“훔친 기술로 AI 굴기 이뤘나” 반복되는 中 AI 모델 베끼기, 美 대중 견제 전선 확대일로

Picture

Member for

1 year 8 months

Real name

이태선

Position

선임기자

Bio

[email protected]

세상은 이야기로 만들어져 있습니다. 다만 우리 눈에 그 이야기가 보이지 않을 뿐입니다. 숨겨진 이야기를 찾아내서 함께 공유하겠습니다.

입력

2026-06-26 13:17

수정

2026-06-26 15:41

앤스로픽 폭로로 재점화된 中 AI 모델 증류 의혹
2.5만 개 사기계정으로 2,880만 건 대화 탈취
반복된 무단 출력값 활용 논란, 커지는 美 안보 경계

미국 인공지능(AI) 기업 앤스로픽이 중국 빅테크 알리바바의 기술 탈취 정황을 공개했다. 이번 의혹은 딥시크와 문샷AI, 미니맥스 등 중국 AI 기업들을 둘러싼 유사 사례가 잇따른 가운데 제기됐다는 점에서 파장이 더욱 크다. 미국이 첨단 AI 반도체와 연산 인프라 수출을 강하게 통제하는 상황에서 중국 기업들이 선도 모델의 출력값을 확보해 성능을 끌어올리려 했다는 의혹까지 이어지면서, AI 기술 유출 문제는 미국의 대중 기술안보 정책 전반을 흔드는 핵심 변수로 떠오르고 있다.

알리바바, 가짜 계정으로 클로드 무단 학습

25일(이하 현지시간) 블룸버그통신에 따르면 최근 앤스로픽은 미 상원의원들과 백악관 관계자들에게 보낸 서한에서 "알리바바의 AI 모델 '큐원(Qwen)'을 개발한 연구소와 연계된 운영자들이 지난 4월부터 허위 계정 2만5,000개를 이용해 클로드와 2,880만 건의 대화를 주고받았다"고 주장했다. 앤스로픽은 이들이 소프트웨어 엔지니어링과 에이전트 추론 등 클로드의 핵심 역량을 노렸다고 설명했다.

앤스로픽은 이를 '증류(distillation) 공격'으로 규정했다. 증류란 성능이 뛰어난 기존 모델의 출력을 대량으로 수집해, 더 작고 값싼 모델을 학습시키는 기법이다. 이 방식을 사용하면 막대한 연구개발(R&D) 비용과 인프라 투자 없이, 앞선 모델의 성능을 복제한 AI 챗봇을 만들 수 있다. 정상적인 연구 목적의 증류도 있지만, 약관을 위반해 상대 모델의 핵심 능력을 조직적으로 복제하면 명백한 무임승차가 된다.

앤스로픽은 서한에서 “이런 증류 공격은 미국 첨단 AI 역량을 수확해 자기 것인 양 재포장하기 위해 산업적 규모로 불법적이고 체계적으로 자행되고 있다”며 “이렇게 구축된 AI 시스템은 안전 가이드라인마저 결여된 경우가 많다”며 미국 정부의 개입과 단속을 촉구했다. 이어 앤스로픽은 알리바바가 노린 표적이 클로드의 가장 상업적 가치가 높은 능력, 즉 소프트웨어 엔지니어링과 에이전트형 추론(agentic reasoning)이었다고 전했다. 그러면서 "앤스로픽을 대상으로 한 사상 최대 규모의 증류 공격"이자 "중국 기업이 미국 최상위 연구소의 성과에 무임승차하려 한 가장 큰 시도"라고 못 박았다.

중국 AI 기업들의 선도 모델 무단 활용 의혹은 이번이 처음이 아니다. 앤스로픽은 지난 2월에도 딥시크, 문샷AI, 미니맥스 등 중국 AI 연구소들이 약 2만4,000개의 허위 계정을 통해 클로드와 1,600만 건 이상 상호작용하며 모델 역량을 추출했다고 밝힌 바 있다. 오픈AI도 올해 초 미 의회에 제출한 정책 제안서에서 중국 AI 기업들의 증류 문제를 지적했다. 당시 오픈AI와 마이크로소프트(MS)는 딥시크와 연계된 것으로 의심되는 계정에서 대규모 API 호출 정황을 조사한 것으로 알려졌다. 중국의 AI 증류 정황은 중국 IT기업 텐센트가 지난달 공개한 AI 모델 ‘Hy3 프리뷰’에서도 엿보인다. 미 IT 전문 매체 디인포메이션은 “텐센트 직원들은 Hy3 개발 과정에서 클로드의 코딩 도구인 클로드 코드를 이용했다”고 보도했다. 학습 단계에서 평가자들이 클로드를 기준으로 삼아 비교·분석하며 최종 품질을 끌어올렸다는 것이다.

기업·정부·의회 총력 대응

중국의 AI 모델 베끼기가 기승을 부리자 오픈AI와 앤스로픽, 구글 3사는 공동대응에 나선 상태다. 오픈AI의 챗GPT와 앤스로픽 클로드, 구글 제미나이가 AI 시장에서 치열하게 경쟁하면서도 보안을 위해 맞손을 잡은 것이다. 지난 4월부터 3사는 MS가 2023년 설립한 비영리단체 ‘프론티어 모델 포럼’을 통해 정보를 공유해 적대적 데이터 추출 시도를 탐지하고 있다. 이들 기업은 외부의 공격 기법을 더 효과적으로 탐지하고 책임자를 파악하고 권한 없는 사용자의 접근을 차단하기 위해 협력 중이다.

미국 정부도 중국을 상대로 비판 수위를 높이고 있다. 지난 4월 마이클 크라치오스 백악관 과학기술정책실장은 중국을 중심으로 한 외국 기관들이 미국 AI 시스템을 대상으로 ‘산업적 규모의 증류 캠페인’을 벌이고 있다고 지적했다. 미 정부는 이러한 활동이 중국 기반 기관을 중심으로 이뤄지고 있으며, 수만 개의 프록시 계정과 ‘탈옥(jailbreaking)’ 기법을 활용해 보안 장치를 우회하고 비공개 정보를 확보하고 있다고 보고 있다. 탈옥은 AI 시스템의 안전·윤리 제한을 무력화해 의도하지 않은 정보를 끌어내는 방식이다. 크라치오스 실장은 “이 같은 취약한 기반 위에 구축된 AI 모델은 무결성과 신뢰성을 담보하기 어렵다”고 꼬집었다. 이 발언은 지난달 도널드 트럼프 대통령의 중국 방문을 계기로 열렸던 미·중 정상회담을 앞두고 나와, 해당 문제가 주요 의제로 다뤄질 가능성이 제기되기도 했다.

미 국무부는 아예 옐로우카드까지 꺼내 들었다. 지난달 24 국무부는 전 세계 외교 공관과 영사관에 “중국 기업들의 미국 AI 모델 ‘추출 및 증류’ 시도에 대한 우려를 외국 정부에 제기하라”는 외교 전문을 발송했다. 미 백악관 과학기술정책국은 전날인 23일 “외국이 수만 개의 프록시 계정과 탈옥 기법을 통해 미국의 혁신을 체계적으로 추출하고 있다”는 내용의 메모를 연방 정부 부처에 공유했는데, 비슷한 내용을 전 세계에 전파한 것이다. 외교 전문에서 국무부는 중국의 AI 업체인 딥시크와 문샷AI, 미니맥스 3사를 직접 거론하며, “적대 세력이 미국 AI 모델을 추출·증류하는 것이 우려된다”고 했다.

미 의회도 대응에 나섰다. 공화당의 빌 해거티, 민주당의 앤디 김 상원의원은 미국 AI 모델의 출력을 부적절하게 가로채 경쟁 모델을 학습시키는 중국 기업을 블랙리스트에 올리거나 제재할 수 있도록 하는 내용을 연례 국방수권법(NDAA)의 수정안에 넣을 예정이다. 하원에서도 유사한 초당적 국방 법안이 준비 중이며, 미 국방부는 이미 이달 초 알리바바를 중국 군부를 지원하는 기업 블랙리스트에 추가한 상태다.

'中 AI 굴기' 둘러싼 기술 탈취 의구심 확산

전문가들은 이 같은 논란이 일회성 사건으로 끝날 가능성을 낮게 보고 있다. AI 주도권 경쟁이 국가 간 패권 경쟁으로 확산한 만큼, 향후 백악관의 대중 기술안보 정책과 미·중 협상 과정에서도 반복적으로 거론될 가능성이 크다는 이유에서다. 이미 미국 업계에서는 중국 'AI 굴기'를 향한 의구심도 한층 짙어지고 있다. 중국 기업들은 그동안 저비용·고성능 모델을 앞세워 미국 중심의 AI 주도권을 빠르게 추격해 왔지만, 딥시크와 문샷AI, 미니맥스에 이어 알리바바까지 미국 선도 모델의 출력값을 무단으로 흡수했다는 의혹에 휩싸이면서, 중국 AI 산업의 성장 경로 자체를 둘러싼 신뢰도 흔들리고 있다.

AI 기술 유출 논란은 모델 출력값에만 국한되지 않는다. 미 법무부는 올해 1월 전 구글 소프트웨어 엔지니어 린웨이 딩이 구글의 AI 관련 영업비밀을 중국에 유리하게 활용한 혐의로 유죄 평결을 받았다고 발표했다. 딩은 구글 재직 당시 AI 데이터센터와 머신러닝 인프라 관련 기밀 문서 2,000쪽 이상을 개인 클라우드 계정으로 옮긴 것으로 조사됐다. 해당 자료에는 구글의 텐서처리장치(TPU), 그래픽처리장치(GPU), 스마트NIC 등 대규모 AI 학습 인프라의 핵심 설계와 운용 정보가 포함됐다.

이는 중국의 AI 추격을 둘러싼 미국의 문제의식이 기업 간 분쟁에 머물지 않는다는 사실을 방증한다. 한쪽에서는 클로드와 챗GPT 같은 선도 모델의 출력값을 대량으로 수집하려는 시도가 포착되고, 다른 한쪽에서는 AI 데이터센터와 반도체 인프라의 영업비밀 유출 사건이 발생했다. 모델 성능, 학습 데이터, 연산 인프라, 인력 이동이 모두 하나의 기술안보 전선으로 묶이기 시작한 셈이다. 중국의 첨단산업 성장 과정에서 기술 탈취와 인력 빼가기 논란이 반복돼 왔다는 점도 미국의 경계심을 키우는 요인이다. 반도체, 배터리, 통신장비 분야에서 제기됐던 산업스파이 논란이 이제 AI 모델과 클라우드 인프라 영역으로 옮겨붙었다. 특히 생성형 AI는 모델 자체가 막대한 자본과 데이터, 엔지니어링 노하우의 집약체인 만큼, 출력값 무단 수집만으로도 선도 기업의 경쟁 우위가 훼손될 수 있다.

게다가 이미 중국의 AI 기술은 미국의 턱밑을 위협하고 있는 실정이다. 최근 스탠퍼드대 인간중심 AI연구소가 발표한 ‘2026 AI 인덱스’ 보고서에 따르면 미·중 양국의 최상위 AI 모델 간 격차는 2~3%로 크게 좁혀졌다. 지난 4월 중국 반도체 기업 화웨이 칩을 활용해 개발한 ‘V4 프로’를 공개한 딥시크는 추론과 에이전트 업무 능력이 크게 개선됐다고 주장했다. 딥시크 측에서도 성능 면에서 ‘V4 프로-맥스’가 앤스로픽의 ‘클로드 오퍼스 4.6’, 구글 ‘제미나이 3.1 프로’에는 아직 미치지 못한다고 인정했지만, 구독료가 7분의 1 수준(오퍼스 4.6은 25달러, V4 프로는 3.5달러)이어서 가격 경쟁력이 뛰어나다는 평가를 받고 있다.

Picture