오픈소스 앞세워 AI 시장 공략하는 中, 모델 성능 하한선 올라가며 '환각 최소화' 경쟁 격화 전망
입력
수정
中 AI업계, 오픈소스 모델로 접근성·유연성 확보해 시장 공략 "불확실한 상황에도 무조건 추측성 답변 제시", AI 환각 문제 여전 모델 성능 상향 평준화, 환각 줄여 신뢰성 확보하는 기업이 승기 잡는다

중국이 생성형 인공지능(AI) 분야에서 미국과의 격차를 획기적으로 좁혔다는 평가가 쏟아지고 있다. 오픈소스 모델을 중심으로 기술적 한계를 넘어 글로벌 AI 수요를 공략, 시장 입지를 빠르게 넓혀 나가는 양상이다. 전문가들은 이 같은 중국의 성장 전략이 글로벌 AI 시장의 경쟁 구도 자체를 뒤흔들 수 있다는 분석을 내놓는다.
좁혀지는 美-中 AI 기술 격차
14일(현지시각) 홍콩 사우스차이나모닝포스트(SCMP)는 한때 2~3년으로 평가되던 중국과 미국의 AI 기술 격차가 이제 약 3개월 수준으로 줄어들었다고 보도했다. AI 인재의 유입, 원본 코드(소스 코드)를 공개하는 오픈소스 모델 채택 등 다양한 요인이 중국의 기술력 제고에 영향을 미쳤다는 평가다. 앞서 홍콩계 투자은행(IB) CLSA, 미국 AI 연구 기관 에포크(Epoch) AI 등도 이와 유사한 분석을 내놓은 바 있다.
실제 중국은 오픈 소스 방식의 개방형 AI 모델에서 최고 지위를 굳혀가고 있다. 오픈AI, 앤트로픽, 구글 등 미국 테크 기업은 자체 개발한 AI를 공개하지 않고 구독료를 받으며 판매하는 폐쇄 전략을 택했다. 반면 딥시크(AI 모델 DeepSeek), 알리바바(Qwen), 문샷(KIMI) 등 중국 기업들은 AI 모델 코드를 공개하고 누구든지 내려받아 응용할 수 있도록 허용한다. 이는 중국 AI 모델을 널리 확산해 AI 생태계를 장악하기 위한 전략으로 풀이된다. 미국 기업 대비 기술적 우위를 점하지는 못했지만, 접근성과 유연성을 앞세워 글로벌 시장을 공략하기 시작한 것이다.
오픈소스 모델 성능 역시 눈에 띄게 발전하고 있다. 지난달 글로벌 AI 성능 분석 전문 기관 아티피셜 애널리시스(Artificial Analysis)가 분석한 바에 따르면, 올해 10월 중국 스타트업 미니맥스가 내놓은 ‘M2’는 전 세계 오픈 소스 AI 종합 성능 평가 1위를 차지했다. 저비용·고효율 전략을 택한 이 AI는 작업을 수행할 때 문제 해결에 필요한 매개변수(파라미터)만 활성화하는 ‘전문가 혼합’ 방식으로 연산 효율성과 응답 속도를 대폭 제고한 것이 특징이다. 이 밖에도 DeepSeek와 Qwen 등 중국이 개발한 AI 8개 모델이 세계 10위 안에 들었다. 중국 이외 모델은 미국 오픈AI가 ‘부분 공개 방식(오픈 웨이트)’으로 공개한 2종(2·9위)뿐이었다.
가격도 미국 대비 눈에 띄게 저렴한 편이다. 상당수 중국 AI 모델들이 미국 경쟁사보다 2배 이상의 저렴한 비용으로 AI 서비스를 제공 중이다. 이에 따라 시장 내에서 중국 오픈소스 AI 활용도는 급격히 높아지는 추세다. 미국 매사추세츠공대(MIT)와 오픈소스 AI 플랫폼 허깅페이스가 지난달 발표한 보고서에 따르면, 지난 1년간 허깅페이스에서 신규 발생한 오픈 모델 다운로드 중 중국산 모델 비중은 17%로 집계된 반면 구글, 메타, 오픈AI 등 미국 기업들이 개발한 모델은 15.8%를 차지했다. 해당 지표에서 중국이 미국 모델을 추월한 것은 이번이 처음이다.
AI 시장의 고질적 난제 '환각'
이 같은 오픈소스 경쟁력은 AI 시장 전반의 경쟁 판도를 뒤집을 가능성이 크다. 오픈소스 모델 활용이 보편화되면 모델 성능의 하한선이 크게 올라가고, 대부분 기업이 비슷한 수준의 기본 추론·생성 능력을 확보하게 된다. 이전처럼 '자력으로 AI 모델을 만들 수 있는지' 여부 자체가 경쟁력이 되긴 어렵다는 의미다.
이 같은 상황 속에서는 자체 데이터의 양·질·구조화 수준, AI 환각(hallucination) 발생 빈도 등이 새로운 경쟁 축으로 떠오를 수 있다. AI 환각은 AI가 생성한 정보에 허위 또는 날조된 정보가 포함되는 현상으로, 대형언어모델(LLM) 시장이 개화했을 때부터 줄곧 난제로 꼽혀 왔다. 오픈AI가 지난 9월 발표한 연구 논문에 따르면, 환각이 발생하는 근본적 원인은 언어 모델의 학습 및 평가 구조가 ‘모른다’고 답하는 것보다 ‘추측’을 장려한다는 데에 있다. 기존 평가 방식은 정답을 맞히면 점수를 주고, 모른다고 답하면 0점을 부여한다. 따라서 모델은 불확실한 상황에서도 답을 추측하도록 학습된다는 것이다.
언어 모델은 방대한 텍스트 데이터를 기반으로 ‘다음 단어 예측(next-word prediction)’을 통해 학습된다. 맞춤법이나 문법처럼 규칙성이 있는 패턴은 잘 학습하지만, 무작위하고 희귀한 정보(예: 개인의 생일)는 정확히 예측하기 어렵다. 이로 인해 특정 사실 오류가 발생하게 된다. 예컨대 어떤 인물의 생일을 묻는 말에 모델이 “모른다”고 답하면 0점을 받지만, “9월 10일”이라고 추측하면 낮은 확률로나마 정답을 맞힐 수 있다. 이러한 구조적 문제로 인해 모델은 ‘자신감 있는 추측’을 택하며 잘못된 정보를 전달하게 된다.

환각, AI 패권 경쟁 중심축으로 떠오를까
이 같은 환각 문제는 전문 분야일수록 특히 심각하다. 정보통신기획평가원에 따르면 주요 AI 모델의 분야별 환각 감지 정확도는 ‘일반 상식’의 경우 85%에 달했지만, 법률(64%)·의학(58%)·심리학(53%) 등 전문 분야로 가면 50∼60% 수준에 불과한 것으로 추산됐다. 감지 정확도는 AI가 어떤 부분이 환각인지 직접 식별하는 비율을 뜻한다. 해외 조사에서도 비슷한 결론이 도출됐다. 글로벌 AI 싱크탱크 올어바웃AI가 주요 AI 모델의 환각률을 조사한 결과 의료 정보 부문 환각률은 15.6%, 법률 정보 부문 환각률은 18.7%로 나타났다.
피해 사례도 잇따르고 있다. 도널드 트럼프 미국 대통령의 ‘해결사’로 불렸던 마이클 코언 변호사는 2023년 구글의 AI 챗봇인 ‘바드’를 이용해 만든 가짜 판례 인용문을 법원에 제출했다가 적발당했다. 지난해에는 항공사 에어캐나다가 자체 AI 챗봇이 소비자에게 잘못된 할인 정보를 제공했다는 이유로 소송에 휘말려 보상 판결을 받았다. 우리나라에서는 지난해 말 제주항공 여객기 참사 당시 챗GPT가 한 방송사 화면에 노출된 ‘817’이라는 숫자가 북한의 대남 공작과 관련이 있다는 환각성 답변을 내놓으면서 음모론이 기승을 부리기도 했다.
전문가들은 이 같은 환각을 최소화하는 데 성공하는 기업이 시장 경쟁에서 승기를 쥐게 될 것이라고 전망한다. 한 시장 전문가는 "중국을 중심으로 오픈 소스 AI 영향력이 커지며 모델 성능이 상향 평준화됐고, 알고리즘 차원의 혁신은 줄어들었다"며 "기술적 우위가 곧 경쟁력이 되는 시대가 저물어 가고 있는 것"이라고 짚었다. 이어 "AI 기업들은 큰돈을 들여 자체 LLM을 개발하기보다도, 환각 등을 최소화해 소비자 신뢰도를 높일 수 있는 시스템을 우선적으로 만들어야 할 것"이라고 덧붙였다.