[중국 반도체] 엔비디아 독점 생태계까지 넘보는 ‘캠브리콘’, 미국 제재의 역설
입력
수정
완전 자립형 소프트웨어 스택 구축 ‘원클릭’ GPU 이전 기능 탑재 美 제재 속 하드웨어·소프트웨어 동시 공략

중국 AI 반도체 기업 캠브리콘이 엔비디아의 '쿠다(CUDA)' 생태계에 도전장을 내밀었다. 오랜 기간 엔비디아의 독점적 생태계에 종속돼 있던 중국 AI 산업이 독자 연산 프레임워크를 구축함으로써 기술 자립의 전기를 마련한 것이다. 여기엔 AMD의 오픈소스 전략과 중국 정부 주도의 집중 투자, 미국 정부의 수출 제한이라는 삼중 요인이 맞물렸다. 특히 캠브리콘은 미국의 수출 규제 탓에 엔비디아 칩 부족 현상이 심각한 중국 시장 내에서 높은 접근성을 무기로 빠르게 입지를 넓히고 있다. 미중 갈등에 따른 지정학적 긴장이 높아질수록 ‘중국산 대체품’의 경쟁력만 커진 셈이다.
CUDA 없이 AI 훈련, ‘원클릭’ 이전으로 생태계 전환
7일 대만 IT전문 매체 디지타임스에 따르면 중국과학원 산하 AI 칩 설계 기업인 캠브리콘은 자체 개발한 소프트웨어 제품군 '뉴웨어(NeuWare)'가 완숙 단계에 이르렀다고 공식 선언했다. 지난 수년간 중국의 AI 칩 제조사들은 하드웨어 설계 분야에서는 글로벌 경쟁사들과 어깨를 나란히 했으나, 소프트웨어 분야에서는 엔비디아의 압도적인 지배력에 막혀 있었다. 하지만 이번 캠브리콘의 기술 개발로 격차가 대폭 좁혀졌다는 평가다.
캠브리콘의 뉴웨어는 드라이버, 컴파일러, 오퍼레이터 라이브러리, 개발 도구와 클러스터 관리에 이르는 전 과정을 포괄하는 완전한 자체 소프트웨어 스택이다. 이에 따라 개발자들은 CUDA의 도움 없이도 캠브리콘의 MLU 칩에서 직접 AI 모델을 훈련하고 배포할 수 있다. 캠브리콘 측은 뉴웨어가 최신 파이토치(PyTorch) 버전과 오퍼레이터 개발용 언어인 트라이튼(Triton)을 완벽하게 지원해 모델과 오퍼레이터의 신속한 이전(마이그레이션)이 가능하다고 밝혔다.
특히 새롭게 선보인 '원클릭 그래픽처리장치(GPU) 이전' 도구는 개발자들이 기존 GPU 기반 AI 모델을 최소한의 비용으로 캠브리콘 MLU 칩으로 이전할 수 있도록 지원한다. CUDA 생태계에서 벗어나는 전환 과정을 대폭 용이하게 한 것이다. 이 같은 하드웨어와 소프트웨어의 공동 최적화는 이미 대규모 모델 훈련과 추론 환경에서 그 성능을 입증했다. 뉴웨어는 딥시크 V3(DeepSeek V3), 큐웬 3(Qwen 3), GLM 4.5, 훈위안-비디오(Hunyuan-Video) 등 현존하는 중국 주요 AI 모델을 지원한다. 또한 저정밀 연산인 FP8과 FP4 형식을 호환하며, 희소(sparse) 및 선형 어텐션(주의) 방식을 지원해 에너지 효율과 지연 시간을 획기적으로 개선했다.
아울러 캠브리콘은 AI 검색, 광고, 추천 시스템을 위한 전용 훈련과 추론 솔루션도 함께 공개했다. 해당 플랫폼은 대규모 클러스터 배포를 지원하며, 레이어놈(LayerNorm)이나 XLA 같은 핵심 오퍼레이터의 성능을 극대화한다. 이를 통해 상업용 AI 응용 프로그램(애플리케이션)이 기존의 수동적인 추천 방식을 넘어 능동적 이해 단계로 진화하는 데 기여할 것으로 기대하고 있다.
캠브리콘은 업계에서 요구하는 수준의 효율성을 달성하기 위해 다중 노드와 다중 카드 클러스터 훈련에 맞춘 뉴웨어 최적화도 완료했다. 현재 뉴웨어는 2.1 버전부터 2.8 버전에 이르는 모든 파이토치 버전을 지원한다. 특히 오픈소스 커뮤니티의 최신 동향과 보조를 맞추기 위해 새로운 버전이 출시될 때마다 2주 이내에 MLU 적응 갱신(업데이트)을 신속하게 제공한다. 이와 더불어 캠브리콘의 주력 제품인 '쓰위안(Siyuan) 590' 칩도 추론 성능에 최적화했다. 쓰위안 590의 성능은 엔비디아 A100의 약 80% 수준으로 평가받지만, 가격 경쟁력이 높고 설치가 쉽다는 강점이 있다.
AMD ‘오픈소스 전략’의 역효과
반도체 전문가들은 캠브리콘이 CUDA의 카피캣을 내놓을 수 있었던 배경 중 하나로 미국 AMD의 오픈소스를 꼽는다. 엔비디아를 단순한 '하드웨어 회사'가 아닌 'AI 인프라 지배자'로 만든 CUDA는 AI 개발자들이 그래픽 기술을 몰라도 GPU의 강력한 연산력을 쉽게 활용할 수 있는 다리를 놔줬다. 이로써 AI 연구 생태계는 마치 물이 낮은 곳으로 흐르듯 자연스레 엔비디아의 GPU 생태계 안으로 흡수됐다.
오늘날 CUDA는 15년 이상 축적된 방대한 라이브러리, 프레임워크, 코드 등 AI 개발의 역사가 고스란히 담겨 있다. 다른 경쟁사 칩을 쓰려면 CUDA를 완전히 대체할 새로운 시스템을 처음부터 구축해야 하는데, 이는 시간과 비용 측면에서 상당히 어려운 일이다. CUDA가 엔비디아의 기술적 우위를 넘어 그 어떤 경쟁자도 넘보기 힘든 '시장 종속성'이란 진입장벽을 구축했다는 평가가 나오는 배경이다.
이런 엔비디아의 패권에 도전장을 내민 경쟁사 중 가장 유력한 기업으로 꼽히는 AMD는 상대적인 가격 경쟁력과 오픈소스 체계를 통해 CUDA 생태계의 틈을 벌리려 애쓰고 있다. 대표적인 게 ROCm이다. ROCm은 AMD 라데온 그래픽카드의 연산 프로그래밍을 위한 소프트웨어로, CUDA와 같은 역할을 한다. AMD는 지난 5월 어드밴싱 AI(Advancing AI 2025) 행사에서 ROCm이 7세대로 업그레이드됐으며 △최신 알고리즘 및 모델 지원 △AI 구축을 위한 고급기능 지원 △MI350 시리즈 지원 △분산 자원 관리 △산업 시장 대응을 주요 골자로 한다고 밝힌 바 있다.
특히 ROCm6와 비교해 메타 라마3.1 70B 추론 성능이 3.2배, 알리바바 큐웬2-72B 모델도 3.4배, 딥시크 R1도 3.8배나 향상됐다. AI 모델 훈련 성능 역시 라마2 70B와 3.1 8B, 큐웬 1.5 7B 훈련 시 3배나 좋아졌다. AMD 인스팅트 MI355와 ROCm7의 조합은 엔비디아 B200과 비교해 FP8 조건에서 1.3배 높은 효율을 낼 수 있다. 다만 엔비디아가 90% 이상의 시장 점유율로 CUDA 생태계를 20여 년 가까이 다져온 터라 후발 주자인 AMD가 ROCm 생태계를 구축하기란 쉽지 않다. 반면 캠브리콘은 AMD의 오픈소스를 통해 CUDA 대체 기술을 단기간 내 구현할 수 있는 설계도를 확보했다. AMD의 오픈소스 전략이 엔비디아 견제라는 본래 목적은 달성하지 못한 채, 캠브리콘이 중국판 엔비디아로 도약할 수 있는 기회만 제공한 셈이다.

망해가던 캠브리콘 부활
캠브리콘이 중국판 엔비디아가 될 수 있었던 건 중국 국영기업의 막대한 투자가 뒷받침됐기에 가능했다. 2016년 설립된 캠브리콘은 세계 최초의 상업용 AI 칩 ‘캠브리콘-1A’를 출시하며 주목받았다. 당시에도 이미 엔비디아 GPU가 AI 훈련에 많이 쓰이고는 있었지만, 아직 엔비디아가 본격적으로 AI 전용 GPU를 선보이기 전이었다. 이에 힘입어 캠브리콘은 알리바바·화웨이 같은 대기업을 고객사로 두게 됐고, 캠브리콘에 투자하겠다는 투자사가 줄을 서면서 기업가치가 급등했다. 2020년 7월엔 ‘중국판 나스닥’인 상하이거래소의 과창판(스타 마켓)에 화려하게 데뷔했는데, 상장하자마자 주가가 공모가(64위안)의 4배까지 치솟기도 했다.
하지만 환호는 오래가지 못했다. 매년 연구개발(R&D) 비용에 막대한 자금이 투입돼 수년간 적자를 벗어나지 못했기 때문이다. 이런 상황에서 2022년 말 미국 상무부의 ‘거래제한기업 명단(Entity List)’에 캠브리콘이 들어가면서 위기를 정통으로 맞았다. 이로 인해 자율주행 칩 개발 프로젝트는 중단됐고, 수백 명의 직원을 해고해야만 했다. 전 세계가 ‘챗GPT 열풍’에 휩싸이기 시작한 2023년 초에는 캠브리콘 주가가 바닥을 기었다. 이 때문에 상장 전에 투자했던 벤처캐피털(VC)들은 2023년 내내 캠브리콘 주식을 전량 팔아치우고 떠나기 바빴다. 언론도 싸늘한 시선을 보냈다. 캠브리콘이 과연 경쟁력 있는 AI 반도체를 개발할 능력이 있긴 하냐는 내용이 주를 이뤘다.
이런 캠브리콘을 부활할 수 있게 한 것은 미국 정부의 반도체 수출 규제다. 대중국 규제에 따라 2023년 9월부터 엔비디아 A100, H100 같은 첨단 AI 칩의 중국 수출이 완전히 막히면서 내수 시장을 파고들 기회가 생겼다. 캠브리콘이 기존 AI 칩에서 한층 업그레이드된 쓰위안 590을 출시한 것도 이때다. 쓰위안 590은 총연산성능(TPP, Total Processing Performance) 기준으로 엔비디아 A100 성능의 90% 정도 되는 제품으로 평가된다. 저렴한 가격으로 가성비까지 갖춘 캠브리콘의 고성능 AI 칩은 중국 IT 기업의 관심을 끌기 시작했다. 어디로 번질지 모르는 미국의 반도체 수출 규제 충격을 최소화하려면 엔비디아에만 마냥 의존할 순 없다는 각성이 시작된 것이다.
특히 대대적인 AI 인프라 투자에 나선 틱톡의 모회사 바이트댄스의 선택을 받으며 캠브리콘의 성장은 날개를 달았다. 업계에 따르면 바이트댄스는 2024년 쓰위안 590을 2만 개 넘게 구입하며 캠브리콘의 최대 고객사로 등극했다. 이 덕에 2024년 4분기, 캠브리콘 분기 순이익은 설립 이후 처음으로 흑자로 돌아섰다.
그러다 올해 들어서는 캠브리콘의 잠재력이 폭발하기 시작했다. 상반기 매출 성장률은 무려 4,348%(2024년 상반기 126억원→2025년 상반기 5,594억원), 순이익은 1,000억원 적자에서 2,000억원 흑자로 뒤바뀌었다. 갈수록 더 강화되는 미국의 AI 칩 수출 규제의 반사이익도 제대로 누리고 있다. 미국 정부는 올해 4월 엔비디아의 저사양 AI 칩인 H20의 중국 수출까지 일시 중단했는데 이때 캠브리콘은 발 빠르게 H20보다 가격이 절반가량 저렴한 쓰위안 670 칩을 내놓으며 공백을 메웠다. 게다가 최근 들어서는 중국 정부까지 노골적으로 거들고 나섰다. 미국이 지난 7월 H20의 중국 수출을 재허가했지만, 오히려 중국 정부는 H20에 보안 우려가 있다며 사용하지 말라고 중국 기업에 요구했다. 이는 ‘엔비디아 대신 중국산 AI 칩을 사라’는 정부 차원의 지시나 다름없다는 평가다.