입력
수정
메타, ‘스케일AI’ 지분 49% 인수 추진 해당 인력 기반 초지능 AI 연구소 설립 AI 모델 '라마' 부진에 대규모 개편 시동

생성형 인공지능(AI) 모델 ‘라마(Llama)’를 보유한 메타가 AI 학습 데이터 분야 최강자인 스케일AI에 대규모 투자를 추진한다. 메타는 스케일AI 인력을 기반으로 ‘초지능 연구소’를 설립하는 청사진을 그리고 있다. 초지능은 현재 AI업계가 궁극적으로 도달하려는 단계로, 인간 수준의 AI를 뜻하는 범용 AI(AGI)를 넘어서는 차세대 기술이다. 대규모언어모델(LLM) 개발 경쟁에서 구글, 오픈AI에 밀리고 있는 메타가 AI 패권을 쥐기 위한 전략적 전환점으로 초지능 카드를 꺼내들었다는 분석이 나온다.
스케일AI 지분 49% 확보· CEO 영입 추진
11일(현지시간) 월스트리트저널, CNBC 등 외신에 따르면 메타는 알렉산더 왕 최고경영자(CEO)가 이끄는 스케일AI에 140억 달러(약 19조원) 투자 계약을 마무리 중이며, 왕 CEO를 영입해 AI 연구를 지휘하는 방안을 놓고 협상하고 있다. 일각에선 메타의 투자 규모가 150억 달러(약 20조4,800억원)에 이를 수 있다는 전망도 나온다. 투자가 성사될 경우 메타가 지금까지 외부에 투자한 금액 중 최대 규모가 된다.
이번 거래로 메타는 스케일AI의 지분 49%를 갖게 되고, 왕 CEO와 스케일AI 직원들은 메타에 합류해 메타의 새로운 AI 연구소 '슈퍼인텔리전스 랩(초지능 연구소)'을 이끌 예정이다. 초지능은 인간의 두뇌 능력을 뛰어넘는 가상의 AI 시스템으로, 인간과 같은 수준의 AI를 의미하는 ‘범용 AI(AGI)’을 뛰어넘는 AI를 뜻한다.
메타가 스케일AI를 직접 인수하지 않고 대규모 지분 투자하는 것은 구글이나 마이크로소프트(MS)가 캐릭터AI, 인플렉션AI 등 스타트업 핵심 인재를 확보하는 방식과 유사하다. 지난달 오픈AI가 AI 기기 개발 스타트업 ‘io(아이오)’를 인수하면서 이 회사 창업자이자 애플의 전설적인 디자이너인 조너선 아이브를 영입한 것도 비슷한 전략이다.
메타의 새로운 연구소 설립은 AI 부문에 대한 대대적인 개편의 일부로 분석된다. 메타는 최근 기술을 둘러싼 내부 경영진의 갈등과 직원 이탈, 여러 제품 출시 실패로 어려움을 겪었다. 대규모언어모델(LLM) '라마' 기반의 AI 챗봇 메타 AI로 AI 경쟁에 뛰어들었지만, 최근 출시한 '라마4'는 예정된 시기보다 늦게 나왔고, 큰 반응도 얻지 못하고 있다. 새로운 플래그십 모델 ‘베헤모스(Behemoth)’도 공개할 예정이었지만 성능 우려로 출시가 연기됐다. 이에 핵심 AI 프로젝트를 이끌었던 주요 연구진 14명 중 대부분이 회사를 떠난 것으로 알려졌다. 메타는 왕 CEO 영입을 통해 AI 경쟁에서 다시 선두 자리를 되찾는 데 도움이 될 것으로 기대하고 있다.

데이터 라벨링 중요성 부각, 기업 러브콜 쇄도
2016년 설립된 스케일AI는 데이터 라벨링 기술로 급성장한 회사다. 당시 샘 올트먼 오픈AI CEO가 대표를 맡고 있던 실리콘밸리 최대 액셀러레이터(창업 지원 회사)인 와이콤비네이터로부터 자금을 지원받았다. 이후 스케일AI는 직원들에게 데이터에 맞는 라벨링 작업을 맡기고 이를 AI 학습 기업에 판매하는 모델을 구축했다. 초기에는 자율주행차를 연구하는 기업들이 주 고객이었지만, 오픈AI가 외부 투자를 받고 본격적으로 AI 모델 개발에 집중하면서 스케일AI도 성장의 기회를 잡았다. 오픈AI가 필요한 데이터를 라벨링하는 작업을 스케일AI가 도맡았기 때문이다.
그러다 2022년 챗GPT가 폭발적으로 성장하면서 스케일AI에는 더 많은 비즈니스 기회가 열렸고, 이때 메타도 스케일AI의 고객이 됐다. 현재 스케일AI는 오픈AI, 구글, MS 등 주요 AI 기업 대부분이 스케일AI의 고객사일 만큼 기술력과 시장 지배력을 갖췄다. AI 기업들이 눈독 들이면서 지난해 140억 달러였던 기업 평가 가치는 올 들어 250억 달러(약 34조원)로 늘었고, 매출도 지난해보다 배 이상으로 증가할 전망이다.
회사가 성장하면서 왕 CEO는 억만장자가 됐다. 2021년 24세의 나이로 ‘당시 세계에서 가장 어린 자수성가형 억만장자’에 이름을 올렸다. 포브스에 따르면 지난 4월 기준 그의 순자산은 35억 달러(약 4조8,000억원)로 추정된다. 특히 왕 CEO는 AI 산업계에서 막강한 네트워크를 가진 것으로도 유명하다. 코로나19 팬데믹 기간 올트먼 CEO와 한집에 살았던 막역한 사이며, AI 스타트업은 물론 주요 빅테크와 협력하며 AI업계 마당발로 입지를 굳혔다. ‘억만장자의 사교모임’으로 불리는 선밸리 콘퍼런스에도 초청받았고, 지난 1월 도널드 트럼프 대통령의 취임식에도 참석하는 등 정부 기관과도 긴밀히 협력하고 있다.

“모델보다 데이터” AI 성능 좌우할 데이터 전쟁
업계에서는 데이터 기업이 높은 기업가치를 인정받은 것을 두고 최근 IT는 물론 패션, 뷰티 등 전 산업 분야가 AI를 접목한 기술 개발에 집중하는 것과 결을 같이한다고 보고 있다. 성공적인 기술 구현을 위해서는 기술력도 중요하지만 AI를 더욱 스마트하게 만드는 고품질의 데이터가 필수적이기 때문이다.
실제 데이터 라벨링은 고도화된 도구 개발에 핵심적인 역할을 한다. 주로 아프리카, 인도 등의 저임금 노동자들이 데이터 라벨링 작업에 동원되는데, 케냐의 한 노동자는 8시간 동안 컴퓨터 화면 앞에서 데이터 분류하는 작업을 한 것으로 알려졌다. 자율 주행차용 AI에서 차량과 사람을 분류하거나 X선 등 의료용 영상·사진에서 질병 부위를 표시하는 식이다. 시급은 1.5~2달러 정도라 노동 착취라는 비판을 듣지만, AI 학습에 들어가는 막대한 데이터를 정제하기 위해서는 저임금 노동을 활용할 수밖에 없다는 게 업계 입장이다.
AI 개발에서 데이터 라벨링 작업에 소요되는 비용과 시간은 상당하다. 시장조사업체 커그니리티카(Cognilytica)는 “데이터를 준비하고 가공하는 작업이 전체 AI 프로젝트 시간의 80%를 차지한다”고 했다. 데이터 라벨링 비용이 전체 개발 프로젝트의 60~80%를 차지한다는 분석도 있다. 그동안 데이터 라벨링 작업에 대규모 인력이 투입된 것은 사진·음성·동영상 등 다양한 형태의 데이터 속 콘텐츠를 AI가 구분하기 어려웠기 때문이다. 한 테크 업계 관계자는 “인간은 동영상을 보고 폭력물인지 금방 알지만, AI로는 이를 구분하는 데 한계가 있다”고 말했다.
이런 가운데 메타 등 빅테크 기업이 초지능 AI에 본격적으로 눈을 돌리기 시작하면서 AI 기술 진화 속도는 더 빨라질 전망이다. AI는 음성 인식 등 특정 작업만 수행하는 ‘약한 AI(ANI)’에서 인간처럼 모든 지적 작업을 수행하는 ‘강한 AI(AGI)’로 진화하고 있다. 더 나아가 인간보다 뛰어난 지적 능력을 보유한 초지능 AI까지 현실화 가능성이 커졌다. 노벨물리학상 수상자인 제프리 힌턴(Geoffrey Hinton) 토론토대 교수와 노벨화학상 수상자인 데미스 하사비스(Demis Hassabis) 딥마인드 CEO는 초지능 AI의 등장 시점이 10년 안에 이뤄질 것이라고 예상했다.