입력
수정
대규모 훈련에 필요한 고품질 데이터 부족 데이터 직접 생성 방식 채택했지만 한계 올해 중순 출시할 예정이었으나 일정 지연
챗GPT 개발사 오픈AI의 차세대 인공지능(AI) 모델 GPT-5 개발이 예상보다 지연되고 있다. 당초 올해 8월 GPT-5가 출시될 것이란 전망이 나왔지만, 기대했던 만큼의 성능 향상이 이뤄지지 못하면서 일정이 무기한 연기됐다. 대규모 훈련에 필요한 고품질 데이터를 직접 생성하는 방식을 채택하면서 시간이 많이 소요되고 있는 데다 전문 인력 유출과 비용 문제가 더해져 어려움을 겪고 있는 것으로 전해졌다.
18개월간 2차례 대규모 훈련했으나 문제 발생
23일(현지 시각) 월스트리트저널(WSJ)은 익명의 내부 관계자를 인용해 오픈AI가 코드명 '오리온(Orion)'으로 알려진 차세대 AI 모델 GPT-5 개발 프로젝트가 막대한 비용이 투입되는 상황에서 일정이 기약 없이 지연되고 있다고 보도했다. 실제로 샘 올트먼 오픈AI 최고경영자(CEO)는 20일 고급 추론 AI 모델 ‘o3’를 공개하면서도 GPT-5라고 부를 만한 새 주력 모델이 언제 나올지에 대해서는 언급하지 않았다. 당초 오픈AI의 최대 투자사인 마이크로소프트(MS)는 올해 중반께 새 모델이 나올 것으로 기대했다.
보도에 따르면 오픈AI는 지난해 8월 GPT-5 개발에 착수해 18개월 동안 최소 2차례에 걸쳐 대규모 훈련을 진행했지만, 훈련을 진행할 때마다 새로운 문제가 발생해 예상치 못한 결과를 얻으면서 여러 난관에 봉착한 상황이다. 내부 관계자는 "오리온은 기존 GPT-4보다 성능이 개선됐지만, 그동안 투입한 막대한 비용을 정당화할 만큼의 수준은 아니다"라고 지적했다. 업계에서는 이 정도 대규모 AI 훈련의 경우 6개월간 컴퓨팅 비용만으로 5억 달러(약 7,330억원)가 소요될 것으로 추정한다.
기존 GPT-4에 비해 훨씬 많은 시간과 비용 소요
당초 시장에서는 GPT-5가 새로운 과학적 발견 과정을 도와주고, 일정이나 항공편 예약과 같은 일상적인 업무를 대신해 줄 것으로 기대했다. 오픈AI 임원 출신인 한 소식통은 GPT-4가 똑똑한 고등학생이라면, GPT-5는 일부 작업에서는 박사 수준을 보일 것이라고 언급하기도 했다. 비상장 회사인 오픈AI가 지난 10월 1,570억 달러(약 230조2,000억원)의 기업가치를 인정받으며 펀딩에 성공한 것도 GPT-5를 비롯한 차세대 모델에 대한 기대감이 반영된 결과다.
하지만 GPT-5 개발 계획에는 처음부터 문제가 있었다. 이전 모델은 인터넷에서 수집한 기사, 소셜미디어 게시물, 논문 등 양질의 데이터를 AI 훈련에 사용했는데 더 지능적인 훈련이 필요한 차세대 모델의 경우 데이터가 충분치 않았다. 학습에 필요한 고품질 데이터가 한계에 도달한 것이다. 이에 오픈AI는 새로운 데이터를 직접 생성하기 위해 소프트웨어 엔지니어나 수학자를 고용해 AI가 학습할 코드를 만들거나 복잡한 수학 문제를 해결하는 방식을 도입했지만, 기존 방식보다 훨씬 많은 시간이 소요되는 것으로 알려졌다.
오픈AI 내 핵심 기술 인재의 대규모 이탈도 개발을 지연시키고 비용 부담을 가중하는 요인으로 꼽힌다. 올해 하반기 오픈AI의 영리화를 두고 회사 내부의 갈등이 심화하면서 미라 무라티 최고기술책임자(CTO)를 비롯해 밥 맥크루 최고연구책임자(CRO), 바렛 조프 연구 담당 부사장 등이 갑작스레 퇴사했다. 오픈AI의 공동 창립자인 그렉 브록만 사장도 장기 휴가를 떠났고 다른 공동 창립자인 존 슐먼 연구원은 경쟁사인 앤트로픽으로 이직했다. 피터 덩 소비자 제품 부문 부사장 역시 회사를 떠났다.
20명 이상의 주요 임원과 연구원들이 회사를 떠나자, 오픈AI는 이들의 빈 자리에 새로운 인재를 채워 넣고 기존 인력의 이탈을 막기 위해 빅테크 시장의 인재 유치 경쟁에 뛰어들었고 그 과정에서 막대한 연봉을 지급하면서 인건비 부담이 커지고 있다. CNBC에 따르면 오픈AI 직원의 급여는 14만5,000만 달러에서 50만 달러(약 7억3,000만원) 수준으로, 한 직원은 해당 직무에서 업계 평균의 3배 이상을 받는 것으로 알려졌다. 이에 대해 일론 머스크 테슬라 CEO는 오픈AI가 '사치스러운 보상'으로 경쟁사를 압박하고 있다고 주장했다.
양질의 데이터 고갈되며 '정체기'에 접어들어
업계에서는 이러한 상황이 비단 오픈AI만의 문제는 아니라고 지적한다. AI 산업 전반에서 모델 성능 향상이 정체기에 접어들었다는 분석이다. 오픈AI 공동 창립자였던 일리야 수츠케버는 최근 강연에서 "컴퓨터 연산 능력은 향상되고 있지만, 학습에 필요한 데이터는 증가하지 않고 있다"며 "인터넷이라는 자원은 유한하기 때문"이라고 했다. 그는 데이터 부족을 화석연료 고갈에 비유하며 "생성형 AI 모델의 사전 훈련은 결국 한계에 도달할 것"이라고 경고하기도 했다.
이 같은 상황은 AI 산업의 패러다임 변화로 이어지고 있다. 무작정 큰 모델을 만드는 '스케일업' 전략에서 효율성 중심의 '스마트 스케일링'으로의 전환이 이뤄지고 있는 것이다. 빅테크 기업들도 대규모 언어모델(LLM) 개발보다는 특화된 목적형 AI나 효율적인 소형 모델 개발로 방향을 선회할 것으로 예상된다. 실제로 앤트로픽의 새로운 언어모델은 GPT-4보다 적은 리소스로도 더 나은 성능을 보여주며, 이러한 효율성 중심의 접근이 새로운 트렌드가 될 수 있음을 시사한다.
AI 투자 시장의 지형에도 변화가 예상된다. 당초 전망되던 1조 달러(약 1,460조원) 규모의 AI 투자 시장은 현실적 조정이 불가피해 보인다. 최근 AI 산업에 대한 버블론이 부상하면서 AI 투자 시장은 사실상 '조정기'에 진입했다. 이는 투자자들이 단순한 기술적 진보가 아닌 실질적 수익 모델과 비용 효율성에 더 큰 관심을 기울이면서 고비용 구조의 AI 스타트업들에 상당한 구조조정 압력으로 작용할 가능성이 있다. 실제로 최근 AI 스타트업의 투자 유치 조건이 까다로워지고 있으며, 수익성 검증 역시 더욱 중요해지고 있다.