앤스로픽 새 모델에 놀란 오픈AI, GPT-5.4 출시 6주 만에 5.5 공개, IPO 앞두고 기술력 과시 경쟁 격화

Picture

Member for

1 year 7 months

Real name

이제인

Position

기자

Bio

[email protected]

뉴스의 사회적 책임을 자각하며 공정하고 균형 있는 시각을 최우선으로 합니다. 꾸준한 추적과 철저한 리서치를 바탕으로 사실만을 전달하겠습니다.

입력

2026-04-24 14:50

수정

2026-04-24 16:46

앤스로픽을 기술적 척도로, 기습적 고도화 단행
에이전트 코딩 기능 고도화로 점유율 회복 노려
오픈AI vs. 앤스로픽, 주도권 싸움 치열

GPT-5.5의 지능 지수(Intelligence Index)/출처=오픈AI 블로그

오픈AI가 새 인공지능(AI) 모델을 공개하면서 생성형 AI 시장 주도권 경쟁에 다시 불을 붙였다. 불과 6주 만에 이어진 신모델 공개는 AI 경쟁의 속도 자체가 한층 가팔라졌음을 보여준다. 특히 경쟁사인 앤스로픽을 기준으로 성능을 입증하려는 흐름은 오픈AI의 다급함을 반영한다는 평가다. 기술력은 물론 윤리 기준까지 맞물린 복합 경쟁 구도 속에서 양사의 패권 다툼도 갈수록 치열해지는 모습이다.

오픈AI, 앤스로픽 미토스 출시 2주 만에 맞불

23일(이하 현지시간) 그렉 브록만(Greg Brockman) 오픈AI 사장은 이날 신규 AI 모델인 GPT-5.5 출시 브리핑에서 "GPT-5.5는 5.4와 비교해 더 적은 토큰(AI 연산 기본단위)으로 더욱 빠르게 날카롭게 사고한다"고 밝혔다. 그는 "실제 환경에서 토큰당 지연 시간을 측정했을 때 GPT-5.5는 전작과 일치하는 속도를 보여주면서도 지능은 훨씬 더 높다"고 강조했다. AI 모델 경쟁에서 단순 성능보다 '비용 대비 성능'이 더욱 중요해지는 시점에서 획기적인 발전이라는 게 오픈AI의 설명이다. 브록만 사장은 "거시적으로 우리는 '컴퓨팅 자원 경제'로 이동하고 있다"며 "기업 사용자들에게 더 많은 첨단 AI 모델 (사용량)을 제공할 수 있다는 뜻"이라고 말했다.

업계는 오픈AI가 5.4 버전 발표 후 불과 한 달 반 만에 5.5를 출시한 점과, 경쟁사인 앤스로픽의 주력 모델을 기술적 척도로 삼은 것에 주목하고 있다. 실제 이번 출시는 불과 몇 주 전 앤스로픽이 클로드 미토스 프리뷰(Claude Mythos Preview)라는 고급 사이버보안 기능을 갖춘 모델을 공개한 직후 이뤄졌다. 오픈AI가 공개한 성능지표(벤치마크) 보고서에 따르면 GPT-5.5는 많은 영역에서 앤스로픽의 ‘클로드 오퍼스4.7’보다 높은 점수를 기록한 것으로 파악됐다. 지식 업무 수행 능력을 평가하는 ‘GDPval’ 지표는 84.9%로 80.3%인 오퍼스4.7을 능가했다. 터미널 환경 작업 능력을 보여주는 ‘터미널-벤치 2.0’에서는 82.7%를 기록해 오퍼스4.7(69.4%)보다 10%p 높았다. 사이버 보안 능력을 평가하는 ‘사이버짐’에서도 81.8%로 오퍼스4.7의 73.1%를 뛰어넘었다.

다만 정보기술(IT) 업계에서 가장 수요가 높은 코딩 부문 지표인 ‘SWE-벤치 프로’에서는 58.6%에 그쳤다. 오퍼스4.7의 64.3%와 5%p 이상 격차가 나는 셈이다. 게다가 GPT-5.5는 앤스로픽이 최근 40개 파트너사에 제한적으로 공개한 미토스(Mythos)의 성능에도 미치지 못했다. 미토스의 터미널-벤치 2.0 지표는 92.1%이었다. 범용 지능을 측정하는 인류 마지막 시험(HLE) 정답률 또한 GPT-5.5가 41.4%로 미토스(56.8%)를 뛰어넘지 못했다. 이에 오픈AI는 “앤스로픽의 모델은 데이터 암기 징후가 보고됐다”며 평가 결과를 인정할 수 없다는 반응을 보였다. 이어 GPT-5.5가 에이전트형 연산에 더 적합하도록 자율성과 직관성을 높였다고 강조했다. 브록만 사장은 “이 모델이 정말 특별한 점은 더 적은 지침으로도 더 많은 일을 할 수 있다는 것”이라며 “불분명한 문제를 보고 다음에 무엇을 해야 하는지 스스로 파악해 낸다”고 설명했다.

GPT-5.5 에이전틱 코딩 강화의 함의

전문가들은 GPT-5.5에서 특히 에이전틱 코딩 기능이 대폭 강화된 데 대해, 앤스로픽과의 경쟁에서 열세로 평가받던 영역을 단기간 내 보완해 주도권을 회복하려는 의도가 강하게 반영돼 있다고 본다. 실제 지난 14일 앤스로픽은 동시에 더 많은 작업을 실행할 수 있도록 설계된 '클로드 코드' 데스크톱 앱의 업데이트 버전을 공개했다. 이번 업데이트에는 단일 프롬프트를 입력하고 결과를 기다리는 기존 방식에서 벗어나, 여러 저장소에서 다양한 작업을 병렬로 진행하는 개발자들의 실제 업무 패턴을 반영했다. 코드 리팩토링, 버그 수정, 테스트 작성 등을 동시에 실행하고, 진행 상황을 확인하며 필요한 순간 개입하는 ‘오케스트레이터’ 역할을 지원하는 데 초점이 맞춰졌다.

가장 큰 변화는 멀티 세션 관리 기능이다. 새롭게 추가된 사이드바에서는 현재 진행 중이거나 최근 작업한 모든 세션을 한눈에 확인할 수 있다. 프로젝트, 상태, 실행 환경별로 필터링하거나 그룹화할 수 있으며, 작업이 완료된 세션은 자동으로 아카이브 처리돼 작업 공간을 깔끔하게 유지한다. 또 작업 중 추가 질문이 필요할 경우, 별도의 ‘사이드 채팅’을 통해 기존 흐름을 방해하지 않고 대화를 분기할 수 있다. 이 기능은 메인 작업의 맥락을 가져오되, 결과를 다시 반영하지 않아 작업 혼선을 줄인다. 앤스로픽은 "많은 개발자에게 있어 능동적인 작업 방식은 변화했다"며 "새로운 앱은 에이전트 기반 코딩이 실제로 어떻게 느껴지는지, 즉 여러 가지 일이 동시에 진행되고 사용자가 이를 총괄하는 방식에 맞춰 설계됐다"고 강조했다.

이런 흐름 속에서 GPT-5.5의 전략은 명확하다. 클로드가 구축한 사용자 경험을 따라잡고, 동시에 더 높은 자동화 수준을 확보하는 것이다. 이에 업계에서는 GPT-5.5 출시로 단순 챗봇 경쟁 구도가 막을 내리고, AI가 스스로 업무를 처리하는 에이전트 전쟁이 본격화됐다는 평가가 나온다. 실제 앤스로픽이 코딩 에이전트 클로드 코드와 범용 업무 에이전트 ‘클로드 코워크’로 기업 시장을 빠르게 잠식하자 오픈AI도 정면 대응에 나선 것이다. 벤처캐피털(VC) 멘로벤처스에 따르면 기업용 AI 시장에서 앤스로픽은 점유율 40%로 오픈AI(27%)를 제쳤으며, 클로드 코드만으로 연 환산 매출(ARR·현재 실적을 1년 치로 환산한 값) 25억 달러(약 3조7,000억원)를 기록한 것으로 알려졌다.

IPO 레이스 속도전, 매출 아닌 기술력이 몸값 결정

오픈AI와 앤스로픽의 경쟁은 기업공개(IPO) 시장에서도 치열하게 펼쳐지고 있다. 양사 모두 IPO를 앞두고 있는 가운데, 상장 시점과 밸류에이션이 시장의 핵심 관심사로 부상하고 있다. 이 과정에서 기업 가치의 판단 기준이 매출보다 기술력으로 이동하는 흐름도 뚜렷해지고 있다. 모델 성능 경쟁에서 뒤처질 경우 기업 가치 전반이 흔들릴 수 있다는 위기감이 양사의 모델 업그레이드 경쟁으로 이어지는 양상이다.

현시점 AI 업계 투자금 흐름은 오픈AI보다 앤스로픽으로 향하고 있다. 장외시장에서 오픈AI는 최근 투자 라운드에서 인정받은 기업가치 8,520억 달러(약 1,280조원)보다 약 10% 낮은 7,650억 달러(약 1,135조원) 수준의 평가를 받고 있다. 이에 반해 앤스로픽은 지난 2월 인정받은 기업가치 3,800억 달러(약 564조원)에 50% 이상 프리미엄이 붙은 6,000억 달러(약 890조원)로 평가되고 있다. 다만 두 회사 모두 투자자들의 임의 장외주식 거래를 허용하지 않아 이들에 대한 장외 주식 거래는 특수목적법인(SPV) 등을 통한 우회 거래로 진행되고 있다.

미국 장외 주식거래 플랫폼 넥스트라운드 캐피탈의 창업자 켄 스미스는 "장외 시장에서 오픈AI 주식에 대한 수요가 줄고 있다"고 상황을 전했다. 켄 스미스는 "대규모 헤지펀드와 VC가 6억 달러(약 9,000억원) 규모의 오픈AI 주식을 장외시장에 매물로 내놨지만 관심을 보이는 투자자가 없었다"며 "반면 앤스로픽에 투자하겠다는 매수자들의 현금은 20억 달러(약 3조원)나 모여 있다"고 말했다. 또 다른 장외거래 플랫폼 오그먼트의 애덤 크롤리 공동창업자도 앤스로픽에 대한 투자 수요가 오픈AI보다 더 높다고 진단했다. 그는 "사람들은 앤스로픽의 가치가 오픈AI를 따라잡을 것이라고 베팅한다"며 "오픈AI 주식을 사면 단기적으로 어떤 수익을 얻을 수 있을지 불분명하다"고 지적했다.

기술 경쟁에 이은 윤리 경쟁에서도 앤스로픽이 한발 앞서는 분위기다. 경쟁의 시작점은 2017년 1월 개최된 아실로마 콘퍼런스(Asilomar Conference)로 거슬러 올라간다. 당시 미국 비영리 단체 미래생명연구소(FLI)는 AI의 향후 발전상과 윤리적인 문제에 대한 합의를 위해 전 세계 AI 석학들과 기술 기업 경영자들을 모아 콘퍼런스를 개최했다. 이 자리에서 석학과 AI 개발자들은 △인류에게 유익한 지능을 만들고 △윤리적으로 검증되고 안정적인 시스템을 구축해야 한다는 원칙을 제정했다.

하지만 오픈AI는 제정 2년 뒤인 2019년, 영리 자회사를 설립해 아실로마 원칙을 위배했다는 논란이 나왔고, 2023년 챗GPT를 출시했을 때는 모델 공개를 거부했다. 이후 공익 법인 전환, 수익상한제 폐지 등을 통해 아실로마 정신과 사실상 결별했다. 반면 앤스로픽은 원칙 중 공동의 이익과 지능 폭발에 대한 대비를 지배구조 수준에서 지키고 있다는 평가다. 앤스로픽은 장기이익신탁(LTBT)이라는 독립 기구가 이사회 구성권을 가지며, 거대 투자자가 안전 원칙을 무시하고 이익 사업을 벌이라고 압박하면 신탁 위원들이 이사회 멤버를 해임할 수 있다. 또한 책임감 있는 확장 정책을 발표해 AI 모델이 일정 수준 이상으로 위험하면 안전 장치가 확보될 때까지 학습을 중단하겠다고 약속한 상황이다.

Picture