적자 속 '비용 절감 모드' 돌입한 오픈AI, 구형 라인업 퇴출하고 GPT-5.2에 집중
적자 속 '비용 절감 모드' 돌입한 오픈AI, 구형 라인업 퇴출하고 GPT-5.2에 집중
입력
수정
오픈AI, 챗GPT 내 구형 모델 정리 종료 발표 후 반발 직면해 되살린 GPT-4o 포함 GPT-5 집중 통한 재무 건전성 확보

오픈AI가 챗GPT에서 구형 인공지능(AI) 모델 지원을 대거 종료한다. 여기에는 한 차례 이용자 반발로 복구됐던 'GPT-4o'도 포함된다. 확보된 컴퓨팅 자원을 최신 모델 고도화에 집중하겠다는 전략으로, 막대한 적자 구조를 타파하기 위해 '저비용 고효율' 중심의 체질 개선이 불가피해진 데 따른 것으로 분석된다.
GPT-4o 포함 구형 모델 공식 종료
2일 IT업계에 따르면 오픈AI는 최근 공식 블로그를 통해 오는 13일(이하 현지시간)부로 GPT-4o, GPT-4.1, GPT-4.1 미니, 오픈AI o4-미니 등을 챗GPT에서 종료할 예정이라고 밝혔다. 이에 따라 해당 모델들은 이달 14일부터 챗GPT 모델 선택 목록에서 완전히 제외된다. 기존에 단계적 은퇴가 예고됐던 GPT-5 인스턴트와 GPT-5 씽킹 모델도 같은 시점에 서비스 라인업에서 빠진다. 다만 개발자 대상 API 서비스는 이번 조치와 무관하게 기존과 동일하게 유지된다.
오픈AI는 이달 모델 정리와 함께 챗GPT 운영 정책 변화도 예고했다. 불필요한 답변 거절이나 훈계조 표현을 줄이고, 성인 이용자에게는 보다 넓은 자유도를 제공하는 ‘성인 전용 모드’ 도입을 준비 중이다. 이를 위해 전 세계 사용자를 대상으로 연령 예측 기술을 적용하고, 미성년자 보호를 위한 안전장치도 병행한다는 방침이다. 표현의 자유와 책임 있는 사용 사이의 균형을 맞추겠다는 의미다.
챗GPT의 구형 모델 서비스 종료는 오픈AI가 앞서 예고한 대로 GPT 5.2에 집중하려는 전략에 따른 것이다. 오픈AI는 "일부 플러스 및 프로 사용자로부터 창의적 아이디어 구상 등 핵심 활용을 (차세대 모델로) 전환하는 데 더 많은 시간이 필요하다"고 강조했다. 이어 "이런 변화에는 적응할 시간이 필요하다는 점을 알고 있다. 특히 GPT-4o 종료가 일부 사용자에게는 큰 실망을 안길 수 있단 점을 이해한다"면서도 "결정은 결코 가볍게 내린 것이 아니다. 대부분의 사용자가 활용하는 모델을 더 집중해서 개선하기 위해 필요한 과정"이라고 말했다.
친근한 답변 호평에 퇴출 취소됐던 GPT-4o
당초 오픈AI는 지난해 8월 차세대 모델 도입을 이유로 GPT-4o를 제거하려 했지만, 이용자 반발에 부딪혀 샘 올트먼 최고경영자(CEO)가 직접 나서 하루 만에 복구를 결정한 바 있다. GPT-4o는 지난 2024년 5월 공개된 모델로, 음성 기능을 통합한 '옴니(Omni)' 모델 1세대에 해당한다. 자연스럽고 따뜻한 대화 스타일로 챗GPT 인기에 큰 도움이 됐다.
하지만 챗GPT의 말투는 지난해 들어 거듭 논란에 휩싸였다. GPT-4o의 친절하고 따뜻한 말투 덕분에 그동안 AI를 단순한 도구가 아니라 마치 친구처럼 느끼고 사용하는 이용자가 많았으나, 새로 업데이트된 GPT-5는 이전 버전에 비해 말투가 형식적이고 감정이 없어 보인다는 평가가 우세했다. 많은 사람이 테스트해 본 결과, GPT-4o가 훨씬 더 표현력이 풍부하고 세심한 답변을 준다는 반응이 대다수였다. 각종 해외 테크 웹사이트도 GPT-4o 버전이 GPT-5보다 나은 이유에 대한 기사를 쏟아내며 불씨를 키웠다. 미국 커뮤니티 레딧(Reddit)의 챗GTP 게시판에서도 논쟁이 이어졌고 일부 이용자는 GPT-5를 ‘재앙’, ‘형편없는’ 같은 표현을 쓰며 비하하기까지 했다.
챗GPT의 어조를 둘러싼 논란이 반복되자 오픈AI는 유료 이용자에게 GPT-4o를 다시 사용할 수 있는 옵션을 지원하는 한편, 말투 선택권을 넘기는 방식으로 대응했다. 챗GPT의 따뜻함(warmth·친절함 정도), 열정 수준(enthusiasm·대화에서 드러내는 흥분과 차분함의 정도), 이모티콘 사용 빈도 등을 이용자가 직접 변경할 수 있는 기능을 추가한 것이 대표적이다. 이에 따라 이용자는 기호에 맞춰 각 설정을 기본, 많이, 적게 중 선택할 수 있다. 또한 신기능 도입으로 이용자는 오픈AI가 지난해 11월 추가한 전문적(Professional), 솔직한(Candid), 기발한(Quirky) 등 기본 스타일에 더해 챗GPT의 말투를 더 세밀하게 조정할 수 있게 됐다.

천문학적 적자 구조, 토큰 소비 과잉 모델 정리해 비용 절감
그러나 오픈AI에 따르면 GPT-4o를 매일 사용하는 사용자는 전체의 0.1%에 불과하다. 대다수 사용자는 최신 GPT-5를 사용하고 있다. 현재 GPT-5의 말투는 더 따뜻하고 친절하게 개선된 상태다. 또한 GPT-5 모델은 과거 이용자들이 만족했던 부드러운 대화 체계를 완벽히 흡수하면서도 답변의 정확도를 한층 더 끌어올렸다. 기술적 한계를 극복하고 사용자의 정서적 요구치까지 충족했다는 내부 판단이 서자, 구형 라인업의 공식 종료를 확정한 것으로 분석된다.
여기에 더해 오픈AI는 고비용 저효율 구조를 탈피해야 하는 절박한 과제에 직면해 있다. 막대한 서버 운용비로 인한 재무적 압박에서 자유롭지 못하다는 뜻이다. 최근 올트먼 CEO는 투자자들에게 “수년간 막대한 적자가 이어질 수 있다”며 회사 수익성이 압박을 받고 있음을 시사한 바 있다. 월스트리트저널(WSJ)에 따르면 오픈AI는 2028년까지 영업손실이 연간 740억 달러(약 108조원)에 이를 것으로 추산됐다. 이는 예상 매출의 4분의 3에 해당하는 규모다.
GPT-4o를 비롯한 기존 모델들은 답변 생성 과정에서 과도한 토큰을 소모하며 수익성을 저하시키는 주범으로 지목돼 왔다. 천문학적인 데이터센터 유지비와 전력 소모를 감당하기 위해선 성능 대비 토큰 효율성이 비약적으로 개선된 혁신이 필수적이다. 실제 GPT-5 기본 모델은 입력 토큰 100만 개당 1.25달러로, 입력 토큰 100만 개당 2.5달러인 GPT-4o의 절반 수준이다. 출력 토큰 단가는 100만 개당 10달러로 이전과 동일하지만, 반복 입력은 자동으로 인식하게 하고 한 번에 처리할 수 있는 문서 길이도 늘어나 대규모 데이터를 다루는 경우 비용 부담이 줄어든다. 또 GPT-5는 입력토큰 15달러, 출력토큰 75달러부터 시작하는 앤스로픽의 '클로드 오푸스 4.1' API보다 저렴하다.
더욱이 GPT-5는 연산 과정에서의 불필요한 중복을 제거하고 최적의 경로로 답변을 도출함으로써 단위 토큰당 생산성을 극대화하도록 설계됐다. 이는 답변의 양적 팽창보다는 질적 밀도를 높여 서버 부하를 줄이는 방식으로 평가된다. GPT-5로의 집중은 이러한 비용 구조를 혁신하려는 오픈AI의 비용 절감 모드 본격화를 의미한다. 오픈AI는 현재 가장 많은 트래픽과 가장 큰 서버 비용을 부담하는 사업자로, 시장에서 가장 먼저 비용 절감 국면에 들어갈 수밖에 없는 위치다. 이에 업계 전문가들은 오픈AI가 주도하는 비용 효율화가 경쟁 모델들의 동반 진화를 유도하며 산업 전반의 표준을 재편할 것으로 보고 있다. 한 AI 전문가는 "이제 AI 모델의 수익성은 얼마나 많은 데이터를 학습했는지가 아니라, 얼마나 적은 자원으로 최고의 답변을 제공하는가에 따라 판가름 날 것"이라고 짚었다.