[AI MEMO] AI 이용량 폭증, 고정 요금제 모델의 수익성 한계 드러나
[AI MEMO] AI 이용량 폭증, 고정 요금제 모델의 수익성 한계 드러나
입력
수정
AI 연산 자원 부족 현실화, 정액제 구독 모델 한계 부상 GPU·전력·데이터센터 비용 급등, AI 기업 인프라 부담 확대 고강도 AI 사용 증가 속 인간 노동 대비 비용 효율 재평가 필요
본 연구 기사는 유럽 경제 연구소 The Economy의 연구위원(Fellow)들이 작성한 The Economy Review 시리즈 기고문을 한국 시장 상황에 맞춰 재구성한 글입니다. 본 시리즈는 최신 기술-경제-정책 이슈에 대해 연구자의 시각을 담아, 일반 독자들에게도 이해하기 쉽게 전달하는 것을 목표로 합니다. 기사에 담긴 견해는 집필자의 개인적인 의견이며, The Economy 또는 집필자의 소속 기관의 견해와 일치하지 않을 수 있습니다.

올해 3월 말, 앤스로픽(Anthropic)의 AI 서비스 ‘클로드(Claude)’ 이용자들은 새로운 형태의 자원 부족 현상을 겪었다. 5시간 사용 한도가 적용된 세션이 불과 20분 만에 종료되는 사례가 잇따르면서다. 이는 인공지능(AI) 연산 자원 부족이 서비스 운영과 가격 체계 전반에 영향을 미치기 시작했음을 보여준다.
초기 고정 요금제가 도입됐을 당시 이용자들은 AI 생성물을 사실상 무료에 가까운 재화처럼 받아들였다. 하지만 프롬프트 하나를 처리하는 과정에는 반도체 칩과 메모리, 전력, 서버 운영 역량 같은 대규모 인프라가 필요하다. 여기에 고강도 이용자의 요구 수준까지 높아지면서 기존 저가형 구독 모델의 부담도 빠르게 확대되고 있다. 사실상 저렴한 AI 서비스는 막대한 운영 비용을 기업이 보조금처럼 떠안는 구조 위에서 유지돼 온 셈이다.
연산 자원 부족에 흔들리는 비용 구조
AI 연산 자원 부족은 단순한 이용자 불편 차원의 문제가 아니다. 모든 이용자에게 대규모 사용 시간을 동일한 고정 비용으로 제공하던 구조 자체가 한계에 다다르고 있다는 의미다. 소비자용 AI 서비스는 가벼운 웹 플랫폼처럼 보이지만, 실제 운영에는 발전소와 데이터센터, 물류 시스템 수준의 대규모 인프라가 투입된다.
특히 AI 모델이 단순 대화형 서비스를 넘어 자율형 에이전트와 코드 생성, 업무 자동화 영역으로 확장되면서 작업당 운영 비용도 빠르게 오르고 있다. 앤스로픽이 최근 유료 이용자를 대상으로 세션·주간 단위 사용 한도를 공개하고, 메시지 길이와 파일 크기, 모델 종류에 따라 토큰 비용이 달라진다는 점까지 안내하기 시작했다. 월 20~30달러(약 2만9,000~4만4,000원) 수준의 구독 요금은 가벼운 질문에는 적용 가능하다. 그러나 매일 수 시간씩 이어지는 에이전트 작업까지 현재 요금 체계 안에서 감당하기에는 비용 부담이 확대되는 양상이다.

정액제 모델의 수익성 한계
고정 요금제의 균열은 하드웨어 시장에서도 확인된다. 현재 AI 정액제는 사용량이 적은 이용자가 고강도 이용자의 비용 일부를 떠안는 ‘교차 보조’ 구조를 기반으로 유지되고 있다. 그러나 하드웨어와 에너지 비용이 급등하면서 이 같은 체계의 부담도 갈수록 확대되는 추세다. 실제로 지난해 10월부터 올해 3월 사이 H100 칩 가격은 약 40% 상승했다. 중국 내 엔비디아(NVIDIA) B300 서버 가격은 대당 100만 달러(약 14억6,230만원)까지 치솟았으며, 이는 미국 기업 공급가의 거의 두 배 수준이다.
이용자별 비용과 수익 구조의 불균형도 뚜렷해지는 분위기다. 앤스로픽이 제시한 가상 사례에서는 월 20달러(약 2만9,000원)를 내는 이용자가 수천달러 규모의 연산 자원을 사용하는 상황이 확인됐다. 이처럼 일부 고강도 이용자에게 비용이 집중되자 앤스로픽은 지난해 7월부터 주간 사용 제한 정책을 도입했다. 다만 회사 측은 해당 조치가 전체 이용자의 95%에는 영향을 주지 않을 것이라는 설명을 내놓았다. 반대로 보면 소수 이용자가 발생시키는 연산 비용 부담이 그만큼 크다는 의미로도 해석된다. 이 같은 변화는 업계 전반으로 확산되고 있다. 깃허브(GitHub)는 코파일럿(Copilot) 서비스를 올해 6월부터 사용량 기반 과금 체계로 전환할 계획이다.
전력 수요 급증에 커지는 인프라 부담
연산 자원 경쟁은 이제 전력 인프라 문제로까지 확대되고 있다. AI 산업은 전력망과 냉각 설비, 대규모 전력 공급 계약 확보를 둘러싸고 다른 산업과 경쟁하는 단계에 접어들었다. 데이터센터 운영에 막대한 전력이 필요해지면서 AI가 대표적인 에너지 다소비 산업으로 부상한 영향이다. 국제에너지기구(IEA)는 데이터센터 전력 사용량이 2024년 460테라와트시(TWh)에서 2030년 1,000TWh를 넘어설 것으로 전망했다. 글로벌 투자은행 골드만삭스 역시 같은 기간 데이터센터 전력 수요가 165% 증가할 것으로 내다봤다.
전력 사용 확대와 함께 AI 기업들의 인프라 투자 부담도 급격히 불어나고 있다. 오픈AI는 지난해 연간 매출 200억 달러(약 29조2,460억원)를 기록했지만, 같은 기간 컴퓨팅 부하는 0.6기가와트(GW)에서 1.9기가와트로 급증했다. 여기에 2030년까지 인프라 구축에 6,000억 달러(약 877조3,800억원)를 투자할 계획이며, 추론 비용 역시 1년 사이 두 배 이상 상승한 것으로 알려졌다.

고강도 AI 사용, 인간 노동보다 높은 비용 부담
일각에서는 AI 서비스 운영 비용이 상승함에 따라 인간 노동과 AI 노동의 비용 효율을 다시 평가해야 한다는 지적이 제기된다. 복잡한 작업 환경에서는 통제되지 않은 AI 연산 비용이 급격히 늘어나면서 단기적으로 인간 노동이 오히려 더 낮은 비용 구조를 형성할 수 있다는 분석에서다. 2024년 5월 기준 미국 소프트웨어 개발자의 연간 중위 임금은 13만3,080달러(약 19억4,312만원)다. 적지 않은 수준의 인건비지만, 통제되지 않은 AI 에이전트가 수만 달러 규모의 토큰을 소모하면서도 기대한 결과를 내지 못할 경우 비용 구조는 달라진다. 상황에 따라서는 AI 연산 비용이 숙련 인력 인건비를 웃도는 사례도 나타날 수 있다. 따라서 향후 경쟁력을 확보하는 기업은 작업 복잡도에 따라 모델을 구분해 운영하고, 컨텍스트 캐싱으로 중복 연산을 줄이며, 에이전트 실행 시간까지 관리하는 체계를 구축하는 방향으로 움직일 것으로 예상된다.
AI 산업, 기술 경쟁 넘어 비용 통제 시대
AI 컴퓨팅 병목은 AI 산업이 실제 물리적 비용 한계와 맞물리기 시작했음을 방증한다. 클로드의 사용 제한과 코파일럿의 과금 체계 개편, GPU 임대료 상승, 데이터센터 전력 수요 급증은 모두 AI 서비스 운영 비용이 빠르게 커지고 있다는 사실을 뒷받침한다. AI 지능 역시 막대한 연산 자원과 전력을 기반으로 작동하는 만큼, 그 비용을 누군가는 부담하고 관리해야 하는 구조다.
따라서 앞으로 AI 산업의 경쟁력은 제한된 자원을 얼마나 효율적으로 활용하고 이를 실제 가치 창출로 연결하느냐에 따라 좌우될 가능성이 크다. 이용자들은 더욱 투명한 사용량 공개와 비용 체계를 요구하고 있으며, 정책당국 역시 컴퓨팅과 에너지를 하나의 전략 산업으로 묶어 접근해야 한다. 일부 제한적 활용 분야에서는 저렴한 AI 서비스가 유지될 것으로 보인다. 그러나 산업 전반으로 확산되는 AI까지 낮은 비용 구조를 유지하기는 쉽지 않을 것이라는 전망이 우세하다.
본 연구 기사의 원문은 The Bill Comes Due for Cheap AI을 참고해 주시기 바랍니다. 본 기사의 저작권은 The Economy에 있습니다.