입력
수정
챗GPT 등 생성형 AI 열풍이 지속되고 있는 가운데, 세계 최대 전자 상거래 업체 아마존도 생성형 AI 시장에 본격적으로 뛰어들었다. 아마존은 지난 13일(현지 시각) 새로운 기업용 클라우드 서비스 '베드록'을 미리보기 형태로 출시하겠다고 밝혔다. 베드록은 챗GPT와 비슷한 형태의 생성형 AI로, 텍스트 생성 AI 시스템을 이용한 플랫폼 서비스다. 아마존은 기업들이 베드록을 이용해 비즈니스 요구에 맞게 설계 가능한 자체 AI를 개발하고 향상시킬 수 있을 것으로 보고 있다.
베드록, 기업들에 타이탄·쥬라기2 등 맞춤형 LLM 제공
알려진 바에 따르면, 기업들은 아마존 클라우드 서비스(AWS)에서 아마존이 제공하는 두 가지 대규모 언어 모델인 '타이탄 텍스트'와 '타이탄 임베딩스'를 사용해볼 수 있다. 타이탄 텍스트는 챗GPT와 유사한 챗봇으로 요약, 텍스트 생성, 분류, 질문 및 답변, 정보 추출을 위한 생성형 LLM이다. 타이탄 임베딩스는 텍스트 입력을 문맥에 맞는 응답을 생성하는 데 필요한 숫자 표현인 '임베딩'으로 변환하는 LLM으로, 직접 텍스트를 생성하진 않지만 임베딩을 비교해 단어 일치보다 더 관련성 있고 상황에 맞는 응답을 생성할 수 있다. 이 같은 특징 덕에 타이탄 임베딩스는 검색을 통한 이용자 개인의 맞춤형 설정을 제공할 수 있는 것이다.
아마존은 베드록을 통해 타이탄 외에도 스타트업 AI21의 언어 모델 '쥬라기-2(Jurassic-2), 구글이 지원하는 앤트로픽의 언어 모델 ‘클로드(Claude)’, 스태빌리티AI의 이미지 생성 AI 모델 ‘스테이블 디퓨전’도 이용할 수 있도록 할 방침이다. 앤디 재시 아마존 최고경영자(CEO)는 "대부분의 기업이 대규모 언어 모델을 사용하길 원하지만 좋은 모델은 훈련에만 수십억 달러와 수년이 걸린다"며 "이런 과정을 거치고 싶지 않은 기업들이 원하는 게 바로 맞춤화 기능이며, 이를 제공할 수 있는 게 바로 베드록"이라고 힘줘 말했다.
아마존의 베드록은 확장 가능하고 안정적이며 안전한 AWS 관리형 서비스를 통해 제공될 예정이다. 베드록은 기업이 인프라를 직접 관리할 필요 없이 AWS 도구와 기능을 이용해 수행하려는 작업에 적합한 모델을 쉽고 빠르게 찾을 수 있도록 돕는다. 또한 자체 데이터로 FM을 맞춤화하고 각 애플리케이션에 쉽게 통합·배포할 수 있다.
베드록의 핵심이라 할 만한 기술은 단연 '모델 맞춤화 용이성'이다. 고객은 아마존 S3(Amazon S3)에서 몇 가지 레이블이 지정된 예시 중 베드록을 가리키기만 하면 대용량 데이터에 주석을 달지 않고도 특정 작업에 대한 모델을 미세 조정할 수 있다. 이 같은 프로세스를 이용하기 위해선 최소 20여 개의 예시면 충분한 것으로 알려졌다.
정보 공개 거부한 아마존, 구글 '바드 사태' 또 일어나나
오픈AI 언어 모델을 기반으로 한 챗GPT나 마이크로소프트사의 Bing(빙) 등 챗봇은 겉으로 보기에 설득력 있는 답변을 내놓아도 실제론 교육 데이터와 전혀 관계없는 부정확한 정보를 내놓기도 한다. 실제 구글의 생성형 AI 바드는 시연회장에서 잘못된 정보를 내놓은 탓에 구글의 주가를 폭락시킨 바 있다. 당시 구글은 바드에게 '아홉 살 어린이를 상대로 제임스 웨브 우주망원경의 새로운 발견에 대해 어떻게 설명해줄 수 있을까'라고 물었으나, 바드는 '제임스 웹 우주 망원경은 태양계 바깥에 있는 행성 사진을 처음 찍었다'고 답한 것이다. 그러나 공식적으로 태양계 밖 이미지를 첫 촬영한 우주망원경은 유럽남방천문대가 설치한 초거대 망원경 'VLT'다. 이 사건으로 인해 구글의 주가는 그날에만 7.68% 하락했고, 구글의 생성형 AI 기술에 대한 불신도 깊어졌다.
바드 사건은 결국 통계 시스템의 약점이 드러난 것이라고 전문가들은 설명한다. 옥스퍼드대 카르사 밸리즈 철학과 교수는 "이런 통계 시스템은 정답이 아닌 그럴듯한 답변들을 열거한다"며 "기업들은 새로운 기술을 출시하는 데만 눈이 멀었다. 기업들은 사회에 미치는 기술의 영향력을 전혀 고려하지 않고 있다"고 목소리를 높였다. 부정확한 정보를 만연히 퍼뜨릴 가능성이 있는 챗봇 시스템에 대한 불안감을 드러낸 것이다.
이 같은 불안에 대해선 아마존 측도 긍정하고 있다. 아마존 측은 "타이탄 모델이 정확도 있고 고품질의 응답을 생성할 수 있도록 정말 우려하고 있다"고 전했다. 이어 타이탄 모델이 명확하지 않은 답변을 내놓지 않도록 노력하겠단 답변도 덧붙였다.
그러나 아마존 측은 타이탄 모델의 크기, 모델을 교육하는 데 사용한 데이터, 모델 교육 데이터의 문제가 있는 내용을 제거하기 위해 수행한 프로세스 등 기술력 부문에 있어 아무런 정보도 공개하지 않았다. 심지어 베드록 서비스의 비용마저도 공개하지 않았다. 현재 제한된 미리보기만 시행하고 있다는 이유에서다. 결국 아무것도 밝혀진 바 없는 상황에서 아마존 측의 '노력하겠다'는 몇 글자만 믿고 기다릴 수밖에 없는 것이 우리 소비자의 현실이다.
아마존도 결국 구글과 같이 챗GPT 히트 이후 제너레이티브AI 역량을 서둘러 내놓고 싶어 하는 대기업 중 하나에 불과하다는 점도 불안 요소다. 구글의 바드 사태가 아마존의 '타이탄 사태'로 또 한 번 발생하지 않을까 우려하는 목소리가 커지고 있는 이유다. 이에 대해 아마존 측은 "우리는 항상 상황이 준비됐을 때 물건을 출시하며, 이런 모든 기술은 매우 일찍 시작된다"고 자신했으나, 전문가들은 "챗GPT를 따라잡기 위해 서두르면 서두를수록 아마존 등 기업은 오히려 뒤처질 수 있다"고 지적했다.
아마존의 베드록 출시로 인해 클라우드 시장에서의 AI 서비스 경쟁은 더욱 치열해질 것으로 전망된다. 아마존은 클라우드 시장에서 수년째 1위 자리를 지키고 있고, 마이크로소프트와 구글이 그 뒤를 쫓고 있다. 결국 아마존의 베드록 출시는 자사의 '세계 최대 클라우드 서비스 제공 업체'라는 타이틀을 타 기업에 넘겨주지 않겠단 강력한 의지를 내비친 것으로 풀이해볼 수 있다. 베드록 출시 소식에 이날 뉴욕증시에서 아마존의 주가는 4.67% 펄쩍 뛰어올랐다. 과연 아마존의 베드록은 챗GPT와 같은 세계적 히트를 일으킬 수 있을까. 치열해지는 AI 경쟁 양상이 흥미로울 따름이다.