Skip to main content
  • Home
  • 반도체
  • 구글 ‘터보퀀트’ 쇼크로 메모리업계 타격? 메모리 수요 흔들 수준 아니다

구글 ‘터보퀀트’ 쇼크로 메모리업계 타격? 메모리 수요 흔들 수준 아니다

Picture

Member for

1 year 7 months
Real name
이제인
Position
기자
Bio
[email protected]

뉴스의 사회적 책임을 자각하며 공정하고 균형 있는 시각을 최우선으로 합니다. 꾸준한 추적과 철저한 리서치를 바탕으로 사실만을 전달하겠습니다.

수정

AI 메모리 공식 뒤흔든 구글
‘폴라퀀트·QJL’로 정확도 유지한 초압축 구현
장기적으론 ‘반도체 대중화’ 촉매제
터보퀀트는 Llama-3.1-8B-Instruct 모델을 기반으로 한 LongBench 벤치마크 전반에서 다양한 압축 기법 대비 견고한 KV 캐시 압축 성능을 입증했다. 괄호 안 수치는 각 기법의 비트폭(bitwidth)을 의미한다/출처=구글 리서치

구글이 인공지능(AI) 메모리 사용을 획기적으로 줄인 ‘터보퀀트(TurboQuant)’ 기술을 공개하면서, 업계와 시장이 술렁이고 있다. AI가 발전할수록 메모리 반도체 수요가 폭발한다는 통념을 무너뜨리는 분수령이 될 수 있다는 점에서다. 당장 터보퀀트 기술 공개 후, 글로벌 반도체 기술주가 하락하며 시장이 반응하기도 했다. 다만 전문가들은 터보퀀트의 파급력이 마케팅적으로 과장된 측면이 있고 본격적으로 도입된다 해도 메모리 공급절벽의 해갈 수준을 넘기 힘들다고 보고 있다. 오히려 AI 대중화를 앞당김으로써 장기적으로 메모리 수요를 더욱 폭증시킬 것이라는 반론도 나온다.

AI의 기억력 압축하는 ‘진공 압축팩’

26일(이하 현지시간) 구글 리서치팀은 이날 대규모언어모델(LLM)의 추론 과정에서 발생하는 메모리 병목 현상을 해결하기 위한 새로운 기술인 터보퀀트를 전격 공개했다. AI 모델의 메모리 사용 효율을 극대화한 터보퀀트는 정확도를 유지하면서도 모델의 크기를 극단적으로 축소하는 기술을 사용해 메모리 사용량을 최대 6분의 1 수준으로 줄인 것이 특징이다.

터보퀀트 기술의 핵심은 크게 세 가지다. 먼저 데이터 자체를 작게 만들어 메모리 사용을 줄인다. 이는 맥락 데이터의 크기를 축소하는 ‘극좌표양자화’(폴라퀀트) 기술로, AI가 다루는 데이터의 구조를 ‘직교좌표계’에서 ‘극좌표계’로 바꾸는 방식으로 크기를 줄인다. “동쪽으로 3칸, 북쪽으로 4칸 가라” 지시를, “37도 각도로 5칸 가라”로 바꾸는 식이다. 동서남북 네 방향밖에 없는 2차원 공간에서는 이 같은 지시 변화가 데이터 크기를 그다지 줄이지 못하지만, 실제로 AI가 사용하는 데이터는 수백~수천 차원 벡터 구조로 돼 있어 효과가 크다.

두 번째는 오차를 줄이는 ‘QJL’(양자화 존슨-린덴스트라우스 변환) 기술이다. 압축 과정에서 발생할 수 있는 미세한 오차는 QJL 기술을 사용해 바로잡는다. 단 1비트만을 소모하는 이 기술은 메모리를 거의 사용하지 않고도 일종의 '수학적 오류 검사기' 역할을 하게 된다. 마지막은 문제를 더 압축된 형태로 변환하는 기술이다. 같은 문제를 더 작은 수식으로 푸는 방식이다.

챗GPT나 제미나이 같은 LLM은 대화가 길어질수록 예전 내용을 기억하기 위해 주고받았던 모든 질문과 답변을 임시로 기억해 둔다. 이 핵심적인 기억 공간을 'KV 캐시(Key-Value Cache)'라 부른다. KV 캐시는 AI가 정보의 맥락인 키(key)와 정보값인 밸류(value)를 담아두는 임시 메모장 역할을 한다. KV 캐시가 없으면 AI는 사용자와의 이전 대화를 기억하지 못해 늘 새로운 대화를 하게 된다. KV 캐시가 꽉 찰 경우 AI가 느려지거나 먹통이 되기 때문에 방대한 양의 메모리 반도체 확보가 필수적이다.

터보퀀트는 바로 이 거대한 기억 공간의 낭비를 획기적으로 줄여주는 '데이터 압축 알고리즘'이다. 부피가 큰 패딩이나 이불을 옷장에 보관할 때 진공 압축팩에 넣어 공기를 빼고 크기를 줄이는 것과 같은 원리다. 이전에는 100페이지 분량의 책 내용을 통째로 기억해야 했다면, 터보퀀트 기술은 의미는 모두 살리면서 요약본으로 압축해 저장하는 것이다.

터보퀀트 쇼크, 메모리 수요 둔화 우려 확산

터보퀀트 기술은 곧장 시장에 충격을 안겼다. 향후 빅테크 기업들이 AI 데이터센터를 새롭게 구축하거나 확장할 때, 서버에 탑재되는 메모리 반도체의 절대적인 수량이 줄어들 수 있다는 우려 때문이다. 이에 메모리 반도체 회사들의 주가도 일제히 급락했다. 26일 삼성전자는 전일보다 4.71% 내린 18만100원에 거래를 마쳤고, SK하이닉스는 6.23% 하락한 93만3,000원에 장을 마감했다. 마이크론(-3.4%), 샌디스크(-3.5%), 키옥시아(-5.7%) 등 글로벌 메모리 칩 기업도 충격을 피하지 못했다.

업계 전문가들은 구글의 이번 발표가 '하드웨어 중심의 AI 확장' 시대에서 '소프트웨어 효율화' 시대로의 전환을 의미한다고 분석했다. 골드만삭스 등 글로벌 투자기관들은 "빅테크 기업들이 천문학적인 데이터센터 구축 비용을 줄이기 위해 메모리 구매량을 줄이는 방향으로 선회할 수 있다"며 메모리업계의 '피크 아웃(정점 통과)' 가능성을 제기했다. 웰스파고의 앤드루 로차 TMT 애널리스트도 "필요한 메모리 사양이 낮아진다면 결국 전체 메모리 용량 수요가 얼마나 필요한지에 대한 의문이 제기될 수 있다"고 말했다. 그러면서 "터보퀀트는 여기서 비용 곡선을 직접적으로 공격하고 있다"고 지적했다.

시장은 특히 이번 충격이 메모리 반도체 가격 인상 흐름이 본격화되던 시점에 터졌다는 점에 주목했다. 고대역폭메모리(HBM)를 중심으로 한 고부가 메모리 시장은 공급 부족 상황이 지속돼 왔고, 업계에서는 올해도 메모리 가격 상승세가 이어질 것이라는 전망이 지배적이다. AI 서버 투자 확대, 에이전틱 AI 확산, 온디바이스 AI 수요 증가 등이 복합적으로 작용하면서 수요 증가 기대감이 주가를 끌어올려왔던 터였다. 이런 상황에서 터보퀀트는 고부가가치 메모리 반도체가 끝없이 팔려나갈 것이라는 강력한 기대감에 찬물을 끼얹었다.

제번스의 역설, 장기 수요 확대 기대

하지만 반론도 만만치 않다. 터보퀀트는 메모리를 덜 쓰게 만드는 기술이지만 동시에 AI 추론 비용을 낮추는 기술이기도 하다. 같은 인프라로 더 긴 문맥을 처리하고, 더 많은 동시 요청을 소화하며, 더 복잡한 에이전틱 AI 서비스를 돌릴 수 있게 되면 오히려 전체 AI 사용량이 더 크게 늘어날 수 있다. 메모리 효율이 높아졌다고 해서 총 메모리 수요까지 줄어든다고 단정할 수 없는 이유다.

모건스탠리는 “터보퀀트로 인해 AI 운영 비용이 6분의 1 수준으로 낮아지면 비용 부담으로 도입을 망설이던 기업들이 AI 생태계에 진입하게 될 것”이라며 “이는 전체 메모리 총수요를 줄이는 것이 아니라 오히려 AI 시장의 파이 자체를 키우는 촉매제가 될 것”이라고 진단했다. 자원의 이용 효율이 높아지면 비용이 하락하게 되고 이는 결국 해당 자원의 전체 소비량을 폭발적으로 늘린다는 ‘제번스의 역설(Jevons Paradox)’이다. 이 경우 개별 작업당 메모리 사용량은 줄더라도 전체 쿼리와 토큰 사용량이 늘어나 총 수요는 오히려 더 커질 수 있다.

병목 현상의 이동에 주목해야 한다는 분석도 있다. 터보퀀트로 데이터 용량을 줄여 처리 속도를 높이게 되면, 오히려 데이터를 더 빠르게 주고받아야 하는 대역폭의 중요성이 훨씬 커진다는 것이다. 결국 용량은 줄어들지 몰라도 더 고성능의 HBM이나 차세대 연결 기술인 CXL(Compute Express Link)에 대한 요구는 오히려 가속화할 것이라는 논리다. 이미 합의된 사항도 존재한다. 현재 HBM 공급 부족은 소프트웨어 기술 때문이 아닌 물리적인 공장 건설과 수율 문제다. 삼성전자와 SK하이닉스의 올해 물량은 이미 완판된 상태로, 알고리즘 하나가 이 거대한 물리적 흐름을 즉각적으로 돌려놓기는 어렵다는 데 의견이 모이고 있다.

메모리 시장에 대한 전망도 여전히 밝다. 시장조사기관 카운터포인트리서치는 지금 같은 공급 부족 현상이 최소 내년 하반기까지 이어질 것으로 내다보고 있는데, 메모리 계약 가격은 올 1분기에 전 분기와 비교해 180%까지 뛸 만큼 유례없는 급등세를 보이고 있음에도 없어서 못팔 지경이다. 특히 서버용 D램과 HBM 매출 비중이 전체의 60%를 차지하며 시장을 압도하고 있는 상황으로, 하이퍼스케일러들의 올해 자본지출 예상액만 6,000억 달러(약 903조원)를 넘어설 만큼, 수요나 가격이 꺾일 기미는 보이질 않고 있다.

Picture

Member for

1 year 7 months
Real name
이제인
Position
기자
Bio
[email protected]

뉴스의 사회적 책임을 자각하며 공정하고 균형 있는 시각을 최우선으로 합니다. 꾸준한 추적과 철저한 리서치를 바탕으로 사실만을 전달하겠습니다.