[해외 DS] AI 가속기 '가우디 3' 출시, 엔비디아 아성에 도전하는 인텔
입력
수정
비전 2024, 거대 언어 모델의 훈련·추론 성능 향상 위한 AI 칩 공개
엔비디아 H100 대비 훈련 속도 50%, LLM 실행 속도 30% 향상
네이버와 AI 반도체 연구소 공동 설립, 엔비디아 독점 견제
가우디 3 출시로 인텔 파운드리 사업 적자 극복 기대
미국 종합반도체기업 인텔은 9일(현지시각) 애리조나주 피닉스에서 열린 '인텔 비전 2024'에서 대규모언어모델(LLM)의 훈련 및 실행 성능을 향상시키기 위해 설계된 최신 AI 칩 '가우디 3'을 발표했다.
인텔은 엔비디아의 주력 GPU인 H100을 콕 찍어 비교했다. 인텔이 공개한 자료에 따르면 가우디 3은 H100에 비해 훈련 속도가 50%, LLM 처리 속도가 30% 더 빠르다고 한다.
팻 겔싱어 인텔 CEO는 "혁신은 실리콘을 통해 전례 없는 속도로 진행되고 있으며, 모든 기업이 빠르게 AI 기업으로 거듭나고 있다"라며, "인텔은 PC에서 데이터 센터, 엣지에 이르기까지 기업 전반의 모든 곳에 AI를 도입하고 있다. 인텔의 최신 가우디, 제온(Xeon)과 코어 Ultra 플랫폼은 고객과 파트너의 변화하는 요구를 충족하고 앞으로의 엄청난 기회를 활용할 수 있도록 맞춤화된 응집력 있는 유연한 솔루션 포트폴리오를 제공하고 있다"고 강조했다.
"고객 니즈 맞춘 매력적인 대안", 뛰어난 성능·확장성·비용 효율성 앞세워
가우디 3은 향상된 메모리와 네트워킹 대역폭을 자랑하며 이전 가우디 2에 비해 4배 더 많은 AI 컴퓨팅을 제공한다. 아울러 이 칩에는 수만 개의 가속기가 내장되어 있으며 이더넷을 통해 상호 연결도 가능한 것이 강점으로 꼽힌다.
또한 인텔은 가우디 3 칩의 비용 효율성이 실험이나 기존 AI 배포를 확장하는 기업에 적합하다고 밝혔다.
인텔 부사장 겸 데이터센터·AI 그룹 총괄 매니저인 저스틴 호타드는 "끊임없이 진화하는 AI 시장의 환경 속에서 기존의 제품들과 고객의 니즈 사이에는 상당한 격차가 존재한다. 고객과 시장의 피드백은 선택의 폭을 넓히고자 하는 열망을 보여준다"라고 운을 뗐다.
이어 그는 "기업들은 가용성, 확장성, 성능, 비용, 에너지 효율성 등을 고려하는데, 인텔 가우디 3은 가격 대비 성능, 시스템 확장성, 짧은 가치 실현 시간의 이점을 제공해 매력적인 대안으로 주목받고 있다"고 덧붙였다.
네이버·인텔 AI 동맹, AI 반도체 연구소 설립으로 엔비디아 독점에 맞서
네이버가 바로 가우디 3칩의 얼리 어답터 중 하나다. 비전 2024에서 네이버는 가우디 하드웨어를 사용하여 글로벌 AI 서비스를 위한 새로운 LLM을 개발하기 위해 인텔과 협업할 계획이라고 발표했다.
협력의 배경은 엔비디아의 AI 칩 시장 독점에 대한 우려다. 인텔은 AI 학습·추론 병렬 처리 소프트웨어 시장을 장악한 엔비디아 CUDA의 독점적 지위를 견제하고, 네이버는 엔비디아의 GPU 공급 부족과 가격 상승에 따른 경영·비용 리스크가 부담스러운 상황이다.
따라서 인텔은 네이버를 이용해 가우디 기반의 'AI 소프트웨어 생태계' 확대를, 네이버는 저렴하고 안정적인 AI 칩 확보와 하이퍼클라우드 AI 업데이트, 그리고 클라우드 운영 비용 절감을 꾀하고 있는 것으로 분석된다. 네이버는 특히 인텔 칩의 '전력 대비 성능'을 높이 샀다고 전했다.
네이버와 인텔의 협력은 AI 칩 시장에 큰 변화를 불러올 수 있는 잠재력이 있지만, 그만큼 불확실성도 존재한다는 지적이 제기됐다. 네이버는 자사의 AI 모델에 인텔 칩을 한 번도 활용한 경험이 없는 데다, 인텔의 AI 칩은 엔비디아 칩 대비 경쟁력이 입증되지 않은 상태기 때문에 엔비디아의 독주를 효과적으로 견제할 수 있을지는 더 지켜봐야 한다는 것이다.
인텔, 가우디 3 출시로 파운드리 사업 적자 극복 기대
한편 지난해 인텔 파운드리 사업이 대규모 적자를 낸 것에 이어 올해 파운드리 사업 적자 규모가 정점을 찍을 것으로 예상되는 가운데, 시장에서는 가우디 3으로 인한 '파운드리 사업 적자 상쇄' 기대가 피어오르고 있다.
주가는 지난해 말 대비 23.5% 하락하고 올해 들어 지속 하락세를 보여, 인텔의 가우디 3의 성공 여부에 이목이 쏠리고 있다. 이에 가우디 3과 함께 인텔은 새로운 제온 프로세서도 살짝 선보였다. 생성형 AI 워크로드를 구동하도록 설계된 제온 6s는 클라우드·엣지 워크로드를 위한 데이터 센터에서 실행할 수 있다.
올해 말 출시될 두 가지 제온 6 제품군인 시에라 포레스트(Sierra Forest)와 그래닛 래피즈(Granite Rapids)는 올해 초에 출시되었던 5세대 버전을 대체할 예정이다. 시장 반전에 만전을 기한 모습이다.
또한 인텔은 기업이 생성형 AI 소프트웨어 배포를 용이하게 하는 데 사용할 수 있는 솔루션 제품군인 타이버(Tiber)도 공개했다. 타이버는 기업 고객이 클라우드 또는 엣지에서 AI 서비스를 안전하게 배포하는 데 사용할 수 있는 도구를 컴파일하는 기능이 있으며, 향후 몇 달 내에 출시될 계획이다.
마지막으로 인텔은 새로운 칩을 올해 말 일반 출시에 앞서 하반기에 델 테크놀로지스, HPE, 레노버를 비롯한 하드웨어 제조업체에 먼저 제공하려고 한다. 그리고 Wi-Fi 카드나 SSD와 같은 다른 고속 입출력 구성 요소를 연결할 수 있는 가우디 3용 PCIe 애드인 카드 출시도 올해 3분기에 예정되어 있다.