Skip to main content

[해외 DS] 구글 딥마인드, 국제수학올림피아드 은메달 수준의 AI 선보여

[해외 DS] 구글 딥마인드, 국제수학올림피아드 은메달 수준의 AI 선보여
Picture

Member for

1 month
Real name
이태선
Position
연구원
Bio
[email protected]
세상은 이야기로 만들어져 있습니다. 다만 우리 눈에 그 이야기가 보이지 않을 뿐입니다. 숨겨진 이야기를 찾아내서 함께 공유하겠습니다.

수정

국제수학올림피아드에서 AI가 은메달 수준의 점수 기록해
알파프루프, 강화 학습과 자연어 처리로 성능 높여
수학 특화 AI, 문제 풀어내는 데 너무 오랜 시간 걸린다는 지적 뒤따라

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 글로벌AI협회(GIAI)에서 번역본에 대해 콘텐츠 제휴가 진행 중입니다.


IMO
사진=Scientific American

구글 딥마인드는 수학에서도 AI의 존재감을 드러냈다. 올해 국제수학올림피아드(IMO)에 AI를 출전시켜 은메달 수준의 점수를 내 대중을 놀라게 했다. 수학에 특화된 AI는 알파프루프와 알파지오메트리 2로 서로 보완하는 역할을 했다. 수학자들은 수학 특화 AI를 두고 시작에 불과하며 앞으로 효율성을 높여 더욱 뛰어난 성능을 보일 것으로 기대된다고 밝혔다.

수학에서도 인간을 뛰어넘은 AI

IMO를 위해 약 110개국에서 600명 이상의 학생이 영국 바스에 모였다. 학생들은 이틀에 나누어 하루에 3문제씩 4시간 30분 동안 문제를 풀었다. 개인전에서는 중국의 하오지아 시가 만점을 받아 1위를 차지했고, 국가별 순위에서는 미국이 1위에 올라섰다.

이번 대회에서 가장 주목할 만한 결과는 딥마인드에서 출전한 두 AI가 거둔 놀라운 성과다. 딥마인드의 AI 프로그램은 6개의 문제 중 4문제를 풀어 42점 만점 중 28점을 받았다. 이는 아쉽게 금메달보다 1점 낮은 은메달에 해당하는 점수다. IMO 금메달리스트이자 필즈상 수상자인 티머시 가워스는 약 60명의 학생만 AI보다 더 높은 점수를 받았다고 말했다.

알파프루프, 증명 도우미 한계 극복하며 뛰어난 성능 보여

딥마인드는 ‘알파프루프’와 ‘알파지오메트리’라는 두 가지 다른 AI를 사용하여 놀라운 성과를 거뒀다. 알파프루프는 바둑과 체스에서 높은 성능을 보였던 ‘강화 학습’ 기반의 AI다. 강화 학습은 반복적으로 자신과 경쟁하고 단계적으로 개선해 나가는 방식이다. 정해진 공간 내에서 성공적으로 작동하므로 보드게임에서 높은 성과를 보이나, 주식 시장처럼 주가가 어떻게 움직일지 예측할 수 없는 상황에서는 좋은 성과를 거두지 못한다.

수학 문제에서 AI가 제대로 작동하려면 두 가지를 확인해야 한다. AI가 문제를 해결했는지와 해법에 도달하는 풀이 과정이 올바른지 확인할 수 있어야 한다. 이를 위해 알파프루프는 증명 도우미를 사용한다. 증명 도우미는 논증을 단계별로 진행하여 제시된 문제의 답이 올바른지 확인한다. 증명 도우미는 린(Lean)이라는 프로그래밍 언어를 사용하는데, 제공하는 수학 데이터가 매우 제한적이어서 모델링하는데 어려움을 겪는다.

반면에 대학교 문제집처럼 자연어로 작성된 수학 문제와 해답은 쉽게 구할 수 있다. 게다가 인터넷에서 자세한 해설이 담긴 여러 수학 문제를 찾을 수 있다. 따라서 딥마인드는 대형언어모델인 제미나이(Gemini)를 훈련시켜 자연어로 구성된 백만 개의 문제를 린 프로그래밍 언어로 번역해 증명 도우미가 성공적으로 학습할 수 있도록 했다. 개발자들은 알파프루프에 문제를 제시하면 알파프루프는 해법 후보를 생성한 다음 린에서 가능한 모든 증명 단계를 검색하여 위에 해법이 옳은지 판별한다. 이를 통해 알파프루프는 어떤 증명 단계가 유용한지 학습하여 점차 더 복잡한 문제를 해결할 수 있는 능력을 기른다.

알파지오메트리, 단 19초 만에 IMO 문제 풀어내

그러나 IMO에 등장하는 기하학 문제는 완전히 다른 접근 방식이 필요하다. 지난 1월 딥마인드는 기하학 문제에 특화된 알파지오메트리를 선보였다. 알파지오메트리를 만드는 과정은 다음과 같다. 우선 삼각형, 사각형 등 여러 종류의 기하학 데이터를 생성한다. 그런 다음 ‘추론 엔진’을 사용하여 어떤 각도가 일치하는지, 어떤 선이 서로 수직하는지 등 삼각형의 추가 속성을 추론한다. 이러한 다이어그램과 도출된 속성을 결합하여 정리와 증명으로 구성된 학습 데이터를 만든다. 최근 딥마인드는 더 많은 데이터로 훈련하고 알고리즘 속도를 개선한 알파지오메트리 2를 출시해 대중의 관심을 받고 있다.

딥마인드는 수학 특화 AI의 성능을 테스트하기 위해 올해 IMO에 AI를 참가시켰다. 연구팀은 먼저 자연어로 된 문제를 린으로 수동 변환했고, 알파지오메트리 2는 단 19초 만에 기하학 문제를 정확하게 풀어냈다. 게다가 알파프루프는 참가자 중 5명만 풀 수 있었던 정수와 대수 문제를 풀어냈다.

수학 특화 AI, 풀이 시간 길지만 점차 보완해 나갈 것

그러나 아쉽게도 AI는 조합 문제를 풀지 못했는데, 이는 조합 문제가 프로그래밍 언어로 변환하기 매우 어렵기 때문이다. 또한 알파프루프의 성능에 문제가 제기됐다. 알파프루프는 일부 문제를 푸는데 60시간 이상이 걸렸고, 이는 총 제한 시간인 9시간보다 훨씬 긴 시간이다. 이에 대해 가워스는 사람도 문제당 그 정도의 시간이 주어졌다면 훨씬 더 높은 점수를 받았을 것이라고 지적했다. 그럼에도 불구하고 수학 특화 AI는 증명 도우미가 할 수 있었던 것을 가뿐히 뛰어넘었으며 성능은 효율성이 향상되면서 줄어들 가능성이 있다고 수학 AI의 잠재력을 높게 평가했다.

가워스는 수학 특화 AI가 다양한 문제로 훈련됐으며 이러한 방법은 IMO에만 국한되지 않는다고 강조했다. 또한 수학자들이 궁금해하는 다양한 질문에 답을 얻을 수 있는 프로그램 개발에 한발 가까워졌다고 설명했다.

*편집진: 영어 원문의 출처는 사이언티픽 아메리칸(Scientific American)으로 본지의 편집 방향과 일치하지 않을 수도 있습니다.

Picture

Member for

1 month
Real name
이태선
Position
연구원
Bio
[email protected]
세상은 이야기로 만들어져 있습니다. 다만 우리 눈에 그 이야기가 보이지 않을 뿐입니다. 숨겨진 이야기를 찾아내서 함께 공유하겠습니다.

[해외 DS] 금융당국 AI 활용, 양날의 검 되지 않게 조심해야 ②

[해외 DS] 금융당국 AI 활용, 양날의 검 되지 않게 조심해야 ②
Picture

Member for

1 month
Real name
전웅
Position
연구원
Bio
[email protected]
흥미로운 데이터 사이언스 이야기를 정확한 분석과 함께 전하겠습니다.

수정

금융당국에게 주어진 과제, 어떻게 AI를 활용할 것인가
언제든 규제할 수 있다는 신호 보내서 AI 견제해야
자체 AI 개발하기 어려운 점 인정하고 민관 협력을 통해 AI 활용해야

[해외 DS] 금융당국 AI 활용, 양날의 검 되지 않게 조심해야 ①에서 이어집니다.

White Paper On A Vintage Typewriter
사진=Pexels

앞서 금융당국이 AI를 어떻게 활용하느냐에 따라 AI가 ‘독’이 될 수도 ‘약’이 될 수도 있다는 점을 살펴봤다. AI를 제대로 활용하면 금융 시스템을 안정시키는 역할을 할 수도 있고 잘못 활용하면 금융 위기를 심화시킨다. 그러나 당국은 민간 금융 기관에 비해 AI를 개발하는 데 불리한 위치에 놓여 있다. 민간 금융 기관은 사용자 데이터를 바탕으로 더 많은 데이터에 접근할 수 있기 때문이다. 당국은 이러한 불리한 조건 속에서 어떻게 AI를 활용할 수 있을까?

금융당국, 언제든 개입할 수 있다는 ‘신호’ 보내는 게 중요해

다행히도 당국이 AI를 활용할 수 있는 네 가지 방안이 있다. 첫 번째로 AI에 즉각적으로 대응할 수 있는 ‘규칙’을 미리 만드는 방법이다. 기존에 당국은 금융 위기를 대처하는 방법으로 금리 인상과 같이 재량적 개입을 선호했다. 그러나 AI의 빠른 반응 속도 때문에 이와 같은 방법은 AI가 만연한 상황에서 사용하기에는 너무 느린 대처라는 평가를 받고 있다.

따라서 당국은 금융 위기에 즉각적으로 대응할 수 있도록 미리 정해진 규칙을 만들어 두어야 한다. 가격이 일정 수준 하락하면 당국이 개입할 수 있다는 사실을 AI가 인지한다면, 그 이상으로 가격이 하락해야 수익을 올리는 전략을 구사하지 않을 것이다. 이처럼 당국은 언제든 개입할 수 있다는 ‘신호’를 보내는 것이 중요하다. AI와 마찬가지로 시장 참여자들도 당국이 개입할 수 있다는 신호를 받아들이면 섣불리 공격적인 전략을 취하기 어렵다. 따라서 당국은 실제로 자금 시장에 개입하지 않더라도 개입한 것과 같은 효과를 볼 수 있다.

두 번째로 금융 AI를 직접 개발하는 방법이다. 당국은 금융 시스템을 직접 모니터링하기 위해 자체 AI를 개발할 수 있다. 당국이 데이터 공유의 법적, 정치적 어려움을 해결할 수 있다면 가장 좋은 방법이다. 당국은 기밀 데이터를 활용하여 자체 AI를 개발하면 금융 시스템에 더욱 포괄적인 시각을 가질 수 있기 때문이다.

민간 기관과 협력을 통해 효율적으로 AI 활용해야

세 번째는 AI 간 연결하는 방법이다. AI와 AI를 연결하는 체계를 구축해 민간 AI를 활용할 수 있다. 연결 체계를 통해 당국은 다른 당국은 물론 민간 AI와 직접 통신할 수도 있다. 성공적으로 AI를 연결하기 위해서는 API 통신 ‘표준’이 필요하다. 서로 다른 기술을 사용하는 만큼 통일된 표준이 있어야 안전하게 통신할 수 있다. 당국에서는 이 같은 표준이 생기면 AI를 규제하기 더욱 쉬워진다. 당국이 미리 정의한 규제 표준과 모범 사례에 따라 민간 AI를 직접 모니터링할 수 있기 때문이다.

또한 AI 간 연결을 통해 더 많은 정보를 금융 위기 시 활용할 수 있다. 당국은 금융 위기가 발생하면 구제금융과 유동성 투입 등을 고려한다. 여러 방안을 시뮬레이션한 후 제일 나은 선택지를 고르는데, 시뮬레이션 과정에서 민간 AI의 상황을 파악할 수 있다면 더 나은 선택지를 고를 수 있다.

마지막으로 공공 기관과 민간 기관이 서로 돕는 민관 협력을 맺는 방법이다. 당국은 민간 AI의 기술력을 따라잡기 힘든 점을 인정하고 민간 기관과 협력하여 민간 AI에 접근할 수 있다. 당국이 자체적으로 AI를 설계하기 위해서는 상당한 투자를 받아야 하며 운영 방식에 커다란 개편이 필요하다. 따라서 당국이 자체 AI를 개발하기는 어렵다는 의견이 우세하다. 따라서 신용 위험 분석, 사기 탐지, 자금 세탁 방지 등 금융 규제 분야에서 이미 보편화된 ‘민관 협력’을 진행하는 것이 더 효율적인 방안이라고 예상한다. 그러나 협력이 순조롭게 이루어지지 않을 수도 있다. 민간 기업은 기술을 독점적으로 유지하고 당국에 공개하는 것을 꺼리므로 제대로 된 협력이 이루어지기 어렵다.

AI 활용에 도사리는 실질적인 문제들

당국은 위에서 제시한 방안들을 구현하지 못할 기술적 이유는 없으나, 실질적인 문제가 있다. 우선 데이터와 주권 문제다. 당국은 지금도 데이터 접근에 어려움을 겪고 있다. 민간 기업이 데이터와 AI 기술을 지식재산으로 소유하여 보호하고 있어서 이 문제는 점점 더 악화될 것으로 예상된다. 또한 당국은 기밀 데이터를 공유하는 것을 꺼린다. 따라서 제대로 된 민관 협력이 이루어지지 않을 가능성이 높다는 의견이다.

다음으로 과도한 위험을 초래하는 AI를 어떻게 다룰지에 관한 것이다. 정책적 대응 방안으로 제시된 것은 위험한 AI를 일시 중단하는 방법이다. 하지만 AI가 일시 중단되면 그에 따른 여파를 예상하기 어렵다. 따라서 당국이 생각하는 것만큼 간단히 실행하기 어려울 수 있다.

AI, 양날의 검 되나

금융 시스템에서 AI의 사용이 빠르게 증가하면 현재보다 훨씬 저렴한 비용으로 금융 서비스를 제공할 것이다. 따라서 금융계에서는 효율성을 높일 수 있다는 장점이 있다. 그러나 AI는 금융 안정성에 새로운 위협을 가져올 수도 있다는 점을 염두에 둬야 한다.

금융 당국은 현재 갈림길에 서 있다. 당국이 AI에 너무 보수적으로 대응하면 AI는 민간 시스템의 전유물로 자리 잡을 가능성이 높다. 따라서 당국은 민간 AI를 규제하기 어려워지고 금융 위기는 심화될 것이다.

반대로 당국이 AI를 적절히 활용하면 금융 시스템이 안정되고 금융 위기로 인한 피해를 줄일 수 있다. 민관 협력을 구축하고 자체 AI를 개발하며 이를 통해 AI 간 연결 시스템을 구축하는 것이다. 이를 통해 당국은 금융 위기 시 대응 방안을 시뮬레이션하는데 더 많은 정보를 활용할 수 있다. 풍부한 정보를 바탕으로 금융 위기가 와도 이전보다 빠르게 경제를 안정시킬 수 있을 것으로 예상된다.

*편집진: 영어 원문의 출처는 경제정책연구센터(Centre for Economic Policy Research)로 본지의 편집 방향과 일치하지 않을 수도 있습니다.

Picture

Member for

1 month
Real name
전웅
Position
연구원
Bio
[email protected]
흥미로운 데이터 사이언스 이야기를 정확한 분석과 함께 전하겠습니다.

[해외 DS] 금융당국 AI 활용, 양날의 검 되지 않게 조심해야 ①

[해외 DS] 금융당국 AI 활용, 양날의 검 되지 않게 조심해야 ①
Picture

Member for

1 month
Real name
전웅
Position
연구원
Bio
[email protected]
흥미로운 데이터 사이언스 이야기를 정확한 분석과 함께 전하겠습니다.

수정

AI 활용에 따라 '약'이 될지 '독'이 될지 결과 달라져
금융 시스템이 점차 복잡해지면서 금융당국 과제 늘어가
금융당국, 민간 금융 기관과의 AI 기술 격차로 규제하기 어려워

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 글로벌AI협회(GIAI)에서 번역본에 대해 콘텐츠 제휴가 진행 중입니다.


CEPR 240808
사진=CEPR

AI는 금융 시스템을 안정시킬 수 있는 진정제 역할을 할 수도 금융 위기를 심화시킬 자극제 역할을 할 수도 있다. 금융당국이 AI를 어떻게 활용하느냐에 따라 결과가 달라진다. 이에 금융 경제학자 욘 다니엘슨 런던정경대 교수는 당국이 AI에 대응할 수 있는 방안을 제시했다. 당국이 자체 AI 엔진을 개발하고, AI와 AI를 연결하고, 민관 협력을 적극 활용하는 것이다.

AI, 만능 해결사 아니야

최근 AI는 정량적 분석만 제공하는 수준을 넘어 개인별 패턴을 분석해 상품을 추천하고 의사 결정을 내리는 등 일반적으로 인간이 하는 작업을 수행한다. 게다가 AI는 사람이 며칠씩 걸리는 의사 결정을 단 몇 초 만에 내린다. 이러한 특성이 AI가 금융을 더욱 효율적으로 만들면서 동시에 금융 위기를 심화시킨다. AI는 금융 위기라고 판단하면 즉각적으로 반응해 위험 자산을 청산한다. 며칠 또는 길게는 몇 주에 걸쳐 진행됐던 뱅크런이 지금은 AI로 인해 몇 초 만에 올 수 있는 상황에 도래했다.

또한 AI는 특히 거시경제에 새로운 리스크를 불러일으킬 수 있다. 금융 위기 상황에서 AI가 잘못된 판단을 내릴 수 있기 때문이다. AI는 가진 데이터를 바탕으로 최적화 계산을 수행한다. 따라서 일반적인 경제 상황에서 AI는 뛰어난 예측력을 보이지만, 금융 위기처럼 드물게 일어나는 사건에서는 미숙한 대응을 보인다. 게다가 코로나와 같이 새로운 종류의 금융 위기가 닥쳤을 때 AI가 스스로 학습해 대처할 수 있다는 것은 그저 '미신'에 가깝다.

금융당국의 목표, 금융 위기 억제

금융당국은 금융 위기 억제를 최우선으로 생각한다. 금융 위기의 피해는 어마어마하다. 수조 달러가 넘는 비용을 내야 하며 이전 경제 상황으로 돌아가기 위해서는 몇 년간 불경기를 겪어야 한다. 하지만 1990년대 이후 금융사 간의 연결성이 강화되고 금융 시스템이 점차 복잡해지면서 당국은 금융 위기를 억제하는데 더욱 골머리를 썩이고 있다.

당국은 금융 시스템 안정을 위한 도구로서 AI를 거론했다. AI를 제대로 활용하면 일을 더 효율적으로 처리할 수 있다는 것이다. 기업 하나하나를 관리하는 미시적 관점에서는 AI를 활용해 규제 기준을 정하는 데 유용하게 쓸 수 있다. 또한 한 나라의 경제를 보는 거시적 관점에서는 금융 위기를 시뮬레이션하여 위기 시 대응 방안을 모색할 수 있다.

당국 “민간 금융 기관에 비해 불리한 점 많아”

그러나 당국은 현실적으로 AI를 적용하기 어려운 점에 관해 얘기했다. 당국이 AI를 사용하게 되면 너무 많은 일을 떠맡게 된다는 의견이다. 민간 AI를 모니터링하고 규제하는 동시에 AI로 이전보다 더 빠르게 발전하고 더 심각해질 수 있는 ‘시스템적 리스크’를 관리해야 한다. 두 가지 일을 소화하기는 현실적으로 어려워 두 마리 토끼를 모두 놓치게 될 것이라고 예상했다.

게다가 당국은 AI를 개발하는 데 민간 금융 기관에 비해 불리한 상황에 놓여 있다는 점을 언급했다. 가장 두드러지는 차이는 민간 금융 기관이 더 많은 데이터에 접근할 수 있다는 점이다. 또한 AI 기술은 지식재산권의 보호를 받고 있어 규제가 어려우며 사용자 데이터라는 독점 데이터를 바탕으로 학습해 민간 금융 기관은 당국보다 한 발짝 앞서나간 상태다. 안타깝게도 당국은 언급한 두 가지를 모두 손에 넣지 못하는 상황이다.

이러한 격차로 인해 당국은 AI로 발생하는 위협을 모니터링하고 대응하기 어렵다. 최악의 시나리오는 시장 참여자들이 이러한 사실을 인지하는 것이다. 당국이 개입하기 어렵다는 점을 이용해 시장 참여자들은 더 공격적인 전략을 구사할 것이다.

당국은 이러한 악조건 속에서 어떻게 상황을 타개해 나갈지 기대되는 대목이다. 다음 글에서 당국이 취할 수 있는 현명한 AI 활용 방안을 소개할 예정이다.

[해외 DS] 금융당국 AI 활용, 양날의 검 되지 않게 조심해야 ②로 이어집니다.

*편집진: 영어 원문의 출처는 경제정책연구센터(Centre for Economic Policy Research)로 본지의 편집 방향과 일치하지 않을 수도 있습니다.
 

Picture

Member for

1 month
Real name
전웅
Position
연구원
Bio
[email protected]
흥미로운 데이터 사이언스 이야기를 정확한 분석과 함께 전하겠습니다.

[해외 DS] AI 금융, '시스템적 리스크'의 새로운 뇌관? ②

[해외 DS] AI 금융, '시스템적 리스크'의 새로운 뇌관? ②
Picture

Member for

1 month
Real name
김광재
Position
연구원
Bio
[email protected]
균형 잡힌 시각으로 인공지능 소식을 전달하겠습니다.

수정

금융 시스템에서 거의 대부분의 데이터는 분포의 중간 부분에서 생성돼
하지만 위기는 분포의 꼬리 부분에서 나타나
위기에 관한 데이터 관측을 어렵게 만드는 요소도 많아

[해외 DS] AI 금융, '시스템적 리스크'의 새로운 뇌관? ①에서 이어집니다.

AI Financial Risk CEPR 20240807
사진=Pexels

AI는 효과적인 작동을 위해 방대한 양의 데이터가 필요하다. 금융 시스템은 매일 테라바이트 단위의 데이터를 생성하기 때문에 데이터 부족은 문제가 되지 않을 것으로 생각될 수 있다. 그러나 대부분의 데이터는 시스템 결과 분포의 중간 부분에서 발생한다. 극단적인 상황, 즉 꼬리(tail) 부분에서 발생하는 데이터는 극히 드물다. AI가 진정으로 학습하고 예측 능력을 발휘하기 위해서는 꼬리 데이터가 필수적이다.

하지만 극단적인 상황에 대한 데이터는 다음과 같은 네 가지 이유로 수집하는 데 어려움이 있다.

불완전한 데이터

첫 번째는 시장 참여자들의 예측 불가능한 행동이다. 위기 상황이나 새로운 규제에 직면하면 시장 참여자들은 수동적으로 반응하기보다 전략적으로 대응한다. 그들의 대응 방식은 규제 당국이나 경쟁자들에게 사전에 공개되지 않으며, 심지어 자신들조차도 명확히 예측하지 못할 수 있다. 이러한 시장 참여자들의 숨겨진 반응 함수는 데이터에 드러나지 않아 AI 학습 데이터의 불완전성을 초래한다. 따라서 AI가 제공하는 정보를 맹신하거나 잘못 해석해 의사 결정에 오류를 범할 경우, 앞서 언급한 '잘못된 정보 채널' 문제가 더욱 심각해질 수 있다.

두 번째 어려움은 시장 참여자들의 상호 의존적인 행동, 특히 위기 상황에서 두드러지는 '전략적 보완성(strategic complementarities)'이다. 시장이 불안정해지면 참여자들은 경쟁자의 행동에 따라 자신의 전략을 수정하는 경향을 보인다. 이러한 전략적 보완성은 경쟁자의 행동에 따라 시장 결과가 크게 달라질 수 있으므로 미래 예측을 어렵게 만든다. 과거의 위기 상황을 분석하더라도 미래를 예측하기 어려운 이유가 바로 여기에 있다. 나아가 AI를 악용해 이익 극대화를 시도하는 '악의적 사용 채널' 상황에서는 문제가 더욱 심각해진다. 이러한 행동은 다른 참여자들의 연쇄적인 반응을 불러일으켜 시스템 전체를 위협할 수 있다.

이러한 문제의 근본에는 AI의 두 가지 특징이 자리 잡고 있다. 첫째 AI는 데이터에서 복잡한 패턴을 추출하는 능력이 뛰어나다. 둘째 AI는 작동 환경에서 빠르게 학습해 나간다. 따라서 현재 AI 엔진은 경쟁업체의 행동을 관찰하고, 이를 통해 세상이 어떻게 작동하는지에 대한 자체 모델을 개선하는 것이 어렵지 않다. 즉 미래에는 민간 기업과 공공 기관의 AI가 서로의 행동을 관찰하고 학습하며, 이를 통해 상호 영향을 주고받으며 발전할 가능성이 높다. 이는 앞서 언급한 전략적 보완성을 더욱 심화시켜 시장의 불확실성을 증폭시킬 수 있다.

인간-AI 목표 불일치와 AI 기술 과점 문제

세 번째 이유는 AI의 목표와 소유자의 목표를 일치시키기 어렵다는 '목표 불일치' 문제다. 이는 위기 상황에서 더욱 심각해지는데, AI가 신속한 대응이 필요한 상황에서 인간의 피드백을 받아 목표를 조정할 시간이 부족하기 때문이다. 이로 인해 시스템 균형을 유지하기 위한 전통적인 조치들이 무력화될 수 있다. 또한 개별적으로 합리적인 행동이 사회적으로 바람직하지 않은 결과를 초래하는 목표 불일치 문제는 인간 규제 당국의 개입이 어려워질 때 더욱 심각해질 것이다. AI는 인간 소유자가 연준 의장의 전화를 받기도 전에 이미 자신의 포지션을 청산하고 위기를 초래했을 수 있다.

마지막으로 AI는 금융 기관들이 세상을 비슷한 방식으로 분석하고 반응하도록 만들어, 과점 시장 구조를 강화할 수 있다. 모두가 비슷한 정보를 바탕으로 비슷한 판단을 내리면, 시장은 쏠림 현상을 보이게 될 것이다. 예를 들어 AI의 특정 자산 가치 상승 예측은 모든 금융 기관의 매수로 이어져 가격 거품을 형성하고, 반대로 하락 예측은 매도로 이어져 가격 폭락을 초래할 수 있다. 이러한 '단일 위험 재배' 현상은 금융 시스템의 호황과 불황의 주요 원인이다. 아울러 AI는 머신 러닝 설계, 입력 데이터, 컴퓨팅 능력에 따라 위험 관리 능력이 달라지는데, 이러한 기술과 정보는 점점 더 소수의 대형 기술 기업에 집중되고 있다. 이러한 기업들이 합병을 통해 과점 시장을 형성하면, 금융 시장의 불안정성은 더욱 커질 수 있다.

이러한 시장 집중 현상의 가장 큰 문제는 공공 부문을 포함한 많은 금융 기관이 동일한 소수의 기술 기업으로부터 세상에 대한 정보와 분석을 제공받는다는 점이다. 이는 기회와 위험에 대한 시각이 획일화될 수 있음을 의미한다. 특히 위기 상황에서 AI의 사용이 동질화되면, 모든 금융 기관이 비슷한 방식으로 반응해 극단적인 상황을 초래할 수 있다. 최근 데이터 공급업체들의 합병 추세를 고려할 때, 금융 당국은 과점 AI 기술이 야기할 수 있는 시스템 위험 증가 가능성을 충분히 인지하지 못한 것으로 우려된다.

더 중요한 것은 금융 당국의 AI 위기 대응 능력

AI는 기관의 존립에 대한 위협에 직면하면 생존을 위해 최적화한다. 바로 이 지점에서 AI의 속도와 효율성이 전체 금융 시스템에 불리하게 작용할 수 있다. 다른 금융 기관도 똑같이 행동하면 위기에 대한 균형이 맞춰지기 때문이다. 위험 자산을 가장 먼저 처분하는 기관이 위기를 가장 잘 극복할 수 있으므로 모두 가능한 한 빨리 대응하려고 할 것이다. 그 결과 불확실성이 증가해 극단적인 시장 변동성과 함께 투매, 유동성 회수, 뱅크런과 같은 악순환이 발생한다. AI로 인해 며칠 또는 몇 주가 걸렸을 위기가 이제 몇 분 또는 몇 시간 만에 발생할 수 있는 것이다.

물론 AI는 반대로 행동할 수도 있다. 실증적 증거에 따르면 자산 가격은 위기 상황에서 기본 가치 아래로 떨어질 수 있지만, 종종 빠르게 회복된다. 이는 매수 기회를 의미하기 때문이다. AI가 생존에 대해 크게 신경 쓰지 않고 엔진들이 전반적으로 회복 균형에 수렴한다면 충격을 흡수하고 위기는 발생하지 않을 것이다.

종합하면 AI는 변동성을 낮추고 극단적인 상황(tail)을 더욱 극단적으로 만들 것으로 추측된다. 단기 변동을 완화하는 대신 더 극단적인 사건이 발생할 수 있다는 의미다. 여기서 중요한 것은 금융 당국이 AI 위기에 얼마나 잘 대비하고 있는가 하는 점이다. 이에 대한 자세한 논의는 다음 글에 발표될 VoxEU 기사에서 다룰 예정이다.

*편집진: 영어 원문의 출처는 경제정책연구센터(Centre for Economic Policy Research)로 본지의 편집 방향과 일치하지 않을 수도 있습니다.

Picture

Member for

1 month
Real name
김광재
Position
연구원
Bio
[email protected]
균형 잡힌 시각으로 인공지능 소식을 전달하겠습니다.

[해외 DS] AI 금융, '시스템적 리스크'의 새로운 뇌관? ①

[해외 DS] AI 금융, '시스템적 리스크'의 새로운 뇌관? ①
Picture

Member for

1 month
Real name
김광재
Position
연구원
Bio
[email protected]
균형 잡힌 시각으로 인공지능 소식을 전달하겠습니다.

수정

AI 금융 도입 증가로 효율성 향상 기대
동시에 시스템적 리스크에 대한 우려도 증가
혁신 활용과 리스크 관리의 균형 필요

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 글로벌AI협회(GIAI)에서 번역본에 대해 콘텐츠 제휴가 진행 중입니다.


AI Financial Crises CEPR 20240806
사진=Pexels

1990년대 이후 금융공학 발달로 금융회사 간 상호 연계성이 급격히 높아지면서, 금융 시스템은 작은 충격에도 쉽게 흔들릴 수 있는 취약한 구조로 변모했다. 이러한 상황에서 AI의 등장은 새로운 위험 요소로 대두되고 있다.

AI는 빠른 정보 처리 속도와 의사 결정 능력을 바탕으로 금융 시스템 전체에 예측하기 어려운 규모와 속도로 영향을 미칠 수 있다. 특히 최신 AI는 단순 통계 모델을 넘어 질적·양적 데이터를 모두 활용해 스스로 학습하고 발전하는 능력까지 갖추게 됐다. 이는 AI가 금융 분야에서 단순 조언을 넘어 실질적인 의사 결정까지 내릴 수 있게 됐다는 것을 의미하며, 시스템 전체에 미치는 영향력이 더욱 커졌음을 시사한다.

금융 불안정성의 뿌리

AI가 새로운 금융 위기를 직접적으로 촉발할 가능성은 작다. 하지만 기존 위기의 근본 원인을 증폭시켜 위기를 심화시킬 수 있다는 분석이 제기되고 있다. 특히 작은 충격에도 금융 기관을 취약하게 만드는 '과도한 레버리지', 시장 참가자들이 위기 시 가장 유동성이 높은 자산을 선호하게 만드는 '자기 보존 본능', 스트레스 상황에서 시장 참가자들이 서로를 불신하게 만드는 시스템의 '불투명성·복잡성·비대칭 정보'와 같은 금융 시스템의 고질적인 취약 요인들이 AI에 의해 더욱 악화될 수 있다는 것이다.

위의 세 가지 취약 요인은 1763년 첫 번째 금융 위기 이후 지난 261년 동안 거의 모든 금융 위기의 배경으로 작용해 왔다는 점에서 더욱 주목할 필요가 있다. 그러나 이러한 근본적인 요인들을 사전에 파악하고 억제하는 것은 쉽지 않다. 금융 시스템의 복잡성으로 인해 위험이 예상치 못한 곳에서 발생할 수 있기 때문이다. 금융 규제는 본질적으로 위기 예방에 초점을 맞추지만, 안타깝게도 위기는 당국이 주시하지 않는 곳에서 발생한다. 근본적으로 금융 시스템의 복잡성은 위험이 축적될 수 있는 무수한 영역을 만들어낸다.

금융 위기를 이해하려면 과거 사례 분석뿐만 아니라 금융 기관의 이익 극대화 추구 행위에도 주목해야 한다. 금융 기관은 허용 가능한 위험 수준 내에서 이익을 극대화하려는 경향이 있다. 쉽게 말해 파산하지 않는 선에서 최대한의 이익을 추구하려고 한다. 평상시에는 이러한 이익 극대화 행동이 유지되지만, 금융 시스템 전체가 불안정해지고 위기가 임박하면 금융 기관은 생존을 최우선 목표로 삼는다. 생존 모드에 돌입한 금융 기관은 행동 패턴을 급격하게 변화시켜 유동성 확보에 주력하고 중앙은행 준비금과 같은 안전하고 유동성이 높은 자산을 선호하게 된다. 하지만 이러한 행동은 뱅크런, 헐값 매각, 신용 경색 등 위기 상황에서 나타나는 부정적인 결과로 이어질 수 있다. 더 큰 문제는 이러한 행동이 법적으로 문제가 없어 규제하기 어렵다는 점이다. 금융 기관의 이러한 최적화 행동은 합리적인 경제적 선택으로 간주되지만, 위기 상황에서는 시스템 전체의 안정성을 위협하는 요인으로 작용할 수 있다.

AI가 개입하면

금융 시스템의 불안정성은 컴퓨터가 등장하기 이전부터 존재했던 문제다. 다만 기술 발전은 효율성 증대와 더불어 기존의 불안정성을 심화시키는 양면성을 보여왔다. AI 역시 이러한 패턴을 따를 것으로 예상되는 이유다. 구체적으로 AI는 다음 네 가지 채널을 통해 경제에 부정적인 영향을 미칠 것으로 분석된다.

  • 잘못된 정보 채널: AI 사용자가 AI의 한계를 이해하지 못하고 과도하게 의존하면서 발생한다. AI가 제공하는 정보를 맹신하거나 잘못 해석해 의사 결정에 오류를 범할 수 있다.
  • 악의적 사용 채널: 높은 자원을 가진 경제 주체들이 사회적 결과를 고려하지 않고 AI를 악용해 이익을 극대화하려 할 때 발생한다.
  • 목표 불일치 채널: AI가 인간 운영자의 의도와 다른 목표를 추구하거나 예상치 못한 결과를 초래할 때 발생한다. AI 알고리즘의 복잡성과 불투명성은 이러한 위험을 더욱 증폭시킬 수 있다.
  • 과점 시장 구조 채널: 소수 AI 기업이 시장을 지배하면서 진입 장벽을 높이고, 동질적인 위험 문화를 형성할 때 발생한다.

사실 금융 서비스 산업에서 AI 기술 도입은 아직 초기 단계에 머물러 있다. 조사 기관마다 차이는 있지만 파이낸셜 타임스의 보고에 따르면, AI 기술을 적극적으로 활용하려는 은행은 6%에 불과한 것으로 나타났다. 이는 신뢰성, 일자리 감소, 규제 등에 대한 우려 때문이다. 하지만 금융 산업은 경쟁이 매우 치열한 분야이므로, 스타트업 금융 기관과 일부 대형 은행이 AI 기술 도입을 통해 비용 절감 및 효율성 향상 효과를 누리고 있다면, 보수적인 기관들도 결국 이러한 흐름에 동참할 수밖에 없을 것이다. 금융 산업의 경쟁 환경을 고려할 때 AI 기술 도입은 피할 수 없는 흐름으로 보인다.

[해외 DS] AI 금융, '시스템적 리스크'의 새로운 뇌관? ②로 이어집니다.

*편집진: 영어 원문의 출처는 경제정책연구센터(Centre for Economic Policy Research)로 본지의 편집 방향과 일치하지 않을 수도 있습니다.

Picture

Member for

1 month
Real name
김광재
Position
연구원
Bio
[email protected]
균형 잡힌 시각으로 인공지능 소식을 전달하겠습니다.

[해외 DS] 엔비디아, 휴머노이드 로봇 개발에 박차 가해

[해외 DS] 엔비디아, 휴머노이드 로봇 개발에 박차 가해
Picture

Member for

1 month
Real name
전웅
Position
연구원
Bio
[email protected]
흥미로운 데이터 사이언스 이야기를 정확한 분석과 함께 전하겠습니다.

수정

엔비디아, 휴머노이드 로봇 개발 지원하는 AI 도구 공개
로봇 개발 기간 수개월에서 1주일로 단축할 수 있다며 자신감 보여
보스턴 다이내믹스, 엔비디아와 협력해 로봇의 한계 극복하고자
엔비디아
사진=엔비디아

엔비디아는 휴머노이드 로봇 개발 속도를 높이는 AI 모델을 공개했다. 미국 콜로라도에서 개최된 시그래프(SIGGRAPH)에서 제조업체와 개발자가 차세대 휴머노이드 로봇 개발을 지원하는 솔루션을 발표했다.

엔비디아 CEO 젠슨 황은 AI의 다음 물결은 로봇 공학이며 가장 흥미로운 로봇으로는 휴머노이드를 꼽았다. 엔비디아는 로봇 발전에 힘쓰는 가운데 플랫폼과 AI 모델을 개방했다. 따라서 전 세계 휴머노이드 개발자와 기업은 자신에게 가장 적합한 AI 도구를 사용할 수 있게 되었다.

로봇 개발에 속도 붙인 엔비디아

이번에 엔비디아는 마이크로서비스 제품군인 엔비디아 NIM의 최신 버전을 공개했다. 이 제품은 사전에 완성된 컨테이너를 제공하여 작업 효율성을 높인다는 평가를 받고 있다.

미믹젠(MimicGen) NIM 마이크로서비스는 애플 비전프로(Apple Vision Pro)와 같이 공간 컴퓨팅 장치에서 원격 제어한 데이터를 기반으로 합성 모션 데이터를 생성하여 로봇 개발자에게 도움을 준다. 로보카사(Robocasa) NIM 마이크로서비스는 OpenUSD에서 시뮬레이션 지원 환경을 생성하여 개발자가 3D 테스트 환경을 만들 수 있도록 지원한다.

또한 엔비디아는 클라우드 네이티브 관리형 서비스인 오스모(Osmo)를 선보였다. 클라우드 네이티브란 전통적인 구축형 환경 대신 클라우드 기반으로 애플리케이션과 시스템을 작동하는 방식을 말한다. 따라서 사용자가 클라우드에서 복잡한 로봇 개발 워크플로를 쉽게 확장할 수 있다.

게다가 사용자는 휴머노이드에 강화 학습과 같이 컴퓨팅 자원을 많이 필요로 하는 작업에서도 시각화하고 관리할 수 있다는 장점이 있다. 엔비디아는 오스모를 사용하면 배포와 개발하는 데 걸리는 시간이 수개월에서 1주일 이내로 단축할 수 있다며 성능에 자신감을 보였다.

엔비디아, 로봇 개발 비용과 시간 단축해

새로운 제품들은 엔비디아 휴머노이드 로봇 개발 프로그램을 통해 제공된다. 이 프로그램에서는 휴머노이드 로봇을 구동하도록 설계된 GR00T와 로봇 시뮬레이션용 애플리케이션인 아이작 심을 사용할 수 있다.

보스턴 다이내믹스 CTO인 아론 샌더스는 보스턴 다이내믹스와 엔비디아가 오랜 기간 협력하여 로봇 공학에서 한계를 극복하기 위해 노력하고 있다고 밝혔다. 엔비디아와 협력을 통해 로봇 업계의 발전을 가속할 것으로 기대된다며 기쁜 마음을 표출했다.

엔비디아는 고가의 휴머노이드를 개발하는 데 드는 비용과 시간을 단축하는 혁신적인 방법을 개발했다. 다음 과정을 통해 로봇 개발자는 비용과 시간을 줄일 수 있다.

개발자는 애플 비전프로와 같은 공간 컴퓨팅 장치를 착용하여 화면을 캡처한 다음, 미믹젠 NIM에서 이 데이터를 합성 데이터로 만들어 입력하고 GR00T에서는 미믹젠 NIM에서 생성된 데이터를 기반으로 학습하는 일련의 과정을 거친다. 또한 로보카사 NIM을 사용하면 로봇 재학습을 하여 시간을 단축할 수 있다. 연구원이 모델링하고 개선하는 동안 오스모는 다양한 컴퓨팅 자원에 작업을 할당하여 기존에 개발자의 부담을 가중했던 관리 작업을 자동화한다.

푸리에인텔리전스(Fourier Intelligence)의 CEO 알렉스 구(Alex Gu)는 “휴머노이드 로봇 개발은 매우 복잡하며 실제로는 지루할 정도로 엄청난 양의 데이터를 캡처해야 한다”며 로봇 개발의 어려움을 토로했다. 그러나 엔비디아의 새로운 기술과 생성형 AI 도구를 활용하면, 모델 개발 워크플로를 구축하는 데 획기적으로 시간을 줄일 수 있다며 앞으로 휴머노이드 로봇이 빠르게 성장할 것으로 내다봤다.

Picture

Member for

1 month
Real name
전웅
Position
연구원
Bio
[email protected]
흥미로운 데이터 사이언스 이야기를 정확한 분석과 함께 전하겠습니다.

[해외 DS] 로봇의 의사 결정, '체화된 사고 사슬'로 더 똑똑하게!

[해외 DS] 로봇의 의사 결정, '체화된 사고 사슬'로 더 똑똑하게!
Picture

Member for

1 month
Real name
이효정
Position
연구원
Bio
[email protected]
지식은 전달하는 정보가 아니라, 함께 고민하기 위해 만들어진 언어입니다.

수정

'체화된 사고 사슬', 단계별 문제 해결 능력 향상
시각-언어-행동 모델의 한계 극복, 다양한 로봇에서 적용 가능
끊임없이 변화하는 환경에서의 적응력과 실행 속도 개선 필요
ECoT 20240801
사진=Pixabay

UC 버클리, 스탠퍼드, 바르샤바대학교 공동 연구팀이 로봇의 의사 결정 능력을 혁신적으로 향상시키는 새로운 방법론, '체화된 사고 사슬'(Embodied Chain of Thought, 이하 ECoT)을 개발했다.

ECoT는 로봇이 인간처럼 단계별로 문제를 해결하고, 환경과의 상호작용을 통해 더 효과적인 의사 결정을 내릴 수 있도록 돕는다. 이는 고차원적인 사고와 저차원적인 감각 정보를 통합해 로봇의 작업 이해도와 수행 능력을 향상시키는 접근법이다.

또한 연구팀은 ECoT를 통해 로봇이 새로운 작업과 환경에 더 효과적으로 적응하고, 인간의 자연어 피드백을 통해 스스로 학습하며 행동을 교정할 수 있음을 입증했다. 이는 로봇의 자율성과 지능을 한 단계 더 발전시킨 획기적인 성과다.

시각-언어-행동 모델의 한계 극복

시각-언어-행동(Vision-Language-Action, VLA) 모델은 로봇이 언어 지시와 시각 정보를 종합적으로 이해해 다양한 작업을 수행하도록 훈련하는 데 유용하게 활용되고 있다. 아울러 로봇이 기존에 경험하지 못한 새로운 상황에서도 적절한 행동을 선택할 수 있도록 돕는다는 장점이 있다.

그러나 연구 결과에 따르면, VLA 모델은 복잡하고 새로운 환경에서 신중한 계획과 상황 적응이 요구되는 작업을 수행하는 데에는 어려움을 겪을 수 있다고 한다. 주로 행동 관찰을 통해 학습하기 때문에 중간 추론 과정을 거치지 않기 때문이다. 즉 VLA 모델은 주어진 정보를 바탕으로 즉각적인 행동을 선택하는 데에는 능숙하지만, 복잡한 상황에서 단계별 추론을 통해 최적의 행동 계획을 수립하는 데에는 한계를 보인다.

연구팀은 VLA 모델이 탑재된 로봇의 단계별 추론 능력을 향상시키기 위해 ECoT에 기반 모델(foundation model)을 접목했다. 다양한 작업 환경에서 로봇의 행동 데이터를 담은 '브리지데이터 V2(BridgeData V2)'에서 기반 모델을 통해 유용한 특징을 추출했으며, 이를 토대로 ECoT 방식의 단계별 사고 과정을 반영한 합성 훈련 데이터를 생성해 냈다.

또한 연구진은 로봇의 환경 이해를 돕기 위해 객체 감지기와 비전-언어 모델과 같은 다양한 기반 모델을 활용해 로봇 주변 환경에 대한 설명을 생성하고, 객체 정보에 주석을 달았다. 이후 구글의 제미나이 모델을 통해 작업 계획, 세부 단계, 이동 경로 등을 레이블 형태로 생성하고, 이전에 수집된 객체 정보와 로봇 그리퍼(집게)의 위치 정보를 결합했다. 마지막으로 전체 프로세스를 하위 모듈로 분할해 로봇이 작업을 수행하기 전에 철저한 분석을 거칠 수 있도록 체계적인 접근 방식을 취했다.

Step by Step 20240801
사진=Pixabay

개선점 및 향후 과제

더 나아가 연구팀은 ECoT 추론 방식이 다양한 로봇에도 적용될 수 있음을 확인했다. 학습 과정에서 접하지 못한 로봇에도 추론 능력을 일반화할 수 있다는 것이다. 특히 ECoT는 로봇 학습 데이터 없이도 까다로운 일반화 작업에서 오픈 소스 VLA인 'OpenVLA'의 절대 성공률을 28%나 향상시키는 괄목할 만한 성과를 보였다.

참고로 절대 성공률은 로봇 조작 작업에서 다양한 시각-언어-행동(VLA) 모델의 성능을 측정하는 데 사용되는 성과 지표를 의미한다. 이 지표는 시도된 전체 작업 중에서 성공적으로 완료된 작업의 비율을 나타내며, 모델이 작업을 올바르게 실행할 수 있는 능력을 단순하게 측정한다.

아직 개선해야 할 과제도 남아있다. 모든 추론 단계가 미리 정해진 순서대로 진행되기 때문에 급변하는 환경에 대한 로봇의 적응력과 유연성이 부족하다는 한계가 있다. 소규모 프로젝트에서는 더 많은 데이터를 활용하여 이를 개선하고 ECoT의 적용 범위를 넓힐 수 있지만, 대규모 과제에는 추가 연구가 필요할 것으로 예상된다. 또한 연구팀은 현재 제한적인 실행 속도를 개선하기 위해 제어 주파수 최적화를 통한 빠른 작동 방안을 모색하고 있다.

한편 ECoT의 기반이 되는 기반 모델은 로봇 연구 분야에서 주목받는 기술이다. 기반 모델은 로봇의 다양한 작업 수행 능력을 향상시키고 로봇 교육 비용을 절감할 수 있는 잠재력을 지니고 있다. ECoT 기술은 아직 발전 단계에 있지만, 꾸준한 연구와 개발을 통해 로봇 제어 분야의 혁신을 끌어낼 수 있을 것으로 기대된다.

Picture

Member for

1 month
Real name
이효정
Position
연구원
Bio
[email protected]
지식은 전달하는 정보가 아니라, 함께 고민하기 위해 만들어진 언어입니다.

[해외 DS] NASA ‘예산 부족’으로 바이퍼 프로젝트 무산돼 ②

[해외 DS] NASA ‘예산 부족’으로 바이퍼 프로젝트 무산돼 ②
Picture

Member for

1 month
Real name
이시호
Position
연구원
Bio
[email protected]
세상은 다면적입니다. 내공이 쌓인다는 것은 다면성을 두루 볼 수 있다는 뜻이라고 생각하고, 하루하루 내공을 쌓고 있습니다. 쌓아놓은 내공을 여러분과 공유하겠습니다.

수정

부채 인상이 굴린 스노우볼, 바이퍼 프로젝트 취소
달 과학자들, 지금이라도 늦지 않았으니 바이퍼 살려야
중국은 승승장구, 미국은 내리막길 걸어가나

[해외 DS] NASA ‘예산 부족’으로 바이퍼 프로젝트 무산돼 ①에서 이어집니다.

Astronaut Standing Beside American Flag on the Moon
사진=Pexels

지난 몇 년간 과학자들은 달에 탐사선을 보내 달의 미스터리를 풀고자 했다. 노력 끝에 탐사선을 통해 많은 데이터를 얻었다. 데이터를 바탕으로 추측한 결과, 달에 물과 얼음이 존재할 가능성이 높다는 것이 과학자들 사이에서 지배적인 의견이다. NASA는 과학자들의 추측을 증명하기 위해 ‘바이퍼’라는 탐사로봇을 만들어 달에 보내고자 했다.

그러나 최근 NASA는 예산 부족에 시달려 바이퍼 프로젝트를 취소했다. NASA에서는 바이퍼가 부품으로 다른 임무에 활용될 수 있다는 의견이지만, 과학자들은 바이퍼가 부품이 아닌 전체로서 더 가치가 크다는 입장이다.

NASA, 미국 부채 인상으로 2년간 예산 동결돼

지난 17일 브리핑에서 나사(NASA) 과학임무 부국장인 니콜라 폭스와 탐사 담당인 조엘 컨스는 바이퍼 프로젝트 무산에 대한 책임이 NASA의 예산 문제에 있다고 언급했다. 법에 따라 NASA는 기본 비용에서 30% 이상 초과하는 임무에 추가 비용을 지출하려면 의회의 승인을 받아야 한다. 바이퍼가 이 기준에 도달하자 지난 6월에 프로젝트에 대한 재검토가 이루어졌다. 게다가 엄격한 예산 규정에 따라 NASA는 자금을 재할당할 여지가 거의 없는 상태인 것으로 알려졌다.

작년 6월 바이든 행정부와 공화당은 미국의 부채 한도를 잠시 동결했다가 다시 인상하여 국가 채무불이행을 피했다. 그러나 그 대가로 NASA의 예산을 2년간 동결하기로 합의한 것이다. 이 제약으로 인해 NASA의 예산은 10억 달러나 구멍이 생겼다. 이에 따라 NASA는 찬드라 엑스선 천문대를 조기 폐쇄하는 등 광범위한 예산 삭감을 진행할 수밖에 없는 상황에 처했다.

7월 9일 발표된 NASA 예산 초안에서 하원 세출위원회는 바이든 행정부가 요청한 것보다 최대 75만 달러 더 많은 예산을 바이퍼에 할당할 것을 권장했다. 이 제안은 NASA가 바이퍼의 예산을 늘릴 수 있지만, NASA의 전체 예산을 인상하는 것은 아니므로 결국 제로섬 게임에 불과하다.

엎친 데 덮친 격, 예산 동결에 그리핀 발사 실패까지

바이퍼의 몰락에는 애스트로보틱이 제작한 달 착륙선인 그리핀의 기술적 어려움이 크게 한몫했다. 애스트로보틱은 달 탐사 임무를 수행한 적이 없었기 때문에 NASA는 이러한 위험을 관리하기 위해 애스트로보틱에 더 많은 테스트를 요구했다. 또한 그리핀 발사를 2023년에서 2024년으로 연기하는 데 동의했다. 지난 1월 애크로보스틱은 처음으로 달 탐사 임무를 시작했으나, 안타깝게도 발사 직후 착륙선이 심각한 고장을 일으켜 달에 도달하지 못했다.

애스트로보틱은 첫 임무 실패 요인에 대해 검토 완료했으며 이에 맞춰 그리핀을 수정하고 있다고 밝혔다. 그러나 컨스는 NASA 포럼에서 그리핀에 회의적인 시각을 드러냈다. 그리핀에 많은 투자 비용이 들어갔으나, 이에 상응하는 가치를 보이고 있는지는 의문이라고 덧붙였다.

바이퍼 프로젝트 취소를 보고 달 과학자들은 의회를 설득하기 위해 조직을 꾸려나가기 시작했다. 이례적일 정도로 간결한 공개 서한을 배포하여 의회에 바이퍼 취소 승인을 거절해달라는 요청을 보냈다. 4억 5000만 달러를 지출한 시점에서 프로젝트를 취소하기로 한 결정은 전례 없는 일이라고 강조했다. 7월 23일 기준으로 1000명 이상이 서한에 서명했다.

중국에게 따라잡히는 건 시간 문제

미국 과학자들은 바이퍼가 비행하지 못하면, 중국에게 달 자원 탐사에서 주도권을 뺏길 수 있다는 점을 우려했다. 최근 중국은 달에 연착륙과 복귀 임무에서 연속적인 성공을 거두었다. 중국은 다음 목표로 두 개의 달 탐사로봇인 창어 7호와 8호를 보낼 예정이다. 이 탐사로봇을 통해 달 남극 근처에서 물과 얼음을 찾고 미래 달 과학 기지를 위한 기술을 시험할 것이라고 밝혔다.

남서연구소의 행성과학자 아크바르 위진은 “현재 중국의 발전 속도는 미국보다 훨씬 빠르다”며 우주 경쟁에서 경각심을 가질 것을 촉구했다.

희망적인 소식은 NASA의 개입 없이도 바이퍼가 비행할 가능성이 희박하나 존재한다는 것이다. 현재 NASA는 국제 파트너와 미국 민간 기업에 추가 비용 없이 바이퍼를 인수할 의향서를 미국 정부에 제출할 것을 요청했다. 그러나 제안서의 마감일은 8월 1일로 빠르게 다가오고 있으며 바이퍼를 채택할 수 있는 자금과 수단을 갖춘 단체는 지구상에서 소수에 불과하다. 이에 위진은 시간이 얼마 남지 않았다며 바이퍼의 새 주인이 나타나길 기대하고 있다.

*편집진: 영어 원문의 출처는 사이언티픽 아메리칸(Scientific American)으로 본지의 편집 방향과 일치하지 않을 수도 있습니다.

Picture

Member for

1 month
Real name
이시호
Position
연구원
Bio
[email protected]
세상은 다면적입니다. 내공이 쌓인다는 것은 다면성을 두루 볼 수 있다는 뜻이라고 생각하고, 하루하루 내공을 쌓고 있습니다. 쌓아놓은 내공을 여러분과 공유하겠습니다.

[해외 DS] NASA ‘예산 부족’으로 바이퍼 프로젝트 무산돼 ①

[해외 DS] NASA ‘예산 부족’으로 바이퍼 프로젝트 무산돼 ①
Picture

Member for

1 month
Real name
이시호
Position
연구원
Bio
[email protected]
세상은 다면적입니다. 내공이 쌓인다는 것은 다면성을 두루 볼 수 있다는 뜻이라고 생각하고, 하루하루 내공을 쌓고 있습니다. 쌓아놓은 내공을 여러분과 공유하겠습니다.

수정

예산 부족으로 수년 간의 노력 물거품으로 돌아가
NASA, 바이퍼 부품 다른 임무에 사용할 것으로 밝혀
과학자들, 바이퍼 빈 자리 채우기 어려울 것

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 글로벌AI협회(GIAI)에서 번역본에 대해 콘텐츠 제휴가 진행 중입니다.


NASA
사진=Scientific American

나사(NASA) 엔지니어들은 달에서 물과 얼음을 찾기 위해 탐사로봇인 바이퍼(Volar Investigating Polar Exploration Rover, VIPER)를 만드는 데 수년 동안 노력을 기울였다. 지난 6월 마침내 골프 카트 크기의 바이퍼를 만드는 데 성공했다. 바이퍼를 제작하기 위해 4억 5천만 달러라는 어마어마한 비용이 들어갔으나, 그에 따른 가치가 있다는 의견이다. 바이퍼가 성공적으로 임무를 완수하면, 수십 년간 추측에 불과했던 수수께끼를 풀 수 있다. 또한 달의 공기, 물, 얼음 등을 채취하여 국제 우주 경쟁에서 우위를 가져갈 수 있다.

예산 부족에 시달리는 NASA

그러나 바이퍼 프로젝트는 공식적으로 취소됐다. 최근 NASA는 극심한 예산 부족에 시달리고 있는 것으로 알려졌다. 따라서 외부에서는 ‘예산 부족’으로 프로젝트가 취소됐다는 의견이 지배적이다. 미국 달 과학자들은 이번 프로젝트에 기대가 컸던 만큼, NASA에 실망과 분노를 표출하고 있다.

센트럴 플로리다 대학교의 행성 과학자인 필 메츠거는 “바이퍼 프로젝트가 NASA에서 설계한 프로젝트 중 가장 중요한 우주 개발 프로젝트”라며 프로젝트 무산에 강한 아쉬움을 표했다. 다른 국가의 우주 기관이나 민간 기업에 바이퍼가 매각되지 않는 한, 바이퍼는 몇 주 안에 해체될 위기에 처해진 것으로 알려졌다.

경제적으로도 중요한 가치 지닌 바이퍼

과학자들은 달에 물과 얼음이 풍부하다고 강하게 추측할 뿐, 확실한 증거는 없었다. 20년 이상 달 궤도에서 수집된 데이터를 바탕으로 달의 북극과 남극, 특히 해가 없고 추운 분화구 깊숙한 곳에 물과 얼음이 풍부하다고 예상했다. 그러나 지금까지 달의 고위도 지역을 직접 가서 자세히 관측한 탐사선은 없었다. 얼음의 깊이는 얼마나 되며, 표면에 따라 얼음이 어떻게 달라지는지 등 안타깝게도 과학자들은 추측만 내놓을 뿐이다.

바이퍼는 과학자들의 이런 질문에 응답하기 위해 제작되었다. 바이퍼는 달 지형을 탐색하여 관심 지점에 도달하고 3피트 깊이로 시추하여 토양의 얼음 함량을 분석한다. 그런 다음 다른 위치로 이동하여 같은 작업을 다시 수행한다.

바이퍼 프로젝트는 과학적 관점에서도 물론 중요하지만, 경제적인 측면에서도 중요한 의미를 가진다. 행성과학연구소(Planetary Science Institute)의 아만다 헨드릭스는 달에 얼마나 많은 물과 얼음이 있는지 아는 것은 경제적으로 매우 중요하다고 강조했다.

물거품이 된 바이퍼 프로젝트

NASA의 원래 계획은 4억 3350만 달러를 들여 2023년 발사를 목표로 바이퍼를 제작하는 것이었다. 그러나 민간 기업인 애스트로보틱(Astrobotic)이 개발한 그리핀이 달에 도착하는 데 지연되자, NASA도 덩달아 발사 날짜를 2024년 말로 미뤘다. NASA는 바이퍼와 그리핀 모두 최소한 2025년 9월까지 비행할 준비가 되지 않았다고 평가했다. 이에 따라 2026년까지 6억 960만 달러가 추가로 들 것으로 내다봤다.

NASA 과학임무 부국장인 니콜라 폭스는 지난 17일 언론 브리핑에서 바이퍼 프로젝트를 취소하면 8400만 달러를 절약할 수 있다고 밝혔다. 물론 쉬운 결정은 아니었으며 결코 가볍게 내린 결정이 아니었음을 강조했다.

NASA는 기하급수적인 비용이 들어가는 만큼 보수적으로 임무를 승인하는 경향이 있다. 예를 들어 작년에 발사한 프시케 탐사선이 있다. 탐사선을 발사하기 전에 발사 지연과 비용 초과에 대해 혹독한 검토를 거친 후 발사하는 데 성공했다. 게다가 NASA는 우주선이 이미 제작되었으나 임무가 난관에 부딪힌 경우, 미국 정부는 주로 우주선 발사를 완전히 취소하기보다는 발사를 연기하는 경향이 있다.

하지만 바이퍼 프로젝트는 과거와는 대조적인 행동을 보였다. 또한 바이퍼 프로젝트의 갑작스러운 종료는 발사를 향해 쏟았던 몇 달간의 노력을 물거품으로 만들었다. 지난 3월에는 바이퍼의 설계를 주도한 NASA 에임스 연구 센터에서 바이퍼 제작 과정을 생중계했다. 또한 지난 5월에는 바이퍼 팀이 스트레스 테스트 계획에 승인받았다. 심지어 7월 17일 기자회견이 열렸을 때, 바이퍼는 이미 완전히 조립되어 진동 테스트도 통과한 상태였다.

돼지에게 립스틱 바른 격

지난 6월 미국 회계감사원 보고서에는 올해 배정된 바이퍼 예산이 7월이면 소진될 것이라고 경고했다. 하지만 NASA 고위 관리들은 바이퍼가 도마 위에 올랐다는 사실을 공개하지 않았다. NASA 탐사 담당인 조엘 컨스는 바이퍼와 그리핀이 이전에 예상했던 대로 2024년 말에 발사되지 않을 것이라고 인정했다. 그러나 프로젝트의 잠재적 종료 가능성에 대해서는 전혀 언급하지 않고 넘겼다.

7월 17일 기자회견에서 폭스와 컨스는 다른 달 탐사 임무는 순조롭게 진행 중이며 바이퍼의 장비가 다른 임무에 사용될 것이라고 밝혔다.

과학자들은 바이퍼의 부품이 부분적으로 사용되는 것보다 바이퍼로서 작동하는 데 가치가 더 크다고 답했다. 다른 탐사로봇은 바이퍼의 빈자리를 채우지 못하고 있다. 얼음이 많은 극지방이 아닌 달의 저위도 지역을 목표로 하고 있다. 곧 예정된 달 탐사 임무에서는 올해 말 달의 남극 근처에 착륙 시도할 예정이라고 밝혔다. 그러나 바이퍼는 여러 지점을 탐사할 수 있는 반면, 다른 탐사로봇은 한 곳에서만 데이터를 수집할 수 있다.

존스 홉킨스 대학 응용 물리학 연구소의 행성 과학자인 벤자민 그린하겐은 바이퍼가 하려던 일은 완전히 독자적이었기 때문에 다른 탐사선이 대체할 수 없다고 했다. 따라서 다른 탐사선이 바이퍼를 대체할 수 있다는 NASA의 결정에 회의감을 드러냈다.

노트르담 대학교의 달 과학자 클라이브 닐은 NASA가 바이퍼 프로젝트를 취소한 것을 보고 “돼지에게 립스틱을 바르고 있다”며 다른 탐사선이 할 일과 바이퍼가 할 일을 제대로 고려하지 못했다고 지적했다.

[해외 DS] NASA ‘예산 부족’으로 바이퍼 프로젝트 무산돼 ②로 이어집니다.

*편집진: 영어 원문의 출처는 사이언티픽 아메리칸(Scientific American)으로 본지의 편집 방향과 일치하지 않을 수도 있습니다.

Picture

Member for

1 month
Real name
이시호
Position
연구원
Bio
[email protected]
세상은 다면적입니다. 내공이 쌓인다는 것은 다면성을 두루 볼 수 있다는 뜻이라고 생각하고, 하루하루 내공을 쌓고 있습니다. 쌓아놓은 내공을 여러분과 공유하겠습니다.

[해외 DS] 메타, 4050억 개 매개변수 가진 대형언어모델 '오픈 소스'로 공개해

[해외 DS] 메타, 4050억 개 매개변수 가진 대형언어모델 '오픈 소스'로 공개해
Picture

Member for

1 month
Real name
이태선
Position
연구원
Bio
[email protected]
세상은 이야기로 만들어져 있습니다. 다만 우리 눈에 그 이야기가 보이지 않을 뿐입니다. 숨겨진 이야기를 찾아내서 함께 공유하겠습니다.

수정

역사상 최대 규모의 오픈 소스 대형언어모델 등장
라마 3.1, 여러 벤치마크 테스트에서 GPT-4와 비슷한 성능 보여
오픈 소스 공개를 통해 투명하고 안전한 대형언어모델 되어야
Paper in Vintage Typewriter
사진=Pexels

메타는 역사상 최대 규모의 오픈 소스 대형언어모델(LLM)인 라마 3.1을 공개했다. 라마 3.1을 두고 현존하는 최강의 AI 모델이라며 성능에 자신감을 보였다. 더불어 오픈AI가 챗GPT 코드를 공개하지 않는 모습을 보며 회사명과 모순인 점을 비난했다.

마크 저커버그 “대형언어모델 업계에서도 오픈 소스 문화 활성화 되어야”

라마 3.1은 영어뿐만 아니라 아랍어, 독일어, 힌디어 등 8개 언어로 대화할 수 있으며 긴 글 요약에서도 높은 성능을 보여 강력한 언어 모델로서 자리매김했다. 게다가 사용자가 언어 모델을 쉽게 구현할 수 있도록 API를 제공했다. 라마 3.1은 오픈 소스를 공개하면서도 오픈AI의 GPT-4와 앤트로픽의 클로드 3.5 등과 같이 최신 대형언어모델과 비슷한 성능을 보였다.

메타 CEO인 마크 저커버그는 라마 3.1을 오픈 소스로 과감히 공개한 사건을 두고 개발 업계에 변곡점이 될 것이라고 예상했다. 또한 대형언어모델 업계에서도 오픈 소스를 공개하는 문화가 정착해야 한다고 지적했다.

라마 3.1, GPT-4와 비슷한 성능 보여

이전에 공개한 라마 3는 700억 개의 매개변수로 학습했으나, 이번에 출시한 라마 3.1 405B는 무려 4050억 개의 매개변수로 모델을 학습했다. 이는 GPT-3를 한참 능가한 수준이다. 대형언어모델에서 매개변수 개수는 그 모델의 크기를 뜻한다. 일반적으로 매개변수 개수가 많을수록 더 많은 데이터를 활용해 나은 성능을 보일 것으로 예상한다.

또한 메타는 라마 3.1은 일반 지식, 조종성, 수학, 도구 사용, 다국어 번역 등 다양한 작업에서 GPT-4와 경쟁할 수 있는 수준이라고 밝혔다. 벤치마크 결과에 따르면, 라마 3.1은 수학 벤치마크 테스트에서 클로드 3.5와 GPT-4o 모델을 넘어섰다. 또한 업계 표준 테스트인 MMLU(Massive Multitask Language Understanding)에서도 경쟁력을 유지하는 모습을 보였다.

모델 효율성 혁신 이룬 메타

게다가 라마 3.1은 15조 개 이상의 토큰으로 훈련되었다. 토큰은 언어의 기본 구문 단위를 말한다. 훈련 과정에서 엔비디아의 H100 GPU를 16000개를 사용하여 몇 달이 걸릴 정도로 거대한 언어 모델이다.

라마 3.1의 컨텍스트(Context) 길이는 12만8천개 토큰이다. 컨텍스트 길이는 언어 모델이 한 번에 처리할 수 있는 입력 텍스트 길이를 뜻한다. 일반적으로 한 번에 처리할 수 있는 텍스트가 많을수록 더 높은 성능을 보인다. 그 이유는 대형언어모델 특성상 이전 문장과 가장 유사한 단어를 출력하여 한 번에 고려할 수 있는 단어가 많으면 많을수록 문맥을 더 정확하게 고려할 수 있기 때문이다. 그러나 컨텍스트 길이가 늘어날수록 비용은 기하급수적으로 증가하므로 그 사이의 균형을 찾는 것이 대형언어모델에서 주요한 과제로 꼽힌다.

제미나이 1.5 프로가 200만 컨텍스트를 고려한 것에 비해 라마 3.1의 컨텍스트는 길지 않지만, 추론 기능이 향상되어 긴 텍스트를 더 효과적으로 처리하고 이해할 수 있다.

또한 메타 AI 엔지니어들은 트랜스포머 모델 아키텍처에 약간의 변형을 줘서 더 높은 성능을 보이게 설계했다. 모델 효율성 혁신은 단순히 규모를 확장하는 것을 넘어 더 큰 도움이 된다. 작고 관리하기 쉬운 모델로 비슷하거나 우수한 결과를 달성하면, 비용뿐만 아니라 환경에도 영향을 줘 사용자와 애플리케이션이 고급 AI에 쉽게 접근할 수 있다.

오픈 소스 대형언어모델, 폐쇄형보다 투명하고 안전해

또한 메타는 라마 3.1을 공개하면서 모델 안전성을 강조했다. 모델이 커질수록 방대한 양의 데이터를 처리해야 하므로 안전성을 관리하기가 어렵다는 점을 짚었다. 메타는 라마 3.1을 출시하기 전에 여러 위험 평가와 안전성 평가는 물론 전문가와 함께 스트레스 테스트를 시행했다고 밝혔다.

게다가 메타는 모델의 다국어 기능 평가도 소홀히 하지 않았다. 영어 이외의 언어에서도 안전하고 합리적인 결과를 도출하도록 설계했다. 저커버그는 라마 3.1와 같이 오픈 소스 모델은 투명하고 광범위하게 조사할 수 있으므로 챗GPT와 같이 폐쇄형 모델보다 더 안전할 것이라고 강조했다.

오픈 소스로 공개했을 뿐, 구현하기에는 현실적으로 어려워

메타는 이전 라마 모델과 마찬가지로 라마 3.1을 오픈 소스로 공개했으며 누구나 접근할 수 있도록 만들었다. 실제로 허깅 페이스(Hugging Face), 깃허브 또는 메타에서 직접 내려받을 수 있다.

그러나 아이리스에이아이(Iris.ai)의 CTO겸 공동 창립자인 빅터 보테브는 이 모델을 실행하려면 상당한 규모의 하드웨어가 필요하여 사실상 접근이 쉽지 않다고 했다. 오픈 소스로 공개했을 뿐, 현실적으로 이를 구현할 수는 없다고 덧붙였다.

보테브는 대부분 연구자와 조직이 대규모 모델을 활용할 수 있는 인프라가 부족하다는 점을 지적했다. 또한 대규모 모델을 훈련하고 실행하는 데 따르는 환경적 영향을 무시할 수 없다고 언급했다.

Picture

Member for

1 month
Real name
이태선
Position
연구원
Bio
[email protected]
세상은 이야기로 만들어져 있습니다. 다만 우리 눈에 그 이야기가 보이지 않을 뿐입니다. 숨겨진 이야기를 찾아내서 함께 공유하겠습니다.