입력
수정
AI의 능력을 제대로 인지하게 되면서 AI에 대한 인식이 비관적으로 바뀌고 있어
AI가 바둑처럼 저소음 데이터에서는 높은 예측력 보이지만, 주식 시장같이 고소음 데이터에서는 예측 어려워
저소음 데이터의 일자리만 대체될 뿐, 고소음 데이터 일자리는 건재해
최근 AI의 미래에 대해 비관적인 이야기가 흘러나오면서 빅테크 기업의 주가가 곤두박질쳤다. 이에 따라 AI에 부정적인 견해를 가진 투자자, 전문가, 학자들의 발언이 재평가되고 있다. 이들은 AI에 투자해서 얻는 수익률이 낮을 것이고, AI 제품의 가격이 지나치게 높으며 AI가 경제에 미치는 영향은 미미하다고 주장했다. 사실 많은 사람이 여러 해 동안 경고했다. AI는 만능 해결사가 아니며 AI가 도출하는 결과는 상관관계일 뿐, 인과관계나 지능이 아닌 점을 지적해왔다.
GIAI는 AI에 ‘환상’이 있는 사람들로부터 99.99% 정확도로 주가를 예측할 수 있는 알고리즘을 만들 수 있는지 묻는 메일을 종종 받는다. 만약 그런 알고리즘이 있다면, 그걸 공유할 필요가 있을까? 당연히 비밀로 유지하고 수익을 독차지할 것이다. 노벨 경제학상 수상자인 밀턴 프리드먼의 유명한 표현처럼 “공짜 점심은 없다.” 게다가 완벽한 예측이 널리 알려지면, 예측은 더 이상 예측이 아니다. 모든 사람이 주가가 상승할 것을 알고 있으면, 주가는 예측치에 도달할 때까지 급등한다. 즉, 미래는 현재가 되고, 아무도 이익을 얻지 못한다.
AI는 신인가? 패턴 매칭 기계일 뿐
AI 신봉론자들은 AI가 인간의 인지능력을 가뿐히 넘어서고 곧 신과 같은 존재가 될 것이라는 과도한 낙관을 가지고 있다. 그러나 현재 AI는 단지 ‘패턴 매칭 기계’에 불과하다. 그 이유는 AI가 사물의 원리를 이해하는 게 아니라 시행착오를 여러 번 겪으면서 패턴을 찾기 때문이다. 예를 들어 뜨거운 냄비를 만지면 화상을 입고, 화상을 입으니 뜨거울 때는 만지지 말아야 한다는 것을 배운다. 또한 고통이 클수록 더욱 조심하게 된다. 여기서 학습 과정을 동적으로 바꾸면, 생성형 AI가 된다. 시스템은 계속 시행착오를 겪으면서 데이터베이스에 더 많은 패턴을 추가한다.
AI가 수많은 패턴을 찾으면 큰 잠재력을 가지게 되지만, 그렇다고 해서 기계가 패턴의 인과관계를 이해한다는 말은 아니다. 기계는 ‘패턴 매칭 기계’에 불과할 뿐이다.
예를 들어 매년 열리는 전공수업에서 교수님이 어떤 농담을 할지 예측할 수 있을까? 지겹도록 들었기 때문에 당연히 예측할 수 있다. 그럼 주식 시장도 수십 년 동안 같은 행동을 반복했으니, 주가도 예측할 수 있을까? 아쉽지만 쉽게 부자가 될 수 없다.
저소음 데이터 vs 고소음 데이터
월스트리트에 가보면 금융 시장을 완벽하게 예측할 수 있다고 주장하는 헤지펀드 매니저를 만날 수 있다. 그들과 얘기를 나눠보면, 뛰어난 실적에 놀라고 어느 순간 설득당할 정도로 말을 잘한다. 1910년대 초와 1940년대에도 이런 주장이 만연했으나, 이들은 결국 투자자들에게 고소당해 체포됐고 몇 년 안에 거리에서 사라졌다. 만약 그들이 그렇게 뛰어난 사람들이었다면, 왜 돈을 잃고 고소당했을까?
데이터에는 두 가지 유형이 있다. 기계처럼 매우 통제된 환경에서 얻을 수 있는 데이터를 저소음(Low-noise) 데이터라고 한다. 이 데이터를 바탕으로 AI 모델을 만들면, 높은 예측력을 얻을 수 있다. 심지어 데이터에 패턴이 숨어있더라도, ‘똑똑한’ 두뇌나 경우의 수를 모두 계산할 수 있는 ‘고성능’ 기계가 있으면 패턴을 찾을 수 있다. 대표적인 예시가 바둑이다. 바둑에서 상대방을 이기려면 이세돌처럼 뛰어난 두뇌가 있거나, 바둑판 내에서 발생하는 경우의 수를 모두 계산하는 기계가 있으면 된다. 이세돌만큼 뛰어난 두뇌를 가지고 있지 않더라도, 컴퓨터가 승리 패턴을 찾을 수 있다는 것은 이세돌 대 알파고의 대국에서 이미 보여줬다.
다른 유형의 데이터는 통제되지 않은 환경에서 나온다. 이 데이터에 패턴이 있을 수 있지만, 관측할 수 없는 수천, 수백만 개의 패턴이 존재한다. 따라서 ‘정확한’ 움직임을 예측하는 것이 불가능해 확률 모델링이 필요하다. 이를 고소음(High-noise) 데이터라고 한다. 위에서 계속 언급했던 주식 시장이 대표적인 예시다. 관측할 수 없는 수백만 개의 영향이 존재해 아무리 뛰어난 연구자나 기계가 있어도 높은 정확도로 예측할 수 없다. 따라서 금융 모델은 예측을 위한 게 아니라, 백테스팅을 통해 파생상품의 합리적인 가격을 책정하는 데 사용된다.
저소음 데이터의 대표적인 예시로는 자연어 처리(NLP)가 있다. 언어는 문법이라고 하는 일정한 규칙을 따른다. 고의로 문법을 벗어나거나 실수하지 않는 한 사람들은 대체로 문법을 따른다. 날씨는 대부분 저소음이지만, 고소음 데이터 요소를 가진 재밌는 데이터다. 기상청에서 태풍을 정확하게 예측하기도 하지만, 예측이 틀릴 때도 많다. 그럼 주식 시장은? 노벨 경제학상 수상자를 상대로 이길 수 있으면 도전해 봐라. 2023년까지 4명의 금융 경제학자가 노벨 경제학상을 받았으며, 모두 주식 시장이 확률 과정을 따른다는 믿음을 가지고 있다. 정규분포, 포아송 분포, 또는 다른 알려지지 않은 분포일 수 있다. 여기서 데이터가 알려진 분포를 따른다는 말은 데이터가 임의로 움직인다는 뜻이다.
AI 활용처, 반복 업무 자동화
위에서 설명한 것을 근거로 GIAI는 AI가 단기적으로 비즈니스와 일상에 큰 변화를 불러오지 못할 것으로 믿는다. AI에게 기대할 수 있는 최선은 단순 작업의 자동화뿐이다. 마치 20세기 초의 세탁기처럼. 챗GPT가 그 증거로, 곧 상담사는 대형언어모델(LLM) 기반 챗봇으로 대체될 것이다.
회사에서 여전히 사람이 필요하지만. 이전보다는 훨씬 적게 필요할 것이다. 실제로 GIAI는 이미 여러 국제 서비스로부터 기계가 생성한 답변을 받고 있다. 예를 들어 워드프레스 플러그인에 오작동이 생겨 불만을 제기하면, 우선 기계가 이메일로 답변을 보낸다. 어느 정도는 기계의 답변으로 충분하다. 이런 관행은 챗봇을 구현하기 더 쉬워지고 저렴해지면서 더욱 대중화될 것이다.
GIAI는 이전 글에서 밝혔듯이 에듀타임즈(EduTimes)와 협업하여 카피보이를 대체하는 연구를 하고 있다. 대형 신문사 기자들이 항상 새로운 이야기를 찾기 위해 거리로 나가지 않는다. 실제로 대부분은 다른 신문사의 기사를 마치 원본인 것처럼 내용을 재정리해서 기사로 내보낸다. 중요한 작업은 아니지만, 신문사가 운영되기 위해서는 여전히 필요한 작업이다. 대형 신문사에서 일한 경력이 있는 에듀타임즈 기자에 따르면, 카피 팀은 보통 가장 적은 급여를 받고 기자로서 사형 선고를 받은 것으로 여긴다. 그런데 존경받지 못하는 것은 둘째 치고, 이 일은 곧 대형언어모델 카피보이로 대체될 것이다.
신문사에 국한되지 않고 일반적으로 말하면, 높은 인지능력을 요구하지 않는 ‘패턴화’된 콘텐츠를 생성하는 직업은 점차 대체될 것이다.
자동차 운전은 어떨까? 저소음 패턴 작업일까, 아니면 고소음 데이터에 복잡한 작업일까? 일론 머스크는 특정 구간에서 자율주행이 가능한 레벨 4 자율주행이 가능하다고 주장한다. 하지만 여기에 대해서 GIAI는 동의하지 않는다. 게임 이론 전문가 중 어느 누구도 불완전 정보와 참가자를 알 수 없는 베이지안 게임에서 컴퓨터가 스스로 문제를 풀 수 있다고 믿지 않는다. 따라서 자율주행 알고리즘은 다른 운전자의 행동을 전혀 예측할 수 없다.
빠르게 달리는 상황에서 다른 운전자의 행동을 정확히 예측할 수 없다면, 자율주행 알고리즘은 난폭한 운전자를 피해 안전하게 운전하기 어려울 것이다. 현재 알고리즘이 할 수 있는 최선은 ‘차 한 대’에 대해서 수학적, 기계적, 법적 문제 등을 최적화하는 작업뿐이다.
과연 자신감 넘치고 똑똑한 월스트리트 투자자들이 AI의 실상을 모르고 있을까? 기술주가 급락한 것은 월스트리트 투자자들이 이런 사실을 모두 알고 있기 때문이 아닐까?
추측하건대, 월스트리트는 실리콘밸리가 너무 높은 급여를 받고 있다고 생각한다. 미국 동부에서는 서부가 너무 비현실적이고 허무맹랑하게 느껴진다. 어쩌면 오픈AI의 다음 라운드 펀딩은 완전히 정반대 방향으로 우리를 놀라게 할 수도 있다.
*편집진: 영어 원문은 GIAI Research의 AI Pessimism, just another correction of exorbitant optimism입니다.