입력
수정
소셜 미디어 타고 빠르게 퍼지는 허위 정보
허위 정보 연구진, 전염병에서 아이디어 얻어
허위 정보에 휘둘리지 않으려면 면역력 키워야
[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 글로벌AI협회(GIAI)에서 번역본에 대해 콘텐츠 제휴가 진행 중입니다.
허위 정보가 퍼져나가는 과정은 마치 전염병을 연상시킨다. 보균자가 바이러스를 퍼뜨려 병을 옮기듯 소셜 미디어에 허위 정보가 돌아다니면 사람들은 허위 정보에 속아 넘어간다. 이러한 유사점에서 영감을 얻은 과학자들은 전염병 연구에 사용되는 수학 모형을 활용해 허위 정보가 퍼져나가는 모습을 모형화했다. 더불어 해당 모형을 통해 허위 정보에도 ‘예방접종’이 효과적임을 입증했다.
늘어나는 허위 정보, 낮아지는 신뢰도
소셜 미디어가 발달하면서 다양한 허위 정보가 온라인을 통해 확산하고 있다. 특히 올해 미국 대선 기간에는 그 정도가 더욱 심했다. 정부가 날씨를 통제해 허리케인을 발생시켰다는 ‘날씨 조작’ 음모론이 퍼지는가 하면 "아이티 이민자들이 이웃 애완동물을 몰래 잡아가 먹었다"는 도널드 트럼프 미국 대통령 당선인의 황당한 발언까지 소셜 미디어를 타고 빠르게 퍼져나갔다.
이를 두고 일각에서는 이렇게 허위 정보가 빠르게 확산하는 데 일론 머스크 테슬라 최고경영자(CEO)도 일조했다는 주장이 나온다. 실제 날씨 조작 음모론에서 주목할 점은 X(옛 트위터)에 허위 정보를 유포한 계정이 대부분 '블루 체크' 마크를 달고 있다는 점이다. 머스크가 트위터를 인수하기 이전만 해도 블루 체크는 '해당 계정은 진짜'란 의미였다.
하지만 머스크가 인수하고 난 뒤 유료 서비스에 가입하기만 하면 블루 체크를 달 수 있게 됐다. 문제는 블루 체크를 달고 있으면 게시글의 사실 여부를 막론하고 알고리즘에 의해 더 자주 노출된다는 점이다. 이에 허위 정보 유포자들은 블루 체크를 달고 사람들에게 손쉽게 허위 정보를 노출할 수 있었다.
전염병 확산 모형, 허위 정보에 적용
이처럼 허위 정보가 판치면서 사람들의 우려도 깊어지고 있다. 실제로 미국인 중 73%는 오해의 소지가 있는 뉴스를 본 적이 있다고 했으며, 허위 정보를 구분하는 일은 간단하지 않다고 답했다. 일부는 허위 정보를 자주 접하다 보니 정보의 신뢰도가 현저히 낮아졌다며 불만의 목소리를 표하기도 했다.
이에 샌더 반 데르 린덴(Sander van der Linden)은 케임브리지대학(University of Cambridge) 심리학 교수를 비롯한 연구진은 날로 심각해지는 허위 정보를 파악하고자 나섰고, 전염병 연구에서 돌파구를 찾았다. 전염병 확산을 모형화하고자 만든 수학 모형을 허위 정보가 확산하는 과정에 똑같이 적용한 것이다. 허위 정보에 적용한 수학 모형은 감염병 연구에서 가장 기초가 되는 SIR 모형으로, 감염 대상군(Susceptible)-감염군(Infected)-회복군(Recovered) 간의 역학 관계를 계산하는 모형이다.
학계에서도 SIR 모형을 허위 정보에 적용하는 것이 합리적이라는 반응이다. 전염병이 퍼져나가는 과정과 허위 정보가 퍼져나가는 과정이 비슷하기 때문이다. 허위 정보도 이를 퍼뜨리는 전파자가 있으며 허위 정보에 노출된 사람 중 일부는 이를 믿고 일부는 믿지 않는다. 또한 자신도 모르게 허위 정보에 노출된 사람은 무증상 전파자처럼 별다른 죄책감 없이 허위 정보를 퍼뜨리기도 한다.
무엇보다 SIR 모형을 허위 정보에 적용했을 때 허위 정보가 퍼져나가는 수치를 계산할 수 있다는 점에서 매력적이다. 예를 들어 허위 정보에 감염된 개인이 평균적으로 몇 명에게 허위 정보를 옮기는지 제시할 수 있다. 이를 전염병 연구에서는 기본재상산계수(R0)라고 표현하며 대부분 소셜 미디어 플랫폼은 이 수치가 1보다 큰 것으로 추정된다.
허위 정보 예방접종 ‘프리벙킹’
소셜 미디어에서 빠르게 퍼지고 있는 허위 정보를 제어하고자 연구진은 예방접종과 유사한 맥락인 ‘프리벙킹(Prebunking)’을 제안했다. 프리벙킹이란 허위 정보가 확산하는 과정을 자세히 보여줌으로써 사람들에게 허위 정보에 대한 면역력을 심어주는 방법이다. 기존에는 허위 정보 확산을 막기 위해 허위 정보에 반박하는 디벙킹(Debunking)이 주로 사용됐다. 하지만 정보의 확산이 빨리지면서 한계를 맞이했고, 이러한 한계를 극복하고자 연구진은 관점을 바꿔 프리벙킹을 제시했다. 확산 속도를 따라잡을 수 없다면 면역력을 가져 허위 정보에 감염되지 않도록 하겠다는 것이다.
연구진은 시뮬레이션을 통해 프리벙킹의 효과를 입증했다. 시뮬레이션하는 대상은 전염병과 유사하게 감염 대상군(Susceptible)-허위 정보 감염군(Disinformed)-면역군(Vaccinated)으로 정의한 뒤, 프리벙킹을 하지 않은 집단과 한 집단 간의 움직임을 살펴봤다. 그 결과 허위 정보가 가장 심할 때, 프리벙킹을 하지 않은 집단은 감염된 비율이 80%를 넘긴 반면, 프리벙킹을 한 집단은 그 비율이 40%를 넘지 않았다.
연구진은 프리벙킹을 통해 허위 정보에 면역력을 갖는 것이 가장 중요하다고 힘줘 말했다. 인공지능(AI)이 허위 정보를 자동으로 생성하는 시대에 이를 하나하나 반박하기란 사실상 불가능하기 때문이다. 일각에선 AI가 생성한 허위 정보를 AI로 잡아내면 되지 않느냐는 의견도 나오지만, AI의 특성을 고려하면 쉽지 않을 것이라는 분석이 지배적이다. AI는 단어 간의 상관관계를 파악해 글을 자동으로 생성하는 데는 유용하지만, 그 글의 사실 여부를 판단하는 데는 효과적이지 않다.
원문의 저자는 샌더 반 데르 린덴(Sander van der Linden) 케임브리지대학(University of Cambridge) 심리학 교수와 데이비드 로버트 그라임스(David Robert Grimes) 과학자입니다. 영어 원문은 Misinformation Really Does Spread like a Virus, Epidemiology Shows | Scientific American에 게재돼 있습니다.