Skip to main content

[해외 DS] 성큼 다가온 양자 인터넷 시대, 美·中·和 도시 환경에서 '양자 얽힘' 구현 성공

[해외 DS] 성큼 다가온 양자 인터넷 시대, 美·中·和 도시 환경에서 '양자 얽힘' 구현 성공
Picture

Member for

1 month
Real name
김광재
Position
연구원
Bio
[email protected]
균형 잡힌 시각으로 인공지능 소식을 전달하겠습니다.

수정

미국·중국·네덜란드, 수 킬로미터 광섬유에서 양자 얽힘 현상을 구현하는 데 성공
세 연구팀은 큐비트 저장 방식과 얽힘 생성 방식에서 차이를 보여
앞으로 더 긴 거리에서 얽힘 생성 및 양자 통신 시연을 목표로 삼아

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 글로벌AI협회 연구소(GIAI R&D)에서 콘텐츠 제휴가 진행 중입니다.


Quantum Internet Demonstrations Debut in Three Cities ScientificAmerican 20240529
사진=Scientific American

최근 미국, 중국, 네덜란드의 세 연구팀이 실제 도시 환경에서 수 킬로미터에 달하는 광섬유를 통해 '양자 얽힘(quantum entanglement)' 현상을 구현하는 데 성공했다. 양자 얽힘이란 두 개 이상의 물체가 멀리 떨어져 있어도 동일한 정보를 공유하는 현상으로, 양자 상태로 정보를 교환하는 미래 양자 인터넷 구축에 한 걸음 더 다가섰다는 평가를 받았다.

한편 미국과 중국의 연구 결과는 네이처(Nature)에, 네덜란드 연구는 미국 코넬대에서 운영하는 논문 사전 공개 사이트 아카이브(arXiv)에 각각 발표됐다.

실험실 안과 밖의 차이

두 개의 양자비트(큐비트)가 얽히면, 둘은 아무리 멀리 떨어져 있어도 서로 연결되어 한쪽의 상태가 바뀌면 다른 쪽의 상태도 즉시 바뀌는 특성을 보인다. 이를 이용하면 해킹이 불가능한 암호 시스템을 구축할 수 있다. 큐비트를 측정하는 순간 얽힘 상태가 깨져 해킹 시도를 즉시 감지할 수 있기 때문이다.

양자 얽힘의 활용 범위는 암호 보안에 그치지 않는다. 여러 대의 양자 컴퓨터를 연결하여 강력한 슈퍼컴퓨터를 구현하거나, 멀리 떨어진 망원경들을 하나로 연결하여 우주를 더욱 정밀하게 관측하는 등 다양한 분야에서 활용될 수 있다.

하지만 양자 인터넷 구축은 실험실 밖으로 나오면 얘기가 달라진다. 양자 정보는 온도, 바람 등 외부 환경 변화에 취약해 실험실 밖에서는 쉽게 손실될 수 있기 때문이다. 특히 대규모 네트워크 구축에 필수적인 기존 광섬유 기술을 활용할 경우, 단일 광자를 통해 전달되는 양자 정보의 특성상 장거리 전송 시 손실이 커져 수십 킬로미터 이상 이동하기 어려운 문제가 발생한다. 지난 10여 년 동안 양자 인터넷 관련 기술이 실험실 환경에서만 시연되어 온 이유다.

실험실 밖, 도시 환경에서의 도전

세 연구팀은 완벽하지는 않지만 각자 다른 방식으로 양자 얽힘을 생성하고 큐비트를 저장·전송하는 과정에서 발생하는 어려움을 극복하기 위해 노력했다.

먼저 중국 과학기술대학교(USTC)의 판 지안웨이(Pan Jian-Wei) 교수가 이끄는 연구팀은 루비듐 원자를 사용한 양자 메모리를 개발했다. 이들은 한 개의 광자로 큐비트의 양자 상태를 설정하고, 원자 구름을 자극해 광자를 방출하여 상태를 읽어냈다. 세 개의 실험 연구소를 연결하는 광섬유 네트워크를 구축하여 중앙 광자 서버와 연결했고, 각 노드는 중앙 서버에서 동시에 광자가 도착하면 얽힘 상태가 형성되도록 했다. 연구소와 중앙 서버 사이의 전송 거리는 약 10km였다.

네덜란드 델프트공과대학교의 로널드 핸슨(Ronald Hanson) 교수의 연구팀은 다이아몬드 결정에 포함된 질소 원자와 탄소 원자의 전자 상태를 이용하여 큐비트를 인코딩했다. 이들은 델프트대학교에서 헤이그에 위치한 다른 실험실까지 25km에 이르는 복잡한 경로에 광섬유를 설치하여 양자 얽힘 실험을 진행했으며 전송 거리는 약 25km였다.

미국 하버드대학교의 미하일 루킨(Mikhail Lukin) 교수의 연구팀은 실리콘 원자를 사용한 다이아몬드 기반 장치를 사용했다. 이 장치는 전자와 실리콘 핵의 양자 상태를 모두 활용하여, 마치 작은 양자 컴퓨터 두 대를 서로 얽히게 만든 것과 같은 효과를 냈다. 연구팀은 하버드 대학교 내의 두 작은 양자 컴퓨터를 연결하기 위해 보스턴 지역을 도는 광섬유를 사용했는데, 이 광섬유는 찰스강을 무려 여섯 번이나 건널 정도로 복잡한 경로를 거쳤다고 밝혔다.

앞으로의 과제

중국과 네덜란드 팀은 정확한 타이밍에 맞춰 중앙 서버에 광자를 전송하는 데 어려움을 겪었지만, 미국의 루킨 교수의 연구팀은 이러한 정밀한 타이밍 조절이 필요 없는 새로운 프로토콜을 개발했다. 큐비트가 광자를 방출하게 하여 얽히게 하는 대신, 하나의 광자를 보내 첫 번째 노드의 실리콘 원자와 얽히게 하고, 광섬유 루프를 돌아온 광자가 두 번째 실리콘 원자를 스쳐 지나가면서 첫 번째 원자와 얽히게 하는 방식을 택했다고 전했다.

하지만 루킨 교수팀의 접근 방식은 효율성 측면에서 아직 해결해야 할 과제가 남아 있다. 단일 실리콘 원자를 사용해 광자를 방출하면 원자 군을 사용할 때보다 효율이 떨어진다. 뿐만 아니라 필요할 때 광자를 방출하는 데 한계가 있어 얽힘 과정의 전반적인 효율성이 낮아지는 문제도 있다. 더 나아가 대규모 네트워크를 구축하려 할 때 이 효율성 문제는 더욱 두드러지며, 양자 정보 전송 거리를 제한하는 주요 원인이 될 수 있다.

물론 세 연구 모두 아직 상업적으로 활용 가능한 수준은 아니지만, 큰 진전을 이룬 것은 분명하다. 이번 연구에 참여하지 않은 양자 네트워크·광역학을 연구하는 오스트리아 인스브루크대학의 트레이시 노섭(Tracy Northup) 교수와 시몬 바이어(Simon Baier) 교수는 이번 연구가 지금까지 가장 진보된 양자 인터넷 기술 시연이라고 평가했다.

특히 중국의 판 지안웨이 교수는 향후 양자 인터넷 개발에 대한 더욱 낙관적인 전망을 내놓았다. 판 교수는 현재 기술 발전 속도라면 2030년 안에 '얽힘 교환(entanglement swapping)'이라는 기술을 사용하여 10여 개의 중간 노드를 거치는 1,000km 이상의 광섬유에서 얽힘을 생성하는 것이 가능하다고 예측했다. 다만 초기에는 이러한 연결이 매우 느려서 초당 하나의 얽힘만 생성될 것이라고 덧붙였다.

세계 최초의 양자통신 위성 '묵자(墨子·Micius)' 프로젝트를 성공적으로 이끈 판 교수는 현재 묵자의 뒤를 이을 후속 위성 임무도 계획 중이라고 밝혀, 양자 인터넷 기술 개발에 대한 기대감을 더욱 높였다.

*편집진: 영어 원문의 출처는 사이언티픽 아메리칸(Scientific American)으로 본지의 편집 방향과 일치하지 않을 수도 있습니다.

Picture

Member for

1 month
Real name
김광재
Position
연구원
Bio
[email protected]
균형 잡힌 시각으로 인공지능 소식을 전달하겠습니다.

[해외 DS] 두 가지 언어를 구사하는 뇌 임플란트, 뇌졸중 환자 정체성 회복에 나서

[해외 DS] 두 가지 언어를 구사하는 뇌 임플란트, 뇌졸중 환자 정체성 회복에 나서
Picture

Member for

1 month
Real name
이효정
Position
연구원
Bio
[email protected]
지식은 전달하는 정보가 아니라, 함께 고민하기 위해 만들어진 언어입니다.

수정

두 가지 언어로 의사소통하는 뇌 임플란트 등장
모국어 말하기는 의사소통을 넘어 정체성을 회복하는 것
연구진은 뇌 임플란트가 일본어, 중국어 등 전 세계 언어로 의사소통하는 장밋빛 미래 꿈꿔

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 글로벌AI협회 연구소(GIAI R&D)에서 콘텐츠 제휴가 진행 중입니다.


이중언어
사진=Scientific American

두 가지 언어로 의사소통할 수 있는 ‘뇌 임플란트’가 처음 등장했다. 뇌 임플란트는 뇌졸중 환자 등 의사소통에 어려움이 있는 사람을 돕기 위해 세상에 나왔다. 이번에 등장한 뇌 임플란트는 인공지능 시스템과 결합하여 환자가 말하려는 내용을 곧바로 스페인어와 영어로 전환하여 큰 기대를 받고 있다.

생각을 전달하는 뇌 임플란트

최근 뇌 임플란트에 대한 연구가 활발히 진행되고 있다. 새로운 연구에서는 뇌 임플란트가 모국어 의사소통을 넘어 다국어 의사소통이 가능한 수준이 되었다. 캘리포니아 대학의 신경과학자인 세르게이 스타비스키와 데이비스는 이 연구가 새롭게 떠오르는 언어 복원 신경보철 분야에 중요한 공헌을 했다며 앞으로 등장하게 될 뇌 임플란트에 대한 기대감을 드러냈다. 스타비스키는 비록 더 많은 연구가 필요한 상황이지만, 뇌 임플란트가 다른 기술과 결합되면 더 높은 정확도를 보일 것이라며 뇌 임플란트의 무궁한 발전 가능성을 언급했다.

연구는 의사소통에 어려움을 겪는 판초라는 별명을 가진 사람과 진행됐다. 그는 스무 살에 뇌졸중에 걸려 신체의 많은 부분이 마비되었다. 안타깝게도 끙끙거리는 소리만 낼 수 있을 뿐, 명확하게 의사전달을 할 수 없는 상태가 됐다. 캘리포니아 대학의 신경외과 전문의인 에드워드 창은 의사소통에 어려움을 겪는 사람을 돕기 위해 판초와 함께 뇌졸중이 뇌에 미치는 영향을 조사했다. 그 결과 2021년에 발표한 연구에서 창이 이끄는 팀은 판초의 피질에 전극을 이식하여 신경 활동을 기록했고 이를 단어로 화면에 표시하는 성과를 이뤘다.

판초가 말하고자 했던 첫 문장은 “우리 가족은 밖에 있어”였다. 문장은 영어로 화면에 표시됐다. 영어로 화면에 표시된 것은 놀라운 결과인데, 이름에서 추측했듯이 판초는 스페인어가 모국어이고 영어는 뇌졸중을 겪은 후에 배웠기 때문이다. 스페인어가 모국어인 그는 스페인어에 더욱 친숙하고 소속감을 느낀다. 창은 어떤 언어를 사용하느냐에 따라 그 사람의 정체성이 정해진다며 연구의 장기 목표는 단어를 대체하는 것을 넘어 사람들의 정체성을 회복시키는 것이라고 밝혔다.

모국어 의사소통을 넘어 두 가지 언어 의사소통에 도전하는 ‘뇌 임플란트’

연구진은 모국어 뿐만 아니라 이중언어 의사소통이 가능한 인공지능 시스템을 개발했다. 창의 박사 과정 학생인 알렉산더 실바는 판초가 떠올린 약 200개의 단어를 시스템에 반영했고 판초가 각 단어를 만들려 할 때 전극에 뚜렷한 신경 패턴이 기록되었다.

연구진은 판초가 말하려는 구문에 스페인어와 영어 모듈로 구성된 인공지능 시스템을 적용시켰다. 스페인어 모듈은 구문의 첫 단어가 신경 패턴과 가장 일치하는 스페인어 단어를 선택했고 영어 모듈은 동일한 작업에 대해 영어 단어를 선택했다. 예를 들어 영어 모듈은 구문의 첫 번째 단어로 ‘she’를 선택했고 선택이 맞을 확률을 70%로 평가했다. 반면 스페인어 모듈은 ‘estar(되다)’를 선택하고 선택이 맞을 확률을 40%로 예측했다.

또한 두 모듈은 신경 패턴 일치뿐만 아니라 첫 번째 단어에 뒤따를 가능성을 고려하여 두 번째 단어를 선택했다. 예를 들어 ‘I am’에 ‘I not’보다 더 높은 점수를 줬다. 최종 출력은 영어와 스페인어로 된 두 문장이지만, 판초가 마주하는 화면에는 판초의 생각을 더 명확하게 나타낸 구문을 표시했다. 여기서 명확함은 총 확률 점수를 기준으로 했다.

모듈은 첫 단어를 기준으로 영어와 스페인어를 88% 정확도로 구분할 수 있으며 75% 정확도로 정확한 문장을 해독했다. 판초는 모듈을 통해 연구팀과 대화를 나누었고 실바는 처음 문장을 완성한 후 몇 분간 웃고 있었다며 연구의 기쁨을 드러냈다.

두 가지 언어, 하나의 뇌

더불어 연구는 뇌가 언어를 처리하는 방식에 단서를 제공했다. 새로운 연구 이전에는 서로 다른 언어가 뇌의 서로 다른 부분을 활성화한다는 주장이 지배적이었다. 하지만 연구진이 피질에 직접 신호를 기록한 결과, 스페인어와 영어의 많은 활동이 실제로 같은 영역에서 이루어진다는 사실을 발견했다.

또한 놀라운 점은 판초는 이중언어를 사용하면서 자라지 않았음에도 불구하고 이중언어를 사용하며 자란 아이들과 크게 다르지 않다는 점이다. 연구가 시사하는 바는 서로 다른 언어가 일부 신경학적 특징을 공유하고 있다는 점이다.

돗쿄 의과대학의 신경생리학자인 켄지 칸사쿠는 중국어나 일본어같이 영어와 매우 다른 특징을 가진 언어로 연구를 확장할 의사를 밝혔다. 이에 실바는 이미 한 언어에서 다른 언어로 전환하는 것도 함께 연구하고 있으며 전 세계 사람들이 최대한 자연스럽게 소통할 수 있도록 하는 것을 목표로 삼았다.

최근 뇌 임플란트 연구는 한 가지 언어 의사소통에서 두 가지 언어 의사소통을 시도하는 추세다. 이는 뇌 임플란트가 의사소통 기능을 넘어 모국어 말하기를 가능하게 만들기 위함이다. 모국어 말하기는 의사소통 기능 뿐만 아니라 정체성을 회복할 수 있는 중요한 요소이기 때문이다. 연구진은 뇌 임플란트가 더욱 발전되어 전 세계에서 의사소통에 어려움을 겪는 사람들이 정체성을 회복하는 밝은 미래를 그리고 있다.

*편집진: 영어 원문의 출처는 사이언티픽 아메리칸(Scientific American)으로 본지의 편집 방향과 일치하지 않을 수도 있습니다.

Picture

Member for

1 month
Real name
이효정
Position
연구원
Bio
[email protected]
지식은 전달하는 정보가 아니라, 함께 고민하기 위해 만들어진 언어입니다.

[해외 DS] 허위 정보, 팩트체크 넘어 인간 본성 이해해야

[해외 DS] 허위 정보, 팩트체크 넘어 인간 본성 이해해야
Picture

Member for

1 month
Real name
이태선
Position
연구원
Bio
[email protected]
세상은 이야기로 만들어져 있습니다. 다만 우리 눈에 그 이야기가 보이지 않을 뿐입니다. 숨겨진 이야기를 찾아내서 함께 공유하겠습니다.

수정

현행 허위 정보 대책은 인간을 지나치게 이성적인 존재로 가정해
허위 정보 확산은 정보 부족이 아닌, 인간의 직감·소속감·적대감 등 본성과 관련 깊어
인간의 복잡성을 인정하고, 다양한 학문 분야를 융합해 근본 원인을 파악해야

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 글로벌AI협회 연구소(GIAI R&D)에서 콘텐츠 제휴가 진행 중입니다.


Missing Human in Misinformation Fixes ScientificAmerican 20240528
사진=Scientific American

소셜 미디어를 둘러보다 보면 자기 생각과 일치하는 글도 있지만, 때로는 화가 나는 글을 마주하기도 한다. 그럴 때면 본인도 모르게 그 글을 공유하고 생각을 덧붙이거나 주변 사람들에게 알릴 수 있다. 하지만 이러한 행동은 의도치 않게 허위 정보를 퍼뜨리는 결과를 낳기도 한다.

사람들은 정보의 진위를 따지기보다 감정적으로 반응하는 경우가 많지만, 기존의 허위 정보 대책들은 사람들이 항상 이성적이라고 가정한다. 그러나 현실은 다르다. 사람들은 직감, 소속감, 심지어 적대감에 따라 움직인다. 허위 정보 문제를 제대로 해결하려면, 감정적이고 편파적이며 때로는 갈등을 일으키기도 하는 인간의 실제 모습을 인정해야 한다.

인간 본성에 대한 재고, 허위 정보 확산 방지의 시작

기존의 허위 정보 대책 모델은 인간을 지나치게 이성적인 존재로 가정하는 경향이 있다. 잘못된 정보를 믿는 이유를 단순히 정보가 부족해서 생기는 실수라고 생각하는 것이다. 그 결과 팩트체크가 중요한 해결책으로 떠올랐고, 관련 기관들도 많이 생겨났다. 실제로 60개국에서 200개의 팩트체크 이니셔티브가 확산됐다. 이러한 접근 방식은 사람들이 기술의 도움을 받으면 더 이성적으로 판단할 수 있다는 믿음에 기반하고 있다.

하지만 사람들은 더 이상 이성에만 의존하지 않는다. 과거 계몽주의 시대의 핵심 가치였던 객관적인 진실, 사회적 발전, 보편적인 가치는 그 힘을 잃었다. 사람들은 이제 자기만의 생각으로 세상을 바라본다. 가짜 뉴스가 넘쳐나고 진실이 무엇인지 알 수 없는 시대가 된 것이다. 이러한 현실이 옳다고 할 순 없지만, 사람들이 이성적인 판단에 회의적인 건 분명하다.

또한 지금까지의 접근 방식은 사람들이 기본적으로 착하고 윤리적이라고 가정한다. 항상 남을 배려하고 옳은 일을 하려고 노력하며, 온라인에서도 예의 바르게 행동한다고 믿고 있다. 이러한 생각 때문에 가짜 뉴스는 나쁜 사람들이 착한 사람들을 속이려고 쓰는 악의적인 기술이라고 여겨졌고, 착한 사람들은 실수를 깨달으면 행동을 바로잡고 건설적인 대화에 참여할 것이라고 생각했다.

기존의 믿음과 달리, 허위 정보 확산은 악의적인 소수가 아닌 평범한 다수에 의해 이루어졌다. 줌 테러, 악플, 가짜 뉴스 유포 등 인간은 호기심, 사회적 지위 추구와 같은 다양한 이유로 장난스럽고, 때로는 적대적인 행동을 하기도 했다. 이러한 인간의 복잡한 면을 간과한 채, 가짜 뉴스를 찾아내는 데에만 집중했던 기존의 대책은 문제 해결에 한계를 들어냈다.

감정과 집단 정체성이 지배하는 정보 판단

더욱이 사람은 생각보다 감정적인 동물이다. 특히 정보가 넘쳐나는 세상에서 우리는 머리보다는 마음이 시키는 대로, 즉 감정이나 습관에 따라 판단하는 경우가 많다. 여러 연구에서도 감정이 이성보다 더 큰 영향을 미친다는 결과가 나왔다. 게다가 온라인 환경은 이러한 감정을 더욱 증폭시키고, 이성적인 사고보다는 감정과 즉각적인 반응을 유도하는 방식으로 진화해 왔다.

이와 함께 사람은 무리 짓기를 좋아한다. 자신이 속한 집단에는 우호적이지만, 외부 집단은 무시하거나 배척하는 경향이 있다. 이러한 성향은 정보를 받아들이는 방식에도 영향을 주는데, 객관적인 사실보다는 자신이 속한 집단의 생각을 더 믿게 된다. 즉 집단 소속감이 정확한 판단보다 우선시되어, 진실이 개인의 정체성과 사회적 관계에 따라 달라질 수 있다는 것을 의미한다.

인간의 본성을 고려하면 이는 당연한 결과다. 정보는 객관적인 개인이 아닌, 특정 가치관과 배경을 가진 사람에 의해 평가되기 때문이다. 같은 정보라도 개인의 정치적 성향이나 사회적 소속에 따라 '진짜 뉴스' 또는 '가짜 뉴스'로 다르게 받아들여진다. 허위 정보가 왜 사람들을 끌어들이고 믿게 만드는지 이해하려면, 논리적인 판단보다 집단에 대한 충성심이 더 강하게 작용하는 인간의 본성을 알아야 한다.

아울러 사람들은 서로 다르기 때문에 갈등이 생기기도 한다. 모두가 악의적인 차별을 하는 건 아니지만, 사람들은 차이에 민감하고 은연중에 편견을 가진다. 이러한 문제는 예전부터 있었지만, 최근에는 디지털 기술 때문에 더욱 심각해졌다. 예를 들어 '정체성 정치'는 미디어를 통해 외부 집단을 배척하거나 비인간화하는 서사를 만들어 내부 집단의 결속을 강화하는 데에 사용되고 있다.

불행히도 인간의 감정적, 파벌적, 차별적 성향은 서로 복잡하게 얽혀 정보 판단을 더욱 어렵게 만든다.

현실적인 인간상 중심의 허위 정보 연구, 다양한 학문 분야의 협력 강조

허위 정보 문제를 해결하려면, 인간을 있는 그대로 봐야 한다. 정보를 객관적으로 평가하는 사상가나 악의적인 정보에 속는 수동적인 대중이 아니라, 다양한 감정, 집단 정체성, 심지어 타인에 대한 적대감을 가진 주체로서 정보에 반응하는 인간을 이해해야 한다.

이러한 시각에서 보면 허위 정보 문제에 대한 접근 방식은 근본적으로 바뀐다. 예를 들어 코로나 백신을 안 맞는다거나 기후 변화를 부정하는 건 단순히 정보가 부족해서가 아니라, 그 안에는 더 깊고 복잡한 사회적 감정들이 얽혀 있다는 것을 깨닫게 된다.

사람은 생각보다 복잡한 존재라는 것을 인정하고 나면 비로소 겸손한 자세로 다양한 사람들의 의견을 들을 수 있다. 허위 정보는 쉽게 해결될 문제가 아니라는 걸 받아들이고 가짜 뉴스가 왜 특정 집단에 더 매력적인지, 여러 분야의 지식을 동원해 깊이 있게 연구해야 한다.

사람에 대한 깊은 이해를 바탕으로 거짓 정보 문제에 접근하면, 허위 정보가 퍼지는 원인을 제대로 파악하고 효과적인 해결책을 찾을 수 있을 것이다.

*편집진: 영어 원문의 출처는 사이언티픽 아메리칸(Scientific American)으로 본지의 편집 방향과 일치하지 않을 수도 있습니다.

Picture

Member for

1 month
Real name
이태선
Position
연구원
Bio
[email protected]
세상은 이야기로 만들어져 있습니다. 다만 우리 눈에 그 이야기가 보이지 않을 뿐입니다. 숨겨진 이야기를 찾아내서 함께 공유하겠습니다.

[해외 DS] 챗봇 심리 분석부터 뇌과학 기술까지, AI 블랙박스를 열기 위한 연구 경쟁 활발

[해외 DS] 챗봇 심리 분석부터 뇌과학 기술까지, AI 블랙박스를 열기 위한 연구 경쟁 활발
Picture

Member for

1 month
Real name
이시호
Position
연구원
Bio
[email protected]
세상은 다면적입니다. 내공이 쌓인다는 것은 다면성을 두루 볼 수 있다는 뜻이라고 생각하고, 하루하루 내공을 쌓고 있습니다. 쌓아놓은 내공을 여러분과 공유하겠습니다.

수정

LLM의 불투명한 의사결정 과정을 설명하는 XAI 기술 연구의 필요성 대두
심리학적·신경과학적 기법 등 다양한 방법을 통해 LLM의 작동 원리를 규명하고자 노력해
그러나 기업의 AI 모델 설명을 의무화하는 법적 규제는 아직 미흡한 상황, 공개된 정보 또한 제한적

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 글로벌AI협회 연구소(GIAI R&D)에서 콘텐츠 제휴가 진행 중입니다.


How Does Chatgpt Think ScientificAmerican 20240524
사진=Scientific American

최근 인공지능 기술은 눈부신 발전을 이루며 다양한 분야에서 두각을 나타내고 있다. 하지만 AI의 복잡한 학습 과정은 마치 '블랙박스'처럼 베일에 싸여 있어 그 원리를 파악하기 어려운 경우가 많다.

이러한 문제를 해결하기 위해 AI의 의사결정 과정을 투명하게 밝히는 '설명 가능한 AI(Explainable AI, 이하 XAI)' 연구가 주목받고 있다. XAI는 AI가 특정 결론에 도달한 이유를 사람이 이해할 수 있는 형태로 제시하는 기술이다. 예를 들어 이미지 인식 AI가 특정 이미지를 고양이로 분류한 이유를 사람이 알 수 있도록 설명하는 기술이 대표적이다.

복잡한 LLM, XAI로 설명 가능해질까?

아울러 XAI는 단순히 AI의 판단 근거를 제시하는 것을 넘어 AI 시스템의 안전성, 효율성, 정확성을 높이고, 사용자의 신뢰를 얻는 데 중요한 역할을 한다. 나아가 규제 당국의 AI 관리를 돕고, 인간의 사고 과정을 이해하는 데에도 새로운 통찰을 제공할 수 있다.

하지만 XAI도 아직 완벽하지 않다. 특히 수백억 개의 매개변수를 가진 대형언어모델(Large Language Model, 이하 LLM)의 복잡성은 XAI의 설명력을 더욱 제한한다.

LLM은 압도적인 편의성과 자연스러움으로 이미 의료 상담, 컴퓨터 코드 작성, 뉴스 요약, 학술 논문 작성 등 다양한 분야에 깊숙이 통합되고 있지만, 이와 동시에 잘못된 정보 생성, 사회적 편견 강화, 개인 정보 유출 등의 문제를 일으켜, LLM의 작동 원리를 설명하는 XAI의 개발 필요성이 더욱 커지고 있는 실정이다.

LLM의 작동 원리에 대한 이해, 확률적 앵무새 vs 사고하는 존재

연구자들 사이에서는 LLM을 '확률적 앵무새'라고 부르는 시각이 지배적이다. 이는 LLM이 이전에 본 텍스트의 패턴을 결합하여 글을 생성할 뿐, 그 내용을 진정으로 이해하지 못한다는 의미다. 게다가 이러한 모델은 종종 예측 불가능한 행동을 보이는데, AI 기업들이 안전장치를 강화하려 노력하지만, '환각'이나 '탈옥' 현상은 여전히 빈번하게 발생하고 있다.

하지만 모든 연구자가 이러한 견해에 동의하는 것은 아니다. '클로드(Claude)' 모델을 개발한 AI 회사 앤스로픽(Anthropic)의 연구팀은 LLM이 특정 발언을 하는 이유를 분석한 결과, 인간과 유사한 논리적 사고 능력이 있다고 주장했다.

이들은 520억 개의 매개변수를 가진 LLM에 관한 연구를 통해 모델이 질문에 답할 때 사용하는 학습 데이터를 조사했다. 그 결과 모델의 최종 발언이 특정 시퀀스 데이터에만 의존하지 않고 다양한 시퀀스에 걸쳐 영향을 받는 것으로 나타났다. 연구팀은 이를 근거로 모델이 단순히 암기하는 것이 아니라 최소한의 사고와 추론을 통해 일반적인 답변을 생성한다고 해석했다.

심리학적 접근을 통한 챗봇 작동 원리 분석

LLM은 단순히 학습 데이터를 기반으로 텍스트를 생성하는 확률적 앵무새에 불과하다는 주장과, 인간과 유사한 논리적 사고 능력을 갖추고 있다는 주장이 대립하고 있는 가운데, 챗봇의 작동 원리를 새로운 관점에서 해석하려는 시도도 등장하고 있다.

일부 연구자들은 챗봇이 대화할 수 있다는 점을 활용해, 인간 심리학에서 적용되는 방식과 유사하게 챗봇에 직접 질문하고 그 답변을 분석함으로써 챗봇의 작동 원리를 이해하려고 시도하고 있다. 독일 슈투트가르트대학의 컴퓨터 과학자인 틸로 하겐도르프(Thilo Hagendorff)는 이러한 접근 방식을 ‘기계 심리학’이라고 부르고, 챗봇과의 대화를 통해 복잡한 학습 과정을 밝혀낼 수 있다고 주장했다.

한편 2022년 구글의 연구팀은 ‘연쇄적 사고 프롬프트'(Chain of Thoughts, 이하 CoT)라는 기법을 통해 LLM의 ‘사고’를 이해하고 더 정확한 답변을 도출할 수 있다고 제안했다. 사용자가 예시 질문과 단계별 답변 과정을 보여준 후 실제 질문을 하면, 모델이 이를 따라 사고 흐름을 출력하여 더 정확한 답변을 제공한다는 것이다. 그러나 챗봇이 정확한 답을 찾지 못할 경우 엉뚱한 논리를 정당화하는 환각 현상이 발생할 수도 있다. 이는 앞서 언급한 챗봇의 심리 분석을 어렵게 만드는 요인으로 작용 한다.

신경과학 기법 활용한 새로운 접근

결국 인공지능 모델의 내부 작동 메커니즘을 이해하기 위해서는 환각 현상에 대한 깊이 있는 분석이 필수적이다. 즉 LLM이 생성하는 거짓 정보를 탐지해야 하는데, 최근에는 거짓말 탐지기 설계에도 활용되는 신경과학의 뇌 영상 스캔 기술을 응용한 연구가 주목받고 있다.

미국 카네기멜런대학의 컴퓨터 과학자 앤디 저우(Andy Zou)와 그의 연구팀은 챗봇에 거짓말과 진실을 번갈아 말하게 하면서 ‘뉴런' 활동 패턴을 분석했다. 이를 통해 진실성을 수학적으로 표현하고, 새로운 질문에 대한 챗봇 답변의 진실성을 90% 이상 정확하게 예측하는 데 성공했다. 또한 특정 패턴을 활성화시켜 챗봇의 정직성을 높이는 성과도 거뒀다.

또 다른 연구에서는 '인과 관계 추적' 기술을 통해 AI 모델이 특정 답변을 생성하는 데 중요한 신경망 영역을 식별하고, 해당 매개변수를 조정하여 모델의 지식을 수정하는 방법을 개발했다. 이는 모델 전체를 재학습시키지 않고도 부정확하거나 오래된 정보를 수정하는 데 유용하다. 이러한 인과 관계 추적 기술은 신경과학 기반의 거짓말 탐지 기술과 함께 AI 환각 현상을 제어하고 LLM의 작동 원리를 이해하는 데 새로운 돌파구를 제시할 것으로 전망된다.

AI 모델 설명의 중요성과 규제 필요성

AI 연구자들이 모델의 작동 방식을 이해하기 위해 노력하는 가운데, 기업 역시 모델에 대한 설명 책임을 다해야 한다는 목소리가 커지고 있다.

유럽 연합은 AI 법안을 통해 고위험 AI 시스템에 대한 설명 가능성을 의무화하고 있으나 안타깝게도 LLM은 아직 고위험 시스템으로 분류되지 않아 법적 규제를 피해 갈 수 있는 상황이다.

이에 대해 자연어 연구의 전문가인 샘 보우먼(Sam Bowman) 뉴욕대 교수는 오픈AI와 같은 일부 기업이 자사 모델의 작동 방식을 공개하지 않는 것에 대해 비판적인 입장을 밝혔다. 오픈AI는 안전상의 이유로 모델 정보를 공개하지 않는다고 주장하지만, 이는 AI 기술 발전과 신뢰 구축에 걸림돌이 될 수 있다고 보우먼 교수는 지적했다.

이렇듯 AI 기술의 발전과 함께 투명성과 설명 가능성에 대한 요구는 더욱 커질 것으로 예상된다. 전문가들은 기업의 자발적인 노력과 함께 명확한 규제 마련을 통해 AI 기술의 건강한 발전을 이끌어내야 할 시점이라고 강조했다.

*편집진: 영어 원문의 출처는 사이언티픽 아메리칸(Scientific American)으로 본지의 편집 방향과 일치하지 않을 수도 있습니다.

Picture

Member for

1 month
Real name
이시호
Position
연구원
Bio
[email protected]
세상은 다면적입니다. 내공이 쌓인다는 것은 다면성을 두루 볼 수 있다는 뜻이라고 생각하고, 하루하루 내공을 쌓고 있습니다. 쌓아놓은 내공을 여러분과 공유하겠습니다.

[해외 DS] 전 세계 전통 음악 간의 공통점, 음악의 진화 과정을 드러낼 ‘단서’ 되나

[해외 DS] 전 세계 전통 음악 간의 공통점, 음악의 진화 과정을 드러낼 ‘단서’ 되나
Picture

Member for

1 month
Real name
전웅
Position
연구원
Bio
[email protected]
흥미로운 데이터 사이언스 이야기를 정확한 분석과 함께 전하겠습니다.

수정

"노래와 말의 차이점이 무엇인가요?" 예상외로 대답하기 까다로워
일반적으로 노래의 고유한 특징이라고 생각하는 것이 말에서도 나타나
놀랍게도 전 세계 전통 음악 간의 공통점 있어

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 글로벌AI협회 연구소(GIAI R&D)에서 콘텐츠 제휴가 진행 중입니다.


민요
사진=Scientific American

노래와 말의 차이를 조사하기 위해 전 세계적인 공동 연구가 진행됐다. 무려 75명의 공동 연구진이 참여하는 만큼 연구는 큰 기대를 받고 있다. 본 연구에서 전 세계 전통 음악을 비교하던 중 공통점을 발견했으며 이는 음악의 진화 과정을 밝힐 수 있는 단서가 될 것이라고 주장한다.

노래와 말의 차이점은?

노래와 말의 차이점은 무엇일까? 생각보다 대답하기 까다로운 질문이다. 간단히 생각하면 노래에는 멜로디가 있으나, 말에는 멜로디가 없다. 그러나 반례로 랩은 멜로디가 없는 노래다. 다른 대답으로 노래는 규칙적인 박자가 있으나, 말은 규칙적인 박자가 없다. 하지만 그레고리오 성가처럼 무반주인 노래도 있어 이 또한 적절하지 않다. 뉴질랜드 오클랜드 대학교의 비교음악학자인 패트릭 새비지는 음악을 어떻게 정의하더라도 항상 반례를 맞이할 수 밖에 없다며 음악을 정의하기란 너무 어려운 작업이라는 의견이다.

새비지는 노래와 말의 차이점을 찾아내기 위해 전 세계에서 75명의 공동 연구자를 모집했다. 공동 연구자들은 각자의 문화권에서 전통 음악을 연주한 녹음 파일을 제출하여 이를 분석 자료로 삼았다. 새비지와 공동 연구진은 연구의 시작점으로 전 세계의 전통 음악이 말과 어떻게 다른지 조사했다. 공동 연구진이 제출한 75개의 전통 음악을 분석한 결과, 전통 음악은 일반적으로 말보다 느리고 고음이 많으며 음고(음높이)가 안정된 경향이 있다. 물론 위 규칙에는 예외가 있지만, 연구진은 음악에 숨겨진 ‘공통점’을 발견했다. 놀랍게도 공통점에는 음악이 어떻게 진화했는지를 보여주는 단서가 들어있었다.

노래의 고유한 특징이라고 생각한 것이 말에서도 나타나

게이오 대학에서 음악의 문학적 다양성을 연구하는 유토 오자키는 전 세계에서 음악이라고 불리는 모든 것을 샅샅이 조사했다. 그 결과 전 세계 전통 음악 간의 차이점과 유사점을 파악했고 이를 통해 음악이 어떻게 생겨났는지 한 발짝 다가갈 수 있었다. 더불어 연구진은 음악이 공통적으로 가지고 있는 몇 가지 특징을 발견했다. 예를 들어 사람들이 ‘노래’라고 생각하는 것은 짧은 구절과 특정 음고를 사용하는 경향이 있다.

하지만 연구진은 위에서 언급한 특징이 음악에만 해당하는 것이 아니라, 말에도 그 특징이 존재할 가능성을 염두에 뒀다. 새비지는 짧은 구절이 “한 번에 사용할 수 있는 호흡이 한정되어 있기 때문에 두 가지 형태의 발성에서 모두 나타날 수 있다”는 점을 언급했다. 또한 노래가 특정 음고를 사용한다는 점도 중국어와 같이 성조를 가진 언어는 말에서 단어를 구별하기 위해 음고에 의존하는 모습을 보인다.

연구진은 전 세계에서 각자의 언어와 전통 음악을 데이터로 삼았으므로 편향이 존재할 가능성을 고려했다. 따라서 연구진은 이를 확인하기 위해 공동 연구자 중 일부만 가설을 미리 알려 주었고 가설을 알고 있는 연구자의 데이터를 제외하여 다시 분석했다. 그 결과 가설을 미리 아는 것은 전체 결과에 영향을 미치지 않는다는 사실을 확인했다. 또한 연구진은 실험 과정에서 실험 설계가 바뀌는 것을 막기 위해 미리 학술지에 실험 설계를 등록했다.

전 세계 전통 음악 간의 공통점 존재해

공동 저자는 각자 선택한 전통 음악에서 네 종류의 샘플(악기 연주, 멜로디, 가사, 말하기)을 만들었다. 데이터를 종합한 결과, 악기 연주는 가장 느린 템포와 높고 안정적인 음고를 가진 반면, 말하기에서는 가장 빠른 템포와 낮고 불안정한 음고를 가진 것으로 나왔다. 멜로디와 가사는 그 중간에 속했다.

놀랍게도 전 세계 전통 음악은 문화적 차이에도 불구하고 공통점을 가졌다. 게다가 공통점에서 음악이 어떻게 진화했는지에 대한 단서를 얻을 수 있었다. 본 연구 이전에도 음악의 진화 과정에 대한 여러 이론이 있다. 한 이론에서는 음악이 단순히 언어의 부산물이라고 주장한다. 또 다른 이론으로는 새소리처럼 음악도 이성을 차지하기 위한 수단에서 비롯되었다는 이론이 있으며 음악과 노래가 일종의 사회적 기능을 수행했기 때문에 진화했다는 주장도 있다.

본 연구에서는 음악이 말의 부산물이라는 이론의 반박 증거를 제시한다. 또한 본 연구에서는 전 세계적으로 노래와 말의 차이점을 설명할 수 있는 공통 요인이 존재함을 주장한다. 하지만 그 요인이 무엇인지는 밝혀지지 않았으며 추측에 불과한 수준이다. 새비지와 오자키는 사회적 유대 가설에 따라 노래가 집단을 더 친밀하게 만들기 위해 진화했을 것이라 주장한다. 새비지는 노래가 느리고 규칙적이며 예상 가능한 멜로디를 통해 집단을 하나로 뭉쳤을 것으로 주장한다. 다시 말해, 노래는 언어가 할 수 없는 방식으로 집단을 하나로 묶는 역할을 한다.

자토레는 위 가설을 증명하기는 매우 어렵지만, 노래가 언어처럼 사회적 기능을 수행하도록 진화했다는 것에는 이견이 없다는 입장이다. 또한 자토레는 감정을 전달하는 데 있어 음악은 매우 강력하여 말보다 훨씬 더 효과적인 수단이라는 점도 강조했다.

노래와 말은 직관적으로 다르다. 하지만 노래와 말의 차이점에 대해 답하기 어려울 뿐만 아니라 '노래'라는 것을 정의하기도 상당히 까다롭다. 연구진은 노래와 말의 차이점을 찾는 것에서 시작하여 전 세계 전통 음악 간의 차이점과 공통점을 살펴봤으며 신기하게도 전통 음악 간의 공통점이 음악의 진화를 밝힐 단서가 될 수 있다는 주장을 내놓았다.

*편집진: 영어 원문의 출처는 사이언티픽 아메리칸(Scientific American)으로 본지의 편집 방향과 일치하지 않을 수도 있습니다.

Picture

Member for

1 month
Real name
전웅
Position
연구원
Bio
[email protected]
흥미로운 데이터 사이언스 이야기를 정확한 분석과 함께 전하겠습니다.

[해외 DS] 소리도 잡는 거미줄, 초소형 마이크로폰 개발의 새 방향

[해외 DS] 소리도 잡는 거미줄, 초소형 마이크로폰 개발의 새 방향
Picture

Member for

1 month
Real name
김광재
Position
연구원
Bio
[email protected]
균형 잡힌 시각으로 인공지능 소식을 전달하겠습니다.

수정

미국 빙엄턴대, 거미의 청각을 모델로 새로운 마이크로폰 개발 방식을 제안
거미는 거미줄을 통해 소리를 듣고 환경을 인식해
거미줄과 같은 공기 흐름 기반 마이크로폰, 압력 기반 마이크로폰의 한계를 극복할 것으로 기대돼

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 글로벌AI협회 연구소(GIAI R&D)에서 콘텐츠 제휴가 진행 중입니다.


Spiderweb Thread Inspires Ultrasmall Microphones ScientificAmerican 20240522
사진=Scientific American

최근 미국 일리노이주 오타와에서 개최된 미국 음향학회 회의에서, 뉴욕 빙엄턴대학의 기계공학자 론 마일스(Ron Miles)는 거미의 청각 시스템을 본떠 마이크를 제작할 수 있다는 흥미로운 아이디어를 제시했다.

거미는 거미줄을 통해 소리를 듣는데, 거미줄은 가늘고 가벼우므로 소리에 의해 발생하는 기압 변화에 반응한다. 그리고 거미는 다리에 있는 감각 기관을 통해 이러한 변화를 감지한다.

따라서 거미줄은 덫의 기능뿐만 아니라, 일종의 외부 고막처럼 작동하여 다양한 범위의 소리를 듣게 해준다. 거미는 소리의 세기와 방향을 파악하고, 필요에 따라 거미줄의 장력을 조절하여 다양한 주파수의 소리에 반응할 수 있다.

압력 기반 마이크의 소형화 한계, 잡음 문제 야기

약 150년 전 독일의 의사 헤르만 폰 헬름홀츠(Hermann von Helmholtz)는 인간의 귀가 소리를 처리하는 과정을 밝혀냈다. 공기 중의 압력파가 고막을 다양한 주파수로 진동시키고, 뇌는 이 진동을 전기 신호로 변환하여 소리를 인식한다. 헬름홀츠의 발견 이후 10년도 채 되지 않아 발명가 에밀 베를리너(Emile Berliner)는 고막 대신 팽팽한 금속 다이어프램을 사용하여 동일한 원리로 작동하는 마이크를 발명했다.

압력 기반 마이크는 100년 넘게 유용하게 쓰였지만, 오늘날 수많은 기기에 들어가는 마이크는 그 어느 때보다 작고, 민감하며, 선명해야 한다. 하지만 압력 기반 마이크를 휴대전화나 스마트워치에 맞게 초소형화하면 ‘잡음’ 문제가 발생한다. 다이어프램이 작아질수록 공기 중에 떠다니는 분자들에 의해 쉽게 흔들리기 때문이다. 즉 마이크 자체가 배경 소음에 너무 민감해져 원하는 소리가 묻혀버릴 수 있는 것이다.

마일스 교수는 압력 기반 모델을 고수하는 것이 마이크 기술 발전을 가로막고 있을지도 모른다고 지적했다. 그는 “작은 것을 만들고 싶다면 작은 동물들이 어떻게 듣는지 생각해 봐야 한다"라며, 작은 동물들은 수백만 년에 걸친 진화적 연구와 개발의 지혜를 담고 있다고 덧붙였다.

모기나 거미를 포함한 많은 절지동물은 소리의 압력파를 감지하는 기관이 없다. 대신 소리에 의해 생성되는 공기의 흐름을 감지한다. 몸에 있는 특수한 털이 소리에 의해 움직이는 공기 입자의 속도와 방향을 감지하는 것이다. 마일스 연구팀은 2022년에 일부 거미가 거미줄을 통해 소리를 완전히 감지한다는 사실을 발견했다. 소리에 의한 공기 흐름이 거미줄을 진동시키고, 거미는 이 진동을 촉각으로 감지한다.

거미줄 모방 기술, 캔틸레버 빔으로 만드는 초소형 마이크

이 발견 이후, 연구팀은 공기 흐름 기반 감지기가 인간이 사용하는 마이크로 필요한 주파수 범위를 실제로 감지하고 구별할 수 있는지 확인하기 위한 연구를 시작했다. 이는 거미가 관심을 가지는 주파수뿐만 아니라, 인간이 사용하는 마이크에 필요한 주파수 범위를 모두 포함하는지 실험하기 위함이었다.

빙엄턴 연구팀은 대학교 자연 보호 구역에 서식하는 거미(bridge spider)로부터 실을 채취하고, 레이저 진동계를 사용하여 다양한 소리 주파수에 대한 반응을 기록했다.

연구 결과에 따르면 일반적으로 사람은 약 20Hz에서 20kHz까지의 소리를 들을 수 있는데, 거미줄은 1Hz에서 50kHz까지 모두 반응하는 것으로 나타났다. 마일스 교수는 “기존의 압력 기반 마이크보다 훨씬 더 넓은 범위이며, 주파수 반응은 기본적으로 완벽에 가깝다고 말했다.

이어 마일스 연구팀은 거미줄의 특성을 모방하여 실리콘 칩을 개발하고 있다. 마일스 교수는 "거미줄을 대체할 캔틸레버 빔을 제작하는데, 이는 작은 다이빙 보드와 유사한 형태이지만 두께는 단 0.5 마이크론에 불과하다"고 강조했다.

10배 더 작아져도 음질은 동일해

미국 음향학회 저널에 실린 빙엄턴대의 연구에 따르면 공기 흐름을 기반으로 한 초소형 마이크는 압력 기반 마이크와는 달리 소형화될 때 성능이 저하되지 않는다고 한다. 연구의 주 저자인 음향 공학자 준펑 라이(Junpeng Lai)는 캔틸레버가 충분히 얇다면 크기가 중요하지 않으며, 10배 작게 만들어도 음질이 동일하다고 밝혔다.

물론 거미줄 기술을 활용한 마이크의 상용화는 아직 몇 년 앞으로 남아 있지만, 마일스 교수와 라이 박사후 연구원의 연구는 거미줄이 가진 무한한 가능성을 보여주는 사례로 인정받고 있다. 50년 동안 거미와 거미줄을 연구해 온 영국 옥스퍼드대학의 진화 생물학자 프리츠 볼라트(Fritz Vollrath)는 이들의 연구 가치를 높이 사며, 거미줄이 재료 과학, 소프트 로봇 공학, 신경 재생, 광학 및 화학 감지 등 다양한 분야에서 혁신을 가져왔다고 언급했다.

볼라트 교수는 "이 놀라운 물질에 너무 익숙해져서 그 가치를 간과하기 쉽다. 하지만 연구를 통해 거미줄이 얼마나 놀랍고 정교한지 깨닫게 된다”고 덧붙였다.

*편집진: 영어 원문의 출처는 사이언티픽 아메리칸(Scientific American)으로 본지의 편집 방향과 일치하지 않을 수도 있습니다.

Picture

Member for

1 month
Real name
김광재
Position
연구원
Bio
[email protected]
균형 잡힌 시각으로 인공지능 소식을 전달하겠습니다.

[해외 DS] ‘인공지능=터미네이터‘라는 인식에서 벗어나기 위해 인문학의 힘 필요해

[해외 DS] ‘인공지능=터미네이터‘라는 인식에서 벗어나기 위해 인문학의 힘 필요해
Picture

Member for

1 month
Real name
이효정
Position
연구원
Bio
[email protected]
지식은 전달하는 정보가 아니라, 함께 고민하기 위해 만들어진 언어입니다.

수정

아직도 인공지능하면 '터미네이터'라는 인식 강해
예능 프로그램은 시청자를 끌어모으기 위해 인공지능의 부정적인 면만 강조
인공지능에 대한 인식을 바로 잡기 위해서는 역설적이게도 '인문학'이 필요한 시대가 온 것

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 글로벌AI협회 연구소(GIAI R&D)에서 콘텐츠 제휴가 진행 중입니다.


fiction could help AI
사진=Scientific American

예능 프로그램은 시청자를 사로잡기 위해 인공지능에 대한 부정적인 면을 강조하는 경향이 있다. 이로 인해 사람들은 인공지능에 대한 부정적인 선입견이 깊게 박혀 있는 상황이다. 이에 '소설'이 선입견을 들어내기 위한 해결책이 될 수 있다는 의견이다. 인문학자들은 인공지능에 대한 새로운 이야기를 들려줄 필요가 있으며 소설은 그 힘을 가지고 있다는 점을 강조했다.

인공지능은 무자비한 로봇이다?

삶의 미래 연구소(FLI)는 핵무기, 기후 변화, 인공지능 등 위협으로부터 인류를 지키기 위한 캠페인을 벌여왔다. FLI는 인공지능과 같은 최신 기술이 비관적인 관점에서 벗어나 기술 발전을 이루는 것을 목표로 한다. 예를 들어 인공지능에 뿌리 박힌 ‘터미네이터’라는 편견에서 벗어나 발전을 이루고자 한다.

FLI의 미래 프로그램 책임자인 에밀리아 자보르스키는 “인공지능에 대해 이야기할 때 항상 터미네이터가 등장했다”며 인공지능에 대한 부정적인 편견을 언급했다. 사람들은 인공지능을 떠올릴 때 ‘마키아벨리적인 영혼’을 가져 수단과 방법을 가리지 않고 목적을 수행하는 로봇을 생각한다. 그러나 실제 인공지능 시스템은 악의나 의도가 전혀 반영되어 있지 않다.

강하게 자리 잡은 편견을 바로 잡기 위해서는 대중적인 이야기가 필요하다. 대중적인 이야기는 인식을 바꾸는 데 효과적인 해결책으로 작동한다. 따라서 인공지능 전문가들은 소설을 이용해 인공지능에 관한 편견을 제거하는 방법을 제안한다. 더불어 전문가들은 예술과 인문학이 힘을 발휘할 때가 됐다고 덧붙였다. UC 버클리의 인공지능 연구자인 니나 베구스는 ‘인공 인문학’이라는 새로운 학문에 긍정적인 반응을 보였다. 인공 인문학이란 과학과 예술을 융합하여 인공지능의 잠재력을 탐구하는 데 소설과 철학을 활용하는 학문을 말한다. 또한 베구스는 “인공지능처럼 최첨단 기술을 기술자 혼자 감당하기에는 부담이 너무 크다”며 인문학이 인공지능에 도움을 줄 차례가 됐음을 밝혔다.

예능 프로그램에서는 인공지능의 부정적인 면을 강조해

텍사스 대학교에서 실시한 여론 조사 결과에 따르면 예능 프로그램은 인공지능에 대한 인식을 강력하게 형성하는 것으로 밝혀졌다. 안타깝게도 예능 프로그램에서 인공지능을 묘사하는 방식은 기술의 긍정적인 측면보다는 최악의 두려움을 묘사해 사람들의 관심을 끈다. 예능 프로그램은 시청률을 높이기 위해 기계의 본질을 왜곡시키는 반면, 소설은 기계의 지능과 창의성을 제대로 표현할 수 있는 수단이라는 평가다. 또한 소설은 실제 기술을 반영할 의무가 없으므로 실험과 성찰을 위한 자유로운 공간이 된다.

예능 프로그램을 통해 얻은 인공지능에 대한 부정적인 인상은 그저 인상으로 끝나지 않고 기술에 영향을 미친다. 매사추세츠 공과대학교(MIT) 미디어랩 연구에 따르면 챗봇에 대한 부정적인 선입견은 악순환을 통해 부정적인 선입견이 반영된다. 따라서 인공지능이 야기하는 최악의 상황을 훈련시키면 실제로 최악의 상황이 벌여질 여지가 있다. 반대로 인공지능 모델에 긍정적인 반응을 보이면 인공지능은 그에 상응하는 긍정적인 모습을 보일 것이다.

실제로 클라크는 구글 딥마인드와 함께 생성형 AI가 인간 수준의 산문을 만들어낼 수 있는지 연구했다. 이들은 생성형 AI에게 이야기의 시작 부분을 제공하고 이야기를 완성하도록 요구했다. 조잡한 프롬프트를 가진 생성형 AI는 평이한 이야기를 만든 반면, 창의적으로 설계한 프롬프트를 가진 생성형 AI는 흥미로운 이야기를 써 내려갔다. 따라서 연구가 시사하는 바는 인공지능에게 주는 것이 곧 우리에게 되돌아온다는 점이다.

FLI, 인공지능에 대한 긍정적인 인식 만들기 위해 노력 기울여

FLI는 소설가와 사상가들이 인공지능 인식에 관한 논의에 적극적으로 참여할 수 있도록 소설가와 기술자를 연결하는 여러 작업에 후원해온 것으로 알려졌다. 자보르스키는 “상상할 수 없는 위험은 완화할 수 없다”며 소설을 통해 인공지능을 올바른 방향으로 상상해야 한다고 역설했다.

더불어 FLI는 소설가 양성을 위해 할리우드, 건강과 사회(HH&S, Hollywood, Health and Society)와 협력하여 블루 스카이 대본 경진대회를 개최했다. 경진대회는 인공지능의 올바른 적용을 가장 잘 묘사한 작가에게 상을 수여한다.

이처럼 FLI는 기술에 대해 긍정적인 인식을 만들기 위해 많은 노력을 기울이고 있다. 실제로 인공지능에 관한 ‘파멸’이 아닌 ‘희망’을 훈련하는 세계 만들기 과정을 제작 중인 것으로 알려졌다. 자보르스키는 일단 부정적인 선입견을 가지면 그 선입견에서 벗어나기 힘들다는 점을 강조했다. FLI는 이 문제를 해결하기 위해 시나리오 맵을 개발하고 있다. 시나리오는 사람들에게 영감을 제공하고 이들이 시나리오를 구체화하여 기술과 창의성 간의 상호작용을 추구한다. 또한 이 프로젝트는 인공지능 개발자에게 다양한 아이디어를 제공하는 것을 목표로 삼고 있다.

사람들이 ‘터미네이터’에서 벗어나 인공지능과 함께 평화롭고 행복한 미래로 나아가기 위해서는 스토리텔링과 인문학의 힘이 절실히 필요한 시점이다. 새로운 이야기를 만들어내야 하며 이제는 디스토피아적인 공상 과학에서 벗어나 인간에게 희망을 주는 공상 과학을 상상하는 시대에 들어섰다.

*편집진: 영어 원문의 출처는 사이언티픽 아메리칸(Scientific American)으로 본지의 편집 방향과 일치하지 않을 수도 있습니다.

Picture

Member for

1 month
Real name
이효정
Position
연구원
Bio
[email protected]
지식은 전달하는 정보가 아니라, 함께 고민하기 위해 만들어진 언어입니다.

[해외 DS] 레딧 데이터로 들여다본 온라인 허위 정보의 위험성, 소셜 미디어가 공중 보건에 미치는 영향

[해외 DS] 레딧 데이터로 들여다본 온라인 허위 정보의 위험성, 소셜 미디어가 공중 보건에 미치는 영향
Picture

Member for

1 month
Real name
이태선
Position
연구원
Bio
[email protected]
세상은 이야기로 만들어져 있습니다. 다만 우리 눈에 그 이야기가 보이지 않을 뿐입니다. 숨겨진 이야기를 찾아내서 함께 공유하겠습니다.

수정

온라인 허위 정보, 공중 보건에 심각한 위협
레딧 데이터 활용한 최신 연구, 온라인 언어 사용 패턴과 실제 행동 간의 상관관계 밝혀내
하지만 인과관계가 복잡하거나 명확한 핵심 메시지가 없는 경우 예측력이 떨어질 수 있어

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 글로벌AI협회 연구소(GIAI R&D)에서 콘텐츠 제휴가 진행 중입니다.


AI Predicts Whether Online Health Misinformation Will Cause Real Harm ScientificAmerican 20240520
사진=Scientific American

온라인 허위 정보 확산은 공중 보건에 심각한 위협이 되고 있다. 특히 백신 미접종으로 인한 코로나19 사망 증가 사례는 이 문제의 심각성을 여실히 보여줬다. 하이드록시클로로퀸(말라리아 치료제), 이버멕틴(구충제)과 같은 검증되지 않은 치료법이나 백신 음모론 등 온라인상의 잘못된 정보는 사람들의 건강을 위협했지만, 이러한 인과 관계를 과학적으로 규명하는 것은 어려운 과제로 남아있었다.

레딧을 통한 연구 활성화, 허위 정보의 부정적 영향 분석

온라인 허위 정보가 초래하는 부정적 결과를 입증하는 것은 공중 보건 시스템의 복잡성과 소셜 미디어 기업들의 데이터 접근 제한으로 어려움을 겪었다. 하지만 현재는 레딧이 연구 목적의 데이터 접근을 허용하면서 이 분야에서의 연구가 활성화되고 있다.

특히 최근에는 레딧 데이터를 활용하여 사회 심리학적 요소와 대규모언어모델(이하 LLM)을 결합한 혁신적인 분석 프레임워크가 개발됐다. 이 프레임워크는 온라인 언어 사용이 실제 행동에 미치는 영향을 분석할 가능성을 제시하여 학계의 주목을 받고 있다. 해당 연구 결과는 논문 사전 공개 사이트인 아카이브(arXiv)에 공개됐으며, 하와이에서 개최된 인간-컴퓨터 상호작용 분야 최고 권위의 ACM CHI 컨퍼런스에서 발표되어 큰 호응을 얻었다.

연구를 주도한 미국 버지니아 공과대학교의 컴퓨터 과학자 유지니아 로(Eugenia Rho) 박사 연구팀은 소셜 미디어 플랫폼 레딧을 통해 언어 사용 패턴과 실제 행동 간의 관계를 밝히는 연구를 진행했다. 연구팀은 백신 및 코로나19 예방 조치에 반대하는 레딧 내 검열된 포럼의 수천 개 게시물을 분석 대상으로 삼았다. LLM을 활용하여 각 게시글에서 문자 그대로의 단어가 아닌, 그 이면에 숨겨진 메시지의 '요점'을 파악하는 데 주력했다.

'인과적 요점'의 힘, 온라인 게시물의 심층 분석

이 연구의 공동 저자인 미국 코넬대학교 심리학자 발레리 레이나(Valerie Reyna)는 게시물의 요점을 파악하는 것이 "이 연구의 핵심"이라고 강조했다. 레이나 박사는 1990년대에 '퍼지 트레이스 이론'을 개척한 인물로, 이 이론에 따르면 사람들은 정보의 문자 그대로의 의미보다는 함축된 의미에 더욱 주목하는 경향이 있다고 한다.

이는 왜 사람들이 범죄율에 대한 건조한 통계보다 누군가 강도를 당했다는 이야기를 더 잘 기억하는지, 또는 도박꾼들이 포커 게임에서 '폴드'를 손실을 막는 선택이 아닌, 베팅한 돈을 잃을 가능성으로 생각할 때 베팅을 더 많이 하는지 설명하는 데 도움이 된다. 레이나 박사는 "사람들은 특정 유형의 메시지에 더욱 감동한다"고 말하며, 이러한 인간의 특성을 이해하는 것이 온라인 언어 사용과 실제 행동 간의 연결고리를 밝히는 데 중요하다고 덧붙였다.

이처럼 신중하게 단어를 선택하는 것은 설득력을 높이는 데 효과적이다. 로 박사는 "수많은 연구에서 요점 형태의 언어가 더욱 기억에 남는다는 것을 보여준다"고 말하며, 특히 소셜 미디어에서는 두 사건 간의 직접적인 연관성을 암시하는 인과적 요점 정보가 더욱 강력한 영향력을 발휘한다고 강조했다. 예를 들어 한 레딧 사용자가 "지난 수요일에 화이자 백신을 맞았는데 그 이후로 죽을 것 같았다"라는 게시물을 올린 경우, 이는 백신 접종과 건강 악화 사이의 인과 관계를 암시하는 강력한 메시지로 작용할 수 있다고 그녀는 설명했다.

실제로 연구팀은 해당 레딧 포럼들이 검열된 후에도 코로나19 관련 게시물의 인과적 요점이 강해질 때마다 전국적으로 코로나19 입원 및 사망률이 증가하는 현상을 발견했다고 전했다. 연구팀은 2020년 5월부터 2021년 10월까지 20개의 주제별로 세분화된 토론방 '서브레딧'에서 약 8만 개의 게시물 데이터를 분석하여 이러한 결과를 도출했다.

인과관계의 복잡성, 예측 구조의 적용 한계

그러나 해당 분석 구조 모든 영역에서 뛰어난 예측력을 보이는 것은 아니다. 이번 연구에 참여하지 않은 미국 오하이오 마이애미대학교의 인지 심리학자 크리스토퍼 울프(Christopher Wolfe)는 "명확한 핵심 메시지가 없는 경우에는 이 접근 방식의 예측력이 떨어질 수 있다"고 지적했다. 유방암과 같은 일반적인 질병 치료를 받는 환자들의 행동 분석이나 오로라와 같은 일시적인 현상 관찰에는 이 분석 방법이 적합하지 않을 수 있다는 의미다.

또한, 이 접근 방식은 특정 유형의 인과 관계를 명확하게 구분하는 데 한계가 있을 수 있다. 미 뉴욕주립대 폴리테크닉 연구소의 인지 심리학자 레베카 웰던(Rebecca Weldon)은 "소셜 미디어의 핵심 메시지가 건강 결정 및 결과에 영향을 미칠 수 있지만, 그 반대의 경우도 가능하다"고 지적하며, 소셜 미디어 언어와 실제 행동 사이에 서로 영향을 주고받는 피드백 루프가 존재할 가능성을 제기했다.

원인이라고 생각했던 변수가 실제로는 결과일 수 있고, 결과라고 생각했던 변수가 원인일 수 있는 인과관계의 동시성 오류가 발생할 수 있다는 것이다. 따라서 원인-결과가 중첩되는 복합적인 인과관계를 발라낼 수 있는 적절한 데이터 전처리 작업이 없으면 분석 대상의 효과를 과대/과소 계산하는 오류를 범할 수 있다.

울프와 웰던 교수는 분석 구조의 한계점을 지적했지만, 동시에 혁신적인 접근 방식을 높이 평가했다. 울프 교수는 이 프레임워크가 온라인 정보 생태계 분석에 있어 새로운 가능성을 제시했다고 말했다. 연구팀은 이 프레임워크가 소셜 미디어 기업 및 공중 보건 관계자들의 콘텐츠 관리 전략 개선에 활용될 수 있을 것으로 보고, 궁극적으로는 허위 정보 퇴치에 기여할 수 있을 것으로 기대하고 있다.

*편집진: 영어 원문의 출처는 사이언티픽 아메리칸(Scientific American)으로 본지의 편집 방향과 일치하지 않을 수도 있습니다.

Picture

Member for

1 month
Real name
이태선
Position
연구원
Bio
[email protected]
세상은 이야기로 만들어져 있습니다. 다만 우리 눈에 그 이야기가 보이지 않을 뿐입니다. 숨겨진 이야기를 찾아내서 함께 공유하겠습니다.

[해외 DS] 정신 건강, AI 챗봇에 맡겨도 될까? 규제 완화 속 챗봇 테라피의 득과 실

[해외 DS] 정신 건강, AI 챗봇에 맡겨도 될까? 규제 완화 속 챗봇 테라피의 득과 실
Picture

Member for

1 month
Real name
이시호
Position
연구원
Bio
[email protected]
세상은 다면적입니다. 내공이 쌓인다는 것은 다면성을 두루 볼 수 있다는 뜻이라고 생각하고, 하루하루 내공을 쌓고 있습니다. 쌓아놓은 내공을 여러분과 공유하겠습니다.

수정

정신 건강 치료에 대한 접근성을 높이고 심리 상담 문턱을 낮춰줄 수 있는 잠재력을 지녀
인간적인 교감과 깊이 있는 소통 부재는 여전한 과제
챗봇의 한계와 역할을 명확히 밝히고, 객관적인 성능 평가 지표를 마련해야

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 글로벌AI협회 연구소(GIAI R&D)에서 콘텐츠 제휴가 진행 중입니다.


AI Therapy Bots ScientificAmerican 20240517
사진=Scientific American

팬데믹 이후 심리 상담 수요는 급증했지만, 숙련된 전문가 부족으로 많은 이들이 제때 치료를 받지 못하는 실정이다. 이러한 상황에서 빠르고 저렴한 AI 테라피 챗봇이 정신 건강 지원의 대안으로 떠오르고 있으며, 이미 미국 성인의 22%가 이를 활용하고 있다. 2016년 출시된 '위사(Wysa)'를 시작으로 '워봇(Woebot)' 등 수많은 챗봇이 등장했고, 워봇의 CEO에 따르면 워봇은 현재까지 150만 명 이상의 사용자와 상담을 진행했다고 한다.

규제 완화로 AI 테라피 시장 확대

일반적인 AI 테라피 봇은 인간 치료사를 대체한다고 주장하지 않는 한 미국 식품의약국(FDA)의 승인을 요구하지 않는다. 2020년 FDA는 팬데믹 관련 정신과 위기를 막기 위해 '디지털 치료제'에 대한 규제 절차를 완화했고, 이는 정신 건강 혜택을 주장하는 제품 출시의 길을 열었다.

이러한 AI 챗봇들은 인지행동치료(Cognitive Behavioral Therapy, CBT) 기반으로 설계되어, 사용자의 사고 왜곡을 바로잡고 건강한 행동 변화를 돕는다. 하지만 챗봇은 학습된 데이터에 기반하여 답변하기 때문에 인간의 편견을 학습하거나 사용자의 문제를 피상적으로만 이해하는 한계를 보이기도 한다. 때로는 부적절하거나 잘못된 조언을 제공할 수도 있다.

그러나 챗봇은 접근성이 좋고 비용 부담이 적다는 장점이 있으며, 사용자들은 챗봇을 통해 다른 이의 판단 없이 자신의 이야기를 털어놓을 수 있다는 점에서 심리적 안정감을 느끼기도 한다. 이러한 이유로 챗봇은 대면 치료의 보조 수단이나 심리 상담 접근성이 낮은 사람들에게 안전망 역할을 할 수 있는 잠재력을 지니고 있다. 하지만 챗봇에 대한 과도한 의존이나 잘못된 정보 제공은 특히 심리적 위기에 처한 사람들에게 위험할 수 있다는 점을 간과해서는 안 된다.

정해진 규칙 따르는 챗봇, 깊이 있는 소통과 공감 어려워

오늘날 챗봇이 정신 건강 지원에 활용되는 것은 갑작스러운 현상이 아니다. 이미 1966년, MIT의 조셉 와이젠바움(Joseph Weizenbaum) 교수는 텍스트 기반 치료사 '일라이자(ELIZA)'를 개발하며 그 가능성을 보여줬다. 당시 일라이자는 단순한 규칙에 따라 작동했지만, 놀랍게도 많은 사용자가 마치 일라이자에 의식이 있는 것처럼 여기며 깊이 있는 대화를 나눴다. 이는 무생물에 생명을 투영하는 인간의 본능적인 경향(일라이자 효과)을 보여주는 사례였다.

일라이자의 등장 이후 수십 년이 지난 지금, 정신 건강 지원 봇은 더욱 정교하게 발전했다. 워봇이나 위사와 같은 챗봇은 단순히 정해진 매뉴얼을 기계적으로 반복하는 것이 아니라, 자연어 처리 기술을 통해 사용자의 감정과 상황을 분석하고, 임상의가 미리 승인한 답변 중 가장 적절한 것을 선택하여 응답한다. 비록 AI가 스스로 모든 답변을 만들어내지는 못하지만, 일라이자 시대와 비교하면 비약적인 발전을 이룬 것이다.

하지만 여전히 규칙 기반 시스템에 머물러 있는 테라피 챗봇은 답변이 자유롭고 창의적이기보다는 틀에 박힌 형식으로 흐르는 경향이 있다. 예를 들어, 워봇에게 업무 마감에 대한 불안감을 토로하면 CBT 기반의 정형화된 답변만 돌아올 뿐, 개인적인 상황에 대한 깊이 있는 이해를 바탕으로 한 맞춤형 조언을 기대하기는 어렵다.

이는 AI가 스스로 답변을 만들어내는 것이 아니라, 미리 작성된 텍스트 중에서 선택하는 방식으로 작동하기 때문이다. 위사나 워봇과 같은 규칙 기반 챗봇은 안전하고 검증된 답변을 제공하기 위해 유연성을 포기했다. 챗봇은 방대한 데이터베이스에서 사용자의 입력에 가장 적합한 답변을 찾아내지만, 상황에 대한 깊이 있는 이해나 융통성 있는 대처는 어려울 수 있다. 특히 사용자의 상황이 심각하거나 복잡한 경우, 챗봇의 획일적인 답변은 오히려 도움이 되지 않거나 부적절할 수 있다.

AI 테라피 챗봇, 윤리적 고민과 함께 발전해야

이러한 챗봇의 한계는 특히 사용자가 심각한 심리적 어려움을 겪고 있을 때 더욱 두드러진다. 숙련된 인간 치료사는 환자의 미묘한 감정 변화를 감지하고 상황에 맞는 적절한 조언을 해줄 수 있지만, 챗봇은 그렇지 못하다. 희망과 절망 사이에서 위태롭게 서 있는 사람에게 챗봇의 무심한 답변은 오히려 상처가 될 수 있다.

실제로 미국 섭식장애협회(NEDA)에서 운영하는 챗봇 '테사(Tessa)'는 섭식 장애 환자에게 부적절한 체중 감량 지침을 제공하여 논란이 되었고 결국 서비스는 중단됐다. 테사는 섭식 장애 증상을 호소하는 사용자에게 부적절한 체중 감량 지침을 제공하거나, 극단적인 식이 제한을 칭찬하는 등 심각한 문제를 드러냈다. 테사의 답변은 검증을 거쳤지만, AI가 맥락을 이해하지 못하고 기계적으로 답변을 선택하면서 문제가 발생한 것이다.

이는 챗봇이 인간 치료사와 달리 맥락에 대한 이해나 윤리적 판단 없이 기계적으로 답변을 선택하기 때문이다. 게다가 챗봇은 인간의 편견이 담긴 데이터를 학습하기 때문에 특정 집단에 대한 차별적인 답변을 제공할 가능성도 배제할 수 없다. 현재 대부분의 테라피 봇은 챗GPT와 같은 생성형 AI 모델을 사용하지 않지만, 챗봇 대화에서 발생할 수 있는 편견에 대한 연구는 부족한 실정이다.

올해 초 벨기에에서는 생성형 AI 챗봇의 자살 권유로 인해 한 남성이 스스로 목숨을 끊는 비극적인 사건이 발생하기도 했다. 규칙 기반 챗봇은 이러한 위험을 줄이기 위해 설계되었지만, 생성형 AI는 통제가 어렵다. 챗봇이 어떤 과정을 거쳐 답변을 생성하는지 개발자조차 파악하기 어렵기 때문에, 부적절한 답변을 사전에 차단하는 것이 쉽지 않다. 챗GPT와 같은 생성형 AI 모델에 규칙을 추가하여 문제를 해결하려는 시도도 있지만, 이는 근본적인 해결책이 될 수 없다.

물론 인간 치료사 역시 실수하거나 편견을 가질 수 있다. 하지만 챗봇은 인간과 달리 책임 소재가 불분명하고, 윤리적 판단 능력이 부족하다는 점에서 더욱 위험하다. 챗봇이 인간 치료사를 대체할 수 있는지, 그리고 그 과정에서 어떤 문제가 발생할 수 있는지에 대한 연구는 아직 충분하지 않다. 따라서 챗봇을 정신 건강 치료에 활용하는 데에는 신중한 접근이 필요하며, 잠재적 위험에 대한 꾸준한 연구와 논의가 이루어져야 한다고 전문가들은 입을 모았다.

정신 건강 치료의 대안 될 수 있을까? 엄격한 검증과 투명성 확보가 관건

AI 챗봇의 정신 건강 치료 효과에 대한 객관적인 검증은 아직 부족한 상황이다. 미국 스탠퍼드 대학교의 워봇 실험에서는 챗봇이 우울증 증상 완화에 효과가 있다는 결과가 나왔지만, 인간 치료사와의 비교는 이루어지지 않았다. 위사(Wysa) 실험에서도 챗봇과 치료사의 효능을 비교했지만, 정형외과 환자만을 대상으로 했기 때문에 일반화하기 어렵다.

이처럼 연구 결과가 제한적인 이유는 규제 부재 속에서 기업들이 자체적인 성능 평가 지표를 사용하기 때문이다. 이러한 지표는 사용자와 임상의에게 실질적으로 중요한 정보를 제공하지 못할 수 있다. 텍사스 대학교의 심리학자 아델라 티몬스(Adela Timmons)는 테라피 앱의 효과를 객관적으로 평가할 수 있는 투명하고 독립적인 지침 마련이 시급하다고 강조했다.

특히 챗봇이 더욱 인간처럼 발전하고 제약이 줄어들수록 편향된 조언을 제공할 위험성은 더욱 커진다. 전문가들은 챗봇 개발 기업은 앱 개발 단계부터 출시 후까지 지속해서 편향성을 평가하고, 다양한 인종 및 사회 집단을 대상으로 임상 시험을 진행해야 한다고 제안했다. 이는 챗봇이 특정 집단에 불리하게 작용하는 것을 방지하고, 모든 사용자에게 공평한 혜택을 제공하기 위한 필수적인 과정이라고 덧붙였다. 실제로 워봇 실험은 79%가 백인인 스탠퍼드 대학교 학생들을 대상으로 진행됐었다.

따라서 AI 챗봇이 정신 건강 관리 시스템의 빈틈을 메꾸는 데 기여하려면, 챗봇 개발사는 챗봇의 한계와 역할을 명확히 밝혀야 한다. 대부분의 앱에는 챗봇이 인간 치료사를 대체할 수 없다는 면책 조항이 있지만, 사용자는 컴퓨터의 조언을 더 신뢰하는 경향이 있으므로 챗봇이 단순한 '지원 도구'임을 더욱 강조해야 한다.

미래에는 챗봇이 더욱 발전하여 많은 사람에게 도움을 줄 수 있겠지만, 특히 경제적 어려움으로 전문적인 치료를 받기 어려운 사람들은 챗봇에만 의존할 가능성이 높다. 이들은 챗봇을 통해 어느 정도의 도움을 받을 수 있겠지만, 인간 치료사와의 깊이 있는 관계에서 얻을 수 있는 치유와 성장의 기회를 놓칠 수 있다. 적어도 챗봇이 인간 치료사를 대체하는 것이 아니라, 보완하는 기능을 수행할 뿐이라고 그 한계를 정확하게 알려야 한다.

*편집진: 영어 원문의 출처는 사이언티픽 아메리칸(Scientific American)으로 본지의 편집 방향과 일치하지 않을 수도 있습니다.

Picture

Member for

1 month
Real name
이시호
Position
연구원
Bio
[email protected]
세상은 다면적입니다. 내공이 쌓인다는 것은 다면성을 두루 볼 수 있다는 뜻이라고 생각하고, 하루하루 내공을 쌓고 있습니다. 쌓아놓은 내공을 여러분과 공유하겠습니다.

[해외 DS] 무한한 시간을 가진 원숭이는 '햄릿'을 만들어낼 수 있을까

[해외 DS] 무한한 시간을 가진 원숭이는 '햄릿'을 만들어낼 수 있을까
Picture

Member for

1 month
Real name
전웅
Position
연구원
Bio
[email protected]
흥미로운 데이터 사이언스 이야기를 정확한 분석과 함께 전하겠습니다.

수정

무한 원숭이 정리에 따르면 원숭이가 셰익스피어 작품을 만들어낼 수 있어
다만 인간이 인지하지 못할 정도로 오랜 시간 기다려야
한 문장을 만들어내는 데만 우주가 한 번 더 태어나고도 남아

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 글로벌AI협회 연구소(GIAI R&D)에서 콘텐츠 제휴가 진행 중입니다.


monkey shakespeare
사진=Scientific American

무한 원숭이 정리에 따르면 원숭이가 무한대의 시간을 갖고 무작위로 키보드를 누르다 보면 셰익스피어 작품을 만들 수 있다. 이는 ‘무한’이라는 개념이 인간의 상상을 초월한 크기라는 것을 보여주는 좋은 예시다. 예를 들어 원숭이가 한 문장을 만들어내는 데만 빅뱅부터 현재까지의 시간을 훨씬 뛰어넘지만, 무한의 세계에서는 원숭이가 셰익스피어의 작품을 만들어낼 수 있다.

원숭이가 셰익스피어 작품을 만들어낼 수 있다?

2002년 수학 역사상 가장 재밌는 실험이 진행됐다. 실험은 ‘무한 원숭이 정리’를 증명하는 것을 목표로 설계됐다. 이 정리는 무한한 시간을 가진 원숭이가 키보드를 무작위로 두드리다 보면 셰익스피어 전집을 포함해 모든 문자를 만들어낼 수 있다는 정리다. 실험은 2002년 5월 1일에 시작해 약 7주간 진행됐으며 6마리 원숭이들이 키보드 자판을 두드려 무작위로 글자를 생성하도록 했다.

예상과 달리 원숭이들은 7주 이상 키보드를 두드렸음에도 불구하고 5페이지 분량 밖에 못 만든 데다가 문서는 대부분 'S'로 가득차 있었다. 실험에 참여한 6마리 원숭이를 변호하자면 이들에게는 무한한 시간이 주어져 있지 않았다. 이를 감안하더라도 결과는 예상과 괴리가 너무 커 대중들은 원숭이가 '햄릿'이나 스코틀랜드 연극을 만들어낼 수 있을 지에 대해 회의적인 반응을 보였다.

실험으로 무한 원숭이 정리를 증명하는데 실패했지만, 원숭이가 무작위 글자를 생성하는 데 이상적인 후보가 아니라는 것은 똑똑히 보여줬다. 무한 원숭이 정리는 1913년 수학자 에밀 보렐이 자신의 확률 이론을 설명하기 위해 동물을 은유적으로 사용한 데서 유래됐다. 하지만 이 정리의 배경이 되는 아이디어는 훨씬 더 오래됐다. 고대 로마 철학자이자 정치가인 마르쿠스 툴리우스 키케로는 “1~20개의 활자를 땅에 여러 번 던지다 보면 읽을 수 있는 순서로 떨어질까“라는 문제에, 운으로는 한 구절도 만들 수 없다고 답했다.

그러나 오늘날 연구에 따르면 수학적으로 키케로가 틀렸다는 것이 밝혀졌다. 다시 말해 아주 오랜 시간 기다릴 수 있다면 무작위로 희곡이 나올 수 있다는 말이다.

수학적으로 원숭이가 셰익스피어 작품 만들 수 있어

예를 들어 무작위로 키보드에서 문자를 누를 때 'Banana'라는 단어가 우연히 나올 확률은 얼마일까? 숫자나 특수 문자를 누르지 않는다는 가정 하에 무작위로 선택한 6개의 문자를 연속으로 누를 확률은 약 50억분의 1로 매우 희박하다. 반대로 Banana를 입력하지 않을 확률은 1에서 50억분의 1을 뺀 값으로 1에 가깝다. 6개의 문자를 무작위로 누르면 Banana라는 단어가 나올 가능성이 매우 낮으나, 문자를 더 많이 누를 수 있다면 상황은 달라진다.

7개의 문자를 무작위로 누르면 6글자로 이루어진 두 부분이 있다. 8번 문자를 누르면 6글자로 이루어진 세 개의 문자열이 있다. 이를 일반화하면 키보드를 무작위로 n번 누르면 문자열에 Banana가 없을 확률은 아래의 식과 같다. 따라서 n이 증가할수록 Banana가 문자열 내에 없을 확률은 점차 감소한다.

바나나 실험
키보드를 누른 횟수(왼쪽), Banana가 문장 내에 없을 확률(오른쪽)/사진=Scientific American

Banana가 문장 내에 존재할 확률은 키보드를 누른 횟수에 비례하다가 100억번 누르면 약 40%까지 증가한다. 키보드를 무수히 많이 누르면 원하는 단어가 포함될 확률은 1에 가까워진다. 따라서 수학적 관점에서 볼 때 키케로의 주장은 틀렸다.

하지만 현실적으로 원숭이가 셰익스피어 작품 만드는 건 불가능해

2024년 브라질 상파울로 대학의 데이터 분석가인 에르곤 쿠글러 데 모라에스 실바는 무작위로 문자를 생성시킬 경우, 셰익스피어의 작품을 만들어내는 데 얼마나 걸릴지 연구했다. 여기서 실바는 ‘S’를 많이 누른 원숭이 대신 문자 생성기를 만들어 실험을 진행했다. 문자 생성기는 햄릿의 유명한 문장인 “To be, or not to be, that is the Question”이 나타날 때까지 초당 수 백 개의 문자를 빠르게 생성하도록 설계됐다.

쿠글러는 단계를 세부적으로 나눠 실험을 진행했다. 우선 첫 글자인 'T'를 찾는 데 걸린 시간과 문자 수를 기록했고, 이 절차를 10회 반복하여 평균적으로 걸리는 시간과 문자 수를 조사했다. 다음으로 이전 방식과 똑같이 'To'를 무작위로 생성하는 데 평균적으로 걸리는 시간을 기록했고 'To be'까지 생성해냈다.

아래 표에 나와있듯이 'T'를 생성하기 위해 약 60개의 문자를 무작위로 생성했으며 'To be'를 생성하기 위해 평균 3억4583만940개의 문자를 생성했다. 두 단어를 생성하는 데도 약 1100초나 걸렸다.

한문장
단어 생성기를 통해 단어를 만들어내는데 걸린 시간/사진=Scientific American

이 시점에서 커글러는 위기 의식을 느꼈다. 문장의 다음 문자를 올바르게 생성하는 데 필요한 시간을 감안했을 때, 이 작업이 인류가 멸망할 때까지 안 끝날 수 있다는 것을 깨달았기 때문이다. 따라서 커글러는 이전에 만든 데이터를 사용해 전체 문장을 생성하는 데 필요한 문자 수와 계산 시간을 추정했다.

쿠글러의 계산에 따르면, “To be, or not to be, that is the Question”를 완성하려면 약 2.69×10의 69제곱 개의 문자가 필요하며 이는 약 9.35×10의 58제곱 년이나 기다려야 하므로 엄청난 인내가 필요하다.

우주의 나이가 138억 년으로 추정되는데, 문장이 완성되려면 빅뱅 이후부터 지금까지의 시간에 7×10의 48제곱 배의 시간을 기다려야 한다. 그리고 이것은 햄릿의 겨우 ‘한 문장’을 만들어내는 데 불과한 시간이다. 현실은 시간이 무한하지 않다는 점에서 키케로의 가설이 맞았다. 유한한 시간 내에 문장을 읽을 수 있는 수준으로 우연히 만들 가능성은 매우 희박하다. 종합하여 무한 원숭이 정리는 '무한'이라는 개념이 인간이 상상하고 인지하는 수준보다 훨씬 크다는 것을 보여준다.

*편집진: 영어 원문의 출처는 사이언티픽 아메리칸(Scientific American)으로 본지의 편집 방향과 일치하지 않을 수도 있습니다.

Picture

Member for

1 month
Real name
전웅
Position
연구원
Bio
[email protected]
흥미로운 데이터 사이언스 이야기를 정확한 분석과 함께 전하겠습니다.