Skip to main content

[해외 DS] 창의성과 연결성을 극대화하는 하이브리드 업무 환경 ①, 재택근무의 업무효율은 장기적인 관점에서 바라봐야

[해외 DS] 창의성과 연결성을 극대화하는 하이브리드 업무 환경 ①, 재택근무의 업무효율은 장기적인 관점에서 바라봐야
Picture

Member for

1 month
Real name
안현정
Position
연구원
Bio
[email protected]
정보 범람의 시대를 함께 헤쳐 나갈 동반자로서 꼭 필요한 정보, 거짓 없는 정보만을 전하기 위해 노력하겠습니다. 오늘을 사는 모든 분을 응원합니다.

수정

영국 옥스퍼드대 연구 결과, 원격근무는 창의력을 저해할 수 있어
원격근무의 영향은 장기적 관점에서 분석해야 정확해
하이브리드형 근무로 창의력과 생산성 그리고 자율성의 균형 잡아야

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 데이터 사이언스 경영 연구소 (GIAI R&D Korea)에서 콘텐츠 제휴가 진행 중입니다.


Successful_Hybrid_Work_ScientificAmerican_20240313
사진=Scientific American

2016년 미국에서는 전체 유급 근무일 중 4%만이 재택근무였는데, 2020년 5월에는 그 비율이 60%까지 증가했으며, 이후에는 약 25%로 평준화됐다. 또한 코로나19 팬데믹은 다른 많은 직업과 마찬가지로 과학 분야에서도 하이브리드 근무를 향한 움직임을 가속했다. 대학과 연구소에서 공식적으로 직원들이 현장근무와 원격근무 시간을 병행할 수 있도록 허용한 것이다.

과학자들은 평소 실험실에 출근하는 횟수가 더 많지만, 논문을 작성하거나 데이터를 분석할 때는 재택근무를 한다. 일례로 이탈리아 시에나의 토스카나 생명과학재단에서 분자 미생물학 실험을 하는 클라우디아 살라와 스페인 바르셀로나자치대학교에서 신석기 시대 도자기를 연구하는 고고학자 아드리아 브뢰는 실험실과 현장 방문을 위해 집을 나서야 할 때도 많지만, 서류나 컴퓨터 작업을 위해선 원격근무를 한다고 전했다.

과학 분야에서의 원격 협업, 획기적인 아이디어 vs. 점진적인 진전

사실 과학 분야에서 지리적으로 분산된 팀에 관한 연구는 팬데믹 이전부터 진행됐다. 기술과 정책이 아이디어, 데이터, 자료의 교환을 장려하고 지식이 더욱 전문화됨에 따라 공동 연구팀의 지리적 분산이 증가했기 때문이다. 2011년 연구 논문 저자 약 3,900만 명의 주소를 분석한 결과, 평균 협업 거리가 1980년 334킬로미터에서 2009년 1,553킬로미터로 선형적으로 증가한 것으로 나타났다. 이는 원격 협업이 잘 정착되었고 팀이 더욱 국제화되고 있음을 의미하는 수치다.

물론 원격 연구팀의 구성원들은 일반적으로 재택근무를 하지 않는다. 다른 나라에 있더라도 연구원이 집이 아닌 실험실에서 근무하고 있을 확률이 더 높다. 그러나 미국 일리노이주의 노스웨스턴대학교에서 원격 근무의 영향을 연구하는 커뮤니케이션 및 컴퓨터과학 연구원인 아그네스 호바트(Ágnes Horvát)는 원격 협업의 어려움과 기술에 대한 의존도를 고려할 때 과학자들의 업무 방식과 성공적인 하이브리드 구조를 구축하려는 다른 모든 분야의 조직과 기업이 많은 공통점을 공유하고 있다고 설명했다.

작년 말 영국 옥스퍼드대학의 경제학자 칼 프레이(Carl Frey)가 주도한 장기 연구에 따르면 같은 장소에서 근무하고 있는 연구자들이 더 획기적인 아이디어를 발견할 가능성이 더 크다고 한다. 반면에 원격 공동 작업자는 더 큰 집단 지식에 접근하는 이점을 누리지만, 그러한 팀은 창의적일 가능성이 작고 점진적인 진전을 이루는 데 더 적합하다고 설명했다. "원격 팀은 기술적인 작업에서 협업할 확률이 더 높다"라며, "반면 현장 팀은 새로운 아이디어를 개념화하는 작업에서 협업할 확률이 훨씬 더 높다"고 덧붙였다.

프레이 교수의 연구는 1960년부터 2020년 사이에 발표된 전 세계 2천만 건의 연구 논문과 1976년부터 2020년 사이에 제출된 4백만 건의 특허 출원을 분석한 결과다. 연구진은 기고자들의 소속과 지리적 정보를 살펴보고 인용 패턴 분석을 통해 논문의 '창조적 파괴력'(혁신) 정도를 평가했다. 그 결과 협업 거리가 0킬로미터에서 600킬로미터 이상으로 늘어났을 때 논문의 파괴력은 약 20% 감소했으며, "원거리 팀일수록 획기적인 연구 결과를 도출할 가능성이 작았다"고 그는 강조했다.

하이브리드 근무, 유연성과 생산성의 타협점

이론적으로 하이브리드 근무는 유연성을 원하는 근로자의 욕구와 생산성에 대한 상사의 우려 사이에서 탄생한 균형이다. 팬데믹 초기 많은 원격 근무자들은 삶의 질이 향상되고 생산성도 높아졌다고 주장했다. 하지만 일각에선 원격 근무의 효과를 완전히 드러내기 위해선 장기적인 분석이 필요하다고 짚었다. 앞서 언급한 연구 결과에서도 서로 가까운 거리에서 일하는 팀이 더 높은 수준의 혁신적인 결과를 만들어낸다고 강조했었다.

이에 원격 근무의 영향을 더욱 명확하게 들여다보기 위해 연구자들은 과학뿐만 아니라 다른 모든 분야에 대해서 재택근무와 사무실 근무의 의미를 경쟁적으로 파악하기 시작했다. 경제학, 심리학, 커뮤니케이션 이론을 바탕으로 사람들이 이메일과 화상 통화에 응답하는 방식부터 원격으로 일하는 팀이 협업하고 지식을 전달하는 방식에 이르기까지 하이브리드 근무의 다양한 측면을 조사한 것이다. 또한 사무실 팀과 원격 팀 간의 격차를 해소하여 하이브리드 근무를 성공으로 이끌기 위해 과학이 제공할 수 있는 것이 무엇인지 탐구하고 있다.

한편 팬데믹 이전에도 원격 근무의 효과를 조사한 사례가 있다. 1980년대에 미국의 은행 회사인 아메리칸 익스프레스(American Express)는 장애인을 위한 재택 대체 사무실 시스템을 시험하는 프로젝트 홈바운드(Project Homebound)라는 파일럿 프로그램을 운영한 바 있다. 이 프로젝트는 성공적이었다는 평가를 받으며 회사는 비용 절감과 생산성 향상을 자랑했었다.

그 후로도 과학자들은 다양한 직군과 규모로 원격 근무의 영향을 연구했다. 최근에 진행된 콜센터 직원 및 IT 전문가와 같은 특정 그룹에 대한 일련의 소규모 연구에 따르면 완전 원격 근무자의 생산성이 약 10~20% 떨어지는 경향이 있는 것으로 나타났다. 이들은 더 적은 통화를 처리하고, 더 적은 데이터를 입력하며, 동일한 작업을 수행하는 데 더 오랜 시간이 걸린다고 집계됐다. 이는 팬데믹 초기에 재택근무자가 사무실에 있는 사람보다 더 많은 업무를 수행한다는 주장과는 상반되는 결과다.

원격 근무와 현장 근무의 연구 결과가 서로 엎치락뒤치락하는 가운데 하이브리드 근무 방식은 하나의 절충안으로 자리잡았다. 여행사 트립닷컴(Trip.com)에서 엔지니어와 마케팅 및 재무 직원 1,612명을 대상으로 실시한 2022년 연구 결과도 이를 뒷받침하는데, 이 회사는 직원들에게 풀타임 또는 일주일에 이틀만 사무실에서 근무하도록 했다. 그 결과 하이브리드 패턴으로 근무하는 직원들은 풀타임으로 근무하는 직원들보다 더 행복하고 회사를 떠날 확률이 낮았다. 아직 동료 심사를 거치지 않은 연구 논문으로 발표된 이 결과에 따르면 하이브리드 그룹에 배정된 팀원들은 사무실 근무자들과 근무 시간과 그 패턴이 달랐지만, 두 그룹의 전반적인 생산성은 동일하게 나타났다. 또한 출퇴근 시간이 긴 직원들이 원격 근무의 이점을 더 많이 보고하는 경향도 함께 포착됐다.

[해외 DS] 창의성과 연결성을 극대화하는 하이브리드 업무 환경 ②, 혁신을 가로막는 재택근무 지원 기술로 이어집니다.

영어 원문 기사는 사이언티픽 아메리칸에 게재되었습니다.

Picture

Member for

1 month
Real name
안현정
Position
연구원
Bio
[email protected]
정보 범람의 시대를 함께 헤쳐 나갈 동반자로서 꼭 필요한 정보, 거짓 없는 정보만을 전하기 위해 노력하겠습니다. 오늘을 사는 모든 분을 응원합니다.

[해외 DS] 페어리 트레인드, 생성형 AI의 '공정 학습' 인증 프로그램 도입

[해외 DS] 페어리 트레인드, 생성형 AI의 '공정 학습' 인증 프로그램 도입
Picture

Member for

1 month
Real name
안현정
Position
연구원
Bio
[email protected]
정보 범람의 시대를 함께 헤쳐 나갈 동반자로서 꼭 필요한 정보, 거짓 없는 정보만을 전하기 위해 노력하겠습니다. 오늘을 사는 모든 분을 응원합니다.

수정

AI 회사들은 '공정 사용'을 내세워 저작권 문제를 우회하려고 시도해 
페어리 트레인드, 라이선스가 있는 데이터를 사용하는 '공정 학습'을 제안
인간 창작자에 대한 존중과 책임감 있는 AI 개발 문화 조성을 강조 

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 데이터 사이언스 경영 연구소 (GIAI R&D Korea)에서 콘텐츠 제휴가 진행 중입니다.


AI_Copyright_Fairly_Trained_ScientificAmerican_20240312
사진=Scientific American

생성형 AI 시스템은 텍스트, 이미지, 영상 등 인간이 만든 방대한 콘텐츠에서 영감을 얻고 학습한다. AI 회사들은 종종 '공정 사용'이라는 논리를 내세워 창작자와 상의하거나 비용을 지급할 필요 없이 모델을 학습시키는 것이 허용돼야 한다고 주장하고 있다. 심지어 인기 이미지 생성기인 스테이블 디퓨전을 만든 스태빌리티 AI는 작년 10월 미국 저작권청에 보낸 성명에서 "AI 개발을 위한 기존 콘텐츠의 사용은 공정 사용으로 보호되는 한 허용 가능하고, 혁신적이며, 사회적으로 유익하다"고 역설했다.

공정 사용 논란과 공정 학습을 위한 노력

하지만 문제는 공정 사용 관점이 보편적이지 않다는 데에 있다. 일례로 오픈AI는 챗GPT의 등장 이후 불과 1년여 만에 20여 건에 달하는 소송과 조사 등에 얽혀 있다. 현재 저작권이 있는 자료의 무단 사용에 대한 반발이 거세지고 있으며 책임감 있는 AI 사용 의식도 개인과 국가 차원에서 점차 개선되는 중이다. 그 결과 법적 위험 부담이 커지고 있어 AI 시장의 생태계 조정이 시급하다는 우려의 목소리가 높아지고 있다. 컴퓨터 과학자 에드 뉴턴-렉스(Ed Newton-Rex)도 이와 비슷한 감정으로 인해 스태빌리티 AI에서 퇴사하게 됐다. 그는 학습 데이터가 GPU와 AI 인재에 이어 AI 시스템을 구축하는 데 필요한 세 가지 주요 자원 중 하나인데, 수백만 달러를 투자하고 있는 다른 두 자원과 달리 학습 데이터를 공짜로 얻으려는 시도가 어떻게 정당화될 수 있는지 모르겠다고 밝혔다.

뉴턴-렉스는 현재 라이선스가 있는 자료로만 생성형 AI 모델을 학습시키는 기업을 인증하는 비영리 단체인 페어리 트레인드(Fairly Trained)를 설립했다. 페어리 트레인드는 이름에서도 그 뜻을 알 수 있듯이 '공정 학습'을 추구하며 모델이 어떻게 개발되는지 명확히 하는 것을 목표로 하고 있다. 따라서 인증을 받기 위해 기업은 라이선스가 있는 학습 데이터를 사용하고 라이선스 계약 준수를 보장하기 위한 내부 절차에 대해 자세히 보고해야 한다. 물론 페어리 트레인드에서 고객의 시스템을 직접 들여다보지 않기 때문에 현재 많은 부분이 신뢰에 기반하고 있는 것이 사실이다. 하지만 스태빌리티 AI처럼 라이선스가 없는 데이터를 사용하는 것에 거리낌이 없고, 이를 공개하는 개방적인 분위기가 형성되어 있어 인증에 관한 신뢰 측면을 크게 우려하지 않는다고 뉴턴-렉스는 전했다.

페어리 트레인드 인증의 한계텍스트 생성 모델 인증의 어려움

그러나 일각에서 페어리 트레인드의 인증 대상이 제한적이라는 지적이 나왔다. 시중에는 수많은 생성형 AI 모델이 있으며, 그중에는 세계 최대 규모의 기술 기업이 만든 모델도 있는데, 지금까지 9개 인증 승인 모두 비교적 작은 회사에서 이뤄졌다. 최근에 마지막으로 인증받은 이스라엘의 AI 회사 브리아(Bria)도 2,400만 달러의 시리즈 A 투자를 유치한 스타트업이다. 뉴턴-렉스는 의도적으로 이러한 소규모 AI 회사와 협업을 진행했다고 밝혔는데, 작은 회사의 경우 일부 대기업에서 볼 수 있는 관료주의가 없기 때문에 초기 인증 사례 대상으로 적합하다고 그 이유를 설명했다. 게다가 큰 규모의 AI 회사 중 상당수가 인증 기준에 부합하지 않았다고 덧붙였다.

한편 인증을 받은 모델 모두 음악, 오디오 또는 이미지와 관련이 있었는데, 텍스트를 생성하는 모델은 하나도 없었다. 그의 설명에 따르면 현재로서는 인증을 받을 수 있는 대규모언어모델(LLM)이 존재하지 않았다. 모든 텍스트가 라이선스가 있거나 퍼블릭 도메인 또는 올바른 종류의 오픈 라이선스 하에 있는 모델을 출시하는 것이 사실상 불가능하다는 것이다. 안타깝게도 지난 1년 반 또는 2년 동안 대다수의 기술 기업이 생성형 AI 시장에서 우위를 차지하기 위해 무분별한 대규모 학습을 감행해 출처에 대한 라이선스 구별 가능성 자체가 묘연해졌기 때문이라고 그는 분석했다. 또한 그는 일부 기업에서 반박하는 것처럼 블로그, 게시물, 코드, 정부 문서 등 거의 모든 텍스트 데이터가 저작권 보호를 받고 있기 때문에 저작권 데이터의 사용이 불가피하다고 주장할 것이 아니라, 소량의 데이터로 학습되고 라이선스가 부여되는 언어 모델을 개발하는 방향으로 기업에서 더 많이 노력해야 한다고 꼬집었다.

지속가능한 창작 활동을 위한 인간과 AI의 상호 존중

뉴턴-렉슨은 인간 예술가와 함께 평화롭게 공존할 수 있는 생성형 AI의 미래를 꿈꾼다고 말했다. 특히 공정 학습 인증을 통해 대중들이 어떤 기술 기업이 인간 창작자의 저작권을 존중하는 데 적극적인지를 구별할 수 있게 하는 것에 방점을 뒀다. 개인 창작자들에 대한 보상에 대해 논의하기에 앞서 라이선스 데이터 사용에 대한 동의를 구하는 것이 선행돼야 하며, 이는 곧 해당 기업의 저작권 문제를 향한 민감도를 엿볼 수 있는 기회라고 그는 바라봤다. 인간의 창작물을 기반으로 지금의 AI 모델을 개발할 수 있었기 때문에 앞으로 더 유용한 모델을 얻기 위해선 인간의 창작 활동을 존중하고 격려하는 노력이 뒷받침돼야 한다는 것이다. 인간 창작자에 대한 존중을 바탕으로 창작의 선순환을 만들어야 한다는 것이 페어리 트레인드의 핵심 가치다.

마지막으로 AI 연구와 함께 뉴턴-렉슨은 합창 음악을 작곡하는 클래식 작곡가이기도 하다. 그는 자신의 예술적 활동이 크리에이터를 옹호하는 데 동기를 부여했다며, "이 문제는 항상 나의 마음에 가까운 문제였으며, 이는 내가 음악가이기 때문이라고 생각한다"고 그는 전했다. 이처럼 예술 작품의 저작권 문제를 향한 그의 진정성과 스태빌리티 AI의 임원이었던 그의 전문성을 보고 합류한 4명의 자문위원도 함께 주목받고 있다. 이 위원회의 위원으로는 애플 시리(Siri)의 공동 제작자 톰 그루버, 변호사 엘리자베스 무디, 작곡가 맥스 리히터, 미국 출판사 협회의 최고 경영자인 마리아 팔란테가 있다.

영어 원문 기사는 사이언티픽 아메리칸에 게재되었습니다.

Picture

Member for

1 month
Real name
안현정
Position
연구원
Bio
[email protected]
정보 범람의 시대를 함께 헤쳐 나갈 동반자로서 꼭 필요한 정보, 거짓 없는 정보만을 전하기 위해 노력하겠습니다. 오늘을 사는 모든 분을 응원합니다.

[해외 DS] 마이크로소프트 수학 전용 SLM '오르카-매쓰' 발표, LLM과 기존 모델 모두 능가

[해외 DS] 마이크로소프트 수학 전용 SLM '오르카-매쓰' 발표, LLM과 기존 모델 모두 능가
Picture

Member for

1 month
Real name
안현정
Position
연구원
Bio
[email protected]
정보 범람의 시대를 함께 헤쳐 나갈 동반자로서 꼭 필요한 정보, 거짓 없는 정보만을 전하기 위해 노력하겠습니다. 오늘을 사는 모든 분을 응원합니다.

수정

오르카-매쓰는 미스트랄 7B 모델 기반으로 만들어졌으며, GSM8K 벤치마크에서 LLM과 기존 수학 전용 모델을 모두 능가해
주요 성공 요인은 고품질 합성 데이터, 반복 학습, SFT-KTO-KTO 시퀀스를 활용한 교사의 피드백 품질 향상에 있어
마이크로소프트는 20만 단어의 AI 생성 합성 수학 문제 세트를 허깅페이스에 공개
Orca_Math_Microsoft_20240311
사진=Pexels

마이크로소프트 리서치(이하 MS)에서 수학 전문 언어 모델 '오르카-매쓰'(Orca-Math, 이하 오르카)를 발표했다. 오르카는 소형언어모델(SLM)로 수학 문제 해결에 있어 제미나이 프로(Gemini Pro) 및 GPT-3.5와 같은 대형언모델(LLM)보다 뛰어난 성능을 기록하여 특정 도메인에 특화된 SLM의 잠재력을 뽐냈다.

수학 문제 해결 능력에서 LLM과 기존 수학 전용 모델을 모두 능가

'미스트랄 7B'(Mistral 7B) 모델을 기반으로 만들어진 오르카는 GSM8K pass@1에서 86.81%라는 놀라운 성과를 거두며 메타, 구글, 오픈AI의 모델 성능을 추월했다. GSM8K는 인간 작성자가 만든 8.5만 개의 초등학교 수준의 수학 문제로 구성된 고품질 데이터 세트다. 주로 기본 산술 연산(+ - ×÷)을 사용하여 일련의 계산을 수행해 최종 답에 도달하는 방식으로 푸는 문제다. 영리한 중학생이라면 모든 문제를 풀 수 있어야 하는 수준이다.

Orca_Math_GSM8K_20240311
GSM8K 벤치마크/사진=마이크로소프트

오르카는 LLM보다 높은 성능을 보였을 뿐만 아니라, MetaMath-70B 및 WizardMa8th-70B와 같은 다른 수학 전용 모델과의 경쟁에서도 우위를 지켰다. 또한 AddSub, MultiArith, SinglEq와 같은 다른 수학 데이터 세트에서도 강력한 성능을 보여줬다. 수학 문제를 푸는 것이 SLM에게 오랫동안 복잡한 작업으로 인식되어 왔던 걸 미루어 보면 괄목할 만한 성과라는 평이 납득이 가는 이유다.

더 작은 모델로 더 높은 수준의 성능을 달성하기 위해 연구자들은 종종 SLM을 훈련시켜 코드를 생성하거나 계산기를 사용하여 계산 오류를 방지한다. 아울러 모델을 최대 100회까지 호출하여 각 호출마다 문제 해결을 다시 시도하는 앙상블이라는 기법을 사용하는데, 앙상블을 사용하면 정확도가 크게 향상되지만, 모델을 여러 번 호출하기 때문에 컴퓨팅 비용이 크게 증가하는 문제점이 있다. 오르카 연구진에 따르면 이번 연구는 수학 문제 해결에 특화된 SLM이 외부 도구, 검증자 또는 앙상블을 사용하지 않고도 얼마나 더 높은 수준의 능력을 발휘할 수 있는지 탐구하는 것을 목표했다고 한다.

고품질 합성 데이터와 반복 학습

먼저 MS 연구진은 오르카의 성공 요인을 고품질의 합성 데이터로 꼽았다. 시드 문제를 기반으로 다양한 수와 속성을 가진 문제를 생성하면 작은 모델을 위한 학습 데이터를 생성할 수 있다. 연구진은 자동 생성 기능을 사용하여 새로운 문제와 솔루션을 생성하는 다중 에이전트로 풀이법을 더 많이 만들 수 있었을 뿐만 아니라 문제의 다양성과 난이도도 높일 수 있었다. 구체적으로는 제안자(suggester)와 편집자(editor) 에이전트를 사용했는데, 제안자는 문제를 검토하고 복잡도를 높이기 위한 방법을 제안하고, 편집자는 원래의 문제와 제안자의 추천을 참고해 더 어려운 문제를 생성하는 방식이다. 이러한 과정은 여러 라운드에 걸쳐 진행될 수 있으며 각 라운드마다 문제의 난이도가 높아진다. 마지막으로 제삼의 에이전트는 문제가 해결 가능한지 확인하고 해결책을 만든다.

학습 데이터의 구조에 맞게 학습 과정도 마찬가지로 교사(LLM)와 학생(SLM) 간의 반복학습이 이루어진다. 마치 실제 학생이 교사로부터 수학 문제 풀이법을 배우듯이 학생 모델은 먼저 교사 모델의 시범을 통해 풀이법을 배운다. 그런 다음 학생 모델은 스스로 문제 해결을 연습하고 교사 모델은 그에 맞는 피드백을 제공하며, 여기엔 동일한 문제에 대한 좋은 해결책과 나쁜 해결책을 모두 보여주는 선호도 데이터가 포함된다. 피드백을 받은 학생 모델은 해당 내용을 참고해 더 좋은 풀이법을 만들어내고 이러한 프로세스는 반복적으로 진행된다. 물론 여러 번 시도한 후에도 학생 모델이 문제를 올바르게 해결할 수 없는 경우, 교사가 제공한 솔루션을 사용하도록 설정됐다.

교사의 피드백 품질이 핵심, 'SFT-KTO-KTO'

결국 교사의 피드백이 학생의 능률을 좌우한다. 하지만 인간을 통해 "입력 X에 대해 출력 A가 B보다 낫다"라는 피드백을 만드는 비용이 만만치 않다. 게다가 인간의 판단이 주관적이기 때문에 결과가 상충될 수 있어 우리가 익히 알고 있는 LLM의 편향·환각·유용성 및 해석 가능성 부족 등의 증상이 나타난다. 따라서 MS 연구팀은 기존의 감독 하의 미세조정(Supervised Fine-Tuning, 이하 SFT)과 더불어 성능 저하 없이 쉽고 저렴하게 LLM을 정렬할 수 있는 카네만-트베르스키 최적화(Kahneman-Tversky Optimization, 이하 KTO)라는 방법을 차용했다.

KTO는 작년 말 스타트업 컨텍스츄얼 AI(Contextual AI)가 개발하여 오픈소스로 공개한 얼라인먼트 기법으로, 인간의 의사결정에 대한 경제학자 카네만과 트베르스키의 연구를 통해 "입력 X에 대해 출력 Y가 바람직한지 바람직하지 않은지"만 물어본다. 이러한 종류의 피드백은 적용 범위가 넓은 장점이 있다. 예로 들어 모든 회사에는 바람직한(예: 판매가 이루어짐) 또는 바람직하지 않은(예: 판매가 이루어지지 않음) 것으로 표시할 수 있는 고객 상호 작용 데이터가 있다. 이번 연구의 리더이자 MS의 선임 연구원인 아린담 미트라(Arindam Mitra)에 따르면 SFT로 시작하여 두 차례의 KTO로 이어지는 'SFT-KTO-KTO' 시퀀스가 연속적인 SFT 시퀀스보다 더 효과적이었으며 DPO(Direct Preference Optimization는 수학적으로 RLHF와 동등하면서도 훨씬 간단하여 오픈소스에서도 얼라인먼트가 용이한 강화학습 기법)도 뛰어넘는 것으로 입증됐다.

한편 MS의 오르카 연구팀은 상업적 용도로도 "누구나 탐색, 구축 및 혁신"할 수 있도록 허용하는 MIT 라이선스에 따라 20만 단어로 구성된 AI 생성 합성 수학 문제 세트를 허깅페이스(Hugging Face)에 게시했다. 따라서 스타트업과 기업에서 이를 활용할 수 있게 됐다. 특히 LLM의 개발·유지 비용을 감당하기 어려운 기업이 대다수인 만큼 적용 대상이 넓을 것으로 예상된다.

Picture

Member for

1 month
Real name
안현정
Position
연구원
Bio
[email protected]
정보 범람의 시대를 함께 헤쳐 나갈 동반자로서 꼭 필요한 정보, 거짓 없는 정보만을 전하기 위해 노력하겠습니다. 오늘을 사는 모든 분을 응원합니다.

[해외 DS] 다중우주, 과학적 상상력으로 본 다른 세계의 가능성

[해외 DS] 다중우주, 과학적 상상력으로 본 다른 세계의 가능성
Picture

Member for

1 month
Real name
김광재
Position
연구원
Bio
[email protected]
균형 잡힌 시각으로 인공지능 소식을 전달하겠습니다.

수정

다중우주를 이해하기 위한 과학적 시도, 양자 다중우주와 우주론적 다중우주
결국 다양한 우주 존재를 가정해야 특별함을 설명할 수 있어
인식 범위 밖의 존재, 이론적 모델링으로 끊임없이 상상해야

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 데이터 사이언스 경영 연구소 (GIAI R&D Korea)에서 콘텐츠 제휴가 진행 중입니다.


Multiverse_ScientificAmerican_20240308
사진=Scientific American

다중우주라는 개념은 많은 SF의 소재가 되기도 하지만, 일부 과학자들이 진지하게 연구하고 있는 분야이기도 하다. 현대 물리학의 여러 분야에서 등장하는데, 양자역학의 다중세계를 예로 들 수 있다.

양자역학의 다중세계는 인간의 삶이 양자 세계와 어떻게 연결되어 있는지에 대한 질문에서 시작된다. 그 질문에 대한 대답으로 1957년 젊은 대학원생 휴 에버렛 3세(Hugh Everett III)는 다양한 가능성이 서로 다른 우주로 나뉘며, 인간은 여러 현실을 경험하지만 도플갱어에 대해서는 잘 모른다고 추측했다. 즉 양자역학에서 입자는 누군가가 측정을 시도하기 전까지는 모든 가능한 경우의 중첩으로 존재하는데, 측정을 시도하면 모든 가능성이 붕괴하고 하나의 물리적 상태만 관찰된다고 해석한다. 그리고 측정 이전에 존재했던 다른 가능성은 각각 다른 버전의 관찰자와 함께 서로 다른 우주에서 펼쳐진다고 가정하는 것이다.

미세조정의 신비, 인플레이션이 불어낸 우주 버블들

양자 다중우주 말고도 우주론적 다중우주(cosmological multiverse) 해석이 있다. 이는 인플레이션이라는 과정(우주의 초기 단계로 여겨지는 급격한 팽창)이 초기 우주의 여러 지역에서 한 번이 아니라 여러 번 일어났을 수 있다는 생각이다. 또한 인플레이션이 일어날 때마다 우주가 팽창하는 별도의 '버블'을 만들어내며 이러한 버블은 우리의 우주와는 다른 물리 법칙을 가진 독자적인 우주로 성장할 수 있다고 바라본다. 우리가 속한 우주가 팽창하는 동안 다른 우주 버블들도 팽창하고 있었을 것이다. 그 결과 오랜 시간이 흐른 지금은 서로 멀어져서 직접 보거나 상호작용할 수 없다고 가정한다.

물리학자들이 다중우주가 현실에 대한 올바른 해석이라고 생각하게 만드는 우주의 특성은 '미세조정'에 있다. 우리 우주의 여러 조건(매개변수)은 은하, 별, 행성, 생명체가 형성되기에 적합한 범위 내에 있는 것으로 보이는데 중력의 세기, 전자기 상호작용의 세기 등 이러한 상숫값이 조금만 달랐었다면 우리가 알고 있는 행성과 생명체는 결코 형성되지 못했을 것이다. 1970년경 물리학자 브랜든 카터(Brandon Carter)는 우리가 살고 있는 우주가 특별하며 특별할 수 있기 위해선 가능한 우주의 형태가 다양하다는 전제가 뒷받침되어야 한다고 설명했다.

이론 물리학의 역할, 관찰 너머의 진실을 찾아서

하지만 다중우주론의 한 가지 문제는 이 아이디어를 직접 실험할 방법이 없다는 것이다. 다른 우주가 존재해도 우리의 인식 범위를 벗어났기 때문에 증명할 길이 없다. '다중 우주의 매력'의 저자인 세인트조셉대학교의 물리학자 폴 핼펀(Paul Halpern)은 현재 물리학에는 직접 실험할 수 없는 한계가 분명하다고 언급했다. 우주는 팽창하고 가속하고 있으며 빛의 속도는 유한하므로 특정 반경을 벗어난 우주의 일부는 절대 볼 수 없다. 따라서 약 460억 광년 너머의 세계에 대해서는 상상력을 발휘할 수밖에 없는 것이다. 또한 하이젠베르크의 불확정성 원리 때문에 이론적으로도 우주의 모든 입자의 위치와 모멘텀을 한 번에 파악할 수 없다.

그러나 물리학은 역사적으로 직접 측정할 수 없는 많은 제한이 있었음에도 불구하고 지속해서 발전해 왔다. 직접 관찰이 불가능할 때 과학자들은 이론 물리학에 의존했다. 일반 상대성 이론과 같이 설득력 높아 보이는 이론은 관찰 없이도 어느 정도 받아들여지다가 나중에야 실험 결과가 나오는 이론적 모델이었다. 이론과 실험에는 시차가 있을 수 있기 때문에 핼펀 교수는 사람들이 상대성 이론이나 양자 물리학처럼 잘 받아들여지고 있는 이론 물리학의 다양한 가능성을 인정하고, 이 모든 가능성이 어떻게 오늘날 우리의 우주에서 발생한 것인지를 곰곰이 생각해 보기를 권고했다. 이 모든 것이 큰 미스터리라는 것을 이해했으면 좋겠다고 그는 덧붙였다.

영어 원문 기사는 사이언티픽 아메리칸에 게재되었습니다.

Picture

Member for

1 month
Real name
김광재
Position
연구원
Bio
[email protected]
균형 잡힌 시각으로 인공지능 소식을 전달하겠습니다.

[해외DS] 재정의된 스크린 타임, AI와 디지털 도서의 결합으로 몰입감 넘치는 독서 경험 제공

[해외DS] 재정의된 스크린 타임, AI와 디지털 도서의 결합으로 몰입감 넘치는 독서 경험 제공
Picture

Member for

1 month
Real name
이시호
Position
연구원
Bio
[email protected]
세상은 다면적입니다. 내공이 쌓인다는 것은 다면성을 두루 볼 수 있다는 뜻이라고 생각하고, 하루하루 내공을 쌓고 있습니다. 쌓아놓은 내공을 여러분과 공유하겠습니다.

수정

디지털 도서의 장점을 살려 스크린 타임의 부작용 피하고 교육 효과도 극대화할 수 있어
양질의 디지털 스토리는 개인화된 독서 경험, 지능형 아바타, 공동 독서 등의 특징 공유
과도한 멀티미디어 기능은 정보 과부하를 초래하며 상업적 변질의 가능성도 항상 유념해야

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 데이터 사이언스 경영 연구소 (GIAI R&D Korea)에서 콘텐츠 제휴가 진행 중입니다.


Digital_Book_Shouldnt_Count_as_Screen_Time_ScientificAmerican_20240307
사진=Scientific American

불과 10여 년 전만 해도 디지털 도서는 단순한 CD-ROM이었다. 고정된 PC에서 마우스로 페이지를 이동하는 방식이었다. 그러나 오늘날의 디지털 도서는 어디서나 읽을 수 있는 대화형 이야기책으로 진화했다. 어린이 독자들은 가상 현실 앱을 추가하여 인쇄된 책 속의 새를 날게 하거나 공룡을 가지고 놀면서 자신만의 동화책을 만드는 경험을 하고 있다. 또한 출판사들은 인기 도서를 구독형 라이브러리에 통합했으며, 그중 일부는 실제 교사나 인공지능 기반 교사를 함께 제공한다. 이처럼 다양한 독서 접근 방식은 학부모, 교육자, 연구자 모두에게 흥미롭고 도전적인 과제를 가져다줬다.

하지만 부모들은 아이들의 스크린 타임에 대한 걱정이 앞선다. 아이들은 전자기기를 빼앗기면 떼를 쓰고, 언론 보도에서는 과도한 스마트 기기 사용의 단점을 쉴 새 없이 강조한다. 심지어 일부 국가에서는 학교에서 스마트폰 사용을 금지하고 있다. 그러나 전문가들은 디지털 도서가 종이책을 대체할 수는 없지만, 디지털 독서만의 장점을 간과해서는 안 된다고 지적한다. 아이의 집중력을 높여주는 AI 맞춤·참여형 콘텐츠와 창의력을 길러주는 다양한 스토리 전개 방식을 단순한 스크린 타임으로 여겨서는 안 된다는 것이다. 또한 디지털 도서를 고를 때 몇 가지 사항만 주의하면 앞서 나열한 장점과 부모와 아이 간의 유대감을 형성할 수 있는 기회를 극대화할 수 있다고 강조했다.

효과적인 디지털 스토리의 특징

설득력 있는 디자인이 부족하거나 과학 기반의 교육 전략이 빠진 수많은 에듀테크 제품이 쏟아져 나오는 가운데, 무엇이 아이들의 학습에 좋은 디지털 스토리를 만드는가 하는 질문은 모두의 관심사다. 지난 20년 동안 연구자들은 어떤 디지털 도서가 더 교육적일 수 있는지 분석해 왔다. 연구에 따르면 먼저 디지털책은 고품질의 개인화된 독서 경험을 제공하는 것이 중요하다. AI 기반 텍스트 생성기와 개방적인 디자인이 적용된 책을 통해 아이들이 멀티미디어 제작자, 공동 작가, 공동 삽화가로서 자신만의 이야기 세계를 만들어갈 수 있게 유도하는 앱을 골라야 한다. 더 진보적인 독서 플랫폼은 단순히 넷플릭스 스타일의 콘텐츠를 제공하는 데 그치지 않고, 다른 독자들에게 매력적인 경험을 제공하는 커뮤니티 회원에게 적극적으로 보상을 제공하는 특징이 있다. 독자의 동기와 진도에 따라 텍스트의 인기가 판단되기 때문에 이러한 플랫폼은 장기적으로 콘텐츠와 독서 형식이 더욱 다양해진다.

또한 높은 품질의 디지털 도서는 지능형 아바타를 통해 부모와 자녀의 독서 경험을 크게 향상한다. 이야기의 흥미로운 요소에 아이의 주의를 끌기 위해 질문을 던지는 아바타는 이가 읽고 있는 내용을 이해하도록 도와 독립심을 키워줄 뿐만 아니라 새로운 어휘를 접하게 하고 아이의 시야를 넓히는 기능을 수행한다. 이는 특히 부모와 자녀의 대화를 강화할 수 있는데, 부모가 질문할 수 있는 내용을 모델링하고 확장하여 책을 둘러싼 대화의 질을 높여준다. 일반적으로 성인에게도 쉽지 않은 수학 관련 대화를 늘리는 데에도 사용될 수 있어 인쇄 도서만큼은 아니더라도 기대 이상의 효과를 발휘한다고 분석됐다.

아울러 화상 채팅을 통한 공동 독서는 자녀에게 제공되는 피드백이 즉각적이고 개별화되어 있다면 대면 독서와 동일한 언어 학습 효과를 가져다준다고 한다. 물리적 유대감을 디지털로 대체할 수 없지만, 부모와 자녀가 같은 공간에 있지 않더라도 긍정적인 양육과 독서 지원의 학습 효과를 얻을 수 있다는 점이 특히 인상적이다. 최근 팬데믹 기간의 봉쇄나 1억 8천만 명의 이재민, 그리고 전 세계적인 교사 부족 위기 등을 생각하면 원거리 독서 지원 기능의 중요성은 앞으로도 대두될 것이다. 한편 디지털책이 공유 독서 경험에 가져다줄 수 있는 것은 개별적인 언어적 독려뿐만이 아니다. 그림에 확대, 축소 및 패닝 기능을 추가해 카메라가 내레이션에 맞춰 아동의 시각적 주의를 유도할 수 있어, 문해력이 낮은 어린이의 스토리 이해도를 높이는 데 큰 도움이 된다.

과도한 멀티미디어 기능과 상업적 변질 경계해야

하지만 한 제품에 여러 멀티미디어 기능을 한꺼번에 몰아넣은 애플리케이션은 피해야 한다. 한 번에 여러 유형의 정보를 처리해야 하므로 아이들에게 부담을 줄 수 있기 때문이다. 디지털 북을 디자인할 때는 종소리와 휘파람, 대화를 방해하는 큰 소리, 어린이의 주의력 데이터를 오용하는 조작 기능이 포함된 제품을 사용하지 않는 것이 좋다. 핵심은 어린이의 화면 터치에 반응하고 스토리 플롯에 부합하는 기능의 균형 잡힌 조합에 있다. 이러한 전자책을 사용하면 평소 주의력 조절에 어려움을 겪는 어린이도 책을 읽은 후에는 이야기에서 일어난 일을 더 많이 기억해 냈다.

디지털 독서를 지지하는 만큼 교육 기술 개발이 상업적으로 변질되는 것은 특히 수익 중심의 앱 설계와 어린이 데이터 오용과 관련하여 걱정스러운 부분이다. 일부 소셜 미디어와 마찬가지로 구독형 도서관은 아이들의 관심을 상품화하는 데에 초점을 맞춰, 자동 도서 추천을 통해 교사와 사서의 중요성을 떨어뜨려 아이들을 만족스럽지 못한 독서 경험에 가둘 수 있다. 추천된 도서들은 광고 클릭 수와 연계된 경우가 많고, 현지 언어로 된 콘텐츠가 부족하며, 이야기의 문학적 수준이 낮을 가능성이 높기 때문이다. 또한 콘텐츠에 대한 관리 감독이 없어 정치적으로 편향되거나 어린이의 주의력 데이터를 악용하기 위한 수집 자료가 만들어질 수 있다. 생성형 AI의 등장으로 콘텐츠 제작의 가능성은 확대되었지만 품질에 대한 우려도 그만큼 커진 셈이다. 이러한 점에서 디지털 도서도 모든 교육 기술과 마찬가지로 엄격한 품질 검사와 연구자와 개발자 간의 개선된 협업이 필요할 것으로 예상된다.

일례로 하버드 교육대학원의 연구에서 파생된 문해력을 높이는 앱과 필자의 박사 학위 논문을 기반으로 만든 무료 어린이 동화 제작 앱인 '우리의 이야기(Our Story)'는 디지털 콘텐츠 제작의 용이성을 활용하는 여러 상업용 앱의 디자인에 영감을 줬다. 이 앱은 '개인화 및 다원화'라는 단순한 원칙에 기반하여 개방형 디자인을 통해 어린이들이 자신만의 콘텐츠를 만들 수 있도록 하는 동시에 교육적이고 다양한 콘텐츠로 시야를 넓힐 수 있도록 지원하고 있다. 오늘날 최고 수준의 출판사와 전자책 개발자들은 이러한 원칙을 준수하고 있다.

디지털 독서 형식은 새로운 연구 분야를 열었다. 여기에는 교사와 기타 전문가가 아이들의 읽기 학습 방법을 개별화하는 데 사용할 수 있는 실시간 데이터 활용이 포함되는데, 양질의 데이터로 만들어진 AI 모델은 부모와 아이의 유대를 강화하는 것과 어린이를 위한 읽기 활동을 지원하는 데 있어 훌륭한 파트너가 될 것으로 전망된다. 증거 기반의 아동 교육 기술에 대한 연구자들의 요청이 정부와 기금 제공자들의 귀에 닿고 있는 만큼, 지난 20년간의 전자책 연구가 모든 어린이에게 이점을 제공할 수 있기를 바란다고 전문가들은 입을 모아 말했다.

영어 원문 기사는 사이언티픽 아메리칸에 게재되었습니다.

Picture

Member for

1 month
Real name
이시호
Position
연구원
Bio
[email protected]
세상은 다면적입니다. 내공이 쌓인다는 것은 다면성을 두루 볼 수 있다는 뜻이라고 생각하고, 하루하루 내공을 쌓고 있습니다. 쌓아놓은 내공을 여러분과 공유하겠습니다.

[해외 DS] 2024년 미국 대선 여론조사, 이번엔 믿을 수 있을까?

[해외 DS] 2024년 미국 대선 여론조사, 이번엔 믿을 수 있을까?
Picture

Member for

1 month
Real name
이태선
Position
연구원
Bio
[email protected]
세상은 이야기로 만들어져 있습니다. 다만 우리 눈에 그 이야기가 보이지 않을 뿐입니다. 숨겨진 이야기를 찾아내서 함께 공유하겠습니다.

수정

미국 선거 여론조사, "낮은 응답률·오류 증가·불신의 악순환"
과거의 실패는 누락된 집단에 대한 깊은 이해 부재에서 비롯돼
올해 여론조사의 성패, 바른 인식과 다양성 확보에 달렸다

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 데이터 사이언스 경영 연구소 (GIAI R&D Korea)에서 콘텐츠 제휴가 진행 중입니다.


What_Election_Polls_Really_Tell_ScientificAmerican_20240306
사진=Scientific American

2024년에는 중요한 미국 대통령 선거가 있는 해다. 그 어느 때보다도 여론조사에 관한 관심이 높아져야 할 시기지만, 안타깝게도 여론조사 기관은 대중들의 믿음을 잃어가고 있다. 선거 여론조사에 대한 응답률이 감소하고 있는데, 응답률이 감소하면 여론조사에 오류가 발생할 가능성이 커지고, 이는 결국 여론조사에 대한 불신으로 이어진다. 여론조사에 대한 불신은 더 낮은 응답률로 이어지며 악순환은 그렇게 시작된다.

선거 여론조사, 미래를 예측하는 마법 거울 아니야

미국의 초당파적 싱크탱크인 퓨 리서치 센터에 따르면 과학에 대한 미국인들의 신뢰가 계속 감소하고 있다고 한다. 민주당과 공화당 지지자 모두 과학자에 대한 신뢰가 팬데믹 이전보다 낮아졌다고 명시했다. 이런 현상을 두고 전문가들은 여론조사를 일종의 미래를 예측할 수 있는 수단으로 받아들이면 안 된다고 우려의 목소리를 높였다. 선거 여론조사는 그날 유권자의 의중을 알 수 있을 뿐이지 미래를 예측할 수는 없다는 것이다. 또한 선거 이외의 주제를 조사하는 여론조사, 예를 들어 이슈, 시사 및 정책에 대한 미국인의 생각을 조사하는 여론조사는 여전히 정확하다며, 선거 여론조사의 경우 대체로 정확하지만, 오류에 더 취약한 문제점이 있다는 점을 이해해야 한다고 설명했다.

선거 여론조사는 항상 "만약 오늘 선거가 벌어진다면"으로 시작한다. 거기에는 이유가 있다. 선거 초반에 시행되는 여론조사는 최종 결과와 다른 이야기를 할 가능성이 훨씬 높기 때문이다. 선거 며칠 전에 시행되는 여론조사조차도 선거 막바지의 기세를 담아내지 못할 수 있다. 그리고 결과를 좌우할 만큼 많은 표를 가지고 있는 미결정자의 마음을 들여다보는 데는 한계가 있다. 따라서 오늘날의 바이든 대 트럼프에 대한 여론조사는 그 자체로 틀린 것이 아니라, 유권자들이 현재 느끼고 있는 것을 알려주는 것일 뿐이다. 지금부터 선거일까지 많은 변수가 일어날 수 있다는 점을 유념해야 한다는 것이다.

또한 여론조사에는 오차 범위가 함께 보고되는데, 선거 여론조사의 실제 오차 범위는 평균 5% 정도다. 하지만 많은 선거는 이보다 훨씬 작은 차이로 승패가 갈린다. 그리고 선거 여론조사는 다른 어떤 조사에서도 찾아볼 수 없는 독특한 특성이 있는데, 바로 아직 존재하지 않는 모집단을 대상으로 조사를 진행한다는 점이다. 선거 여론조사원은 누가 실제로 투표할지 예측해야 한다. 투표할 가능성이 높은 유권자 모델은 80%의 정확도를 보이는 경향이 있으므로 여론조사 대상자 중 누가 실제로 추정치에 포함될지 결정하는 데는 상당한 불확실성이 잇따른다. 마지막으로, 설문조사는 매우 엄격하게 설계하고 시행할 수 있지만 비용이 많이 든다. 그 결과 많은 선거 여론조사는 가능한 한 최소한의 예산으로 실시되며, 언론과 대중은 여론조사의 '설계 품질'을 주의 깊게 살펴보지 않는 경우가 많다.

누락된 집단의 실체에 대한 이해 부족과 이질성에 대한 무지

여론조사에서 설계 품질은 생명이다. 2016년과 2020년의 대선 여론조사에서 그 중요성을 확인할 수 있다. 2016년 여론조사 기관들은 트럼프 지지층의 주요 집단인 저학력 백인을 통계적으로 적절하게 조정하지 못했음을 발견했다. 해결책을 찾은 여론조사 기관들은 2020년 선거에 더 자신감을 가지고 임했지만, 여론조사 결과는 여전히 푸르렀다. 이후 여론조사 업체들은 선거 여론조사에서 공화당 지지자 수는 적절했지만, 공화당 내부의 정확한 단면을 파악하지 못했으며, 민주당 지지자들은 계속해서 투표 의사를 과대 보고하고 있다는 사실을 점차 깨달았다.

문제는 누가 누락된 것인가 하는 것이다. 그 답은 당초 예상했던 교육 수준이 낮은 사람들뿐만 아니라, 특히 과학과 미디어를 불신하고, 편파적인 뉴스 매체에 호감을 느끼거나 특정 종교성이나 기타 속성을 가진 사람들이다. 게다가 이 누락된 집단은 인구통계학 전반에 걸쳐 균일하게 나타나지 않았는데, 예를 들어 히스패닉과 백인의 경우 다른 양상을 보였다. 이에 지난 4년 동안 과거 투표 행동에 대한 보다 엄격한 조정과 이러한 유형의 유권자가 투표에 더 많이 참여하도록 장려하기 위한 새로운 접근이 적극적으로 도입됐다. 그동안의 노력이 결실을 볼지는 올해의 선거 결과에 달려 있다.

한편 전문가들은 여론조사에 대한 대중들의 인식 개선을 촉구했다. 앞서 언급한 대로 선거 여론조사는 미국에서 이루어지는 수많은 여론조사 연구의 극히 일부에 불과하며, 비선거 여론조사의 경우, 응답률이 낮음에도 불구하고 오차가 일반적으로 매우 작으며, 응답률과의 상관관계도 일반적으로 높지 않다는 것이다. 여론조사에 대한 정확한 이해를 바탕으로 언론과 대중이 여론조사의 결과를 과대 해석하지 않고 저품질·저가 여론조사의 결과를 비판적으로 받아들여야, 궁극적으로 표본에서 누락돼 왔던 '과학을 불신하는 이질적 집단'의 공백을 메꿀 수 있다고 강조했다.

스포츠에서 언더독의 반란은 종종 발생한다. 선거 여론조사에서도 마찬가지다. 한 가지 확실한 것은 여론조사에 더 많은 다양한 사람이 참여해야 한다는 것이며, 사람들이 참여하여 솔직한 의견을 제시할 때 더욱 신뢰할 수 있다는 것이다.

영어 원문 기사는 사이언티픽 아메리칸에 게재되었습니다.

Picture

Member for

1 month
Real name
이태선
Position
연구원
Bio
[email protected]
세상은 이야기로 만들어져 있습니다. 다만 우리 눈에 그 이야기가 보이지 않을 뿐입니다. 숨겨진 이야기를 찾아내서 함께 공유하겠습니다.

[해외 DS] 오픈AI의 새로운 텍스트 투 비디오 생성기, '소라'에 대해 알아야 할 모든 것

[해외 DS] 오픈AI의 새로운 텍스트 투 비디오 생성기, '소라'에 대해 알아야 할 모든 것
Picture

Member for

1 month
Real name
김광재
Position
연구원
Bio
[email protected]
균형 잡힌 시각으로 인공지능 소식을 전달하겠습니다.

수정

소라, 텍스트 프롬프트 입력으로 1분 동영상 생성 기능 제공
전문가들에 따르면 기존 기술에서의 확장일 뿐, 큰 기술적 도약은 아니야
윤리 및 허위 정보 우려와 함께 저작권 문제에 대한 대응책 마련 중

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 데이터 사이언스 경영 연구소 (GIAI R&D Korea)에서 콘텐츠 제휴가 진행 중입니다.


Sora_OpenAI_ScientificAmerican_20240305
사진=Scientific American

언뜻 보면 뮤직비디오나 세련된 자동차 광고 영상처럼 보이는 위 사진은 선글라스를 쓴 여성이 보행자와 밝은 불빛의 간판으로 둘러싸인 밤거리를 걸어가는 장면이다. 하지만 화면 너머의 여성은 존재하지 않으며 거리도 존재하지 않는다. 영상에 등장하는 모든 것은 오픈AI의 새로운 '텍스트 투 비디오' 도구인 '소라(Sora)'로 제작됐다. 소라에 간단한 정지 이미지나 프롬프트를 입력하면 최대 1분 분량의 동영상을 만들어낸다.

오픈AI는 소라로 생성한 수십 개의 샘플 동영상을 블로그 게시물과 간단한 기술 보고서, 그리고 CEO 겸 설립자인 샘 알트먼의 계정을 통해 X(이전의 트위터)에 공유했다. 지난달 15일에 소라를 발표했지만 아직 일반에 공개하지는 않았다. 현재 일부 아티스트와 '레드팀' 해커 그룹이 생성기를 테스트하고 있기 때문에 접근을 제한하고 있다고 전했다.

출력물의 길이와 사실감 측면에서 볼 때, 소라는 AI가 생성하는 동영상 중에 당연히 최고의 품질을 자랑한다. "소라가 보여주는 품질 수준에 매우 놀랐다"고 미국 미시간대학교 전기공학 및 컴퓨터과학의 박정준 교수는 강조했다. 그는 현재 머신러닝을 사용하여 생성적 3차원 모델링 기법을 개발하고 있다. 그리고 불과 7개월 전, 박정준 교수는 사이언티픽 아메리칸과의 인터뷰에서 텍스트만으로 사실적인 영상을 제작할 수 있는 AI 모델은 큰 기술적 도약이 필요한 먼 미래의 일이라고 생각한다고 밝힌 바 있다. "비디오 생성기가 이렇게 빨리 발전할 줄은 몰랐고, 소라의 품질은 예상을 완전히 뛰어넘었다"고 그는 덧붙였다.

소라, 기존 AI 도구와 어떻게 다른가?

소라는 프롬프트에 입력된 텍스트와 상관관계가 높은 영상 콘텐츠를 연결하도록 훈련된 매우 큰 컴퓨터 프로그램이다. 좀 더 기술적으로 설명하자면 소라는 다른 많은 이미지 생성 AI 도구와 마찬가지로 확산 모델 기반이며, 챗GPT와 유사한 트랜스포머 인코딩 시스템을 갖추고 있다. 개발자들은 비디오 클립에서 시각적 노이즈를 제거하는 반복적인 과정을 통해 텍스트 프롬프트에서 영상을 출력하도록 소라를 학습시켰다. 소라와 일반 이미지 생성기의 가장 큰 차이점은 텍스트를 정지 픽셀로 인코딩하는 대신 단어를 시간적-공간적 블록으로 변환하여 영상을 생성한다는 점이다. 구글의 뤼미에르(Lumiere)와 다른 많은 모델도 비슷한 방식으로 작동한다.

오픈AI는 소라로 최대 60초 길이의 동영상을 생성할 수 있고, 사용자가 추가적인 클립을 순서대로 생성하도록 요청하면 그 길이를 더 늘일 수 있다고 말했다. 이는 기술적으로 난이도가 높은 일인데, 이전의 생성형 AI 도구는 프롬프트 사이는 물론이고 비디오 프레임 간의 일관성을 유지하는 데도 어려움을 겪었다. 그러나 전문가들은 소라가 머신러닝 기술 자체에서 큰 도약을 이룬 것은 아니라고 지적했다. "소라의 알고리즘은 기존 방식과 거의 동일하다. 단지 더 큰 데이터와 모델로 확장했을 뿐이다"고 박정준 교수는 말했다. 미국 카네기멜론대의 컴퓨터과학 루슬란 살라쿠트디노프(Ruslan Salakhutdinov) 교수도 "반드시 새로운 것은 아니다"라며, "무차별 대입 방식(brute force approach)이 적용 됐다"고 전했다.

일부 전문가들은 오픈AI가 언리얼 엔진과 같은 비디오 게임 디자인 프로그램에서 생성된 합성 데이터를 함께 사용했을 것으로 추측했다. 살라쿠트디노프 교수는 출력물의 비정상적으로 매끄러운 모양과 일부 영상의 카메라 각도를 미루어 보아 그럴 가능성이 높다는 데 동의한다며, 비디오 게임의 인공성과 닮은 점이 소라가 놀랍긴 하지만 완벽하지 않은 이유 중 하나라고 설명했다. 특히 공개된 샘플 영상에서 여성이 걷는 영상을 자세히 살펴보면 특정 디테일이 어긋난다는 것을 알 수 있다. 드레스 밑단이 천인 것에 비해 너무 뻣뻣하게 움직이고 카메라 패닝이 이상할 정도로 매끄럽지 않다. 클로즈업 컷에서는 드레스에 이전에는 없던 얼룩덜룩한 무늬가 생겼고, 일부 장면에서는 목걸이가 빠져 있거나, 가죽 재킷의 옷깃에 있는 여밈이 움직이고 재킷 자체가 길어지는 등의 불일치는 오픈AI가 지금까지 공유한 동영상 전반에 걸쳐 나타난다. 이는 오픈AI가 과대광고 논란을 피하고자 일부러 고른 것일 가능성이 높다.

소라의 부상과 생성형 AI의 고질병, 윤리·저작권 문제

한편 생성형 AI가 등장할 때마다 그렇듯이 저작권 침해와 윤리적 문제에 대한 비판의 목소리도 높아지고 있다. 소라는 이미지를 생성하는 다른 모델과 마찬가지로 학습 데이터에 저작권이 있는 자료가 포함되어 있을 가능성이 높다. 이에 오픈AI는 소라를 공개하기 전 메타데이터 기반의 워터마크를 장착하는 등 생성형 AI 기술의 부작용을 최소화하겠다고 밝혔다. 플랫폼의 내부 테스트, 콘텐츠 가드레일, 메타데이터를 사용하여 콘텐츠의 출처를 쉽게 파악할 수 있도록 하는 C2PA(Coalition for Content Provenance and Authenticity) 표준 프로토콜 사용하여 소라를 더 안전하게 만들기 위한 조치를 취하고 있다고 강조했다.

하지만 사용자가 메타데이터를 제거하는 것을 방지하는 기능을 달리3(오픈AI의 이미지 생성기)에서조차 찾을 수 없는 게 현 실정이다. 더 나아가 워터마크와 메타데이터는 아직 기술적으로 완성도가 높지 않으며 우회 방법도 계속 개발되고 있다. 따라서 전문가들은 소라를 이용한 허위 정보 유포 및 확산은 막기 어려울 것으로 예상했다. 기존의 가짜 동영상을 제작하기 위해서는 AI를 이용한 조작과 실제 영상을 조합하여 작업해야 했는데, 텍스트-투-비디오 플랫폼은 사용자의 소스 자료가 필요 없기 때문에 잠재적인 남용을 가속화하고 확대할 전망이라는 것이다. 미국 캘리포니아대학교 버클리캠퍼스의 하니 파리드 컴퓨터과학 교수는 소라와 같은 도구가 딥페이크 포르노와 정치적 선전을 포함한 유해 콘텐츠의 '증폭 요인'이 될 수 있다고 경고했다.

그러나 잘못된 정보와 허위 정보를 연구하는 미국 메릴랜드대학교의 아이린 파스케토(Irene Pasquetto) 교수는 소라 외에도 허위 정보는 존재하며, 이 문제를 해결하는 것은 궁극적으로 기술적 문제가 아니라 사회적 문제라고 언급했다. 또한 파스케토 조교수는 소라의 위험성이나 피해 가능성을 과장하는 것은 AI에 대한 과대광고를 부추길 수 있다고 우려했다. 소라가 짧은 동영상을 더 쉽고 빠르게 제작할 수 있게 해주지만, 그 자체로 새로운 문제를 야기하는 것은 아니라고 지적하며, 피해를 맥락에 맞게 파악하고 근본 원인에 집중하는 것이 더 중요하다고 그녀는 말했다.

영어 원문 기사는 사이언티픽 아메리칸에 게재되었습니다.

Picture

Member for

1 month
Real name
김광재
Position
연구원
Bio
[email protected]
균형 잡힌 시각으로 인공지능 소식을 전달하겠습니다.

[해외 DS] 일론 머스크, "인류를 구하기 위해 오픈AI 고소해"

[해외 DS] 일론 머스크, "인류를 구하기 위해 오픈AI 고소해"
Picture

Member for

1 month
Real name
이효정
Position
연구원
Bio
[email protected]
지식은 전달하는 정보가 아니라, 함께 고민하기 위해 만들어진 언어입니다.

수정

일론 머스크, 오픈AI의 비영리 사명 포기 주장
AGI 기술 개발 숨김 및 세금 탈루 의혹 제기
머스크의 승소 가능성은 낮지만 오픈AI의 평판 타격은 불가피
ElonMusk_Sues_OpenAI_20240304
사진=Pexels

지난달 29일(현지 시각) 일론 머스크 테슬라 CEO는 46페이지에 달하는 소장에서 오픈AI의 CEO인 샘 알트먼과 그렉 브록먼 사장을 피고로 지목했다. 오픈AI가 최소 100억 달러를 받고 마이크로소프트(MS)에 49%의 지분을 팔아 초기 비영리 단체로써의 설립 목적과는 정반대되는 양상으로 이사회가 운영되고 있다는 점을 지적하는 내용이 이번 소송의 골자다.

오픈AI가 MS와 제휴하고 오픈AI 이사회를 상업적 추구에 더 동조하는 사람들로 교체함으로써 비영리 사명을 '포기'했다고 머스크는 주장했다. 이사회 교체는 지난해 11월 알트먼이 명확하지 않은 이유로 해고된 후(현재 미국증권거래위원회가 조사 중인 것으로 알려짐) 투자자와 MS의 로비 끝에 며칠 만에 복직된 후 이뤄졌다.

오픈AI, "AGI 기술 개발 숨기고 있나?"

머스크가 오픈AI 이사회 구성원에 민감하게 반응한 이유는 이사회가 갖고 있는 결정권 때문이다. 이사회는 인공일반지능(AGI)에 도달한 기술을 개발했는지 여부를 결정하는 중요한 임무를 맡고 있다. 그리고 MS는 AGI를 제외한 오픈AI의 모든 기술에 접근할 수 있다. 만약 기업 친화적인 이사회가 MS의 '인공일반지능(AGI)' 상용화를 돕겠다고 나서면 AGI의 존재를 부인할 것이다. 머스크는 "오픈AI가 AGI를 달성했다는 사실을 발표하는 것을 지연시킬 모든 이유를 갖게 될 것"이라고 불만을 토로했다.

오픈AI의 대규모언어모델인(LLM) GPT 제품군은 처음엔 사람들에게 공개되어 누구나 사용할 수 있는 상태였다. 하지만 이 모든 것은 오픈AI의 가장 강력한 언어 모델인 GPT-4를 비공개로 유지하면서 바뀌기 시작했다. 머스크의 소송에 따르면 GPT-4가 너무 강력해서 MS의 자체 연구원들은 이를 "AGI 시스템의 초기(아직 불완전한) 버전"이라고 불렀다며, 오픈AI 이사회가 AGI 달성을 숨기고 있다고 의혹을 제기했다. 또한 오픈AI는 AGI에 훨씬 더 가까운 큐스타(Q*)라는 모델을 개발 중이라고 그는 주장했다.

게다가 GPT-4는 MS의 Office 생산성 제품군에 통합되어 사실상 MS의 독점 알고리즘이 됐으며, 오픈AI가 MS의 자회사로 전락했다고 머스크는 꼬집었다. 그러나 오픈AI와 MS의 파트너십을 마냥 비난할 수 없다는 게 전문가들의 중론이다. 왜냐하면 오픈AI의 주력 모델인 챗GPT는 초기 투자금이 많이 들어가는 자본 집약적 서비스이기 때문이다. 생성형 AI의 전력 소모량과 클라우드 서비스 의존도 그리고 인재 확보 등을 고려하면 MS와의 전략적 파트너십은 지극히 합리적인 의사결정이라는 것이다.

경쟁 AI 시스템 'xAI' 설립한 일론 머스크, "오픈AI 독주 견제?"

머스크의 소송은 또한 OpenAI가 비영리에서 영리 기업으로 전환하면서 정부로부터 세금을 탈루하고 있다고 비판했다. 비영리 단체로 시작한 스타트업에 자금을 지원하는 투자자는 기부금에서 세금 공제를 받은 후 나중에 해당 스타트업이 영리 단체로 전환할 때 이익을 얻을 수 있다. 다른 스타트업이 오픈AI의 전철을 밟도록 두면 "합법적인 비영리 단체, 정부의 세금 금고, 궁극적으로는 캘리포니아를 비롯한 전 세계 사람들에게 손해를 끼치는 스타트업의 표준 운영 절차가 될 것"이라고 경고했다.

머스크는 OpenAI의 공동 창립자 중 한 명이었지만, 비영리 단체로서의 정체성을 확고히 하지 않는 이사회의 움직임에 2018년에 탈퇴했다. 그는 지난해 폭스 뉴스에 출연해 오픈AI와 MS의 파트너십에 대해 "마이크로소프트가 OpenAI를 직접 통제하지는 않더라도 매우 강력한 발언권을 가지고 있다"고 말하며 비판의 목소리를 높였다. 이후 머스크는 경쟁 시스템을 구축하기 위해 구글 딥마인드, 오픈AI, MS 리서치, 테슬라의 직원들을 모아 'xAI'를 설립했다. 유머러스한 챗봇 '그록(Grok)'을 정식 출시했지만 챗GPT에 비해 그 파급력은 미미했다. 일각에서 이번 머스크의 소송이 오픈AI의 독주를 견제한 일종의 방해 공작이 아니냐는 분석이 흘러나오는 이유다.

법률 전문가들은 머스크의 소송이 성공할 가능성은 작다고 말하지만, 머스크가 승소하든 패소하든 소송과 관련된 여론은 오픈AI의 평판에 타격을 줄 수 있다고 내다봤다. 또한 세계에서 가장 부유한 사람 중 한 명인 머스크가 오픈AI를 수년 동안 소송에 묶어둘 수 있어 이번 법정 공방의 미래를 쉽게 예측할 수 없다고 전했다.

Picture

Member for

1 month
Real name
이효정
Position
연구원
Bio
[email protected]
지식은 전달하는 정보가 아니라, 함께 고민하기 위해 만들어진 언어입니다.

[해외 DS] 구글 제미나이, 인종 왜곡 논란으로 이미지 생성 기능 중단

[해외 DS] 구글 제미나이, 인종 왜곡 논란으로 이미지 생성 기능 중단
Picture

Member for

1 month
Real name
이시호
Position
연구원
Bio
[email protected]
세상은 다면적입니다. 내공이 쌓인다는 것은 다면성을 두루 볼 수 있다는 뜻이라고 생각하고, 하루하루 내공을 쌓고 있습니다. 쌓아놓은 내공을 여러분과 공유하겠습니다.

수정

구글 CEO, 제미나이의 인종적 왜곡 '용납할 수 없다'고 말해
인종 다양성을 지향하는 과정에서 과잉 보정이 적용된 것으로 풀이돼
일각에선 OpenAI-MS 연합에 AI 시장 선두 자리를 완전히 빼앗겼다고 평가해

Google_holds_Gemini_Imagen_20240304
사진=Pexels

미국 온라인 매체 세마포르(Semafor)가 입수한 사내 메모에 따르면 구글 CEO 순다르 피차이는 역사적인 백인 인물을 유색인종으로 묘사한 제미나이(Gemini)의 일부 이미지가 "사용자들에게 불쾌감을 주고 편견을 드러냈다"며 "이는 명백히 용납할 수 없는 일이며 우리가 잘못한 것"이라고 인정했다.

다양성 추구가 낳은 '인종 왜곡', 20일 만에 기능 중단

제미나이가 미국 건국의 아버지를 라틴계 또는 흑인으로 묘사하는 등의 이미지를 생성한 후 소셜 미디어에서 논란이 확산됐다. 게다가 이 모델은 일론 머스크의 영향력을 아돌프 히틀러의 영향력에 비유하는 등 부적절한 답변을 생성하기도 했다. 이에 구글은 추후 공지가 있을 때까지 제미나이에서 '인물 이미지 생성 기능'을 중단하겠다고 공지했다. 이번 중단은 지난 1일 이미지 생성 기능을 추가한다고 발표한 지 20일 만이다.

설상가상으로 제미니의 소셜 미디어 공격은 사람들이 경쟁사인 OpenAI의 새로운 동영상 생성 모델인 소라에 대해 극찬을 쏟아내는 시점에 발생했다. 각종 환각 증세를 보이며 챗GPT의 성능에 미치지 못한 바드에 이어 제미나이마저 OpenAI의 소라에 밀렸다는 시각이 지배적인 분위기다.

제미나이의 인종 왜곡은 역설적으로 인종 다양성을 지향하면서 발생했다. 구글의 수석 부사장인 프라브하카르 라가반(Prabhakar Raghavan)은 제미나이의 이미지 생성 기능이 구글의 이미지 생성 모델인 'Imagen 2'에서 비롯됐으며, 구글이 이 기능을 개발할 당시에는 글로벌 제품을 목표해 과잉 보정이 적용됐다고 밝혔다. 이어 라가반은 "다양한 사람을 보여주기 위한 튜닝이 침범하면 안 되는 범위를 고려하지 못했다"라고 덧붙였다.

피차이 CEO, 구조적 변경 등 일련의 조치 추진 약속

한편 일각에선 구글의 다양성에 대한 집착이 지나치다며 일종의 '백인 대체론'을 위한 움직임이 아니냐는 의혹도 제기됐다. ‘거대한 대체론’(Great Replacement)이라고도 불리는 이 음모론은 백인 문명이 출산율이 높은 이주민들의 문명으로 대체될 것이라는 백일 우월주의적 사상이 담겨 있다.

피차이 CEO의 내부 서한은 제미나이의 응답이 사용자들의 기분을 상하게 하고 편견을 드러냈다는 사실을 인정했고, 실수로부터 배울 것이라고 말했다. 또한 그는 이러한 실수가 수정되고 있다고 명시했다. "우리 팀은 이러한 문제를 해결하기 위해 24시간 내내 노력하고 있다"며, "이미 다양한 프롬프트에서 상당한 개선이 이루어지고 있다. 특히 초기 단계에 있는 만큼 완벽한 AI는 없지만, 목표가 높다는 것을 잘 인지하고 있으며 시간이 얼마나 걸리든 계속 노력할 것이다. 그리고 무슨 일이 있었는지 검토하여 대규모로 수정할 수 있게 하겠다"고 강조했다.

아울러 구글은 구조적 변경, 업데이트된 제품 가이드라인, 개선된 출시 프로세스, 강력한 평가 및 레드팀, 기술 권장 사항을 포함한 일련의 명확한 조치를 추진할 것이라며 이 모든 것을 검토하고 있으며 필요한 변화를 만들 것을 약속했다.

Picture

Member for

1 month
Real name
이시호
Position
연구원
Bio
[email protected]
세상은 다면적입니다. 내공이 쌓인다는 것은 다면성을 두루 볼 수 있다는 뜻이라고 생각하고, 하루하루 내공을 쌓고 있습니다. 쌓아놓은 내공을 여러분과 공유하겠습니다.

[해외 DS] 사랑에 대한 요구에 의문을 제기한 섹스봇

[해외 DS] 사랑에 대한 요구에 의문을 제기한 섹스봇
Picture

Member for

1 month
Real name
이태선
Position
연구원
Bio
[email protected]
세상은 이야기로 만들어져 있습니다. 다만 우리 눈에 그 이야기가 보이지 않을 뿐입니다. 숨겨진 이야기를 찾아내서 함께 공유하겠습니다.

수정

'애니 봇', 섹스봇과 주인 간의 감정적 복잡성 다뤄
자동 학습이 가능한 섹스봇, 늘어나는 감정에 내적 갈등 겪어
"섹스 로봇에게도 권리를?", 섹스봇과의 관계 규정에 대한 화두

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 데이터 사이언스 경영 연구소 (GIAI R&D Korea)에서 콘텐츠 제휴가 진행 중입니다.


Sexbot_Gains_Sentience_ScientificAmerican_20240228
사진=Scientific American

시에라 그리어(Sierra Greer)의 소설 '애니 봇'은 예상보다 더 지적인 섹스봇의 내면에 관한 이야기가 담겨 있다. 공상 과학 소설에서는 보기 드문 '요리'라는 소재를 중심으로 봇(애니)과 주인(더그) 사이의 널뛰는 감정선을 밀도 있게 묘사했다.

학습하는 로봇의 내적 갈등, 주인 이외 다른 사람을 사랑할 수 있을까?

더그는 아픈 이별 후 애니를 구매했다. 그는 제작자인 스텔라 하디에게 애니를 전 애인과 상당히 비슷하게 만들어 달라고 요청했었다. 애니는 '안아주기' 모드로 설정되어 있는데, 이는 애니의 주요 기능이 성적으로나 일반적으로 더그를 기쁘게 하는 것임을 의미한다. 즉 유쾌한 잡담을 나누고, 그의 손길을 기대하며 체온을 37°C까지 올려 1부터 10까지의 척도로 표시되는 그의 불쾌감을 모니터링하고 그에 반응하는 것이다. 물론 인간의 세포로 피부를 배양한 후 더그의 취향에 따라 육체를 형성한 애니와의 관계는 더할 나위 없이 좋았다.

한편 애니의 마음은 복잡하다. 애니는 최근 경험을 통해 학습하고 선택과 실수를 할 수 있는 '자동 학습 모드'로 설정되었으며, 더그가 주중에는 10점 만점에 4점, 주말에는 7점을 꾸준히 유지하던 성욕도 더그의 신호에 따라 스스로 조절하도록 조정되어 있다. 애니는 예전보다 훨씬 더 많은 것을 느끼고 있으며, 급증하는 감성에 적응하려고 노력하면서 필연적으로 발생하는 내적 갈등에 괴로워하게 된다.

그러던 중 더그의 오랜 절친인 롤랜드가 초대장도 없이 하룻밤을 같이 보내게 됐다. 롤랜드는 더그가 스텔라 로봇과 함께 있는 것을 보고 깜짝 놀랐다. 애니가 더그의 전 애인과 닮았다는 롤랜드의 질문에 더그의 짜증은 금세 레벨 5로 치솟았다. 그날 밤늦게, 더그가 자신의 로봇과 긴장감 넘치는 조용한 섹스를 마치고 잠든 사이 롤랜드는 충전 중인 애니에게 다가와 "더그가 아닌 다른 사람이 같이 자자고 하면 어떻게 하겠니?"라고 물었다. 애니가 상황을 이해하지 못하자 그는 "비밀이 당신을 진짜로 만들어 줄 것"이라고 말했다.

"인공 생명의 권리?", 아직 기본적인 AI 규제도 부족한 상황

작가 시에라 그리어는 그날 밤의 결과, 애니의 의식 발달, 선택이나 유예 없이 전적으로 다른 사람의 행복을 위해 헌신할 때 행복이나 자아실현과 같은 것을 성취할 수 없다는 것을 차트로 표현했다. 하지만 차트로 표현하지 못한 더 복잡한 문제는 더그의 불쾌감이다. 섹스봇에 의지해 교제하는 것에 대한 수치심은 섹스봇이 해결할 수 있는 것이 아니었다. 더그의 기분에 맞춰 행동해야 하는 임무가 있었지만 사실 애니는 더그가 왜 자신을 비밀로 하는지, 왜 가끔 친구들과의 여행이나 부모님과의 저녁 식사에서 자신을 인간으로 위장하는지 거의 이해하지 못한다.

애니와 더그의 시끄러운 내면이 그들을 더 친밀하게 만들어줄까? 사실 애니뿐만 아니라 더그도 '인간다움'의 정의를 배워가고 있는 것이 아닐까? 현재 섹스봇과 관련 산업을 둘러싼 논란이 끊이질 않고 있다. 장애인과 노인, 그리고 이성과의 교제가 두려운 사람들에게 긍정적인 영향을 미치며 성범죄를 낮출 수 있을 거라 기대하는 찬성 측이 있지만, 오히려 성적 둔감과 대상화를 부추겨 더 큰 사회적 문제를 불러일으킬 것이라는 반대 측의 주장도 거세다.

거시적인 문제보다 로봇을 대하는 실제 사람들의 감정 변화에 더 많은 주의를 기울여야 한다는 시각도 있다. 소설의 주인공인 섹스봇 애니의 흡입력은 상당하다. 섹스봇 자체에 불쾌감을 가진 사람들마저도 그녀의 처지와 상황에 어렵지 않게 공감하는 것을 인터넷 서평 곳곳에서 확인할 수 있다. 로봇의 인권을 주장할 날이 얼마 남지 않았다는 게 전문가들의 중론이다. 심지어 홀로그램 연인과 결혼을 발표하는 사례도 생기고 있다. 아직 AI에 관한 기본적인 윤리 규제도 확립되지 않은 시점에서 AI 로봇의 인권을 다룰 만한 여력이 없는 것이 현 실정이다.

인공 생명에 대한 철학은 아마도 실제 생명에 대한 철학과 크게 다르지 않을 것이다. 타자의 존재를 '인정'하고 '인내'하는 것에서 시작될 것이기 때문이다. 하지만 현대 사회에서 사람과 사람 사이에서도 부족한 인정과 인내가 로봇에도 허락될까? 아니면 오히려 로봇의 인정과 인내로부터 사람들의 '인간다움'도 회복될까.

영어 원문 기사는 사이언티픽 아메리칸에 게재되었습니다.

Picture

Member for

1 month
Real name
이태선
Position
연구원
Bio
[email protected]
세상은 이야기로 만들어져 있습니다. 다만 우리 눈에 그 이야기가 보이지 않을 뿐입니다. 숨겨진 이야기를 찾아내서 함께 공유하겠습니다.