Skip to main content

[해외 DS] 물 먹는 하마 AI 데이터센터, 해결책으로 떠오른 ‘빗물 집수’

[해외 DS] 물 먹는 하마 AI 데이터센터, 해결책으로 떠오른 ‘빗물 집수’
Picture

Member for

1 month 3 weeks
Real name
전웅
Position
연구원
Bio
[email protected]
흥미로운 데이터 사이언스 이야기를 정확한 분석과 함께 전하겠습니다.

수정

AI 기술 전쟁의 댓가 ‘물 부족 가속화’
데이터센터, 빗물 집수에 적합한 구조
그린뱅크, 빗물 집수 프로젝트에 투자

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 글로벌AI협회(GIAI)에서 번역본에 대해 콘텐츠 제휴가 진행 중입니다.


빅테크 기업들이 인공지능(AI) 연구에 박차를 가하면서 데이터센터의 물 사용량이 급격히 증가했다. 이를 해결할 방법으로 ‘빗물 집수’가 주목받고 있다. 빗물 집수의 친환경적이고 경제적인 면이 장점으로 꼽힌다.

사진=Scientific American

AI 발전과 함께 말라가는 물

데이터센터는 서버에서 발생하는 열을 흡수하고 방출하기 위해 막대한 양의 물을 사용한다. 지난 2021년 구글 데이터센터는 약 43억 갤런의 물을 사용했는데, 이는 미국 남서부지역 골프장 29곳에 물을 공급할 수 있는 양이다.

AI 경쟁이 본격화되면서 데이터센터 물 사용량은 더욱 가파르게 증가했다. 2022년을 기준으로 전년도 대비 구글은 20%, 마이크로소프트(MS)는 34% 물 사용량을 늘렸다. 이런 와중에 같은 해 11월 오픈AI가 내놓은 챗GPT(ChatGPT)의 등장은 물 부족 문제를 더욱 가속화했다. 캘리포니아대학이 발표한 자료에 따르면 챗GPT와 25~50회가량 대화를 주고받으면 물 500ml 정도를 사용하는 것으로 알려졌다.

전문가들은 이러한 추세가 지속될 것이며 2027년에는 전 세계적으로 AI가 사용하는 연간 물 사용량이 유럽의 작은 국가가 소비하는 양과 비슷한 수준에 도달할 것이라고 우려하고 있다.

물 부족 해소를 위한 경제적 선택, 빗물 집수

이런 가운데, 최근 이를 해결할 대책으로 ‘빗물 집수’가 떠오르고 있다. 빗물 집수는 내버려 두면 흘러 없어질 빗물을 용도에 맞게 사용할 수 있도록 저장하는 방식을 말한다. 이 방식은 데이터센터 물 부족 문제를 해결하는 동시에 지하수를 보충할 수 있어 큰 기대를 받고 있다.

더군다나 데이터센터는 평평한 지붕을 가져 빗물을 집수하는 데 효율적이다. 5만 ft²(제곱피트) 지붕에 1인치 비가 내리면 약 3만 gal(갤런)의 물을 모을 수 있다. 이는 미국 1인당 평균 물 사용량이 300갤런인 것을 감안하면 엄청난 양이다. 일반적으로 데이터센터의 지붕은 10만 제곱피트 이상이며, 빅테크 기업이 소유한 데이터센터의 지붕은 무려 100만 제곱피트에 달해 빗물 집수 효과가 두드러지게 나타날 것으로 예상된다.

다만 일각에서는 빗물 집수 시설을 구축하는 데 드는 초기 비용이 부담이란 반응도 적지 않다. 데이터센터에 빗물 집수 시설을 설치하려면 제곱피트당 2~5달러가 든다. 일반적인 지붕 크기인 10만 제곱피트라고 가정했을 때 20~50만 달러가 소요되는 셈이다.

그럼에도 전문가들은 빗물 집수 시설을 설치하는 것이 장기적으로 이익이 될 가능성이 높다는 의견이다. 태양광 패널과 마찬가지로 일회성 투자로 오랫동안 이익을 가져갈 수 있기 때문이다. 실제로 데이터센터가 많이 설치된 미국 텍사스 댈러스(Dallas)에서는 빗물 집수로 데이터센터 냉각 수요의 최대 3분의 1까지 충당할 수 있다는 분석도 나왔다.

빗물 집수, 친환경 정책 수혜 기대

빗물 집수에 대한 인식이 긍정적으로 변한 것은 비교적 최근이다. 수년 동안 일부 주와 지자체에서는 빗물 집수를 제한했다. 빗물이 산성비처럼 불순물과 결합해 있어 이를 사용할 수 없다는 시각과, 빗물이 하천으로 흘러가는 것을 막으면 하천이 마를 수 있다는 견해가 만연했기 때문이다.

하지만 빗물 집수가 친환경적이라는 증거가 쌓이면서 빗물 집수에 대한 신뢰도 역시 올라갔다. 이에 미국 여러 주에서도 빗물 집수를 승인하는 추세다. 애리조나 투손(Tucson)과 텍사스 오스틴(Austin) 지역의 경우 인센티브를 제공해 빗물 집수를 적극 장려하고 있기도 하다. 이에 기업들도 발 빠르게 빗물 집수 시설을 구축하고 있다. 구글은 사우스캐롤라이나에 있는 데이터센터에 빗물 집수 시설을 구축했으며, MS는 스웨덴에 위치한 데이터센터에 빗물 집수 시설을 설치해 지역 수자원에 대한 의존도를 대폭 낮췄다.

게다가 빗물 집수 시설은 친환경 정책의 수혜자로 더욱 빠르게 보급될 것으로 예상된다. 인플레이션 감축법(IRA)을 통해 270억 달러(약 37조9,000억원)의 투자를 받은 그린뱅크(Green bank)는 조만간 빗물 집수 프로젝트에 자금을 지원할 계획이라고 밝혔다. 그린뱅크는 친환경 인프라를 구축하기 위해 설립된 기관으로, 이번에는 빗물 집수 프로젝트에 관심을 가진 것이다. 추가로 빗물 집수 시설은 재생가능 에너지 법안에 따라 세금 공제 혜택까지 받을 수 있어 보급 속도가 한층 더 빨라질 것으로 전망된다.

원문의 저자는 저스틴 탈봇 존(Justin Talbot Zorn) 워싱턴 경제정책연구센터의 선임 고문과 베티나 바르부르크(Bettina Warburg) AI 및 새로운 기술에 관심이 많은 작가입니다. 영어 원문은 Rainwater Could Help Satisfy AI’s Water Demands | Scientific American에 게재돼 있습니다.

Picture

Member for

1 month 3 weeks
Real name
전웅
Position
연구원
Bio
[email protected]
흥미로운 데이터 사이언스 이야기를 정확한 분석과 함께 전하겠습니다.

[해외 DS] 허위 정보에도 필요한 '예방접종', 면역력 증강이 핵심

[해외 DS] 허위 정보에도 필요한 '예방접종', 면역력 증강이 핵심
Picture

Member for

1 month 3 weeks
Real name
전웅
Position
연구원
Bio
[email protected]
흥미로운 데이터 사이언스 이야기를 정확한 분석과 함께 전하겠습니다.

수정

소셜 미디어 타고 빠르게 퍼지는 허위 정보
허위 정보 연구진, 전염병에서 아이디어 얻어
허위 정보에 휘둘리지 않으려면 면역력 키워야

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 글로벌AI협회(GIAI)에서 번역본에 대해 콘텐츠 제휴가 진행 중입니다.


허위 정보가 퍼져나가는 과정은 마치 전염병을 연상시킨다. 보균자가 바이러스를 퍼뜨려 병을 옮기듯 소셜 미디어에 허위 정보가 돌아다니면 사람들은 허위 정보에 속아 넘어간다. 이러한 유사점에서 영감을 얻은 과학자들은 전염병 연구에 사용되는 수학 모형을 활용해 허위 정보가 퍼져나가는 모습을 모형화했다. 더불어 해당 모형을 통해 허위 정보에도 ‘예방접종’이 효과적임을 입증했다.

Misinformation_SA_20241108
사진=Scientific American

늘어나는 허위 정보, 낮아지는 신뢰도

소셜 미디어가 발달하면서 다양한 허위 정보가 온라인을 통해 확산하고 있다. 특히 올해 미국 대선 기간에는 그 정도가 더욱 심했다. 정부가 날씨를 통제해 허리케인을 발생시켰다는 ‘날씨 조작’ 음모론이 퍼지는가 하면 "아이티 이민자들이 이웃 애완동물을 몰래 잡아가 먹었다"는 도널드 트럼프 미국 대통령 당선인의 황당한 발언까지 소셜 미디어를 타고 빠르게 퍼져나갔다.

이를 두고 일각에서는 이렇게 허위 정보가 빠르게 확산하는 데 일론 머스크 테슬라 최고경영자(CEO)도 일조했다는 주장이 나온다. 실제 날씨 조작 음모론에서 주목할 점은 X(옛 트위터)에 허위 정보를 유포한 계정이 대부분 '블루 체크' 마크를 달고 있다는 점이다. 머스크가 트위터를 인수하기 이전만 해도 블루 체크는 '해당 계정은 진짜'란 의미였다.

하지만 머스크가 인수하고 난 뒤 유료 서비스에 가입하기만 하면 블루 체크를 달 수 있게 됐다. 문제는 블루 체크를 달고 있으면 게시글의 사실 여부를 막론하고 알고리즘에 의해 더 자주 노출된다는 점이다. 이에 허위 정보 유포자들은 블루 체크를 달고 사람들에게 손쉽게 허위 정보를 노출할 수 있었다.

전염병 확산 모형, 허위 정보에 적용

이처럼 허위 정보가 판치면서 사람들의 우려도 깊어지고 있다. 실제로 미국인 중 73%는 오해의 소지가 있는 뉴스를 본 적이 있다고 했으며, 허위 정보를 구분하는 일은 간단하지 않다고 답했다. 일부는 허위 정보를 자주 접하다 보니 정보의 신뢰도가 현저히 낮아졌다며 불만의 목소리를 표하기도 했다.

이에 샌더 반 데르 린덴(Sander van der Linden)은 케임브리지대학(University of Cambridge) 심리학 교수를 비롯한 연구진은 날로 심각해지는 허위 정보를 파악하고자 나섰고, 전염병 연구에서 돌파구를 찾았다. 전염병 확산을 모형화하고자 만든 수학 모형을 허위 정보가 확산하는 과정에 똑같이 적용한 것이다. 허위 정보에 적용한 수학 모형은 감염병 연구에서 가장 기초가 되는 SIR 모형으로, 감염 대상군(Susceptible)-감염군(Infected)-회복군(Recovered) 간의 역학 관계를 계산하는 모형이다.

학계에서도 SIR 모형을 허위 정보에 적용하는 것이 합리적이라는 반응이다. 전염병이 퍼져나가는 과정과 허위 정보가 퍼져나가는 과정이 비슷하기 때문이다. 허위 정보도 이를 퍼뜨리는 전파자가 있으며 허위 정보에 노출된 사람 중 일부는 이를 믿고 일부는 믿지 않는다. 또한 자신도 모르게 허위 정보에 노출된 사람은 무증상 전파자처럼 별다른 죄책감 없이 허위 정보를 퍼뜨리기도 한다.

무엇보다 SIR 모형을 허위 정보에 적용했을 때 허위 정보가 퍼져나가는 수치를 계산할 수 있다는 점에서 매력적이다. 예를 들어 허위 정보에 감염된 개인이 평균적으로 몇 명에게 허위 정보를 옮기는지 제시할 수 있다. 이를 전염병 연구에서는 기본재상산계수(R0)라고 표현하며 대부분 소셜 미디어 플랫폼은 이 수치가 1보다 큰 것으로 추정된다.

허위 정보 예방접종 ‘프리벙킹’

소셜 미디어에서 빠르게 퍼지고 있는 허위 정보를 제어하고자 연구진은 예방접종과 유사한 맥락인 ‘프리벙킹(Prebunking)’을 제안했다. 프리벙킹이란 허위 정보가 확산하는 과정을 자세히 보여줌으로써 사람들에게 허위 정보에 대한 면역력을 심어주는 방법이다. 기존에는 허위 정보 확산을 막기 위해 허위 정보에 반박하는 디벙킹(Debunking)이 주로 사용됐다. 하지만 정보의 확산이 빨리지면서 한계를 맞이했고, 이러한 한계를 극복하고자 연구진은 관점을 바꿔 프리벙킹을 제시했다. 확산 속도를 따라잡을 수 없다면 면역력을 가져 허위 정보에 감염되지 않도록 하겠다는 것이다.

연구진은 시뮬레이션을 통해 프리벙킹의 효과를 입증했다. 시뮬레이션하는 대상은 전염병과 유사하게 감염 대상군(Susceptible)-허위 정보 감염군(Disinformed)-면역군(Vaccinated)으로 정의한 뒤, 프리벙킹을 하지 않은 집단과 한 집단 간의 움직임을 살펴봤다. 그 결과 허위 정보가 가장 심할 때, 프리벙킹을 하지 않은 집단은 감염된 비율이 80%를 넘긴 반면, 프리벙킹을 한 집단은 그 비율이 40%를 넘지 않았다.

Misinformation_figure_SA_20241108
프리벙킹을 하지 않은 집단(왼쪽), 프리벙킹을 한 집단(오른쪽)/출처=Scientific American

연구진은 프리벙킹을 통해 허위 정보에 면역력을 갖는 것이 가장 중요하다고 힘줘 말했다. 인공지능(AI)이 허위 정보를 자동으로 생성하는 시대에 이를 하나하나 반박하기란 사실상 불가능하기 때문이다. 일각에선 AI가 생성한 허위 정보를 AI로 잡아내면 되지 않느냐는 의견도 나오지만, AI의 특성을 고려하면 쉽지 않을 것이라는 분석이 지배적이다. AI는 단어 간의 상관관계를 파악해 글을 자동으로 생성하는 데는 유용하지만, 그 글의 사실 여부를 판단하는 데는 효과적이지 않다.

원문의 저자는 샌더 반 데르 린덴(Sander van der Linden) 케임브리지대학(University of Cambridge) 심리학 교수와 데이비드 로버트 그라임스(David Robert Grimes) 과학자입니다. 영어 원문은 Misinformation Really Does Spread like a Virus, Epidemiology Shows | Scientific American에 게재돼 있습니다.

Picture

Member for

1 month 3 weeks
Real name
전웅
Position
연구원
Bio
[email protected]
흥미로운 데이터 사이언스 이야기를 정확한 분석과 함께 전하겠습니다.

[해외DS] 美 대선 여론조사, 이번엔 믿어도 될까?

[해외DS] 美 대선 여론조사, 이번엔 믿어도 될까?
Picture

Member for

1 month 3 weeks
Real name
김광재
Position
연구원
Bio
[email protected]
균형 잡힌 시각으로 인공지능 소식을 전달하겠습니다.

수정

여론조사 응답률 1%까지 감소, 표본 왜곡 우려 ↑
과거 선거 결과 반영한 가중치에도 사라지지 않는 근본적 한계
시뮬레이션조차 선거 결과 정확히 예측 못 해

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 글로벌AI협회(GIAI)에서 번역본에 대해 콘텐츠 제휴가 진행 중입니다.


여론조사 결과는 선거 보도와 전략, 유권자들의 판단에 큰 영향을 미친다. 그러나 최근 여론조사의 신뢰성에 대한 의문이 커지고 있다. 마이클 베일리(Michael Bailey) 조지타운대 미국정치학 교수이자 '기로에 선 여론조사: 설문조사 방식을 다시 생각하다(Polling at a Crossroads: Rethinking Modern Survey Research)'의 저자는 “우리는 큰 오류에 취약한 기법을 사용하고 있다”고 지적했다. 특히 지난 두 번의 대선에서 트럼프 지지율이 과소평가되면서 이러한 문제가 두드러졌다. 여론조사 기관들은 이 같은 실수를 교훈 삼아 개선에 나서고 있지만, 아직까지 확실한 해결책은 찾지 못한 상황이다.

Election_Polling_Became_Less_Reliable_ScientificAmerican_20241105
사진=Scientific American

더 이상 여론조사에 응답하지 않는 사람들

여론조사의 성공 여부는 표본의 질에 크게 좌우된다. 응답자가 많고 표본의 대표성이 높을수록 데이터의 신뢰도 역시 높아진다. 그런 점에서 20세기 후반 유선 전화의 보급은 여론조사에 황금기를 가져왔다. 이 시기 여론조사 기관들은 무작위 전화 통화를 통해 다양한 인구 집단의 의견을 수집할 수 있었으며, 응답률도 약 60%로 안정적이었다.

하지만 최근에는 발신자 표시, 문자 메시지의 증가, 스팸 메시지 확산 등 기술적 변화로 인해 전화를 받거나 원치 않는 문자에 응답하는 사람이 거의 없다. 권위 있는 뉴욕 타임스와 미국 시에나 칼리지의 여론조사조차 응답률이 약 1%에 불과하다. 이로 인해 여론조사에 응답하는 사람들은 대체로 예외적인 경우가 많아, 자발적 응답이 예측에 반영될 경우 심각한 편향이 발생할 수 있다.

“응답률이 1%까지 떨어지면 더 이상 무작위 표본이라 할 수 없다. 사실상 게임은 끝난 셈이다”라고 베일리 교수는 단호히 말했다. 제한된 데이터를 유의미한 통찰로 전환하기 위해 여론조사 기관들은 점점 더 복잡한 모델링에 의존하고 있다. 일반적으로 이러한 기법은 나이, 인종, 성별, 정치 성향 같은 주요 변수에 맞춰 왜곡된 표본에 가중치를 부여해 전체 유권자 집단을 반영하려는 것이다. 이론상으로는 편향된 소수의 응답을 통해 전체 유권자에 대한 통계를 추정할 수 있도록 돕는 방식이다.

무작위 표본 추출의 황금기에는 여론조사가 “과학적 방법에 기반해 정해진 절차에 따라 확률적인 결과를 내는 방식이었다”고 베일리 교수는 설명했다. 그러나 “이제는 원본 데이터에 여러 모델링 결정을 계속 덧붙여야 하고, 그 가정들이 맞기를 바랄 뿐이다”라고 그는 덧붙였다.

모델의 가정이 틀렸다면?

여론조사 기관들은 데이터를 실제 유권자 집단 비율에 맞추기 위해 신중하고 정교한 결정을 내린다. 하지만 결국 이 역시 학문적인 추측에 불과하며, 가정에 따라 결과가 달라질 수 있다. “합리적인 가정들이지만 서로 다를 수 있다. 어느 가정이 맞는지 알 수 없다”고 조지워싱턴대 데이비드 카프(David Karpf) 미디어·공공문제 교수는 강조했다.

여론조사의 정확도는 11월 5일(현지 시각 기준) 실제 유권자들이 내리는 결정에 달려 있다. 그러나 이는 근본적으로 알 수 없는 부분이며, 여론조사 전문가들이 지난 두 번의 선거에서 실수한 이유이기도 하다. 2016년 전체 여론조사의 88%가 힐러리 클린턴의 지지율을 과대평가했다. 조사 결과, 저학력 백인 유권자 중 트럼프 지지층을 크게 놓쳤으며, 교육 수준을 반영해 데이터를 가중하지 않은 것이 주요 원인으로 드러났다. 2020년에는 교육 수준 가중치를 추가했지만, 이번에는 인구 통계 외의 다른 요소를 포함하지 않아 비슷한 문제가 반복됐다. 조 바이든 미국 대통령이 승리할 것이라는 예측은 맞았지만, 여론조사의 93%가 그의 우세를 과대평가했다.

더욱이 2020년 선거는 여론조사 기관들이 의존하던 인구통계 변수만으로는 트럼프 지지를 완전히 설명하기 어렵다는 사실을 드러냈다. 이에 올해 많은 여론조사 기관들이 이를 보완하기 위해 더 직접적인 접근을 사용하고 있다. 바로 응답자가 지난 선거에서 누구에게 투표했는지를 기준으로 가중치를 부여하는 '회상 투표 가중치'(recall-vote weighting) 방식이다. 이 방식은 2024년 여론조사를 2020년의 투표율에 맞추는 효과를 내며, 결과적으로 트럼프의 지지율이 다소 부풀려지는 결과를 낳는다.

하지만 이 기법에는 몇 가지 치명적인 한계가 있다. 우선 2024년의 유권자 집단이 2020년과 동일할지는 알 수 없다. 특히 2022년 중간선거에서 여성 유권자들의 높은 투표율을 고려하면 그 가능성은 더욱 낮아진다. 게다가 4년 동안 유권자 구성은 크게 변할 수 있다. 일부 유권자들은 사망하고, 새로운 유권자들이 18세가 되어 투표권을 얻으며, 많은 사람들이 다른 주로 이주한다. 또한 4년 전 자신이 누구에게 투표했는지에 대한 질문에 신뢰할 만한 답을 하지 않는 경우도 있을 수 있다.

사실 가장 우려되는 부분은 이 기법의 근본적인 한계 점이다. 여론조사 기관들은 단순히 표본 내 트럼프 지지자의 비율을 맞추는 것뿐만 아니라, 실제로 트럼프 지지층을 제대로 반영해야 한다. 만약 표본이 2020년 트럼프 지지자를 충분히 대표하지 못한다면, 회상 투표 가중치로는 이 문제를 해결할 수 없다. “2020년에 트럼프에게 투표했지만 지금은 그에게 실망한 사람을 떠올려보라. 그런 사람은 여론조사에 응답하지 않을 수도 있다”고 베일리 교수는 짚었다. 민주당 측에서도 비슷한 현상이 발생할 수 있다. 결국, 회상 투표 가중치를 사용해도 여론조사 결과가 왜곡될 가능성은 남아 있다.

선거 시뮬레이션도 큰 도움 안 돼

개별 여론조사가 신뢰하기 어렵다면, 여론조사 집계 사이트의 상황은 어떨까? 이들 사이트는 수십 개에서 많게는 수백 개의 설문조사 결과를 결합하고, 538(전 파이브서티에이트)의 설립자이자 대선 예측의 '귀재'로 불리는 네이트 실버(Nate Silver)가 대중화한 선거 시뮬레이션 방식을 자주 사용한다. 이렇게 수집된 여론조사 데이터를 기반으로 약 10,000번의 선거 시뮬레이션을 실행해 결과를 예측하는 것이다.

그러나 일반인들에게는 이런 시뮬레이션이 큰 도움이 되지 않는다. 예를 들어 2016년 538은 클린턴이 71.4%의 시뮬레이션에서 승리할 것으로 예측했다. 그렇다면 트럼프가 승리한 28.6%의 현실을 우리는 어떻게 받아들여야 할까? 특정 시점의 후보 지지율을 보여주는 대신 선거 결과를 예측하려는 이러한 시도는, 2016년 여론조사 실패 이후 미국 여론조사협회 보고서에서 많은 비판을 받았다.

크리스틴 올슨(Kristen Olson) 네브래스카 링컨대 사회학 교수는 “미디어와 정치적 담론에서 이러한 여론조사 집계 사이트가 큰 비중을 차지하고 있다”며, “그들은 알 수 없는 오류가 포함된 모델 입력값을 사용했고, 투명하지 않았다”고 경고했다. 그는 “오늘 수업 시간에 예시로 보여줬는데, 538의 여론조사 목록 중 몇 곳을 클릭해보면 ‘이 사람들이 누구지?’라는 생각이 들 정도다. 그들의 배경을 전혀 알 수 없는 경우도 있어 놀랍다”고 말했다. 일부 기관은 당파적 성향이 뚜렷하며, 다른 곳은 조사 방법조차 공개하지 않았다고 덧붙였다. 그는 이러한 상황이 “과학적 기준에서 보면 균형 잡힌 접근과는 거리가 멀다”고 강조했다.

또한 538 예측 페이지에서도 언급하듯이 여론조사 결과가 접전이라고 해서 선거 결과가 꼭 접전이라는 의미는 아니다. 현재 후보들 간의 승률이 팽팽해 보이지만, 승자는 여전히 상당한 차이로 선거인단 투표에서 승리를 거둘 가능성이 있다.

“지금 대중이 겪는 어려움은 여론조사를 보면서 미래가 어떻게 될지 궁금해한다는 것이다. 그러나 여론조사는 그 답을 제공할 수 없다”고 카프 교수는 말한다. 그는 여론조사가 또다시 트럼프의 지지율을 과소평가하고 그가 패배할 경우, 최종 결과가 오차 범위 내에 있더라도 선거 부정 주장의 근거로 활용될 수 있다고 설명했다. 물론 이러한 문제는 여론조사 기관이 직접 해결할 수 있는 부분은 아니지만, 그들이 직면한 현실의 일부이며 회상 투표 가중치 적용 여부에 영향을 미칠 수 있다는 것이다.

이번 선거에서는 여론조사가 그 어느 때보다도 사람들에게 큰 위안을 주지 못하고 있다. 전문가들뿐만 아니라 여론조사 기관들조차 여론조사 결과를 멀리할 것을 조언하고 있다. 결국 선거일에 어떤 일이 벌어질지는 그날이 되어야만 알 수 있다.

원문의 저자는 앨리슨 파샬(Allison Parshall) 사이언티픽 아메리칸 부편집장입니다. 영어 원문은 Why Election Polling Has Become Less Reliable | Scientific American에 게재돼 있습니다.

Picture

Member for

1 month 3 weeks
Real name
김광재
Position
연구원
Bio
[email protected]
균형 잡힌 시각으로 인공지능 소식을 전달하겠습니다.

[해외 DS] 선거철에 조심해야 하는 유언비어 세 가지

[해외 DS] 선거철에 조심해야 하는 유언비어 세 가지
Picture

Member for

1 month 3 weeks
Real name
전웅
Position
연구원
Bio
[email protected]
흥미로운 데이터 사이언스 이야기를 정확한 분석과 함께 전하겠습니다.

수정

연구진, 선거철에 유행하는 유언비어 유형 밝혀내
유언비어 세 가지 “비시민권자 투표, 상대편 계략, 의심스러운 사진”
“유언비어 유형 인지해야 자신만의 투표할 수 있어”

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 글로벌AI협회(GIAI)에서 번역본에 대해 콘텐츠 제휴가 진행 중입니다.


미국 대선이 한 발 앞으로 다가오면서 유언비어가 난무하고 있다. 특히 이번 대선은 전례 없는 혼전 양상을 보여 이를 먹이 삼아 유언비어가 급속도로 퍼졌다. 이에 허위 정보 전문가들은 정부 차원에서 유언비어에 신속하게 대응하지 않으면 대중의 혼란은 한층 더 가속화될 것이라고 경고했다.

Rumor_SA_20241028
사진=Scientific American

사건·사고를 먹이 삼는 유언비어

이번 대선은 역대급으로 말도 많고 탈도 많은 대선으로 평가된다. 연임을 꿈꿨던 조 바이든 대통령은 선거를 4개월도 남겨두지 않은 상황에서 사퇴를 선언했고, 그 자리를 해리스 부통령이 이어받았다. 그런가 하면 도널드 트럼프 공화당 대통령 후보는 펜실베이니아주 버틀러에서 야외 유세를 하던 중 암살 시도를 당했다. 다행히 치명상은 피했으나, 전 세계를 큰 충격에 빠트렸다.

케이트 스타버드(Kate Starbird) 워싱턴대(University of Washington) 컴퓨터 과학자는 선거철에 발생하는 사건·사고가 유언비어를 퍼뜨리기 좋은 환경을 마련한다며 이번 대선에서의 유언비어는 지난 대선과 비교할 수 없을 정도로 심할 것으로 예상했다. 이에 스타버드 컴퓨터 과학자를 필두로 한 연구진은 실시간으로 퍼지는 유언비어를 확인하고 그 유형을 찾는 데 힘썼다. 노력 끝에 연구진은 자주 나타나는 유언비어 세 가지 유형을 파악했다.

첫 번째 유언비어, 비시민권자 투표

첫 번째로 연구진은 비시민권자 투표에 관한 유언비어를 조심할 것을 당부했다. 이러한 유언비어는 틱톡이나 인스타그램과 같은 소셜 미디어 플랫폼에서 자주 등장하는데, 주로 길거리 인터뷰 동영상을 통해 비시민권자가 유권자로 등록하거나 투표했다는 식으로 나타난다. 이에 전문가들은 “편집과 부정확한 자막을 활용해 일부 동영상이 사람들에게 잘못된 인상을 심어준다”며 우려를 표했다.

연구진은 이러한 상황이 처음이 아니라고 설명했다. 2016년 1월 당시 대통령이었던 트럼프는 불법 이민자 300~500만 명이 투표하게 됐고, 이는 자신에게 불리하게 적용됐다고 주장했다. 하지만 이는 근거 없는 주장이었다. 미국에서 다수의 비시민권자가 불법 투표했다는 증거는 어디에서도 찾아볼 수 없었기 때문이다. 실제로 2016년 42개 관할 구역을 대상으로 조사했으나, 2,350만 표 중 약 30표만이 비시민권자의 표인 걸로 드러났다. 유언비어의 무서운 점은 사실이 밝혀졌음에도 유언비어는 사라지지 않고 영향력을 행사한다는 점이다. 트럼프의 발언 이후 이민자를 대상으로 한 수사가 계속 증가하고 있는 현상이 이를 말해준다.

두 번째 유언비어, 상대편 계략

다음 유언비어로는 특정 사건을 두고 무조건 상대편 계략이라고 치부하는 것이다. 이를테면 지난 9월 말 플로리다 팜비치 카운티에서 군인과 해외 유권자를 대상으로 250여 개의 전자 투표용지를 메일로 보냈다. 하지만 해당 메일에는 엄청난 오류가 있었는데, 민주당 부통령 후보인 팀 월즈(Tim Walz)의 철자가 톰 월즈(Tom Walz)로 잘못 기재돼 있었다. 해당 오류는 황급히 수정됐지만, 민주당 지지자들은 “공화당의 계략” 아니냐며 의심을 보냈다.

후보자 이름을 잘못 기재한 것과 같은 정치적 사건은 소셜 미디어를 통해 널리 퍼진다. 유언비어는 이러한 사건을 먹이 삼아 덩치를 키우는 것이다. 게다가 소셜 미디어 플랫폼은 정치적 유언비어를 빠르게 확산할 준비가 되어 있으며 인플루언서들은 정치적 사건을 교묘하게 조작해 사람들을 혼란에 빠트린다.

세 번째 유언비어, 의심스러운 사진

마지막으로 연구진은 개표 기간에 의심스러운 사진을 소셜 미디어에 유포해 유언비어를 퍼뜨린다고 설명했다. 예를 들어 한 사람이 의심스러운 장비를 들고 개표 시설에 들어가는 모습이 소셜 미디어에 떠돌아다니거나 혹은 유권자의 투표용지를 실은 것으로 의심되는 차량이 투표소로 이동하는 동영상과 목격담이 널리 퍼진다. 이러한 유언비어는 선거가 조작됐다고 믿게 해 투표 결과를 신뢰할 수 없게 만들며 이는 대통령에 대한 불신으로 이어진다.

실제로 해당 전략은 2020년 미국 대통령 선거 결과에 이의제기하고자 사용됐다. 의심스러운 상자를 찍은 사진이 소셜 미디어에 퍼졌고 의심스러운 차량이 투표소로 들어가는 것도 널리 퍼졌다. 하지만 진실은 의심스러운 상자는 미시간주 디트로이트의 한 지역 신문사의 사진기자 것이었으며 차량은 선거 관리자들이 투표소에서 개표장으로 투표용지를 운반하기 위해 사용한 차량으로 밝혀졌다.

마지막으로 연구진은 유언비어에 흔들리지 않기 위해서는 세 가지 유언비어 유형을 꼭 숙지할 것을 강조했다. 이를 통해 유언비어와 소셜 미디어 간의 역학 관계를 이해하고 비로소 자신만의 투표를 할 수 있게 된다고 설명했다. 더불어 연구진은 언론인에게 청중이 오해할 만한 기사를 쓰지 않을 것을 당부하며 국민이 유언비어와 정치적 조작에 놀아나지 않길 바란다는 마음을 전했다.

원문의 저자는 케이트 스타버드(Kate Starbird) 워싱턴대(University of Washington) 컴퓨터 과학자입니다. 영어 원문은 These Are the Rumors and Misinformation to Watch for on Election Day | Scientific American에 게재돼 있습니다.

Picture

Member for

1 month 3 weeks
Real name
전웅
Position
연구원
Bio
[email protected]
흥미로운 데이터 사이언스 이야기를 정확한 분석과 함께 전하겠습니다.

[해외 DS] GPS를 통한 자녀 위치추적, 진정 자녀를 위한 것인가

[해외 DS] GPS를 통한 자녀 위치추적, 진정 자녀를 위한 것인가
Picture

Member for

1 month 3 weeks
Real name
전웅
Position
연구원
Bio
[email protected]
흥미로운 데이터 사이언스 이야기를 정확한 분석과 함께 전하겠습니다.

수정

과도한 위치추적, 부모와 자녀 간의 ‘벽’ 세워
위치추적 실용성 의문 “실제 위험은 스마트폰 안에 있어”
자녀와 진실한 대화를 통해 적절한 타협책 찾아야

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 글로벌AI협회(GIAI)에서 번역본에 대해 콘텐츠 제휴가 진행 중입니다.


부모 중 절반이 스마트폰을 통해 자녀의 위치를 추적하고 있는 것으로 나타났다. 이는 자녀가 위험에 처하거나 나쁜 길로 빠지는 것을 막을 수 있다는 명분에서다. 하지만 이러한 부모의 행동은 자칫하면 자녀의 자율성 발달에 악영향을 미칠 뿐만 아니라 그 정도가 심하면 부모와 자녀 간의 관계가 완전히 틀어져 버릴 수 있다. 전문가들은 부모의 마음은 이해하나, 위치추적을 통해 얻는 것보다 잃는 게 더 많을 것이라고 조언했다.

GPS_SA_20241025
사진=Scientific American

지나친 간섭은 자녀의 성장을 망치는 ‘독’

스마트폰은 이제 중학생은 물론 초등학생도 심심찮게 가지고 있을 만큼 보편화됐다. 부모는 스마트폰을 사주는 게 자녀를 나쁜 길로 인도한다는 생각에 찝찝한 마음이 든다. 하지만 한편으로 다른 아이들이 모두 가지고 있는 것을 못 가져 소외감을 느끼게 하고 싶지 않은 게 부모의 마음이다. 게다가 스마트폰은 부모가 자녀와 멀리 떨어져 있어도 연락할 수 있어 안도감을 준다. 최근에는 연락을 넘어 위치추적 앱을 통해 자녀의 위치를 손쉽게 확인할 수 있다. 하지만 위치추적으로 부모의 마음은 한층 편해질지 몰라도 자녀는 지나친 간섭을 받는다는다고 느낄 수 있음을 항상 조심해야 한다.

그러나 범죄가 난무한 나라에서는 위치추적이 과민 반응이 아니라는 의견도 나온다. 학교 총기 사고, 펜타닐 복용 등 각종 범죄가 일어나는 상황에서 부모가 아무런 조치를 취하지 않는 게 오히려 무책임하다는 이유에서다.

그럼에도 소피아 슈카스 브래들리(Sophia Choukas-Bradley) 피츠버그대(University of Pittsburgh) 심리학 부교수는 “청소년기는 부모에게서 벗어나 자율성과 독립성을 추구하는 단계”라며 청소년기에 지나친 간섭은 독이 될 수 있음을 강조했다. 청소년기에 독립적으로 생활하면서 책임감을 키우고 스스로 결정하는 법을 배워 자신만의 가치 체계를 확립해야 한다고 덧붙였다.

더군다나 심한 간섭은 반항심으로 이어질 수 있다. 청소년기는 부모의 말 한마디에도 감정 변화가 클 만큼 예민한 시기다. 이러한 시기에 위치추적을 통한 간섭은 자녀에게 반항심을 심어주고 감시당하는 것에 지친 자녀는 휴대폰을 끄거나 문자 메시지를 무시하는 등 부모와의 관계를 회피하게 될 수 있다. 한 번 틀어진 관계는 되돌리기 어려운 만큼 부모의 섬세한 행동이 중요하다.

더 많은 위협은 스마트폰 안에

무엇보다 위치추적이 자녀를 위험에서 구해낼 수 있는지 의문이라는 의견이 나온다. 사이버 괴롭힘, 소셜 미디어 중독 등 자녀에게 노출된 위험은 물리적 환경보다 스마트폰 안에서 자주 발생한다. 미국 질병통제예방센터에 따르면 지난 몇 년간 우울증 같은 정신 질환을 겪는 청소년이 급증한 것으로 나타났다. 이는 소셜 미디어가 발달하면서 타인의 생활을 들여다볼 수 있게 됐고 자연스럽게 타인과 자신을 비교하면서 생긴 결과로 해석된다. 특히 청소년들은 소셜 미디어에 등장하는 인플루언서를 선망의 대상으로 삼아 비정상적인 미의 기준을 가지기도 한다. 실제로 소셜 미디어가 발달한 이후 많은 청소년들이 섭식 장애를 앓고 있는 것으로 알려졌다.

심지어 소셜 미디어는 새로운 범죄의 창구로 이용되기도 한다. 최근 화두에 오른 청소년 딥페이크 문제를 비롯해 마약 유통, 범죄 과시 등이 소셜 미디어를 통해 이루어지고 있는 상황이다. 따라서 스마트폰 시대에 자녀에게 도사리는 위험은 물리적 환경보다 스마트폰 안에 자리 잡고 있다. 이를 두고 슈카스 브래들리 교수는 “온라인 활동에는 적절한 제한을 두지 않으면서 위치추적을 통해 자녀의 행동반경을 제한하는 것은 무의미하다”라며 위치추적의 실효성을 두고 고개를 갸우뚱했다.

위치추적, 꼭 필요한 상황에서만 쓰여야

그럼에도 부모가 자녀를 혼자 내버려 둘 수 없어 위치추적을 사용하기로 했다면, 자녀와 숨김없는 대화를 통해 적절한 타협점을 찾는 게 중요하다. 파멜라 위스니에브스키(Pamela Wisniewski) 청소년 온라인 안전 연구원이자 밴더빌트대 사회기술 상호작용 연구소(Socio-Technical Interaction Research Lab at Vanderbilt University) 책임자는 자녀와 위치추적 수준에 대해 정기적으로 열린 대화를 나눌 것을 강조했다. 부모와 자녀 간의 합의된 위치추적 수준이 생기면, 자녀도 부모에게 마냥 간섭당하는 기분을 느끼지는 않을 것이라고 덧붙여 설명했다.

또한 슈카스 브래들리 교수는 위치추적은 꼭 필요한 상황에서만 사용할 것을 권장했다. 예를 들어 자연재해나 학교 총격 사건과 같은 긴급 상황이 발생했거나 자녀가 약속 장소에 없을 때만 제한적으로 사용해야 한다는 의견이다. 마지막으로 위치추적이 자녀의 안전과 성장을 위해서라기보다는 부모가 스스로 안도감을 느끼기 위해 사용되고 있는 게 아닐까?

원문의 저자는 시라 노박(Sara Novak) 설리번스 아일랜드에서 일하는 과학 작가입니다. 영어 원문은 How GPS Tracking of Teens 24/7 Impacts Parent-Child Relationships | Scientific American에 게재돼 있습니다.

Picture

Member for

1 month 3 weeks
Real name
전웅
Position
연구원
Bio
[email protected]
흥미로운 데이터 사이언스 이야기를 정확한 분석과 함께 전하겠습니다.

[해외 DS] 올해 노벨상, AI가 아니라 수상자의 ‘업적’에 주목해야

[해외 DS] 올해 노벨상, AI가 아니라 수상자의 ‘업적’에 주목해야
Picture

Member for

1 month 3 weeks
Real name
전웅
Position
연구원
Bio
[email protected]
흥미로운 데이터 사이언스 이야기를 정확한 분석과 함께 전하겠습니다.

수정

노벨 물리학상, 인공신경망 구현한 공로 인정
단백질 구조 예측에 혁신 일으킨 딥마인드
단, 미래 노벨 과학상은 모두 AI 연구자의 몫이라는 반응은 과해

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 글로벌AI협회(GIAI)에서 번역본에 대해 콘텐츠 제휴가 진행 중입니다.


인공지능(AI) 연구자가 올해 노벨 물리학상과 화학상을 받은 가운데, 앞으로 노벨 과학상은 모두 AI 연구자에게 돌아가는 것 아니냐는 우려가 나온다. 하지만 노벨위원회가 공로를 인정한 것은 전반적인 AI 연구가 아니라 해당 부문에서 기여한 막대한 업적이다. 전문가들은 AI에 과장된 기대를 갖는 걸 조심하고, 올해 노벨상에서 집중해야 하는 것은 AI가 아니라 그들이 이루어 낸 '업적'이라고 강조했다.

NobelPrize_AI_SA_20241023
사진=Scientific American

두 번의 겨울을 넘어선 AI

최근 들어 AI는 눈부신 발전을 이뤄냈다. AI가 절대 섭렵할 수 없을 것으로 여겨졌던 바둑을 시작으로 영향력을 점차 넓혀갔다. 생성형 AI를 통해 회의록을 요약하거나 이미지 인식을 활용해 불량품을 빠르게 확인하는 등 이전에는 상상 속에 존재했던 일을 실제로 해내고 있다. AI가 생산성 혁신을 이루어 낸 덕분에 업무 효율성은 이전과는 비교할 수 없을 정도로 올라간 상태다.

그러나 AI가 활약하기까지의 여정은 순탄치 않았다. AI는 두 번의 고비를 겪으며 단단한 기반을 갈고 닦았다. 첫 번째 고비는 인공신경망의 시초인 단층 퍼셉트론이 배타적 논리합(XOR) 문제를 해결하지 못한다는 지적이 나온면서였다. 이후 층(layer)을 여러 겹 쌓는 방식인 다층 퍼셉트론으로 배타적 논리합 문제를 해결한 것과 더불어 역전파(Backpropagation) 개념이 나오면서 AI는 다시 희망을 엿봤다. 하지만 다층 퍼셉트론은 어마어마한 계산량이 필요했을뿐더러 계산상의 여러 한계로 AI는 다시 겨울로 접어들었다.

그럼에도 AI 연구자들은 포기하지 않고 연구를 이어 나갔다. 연구진은 다층 퍼셉트론이 이론적으로만 가능할 뿐, 현실에서는 엄청난 계산량으로 구현되지 못하는 것에 아쉬움을 느꼈다. 그러던 중 제한된 볼츠만 머신(Restricted Boltzmann Machine, RBM)이라는 계산법과 이를 적용하기 위한 알고리즘을 만들어 내면서 계산 혁신을 이루어 냈다. 길고 긴 겨울을 지나 AI는 비로소 빛을 볼 수 있었다. AI는 튼튼한 기반을 바탕으로 차차 업적을 이루어 나갔고, 결국 노벨상을 받을만한 업적까지 달성한 것이다.

노벨위원회 "AI 연구자가 이루어 낸 지대한 업적 인정해"

올해 노벨 물리학상과 화학상은 AI 연구자에게 수여됐다. 노벨 물리학상은 홉필드(John Hopfield) 미국 프린스턴대(Princeton University) 교수와 제프리 힌턴(Geoffrey Hinton) 캐나다 토론토대(University of Toronto) 교수에게 돌아갔다. 홉필드 교수는 울퉁불퉁한 지형을 굴러가는 공이 종종 가장 낮은 골짜기로 돌아오는 것을 ‘기억’한다는 직관적인 비유를 생각해 냈다. 한편 힌턴 교수는 층을 더 깊게 할수록 생기는 문제를 한 걸음 한 걸음 해결해 나가며 다층 퍼셉트론을 구현할 수 있게 만들었다. 즉, 노벨 물리학상은 ‘AI와 그 응용’이라는 포괄적인 범위에서 수상한 것이 아니라 물리학을 기반으로 정보에 대한 기초 연구의 공로를 인정한 것이다.

반면 노벨 화학상에서는 AI를 활용한 단백질 구조 예측의 업적을 높이 평가했다. 업적의 주인공은 데미스 허사비스(Demis Hassabis) 딥마인드 CEO와 존 점퍼(John Michael Jumper) 딥마인드 이사다. 이들은 난공불락의 문제로 여겨졌던 단백질 구조 예측에 높은 성과를 보였다. 단백질 구조 예측으로 노벨상을 받을 수 있었던 이유는 인류에게 미칠 지대한 영향력을 인정했기 때문이다. 단백질은 형태가 곧 기능으로 어떤 모양을 가지느냐에 따라 할 수 있는 일이 정해진다. 따라서 단백질 구조를 알게 된다면 신약 개발의 어려움을 한풀 덜어낼 수 있는 것이다.

그러나 단백질 구조 예측은 많은 연구자에게 좌절감을 안겨줬다. 그 이유는 단백질이 가진 복잡한 형태에 있다. 단백질은 얽힌 실타래처럼 복잡하게 접혀 있으나, 어떤 방식으로 접히는지는 밝혀지지 않았다. 게다가 우리가 가진 정보는 단백질의 기본 단위인 아미노산으로 제한된 정보를 갖고 단백질 구조를 예측해야 하는 것이다. 이러한 어려움으로 인해 2018년까지 모든 유전자 데이터베이스에 분류된 단백질은 2억 개지만, 확인된 구조는 0.1%도 되지 않는 15만 개뿐이다. 그러던 중 허사비스와 점퍼는 단백질 구조 예측대회(CASP)에서 알파폴드를 선보여 모두를 놀라게 했다. 알파폴드는 첫 대회에서 경쟁자들과 큰 차이를 내며 우승했고, 두 번째 대회에서는 2억 개의 단백질 접힘 구조를 매우 정확하게 계산해 냈다.

이처럼 노벨위원회가 AI 연구자에게 AI 연구를 했다는 이유만으로 노벨상을 수여한 게 아니라는 해석이 나온다. 다층 퍼셉트론의 핵심인 RBM을 제안한 힌턴 교수와 이러한 모델이 나올 수 있도록 물리학 기초에서 아이디어를 가져온 홉필드 교수는 물리학에 큰 공헌을 했으며, 허사비스와 점퍼는 화학에서 핵심 문제인 단백질 구조 예측에 혁신을 이루어 낸 공로를 인정받았다. 따라서 앞으로 받을 노벨 과학상은 모두 AI 연구자일 것이라는 추측은 과장된 면이 있다는 반응이다.

원문의 저자는 댄 가리스토(Dan Garisto) 프리랜서 과학 저널리스트입니다. 영어 원문은 Don’t Panic. AI Isn’t Coming to End Scientific Exploration | Scientific American에 게재돼 있습니다.

Picture

Member for

1 month 3 weeks
Real name
전웅
Position
연구원
Bio
[email protected]
흥미로운 데이터 사이언스 이야기를 정확한 분석과 함께 전하겠습니다.

[해외DS] 美 아시아·태평양계 의료 데이터, 뭉치면 죽고 흩어지면 산다 ②

[해외DS] 美 아시아·태평양계 의료 데이터, 뭉치면 죽고 흩어지면 산다 ②
Picture

Member for

1 month 3 weeks
Real name
김광재
Position
연구원
Bio
[email protected]
균형 잡힌 시각으로 인공지능 소식을 전달하겠습니다.

수정

하와이 보건부, 코로나19 초기 사회적 요인 고려한 대응 필요성 인식
커뮤니티 맞춤형 데이터 분석, 소규모 커뮤니티 지원에 기여한 사례 多
미 정부, AANHPI 커뮤니티 건강 추적 위한 MOSAAIC 대규모 연구 진행

[해외DS] 美 아시아·태평양계 의료 데이터, 뭉치면 죽고 흩어지면 산다 ①에서 이어집니다.

2020년 초 코로나19 바이러스가 빠르게 확산하던 시기, 하와이 보건부의 전염병 전담팀은 총력을 기울여 대응에 나섰다. 그러나 초기에는 생물학적 시스템을 중심으로 한 접근에 주력했던 것으로 알려졌다. 조슈아 퀸트(Joshua Quint) 하와이주 보건부 역학자는 “사회적 요인을 자세히 파악하는 것이 중요하다”며, 다양한 관점에서의 접근 필요성을 강조했다. 그의 이러한 조언은 이후 하와이가 코로나19 팬데믹 위기를 헤쳐 나가는 데 큰 도움이 됐다. 특히 커뮤니티 의료 데이터를 세분화해 활용한 전략은 많은 생명을 구하는 데 기여했다.

Men's White Dress Shirt
사진=Pixabay

사회적 요인 반영한 맞춤형 의료 대책 마련

코로나19 팬데믹 초기 퀸트 연구원은 텔리 마타기(Tellie Matagi) 하와이주 보건부 태평양 섬 주민 태스크포스 지역사회 보건 리더와 조셉 카홀로쿨라(Joseph Kaholokula) 하와이대학교 암센터 전문의와 협력해 코로나 조사팀을 구성했다. 그러나 이들은 곧 하와이 원주민과 20개 이상의 태평양 섬 주민 커뮤니티 중 어떤 곳이 자원이 필요하며, 어떤 자원이 필요한지를 파악할 방법이 부족하다는 사실을 깨달았다. 당시 제공되던 데이터는 이러한 필요를 정확히 추정하기에는 충분하지 않았기 때문이다.

이에 따라 이들은 COVID 사망자 수를 더욱 구체적인 인구통계학적 세부 정보와 함께 기록하기 시작했다. 다만 소규모 커뮤니티의 경우 개별 식별 위험이 있을 수 있으므로, 이를 방지하면서도 작은 커뮤니티의 정보가 집계에서 빠지지 않도록 별도의 데이터베이스에 해당 세부 사항을 기록하는 방식을 도입했다고 마타기는 밝혔다.

또한 연구팀은 정보를 단순히 수집하는 것에 그치지 않고, 가상 회의와 전화 통화를 통해 커뮤니티와 활발히 공유했다. 그 결과 이 과정에서 세심하게 수집된 데이터는 커뮤니티가 방대한 통계 속에서 그들의 고통과 피해가 묻히지 않도록 돕고, 소외되지 않게 하는 중요한 역할을 했다. 마타기는 이러한 접근 방식이 특히 사모아, 마셜 제도, 추크 섬 등 큰 피해를 겪은 태평양 섬 주민 커뮤니티에 효과적이었다고 전했다.

커뮤니티 맞춤형 접근법의 중요성

나아가 연구팀은 각 커뮤니티와 긴밀히 협력하며 구체적인 필요 사항을 파악했다. 코로나 팬데믹 동안 일부 지역은 감염자와 건강한 가족을 분리할 수 있는 안전한 공간이 필요했고, 다른 지역은 식료품과 의료 자원에 대한 긴급 지원이 절실했다. 또 어떤 커뮤니티는 사회적 유대를 유지하거나 비대면으로 종교 모임에 참여할 방법을 모색했다. 이러한 맞춤형 접근법은 코로나19 팬데믹뿐만 아니라 마우이 화재 당시에도 음식, 거처, 약품 등 특정 요구를 인식하고 맞춤형 지원을 제공하는 데 큰 역할을 했다. 이와 같은 접근법은 이후 세계보건기구(WHO)에서 건강 불평등 해소의 효과적인 방법으로 주목받았다.

맞춤형 접근이 실질적인 변화를 끌어낸 사례는 또 있다. 2000년대 초 뉴욕시에서는 B형 간염 예방 접종이 주로 어린이만을 대상으로 이루어졌다. 성인의 경우, B형 간염이 성병으로 분류되어 HIV 클리닉에서만 검사와 치료를 받는 구조였다. 그러나 아시아계 미국인 이민자들 사이에서는 고국의 높은 감염률로 인해 감염이 흔했음에도 불구하고, 많은 성인이 성병 클리닉 방문을 꺼렸다. 뉴욕대학교 랑곤 헬스의 역학자인 시모나 권은 “아시아계 미국인 성인들에게 성병 클리닉은 편하게 방문할 수 있는 곳이 아니었다”고 설명하며, “커뮤니티마다 건강 우선순위가 다르다”고 덧붙였다.

당시 연구진은 아시아계 미국인의 B형 간염 감염률이 비히스패닉 백인보다 약 50배 높고, 간암 발생률 역시 몇 배나 높다는 사실을 밝혀냈다. 바이러스는 가족 간 접촉, 주방용품 공유, 그리고 출산 시 모자 전염 등을 통해 전파되고 있었다. 이에 2003년 뉴욕대학교 연구팀은 커뮤니티 리더, 정치인, 의료진과 손잡고 이와 같은 불균형 문제를 해결하고자 했다. 연구팀은 시 당국과 협력하여 지역 기반 프로그램을 추진하고, 일차 진료 클리닉과 지역 사회 단체를 통해 성인 대상의 예방 접종이 이뤄질 수 있도록 지원했다. 단순한 감염률 저감뿐 아니라, 사회적·문화적 요인이 치료 선택에 미치는 영향을 이해하는 것이 B형 간염 확산을 막는 중요한 열쇠임을 인식한 것이다.

공정한 사회 위해 통계적 포용성 필요

한편 퀸트 연구원은 인종·민족 데이터를 사용할 때 연구자와 정책 입안자들이 이 요소들만으로 개인의 건강을 단순화하지 않도록 주의해야 한다고 지적했다. 집계된 데이터든 세분화된 데이터든, 인종과 민족은 건강에 영향을 미치는 여러 사회적·문화적 요인을 단순히 반영하는 지표일 뿐이다. 퀸트는 "데이터의 세분화가 인종을 넘어 더 의미 있고 실질적인 방식으로 민족성에 대해 논의할 수 있게 돕는다"고 강조하며, 더 깊이 있는 이해가 필요하다고 전했다.

아울러 마타기는 커뮤니티 맞춤형 접근법을 마련하는 노력이 “실제로 불평등을 줄이는 역할을 한다”고 강조했다. 주 및 커뮤니티 단위에서 이뤄진 연구들이 성공을 거두자, 정책 입안자들은 더 큰 규모의 연구를 시작하고 자금을 확대해 AANHPI 범주 내 다양한 그룹의 건강 상태를 보다 깊이 이해하려는 움직임을 보인다.

작년 백악관은 AANHPI 커뮤니티의 형평성을 우선시하는 정책을 발표했고, 올해 초 국립 심장, 폐, 혈액 연구소는 이 인구 집단의 건강 동향을 파악하기 위한 대규모 역학 연구에 착수했다. 이 7년간의 프로젝트는 '미국 아시아 및 태평양 섬 주민 커뮤니티 다민족 관찰 연구(Multi-ethnic Observational Study in American Asian and Pacific Islander Communities, MOSAAIC)'로 알려져 있으며, 다양한 AANHPI 하위 그룹에 속한 10,000명의 건강을 추적하는 것을 목표로 한다. 이 프로젝트의 주요 도전 과제는 데이터의 익명성을 유지하면서도 유의미한 건강 추세를 파악할 수 있는 세부 정보를 확보하는 것이다.

이러한 세분화 작업은 인종적 편견을 없애고 공평함을 추구하는 노력과 상충할 수 있는 것으로 보일 수 있다. 그러나 이러한 작업이 올바르게 이뤄진다면 두 노력은 상호 보완적일 수 있다. 퀸트 연구원은 “인종에 대한 논의를 피하려는 움직임이 있는데, 만약 그것이 이 문제를 무시하려는 태도에서 비롯된 것이라면 큰 위험이 있다”고 말했다. 이어 그는 “더 공정하고 정의로운 사회를 구축하고 있는지를 평가하기 위해서는 모든 인구 통계적 요소를 아우르는 통계가 필요하다”고 덧붙였다.

원문의 저자는 조티 마두수다난(Jyoti Madhusoodanan) 건강, 의학 그리고 생명 분야 과학 저널리스트입니다. 영어 원문은 How to Fix Health Data for People with Asian and Pacific Islander Heritage | Scientific American에 게재돼 있습니다.

Picture

Member for

1 month 3 weeks
Real name
김광재
Position
연구원
Bio
[email protected]
균형 잡힌 시각으로 인공지능 소식을 전달하겠습니다.

[해외DS] 美 아시아·태평양계 의료 데이터, 뭉치면 죽고 흩어지면 산다 ①

[해외DS] 美 아시아·태평양계 의료 데이터, 뭉치면 죽고 흩어지면 산다 ①
Picture

Member for

1 month 3 weeks
Real name
김광재
Position
연구원
Bio
[email protected]
균형 잡힌 시각으로 인공지능 소식을 전달하겠습니다.

수정

통합된 'AANHPI' 데이터, 각 커뮤니티의 고유 건강 위험 요소 충분히 반영하지 못해
'모범 소수자' 고정관념과 연구 자금 부족이 데이터 세분화의 걸림돌
코로나19 팬데믹 이후 커뮤니티별 건강 위험 분석 필요성 대두

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 글로벌AI협회(GIAI)에서 번역본에 대해 콘텐츠 제휴가 진행 중입니다.


아시아계 미국인, 하와이 원주민, 태평양 제도 주민으로 구성된 'AANHPI'(Asian American, Native Hawaiian and Pacific Islanders) 커뮤니티는 서로 다른 배경과 생활 방식을 가지고 있다. 그러나 미국에서는 이들이 하나의 범주로 묶여 의료 데이터가 수집되면서, 각 커뮤니티의 고유한 건강 위험 요소가 충분히 반영되지 않는 한계가 드러나고 있다. 이를 해결하기 위해 알리시아 주(Alicia L. Zhu) 미국 스탠퍼드대 아시아 보건의료 연구·교육 센터 연구원을 비롯한 연구팀은 AANHPI 커뮤니티 내 사회적 스트레스 요인과 심장 건강 간의 연관성을 조사했다. 그 결과 동일한 스트레스 요인이 중국계에서는 당뇨병, 필리핀계에서는 고혈압, 인도계에서는 수면의 질 저하와 더 밀접하게 관련된 것으로 나타났다. 각 커뮤니티의 특성에 맞춘 세부적인 의료 데이터 관리가 절실한 상황이다.

Fix_Health_Data_ScientificAmerican_20241023
사진=Scientific American

통합 데이터가 가린 AANHPI 건강 격차

1997년 미국 인구조사에서 정의된 AANHPI 카테고리는 현재까지 병원, 주, 국가 건강 데이터베이스에서 널리 사용되고 있다. 이를 통해 연구자들과 정책 입안자들은 질병 발생률을 평가하고 건강 요구를 분석해 자원을 배분한다. 그러나 AANHPI 범주는 다양한 인구 집단을 지나치게 단순화하는 문제를 안고 있다. 이 범주에 속하는 사람들은 50개국 이상의 출신 배경을 가지고 있으며 100개 이상의 언어를 사용하고, 서로 다른 생활 방식과 유전적 배경을 지녀 건강 위험 요인도 크게 다르다. 게다가 이들은 미국 내에서 가장 빠르게 성장하는 소수 집단 중 하나에 속한다.

현재 AANHPI 커뮤니티 출신의 옹호자, 연구자, 현장 활동가들이 데이터 형평성을 개선하고 건강 증진을 위한 변화에 앞장서고 있다. 코로나19 팬데믹 동안 통합된 데이터가 각 커뮤니티의 건강 격차를 제대로 반영하지 못한다는 문제가 드러나면서, 연구자들은 태평양 제도, 남아시아, 베트남 등 특정 AANHPI 집단의 질병 위험을 개별적으로 조사하기 시작했다. 이를 통해 커뮤니티별 데이터가 세분돼 인종 정보가 생물학적 요인과 혼동되지 않도록 관리할 수 있게 됐다. 이러한 데이터는 정책 입안자들이 각 커뮤니티의 특성에 맞춰 자원을 배분하고, 보다 효과적인 소통 전략을 수립하는 데 활용되고 있다.

또한 최근 몇 년간 AANHPI 데이터를 세분화한 결과, 보건 전문가들은 B형 간염 예방 접종률을 높이고, 코로나와 산불로 인한 하와이 지역사회의 피해를 줄이며, 남아시아 커뮤니티의 심장 질환 위험을 낮추기 위한 식단 전략을 마련하는 등 큰 진전을 이뤘다. 이에 대해 스텔라 이(Stella Yi) 뉴욕대 랑곤헬스(NYU Langone Health) 메디컬센터 전염병학자는 “매우 흥미로운 경험이었다”고 전했다.

자금 지원 불균형과 고정관념이 원인

과도하게 통합된 데이터는 각 커뮤니티의 현실을 제대로 반영하지 못한다. 예를 들어 아시아계 미국인의 암 사망 위험이 백인보다 약 40% 낮다고 알려졌지만, 데이터를 세분화하면 의미 있는 차이가 드러난다. AANHPI 그룹 내에서 베트남, 라오스, 차모로(마리아나 제도 출신) 남성에게서는 폐암이 가장 흔한 암으로 진단되며, 라오스, 몽, 캄보디아 남성에게서는 대장암 발생률이 특히 높게 나타났다.

통합된 데이터에서는 이러한 차이가 감춰지기 쉽다. “한 그룹은 실제보다 긍정적으로, 다른 그룹은 부정적으로 보일 수 있으며, 그 결과를 신뢰할 수 없게 됩니다,”라고 조셉 카홀로쿨라(Joseph Kaholokula) 하와이대학교 마노아캠퍼스 존 번스 의과대학 하와이 원주민 보건학과 교수는 지적했다. 이어 그는 “이건 무의미하다. 좋은 과학이 아니며, 사람들이 수십 년 동안 이렇게 해왔다”고 덧붙였다.

이러한 문제의 근본 원인 중 하나는 연방과 주에서 관리하는 의료 데이터베이스가 오랫동안 연구자들에게 인구 집단에 대한 제한된 정보만 제공해 왔기 때문이다. 세부적인 데이터 분류를 위한 초기 시도는 인구 수가 부족하다는 이유로 무산됐으며, 특히 소수 인구 집단의 경우 익명성을 유지하면서도 식별될 위험이 크다는 우려가 있었다. 더불어 AANHPI 커뮤니티를 대상으로 한 건강 연구에 대한 자금 지원도 턱없이 부족했다. 2019년 연구에 따르면, 지난 25년간 미국 국립보건원(NIH) 임상 연구 지원금 중 AANHPI 커뮤니티를 위한 프로젝트에 할당된 비율은 단 0.17%에 불과했다.

한편 이러한 데이터 통합의 배경에는 아시아계 미국인을 '모범 소수자'(model minority)로 보는 고정관념이 깔려 있다. 아시아계가 전반적으로 높은 교육 수준을 유지하고 경제적으로 안정적이며 건강 상태도 양호하다는 인식이 널리 퍼져 있기 때문이다. 티나 카우(Tina Kauh) 미국 로버트 우드 존슨 재단의 프로그램 매니저는 “데이터를 세분화하지 않는 배경에는 체계적인 인종차별이 자리 잡고 있음을 인식하는 것이 중요하다”고 지적했다. 미 국립보건원(National Institutes of Health, NIH)의 한정된 지원 속에서 과학자들은 모범 소수자 신화를 깨기 위해 고군분투하고 있으며, 카우는 이를 “마치 다람쥐 쳇바퀴에 갇힌 기분”이라고 표현했다.

MASALA 연구로 본 맞춤형 치료의 가능성

사회적 요인과 건강의 관계를 깊이 이해할수록, 각 커뮤니티에 맞춘 맞춤형 치료 설계가 가능해진다. 그 대표적인 예가 식습관이다. 미국 내 남아시아 커뮤니티의 심장병 비율이 특히 높은데, 이는 주로 전통적인 식단과 연관이 있다. 당뇨병을 연구하는 알카 카나야(Alka Kanaya) 미국 캘리포니아대학교 샌프란시스코 캠퍼스(UCSF) 의학, 역학 및 생물통계학 교수는 대부분의 연구가 서양식 식단을 기준으로 한 표준 질문을 사용해 식습관을 조사하기 때문에 다양한 문화권의 식생활을 충분히 반영하지 못한다고 지적한다. “건강한 음식에 대한 권고 역시 서양식 식단에 기반한 연구에서 비롯된다. 사람마다 먹는 음식과 요리 방식이 다르기 때문에, 정확하지 않은 측정 방법은 결국 의미 없는 데이터를 만들어낼 뿐이다”고 카나야 교수는 설명했다.

지난 10년간 카나야 교수와 다른 연구자들은 미국에 거주하는 남아시아인의 심장 건강을 조사하는 ‘미국 거주 남아시아인의 죽상동맥경화증 매개변수 연구(Mediators of Atherosclerosis in South Asians Living in America, MASALA)’를 진행해 왔다. 이 연구는 남아시아 전통 음식, 예를 들어 도클라(dhokla, 짭짤한 케이크), 삼바르(sambar, 렌틸 스튜), 찐 생선, 양고기 커리, 그리고 인기 있는 간식을 포함한 식단 빈도 질문서를 통해 식습관을 조사한다. 지난해 연구자들은 약 900명의 식단을 분석해 신선한 채소, 과일, 생선, 콩류가 풍부한 ‘남아시아식 지중해 식단’을 식별했다. 이러한 식단을 섭취한 사람들은 같은 그룹 내 다른 사람들보다 심장병과 당뇨병의 위험이 낮은 것으로 나타났다.

"이 데이터는 의사들이 환자에게 더 효과적으로 조언할 수 있도록 돕고, 서구식 생활 방식을 강요하지 않으면서 환자들이 쉽게 따를 수 있는 식이 요법을 제안하는 데 유용하다"고 카나야 교수는 밝혔다.

[해외DS] 美 아시아·태평양계 의료 데이터, 뭉치면 죽고 흩어지면 산다 ②로 이어집니다.

원문의 저자는 조티 마두수다난(Jyoti Madhusoodanan) 건강, 의학 그리고 생명 분야 과학 저널리스트입니다. 영어 원문은 How to Fix Health Data for People with Asian and Pacific Islander Heritage | Scientific American에 게재돼 있습니다.

Picture

Member for

1 month 3 weeks
Real name
김광재
Position
연구원
Bio
[email protected]
균형 잡힌 시각으로 인공지능 소식을 전달하겠습니다.

[해외DS] 구글 독점 깨질까? 대안 검색 엔진과 AI의 도전

[해외DS] 구글 독점 깨질까? 대안 검색 엔진과 AI의 도전
Picture

Member for

1 month 3 weeks
Real name
김광재
Position
연구원
Bio
[email protected]
균형 잡힌 시각으로 인공지능 소식을 전달하겠습니다.

수정

구글, 검색 품질 저하 및 법적 리스크 우려 증가
경쟁 검색 엔진과의 차별성 감소
단, 플랫폼 통합 검색 경험은 여전히 우수
새로운 검색 엔진 출현 가능성, 데이터 수집 및 처리 비용이 장벽

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 글로벌AI협회(GIAI)에서 번역본에 대해 콘텐츠 제휴가 진행 중입니다.


한때 혁신적인 도구로 여겨졌던 구글 검색이 최근 반독점 소송과 검색 품질 저하 문제가 부각되면서 시장 지배력에 대한 의문이 제기되고 있다. 여전히 시장 우위를 점하고 있지만, 변화하는 디지털 환경 속에서 점점 더 많은 도전에 직면하는 모습이다.

Google_Is_A_Monopoly_ScientificAmerican_20241004
사진=Scientific American

연이은 악재 속 위기 봉착

올해 구글은 여러 도전과 논란에 휩싸였다. 구글이 야심차게 내놓은 AI(인공지능) 서비스 관련 논란이 대표적이다. 지난 5월 구글은 AI 기반 검색 플랫폼 'AI 오버뷰(AI Overviews)'를 출시했지만, 검색 질의에 대한 자동 요약이 부자연스럽다는 비판이 쏟아졌다. 특히 특정 제품을 검색할 때 '검색엔진 최적화 스팸(SEO 스팸, 검색 순위를 높이기 위해 부자연스럽게 최적화된 저품질 콘텐츠)' 페이지가 많이 포함되는 점이 문제가 됐다. 또한 버락 후세인 오바마 미국 전 대통령을 무슬림 대통령이라고 지칭하는 등 사실과 맞지 않거나 상식적이지 않은 답변을 내놓기도 했다.

구글이 직면한 문제는 이뿐만이 아니다. 불법적으로 검색 엔진 시장을 독점했다는 판결로 벌금 부과나 기업 분할 등의 제재가 예상되는 가운데, 디지털 광고 관행과 관련된 반독점 소송도 여전히 진행 중이다. 이와 관련해 유타 하이더(Jutta Haider) 스웨덴 보로스대학(University of Borås) 문헌정보학 교수는 "구글이 점점 나빠지고 있거나, 최소한 이전보다 덜 유용해지는 모습을 보고 있다"고 말했다. 이어 "사용자들이 검색 경험을 개선하기 위해 다양한 우회 방법을 사용하고 있다"고 덧붙였다.

그러면서 특정 웹사이트에서만 결과를 얻기 위해 사이트명을 검색어에 추가하거나, AI 응답 대신 전통적인 하이퍼링크를 선호하도록 설정을 변경하는 사례를 언급했다. 하이더 교수는 올로프 순딘(Olof Sundin) 스웨덴 룬드대학(Lund University) 예술문화과학부 정보학 교수와 함께 2019년 '보이지 않는 검색과 온라인 검색 엔진(Invisible Search and Online Search Engines)'이라는 책을 공동 집필한 바 있다.

가장 큰 문제는 대체할 수 있는 검색 엔진이 많지 않다는 점이다. 현재 미국에서는 약 90%의 검색이 구글을 통해 이뤄지고 있다. 게다가 웹 트래픽 분석 업체 스탯카운터(StatCounter)에 따르면, 미국 시장에서 점유율이 1%를 넘는 검색 엔진은 단 세 개뿐이다. 마이크로소프트(MS)의 빙(Bing)은 약 7%의 검색에서 사용되며, 빙의 인덱스(검색 엔진이 알고 있는 웹사이트 목록)를 사용하는 덕덕고(DuckDuckGo)는 약 2%의 점유율을 차지하고 있다. 야후 검색(Yahoo! Search) 역시 2%가량의 점유율을 기록하고 있다. 브레이브 검색(Brave Search)처럼 프라이버시를 중시해 사용자 데이터 추적을 제한하는 덜 알려진 옵션도 존재한다. 또한 비영어권 사용자를 주요 대상으로 하는 검색 엔진들도 있다. 대표적 예가 러시아의 얀덱스(Yandex)와 중국의 바이두(Baidu)다.

더욱이 일부 새로운 검색 엔진들은 생성형 AI를 통해 답변을 제공하는데 이러한 AI 검색 도구들은 대부분 표절 의혹을 받고 있다. 이에 대해 하이더 교수는 "AI 기반 검색 엔진이 기후 변화 부정과 같은 잘못된 정보를 제공할 수 있다"며 "이는 AI가 미디어를 사람처럼 정확하게 해석하지 못하기 때문"이라고 설명했다.

이렇다 보니 몇몇 검색 엔진들은 완전히 다른 방식을 취하기도 한다. 베를린에 본사를 둔 에코시아(Ecosia)는 검색을 통해 얻은 수익을 나무 심기 프로젝트에 기부한다. 피터 반 미드워드(Pieter Van Midwoud) 에코시아의 수목 담당 최고 책임자에 따르면, 약 50번의 검색이 나무 한 그루를 심을 수 있는 비용을 마련할 수 있다. 다만 사용자의 위치나 클릭한 광고 수에 따라 수치가 변동될 수 있다. 또한 제이드 데비(Jade Devey) 에코시아 글로벌 커뮤니케이션 책임자에 따르면 에코시아는 빙이나 구글 등 외부 소스에서 검색 결과를 가져오지만, 결과에 대한 통제권은 크지 않다. 대신 특정 링크에는 맞춤형 라벨을 적용하는데, 녹색 잎 아이콘은 '실질적인 기후 약속을 가진' 기업을, 공장 굴뚝 모양의 아이콘은 "대형 오염원"을 나타낸다.

엔진 간 성능 차이 크지 않아

전문가들은 잘 알려진 사실을 확인하거나 회사 웹사이트를 찾고자 한다면, 구글이나 빙 외에 다른 검색 엔진들도 대부분 원하는 답변을 제공한다고 말한다. 검색 엔진과 사용자 행동을 연구하는 디르크 레반도프스키(Dirk Lewandowski) 독일 함부르크응용과학대 교수는 "대부분의 검색에서 어느 검색 엔진을 사용하든 큰 차이가 없다"고 진단했다.

레반도프스키 교수와 그의 동료들은 2022년 '정보과학및기술협회회보(Proceedings of the Association for Information Science and Technology)'에 발표한 연구에서 구글, 덕덕고, 빙, 그리고 독일의 메타 검색 엔진인 메타거(MetaGer)를 비교했다. 메타거는 다른 검색 엔진의 데이터를 종합하는 엔진이다. 연구팀은 ‘결과 평가 도구(Result Assessment Tool, RAT)’라는 소프트웨어를 사용해 2021년 말에서 2022년 초 사이 독일과 미국에서 약 3,500개의 구글 트렌드 검색어에 대해 상위 10개의 결과를 분석했다.

연구 결과 미국의 상위 결과에서는 위키피디아, 인스타그램, IMDb(영화리뷰 사이트)와 같은 인기 있는 웹사이트가 반복적으로 나타났다. 구글의 상위 10개 검색 결과는 다른 검색 엔진과 약 24~25% 정도 겹쳤으며, 구글을 제외한 검색 엔진들 간에는 더 높은 유사성을 보였다. 특히 빙과 덕덕고의 검색 결과는 64%가 일치했는데, 이는 두 검색 엔진이 빙의 인덱스를 공유하고 있기 때문이라고 연구진은 설명했다.

레반도프스키 교수는 이번 연구가 트렌드 검색에 의존한 점에서 한계가 있음을 인정했다. 그는 "잘 검색되지 않는 용어의 경우, 인기 검색어에 비해 결과의 일치율이 훨씬 낮을 것"이라고 지적하며, 위키피디아에서 답을 찾기 어려운 특수한 질문에 대해서는 각 검색 엔진이 인터넷의 다른 부분에서 답을 찾아낼 가능성이 크다고 설명했다. 그러면서 이러한 경우 여러 검색 엔진을 사용하는 것이 더 많은 정보를 얻는 데 유리하다고 조언했다.

그런가 하면 하이더 교수는 "많은 검색에서 구글과 빙, 혹은 덕덕고 사이의 차이는 이제 크지 않다"고 언급하면서도, 구글이 구글 지도나 유튜브와 같은 강력한 기능을 다른 검색 결과에 매끄럽게 통합한다는 점에서 다른 엔진들보다 앞서 있다고 분석했다. 하이더 교수는 검색 엔진을 평가할 때 주로 '파리 마드리드'나 '퀘벡 토론토'와 같은 두 주요 도시 이름을 검색해 본다고 말했다. 이때 검색 결과에서는 항공편 프로모션이 상위에 올라오는 경우가 많으며, 탄소 배출이 높은 항공편 같은 것이 보통 더 상위에 랭크된다고 설명했다. 또한 여름 옷이나 어린이 옷을 검색하면, 많은 검색 엔진들이 소비 성향이 강한 상업 사이트나 의류 쇼핑몰로 연결되는 경향이 있다고 말하며, 이러한 검색을 통해 검색 엔진이 보이지 않게 전제하고 있는 가정을 드러내려 한다고 강조했다.

검색 인덱스 구축의 어려움

구글이 시장을 독점하지 않더라도, 새로운 검색 엔진을 개발하는 일은 여전히 쉽지 않다. 웹 크롤러, 랭킹 알고리즘, 검색 인터페이스 등 여러 구성 요소 중에서도 가장 만들기 어려운 부분은 인덱스다. 지난해 판두 나야크(Pandu Nayak) 구글 검색 부사장은 구글의 인덱스가 2020년에 약 4,000억 개의 문서에 이른다고 밝히기도 했다.

소요되는 비용도 상당하다. 레반도프스키 교수는 이 정도 규모의 인덱스를 구축하고 유지하는 데는 엄청난 비용이 든다고 설명한다. 인덱스는 지속적으로 업데이트되고, 전 세계 사용자들이 접근할 수 있도록 관리돼야 하는데, 이런 작업을 감당할 자본을 가진 곳은 구글과 MS뿐이라고 강조했다. 이러한 문제를 해결하기 위해 레반도프스키 교수를 비롯한 여러 정보·컴퓨터 분야 과학자들은 공공 자금으로 운영되는 '웹 인덱스'를 제안하고 있다. 이들에 따르면 이를 통해 '수천 개의 검색 엔진'이 만들어질 수 있다.

물론 걸림돌이 없는 것은 아니다. 하이더 교수는 공공 인덱스 개발이 기술적으로는 가능하지만, 정부의 통제나 수익 동기에서 독립된 형태로 이를 구축하는 데는 여전히 정치적인 문제가 남아 있다고 지적한다. 다만 정치적 문제와는 별개로, 특정 검색 엔진에 대한 사용자 선호가 변화를 일으킬 수 있다. 웹 검색 엔진은 사용될수록 개선되기 때문이다. 하이더 교수는 "개발자들은 사람들이 무엇을 검색하고, 검색 결과가 어떻게 표시되며, 무엇이 클릭되는지에 대한 피드백을 받아 이를 토대로 시스템을 개선한다"고 설명했다.

원문의 저자는 벤 구아리노(Ben Guarino) 사이언티픽 아메리칸의 기술 부편집장입니다. 영어 원문은 What Search Engine Should You Use? | Scientific American에 게재돼 있습니다.

Picture

Member for

1 month 3 weeks
Real name
김광재
Position
연구원
Bio
[email protected]
균형 잡힌 시각으로 인공지능 소식을 전달하겠습니다.

[해외DS] MS, AI 전력 공급 위해 사고 원전 '스리마일섬 재가동', 안전 괜찮을까?

[해외DS] MS, AI 전력 공급 위해 사고 원전 '스리마일섬 재가동', 안전 괜찮을까?
Picture

Member for

1 month 3 weeks
Real name
김광재
Position
연구원
Bio
[email protected]
균형 잡힌 시각으로 인공지능 소식을 전달하겠습니다.

수정

마이크로소프트, 스리마일섬 원전과 독점 계약 체결
AI 전력 수요 대응 및 기후 목표 달성을 위한 전략
재가동에 따른 복잡한 안전 점검과 핵연료 공급망 문제 산적

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 글로벌AI협회(GIAI)에서 번역본에 대해 콘텐츠 제휴가 진행 중입니다.


마이크로소프트(MS)가 지난달 20일 스리마일섬(Three Mile Island) 원자력 발전소에서 생산된 에너지를 20년 동안 구매하는 계약을 체결했다. 스리마일섬 발전소는 1979년 '멜트다운'(노심융해, 원자로의 연료봉이 녹아내리는 현상) 사고가 발생한 곳이다. 이는 미국 역사상 최악의 원자력 사고로 기록돼 있다.

Power_Thirsty_AI_ScientificAmerican_20241004
사진=Scientific American

AI 발전에 따른 전력 수요 증가, 원전 재가동에 박차

MS의 이번 결정은 AI(인공지능) 운영을 위해 테크 기업들이 점점 더 많은 전력이 필요함을 상징적으로 보여준다. 그러나 이와 동시에, 폐쇄된 원자력 발전소들이 어떻게 안전하게 재가동될 수 있을지에 대한 의문도 제기되고 있다. 스리마일섬 발전소뿐만 아니라 퇴역한 다른 원전들도 다시 가동될 계획이 있기 때문이다.

미시간주 코버트에 위치한 팰리세이즈(Palisades) 원자력 발전소는 2022년 5월에 가동을 중단했지만, 소유주인 홀텍 인터내셔널(Holtec International)이 최근 재가동을 계획하고 있다. 미 에너지부(United States Department of Energy, DOE)로부터 15억 달러(약 2조원) 규모의 조건부 대출 약정을 받으면서 팰리세이즈 발전소 재가동 계획은 한층 탄력을 받았다. 에너지부는 저탄소 전력을 제공하는 원자력 발전을 통해 기후 목표를 달성하겠다는 구상이다. 팰리세이즈 발전소는 2025년 말에 재가동될 예정이다.

경제적 요인으로 폐쇄된 원전, AI와 기후 목표로 재가동 추진

앞서 미국에서는 경제적 요인으로 인해 2010년대 들어서만 12개 이상의 원자력 발전소가 폐쇄됐다. 특히 단일 원자로만 가동되는 비용 효율성이 낮은 발전소들은 전력 시장이 자유화된 주에서 가격 변동성을 감당하지 못해 수익성을 유지하기 어려웠다. 메릴랜드주 볼티모어에 있는 전력회사 콘스텔레이션(Constellation) 에너지가 소유한 스리마일섬 발전소가 대표적인 예다. 현재 미국에는 94기의 원자로를 가동 중인 54개의 원전이 남아 있다.

그런데 최근 들어 미국 원자력 발전소의 미래에 변화의 조짐이 보이고 있다. AI 시스템과 다양한 애플리케이션을 지원하기 위한 대규모 데이터 센터를 구축하려는 테크 기업들 간의 경쟁이 치열해지면서, 이러한 변화를 촉발하고 있다. 이들 기업은 동시에 기후 목표 달성에도 집중하고 있는데, MS는 2030년까지 탄소 '네거티브'(운영 과정에서 배출된 탄소보다 더 많은 탄소를 제거하는 것)를 실현하겠다고 공언한 상태다. 자코포 본조르노(Jacopo Buongiorno) 미국 MIT 교수(원자력과학·공학) 겸 고급원자력시스템센터(CANES) 소장은 "이번 계약은 원자력의 가치를 재확인할 뿐만 아니라, 가격만 적절하다면 사업적으로도 합리적인 결정"이라고 평가했다.

미국이 폐쇄된 원자로를 재가동한 것은 이번이 처음이 아니다. 1985년 테네시 밸리 당국(Tennessee Valley Authority, TVA)은 연방 소유 전력 회사로, 앨라배마주 애선스에 위치한 브라운스 페리(Browns Ferry) 원자력 발전소의 원자로들을 중단시켰다. 이후 수년간의 개보수 작업 끝에, 마지막 원자로가 2007년에 재가동됐다.

복잡한 안전 점검·면허 갱신 절차 거쳐야

그러나 팰리세이즈와 스리마일섬은 브라운스 페리 원자력 발전소와는 다른 점이 있다. 이들 발전소는 폐쇄 당시 운영 면허가 유효했음에도 불구하고, 소유주들이 법적 성명을 통해 폐쇄 결정을 내렸다는 점이다. 영구 폐쇄 계획으로 인해 안전 점검이 중단됐기 때문에, 이제는 복잡한 면허 갱신, 감독, 그리고 환경 평가 절차를 거쳐야만 해체 결정을 번복할 수 있다.

특히 우라늄 연료봉을 교체한 후에도 발전소가 안전하게 운영될 수 있는지를 확인하기 위한 철저한 안전 점검이 필요하다. 팰리세이즈 발전소의 경우, 재가동을 추진할 때 해체된 발전소들은 이미 방사성 연료를 제거하고 안전하게 보관했기 때문에 엄격한 기술적 규정을 따를 필요가 없었고, 이에 따라 재가동 절차가 비교적 순조롭게 진행될 수 있었다.

다만 스리마일섬의 경우는 상황이 다를 수 있다. 더욱이 이러한 안전 규정을 다시 도입하는 과정은 절대 간단하지 않다. 표준을 충족하려면 기반 시설을 철저히 점검해야 한다. 본조르노 교수에 따르면 폐쇄 후 부식된 금속 부품뿐만 아니라 계기와 제어에 사용되는 전선과 케이블도 모두 교체해야 할 수도 있다.

발전소의 증기 발전기, 즉 연료봉이 물을 가열해 발생하는 증기로 전기를 만드는 터빈 발전기도 면밀히 점검될 계획이다. 몇 년간 방치된 터빈은 축 결함이 생기거나 날개에 부식이 발생했을 가능성이 있기 때문이다. 원자력규제위원회(Nuclear Regulatory Commission, NRC)가 지난달 18일 팰리세이즈 발전소의 증기 발전기에 추가 테스트와 수리가 필요하다고 발표한 것도 같은 맥락으로, 스리마일섬 발전소 역시 유사한 조치가 요구될 것으로 보인다.

핵연료 공급망 확보와 인식 개선 과제도 여전

핵연료 공급 확보도 큰 과제다. 특히 이 문제는 정상적으로 가동 중인 발전소들도 직면한 도전 과제다. 미국의 원자력 발전 회사들은 오랫동안 국제 시장에 의존해 왔으며, 핵연료봉에 사용되는 동위 원소 우라늄-235를 분리하고 농축하는 데 필요한 원자재인 '옐로케이크'(우라늄정광)를 수입해 왔다. 주요 공급 국가는 러시아로, 2022년 우크라이나 침공 이후에도 미국과 유럽의 제재는 핵연료 공급에 대해선 적용되지 않았다. 다만 최근 미국은 러시아 의존도를 줄이기 위해 자국 내 공급망 구축을 계획하고 있다. 미 에너지부는 미국산 농축 우라늄 구매를 지원하기 위해 34억 달러(약 4조6,000억원)를 투입할 방침인 것으로 알려졌다.

한편 저탄소 전력 수요가 증가하더라도, 미국에서 폐쇄된 원자력 발전소가 대거 재가동될 가능성은 작다는 분석도 나온다. 일부 폐쇄된 발전소는 복구하기에는 상태가 양호하지 않을 수 있는 데다, 재개장을 둘러싼 지역사회의 반대도 상당할 것이라는 이유에서다. 본조르노 교수는 2021년에 폐쇄된 뉴욕의 인디언 포인트 에너지 센터를 예로 들며, 이 발전소가 뉴욕시에 인접해 있어 오랫동안 핵 안전 옹호자들의 비판을 받아온 점을 강조했다.

그러나 모든 발전소 부지가 그대로 방치되지는 않을 전망이다. 한 가지 대안은 기존 전송선과 기반 시설을 활용해, 과거 원전 부지에 향상된 안전 기능을 갖춘 대형 원자로나 혁신적인 설계를 적용한 소형 모듈 원자로를 건설하는 방법이다. 본조르노 교수는 "데이터 센터나 다른 응용 프로그램을 위해 이러한 대형 원자로를 더 많이 건설하려는 관심이 미국에서 생길 수 있다"고 설명했다. 이어 "현재 전력 회사와 주요 고객들이 이를 모색하고 있다"고 덧붙였다.

원문의 저자는 마이클 그레시코(Michael Greshko) 과학 분야 전문 저널리스트입니다. 영어 원문은 Power-Thirsty AI Turns to Mothballed Nuclear Plants. Is That Safe? | Scientific American에 게재돼 있습니다.

Picture

Member for

1 month 3 weeks
Real name
김광재
Position
연구원
Bio
[email protected]
균형 잡힌 시각으로 인공지능 소식을 전달하겠습니다.