5의 제곱은 5로 끝난다?
이 패턴을 따르는 숫자를 오토모픽 숫자라고 불러
무한히 큰 수를 제곱하면 마지막 숫자가 …918,212,890,625로 고정돼
[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 데이터 사이언스 경영 연구소 (GIAI R&D Korea)에서 콘텐츠 제휴가 진행 중입니다.
수학은 종종 패턴을 발견하는 학문이다. 수천 년 전 바빌로니아 사람들이 인식했던 숫자 5와 6에서도 재밌는 패턴을 관찰할 수 있는데, 5의 제곱은 5로 끝나는 25, 25의 제곱은 25로 끝나는 625, 625의 제곱은 625로 끝나는 390,625가 그것이다. 1942년 수학자 모리스 크라이칙(Maurice Kraitchik)이 만든 재밌는 속임수처럼 보이는 이 패턴은 수학에서 가장 중요한 수 체계 중 하나이자 가장 이상한 수 체계 중 하나로 여겨진다.
숫자 6은 5만큼 인상적이지 않지만, 여기에서도 비슷한 패턴이 나타난다. 6을 제곱하면 6으로 끝나는 36이 되지만, 36을 제곱하면 1,296이 나오면서 36은 더 이상 시퀀스에 나타나지 않는다. 하지만 결과는 항상 6으로 끝난다. 이렇게 일반적으로 제곱이 숫자 자체와 같은 자리로 끝나는 숫자를 오토모픽(automorphic)이라고 부른다. 이러한 숫자는 무한히 많으며 0, 1, 5, 6, 25, 76, 376 등을 예로 들 수 있다. 그런데 0과 1을 제외한 모든 오토모픽 숫자는 5 또는 6으로 끝난다.
숫자 5로 이뤄진 오토모픽 숫자 시퀀스
그 중 숫자 5는 특히 흥미롭다. 5는 오토모픽일 뿐만 아니라 그 제곱과 제곱의 제곱도 오토모픽이다. 그렇다면 5의 오토모픽 시퀀스는 무한히 계속될까. 다시 말해, 5의 제곱을 반복하면 항상 오토모픽 수가 나올까?
결과적으로 그렇지 않다는 것이 밝혀졌다.
위의 표에서 볼 수 있듯이 세 번째 제곱 이후에는 패턴이 무너지는 것처럼 보인다. 390,6252는 152,587,890,625가 되는데, 390,625가 제곱한 숫자에 완전히 포함되지 않았기 때문에 오토모픽이 아니다.
그러나 자세히 살펴보면 적어도 마지막 다섯 자리가 제곱 숫자, 즉 90,625에 포함된다는 것을 알 수 있다. 이 숫자를 제곱하면 8,212,890,625이며 제곱한 숫자에 자기 자신이 완전히 포함되기 때문에 90,625는 오토모픽 숫자다!
이어서 8,212,890,625의 제곱을 계산하면 67,451,572,418,212,890,625가 나오는데, 마지막 10자리 숫자가 같으므로 8,212,890,625도 오토모픽이다.
따라서 모든 숫자를 연속적으로 제곱한 다음, 오토모픽이 아닌 경우 반복되는 마지막 숫자로 계산을 계속하면 아래와 같은 숫자 리스트가 만들어진다.
위 과정을 무한히 반복하면 완전히 오토모픽한 무한히 큰 수, 즉 제곱이 자기 자신에 해당하는 무한히 큰 수 n2 = n이라는 수식을 도출할 수 있게 된다. 이 무한히 큰 숫자를 다 적을 수는 없더라도 마지막 숫자는 …918,212,890,625로 알려져 있다.
무한히 큰 수에서 이런 고정된 숫자가 있다는 사실 자체가 놀랍다. 특히 마지막 자리까지 정확하게 지정할 수 있다는 사실은 더욱 놀랍다.
하지만 무한대로 큰 수의 마지막 자릿수들이 다를 때는 무엇을 의미하는 것일까. 예를 들어 …67,451,572,418,212,890,625와 …11111111111 두 숫자 모두 무한대지만 다른 숫자일까?
새로운 숫자 체계의 탄생
19세기 후반에 수학자 커트 헨셀(Kurt Hensel)은 소위 p-진수라는 개념을 개발했다. 이는 π = 3.14159… 와 같이 소수점 이후 무한대로 이어지는 일반 실수와 달리 소수점 앞에 정수가 무한대로 이어지는 숫자다. 처음에는 생소하게 들리겠지만, 일반 실수와 같은 방식으로 p-진수를 사용하여 계산할 수 있다.
이를 이해하려면 실수의 다소 특이한 표현을 떠올려야 봐야 한다. 모든 실수는 합으로도 표현할 수도 있는데, π = 3 x 100 + 1 x 10-1 + 4 x 10-2 + 1 x 10-3 + 5 x 10-4 + 9 x 10-5 + …과 같은 식이다. p-진수도 양의 지수를 사용한 무한급수로 표현할 수 있어서 …890625 = 5 x 100 + 2 x 101 + 6 x 102 + 0 x 103 + 9 x 104 + 8 x 105 + …로 바꿔서, …111111 + …22222 = …33333과 같이 p-진수의 숫자들로도 사칙연산을 수행할 수 있게 된다.
이미 언급했듯이 오토모픽 숫자는 그 제곱에 해당하므로 n2 = n 공식이 적용된다. 이 이차 방정식을 변환하면 n2 - n = n x (n - 1) = 0, 즉 두 요인(여기서는 n과 n - 1)의 곱이 0이 되려면 요인 중 적어도 하나는 0이어야 한다. 이는 n = 0 또는 n = 1일의 경우에만 해당하는데, p-진수의 경우 n은 예를 들어 …890,625와 같이 0 또는 1 이외의 값을 가질 수도 있지만 여전히 위의 방정식을 충족한다. 다시 말해 p-진수에서는 둘 다 0이 아닌 두 숫자의 곱이 여전히 0이 될 수 있는 것이다.
0으로 나누기
p는 소수(prime number)를 의미하는데, 위의 예제와 같이 10-진수로 계산하면 10은 소수가 아니기 때문에 자기 자신 이외의 숫자로도 나눠질 수 있으므로 0의 제수 문제가 발생한다. 따라서 일반적인 접근으로 방정식을 풀 수가 없다. 예를 들어 a와 b가 0과 같지 않은 p-진수고 a x b = 0이라고 가정할 때, x에 대한 방정식 2⁄a = b x (1 + x)를 풀려면 일반적으로 방정식의 양변을 먼저 b로 나눈다. 그러나 a와 b의 곱은 0이고 0의 제수 문제가 발생하므로 방정식을 일반적인 방식으로 풀 수 없다.
결과적으로 0의 제수 문제를 피하려면 소수를 사용해야 한다. 예를 들어 x0 · 30 + x1 · 31 + x2 · 32 + x3 · 33 + x4 · 34 + x5 · 35 + … (여기서 계수 xi = 0, 1 또는 2)의 합으로 표현되는 3진수를 살펴보면 0의 제수는 발견되지 않는다. 따라서 p가 실제 소수인 p-진수에는 …00000과 …00001(0과 1)을 제외하고는 n2 = n을 충족하는 완전 오토모픽한 값이 포함되지 않는다.
p-진수는 언뜻 보기에는 매우 복잡해 보이지만 언급한 특징들 덕분에 널리 사용되고 있다. 실제로 수 이론가들은 대부분의 작업에 이 이상한 값을 사용한다. 수학자 피터 숄제(Peter Scholze)는 콴타매거진(Quanta Magazine)과의 인터뷰에서 "p-진수는 우리의 일상적인 직관과는 거리가 멀다", 그러나 "이제 저는 실수가 p-진수보다 훨씬 더 혼란스럽다. 너무 익숙해져서 이제는 실수가 이상하게 느껴진다"라고 언급했다.
인공지능의 급속한 발전으로 인한 위험성 증가
AI 안전을 위한 노력이 필요하지만, 충분하지 않아
ASI가 등장하기 전에 프론티어 AI 개발 잠정 중단 필요
[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 데이터 사이언스 경영 연구소 (GIAI R&D Korea)에서 콘텐츠 제휴가 진행 중입니다.
수십 년 동안 미진했던 인공지능이 갑자기 무섭게 발전하고 있다. 구글에서 오랫동안 근무하며 'AI의 대부'로 불리는 제프리 힌튼(Geoffrey Hinton)은 인공지능으로 인한 위협이 단순한 공상 과학 소설이 아니라고 거듭 경고했다. "악의적으로 나쁜 일에 [AI]를 사용하는 것을 막기 어렵다"고 그는 말했다.
백악관, 세계 지도자들, 많은 AI 기업이 이런 일이 일어나지 않도록 노력하고 있지만, 이들의 노력만으로는 충분하지 않다. AI가 돌이킬 수 없는 해를 끼치지 않도록 하려면 AI 안전에 대한 적절한 논의가 이루어질 때까지 AI 모델 개발을 잠시 중단해야 한다.
인공 초지능, 기하급수적인 발전과 잠재적 위험
하지만 과도해 보이는 AI에 관한 우려는 많은 사람들이 접하는 ChatGPT, Bard, Claude 2와 같은 챗봇과 괴리가 있어 보인다. 아직 '환각' 증세나 '탈옥' 유도에서 벗어나지 못한 챗봇이 인류에게 어떤 위협을 가할 수 있다는 것인지 이해하기 어려울지도 모른다. 그러나 여기서 핵심은 AI의 기하급수적인 발전이며, 머지않아 인간보다 더 나은 지능의 문턱에 도달할 가능성이 높은 AI의 잠재력이다. 인공 일반지능(AGI)이 출현하면 언어·문제해결·수학·추론·창의성 등 인간의 인지적 작업 대부분 또는 전부를 동등하거나 더 잘하는 AI가 등장할 것이다. AGI 시대가 도래하면 인간보다 훨씬 빠른 속도로 더 똑똑한 AI가 구축될 수 있다. 이렇게 되면 우리는 아마도 AI를 인공 초지능(ASI)이라고 부르는 단계에 도달하게 될 것이다.
ASI는 신과 같은 힘을 가진 인공지능으로 생각할 수 있다. 지금까지 살았던 가장 똑똑한 인간의 IQ가 200 정도라면, ASI는 100만 이상의 IQ를 가질 수도 있다. 물론 인간이 만든 어떤 척도도 이 정도의 지능을 가진 존재에게는 의미가 없을 것이다. 높은 지능으로 AGI와 ASI는 자기 몸이 될 로봇도 만들 수 있다. 이러한 로봇이 AI에 의해 제어되든 인간이 제어하든, 최소한 인간 사회의 모든 일을 변화시킬 것이며, 최악의 경우 부도덕한 정부와 기업(또는 부도덕한 AI)이 인류를 통제하는 데 이용될 수 있다.
사실 단기적으로 위험성이 더 높은 것은 자율적인 AI의 폭주가 아니라 인간이 악의적인 목적으로 AGI·ASI를 사용하는 경우다. 예를 들어 미국과 중국 간의 경쟁과 이미 시작된 AI 군비 경쟁에서 자율 AI가 전략과 전쟁 수행의 거의 모든 측면을 장악하고 적군의 통제권 마비시키는 지점에 쉽게 도달할 수 있다.
AI 안전을 위한 '잠정 개발 중단'
앞서 언급한 바와같이 위험한 악용 사례를 방지하기 위한 노력이 이미 진행 중이다. 백악관은 작년 11월에 연방 정부가 여러 분야에서 AI에 대응할 수 있도록 하는 광범위한 행정 명령을 발표했다. 또한 세계 지도자들이 영국에서 모여 AI 안전에 대해 논의하고 국제적인 규제를 시작하는 블레츨리 선언을 발표했다. OpenAI와 같은 업계 리더들은 슈퍼얼라인먼트 이니셔티브와 프런티어 모델 포럼을 시작했다. OpenAI와 OpenAI의 전직 직원이 설립한 경쟁사 Anthropic은 더 안전한 AI에 집중하기 위해 특별히 설립됐다. 하지만 이러한 노력만으로는 인공지능을 안전하게 만들 수 없다.
컴퓨터 과학 교수인 로만 얌폴스키(Roman Yampolskiy)는 2022년 Journal of Cyber Security and Mobility 논문에서 그 이유를 자세히 설명했다. 그는 AI가 아직 초지능에 훨씬 못 미치는데도 현재 AI가 어떻게 작동하는지 이해하거나 예측 과정을 추적할 수 없다는 점에 주목해야 한다고 지적했다. 결국 AI가 AGI·ASI로 발전함에 따라 인간이 이해할 수 없고, 따라서 통제할 수 없는 상태가 될 것이라고 그는 내다봤다.
한편 인간이 개발할 수 있는 모든 대응책은 확률적일 뿐 완벽하지 않다. 그러나 AGI 시대에 확률론적인 해법을 받아들일 수 없는 이유는 인공지능이 너무 똑똑해져서 아무리 작은 시스템 결함이라도 이를 악용할 것이기 때문이다. 이러한 문제에 대해 OpenAI의 AI 안전 책임자인 얀 라이크(Jan Leike)는 "현실 세계에는 '완벽한 것'은 없지만 '충분하다'와 '충분하지 않다'는 있다"며 "그 기준이 정확히 무엇인지는 기술이 어떻게 발전하느냐에 따라 달라진다"고 답했다.
완벽하진 않지만 충분한 해결책이라도 모색하고 마련하기 위해, AI 안전에 대한 집단적 토론을 하는 동안 전 세계적으로 프런티어 AI 개발, 즉 GPT-5와 같은 새로운 대규모 AI 언어 모델 개발을 잠시 멈춰야 한다. 뾰족한 대책 없이 AI 개발을 내버려두면 행정명령부터 업계 표준에 이르기까지 '더 안전한 AI'를 만들기 위한 모든 노력은 누군가가, 어딘가에서, 제때 해결책을 내놓을 것이라는 막연한 믿음 아래 더욱 강력한 AI를 무책임하게 개발하는 것에 불과하기 때문이다.
[email protected]
세상은 이야기로 만들어져 있습니다. 다만 우리 눈에 그 이야기가 보이지 않을 뿐입니다. 숨겨진 이야기를 찾아내서 함께 공유하겠습니다.
입력
수정
AI 기상 모델 '그래프캐스트', 허리케인 '리'의 상륙을 슈퍼컴퓨터보다 더 빨리 예측해
그래프캐스트는 기존 모델보다 빠르고 저렴하게 예측을 생성할 수 있어
하지만 해석이 어렵고 드문 사건을 예측하는 데는 한계점 분명
[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 데이터 사이언스 경영 연구소 (GIAI R&D Korea)에서 콘텐츠 제휴가 진행 중입니다.
작년 9월 중순 허리케인 '리'가 버뮤다 서쪽으로 북상하고 있을 때, 예보관들은 폭풍이 상륙할 가능성이 있는 위치를 파악하기 위해 기상 모델과 '허리케인 헌터' 항공기의 데이터를 분주하게 분석하고 있었다. 예상 착륙 지점은 뉴잉글랜드 또는 캐나다였다. 기상학자들이 위치를 빨리 파악할수록, 해일, 폭우로 인한 피해를 보는 사람들에게 더 빨리 경고할 수 있는 긴박한 상황이었다. 상륙 6일 전에는 리가 동쪽 경로를 따를 것이 분명해졌고, 그에 따라 경고가 발령됐다. 하지만 놀랍게도 '그래프캐스트'(GraphCast)라는 AI 기상 모델은 예보관들의 기존 모델보다 3일 전에 이를 정확하게 예측해 냈다.
그래프캐스트의 예측은 일기 예보를 개선할 수 있는 AI의 잠재력을 보여주는 사례로, 적은 컴퓨팅 파워로 더 빠르게 예측할 수 있는 장점이 있다. 구글 딥마인드에서 개발한 그래프캐스트는 최근 몇 년간 출시된 여러 AI 기상 모델 중 가장 최신 모델이다. 2020년에 처음 소개된 구글의 'MetNet'은 이미 구글의 날씨 앱 '나우캐스트'(Nowcast)와 같은 제품에 사용되고 있으며, 엔비디아와 화웨이도 자체 AI 날씨 모델을 개발했다. 모두 AI가 탑재되지 않은 기존의 예측 컴퓨터 모델과 비슷하거나 더 높은 정확도를 자랑하며 기상학 분야에서 큰 반향을 불러일으켰는데, 그중에서도 그래프캐스트는 지금까지 가장 큰 파장을 일으켰다. 35개국의 일기 예보를 발표하고 많은 전문가들이 최고의 일기 예보 모델 중 하나로 꼽는 유럽 중기예보센터(ECMWF)에서 머신러닝을 연구하는 과학자 마리아나 클레어(Mariana Clare)도 "정말 큰 영향을 미쳤다"라고 강조했다.
허리케인 리가 발생하기 전, 딥마인드 연구팀은 과거 기상 데이터를 그래프캐스트에 입력해 어떤 일이 일어날지 정확하게 예측할 수 있는지 테스트했다. 작년 11월 사이언스(Science)에 게재된 이 연구 결과에 따르면, AI는 테스트 사례의 90%에서 최고 표준인 ECMWF의 통합예보시스템(IFS)과 동등하거나 더 나은 성능을 보였다. 또한 허리케인 리의 예측 경로를 실시간으로 예측하는 것을 보고 구글 딥마인드 연구팀은 시스템이 실제로 작동한다는 확신이 들었다고 전했다.
AI 기상 예측 모델의 원리와 한계
AI는 기존의 예측 모델과는 매우 다른 방식으로 작동한다. 기존 예측 모델은 대기 역학을 포착하기 위한 복잡한 물리 방정식으로 표현돼 있다. 이 모델은 전 세계의 기상 관측용 풍선과 기상관측소에서 수집한 데이터를 바탕으로 다양한 기단과 기타 대기 특징이 상호작용하면서 날씨가 어떻게 전개될지 예측하는 데 사용된다. 예보관은 일반적으로 이러한 모델을 여러 개 실행한 다음 지역 지리에 대한 자신의 전문 지식과 각 모델의 장단점을 통해 필터링된 결과 정보를 통합하여 최종 예측 결과를 결정한다.
이와는 대조적으로 그래프캐스트와 다른 대부분의 새로운 AI 모델은 실제 대기 역학을 이해하고 이를 수학적으로 복제하려는 노력을 포기한다(엔비디아의 포캐스트넷은 예외). 대신 AI 도구는 통계적 모델로서, 수십 년간의 기상 관측 기록과 물리적 예측에서 수집한 정보로 구성된 학습 데이터의 패턴을 인식한다. 따라서 AI 모델은 특정 날짜의 날씨 설정이 과거의 유사한 사건과 유사하다는 것을 알아차리고 그 패턴을 기반으로 예보를 내리는 방식을 취한다.
미국 애리조나대학교의 대기과학 및 수문학 부교수인 킴 우드(Kim Wood)는 과거 데이터에 의존하기 때문에 대부분의 AI 모델은 드물게 일어나거나 한 번도 경험하지 못한 사건을 예측하는 데는 한계가 있다고 지적했다. 2017년 텍사스 일부 지역에 전례 없는 60인치의 폭우를 쏟아부은 허리케인 '하비', 지난해 멕시코 태평양 연안을 강타하기 직전에 5등급으로 급격히 강화된 허리케인 '오티스' 등이 이러한 사례에 속한다. "학습 데이터에서 가장 자주 볼 수 있는 이벤트를 가장 잘 포착할 수 있다. 평균적으로 예측을 잘하는 것이다"라고 우드는 설명했다. 우드는 기후가 변화함에 따라 '희귀한' 사건들이 점점 더 보편화되고 있기 때문에 이를 정확하게 포착하고 예측하는 것이 점점 중요하고 어려울 것이라고 말했다.
그래프캐스트는 폭풍과 강우 강도를 예측하는 데도 한계가 있는 것으로 보인다고 ECMWF의 클레어와 구글 딥마인드의 과학자 레미 램은 언급했다. 이는 이 모델의 공간 해상도가 상대적으로 낮기 때문일 수 있다. 그래프캐스트의 모델은 전 세계를 28km2 단위로 보지만, 돌풍과 폭우는 도시 블록과 동네 단위로 발생한다. 램은 "분명 개선의 여지가 있다"라고 말하지만, 더 높은 해상도의 AI 모델을 얻으려면 그와 그의 동료들은 훨씬 더 많은 고해상도 훈련 데이터를 수집해야 한다. 이는 어려운 일이지만 극복할 수 없는 문제는 아니라고 램은 덧붙였다.
슈퍼컴퓨터 없이 예측 가능하지만, 설명력은 떨어지는 AI 모델
물리학 기반 모델이 슈퍼컴퓨터로 실행하는 데 2~3시간이 걸리는 데 비해 AI 모델은 몇 분 만에 예측할 수 있는 것은 사실이지만, AI가 어떻게 예측에 도달하는지 정확히 알 방법은 없다. 물리 기반 모델과 달리 그래프캐스트 및 기타 유사한 AI 예측 도구는 '해석 가능'하지 않다. AI 모델을 구성하는 수천만 개의 매개변수를 통해 결과를 쉽게 추적할 수 없기 때문이다. 미국 노스다코타대학교의 대기과학 부교수인 아론 케네디(Aaron Kennedy)는 "모델에 문제가 발생하면 세부 사항을 살펴보고 그 이유를 파악할 수 있어야 한다"고 꼬집었다.
에너지 회사인 세니에르 에너지(Cheniere Energy)의 기상학자이자 휴스턴에 본사를 둔 극한 날씨 웹사이트 'The Eyewall'의 공동 설립자인 맷 란자(Matt Lanza)는 오류를 이해하는 것이 어느 정도는 중요하다는 데 동의했다. "AI의 [블랙박스] 특성은 현장의 사람들이 AI를 유용한 것으로 받아들이는 데 방해가 되는 요소 중 하나가 될 것이다"라고 그는 내다봤다.
AI 모델의 낮은 설명력은 고질적인 문제다. 그래프캐스트가 현재 직면한 구체적인 과제 중 하나는 결정론적 예보, 즉 실제로 일어날 가능성에 대한 확률 없이 제시되는 단일 예보만 생성할 수 있다는 점을 먼저 개선해야 한다. 일련의 매개변수가 주어지면 그래프캐스트를 실행할 때마다 비슷한 결과가 나오기 때문에 다양한 예측 가능성을 생성하기가 어렵다. 이는 대기에 내재된 무작위성을 수용하는 기존의 물리적 앙상블 예보에서 벗어난 예측 방식이기 때문이다. 미국 해양대기청(NOAA) 산하 미국 국립기상청(NWS) 기상예보센터의 예보운영책임자인 그렉 카빈(Greg Carbin)은 기존 기상 모델 예보의 궤적을 강 위에 떠 있는 코르크에 비유했다. 매번 같은 출발점에 똑같은 코르크를 조심스럽게 놓아도 하류로 내려가는 길은 달라지는데, 코르크의 이동 거리가 길어질수록 기존의 궤적에서 더 멀리 떨어져 있을 가능성이 높아지는 이치다. 현재 그래프캐스트는 이러한 불확실성을 계산하지 못하는 상태다.
하지만 그래프캐스트가 확률적으로 변하더라도, 그리고 모델의 해상도가 향상되고 AI가 비와 폭풍의 강도를 더 정확하게 예측하더라도, 모델링은 기상 예측 파이프라인의 한 구성 요소에 불과하다고 NWS의 고급모델링시스템 수석 고문인 헨드릭 톨만(Hendrik Tolman)은 지적했다. 예보의 첫 번째 단계는 센서를 통해 전 세계의 상태에 대한 데이터를 수집하는 것이고, 두 번째 단계는 이러한 모든 관측 데이터를 매개변수로 통합하여 모델에 입력하는 것이다. 그다음에는 모델링이 이루어지며, 마지막으로 대중을 위해 예보를 번역하는 과정이 있다. 톨먼은 예측 단계에서 지름길을 개발했다고 해서 정보를 수집, 전달, 해석하는 전문 인력의 필요성이 없어지는 것은 아니라고 말했다. 물론 AI가 정확한 예측을 빠르고 저렴하게 생성할 수 있다면 기존 방법과 함께 사용하지 않을 이유가 없다. 아울러 슈퍼컴퓨터를 사용할 수 없는 기업이나 기관이 날씨 모델링에 훨씬 더 쉽게 접근할 수 있는 기회가 생긴 것은 그래프캐스트가 가져온 커다란 변화다. 하지만 향후 5년 또는 10년 이내에 AI 모델이 물리학 기반 모델과 사람을 대체하는 세상이 올 가능성은 거의 없다는 게 전문가들의 중론이다.
[email protected]
세상은 다면적입니다. 내공이 쌓인다는 것은 다면성을 두루 볼 수 있다는 뜻이라고 생각하고, 하루하루 내공을 쌓고 있습니다. 쌓아놓은 내공을 여러분과 공유하겠습니다.
입력
수정
인간 운전자보다 안전한 자율주행차 개발 위해 엄격한 안전 규제 필요
테슬라·크루즈 사고로 안전성 문제 부각, 실리콘밸리의 '빨리빨리' 문화 부작용
안전 전문가 및 규제 기관의 검증 거쳐 엄격한 안전 규제 프레임워크 도입 시급
[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 데이터 사이언스 경영 연구소 (GIAI R&D Korea)에서 콘텐츠 제휴가 진행 중입니다.
인공지능에 관한 관심이 높아지면서 머신러닝 기술이 자율주행에 어떤 역할을 할 수 있을지에 대한 기대도 높아지고 있다. 그러나 문장을 생성하는 대규모언어모델(LLM)과 공공 도로에서 차량을 운전하는 AI 사이에는 근본적인 차이가 있다. 자율주행차의 소프트웨어는 문장을 생성형 AI 애플리케이션보다 훨씬 더 높은 수준의 정확성과 신뢰성을 갖춰야 하는데, 자율주행은 무인 차량의 탑승자뿐만 아니라 도로를 공유하는 모든 사람의 생명 안전에 영향을 미치기 때문이다. 따라서 생성형 AI에서 자주 보는 '환각'과 '탈옥' 증상은 자율주행에서 가볍게 넘길 수 없는 문제로 인식될 수밖에 없다.
미국에서 인간 운전자의 실수로 인한 심각한 교통사고의 발생 빈도는 이미 현저히 낮은 수준이다. 미국 도로교통안전국(NHTSA)의 교통 통계에 따르면 사망 사고는 360만 시간당 한 번, 부상을 유발하는 사고는 6만1천 시간당 한 번꼴로 발생한다고 한다. 이는 411년 동안 한 번의 치명적인 충돌 사고가 발생하고 7년 동안 24시간 연속으로 운전할 때 한 번의 부상을 유발하는 충돌 사고가 발생한다는 의미다. 하지만 복잡한 소프트웨어 기반 시스템, 특히 자율주행 시스템이 저렴한 가격으로 대량 생산되기 시작하면, 인간 운전자와 같은 수준의 안정성을 확보하는 일은 매우 어려운 일이다.
테슬라 오토파일럿, 운전자 오용 방지 장치 미비로 리콜
특히 무인 자동차 회사 크루즈(Cruise)가 캘리포니아 안전 규제 당국과 부딪힌 문제와 테슬라(Tesla)가 NHTSA와 충돌한 문제를 들여다보면 자율주행 소프트웨어 시스템이 직면한 몇 가지 안전 문제가 두드러진다. 이 두 사건은 단순히 기술적인 문제를 넘어 안전을 최우선으로 고려해야 하는 자율주행 애플리케이션에 실리콘밸리의 '빨리빨리' 문화를 도입하려는 두 회사의 시도가 얼마나 심각한 위험을 초래할 수 있는지를 보여준다. 안전한 시스템을 개발하려면 속도와는 양립할 수 없으며 인내심과 세심한 주의가 필요하다.
먼저 테슬라의 경우, NHTSA는 운전자의 지속적인 감독과 특정 제한된 도로 및 교통 상황에서 운전자의 적극적인 개입을 요구하는 레벨 2 자동화 시스템의 안전 문제를 조사해 왔다. 특히 테슬라 운전자의 자율주행 시스템 사용 중 발생한 일련의 충돌 사고에 대한 2년간의 조사 후, 작년 12월 12일 테슬라가 운전자의 오용 예방에 대한 적절한 안전장치를 포함하지 않았다는 이유로 오토파일럿 기능이 탑재된 차량의 리콜 합의안을 발표했다. 포드나 제너럴 모터스도 비슷한 자동화 기능이 있으나, 이들의 시스템과는 완전히 대조적으로, 테슬라의 오토파일럿은 운전자의 시선을 모니터링하여 운전자의 집중도를 평가하지 않았다. 또한 테슬라의 소프트웨어는 차량 통행이 제한된 고속도로인지 아닌지에 관계없이 어디서나 시스템을 사용할 수 있도록 설계됐다.
간단한 수정만으로도 운전자에게 경각심을 불러일으키고 안전 위험을 줄이기 위해 도로 조건이 적합한 장소로 시스템 사용을 제한할 수 있었을 것이다. 하지만 테슬라는 이를 거부하고 무선 소프트웨어 업데이트를 통해 몇 가지 추가 경고 기능만 구현하는 것에 그쳤다. 시스템이 안전하게 작동하는 것으로 입증된 곳에서만 사용할 수 있도록 시스템을 '지오펜스'(geofence)하고, 운전자가 전방을 주시하고 있는 경우에만 사용하도록 강제하기 위해서는 더 강력한 규제 개입이 필요한 시점이다.
크루즈의 무인 택시 운행 중단, 자율주행안전 문제 부각
크루즈는 샌프란시스코에서 무인 택시 서비스를 제공할 수 있는 권한이 있었으나, 캘리포니아주 차량관리국(DMV)에 의해 취소됐다. 작년 10월 2일에 발생한 차량 충돌 사고로 차량 아래에 갇힌 피해자가 중상을 입은 사건에 대해 크루즈는 납득 가능한 보고서를 제출하지 못해서다. DMV는 이번 운행 중단 명령은 해당 무인 차량의 안정성 및 기술 안전과 관련된 정보를 허위로 진술한 경우 등에 해당한다고 설명했다. 이 사건을 계기로 내부적으로 크루즈 운영에 대한 종합적인 재검토가 이뤄졌고, 그 결과 조직의 안전 문화와 대중 및 공공기관 관계자들과의 상호 작용에 심각한 문제가 있는 것으로 드러났다. 크루즈는 안전보다 개발 및 확장 속도를 중시했고, 무인 차량 호출 서비스를 개발해 온 다른 주요 기업들과 달리 최고안전책임자나 효과적인 기업 안전 관리 시스템을 갖추지 못한 것으로 밝혀졌다. 크루즈는 안전에 중대한 영향을 미치는 의사결정을 내릴 때 안전에 우선순위를 두지 않았던 것으로 보인다.
테슬라와 크루즈의 사태를 통해 이들의 우선순위가 자율주행 시스템의 발전에 있지, 시스템의 안전성에는 무관심하다는 점을 발견할 수 있다. 미국은 안전 전문가와 안전 규제 기관의 적절한 검증을 거쳐 자율주행 기술의 안전성을 강화하고, 업계가 안전에 대한 대중의 신뢰를 얻을 수 있도록 엄격한 안전 규제 프레임워크를 도입할 필요가 있다. 자동차를 구동하는 소프트웨어는 안전에 매우 중요하기 때문에 전례 없이 높은 수준의 신뢰성으로 작동해야 하므로 일반 대중과 안전 규제 당국 모두 입증할 수 있고 설명할 수 있는 증거를 기업으로부터 제공받아야 하는 것이다. 즉 소프트웨어가 머신러닝에만 전적으로 의존해서는 안 되며 명시적인 알고리즘 안전 가드레일과 통합돼야 안전성을 담보할 수 있다.
자율주행 기술이 아직 성숙 단계에 있고 정확한 성능 기반 규정을 정의하기에는 데이터가 충분하지 않지만, 안전을 개선하고 안전에 대한 대중의 인식을 제고하기 위해 주 또는 가급적 국가 차원에서 기본 안전 요건을 구현하는 데 먼저 집중해야 한다. 자율주행 시스템(ADS) 개발자와 차량 운영자는 △안전성이 입증되지 않은 곳에서는 ADS가 작동할 수 없도록 하고 △모든 충돌 사고와 아차 사고(고속 기동과 사람의 조종권 탈취 포함)를 보고하며 △감사 및 규제하에 안전 관리 시스템을 구현해야 하는 일련의 규제 프레임워크가 필요하다. 마지막으로, 소프트웨어 배포 전에 주 또는 연방 규제 기관의 검토와 승인을 받아야 하는 포괄적인 안전 사례를 개발해야 하는데, 안전 사례는 합리적으로 예측 가능한 위험을 식별하고, 실제 조건에서 사람의 감독하에 테스트한 정량적 증거를 바탕으로 공공 안전의 위험을 어떻게 완화했는지에 대한 설명을 적극적으로 요구해야 한다. 더 똑똑한 인공지능보다 더 시급한 것은 똑똑한 무인 자동차 규제다.
플로리다주 외과의사, 코로나19 백신의 암 유발 가능성 제기
FDA 및 전문가들은 "근거 없고, 백신 접종의 이점 훨씬 커"
백신 접종 부작용도 있지만 손실 회피 편향에 빠지면 안 돼
[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 데이터 사이언스 경영 연구소 (GIAI R&D Korea)에서 콘텐츠 제휴가 진행 중입니다.
지난 3일 플로리다주 외과의사 조셉 라다포(Joseph Ladapo)는 확실한 증거 없이 백신의 DNA 조각이 인간 게놈에 들어가는 것에 대한 우려를 언급하며 전령 RNA 기반 코로나 백신의 사용을 중단할 것을 촉구했다. 미국 식품의약청(FDA)을 비롯한 전문가들은 그의 주장은 근거가 없으며, 이러한 경고는 사람들이 백신을 접종받지 못하게 함으로써 큰 해를 끼칠 수 있다고 비판했다.
라다포의 근거 없는 발언은 이번이 처음이 아니다. 지난해 12월 라다포는 FDA 국장과 질병통제예방센터 소장에게 서한을 보내 화이자와 모더나의 코로나19 mRNA 백신에 포함된 DNA 조각의 안전성에 의문을 제기했다. 이 서한에서도 그는 mRNA를 세포에 전달하는 데 사용되는 지질 나노 입자가 있는 상태에서 DNA 조각이 인간 세포핵에 들어가는 것에 대한 근거 없는 우려를 제시했었다. 또한 그는 시미안바이러스 40(SV40)이라는 바이러스로 인한 DNA 오염에 대한 우려를 표명했는데, 라다포는 이러한 DNA가 세포에 통합되면 암을 유발하는 유전자를 활성화하거나 염색체 불안정성을 유발할 수 있다고 피력했다.
FDA는 공식 답변을 통해 "전체 제조 공정에 대한 철저한 평가를 바탕으로 FDA는 코로나19 백신의 품질, 안전성 및 효과에 대해 확신한다"고 밝혔다.
mRNA 백신, 잔여 DNA는 세포핵에 침투하지 못해
많은 과학자들은 라다포가 주장한 백신의 위험성을 일축했다. 여기에는 필라델피아 아동병원의 백신 교육센터 소장이며 FDA의 코로나19 백신 자문위원회에서 활동하고 있는 폴 오핏(Paul Offit)이 포함되는데, 오핏은 mRNA 백신이 만들어지는 방식은 최종 제품에 소량의 DNA를 포함하지만, 홍역 및 수두 백신을 포함하여 세포에서 배양되는 모든 백신에 해당하는 사항이라고 설명했다. 그는 백신 1회 접종당 '미량의'(10억 혹은 1조분의 1그램) DNA가 존재하며, 이는 "여러 가지 이유로 완전히 무해하다"고 덧붙였다.
COVID에 대한 mRNA 백신 제조는 질병을 일으키는 바이러스인 SARS-CoV-2의 스파이크 단백질 유전자가 들어 있는 플라스미드(plasmids)라고 하는 원형 DNA 조각에서 시작된다. 플라스미드를 박테리아 내부에서 세포 분열로 수십억 개의 사본으로 증폭한 다음, 화학 물질을 첨가하여 박테리아에서 방출한다. 효소는 플라스미드를 스파이크 단백질을 암호화하는 선형 DNA 조각으로 자르는 데 사용되며, 다른 효소는 해당 DNA를 mRNA로 변환하는 작업을 수행한다. 그다음 또 다른 효소가 추가되어 남은 DNA를 무해한 작은 조각으로 자른다.
이러한 잔여 바이러스 DNA가 인간 세포핵에 들어가려면 먼저 세포의 주요 구조, 즉 세포질로 들어가야 하는데, 세포질은 일반적으로 외부 DNA를 차단한다. 우연히 세포질을 뚫더라도 그다음에는 핵막을 통과해야 하는데, 핵막에는 접근 신호 자체가 없기 때문에 이 과정이 불가능하다고 오핏은 지적한다. 게다가 잔여 DNA는 핵 DNA에 통합되어야 하는데, 이를 위해서는 mRNA 백신에 없는 DNA 절단 효소가 필요하므로, 오핏은 mRNA 백신이 어떤 식으로든 DNA에 영향을 미칠 가능성은 '제로'라고 말한다.
인간의 신체, 외부 DNA 침입에 준비돼있어
라다포는 2022년부터 코로나19 mRNA 백신의 안전성에 의문을 제기해 왔다. 그는 17세 이하의 어린이에게 백신 접종을 권장하지 않았으며, 백신이 도움이 되지 않고 심지어 해를 끼칠 수도 있다고 거짓 주장을 했었다. 라다포뿐만 아니라 과학자이자 의사인 로버트 말론(Robert Malone)도 작년 11월 조지아주 공화당 하원의원 마조리 테일러 그린이 개최한 위원회 청문회에서 mRNA 백신의 DNA 조각이 인간 DNA를 변형시킨다는 근거 없는 주장을 펼쳤다. 이에 대해 오핏은 우리가 노출되는 박테리아와 우리가 먹는 동식물을 통해 훨씬 더 많은 양의 외부 DNA를 항상 접하고 있다고 반박했다.
지난 3일 성명에서 라다포는 사람들이 mRNA를 사용하지 않는 다른 코로나19 백신을 접종받을 수 있다고 주장했는데, 미국에서 유일한 대안은 노바백스(Novavax)라는 회사가 만든 나방 세포에서 배양한 것으로, 이 역시 DNA를 포함하고 있다. "DNA라는 단어를 말하는 순간 사람들은 '맙소사, 여기에 DNA가 들어 있다고? 내 DNA에 영향을 미칠까?"라고 생각한다", 하지만 "코로나 백신의 DNA로 인해 피해를 보는 것보다 스파이더맨이 될 확률이 더 높다"라고 오핏은 강조했다.
한편 시미안바이러스 40에 대한 우려에 관해서는, 코로나 백신에는 SV40 단백질이나 이를 코딩하는 유전 물질이 포함되어 있지 않다. 또한 SV40은 초기 소아마비 백신의 오염 물질이었지만, 인간에게 암을 유발하는 것으로 밝혀지지 않았다.
완벽한 백신은 없지만 접종하지 않으면 "득보다 실이 더 커"
물론 모든 백신이나 의약품에는 잠재적인 위험과 혜택이 공존한다. 존슨앤드존슨의 코로나19 백신은 일부 사람들에게서 드물지만 때로는 치명적인 혈전을 유발하는 것으로 밝혀져 시장에서 퇴출 당했다. mRNA 백신은 대체로 안전하지만, 주로 10대 소년과 젊은 남성의 경우 심근염 위험이 적지만 제로에 가깝지는 않았다. 그러나 COVID 자체로 인한 심근염의 위험은 더 높으며, COVID 관련 심근염은 더 심각한 경향이 있다. 아울러 mRNA 백신에 대해 우려하는 사람들을 위해 노바백스에서 만든 백신과 같은 다른 옵션도 존재한다.
따라서 전문가들은 백신 접종의 이점이 여전히 위험보다 훨씬 크다고 입을 모아 말한다. 오핏은 생후 6개월 이상의 모든 사람에게 1차 백신을 접종할 것을 권장했다. 그는 입원 고위험군이 아닌 건강한 젊은이들에게는 추가 접종이 덜 중요하다고 말했다. 하지만 65세 이상과 임산부를 포함하여 중증 질환의 위험에 노출될 수 있는 기저질환이 있는 모든 연령대의 사람들은 반드시 백신을 최신 상태로 접종해야 한다고 강조했다. 또한 최근 연구에 따르면 백신을 접종한 후 하나 이상의 부스터 백신을 접종하면 장기적으로 코로나19에 걸릴 위험이 크게 줄어드는 것으로 나타났다.
백신으로 위험을 완전히 피할 수 없지만, 백신을 맞지 않는 선택을 내릴 땐, 질병의 위험도 감수해야 한다. 백신에 섞여 있는 DNA 조각을 두려워하기 전에, 인간의 DNA에 내재한 손실 회피 편향을 인지하고 백신의 득과 실을 냉정하게 따져봐야 한다.
2023년, AI 붐에 대한 과대광고가 난무했던 한 해
기술 이해와 교육이 무엇보다 중요해져
현재 AI 발전 속도를 고려하면 규제가 더 시급해
[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 데이터 사이언스 경영 연구소 (GIAI R&D Korea)에서 콘텐츠 제휴가 진행 중입니다.
2023년은 인공지능의 진화와 사회에서의 역할에 있어 변곡점이 되는 해였다. 생성형 AI가 등장하여 인공지능의 잠재력이 음지에서 대중의 상상력의 중심으로 옮겨졌다. 또한 OpenAI 이사회의 드라마가 며칠 동안 연말 뉴스 토픽을 장식하기도 했다. 그리고 바이든 행정부가 행정명령을 내리고 유럽연합이 AI 규제를 목표로 하는 법안을 통과시켰다.
하지만 무엇보다도 2023년은 AI 붐의 해였다. AI가 세상을 구할 것이라는 이야기든 세상을 파괴할 것이라는 이야기든, 언젠가 AI가 어떻게 될지에 대한 비전이 현재의 현실을 압도하는 것처럼 느껴지는 이야기들이 오갔다. 미래의 해악을 예측하고 기술의 윤리적 부채를 극복해야 하지만, 기술에 대한 충분한 이해 없이 과대광고에 휩쓸리면 마술처럼 보이는 AI의 미래가 만들어질 위험이 있다.
인공지능의 원리를 깨달아야, "문제는 교육이야!"
AI 마법에 가장 큰 타격을 입은 분야는 교육이다. 작년 이맘때만 해도 대부분의 뉴스 헤드라인은 학생들이 어떻게 이 기술을 이용해 부정행위를 할 수 있는지, 그리고 교육자들이 어떻게 이를 막기 위해 애쓰고 있는지에 초점을 맞췄는데, 해가 거듭될수록 학생들에게 AI에 대해 가르치지 않으면 불이익을 받을 수 있다는 인식이 확산하면서 많은 학교가 금지 조치를 철회했다.
결국 학생들이 AI가 어떻게 작동하는지 배우지 않으면 그 한계를 이해하지 못하기 때문에 AI를 유용하고 적절하게 사용하는 방법과 그렇지 않은 방법을 이해하지 못한다. 아울러 이는 학생에게만 해당하는 이야기가 아니다. 사람들이 AI의 작동 원리를 더 많이 이해할수록 AI를 사용하고 비판할 수 있는 권한이 더 커질 수 있으므로 걱정이 앞설 땐 충분한 학습이 선행돼야 하는 이유다.
따라서 전문가들은 올해 엄청난 학습 압박이 몰려올 것으로 전망했다. 이전 세대의 기술 복잡도를 넘어선 새로운 시대가 열렸기 때문이다. 1966년 엘리자(ELIZA) 챗봇을 만든 조셉 바이젠바움(Joseph Weizenbaum)은 기계는 "가장 경험이 많은 관찰자조차도 현혹하기에 충분"하지만, "이해를 유도할 수 있을 정도로 평이한 언어로 기계의 내부 작동을 설명하면 그 마법은 무너진다"고 썼다. 그러나 생성형 인공지능의 문제점은 엘리자의 매우 기본적인 패턴 매칭 및 치환 방법론과 달리, 인공지능의 마법을 무너뜨릴 수 있을 만큼 '충분히 쉬운' 언어를 찾기가 훨씬 더 어렵다는 것이다. 그 결과 기술이 이해하기 어려운 만큼 사람들이 적절한 대응책 마련할 수 있는 시기는 미뤄질 수밖에 없다.
"더 많은 AI 기술 전문가를 채용하기 위해 서두르고 있는 대학들이 AI 윤리학자를 채용하는 데에도 많은 노력을 기울였으면 좋겠다"고 미국 콜로라도 소재 볼더대학교 정보과학 부교수 케이시 피슬러(Casey Fiesler)는 말했다. 언론 매체들이 AI에 관한 과대광고를 지양하고, 모든 사람이 자신의 AI 기술 사용과 그 결과에 대해 성찰했으면 좋겠다고 그녀는 덧붙였다. 인공지능을 비판적으로 바라보기 위해선 정보에 입각한 비평에 귀를 기울여야 한다고 전문가들은 입을 모아 조언했다.
알고리즘, "알아도 모르고 배워도 쫓아가지 못하는 시대?"
2022년 ChatGPT가 공개되면서 수익과 명예, 글로벌 패권을 차지하기 위한 전면적인 무한 경쟁이 시작됐다. 새로운 AI 애플리케이션의 홍수와 더불어 더욱 강력한 AI를 기대하는 움직임이 폭발적으로 증가했다. 이로 인해 새로운 문제도 생겨날 가능성이 높아졌다. 예로 들어 딥페이크로 생성된 이미지와 동영상은 규제에도 불구하고 만연하며, 개인과 민주주의에 해악을 끼치고 있다.
게다가 ChatGPT가 공개된 이후 1년 동안 생성형 AI 모델의 개발은 빠른 속도로 계속되고 있다. 텍스트 프롬프트를 입력으로 받아 텍스트 출력을 생성했던 1년 전 ChatGPT와 달리, 새로운 세대의 생성형 AI 모델은 멀티모달로 학습되며, 이는 학습에 사용되는 데이터가 위키피디아(Wikipedia), 레딧(Reddit)과 같은 텍스트뿐만 아니라 유튜브 동영상, 스포티파이(Spotify)의 노래, 기타 오디오 및 시각 정보에서도 제공된다는 것을 의미한다. 이러한 애플리케이션을 지원하는 차세대 멀티모달 대규모언어 모델(LLM)을 사용하면 텍스트 입력을 사용하여 이미지와 텍스트뿐만 아니라 오디오와 비디오도 생성할 수 있다. 5년 전만 해도 상상할 수 없었던 새로운 종류의 AI 재난이 발생할 가능성도 함께 높아진 것이다.
또한 기업들은 스마트폰에서 LLM을 실행하는 것을 포함하여 다양한 하드웨어와 다양한 애플리케이션에 배포할 수 있는 LLM을 개발하기 위해 경쟁하고 있다. 이러한 고급 AI 기능은 일반 비즈니스에서 정밀 의학에 이르기까지 다양한 분야에서 엄청난 혁신을 불러올 수 있으나, 이러한 고급 기능이 인간이 만든 콘텐츠와 AI가 만든 콘텐츠를 구분하는 데 새로운 도전과제를 제기할 뿐만 아니라 새로운 유형의 알고리즘 피해를 야기할 수 있다. 생성형 AI에 의해 생성된 합성 콘텐츠의 범람으로 인해 악의적인 사람과 기관이 합성 신원을 만들고 대규모의 잘못된 정보를 생산할 수 있는 세상이 도래했다.
미국 연방거래위원회(FTC)는 AI를 이용한 콘텐츠 제작의 용이성으로 인해 사기, 속임수, 개인정보 침해 및 기타 불공정 행위가 발생할 수 있다고 경고한 바 있다. 유튜브와 같은 디지털 플랫폼은 AI가 생성한 콘텐츠의 공개에 대한 정책 가이드라인을 마련했지만, 미국 데이터 프라이버시 및 보호법(American Data Privacy & Protection Act)과 같은 개인 정보 보호를 위해 노력하는 의원들과 FTC와 같은 기관에서 알고리즘의 피해에 대해 더 면밀히 조사할 필요성이 있다. AI가 사람들이 하는 모든 일과 점점 더 밀접하게 얽히면서, 이제는 알고리즘을 기술의 일부가 아니라 알고리즘이 작동하는 맥락, 즉 사람, 프로세스, 사회에 초점을 맞춰야 할 때가 온 것이 분명하다.
[email protected]
세상은 다면적입니다. 내공이 쌓인다는 것은 다면성을 두루 볼 수 있다는 뜻이라고 생각하고, 하루하루 내공을 쌓고 있습니다. 쌓아놓은 내공을 여러분과 공유하겠습니다.
입력
수정
전자 제품의 열 문제 해결을 위한 새로운 열 트랜지스터 개발
원자의 화학적 결합 방식 이용하여 열 흐름 정밀 제어
컴퓨터 과열 방지, 낭비 열 재활용 등 다양한 응용 기대
[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 데이터 사이언스 경영 연구소 (GIAI R&D Korea)에서 콘텐츠 제휴가 진행 중입니다.
스마트폰에서 슈퍼컴퓨터에 이르기까지 전자제품에는 열이 문제다. 최신 컴퓨터 칩은 로켓 노즐에서 뿜어져 나오는 에너지를 능가하고 심지어 태양 표면에 근접하는 수준의 전력 밀도를 가진다. 이에 따라 미국 데이터 센터에서 소비되는 총 전력의 절반 이상이 컴퓨팅이 아닌 냉각에 사용되고 있다. 또한 3D 적층 칩과 재생 에너지 시스템과 같은 많은 유망한 신기술이 기기의 성능, 신뢰성, 수명을 저하하는 열로 인해 잠재력을 최대한으로 발휘하지 못한다.
"열은 관리하기가 매우 어렵다"라고 로스앤젤레스 캘리포니아대학교의 물리학자이자 기계 엔지니어인 용지에 후(Yongjie Hu)는 말했다. "열의 흐름을 제어하는 것은 오랫동안 물리학자와 엔지니어들의 꿈이었다."
열 트랜지스터, 원자의 화학적 결합 방식 이용하여 열 흐름 제어해
하지만 후와 그의 동료들은 해결책을 찾았을지도 모른다. 지난해 11월 사이언스지에 보고된 바와 같이, 그의 연구팀은 단일 분자 수준에서 원자 결합의 기본 화학 구조를 활용하여 열 흐름을 정밀하게 제어할 수 있는 새로운 유형의 트랜지스터를 개발했다. 이 '열 트랜지스터'는 미래 회로의 핵심 구성 요소가 될 것이며 전기 트랜지스터와 함께 작동할 것이다. 후는 이 새로운 장치가 이미 저렴하고 확장할 수 있으며 현재의 산업 제조 관행과 호환되며 곧 리튬 이온 배터리, 연소 엔진, 반도체 시스템(예: 컴퓨터 칩) 등의 생산에 통합될 수 있다고 전했다.
"광범위한 실용적 응용이 가능한 혁신적인 돌파구다"라고 후는 언급했다. "간단히 말해, 이전에는 열을 정밀하게 제어할 방법이 없었다."
1947년에 발명된 전기 트랜지스터는 엔지니어들이 전기를 정밀하게 제어할 수 있게 함으로써 세상을 변화시켰다. 이제 모든 전자제품의 핵심 구성 요소로 자리 잡은 전기 트랜지스터는 전기가 흐르는 두 개의 단자와 흐름을 제어하는 세 번째 단자로 구성되어 스위치와 같은 역할을 한다. 오늘날에는 수십억 개의 트랜지스터를 하나의 칩에 집적할 수 있게 됐으며, 이러한 소형화로 인해 컴퓨팅 성능이 기하급수적으로 향상됐지만 과도한 열을 처리하는 것도 훨씬 더 어려워졌다.
하지만 적절한 기술을 활용하면 낭비되는 열을 포착하여 칩의 손상을 방지할 수 있을 뿐만 아니라 이를 재사용할 수도 있다. 이번 연구에 참여하지 않은 버클리 캘리포니아대학교의 실험 물리학자 알렉스 제틀(Alex Zettl)은 "오늘날 전자 회로의 열은 대부분 성가신 것으로 간주되어 그냥 흘려보내려고만 하는데, 실제로는 열을 활용해야 한다"라고 말하며 "미래에는 전자 회로와 열 회로가 함께 작동할 것으로 예상된다"고 덧붙였다.
10년이 걸린 연구, "원자의 전자 분포를 이용해 열 차단"
지난 20년 동안 후 연구팀과 같은 연구진은 전기 트랜지스터가 전류를 제어하는 것처럼 열 흐름을 정밀하게 제어하는 열 트랜지스터를 개발하여 이러한 미래를 열어가기 위해 노력해 왔다. 하지만 몇 가지 근본적인 문제가 이들을 가로막고 있었다. 예를 들어 이전의 열 트랜지스터 설계는 처리 시간을 느리게 하는 다루기 힘든 움직임이 있는 부품에 의존하는 경우가 많았다. 또한 구조적인 문제로 인해 이러한 소자가 고장을 일으키기도 했다. 후는 "이 분야에 대한 관심은 많았지만, 과거의 어떤 시도도 성공하지 못했다"라고 당시 상황을 설명했다.
이러한 한계를 극복하기 위해 후와 그의 동료들은 10년의 연구 끝에 열 트랜지스터를 제작하는 완전히 새로운 접근 방식을 개발했다. 이 기술은 새로운 원자 사이에 형성되는 결합을 활용한다. 결합한 원자는 전자를 공유함으로써 서로를 붙잡고 있는데, 전자가 원자 사이에 분포하는 방식은 결합의 강도에 영향을 미치고, 이는 다시 원자를 통과할 수 있는 열의 양에 영향을 미친다.
후와 그의 동료들은 열의 이동을 정밀하게 제어하기 위해 전기장을 가하는 나노 크기의 전극을 사용하여 이러한 변수를 조작할 수 있다는 사실을 발견한 것이다. 전기 트랜지스터와 마찬가지로 이 새로운 소자는 열이 흐르는 두 개의 단자와 이 흐름을 제어하는 세 번째 단자, 즉 전기장을 통해 소자 내의 전자와 원자 간의 상호 작용을 조정하는 세 번째 단자로 구성된다. 그 결과 열전도율이 변화하고 열 이동을 정밀하게 제어할 수 있게 된다. 후는 이 장치의 발명으로 이제 "필요에 따라 다양한 응용 분야에서 열을 조작할 수 있게 됐다"고 강조했다. 여기에는 컴퓨터의 과열을 방지하고 한때 낭비되었던 에너지를 다시 회수하여 재사용하는 것도 모두 포함된다.
이 새로운 장치는 원자 수준의 결합을 활용하지 않는 최근에 설계된 다른 열 트랜지스터와의 비교 실험에서 몇 배나 더 나은 성능을 보였다. 이 연구에 참여하지 않은 오하이오주립대학의 실험 물리학자 조셉 헤레만스(Joseph Heremans)는 "새롭고 우아한 설계가 특정 영역에 탁월한 속도로 냉각된 전력을 전달한다"고 말했다. 연구팀은 실험을 통해 이 새로운 장치가 열 스파이크를 1,300%까지 극적으로 완화하고 이 모든 제어를 높은 신뢰성으로 달성한다는 사실을 발견했다. 라이스대학의 기계 공학자 제프 웨마이어(Geoff Wehmeyer)는 전기로 원자 간의 결합을 조작하여 열을 제어하는 새로운 기술이 "향후 많은 기초 연구에 동기를 부여할 것"이라고 덧붙였다.
전기 트랜지스터와 결합해 시너지 효과 기대돼
한편 제틀은 열 트랜지스터에 관한 연구가 아직 더 많이 필요하다고 언급했다. 결정적으로 완전한 하이브리드 전자-열 회로를 만들어야 하며, 이를 위해서는 새로운 열 제어 회로를 기존의 전기 회로와 통합해야 하는 작업이 선행돼야 한다. 하지만 제틀은 이 새로운 장치가 "전자 장치와 열에너지 흐름을 우아하게 결합"할 수 있다고 생각한다고 전했다.
후와 그의 동료들은 이미 장치의 성능을 더욱 향상시키기 위해 장치의 구조와 소재를 실험하고 있다. 또한 3D 적층 칩을 비롯한 다양한 시스템에 통합하는 방법도 연구하고 있다. 3D 적층 칩은 2D 칩을 쌓아 올리는 방식으로 근본적인 확장 문제를 해결하지만, 냉각이 까다롭다는 단점이 있어서 이에 관해 연구를 더 진행할 예정이다.
아울러 초소형 열 제어 트랜지스터는 의료 분야에도 적용될 수 있다. 후의 연구팀은 종양학자와 협력하여 열 트랜지스터가 악성 세포에 치명적인 수준의 열을 전달하기 위해 자성 입자를 사용하는 온열요법이라는 암 치료법을 발전시킬 수 있는지 조사하고 있다. 후는 열 트랜지스터를 프로브나 나노 입자에 통합하여 종양학자들이 열을 정밀하게 제어할 수 있게 되면 암세포는 소멸시키고 건강한 세포는 살릴 수 있다고 전망했다.
전기 트랜지스터의 발명이 현재의 기술 시대를 여는 혁신의 물결을 일으킨 것처럼, 열 트랜지스터 역시 지금으로서는 상상할 수 없는 혁신을 가져올 수 있을 것이라고 후는 기대했다. "이 발명은 열 관리, 열처리 및 새로운 컴퓨팅 패러다임에서 엄청난 기회를 열어줄 것이다"라고 후는 말했다. "열 트랜지스터는 미래로 가는 관문이다."
[email protected]
세상은 이야기로 만들어져 있습니다. 다만 우리 눈에 그 이야기가 보이지 않을 뿐입니다. 숨겨진 이야기를 찾아내서 함께 공유하겠습니다.
입력
수정
잠정 합의안 따르면 대부분의 오픈소스 AI 모델은 면제
위험도가 높은 범용·기반 모델은 규제 대상에 포함
깃허브 등 오픈소스 생태계 주체, 지속가능성 위한 노력 지속해야
[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 데이터 사이언스 경영 연구소 (GIAI R&D Korea)에서 콘텐츠 제휴가 진행 중입니다.
2023년 말, 유럽 의원들은 수년간의 교착 상태 끝에 마침내 AI 규제 방안에 대한 초기 합의에 도달했다. EU AI 법안은 시민의 권리에 영향을 미칠 가능성에 따라 모든 AI 시스템을 분류하는 위험 기반 규율이다.
무료 오픈소스 AI 모델은 EU AI 법에서 대부분 면제되는 것으로 알려졌지만, 규정의 문안은 아직 최종 확정되지 않았으며 공개되지 않았다.
AI 비즈니스는 깃허브(GitHub)의 최고법률책임자 셸리 맥킨리(Shelley McKinley)와 이 EU AI 법이 오픈소스 개발에 미칠 영향에 관해 이야기를 나눴다. Microsoft가 소유한 깃허브는 세계에서 가장 큰 오픈소스 저장소이자 커뮤니티다. 법안의 규정에 따라 깃허브의 향후 운영 방침이 AI 관련 산업과 기관 그리고 개인에게 파급력이 클 것으로 예상된다.
EU AI 법이 생각하는 오픈소스 모델
"잠정 합의안이 최종 규정에 반영된다고 가정하면, EU AI 법은 대부분의 오픈소스 AI 개발자에게 혁신을 계속할 수 있다는 확신을 줄 것이다"고 맥킨리는 말했다. 특히 전체 AI 시스템을 구현하는 것이 아니라 데이터세트, 학습 코드, 모델, 애플리케이션 소프트웨어 등 AI 구성 요소를 구축하고 공유하는 개발자들은 법의 영향권에 밖에 있다.
대부분의 오픈 소스는 예외를 인정받았으나, 금지된 시스템, 고위험 시스템, 투명성 의무가 있는 시스템, 규모가 가장 큰 기반 모델 등 명백한 위험이 있는 경우에는 오픈 소스를 제한한다. 따라서 오픈 소스이든 폐쇄형이든, AI 법은 시스템적 위험을 초래할 수 있는 범용 모델을 규제하는 데 초점을 맞췄다.
즉 영향력이 큰 범용 모델을 구축하는 개발자는 문서화, 평가, 통지, 에너지 사용 보고 및 사이버 보안 요건과 관련하여 법률을 준수해야 한다. 이는 개발자가 책임감 있게 혁신을 지속할 수 있도록 하면서도 위험에 초점을 맞춘 깃허브의 AI 규제 접근 방식과도 일치하는데 아직 규제 문서가 완성되지 않은 상태여서 추가되는 규정이 있는지 주시해야 한다.
"오픈 소스와 개발자에게 미치는 영향 측면에서 정책 입안자들이 2021년 유럽 집행위원회의 제안 이후 우리가 주장해 온 대로 고위험 시나리오를 규제하는 것과 오픈 혁신을 활성화하는 것 사이에서 적절한 균형을 잡았다고 생각한다"고 맥킨리는 설명했다. 아직 많은 작업이 남아 있을 것으로 예상되지만, 개발자 입장에서 보면 이번 정치적 합의는 합리적이며 고무적인 결과라는 반응이다.
'과도한' 규제의 부작용은?
맥캘리는 오픈소스에 대한 면제가 없었다면 개발자들이 유럽 시장에서 오픈소스 AI에 대한 업스트림 기여를 철회할 것이 거의 확실하다고 단언했다. 이는 EU뿐만 아니라 전 세계의 전반적인 혁신에 직접적인 영향을 미칠 것이라고도 덧붙였다.
오픈소스 소프트웨어는 어디에나 존재하며, 최신 시놉시스(Synopsys) 보고서에 따르면 오픈소스 구성 요소는 소프트웨어의 96%에 포함되어 있고 특정 소프트웨어의 76%를 차지한다. 따라서 개발자들의 활발한 지식 공유와 기여 문화가 주춤하면 오픈소스에 절대적으로 의존하는 현대의 소프트웨어 개발 방식에 심각한 제동이 걸릴 수밖에 없다.
다행히도 잠정 합의안은 광범위한 혁신을 저해하지 않으면서 고위험 AI 시스템을 규제하겠다는 의지를 반영한 것으로 보이며, 정책 입안자들이 커뮤니티의 요청에 귀를 기울여 최종 문안이 개발자들이 EU에서 책임감 있고 개방적으로 계속 협업하고 혁신할 수 있도록 보장할 것이라는 낙관이 전망된다.
오픈소스는 생태계의 지속가능성을 위한 깃허브의 전략
"오픈소스 생태계를 지원하기 위한 전략 중 하나는 조직이 오픈소스에 어떻게 의존하는지에 대해 교육하고, 조직이 의존하는 프로젝트에 투자할 수 있는 방법을 제공하는 것이다"고 맥캘리는 강조했다.
깃허브는 최근 깃허브 스폰서(GitHub Sponsor)를 만들었다. 오픈소스의 사용자 입장에 있는 조직은 사용하는 오픈소스의 유지관리를 위해 인재 채용을 따로 진행할 필요 없이, 해당 오픈소스의 관리자에게 재정 지원을 직접적으로 제공함으로써 사용자와 관리자 모두 윈윈할 수 있는 전략 방안을 구축한 것이다. 최근 전 세계적으로 기술 인재에 대한 수요가 매우 높고, 개발자들의 오픈소스에 대한 의존도도 높아지고 있기 때문에 이런 상생 전략이 고안된 것으로 사료된다.
이러한 접근 방식이 정부에도 영향을 미치고 있는데, 일례로 독일 소버린 테크 펀드(German Sovereign Tech Fund)는 주요 오픈소스 프로젝트에 유사한 재정 지원을 제공하고 있으며, 깃허브는 인터넷 자유 인프라를 지원하기 위해 오픈 테크놀로지 펀드(Open Technology Fund)의 무료 및 오픈소스 소프트웨어 지속 가능성 기금을 지원하고 있다.
모든 조직은 기술 인재 유치를 넘어서 개발자가 흐름을 파악하고 창의력을 발휘하는 데 도움이 되는 AI 도구에 투자하고, 경영진과 소통의 창구를 열어두고, 조직 내 대표성을 높이기 위한 공동의 노력을 기울여야 EU의 AI 법안뿐만 아니라 다른 AI 규제 속에서도 오픈소스 개발 문화가 존중 받을 수 있을 것이다.
작년 9월 2일 발사된 아디티아-L1, 라그랑주 1지점에 곧 도착 예정
궤도 안정성 및 적은 연료 사용으로 태양 관측에 이상적인 L1
라그랑주점 간의 중력 시너지를 파악해 비행 효율성이 더 높아질 전망
[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 데이터 사이언스 경영 연구소 (GIAI R&D Korea)에서 콘텐츠 제휴가 진행 중입니다.
인도의 ‘아디티아-L1’(Aditya-L1) 탐사선은 며칠 안에 목적지인 라그랑주 1지점(L1)에 도착할 예정이다. 지구로부터 150만km 떨어진 지구와 태양 사이의 외딴 공간이지만 이미 4대의 다른 우주선이 L1에 주둔해 있다.
L1은 지구의 중력, 태양의 중력, 우주선 궤도의 원심력이 거의 정확히 상쇄되어 변화무쌍한 태양계의 중력장 속에서 비교적 안정된 '섬'을 형성하는 특별한 장소다. 그 결과 L1에 정박한 우주선은 적은 연료로 지구와 함께 태양을 공전할 수 있게 된다.
"궤도의 어느 지점에서도 지구가 태양을 가리지 않기 때문에 L1에서는 안정적인 태양 관측이 가능하다"고 미국 몬태나주립대학교의 천체 물리학자 닐 코니쉬(Neil Cornish)는 설명했다. 닐 코니쉬 교수는 라그랑주점을 설명하는 나사(NASA)의 공식 문서를 작성한 사람이다.
인도가 쏘아 올린 태양 정찰병
아디티아-L1(아디티아는 산스크리트어로 태양을 의미)은 올해 1월 첫째 주에야 최종 목적지에 도착할 예정이지만, 이미 자외선에 가까운 파장으로 태양 이미지를 전송하고 있다.
탐사선은 곧 L1 주변의 '헤일로 궤도'(Halo orbit)에 진입한다. 궤도를 유지하기 위해 몇 주마다 추진기를 가동해 태양 주위를 돌게 된다. 다행히도 L1의 영역은 광대해서 근처에 있는 많은 우주선이 가까이서 마주치는 것은 고사하고 서로를 볼 수도 없다고 코니쉬는 설명했다. "밖에서 무언가와 마주칠 위험은 전혀 없다"라고 덧붙였다.
L1에 가장 오래 머물고 있는 미국항공우주국(NASA)와 유럽우주국(ESA)의 합작품인 소호 태양관측위성(SOHO)과 같이, 아디티아-L1도 가시광선, 자외선 및 X선 파장의 빛으로 태양을 이미지화하여 태양 대기의 역학에 대한 귀중한 자료를 전송할 예정이다.
인도 우주국에 따르면, 탐사선은 태양 폭풍에 영향받는 '우주 기상'을 연구하기 위해 지구를 가리키는 4개의 장비와 태양풍과 태양 자기장에 대한 폭발의 영향을 모니터링하기 위해 다른 곳을 겨냥한 3개의 장비를 사용할 예정이라고 한다.
또한 아디티아-L1의 주요 임무는 5년 동안만 지속될 예정이었지만, 앞서 언급한 L1 위치의 이점으로 인해 우주선의 작동 수명이 훨씬 더 길어질 전망이다. 소호도 2년만 사용할 계획이었지만 25년 이상 L1에서 비행한 전력이 있으며, 2025년 말까지 임무 기한이 연장됐다.
라그랑지안 군도, 각 라그랑주 지점의 특징과 쓰임새
라그랑주 지점은 태양 주위를 도는 행성마다 존재한다. 과학자들은 1760년대 스위스 수학자 레온하르트 오일러가 아이작 뉴턴의 중력 법칙에서 비롯된 '3체 문제'(three-body problem)에 대한 해결책을 제시한 이래로 라그랑주 지점에 대해 알고 있었다. 이탈리아계 프랑스 천체물리학자 조제프루이 라그랑주(Joseph-Louis Lagrange)는 오일러의 연구를 확장하여 1772년에 태양과 지구 사이의 중력에 의해 생성되는 5개의 지점을 발견했다. 이 점들은 라그랑주의 이름을 따서 라그랑주 지점이라고 불린다.
먼저 세 번째 라그랑주 지점(L3)은 태양으로부터 가장 먼 쪽에 있으며 지구 궤도보다 조금 더 멀리 떨어져 있다. 이에 따라 이 라그랑주 지점은 지구에서 바라볼 때 항상 태양에 가려져 있어, 지구와의 직접적인 통신이 불가능하다. 그곳에는 어떤 우주선도 주둔하지 않는다.
그다음으로 L4와 L5는 태양 주위를 도는 지구의 궤도를 공유하지만 각각 지구의 앞과 뒤에서 정확히 60도 떨어져 있다. 다른 라그랑주 지점들보다 안정성이 높은 구역이기 때문에 우주 먼지나 소행성들이 쉽게 몰려든다. 지구 중력에 편승하는 소행성들은 '트로이 소행성'(Trojan asteroids)이라고 부르며, 목성의 궤도 위를 목성과 함께 도는 목성 트로이군도 수십 개가 있는 것으로 관측됐다.
마지막으로 모든 지구-태양 라그랑주 점 중 최고의 명당은 L2다. L2는 지구를 사이에 두고 L1의 반대쪽에 자리 잡고 있는데, L2에서 태양을 바라보면 지구·달·태양이 모여 있어서 이 세 가지 행성에서 방출되는 빛을 쉽게 차단할 수 있는 장점이 있다. 그 결과 L2는 제임스 웹 우주망원경을 비롯한 여러 탐사선이 선택한 궤도 목적지가 됐다. 이 지점에 가장 최근에 도착한 우주 망원경은 ESA의 유클리드다. 유클리드는 암흑 에너지와 암흑 물질의 영향을 측정하기 위해 작년에 L2에 도착했다.
ESA의 우주과학 책임자인 천체물리학자 캐롤 문델(Carole Mundell)은 L2를 통해 지구의 지상 관측소에서 유클리드를 항상 볼 수 있고, 유클리드도 넓은 시야를 확보하면서 촬영할 수 있다고 강조했다. "이 지점은 방사선 환경, 열 안정성 및 시야 확보에 가장 적합한 곳이다"라고 그녀는 덧붙였다. "이러한 장점들이 결합되어 유클리드 같은 고정밀 조사 임무에 이상적이다."
행성 간의 고속도로, 라그랑주의 궤도 시너지
NASA 제트추진연구소의 우주선 궤적 전문가인 마틴 로(Martin Lo)는 라그랑주점을 태양계 전체로 뻗어 있는 '행성 간 초고속도로'라고 부른다.
지구에서 약 193만km 이내에 7개의 주요 라그랑주 지점이 있는데, 지구-태양계의 L1과 L2, 그리고 지구-달계의 '작은' 라그랑주 지점 5곳이다. 이 근처의 7개 지역은 모두 비슷한 궤도 에너지를 공유하기 때문에 우주선이 한 지역에서 다른 지역으로 이동하는 데 약간의 추진력만 있으면 된다고 한다. 이는 마치 정글짐에서 바에서 바 사이를 스윙하는 것과 비슷하다고 로는 설명했다.
이러한 라그랑주점의 고효율 궤도 이동 가능성에 대한 전망은 달에 유인 탐사와 우주정거장 건설 등을 목표로 하는 NASA의 아르테미스 임무에 대한 로의 궤도 간 이동 연구에 영향을 미쳤다. 그리고 그는 현재 토성의 라그랑주점과 여러 위성 사이에 존재하는 복잡한 궤도를 연구하고 있는데, 이 위성 중 하나인 엔셀라두스는 태양계에서 외계 생명체를 찾기에 가장 좋은 장소일 수 있다고 한다.
"엔셀라두스는 남극 근처에서 얼음 기둥을 방출하는데, 우리는 이 궤도를 이용해 엔셀라두스 주변 궤도에 진입해 물질을 포착하는 방법을 결정하고 있다"라고 그는 말하며, 이는 적절한 장소, 속도, 시간을 맞추기 위해 가능한 가장 부드러운 스윙을 사용하는 문제라고 설명했다.
스미스는 처음부터 비주기적 모노타일을 찾으려는 구체적인 목표를 세우지는 않았지만, 이 문제의 역사와 중요성에 대해 잘 알고 있었다. 그는 타일 문제를 푸는 과정에서 비주기성의 징후를 항상 주시했었다.
스미스와 카플란 교수는 모자의 행동을 이해하려고 노력하기 시작했다. 먼저 모자의 구성 요소를 살폈다. 이 모자는 폴리폼(polyform)이라고 불리는데, 어떤 단순한 단위 요소의 조합을 일컫는다. 예를 들어 '테트리스' 게임의 모든 조각들은 네 개의 정사각형(단위 요소)을 다양하게 조합하여 만든 폴리폼들이다
모자 타일 속에 숨겨진 치환 규칙을 찾아서
스미스의 모자는 8개의 연(kite)으로 만들어졌는데, 이 연은 펜로즈의 연과는 다르다. 스미스의 연은 정육각형을 6 등분 한 연으로 조합한 폴리폼이다.
스미스는 카플란 교수가 최근에 폴리오미노(정사각형을 붙여 만든 폴리폼), 폴리헥스(정육각형), 폴리아몬드(정삼각형)의 히쉬수를 계산하는 소프트웨어를 개발한 것을 알고 있었고, 이를 폴리카이트에 적용할 수 있는지 궁금해했다. 다행히도 카플란 교수는 워털루대학의 학부생인 아바 푼(Ava Pun)의 도움으로 연에 대한 기능을 추가한 적이 있었다.
카플란 교수의 소프트웨어는 막힘없이 큰 모자 클러스터를 쉽게 생성하여 모자가 평면을 타일링한다는 스미스의 믿음을 강화했다. 그뿐만 아니라 컴퓨터로 생성된 새로운 클러스터 이미지는 스미스의 직관을 개선할 수 있는 좋은 연구 자료가 되어 줬다. 그들은 디지털 일러스트레이션으로 직접 색칠하는 등 다양한 방법으로 모자를 그룹화하며 새로운 사실을 발견했다. 반사된 모자가 드문드문 배열되어 있고, 반사되지 않은 모자가 반사된 모자를 둘러싸는 반복 패턴이 튀어나온 것이다.
모자 타일의 이러한 패턴은 병진 단위를 형성하지 않으면서도 재귀적인 계층 구조를 가진 것처럼 보였다. 즉 반복되는 조합 패턴을 규정하고 해당 조합들을 재귀적으로 결합하면, 모양은 유지하면서 스케일은 무한대로 커질 수 있게 된다. 평면 타일링이 가능한 것이다. 결국 모자가 비주기적 타일일 수 있다는 것을 암시하는 최상의 시나리오였다. 한편 재귀적 계층 구조는 치환 규칙(substitution rules)이 적용된 시스템이다. 펜로즈의 타일 집합을 포함한 많은 비주기적 타일 집합에서 치환 시스템으로 평면을 타일링하는 것을 볼 수 있는데, 연과 다트로 구성된 펜로즈의 타일이 연과 다트의 조합 속에서 규모가 더 큰 연과 다트를 발견할 수 있는 시스템이다. 이런 식으로 모양이 변하지 않으면서 점점 더 큰 클러스터를 만들어가는 시퀀스를 발견하면 무한 평면을 채워 나갈 수 있다는 것을 증명할 수 있게 된다.
카플란 교수는 스미스의 이메일을 받고 약 2주가 흐른 시점에 모자 타일의 치환 규칙을 설명할 수 있을 '시드' 구성을 발견했다. 비결은 반사된 모자는 반사되지 않은 모자와 다르게 행동할 수밖에 없기 때문에 단일 반사 모자로 직접 작업하는 것을 피하는 것이었다. 대신 반사된 모자를 세 개의 이웃 모자와 그룹화하여 분할할 수 없는 단위, 즉 자체적인 치환 규칙을 가진 타일 모양으로 취급할 수 있는 '메타타일'을 만들었다. 카플란 교수는 메타타일과 모자의 치환 규칙을 다듬어 4개의 메타타일(시드)로 구성된 치환 시스템을 정의했다.
강한 비주기성을 증명하기 위해
스미스와 카플란 교수는 메타타일과 치환 규칙으로 모자가 모노타일이라는 것을 증명했다. 그리고 치환 규칙에 따라 생성된 타일링이 비주기적(nonperiodic)이라는 것도 쉽게 알 수 있었다. 하지만 강한 비주기성(aperiodic)은 담보할 수 없는 상황이었다. 강한 비주기성은 비주기적 타일이 임의로 큰 주기적 영역을 갖지 않아야 한다는 추가 속성이 있기 때문이다. 결국 모든 모자 타일링이 반드시 비주기적이라는 것을 증명하기 위해 2023년 1월 초 스미스와 카플란 교수는 타일링 이론에 관한 중요한 논문을 다수 발표한 수학자 굿맨-슈트라우스에게 연락을 취했다. 굿맨-슈트라우스는 수학 커뮤니케이터이자 타일링 체험 활동의 기획자로도 잘 알려져 있었고 그의 소개로 소프트웨어 개발자 조셉 사무엘 마이어스도 프로젝트에 합류했다.
마이어스는 조합론으로 수학 박사 학위를 받은 후 학계를 떠났지만 타일링에 관한 관심은 계속 유지했다. 타일링에 대한 그의 이전 작업 덕분에 그는 불과 8일 만에 증명을 완료했다. 올해 1월 말에 이 모자가 세계 최초의 비주기적 모노타일임을 확인한 것이다. 그는 임의의 모자 타일이 메타타일로, 메타타일을 슈퍼타일로 그룹화하는 독특한 방법이 영원히 존재한다는 것을 증명하여 완전한 타일링으로 끝나는 치환의 무한 계층을 역설계해야 했다. 이를 위해 마이어스는 컴퓨터를 이용한 접근법을 개발했다. 모자 타일링에서 나타날 수 있는 188개의 작은 타일 클러스터를 생성하고, 각 클러스터를 고유한 방식으로 메타타일의 조각으로 나눌 수 있음을 보여줬다. 이는 어떤 모자 타일링도 메타타일로 분해할 수 있음을 의미한다. 마지막으로 그는 메타타일로 구성된 타일링에서 더 큰 메타타일처럼 동작하는 슈퍼타일로 클러스터를 확장할 수 있음을 보여줬다. 이 마지막 단계에서는 일종의 재귀가 시작되는데 슈퍼타일은 메타타일의 속성을 공유하기 때문에 동일한 그룹화 프로세스가 슈퍼타일에도 적용된다. 따라서 모자를 메타타일로 그룹화하고, 메타타일을 슈퍼타일로 그룹화하면 그 이후의 모든 계층은 수학적으로 일반화할 수 있다.
2022년 12월 스미스는 모자와 매우 유사한 특징을 가진 거북이라는 두 번째 비주기적 모노타일을 발견했다. 다른 사람들이 50년 동안 찾지 못하던 것을 스미스가 2주 만에 두 개의 모노타일을 발견하는 것이 가능한 일일까.
사실 모자와 거북이는 연속적인 다각형 계열의 두 도형이었으며, 모두 같은 방식으로 타일을 붙인 비주기적인 도형이다.
구체적으로 모자는 길이 1과 √3의 변으로 이뤄진 다각형이다. 사각형의 가로·세로 길이를 독립적으로 변경하여 여러 직사각형 계열의 도형을 생성할 수 있는 것처럼, 폴리카이트의 두 변(a와 b)을 Tile(a, b)라고 부르고 각각의 길이를 변경하면 새로운 다각형을 얻을 수 있다. 이 표기법을 사용하면 모자는 Tile(1,√3 )이 되고 거북이는 Tile(√3, 1)이 된다. 마이어스는 Tile(a, b) 형태의 거의 모든 도형이 동일한 타일을 가진 비주기적 모노타일임을 증명했다. 다만 세 가지 예외가 있었는데, Tile(0, 1)('갈매기' 타일), Tile(1, 0)('혜성' 타일), 그리고 정다각형 Tile(1,1)(별명은 얻지 못했다)이 바로 그것이다. 이 세 가지 도형은 각각 주기적 타일링과 비주기적 타일링을 모두 허용하는 보다 유연한 도형이기 때문에 비주기적 모노타일로 인정할 수 없었다.
얼마 지나지 않아 마이어스는 모자와 거북이 사이의 연결 고리를 확장하여 Tile(a,b) 연속체를 기반으로 모자의 비주기성에 대한 새로운 증명을 개발했다. 그는 모순에 의한 증명 기법을 사용하여 모자의 주기적 타일링의 존재를 가정한 다음, 그러한 타일링의 존재로부터 처음 가정(모자의 주기적 타일링)이 불가능하다는 부조리를 도출해 냈다. 그는 먼저 주기적 모자 타일링의 가장자리를 늘이고 줄이면서 갈매기와 혜성에 의한 동등한 주기적 타일링을 얻을 수 있다는 것을 발견했다. 그러나 갈매기와 혜성은 모두 서로 다른 스케일의 정삼각형 타일링 위에 세워진 폴리아몬드(정삼각형의 결합)다. 마이어스는 조합론, 기하학, 그리고 약간의 정수론이 포함된 논증을 통해 갈매기와 혜성 타일링이 동일한 것으로 추정되는 주기적 모자 타일링에서 비롯됐기 때문에 단위 요소인 삼각형 타일링이 수학적으로 불가능한 배율을 통해 서로 연관되어야 한다는 것을 증명했다. 이것은 모자가 비주기적 모노타일이라는 것을 증명하는 새로운 방법이었다. 이는 모자의 비주기성에 관한 주장을 강화할 뿐만 아니라 이 분야에서 완전히 새로운 증명 방법을 제시하여 향후 다른 타일을 분석하는 데 유용할 수 있다는 점에서 시사하는 바가 크다.
유령 타일, 반사된 타일 없이 강한 비주기성 증명해
모자를 처음 공개했을 때 사람들은 다른 어떤 것보다도 반사 타일을 사용한다는 점을 가장 많이 지적했다. 스미스와 카플란 교수가 초기에 발견한 것처럼, 모자를 이용한 모든 타일링에는 반사된 모자가 드문드문 분포되어 있어야 한다. 모노타일의 정의는 반사 도형을 합법적인 움직임으로 허용해 왔었다. 그런데도 많은 사람들은 타일을 뒤집지 않는 '한 손' 또는 '카이랄'(어떤 대상이 거울에 비춘 모양과 합동을 이루지 않을 때) 비주기적 타일링을 생성하는 도형이 존재할 수 있을까 궁금해했다.
다행히도 스미스는 놀라운 사실을 하나 더 알려줬다. 첫 번째 원고를 올린 지 일주일도 채 지나지 않아 그는 모자와 거북이를 포함하는 도형 연속체의 등변 Tile(1, 1)에 대해 이메일을 보내기 시작했다. 메일을 받은 세 명 모두 해당 다각형은 비주기적 타일이 아니라 무반사 타일과 반사 타일이 섞인 주기적 타일이라는 것을 알고 있었다. 하지만 스미스는 의도적으로 한 손으로만 뒤집는 타일로 반사를 제한하면 흥미로운 타일 군집이 만들어지는 것을 관찰했다.
네 사람은 즉시 연구를 시작했다. 그들은 Tile(1,1)의 반사되지 않은 복사본의 메타타일을 계산하고, 타일을 반복되는 클러스터로 그룹화하는 방법을 발견한 다음, 동일한 성질을 갖는 슈퍼타일을 생성하는 치환 시스템을 정리했다. 그 결과 그들은 다시 한번 비주기적 타일링을 강제하는 고유한 무한 치환 계층의 존재를 반사되지 않은(한 손) 타일에서도 발견했다. 마지막으로 Tile(1,1)의 가장자리를 임의의 곡선으로 대체하여 기존 타일과 그 반사 타일이 공존할 수 없도록 설정했다. 이를 유령(spectres) 타일이라고 부르고, 모든 임의의 유령 타일은 카이랄 비주기적 모노타일임을 밝혔다.
카플란 교수는 "항상 아인슈타인 문제에 매료됐지만 직접 연구한 적은 없었고, 2022년 11월에 해답을 받은 후에야 시작했습니다. 모자는 스미스의 손에서 어느 정도 구체화됐고, 운이 좋게도 그가 연락을 줬습니다. 몇 달 후 우리는 어렵지 않게 완전한 증거를 만들 수 있었는데, 네 명 모두 수십 년 동안 아인슈타인 문제와 관련된 질문에 대해 고민해 온 노력의 보상 같습니다"라고 소감을 밝혔다.
Smith hadn't specifically set out to find an aperiodic monotile, but he was aware of the history and significance of the problem. He was always on the lookout for signs of aperiodicity in his explorations. It was Smith who first dared to suggest, in an e-mail on November 24, 2022, that the hat might be an einstein, modestly adding, “Now wouldn't that be a thing?”
Smith and I began trying to understand the hat's behavior. The hat is what's known as a polyform: a shape made up of copies of some simple unit element. For example, the pieces in the video game Tetris represent all the ways to stick four squares together.
The hat is made from eight kites. These kites aren't the same as Penrose's; Smith made them by slicing a regular hexagon into six equal pieces with lines connecting the midpoints of opposite edges.
He knew that I had recently written software to compute Heesch numbers of polyominoes (glued-together squares), polyhexes (regular hexagons) and polyiamonds (equilateral triangles), and he wondered whether it could be adapted to polykites. Fortunately, I had added support for kites the year before with the help of Ava Pun, an undergraduate at the University of Waterloo.
My software easily generated large clusters of hats without getting stuck, reinforcing our belief that the hat tiled the plane. Better yet, these new computer-generated clusters became raw data that Smith and I could study to refine our intuition. We began grouping hats in different ways, usually coloring them by hand in digital illustrations, to search for order. Recurring patterns leaped out immediately, organized around a sparse arrangement of reflected hats embedded in a larger field of unreflected hats (something Smith had also observed in his paper experiments).
Yet these patterns never formed a translational unit. Moreover, the tiles seemed to build up into families of related “motifs” at multiple scales. This kind of recurring hierarchy hinted at a best-case scenario for eventually proving the hat was aperiodic: we could hope to find a system of so-called substitution rules. In a substitution system, every tile shape in a set is equipped with a rule that can be applied to replace it by a collection of smaller copies of the tiles. Armed with a suitable substitution system for hats, we might be able to start with a “seed” configuration of tiles and apply the rules iteratively, zooming in as we go to preserve scale. In this way, we would define a sequence of ever-larger clusters of hats, which would eventually fill the entire plane. Many aperiodic tile sets, including Penrose's, can be shown to tile the plane with substitution systems like these.
On my 50th birthday, about two weeks after I first saw the hat, I found a preliminary set of substitution rules. The trick was to avoid working directly with “naked,” or single, reflected hats, which necessarily behaved differently than their unreflected counterparts. Instead I grouped each reflected hat with three of its neighbors to form an indivisible unit, a new “metatile” that could be treated as a full-fledged tile shape with a substitution rule of its own. I refined the metatiles and their rules through the rest of 2022, arriving at a system of four metatiles, each one a kind of schematic representation of a small cluster of hats.
By the start of 2023 Smith and I had half of a proof of aperiodicity, and arguably it was the easy half. Our metatiles and substitution rules guaranteed that the hat was a monotile: it tiled the infinite plane rather than petering out with an unexpectedly large, but finite, Heesch number. And it was easy to see that the tilings generated by the rules were nonperiodic. But remember that nonperiodicity is a far cry from aperiodicity. Perhaps our rules were just an overly complicated way to construct hat tilings, and periodic tilings existed, too. To complete the proof, we had to show that every tiling by hats was necessarily nonperiodic. I had some inkling of how that step might play out, but I felt as I imagine Smith had the previous November: close to the limits of my mathematical expertise. It was time to call in reinforcements.
Early in January 2023 Smith and I reached out to Goodman-Strauss, a mathematician who has published many important articles about tiling theory. I consider him a go-to authority on contemporary research. He is also known as a mathematics communicator and an organizer of hands-on activities, and at the time he was transitioning into a new role as an outreach mathematician at the National Museum of Mathematics in New York City. In other words, he was already swamped. But he provided valuable input and insisted that we also contact Myers immediately. Myers left academia after receiving a Ph.D. in the mathematical field of combinatorics, but he remained interested in tilings. In particular, he maintained a long-term project to catalog the tiling properties of polyforms. I had run some supporting computations for him back in 2006, and I was using his software as part of my own research on Heesch numbers.
I hadn't worked that closely with Myers before, so I was unprepared for his combination of mental horsepower, coding skill and knowledge of the field. His previous work on tilings had left him perfectly prepared for this moment. A mere eight days after being introduced to our work in progress, Myers completed the proof, confirming in late January that the hat was the world's first aperiodic monotile.
Before Myers came onboard, we already had our substitution rules and could generate tilings; his mission was to prove that all tilings by the hat had to be nonperiodic. In the aperiodicity playbook, the standard move at this point is to show that any tiling bears the imprint of the substitution rules. In other words, he needed to prove that for any arbitrary hat tiling, there is a unique way to group tiles into metatiles, metatiles into supertiles, and so on forever, reverse-engineering an infinite tower of substitutions that ends with the full, infinite tiling. A preexisting mathematical argument then would allow us to conclude that the tiling must be nonperiodic. The challenge of this strategy is to locate this tower atop an arbitrary hat tiling whose construction was not constrained at the outset to obey our rules.
Myers developed a computer-assisted approach to solving this problem. We generated an exhaustive list of 188 small clusters of tiles that could appear in hat tilings. These clusters represented every legal arrangement around a single hat so that each tile in any conceivable tiling must lie at the center of one such cluster. Myers then showed that each of these clusters could be divided up in a unique way into fragments of the metatiles, implying that the hats in any tiling could be grouped to yield a tiling by metatiles. Finally, he demonstrated that in a tiling made of metatiles, it was always possible to group metatiles into larger clusters called supertiles, which behave exactly like larger metatiles. This last step launches a kind of recursion: because the supertiles behave just like metatiles, the same grouping process applies to them as well. Once we group hats into metatiles and metatiles into supertiles, all subsequent levels of the hierarchy lock into place with a single mathematical flourish.
We had our prize, and in early February 2023 we began writing a manuscript to share the hat with the world. That might have been the end to an already magical story were it not for Smith's capacity for mathematical discovery. Way back in December 2022 he had shocked me by e-mailing me a second shape, a polykite we call the turtle, which behaved a lot like the hat. The turtle, too, radiated an uncanny aura of aperiodicity. Was it possible that Smith had discovered two revolutionary shapes in two weeks after others had looked in vain for 50 years? I begged for patience; my head was already full of hats, so to speak.
But after resolving the status of the hat, Myers began contemplating the neglected turtle. A week or two later he stunned the three of us with the observation that the turtle was necessarily also aperiodic because it was really just a hat in disguise. In fact, the hat and the turtle were two shapes in a continuous family of polygons, all of which were aperiodic and tiled in the same way.
The hat can be regarded as a polygon with edges of length 1 and √3 (where two consecutive edges of length 1 form one longer edge). Just as one can construct a family of rectangles by varying the lengths of its horizontal and vertical edges independently, we can choose any two numbers a and b to replace the hat's edge lengths and obtain a new polygon that we will call Tile(a,b). Using this notation, the hat is Tile(1, √3), and the turtle is Tile(√3, 1). Myers showed that nearly all shapes of the form Tile(a,b) are aperiodic monotiles with the same tilings. There were just three exceptions: Tile(0,1) (the “chevron”), Tile(1,0) (the “comet”) and the equilateral polygon Tile(1,1) (which never acquired a catchy nickname). Each of these three shapes is more flexible, admitting both periodic and nonperiodic tilings.
Soon after, Myers doubled down on the link he had forged between the hat and the turtle, developing a remarkable second proof of the hat's aperiodicity based on the Tile(a,b) continuum. He relied on the classic technique of proof by contradiction: he posited the existence of a periodic tiling of hats, and then, from the existence of such a tiling, he derived an absurdity that showed the initial supposition (the periodic hat tiling) was impossible. Specifically, he found that one could stretch and squeeze edges in a periodic hat tiling to obtain equivalent, periodic tilings by chevrons and comets. But chevrons and comets are both polyiamonds (unions of equilateral triangles) built on top of regular triangular tilings at different scales. In an argument that involves combinatorics, geometry and a dash of number theory, Myers proved that because the chevron and comet tilings originated from the same supposedly periodic hat tiling, their underlying triangle tilings would have to be related to each other through a mathematically impossible scaling factor. This was a second way to prove that the hat is an aperiodic monotile. It's exciting not just because it bolsters the claim of the hat's aperiodicity but also because it represents a whole new method of proof in this field, which could be useful in analyzing other tiles in the future.
We put our manuscript online in March 2023 and received an enthusiastic, overwhelming response from mathematicians and tiling hobbyists. The hat became an immediate source of inspiration for artists, designers and puzzle creators (you can now buy hat tiling sets on Etsy, for instance). It's important to remember that the work has not yet emerged from the crucible of peer review, although it has withstood a great deal of scrutiny from experts with barely a scratch.
When we first revealed the hat, people objected to one aspect of our work more frequently than any other: the use of reflected tiles. Every tiling by hats must include a sparse distribution of reflected hats, as Smith and I discovered early on. Mathematically, this objection does not derail our result: the accepted definition of a monotile has always allowed reflections as legal moves in tilings. Still, many wondered, could there be a shape out there that yields a “one-handed,” or “chiral,” aperiodic tiling in which no tiles are flipped over? Our manuscript offered no insight into this problem, and we were as prepared as everyone else to settle in for the long wait until its resolution.
Happily, Smith had one more astounding surprise for us. Less than a week after our first manuscript went live, he began e-mailing the rest of us about Tile(1,1), the equilateral member of the continuum of shapes that included the hat and the turtle. We knew that this polygon was not aperiodic: it admitted periodic tilings that mixed unreflected and reflected tiles. But Smith observed that if he deliberately restricted himself to tiles of a single-handedness (no flipping allowed), he produced intriguing clusters of tiles.
The four of us immediately dove into a new collaboration. We computed large patches of unreflected copies of Tile(1,1) and studied them for patterns. We discovered a way to group tiles into recurring clusters and then determined substitution rules for those clusters that yielded superclusters with identical behavior. Once again, this recursive grouping guaranteed the existence of a unique infinite hierarchy of substitutions that forced all unreflected (single-handed) tilings to be nonperiodic. The final trick was simply to replace the edges of Tile(1,1) with arbitrary curves, which guaranteed that tiles and their reflections couldn't coexist in a tiling. The result was a family of shapes that we called spectres, all of which turned out to be chiral aperiodic monotiles.
There is a romance to stories of mathematicians working for years on intractable problems, sometimes in secret, and finally emerging into the light with a new result. That is not our story. Although I was always fascinated by the einstein problem, I never worked on it directly—I started only when I was handed the answer in November 2022. The hat more or less materialized in Smith's hands, and I was lucky that he chose to contact me. A few months later we had a complete proof, created through a process that was, as far as I can tell, painless for all four of us. Perhaps our pace reflects the fact that there is a clear procedure to follow in generating a proof of aperiodicity if you have the right shape to begin with. Our sense of ease was also surely a result of the decades we had each spent pondering the einstein problem and related questions. That experience left us well positioned to recognize the hat as a possible solution and to know what to do with it.
There is no shortage of unsolved problems in tiling theory, a branch of mathematics with a low barrier to entry and lots of visual appeal. Smith joins a pantheon of enthusiastic amateurs who have made important contributions to the field, often after reading about open problems in this magazine. He is in the company of Robert Ammann, who independently discovered many of the same results as Penrose and contributed other important ideas to tiling theory; Marjorie Rice, who discovered new classes of pentagonal monotiles; and Joan Taylor, who originated the Socolar-Taylor tile. I should also include the artist M. C. Escher, who invented the math he needed to draw his tessellations, even if he would not have thought of it as math at all.
As the impact of our aperiodic monotiles ripples outward, I'm sure it will stimulate new scholarly research. But I hope we also entice others who might have seen mathematics as forbidding but now recognize an opportunity to play.