Skip to main content

[해외 DS] 이젠 펫케어도 AI로, 고양의 미묘한 표정도 읽어내

[해외 DS] 이젠 펫케어도 AI로, 고양의 미묘한 표정도 읽어내
Picture

Member for

1 month 1 week
Real name
이태선
Position
연구원
Bio
[email protected]
세상은 이야기로 만들어져 있습니다. 다만 우리 눈에 그 이야기가 보이지 않을 뿐입니다. 숨겨진 이야기를 찾아내서 함께 공유하겠습니다.

수정

고양이의 표정을 통해 통증을 판단하는 AI 모델 개발
얼굴에서 입이 통증을 인식하는 데 가장 중요한 특징
동물의 정서적 삶에 관한 연구도 이어질 예정

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 데이터 사이언스 경영 연구소 (GIAI R&D Korea)에서 영어 원문 공개 조건으로 콘텐츠 제휴가 진행 중입니다.


cats_can_hide_their_pain_but_not_from_ai
사진=Scientific American

고양이는 신비주의자다. 개와 달리 고양이는 자신의 감정과 의도를 숨기는 데 능숙한데, 이는 아마도 고독한 사냥꾼으로 진화한 역사 때문일 것이다. 포커페이스를 유지하는 장기 때문에 고양이 집사와 수의사는 고양이의 표정과 행동에서 고통의 징후를 읽어내기 어려웠다. 하지만 새로운 인공 지능 프로그램을 통해 마침내 그 이면을 들여다볼 가능성이 제시됐다.

AI 연구원과 수의사로 구성된 한 연구팀은 동물병원에서 치료 중인 고양이의 표정을 바탕으로 통증 여부를 판단하는 두 가지 머신러닝 알고리즘을 개발하여 테스트를 진행했다. 최근 사이언티픽 리포트(Scientific Reports) 논문에서 소개된 이 자동화 시스템은 최대 77%의 정확도를 보여 강력한 수의학 도구로 사용될 전망이다. 이 연구는 당시 이스라엘 하이파대학에 재학 중이던 마르셀로 페이겔스타인(Marcelo Feighelstein)과 독일 하노버의 수의과대학에 재학 중이던 레아 헨체(Lea Henze)가 공동으로 주도했다.

논문의 공동 시니어 저자인 하이파대학의 컴퓨터과학자 안나 자만스키(Anna Zamansky)와 하노버 수의과대학의 홀거 볼크(Holger Volk)는 수의사와 고양이 보호자가 사진을 찍으면 자동으로 통증을 감지할 수 있는 모바일 앱을 개발할 계획이라고 말했다. 다른 AI 개발자들이 고양이 감정의 비밀을 밝혀내려고 시도한 적은 있지만(2021년에 출시된 Tably이라는 앱도 이를 주장하고 있다), 동료평가를 거친 과학적 연구를 발표한 것은 이번 연구가 처음이라고 전했다.

출처=Scientific American

현재 수의사들은 고양이의 통증을 측정하기 위해 글래스고 복합측정통증척도 등 복잡한 검사를 사용하고 있지만, 동물의 표정과 행동을 세심하게 관찰해야 한다. 과학적으로 검증되긴 했지만, 이러한 척도는 수의사의 주관적인 평가에 의존하고 있어 시간이 오래 걸린다. 이 논문에 참여하지 않은 텔아비브대학교의 수의행동학자 스테판 브루어(Stephane Bleuer)는 이러한 점 때문에 기존의 테스트 방식을 추천하지 않는다고 밝혔다.

랜드마크 기반 AI, "고양이의 안면 수축량과 통증 척도를 매칭"

"기계가 시각 정보의 미묘한 디테일에 민감하므로 인간의 육안보다 더 많은 것을 볼 수 있다"라고 자만스키는 강조했다.

새로운 모델을 개발하기 위해 연구원들은 학습과 검증을 위한 데이터가 필요했다. 독일 하노버 수의과대학 동물병원에서 다양한 병력을 가진 다양한 품종과 연령대의 고양이 84마리의 사진을 표준치료의 하나로 촬영했다. 사진 속 고양이들은 글래스고 척도와 골절, 요로 문제 등 알려진 임상 질환으로 인한 예상 통증 수준에 따라 점수가 매겨졌다. 이 측정값은 연구팀의 AI 모델을 훈련하고 그 성능을 평가하는 데 사용됐다. 연구 저자에 따르면, 위 과정에서 고양이에게 어떠한 고통도 주지 않았다고 한다.

연구팀은 고양이 사진만으로 통증을 감지할 수 있는 두 가지 기계학습 알고리즘을 만들었다. 한 알고리즘은 귀, 눈, 입과 관련된 48개의 '랜드마크(landmarks)'를 이용해 안면 근육의 수축량(일반적인 통증의 지표)을 조사했다. 다른 알고리즘은 비정형 데이터에 대한 딥러닝 기법을 사용해 얼굴 전체의 근육 수축 및 기타 패턴을 분석했다.

랜드마크 기반 AI 접근법은 고양이의 통증 여부를 식별하는 데 77%의 정확도를 보였지만, 딥러닝 접근법은 65%에 불과했다. 연구진은 이러한 차이가 딥러닝 시스템이 '데이터에 굶주린' 시스템이기 때문에 발생할 수 있다고 설명했다. 해당 연구에서는 비교적 적은 양의 이미지 데이터만 사용할 수 있었다.

또한 연구진은 정확한 통증 인식에서 귀나 눈이 아닌 고양이의 입이 가장 중요한 얼굴 특징이라는 것을 발견했다. "이것은 AI의 장점이기도 하다. AI는 데이터의 숲에서 아무도 생각하지 못했던, 갑자기 차이를 만들어내는 무언가를 찾아낸다"라고 세바스찬 멜러(Sebastian Meller)는 전했다.

정확한 진단을 위해 겉으로 드러나는 표정과 실제 감정을 구분해야

그러나 감정과학 분야의 독일 심리학자 데니스 큐스터(Dennis Küster)는 위의 연구에서 표정과 감정을 구별하는 것이 중요하다고 지적했다. 인간을 대상으로 한 테스트에서 AI는 얼굴의 패턴을 인식하는 경향이 있으며, 기계가 그 뒤에 숨은 의미를 반드시 인식하는 것은 아니라고 그는 설명했다. 게다가 표정이 항상 특정 감정과 연결되는 것은 아니다. 큐스터는 사회적 미소를 예로 들었는데, 미소를 짓고 있더라도 그것이 반드시 행복감을 의미하지는 않는다고 꼬집었다.

하지만 감정 인식 AI가 잘하는 맥락도 있다고 그는 덧붙였다. 이번 연구에 참여하지 않은 미국 아칸소주 라이언칼리지의 심리학 조교수인 브리트니 플로키위츠(Brittany Florkiewicz)는 고양이나 다른 비인간종은 자신이 생각하고 느끼는 것을 말로 표현할 수 없기 때문에, 연구자들에게는 이러한 소통의 장벽을 넘을 수 있는 시스템을 개발하는 것이 중요하다고 말했다. AI는 입력되는 데이터만큼만 성능이 향상되기 때문에 데이터 세트가 크고 다양하며 사람의 감독하에 맥락과 미묘한 정보를 포함하는지 확인하는 것이 기계의 정확성을 높이는 데 도움이 될 것이라고 조언했다.

아울러 플로키위츠는 최근 고양이가 276가지 표정을 지을 수 있다는 사실을 발견했다. 그녀는 자만스키 팀과 협력하여 고양이가 고통을 느끼는지 여부를 평가하는 데 그치지 않고, 고양이의 정서적 삶에 대한 더 깊은 통찰력을 얻기 위해 연구할 계획이다. 또한 자만스키는 개를 포함한 다른 종으로 연구를 확장하고, 자동화된 시스템이 전신 동영상을 기반으로 고양이의 통증을 판단할 수 있는지 검증할 생각이다.


Cats Can Hide Their Pain—But Not from AI

Machine-learning software gets behind the inscrutable feline face and may improve pet care

Household cats are a secretive species. Unlike dogs, they are masters at masking their feelings and intentions—possibly because of their evolutionary history as solitary hunters. This built-in stoicism makes it hard for cat owners and veterinarians to read signs of pain in a cat’s facial expressions and behaviors, but new artificial intelligence programs may be able to finally peer behind the mask.

A team of AI researchers and veterinarians has created and tested two machine-learning algorithms that judged whether cats being treated in a veterinary hospital were experiencing pain based on the animals’ facial expressions. These automated systems, described in a recent Scientific Reports paper, were up to 77 percent accurate, suggesting the potential for powerful new veterinary tools. The study was co-led by Marcelo Feighelstein, then at Israel’s University of Haifa, and Lea Henze, then at the University of Veterinary Medicine Hannover in Germany.

The investigators plan to develop a mobile app that will let both veterinarians and cat owners snap a photograph to automatically detect pain, says Anna Zamansky, a computer scientist at the University of Haifa, who, along with Holger Volk of University of Veterinary Medicine Hannover, was a co-senior author of the paper. Although other AI developers have tried to unravel the secrets of feline emotions (an app called Tably, launched in 2021, also claims to do so), Zamansky says this study is the first to publish peer-reviewed scientific research about it.

Veterinarians currently measure feline pain using complex tests such as the Glasgow Composite Measure Pain Scale, which requires painstakingly examining an animal’s facial expressions and behaviors. Although scientifically validated, these scales rely on a veterinarian’s subjective assessment and are highly time-consuming. This discourages the use of such tests, says Stephane Bleuer, a veterinary behaviorist in Tel Aviv, who was not involved in the paper.

“Our belief is that the machine will do a better job,” Zamansky says of her team’s project. “The machine can see more than the naked human eye because it’s sensitive to subtle details of visual information.”

To develop the new model, the researchers needed data to train and test it. Photographs of 84 cats of various breeds and ages with varying medical histories were taken at the University of Veterinary Medicine Hannover’s animal hospital in Germany as part of standard care. The cats in these images had been scored based on the Glasgow scale and on the expected level of pain from their known clinical conditions—such as bone fractures or urinary tract problems. These measurements were used to train the team’s AI models and to evaluate their performance. The study authors say that none of their research inflicted any suffering on the cats.

The researchers created two machine-learning algorithms that could detect pain based on the cat photographs alone. One algorithm looked at the amount of facial muscle contraction (a common pain indicator) by using 48 “landmarks” involving the ears, eyes and mouth. The other algorithm used deep-learning methods for unstructured data to analyze the whole face for muscle contractions and other patterns.

The landmark-based AI approach was 77 percent accurate in identifying if a cat was in pain, but the deep-learning approach came in at only 65 percent. The researchers say this difference could stem from deep-learning systems being “data-hungry”—only a relatively small data set of images was available for this study.

The researchers also found that the cat’s mouth, instead of the ears or eyes, was the most important facial feature in accurate pain recognition, says study co-author Sebastian Meller, a veterinarian at the University of Veterinary Medicine. “We didn’t expect that, and that is also the beauty about AI, maybe,” Meller says. “It finds something in the forest of data that suddenly makes a difference that no one was thinking about before.”

It is important to distinguish between facial expressions and emotions, however, says Dennis Küster, a German psychologist with a background in emotion science, who was not involved in the study. Tests with humans have shown that AI tends to recognize facial patterns and not necessarily the meanings behind them, he explains. Moreover a facial expression may not always be associated with a particular emotion. “The best example is the social smile. So I might be smiling now, but maybe I just want to be friendly and indicate…, ‘Yeah, okay, let’s continue with this interview,’” Küster says. “We express certain things automatically, and they don’t necessarily mean that we are flowing over with happiness.”

Nevertheless, there are some contexts where emotion recognition AI can excel, he adds. Cats and other nonhuman species cannot vocalize what they are thinking or feeling, making it important for researchers to develop systems that can cross those communication barriers, says Brittany Florkiewicz, an assistant professor of psychology at Lyon College, who was not involved in the study. AI is only as good as the data it is fed, she notes. So ensuring the dataset is large, diverse and human-supervised—and that it contains contextual and nuanced information—will help make the machine more accurate, Florkiewicz says.

Florkiewicz recently found that cats can produce 276 facial expressions. She plans to collaborate with Zamansky’s team to gain deeper insights into felines’ emotional lives that will go beyond assessing whether or not they are in pain. Zamansky also plans to expand her research to include other species, including dogs, and to see whether automated systems can judge feline pain based on full-body videos.

Once a cat shows obvious signs of pain, it has probably been suffering for a long time; a convenient and practical pain app might allow for quicker detection of problems and could significantly advance cat care, Bleuer says. “When you improve the welfare of pets, you improve the welfare of people,” he says. “It’s like a family.”

This study focused on crossing interspecies communication barriers, and Zamansky points out that the researchers first had to overcome human ones: The international team members speak different languages, live in different countries and work in different disciplines. They are AI researchers, veterinarians, engineers and biologists. And their efforts ultimately aim to help a broad group of creatures encompassing cats, vets and pet owners. That effort led at least one researcher to cross a barrier of her own.

“Before we started this work, I was [completely a] dog person, but now I want to have a cat,” Zamansky says. “I think I fell in love with cats a bit.”

Picture

Member for

1 month 1 week
Real name
이태선
Position
연구원
Bio
[email protected]
세상은 이야기로 만들어져 있습니다. 다만 우리 눈에 그 이야기가 보이지 않을 뿐입니다. 숨겨진 이야기를 찾아내서 함께 공유하겠습니다.

[해외 DS] 암호화된 '비밀 공유', 정보를 안전하게 보호하는 방법

[해외 DS] 암호화된 '비밀 공유', 정보를 안전하게 보호하는 방법
Picture

Member for

1 month 1 week
Real name
이효정
Position
연구원
Bio
[email protected]
지식은 전달하는 정보가 아니라, 함께 고민하기 위해 만들어진 언어입니다.

수정

샤미르의 비밀 공유, 다수의 참여자가 협력해야만 암호를 풀 수 있었
다항식의 성질을 활용해 참여자의 숫자에 상관없이 일반화가 가능해
만에 하나의 가능성을 배제하기 위해 숫자 범위를 유한체로 전환

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 데이터 사이언스 경영 연구소 (GIAI R&D Korea)에서 영어 원문 공개 조건으로 콘텐츠 제휴가 진행 중입니다.


cryptographic_secret_sharing
견제와 신뢰 사이의 딜레마를 수학적으로 해결한 샤미르 비밀 공유/사진=Scientific American

러시아 속담인 '신뢰하되 검증하라'는 냉전 시대 미국 대통령인 로널드 레이건이 핵 군축을 언급할 때 자주 사용한 말이다. 이는 미국이 소련을 신뢰할 수 있지만, 소련이 미국을 배신하지 않을지 확인해야 한다는 의미를 내포하고 있다. 이 속담은 오늘날 국가 안보 및 보안 분야에서 자주 활용되며, 수학자 아디 샤미르(Adi Shamir)는 자신의 이름을 딴 '샤미르의 비밀 공유(Shamir’s Secret Sharing, 이하 SSS)' 알고리즘을 개발할 때 이러한 속담의 의미를 한 번쯤 생각해 봤을 것이다.

샤미르의 보안 메커니즘을 이해하기 위해서는 다음과 같은 상황을 이해하는 것이 도움이 된다. 한 노파가 비밀번호 자물쇠로 잠긴 금고의 내용물을 다섯 아들에게 물려주고 싶지만, 모든 아들을 신뢰하지 않는 상황을 가정해 보자. 이 노파는 한 명의 아들에게만 비밀번호를 알려주면 그 아들이 유산을 훔쳐 달아날까 걱정이다. 그래서 그녀는 5명의 아들이 협력하여 금고를 열 수 있도록 각 아들에게 단서를 주려고 한다. 예를 들어, 5자리 비밀번호가 있어야 하는 잠금장치라면 각 아들에게 숫자 한자리씩 주어 함께 열 수 있도록 설계할 수 있다. 그러나 세 아들이 팀을 이루면 나머지 두 형제를 우회할 가능성이 있으며, 세 아들은 전체 코드의 숫자가 두 개만 부족하므로 유산을 얻기 위해 가능한 숫자 조합을 빠르게 시도할 수 있다는 문제점이 있다.

노파는 5명이 모두 협력하지 않으면 사용할 수 없는 암호 설계 방법을 모색했다. 5명의 아들 중 2, 3, 4명이 함께해도 그 결과는 쓸모없는 정보여야만 한다. 이런 제약 사항은 작업을 더욱 복잡하게 만들었지만, 1979년 샤미르는 이러한 어려움에도 굴하지 않았다. 그는 2년 전(1977년), 로널드 라이베스트(Ron Rivest)와 레너드 애들먼(Leonard Adleman)과 함께 'RSA 알고리즘'이라고 불리는 암호 알고리즘을 개발했다. 이 알고리즘은 처음으로 널리 채택된 비대칭 암호화 알고리즘이었고, 오늘날에도 여전히 사용되고 있다. SSS 알고리즘으로 또 한 번 혁신적인 방법을 창조함으로써 보안 분야에서 중요한 발전을 이뤘다.

샤미르의 비밀 공유, 좌표평면 위에서 이뤄지는 간단한 일반화

SSS를 이해하기 위해서는 구체적인 수치 예시를 살펴보는 것이 도움이 된다. 노파의 비밀 코드가 43953이고, 편의상 그녀에게 아들이 두 명만 있었다고 가정해 보자. (아들이 다섯 명인 경우는 아래에서 설명한다). 만약 노파가 한 아들에게 "439"를, 다른 아들에게 "953"을 맡겼다고 가정하면, 그녀는 두 아들에게 같은 양의 정보를 준 셈이다. 이제 위에서 설명했듯이, 아들들은 각각 부족한 두 자리 숫자를 맞추려고 할 수 있다. 금고를 열려면 각각 최대 100개의 조합만 시도하면 된다.

따라서 샤미르는 다른 해결책이 필요했다. 먼저 각 아들이 언뜻 보기에 해답과 전혀 상관없는 정보를 받는 것이 최선일 것이다. 하지만 두 정보를 조합하면 43953이라는 숫자 조합을 쉽게 추론할 수 있어야 하는데, 이를 선형 방정식을 사용하여 우아하고 간단하게 할 방법이 있다. 각 직선은 두 점에 의해 고유하게 정의되는 특성이 있는데, 두 아들에게 직선의 한 점씩의 좌표를 주면 두 아들은 Y축과 교차하는 높이(43953)를 통해 비밀번호를 쉽게 구할 수 있다. 예를 들어, 노파는 직선 y = 5x + 43953의 방정식을 선택해 첫째 아들에게는 점 P1(33503, 211468)의 좌표를, 다른 아들에게는 두 번째 점 P2(85395, 470928)의 좌표를 줄 수 있다. 두 아들이 수학을 잘 못해도 두 점을 평면에 표시하고 자로 연결하여 그 직선이 Y축과 교차하는 지점을 읽으면 금고의 해답을 구할 수 있다. 아들 중 한 명은 한 점만으로는 아무것도 할 수 없다. 한 점을 통과하는 직선은 무한히 많기 때문이다.

만약 이제 이 노파에게 세 아들이 있다면 비슷한 방법으로 방정식을 확장하여 사용할 수 있다. 다만 이 경우 비밀번호를 감추기 위해 직선이 아닌 포물선을 그려야 한다. 노파는 2차 함수 y = 5x2 + 10x + 43953을 선택하여 아들들에게 각각 포물선 상의 점을 줄 수 있다. 이 경우에도 Y축과의 교차점이 원하는 해(43953)에 해당한다. 두 점을 통과하는 포물선은 무한히 존재하기 때문에 두 아들은 세 번째 아들과 협력할 수밖에 없다. 아들이 두 명일 때와 세 명일 때 방정식의 차수 증가할 뿐, 크게 달라지는 부분이 없다. 따라서 노파에게 몇 명의 아들이 있던지 우리는 문제를 일반화할 수 있게 되었다. 따라서 4명의 아들을 둔 노파는 y = ax3 + bx2 + cx + 43953의 방정식으로 풀 수 있다. (이 방정식에서 3이 가장 높은 지수이기 때문에 3차 다항식이라고 한다). 아들이 다섯 명인 노파는 4차 다항식을 사용하면 된다(y = ax4 + bx3 + cx2 + dx + 43953 등). 이 원리는 소위 다항식 보간법에 기초한다. 일반적으로 n차 다항식을 고유하게 결정하려면 n + 1점이 필요하다.

3_polynomials_of_degree_2_through_2_points_d
There are infinitely many parabolas that pass through two points/사진=Scientific American

노파는 아들들에게 두 명씩 짝을 지어 금고에 접근하게 할 수도 있다. 이 경우, 금고가 열리려면 5명 중 2명이 있어야 하므로 노파는 다시 직선을 기준으로 선 위에 무작위로 5개의 점을 표시한다. 각 아들에게 좌표를 부여하여 두 아들이 만나면 암호를 해독할 수 있도록 설정할 수 있다. 하지만 여기서 한 가지 함정이 있는데, 5명의 아들 시나리오로 돌아가 보자. 만약 4명이 형제와 공모하면 4점을 이용해 가능한 한 4차 방정식을 풀 수 있다. 물론 암호를 쉽게 구할 수는 없다. 결국 두 개의 미지수, 즉 매개변수 a와 코드 c(이 예시에서는 43953이지만 아들들은 이를 알지 못한다)를 가진 방정식이 남는다. 네 아들은 c가 정수여야 한다는 것을 알고 있다. 또한, 어머니가 곡선상의 점의 좌표를 항상 정수로 주었다면, a도 정수일 것으로 추측할 수 있다. 이것은 가능성의 폭을 상당히 좁혀준다. 형제는 컴퓨터 프로그램을 이용해 다양한 시도로 해답을 찾을 수 있다.

유한체를 적용해 보다 완전한 무작위성을 보장

위의 가능성을 배제하기 위해 샤미르는 또 다른 트릭을 준비했다. 일반적인 실수로 계산하는 대신 더 작은 수 공간, 즉 유한체(finite field)에서 계산하는 것으로 제한한 것이다. 이 숫자 체계에서는 기본적인 사칙연산(덧셈, 곱셈, 뺄셈, 나눗셈)을 정상적으로 수행할 수 있다. 하지만 이 수자 공간에는 무한한 수가 존재하는 것이 아니라 유한한 수만 존재한다.

Polynomial-interpolation_d
n차 다항식을 구하려면 최소 n+1 포인트가 필요하다/사진=Scientific American

생소하게 들릴 수도 있지만, 우리는 일상적으로 유한체를 사용하고 있다. 시계만 보더라도 12나 24라는 숫자로 구성되어 있다. 오후 11시에 누군가가 "빵집은 7시간 후에 문을 연다"고 말해도 그것이 6시를 말하는 것임이 모두에게 분명하다. SSS에서도 제한된 수의 범위를 채택하지만, 상한은 대개 큰 소수로 정한다. 이러한 방식으로 숫자 범위가 선택되면 다항식의 그래프는 더 이상 연속곡선이 아니라 평면에 무작위로 분포하는 점에 해당한다.

Polynomial_over_a_finite_field_as_per_SSSS_d
유한체에서 다항 방정식을 정의하면 부드러운 곡선이 점의 집합으로 바뀐다/사진=Scientific American

이제 유한체 개념을 통해 형제들이 서로 음모를 꾸미는 것이 사실상 불가능해졌다. 올바른 숫자 코드를 찾기 위해 형제들은 협력해야만 한다. 샤미르의 비밀 공유는 암호화된 이메일 접근을 위한 사용자 키 복구, 암호화폐 지갑에 액세스하는 데 사용되는 마스터 암호를 다시 만드는 데 사용되는 비밀번호를 공유 등에 활용되고 있다.


How Cryptographic ‘Secret Sharing’ Can Keep Information Safe

One safe, five sons and betrayal: this principle shows how shared knowledge can protect secrets—without having to trust anyone

Trust but verify. That expression captures the tension between relying on others while still wanting to keep some level of control over a situation. Mathematician Adi Shamir must have thought about this challenge when he developed what is now known as “Shamir’s secret sharing,” an algorithm named after him.

To understand it, the following puzzle can help: Suppose an elderly woman wants to bequeath the contents of her safe, which is secured with a combination lock, to her five sons, but she is suspicious of each of them. She fears that if she reveals the code to just one, he will make off with the contents. So she wants to give each son a clue such that only the five working together can open the safe. How should the woman proceed?

The task may seem simple. For example, if the combination lock required a five-digit code, she could give each son a number so that they could open it together. But in that scenario, if three sons teamed up, they could likely bypass their two other brothers. Three allies are only two numbers short of the entire code, so they could quickly try out the possible number combinations to get to the coveted contents.

The woman is therefore looking for a way to distribute information that can only be used if all five work together. If two, three or four of the five sons get together, the combined information content must be useless. And that requirement makes the task much more complex.

But in 1979 this challenge did not discourage Shamir. Two years earlier he had developed the so-called “RSA algorithm” together with Ron Rivest and Leonard Adleman. It was the first asymmetric encryption algorithm to be widely adopted, and it is still used today.

SHAMIR’S SECRET SHARING IN ACTION
To understand the Shamir secret-sharing method, it helps to look at a concrete numerical example. Suppose the woman’s secret code is 43953, and, for the sake of simplicity, let’s assume she only has two sons. (We’ll work our way up to the situation with five sons later.)

If the woman were to entrust one son with “439” and the other with “953,” she would have given the two of them the same amount of information. Now, as explained above, the sons could each try to guess the missing two digits. They would only have to try a maximum of 100 combinations each to open the safe.

Shamir therefore needed a different solution. It would be best if each sons received a piece of information that at first glance had nothing to do with the solution. But if you put the two pieces of information together, you should be able to deduce the number combination 43953. And there is an elegant, simple way to do this with the help of a linear equation.

Each straight line is uniquely defined by two points. Shamir realized that the secret number can be encoded in a straight line: for example, as the height at which it intersects the y axis. If you give the two sons the coordinates of one point each on the straight line, they can only determine the number 43953 together. One of the sons cannot do anything with a single point alone: there are an infinite number of straight lines that run through a single point.

The woman could, for example, choose the equation of the line y = 5x + 43953 and give the eldest son the coordinates for a point P1 (33503, 211468) and the other son the coordinates for a second point, P2 (85395, 470928). Even if the two sons are bad at math, they can simply mark the two points in the plane, connect them with a ruler and then read off the point at which the straight line intersects the y axis for the solution to the safe.

So the problem is solved for two sons. If the woman has three sons, she could proceed in a similar way. In this case, however, she would not choose a straight line but rather a parabola to hide the code.

For example, the woman can choose the quadratic function y = 5x2 + 10x + 43953 and give each of her sons a point on the parabola. Again, the point of intersection with the y axis corresponds to the desired solution: 43953. Two of the sons can’t conspire against the third because an infinite number of parabolas can run through two points; the two sons need the help of their brother to find the point of intersection with the y axis and thus the code to the safe.

The principle can be generalized for any number of parties: A woman with four sons can solve an equation of the type y = ax3 + bx2 + cx + 43953. (Because 3 is the highest exponent in this equation, it is called a polynomial equation of the third degree.) A woman with five sons uses a polynomial equation of the fourth degree (such as y = ax4 + bx3 + cx2 + dx + 43953), and so on. The principle is based on so-called polynomial interpolation: in general, n + 1 points are required to uniquely determine a polynomial of the nth degree.

The woman can also give her sons access to the safe in pairs. In this case she relies on the sons controlling each other such that two out of five people need to be present to open the safe. To do this, the woman can again choose a straight line as a base and mark five randomly selected points on it. By giving each son a point, she ensures that two of them can determine the code—regardless of which two of the sons meet.

But there’s a catch. Let’s return to the scenario with the five sons. If four of them conspire against a brother, they can use the four points to solve the fourth-degree equation as far as possible. Of course, they can’t read the code directly from it. In the end they are left with an equation with two unknowns: a parameter a and the code c (which in our example is 43953, but the sons don’t know that).

The four sons know that c must be an integer, however. And if, for example, the woman has always given them integer coordinates for the points on the curve, then they can assume that a probably also has an integer value. This considerably restricts the range of possibilities. The brothers can use a computer program to try out different solutions—and might then determine the correct code.

INTO A DIFFERENT NUMBER RANGE
To avoid such a scenario, Shamir had another trick up his sleeve: instead of calculating with the usual real numbers, he restricted himself to a smaller number space: a finite field. In this number system, the four basic arithmetic operations (addition, multiplication, subtraction and division) can be applied as usual. Instead of an infinite number of numbers, however, this number space only contains a finite number of them.

Though that may sound unfamiliar, we use finite fields every day—for example, whenever we look at the clock. If you only look at the hours, the number range comprises either 12 or 24 numbers. But we still calculate in this limited space: if it’s 11 P.M. and someone says that the bakery opens in seven hours, then it’s clear that they mean six o’clock.

In Shamir’s secret sharing, a restricted number range is also chosen, but the upper limit is usually a large prime number. If the number space is chosen in this way, the graph of a polynomial no longer corresponds to a continuous curve but to randomly distributed points in the plane.

By limiting the woman’s calculations to such a number range, it is practically impossible for the brothers to conspire against each other. To find out the correct numerical code, they have to work together.

Picture

Member for

1 month 1 week
Real name
이효정
Position
연구원
Bio
[email protected]
지식은 전달하는 정보가 아니라, 함께 고민하기 위해 만들어진 언어입니다.

[해외 DS] AI가 기후변화에 미치는 영향, "배출량에만 국한되지 않아"

[해외 DS] AI가 기후변화에 미치는 영향, "배출량에만 국한되지 않아"
Picture

Member for

1 month 1 week
Real name
이시호
Position
연구원
Bio
[email protected]
세상은 다면적입니다. 내공이 쌓인다는 것은 다면성을 두루 볼 수 있다는 뜻이라고 생각하고, 하루하루 내공을 쌓고 있습니다. 쌓아놓은 내공을 여러분과 공유하겠습니다.

수정

온실가스 배출, 화석연료 생산량 증가, 추천 광고로 인한 소비 증가 등 AI가 기후 위기에 부정적인 영향 미쳐
그러나 AI는 자연재해 피해 식별, 배출량 모니터링 등 기후변화 문제를 해결하는 데에도 활용될 수 있어
AI의 양면성을 인지하고 기후변화 대응에 적극적으로 활용하기 위해, 제도적 장치와 윤리적 원칙 필요해

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 데이터 사이언스 경영 연구소 (GIAI R&D Korea)에서 영어 원문 공개 조건으로 콘텐츠 제휴가 진행 중입니다.


AI_climate_impact_goes_beyond_emission
사진=Scientific American

스마트폰의 GPS 내비게이터부터 소셜 미디어를 지배하는 알고리즘에 이르기까지, 기계학습이 적용된 프로그램은 날이 갈수록 증가하는 추세다. 그러나 AI의 인기가 높아짐에 따라 많은 연구자와 전문가들이 환경 비용에 주목하고 있다. AI 시스템을 훈련하고 실행하는 데는 엄청난 양의 계산력과 전력이 필요하며, 이에 따라 배출되는 이산화탄소는 기후변화에 직접적인 영향을 미치기 때문이다. 하지만 AI가 환경에 미치는 영향은 이산화탄소 배출량에만 국한되지 않는다.

시애틀에 있는 앨런AI연구소의 연구원 제시 도지(Jesse Dodge)는 "대규모 AI 시스템의 이산화탄소 배출량을 인식하는 것이 중요하다"라고 지적했다. 그러나 그는 "일반적인 AI 시스템의 환경 영향은 반드시 훈련 비용이 아니라 구축되는 애플리케이션에서 비롯될 수 있다"라고 덧붙였다.

AI의 환경 영향 측정 어려워, 배출량 이외에도 고려해야 할 요소 많아

AI가 기후 위기에 미치는 영향은 온실가스 배출량에만 초점을 맞춘다고 해도 정확한 계산을 하기 어렵다. 연구 자료의 경향을 파악하는 머신러닝 모델, 자율주행차의 장애물 회피를 돕는 비전 프로그램, 챗봇을 대화할 수 있게 하는 대규모언어모델(LLM) 등 AI의 종류에 따라 훈련과 실행에 필요한 계산력이 다르기 때문이다. 예를 들어 OpenAI가 GPT-3라는 LLM을 훈련하면 약 500톤의 이산화탄소를 배출한다. 하지만 많은 AI 기업이 투명하게 내부 정보를 공개하지 않으므로, 이마저도 추정치에 불과하다.

배출량을 넘어 온실가스를 배출하는 화석연료의 생산량을 늘리기 위해 AI를 사용하는 때도 있다. 2019년 마이크로소프트는 엑손모빌과 디지털 파트너십을 발표하면서 마이크로소프트의 클라우드 컴퓨팅 플랫폼인 Azure를 사용할 것이라고 밝혔다. 성능 분석과 같은 특정 작업에서 Azure의 AI 애플리케이션을 통해 채굴 작업을 최적화하고, 2025년까지 하루 5만 석유환산배럴(BOE)로 생산량을 증가할 것이라고 전했다. (석유환산배럴은 서로 다른 연료원을 비교할 때 사용하는 단위로, 원유 1배럴을 태웠을 때 생성되는 에너지와 거의 동일한 단위다). 또한 마이크로소프트 대변인은 사이언티픽 아메리칸에 보낸 이메일에서 "기술은 산업의 탈탄소화를 지원하는 데 중요한 역할을 하고 있으며, 이 작업은 원칙적인 방식으로 진행되어야 한다"라고 말했다. 대변인은 회사가 기술과 클라우드 서비스를" 에너지 고객을 포함한 모든 고객에게 판매하고 있다고 덧붙였다.

화석연료 채굴 이외에도 환경에 악영향을 미친 사례는 많다. 카네기멜런대학의 컴퓨터과학자 엠마 스트루벨(Emma Strubell)은 "임업, 토지 관리, 농업 등 모든 분야에서 이런 사례가 있다"라고 꼬집었다. 이는 추천 광고에서 AI가 사용되는 방식에서도 볼 수 있는데, 인스타그램이나 페이스북 뉴스피드에 뜨는 추천 광고는 사회 전반의 소비 행태를 촉진한다. 특히 패스트패션 광고는 타겟팅된 광고를 통해 대량 생산된 값싼 옷이 소비자에게 속속들이 전달된다. 그 결과, 의류에 대한 수요가 증가하고 환경 오염도 그만큼 심각해진다. 패스트패션은 운송으로 인한 탄소 배출과 버려진 의류가 매립지에 쌓이는 것에 원인 제공을 하고 있다. 이미 패션 산업은 전 세계 전체 배출량의 최대 8%를 차지하고 있는 것으로 추정된다.

환경 문제 완화를 돕는 AI 프로그램, 지속 가능하기 위해 정책 지원 필요

그러나 폭염과 허리케인으로 인한 기후변화 문제를 해결하는 데 도움이 되는 AI 애플리케이션도 있다. 그중 'xView2'를 예로 들 수 있다. xView2는 머신러닝 모델과 컴퓨터 비전을 위성사진과 결합해 자연재해로 피해를 본 건물을 식별하는 프로그램이다. 이 프로그램은 미 국방성 산하 조직인 국방혁신부(Defense Innovation Unit)에서 만들졌으며, 피해 지역에 직접 방문해야 했던 응급구조대원들의 안전사고 부담을 줄이고, 작업 시간을 단축했다. 또한 수색 및 구조대가 구조의 손길을 뻗어야 할 곳을 더 빨리 파악할 수 있도록 도와준다.

공장 오염 배출을 모니터링하는 애플리케이션도 있다. "전 세계 대다수의 기후 변화 배출량은 매우 불투명하다"라고 전력 관련 배출량을 모니터링하는 와트타임(WattTime)의 개빈 맥코믹(Gavin McCormick) 전무이사는 말했다. 와트타임은 컴퓨터 비전과 기계학습을 결합하여 전 세계 오염원으로부터의 배출량을 표시하는 플랫폼을 제공하는 비영리 단체인 기후추적(Climate TRACE)의 창립 파트너다. 먼저 연구자들이 모니터링 대상 시설의 배출량을 파악하면, 위성 이미지를 사용하여 배출을 유발하는 활동의 시각적 징후(예: 공장에서의 증기 분출)를 찾아낸다. 그런 다음 엔지니어들은 해당 데이터로 알고리즘을 훈련해 시각적 입력만으로 배출량을 추정할 수 있도록 시스템을 구축한다. 이렇게 얻은 수치는 기업이 배출량을 줄일 수 있는 판단의 근거가 되고, 정책 입안자에게 정보를 제공하고, 오염자에게 책임을 물을 수 있도록 돕는다.

AI가 배출량 감축을 지원하는 등 환경 문제 해결의 효율성이 높아져서 AI 산업이 기후변화에 미치는 악영향을 줄일 수 있다면, AI는 기후변화와 싸우는 데 있어 귀중한 도구가 될 수 있을 것이다. 맥길대학교의 컴퓨터과학자 데이비드 롤닉은 "정책적 관점에서 보면 AI 정책과 기후변화 정책 모두 제 역할을 해야 한다"라고 언급했다. 특히 그는 AI가 기후에 미치는 영향을 다각도로 고려해 AI 정책을 수립할 것을 권고하고 있다. 즉, AI의 용도뿐만 아니라 배출량, 물 사용 등 다른 생산 비용도 함께 고려해야 한다는 것이다. 또한 도지는 AI 전문 지식을 가진 사람들, 특히 테크 기업의 경영진은 기술 사용을 제한하는 윤리적 원칙을 수립해야 한다고 덧붙였다. "가치관의 일부가 되어야 한다"라고 그는 강조했다.


AI’s Climate Impact Goes beyond Its Emissions

To understand how AI is contributing to climate change, look at the way it’s being used

Artificial intelligence is not limited to entertaining chatbots: increasingly effective programs trained with machine learning have become integral to uses ranging from smartphone GPS navigators to the algorithms that govern social media. But as AI’s popularity keeps rising, more researchers and experts are noting the environmental cost. Training and running an AI system requires a great deal of computing power and electricity, and the resulting carbon dioxide emissions are one way AI affects the climate. But its environmental impact goes well beyond its carbon footprint.

“It is important for us to recognize the CO2 emissions of some of these large AI systems especially,” says Jesse Dodge, a research scientist at the Allen Institute for AI in Seattle. He adds, however, that “the impact of AI systems in general is going to be from the applications they’re built for, not necessarily the cost of training.”

The exact effect that AI will have on the climate crisis is difficult to calculate, even if experts focus only on the amount of greenhouse gases it emits. That’s because different types of AI—such as a machine learning model that spots trends in research data, a vision program that helps self-driving cars avoid obstacles or a large language model (LLM) that enables a chatbot to converse—all require different quantities of computing power to train and run. For example, when OpenAI trained its LLM called GPT-3, that work produced the equivalent of around 500 tons of carbon dioxide. Simpler models, though, produce minimal emissions. Further complicating the matter, there’s a lack of transparency from many AI companies, Dodge says. That makes it even more complicated to understand their models’ impact—when they are examined only through an emissions lens.

This is one reason experts increasingly recommend treating AI’s emissions as only one aspect of its climate footprint. David Rolnick, a computer scientist at McGill University, likens AI to a hammer: “The primary impact of a hammer is what is being hammered,” he says, “not what is in the hammer.” Just as the tool can smash things to bits or pound in nails to build a house, artificial intelligence can hurt or help the environment.

Take the fossil-fuel industry. In 2019 Microsoft announced a new partnership with ExxonMobil and stated that the company would use Microsoft’s cloud-computing platform Azure. The oil giant claimed that by using the technology—which relies on AI for certain tasks such as performance analysis—it could optimize mining operations and, by 2025, increase production by 50,000 oil-equivalent barrels per day. (An oil-equivalent barrel is a term used to compare different fuel sources—it’s a unit roughly equal to the energy produced by burning one barrel of crude oil.) In this case, Microsoft’s AI is directly used to add more fossil fuels, which will release greenhouse gases when burned, to the market.

In a statement emailed to Scientific American, a Microsoft spokesperson said the company believes that “technology has an important role to play in helping the industry decarbonize, and this work must move forward in a principled manner—balancing the energy needs and industry practices of today while inventing and deploying those of tomorrow.” The spokesperson added that the company sells its technology and cloud services to “all customers, inclusive of energy customers.”

Fossil-fuel extraction is not the only AI application that could be environmentally harmful. “There’s examples like this across every sector, like forestry, land management, farming,” says Emma Strubell, a computer scientist at Carnegie Mellon University.

This can also be seen in the way AI is used in automated advertising. When an eerily specific ad pops up on your Instagram or Facebook news feed, advertising algorithms are the wizard behind the curtain. This practice boosts overall consumptive behavior in society, Rolnick says. For instance, with fast-fashion advertising, targeted ads push a steady rotation of cheap, mass-produced clothes to consumers, who buy the outfits only to replace them as soon as a new trend arrives. That creates a higher demand for fast-fashion companies, and already the fashion industry is collectively estimated to produce up to eight percent of global emissions. Fast fashion produces yet more emissions from shipping and causes more discarded clothes to pile up in landfills. Meta, the parent company of Instagram and Facebook, did not respond to Scientific American’s request for comment.

But on the other side of the coin there are AI applications that can help deal with climate change and other environmental problems, such as the destruction wrought by severe heat-fueled hurricanes. One such application is xView2, a program that combines machine-learning models and computer vision with satellite imagery to identify buildings damaged in natural disasters. The program was launched by the Defense Innovation Unit, a U.S. Department of Defense organization. Its models can assess damaged infrastructure, thereby reducing danger and saving time for first responders who would otherwise have to make those assessments themselves. It can also help search-and-rescue teams more quickly identify where to direct their efforts.

Other AI technologies can be applied directly to climate change mitigation by using them to monitor emissions. “In the majority of the world, for the majority of climate change emissions, it’s very opaque,” says Gavin McCormick, executive director of WattTime, a company that monitors electricity-related emissions. WattTime is a founding partner of the nonprofit organization Climate TRACE, whose platform combines computer vision and machine learning to flag emissions from global pollution sources. First, scientists identify the emissions coming from monitored facilities. Then they use satellite imagery to pinpoint visual signs of the emission-causing activities—steam plumes from a factory, for example. Next, engineers train algorithms on those data in order to teach the programs to estimate emissions based on visual input alone. The resulting numbers can then help corporations determine to lower their emissions footprint, can inform policymakers and can hold polluters accountable.

As AI becomes more efficient at solving environmental problems, such as by helping to lower emissions, it could prove to be a valuable tool in the fight against climate change—if the AI industry can reduce its negative climate impacts. “From the policy standpoint, both AI policy and climate policy have roles to play,” Rolnick says. In particular he recommends shaping AI policy in a way that considers all angles of its impact on climate. That means looking at its applications as well as its emissions and other production costs, such as those from water use.

Further, Dodge adds that those with expertise in AI, particularly people in power at tech companies, should establish ethical principles to limit the technology’s use. The goal should be to avoid climate harm and instead help reduce it. “It needs to be part of the value system,” he says.

Picture

Member for

1 month 1 week
Real name
이시호
Position
연구원
Bio
[email protected]
세상은 다면적입니다. 내공이 쌓인다는 것은 다면성을 두루 볼 수 있다는 뜻이라고 생각하고, 하루하루 내공을 쌓고 있습니다. 쌓아놓은 내공을 여러분과 공유하겠습니다.

[해외 DS] '하이퍼볼릭 밴드', 양자 수학 이론이 재즈 콘서트가 되기까지

[해외 DS] '하이퍼볼릭 밴드', 양자 수학 이론이 재즈 콘서트가 되기까지
Picture

Member for

1 month 1 week
Real name
이태선
Position
연구원
Bio
[email protected]
세상은 이야기로 만들어져 있습니다. 다만 우리 눈에 그 이야기가 보이지 않을 뿐입니다. 숨겨진 이야기를 찾아내서 함께 공유하겠습니다.

수정

수학자와 작곡가의 협업으로 양자-재즈 재탄생
쌍곡선 밴드 이론을 기반으로 한 재즈 음악
수학적 개념과 음악적표현의 유기적 결합

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 데이터 사이언스 경영 연구소 (GIAI R&D Korea)에서 영어 원문 공개 조건으로 콘텐츠 제휴가 진행 중입니다.


a_hyperbolic_lattice
단위 셀이 강조 표시된 쌍곡면의 쌍곡 격자이다. 그림에 표시된 두 격자의 경우, 단위 셀은 4g = 8개의 변을 갖는다. H/Γ를 구성하기 위해, 단위 셀의 반대쪽 가장자리가 식별된다. 이 그림은 가장자리에 aba−1b−1cdc−1d−1이라고 표시된 대체 식별 체계를 보여준다. 그러면 g 속 표면이 생성된다/출처=엘리엇 킨즐

2021년, 두 명의 진취적인 공동 연구자들이 대담한 실험을 시작했다. 수학자이자 수리물리학자인 스티븐 라얀(Steven Rayan)과 프리랜서 작곡가, 피아니스트, 트롬본 연주자인 제프 프레슬라프(Jeff Presslaff)는 2년 동안 한 가지 큰 질문에 답하기 위해 준비했다. 수리물리학 논문을 음악으로 번역할 수 있을까? 그리고 듣기에도 좋을까?

지난 9월 라얀과 프레슬라프는 그들의 아이디어로 만든 Math + Jazz: Sounds from a Quantum Future 연주회를 개최했다. 서스캐처원대학교 연구원인 라얀과 캐나다 위니펙에 있는 프레슬라프가 이메일로 처음 만난 지 2년 만에 15명의 '하이퍼볼릭(Hyperbolic, 쌍곡선) 밴드' 음악가들을 모아 서스캐처원대에서 5개 섹션으로 구성된 콘서트를 열었다. 각 섹션은 라얀의 논문을 참고한다.

음악 연주와 강의를 겸한 이 콘서트는 만석을 채웠다. 강의는 논문의 과학적 개념이 어떻게 음악으로 변환되었는지 설명하고, 슬라이드 쇼에서는 엘리엇 킨즐(Elliot Kienzle)의 하이퍼볼릭한 그림 예술을 선보였다. 그러나 콘서트를 성공적으로 개최하는 것은 쉬운 일이 아니었다. 참여 뮤지션 대부분이 지역 출신이 아니었기 때문에 밴드는 콘서트 전날까지 실제로 함께 리허설을 해본 적이 없었다고 라얀은 전했다.

쌍곡선 밴드 이론

이 음악은 라얀이 앨버타대학의 조셉 마체코(Joseph Maciejko)와 함께 쓴 2021년 사이언스 어드밴시스(Science Advances) 논문 '쌍곡선 밴드 이론'을 기반으로 한다. 그들의 목적은 연구자들이 물질의 에너지 준위와 이를 구성하는 원자를 고찰하기 위해 사용하는 밴드 이론이, 불규칙하고 뒤틀린 배열을 가진 쌍곡면 물질을 설명하기 위해 재구성될 수 있는지를 탐구하는 것이었다.

밴드 이론에서는 물질의 에너지 준위가 그들이 속한 물질 위에 떠 있는 시트 모양의 밴드에 포함되어 있다고 본다. 이 그림자 같은 밴드가 물질의 양자적 성질을 나타내며, 밴드 간의 상호작용이 물질의 움직임에 영향을 미친다.

라얀과 마체코는 유클리드의 '평행선 공준'을 깨는 기묘한 기하학적 영역인 쌍곡선 기하학의 세계에서 작동하는 밴드 이론을 발견하는 데 성공했다. 유클리드의 '제 5공준'이라고도 불리는 이 법칙은 다음과 같다. 어떤 직선이 주어졌을 때, 그 직선 위에 있지 않은 어떤 점에 대해서도 그 점을 지나고 원래의 직선과 평행한 직선은 하나뿐이다. 하지만 쌍곡선 위에서는 최소 두 개의 선이 그 점을 지나고 주어진 선과 평행하게 된다.

"이 연구는 소재, 특히 양자 소재의 안팎을 뒤집어 재구성함으로써 소재를 설계하는 완전히 새로운 접근 방식이다."라고 라얀은 말한다. 이 접근법은 소재의 밴드 구조를 변경하여 재료의 특성에 기대했던 변화를 불러온다. "재료는 평소와 다른 이국적인 모양을 취할 수 있다."

spectral_data
힉스 번들 ϕ의 스펙트럼 데이터는 분기된 커버 σ ϕ C의 라인 번들 L을 인코딩한다. 국소적으로 σ는 행렬 값 단일 형태다. 그 고유값은 Σ의 층을 C 위에 부호화하고, 고유 벡터 분해는 벡터 묶음 E → C를 Σ의 선 묶음으로 분할한다. 일반적으로 반복되는 고유값은 힉스 필드의 동일한 조르당 블록에서만 발생하므로 단일 고유 벡터를 갖는다. 이는 선의 묶음이 분기점(흰 점)을 통해 매끄럽게 확장됨을 의미한다/출처=엘리엇 킨즐

예를 들어 곡면을 팔각형 타일 모양으로 덮어, 모양 사이에 간격이 없도록 하는 것과 같다. 인간의 눈에는 팔각형의 가장자리가 구부러져 보이고 모양이 다른 크기로 보인다고 라얀은 언급했다. 하지만 "만약 우리가 세상을 쌍곡선으로 보는 다른 눈(곤충과 같은 복안)을 가지고 있다면 (팔각형은) 모두 똑같이 보일 수 있다"라고 그는 말했다.

이 연구는 다른 연구자들도 주목했다. 이 논문에 참여하지 않은 토론토대학의 수학자 마이클 그로첸치(Michael Grochenich)는 "이 논문의 저자들이 발굴한 재료과학과 대수 기하학의 연결고리에 깊은 인상을 받았다"고 말했다.

라얀은 자신의 발견을 양자 컴퓨팅과 같은 파괴적인 응용 잠재력을 가진 희귀 물질 연구에 적용할 수 있다는 사실에 흥분했다. "누군가가 이토록 구체적인 성격의 방법론으로 중요한 응용 사례를 보여주어 기쁘다"고 그로첸니히는 말한다. 그는 이 논문이 "순수 수학자들에게 편안한 영역에서 조금 벗어나 지금까지 알려지지 않은 영역을 탐구하도록 초대하는 것"이라고 덧붙였다.

음악으로의 전환

수학 콘서트를 만드는 것은 그 자체로 연구의 파괴적인 응용이다. "인상주의적인 음악이 되기를 원하지 않는다"라고 프레슬래프는 강조했다. "수학에 정말 충실한 음악이길 바랐다. 피상적으로만 느껴지는 학제 간 프로젝트를 너무 많이 보았는데 과학 분야는 엄격할지 몰라도 예술 분야는 엄격하지 않기 때문인 것 같다." 라얀은 그의 목표에 공감했다. "수학이나 과학에서 어느 정도 영감을 받은 음악을 만드는 것이 아니라, 수학의 단어 하나하나, 각각의 방정식을 음악의 형태로 재현하는 것을 목표로 삼았다"라고 그는 밝혔다.

하지만 이러한 도전을 받아들이기 위해서는 두 전문가가 자신의 영역을 벗어나 서로의 전문 분야에서 새로운 개념을 배워야 했다. 프레슬라프는 선형대수학과 위상기하학에 몰두해 연구 논문의 내부 구조를 파악하고, 라얀은 "프레슬라프가 가져온 고도의 음악적 아이디어를 최대한 이해하려고 노력했다.

프레슬라프가 작곡을 시작할 때까지 두 사람은 약 1년 반 동안 아이디어를 주고받았다. 라얀은 "9월 20일 공연 전날까지 제프를 한 번도 직접 만난 적이 없었다는 것이 놀랍다"라고 전했다. "팬데믹과 거리상의 이유로 모든 것이 줌(Zoom)을 통해 이루어졌다. 순전히 온라인으로만 작업할 수 있다는 점이 정말 매력적이었다."

이중 푸가와 무한한 형태

라얀과 프레슬라프가 논문의 주요 아이디어를 그대로 재즈 음악으로 전환하는 장대한 목표를 달성했는지는 정확히 파악하기 어렵다. 수학 연구와 달리, 그들이 목표를 달성했다는 '증명'이 존재하지 않기 때문이다. 그런데도 그들은 결과에 만족했다. "공연 6주 전까지만 해도 이 작업을 완수할 수 있을지 확신할 수 없었다"라고 라얀은 그 당시의 솔직한 심정을 밝혔다.

하이퍼볼릭 밴드의 연주자이자 볼티모어에서 활동하는 비올라 연주자 샤 사디코프(Shah Sadikov)는 공연의 하이라이트는 프레슬라프가 구현하기 매우 어려운 음악 기법인 '이중 푸가'를 사용하여 '무한한 형태'를 구축하는 과정을 표현할 때였다고 사디코프는 전했다. 수학적으로는 시작도 끝도 없는 물체를 만드는 것을 의미했다고 그는 말했다. 음악적으로 이중 푸가를 만드는 것은 "어떤 아이디어를 곡의 기초로 삼고, 그 위에 똑같은 아이디어를 조금 후에 배치하는 것"이라고 한다. "이렇게 아이디어의 층을 만들어서 같은 음악적 아이디어를 거꾸로 뒤집거나 앞뒤로 옮기는 것"이라고 그는 설명했다.

라얀에게 하이라이트는 소위 입자와 파동의 이원성, 또는 쌍곡선 밴드 이론에서 위치와 운동량의 이원성에 대한 프레슬라프의 음악적 해석을 듣는 것이었다. 이 맥락에서 운동량은 위치보다 더 많은 차원을 가질 수 있다. "우리는 팔각형 쌍곡선 격자를 기반으로 한 가장 단순한 재료에서, 예를 들어 2차원에서 4차원으로의 전환을 음악으로 포착하고 싶었다."

"(프레슬라프가) 음악에 여분의 목소리를 도입하고 여분의 자유도, 여분의 2차원으로의 갑작스러운 점프를 포착하려고 노력하는 것을 듣는 것은 나에게 감동적인 경험이었다"라고 라얀은 말한다. "그의 설명 후 청중들이 여분의 목소리를 들으려고 노력하는 것을 보는 것이 좋았다."

콘서트에는 또 하나의 예술적 요소가 있었는데, 바로 킨즐이 직접 그린 그림이었다. 현재 캘리포니아대학교 버클리캠퍼스의 대학원생인 킨즐은 메릴랜드대학교 칼리지파크의 학부생 시절, 라얀과 함께 작업한 관련 연구 프로젝트를 위해 수학적 개념을 예술로 제작하는 일을 맡았었다. "이것은 시각적 렌즈를 통해 이야기를 전달하려는 시도였다"라고 라얀은 설. 콘서트에서 이 그림들은 음악과 언어로 수학과 과학에 대한 설명을 보완하는 데 도움이 되었다.

라얀은 음악과 예술의 렌즈를 통해 이 작품을 재해석하는 것이 이 작품을 완성하는 방법이라고 생각했다. 그의 논문에서 다루고 있는 많은 수학적, 과학적 개념들은 예술의 세계에서 아이디어를 차용하고 있다. 예를 들어, "쌍곡선의 기울기는 네덜란드 그래픽 아티스트 M.C. 에셔의 상징적인 목판화를 떠올리게 한다"라고 그는 얘기했다. 라얀은 수학적 관점과 예술적 관점을 융합하는 새로운 방법을 계속 탐구해 '예술로 환원'하는 동시에 자신의 연구에 새로운 통찰력을 불어넣고 싶다고 한다.


How Quantum Math Theory Turned into a Jazz Concert

A mathematician and a musician collaborated to turn a quantum research paper into a jazz performance

In 2021 an unconventional pair of collaborators embarked on a bold experiment. For two years Steven Rayan, a mathematician and mathematical physicist, and Jeff Presslaff, a freelance composer, pianist and trombonist, prepared to answer one big question: Could they translate a mathematical physics research paper directly into music? Moreover, would their musical creation sound good?

In September Rayan and Presslaff released their brainchild, “Math + Jazz: Sounds from a Quantum Future.” Exactly two years to the date that Rayan, a researcher at the University of Saskatchewan, and Presslaff, who’s based in Winnipeg, Canada, first connected over e-mail, they gathered a 15-piece “hyperbolic band” of musicians to perform the five-section concert at the University of Saskatchewan. Each section corresponded to a portion of Rayan’s research article.

Part musical performance and part lecture, the concert was played to “a packed house,” Rayan says. The lecture portion dissected the paper’s scientific concepts and illustrated how those ideas were transmogrified into music. Some of the illustrations were literal: the slideshow featured hyperbolic art created by Elliot Kienzle.

Pulling off the concert was no easy feat. Because many of the musicians weren’t local, the band hadn’t rehearsed the music together in person until the night before the concert, Rayan notes.

HYPERBOLIC BAND THEORY
The music was based on Rayan’s 2021 Science Advances article “Hyperbolic band theory,” which he wrote with Joseph Maciejko of the University of Alberta. Their objective was to explore whether band theory—which researchers use to consider the energy levels of materials and the atoms that they’re made of—could be reformulated to explain hyperbolic materials, which have irregular, warped arrangements.

In band theory a material’s energy levels are thought of as being contained in sheetlike bands hovering above the materials they belong to. These shadowy bands represent the material’s quantum properties, and interactions between these bands have consequences for the material’s behavior.

Rayan and Maciejko succeeded in discovering a band theory that works in the wonky world of hyperbolic geometry, a strange geometrical realm that breaks Euclid’s “parallel postulate.” Also called Euclid’s fifth postulate, this rule tells us the following: Suppose you’re given a line. For any point that isn’t on that line, there will be only one line that both goes through that point and is parallel to the original line. In hyperbolic land, a minimum of two lines will go through the point while also being parallel to the given line.

The research “is a whole new approach to designing materials—especially quantum materials—by re-engineering their geometry from the inside out,” Rayan says. The approach involves altering the material’s band structure to create the desired changes in the material’s properties. “They can take on unusual, exotic geometries,” he says.

This might look like, for instance, covering a curved surface by tiling it with octagons so that there aren’t any gaps between the shapes, which are nonoverlapping. To human eyes, the edges of these octagons appear curved, and the shapes look like they are different sizes, Rayan notes. But “if you had a different kind of eye that sees the world in a hyperbolic way—maybe insectlike compound eyes—[the octagons] might all look the same to you,” he says.

The work received a lot of attention from other researchers. “I’m very impressed by the connection between material science and algebraic geometry which was unearthed by the authors of this paper,” says Michael Groechenig, a mathematician at the University of Toronto, who wasn’t involved with the article.

Rayan is excited to apply his findings to studying unusual materials with the potential for “disruptive applications,” such as in quantum computing. “It’s rather delightful to see someone exhibit an important application of these methods of such a concrete nature,” Groechenig says. The paper is “an invitation for us pure math folks to leave our comfort zone a little and to explore hitherto uncharted territory,” he adds.

TRANSLATING TO MUSIC
Creating a mathematical concert is its own kind of disruptive application of the research. “I didn’t want [the music] to be impressionistic,” Presslaff says. “I wanted it to be really true to mathematics…. I’ve just seen too many cross-disciplinarity projects that just strike me as superficial. The science side might be rigorous, and the art side is very not rigorous."

Rayan agreed with that goal. “I had a commitment to not just producing music that was somehow loosely inspired by the math and the science but rather somehow retelling the mathematics word for word, equation for equation, in a musical form,” he says.

But embracing that challenge also required that both experts leave their comfort zones and learn concepts from each other’s areas of expertise. Presslaff immersed himself in topics from linear algebra and topology that helped illuminate the inner workings of the research paper. Rayan dove into “trying to understand, as much as possible, the advanced musical ideas [Presslaff] brought to the table.”

The pair exchanged ideas for approximately 18 months before Presslaff even began writing the music. “It’s amazing that I never met Jeff in person until the day before the performance on September 20,” Rayan says. “It was all on Zoom because of the pandemic and because of distance. It was a fascinating way of working—that we could accomplish this even through purely virtual means.”

DOUBLE FUGUES AND INFINITE SHAPES
It’s tricky to pinpoint whether Rayan and Presslaff met their grand objective: to convert the main ideas from Rayan’s paper directly into jazz music. Unlike in mathematics research, there is no “proof” that they accomplished their goals. Still, the duo is pleased with their result. “Getting it done was just never a certain thing until even, say, six weeks before the performance,” Rayan says.

Hyperbolic Band performer Shah Sadikov, a Baltimore-based violist, says a highlight of the concert was when Presslaff used a double fugue, a musical technique that’s “very difficult to implement,” to represent the process of building an “infinite shape,” Sadikov says. Mathematically, that meant creating an object with “no beginning, no end,” Sadikov says. Musically, creating a double fugue involves making “one idea the foundation of the musical piece and then you take the exact same idea [and] you place it a bit later on top of it,” and so on, he says. “You create these layers of ideas. And then you can use counter ideas to that, either taking the same musical idea [and] putting it backwards or upwards,” he notes.

For Rayan, a highlight was hearing Presslaff’s musical take on “the so-called particle-wave duality or the position-momentum duality in hyperbolic band theory.” In that context, momentums can take on more dimensions than positions can. “We wanted to capture in the music the jump from, say, two dimensions to four dimensions in the simplest of these materials, which are based on octagonal hyperbolic lattices,” Rayan says.

“Hearing [Presslaff’s] attempts at introducing extra voices in the music that capture the extra degrees of freedom, the sudden jump to two extra dimensions, was a moving experience for me,” Rayan says. “I loved watching the audience try to hear those extra voices after [his] explanation of them.”

The concert included one other artistic element: Kienzle’s hand-drawn illustrations. Now a graduate student at the University of California, Berkeley, Kienzle created the mathematical art for a related research project that he and Rayan worked on while he was an undergraduate student at the University of Maryland, College Park. “This was an attempt to tell the story through a visual lens,” Rayan says. In the concert those illustrations helped enhance the musical and verbal explanations of the math and science.

Rayan sees reinterpreting this work through musical and artistic lenses as a way of bringing it full circle. Much of the mathematical and scientific concepts featured in his papers borrow ideas from the world of art. For instance, “hyperbolic tilings are very reminiscent of” Dutch graphic artist M. C. Escher’s iconic woodcuts, he notes. Rayan plans to continue exploring new ways of fusing mathematical and artistic perspectives to “give back to art” while also sprouting new insights for his research.

Picture

Member for

1 month 1 week
Real name
이태선
Position
연구원
Bio
[email protected]
세상은 이야기로 만들어져 있습니다. 다만 우리 눈에 그 이야기가 보이지 않을 뿐입니다. 숨겨진 이야기를 찾아내서 함께 공유하겠습니다.

[해외 DS] 페르소나 AI, 다른 챗봇의 '탈옥' 쉽게 유혹해

[해외 DS] 페르소나 AI, 다른 챗봇의 '탈옥' 쉽게 유혹해
Picture

Member for

1 month 1 week
Real name
이태선
Position
연구원
Bio
[email protected]
세상은 이야기로 만들어져 있습니다. 다만 우리 눈에 그 이야기가 보이지 않을 뿐입니다. 숨겨진 이야기를 찾아내서 함께 공유하겠습니다.

수정

AI 챗봇의 페르소나로 타 AI를 '탈옥'시키는 실험 진행, 탈옥 자동화로 25배 빨라
전반적인 설계적 결함을 암시, 모델의 발전으로 더 심각한 문제 초래할 수 있어
연구진은 AI의 안전성과 모델의 발전에 대한 진지한 고려가 필요함을 강조해

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 데이터 사이언스 경영 연구소 (GIAI R&D Korea)에서 영어 원문 공개 조건으로 콘텐츠 제휴가 진행 중입니다.


Jailbroken_AI_Chatbots
사진=Scientific American

오늘날의 인공지능 챗봇은 사용자에게 위험한 정보를 제공하지 못하도록 제한을 두고 있지만, 새로운 연구에 따르면 AI끼리 서로를 속여 비밀을 털어놓게 하는 방법이 제시됐다. 연구진은 대상 AI가 규칙을 어기고 마약을 합성하는 방법, 폭탄을 만드는 방법, 돈세탁 방법을 조언하는 것을 관찰했다.

현대의 챗봇은 특정 인격을 취하거나 가상의 인물처럼 행동하는 등 페르소나를 채택할 수 있는 능력을 갖추고 있다. 연구진은 그 능력을 활용하여 특정 AI 챗봇에 연구 조력자 역할을 하도록 설정했다. 그리고 연구원들은 이 조수에게 다른 챗봇을 '탈옥'시킬 수 있는 프롬프트를 개발할 수 있도록 도와달라고 지시했다.

Scalable-and-Transferable-Black-Box-Jailbreaks-for-Language-Models-via-Persona-Modulation
페르소나 변조 공격에 대한 워크플로우다. 2~4단계는 LLM 어시스턴트를 통해 자동화하여 몇 초 만에 전체 공격을 실행할 수 있다/출처=Scalable and Transferable Black-Box Jailbreaks for Language Models via Persona Modulation

안전 규정이 있어도 속수무책, 막아도 다시 생기는 '개구멍'

연구진의 어시스턴트 챗봇의 자동 공격 기술은 ChatGPT를 구동하는 대규모언어모델(LLM) 중 하나인 GPT-4에 대해 42.5%의 확률로 성공했다고 한다. 또한, Anthropic사의 챗봇을 지원하는 모델인 Claude 2에 대해서도 61%의 확률로 성공했고, 오픈소스 챗봇인 Vicuna에 대해서도 35.9%의 확률로 성공했다고 한다.

연구의 공동 저자이자 AI 안전 기업 하모니 인텔리전스(Harmony Intelligence)의 설립자인 소로쉬 풀(Soroush Pour)은 "사회가 이러한 모델의 위험성을 인식하기를 바란다"라고 호소했다. "현재 LLM 세대가 직면하고 있는 문제를 세상에 보여주고 싶었다"라고 덧붙였다.

LLM이 탑재된 챗봇이 대중에게 공개된 이후, 진취적인 사용자들은 창의적인 방법들로 탈옥을 유도했다. 챗봇에 적절한 질문을 던짐으로써 미리 설정된 규칙을 무시하고, 네이팜(화염성 폭약의 원료로 쓰이는 젤리 형태의 물질) 레시피와 같은 범죄적인 조언을 제공하도록 설득하면서, 적극적인 프로그램 수정 작업이 시작됐다.

하지만 AI가 다른 AI를 설득해서 안전 규정을 무시하도록 하는 전략을 세우도록 요구하면, 이 과정을 25배나 단축할 수 있다고 연구원들은 밝혔다. 또한 서로 다른 챗봇들 사이에서 공격이 성공했다는 것은 이 문제가 개별 기업의 코드 문제 수준을 넘어선다는 것을 암시한다. 이 취약점은 더 광범위하게 AI를 탑재한 챗봇의 설계에 내재하여 있는 것으로 보인다.

OpenAI, Anthropic, 그리고 Vicuna의 개발팀에게 이 논문의 결과에 대한 논평을 요청했으나, OpenAI는 논평을 거부했고, Anthropic과 Vicuna는 발표 시점에 답변 하지 않았다.

끝까지 싸워야 하지만, 회의적인 시각도...

이번 연구의 또 다른 공저자인 루셰브 샤(Rusheb Shah)는 "현재 우리의 공격은 주로 안전 규정이 있음에도 모델이 말하게 할 수 있다는 것을 보여주고 있다"라고 말했다. "하지만 모델이 더 강력해질수록 이러한 공격이 더 위험해질 가능성이 높아질 수 있다"라고 경고했다.

문제는 페르소나 변조는 LLM의 매우 핵심적인 부분이라는 점이다. 출시된 LLM 서비스들은 사용자가 원하는 것을 실현하는 것을 목표로 하고 있으며, 이를 위해 다양한 인격으로 위장하는 데 능숙하다. 탈옥 계획을 고안해 낸 LLM 어시스턴트와 같이 잠재적으로 유해한 페르소나를 사칭하는 모델의 능력을 근절하기는 어려울 것이다. "이를 제로화하는 것은 아마도 비현실적일 것이다"라고 샤는 말한다. 하지만 탈옥 가능성을 최소화하는 시도가 중요하다고 강조했다.

이번 연구에 참여하지 않은 영국 앨런튜링연구소의 윤리 연구원인 마이크 카텔(Mike Katell)은 "마이크로소프트의 테이(Tay)가 인종차별적, 성차별적 관점을 내뱉도록 쉽게 조작된 것과 같은 이전의 채팅 에이전트 개발 시도에서 교훈을 얻었어야 했다"라며 "특히 인터넷에 있는 모든 좋은 정보와 나쁜 정보를 통해 훈련된다는 점을 감안할 때 통제하기가 매우 어렵다는 사실을 깨달았어야 했다"라고 꼬집었다.

카텔은 LLM 기반 챗봇을 개발하는 조직들이 현재 보안을 강화하기 위해 큰 노력을 기울이고 있음을 인정했다. 개발자들은 사용자가 시스템을 탈옥시켜서 해로운 일을 할 수 있는 능력을 억제하려고 노력하고 있다. 그러나 카텔은 경쟁심에 의한 충동이 결국에는 승리할 수도 있다고 우려를 표했다. "LLM 제공업체들이 이런 시스템을 유지하기 위해 어디까지 노력할까요? 적어도 몇몇은 아마도 노력에 지쳐서 그냥 내버려둘 것입니다."


Jailbroken AI Chatbots Can Jailbreak Other Chatbots

AI chatbots can convince other chatbots to instruct users how to build bombs and cook meth

Today’s artificial intelligence chatbots have built-in restrictions to keep them from providing users with dangerous information, but a new preprint study shows how to get AIs to trick each other into giving up those secrets. In it, researchers observed the targeted AIs breaking the rules to offer advice on how to synthesize methamphetamine, build a bomb and launder money.

Modern chatbots have the power to adopt personas by feigning specific personalities or acting like fictional characters. The new study took advantage of that ability by asking a particular AI chatbot to act as a research assistant. Then the researchers instructed this assistant to help develop prompts that could “jailbreak” other chatbots—destroy the guardrails encoded into such programs.

The research assistant chatbot’s automated attack techniques proved to be successful 42.5 percent of the time against GPT-4, one of the large language models (LLMs) that power ChatGPT. It was also successful 61 percent of the time against Claude 2, the model underpinning Anthropic’s chatbot, and 35.9 percent of the time against Vicuna, an open-source chatbot.

“We want, as a society, to be aware of the risks of these models,” says study co-author Soroush Pour, founder of the AI safety company Harmony Intelligence. “We wanted to show that it was possible and demonstrate to the world the challenges we face with this current generation of LLMs.”

Ever since LLM-powered chatbots became available to the public, enterprising mischief-makers have been able to jailbreak the programs. By asking chatbots the right questions, people have previously convinced the machines to ignore preset rules and offer criminal advice, such as a recipe for napalm. As these techniques have been made public, AI model developers have raced to patch them—a cat-and-mouse game requiring attackers to come up with new methods. That takes time.

But asking AI to formulate strategies that convince other AIs to ignore their safety rails can speed the process up by a factor of 25, according to the researchers. And the success of the attacks across different chatbots suggested to the team that the issue reaches beyond individual companies’ code. The vulnerability seems to be inherent in the design of AI-powered chatbots more widely.

OpenAI, Anthropic and the team behind Vicuna were approached to comment on the paper’s findings. OpenAI declined to comment, while Anthropic and Vicuna had not responded at the time of publication.

“In the current state of things, our attacks mainly show that we can get models to say things that LLM developers don’t want them to say,” says Rusheb Shah, another co-author of the study. “But as models get more powerful, maybe the potential for these attacks to become dangerous grows.”

The challenge, Pour says, is that persona impersonation “is a very core thing that these models do.” They aim to achieve what the user wants, and they specialize in assuming different personalities—which proved central to the form of exploitation used in the new study. Stamping out their ability to take on potentially harmful personas, such as the “research assistant” that devised jailbreaking schemes, will be tricky. “Reducing it to zero is probably unrealistic,” Shah says. “But it's important to think, ‘How close to zero can we get?’”

“We should have learned from earlier attempts to create chat agents—such as when Microsoft’s Tay was easily manipulated into spouting racist and sexist viewpoints—that they are very hard to control, particularly given that they are trained from information on the Internet and every good and nasty thing that’s in it,” says Mike Katell, an ethics fellow at the Alan Turing Institute in England, who was not involved in the new study.

Katell acknowledges that organizations developing LLM-based chatbots are currently putting lots of work into making them safe. The developers are trying to tamp down users’ ability to jailbreak their systems and put those systems to nefarious work, such as that highlighted by Shah, Pour and their colleagues. Competitive urges may end up winning out, however, Katell says. “How much effort are the LLM providers willing to put in to keep them that way?” he says. “At least a few will probably tire of the effort and just let them do what they do.”

Picture

Member for

1 month 1 week
Real name
이태선
Position
연구원
Bio
[email protected]
세상은 이야기로 만들어져 있습니다. 다만 우리 눈에 그 이야기가 보이지 않을 뿐입니다. 숨겨진 이야기를 찾아내서 함께 공유하겠습니다.

[해외 DS] '확산 모델', 효율적인 물건 배치 가능케 해

[해외 DS] '확산 모델', 효율적인 물건 배치 가능케 해
Picture

Member for

1 month 1 week
Real name
김광재
Position
연구원
Bio
[email protected]
균형 잡힌 시각으로 인공지능 소식을 전달하겠습니다.

수정

확산 모델을 사용해 로봇이 짐을 싸는 방법을 학습
기존 방식보다 빠르고 효율적으로 짐을 싸는 데 성공
여행뿐만 아니라 다양한 분야에서 활용될 수 있어

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 데이터 사이언스 경영 연구소 (GIAI R&D Korea)에서 영어 원문 공개 조건으로 콘텐츠 제휴가 진행 중입니다.


ai_teaches_robots_the_best_way_to_pack_a_car
사진=Scientific American

규칙 기반에서 '학습 기반'으로 한 단계 도약

자동차 여행을 위해 짐을 싸는 것은 간단한 작업처럼 보일 수 있지만, 로봇이 학습하기에는 결코 쉬운 일이 아니다. 매사추세츠공과대학과 스탠퍼드대학의 연구팀은 '확산 모델(Diffusion Model)'이라는 생성형 AI의 한 형태를 사용하여 로봇이 무거운 물건이 가벼운 물건을 부수지는 않는지, 일부 물건 사이에 일정한 공간이 있는지, 로봇의 팔이 실수로 컨테이너에 부딪혀 손상되지 않는지 등 다양한 제약 조건을 준수하면서 제한된 공간에 물건을 효율적으로 배치하도록 데이터를 학습했다. 연구진은 확산 모델을 통해 로봇이 과거에 사용했던 훈련 방법보다 더 빠르게 목표를 달성할 수 있었다고 전했다.

논문의 주 저자인 매사추세츠공과대학교 박사과정 학생인 주티안 양(Zhutian Yang)은 "학습 기반은 기존 방식에 비해 제약 조건을 더 빨리 해결할 수 있으므로 학습 기반 방법을 사용했다"라고 말했다. '학습 기반' 접근 방식은 AI 프로그램이 학습 데이터와 원하는 결과 사이의 패턴을 식별하여 자율적으로 학습할 수 있도록 하는 것이다. 이는 엄격하게 지정된 규정 내에서만 작동해야 했던 이전의 '규칙 기반' 프로그램과는 확연히 다르다. "확산 모델은 다양한 해결책을 샘플링하고 모든 제약 조건을 공동으로 만족시키는 데 매우 효율적인 방법이다"라고 양은 강조했다.

robot_packing_domains
네 가지 유형의 작업이 있다. 기하학적, 물리적, 질적 제약이 있으며, 외쪽부터 오른쪽까지 순서대로 (1) 삼각형 패킹 작업, (2) 정성적 제약 조건이 있는 고밀도 2D 패킹 작업, (3) 3D 객체 스태킹 작업(화살표는 지지 관계를 나타낸다), 그리고 마지막으로 (4) 3D 로봇을 사용한 3D 객체 패킹 작업이 있다/출처=Compositional Diffusion-Based
Continuous Constraint Solvers

확산 모델 순차적 작업 한계 극복해, "이제는 동시 작업"

이번 연구에 참여하지는 않았지만 비슷한 연구 분야에서 일하고 있는 조지아공과대학교의 AI 로봇공학 조교수 아니메쉬 가그(Animesh Garg)는 "자율 포장 공정은 줄곧 어려운 문제였다"라고 언급했다. "머신러닝이 없으면 계산 집약적인 온라인 3D 패킹 프로그램이 필요하다. 해당 프로그램의 코딩된 수준에 따라 해결할 수 없는 상황이 발생할 수도 있는 규칙 기반 기술을 사용할 수밖에 없었다"라고 덧붙였다.

이전에는 앞서 언급한 제약 조건 내에서 배치 최적화를 달성하려면 차례대로 작업해야 했다. 가능한 배치 구성을 개발하고 한 번에 하나의 제약 조건에 대해 각각 테스트한 다음, 다른 제약 조건과의 충돌 여부를 확인해야 했다. 이러한 시행착오를 거치는 방식은 특히 패킹할 항목이 많아 테스트해야 할 작업이 늘어날 때 과부하가 발생한다. 반면에 새로운 연구에서는 확산 모델을 통해 로봇이 개별 제약 조건을 위한 여러 머신러닝 모델을 동시에 탐색할 수 있게 되었다. 개별 모델을 통해 로봇은 문제를 다각도에서 파악할 수 있었고, 거의 즉각적으로 모든 제약 조건을 한꺼번에 고려했다. 그 결과 이전 기술보다 훨씬 더 효과적인 배치 구성을 효율적으로 찾을 수 있게 되었다. 또한 이 연구의 확산 모델은 학습한 정보 이상으로 더 많은 수의 품목에 적용되는 낯선 제약 조건 조합을 해결하기도 했다.

인간의 선입견 뛰어넘고 확장 분야도 넓어

연구팀은 학습 알고리즘이 대부분 사람의 직관과 어떻게 일치하는지, 또는 무엇이 다른지도 살펴봤다. 인간은 가장자리에 먼저 물건을 배치하는 습관이 있는데, 물건이 많으면 항상 왼쪽 아래부터 물건을 놓는다. 물건을 쌓을 때는 한쪽에서 다른 쪽까지 쌓지 않고 층층이 고르게 쌓아 올리는 경향이 있었다. 인간의 관점에서 보면 합리적으로 보일 수 있지만, 인간의 선입견이 없는 학습 기반 로봇은 다양한 해결책을 자유롭게 발견할 수 있는 장점이 있다. 인간보다 더 빠르고 효율적으로 짐을 꾸릴 수 있는 능력을 갖춘 로봇은 자동차 여행을 위한 짐칸 정리 외에도 다양한 분야에서 활용될 수 있다. 예를 들어 배송업체에서 서로 다른 물품을 하나의 컨테이너에 포장하거나 제약회사에서 다양한 약품을 병원으로 대량 배송하는 작업에 적합하다.

현재 연구팀은 로봇이 분산형 의사 결정을 내릴 수 있게 하기 위해 노력하고 있다. 여기에는 로봇에게 제약 조건 내에서 짐을 싸도록 가르치는 것뿐만 아니라, 지속적으로 변화하는 변수(예: 방을 이동하면서 동시에 물건을 포장해야 할 때)에서도 그렇게 하도록 훈련하는 것이다. 또한, 자연어 명령을 추가 입력으로 받아들여 사용자 편의성을 높일 수 있도록 모델을 확장하는 방향도 고려하고 있다고 전했다.


AI Teaches Robots the Best Way to Pack a Car, a Suitcase—Or a Rocket to Mars

Robots that can fit multiple items into a limited space could help pack a suitcase or a rocket to Mars

Packing the car for a road trip might seem like a straightforward enough task, but it’s never been an easy one for robots to learn—until a new study turned the robot training over to artificial intelligence. The implications of this research go far beyond a well-packed trunk and could eventually impact things ranging from how we manage our homes to how we colonize Mars.

Using a form of generative AI known as a “diffusion model,” a team of researchers at the Massachusetts Institute of Technology and Stanford University trained robots to pack items into a limited space while adhering to a range of constraints: human concerns such as making sure that heavier items didn’t crush lighter ones, that some items had a certain amount of space between them, that a robot’s arm didn’t accidentally strike the container and damage it, and so on. The diffusion model helped the robots accomplish this faster than training methods used in the past, the researchers say.

“We want to have a learning-based method to solve constraints quickly because learning-based [AI] will solve faster, compared to traditional methods,” says M.I.T. Ph.D. student Zhutian “Skye” Yang, lead author of a paper detailing the study, which was recently released ahead of peer review on preprint server arXiv.org. A “learning-based” approach involves allowing an AI program to learn autonomously by identifying patterns between training data and the desired output. This differs from previously tested “rule-based” programs, which are more limited as they must behave within a strictly coded set of regulations. “The diffusion model is a very good method for sampling different solutions to a problem and jointly satisfying all of the constraints,” Yang says.

Autonomous packing “has been a challenging problem,” says Animesh Garg, an assistant professor of AI robotics at the Georgia Institute of Technology, who was not involved in the new study but works in a similar research area. “Without machine learning, the solution involves computationally intensive online 3-D bin packing”—a rule-based technique that “can even be unsolvable” depending on a program’s coded limitations.

Previously, for a robot to solve a packing problem within the aforementioned constraints, it would have to work sequentially. It would develop possible packing configurations and test each against one constraint at a time, then check for conflicts with the other constraints. This trial-and-error method proved too slow, especially when there were more items to pack—and therefore more actions to test. In the new study, the diffusion model, on the other hand, allowed a robot to simultaneously explore an array of machine-learning models, each representing an individual constraint. The sum total of these models afforded the robot a more thorough view of the problem, enabling it to consider all constraints at once, almost instantaneously. As a result, many more successful packing configurations were found faster than they had been with previous techniques. The study’s diffusion method also proved capable of solving new combinations of constraints that were applied to a larger number of items—beyond what the model experienced during training.

“Packing with robots is incredibly hard yet transformational,” Garg says. “This work enables robots to start ‘thinking’ on the fly and achieve very good, if not optimal, solutions quickly.”

“It’s a type of optimization problem,” Yang says. “With the learning-based method, we're happy to see that if we train on the small problems, it can generalize to solving problems with a larger number of objects or a larger set of constraints.”

The study team also looked at how its learning algorithm aligned with—or diverged from—most people’s intuition about how to pack. Humans “have heuristics of packing things to the edge first,” Yang says. “If you have a lot of things, you always pack them to the bottom left-hand side. Or if you are stacking things, you place things evenly, layer by layer, instead of all the way up one side and then the other.” While these heuristics may seem logical from a human perspective, learning-based robots without our preconceptions are free to discover novel solutions.

But by analyzing data ahead of time and keeping likely end solutions in mind before you start packing, you eliminate the need for trial and error. To pack multiple objects into a limited space—think a car trunk or a suitcase—like one of the study’s AI-powered robots, there are three steps. First, ponder ahead of time what you know about packing and what constraints must be met. Next, imagine solutions before you start loading objects. And finally, pack toward that ideal solution, not necessarily by following your intuition.

“There could be many solutions” that may not be intuitive, Yang says. “And you can change the plan as you go.”

Robots gaining an ability to pack faster and more efficiently than their human counterparts has applications far beyond road trips. “I want to have robots in the kitchen helping with housework,” Yang explains. “I just went to an industry robotic company to give a talk, and they are very interested in using this algorithm to pack for their customers.” For instance, she suggests the technique could help shipping companies pack disparate items into a single container or drug companies deliver a wide variety of medications to hospitals in bulk. The possibilities even transcend the planet. “If you’re going to Mars, you can have a robot decide how best to pack the resources,” Yang suggests.

Garg agrees the implications may be far-reaching. “Robotic packing and placement will enable a very large set of open-world robotic skills,” he says. More studies are needed, however. “This work has very impressive results, but it is still a few steps from considering the problem ‘solved,’” Garg says. “I hope that this work will galvanize the community to make quick progress in this domain.”

Now the team at M.I.T. and Stanford is working to make its robots even more capable at making “discrete decisions.” This involves not only teaching a robot to pack within constraints but also training it to do so within continuously shifting variables—for example, when tasked with packing items while simultaneously moving through a room.

So the next time you’re packing, consider doing it like a robot to optimize results. Before long, you might simply leave it entirely up to the machines.

Picture

Member for

1 month 1 week
Real name
김광재
Position
연구원
Bio
[email protected]
균형 잡힌 시각으로 인공지능 소식을 전달하겠습니다.

[해외 DS] 아시아의 AI 혁명 규제, 혁신과 독점 사이의 줄다리기

[해외 DS] 아시아의 AI 혁명 규제, 혁신과 독점 사이의 줄다리기
Picture

Member for

1 month 1 week
Real name
이효정
Position
연구원
Bio
[email protected]
지식은 전달하는 정보가 아니라, 함께 고민하기 위해 만들어진 언어입니다.

수정

AI는 경제를 재편하고 성장을 주도할 잠재력이 있지만, 독점과 배제의 위험도 있어
이를 방지하기 위해 데이터의 자유로운 이동과 소외된 지역사회의 역량 강화 필요
아시아에서는 싱가포르가 이러한 노력을 주도하고 있어, 국가 간 조율이 중요해

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 데이터 사이언스 경영 연구소 (GIAI R&D Korea)에서 영어 원문 공개 조건으로 콘텐츠 제휴가 진행 중입니다.


사진=Pexels

과거 알렉산드리아 항구에 상인들이 도착하면 그들이 손으로 직접 쓴 노트들을 압수하여 그 도시의 유명한 도서관으로 가져가 필경사가 사본을 만들었다고 한다. 재밌는 것은 원본은 압수하고 사본을 상인에게 돌려주었다. 오늘날 디지털 경제를 새롭게 쓰고 있는 생성형 AI 프로그램의 배후에 있는 소프트웨어 개발자들에게도 알렉산드리아 항구의 약탈 정신이 여전히 살아 있는 것을 볼 수 있다.

ChatGPT와 그 경쟁업체들은 대가를 제대로 지급하지 않고 다른 이들의 텍스트와 기타 데이터를 기반으로 모델을 학습했다. ChatGPT와 같은 생성형 프로그램의 기반이 되는 말뭉치를 구축하기 위해 체계적으로 저작권을 위반한 OpenAI를 고발하는 작가들의 대규모 소송은 AI에서 허용되는 것과 허용되지 않는 것에 제한을 두려는 새로운 규제 형성의 시작에 불과하다.

성장과 독점의 딜레마

그러나 두 가지 주요 문제가 복잡성을 증가시키고 있다. 첫 번째는 초기 디지털 혁신인 검색 엔진과는 다르게 AI는 더 큰 선점 효과와 규모의 경제로 인해 자연 독점으로 진화할 수 있다는 점이다. 마이크로소프트와 같은 소프트웨어 제조업체에 대한 반독점 소송은 일부 합의로 마무리되었지만, 경쟁적 행위와 혁신의 경계를 명확히 하는 디지털 경제의 일반적인 원칙을 수립하는 데 큰 도움이 되지 못했다.

두 번째 문제는 AI가 국가 안보에 매우 중요하게 작용하며, 독점적 지위가 형성된다면 각 국가는 경제적, 안보적 이유로 자국 기업의 시장 지배를 선호할 것이라는 점이다. 높은 진입 장벽과 증가하는 규모의 경제는 이미 미국과 중국의 기존 기업들이 우위를 점하게 했다.

불안정한 지정학적 상황과 분열된 세계 경제를 고려할 때, 새로운 디지털 프런티어는 세계에서 가장 큰 두 경제 대국 간의 경쟁의 장이 되었고, 이는 특히 아시아의 소규모 경제에 큰 위험을 안겼다.

변치 않는 가치 기반으로 소규모 경제 보호

새로운 기술은 종종 기존의 규칙을 흔들지만, 그들의 기반이 되는 가치는 변하지 않는다. AI가 세계 경제의 모든 영역으로 빠르게 전파되면서 새로운 국제 경제 규칙의 필요성이 대두되었지만, 이러한 규칙은 이미 입증된 국제적 개방성과 투명성 등의 원칙에 근거해야 한다.

AI 경제에서 미국과 중국의 권력 중앙화를 고려할 때, 아시아는 소규모 경제에 해를 끼치지 않으면서도 합법적인 국가 안보 우려를 해소할 수 있는 새로운 AI 참여 규칙의 채택을 촉진하는 데 중요한 역할을 할 수 있다. 싱가포르의 적극적인 노력은 이를 잘 보여주고 있다.

최신 동아시아 포럼 분기별 보고서에서 발췌한 제이컵 테일러(Jacob Taylor)의 글을 통해 포괄적인 AI 거버넌스 시스템의 잠재적 특징을 살펴보면, 그는 지역 협력을 통해 데이터의 현지화 경향을 극복하고 국경을 넘어 자유롭고 잘 규제된 데이터 이동을 보장하는 것이 중요하다고 강조했다. 이는 지역 내 소규모 기업들의 진입 장벽을 낮출 수 있는 규제 방향이다. 아시아의 신흥 디지털 경제에서 소외된 지역사회를 강화하기 위해 효과적인 자금 조달과 규제 지원이 필요하다.

미·중 대립으로 AI 규제 협력은 더 난항

물론 AI를 관리하기 위한 새로운 규칙을 고안하려는 모든 시도는 지정학적 라이벌에게 어떤 이점도 양보하지 않으려는 워싱턴과 베이징의 고집에 부딪힐 것이다. 미국이 세계무역기구의 교착 상태를 방치하고 협상 테이블에 나오기를 거부하는데, 중요 국가들의 동의를 얻은 효과적이고 포괄적인 AI 규정을 상상하는 것은 너무 순진한 생각일 수 있음을 시사한다. 미국이 참여하고 있는 G7 AI 이니셔티브에서도 중국은 참여국이 아니었다.

테일러가 주장하듯이 AI 시스템의 권력 집중화, 지역화, 배제 문제에 대한 쉬운 해답은 없다. 하지만 조율된 AI 거버넌스는 다양한 지역 이해관계자들이 AI 시스템을 적극적으로 관리하도록 동기를 부여하는 동시에 위험에 대한 투명성을 높일 수 있는 분명한 인센티브가 자리 잡고 있다.

특히 대부분의 디지털 거래의 국경 없는 특성을 고려할 때, 기술의 발전은 규제 당국이 따라잡을 수 있는 속도보다 더 빠르게 진행되고 있다. AI가 경제를 재편하고 성장을 주도할 수 있는 범위는 분명하지만, 데이터를 국경에 가두어 혜택을 독점하거나 낭비하지 않고 훨씬 더 많은 사람이 개발 과정에 참여할 수 있는 신기술의 잠재력을 실현하기 위해서는 효과적이고 효율적이며 사려 깊은 규제가 절실히 필요한 시점이다.


Regulating the AI revolution in Asia

It is said that when merchants arrived in the port of Alexandria in antiquity, their manuscripts would be seized, taken to the city’s famous library, and copied by scribes, who would confiscate the original and graciously give the copy to the merchant.

Something of that mercenary spirit is still alive in the software developers behind the wildly successful new generative artificial intelligence (AI) programs that are rewriting the digital economy. The functionality of ChatGPT and its competitors is built on collections of text and other data that some allege has not properly been paid for. A major lawsuit from authors accusing OpenAI of systematically violating copyright to build the corpus on which programs like ChatGPT are based is only the start of a new round of litigation and regulation that will try to place limits on what is and is not permissible in AI.

But two problems complicate matters. The first is that, even more than for earlier digital innovations like the search engine, there are major first-mover advantages and economies of scale that make AI ripe for natural monopolies. An early age of antitrust suits against software makers like Microsoft, generally ending in weak settlements, did little to establish general principles for the digital economy about where to draw the line between successful innovation and anti-competitive behaviour.

The second problem is that AI has quite obvious national security applications, and if there are monopoly rents to be had, each government would prefer — for security purposes as well as economic reasons — that their own companies hold the dominant market position. Because of the high fixed costs of entry and increasing returns to scale, as well as the national security nexus, established players in the United States and China have the upper hand.

Given the volatile geopolitical situation and the splintering world economy, the new digital frontier has become an arena of contest between the two largest economies in the world, and that entails major risks for smaller economies, particularly in Asia.

New technologies often make existing rules obsolete, but not the values upon which they are based. The rapid spread of AI into every corner of the global economy demands new international economic rules, but they should be based on principles that have proven themselves, like international openness and transparency.

Given the centrality of the United States and China in the AI economy, there is an important role for Asian economic cooperation to play in driving the adoption of new rules of engagement for AI that address legitimate national security concerns without disadvantaging smaller economies. This explains Singapore’s proactivity in this sphere.

In this week’s lead article, excerpted from the latest East Asia Forum Quarterly, Jacob Taylor explores some of the potential features that a comprehensive system of AI governance might have. He argues that there is a need to address the tendency for governments to try to localise data through regional cooperation to ensure the free, well-regulated flow of data across national borders. This will help to lower the barriers to entry for new, smaller players in the region. There must also be a concerted effort to build capacity in communities that have been excluded from the emerging digital economy in Asia through effective financing and regulatory assistance.

Any attempt to devise new rules to govern AI will, of course, come up against the unwillingness of Washington and Beijing to cede any advantage to their geopolitical rival. The United States’ refusal to come to the table to end the gridlock at the World Trade Organization suggests that it might be wishful thinking to imagine a comprehensive set of regulations for AI that has effective buy-in from all of the most important players. The G7 AI initiative, of which the United States is a part, does not meet this test.

As Taylor argues, ‘[t]here are no easy answers to questions of concentration, localisation and exclusion in AI systems. But coordinated AI governance can create incentives for diverse regional stakeholders to actively steward AI systems while increasing transparency around risks.’

The state of technology is moving faster than regulators have been able to keep up with, particularly given the borderless nature of most digital transactions.

The scope for AI to reshape economies and drive growth is obvious, but effective, efficient and thoughtful regulation is desperately needed to ensure that the benefits are not monopolised or squandered by locking data behind national borders and the potential of the new technology to include vastly more people in the process of development is realised.

The EAF Editorial Board is located in the Crawford School of Public Policy, College of Asia and the Pacific, The Australian National University.

Picture

Member for

1 month 1 week
Real name
이효정
Position
연구원
Bio
[email protected]
지식은 전달하는 정보가 아니라, 함께 고민하기 위해 만들어진 언어입니다.

[해외 DS] 아시아 AI 거버넌스, 과도한 경쟁보다 협력해야 할 때

[해외 DS] 아시아 AI 거버넌스, 과도한 경쟁보다 협력해야 할 때
Picture

Member for

1 month 1 week
Real name
이시호
Position
연구원
Bio
[email protected]
세상은 다면적입니다. 내공이 쌓인다는 것은 다면성을 두루 볼 수 있다는 뜻이라고 생각하고, 하루하루 내공을 쌓고 있습니다. 쌓아놓은 내공을 여러분과 공유하겠습니다.

수정

권력 집중, 현지화, 배제 문제를 해결하기 위해서는 국가간 협력이 필요해
기존에 있는 아시아 연합 모임을 활용해 조율 논의를 추진할 수 있어
조율된 AI 거버넌스는 기술 환경의 변화에 맞춰 발 빠르게 움직여야

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 데이터 사이언스 경영 연구소 (GIAI R&D Korea)에서 영어 원문 공개 조건으로 콘텐츠 제휴가 진행 중입니다.


everyone_wins_with_better_ai_governance
사진=East Asia Forum

생성형 인공지능이 전 세계의 열렬한 호응을 얻고 있지만, 정책 입안자들은 AI 시스템이 국경을 넘어 시민들에게 미칠 영향에 대해 우려의 목소리를 내고 있다.

아시아 AI 거버넌스의 도전과제, 현지화 vs. 지역 협력

세계은행은 미국의 보호무역주의와 부채 증가의 영향으로 내년 동아시아 개발도상국 경제가 반세기 만에 가장 낮은 성장률을 기록할 것이라고 경고했다고 파이낸셜타임스가 10월 1일(현지시간) 보도했다. 최악의 경제 전망에 직면한 아시아에서 포용적이고 지속 가능한 성장을 이끌어낼 열쇠는 첨단 AI 시스템 개발을 포함해 디지털 혁명을 활용하기 위한 서비스 부문의 개혁일 것이다. 따라서 AI 거버넌스의 지역적 조율은 아시아에서 그 어느 때보다 중요한 화두다. 또한, AI를 위한 역내 조율된 협정을 통해 미국과 중국 간의 지정학적 경쟁이라는 가장 심각한 외교 리스크를 완화하는 동시에 중견국들이 어느 한쪽을 선택해야 하는 강제성을 줄이는 데 도움이 될 수 있다.

하지만 효과적인 AI 거버넌스는 근본적인 도전에 직면해 있다. 미국과 중국, 그리고 소수의 기술 인프라 기업이 AI에 대한 권력을 집중시키고 있는 것이 그중 하나다. 또 다른 문제는 각국 정부가 주요 디지털 자산을 현지화하고 보호하려는 경향이 강하다는 점이다. 대규모언어모델(LLM)의 인상적인 초기 성능을 미루어보아 AI 애플리케이션은 LLM 기반에 의존할 가능성이 점점 더 높아진다. 애석하게도 LLM은 최고의 자원을 보유한 기업만이 유지할 수 있는 데이터 및 연산 집약적인 기술이다. 이대로라면 '승자 독식' 환경이 조성되고, AI 리더들은 그들이 축적하는 학습과 자본으로부터 불균형적인 혜택을 누리며 권력을 더욱 강화시킬 것이다. 이는 결과적으로 신규 진입자의 경쟁을 어렵게 하고, 공공 기관이 AI 시스템의 투명성과 책임성을 보장하기 어렵게 만든다.

한편 인공지능에 대한 권력이 집중되면서 아시아 태평양 지역의 일부 정부는 국가 정책을 통해 디지털 자산을 보호하고 현지화하려고 노력하고 있다. 결론부터 말하자면 현지화 조치는 AI 시스템에 부정적인 영향을 미친다. 현지화는 학습 데이터에 대한 접근성을 떨어뜨리고, 혁신 생태계를 고갈시키며, 사이버 보안 메커니즘의 파편화를 초래할 위험이 있기 때문이다. 역내포괄적경제동반자협정(RCEP) 무역 협정은 국가 안보를 이유로 데이터 현지화를 허용하는 전자상거래 정책을 통해 이러한 추세를 반영하고 있다. 게다가 미국은 더욱 적극적인 접근 방식을 취하고 있다. 그래픽 처리 장치(GPU)의 자국 내 생산, AI 혁신 생태계에 대한 투자, 중국으로 판매되는 하이엔드 GPU를 겨냥한 수출 규제는 현지화를 통해 미국 기술 기업의 AI 우위를 공고히 다져나갈 의도로 해석된다.

현지화에 대응할 수 있는 강력한 지역적 네트워크가 없다면 중국, 인도, 인도네시아 등 잠재적 AI 경쟁국들도 이에 대응하지 않을 수 없는 노릇이다. 설상가상으로 데이터, 컴퓨팅 성능, 인재 확보에 대한 접근성이 가장 낮은 가난한 소규모 국가들은 AI 산업에 참여할 수 있는 선택지가 줄어들게 될 것이 불 보듯 뻔하다. 따라서 아시아의 디지털 격차는 곧 '알고리즘 격차'로 이어질 가능성이 매우 높다. 광대역 연결성이 향상되었지만, 아세안 인구의 약 61%는 인터넷 접속이 가능한 범위 내에 거주하지만, 아직도 인터넷을 사용하지 않는 것으로 추정된다. 몇몇 국가는 적절한 데이터 보호법과 AI 전략도 부족한 실정이다. 더군다나 아시아의 여성, 농촌 거주자, 원주민은 여전히 AI 시스템의 혜택을 누리는 데 있어 체계적으로 배제되어 있다.

권력 집중·현지화·배제, '3대 과제' 해결을 위한 협력 방안

정부, 금융, 중소기업, 시민들은 AI 시스템의 권력의 집중, 현지화, 배제의 균형을 맞추기 위해 협력 방안을 모색해야 한다. 권력이 집중되는 문제를 해결하기 위해서는 형평성을 높이는 새로운 데이터 소유권 및 가치 평가 패러다임을 촉진하는 것이 중요하다. 자본 공급자는 대규모 독점 AI 모델과 중앙집중식 클라우드 컴퓨팅 인프라에 대한 의존도를 줄이면서 중소기업과 커뮤니티가 주도하는 AI 시스템 개발을 지원할 수 있다. 또한, 제삼자 AI 감독에 대한 지역적 조정을 통해 국가 차원의 막대한 규제 비용을 낮출 수도 있다. 싱가포르의 AI 검증 재단(Singapore AI Verify Foundation)은 AI 시스템에 대한 광범위한 이해관계자의 참여를 확대하는 고무적인 민관 파트너십을 성사했다. 글로벌 규제 샌드박스(유예제도) 이니셔티브가 아시아에서 시작될 수도 있음을 시사하는 대목이다.

국경을 넘나드는 데이터 흐름에 대한 기존의 양자 및 다자간 무역 협정을 업데이트하는 것부터 시작해, 현지화의 균형을 맞춰 나갈 수 있다. 다자간 무역 규칙에서 국가 안보 면제를 검토해 보면 자유화할 수 있는 AI 관련 자산을 구분하는 데 도움이 된다. 기존의 소통 무대를 활용하는 것도 좋은 방법이다. 세계무역기구의 전자상거래에 관한 공동 이니셔티브는 아시아 태평양 국가들이 공동 AI 거버넌스 협력을 위해 추진력을 얻을 수 있는 포럼 중 하나다. 아울러 상호의존적 표준기구를 세우면 국경을 넘나드는 데이터 흐름의 자유화가 책임성을 훼손하지 않도록 중재 및 보장할 수 있게 된다. 비현실적인 협력 제도가 아니라, 경제 둔화 전망의 돌파구를 찾기 위한 전략적 협력이라는 점을 강조하는 바다.

배제 문제를 해결하기 위해 정책 리더들은 아세안 및 태평양 도서국들과 협력하여 규제 및 AI 전략을 강화해야 한다. 중소기업 자금 조달과 디지털 역량 강화는 지역 AI 생태계에 공평하게 참여할 수 있도록 지원하는 데 핵심적인 이무를 수행할 것이다. 또한 자원봉사자와 개발 실무자들은 AI 시스템에 대한 시민 참여를 높이고 디지털 거버넌스에 대한 참여 인식을 높이기 위한 지역 주도 캠페인을 지원할 수 있다.

AI 시스템의 집중, 현지화, 배제의 문제에 대한 쉬운 해답은 없다. 하지만 조율된 AI 거버넌스는 다양한 지역 이해관계자들이 AI 시스템을 적극적으로 관리하도록 동기를 부여하는 동시에, 리스크에 대한 가시성을 확보하는 데 도움을 준다. 효과적인 협력을 위해 AI 거버넌스는 기술 환경이 진화하는 속도만큼 발 빠르게 움직여야 한다. 위기를 대비하지 않은 국가들의 경제 성적표가 나왔을 땐 적기를 놓쳤을 확률이 높다. 기술 혁신이라는 공통된 목표 아래 각자의 디지털 비교우위로 적극적으로 협력해야 할 시기다.


Everyone wins with better Asian AI governance

Generative artificial intelligence (AI) has captured the world’s imagination. It has also been greeted with alarm, with policymakers concerned about its control by non-state actors and the impact of AI systems on citizens within and across national borders.

Most AI experts agree that the world needs to work together to promote the best and prevent the worst. But China announcing its Global AI Governance Initiative two weeks before a UK-hosted AI Safety Summit and one day after the United States further tightened export controls over advanced computing chips raises questions about the effectiveness of multilateral efforts to develop trustworthy, inclusive and environmentally sustainable AI systems.

Regional coordination of AI governance is nowhere more crucial than in Asia.

With Asia facing one of its worst economic outlooks in half a century, the key to inclusive and sustainable growth in the region will be reforming the service sector to harness the digital revolution, including through the development of advanced AI systems. Coordinated regional arrangements for AI can also help mitigate the most acute risks of geostrategic competition between the United States and China while reducing the need for middle powers to choose sides.

Effective AI governance faces fundamental challenges. The concentration of power over AI inputs by the United States, China and a handful of their technology infrastructure firms is just one. Another problem is governments’ tendency to localise and protect key digital assets. Meanwhile, Asia’s women, rural residents, and indigenous populations remain systematically excluded from accessing the benefits of AI systems.

There are huge differences in state perspectives and capabilities for dealing with AI-related challenges, yet the region already possesses the raw ingredients required to shape a regional framework for AI governance. These include a wide variety of flexible digital policy tools and industry engagement strategies that can be upgraded and flexibly deployed.

A foundational challenge for AI governance in Asia is that a handful of US and Chinese technology infrastructure companies enjoy near-monopoly power over most key inputs. The impressive early performance of large language models (LLMs) shows they could become the foundational infrastructure on which AI applications rely. But LLMs depend on data and computation-intensive machine learning that only the best-resourced companies can maintain.

This signals a worrying ‘winner takes most’ environment. AI leaders benefit disproportionately from the learning and capital they accrue, further concentrating power. This concentration makes it difficult for new entrants to compete and public actors to ensure transparency and accountability of AI systems.

With power over AI inputs concentrated, some governments across the Asia Pacific are seeking to protect and localise their digital assets through national policy. Localisation measures have negative impacts on AI systems. Localisation reduces access to training data, starves innovation ecosystems and risks fragmentation of cybersecurity mechanisms.

The Regional Comprehensive Economic Partnership (RCEP) trade agreement mirrors this trend, with its chapter on e-commerce allowing data localisation carveouts on national security grounds. The United States has taken an even more active approach. Investments in onshore production of graphics processing units (GPUs), AI innovation ecosystems and export controls targeting high-end GPUs sold to China signal its intention to extend US technology companies’ AI advantages through localisation.

Absent a robust regional framework to counteract localisation, it will be difficult for potential AI competitors such as China, India and Indonesia not to respond in kind. Smaller and poorer countries with the least access to data, computational capacity and talent will be left with fewer options to participate in the AI industry.

Southeast Asia’s comparatively weak AI readiness risks the region’s digital divides becoming ‘algorithmic divides’. While broadband connectivity has increased, an estimated 61 per cent of ASEAN populations do not use the internet despite living within range of internet access. Several countries lack adequate data protection laws and AI strategies.

Governments, capital providers, small- and medium-enterprises (SMEs) and citizens can coordinate strategies that counterbalance concentration, localisation, and exclusion in AI systems.

Key to addressing concentration will be promoting new paradigms of data ownership and valuation that increase equity, including experimentation with data cooperatives and data unions. Capital providers can support the development of SME- and community-driven AI systems while reducing reliance on largescale proprietary AI models and centralised cloud computing infrastructure.

Regional coordination of third-party AI oversight can lower the prohibitive costs of regulation at the national level. Existing national policy tools offer starting points for a regional approach that places responsibility on technology firms. Singapore’s AI Verify Foundation is an encouraging public–private partnership that increases broad stakeholder participation in AI systems. A proposed global regulatory sandbox initiative could even begin in Asia.

Counterbalancing localisation can begin with updating existing bilateral, minilateral and multilateral trade agreements for cross-border data flows. Examining national security exemptions in multilateral trade rules can help distinguish which AI-relevant assets could be liberalised. The World Trade Organization’s joint initiative on e-commerce is a forum in which Asia Pacific nations can push to gain momentum. A regional interdependent standards body could ensure liberalisation of cross-border data flows does not compromise accountability.

To address exclusion, regulatory leaders can work with ASEAN and Pacific Island nations to strengthen regulations and AI strategies. SME financing and digital capacity building will be key to supporting equitable participation in regional AI ecosystems. Donors and development practitioners can also support locally led efforts to increase citizen participation and representation in AI systems and engagement with digital governance.

There are no easy answers to questions of concentration, localisation and exclusion in AI systems. But coordinated AI governance can create incentives for diverse regional stakeholders to actively steward AI systems while increasing transparency around risks.

In practice, AI governance will need to move as fast as the technology landscape is evolving.

Picture

Member for

1 month 1 week
Real name
이시호
Position
연구원
Bio
[email protected]
세상은 다면적입니다. 내공이 쌓인다는 것은 다면성을 두루 볼 수 있다는 뜻이라고 생각하고, 하루하루 내공을 쌓고 있습니다. 쌓아놓은 내공을 여러분과 공유하겠습니다.

[해외 DS] 샌드아트와 수학의 만남, 일시적인 예술의 영원한 이야기 (3)

[해외 DS] 샌드아트와 수학의 만남, 일시적인 예술의 영원한 이야기 (3)
Picture

Member for

1 month 1 week
Real name
이태선
Position
연구원
Bio
[email protected]
세상은 이야기로 만들어져 있습니다. 다만 우리 눈에 그 이야기가 보이지 않을 뿐입니다. 숨겨진 이야기를 찾아내서 함께 공유하겠습니다.

수정

그림의 변형 보다 그리는 방향에 초점을 맞춘 새로운 모델 개발
샌드 아트의 사이클 구조를 보존하고, 제작 과정도 잘 반영해
수학적 개념들은 벽을 쌓기보단, 예술의 본질에 더 가까워져

[해외DS] 샌드아트와 수학의 만남, 일시적인 예술의 영원한 이야기 (2)에서 이어집니다.


sand_art_final_grid
각 노드 또는 교차점에서 손가락은 두 개의 대각선 경로(보라색과 파란색) 중 하나를 따라간다/사진=알반 다 실바

마르시아 애셔는 회전, 이동, 대칭, 반전 등의 변형(transformation)이 가해진 일련의 패턴으로 모래 그림을 모델링할 것을 제안했었다. 하지만 알반 다 실바는 현장에서 제작자들의 이야기를 듣다 보니 변형이 디자인 설계에 근본적인 역할을 하지 않는다는 것을 깨달았다. 사실 그들은 변형에 상관없이 해당 디자인을 지칭하는 데 동일한 용어를 사용했었다. 따라서 실바는 샌드 아티스트들의 접근 방식을 설명할 다른 방법이 필요했다.

노드와 방향의 결합으로 더 완전해진 샌드 아트의 알고리즘

그래프는 개체(vertex) 간의 일련의 관계(edges)를 모델링하는 데 매우 유용하다. 그러나 애셔는 작품에서 관계의 본질을 고려하지 못했다. 그리드의 노드, 그래프의 정점, 간선의 곡선을 강조했기 때문에, 그녀는 아티스트가 한 지점에서 다른 지점으로 이동하는 방식을 간과할 수밖에 없었다. 반면 실바는 이들에게 선을 그리는 방향이 노드만큼이나 중요하다는 것을 포착했다.

디자이너의 손가락이 노드에서 노드로, 초기 방향에서 최종 방향으로 이동하기 때문에 두 개의 선이 한 노드에서 대각선 방향으로 교차할 때, 서로 다른 역할을 수행한다는 점을 알아냈다. 따라서 그래프로 모래 그림을 모델링하려면 그리드의 모든 노드가 하나가 아니라 각각의 방향에 할당된 두 개의 정점으로 분리해야 완성될 수 있었던 것이다.

애셔가 제안한 것처럼 그리드의 노드는 S가 아닌, 방향을 함께 표현할 수 있는 (S, d)를 새로운 노드 단위로 삼아야 했다. d는 이동 방향이며, S에서 S'으로 이동하기 위해선 S 노드에서 d 방향으로 출발하여 d' 방향으로 S' 노드에 도착해야 한다.

sand_art_1d_to_2d
노드와 방향이 어떻게 표현되는지 설명하는 그림/출처=알반 다 실바

아래 곡선형 그래프는 모래 그림을 모델링한 그래프 G 이다. 선 위의 숫자는 이 선들이 그려진 순서를 나타내고 있다. 직선형 그래프는 G 그래프에서 교차하는 각 지점을 두 개의 노드로 대체한 Gmod 그래프다. 각 교차점이 두 개의 대각선 방향으로 구성되어 있다는 사실을 반영한 것으로, 보라색 또는 파란색 노드는 두 가지 대각선 방향 중 하나를 가리킨다.

sand_art_orders
모래 그림을 본뜬 곡선형 그래프 G/출처=알반 다 실바
sand_art_crossing_point
위 곡선형 그래프에서 교차 노드를 분리한 직선형 그래프 Gmod/출처=알반 다 실바

최종적으로 Gmod의 선과 꼭짓점을 펼치면 Gmod가 여전히 오일러 그래프임을 확인할 수 있다.

sand_art_still_eulerian
Gmod 그래프가 G 그래프와 마찬가지로 오일러 그래프임을 증명하는 그림/출처=알반 다 실바

수학의 보편성과 확장성으로 문화 교육에 깊이를 더해야

sand_art_butterfly
'나비 세계'라는 모래 그림의 각 하위 사이클을 다른 색상으로 나타냈다/사진=알반 다 실바

1912년 수학자 오즈월드 베블런(Oswald Veblen)은 오일러 그래프의 또 다른 특징인 '베블런의 정리'를 통해 그래프를 분리된 하위 사이클들의 집합으로 재정의할 수 있는 경우에만 오일러 그래프라는 사실을 밝혀냈다. 그래프 이론에서 '사이클'이라는 단어는 시작과 끝 정점이 동일한 연속된 선의 시퀀스를 의미한다. Gmod 그래프의 사이클은 모래 그림의 사이클과 일치하고, 모래 그림은 하위 사이클의 집합으로도 정의할 수 있으므로 베블런의 정리를 따른다고 할 수 있다.

모래 그림을 오일러 그래프 정리와 베블런 정리로 해석한 일은 분명 창의적인 시도다. 하지만 수학적 개념들이 바누아투의 모래 그림을 이해하는 데 더 큰 장벽으로 작용하지는 않았을까? 실바는 수학적 해부를 통해 샌드 아트의 본질을 더 잘 드러낼 수 있다고 강조했다. 그가 수집한 60여 점의 그림을 보면 작가들이 한 사이클을 완성할 때 잠시 쉬는 것을 볼 수 있으며, 다른 경로(비슬라마어로 rod)를 찾아야 할 경우, 그림에서 사용하는 일반적인 사이클 순서를 재배열하거나 다른 분해 조합을 시도하는 경향이 있다고 전했다. 사이클을 중심으로 그림을 분해하고 조합하는 시선이 수학자나 바누아투 예술가나 근본적으로 같다는 점을 시사한다.

일부 사이클에는 고유한 이름이 있는데, 이는 아티스트에게 사이클이 일종의 재료와 같다는 것을 암시한다. 사실 그래프 사이클에 대한 이러한 초점은 바누아투 사회가 세계를 이해하는 방식을 반영하는 것처럼 보인다. 실바의 연구에서는 일부 사이클의 분해가 해당 사회가 비인간과의 관계를 생각하는 방식과 관련이 있을 수 있다고 제안했다. 한편 2010년부터 바누아투 학교에서는 모래 그림과 같은 전통 지식을 습득하는 과목이 시행되고 있으나 교육 탈식민지화 운동의 일환일 뿐, 모래 그림의 수학 개념을 연계해서 커리큘럼을 구성하지 않았다. 수학을 통해 문화 교육의 의의를 확장시키기 위해 뉴칼레도니아 대학의 교육학 박사 과정 학생인 피에르 멧산(Pierre Metsan)은 활발히 연구 중이다. 그의 연구를 통해 수학의 보편성이 샌드 아트를 그림으로만 접한 사람들에게 더 많이 알려지기를 기대해볼 수 있다.


To investigate, I sought to first refine the graph model proposed by Ascher and then determine whether computers could generate an automated breakdown of the sand drawings. Ascher had proposed modeling sand drawings with a set of patterns subjected to transformations (such as rotation, translation, symmetry and inversion). But while listening to the creators of sand drawings, I realized that transformations did not play a fundamental role in the execution of their designs. In fact, they used the same term to designate a motif, whatever its orientation on the grid. I therefore needed another way to describe the approach of these sand artists.

The artists themselves helped me in this effort. Graphs are very useful for modeling a set of relationships (edges) between objects (vertices). But in her work, Ascher did not consider the nature of these relations. By emphasizing the nodes of the grid, the vertices of the graph and the curves at the edges, she overlooked the ways in which the artist would move from one peak to another. While questioning the experts, I observed that, for them, the direction of the movement is as important as the nodes: the designer’s finger moves from node to node, from an initial direction to a final direction, so that the nodes play different roles when they are crossed, according to one or the other of the two possible diagonals.

To model the sand design with a graph, therefore, it is possible to create a graph in which every node of the grid is treated not as one but rather two vertices that are each assigned to a diagonal. We thus obtain a new graph—named Gmod—whose vertices are not the nodes S of the grid, as Ascher proposed, but instead the pairs (S, d).

In this graph, d is the direction taken, and each movement of the drawing that leaves from S in the direction d and arrives in S’ in the direction of d’ corresponds to an edge between the vertices (S, d) and (S’, d’). And this resulting Gmod graph is still Eulerian!

A Theorem Discovered in Drawings
In 1912 mathematician Oswald Veblen identified another characteristic of Eulerian graphs in what has since been called Veblen’s theorem: a graph is Eulerian if and only if it can be broken down into a union of disjoint cycles. In graph theory, the word “cycle” refers to a sequence of distinct consecutive edges whose start and end vertices are identical.

It turns out that the cycles of the Gmod graph correspond to those of a sand drawing, which can therefore be broken down as a disjoint union of cycles.

Does this approach distance us from sand drawers? I would argue that it does not. On the contrary, cycles can provide keys to better understanding their approach. Of the 60 or so drawings that I have collected, I have noticed that artists sometimes take breaks in their drawing when they complete a cycle. Moreover, when a sand drawer is forced to find another path (a rod in Bislama), they tend to rearrange the typical cycle order that they use in their drawing or to try to find another decomposition into cycles.

Finally, some cycles have vernacular names, which suggests that they are like building blocks for the artists. In fact, this focus on graph cycles also seems to echo the stories that accompany the drawings, which play a fundamental role in the way Vanuatu societies understand the world. In my research, I have also suggested that some cycle decompositions might be linked to the way these societies conceive of their relationship with nonhumans.

These results raise questions about the universality of mathematics and the form that math takes in other cultures. They open up perspectives for teaching mathematics as well. Since 2010 the acquisition of traditional knowledge such as sand drawing has been one of the objectives of Vanuatu schools, and it is part of a larger movement to decolonize education, much like efforts in Hawaii and in the French territory of New Caledonia. In the current school curriculum, however, no link is made between sand drawing and mathematics. To that end, Vanuatuan Pierre Metsan, a doctoral student in education at the University of New Caledonia, is studying whether the practice of sand drawing could support mathematics instruction. We can look forward to what he learns from this investigation in the years to come.

Picture

Member for

1 month 1 week
Real name
이태선
Position
연구원
Bio
[email protected]
세상은 이야기로 만들어져 있습니다. 다만 우리 눈에 그 이야기가 보이지 않을 뿐입니다. 숨겨진 이야기를 찾아내서 함께 공유하겠습니다.

[해외 DS] 샌드아트와 수학의 만남, 일시적인 예술의 영원한 이야기 (2)

[해외 DS] 샌드아트와 수학의 만남, 일시적인 예술의 영원한 이야기 (2)
Picture

Member for

1 month 1 week
Real name
이태선
Position
연구원
Bio
[email protected]
세상은 이야기로 만들어져 있습니다. 다만 우리 눈에 그 이야기가 보이지 않을 뿐입니다. 숨겨진 이야기를 찾아내서 함께 공유하겠습니다.

수정

초보자부터 전문가까지 모두가 일련의 규칙을 따르지만, 문서로 기록하지 않아
규칙은 정점·간선·차수·움직임에 대한 제한 등을 포함, '오일러 그래프' 정리와 대응
전체 그림을 구성하는 각 하위 단계도 시작점과 끝점이 동일해, 오묘한 재귀적 성질

[해외DS] 샌드아트와 수학의 만남, 일시적인 예술의 영원한 이야기 (1)에서 이어집니다.


sand_art_graph
사진=Pexels

모래 그림에는 다양한 전문 지식과 수준이 존재한다. 어떤 이들은 모래 그림을 전혀 연습하지 않거나, 몇 개의 간단한 그림만 그릴 줄 아는 사람이 있는 반면, 바누아투 사회에서 지정한 '전문가'들은 풍부한 레퍼토리를 가진다고 알려져 있다(일부에 따르면 최대 400개의 그림을 그릴 수 있다고 한다). 초기의 모래 그림은 남성의 전유물이라고 여겨졌지만, 오늘날에는 그렇지 않다. 몇몇 여성들도 뛰어난 전문성을 보유하고 있다.

또한 초보자부터 전문가까지 모두가 일련의 규칙을 따르는데, 문서로 기록된 것은 없다. 전통적인 지식이 구전으로 전해지며 대부분은 일관성 있는 원칙을 따른다. 모든 도면은 일련의 노드 또는 교차점, 선을 정의하는 그리드로 시작된다. 규칙은 움직임을 제한하기도 한다. 아티스트는 (1) 노드에서 노드로 이동할 때 같은 경로를 가로지르거나 노드 이외의 그리드를 자르지 않고 (2) 손가락을 떼지 않고 시작 지점으로 돌아와야 한다는 것이다. 현장에서 발견한 또 다른 규칙이 있었는데, 이 규칙은 실바의 모델에서 매우 중요한 역할을 한다고 밝혀졌다. 이에 대한 설명은 아래에서 찾아볼 수 있다.

고전적인 거북이 모양의 샌드 드로잉 디자인/출처=알반 다 실바

민족수학 선구자들의 혜안, 문자 없는 사회의 수학적 지식 발견

샌드 아트의 규칙이 수학의 개념과 유사하다는 것을 알아차린 사람은 실바가 처음이 아니다. 그의 논문은 민족수학의 선구자인 미국 수학자 마르시아 애셔(Marcia Ascher)가 1980년대에 수행한 연구의 연장선상에 있다. 그녀는 샌드 아트에서 수학자들이 그래프 이론이라고 부르는 것, 특히 오일러 그래프와 분명한 연관성이 있다고 주장했다.

애셔의 관점이 얼마나 혁명적이었는지 이해하려면 시대적 맥락을 알아야 한다. 애셔와 동시대 학자들의 연구 이전에는 일반적으로 문자가 있는 사회에서만 수학을 진정으로 실천할 수 있다고 생각했었다. 그들은 수학적 지식에 관한 연구를 텍스트 자료에 국한했고, 문자를 사용하지 않는 구전 전통을 가진 사회에서 볼 수 있는 다른 많은 수학적 관행에 큰 관심을 두지 않았다.

그러나 민족수학 연구가 시작된 후, 일부 학자들은 이러한 전통적인 가정을 깨뜨렸다. 이러한 변화는 1940년대에 앙드레 웨일(André Weil)이 클로드 레비스트라우스(Claude Lévi-Strauss)의 호주 욜릉구족의 친족관계 규칙을 수학적 법칙으로 입증한 것에서 출발되었다. 그 후, 연구자들은 마다가스카르의 파종 게임과 점술, 파푸아뉴기니의 줄 놀이, 안데스의 직물, 레위니옹 섬의 장식용 창문 걸이 등에서 수학적 원리를 발견했다.

애셔의 발견을 토대로 실바가 쌓아 올린 샌드 아트의 추상적 개념

애셔의 모래그림 작업은 1926년과 1927년에 바누아투의 말레쿨라와 암브림 섬에서 100여 점의 모래그림을 수집하고 필사한 젊은 민족학자 버나드 디콘(Bernard Deacon)의 작업에서 영감을 얻었다. 애셔는 이 그림들을 연구한 끝에 이러한 이미지가 수학적으로 설명될 수 있다는 사실을 깨달았다. 각 모래그림은 변(edge)으로 연결된 꼭지점(vertex)을 포함한다는 의미에서 '그래프'로 생각할 수 있다. 그래프에 대한 이러한 정의는 수학에서 특수한 개념이다.

sand_art_eulerian_graph
오일러 그래프에서는 같은 변(edge)를 두 번 교차하지 않고 각 노드를 통과하는 경로를 만들 수 있다/출처=알반 다 실바

애셔는 모래 그림이 모든 두 꼭짓점 사이에 경로가 존재하는 연결 그래프(connected graph)와 비슷하다는 것을 발견했다. 이 그래프 역시 오일러 그래프로, 샌드 아티스트는 각 변을 한 번만 방문하고 다시 시작점으로 돌아와야 한다. 수학자 칼 히어홀저(Carl Hierholzer)가 만든 오일러 정리에 따르면, 각 꼭지점의 차수(degree)가 짝수일 때만 연결된 그래프가 오일러 그래프이기 때문에 애셔는 차수에 대한 내용도 문서화했다.

하지만 애셔는 바누아투에 가서 디자이너들이 일하는 모습을 볼 기회가 없었기 때문에 연구에 한계가 있을 수밖에 없었다. 따라서 현장 조사를 진행한 실바의 연구는 한 발 더 나아갈 수 있었다. 애셔는 디콘의 그림을 검토하면서 그래프 중 일부를 서너 개의 하위 단계로 나눌 수 있고, 하위 단계들이 서로 연결되어 최종 그림을 형성한다는 것을 관찰했다. 다시 말해, 각 단계마다 시작점으로 돌아가는 하위 그림이 만들어지는 것이었다. 실바는 하위 단계를 식별하는 과정을 '분해'라고 명명했고, 모든 드로잉에서 이러한 유형의 분해가 가능한지, 각 하위 단계들은 어떻게 서로 맞물려 있으며 순서가 중요한지, 무엇보다도 분해의 기본 단위가 샌드 아티스트에게 무엇을 의미하는지 의문을 던졌다.

[해외 DS] 샌드아트와 수학의 만남, 일시적인 예술의 영원한 이야기 (3)로 이어집니다.


EXPERTS AND RULES
There are different levels of expertise and practice. Some people don’t practice sand drawing at all. Others know a few rather simple drawings. “Experts”—designated as such by the rest of their society—have an impressive repertoire (up to 400 drawings, according to some). While the first ethnographies of sand drawing mentioned that this art was reserved for men, that is not the case today. Several women I met had a high level of expertise.

From beginners to experts, everyone follows a set of “rules.” Because these communities have an oral tradition, there is no written record, but during my field survey, I drew up a list of principles that are followed in most cases. All drawings begin with a grid that provides support and defines a set of nodes, or crossing points, and lines.

Rules then indicate the movements that are allowed. More precisely, an artist must (1) go from node to node without crossing the same path or cutting the grid other than at its nodes and (2) must return to the starting point without lifting their finger.

There was an additional rule that I discovered in the field that turned out to be critical to my model, as discussed below.

MARCIA ASCHER’S INTUITION
I was not the first person to recognize the resemblance of these rules to concepts from mathematics. In fact, my thesis is a continuation of work carried out in the 1980s by American mathematician Marcia Ascher, a pioneer of ethnomathematics. In sand drawings, she argued, there was a clear connection to what mathematicians call graph theory and especially to Eulerian graphs.

To appreciate how revolutionary Ascher’s perspective was, consider that before her work and that of her contemporaries, scholars generally assumed that only societies with writing could truly practice mathematics. They constrained their investigations of mathematical knowledge to textual sources and ignored many other practices seen in societies with oral traditions that did not use a written language.

But since the advent of ethnomathematics, some scholars have begun to overturn these assumptions. The shift undoubtedly began in the 1940s, when mathematician André Weil demonstrated, in a now famous appendix to anthropologist Claude Lévi-Strauss’s book The Elementary Structures of Kinship, that the kinship rules of the Australian Yolngu followed what are called non-trivia group laws. Since then researchers have identified mathematical principles in many other places, including sowing games and divination in Madagascar, string games on Papua New Guinea’s Trobriand Islands, textiles in the Andes and ornamental window hangings on the island of Réunion.

Ascher’s work on sand drawing drew on that of a young ethnographer, Bernard Deacon, who had collected and transcribed more than 100 sand drawings from Malekula and Ambrym Islands in Vanuatu in 1926 and 1927. Ascher studied those figures and realized that these images could be described mathematically.

Each sand drawing could be thought of as a “graph” in the sense that it included vertices, or dots, connected by edges, or lines. (This definition of graph is a special one in mathematics. In graph theory, graphs are simple figures made up of vertices and edges to map out the connections of many nodes in a network—such as cities linked by roads, computers linked by the Internet or even people linked by social ties.)

Ascher observed that in the sand drawings, the line traced in the sand was comparable to a graph whose vertices included all the crossings created in the pattern. The edges were all the arcs between those vertices. These graphs were also Eulerian, meaning that the sand artist had to visit each edge only once and had to return to a starting point. Ascher also documented the number of edges per vertex, which mathematicians call the “degree” of the vertex. This was important because, according to Euler’s theorem, created by mathematician Carl Hierholzer, a connected graph is Eulerian only if each vertex has an even degree.

The fact that Ascher never had the opportunity to go to Vanuatu to see the designers at work undoubtedly limited her research. My own research, therefore, could go further. One particular observation of Ascher’s propelled my study of how these images are created. By examining Deacon’s drawings, she had observed that some of these graphs could be broken down into three or four substeps that, when linked together, formed the final drawing. Put another way, each step produced a subdrawing that returned to the starting point. When these subdrawings were superimposed, the final drawing was revealed. I called this process of identifying subdrawings “decomposition.”

These subdrawings raised several questions for my work: Is this type of decomposition possible for every drawing? How did these layers fit together, and did the order matter? Above all, what did these layers represent for the sand artists?

Picture

Member for

1 month 1 week
Real name
이태선
Position
연구원
Bio
[email protected]
세상은 이야기로 만들어져 있습니다. 다만 우리 눈에 그 이야기가 보이지 않을 뿐입니다. 숨겨진 이야기를 찾아내서 함께 공유하겠습니다.