입력
수정
인간의 삶은 ‘불확실성의 연속’ 불확실성 극복 위한 ‘주관적 가정의 체계’가 ‘실생활에서의 확률’ 합리적 가정이라면 인류에 “획기적 도움 줄 수도”
더 이코노미(The Economy) 및 산하 전문지들의 [Deep] 섹션은 해외 유수의 금융/기술/정책 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 본사인 글로벌AI협회(GIAI)에서 번역본에 대해 콘텐츠 제휴가 진행 중입니다.
삶은 불확실성으로 가득하고 미래를 예측하는 사람은 없다. 목전에서 경험한 것이 아니면 우리는 과거에 일어난 일이나 앞으로 일어날 일에 대해 별로 아는 것이 없다. 불확실성을 ‘무지에 대한 의식적 인지’(conscious awareness of ignorance)라고 하지 않던가? 불확실성은 내일 날씨, 다음 ‘프리미어 리그’ 우승 팀, 2100년의 날씨, 고대 조상들의 정체를 포함해 우리 삶의 전체에 놓여 있으며, 이를 극복하고자 고안한 수단이 바로 확률이다. 그런데 확률이 무엇인지 실제로 이해하는 사람이 드문 점을 감안할 때 오늘날 통계를 포함한 대부분의 과학이 확률에 의지하고 있다는 사실은 놀라운 성과가 아닐 수 없다.
불확실성에 대한 숫자, 가끔 ‘낭패’로 연결
매일의 삶에서 우리는 불확실성을 ‘그럴 수도’(could), ‘아마’(might), ‘그럴 것’(is likely to) 등의 언어로 표현하는데, 가끔 이 불확실성이 엄청난 결과를 초래하기도 한다. 1961년 임기를 갓 시작한 존 F. 케네디(John F. Kennedy) 미국 대통령은 중앙정보국(Central Intelligence Agency, CIA)이 지원하는 쿠바 침공 계획을 듣고 군 고위 장성들에게 계획에 대한 평가를 의뢰한다. 의견은 30%의 성공 가능성과 70%의 실패 가능성이었는데, 보고서를 읽은 대통령은 ‘괜찮은 기회’(a fair chance)라고 판단해 피그스만 침공(Bay of Pigs invasion)을 실행한다. 결과는 대실패였다.
지금은 불확실성을 대략의 숫자로 표현하는 공식이 성립해 있다. 예를 들면 영국 정보 분야에서 일하는 사람이 ‘아마도’(likely)라고 한다면 이는 55~75%의 가능성을 의미한다.
가능성과 불확실성을 숫자로 표현하려는 시도는 인류를 ‘수학적 확률론의 세계’(mathematical realm of probability)로 이끌어 이제는 이 개념을 사용하지 않는 분야가 드물 정도다. 손에 잡히는 대로 과학 저널 하나만 펼쳐도 ‘통계적 유의성’(p-value), 신뢰구간(confidence intervals), ‘베이지안 사후 분포’(Bayesian posterior distributions, 알려지지 않은 다양한 매개 변수들의 가능성을 설명) 같은 용어들이 쉽게 보이는데 이들 모두 확률에 근거한 개념들이다.
모든 수치적 확률, ‘주관적 판단과 가정’의 결과물
하지만 과학 논문에 나오든, 일기예보나 운동 경기 승패 예측에 사용되든, 건강 위험을 표현하든 간에 모든 수치적 확률은 세계의 객관적 속성이 아니라 개인적, 집단적 판단과 가정 위에 쌓아 올려진 결과물이다. 게다가 대부분의 경우 실제 숫자를 계산해 보려는 시도도 하지 않기 때문에 확률이라는 것이 존재한다고 말할 근거는 별로 없다.
확률은 수학 분야에서도 비교적 늦게 채용된 개념이다. 인류가 수천 년 동안 동물 발가락뼈와 주사위로 도박을 해 왔음에도 1650년대 블레즈 파스칼(Blaise Pascal)과 피에르 드 페르마(Pierre de Fermat)가 서신을 주고받기 전까지는 ‘확률적 사건’에 대해 그 어떤 철저한 분석도 행해지지 않았다. 하지만 이후 봇물이 터지듯 확률은 도박은 물론 재무, 천문학, 법률 등의 다양한 분야로 흘러넘치게 된다.
확률의 애매한 성격을 이해하기 위해 일기예보를 떠올려 보자. 기상학자들은 기온, 풍속, 강수량과 강수 확률 등을 예보하는데 특정 시점과 장소에 강수 확률이 70%라고 치자. 여기서 앞의 세 가지 기후 지표는 실제 검증 대상이 있다. 밖에 나가서 직접 측정해 보면 맞는지 확인할 수 있는 것이다. 하지만 강수 확률은 비교해 볼 수 있는 ‘진짜’가 존재하지 않는다. 확률 계측기도 없고 그냥 비가 오거나 안 오거나 둘 중 하나다.
확률의 두 가지 측면, ‘가능성’과 ‘무지’
게다가 철학자 이안 해킹(Ian Hacking)이 지적하듯 확률은 ‘두 얼굴’을 가졌다. ‘가능성’과 ‘무지’ 두 가지를 다루는 것이다. 내가 동전을 던지면서 당신에게 앞면이 나올 확률을 묻는다고 해 보자. 당신은 자신 있게 ‘50%’나 ‘절반’과 같은 용어를 사용해 대답할 것이다. 하지만 이번에는 내가 동전을 던진 후 뭐가 나왔는지 살짝 본 후에 당신에게 묻는다. “당신이 생각하는 앞면 확률은 얼마나 될까요?”
‘그냥 확률’이 아니라 ‘당신이 생각하는 확률’이다. 대부분의 사람은 주저하다 마지못해 50%라고 대답한다. 동전 던지는 행위의 완료와 함께 무작위성은 사라졌고 이제 당신의 무지만이 남은 것이다. 알 수 없는 미래에 대한 ‘우연적 불확실성’‘(aleatory uncertainty)이 무지와 관련한 ‘인식론적 불확실성’(epistemic’ uncertainty)으로 바뀌는 순간이다. 수치적 확률은 이 두 가지 상황을 모두 다룬다.
생각해 볼 사항은 하나 더 있다. 어느 면이 나올지에 대한 확률적 모델이 존재한다고 하지만 언제나 주관적인 가정이 개입하는 것이다. 동전 던지기의 경우라면 앞뒷면이 나올 확률이 동일하다는 가정이다. 만약 앞면이 두 개인 동전이라면 어떨까? 50%라는 당신의 의견은 ‘나를 신뢰한다’는 가정이 개입된 성급한 결정이 된다.
내가 하려는 주장의 핵심은 확률을 실제로 활용하려면 어떻게든 주관적 판단이 개입할 수밖에 없다는 것이다. 그렇다고 아무 숫자나 생각나는 대로 주워섬긴다는 뜻은 아니다. 내가 지붕 위에서 훨훨 날아갈 확률이 99%라고 주장한다면 얼마나 황당해 보이겠는가? 당연히 확률을 생각할 때는 객관적 세계와 현실을 뒷받침하는 가정을 고려하지만 그럼에도 확률 자체가 객관적인 것은 아니라는 것이다.
확률을 판단하기 위해 사람들이 사용하는 어떤 가정은 다른 것보다 강한 합리화를 동반한다. 예를 들어 동전을 던지기 전에 그 동전을 꼼꼼히 살펴봤다면 수상쩍은 사람이 성의 없이 던져 올린 동전보다 50% 확률을 정당화하기 쉽다는 것이다. 그리고 이러한 특성은 확률을 사용하는 모든 분야에 적용되는데, 특성상 객관성을 근간으로 할 것 같은 과학 연구도 예외가 아니다.
영국 코로나 치료법 테스트, 확률 분석 통해 ‘수십만 목숨 구해’
과학적이고 공공적인 특징을 지닌 예를 하나 들겠다. 코로나19 팬데믹 발생 후 영국에서 시작한 ‘무작위 대조 실험’(RECOVERY Trial)은 해당 증세로 입원 중인 환자들을 대상으로 치료법을 테스트했다. 한 실험은 6천 명이 넘는 환자들을, 입원한 병원이 제공하는 표준 치료만 받는 집단과 여기에 더해 특정 항생제를 처방받는 집단으로 무작위 구분했다. 그 결과 인공호흡기를 단 환자들을 대상으로 연령 차이로 인한 변수를 제거했을 때, 항생제를 처방받은 환자들의 사망률이 표준 치료만 받은 환자들보다 29%나 낮았다. 95% 신뢰구간은 19~49%에 이르렀다. 실험 집단과 통제 집단 간 항생제를 제외한 다른 리스크의 차이가 없다는 가정(null hypothesis, 영 가설)에 따라 해당 사망률 차이가 실제로 발생할 가능성을 보여주는 ‘통계적 유의성’(P value, 다른 변수가 없다고 가정할 때 동일한 결과를 다시 얻을 확률)은 0.01%(값이 낮을수록 통계적 유의성이 높음)로 산정됐다.
모두 표준적 분석을 통해 계산한 것이지만 정확한 신뢰구간과 유의성을 얻기 위해서는 영 가설보다 더 많은 가정이 필요하다. 예를 들면 개별 환자들의 결과가 독립적이어야 한다. 시공간적으로 서로 영향을 끼쳐 더 비슷한 결과가 나오게 하는 원인이 없어야 한다는 뜻이다. 하지만 치료를 받는 병원이든 치료법이든 독립성을 방해하는 요소는 많았다. 보다 근본적으로, 정확한 실험 결과를 얻으려면 실험 기간 두 집단에 속하는 환자들이 애초에 모두 동일한 생존 가능성을 갖고 있어야 하는데 이는 불가능한 설정이다.
가정들이 틀렸다고 실험이 잘못됐다는 뜻은 아니다. 해당 실험은 결과가 너무 강력해 환자들 간 리스크 차이를 사실상 인정한 가정도 전체적인 결론에 영향을 미치지 못했다. 하지만 실험 결과가 미미하다면 가정 변화에 따른 결과 민감도를 폭넓게 따져보는 것이 타당하다.
‘모든 실험은 결함이 있지만, 일부는 유용하다’는 경구가 떠오르는 사례다. 항생제 실험이 특히 유용했던 것은 강력한 결론으로 인해 바뀐 치료법이 수십만 명의 환자를 살릴 수 있었다는 사실 때문이다. 그럼에도 해당 결론이 기반한 확률이 ‘참’은 아니다. 합리적이라고 인정한다 해도 그것이 주관적 가정과 판단의 산물이라는 사실은 변하지 않는다.
원문의 저자는 데이비드 스피겔할터(David Spiegelhalter) 케임브리지 대학교(University of Cambridge) 명예 교수입니다. 영어 원문은 Probability Probably Doesn’t Exist | Scientific American에 게재돼 있습니다.