Skip to main content
Keith Lee
Head of GIAI Korea
Professor of AI/Data Science @ SIAI

Ⅰ. 부동산 버블을 탐지할 수 있다면?

최근 부동산 시장은 버블(Bubble)이 꺼지면서 침체기에 접어들었다. 정부는 시장을 살리고자 부리나케 대책을 마련하고 있으나, 마음대로 되지 않아 보인다. 그런데 만약 부동산 버블을 미리 탐지할 수 있다면, 시장이 침체기로 접어드는 일을 막을 수 있지 않을까?
부동산 버블의 여파
부동산 버블의 충격은 어마어마했다. 전국 및 수도권 아파트 가격은 한국부동산원이 시세 조사를 시작한 이래 가장 큰 낙폭을 기록했고, 서울 주택 종합 매매가격은 서브프라임 모기지 사태 이후로 가장 크게 떨어졌다.
최근 부동산 시장이 심상치 않다. 전 세계적으로 긴축 기조가 시작됨에 따라, 전문가들 사이에서는 코로나19 이후 통화 완화 정책으로 엄청난 유동성 수혜를 봤던 국내 부동산 시장의 '거품'이 꺼지면서 실물시장 충격에 대비해야 하는 것 아니냐는 우려가 나온다. 작년 말부터 미국을 포함한 주요국 중앙은행을 중심으로 인플레이션을 대비하기 위해 기준금리 인상이 지속되고 있는 가운데, 이에 따라 주택가격이 하락하면서 가계의 순자산 감소 및 부동산 개발업자들의 손실 확대로 이어져 종국적으로는 경기 침체로 확산할 우려가 있다는 것이다.
대학원 수업들을 절반 이상 이수하며 졸업을 얼마 안 남긴 시점에서, 데이터 사이언스와 인공지능을 배우기 위해 이 대학원에 온 만큼, 기존 통계학 분석 방법이 아닌 머신러닝과 딥러닝이 잘 사용되는 분야로 논문을 작성하고 싶었다. 그렇게 해야 대학원 교육과정을 마치는 의미가 더욱 클 것 같았기 때문이다.

데이터를 찾기 쉽고, 딥 러닝을 활용할 수 있는 분야

필자를 포함한 많은 사람들이 데이터를 확보하기 힘들다는 이유로 논문 작성에 많은 애로사항을 겪었다. 그래서 데이터를 쉽게 확보할 수 있으면서도 기존의 방법론으로 유의미한 정보를 뽑아낼 수 없었던 분야를 선정해야만 했다. 대학원에서 우리는 특정 주제에 국한된 연구를 한 것이 아니라, 수학적・통계학적 이해를 바탕으로 데이터 분석의 방법론을 폭넓게 배웠기 때문에 모든 선택지를 열어두고 주제를 탐색할 수 있었다.

Ⅰ. 측정오차 문제를 겪고 있는 광고 시장

디지털 광고는 매년 폭발적으로 성장하고 있습니다. 특히 글로벌 팬데믹으로 오프라인 시장이 크게 위축되던 시기에 소비의 중심축이 온라인으로 옮겨가면서 디지털 광고는 전 세계 광고 시장의 주류로 자리 잡게 되었습니다. 디지털 광고의 핵심은 단연 스마트폰입니다. 스마트폰으로 언제 어디서나 웹에 접속할 수 있게 되면서 웹 기반 매체들이 광고 시장에 등장하게 됐습니다. 사용자 편의성을 기반으로 양질의 서비스를 제공받고, 이에 따라 디지털 광고 시장 또한 새로운 성장 국면을 맞게 된 거죠. 그러나 현재 디지털 광고 업계에서는 ‘측정오차(Measurement Error)’라는 문제로 시름이 끊이지 않습니다. 즉 측정오차로 광고 성과 측정 및 예측에 큰 차질을 겪고 있습니다.
대내외 경제 불확실성으로 올겨울 에너지 관련 원자재 가격 급등은 '예견'된 가운데, 전문가들은 지금부터라도 겨울철 에너지 사용량을 정확하게 예측하는 한편, 에너지 절약을 위한 대응 방안을 마련해야 한다고 당부했다. 그러나 정작 업계에서는 기존 에너지 사용량 추정에 사용됐던 방법론에 대해 의문을 제기하는 분위기다. 해당 연구들의 방법론이 현실을 제대로 대변하지 못한다는 이유에서다. 그렇다면 어떻게 정확하게 에너지 사용량을 예측할 수 있을까? 또한 정확하게 예측된 에너지 사용량은 이외에도 어떤 파급효과를 불러올 수 있을까? 이번 글을 통해 '결합확률분포' 모델을 기반으로 보다 현실적으로 에너지 사용량을 예측할 수 있는 통계적 방법론을 대중들에게 쉽게 풀어보고자 한다.
작년 발간된 SIAI YearBook 2023은 "기업 경영에서의 AI 알고리즘 활용"을 주제로 다뤘다. 올해는 기계 산업 내 AI 산업에 대한 관심이 커짐에 따라 시스템 효율성을 중점으로 2024 YearBook을 준비했다. 먼저 곽연숙 연구원은 헬스케어 산업에서 생체 행동 데이터를 적용한 연구를 주제로 삼았다. 웨어러블 기기의 사용이 증가하면서, 특히 수면 추적에 대한 관심이 높아지고 있다. 그러나 아직까지도 사람이 잠에 드는 시점과 깨어나는 시점을 정확하게 감지하는 데에는 여전히 한계가 존재한다. 이를 해결하기 위해, 곽 연구원은 최근 연구에서 수면 상태와 깨어 있는 상태의 데이터 분포 함수 차이를 활용해 정확도를 개선하는 방법을 제안했다. 기존의 1차원적인 평균만을 사용하는 AI 알고리즘과는 달리, 이 분포 함수는 평균과 분산 같은 다차원 데이터를 활용하여 잠드는 순간과 깨어나는 변화를 더욱 정교하게 식별할 수 있다. 이러한 접근 방식은 수면 추적뿐만 아니라 웨어러블 기기에서 수집되는 다양한 데이터를 분석하는 데에도 효과적으로 적용될 수 있을 것으로 기대된다.
처음으로 SIAI 학생들의 논문을 외부에 발표하는 자리를 가졌다. 2023년 논문을 요약하면 AI알고리즘의 기업 경영 활용이다. 챗GPT가 등장하면서 기업에서 AI알고리즘을 어떻게 사용할지 관심이 많아졌는데, 이에 학생들이 각자 연구 주제로 답을 내놓았다. Yearbook에서는 논문 해설 겸 학생들이 논문 쓰면서 겪었던 이야기를 소개할 것이다. 송정훈 연구원은 "개별 건축물 내 연간 월별 에너지 사용량의 결합확률분포 모델"을 주제로 잡았다. 개별 건물의 월별 에너지 사용량은 도심지의 에너지 소비량 추정에 중요한 정보다. 기존의 회귀분석 기반 연구에서는 월별 에너지사용량의 평균과 분산을 추정하는 모델들이 제시됐다. 하지만 서로 다른 월의 에너지 사용량 간 상관관계는 반영되지 않아 해당 종속변수의 추정에 어려움을 겪었다. 따라서 본 연구에서는 월별 에너지 사용량 간의 상관관계를 반영하여 건물별, 전기/가스별, 월별 사용량을 좀 더 현실적으로 예측했다.
들어가며 연세대학교 경제학과 출신으로 1998년 경원대 교수를 지낸, 문재인 정권에서 중소벤처기업부 장관을 지낸 홍종학 교수님이 IMF 구제금융기를 막 벗어나려던 2001년에 '한국은 망한다'라는 저서를 내셨습니다. 저는 이 책을 대입 논술을 잘 쓰기 위한 목적에서 2001년 말에 읽었는데, 한국 사회가 갖고 있는 각종 문제에 대해 고교생 수준의 매우 조잡한 지식만 갖고 있던 제게 쉽게 와 닿지 않는 충격적인 저서였습니다. 이 책의 내용이 좀 더 제게 강하게 와 닿은 것은 실제 한국 사회의 온갖 조잡함을 온 몸으로 겪고 있던 2020년 무렵이었습니다.
이 책은 SIAI를 졸업한 한국 학생들이 남긴 '논문 후기'를 엮었습니다. 처음 기획 의도는 학생들이 수업에서 들은 내용을 논문에 적용하기 위해 이런저런 고민을 했던 '날 것(Raw)'을 글로 옮기자는 관점이었는데, 정작 다들 눈치를 보더니 논문을 설명하는 글들만 써 버렸습니다. 수필이 나와야 되는데 논문 해석이 되었으니 '망한 글'이 됐는데, 기획 의도와는 매우 거리가 멀어져버렸습니다만, 논문을 읽기 어려운 분들께 논문을 풀어 써 놓은 글이라는 관점에서 가치는 있어 보입니다.
서비스의 개발 논리를 이해하고 구현하는 것보다 무슨 '기술'인지 정보를 알아서 베끼는데 초점 맞춘 기업인들 많아대부분 연구직 출신들이 아니라 IT 개발자들이 머신러닝 코드 몇 줄을 배운 다음 '머신러닝 개발자'가 되었기 때문개발 직군들로 고급 AI상품 만들기 어려워, 한국 인력 상황 감안할 때 AI산업에 계속 투자하는 것은 밑빠진 독에 물 붓기 될 것
한국IT업계에서 개발자로 불리는 기술직군 관계자들을 기업 미팅에서 만날 때마다 자주 듣는 질문 중 하나로 "무슨 기술로 만들었나요?"가 있다. 특정한 사건을 관찰하고, 수식 기반으로 적절한 모델을 만들어서 그 사건 속에 담긴 문제를 해결하는 방식의 훈련을 받았던 입장에서 '무슨 기술'이라는 표현이 처음에는 잘 이해가 안 됐다. 그래서 '무슨 기술'이라는게 무슨 뜻이냐고 물으니 짜증난다는 말투로 "무슨 라이브러리로 만들었냐구요"라며 문제 해결 방식 뒤에는 개발자들에게 제공되는 코드 묶음집이 있을 것이라는 확신을 갖고 있다는 것을 보여줬다.
AI의 능력을 제대로 인지하게 되면서 AI에 대한 인식이 비관적으로 바뀌고 있어AI가 바둑처럼 저소음 데이터에서는 높은 예측력 보이지만, 주식 시장같이 고소음 데이터에서는 예측 어려워


Many amateur data scientists have little respect to math/stat behind all computational modelsMath/stat contains the modelers' logic and intuition to real world data


Top brains in AI/Data Science are driven to challenging jobs like modelingSeldom a 2nd-tier company, with countless malpractices, can meet the expectations


지루한 반복 업무 대신하는 챗GPT하지만 지적이고 도전적인 업무에는 벽 느껴챗GPT, 수학적 한계 극복하지 못하면 ‘헛소리 생성기’에 불과해
지난 1년 동안 대형언어모델(LLM)을 둘러싼 과대 광고가 끊임없이 이어졌다. 처음 대형언어모델이 등장했을 때, 사람들은 자신의 일자리가 로봇으로 대체될까봐 두려워했다. 그러나 1년이 넘는 기간 동안 챗GPT를 시험한 지금, 그 걱정은 많이 사그라들었다. 미국의 유명한 언어학자인 노엄 촘스키 교수는 “챗GPT가 헛소리를 내뱉는 고급 챗봇에 지나지 않는다”라며 챗GPT의 본질을 짚었다.
서울대 A교수, 김박사넷에 올라온 평가에 명예훼손 소송했지만 패소법원, 개인정보의 공익성 판단할 때 김박사넷 위법 행위 아냐교수 사회, 제대로 연구하면 김박사넷 D급 평가 받는다 불만 제기연구 역량보다 학생들 취직 지원하는데 더 집중해야하는 대학원 세태에 대한 지적도같은 사건 계속되면 국내 귀국 고민하는 교수들 늘어날 것이라는 불만도 나와
지난달 17일, 대법원은 서울대 A 교수가 '김박사넷' 운영업체 팔루썸니를 상대로 낸 명예훼손 및 인격권 침해 손해배상 소송에서 원고 패소 판결을 내렸다. 1달 동안 서울대 A교수가 다른 법적 조치를 취하지 않으면서 이달 17일 대법원 판결이 최종 확정됐다.
COM502 LectureNote4 1
COM502 LectureNote4 2