Skip to main content

MSDS Boot Camp 수강 후기 (2)

MSDS Boot Camp 수강 후기 (2)
Picture

Member for

6 months
Real name
Keith Lee
Bio
Head of GIAI Korea
Professor of AI/Data Science @ SIAI

MSDS Boot Camp 시험을 치르고 나니 몇 개 후기를 더 받았는데,

프로그램 결정하는데 or 업무하는데 도움 될 것 같아보이는 구절들만 몇 개 골라봤습니다.


(중략)

제가 이번 강의를 들었던 가장 큰 이유는 MSDS 과정을 밟기 위해서가 아니라, (*주: MSDA 지원하겠다고 미리 말씀하신 분)
데이터 사이언스라는 분야에 발을 들이기 위해선
최소한 어떤 학문 또는 역량, 훈련이 필요한지 알기 위해서였습니다.

강의를 들었을 땐 조각이 맞춰지는 기분이었는데,
이상하게 시험을 치뤘을 땐 '아 그 때 다 맞춰진 게 아니라 그냥 기분이었구나. 아직 멀었구나'라고 생각했습니다. 웃프네요.

12년 동안 수학은 암기과목이다 생각하고 살아온 탓에,
수학, 통계학을 직관적으로 바라볼 수 있는 훈련(혹은 교육)을 받고 싶었습니다.
직관적인 시각, 훈련을 기르기에 2달이라는 기간은 제게 조금 짧았던 것 같아요.
(중략)


(중략)

대표님 강의는 항상 느끼는 것이 많지만, 금번 강의 및 시험은 특히나 와 닿는 것이 더 많았습니다.

(중략)

문제와는 별개로, 시험을 준비하면서 잊고 있었던 수리통계 지식들을 복구하는 과정은 힘들었지만 재밌었습니다.

예전에는 단순히 개념/증명을 외우고 문제를 푸는데 집중했다면,

현업에 있고 & 대표님 강의를 듣고 난 지금은 이 성질 / 정리들이 왜 중요하고, 어디에 어떻게 쓰일 수 있을 지를 고민하다보니 더 좋았던 것 같습니다.

(중략)

말씀주셨던 대로, 더욱 열심히 공부하라는 뜻으로 받아들이고 그만 좌절하고 더욱 정진하겠습니다.

어차피 통계 / 데이터 사이언스 공부는 끝이 없기 때문에 갈 길도 멀고,

당장의 조급함에 치우쳐 전체를 그르치는 것 보다 한 계단 한 계단 내공을 쌓아올리는 데 집중하겠습니다.

(중략)


표면적 사고에 적응해서 깊이있는 논리적 사고가 부족한 제 분수를 알게된 시험 덕분에 마음이 많이 아프지만..

어떻게 공부하고 생각해야 하는가에 대한 방향을 이제 좀 알 것 같습니다.

부끄럽지만 앞으로 더 열심히 하겠습니다 ㅜ.ㅜ


 

먼저, 두 달 동안 좋은 강의를 해주셔서 감사합니다.

Prep class를 들으면서 시험을 쳐야하나 말아야하나 고민이 많았지만,
스스로가 얼마나 심각한지 느끼고 각성해야겠다는 마음으로 시험장에 들어갔네요.

저는 산업공학으로 학사, 석사를 마쳤는데 Prep class 8번의 통계학 수업은 전부 다 처음 다뤄본 내용이었습니다..
(Wald, LR 등 parameter의 variance에 대한 test나 heteroskedasticity, endogeneity가 존재할 경우...)
동적최적화 부분 역시도 마찬가지지만요..

첫 수업을 듣자마자 흔히 말하는 멘붕이 왔지만 작년 들었던 DS 수업을 떠올리며 버텼습니다.
DS 수업도 어찌저찌 흐름만 따라가고 실제는 반도 이해못했었지만, 다 듣고 나니 깨닫는게 많았던 수업이었고
당시 데이터 업무를 어떻게 해나가야 되는지 모르는 저에게 방향성과 지식의 깊이가 어느정도 돼야 하는지 가늠자가 됐었습니다.
(그 전에도 여러 강의를 찾아봤지만 다 코드 기반의 수업들만 있어서 회피하다가 진짜 없어서 그나마 하나 선택해서 들었었는데 크게 도움은 안됐었습니다. 그렇게 떠돌다가 결국 파비클래스를 알게 되긴 했지만요ㅎㅎ)

이번 Prep class를 들으면서 선형대수, 통계도 다시 공부하게 됐고 그 후에 다시 수업내용을 따라가느라 많이 버거웠던 것 같습니다.
그래도 추천해주신 김창진 교수님의 계량경제학 노트 덕분에 많은 도움이 됐었습니다. 확실히 이 노트를 보고 수업 내용을 복기하면서
'대표님께서 이 정도는 알고 있다는 가정 하에 수업을 진행하시는구나'를 많이 느꼈습니다. 부끄럽습니다..

그리고 전공에서 왜 이러한 관점에서는 안 다룬건지 너무 화가 나서 일부 과목들의 교재를 살펴보고 생각을 해봤는데,
그냥 품질, 실험계획 과목이나 제조 데이터 특성상 데이터 분석 영역의 대부분이 one variable로 확률분포 분석을 하거나
반복 측정으로 measurement error를 줄일 수 있거나 regression을 해도 보통 A3F와 A5N인 상황이 많기 때문이라는 것을 깨달았습니다.

산업공학이라는 학문이 흔히들 넓고 얕게 많은 걸 배운다라고 하는데 그러다보니
정말 딱 그 프레임 안에서 필요한 것만 가르칠 수 밖에 없었던 건가 싶지만
Prep class로 다양한 주제를 배우고 나니 뭔가 아쉬움이 남았습니다.
특히나 이제는 기존 분석 외에도 다양한 데이터를 다룰 기회들이 많아지고 요구할텐데
이러한 직무로 오는 전공자들이 경쟁력이 있을까 싶네요.
물론 산업에 따른 도메인 지식도 중요하지만 부족한 수학적 논리로 인해 필드 데이터와 분석결과 간 괴리감이 클 것 같습니다.

(중략)

이러한 환경에서 제가 잘못된 지식이 쌓여가면 어떻게 하나 염려가 되면서도 저의 부족함을 한탄했습니다.

그래서 파비 대학원이 생긴다고 했을 때 많은 생각을 했던 것 같습니다.
(제가 다른 기업으로 이직한다한들 이 직무에 대해 제대로 알려 줄 선배나 시니어를 만날 확률이 극히 낮을 것이고
그런 운에 기댈 바에는 파비 대학원 가서 제대로 공부하는게 빠르지 않을까.. 이런 생각들..)
Prep class 모집 초기 당시에는 사실 대학원 과정이 이렇게 세분화될 줄은 몰랐지만 DS 수강 경험상 어려울 걸 알았기에
더욱 더 수준을 알아야 저에게 맞는 과정 선택을 할 수 있다고 생각하여 등록을 했는데 역시나 저에겐 어려웠네요..

아마 채점을 하면서 한숨을 많이 쉬셨을 생각을 하니 죄송해집니다.
저 또한 미리 포기하고 메일을 드려야하나, 망하더라도 시험을 봐야 하나 등등 머리 터질 듯 고민했습니다. (그 와중에 동적 최적화는 너무 어렵고..ㅠ)
그래도 어떤 과정이든 대학원을 가고 싶기 때문에 부딪혀보는게 맞다고 생각해서 시험을 지원했습니다.
(시험장에서의 많은 빈자리와 오전에 블로그 Boot camp 후기를 읽으면서 저와 같이 생각하는 분들도 있구나라는 생각이 드네요.)


 

이런 유형의 시험이 익숙하지 않아서 좀 얼어 있던거 같습니다..

동적최적화 부분은 아직 이해못한 내용도 있지만 다른 문제들은 저 또한 아쉬움이 큰 것 같습니다..

(준비가 그만큼 미흡했다는 것이겠지만요..)


 

+ 간단 의견

전반적으로 보면, 내용이 어려운 부분도 있었겠지만, 시험 준비 방식이 시험 점수를 결정했지 않나 싶다.

 

나 역시 처음 이런 지식을 이런 방식으로 배울 때 그림을 하나로 그려내면서 문제 풀이를 하지 못했던 탓에 고생이 많았었다.

계속 문제들을 풀면서 어느 시점엔가 이게 문제를 만들려고 문제를 만든게 아니라,

굉장히 좋은 논문이 구성된 방식을 정리하고, 그 정리한 내용을 문제로 바꾼거라는걸 깨닫는 순간이 있었는데,

딱 그 때부터 시험 점수의 레벨이 완전히 달라졌던 것 같다.

 

이런 전환이 단기간에 쉽게 일어나려면 이미 수학적으로 준비가 굉장히 많이 된 상태거나,

아니면 원래부터 논리를 쌓는 훈련도가 높고, 최소한의 수학 지식을 갖췄어야 할 것이다.

 

그 둘을 우리나라 대학들이 제대로 못 시켜준다는걸 느낄 수 있는 후기이기도 했고,

강의 끝나고 조교 수업을 붙여서 문제들을 풀어주는 훈련이 반드시 필요하겠다는 확신을 갖게되는 후기이기도 한 것 같다.

 

MSDA (-> 변경 MSc in Data Science) 첫 학기에 배울 Mathematical Statistics 1 (-> 변경 Regression Analysis) 수업은 아예 교수님 두 분에게 본인들 방식으로 하나씩 만들어달라고 부탁을 했다.

한 수업을 듣고 잘 이해가 안 되면 같은 내용을 다룬 다른 교수님 수업을 들으면서 좀 더 보완을 해 보는거다.

이렇게까지해도 MSDA의 첫번째 관문을 넘을 수 없으면 Science DNA가 부족하다는 걸 스스로 인정하고

MBA in AI BigData에서 공부를 조금이라도 더 즐겁게 하면 좋겠다.

 

논문을 정리해서 문제를 만들었다는 걸 깨닫고 갑자기 문제를 푸는 길, 논문을 쓰는 길이 눈에 확~ 들어오던 그 무렵,

너무 기분이 좋아서 구글링으로 여러 학교 문제들을 뒤져서 한동안은 못 푸는 문제가 없다고 자뻑감에 좀 사로잡혔었는데,

우리 학생들도 어느 레벨에서 공부하건 그런 즐거움을 만끽하는 순간을 경험하면 좋겠다.

 

前 MSDS, 현 MSc Artificial Intelligence 입시시험 후기 시리즈

Picture

Member for

6 months
Real name
Keith Lee
Bio
Head of GIAI Korea
Professor of AI/Data Science @ SIAI

MSDS Boot Camp 수강 후기 (3)

MSDS Boot Camp 수강 후기 (3)
Picture

Member for

6 months
Real name
Keith Lee
Bio
Head of GIAI Korea
Professor of AI/Data Science @ SIAI

MSDS 입학시험 문제가 공개되고 난 다음에 또 말들이 돌던데, 무슨 박사 시험 문제를 냈다는 둥 어쨌다는 둥ㅋㅋ

학부 4학년 경제학과 고급계량 정도, 통계학과 학부 고학년 시계열 정도에 나올만한 내용들에 불과하다.

나중에 대학원 박사 수업 문제들 공개하면 무슨 말이 나올려나? ㅋㅋ

문제가 AI랑 아무 관계 없다는 둥 그러던데, 일부러 Deep Neural Net, Reinforcement Learning이 쓰일 수 있는 DGP가 얼마나 제한적인지를 확인하는 항목을 추가했다.

암튼, 이번에는 어문계열 출신인데 정말 이 악물고 열심히 공부해서 이 모든 걸 이해하고 시험 잘 치신 분의 후기를 공유한다.


학부는 XX과 (*주-어문계열)를 나왔고요, 석사는 대표님께서 익히 알고 계시는 빅데이터 석사를 나왔습니다.

(중략)

이러나 저러나 대학원 시절에 대표님을 만났더라면 대학원 수준의 통계수업도 도전해보고 했을텐데 너무 아쉽다는 생각을 하게 되네요.

하지만 지금이라도 만나뵙게 된 것을 너무나도 감사하게 생각하고 있습니다.

(중략)

 

어쨌든 이렇게 부족한 문과 출신이 감히... 어떻게... MSDS에 가겠다고 이 수업을? 이라고 충분히 생각하실 수 있을 것 같아요.

그게 참 무섭고 두려워서 지금까지 딱히 저의 배경에 대해 정확하게 말씀을 못드리고 있다가

이제서야 admission을 앞두고 어차피 알게 되실테니 조심스럽게 메일 드립니다.

 

당연히 제가 MSDS에 직행할 수 있을거라는 오만하고 가벼운 생각으로 수강을 한 것이 아니었어요.

다른 분께서 쓰신 후기를 봤는데 저랑 비슷한 마음이셨더라고요.

신청을 하면서 제 마음은 딱 뱁새의 마음이었습니다. 황새를 너무나도 따라가고 싶은 뱁새의 마음이요.

황새를 따라가다 가랑이가 찢어질 지 언정 출발점에 누워있는 뱁새보다는 나을 것이다 라는 생각으로 MSDS prep class를 신청했습니다.

 

첫 수업부터 되게 멘붕이었어요. 이런 스타일의 교육을 받아본 적도 없고 저 말고 대부분의 다른 황새 분들은 A1~A5 이런건 당연히 모두 알고계시며 heteroskedascity, heteroskedasticity, OLS, MLE, Asymptotic, CUAN, BLUE 등등 용어들은 쏟아져 나오는데 제가 아는건 하나도 없었기 때문에요. 대표님께서 따라 오냐고 물어보시는데 제가 따라가고 있는 것인지 아닌 것인지를 분간하기조차 힘들었습니다. 황새분들의 발목을 잡으며 민폐를 끼칠 순 없으니 뱁새로서 수업시간은 대부분 조용히 넘어갔고 복습으로 부족한 부분을 메우려고 노력했어요. 모르는 용어가 나오면 일단 적어두었다가 수업이 끝나면 김창진 교수님 노트라든가, 유튜브, 블로그 등등을 활용해서 개념에 대해 다시 익혔고 그런 후 문제를 보니까 서서히 익숙해지더라고요. 검색하다가 찾은 UCL의 Econometrics 강의노트도 뱁새인 제겐 많은 도움이 되었습니다.

Dynamic Optimisation 부분은 대표님께서 겁주신(?) 것에 비하면 훨씬 괜찮았습니다. 당연히 대표님께서 강의를 너무 잘 해주셨기 때문이겠죠. 수업시간에 수식을 바로바로 따라가기는 어려웠지만, 개념적으로 BE (*주 - Bellman Equation)는 어떤 것이다, Hamiltonian은 어떤 것이다, Phase diagram은 어떤 것이다 이런 것들은 수업을 들으면서 이해를 했고, 끝난 후에 다시 하나하나 derivation을 따라가보면서 Lecture note를 꼼꼼히 따라가니까 깊이있는 이해까지는 아니겠지만 내주신 문제를 풀 수 있을 정도는 가능했습니다. 막히는 부분은 또 유튜브 등을 통해서 메웠구요.

시험 준비를 위해서 2주 정도는 잠을 제대로 잔 날이 없었어요. 회사가서 몽롱하게 있을지언정 거의 밤을 새고... 공부를 했고 몬스터, 글루콤 같은 약물에 의존해 공부를 했습니다. 제가 뱁새라는 것을 알고 있었기에 대표님께서 아... 진짜 얘는 시험을 너무 못봐서 블랙리스트감이다 이렇게 생각하지 않으셨으면 좋겠다고 생각해서 열심히 했어요. 바보같이 수준 낮은 질문들을 office hour에 들고가야 했던 게 쪽팔렸지만 그래도 지금 쪽팔린 게 낫다 하는 마음으로... 질문을 드렸습니다. office hour에 거의 제 질문만 다뤄주실땐 아....... 황새분들께 폐를 끼친 것은 아닌가 하고 굉장히 죄송한 마음이었고요.

시험은 말씀해주신대로 어려웠습니다.

첫 문제부터 예상치 못한 OVB (*주 - Omitted Variable Bias)가 나와서 많이 당황했어요. Measurement Error를 다루는 문제들이 많았다보니 그 위주로 나올거라고 생각했었거든요. 참 바보같은 생각이었습니다. 그래도 배운 내용, 공부한 내용을 떠올리며 열심히 풀어보았습니다. 한 문제 푸는데 이미 1시간이 지났더라고요. 이러다 답안 작성을 다 못하겠다 싶어서 크게 흔들렸던 것 같아요. MA(5)까지는 상상도 못했는데 그런 내용이 나와서 너무 놀랐고 x_2t=y_(t-2)라는 조건도 상상도 못한 조건이라 많이 당황했던 것 같아요. 그러는 사이 2시간이 지났다고 하셔서 정말 마음이 너무 급해졌습니다. 4번은 너무나 감사하게도 평이하게 바꿔주신 관계로 보자마자 풀 수 있다는 확신이 있었는데, 3번을 고민하다가 답안을 다 못쓸까봐 4번부터 답안을 썼던 게 기억납니다. 여러모로 부랴부랴 쓰느라 되게 두서없이 엉망으로 써서 쓰면서도 죄송했습니다.

그렇게 시험이 끝나고 나오면서 40점은 나오려나? 하면서 자책을 많이 했어요. 주말엔 부족했던 잠을 몰아잤는데 시험점수 나오면 이제 대표님께 뭐라고 말씀을 드려야 하나 나 혼자 말도 안되는 점수를 받아서 대표님께서 대노하시면 어떡하지... 하고 걱정을 계속 했습니다. 오늘은 출근길에 블로그에 MBA와 MSDA 설명을 해두신걸 보고는 대표님께서 나는 역시 MBA를 가라고 하실까? 하면서 아침 내내 계속 고민했습니다. 어떤 과정으로 가든 개강 전 공부를 더 해가고 싶은데 수리통계학을 보고 갈까 하고 강의도 알아보던 중이었고요.

그런데 너무나 감사하게도 미국식 채점기준을 적용해주신 덕에, 성실성 점수를 반영해 주신 덕에 저에게 예상치 못한 합격목걸이가 쥐어진 걸 알게 되었어요. 솔직히 성적표를 보고는 너무 기뻐서 회사에서 소리지르면서 뛰어다닐 뻔 했습니다. 커트라인을 간신히 턱걸이로 넘은 수준이지만 저 따위가........ 뱁새가.... 감히.......? 합격을 해도 되는 것인지 어안이 벙벙합니다.

뱁새지만 그래도 폐를 최소한으로 끼치면서 턱걸이지만 완주를 해낸 거 아닐까 하는 뿌듯한 마음도 있지만 사실 내가 이래도 되나? 하는 두려움이 앞섭니다. 대표님께서 이건 그냥 기초라고. 그 다음에 훨씬 어려운 것들이 MSDS에서 우릴 기다리고 있다고 몇 번이고 말씀해 주셨으니까요.

그래서 지금 굉장히 혼란스럽습니다. 대표님도 메일 보고 많이 당혹스러우실 것 같아요. 이런 애는... 당연히 걸러져야 하는데 왜 여기에? 싶으실 것 같고요. 혹은 그럼에도 불구하고 제가 감히 이 시험을 턱걸이지만 통과는 한 것이니 자랑스러워해도 되는 것 일까요. 통과를 해서 기쁘기는 한데 잠이 안옵니다....... 통과한다는 것 자체를 감히 상상조차 한적이 없어서요.......... 부디 노여워 마시고 ㅠ_ㅠ 뱁새 주제에 용케도 여기까지 왔네... 라는 관점으로 봐주셨으면 합니다.............ㅠㅠ

지난 한달 반 동안 내용이 버겁긴 했지만 (제가 감히 이런 말씀을 드려도 될지 모르겠지만) 참 재밌었습니다. 몰랐던 새로운 언어들을 배워가면서 아! 이게 이거였구나! 하는 순간들이 많아서 세계가 확장되는 기분과 더불어 즐거움을 느낄 수밖에 없었던 것 같아요. 저 같은 뱁새조차도 그렇게 느낄 수 있도록 어디가서 배우기 힘든 이런 좋은 강의 해주셔서 너무너무 감사드립니다.

메일이 너무 길었죠?ㅠㅠ 찔리는게 많아서 구구절절 쓰게 되었습니다.......

빅데이터 석사를 했지만 항상 마음속에 의구심이 있었어요. 졸업 논문도 쓰레기 같은 걸 쓰고 졸업해서... 너무너무 부끄러운 마음이 항상 있었고요. 대표님께 배운 한달 반 덕에 이제 아주 조금은 어깨를 살짝 펴도 되지 않을까 하는 생각을 해봅니다. 어디가서 부끄럽지 않기 위해서, 이제 참새에서 비둘기가 되기 위해서 계속 열심히 공부할게요.


 

감동의 쓰나미가 몰려와서 한동안 말을 잃었습니다.

주변에 이런 케이스들이 드물게 있기는 했습니다.

경영학과 출신에 대기업 다니다가 그만두고 와서는 대학원 통계 수업 한번에 따라가고 그런 애들.

제가 평소에 말하는대로, DNA가 다른 애들이었습니다.

저보다 덜 고생해도 더 빨리, 더 많은 지식을 익힐 수 있는 축복받은 인재들이죠.

(중략)


진짜 농담이 아니고 메일 받고 울었다. 공부하느라 얼마나 고생했을지, 내가 딱 저 부분 공부하던 시절이 떠오르더라.

나도 그 때 생긴 중지 손가락의 펜 자국이 몇 년간 안 없어질만큼 펜을 놓질 않고 또 쓰고 또 쓰면서 겨우겨우 이해했었으니까.

Office Hour 질문이라고 장문의 이메일을 몇 차례 받으면서, 정말 이 악물고 열심히 공부하는 중이구나 싶었는데,

답안 채점하는 내내, 문제 상황을 제대로 이해하고 접근하는 훈련, 수업 내용을 활용하는 능력이 잘 갖춰진 답안지라고 생각했고,

Office Hour 까지 진행해가며 가르친 보람(?)이 느껴지는 답안지였다.

 

충분히 어깨를 펴고 자랑해도 된다... 가 아니라 열정과 학습 속도에 고개 숙이고 존경심을 표하고 싶다.

이런 인재 분들이 2류 교육을 받고, 자신의 가치와 역량을 영원히 모르고 사는 그런 인생 대신,

자신의 역량을 마음껏 발휘할 수 있는 토대를 닦는 1류 교육을 제공해서,

내가 공급하는 교육을 2류, 3류로 추락시킬 수 있도록 청출어람 하기를 바라 마지않는다.

 

前 MSDS, 현 MSc Artificial Intelligence 입시시험 후기 시리즈

Picture

Member for

6 months
Real name
Keith Lee
Bio
Head of GIAI Korea
Professor of AI/Data Science @ SIAI

MSDS Boot Camp 수강 후기 (1)

MSDS Boot Camp 수강 후기 (1)
Picture

Member for

6 months
Real name
Keith Lee
Bio
Head of GIAI Korea
Professor of AI/Data Science @ SIAI

MSDS Boot Camp 시험을 치르기도 전에 아래의 후기를 받았습니다.

학생들의 프로그램 선택 및 수학/통계학에 대한 접근 방식에 좋은 정보가 될 것 같아,

본인 동의 하에 개인정보를 생략하고 공유합니다.


안녕하세요. 이번 MSDS Prep 강의 수강자 XXX입니다.

준비가 너무 미흡하여 입학시험을 포기하겠습니다. 죄송합니다.

아직 미련이 남아 시기를 정확히 말씀드리지는 못하지만 이번 MBA 코스 혹은 내년 MSDA를 목표하고 있어 이하 변명의 글을 적습니다.

저는 CS학부를 졸업하고 현재 데이터 직종에 종사하고 있습니다. 사내 분류상 DS직무로 분류되지만 본 업무는 데이터 모델링 및 분석 업무가 주된 업무입니다.

파비클래스를 알기 전 타 DS 온라인 강의를 수강했고, XXX 주최의 작은 AI경진대회의 한 분야에서 우승을 했었습니다. (그 때 사용했던 모델은 랜덤포레스트였습니다ㅎ) 그냥 라이브러리 가져와서 돌리고, 점수 낮으면 설정값 바꿔서 돌리고 다시 점수내고.. DS를 이런 식으로 배우고 쓰는 건 아니다라는 생각을 하며 찾다가 파비블로그를 접하게 되었습니다.

블로그 글을 보며 부족함과 깨달음을 얻고 제대로 된 DS를 배우고 싶어 대학원 설립 전 MSDS수업을 목표로 베이스가 되는 수학 및 통계학 공부를 시작했습니다.

미적분, 선형대수, 수리통계를 공부하고 Math & Stat for MSDA를 들으며 괜찮을지도 모른다는 오만한 생각을 했습니다. (이번 강의를 들으며 문제풀이와 암기에만 급급한 잘못된 방법으로 공부를 했다는 것을 깨달았습니다. 괜찮을지도 모른다고 생각한 것도 사고의 깊이가 얕아 그 의미를 정확하게 이해하지 못했기 때문일거 같습니다. 그냥 단순히 그런가보다 하고 아는 용어 나오니까 안다고 착각하고 넘어갔겠죠.. 부끄럽습니다..)

처음부터 MSDS는 언감생심으로 MSDA를 생각하고 있었지만 혹시나 하는 마음이 없었다고 한다면 거짓말입니다. 그리고 좋은 강의를 듣고 싶다는 욕심에 무리임을 알면서도 수강 신청을 했습니다.

수학은 언어라고 하셨던 것처럼 수학으로 내 논리를 탄탄하게 앃아올리는 연습을 해야하는데 숫자 보기에만 연연했던지라 응용 및 사고의 확장이 자유롭게 되지 않았습니다. (추가로 정규 과정이 아닌 자율학습으로 공부한지라 첫 시간에는 영어로 표현되는 용어에 멘붕이 와서 수업 내용이 잘 기억이 나지 않습니다.)

수강을 취소하지 않았던 것은 그래도 다행히 전혀 못 알아듣지는 않았고, 공부하는 과정이 힘들지만 단순 노가다성 암기가 아닌 즐거움과 성취감이 있었기 때문입니다.

시험을 준비하며 시간이 조금만 더 있었으면 하는 마음이 들었습니다. 그리고 혹시나 운이 엄청나게 좋을수도 있지 않을까하는 허황된 생각도 해보기는 했지만 주어진 시간 안에 소화할 수 없다는 것은 결국 수업을 따라갈 수 없는 수준이라 판단하였습니다.

더 공부를 하면 벽을 넘을 수 있을까 꽤 오랜시간 고민을 하고 있지만 아직 답을 내지 못했습니다. 미련이고 지금보다 훨씬 괴로운 길일 것이라 생각하지만 포기를 하기에는 아직 덜 깨진 것 같습니다.

마지막으로 제 분수에 맞지 않는 좋은 강의를 들을 수 있는 기회를 주셔서 감사하다는 말씀을 꼭 드리고 싶었습니다. 개인적인 레벨에서 첫 강의를 들었을 때와 마지막 강의까지 들은 지금을 비교하면 정말 문제를 대하는 방법부터 사고의 흐름 및 관점까지 많은 발전이 있었습니다. 만약 강의를 듣지 않았다면 여전히 계산에만 집착 하거나 그마저도 못한 라이브러리 가져다가 안 맞으면 다른 라이브러리 찾는 짓을 하고 있었을 거라 생각합니다.

다시 한 번 죄송하다는 말씀과 염치 불구하고 감사하다는 말씀 드립니다.

 

사담입니다. SNS를 하지 않아 올라오는 글로만 보았지만 논지를 이해 못하는 분들과 억지로 눈을 돌리려고 하시는 분들이 계신 것 같습니다. 맞는 말을 하고 계시니 아마 자연스레 사라질 것이라 생각합니다. 힘든 길을 가주시는 덕분에 저 같은 사람은 감사하고 있습니다. 나아가시는 길 존경을 담아 응원하겠습니다.


 

안녕하세요 XXX님,

 

많은 고민이 느껴지는 장문의 이메일을 받고 안타까운 마음이 커집니다.

CS출신 직장인이라는 알려주신 스펙만 놓고봤을 때는 MBA vs. MSDA 놓고 고민하는 것조차 버거울 것 같은데

MSDA 수업 요약에 해당하는 Prep을 단기간에 들으셨으니 보통 난이도가 아니었을겁니다.

그럼에도 불구하고 Math & Stat for MSDA까지 들으며 준비하신 열정에 고개를 숙입니다.

 

직접적인 타겟이 아닌 분이었음에도 짧은 수업을 거치며 제 의도가 많은 부분 전달되었던 것 같아

한편으로는 다행으로 생각하고, 다른 한편으로는 선악과를 준 뱀이 된 것 같아 되려 찜찜해지는군요.

 

비슷한 상황이신 분들께 MBA in AI BigData를 하면서 MSDA와 수업이 겹치는 몇 과목의 과제/시험을 MSDA로 하라고 권유합니다.

XX님께도 같은 추천을 드리고 싶습니다.

 

살짝 맛보기를 해 봤으니 어느 정도 느껴지겠지만, 수학, 통계학의 고학년/대학원을 위한 수업들 앞에 놓인 벽은

그리고 제가 고생해서 배운 후 전달하고 있는 직관적, 추론적, 추상화된 사고력을 기르는 방식의 또 하나의 벽은

국내의 계산 위주로 구성된 공학 or 유사한 수준의 교육과정을 거친 분들이 직장 다니면서 쉽게 넘을 수 있는 벽이 아닙니다.

 

직장에서 제대로 쓰지도 못하는 Scientific 지식을 굳이 욕심내서 공부하려고 돌아가는 길을 선택하는 대신,

주어진 상황에 적절한 선택을 하시는 편이 맞지 않나 생각합니다.

 

옷도 무조건 큰 옷, 무조건 유명 브랜드의 옷이 예쁜게 아니라, 자기 체형과 분위기에 맞아야 좋은 옷이잖아요.

 

수업 듣느라 고생 많으셨습니다.


 

안녕하세요.

진심어린 조언 감사드립니다. 과정 선택에 많은 도움이 될 것 같습니다!

메일 내용은 편하신대로 공개하셔도 괜찮습니다.

답변 주셔서 부족함으로 수업 목적에 부합하지 못해 죄송스러웠던 마음이 조금이나마 가벼워졌습니다.

감사합니다.


(Note: 여태 이런 수준 교육에만 헛 돈을 썼으니ㅠㅠ)

 

아예 한 마디도 못 알아듣고 코드만 달라고 하거나, 욕하면서 강의장을 엉망으로 만들었던 CS 출신들이 은근 있었는데,

저 분은 실력의 격차를 메우려면 수학/통계학이 필요하다는 사실을 (막연하게나마) 인지하고 수업을 찾아온 것 같고,

하필이면 준비상태에 맞지 않은, 너무 무리한 도전을 했다고 생각된다.

 

아마도 Data Scientist를 꿈꾸는 국내 공학도들 거의 대부분이 영미권 학부 3,4학년 수준인 이번 MSDS 입학시험 문제에 손도 못 댈 것이다.

국내 비전공 학부 출신이 1년간 MSDA 과목들을 듣는다고 해도 이번 입학시험 정도의 난이도 문제들을 풀기 쉽지 않을 것이다.

기본에 해당하는 수학, 통계학 교육, 직관적 추상화 교육이 사실상 전무한 상황인데, 그걸 1년만에 따라잡는건 기적이니까.

(그 정도 지식이 있어야 왜 수학, 통계학, 직관적 추상화가 Data Science에 핵심인지 알텐데, 그걸 모르니 맨날 우리를 욕하는거겠지.)

(아니면 그렇게 욕해야 자기네 코딩 학원에 학생들이 많이오는 마케팅 담당자들의 교묘한 바이럴 마케팅이었을지도?)

(어쩌면 그런 사리사욕만 챙기는 바이럴 마케팅에 속아 넘어간 불쌍한 짝퉁 Data Scientist였을지도 모르겠다.)

 

3년 남짓 국내에서 데이터 사이언스 교육을 하면서 느꼈지만, 교육 연구를 해서 제대로 가르치는 교수들은 정말 드물더라.

못하는게 딱히 학생들 잘못은 아닌 것 같고, 교수들의 책임 방기라고 지적하고 싶지만, 교수들이라고해서 제대로 안 가르치고 싶을까?

 

학부시절에도, 심지어 S대 최상위권 학과에, 수학, 통계학 지식이 중요하다는걸 과 전체가 느끼면서 공부하는 전공이었는데도

같은 과목을 쉽게/어렵게 가르치는 교수 2명이 강의하고 있으면 학점 잘 받아서 교환학생, 취직에 활용하려는 애들이

쉽게 가르치는 수업에 우르르 몰려갔었다. 학점 바닥을 깔더라도 어려운 수업 찾아가는 나같은 Psycho는 그 때도 괴물 취급 받았으니까.

고집 피우며 어렵게 (즉, 제대로) 가르칠 수 있는 분위기가 조성된 전공과 학교에서도 그랬는데, 하물며 다른 곳들이야.

 

반값 등록금의 파장이 낳은 쥐꼬리 월급을 받는 교수들의 현실, 돈 되는 프로젝트에 양심을 팔 수 밖에 없는 현실들이 이해되는터라,

그런 와중에 제대로 고민해서 수업 만들어봐야 소수만 살아남아서 학장에게 돈 안 된다고 꾸중만 듣는 수업이 되는데, 왜 고생해야되지?

어차피 대학 교수들의 직위는 단순히 노동3법 정도가 아니라 사립학교법, 고등교육법으로 보장될만큼 안정적인데?

월급 잘 나오는데, 강의 잘해서는 월급 말고 돈 더 나올 구석이 없는데 왜 오버함?

 

그냥 안타깝다.

직장가서도 저렇게 열정을 갖고 공부하는 학부 졸업생이 영미권 학부 3-4학년 수준 지식 공부하려면

직장 그만두고 몇 년을 쏟아부어야 할 만큼 우리나라 학부 교육이 부실하다는 사실이.

내 자식이 저런 상황이었으면 교수들에게 분노가 치밀고, 자식을 국내 대학 보낸 나 자신의 어리석음에 자책감만 생길듯

 

前 MSDS, 현 MSc Artificial Intelligence 입시시험 후기 시리즈

Picture

Member for

6 months
Real name
Keith Lee
Bio
Head of GIAI Korea
Professor of AI/Data Science @ SIAI

수학, 통계학 중심의 AI대학원 커리큘럼

수학, 통계학 중심의 AI대학원 커리큘럼
Picture

Member for

6 months
Real name
Keith Lee
Bio
Head of GIAI Korea
Professor of AI/Data Science @ SIAI

업계에서 필자의 컬럼에 대해 "코딩은 필요없다는건가", "현업에서 수학의 효율은 기대하기 어렵다", "통계학은 평균,분산 구하는것 아닌가", "수학・통계학의 시대는 지났고, 인공지능에게 맡기면 된다"등의 지적들을 하고 있는 것으로 안다. 그러나, 이는 단지 필자만의 주장이 아닌, 영미권 응용 수학・통계학(Applied Mathematics & Statistics) 전공에서 운영하는 데이터 사이언스 프로그램이 선도하고 있는 AI라는 학문의 전반적인 흐름이다. 필자는 지금까지 많은 글들을 통해 관련 오해들을 지적해왔는데, 이와 비슷한 관점을 대한민국에서 유일하게 S대 계산과학 연계전공에서도 볼 수 있다는 점을 이번 글에서 전하고자 한다.

아래 소개하는 교수님과는 개인적인 친분이 전혀 없고, 순수하게 구글링을 통해 찾은 정보임을 미리 밝힌다.

 

S대 컴퓨터 공학과에서 수학・통계학 기반의 AI 관련 교육을 하시는 장병탁 교수님이시다. 그동안 필자가 봐왔던 우리나라 컴퓨터 과학(Computer Science) 교수님들의 강의 목차 중 처음 볼츠만 머신(Boltzmann Machine)을 가르치시고 계셨다. 또, 볼츠만 머신을 이해하기 위해 마르코프 연쇄 몬테카를로(Markov Chain Monte Carlo, MCMC), 깁스 샘플링(Gibbs sampling)으로 이어지는 베이지안(Bayesian) 계산통계학의 한 축과 네트워크 이론(Network theory)에서 랜덤 워크(random walk)와 같은 주제, 그리고 이를 다루기 위한 마르코프 과정(Markovian process), 그리고 요인 분석(Factor Analysis)을 가르치시는 강의 노트를 확인할 수 있었다.

그간 필자는 역전파(Back-propagation)은 80년대 계산법이고, 90년대 후반 이후에 문제점을 보완한 볼츠만 머신을 쓰지 않는 이상, 그 한계로 인해 신경망(Neural Net) 계산을 신뢰하기는 어렵다고 강조해왔다. S대 대학원 수업에 볼츠만을 가르치시는 위 교수님의 커리큘럼이 필자의 신경망에 대한 견해와 같은 선상에 있다는 것을 확인할 수 있다.

 

위 교수님이 남들은 고개를 한번쯤은 숙일 S대 컴퓨터 공학과 교수, S대 AI 연구원장, 그리고 N사에서 연구원 100명이 참여하는 수백억원대 공동 프로젝트를 맡기는 핵심 인력이니, 충분히 설득이 될 것이다. 우선, 이런 분을 못 찾고 그동안 컴퓨터 과학 분야를 비난한 부분에 대해서 고개 숙여 사과드린다. 대신, 이런 글로벌 수준 지식을 갖고 있는 분이 아니라면, 인공지능에 대한 오해를 불러일으키는 언행은 자제해주셨으면 좋겠다. 이와 비슷한 수학・통계학 훈련을 받아 연구 주제만 전환하면 짧은 시간 안에 적응할 수 있는 분들이 문과인 경제학에만도 국내 최소 수백명은 있다는 점을 상기시켜드리고 싶다.

영미권의 유수 대학 데이터 사이언스 프로그램들과 비교해서, 위 교수님의 커리큘럼과 관련해서 공유할만한 포인트가 크게 3가지가 있다.

 

1. 영미권에서는 여러 과목에 나눠서 가르치는 내용을 1-2과목에 압축했다

해외 대학의 플래그십(flagship)에 해당하는 데이터 사이언스 프로그램들을 살펴보면,

  • Graph Theory,
  • Information Theory,
  • Machine Learning,
  • Reinforcement Learning,
  • Bayesian Time Series

에 걸쳐 나눠넣은 교육 과정을 1-2과목에 다 가르치시고 있다. 필자 또한 필요한 수학은 스스로 찾아가며 공부하면 된다고 생각하기에, 이런 1-2과목 압축형 커리큘럼에 동의한다.

그러나, 비슷한 수업을 여러 주제를 필요한 수학・통계학 기준에 맞춰 12시간의 수업으로 묶어 필자의 '데이터 사이언스 모델링'이라는 수업으로 운영한 적이 있었는데, 대부분의 수강생이 좌절하고 한 학기 수업으로 만들어달라고 요청하는 경우가 대부분이었다.

꽤 준비되신 분들마저도 수업 중반부에 들어서면서 퍼지시는 모습을 지켜봤는데, 위처럼 1-2과목에 내용을 모두 몰아넣으면 충분히 지식이 전달 되었을지 우려스러운 부분이 있다. 해당 커리큘럼을 소화하기 위해 수강생들이 그 전에 상당한 수준의 수학・통계학 훈련을 받았어야 할 것이다.

 

2. 얼마나 지식을 소화할 수 있었을까?

필자가 3년간 '데이터 사이언스 모델링' 강의를 총 3번 진행했던 경험이 있다. 약 50명의 인원을 가르치면서, 수학 및 통계학으로 일정 수준 이상의 훈련을 받은 분들만 수강생으로 받았고, 상당수는 국내외 대학의 박사과정을 거치셨던 분들이었음에도 불구하고, 대부분이 지식을 완전히 소화하기 버거워하셨던 것으로 기억한다.

S대 컴퓨터 공학과 전공 커리큘럼 상 수학・통계학을 훈련하는 수업이 주를 이루고 있지는 않다보니, 얼마나 많은 수의 학생들이 제대로 듣고 이해했을지 우려스럽다.

남의 전공 상황을 함부로 재단하고 싶지는 않으나, 배운 지식에 대한 측정이 가능한, 볼츠만 머신과 관련된 질문에 대답을 제대로 하셨던 분이 거의 없었던 필자의 경험상, 다른 기초 훈련없이 해당 수업을 제대로 이해한 분이 있을지, 고급 지식을 이해하기 위한 추가적인 기초 수업들이 필요하진 않을지 걱정되는 부분이 있다.

 

3. 체계적인 커리큘럼의 중요성

필자가 견지하고 있는 AI에 대한 견해는 필자의 석・박 유학 시절 혹독하게 받은 영미권 교육 및 해외 유수 대학의 데이터 사이언스라는 학문의 전반적인 흐름에 기반하고 있다. S대 계산과학 연계전공이 위 흐름을 유일하게 이해하고 있는 것으로 보이나, 학부 사정 및 커리큘럼의 구성을 고려했을 때, 혹독한 교육과정에서 제대로 살아남을 수 있는 인재는 몇 안될 것으로 짐작된다.

어느 유명 해외의 데이터 사이언스 프로그램의 경우, 위 커리큘럼 스타일을 유지하면서도, 이를 더 자세하게 가르쳐 주는 커리큘럼을 제공하고 있다. 더불어 많은 데이터 셋에서 데이터 생성 과정(Data Generating Process, DGP)에 맞춘 적절한 모델링을 할 수 있도록 경제학의 계량경제학 도구, 방법론, 활용처 일부까지 가르치는 커리큘럼을 제공하는 경우도 있다. 이러한 교육과정을 거쳐야 수학, 통계학을 해당 교육기관이 가르치는 레벨로 이해하고, 나아가 데이터 사이언스 업계에서 복잡한 현실 상황을 맞닥뜨려도, 배운 수학・통계학적 지식과 도구들로 문제들을 논리적으로 해결할 수 있는 능력을 갖추게 될 것이다.

그러나, 아직 우리나라의 AI 교육기관은 위와 같은 지식선진국의 체계적인 교육 커리큘럼이 구성된 바가 없어 아쉬울 따름이다. 언젠가는 '진짜' 전문가들이 힘을 합쳐 경제학, 수학, 통계학의 기반을 단단히 다져 계산과학 및 인공지능 전문가를 양성할 수 있는 체계적인 커리큘럼을 갖춘 데이터 사이언스, 인공지능 교육 기관이 출범할 수 있기를 바래본다.

 

+AI를 제대로 공부하고 싶은 분들께

AI를 제대로 공부하고 싶다면, 수학・통계학적 훈련은 일정 수준 이상으로 필요할 것이다. 다른 양적(Quantative) 학문의 상황도 별반 다르지 않다.

경영학과를 예로 들면, 경영학과에서 재무(Finance) 교수님들이 다루는 수학・통계학 훈련이 된 경우는 경영학과 학・석사를 마친 분들이 아닌, 수학・통계학을 복수전공 하신 분들이다. 이런 훈련을 받았어야 대학원에서 재무 전공과 관련된 논문들을 이해할 수 있기 때문이다. 수학・통계학 공부를 자체적으로 하는 경제학과 또한 상황은 다르지 않다. 수학, 통계학과의 해석개론, 수리통계학 이수기록 및 학점이 있어야 대학원 추천서를 받을 수 있다.

위의 CS 대학원 수업 커리큘럼 또한 AI로 이름을 달아놓은 주제도 위와 맥락을 같이한다. 수학・통계학을 어느 정도 깊이 이상으로 공부해야하는 전공의 대학원은 누구나 다 괴로운 벽을 넘어야한다. 다루는 내용이 이미지 인식, 언어 처리인지, IT업계의 개인 행동 데이터인지, 금융데이터인지 등으로 도메인의 차이만 있을 뿐이다. AI라고 불리는 계산과학을 제대로 공부하고 싶다면, 수학적인 도전은 반드시 필요할 것이다.

Picture

Member for

6 months
Real name
Keith Lee
Bio
Head of GIAI Korea
Professor of AI/Data Science @ SIAI

전략 컨설팅의 실패와 머신러닝의 관계 (2)

전략 컨설팅의 실패와 머신러닝의 관계 (2)
Picture

Member for

6 months
Real name
Keith Lee
Bio
Head of GIAI Korea
Professor of AI/Data Science @ SIAI

지난 글 이후로 많은 의견을 받았는데, 답변차원에서 2번째 글타래를 이어가본다.

지난 글에서 이미 컨설턴트의 '케이스 풀이법'에서 선형적 비지니스 접근의 한계에 대해서는 언급했으므로, 이번에는 실제 현업에서 비지니스 하는 사람들과 컨설턴트들의 차이를 살펴보자.

케이스 풀이법에서 슈퍼마켓 예시를 들었으니 같은 산업에서 스토리를 이어가보려 한다.

컨설팅 vs. 슈퍼마켓 지점장 사례

당신이 대형슈퍼마켓 지점장이라고 해보자. 컨설팅 회사 출신 본사의 전략기획 실장님께서 우리 지점 매출액 목표치가 '동네인구 x 시장점유율 x 1인당 장바구니 사이즈 x 52주' 정리해서 보내주셨다. 이제 매출액을 어떻게 끌어올릴 수 있을까?

여기서 동네인구를 끌어올릴 수 있는 방법은 없다. 52주를 104주로 늘릴 방법도 없다. 1인당 장바구니 사이즈를 늘릴 수 있는 방법은 일시적으로 인기 상품을 들여와 가능할 수는 있으나, 장기적으로는 불가능에 가깝다. 결국 사람들이 집에서 요리를 해먹도록 만들어야 1인당 장바구니 사이즈가 늘어날텐데, 이는 본사에서도 하기 쉽지 않은, 트렌드의 변화를 불러일으켜야하는 일이다. 문화 현상에 대한 도전은 이 글에서 논외로 하기로 한다.

 

시장 점유율 끌어올리기

결국 지점장인 당신에게 필요한 내용은 우리동네에서 우리 슈퍼마켓이 경쟁마트보다 조금이라도 더 많은 고객을 끌어들이도록 해야한다는 것이다. 여기서 당신은 아래와 같은 세 가지 정도의 마케팅 전략을 취할 수 있을 것이다.

  • 미끼 상품 몇 개로 사람들 유혹하기
  • 상품 팜플렛 돌리기
  • 입소문 내기

미끼 상품은 뭘로 고르면 될까?

컨설팅의 하향식 접근방식에 따라, 우리 동네에는 4인가구가 많고, 요리를 많이하고, 부자동네라서 고급 음식을 많이 먹으므로 1등급 한우의 비싼 부위를 싸게 판다고 결론 내리는 방식과, 지난 주에 제일 많이 팔린 상품 리스트 중 아직 재고가 많이 남은 상품 1-2개를 골라 재고를 처리하는 방식 중 당신은 어느 쪽을 더 선호하겠는가?

컨설팅의 접근 방식을 취하려면, 1등급 한우의 비싼 부위를 얼마의 가격에 팔아야할지, 몇 %의 손실을 감수해야할지, 홍보효과가 충분해서 사람들이 많이 올지, 방문해서 다른 상품도 많이 사갈지에 대한 구체적인 수치가 있어야하고, 해당 수치를 뒷받침하기 위한 충분한 근거가 필요하다. 예컨대 우리 마트 또는 옆 마트에서 비슷한 미끼 상품을 썼던 기록 데이터가 필요하다.

만약 데이터가 없는 상황이라면 직접 시행착오를 겪으며 숫자가 나오는 것을 봐야한다. 그러나 이러한 시행착오를 겪으며 매몰비용을 지불하는 것보다, 재고 남은 상품을 처리하는 것이 더 합리적일 수 있다. 최소한 이를 통해 할인판매에 얼마나 많은 사람이 반응하는지 알 수 있는 소중한 근거자료를 얻을 수 있기 때문이다. 이는 다음에 다른 미끼 상품을 기획할 때 사용할 수도 있을 것이다.

자, 다음 포인트를 보자. 팜플렛은 어떻게 만들어야되는가? 입소문은 어떻게 내야할까?

미끼 상품 케이스와 똑같다. 플랜을 만들어내려면 오랜세월 마트를 운영해온 경험이 있거나, 아니면 남들이 하는 것을 벤치마크로 삼아 내실이 들어찰 때까지 왜 그렇게 했을까 고민하면서 모방하는 수 밖에 없다.

 

싸게 파는데도 사람들이 안 온다

조금 더 깊게 들어가서, 아무리 싸게 상품을 내놔도 사람들이 우리 마트에 안 온다고 해보자. 마트 직원들이 고객들에게 설문한 결과 주차장이 불편해서 장보는 아주머니들이 낮에 차를 끌고 오지 못해서 불만의 목소리를 높이고 있다고 한다. 나아가 마트 차원에서 더 많은 주차가 가능하도록 하려고 차 간격을 좁게 했더니 문콕이 자주 발생하고 있다고 한다.

이를 컨설팅 방식의 하향식 접근법을 적용하면, 문 앞에서 고객들에게 설문지를 돌리면서 정보를 수집할 것이다. 그러나 고객이 솔직하게 답변을 하지 않을 가능성도 있으며, 문항 구성에 따라 답변에 대한 신뢰도가 천차만별로 달라진다.

주차장 문제를 해결했다고 하더라도, 최초 설계부터 잘못되었기 때문에 건축설계사무소를 고소하고, 설계 변경 비용 내고, 지방정부기관 건축팀 승인 및 안전 평가, 건설업체 결정 문제 등 매우 많은 시간과 비용이 투입되겠지만, 양보해서 해당 문제를 빠르게 해결해서 고객들이 마트에 많이 오게 되었다고 가정해보자.

 

오게 만들어 놔도 돈을 안 쓴다

고객들이 매장에 들어왔는데, 다른 마트보다 장바구니 금액이 적다.

컨설턴트는 우리 동네가 우리 동네는 어떤 소득, 소비 수준을 갖춘 사람들이 살고 있고, 그래서 상품은 어떤 종류를 소비하고, 그 중 어떤 상품은 브랜드 이미지가 어떻고, 그래서 어떤 종류의 상품을 더 많이 입점시켜야하는지 등의 '솔루션'을 제안할 것이다.

힌퍈 현장 경험이 많은 노련한 지점장은 고객들의 동선을 먼저 확인해볼 것이다. 특히 주차장 문제를 해결한 지점장이면 직접 장바구니를 들고, 혹은 가족 동반으로 장바구니를 들고 1주일치 장을 볼 것이다. 이를 통해 먹고 싶은 상품이 없다거나, 먹고 싶었던 상품이 잘 안보인다거나, 배치에 대한 설명이 부족해 고객이 헷갈리거나 포기하는 경우가 있다는 것을 파악할 것이다.

분석이 끝났으면 고객이 움직이는 동선을 의도적으로 조절할 수 있도록 매대의 폭을 조절하거나, 상품이 잘 팔리는 코너에 더 주력 상품을 배치하거나, 리베이트를 많이 주는 상품들 위주로 홍보 마크를 달아놓는 방향으로 매장 안에서 고객들이 장바구니를 더 풍성하게 채울 수 있도록 하는 환경을 조성할 것이다.

이런 지식을 공부하는 산업공학의 분과학문을 소매 인체공학(Ergonomics in Retail)이라고 하고, 이런 종류의 수업과 교재도 찾아볼 수 있다. 우리가 마트에서 보는 상품 배치는 관련 주제의 학문을 하는 연구자들이 기하학적 지식을 동원해 무수히 많은 시행착오로 만들어낸 결과물인 것이다.

현장 경험이 많은 노련한 업계 종사자들은 이런 것을 경험으로 익히고 있는 것이고, 박사들은 기하학이라는 수학 지식과 실험 기반의 통계적 연구로 그런 지식을 쌓은 차이가 있을 뿐이다.

 

머신러닝이 쓰일 곳

실제 건물에서 사람들의 움직이는 경로에 대한 데이터를 얻고, 그걸 바탕으로 추론을 하던 기존의 연구 방식이 혁명적인 변화를 맞은 건 역설적이게도 움직임을 잘 추적해주는 전파기기(Beacon)이 설치되어서가 아니라, 추적 자체가 매우 간편한 온라인으로 구매의 중식축이 이동했기 때문이다. 마트 산업에서 상품 위치를 어떻게 배치하는 것이 합리적인지 밝혀내기 위해 위의 사진처럼 기계를 착용하고 가짜 고객들이 직접 쇼핑을 하도록 데이터를 모으던게 불과 10년 전의 상황이었다.

온라인 쇼핑몰에서는 고객이 어떤 검색어로 어떤 상품을 봤고, 얼마나 긴 시간동안 그 페이지를 보다가 다른 페이지로 이동했는지에 대한 '지문'을 전부 보유하고 있다. 그 상품 하나만 보고 안 사고 나가버린 데이터 밖에 없으면 문제의 원인이 뭔지 알아내기 힘들 수 있으나 다른 상품을 결국 구매하는걸 보고, 두 상품 간의 차이에 대한 정보를 알아낼 수만 있으면 앞 상품이 왜 안 팔렸는지 쉽게 이해할 수 있게 된다. 고객들의 상품들을 구매하는 데이터가 쌓이기 시작하면, 상품의 가격이 문제였는지, 또는 어떤 특징이 문제였는지를 구분하는 정확도가 가파르게 올라가게 된다.

나아가 같은 카테고리의 상품 N개를 묶고 그 중 가격과 판매량 간의 상관관계가 얼마나 높은지 잡아내면, 해당 상품군은 상품 품질이 중요한지, 또는 가격이 중요한지에 대한 인사이트를 얻을 수 있을 것이다. 이는 산업조직론이라는 경제학의 분과 학문에서 오랫동안 해 오던 작업이고, 온라인 쇼핑몰에서는 시스템만 갖춰져있으면 불과 클릭 몇 번에 같은 정보와 결론을 얻을 수 있다.

좀 더 발전하면 상품 소개 문구 하나, 썸네일 사진에 쓰이는 색상, 썸네일 사진의 모델, 글자 폰트, 화면 색상 비지니스 운영자로서 해야할 고민들을 상당히 합리적인 숫자로 확정지을 수 있게 된다. 최근 이러한 내용을 산업공학과의 소매 인체공학에서 학생들에게 가르치고 있다.

즉 유저들의 행동을 뒤에서 보고, 설문지를 나눠주고, 질문을 하고 답을 얻어가면서 비싸게 얻었던 유저 행동 데이터를 온라인 마케팅 서비스에서 실시간으로 얻어낼 수 있다는 것이다. 물론 서비스가 제대로 작동되어야 유의미한 데이터를 얻을 수 있고, 그 전까지는 정보가 없는 상태에서 시작해야한다는 단점이 있다. 이 때는 온라인 마케팅 또한 시행착오를 겪으며 서비스를 구축해야한다.

필자는 짧지 않은 기간동안 학문과 비지니스를 하면서 한 분야의 지식이 성숙되어 가는 과정에 큰 공통점이 있다는 것을 발견했다. 지식은 어떤 단계에 있든 상관없이 작은 차이를 읽고 이를 어떻게 추상화하여 다른 분야에 적용할 수 있을까, 혹은 이 문제를 어떻게 해결할 수 있을까와 같은 문제의식에서 출발한다는 것이다.

두 영역간의 차이는 그 문제를 해결하는데 수학, 통계학 같은 학문을 쓰느냐, 직관과 경험을 쓰느냐의 차이일 뿐이다.

 

비즈니스 의사결정 구조의 진화 by 데이터 사이언스

설문지보다 훨씬 더 정확하게 인간의 선호를 보여주는 데이터, 현시선호 (Revealed preference)가 표시된 데이터를 손쉽게 얻을 수 있는 세상이 되었기 때문에 컨설턴트의 하향식 접근방식의 가치가 급격하게 떨어지는 시대가 도래했다. 오히려 통계학적 방법론을 이해하고, 더 복잡한 비선형 패턴을 찾아내는 머신러닝 지식을 가지고 있는 인재들에 대한 수요가 늘어날 수 밖에 없게 되었다.

위의 그림을 보면,

  • A타입: Top-down 형태의 컨설팅 형태의 지식 생성 과정
  • B타입: Bottom-up 형태의 하나하나 벽돌을 쌓아올려서 삼각 피라미드를 완성하는 과정
  • C타입: 삼각형 2개를 겹치는 복잡 구조물을 만드는데 하나하나 데이터의 검증을 받는 과정

이 있다. 지금까지 비지니스가 B타입이었기 때문에 대부분이 A 방법론으로 접근해도 될 것이라고 생각해왔다. 그러나 최근들어 C타입처럼 복잡하고 특화된 업무가 생겨나면서 내가 맞는지에 대한 시행착오가 비약적으로 늘어나게 됐고, 시행착오를 비싼 비용을 들여 가짜 유저를 투입시키지 않고도 데이터를 이용해서 높은 정확도를 기대할 수 있게 되었다. 업무는 C타입으로 복잡해졌고, 검증은 온라인 유저 데이터를 이용하면 빠르게 진행되므로 B타입 시절에 A 방법론을 쓰던 컨설턴트가 가지는 엣지가 급격하게 감소하게 된 것이다.

t-Test, A/B Test 같은 1회성의 1변수, 2변수 테스트가 흔히 알려져 있는 통계 테스트 방식이고, 베이지안 방법론을 이용해서 Bandit problem을 풀어내는 연속성의 테스트도 같은 클래스의 통계학 이용법이라고 볼 수 있다.

지난 글에서 선형적인 결과만을 내놓는 업무를 하는 직장에 있으면 2000년대 초반의 지식 체계에 머무를 것이라고 언급한 바 있었다. 요즘 데이터 사이언스 붐이 생기는 이유, 이런 붐이 지속되기 위한 필요조건은 C 타입의 업무가 얼마나 많아지고 사람들에게 받아들여지느냐에 달려있다. 단순한 이미지 인식이나 자연어 처리는 연구실에서 고민한 함수를 적용하는데 그치지만, C 타입의 업무는 본인의 데이터 사이언스 내공을 실무에 적용하는 비지니스 감각에도 영향을 받을 것이다.

 

나가며 - 전략 컨설턴트 접근법의 몰락

컨설팅 스타일의 Top-down 접근법 자체가 틀린 것은 아니다. 그러나 그 접근법은 지식을 체계적으로 쌓아 올리는 과정이 아니라, 정확도를 희생하고 속도를 올리려는 접근법이다. 이는 현실상황이 복잡해질 수록 그 한계가 명확하게 두드러질 수 밖에 없다.

우리 시대에 더 이상 컨설팅적 접근법이 효과적이지 않은 가장 큰 이유는 이제는 더 이상 해당 접근법이 적용될 수 없을 만큼 사회가 다원화, 복잡화되었기 때문일 것이다. 좁은 구역 주차를 수천번해보던 전문가가 아니라면, 주차장 모양만 보고 바로 문제점을 지적할 수 있는 소매 인체공학 전문가가 아니라면, 자기 마트 주차장의 문제는 직접 주차 실패를 겪으며 몇번 차를 긁어봐야 알 수 있을 것 같다.

Picture

Member for

6 months
Real name
Keith Lee
Bio
Head of GIAI Korea
Professor of AI/Data Science @ SIAI

전략 컨설팅의 실패와 머신러닝의 관계

전략 컨설팅의 실패와 머신러닝의 관계
Picture

Member for

6 months
Real name
Keith Lee
Bio
Head of GIAI Korea
Professor of AI/Data Science @ SIAI

우리 회사에 전략 컨설팅 방식의 비즈니스 접근 방식을 좋아하고, 그 방법으로 비지니스 의사결정을 안 하고 있는 상황을 잘못되었다고 지적하는 직원이 하나 있다.

그 분의 접근 방식이 왜 잘못되었는지를 설명하다보니, 해당 설명이 왜 선형 회귀에서 비선형 회귀 또는 머신러닝으로 계산 알고리즘의 중심축이 이동하고 있는지와 맞닿아있는 것 같아 글을 한번 정리해본다.

 

전략 컨설팅에서 하는 '케이스 풀이법'

우선 전략 컨설팅에서 하는 '케이스 풀이법'을 한번 살펴보자. 우리 동네 대형 슈퍼마켓의 매출액을 가늠한다고 할 때, 1가구 4인으로 가정하고, 각 가구별로 1주일에 한번 장을 보러 간다고 가정하고, 한번 장을 보러갈 때 고기, 야채, 우유 등등 기본 품목과 가끔씩 사는 품목을 생각하면 약 20만원의 장바구니가 나온다고 가정해보자. 우리 동네 인구는 120만명이고, 대형 슈퍼마켓이 3개 있고, 각각의 시장 점유율은 33%씩이라고 하면, '30만 가구 X 시장점유율 33% X 장바구니 20만원 X 52주' 라는 방정식을 통해 그 대형 슈퍼마켓의 매출액을 가늠할 수 있다.

조금 더 세부적으로는 인구, 가구별 인원 수, 시장점유율, 장바구니 사이즈 등등에 대해 더 많은 자료를 붙여서 좀 더 정확한 예측을 해 볼 수 있을 것이다. 해당 방식에 대해서는 시대 상황이 많이 달라졌기 때문에 방법론이 달라졌을 수는 있겠으나 컨설팅 업계에서 논리를 구조화하는 방법은 여전히 동일하다고 알려져있다. 이를 가정하고 전략 컨설팅에서 하는 '케이스 풀이법'에 지적을 하자면, 해당 접근법은 매우 많은 영역에서 틀린 이야기를 담고 있다.

 

모든 것은 가정에 불과

첫 번째로 위의 방정식은 수많은 가정 위에 만들어졌는데, 그 가정이 맞는지 확인된 바가 없다는 사실이다. 예컨대 우리 동네 인구 12만명, 대형 슈퍼마켓 3개와 같은 실제 숫자를 제외하면 확실하게 사용할 수 있는 수치가 하나도 없다. 즉, 불완전한 가정을 기반으로 하고 있는 위 방정식은 다음과 같은 질문에 맞부딪치게 된다.

  • 1가구는 4인으로 구성되는가?
  • 1인당 소비하는 장바구니는 (최소한 합계금액이라도) 비슷한가?
  • 1주일에 한번 방문하는 것이 맞는가? 다른 주기로 방문한다면 1주일 평균 장바구니 금액은 비슷한가?
  • 대형 슈퍼마켓 대신 편의점이나 집 앞 소형 마트에서 구매하는 비중은 얼마인가?
  • 시장 점유율은 항상 고정인가? 수시 판촉 행사로 매일처럼 널뛰기 하는건 아닌가?
  • 설, 추석, 연말 등의 시즌에도 매출액 비중은 비슷한가?

위 방정식은 52주를 곱하고 있기 때문에, 제기된 질문에 조금만 다른 답을 하더라도 이는 전체 매출액 예측치에 매우 큰 영향을 주게 된다.

 

각 변수간 연관관계는 곱셉이나 덧셈같은 선형(Linear) 관계인가?

앞서 30만 가구 중 33%가 우리 슈퍼마켓을 방문한다고 가정했다. 그렇다면 우리 동네 30만 가구의 소득 수준은 비슷할까? 소득 수준이 비슷하다면, 혹은 다르더라도 소비 수준은 비슷할까? 소비 수준이 비슷하다고 가정하더라도, 소비 수준이 평균과 분산만 쳐다보면 되는 단순한 정규분포 구조를 따르고 있을까?

경제학 교과서에 나와있는 소득 구조에 대한 그래프들은 최상위 층이 대부분의 소득을 독점하고 있다고 입을 모아 말하고 있다. 또한 각 국가별 분배구조가 어떻게 이루어지고 있는지를 밝히는 수 많은 지표들이 존재한다. 일각에서는 지니계수를 반영하여 해당 방정식을 계산하면 된다고 지적하지만, 소득구조는 대부분 포아송 분포 또는 로그 정규분포 형태를 갖기 때문에 지니계수를 반영한다고 해서 계산이 정확해지기는 어렵다. 또한 정규분포, t분포와 같은 좌우대칭형 종 모양 분포가 아닌 분포들은 3차 모먼트(moment) 이상의 정보를 반영해야 정확한 계산이 가능해진다. 예컨대 자료의 대부분이 왼쪽으로 치우친 분포에서는 평균과 최빈값의 차이가 발생한다. 이 상황에서 단순 평균을 계산한다면 과다계상된 매출액이 나올 것이다.

시장이 고정적일 것이라는 가정 또한 비판의 여지가 존재한다. 동네 마트 주변에 수시로 다른 업체가 진입하고 있거나, 주민들이 다른 동네 마트를 쉽게 다녀올 수 있는 구조거나, 이커머스 회사들의 할인 쿠폰 마케팅 한번에 매출액이 엄청나게 크게 움직일만큼 시장 상황이 다변수에 영향을 받고 있다면 해당 방정식을 통한 예측 정확도는 현저히 낮아질 것이다.

 

선형 방정식으로는 더 이상 불가능한 도전

앞서 언급했듯 위 방정식의 각 변수간 연관관계는 단순 곱셈이나 덧셈으로 표현해서는 안된다. 수학을 이용한 모델링을 하는 분야의 경우 단순 곱셈, 덧셈으로 구성된 인과 관계를 선형(Linear) 관계가 있다고 표현하고, 평균 및 분산 이외의 3차, 4차 모먼트를 확인하거나 제곱, 세제곱과 같은 고차항을 포함한 여러 변수들의 결합된 영향을 보거나, 지수 함수 수, 로그함수 등의 형태를 이용해야하는 경우에는 비선형(Non-linear) 관계를 가지고 있다고 표현한다.

해당 예시로 돌아와서 2인 가구일때 10만원의 장바구니였다고 4인 가구에 20만원의 장바구니를 구성하는게 아닐 수 있다. 식구가 늘어나면 집에서 요리해 먹는게 저렴하고, 2인가구는 맞벌이 부부라면 외식을 하는 일이 잦을 수 있기 때문이다. 나아가 6인 가구의 경우 아파트 단지 평수 및 도시-농촌 거주 여부에 따라 2인가구에서 4인가구로 갔던 장바구니 니 구매액 관계가 4인 가구에서 6인 가구로 갈 때 그대로 성립하지 않을 것이다.

아래의 그래프를 하나 보자.

  • 직선이 A
  • 거의 진폭이 없는 그래프가 B
  • 가장 아래 위 진폭이 심한 그래프가 C

이다.

선형 관계를 가진 A 함수를 이용해서 진폭이 매우 심한 C 함수를 매칭하는 경우, 위의 그래프에서는 가로축 좌표값이 (0,1,2,3,4,5)인 경우, 6번만 일치한다. 다시 말해서 전략 컨설팅의 선형 '케이스 풀이'를 통해 변수간 비선형관계를 복잡한 현실 세계를 예측한다고 했을 때, 높은 수준의 정확도를 기대하기는 어렵다는 것이다.

그동안 인류가 선형 관계식으로 대부분의 문제를 풀 수 있었던 이유는 많은 문제들이 B 정도의 현실복잡도를 갖고 있었기 때문이거나, 우리가 목표하는 단위가 분기, 년 등으로 시점이 정해져 있어 특정 포인트(위 그래프에서는 1,2,3,4,5에 해당한다)들만 예측하면 되었기 때문이다.

 

시간을 더 들여서 예측 정확도를 높일 수 있다?

일각에서는 제대로 시간과 노력을 들여 모델(방정식)을 만든다면 C 그래프를 만들어 낼 수 있다고 말한다. 그러나, 제 3자의 개입이 비주기적으로 나타나면서 시장을 바꾸는 상황을 위 단순 예측 모형으로 맞추려고 하는 것 자체가 근본적으로 잘못된 접근에 해당한다. 또한 C 그래프 또한 평면 위에 있기 때문에 1변수 모델의 한계를 뛰어넘지 못하고 있다. 3, 4, 5차원 공간으로 그려야할 다양한 변수가 영향을 미치고, 각 변수들이 본인이 통제할 수 없는 상황에서 위와 같은 단순 방정식이 좋은 퍼포먼스를 보여주기는 어렵다.

위와 같은 상황의 경우 시간을 더 들여서 A 그래프를 C 형태 그래프로 맞추는 것이 아니라, 마르코프 결정 과정(Markov Decision Process)의 Action, Strategy, Outcome 조합을 두고 시뮬레이션을 하는 Q-learning과 같은 절차로 복잡한 변수간 비선형 관계를 갖는 현실 세계를 모델링하는 작업이 필요하다. 다시 말해서, 시간을 더 들여서 고민해보는 문제가 아니라, 완전히 다른 레벨의 지식이 필요하다는 것이다. 이를 더 구체적인 예시로 확인해보자.

 

중앙은행이 통화정책을 결정하는 보고서를 만드는 프로세스

방법1. 경제학자가 풀어내는 방식

당신이 거시경제학에서 초저금리 중에 팽창 통화 정책은 실물 경제에 직접 영향을 미치지는 못하지만 초단기채권 금융시장에 교란을 줘서 투자자들이 장기채에 투자하게 되도록 만드는, 결국 장기채 금리가 내려가서 기업들의 장기채 발행을 유발할 수 있다는 종류의 논문을 쓰고 경제학 박사 학위를 받은 다음, 중앙은행의 금융통화정책 결정팀 핵심 연구위원으로 취직했다고 가정해보자.

금융통화위원회 위원이 당신에게 이번에 금리를 올리자고 이야기를 하고 싶은데, 어떤 효과가 있는지 보고서를 하나 만들어 달라고 했다고 해 보자. 이를 위해 당신은 우선 금리 올리려면 중앙은행이 취하는 정책 수단이 뭐가 있는지 살펴볼 것이다. 예를 들면 통화안정채권을 시장에 팔 수도 있고, 시중은행들에게 이연평잔을 계산하는데 압박을 줄 수도 있다.

그 중 현재 시장 상황, 특히 지난 몇 달간의 금융 시장을 보고 합리적이라고 판단되는 몇 가지 정책 수단을 골라 어떤 규모로 시장 개입을 하면 0.25%, 0.5% 금리가 오를 것이며, 거기에 맞춰 금융시장이 얼마나 위축되고, 따라서 실물 경기가 얼마나 위축될지를 계산하기 위해 거시경제모형에 수치를 입력해볼 것이다. 그 모델은 몇 백개의 변수가 뒤얽혀 있을텐데, 박사 시절에 공부할 때는 거의 대부분의 변수를 고정시켜놓고 내 연구 주제에 직접 영향을 주는 인과 변수들 몇 개만 넣은 소형 모델을 봤었는데, 현실 상황의 모델이 매우 복잡해져서 기존 연구와는 다른 새로운 도전을 하게 될 것이다.

또한 매우 높은 확률로 결과가 예상과는 다르게 출력되어 이를 보정해주어야하는데, 이를 위해 박사 시절 봤었던 논문의 시장의 특정 상황을 고려하는 변수를 추가를 해보면서 결과를 보정하는 작업을 계속 거치게 될 것이다. 심지어는 본인이 연구할 때 확인했던것처럼 장기간 초저금리가 지속되고 있기 때문에 그 논문과 본인 논문을 결합하는 새로운 모델을 만들고 테스트를 해 봐야할 수도 있을 것이다.

방법2. 컨설턴트가 풀어내는 방식

지난 10년간 금리를 올린/내린 데이터를 살펴보고, 0.25%, 0.5%씩 증감이 총 15차례 있었다는 데이터, 그 때 각각 경제성장률, 각 산업별 성장율이 어떻게 변했는지 중앙은행의 분기별 산업 보고서를 인용해서 그래프를 만들 것이다. 그 다음엔 IS-LM 같은 더 이상 경제학계에서는 잘 쓰이지 않는 그래프를 놓고 LM 커브가 좌측으로 이동하면서 경기 위축이 발생하는데, 그 움직임은 아까 위에서 구한 저 그래프의 결과값과 비슷하도록 그래프 보정을 해 놓을 것이다.

또는 초저금리로 인해 경제 정책이 반영되는 방식이 달라진다는 사실을 자사 컨설팅에 반영하기 위해 월 스트리트 저널에서 15년 경력의 기자를 전문가로 초빙해 자문을 구할 것이다. 경제 정책에는 외연이 깊지 않은 그 기자가 미국에서는 초저금리 때문에 연방준비제도(FED)에서 관련 연구를 하는 Harvard, MIT, U Chicago, Princeton 출신 경제학과들을 대규모로 초청한 프로젝트를 진행중이라며 관련 조언을 해준다면, 컨설턴트는 이자율을 올리면 각 산업별로 어떻게 영향을 받아서 산업별 성장률이 영향을 받고, 산업별 비중이 우리나라에 어떻게 나뉘어 있는데, 그 두 값을 곱한 값으로 국가의 경제성장률이 어떻게 움직일 것이라고 예측하는 단순하지만, 겉으로 보기에는 매우 화려해보이는 PPT를 준비할 것이다.

 

왜 전략 컨설팅이 사양산업이고, 머신러닝이 떴을까?

저 위의 전략 컨설팅 스타일 발표 자료와 논리 전개 방식은 높은 수준의 전문 지식을 필요로 하지 않는다. 자기 산업 분야에 특화되어 있는 몇몇 업계별 경력직 컨설턴트가 아니면, 대부분이 업계 지식 및 논리를 통해 수백개의 가정을 이용해 본인들의 논리를 만들어내고 있다.

하지만 위의 논리는 대부분은 선형 관계의 논리에 국한되어있다. 학문적인 깊이, 사고의 깊이, 지식의 깊이를 통해 남들이 보지 못하는 지점을 바라봐야하는데, 그러한 논리들은 다른 차원의 지식을 체화하면서 만들어낼 수 있는 논리, 즉 비선형관계에 기반한 논리들이기 때문이다.

머신러닝 혹은 데이터 마이닝, 데이터 사이언스는 데이터에서 쉽게 찾아낼 수 없는 다중 패턴(Mutl-pattern), 비선형 패턴을 찾아내기 위한 계산통계학적인 방법이다. 기존에는 거의 대부분의 데이터 분포가 정규분포에 수렴했고, 그래서 특별히 비선형 패턴을 찾아야할 필요가 없었다. 그러나 오늘날은 슈퍼마켓 매출액 하나를 계산하더라도 다양한 시장참여자들의 행동을 모두 고려하는 마르코프 결정 과정이 필요한 시대고, 위의 선형 방정식으로 남들이 보지 못하는 인사이트를 도출하는 것은 불가능에 가깝다.

 

나가며 - 산업계가 컨설턴트를 외면하는 이유

A를 위한 방정식을 만드느니 경험이 많은 업계 종사자들은 차라리 경험에 따른 자신의 직관을 믿고 사업을 할 것이다. 컨설턴트에게 수억원을 주고 받은 A보다 경험에서 나온 직관이 B에, 어쩌면 C에 가까울 확률이 더 높기 때문이다.

위에서 지적한대로,

  • 무수히 많은 가정에 기반해야하고,
  • 그 가정들이 제대로 검증되지 않은 경우가 빈번하고,
  • 더 나아가서 그들의 결론은 Linear 방정식에 국한되어 있어서

오늘날의 전략 컨설턴트가 가지고 있던 엣지는 점차 사라지고 있다. 데이터는 비선형 방정식을 필수적인 접근 방법론으로 삼을만큼 고도화 되었고, 컨설턴트의 선형적 문제 접근은 우리시대의 비즈니스에 유용한 인사이트를 주기에는 명확한 한계점이 존재한다.

 

Picture

Member for

6 months
Real name
Keith Lee
Bio
Head of GIAI Korea
Professor of AI/Data Science @ SIAI