Skip to main content
Keith Lee
Head of GIAI Korea
Professor of AI/Data Science @ SIAI
다음은 필자가 올 초 어떤 학생으로부터 받은 메일이다. 그냥 조금 딱하다는 생각이 들었기에 공유한다.
안녕하세요. 저는 제가 고등학생이던 파비 블로그에 댓글에 열려있던 때부터 최소 일주일에 한 번씩 대표님의 블로그에 들어가 글을 보고 있는 20학번 대학생입니다. 대표님의 글을 고등학교의 다소 늦은 시기에 접한 탓에 경영학과로 대학에 입학했으나, 대학에 들어와 수학과와 통계학과를 복수전공하고 있습니다. 제가 재학 중인 학교는 전과가 불가하여 불가피하게 3전공을 하고 있습니다. 제가 이렇게 이메일을 드리는 이유는 기성의 학부에서도 대표님께서 중시하시는 지식을 쌓는 게 가능하다는 하나의 사례가 되고자 함과 함께 그것을 가능케 해주신 대표님께 감사를 표하고자 함입니다.
신입 개발 면접을 보는 중에, 가끔 특정 학원 출신들을 연속적으로 보게되는 경우가 있다. 포트폴리오 만들어 놓은걸 보면 엄청 화려한데, 거의 대부분, 매우 심각하게 지식이 없는 상태고, 질문을 해도 고민하는 느낌이 전혀 없는, 암기한 내용을 그대로 읊고 있다. 어디 SI회사 가거나, 아예 개발자 구직하는거 포기해야겠다 싶은 생각이 든다.   첫 지원자한테 그렇게 속았다가, 포트폴리오가 판박이인 지원자가 둘 셋 늘어나면서, "아, XYZ 학원에서 소스코드 주고 복붙시켰구나"는 결론을 얻는다. 다시는 그 학원 출신들을 면접보지 않게 된다.   딱히 포트폴리오를 만들어주는 방식으로 학원 형태의 구직 활동 지원 시스템을 안 갖추고 있고, 갖출 계획도 없는 Data Science 전문 과정을 담은 대학 학부, 대학원 레벨 교육을 하고 있는데,
작년 이맘때쯤의 일이다. SIAI 학교 설립, 인가, 강의 등등으로 정신없이 바빠 회사 운영에 거의 손을 놓고 있던 무렵이었는데, 우연히 어느 커뮤니티 게시판에 우리 회사, 정확하게는 내가 운영하는 학교 관련된 비방 글이 잔뜩 올라와 있다는 제보를 받았다. 온갖 음해가 떠돌아 다니고, 자기들끼리 과대망상으로 헛소리들을 늘어놨던데, 그 중 어이가 없었던 멘트 중 기억나는게
파비클래스 듣고 나면 석사 학위 주는거 아냐? 개꿀인데? 그 딴 석사 그거 해 봐야 쓰레기지
라는 내용이었다.   공개한 시험 문제를 보고도 저런 평가 밖에 못 내리는 수준들은 아마 MBA AI/BigData 과정이나 BSc Data Science 편입과정 첫 학기 시험문제는 커녕, 아예 첫 학기, 첫 수업, 첫 과제의 연습문제도 못 푸는 수준일 것이다.
국내 대학원들이 고급 지식을 전달하고 학문적 연구를 위한 곳이 아니라, 학생 숫자를 채워서 돈을 벌기 위해 '학벌 세탁' 전용으로 돌아가고 있다는 강도높은 비난을 여러차례 해 왔다. 이 블로그를 오래 읽은 분들은 이젠 귀에 못이 박힐 정도로 들었을 것이다.   나의 '구린 학부 학벌'을 숨길 수 있는 '명문대 대학원 학벌'이 반드시 필요하다면 그들의 사정이겠지만, 현실적으로 봤을 때, 아무도 당신의 학벌이 세탁되었다고 생각하지 않을 것이다. 한국 교육 시스템이 '서열화'를 매우 잘 하는 시스템이라, 어지간해서는 당신의 잠재력을 제대로 평가했을 것이라는 믿음이 강하기 때문이다. 이렇게까지 맹폭격을 해서 미안하지만, 이게 대기업 인사팀이라는 곳에서 갖고 있는 기준 값으로 알고 있다.   이런 시스템에서 재수까지는 억울한 케이스가 있으니 이해될지 몰라도 3수, 4수까지 해 가며, 아예 10수까지 해가며 대학을 바꿔 가봐야 세상은 녹록치 않다.
지난 봄에 받은 MBA AI/BigData 학생들 중 일부만 Machine Learning 수업시간에 살아남은 성적표를 받은 날, 한국 애들이 어차피 절망적인 상태인걸 뻔히 알고 있고, 직장이다 뭐다 공부할 시간 없다는 것도 아는데, 그냥 무리하지 말고 아예 접을까, 나도 학교 운영하기 귀찮은데... 돈도 안 되고... 진짜 이거 왜 하지... 이런 생각을 하던 무렵이었다.   일전에 한번 공유했었는데, S대 데이터 사이언스 석사 과정에 들어갔던 우리 학교 학생 하나의 증언대로, 제대로 가르치면 3명만 남고 40명 이상이 도망가버리는 그런 석사 과정이 한국 사회의 냉정한 현실이니만큼, 아예 학위 장사하라고 안타까운 눈빛을 보여주시던 많은 분들의 소리없는 응원도 생각나고 그렇더라.   학교 게시판에 올리고, Global MBA (or Associate) 프로그램 만들어야 될 것 같다고 그랬더니,
Global MBA 라는 이름의 교육 프로그램을 추가하면서 수 많은 고민이 있었는데, 가장 괴로웠던 부분이 아래 2가지의 조합이었다
  • MBA AI/BigData에서 쫓겨 내려가는 학생들이 '같은 내용을 공부라도 할 수 있는' 학습권 보장
  • 낙오하는 학생들이 최소화 되면서, 동시에 돈 값하는 공부
  첫번째 포인트는 '너네가 공부 안 했으니 쫓겨 내려가는거다'라고 하면 할 말은 없는데, 그래도 공부할려고 큰 마음 먹고 온 애들한테 '너네 못 하니까 나가라'고 하는게 너무 마음이 괴로워서였고, 두번째 포인트는, 그래서 너무 쉽게, 아무데서나 배울 교육을 할 거면 뭐하러 학교 만드나, 나도 학위 장사꾼 되는거지... 라는 괴로움의 반영이다.   Global MBA는 일단 아래의 방식으로 2개 문제를 해결하려고 한다
요즘 내 화두는 나도 많이 부족한 Critical thinking, logical thinking (이하 CTLT)을 어떻게 학생들에게 가르치느냐다. 교과서에서 지식을 아무리 배워봐야 써 먹으려면, 결국 논리적인 사고력을 이용해 현실과 접목시킬 수 있어야 하니까. 직원을 뽑을 때도 CTLT를 가진 직원을 뽑기 위해 노력하는데, 거의 없었고, 어떻게 해라고 상세하게 가이드를 주고 일을 시키면, 일 끝나고 머리가 너무 아프다는 불평을 은근 듣는다. 관련해서 우리 직원 중 하나가 SNU Life에서 글 하나를 퍼와서 이래저래 묻던데, 그냥 몇몇 구절만 공유해보자.
-미국은 CEO부터 신입까지 철학도 있고, 놀땐 같이 어울리며 잡담해도 업무 들어가면 진지해짐
가끔 학생들이랑 이런저런 이야기를 하다보면 주워 듣는 업계 현실이나, 외부에서 어떤 생각들을 하는지 넘겨짚을 만한 사건들이 있다. 어느 학생이 "데싸 면접에서 알고리즘 물어보고 SGD 막 이런 거 왜 더 빠르냐고 물어본다"며 욕이란 욕을 다 했다는 이야기, 우리 MBA 학생들이 그걸 듣고는 또 더 욕을 해대면서 한국 수준 진짜 절망적이라며 썅욕하는 이야기, 우리 대학원 상담한다고 찾아와서는 "거기서 배우면 어디서 일할 수 있어요?" "배운거는 어디에 쓸 수 있어요?" 라고 묻길래 속이 터졌다는 이야기, 그런 한심한 질문하는 학생들 거르고 제대로 된 사고 방식 만들려고 세운 대학원인데, 엉뚱한 질문으로 떠 보길래, 넌 어차피 서울대, 카이스트 대학원 못 갈꺼니까 그냥 서성한 데이터 어쩌고나 가라고, 꺼지라고 해 줬다는 이야기 등등  
"거기서 배우면 어디서 일할 수 있어요?" "배운거는 어디에 쓸 수 있어요?"
필자는 얼마 전 KAIST 최호용 교수님의 부탁으로 기술경영 전공의 ‘CEO세미나’라는 수업에서 강의를 했다. ‘순한 맛’ 강의를 해 달라는 신신당부가 있었지만 결국 ‘매운 맛’이 되어버렸는데, 아무튼 필자는 2시간 동안 외부 강의에 나가면 항상 하던 이야기인 우리나라의 교육 수준, 특히 DS 교육 수준에 대해 이야기를 했다. 필자가 수업에 쓰는 교재들을 활용해 엉망인 학부 저학년 교육이 고학년 교육도 망치고, 그래서 졸업생 수준도 떨어지고, 그들을 채용하는 기업까지도 엉망이 되는 악순환을 지적한 것이다. 우선 필자가 운영하는 대학의 입학 전 예비교재 중 하나를 띄워놓고, t검정(t-test)을 모르는 사람은 없을 것이다, 아니 최소한 Z검정(Z-test) 모르는 사람은 없을 것이다, 이 둘의 차이는 분포함수가 정규분포이냐 Student-t 분포이냐 밖에 없다, 전체 집단에 관한 정보(정확히는 분포함수 정보)의 유무가 분포함수의 차이를 만든다, 그렇지만 일반적으로 학교에서는 ‘분산’값을 알고 있는지에 따라 t검정과 Z검정을 구분한다, 이런 말을 하면서 수업을 시작했다.
필자가 이미 여러 글에서 수십 번은 강조한 내용이지만, 우리나라의 공교육은 그저 쉽게, 쉽게만 따지다가 완전히 무너졌다. 사실 공교육 실패는 사교육이 존재하는 한 어느 정도는 보완할 수 있다고 생각하는데, 지난 몇 년 동안 우리나라 교육계에 발을 담그면서 더 큰 문제가 도사리고 있다는 사실을 깨닫게 됐다. 우리나라 교육 문제의 근본적인 원인은 바로 “결과 위주” 시스템이다. 이는 필자가 계속 언급했던 “이론 모델링 능력”에 대한 철저한 외면, 혹은 “암기식 속도전”에 대한 맹목적인 투자 정도로 요약된다. “철학이 없는 교육”, “보잘것없는 ‘성과’에만 집착하는 교육”이라고 평가하는 사람도 봤다. 의사결정 구조와 연결해서 다시 표현하자면, ‘탁상행정 공무원들의 성과 보고서 중심 문화가 낳은 투자 실패’가 된다. 우리나라의 공공기관이나 대기업에는 공무원의 무지를 악용해 세금을 지원받으려는 ‘업자’들이 가득하기에 이들을 걸러낼 능력이 없다면 (기적이 일어나지 않는 이상) 투자는 무조건 실패하게 된다.
그간 교육을 하면서 출신 학문 별로 사람들이 인식하는 지식의 격차에 대한 관점이 크게 다르다는 걸 알게 됐다. 우선, 아래의 3가지 형태로 표현된, 신호 세기 형태로 표현되는 지식에 대한 접근 관점을 정리해보자.
  • A - 계단형: 지식은 계단 형태로 쌓인다
  • B - 누적형: 지식은 고르게 누적형태로 쌓인다
  • C - 구분형: 지식은 여러개의 영역으로 구분된다
  우선, "영어를 잘 한다"는 표현을 좀 더 구체적으로 살펴보면서 위의 A, B, C를 이해해보자. 영어권에는 누군가가 말을 잘하고 글을 잘 쓰면 아마 "Eloquent"라는 단어를 이용해 "영어를 잘 한다"고 생각할 것이다. 외국인 대상 영어 강의인 ESL 강좌를 가르치는 교사들은, 발음이 아니라 자기의 생각을 잘 전달할 수 있느냐로 영어를 잘 한다고 생각한다. 한국인들 대다수는 누군가 혀를 잘 굴리면 "발음이 좋다", 즉 "영어를 잘 한다"고 생각한다.
한국식으로 치면 연례 총회(?) 같은걸 했는데, 그 날 학생들에게 들은 이야기, 강의 후기로 들은 이야기들은 공유할만한 것 같아서 좀 정리해봤다.  

1. 수학적으로 그렇게 큰 도전이 아니라는 게 좀 많이 알려졌으면 좋겠다

학부 경영학과 출신인 어느 학생의 이야기다. 첫 학기의 Math & Stat for MBA I 수업 초반에 선형대수학, 미분방정식 다 알아야 되는 과정인거 아니냐, 너무 힘들다~ 학생들이 미리 준비하고 올 수 있도록 많은 정보를 알려주거나, 그 전에 Prep class를 마련해줘야 한다고 주장했던 학생이다.   어느 시점부터 MBA 상위권으로 성장했는데, 이번 총회 모임 때
수학적으로 그렇게 큰 도전이 아니라는게 좀 많이 알려졌으면 좋겠다
우리 SIAI 학생들이 TOEFL 100점 (각 영역 21점) 이상 or 영어권 학위 요건을 충족 못/안 시키는 경우, 아래의 구성으로 된 16주짜리 영어 수업을 들어야 졸업할 수 있다.
  • 2016년 미국 부통령 후보 토론회 (영상 링크) 영상 컨텐츠 Role-play
  • 각 토론 주제별 수업 시간 토론
  • 자기 의견 주장하는 에세이
그냥 TOEFL 100점짜리 수준의 평범한 학부 수준 영어 수업이라고 생각하고, 담당 영어 강사 분이랑 조율을 했었다. 학부 시절에 비슷한 레벨의 고급 영어라는 수업을 몇 개 들으며 영어 공부를 했던 기억이 있어서 크게 이상하다고 생각하질 않았는데, 오히려 Role-play 흉내내기 영상을 미리 만들고 오니까 수업 시간 토론이 더 편하지 않을까 싶었는데,
"Approved by the committee of experts"라는 메일 받고도 다시 1주일이 더 지나 공식 학위 인가증(?)을 받고 난 다음 쓴 글이다.
학위 인증 절차 관련해서 다른 기관에 피해 줄 것 없이 속 시원하게 정보가 공유됐으니, 특히, 모 학교랑 결별하고 난 다음에 상세사항 언급하기가 법적 이슈가 걸려있어 버거웠는데, 진상짓을 하는 학생들 일부가 그 학교를 괴롭혀서 내가 밝히기 어려웠던 내용들마저 외부 공개된 상태니까, 더 이상 누구 배려해 줄 것 없이 몇 가지 불만(?)이었던 부분, 특히 지원자들에게서 겪은 경험담을 좀 속 시원하게 공개해보자. 선 한 줄 요약하면, 한편으론 미안한데, 나도 사람이라 이 분들이 여기저기 쓰신 흑색선전에 불편하긴 마찬가지였다.  
아래는 귀국 후 20일만에 eduQua 인증 심사 합격 통보를 받고 난 다음에 쓴 글이다.
심사 최종 합격 연락을 받았다. 국내에서 대학 설립해볼까 싶어서 처음 사립학교법 조항들 뒤적이던 때부터, 대학 인수하겠다고 전국의 "폐교 위기"에 직면한 학교의 (숨겨진) "주인"들 만나던 시점도 생각나고, 스위스 학교들이랑 협상하던 일, 그리고 변호사랑 계약서 놓고 투덜대던 일들 같은게 주마등처럼 지나갔다. 만세부르고 뛰어다닐 줄 알았는데, 별로 감흥이 없다. 이제 Entry고, 이게 시작인 걸 무의식 중에 알고 있기 때문이겠지. 굳이 따지자면, 눈 앞에 있는 더 큰 고민 때문에 괴롭고, 스트레스가 곱절로 더 쌓인다.  
스위스의 사립대학 민간인증 기관인 eduQua의 심사를 받고 귀국했던 날 밤에 쓴 글이다.
국내 대학은 설립 전에 대략 2년 정도 교육부의 심사를 받고, 졸업생은 커녕 입학공고를 하기 전에 사전인가를 받아야 한다. 심사 내용 중, 인적요건과 물적요건을 다 충족시키려면 수도권에선 대략 2,000억원 남짓이 필요할 것 같고, 지방으로 내려가도 최소 500억은 있어야 된다. 대학원대학처럼 수익성재산 요구조건이 100억이어도 300억은 있어야 될 것 같다. 심사받는 2년간 인적요건을 충족시키기 위해 뽑은 직원들에게 수입 0원 상태로 월급을 꼬박꼬박 챙겨줘야하는건 말할 것도 없다. 사이버대학도 수익성재산 35억, 토지/건물 요건 충족시키려면 최소 100억이다. 수도권은 300억 정도, 서울시내는 그 이상을 생각해야 될 것 같다.   스위스나 미국의 공식적인 인증은 정부 기관이 지정한 민간기관에서 실사를 진행한다.
스위스의 사립대학 민간인증 기관인 eduQua의 심사를 받고 귀국 비행기를 기다리며 쓴 글이다.
어느덧 담당자를 알게 된 지 1년이 됐다. 온라인 대학인데 왜 On-site 심사한다고 스위스까지 오라는 거냐고 불평한지도 올 7월이면 만 1년이다. 형식상 마지막 절차였던 On-site 심사가 코로나-19로 최초 계획했던 7월부터 무려 9개월이나 지나서야 진행되느라 진통을 겪었지만, 미뤄지며 향후 1-2년간 했어야할 서류 절차들을 당겨서 진행한 덕분에, 내년, 내후년엔 Zoom으로만 미팅하면 충분하고, 굳이 스위스를 안 와도 된다니 고마울 뿐이다. 이제 몇 가지 그 쪽 절차상 작업들이 끝나고나면 공식적으로 Certificate을 받을 수 있겠지. 길고, 괴롭고, 힘든 과정이었다. 거기다 1주일에 2-3개씩의 강의를 계속 준비하느라 몸은 완전히 만신창이가 됐네.  
아래는 MSc AI/DS 입학시험으로 이름이 변경될 예정인 오픈 강좌를 듣고 시험을 치른 분의 강의 후기다. 시험 문제 및 강의 후기 일부는 다른 글에 남겨놨으니 참고하시기 바란다. 자세한 개인 사정을 알지는 못하지만, 수학 쪽 전공자인 것 같고, 국내 어지간한 학부 출신과는 달리 수학으로 교육 수준이 탄탄한 분, 현재 업무는 외국계 보험사에서 수학 기반의 논리구조를 활용하는 업무를 하는 분으로 보인다. 가끔 회사 블로그 글이 외부에 돌 때마다 MBA 따위는 제쳐놓고 MSc 입학 따윈 껌으로 할 수 있다고 착각하는 메세지를 보내는 분들에게, 당신이 과연 이 분보다 훨씬 더 뛰어난 능력자인가는 질문을 던지고 싶다.
우리 SIAI의 Signature에 해당하는 Business 특화 수업들은 2개 수업을 통해 관련 통계학 지식과 주요 이슈를 배우고, 그 지식을 현실 Case에 응용해서 문제 풀이를 하는 형태로 구성되어 있다. 총 8개 수업에서 3개 주제로 그룹별 문제 풀이를 발표하고, 다른 그룹의 문제 풀이를 비판하고, 비판에 따라 자기 풀이를 보완한다. 그간 봐 왔던 여러 MBA 수업 방식을 우리 사정에 맞게 좀 변경해봤는데, 이런 수업 방식과 엮으려니 참 쉽지가 않더라. 그래도 노력 중이다. 아래는 Cohort analysis라는 주제를 현재 IT업계에서 쓰는 방식대로 지난 주, 지지난 주, 지지지난 주 방문자들 동향, 이딴 분석(?)으로 돌리는게 큰 의미 없고, Sampling의 다양한 방법들, Factor analysis로 풀어내는 계산법 등을 응용해서, DGP 속 구조를 파악하는게 핵심이라는 강의를 한 후, 그걸 문제로 바꾼 내용이다. 어쩌다보니 최근 대선에 영향을 받아버렸는데,
글 후반부에 우리학교 Machine Learning 과목의 이번학기 Term paper를 공유해 놨는데, 저 문제를 만들 때 했던 생각들 썰풀이로 시작해보자.   신생 대학교에 대한 여러 질문에 대한 답변 드리려고 잠깐동안 단톡방을 운영한 적이 있었다. 분탕이 엄청 몰려들었었는데, 그 중 음해 세력인지 아닌지 확신은 없지만 어느 CS 전공자로 보이는 분이 한 말이 있다.
DNN이 틀렸다는걸 증명해서 보여주면 되지 않을까요?
  우선, 이미 DNN이 만능 솔루션이 아니라는걸 수십번도 더 블로그를 통해서 보여줬고, 아니 몇 년간 그걸 증명하는 블로그를 운영해왔고, 내가 아니더라도 다른 수 많은 똑똑하신 분들이 DNN이라는 계산방식이 언제 더 낫고, 언제 더 나쁜 계산법이라는걸 설명해놓은 컨텐츠가 널려있다.