Skip to main content
Keith Lee
Head of GIAI Korea
Professor of AI/Data Science @ SIAI
호기롭게 서버 이전하다가 망쳐서 하루 날리며 서버 이전을 시작했고,
2주일 만에 일단은 돌아가는데 무리없는 서버를 만들었고,
그 사이에 과거 개발이 만들어 놓은 웹페이지에 대한 불만만 잔뜩 쌓였다
10월 3일까지 서버 공부를 잔뜩 했다고 자신감이 좀 붙었던 그 무렵, 어차피 별 것 없겠지라는 생각으로 10월 7일~9일 연휴 사이에 서버 이전을 싹 완료하겠다고 자신만만하게 떠들었었다. 결과는 오늘 글의 제목에도 나와 있듯이 참혹했고, 10일 새벽에 출근하려는 직원들에게 아예 출근하지 말고 하루 더 쉬어라고 메세지를 보냈었다. 그 날 밤을 꼴딱 샜는데, 아예 우리 서버에 접속조차도 할 수 없었으니까.
세법 개정안 의결, 내년부터 신혼부부 증여세 3억원 공제받는다
자녀세액공제 확대·영유아 세액공제 한도 폐지 등 민생법안 대거 통과
가업승계 증여도 완화, 최저세율 구간 현행 60억원→120억원 이하
세법-개정-내용-수정본
신혼부부 증여세 공제 한도 확대, 가업승계 증여세 완화 등을 골자로 한 세법 개정안이 국회 기획재정위원회 문턱을 넘었다. 국회는 출산 증여재산 공제를 신설하고 자녀 세액공제도 확대해 결혼과 출산 장려에 나서는 모양새다.이와 함께 서민 지원을 위해 월세 세액공제와 신용카드 세액공제도 확대하기로 했다.
서버 대충 만들었으니 해킹 당하는건 당연한거잖아
그럼 서버 잘 만들어야 되는데, 왜 이렇게 일이 많지?
시킬 문제가 아니라 그냥 내가 혼자서 다 찾아보고 직접 만들어야 되더라
해킹 사건을 어느 정도 마무리하고, Sucuri 담당자들이 우리 서버 앞에 감시 방화벽을 강화하는 추가 비용을 써야 된다, 기존과는 다른 방식으로 서비스를 관리해야 된다 등등의 각종 메세지를 열심히 보내주던 9월 말 무렵이다. 솔직히 말해서 우리 회사가 미국에 있었으면 계속 썼었을 것 같은게, 정말 친절하기도 하고, 지식이 많아서 내가 뭘 놓치고 있는지, 어디서 뭘 찾아봐야하는지를 상세하게 알려줬었다. 근데 도움을 받고 지식이 쌓이면 쌓일수록 이제는 내가 직접 한국에서 방화벽 세우고 서비스 돌려야겠다는 생각이 스물스물 올라오더라. 아무것도 모르는 주제에 어줍잖게 줏어듣고 머리가 커진 셈이다.
해킹 당해서 사업 접을 뻔 했는데,
또 해킹 당하고 또 접을 뻔 하고 나니,
이젠 진짜 내가 만들어야겠다 싶더라
지난 9월 18일의 일이다. 아침에 일어나니 당시 방화벽 서비스를 쓰고 있던 Sucuri라는 회사에서 메일이 10개가 와 있더라. 우리 웹사이트 15개 중에 10개를 방화벽 시스템 안에 등록해 놨는데, 10개 모두 해킹을 당했단다.
개발자만 안 뽑았더라면
돈도 아끼고, 회사 서비스도 좋아졌을텐데
하고 싶었던 사업모델들도 지금보다 훨씬 더 키워놨을 수 있었을텐데
마켓컬리를 운영하는 김슬아 대표가 한 인터뷰에서 "지금도 개발자만 없으면 적자 폭을 크게 줄일 수 있다"는 표현을 쓴 적이 있다. 회사 크기는 훨씬 더 작은 회사지만, 그 구절을 읽으면서 마음이 찡하더라. 나 역시도 상황은 크게 다르지 않았기 때문이었고, 결국 나는 개발자들을 다 내보내고 회사를 운영하고 있다. 명색 IT회사라더니 왜 개발자 다 내보냈다고 비웃는 경우도 보고, 주변에서는 "네가 아무리 혼자서 다 할 수 있다고 해도 한계가 있지 않겠냐"며 걱정해주시는 분들도 있다. 실제로 회사 업무에 막대한 지장을 주고 있기도 하고, 개발자 없이 IT서비스를 만들고 돌리는게 이렇게 힘든 거라는 걸 절감하면서 가끔은 모든 걸 다 내려놓고 싶은 순간도 있다.
영국 에너지 기업 코리오제너레이션 & BP, 런던서 투자신고서 제출
코리오의 ‘차세대 해상풍력 프로젝트’, 넷제로 달성의 중추적 역할 수행
에퀴노르·오스테드 등도 국내 시장 진출, 향후 폭발할 잠재력에 기대 
renewable_energy_PE_20241029
영국 에너지기업 두 곳이 우리나라 해상풍력 개발 사업에 총 11억6,000만 달러(약 1조5,000억원)를 투자한다. 이번 투자는 윤석열 대통령의 영국 국빈 방문 중에 결정됐다. 정권 교체와 함께 입지가 흔들리고 있는 태양광과 다르게 해상풍력은 윤 정부가 적극적으로 시장 육성을 공약한 만큼 향후 전망이 밝은 상황이다.
Web novel to Webtoon conversion is not only based on 'profitability'If the novel author is endowed with money or bargaining power, 'Webtoonization' may be nothing more than a marketting tool for the web novel.


국내 대기업 급여 산정 방식은 학위를 연차로 전환 계산해 모델 의미 없어
해외 방식 급여 산정시 학위 별 더미 변수 설정, 급여 성장률과 결합으로 분석 가능
더미 변수 설정 없이 단순 '인공지능 계산'으로는 잘못된 결론 얻을 수 있어
보통은 새로운 모임에 가면 공부를 많이 하고 왔다는 사실을 숨기는데, 본의 아니게 전문성이 담긴 발언을 꺼낼 수밖에 없는 순간이 오고, 결국 남들보다 가방 끈이 좀 더 길다는 사실을 토로하면 항상 받는 질문이 있다. 지식 수준이 높아진 것은 잠깐의 대화로 감을 잡을 수 있는데, 실제로 시장에서 그 가치를 더 높게 쳐 주느냐는 것이다.
Not the quality of teaching, but the way it operatesEasier admission and graduation bar applied to online degrees


Asian companies convert degrees into years of work experienceWithout adding extra values to AI degree, it doesn't help much in salary


The relationship between a commercial district and the concentration of consumers in a specific generation mostly is not by causal effectSimultaneity oftern requires instrumental variables


고분산 데이터에는 0/1 맞추기 모델 무의미, 새로운 데이터에서 같은 정확도 내기 힘들어
해석 가능한 인공지능은 결국 기초 통계학 모델로 돌아가는 것
무조건 '인공지능'='고급모델'='정확한 모델' 아냐, 잘못된 모델 쓸 경우 잘못된 해석 밖에 나오지 않아
5년 전의 일이다. 보스턴 지역의 주거지 관련 데이터를 이용해, 방 크기, 방 숫자 등의 정보를 이용해 집 값, 혹은 월세를 맞추는 단순한 '인공지능' 학습자료가 SNS를 통해 좀 퍼진지 얼마 지나지 않았던 상황이었는데, 그 모델을 어디까지 써 본적이 있냐는 홈페이지를 만들어 놓은 어느 발표 모임에서 데이터 과학을 이용한 타겟 광고 모델을 설명해달라는 요청을 받은 적이 있다. 그렇게 수준 낮은 발표 모임에 유명 대기업이 상당한 후원을 하고 있다는 사실에 충격 먹기도 잠시, 그 데이터를 다양한 '인공지능' 모델에 넣어봤고, 그 중 가장 잘 맞는 모델이 '딥러닝' 모델이었다는 어느 SNS 포스팅을 보여주며 자기들이 굉장한 실력자들이 모여 있다고 자랑을 해 놓으셨더라.
One-variable analysis can lead to big errors, so you must always understand complex relationships between various variables. Data science is a model research project that finds complex relationships between various variables. Obsessing with one variable is a past way of thinking, and you need to improve your way of thinking in line with the era of big data.
When providing data science speeches, when employees come in with wrong conclusions, or when I give external lectures, the point I always emphasize is not to do 'one-variable regression.'
With high variance, 0/1 hardly yields a decent model, let alone with new set of dataWhat is known as 'interpretable' AI is no more than basic statistics


수학, 통계학에 기반한 Data Science 교육이 이뤄져야 하는데, 단순 부트캠프 수준의 코딩 교육만 이뤄진다는 비판을 시작한지 6년이 됐다. 비판을 꺼내니 온갖 비판을 맞는 중인데, 그 중 가장 안타까운 내용이
대기업가는데 저런 거 필요없다. 코테만 통과하면 된다
라는 표현이다. (코테=코딩 테스트)   난 미국서 직장 찾을 때 나같은 수리 모델링 훈련을 받은 사람들을 코딩 테스트로 거르려는 직장들은 모조리 무시했었다. 나만 그랬던 것도 아니고, Data Science 관련으로 비슷한 직군의 구직하는 애들을 만나봐도 '거긴 coding test 보는 곳'이라며 비웃으며 말했던 기억도 있다. 우리는 Matlab, R로 학교에서 수리 모델링하는 훈련을 받은 사람들인데, 난데없이 Java, C로 생뚱맞은 성배에 1/1~ 1/10까지 물 배열하는 알고리즘 짜라니까 황당할 수밖에.
S대 학석박 후 포닥 과정 밟고 있는 SIAI 학생의 제보다
이야기를 들어보니 MIT 학부 신입생들은 XX통계 첫 시간에 heteroskedasity를 배운답니다. 선형회귀 기본 정도는 알아서 떼고 오고, 가우스-마르코프 기본가정들은 숙지해오라는 것이겠지요. 케임브리지 XX학과 신입생들은 첫 시간에 ANOVA를 배우고 벡터공간에서 직각삼각형 형태로 분산이 해체되는 직관을 배운다고 합니다. t-test까지는 알아서 공부해오라고 하고요. UC 버클리 XX통계는 전반부에 PCA, 시계열까지 다 떼고, 후반부는 실제 데이터셋으로 트레이닝합니다. S대 XX는... 제가 석사생들 붙잡고 평균, 분산 가르쳐야 합니다. XX에 XX통계가 없어서 사회과학대학까지 가서 듣고 오는데, 대학원생 대상 '고급 통계학' 중간고사가 겨우 1변수짜리 단순선형회귀까지 다루고, 기말고사까지 행렬 한번 안 나옵니다.
지난 12일, 데이터 사이언스 경영학회 세미나에서 최근 이슈가 된 챗GPT가 기반하고 있는 대형언어모델(Large Language Model, LLM)의 방법론을 풀어내는 설명과 함께, 활용법이 노동 시장을 바꾸는 부분에 대한 예상을 정리했었다. 구글 검색을 해보니 챗GPT가 출시된 지난해 11월부터 올해 5월 초까지 무려 433,000개의 뉴스 기사가 'chatgpt'라는 검색어에 걸렸다. 뉴스 업계에서 광고 기사 1개 내는데 지불해야하는 비용을 감안하면 수십조원의 광고 비용을 쓴 것이나 다름없을만큼 화제가 됐다는 뜻이다. 한국어로도 구글 검색 기준 무려 16,600개의 기사가 검색이 됐다. 영어권과 한국어권의 기사 공급량의 차이를 감안해도 한국에서 큰 화제가 되었다는 것을 보여주는데 큰 무리는 없는 수치일 것이다.
아래는 연구자들 커뮤니티로 유명한 모 웹사이트에서 본 글이다. (링크)
수 많은 AI 대학원의 위험성(?)은 다음과 같습니다. CS 분야를 원래 전공했거나 다른 분야를 전공했지만 수학이 강한 일부 연구자를 제외하면 대부분의 AI 연구자들은 제대로 아는 것이 너무 없습니다. 공부를 열심히 하지 않는다는 뜻이 아닙니다. 급변하는 유행을 따라 경쟁적으로 논문을 쓰다 보면 연구 경험이 별로 없고, 실적이 급한 젊은 연구자 입장에서는 대학원 과정 동안 깊이 있게 공부하면서 차분하게 기본기를 익히기 어렵기 때문입니다.
스위스 AI대학(Swiss Institute of Artificial Intelligence, 이하 SIAI)는 스위스의 대학 교육 기관입니다. 2021년 8월에 개교해 현재까지 70여명의 한국인 학생들이 SIAI를 거쳐갔습니다. 학생 구성은 국내 최상위권 명문대인 SKY, SKP를 비롯, 석·박사 학위자가 전체의 40% 이상으로 대부분의 학생들이 국내 최상위권 대학에서도 받을 수 없는 글로벌 레벨의 데이터 과학 교육을 받기 위해 와 있습니다. 한국인 학생들의 수준이 글로벌 명문대에 못지 않은 가장 큰 이유는
  • 국내 그 어느 대학에서도 볼 수 없는 글로벌 최상위권 교육 프로그램
  • 현실 적용의 고민이 가득 담긴 연습문제, 시험문제 및 논문 지도 과정
  • 온라인 교육을 통한 접근성 강화
  • 높은 수준의 학생들로부터 만들어지는 학생 네트워크
등을 들 수 있습니다.