AI/DS 기고
LG CNS, 인도네시아 정부 웹사이트 제작 오류로 곤욕 치뤄 해외 IT프로젝트 팀들 대비 팀 전체의 역량 크게 떨어지는 것이 한국 IT 현실 커뮤니티 문화, 협업 문화, 역할 공유 문화 없이 기존 시스템으로는 추격 어려워 해외 프로젝트 수주하고 싶으면 개발 문화부터 바꿔야 지난 10월, 인도네시아 국세청의 핵심 세무행정시스템 코어텍스(Coretax)를 구축하던 LG CNS에 대한 한 인도네시아 정부 관계자의 노골적인 불만이 SNS를 탔다. 처음에는 장관급이, 나중에는 국무총리급 인사가 해당 SNS의 내용을 확인하면서 IT업계 관계자들 사이에는 한 차례 한국 IT프로젝트의 현실에 대한 논란이 일었는데, IT업계 밖으로는 크게 알려지지 않은 상태인 것 같다.
Read More
최신 그래픽 카드만 수만장 구매한다고 AI 기술력 향상되는 것 아냐 글로벌 트렌드는 고급 그래픽 카드보다 계산비용 절감에 더 초점 맞춰져 있는 상황 계산 비용 절감하는 고급 인력 기르는 것이 AI 그래픽 카드 구매하는 비용보다 압도적으로 더 저렴 보여주기식 문화에 이끌려 활용도 낮을 고가의 그래픽 카드에 막대한 비용 쓰는 것 의문점 던져야 지난 4월 런던 출장 길에 올해 가을학기부터 MIT 슬론 경영대 교수로 자리를 옮기는 후안 안톨린(Juan Antolin) 교수와 짧은 점심 식사를 했다. 대화의 주제는 한국이나 영국이나 가릴 것 없이 남들이 다들 AI 기술력을 쌓고 있는 것 같으니까, 우리 회사도 뒤처지면 안 된다면서 무작정 엔비디아 그래픽 카드만 사고 있는 세태, 효율적인 계산을 위해 알고리즘을 개선하기 보다, 서버 확충에만 열을 내는 AI 추종자들에 대한 지식인들의 불만이었다.
Read More
서유럽, 한국 등의 일부 국가들이 제3 AI 생태계 도전 중 한국은 반도체 생산 역량만 있을 뿐, 연구 인재 부족, 소프트웨어 역량 부족 등으로 어려울 것 전망 아랍 지역에 클라우드 인프라 구축되면서 하드웨어 장점 희석 중 인재 확보로 장기전을 노리는 방향으로 AI 정책 전환해야 미-중 간의 AI 기술 개발 전쟁이 치열해지면서, 유럽에서는 미-중과 별개로 돌아가는 제3의 AI 생태계를 구축해야 한다는 목소리가 높다. 이미 미-소 냉전기를 거치며 미국에 기술적 의존도가 높아진만큼, 쉽지 않을 것이라는 우려의 목소리도 있지만, 계속해서 미국에 끌려다녀서는 안 된다는 '유럽중심주의'가 밑바닥에 깔려 있어 쉽사리 포기하지는 않을 것으로 보인다.
Read More가짜 인재만 길러내는 현재의 교육 시스템으로 AI굴기 정책 성공하기 어려워 슈퍼 예산으로 해외 AI반도체 기업 지원하기보다 국내에서 교육 내실부터 다져야 글로벌 수준의 A급 역량 갖춘 인재를 길러내는 시스템 구축부터 지난 4일, 이재명 대통령이 국회 시정 연설을 통해 728조 예산을 한 푼도 허투루 쓰지 않겠다며 2025년도 정부 예산안 승인을 요청했다. 매년 세수 부족으로 큰 폭의 적자를 내며 예비비를 다 소진하고, 심지어 국가 자산을 매각하는 와중인만큼, 긴축 재정을 했어야 하는 상황임에도, 역대 어느 정부에서도 볼 수 없었던 팽창 재정 정책을 내놨다.
Read More
서비스의 개발 논리를 이해하고 구현하는 것보다 무슨 '기술'인지 정보를 알아서 베끼는데 초점 맞춘 기업인들 많아대부분 연구직 출신들이 아니라 IT 개발자들이 머신러닝 코드 몇 줄을 배운 다음 '머신러닝 개발자'가 되었기 때문개발 직군들로 고급 AI상품 만들기 어려워, 한국 인력 상황 감안할 때 AI산업에 계속 투자하는 것은 밑빠진 독에 물 붓기 될 것 한국IT업계에서 개발자로 불리는 기술직군 관계자들을 기업 미팅에서 만날 때마다 자주 듣는 질문 중 하나로 "무슨 기술로 만들었나요?"가 있다. 특정한 사건을 관찰하고, 수식 기반으로 적절한 모델을 만들어서 그 사건 속에 담긴 문제를 해결하는 방식의 훈련을 받았던 입장에서 '무슨 기술'이라는 표현이 처음에는 잘 이해가 안 됐다. 그래서 '무슨 기술'이라는게 무슨 뜻이냐고 물으니 짜증난다는 말투로 "무슨 라이브러리로 만들었냐구요"라며 문제 해결 방식 뒤에는 개발자들에게 제공되는 코드 묶음집이 있을 것이라는 확신을 갖고 있다는 것을 보여줬다.
Read More
지루한 반복 업무 대신하는 챗GPT하지만 지적이고 도전적인 업무에는 벽 느껴챗GPT, 수학적 한계 극복하지 못하면 ‘헛소리 생성기’에 불과해 지난 1년 동안 대형언어모델(LLM)을 둘러싼 과대 광고가 끊임없이 이어졌다. 처음 대형언어모델이 등장했을 때, 사람들은 자신의 일자리가 로봇으로 대체될까봐 두려워했다. 그러나 1년이 넘는 기간 동안 챗GPT를 시험한 지금, 그 걱정은 많이 사그라들었다. 미국의 유명한 언어학자인 노엄 촘스키 교수는 “챗GPT가 헛소리를 내뱉는 고급 챗봇에 지나지 않는다”라며 챗GPT의 본질을 짚었다.
Read More
서울대 A교수, 김박사넷에 올라온 평가에 명예훼손 소송했지만 패소법원, 개인정보의 공익성 판단할 때 김박사넷 위법 행위 아냐교수 사회, 제대로 연구하면 김박사넷 D급 평가 받는다 불만 제기연구 역량보다 학생들 취직 지원하는데 더 집중해야하는 대학원 세태에 대한 지적도같은 사건 계속되면 국내 귀국 고민하는 교수들 늘어날 것이라는 불만도 나와 지난달 17일, 대법원은 서울대 A 교수가 '김박사넷' 운영업체 팔루썸니를 상대로 낸 명예훼손 및 인격권 침해 손해배상 소송에서 원고 패소 판결을 내렸다. 1달 동안 서울대 A교수가 다른 법적 조치를 취하지 않으면서 이달 17일 대법원 판결이 최종 확정됐다.
Read More
통계학 방법론은 상관관계를 추론하는데 그칠 뿐, 인과관계를 추론하는데 쓸 수는 없어노벨상을 받은 그랜져(Granger) 교수의 인과 추론도 인과 관계가 없다는 것을 증명하는데만 쓰여AI가 통계학 방법론을 컴퓨터 의존형으로 풀어내는 계산이라는 이해 없는 가짜 데이터 과학자들 많아'AI로는 되는 것 아닌가요?' 같은 질문하는 학회까지 열리는 최근 실상 쌍둥이가 살고 있는 교외 외딴 시골 마을을 생각해보자. 한 아이는 아침 저녁으로 집 밖에서 흙 먼지를 뒤집어 쓰면서 놀기를 좋아하고, 다른 한 아이는 집에서 비디오 게임에만 빠져산다. 1년 후, 의사가 진찰을 해보니 게임만 하던 아이가 훨씬 더 건강했다는 이유로 밖에서 노는 것은 건강에 나쁘다고 표현하면 논리적으로 말이 될까?
Read More
'인공지능 전문가 = 코딩 전문가 = 개발자' 라는 잘못된 상식이 여전히 시장에 퍼져 있어STEM 전공으로 석·박 훈련을 받지 않은 '시민 데이터 과학자' 만으로 충분하다는 주장 여전히 상존훈련 받은 전문가들에게 조롱의 대상이 될 뿐인 결과물에 수십조원 예산 낭비 말아야 최근들어 머신러닝, 딥러닝, 생성형AI 등의 이름으로 불리고 있는 계산과학(Computational Science)을 처음 접했던 것은 박사 과정 중 시뮬레이션 관련 보조 수업을 찾던 2013년이었다. 미국 대학들의 대학원 과정 중 고학년 과정들은 해당 분야를 연구하는 교수들이 드물기 때문에, 인근 대학의 박사생들이 타 대학 수업을 들으러 가는 경우들이 종종 있는데, 당시 MIT에서 열렸던 한 계산과학 수업에 보스턴 일대 주요 대학의 학생들이 모두 모인 탓에 교실이 매우 비좁았던 기억이 있다.
Read More
학회에 간다는 것이 매우 재밌는 일이라는 걸 깨달은 것은 박사 학위 과정 2년차에 '미국 산업응용수학회(Society for Industrial and Applied Mathematics, SIAM)'에 초청 받았던 즈음으로 기억한다. 막 대학원에 들어갔던 시절에는 당장 수업을 따라가기도 버거웠고, 교수님들 논문 발표를 따라가는 것은 커녕, 가깝게 지내는 박사생들이 무슨 연구를 하는지도 제대로 이해하기 어려웠기 때문에, 그들이 마냥 대단해보이기만 했었다. 박사 1학년 시절 듣던 수업에서 교수님들이 쓰고 있는 중이라는 논문으로 수업을 하시는데, 기본 가정을 너무 부실하게 잡아서 연구 목적이 달성될 것 같지 않아보이는 논문의 가정을 별 생각없이 지적했더니, 교수님이 '너무 논문 평가자처럼 볼 필요는 없다.(You act too much like a critic. You don't have to.)'라며 받아주셨던 기억이 있다. 그 이후부터는 논문들의 수준을 좀 더 제대로 이해할 수 있게 됐고, 누군가의 논문을 지적할 수 있는 만큼, 내 논문의 조잡함도 함께 이해하게 됐던 것 같다.
Read More
WSJ, 미국 테크 기업들 AI 인재 채용 줄여, A급 인재만 채용단순 지식 뿐만 아니라 응용력, 협업 능력까지, 팔방미인 따져가며 채용국내도 늦었지만 개발자와 AI전문가 구분하기 시작해 26일 월스트리트저널(WSJ)에 따르면, 미국 테크 기업들이 AI에 막대한 투자를 이어가고 있는 와중에도 예전처럼 AI개발자 채용을 대규모로 진행하지는 않는다고 한다. 일부 A급 인재를 제외하면 해고 압박이 심하고, 재교육 부담이 가중되고 있다는 것이다. 지난 2018년부터 줄기차게 주장했던대로, 진작부터 이렇게 됐었어야 했는데, 투자금과 정부 지원금이 넘쳐났던 덕분에 시장의 교정 작업이 좀 늦어졌다고 본다. IT업계의 개발자라는 직군과 데이터 과학자, 혹은 AI 연구자(Researcher)로 불리는 직군 사이에는 아이돌과 판소리 급의 격차가 있다는 것이 조금씩 시장에 받아들여지는 모습이다.
Read More
AI 열풍에 휩쓸린 사람들은 대부분 심각한 오해에 빠져 있어현재 AI/데이터 과학은 여전히 통계적 방법론에 국한돼과장된 선전은 무지와 오해를 키울 뿐 AI/데이터 과학 교수로 일하다 보면, 이따금 AI 과대광고에 휩쓸린 사람들로부터 이메일을 받곤 한다. 그들이 '최신 AI'라고 부르는 것으로 내가 평소 비관적으로 생각해 온 문제들을 모두 해결할 수 있다고 주장하는 내용들이다. 보통 이런 사람들은 '최신 AI' 프로그램이 스스로 학습하여 인간의 지능 수준을 완전히 뛰어넘은 '인공 일반 지능'(AGI)에 근접했다고 여기는 열렬한 AI 신봉자들이다.
Read More
과거 정신 감정, 지능 검사 등에 국한됐던 직원 선별에 조직 문화 적응 역량도 추가되는 추세미국은 직원들의 SNS 활동을 추척한 조용한 퇴사 지표 개발 필요성 제기되자 논란 되기도기업들이 고용 계약 대신 프리랜서 계약을 들이미는 경우도 늘어 가깝게 지내는 국내 주요 스타트업 핵심 멤버들을 만나면, 어느 중소기업이나 마찬가지듯이 직원을 못 뽑아서 힘들다는 이야기들을 한다. 나 역시 마음에 드는 직원을 뽑기가 쉽지 않기 때문에 어떻게 선별 작업을 '인공지능(AI)'을 써서 자동화하면 좀 더 효율적으로 채용 절차를 진행할 수 있을까 고민이 많은데, 지난 1년 남짓은 직무에 직접 관련된 시험을 치는 것으로 절차를 단순화 해 왔다.
Read More
데이터 처리 기준이 열에서 행렬로, 행렬에서 텐서로 전환되면서 데이터 과학 범위 확대돼 올바른 접근 방식으로 도구를 적재적소에 적용할 때만 더 나은 결과 얻을 수 있어기술의 발전을 아무 생각 없이 받아들이기보다는 그 기술이 ‘왜’ 필요한지 생각하는 자세 필요해 학부 시절인 2000년대 초로 돌아가보면, 기초적인 회귀분석 문제를 풀기 위해 매트랩(Matlab)을 처음 배웠다. 당시 매트랩은 혁명이었는데, 그 이유는 '행렬'로 데이터를 처리하기 때문이다. 다른 소프트웨어가 '열' 단위로 데이터를 처리하는 것과 달리, 매트랩은 ‘행렬’ 단위의 큰 데이터를 한 번에 적재하기 때문에 처리 속도가 O(nxk)에서 O(n)으로 빨라졌다. 좀 더 정확하게 말하면, RAM이 소프트웨어로부터 데이터 받는 방식을 고려하면 O(k)에서 O(1)으로 빨라졌다.
Read More
전화 기반 여론조사 대체해야 한다는 목소리 높아, 인터넷 여론조사 진행하는 경우도 많아한국은 휴대전화 기반 신원 확인 시스템이 잘 갖춰져 여론조사 정확도 높고 비용 저렴한 축에 속해인터넷 조사가 비용은 저렴하지만 정확도 높이기 어려워 아직 한계 있어 이번 22대 총선 기간 내내 스마트폰을 무음으로 처리해놨었다. 주소지가 경합지역이어서인지는 몰라도, 하루에도 최소한 4번 이상의 여론조사 전화를 받았었기 때문이다. 바쁜 업무 와중에 사업상으로 중요한 전화를 놓치게 되는 위험도 있고, 무엇보다 여론조사에 응해주고 싶지 않았다. 실제로 선거철 진행되는 여론조사에 대한 응답률이 5%를 넘는 경우는 매우 드물다. 일반적으로 길거리에서 선호도를 표현하는 스티커를 붙여달라고 해도 바쁘다면서 회피하는 사람들을 많이 볼텐데, 전화는 비대면인만큼 참여를 이끌어내기가 더더욱 힘들기 때문이다. 이런 문제점을 지적하면서 이번 선거 기간 중에 해외에는 전화 기반 여론조사가 점점 줄어들고 있는데, 한국만 아직도 구시대적인 전화 조사를 진행한다는 비판이 나왔다.
Read More
사전투표일에 투표장을 찾아갈 수 있는 직업군, 접근성이 당일투표에 그대로 적용되지 않아콘크리트 지지층이 있는 지방에서도 사전투표와 당일투표 투표율 크게 다른 것도통계학적으로 분포함수가 달라진 것, 향후 선거 예측에 활용할 변수 추출에 활용해야 지난 2020년 제21대 총선부터, 2022년 대선, 2022년 지선에 이어 10일에 치뤄진 제22대 총선까지 사전투표 표심이 당일투표와 상당히 다르게 나오는 것을 보고 왜 다르게 나오는 것인지에 대한 질문을 받는 경우가 종종 있다. 특히 자기가 지지하는 정당과 후보 측이 사전투표에서 불리한 득표를 했던 것이 선거 패배의 원인인 경우에는 선거에 비리가 있었다는 주장을 하는 경우도 많다.
Read More
22대 총선의 여당 참패를 무조건 대통령 잘못으로만 설명하는 정치권 패널들의 해석 다수실제 사회 현상은 수 많은 변수들의 복합 작용으로 이뤄짐에도 단순히 쉬운 설명만 찾기 때문시민 사회 역량 성장을 위해서라도 다양한 원인을 찾아내는 분석 역량을 길러내야 지난 10일 치뤄진 제22대 총선에서 집권 여당의 참패로 결론이 나오자, 정치권 패널들 대부분이 정부 실패, 혹은 정부의 수장인 대통령에 대한 책임을 돌리는 평가를 내놨다. 기업이 잘 돌아가지 않아 상장폐지, 워크아웃, 법정관리 등의 절차를 밟게되면 모든 비난이 회사 대표에게만 쏠리고, 그 아래 모든 직원들은 불쌍한 피해자인 것처럼 취급되는 것과 비슷한 모습을 보는 것 같더라.
Read More
출구조사 오차 탓에 누군가는 웃다고 울고, 또 누군가는 울다가 웃게됐다데이터 과학은 오차가 허락되는 학문이지만, 그렇다고 오차의 원인마저 무시하는 학문은 아냐이번 오차의 원인은 지역, 연령, 성별 기반의 과거 모델이 후보별 특성을 고려 못했기 때문패널 데이터 형태로 기본 데이터 구조를 바꾸 재접근하는 것도 도전해볼만한 방법 지난 22대 총선 투표가 종료되기 약 30분 전 무렵, 서울 동작을 지역구 나경원 후보 사무실 앞에 있던 방송3사 차량들이 허겁지겁 움직이기 시작했다. 출구조사에서 앞선 것으로 나온 같은 지역구 류삼영 후보 사무실로 급하게 이동하는 모습이었다. 출구조사가 투표 종료 시각인 오후 6시보다 1시간 전에 마감됐고, 실제 방송사들이 공표한 6시 정각보다 조금 일찍 결과를 알았던 탓에 현장 기자들이 발빠른 대응을 보였기 때문일 것이다.
Read More