[AI MEMO] 디지털 플랜테이션의 시대, AI 산업의 이면

Picture

Member for

1 year

Real name

송혜리

Position

연구원

Bio

[email protected]

다양한 주제에 대해 사실에 근거한 분석으로 균형 잡힌 시각을 제공하고자 합니다. 정확하고 신뢰할 수 있는 정보 전달에 책임을 다하겠습니다.

입력

2025-11-26 02:04

수정

2025-12-30 12:25

숨겨진 저임금 데이터 노동의 확대
학생·청년이 값싼 디지털 노동으로 편입되는 산업 구조
공정한 노동 기준과 지역 주도 데이터 생태계 구축 필요

본 기사는 스위스 인공지능연구소(SIAI)의 SIAI Research Memo 시리즈 기고문을 한국 시장 상황에 맞춰 재구성한 글입니다. 본 시리즈는 최신 기술·경제·정책 이슈에 대해 연구자의 시각을 담아, 일반 독자들에게도 이해하기 쉽게 전달하는 것을 목표로 합니다. 기사에 담긴 견해는 집필자의 개인적 의견이며, SIAI 또는 그 소속 기관의 공식 입장과 일치하지 않을 수 있습니다.

전 세계적으로 1억 5,400만 명에서 4억 3,500만 명에 이르는 노동자가 현대 AI 시스템을 유지하기 위해 필수적인 데이터 처리 업무를 맡고 있다. 이들은 유해 콘텐츠 정제, 이미지 라벨링, 모델 출력 평가 등 인간의 판단이 필요한 작업을 수행하지만, 상당수는 하루 몇 달러에 불과한 임금을 받고 있다.

반면 AI 산업에 투입되는 자본은 급격히 증가하고 있다. 2024년 민간 AI 투자액은 2,520억 달러(약 370조 원)에 달했으며, 이 중 339억 달러(약 49조 7,000억 원)가 생성형 AI 분야에 집중되었다. 글로벌 생성형 AI 시장 규모는 210억 달러(약 30조 8,000억 원)에 이르렀고, 데이터 라벨링 기업 스케일 AI(Scale AI)는 메타와의 단일 계약 이후 기업가치가 290억 달러(약 42조 6,000억 원)로 뛰었다.

이처럼 극단적인 대비는 우연히 생긴 부작용이 아니다. 기업들은 저임금 국가의 대규모 노동력을 통해 방대한 데이터를 확보하고, 그 위에서 고부가가치 기술을 개발하며 이익을 달성한다. 교육기관 역시 이 흐름에서 벗어나 있지 않다. 학생과 신규 인력이 무비판적으로 데이터 작업에 유입되는 현실을 계속 유지할지, 아니면 더 책임 있는 역할을 모색할지 판단해야 할 시점이다.

AI 데이터 식민주의 구조

AI 데이터 식민주의는 오늘날 AI 산업의 불균형을 드러내는 개념이다. 모델 개발과 연산 인프라를 보유한 소수 기관에 이익과 통제력이 집중되는 반면, AI 작동에 필요한 반복 노동은 저임금 국가의 노동자와 교육 과정을 막 마친 인력에게 넓게 분배된다.

임금 격차는 특히 두드러진다. 케냐와 아르헨티나에서 라벨링과 콘텐츠 검수를 담당하는 노동자는 시간당 1.70~2달러(약 2,495~2,936원)를 받지만, 동일 업무는 미국에서 시간당 18달러(약 26,424원)부터 시작된다. 이는 AI 개발 과정의 핵심 부분이 저임금 노동력에 구조적으로 의존하고 있음을 보여준다.

작업 환경 역시 심각한 문제를 드러낸다. 콜롬비아와 아프리카 지역에서는 노동자가 교대 시간 동안 700~1,000건의 폭력·성적 콘텐츠를 7~12초 안에 처리해야 한다는 사례가 보고되었다. 일부는 하루 18~20시간의 장시간 노동과 강한 감시, 무급 초과근무에 노출된다.

인권단체 에퀴뎀(Equidem)과 인권과 기업연구소(IHRB)는 저임금, 노조 활동 억압, 안전 기준 미준수 등 국제 노동 기준 위반 사례를 확인했다. 타임(Time) 매거진 역시 케냐의 외주 노동자가 주요 챗봇의 유해 콘텐츠 정화를 담당하며 시간당 2달러(약 2,936원)에도 못 미치는 임금을 받았다고 보도했다. 일부 안전 규정이 도입되었음에도 콘텐츠 모더레이터(moderator)의 81%는 여전히 정신건강 지원이 부족하다고 답했다. 이는 AI 산업이 저비용·고위험 노동에 구조적으로 의존하고 있다는 사실을 다시 한번 보여준다.

AI 투자 규모 vs 데이터 라벨링 도구 시장 규모 비교(단위: 십억 달러)
주: 항목(X축), 시장 규모(Y축)/생성형 AI 투자, 현재 데이터 라벨링 도구 시장, 향후 데이터 라벨링 도구 시장 전망

학습 중심 구조로의 전환

현재 구조가 유지된다면 저임금 국가의 청년층에게 데이터 라벨링과 검수는 사실상 ‘첫 직업’으로 고착될 가능성이 크다. 스케일 AI의 자회사 아웃라이어(Outlier)는 전체 인력의 87%가 대학 학위, 12%가 박사 학위를 보유하고 있다고 밝힌다. 그러나 이들이 맡는 업무는 전공과 무관하며 경력 개발로 이어지지 않는다. 고학력 인력이 단기·반복 업무에 묶이는 것은 교육적 관점에서 큰 손실이다.

그러나 다른 모델도 존재한다. 인도의 카르야(Karya)는 시간당 약 5달러(약 7,340원)를 지급한다. 그리고 데이터 재판매 시, 로열티를 제공해 10만 명 넘는 노동자에게 실질적 소득 개선 효과를 보였다. 이 사례는 데이터 노동이 기술 습득과 소득 이동을 동반하는 경로가 될 수 있음을 보여준다. 데이터 라벨링·검수 지원 시장은 2023년 약 10억 달러(약 1조 4,680억 원)에서 2030년 53억 달러(약 7조 7,004억 원) 규모로 성장할 전망이다. 생성형 AI 시장 역시 2034년까지 약 8배 확대될 것으로 예상된다. 필요한 자본은 이미 충분히 유입되고 있으며, 교육기관이 이를 어떻게 활용할지가 관건이다

AI 데이터 노동의 국가·직군별 시간당 임금 비교(단위: 달러)
주: 국가 및 직군 유형(X축), 시간당 임금(Y축)/인도-최저임금, 인도-카르야 작업자, 케냐-에이전트 작업자, 케냐-품질 검수 작업자, 미국-모더레이터 작업자

교육기관이 바꿀 수 있는 노동 구조

교육기관은 이 구조를 바꿀 수 있는 핵심 주체다. 그러나 현재 인턴십과 실무 프로젝트의 일환으로 데이터 라벨링과 검수가 ‘경험’이라는 이름으로 학생에게 맡겨지는 경우가 많으며, 작업 조건에 대한 정보가 충분히 제공되지 않는다. 교육기관은 이러한 관행을 재검토하고 학생이 참여하는 데이터 작업의 기준을 새롭게 정립해야 한다.

학생과 신규 인력이 데이터 관련 업무에 참여할 때는 생활임금 보장, 유해 콘텐츠 작업량 관리, 정신건강 지원 등이 기본 조건으로 확보되어야 한다. 해당 업무는 단순 반복 작업이 아니라 경력 형성 과정으로 설계돼야 하며, 성과는 학점이나 공식 자격으로 인정될 수 있어야 한다.

신흥국 교육기관은 이미 지역 언어, 지역 문제, 농업 정보, 기후 위험, 토착 지식 등 지역 수요에 기반한 자체 데이터 구축 프로그램을 운영하고 있다. 일부 지역에서는 협동조합 기반 플랫폼 모델을 통해 데이터 생산 과정의 이익을 구성원이 공동으로 나누는 방식도 확산되고 있다. 교육기관이 이를 도입하면 기존의 외주 중심 산업 협력에서 벗어나 지역이 주도하는 AI 인프라 구축으로 전환할 수 있다.

핵심 과제로 다루어야 하는 이유

데이터 라벨링과 검수 같은 작업이 곧 자동화될 것이라는 전망과 달리, AI 투자는 오히려 이 분야의 수요가 더 커질 것임을 보여준다. 자동화가 진전되더라도 안전성 점검, 품질 평가, 지역별 맥락을 반영하는 작업은 인간의 판단이 여전히 필요하다.

규제 또한 변화하고 있다. EU 플랫폼 노동 지침은 플랫폼 종사자에게 근로자 지위를 우선 적용하고, 국제단체들은 모더레이터의 적정 임금·작업량 관리·정신건강 보호 기준을 마련했다. 케냐와 가나에서는 정신적 피해가 산업재해로 인정된 사례도 등장했다.

이러한 흐름 속에서 교육기관은 자신들이 사용하는 AI 서비스의 데이터 수집 및 라벨링 과정, 노동환경을 공개하도록 요구할 수 있다. 공공 지원과 민간 협력 역시 환경 기준이나 개인정보 보호 기준과 마찬가지로 노동 기준을 포함해야 한다.

교육 과정에서 학생들은 데이터가 어떻게 생산되고, 누가 어떤 환경에서 작업하는지, 이러한 구조가 왜 유지되는지를 이해해야 한다. 인도의 카르야 사례처럼 공정한 모델이 가능하다는 점을 제시하는 것도 중요하다

플랜테이션 비유는 불편할 수 있지만, AI 산업의 격차를 선명하게 보여준다. 한쪽에는 반복적이고 정신적 부담이 큰 작업을 수행하는 거대한 노동층이 있고, 다른 한쪽에는 막대한 가치를 축적하며 기술을 통제하는 소수가 존재한다. 이것이 AI 데이터 식민주의의 구조다.

교육기관은 이 불균형을 그대로 받아들일 수도 있고, 이를 바로잡는 역할을 선택할 수도 있다. 노동 기준 강화, 지역 기반 데이터 프로젝트 확대, 학생을 전문적 주체로 성장시키는 교육 체계를 마련하는 것이 그 핵심이다. 이 변화가 실현되지 않는다면 AI는 기존 착취 구조를 새로운 형태로 반복하게 될 것이다. 반대로 교육이 적극적으로 개입한다면 오늘의 디지털 플랜테이션은 공정하고 지속 가능한 AI 생태계를 만드는 출발점이 될 수 있다.