[딥폴리시] 학생 데이터 공유 확대, 교육 접근성 높였지만 진입장벽 여전
[딥폴리시] 학생 데이터 공유 확대, 교육 접근성 높였지만 진입장벽 여전
입력
수정
대학 간 학사 정보 공유, 교육 복귀 문턱 낮추는 핵심 수단 온라인 교육 확산 속 경쟁 구조·학생 선발 방식까지 영향 효율성 이면에 정보 가치 이전·알고리즘 편향 우려
본 연구 기사는 유럽 경제 연구소 The Economy의 연구위원(Fellow)들이 작성한 The Economy Review 시리즈 기고문을 한국 시장 상황에 맞춰 재구성한 글입니다. 본 시리즈는 최신 기술-경제-정책 이슈에 대해 연구자의 시각을 담아, 일반 독자들에게도 이해하기 쉽게 전달하는 것을 목표로 합니다. 기사에 담긴 견해는 집필자의 개인적인 의견이며, The Economy 또는 집필자의 소속 기관의 견해와 일치하지 않을 수 있습니다.

미국에서 대학을 중도에 떠나 학위를 마치지 못한 노동연령 인구는 3,760만 명에 이른다. 이들이 교육 현장으로 돌아오지 못하는 배경에는 대학 간 단절된 행정 구조가 자리한다. 수강 내역과 취득 학점이 학교별로 분절돼 관리되면서 재입학이나 편입 과정에서 시간과 비용 부담이 누적되는 구조다. 이 같은 비효율은 학습자의 이탈을 고착시키는 요인으로 지목된다.
이 때문에 미국 정치권에서는 ‘학생 데이터 공유’를 고등교육 개편의 핵심 과제로 내세운다. 성적과 학점 정보를 신속히 공유하고 인정 기준을 정비해 제도 운영의 효율을 높이겠다는 취지다. 그러나 정책 방향은 행정 절차 편의 개선에 무게가 실린 모습이다. 온라인 중심으로 재편된 교육 환경에서는 데이터 공유가 단순한 편의 문제가 아닌 대학 간 경쟁 질서와 진입 구조를 좌우하는 핵심 변수로 기능한다.
고등교육의 핵심 인프라
고등교육에서 데이터는 이미 운영의 핵심 기반으로 자리 잡았다. 미국의 싱크탱크 브루킹스연구소는 대학 간 학생 성적과 학점, 수강 내역 공유가 확대되면 정보 격차를 줄이고 소규모 대학의 경쟁 여건을 개선할 수 있다고 분석했다. 그러나 정보량 증가가 곧 시장 개선으로 이어지는 것은 아니다. 대학이 장기간 축적해 온 학생 정보의 가치가 다른 기관으로 이전되거나, 더 많은 학업 지원이 필요한 학생이 여러 대학에서 동시에 ‘위험군’으로 분류되는 결과로 이어질 가능성도 존재한다.
이 같은 우려는 온라인 교육 확산과 맞물려 더 크게 부각된다. 미국 주(州)간 고등교육 협약기구(NC-SARA)에 따르면 2024년 가을 학기 기준 타주 대학 온라인 수업 수강생은 166만 명을 넘어섰다. 유럽연합(EU)도 국경 간 데이터 교환을 전제로 한 디지털 학위 체계 구축을 서두르는 추세다. 데이터 활용 범위가 빠르게 확대되면서 이제 쟁점은 이 과정에서 누가 이익을 가져가고 어떤 기준으로 학생이 선별되는지에 집중되고 있다.

데이터 공유가 만드는 비용 구조 변화
공공 차원의 데이터 공유는 분명한 장점을 지닌다. 표준화된 성적표는 학점 인정 과정에서의 손실을 줄이고, 성인 학습자의 재진입 장벽을 낮추는 역할을 한다. 그러나 대학의 역할은 단순히 학생과 전공을 연결하는 데서 끝나지 않는다. 학생의 학업 지속 가능성과 필요한 지원 수준을 함께 고려해야 하며, 이는 곧 재정 부담과 직결된다. 어떤 정보를 확보하느냐에 따라 대학의 판단 기준과 자원 배분 방식이 달라지는 이유다.
특히 대형 대학과 주요 플랫폼은 불완전한 수강 내역과 학업 기록을 분석해 활용 가능한 정보로 전환하는 역량을 축적해 왔다. 입학 자료와 온라인 활동 기록, 재정 정보 등을 결합해 중도 이탈을 낮추는 체계를 구축하는 데 상당한 비용이 투입됐다. 이런 상황에서 명확한 기준 없이 데이터 공유가 확대될 경우, 특정 기관이 다른 대학의 투자 성과를 활용하는 구조가 형성될 수 있다. 이는 데이터 축적에 투입된 가치가 외부로 이전되는 결과를 낳고, 장기적으로는 데이터 구축과 관리에 대한 유인을 약화시키는 요인으로 작용한다.
알고리즘 편향, 집단 배제 확산 우려
데이터 활용이 확대될수록 학생 선발과 지원 과정에서의 형평성 문제도 함께 부각된다. 미국교육학회 저널 ‘아애라 오픈(AERA Open)’은 졸업 가능성을 예측하는 알고리즘 정보가 공유될 경우 특정 인종이나 계층에 불리한 선별이 강화될 수 있다고 지적했다. 성과가 이미 확인된 학생에게 자원이 집중되고, 추가 지원이 필요한 학생은 후순위로 밀리는 흐름이 나타난다는 것이다.
이러한 현상은 경제학의 ‘허쉬라이퍼 효과(Hirshleifer effect)’로 설명 가능하다. 이는 정보가 완전히 공유되면 위험을 감수할 유인이 약해진다는 개념이다. 고등교육에서도 모든 기관이 동일한 위험 신호를 인식하게 되면 특정 학생을 받아들이려는 동기가 떨어질 수밖에 없다. 실제로 2024년 연구에서는 흑인과 히스패닉 학생에 대한 알고리즘 오판율이 백인보다 높게 나타났다. 이와 같은 편향된 모델이 대학 간에 확산될 경우 한 기관의 부정적 평가는 다른 기관에서도 반복되며 학생 전반에 걸친 평가로 굳어질 가능성이 있다. 이 과정에서 데이터는 현재 상태를 보여주는 데는 유용하지만, 장기적인 성장 가능성까지 충분히 반영하지 못하는 한계를 드러낸다.

데이터 활용 기준 정교화와 책임 강화
데이터 공유는 중단할 대상이 아니라 적용 범위를 나눠 설계할 사안이다. 이수 과목과 취득 학점처럼 사실로 확인되는 정보는 폭넓게 활용하되, 중도 이탈 가능성이나 학업 지속 여부처럼 해석이 개입된 정보는 엄격한 기준 아래 제한할 필요가 있다. 유럽처럼 데이터의 신뢰성과 검증 여부를 기준으로 활용 범위를 구분하는 방식도 검토 대상이다.
동시에 데이터 접근에는 책임이 뒤따라야 한다. 성과가 기대되는 학생만 선별적으로 유치하는 행위를 제한하고, 주요 판단에 활용되는 알고리즘의 오류율을 지속적으로 점검하는 체계가 필요하다. 데이터 공유가 단순한 효율 개선에 머물지 않고 재도전 기회를 넓히는 기반으로 기능하려면, 정책 설계 전반에 대한 보완이 요구된다.
본 연구 기사의 원문은 Why Student Data Sharing Could Hurt Online Education을 참고해 주시기 바랍니다. 본 기사의 저작권은 The Economy에 있습니다.