입력
수정
미국에서 생성형 AI(인공지능)서비스인 ‘챗GPT’를 통해 수집한 판례를 소송 자료로 제출한 변호사들이 법원으로부터 제재를 받았다. 이들은 해당 판례가 가짜였음에도 이를 제대로 확인하지 않고 그대로 제출했음은 물론, 이후에도 허위 의견을 계속 주장했던 것으로 드러났다. 이를 두고 모의 변호사 시험을 상위권 성적으로 통과할 정도로 기술력이 발달한 생성형 AI를 ‘어디까지 믿을 수 있는지’와 같은 답변의 신뢰도 문제와 함께 AI 챗봇 사용자가 결과물에 끝까지 책임져야 한다는 의견이 공감을 얻고 있다.
법원 “AI 활용 자체는 문제 아냐, 다만 끝까지 검토 안 한 변호사는 책임 물어야”
AP통신 등 외신 보도에 따르면 뉴욕 맨해튼 연방지방법원 P.케빈 카스텔 판사는 22일(현지 시간) 챗GPT로 작성된 엉터리 변론서를 제출한 데 책임을 물어 스티븐 슈워츠(Steven Schwartz)와 피터 로두카(Peter LoDuca) 등 2명의 변호사에 각각 5,000달러의 벌금을 부과했다.
슈워츠 등 두 변호사는 지난 2019년 아비앙카 항공 여객기에 탔던 한 승객이 기내 카트에 부딪혀 다쳤다며 제기한 소송의 변론을 맡았다. 이들은 이 과정에서 변론 자료로 관련 판례를 제출했으나, 대부분 AI가 고안한 가짜 사례로 판명 났다.
법원은 이들이 AI의 도움을 얻었기 때문에 제재 결정을 내린 것은 아니라고 밝혔다. 파스텔 판사는 “변호사는 제출한 자료의 정확성을 보장하기 위해 최종적으로 게이트키핑(gatekeeping) 역할을 해야 한다는 기본 규칙을 어겼다"며 “특히 변호사들이 해당 자료를 챗GPT를 사용해 찾았다고 솔직하게 얘기했다면 처벌하지 않을 수도 있었다”고 전했다.
결국 이번 판결은 AI의 사용 그 자체의 문제가 아닌 AI를 활용한 변호사의 자질에 책임이 있음을 지적한 것으로 보인다. 법원은 판결문을 통해 "AI를 통해 허위로 작성된 법률 자료는 자칫 법조계와 미국 사법제도에 대한 냉소주의를 조장할 수 있다”고 덧붙이며, 향후 법률적 지원을 위해 AI를 활용할 경우 무엇보다 법조계 인사의 책임이 중요함을 강조했다.
전문인력 수준으로 똑똑한 챗GPT, 법조계 앞다퉈 서비스 도입
최근 들어 정부 및 공공기관에 이어 미국의 리걸테크 기업들도 챗GPT를 활용한 각종 서비스를 앞다퉈 내놓는 중이다. 법률 소프트웨어 기업 아이언클래드가 출시한 계약서 검토 AI인 'AI 어시스트'와 로드로이드의 문서 요약과 작성 등을 돕는 '로드로이드 코파일럿' 등이 대표적이다.
미국뿐만 아니라 일본에서도 챗GPT를 활용한 무료 온라인 법률상담 서비스 '벤고시닷컴(변호사닷컴)’이 인기를 끄는가 하면, 국내 대형 로펌들도 해외 입법례 등의 조사에서 챗GPT를 적극 활용하는 것으로 나타났다. 이 밖에도 콜롬비아의 한 판사는 아동 의료권 소송에서 판결문을 준비 과정에서 챗GPT를 사용했다고 밝히며 세간의 관심을 끌기도 했다.
법조계에 이 같은 바람이 부는 이유는 챗GPT의 기술력이 현업 종사자들의 수준까지 발전했기 때문이다. 실제 챗GPT는 미네소타대학교(University of Minnesota)에서 진행된 헌법학 등의 변호사 시험에서 합격에 가까운 성적을 받았다. 객관식 문제 95개와 논술 문제 12개로 구성된 이 시험에서 수학이 포함된 객관식 문제 등에서는 저조한 점수를 냈지만, 그 외 항목에선 합격 커트라인인 평균 C+을 받았다.
나아가 올해 3월에 공개된 ‘챗GPT-4’는 미국 모의 변호사 시험을 전체 상위 10% 성적으로 통과했다. 챗GPT-4는 영문 기준으로 한 번에 최대 2만5,000단어짜리 텍스트를 분석할 수 있고, 나아가 다양한 프로그래밍 언어로 코드까지 작성할 수 있는 챗봇이다. 오픈AI는 “기술적으로 업데이트된 챗GPT-4가 이제 전문 분야만큼은 인간 수준의 성과를 보여준다”고 평가했다.
법조계에 부는 AI 바람, AI가 법률가를 대신할 수 있을까?
챗GPT의 등장으로 전 세계 법조계는 "인공지능이 법률가를 대신할 수 있는가"라는 문제와 맞닥뜨렸다. 그러나 현재까지의 AI 기술은 변호사를 대체할 수 없다는 게 법조계의 중론이다.
특히 복합추론영역에 있는 변호사의 업무를 인공지능이 모두 대체할 수는 없다고 판단하고 있다. 가령 사기 관련 사건이 100개가 있다고 하더라도 모두 같은 사건일 수 없는 데다, 그 사건의 의뢰인 각각이 갖는 '니즈'가 다른 만큼 AI가 일관된 하나의 답을 도출할 수 없다는 것이다.
다만 법조인이 사건에 대한 아이디어를 얻는 등 자료조사와 관련된 영역에선 큰 도움을 얻을 수 있다는 데는 많은 이가 공감했다. 강정수 미디어스피어 이사는 ‘챗GPT·생성형 AI의 개요와 법률 산업에 미칠 영향’을 주제로 한 강연에서 “챗GPT가 변호사들보다 실력이 떨어지더라도 이용료가 저렴하다면 일을 시키게 될 것”이라면서 “법률 분야 내 인간과 AI가 서로 다른 분야를 담당하며 만드는 로펌의 자동화는 전체적인 생산성을 높이고 로펌 규모를 키우는 긍정적인 결과를 만들어 낼 것”이라고 전했다.
한편 오픈AI 측도 AI 챗봇의 한계를 이미 인정한 바 있다. 샘 앨트먼 오픈AI 최고경영자(CEO)는 과거 자신의 트위터에 “(챗GPT-4가) 이전 모델보다 더 창의적이고 환각 현상과 편견도 적다"면서도 "중요한 상황에서 언어모델을 활용하는 경우 사용자의 각별한 주의를 요한다"고 말하며 사용자들의 책임감 있는 태도의 중요성을 간접적으로 드러냈다.