"개인 정보 훔쳐서 AI 모델 훈련" 오픈AI 피소
오픈AI가 집단 소송을 당했다. 개인 정보 등 민감 데이터를 불법으로 수집해 인공지능(AI) 모델에 활용했다는 이유에서다. 미국 지디넷 등 주요 외신은 미국 법률회사 클라크슨 직원들이 집단으로 오픈AI를 소송했다고 29일(현지시간) 보도했다. 오픈AI가 법을 위반하고 데이터를 모아 생성 AI 모델 훈련에 사용했다는 게 주요 이유다. 보도에 따르면, 이번 집단 소송문서는 157페이지에 달한다. 문서에는 오픈AI가 어떤 방식으로 개인 온라인 정보, 쿠키, 키 입력, 채팅 내용, 결제 정보 등을 수집해 AI 모델 훈련에 활용했는지 적혀있다. 클라크슨 직원들 주장에 따르면, 현재 오픈AI는 이미지 데이터부터 금융 데이터까지 수집해 GPT-4를 훈련 중이다. 온라인 애플리케이션에 있는 정보를 수집해 GPT-4에 입력 중이라는 의미다. 직원들은 "이 회사는 단순한 개인정보를 넘어서 온라인에서 일어나는 사적인 대화, 의료 데이터 등 민감 정보까지 수집 중이다"고 말했다. 원고 집단은 "오픈AI는 그 많은 데이터를 어디서, 어떻게 수집했는지 투명하게 공개하라"며 "데이터 소유자 동의 없이 활용했을 경우, 오픈AI는 처벌받아 마땅"하다고 밝혔다. 또 "기존 데이터 소유자는 오픈AI에 반드시 보상받아야 한다"고도 했다. 문서에는 오픈AI가 개인 데이터 활용법을 바꿔야 한다는 내용도 담겼다. "데이터 소유자가 공유 원하는 데이터만 AI 모델에 넣어야 한다"며 "오픈AI는 개인 데이터 공유법까지 바꿔야 할 것"이라고 적혀있다. 미국 워싱턴포스트는 "생성 AI가 온라인 댓글, 블로그 게시물 등을 동의 없이 활용했는지 판단하는 법률이 필요해질 것"이라고 분석했다. 이달 초 한 미국 사용자가 오픈AI를 소송한 바 있다. 챗GPT가 틀린 답변을 지속적으로 내놓는다는 이유에서다.