업스테이지, '다음' 뉴스·게시물 AI 학습에 막 써도 될까
업스테이지가 포털 '다음' 경영권 인수를 전제로 한 실사에 착수하면서, 인수 이후 활용될 방대한 콘텐츠 자산의 법적·계약적 한계에도 관심이 쏠리고 있다. 업스테이지는 다음 뉴스·카페·티스토리 등에서 생산되는 고품질 한국어 데이터를 자체 거대언어모델(LLM) '솔라' 고도화에 활용하겠다는 구상이지만, 실제로는 이용자 동의와 저작권 계약이라는 높은 문턱을 넘어야 할 것이란 분석이 나온다. 다음 약관에 명시된 '연구개발' 범위 어디까지? 업스테이지는 다음 인수를 통해 뉴스·커뮤니티·블로그 등 방대한 한국어 콘텐츠를 실시간으로 확보해 인공지능(AI) 경쟁력을 강화하는 전략을 펼 것으로 보인다. 그러나 현행 다음 사이트 이용약관과 개인정보처리방침을 기준으로 보면, 기존 이용자들이 작성한 게시물을 범용 AI 학습에 자유롭게 활용할 수 있다고 단정하기는 어렵다. 다음 약관은 '이용자가 작성한 게시물의 저작권은 이용자에게 귀속된다'고 명시, 서비스 운영·개선·연구개발을 위한 범위 내에서 회사가 이를 이용할 수 있도록 하고 있다. 문제는 '연구개발'의 범위가 어디까지냐는 점이다. 업계에서는 이를 다음 서비스 개선이나 내부 기능 고도화 수준으로 해석하는 것이 일반적이며, 외부 상업용 AI 모델이나 독립 LLM 학습까지 포괄한다고 보기는 어렵다는 해석이 우세하다. 특히 이번 거래는 단순한 서비스 개선이 아니라, 카카오에서 업스테이지로 사업 주체 자체가 변경되는 인수라는 점에서 법적 부담이 더 커진다. 개인정보보호법상 개인정보 처리 주체가 바뀌거나, 처리 목적이 확대·변경될 경우에는 이용자의 추가 동의가 필요하다. 업스테이지가 다음 콘텐츠를 AI 학습에 본격 활용하려면, 약관과 개인정보처리방침 개정은 물론 '이용자에게 명확한 고지와 선택권을 제공'해야 할 가능성이 크다. 뉴스 콘텐츠는 '별도의 벽'…언론사 계약 없인 활용 어려워 특히 다음 '뉴스' 콘텐츠는 AI 학습 측면에서 가장 큰 제약 요소로 꼽힌다. 다음 뉴스는 플랫폼이 생산한 콘텐츠가 아니라, 각 언론사와의 제휴 계약을 통해 유통되는 구조다. 다시 말해 다음을 인수하더라도, 뉴스 기사에 대한 저작권과 2차적 이용 권한은 여전히 개별 언론사에 있다. 업계에서는 업스테이지가 다음 뉴스 데이터를 AI 학습에 활용하려면, 언론사들과 별도 라이선스 계약을 체결하거나 기존 계약을 전면 재조정해야 할 것으로 보고 있다. 이는 시간과 비용 부담이 크고, 협상 난이도도 높다. 실제로 글로벌 빅테크들도 언론사와의 AI 학습 계약을 둘러싸고 분쟁과 재계약을 반복하고 있다. 국내 검색 포털 1위 사업자인 네이버 역시 지난해 머니투데이그룹(브릴리언트코리아)·KBS 등과 AI 학습을 위한 뉴스 콘텐츠 계약을 별도로 체결한 바 있다. 이 때문에 “뉴스를 포함한 다음의 방대한 콘텐츠가 AI 학습에 즉시 활용될 것”이라는 기대는 다소 과장됐다는 지적도 나온다. 법무법인 세종의 이종관 수석전문위원은 "뉴스 콘텐츠는 플랫폼 인수와 무관하게 저작권 구조가 분리돼 있다. 저작권을 지닌 각 매체사와 개별 협상이나 동의 없이 AI 학습 활용까지 이어지기에는 현실적인 제약이 많다"고 말했다. 포털 업계 정책 전문가는 "다음 주주의 변경은 뉴스 콘텐츠 제휴계약과는 아무런 영향이 없을 가능성이 높다"면서도 "다만 업스테이지가 다음 뉴스 콘텐츠를 (AI 학습 등에) 사용하기 위해서는 각 언론사와 계약 문제를 풀어야 한다"고 설명했다. 카페·블로그 내 이용자 창작글도 '자유 이용' 어려워 다음의 카페·티스토리·브런치스토리 등 이용자 창작 기반 서비스 역시 사정은 비슷하다. 해당 콘텐츠에는 개인정보가 포함될 가능성이 높고, 창작 성격이 강해 AI 학습 활용에 대한 이용자 민감도도 크다. 업스테이지가 만약 이용자의 별도 동의 없이 이를 학습 데이터로 활용할 경우, 법적 분쟁이나 이용자 반발로 이어질 수 있다는 우려가 나온다. 이 수석전문위원은 “통상적으로 이용자가 작성한 게시물의 저작권은 이용자 본인에게 있다”면서 “사업자가 변경될 경우 이용자 정보를 새로운 사업자가 포괄적으로 승계 받게 되는지, 별도 동의를 구해야 하는지는 이용약관이나 규정에 따라 달라질 수 있어 이를 확인해볼 필요가 있다”고 말했다. 결국 업스테이지가 선택할 수 있는 현실적인 시나리오는 ▲AI 학습 목적을 명시한 약관·방침 개정 ▲선택적 동의(옵트인) 방식 도입 ▲익명화·비식별화된 데이터의 제한적 활용 등으로 압축된다. 문제는 이렇게 되면 업스테이지가 실제 확보 가능한 데이터 규모는 당초 기대보다 줄어들 수밖에 없다. 카카오 약관 변경, 'AI 학습' 의식한 선 긋기? 이 가운데 카카오는 최근 통합서비스약관과 서비스 약관을 개정하며 눈에 띄는 문구를 추가했다. 기존에는 서비스 이용기록과 이용패턴을 '기계적으로 분석하거나 요약할 수 있다'고만 명시했지만, 개정 약관에는 '법령상 동의가 요구되는 경우 이용자의 별도 동의를 받는다'는 표현이 새로 들어갔다. 겉으로는 개인정보보호법 준수를 명확히 한 조치지만, 'AI 활용을 둘러싼 법적 논쟁을 사전에 차단하기 위한 방어적 정비'라는 해석이 가능하다. 특히 이번 개정은 이용자 콘텐츠를 AI 학습에 활용할 경우 기존 포괄 동의만으로는 부족하다는 점을 카카오 스스로 인정한 것에 가깝다는 분석이 가능하다. 이는 향후 다음이 업스테이지로 넘어가더라도, 기존 약관을 근거로 이용자 콘텐츠를 AI 학습에 활용하기는 쉽지 않다는 점을 분명히 하는 신호로 읽힌다. 'AI 주도권' 확보의 시험대 업스테이지의 다음 인수는 단순한 포털 인수가 아니라, 한국어 AI 주도권을 둘러싼 전략적 베팅이라는 평가를 받는다. 다만 인수 이후 AI 학습용 데이터 활용은 법·계약·이용자 신뢰라는 세 가지 관문을 동시에 넘어야 한다. 포털이라는 거대한 사용자 접점을 손에 넣더라도, 콘텐츠를 '자유롭게' 쓰지 못한다면 인수의 효용성은 제한될 수 있다. 이에 업스테이지가 실사 과정에서 재무·기술뿐 아니라, 콘텐츠 권리 구조와 이용자 동의 문제를 얼마나 정교하게 설계하느냐가 이번 거래의 성패를 가를 핵심 변수가 될 전망이다.