中 AI 회사, '美 메타' 초거대 AI 표절 논란
중국에서 오픈소스 인공지능(AI) 초거대 모델을 개발한 스타트업이 논란 끝에 표절을 인정했다. 15일 중국 언론 IT즈자에 따르면 중국 시노베이션벤처스 CEO 겸 회장인 리카이푸가 올해 창업한 AI 초거대 모델 스타트업 '링이완우'가 '와이(Yi)-34B'와 'Yi-6B' 등 초거대 모델을 출시한 후 표절 논란에 휘말렸다. 두 모델은 학술연구원을 대상으로 전면 개방됐으며 무료로 상업용 사용 신청이 가능하다. Yi-34B는 두 언어 기반의 모델로 340억 개 매개변수로 훈련됐다. 전일 Yi-34B의 허깅페이스(AI 모델이 모이는 플랫폼) 오픈소스 페이지에 한 개발자(ehartford)가 메타의 대형언어모델(LLM) '라마(LLaMA)' 아키텍처를 사용한 것 아니냐는 의혹을 제기했다. 두 개의 텐서(Tensor) 명칭만 바꾼 것이라고 지적했다. 텐서는 딥러닝 개념에서 다차원 배열을 의미하며 더 높은 차원의 행렬과 벡터를 만들기 위해 쓰인다. 이에 대해 링이완우 측은 공식 답변을 통해 "회사의 오픈소스팀 총괄 책임자인 라치드 린이 라마 텐서 명칭을 수정한 것에 대해 부적절했다고 인정했다"며 "외부 제안에 따라 수정된 텐서 명칭은 기존 Yi에서 다시 라마로 변경된다"고 설명했다. 경위를 설명한 링이완우 측은 명칭 지정이 실수로 이뤄진 것이라고 해명했다. 리차드 린은 "명칭 지정 문제가 개발자의 감독 소홀에 기인했다"며 "개발자가 테스트 요구를 충족하기 위해 코딩 중 여러 차례 명칭을 변경했다"고 밝혔다. 이어 "개발자가 텐서 이름을 라마로 다시 수정하는 것을 잊어버린 것"이라고 사과했다. 또 다른 개발자는 이미 공식적으로 Yi 초거대 모델의 텐서 명칭 수정을 발표했으니, 오픈소스 초거대 모델 Yi는 라마의 파생 저작물이며 코드의 추론 부분과 모델 정의가 모두 라마의 일부란 점에서 라이선스 충돌이 일어난다고 지적했다. 이에 링이완우가 상업적 이용과 관련된 조항을 개정해야 하며, 해당 모델의 월 활성 사용자가 7억 명을 초과할 경우 메타에 라이선스 신청을 해야 한다고 주장했다. Yi 시리즈 모델의 소유권 및 관련 지식재산권에 대한 조항 역시 문제 삼았다. 링이완우의 창업자이자 시노베이션벤처스 회장인 리카이푸는 전 구글 중국 CEO 이자 마이크로 글로벌 부사장, SAP와 시스코 부사장 등을 역임한 중국 유명 AI 전문가 겸 기업가다. 링이완우는 리카이푸가 직접 설립한 스타트업이란 사실 만으로도 상당히 주목받은 기업으로, 이미 알리바바클라우드가 이끄는 10억 달러(약 1조 3천50억 원) 규모의 투자도 받았다. 최근 기업가치가 10억 달러를 넘으면서 유니콘으로 불려왔다.