[단독] 스탠퍼드가 처음 선정한 '주목할 AI' 5개…"LG·네이버만 있었다"
미국 스탠퍼드대 인간중심인공지능연구소(HAI)가 '주목할 만한 AI(Notable AI)'에 포함된 한국 모델 선정 과정을 처음 공개했다. 당초 한국 모델 5개가 포함됐다는 소식이 전해진 뒤 LG AI연구원과 업스테이지 모델이 명단에 오른 것처럼 해석됐지만, 실제 집계 내용은 달랐던 것으로 확인됐다. 당시 김성훈 업스테이지 대표가 자신의 소셜미디어(SNS)에 게재한 게시글까지 맞물리며 시장 혼선이 커졌다는 지적도 나온다. HAI는 23일 지디넷코리아가 에포크AI(Epoch AI) 보고서 내 '주목할 만한 AI' 모델 데이터베이스(DB)의 한국 모델 집계 과정에 대해 문의하자 이메일로 이에 대해 답변했다. HAI는 올해 2월 기준 한국 모델을 5개로 집계했다가 최근 8개로 정정했으며, 현재 해당 수치에 맞춰 에포크AI 보고서를 업데이트하고 있다고 밝혔다. 앞서 과학기술정보통신부는 HAI 보고서에서 한국 모델 5개가 등재됐다는 내용을 알린 바 있다. 당시 공개된 보고서에는 LG AI연구원의 'K-엑사원', '엑사원 4.0(32B)', '엑사원 패스 2.0', '엑사원 딥(32B)' 등 4종만 확인됐고, 나머지 1개 모델은 보고서상에서 특정되지 않았다. 이 때문에 업계 안팎에서는 마지막 1개 모델을 둘러싼 추정이 빠르게 확산됐다. 일각에선 업스테이지 솔라가 포함된 것 아니냐는 관측이 제기됐다. 이 과정에서 일부 매체 기사와 기업 측 메시지가 동시에 시장 해석에 영향을 미쳤다는 평가가 나온다. 특히 공식 명단이 공개되지 않은 상황에서 특정 기업 모델이 포함된 것처럼 읽히는 신호가 잇따르면서 혼선이 커졌다는 지적이다. 당시 김성훈 업스테이지 대표는 자신의 페이스북에 "대한민국이 당당히 3위를 차지했다"며 "저희 솔라(Solar)LLM 모델도 기여를 했다"고 밝힌 바 있다. 취재 결과 당시 공개되지 않았던 나머지 1개 모델은 네이버클라우드의 '하이퍼클로바 X 시드 32B 싱크'인 것으로 확인됐다. 업스테이지 솔라는 초기 5개가 아닌 이후 반영된 추가 모델로 파악됐다.HAI 관계자는 "최신 데이터 반영 과정서 일부 모델이 추가·수정되면서 모델 집계에 변동이 생겼다"며 "2025년 기준 한국 AI 모델 수는 총 8개로 보고서에 반영될 것"이라고 설명했다. HAI는 이번 수정이 데이터베이스(DB) 보완 과정 일환이라는 입장도 내놨다. 외부 문의에 따라 내용을 점검하고 최신 상태로 반영하고 있다고 답했다.HAI 관계자는 "우리는 AI 인덱스 신뢰성을 위해 즉각적인 답변 제공하고 있다"며 "모든 문의사항을 늘 모니터링하고 있다"고 말했다. 업계에서는 이번 사안이 공개 숫자와 실제 명단 사이 시차가 시장 혼선을 키웠다고 평했다. 한국 모델 수 5개만 먼저 공개되고 개별 명단이 불확실한 상황에서, 기업인이 정확하지 않은 메시지를 내놔 혼란이 더 커졌다는 지적이다. 업계 관계자는 "당시 확인되지 않은 해석이 너무 빨리 유통됐고, 아무 근거 없이 추측만 난무한 상황이었다"며 "업체들이 알려지지 않은 1개 기업을 두고 대부분 모른다로 대응했을텐데, 일부 기업이 자기 모델일 것이라고 (그냥) 주장한 듯 하다"고 말했다. "순위 연연해선 안 돼…등재 개수보다 해석이 중요" 이 같은 상황 속에 일각에선 이번 집계 변동을 두고 HAI의 데이터 반영 구조를 살펴봐야 한다는 주장이 나왔다. 단순 공개 지표를 기계적으로 합산한 결과라기보다 기존 모델 제출 이력이나 내부 검증 절차가 함께 작동했을 가능성이 있다고 봐서다. 업계 관계자는 "HAI 데이터 반영 방식이 단순 집계가 아닌 내부 검증 절차를 포함한 구조"라며 "네이버처럼 모델을 꾸준히 제출한 이력이 집계에 반영됐을 가능성 있다"고 설명했다. 신규 모델 등록 시점도 변수로 거론된다. 데이터베이스가 특정 시점을 기준으로 반영되는 만큼, 등록 시점에 따라 일시적으로 평가 대상에서 빠질 수 있다는 분석이다. 특히 연말과 연초처럼 데이터 반영 주기가 엇갈리는 구간에서는 이런 차이가 더 두드러질 수 있다는 지적이 나온다.또 다른 관계자는 "이중 신규 모델의 경우 등록 시점에 따라 일시적으로 평가에서 제외될 수 있다는 해석도 있다"며 "특히 지난 연말에 등록된 모델은 반영 시차가 있었을 것"이라고 말했다. 모델 등재 숫자만으로 기업 경쟁력을 판단하는 것은 무리라는 지적도 적지 않다. 모델 크기와 실행 환경, 배포 방식에 따라 다운로드 수와 활용 지표는 달라질 수 있어서다. 업계에선 순위 경쟁보다 상용화 성과와 실제 시장 영향력이 더 중요하다는 목소리도 나온다.AI 스타트업 관계자는 "모델 크기나 실행 환경에 따라 다운로드 수 등 지표는 언제든 달라질 수 있다"며 "중요한 것은 모델 상용화 성과와 시장에서 창출한 가치"라고 주장했다. 에포크AI 데이터베이스 집계 방식 자체를 확대 해석해선 안 된다는 의견도 있다. 특정 시점 데이터와 필터 조건에 따라 결과가 달라질 수 있는 만큼, 등재 개수만 떼어내 의미를 부여하는 데는 한계가 있다는 것이다. 업계 관계자는 "한국 모델 등재 자체에 큰 의미를 두는 것은 적절하지 않다"며 "에포크 AI 데이터베이스 특정 시점 기준과 필터 방식에 따라 달라질 수 있다"고 말했다. 또 다른 관계자는 "초기 5개 집계 역시 특정 시점 데이터일 뿐"이라며 "순위나 개수보다 데이터 기준과 해석이 더 중요하다"고 강조했다.