• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
2026전망
스테이블코인
배터리
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'솔라 오픈'통합검색 결과 입니다. (4건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

"솔라 독창성, 99.99%"…업스테이지, 데이터 공개로 도용 의혹 반박

업스테이지가 최신 언어모델 '솔라'를 둘러싼 기술 도용 의혹에 대응하기 위해 모델 설계도에 해당하는 학습 로그와 내부 데이터를 공개했다. 이는 독자 기술로 모델을 처음부터 구축했다는 '프롬 스크래치' 진위 논란에 정면 돌파하려는 전략이다. 김성훈 업스테이지 대표는 2일 서울 강남 인근 사무실에서 온·오프라인으로 '솔라 오픈' 현장 검증회를 열었다. 이번 검증회는 지난 1일 제기된 모델 프롬 스크래치 논란을 해소하기 위해 마련됐다. 앞서 고석현 사이오닉AI 대표는 솔라 오픈 100B가 중국 지푸AI의 'GLM-4.5-에어(Air)' 모델에 기반을 둔 파생 모델이라는 의혹을 제기했다. 솔라 오픈 100B는 지난달 30일 업스테이지가 '독자 AI 파운데이션 모델' 1차 성과 발표회에서 공개한 모델이다. 이날 업스테이지는 일부서 제기한 레이어놈(LayerNorm) 유사성을 근거로 타 모델 가중치를 재사용했다는 주장은 통계적 착시에 불과하다고 밝혔다. 레이어놈은 AI 모델 학습 안정성을 높이기 위해 데이터 수치를 일정하게 정돈하는 기술이다. LLM이 수조 개 데이터를 학습하는 과정에서 연산 값이 지나치게 커지거나 작아져 계산이 꼬이는 것을 방지하는 안정장치 역할을 한다. 솔라를 비롯해 'GPT', '라마' 등 전 세계 다수 AI 모델이 채택하고 있는 트랜스포머 핵심 표준 기술이다. 일각에선 솔라와 지푸가 레이어놈 유사성이 존재한다는 이유로 이같은 의혹이 등장했다. 솔라가 프롬 스크래치 모델이라면 해당 수치가 우연히 일치할 확률이 극히 낮다는 이유에서다. 이에 업스테이지는 해당 구간은 모델 전체 약 0.0004%에 불과한 미세 영역이라며 정면 반박했다. 오히려 솔라 오픈의 99.9996%가 타 모델과 완전히 상이함을 보여주는 역설적 지표라는 설명이다. 김 대표는 레이어놈 유사성 판단에 사용된 '코사인 유사도' 역시 적절한 비교 기준이 아니라고 선그었다. 그는 "코사인 유사도는 벡터 방향만 비교하는 단순 지표"라며 "통상 언어모델들의 레이어놈은 비슷한 구조와 특성을 공유한다"고 설명했다. 이어 "독립적인 모델 간 유사도가 높은 값으로 나오는 것이 오히려 자연스러운 현상"이라고 덧붙였다. 김 대표는 토크나이저 도용 주장 역시 어휘 수와 중복률 데이터로 반박했다. 그는 "솔라 오픈의 어휘 수는 19만6천 개로 비교 대상 모델인 15만 개와 차이가 크다"며 "공통 어휘는 41% 수준에 불과해 통상적인 동일 계열 모델의 중복률인 70%에 한참 못 미치는 독자적 결과물"이라고 주장했다. 업스테이지는 소스코드 무단 사용·라이선스 조작 의혹도 기술적 근거로 선을 그었다. 김 대표는 "외부 접근이 불가능한 학습 코드를 재사용한다는 주장은 기술적으로 성립할 수 없다"며 "인퍼런스 코드는 서빙 호환성을 위해 '아파치 2.0 라이선스'에 따라 정당하게 활용한 것"이라고 설명했다. 김 대표는 "의견을 주고받는 건강한 토론은 환영하나 허위 사실을 단정적으로 전달하는 행위는 AI 3강을 향해 최선을 다하고 있는 기업과 정부 노력을 심각하게 훼손하는 것"이라고 지적했다. 이어 "앞으로 투명한 기술 공개 바탕으로 글로벌 최고 수준 기술력을 증명하고 국내 AI 생태계 확장에 힘쓰겠다"고 밝혔다.

2026.01.02 18:44김미정

[유미's 픽] 뿔난 업스테이지, '솔라 오픈 100B' 中 모델 파생 의혹에 공개 검증 '맞불'

정부에서 추진 중인 '독자 인공지능(AI) 파운데이션 모델 프로젝트'에 참가한 업스테이지가 첫 성과를 공개한 후 중국 모델을 복사해 미세 조정한 결과물로 추정되는 모델을 제출했다는 의혹에 휩싸였다. 업스테이지는 억울함을 표하며 모델 공개 검증 행사와 함께 향후 의혹 제기에 대해 강경 대응에 나설 것을 시사했다. 1일 업계에 따르면 고석현 사이오닉에이아이 대표는 이날 자신의 소셜 미디어(SNS)에 깃허브 리포트를 게재하며 업스테이지 '솔라 오픈 100B'가 중국 지푸(Zhipu) AI의 'GLM-4.5-에어'에서 파생된 모델이라고 주장했다. 고 대표는 "국민 세금이 투입된 프로젝트에서 중국 모델을 복사해 미세 조정한 결과물로 추정되는 모델이 제출됐다"며 "상당히 큰 유감"이라고 말했다. 이번 논란은 이날 오후 1시께 올라온 깃허브 리포트가 발단이 됐다. 이 리포트는 '솔라 오픈 100B'와 'GLM-4.5-에어'의 가중치 구조를 통계적으로 비교 분석한 결과를 담고 있다. 앞서 업스테이지는 지난 달 30일 독자 파운데이션 모델 '솔라 오픈 100B'를 LM 아레나 방식으로 해외 유명 모델들과 비교해 공개하며 '프롬 스크래치(From Scratch)'를 기반으로 개발했다고 소개했다. 프롬 스크래치는 AI 모델을 처음부터 직접 개발한다는 뜻으로, 데이터 수집과 모델 아키텍처 설계, 학습, 튜닝까지 모든 것을 자체적으로 수행하는 방식이다. 하지만 리포트 작성자는 '솔라 오픈 100B'와 'GLM-4.5-에어' 두 모델의 레이어별 파라미터 유사도를 측정한 결과 일부 계층에서 매우 높은 수준의 유사성이 관측됐다고 설명했다. 또 동일 모델 내부 레이어 비교보다 솔라와 GLM 간 동일 레이어 비교에서 더 높은 유사도가 나타났다고 주장하며, 이를 근거로 솔라 오픈 100B가 GLM-4.5-에어에서 파생됐다고 결론 내렸다. 다만 일각에서는 해당 분석이 두 모델의 학습 과정이나 개발 경로를 직접 확인한 것이 아니라는 점에서 해석에 신중할 필요가 있다는 지적이 나온다. 공개된 모델 가중치를 기반으로 한 사후적 통계 비교 방식으로 진행된 데다 실제 학습에 사용된 데이터셋, 학습 로그, 내부 코드베이스 등은 검증 대상에 포함되지 않았기 때문이다. 특정 가중치가 그대로 복사됐거나 모델 바이너리 차원에서 직접적인 공유가 있었다는 증거 역시 이번에 제시되지 않았다. 이 같은 의혹 제기에 대해 업스테이지는 즉각 반박에 나섰다. 고 대표가 게시물을 올린 지 2시간 후 김성훈 업스테이지 대표는 자신의 페이스북을 통해 "솔라 오픈 100B가 중국 모델을 복사해 미세 조정한 결과물이라는 주장은 사실과 다르다"며 "해당 모델은 명백히 프롬 스크래치 방식으로 학습됐다"고 강조했다. 그러면서 김 대표는 오는 2일 오후 3시 서울 강남역 부근에서 솔라 오픈 100B의 개발 과정을 공개적으로 검증받겠다고 밝혔다. 이 자리에는 의혹을 제기한 고석현 대표를 포함해 추가 검증에 참여하고 싶은 업계 및 정부 관계자들을 초청할 계획이다. 또 업스테이지 측은 이후에도 이 같은 의혹이 제기될 경우 더 강경하게 대응할지에 대해서도 내부 검토에 착수했다. 김 대표는 "학습에 사용한 중간 체크포인트(checkpoint)와 AI 모델 학습 과정과 실험 결과를 기록·관리하는 도구인 '웨이츠 앤 바이어시스(Weights & Biases·wandb)'를 모두 공개할 예정"이라며 "명확한 검증 절차를 공개해 사실 관계를 바로잡도록 할 것"이라고 말했다. 업계에서는 이번 공개 검증이 논란의 분수령이 될 수 있다는 평가를 내놨다. 실제 학습 체크포인트와 로그가 공개될 경우 '솔라 오픈 100B'가 특정 시점에서 외부 모델을 기반으로 파인튜닝됐는지, 독립적인 학습 경로를 거쳤는지를 보다 명확히 확인할 수 있기 때문이다. 동시에 통계적 유사성만으로 모델 복제 여부를 단정하기는 어렵다는 신중론도 제기된다. 대규모 언어모델 개발 과정에서는 유사한 아키텍처와 데이터, 학습 레시피를 사용할 경우 높은 유사도가 나타날 수 있어서다. 또 지식 증류(distillation)나 합성 데이터 활용 여부에 따라 통계적 패턴이 겹칠 가능성도 존재한다는 지적도 나온다. 업계 관계자는 "이번 논란이 주목받는 이유는 해당 모델이 정부 예산이 투입되는 '독자 AI 파운데이션 모델 프로젝트'의 결과물이기 때문"이라며 "사업 취지상 해외 모델에 대한 기술적 의존 여부와 개발 과정의 투명성은 핵심적인 검증 대상이 될 수밖에 없다"고 설명했다. 그러면서 "결국 이번 사안의 핵심은 통계 분석을 둘러싼 해석 논쟁을 넘어 실제 개발 과정에 대한 객관적 검증으로 옮겨가고 있다"며 "업스테이지가 예고한 공개 검증을 통해 솔라 오픈 100B의 학습 경로와 독립성이 어느 수준까지 입증될지에 많은 관심이 쏠리고 있다"고 덧붙였다.또 다른 관계자는 "이번 논란이 특정 기업의 문제를 넘어 독자 AI 파운데이션 모델 사업 전반의 검증 기준을 끌어올리는 계기가 될 수 있다"며 "다른 참여 기업들 역시 향후 모델 공개 과정에서 학습 출처와 개발 경로에 대한 설명 책임이 더 커질 가능성이 있다"고 말했다.

2026.01.01 18:09장유미

"국가대표 AI 기업 보러 왔어요"…LG·네이버 등 5대 기업, 한 자리서 기술력 과시

"국가대표 인공지능(AI) 기업들이라고 해서 궁금해서 방문했어요. 우리나라 AI 기술이 이렇게 발전했는지 이곳에서 경험할 수 있어서 너무 좋았어요." 서울 강남구에서 근무하고 있는 직장인 김은영 씨는 2일 서울 강남구 코엑스 A홀에서 개최된 'AI 페스타' 행사장에 위치한 '국가대표 5대 인공지능 기업관'에 방문해 이처럼 밝혔다. 평소 AI에 관심이 많았다는 김 씨는 "LG AI 연구원이 만든 '챗엑사원'을 한 번 써보고 싶었는데 오픈AI '챗GPT'와 성능을 비교하면 뒤지지 않는 것 같아 놀라웠다"며 "지금 베타 버전이라고 하는 데 일반 사람들도 편리하게 이용할 수 있게 LG가 나서주면 좋겠다"고 강조했다. '국가대표 5대 인공지능 기업관'은 정부가 지난 8월 '독자 AI 파운데이션 모델' 사업자로 선정한 네이버클라우드와 업스테이지, SK텔레콤, NC AI, LG AI연구원이 함께 부스를 마련한 곳으로, 5개 기업이 한 행사에 함께 모인 것은 이번이 처음이다. '독자 AI 파운데이션 사업'은 정부가 총 2천136억원을 투입하는 국가 프로젝트다. 이날 방문한 '국가대표 5대 인공지능 기업관' 입구 양측에서는 NC AI와 SK텔레콤이 관람객들을 맞았다. NC AI는 이번 전시에서 '바르코 3D'와 '바르코 사운드', '바르코 아트패션' 등 세 가지 솔루션을 선보여 눈길을 끌었다. 특히 '바르코 3D'를 통해 캐릭터를 만들어 현장에서 3D 프린터로 피규어를 만들어 내는 코너에선 관람객들이 신기해 하는 모습을 보였다. '바르코 3D'는 텍스트·이미지 프롬프트로 실시간 3D 모델을 생성하는 솔루션으로, 자동 리메시·텍스처 힐링으로 복잡한 수정 작업을 간소화하며 애니메이션 구현까지 가능하다. NC AI 관계자는 "첫째 날은 비즈니스, 업계 관계자들이 많이 방문해 우리 기술에 대해 관심을 많이 보였다"며 "지금은 학생, 일반인들도 부스를 많이 찾아 우리 회사에 대한 인지도를 더 쌓을 수 있는 기회가 된 것 같다"고 말했다. 전 세계 세 번째로 거대언어모델(LLM)을 선보인 네이버클라우드도 음성 인공지능(AI) 기술 '팟캐스트LM'을 현장에서 선보였다. 팟캐스트LM은 콘텐츠·텍스트를 팟캐스트 음성 콘텐츠로 생성할 수 있는 것으로, 텍스트 데이터와 음성 데이터를 결합해 자연스러운 음성 구현이 가능한 것이 특징이다. 이날 방문객들은 '팟캐스트LM'을 통해 각자가 궁금해 하는 부분들을 텍스트에 입력하자 곧바로 음성 콘텐츠가 생성되는 것을 보고 신기해 했다. '팟캐스트LM'은 기술 데모 형태로 사내에만 공개된 것으로, 향후 음성 콘텐츠 생성 관련 규제 완화 여부에 따라 정식 출시를 고려할 것으로 알려졌다. 네이버클라우드 관계자는 "'팟캐스트LM'은 추임새나 감정 표현까지 정교하게 표현할 수 있다"며 "우리의 음성 LLM 관련 기술은 지난해 최고 권위 AI 학회인 '뉴립스(NeurIPS) 2024'에도 채택됐다"고 설명했다. LG AI 연구원은 이번 행사에서 '엑사원 4.0'과 '챗엑사원' 베타 버전을 선보여 눈길을 끌었다. 계열사인 LG CNS가 마련한 부스와 연계해 스탬프 투어를 진행함으로써 관람객들의 프로그램 참여도를 높인 것이 신선했다. 현장에선 '챗엑사원' 베타 버전의 회원가입을 유도하는 이벤트도 진행됐다. '챗엑사원'은 '챗GPT'와 비슷한 사용자 인터페이스(UI)를 구현해 사용하기에도 좋았다. 답변 곳곳에는 '퍼플렉시티'가 제공하는 것처럼 출처를 명확히 표시해주는 각주 스타일도 결합돼 있었다. 덕분에 업무에 필요한 정보를 좀 더 정확하게 찾을 수 있을 듯 했다. 답변 속도도 상당히 빨랐다. 회사 이메일을 입력해 회원으로 가입한 후 'LG AI 연구원이 독자 AI 파운데이션 모델 사업에서 최종 사업자로 선정될까'라고 묻자 1초 만에 답을 뚝딱 만들어 냈다. 다만 결과물은 '한국의 AI 기술 발전에 중요한 역할을 할 것으로 기대된다'고 나타나 원하는 답변을 얻어내진 못했다. LG AI 연구원 부스 관계자는 "기대 이상의 관람객들이 방문해 준비했던 이벤트 상품들은 오전에 빠르게 소진될 정도로 많은 관심을 보였다"며 "'챗엑사원'을 현장에서 경험한 방문객들이 코드 작성, 검색 결과물 등을 보고 성능이 굉장히 우수하다고 말하며 놀라워했다"고 밝혔다. 그러면서 "국내 다른 대기업 관계자들도 부스에 대거 찾아와 관심을 보이며 많은 질문을 하고 갔다"며 "LG라는 브랜드 인지도가 있어선지 무조건 한 번은 이곳을 방문하는 듯 하다"고 덧붙였다. SK텔레콤은 이번 전시에서 한국어 특화 LLM '에이닷엑스(A.X)'와 AI 개인 비서 '에이닷(A.)'으로 부스를 꾸렸다. '에이닷엑스'는 한국어 환경에 최적화된 성능을 구현한 것이 특징으로, 최근 출시된 4.0 버전은 한국어·한국 문화 벤치마크 CLIcK에서 83.5점을 기록해 GPT-4o(72.5점·80.2점)보다 높은 성능을 입증했다. '에이닷엑스'로 개발된 '에이닷'은 자연어 대화뿐 아니라 일상 일정 관리와 통화 요약, 업무 자동화 등을 지원한다. '에이닷엑스'는 멀티 LLM 구조를 활용해 전문 분야별 에이전트 서비스까지 활용 가능하다. SK텔레콤은 올해 연말까지 5천억 개(500B) 매개변수 LLM을 개발해 '독자 AI 파운데이션 모델' 사업자 톱4에 든다는 목표다. SK텔레콤 관계자는 "현재 자체 보유하고 있는 그래픽처리장치(GPU)와 아마존웹서비스의 GPU를 활용해 열심히 모델을 개발하고 있다"며 "올 연말까지 목표한 대로 500B모델을 선보이기 위해 최선을 다하고 있다"고 말했다. 업스테이지는 이번 전시에서 자체 모델 '솔라 프로 2'와 '도큐먼트 인텔리전스'를 소개해 관심을 끌었다. '솔라 프로2'가 국제 분석 기관 아티피셜 애널리시스에서 12위를 기록하면서 일론 머스크가 이례적으로 트윗에 언급해 화제가 됐던 LLM인 탓에 현장에선 학생, 기업인 등 각계각층의 관람객들이 많은 호기심을 보였다. 올해 7월 공개된 '솔라 프로 2'는 고도화된 추론 능력을 갖춘 '하이브리드 모드'를 탑재한 것이 특징으로, 실시간 웹 검색, 정보 정리, 프레젠테이션 초안 작성 등 업무를 자율적으로 수행할 수 있다는 점이 인상적이었다. '도큐먼트 인텔리전스'는 단순 텍스트 추출에 그치지 않고 체크박스나 그래프, 비틀어진 텍스트까지 인식 가능하다는 점에서 업무에 활용하기에 굉장히 편리할 듯 했다. 업스테이지 관계자는 "'솔라 프로 2'는 단순 문장 응답을 넘어 사용자의 의도를 파악하고 외부 도구를 호출해 실질적인 결과물을 도출하는 '에이전트형 LLM' 구조를 갖췄다"며 "도큐먼트 인텔리전스는 AI로 보험을 비롯한 계약서, 재무문서 등을 99% 정확도로 자동 처리할 수 있는 플랫폼으로, 특히 금융·보험 산업에서 활용하기 유용할 것"이라고 설명했다. '국가대표 AI' 5개 업체는 오는 12월 말 첫 평가를 받을 예정으로, 이 때 대국민 콘테스트가 병행된다는 점에서 이번 'AI 페스타'에 참석해 인지도를 구축하는 데 상당한 도움을 받을 것으로 보인다. 5개 기업은 앞으로 6개월 단위 평가를 거쳐 오는 2027년 상반기까지 최종 2개 팀으로 추려진다. 배경훈 과학기술정보통신부 부총리 겸 장관은 '국가대표 5대 인공지능 기업관'에 방문해 "(이 기업들이) 우리 독자 파운데이션 모델을 글로벌 수준으로 만들 수 있다고 생각한다"며 "글로벌 톱10이 아니라 톱2·3 수준까지 도약할 수 있을 것으로 믿는다"고 강조했다. 이어 "(각 기업들이) 역량을 모아 세계 최고에 도전하는 것을 목표로 삼았으면 한다"고 덧붙였다.

2025.10.02 10:41장유미

[유미's 픽] 국가대표 AI 선발, 오픈소스 비중·기술력·성능에 달렸다…新 모델 개발도 '관건'

이재명 정부의 핵심 국정 사업인 '글로벌 인공지능(AI) 강국' 꿈의 발판이 될 '국가대표 AI' 선정을 앞두고 사업 참여 의사를 밝힌 기업들이 잇따라 자체 개발한 추론 모델을 오픈소스로 개방하고 나섰다. 이번 정부 사업에선 '프롬 스크래치' 방식을 통한 기술력과 오픈소스 비중, AI 모델 성능이 당락을 좌우할 핵심 기준으로 지목되고 있다. 24일 업계에 따르면 지난 21일 마감된 '독자 AI 파운데이션 모델 개발 프로젝트'에는 총 15개 컨소시엄이 참여하는 것으로 집계됐다. 참가팀은 ▲네이버클라우드 ▲루닛 ▲모티프테크놀로지스 ▲바이오넥서스 ▲사이오닉에이아이 ▲업스테이지 ▲SK텔레콤 ▲NC AI ▲LG AI연구원 ▲정션메드 ▲카카오 ▲KT ▲코난테크놀로지 ▲파이온코퍼레이션 ▲한국과학기술원 등이다. 이 프로젝트는 글로벌 톱 수준의 국산 거대언어모델(LLM)을 만들겠다는 목표를 앞세워 추진하는 것으로, 정부에서 오는 2027년까지 약 2천136억원을 투입한다. 선발된 기업들은 정부로부터 그래픽처리장치(GPU)와 데이터, 전문 인력 등을 집중 지원받을 예정이다. 정부는 이번 선발전의 평가 기준을 크게 세 가지로 구분했다. 총점은 100점으로 ▲기술력 및 개발 경험(40점) ▲개발목표 및 전략·기술(30점) ▲파급효과 및 기여 계획(30점) 등을 눈여겨 볼 예정이다. 서면 평가는 이날부터 오는 26일까지 진행되며 총 10팀을 우선 선발한다. 서면 평가를 통과한 기업들은 이르면 26일, 늦어도 27일에 발표될 예정이다. PT 평가는 이달 30~31일에 진행되며 최종 사업자 발표는 8월 4~5일께 이뤄질 것으로 알려졌다. 심사위원 구성은 서면 평가가 7명 내외, PT 평가가 10명 내외인 것으로 전해졌다. 사업 초기에는 총 5개 기업이 우선 선발되며 이후 6개월 단위로 선별 축소할 예정이다. 성능·전략·파급효과 등을 기준으로 단계 평가를 거쳐 4개팀 → 3개팀 → 2개팀 식으로 줄여나갈 예정이다. 현재 업계에서 유력 후보로 보고 있는 곳은 네이버클라우드와 LG AI연구원, NC AI, 업스테이지 등으로 압축됐다. 또 해외 업체들과 활발한 협업에 나섰던 SK텔레콤, KT 등 통신사들은 정부가 이 프로젝트를 시작하며 대규모 자금 투입에 나서자 방향을 틀어 참여 의사를 밝힌 상태다. 중소·중견기업 중에선 코난테크놀로지도 사업자 선정에 대한 기대감을 높이고 있다. 카카오도 자체 개발한 LLM '카나나'를 앞세워 계열사의 다양한 서비스를 활용해 AI 모델 수요를 끌어 올릴 수 있다는 점을 경쟁력으로 내세운 것으로 전해졌다. 업계에선 기술 성숙도 측면에서 '프롬 스크래치(From Scratch·모델의 첫 단계부터 모두 직접 구축)'를 통한 AI 개발 경험이 핵심 기준이 될 것으로 봤다. 외국 거대언어모델(LLM)을 기반으로 파인튜닝하거나, 아키텍처를 재설계하는 식으로 모델을 만들어 본 경험만으로는 정부가 원하는 결과물을 내놓기 쉽지 않을 것으로 예상돼서다. 업계 관계자는 "정부가 '전국민 AI'에 쓸 AI 모델 수준을 현재 최고 수준으로 평가 받는 소타(SOTA·State-of-the-Art) 모델로 원하는 것으로 알고 있다"며 "이에 맞추기 위해선 '프롬 스크래치' 방식으로 300억 개(30B) 이상의 파라미터(매개변수)를 가진 대형 모델을 자체적으로 만들어 본 경험을 가지고 있어야 하는데, 여기에 맞는 기업이 손에 꼽힐 것으로 보여 유력 후보군이 상당히 압축될 수밖에 없다"고 봤다. 그러면서 "외국 AI 모델의 아키텍처를 재설계해 만든 모델임에도 최근 '프롬 스크래치' 방식이 주목 받기 시작하자 이를 마케팅으로 활용하는 기업들이 속속 나오고 있는 듯 하다"며 "해외 모델을 참고해 만들었음에도 '프롬 스크래치'라고 표현하는 것은 심사 위원뿐 아니라 업계 분위기를 흐리는 듯 해 '페이크 파운데이션 모델'로 분류하는 것도 필요해 보인다"고 지적했다. 업계에선 '프롬 스크래치' 방식을 그간 고집하며 대형 모델을 선보였던 네이버클라우드와 LG AI연구원, NC AI, KT가 이번 사업에서 다소 유리한 고지에 올랐다고 평가했다. 이들은 외국 회사의 오픈소스를 활용하지 않고 처음부터 끝까지 자체 기술만을 적용해 30B 이상의 대형 AI 모델을 개발해 본 경험이 있다. 코난테크놀로지, 카카오도 프롬 스크래치 방식으로 자체 모델을 개발했다고 주장하고 있다. 반면 업스테이지는 메타 '라마', 마이크로소프트(MS) '파이' 등 해외 빅테크 AI 모델의 아키텍처를 기반으로 재설계해 자체 LLM인 '솔라'를 선보이고 있다. SK텔레콤도 최근 '프롬 스크래치' 방식으로 만들었다고 강조하며 자체 LLM '에이닷엑스 3.1 라이트'를 공개했지만, 업스테이지와 동일하게 재설계된 모델인 것으로 알려졌다. 루닛과 컨소시엄을 구성한 트릴리온랩스가 지난 23일 공개한 자체 LLM '트리-21B'도 라마 등 해외 모델을 기반으로 한 것으로 업계에선 추정했다. 다만 회사 측은 '프롬 스크래치' 방식으로 그간 모델을 개발해왔던 만큼 이는 사실이 아니라는 입장이다. 정부는 일단 외국 AI 모델의 아키텍처를 재설계했을 경우에는 활용해도 된다는 입장이다. 기존 모델을 고도화할 경우 오픈AI 등 다른 회사와 라이센싱 이슈가 없어야 한다는 조건도 따로 내걸었다. 이는 국내에서 생산되는 양질의 중요 데이터가 자칫 외국으로 유출될 수 있다는 우려를 의식한 것으로 풀이된다. 업계 관계자는 "AI 모델을 자체 개발한 기업만 참가할 수 있게 한다면 대부분 국내 스타트업들은 어느 한 곳도 선발전에 참여할 수 없을 것"이라며 "정부가 이를 고려해 기준을 좀 더 넓게 본 것 같다"고 밝혔다. 그러면서 "이런 스타트업들은 현재 상태에선 프롬 스크래치 방식으로 AI 모델을 새롭게 만들 수 없는 상태"라며 "사업자로 선정된다고 해도 기존 모델을 업그레이드 하는 쪽으로만 방향성을 잡게 될 것"이라고 덧붙였다. 정부는 일단 독자 AI 모델 개발과 관련해 새로운 모델 개발 또는 기존 자체 모델을 고도화하는 방식을 모두 허용했다. 이 사업을 주도하고 있는 과학기술정보통신부는 어떤 방식이든 평가에 차등을 두지 않는다는 방침이다. 기존 자체 모델을 활용하는 곳은 LG AI연구원, KT가 대표적이다. 이들은 사업자로 선정됐을 시 기존에 선보였던 자체 LLM '엑사원', '믿:음'을 고도화 해 '전 국민 AI'로 활용하겠다는 계획을 밝혔다. 카카오도 자체 모델인 '카나나'를 활용해 모델 고도화 방향으로 전략을 짠 것으로 알려졌다. 반면 네이버클라우드, NC AI는 '전 국민 AI'에 맞춰 새로운 모델을 개발하는 것으로 방향을 잡았다. '프롬 스크래치' 방식으로 각각 '하이퍼클로바X', '바르코 LLM'을 개발해봤던 경험을 토대로 이미 기술력이 충분히 검증된 만큼, 한국에 특화된 LLM을 처음부터 새롭게 개발할 수 있다는 자신감을 내보이고 있다. SK텔레콤도 이달 들어 독자 구축 LLM인 '에이닷엑스'의 다양한 모델을 선보이고 있지만, 독자 AI 파운데이션 모델 사업자로 선정되면 새로운 모델 개발에 나설 것으로 파악됐다. 코난테크놀로지와 업스테이지 역시 새로운 모델을 개발한다는 계획이다. 이 같은 분위기 속에 일부 업체들은 자체 LLM을 오픈소스로 잇따라 공개하며 더 높은 점수를 받기 위해 고군분투하고 있다. 정부가 AI 모델 공개를 통해 국내 AI 생태계를 활성화시킬 수 있는지에 대한 여부도 주요 기준으로 삼고 있어서다. 네이버클라우드는 지난 22일 '하이퍼클로바 X 시드 14B 씽크'를 상업용으로 이용할 수 있는 무료 오픈소스를 공개했다. '하이퍼클로바 X 시드 14B 씽크'는 네이버의 독자 기술을 활용해 '프롬 스크래치'로 개발한 경량화 추론 모델로, 상용화된 해외 오픈소스 모델을 개조한 것이 아닌 원천기술로 추론 능력과 경량화 기술을 결합해 개발했다. 네이버클라우드는 추론모델을 연구용으로만 제한하지 않고 비즈니스에도 적용할 수 있게 이같은 결정을 내렸다. 다양한 산업 영역에서 만들어질 AI 에이전트의 기반 기술로 활용될 수 있게 함으로써 국내 AI 생태계를 한층 활성화시킬 것이란 방침이다. NC AI는 일찌감치 '바르코 LLM'을 학술적 용도뿐 아니라 상업적인 용도까지 활용할 수 있도록 오픈소스로 공개해왔다. 또 게임, 패션, 콘텐츠 등 다양한 산업군에서 실제 상용화된 AI 솔루션을 선보이고 있다는 점에서 이번 컨소시엄 구성에 국내 주요 대기업들이 대거 몰리기도 했다. 특히 오픈소스 모델 '바르코 비전 2.0'은 비전-언어 모델(VLM) 분야에서 최고 성능인 '소타'로 인정받아 눈길을 끌었다. LG AI연구원은 지난 해 8월 국내 최초로 연구용 오픈소스 모델인 '엑사원 3.0'을 공개했다. 같은 해 12월 공개한 '엑사원 3.5'는 국내 AI 모델 중 유일하게 스탠퍼드대에서 발간하는 AI 보고서에 포함돼 주목 받았다. 다만 최근 공개된 '엑사원 4.0'은 글로벌 오픈소스 AI 플랫폼 '허깅페이스'에 오픈웨이트(가중치 공개) 모델로만 공개했다. 또 LG AI연구원은 LG그룹 임직원 5만여 명이 사용하는 챗봇인 '챗엑사원'을 외부인도 사용해 볼 수 있도록 베타 버전을 공개해 문턱을 다소 낮췄다. 기업 사용자를 위한 API(애플리케이션인터페이스)도 공개해 '엑사원'을 다른 소프트웨어 개발에 사용할 수 있도록 했다. 기업들의 부담을 낮추기 위해 AI 모델 추론 서비스를 제공하는 스타트업 프렌들리AI와 손잡고 엑사원 API를 챗GPT의 10분의 1 가격으로 서비스하는 것도 강점으로 떠올랐다. 이와 별개로 LG AI연구원과 함께 컨소시엄을 구성한 것으로 알려진 LG CNS는 캐나다 AI 유니콘 기업 코히어와 손잡고 LLM 개발에 한창이다. 지난 5월 70억 파라미터의 한국어 특화 경량 LLM을 출시한 데 이어 두 달 만에 1천110억 개 파라미터를 갖춘 초대형 추론형 LLM을 공동 개발해 주목 받았다. 아직 이 모델들을 오픈소스로 공개하진 않았으나, 내부적으로는 검토 중인 것으로 전해졌다. 코난테크놀로지도 최근 매개변수 40억 개(4B) LLM '코난-LLM-IND'를 오픈소스로 공개했다. 이 모델은 중국 알리바바의 '큐원3'를 기반으로 한국어 최적화와 효율성 향상을 이뤘다는 평가를 받는다. 업스테이지는 신규 추론 AI 모델 '솔라 프로 2'를 중심으로 이번 정부 사업에 참여할 예정으로, 독립 LLM 성능 분석기관 아티피셜 애널리시스가 발표한 '지능 지표(Intelligence Index)'에서 국내 유일의 프런티어 모델로 선정돼 기술력을 입증했다. 이곳은 일찌감치 '솔라 10.7B'를 비롯한 여러 자체 모델을 허깅페이스 등 플랫폼에 공개했으며 해당 모델 가중치를 '아파치 2.0' 오픈소스 라이선스로 배포해 생태계 확장을 선도하고 있다는 평가를 받는다. SK텔레콤은 지난 11일 허깅페이스에 자체 LLM '에이닷 엑스 3.1 라이트'를 오픈소스로 공개했다. 70억 개(7B)의 매개변수를 기반으로 한 경량 모델로, 이 모델의 후속인 매개변수 340억 개(34B)의 프롬 스크래치 모델 '에이닷 엑스 3.1'을 조만간 오픈소스로 선보일 예정이다. KT 역시 지난 2023년 10월 공개한 '믿:음' 모델 중 70억 개 매개변수를 오픈소스로 제공했다. KT는 2천100억 개 매개변수를 가진 모델까지 개발하며 기술력을 과시한 바 있다. 업계 관계자는 "사업 당락은 독자 AI 모델의 오픈소스 공개 비중과 성능에 좌우될 것으로 예상된다"며 "정부가 AI 모델의 오픈소스 수준을 평가에 정밀하게 반영하고 정부 예산과 자부담 매칭 수준도 오픈소스 수준에 따라 차등화 한다는 방침을 세운 것으로 안다"고 말했다. 이어 "이번 사업은 LLM뿐 아니라 멀티모달 등 다양한 AI 모델 개발 역량과 자체 기술을 얼마나 활용하느냐에 따라 사업 성패가 갈릴 듯 하다"며 "정부가 이번에 업계에서 모두 인정할 만한 외국인 심사위원을 제대로 구성한 만큼, 이들이 여러 입김에 영향을 받지 않고 기술력으로만 공정한 심사를 할 것으로 기대된다"고 덧붙였다.

2025.07.24 09:03장유미

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

제도화 vs. 도입…신년사로 본 '디지털자산' 온도차

한국정보과학회 50여년 만에 여성 회장...올해 6대 ICT 학회장 누구?

삼성·LG 신임 수장, 'CES 2026'서 미래 AI·로봇 비전 꺼낸다

최태원 "韓 경제, 이대로 가면 5년 뒤 마이너스 성장"

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.