• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
CES2026
스테이블코인
배터리
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'모델 s'통합검색 결과 입니다. (13건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

[유미's 픽] 고석현發 中 모델 의혹에 정부도 '움찔'…국가대표 AI 개발 경로까지 본다

정부가 독자 인공지능(AI) 파운데이션 모델 프로젝트 정예 5개 팀을 대상으로 최종 모델뿐 아니라 복수의 중간 학습 기록까지 제출받아 검증하기로 하면서 국가 AI 사업의 평가 기준이 성능 경쟁에서 개발 경로 검증 중심으로 전환되고 있다. 업스테이지의 '솔라 오픈 100B'를 둘러싼 모델 유사성 논란을 계기로, 정부가 '프롬 스크래치(from scratch)' 여부를 기술적으로 입증하는 체계를 본격화했다는 해석이 나온다. 4일 과학기술정보통신부에 따르면 정부는 다음 주부터 평가를 진행해 오는 15일께 독자 AI 파운데이션 모델 프로젝트 정예 5개 팀 중 한 팀을 탈락시킨다. 이번 평가에서는 모든 팀으로부터 최종 모델 파일과 함께 복수의 중간 체크포인트(checkpoint)를 제출받아 전문기관인 한국정보통신기술협회(TTA)를 통해 면밀한 기술 검증을 실시할 예정이다. 중간 체크포인트는 AI 모델이 학습 과정에서 일정 단계마다 저장한 가중치 상태로 ▲모델이 랜덤 초기화에서 출발했는지 ▲학습이 연속적인 경로를 거쳤는지 ▲외부 모델 가중치가 중간에 유입됐는지 여부를 사후적으로 확인할 수 있는 핵심 자료다. 단일 최종 결과물만으로는 확인하기 어려웠던 개발 이력을 추적할 수 있다는 점에서 업계에선 이번 방침을 프롬 스크래치 주장에 대한 증빙 책임을 제도화한 조치로 보고 있다.배경훈 과학기술정보통신부 부총리 겸 장관은 "평가 과정에서 모든 정예팀으로부터 개발 모델의 최종 파일과 복수의 중간 체크포인트 파일 등을 제출받아 검증할 예정"이라며 "전문가 평가위원회를 통해서도 같은 자료를 바탕으로 계획에 부합한 AI 모델이 개발됐는지 여부를 검증해 확인할 것"이라고 설명했다. 정부가 이처럼 나선 것은 고석현 사이오닉에이아이 대표가 지난 1일 업스테이지의 독자 AI 프로젝트 모델 '솔라 오픈 100B'가 중국 AI를 도용·파생했다는 의혹을 제기한 것이 계기가 됐다. 고 대표는 '솔라 오픈 100B'의 기술 분석 자료를 공개하고 중국 지푸AI의 'GLM-4.5-에어' 모델에 기반을 둔 파생 모델이라고 의혹을 제기했다. 또 정부가 독자 AI 프로젝트의 참여 조건으로 제시한 프롬 스크래치(처음부터 만드는 것) 방식으로 학습된 모델이라면 나타나기 어려운 유사도라고 강조했다.이에 업스테이지는 곧바로 다음날 서울 강남역 인근에서 기술 공개 검증 행사를 열어 단순 레이어 유사성만으로 모델 파생 여부를 단정하는 것은 무리가 있다고 반박했다. 김성훈 업스테이지 대표는 "학습된 다른 모델의 가중치를 그대로 가져왔다면 프롬 스크래치가 아니지만, 모델 아이디어나 인퍼런스 코드 스타일을 참조하는 건 허용된다"며 "오픈소스 생태계에서 모델이 상호 호환되려면 구조가 비슷해야 한다"고 주장했다. 이후 문제를 제기한 고 대표는 또 다른 게시물을 통해 "상이한 모델도 레이어 값에선 높은 유사도를 보일 수 있다고 본다"면서도 "중국 모델 코드와 구조를 잘 학습하는 게 국가적인 AI 사업의 방향으로 타당한지는 의문"이라고 재차 문제를 제기했다. 이를 두고 업계에선 고 대표가 제시한 분석이 기술적으로 성립하기 어렵다는 점을 지적하며 전반적으로 업스테이지의 손을 들어줬다. 고 대표 역시 이날 또 다시 입장문을 통해 자신의 분석 방법에 한계가 있었음을 인정하며 "해당 근거를 보다 엄밀하게 검증하지 않은 채 공개함으로써 불필요한 혼란과 논란을 야기했다"고 사과했다. 그러나 고 대표는 이번 사안을 단순한 기술적 도용 논쟁이 아니라 '소버린 AI'와 '독자 파운데이션 모델'의 기준을 어떻게 정의할 것인가에 대한 구조적 질문으로 봐야 한다는 입장은 여전히 유지했다. 해외 모델의 코드나 구조를 참고·학습하는 방식이 국가 주도 독자 AI 사업의 취지에 부합하는지, 독자성을 판단하는 기준이 기술·학술적으로 얼마나 명확히 정리돼 있는지에 대한 논의가 필요하다고도 주장했다. 일각에선 고 대표의 초기 문제 제기 방식에 대해선 비판적인 태도를 보였으나, 이번 논쟁을 통해 독자 AI 모델의 개발 경로, 외부 레퍼런스 활용 범위, 학습 과정 공개 수준 등에 대한 사회적 합의 필요성이 수면 위로 떠올랐다는 점에 대해선 긍정적으로 봤다. 업계 관계자는 "이번 논란은 누가 옳고 그르냐를 가르는 사건이라기보다 한국형 파운데이션 모델을 어떤 기준으로 검증하고 설명해야 하는지를 집단적으로 학습한 과정에 가깝다"며 "검증 로그 공개, 체크포인트 관리, 참고 문헌 표기 같은 관행이 정착되는 계기가 될 수 있다"고 말했다. 또 다른 관계자는 "(고 대표가) 의혹을 제기하는 과정에서는 분명히 성급했던 부분이 있었지만, 사과와 인정이 공개적으로 이뤄졌다는 점 자체가 국내 AI 생태계의 성숙도를 보여주는 장면"이라며 "장기적으로는 정부 프로젝트 전반의 신뢰성을 높이는 방향으로 이어질 가능성이 크다"고 평가했다.정부 역시 이번 사안을 계기로 독자 AI 파운데이션 모델 프로젝트의 평가 기준을 보다 구체화해야 한다는 과제를 안게 됐다. 성능 중심 평가를 넘어 학습 경로의 투명성, 외부 기술 활용에 대한 명확한 가이드라인, 검증 가능한 공개 방식 등이 제도적으로 보완될 필요가 있다는 지적이다.이번 일에 대해 배 부총리는 긍정적으로 평가하며 독자 AI 파운데이션 모델의 검증 체계를 보완해야 할 필요성을 언급했다. 또 이번 사안을 계기로 정부가 정의한 '독자 AI 파운데이션 모델'을 어떻게 기술적으로 검증할 것인가에 대해서도 고민하는 모습을 보였다. 그는 지난 3일 자신의 소셜 미디어(SNS)를 통해 "데이터 기반의 분석과 이에 대해 공개 검증으로 답하는 기업의 모습은 우리 AI 생태계가 이미 글로벌 수준의 자정 작용과 기술적 투명성을 갖추고 있음을 보여준다"며 "성장통 없는 혁신은 없다"고 밝혔다. 이어 "의혹 제기는 할 수 있는 것"이라며 "이를 공개 검증으로 증명한 기업과 인정하고 사과한 문제 제기자 모두에게 감사하다"고 덧붙였다.국가AI전략위원회 관계자들도 이번 일에 대해 긍정적으로 평가했다. 박태웅 국가AI전략위원회 공공 AX 분과장은 "순식간에 다양한 검증과 토론이 이뤄지는 과정을 통해 한국 AI 생태계의 저력을 확인했다"고 말했다. 임문영 국가AI전략위원회 부위원장 역시 "검증 논란을 통해 방법의 한계와 개선점이 드러났고, 이는 AI 생태계가 건강하게 작동하고 있음을 보여준다"고 밝혔다.조준희 국가AI전략위원회 산업 AX·생태계 분과장도 최근 독자 파운데이션 모델의 유사성 논란이 건강한 기술 토론으로 이어진 점을 매우 고무적이라고 평가했다. 그러면서도 이제는 기술의 원천에 대한 논쟁을 넘어 '우리 모델이 글로벌 빅테크 대비 어떠한 차별적 경쟁력을 갖출 것인가'라는 소비자 관점의 본질에 집중해야 한다는 점도 강조했다. 그는 "'독자 기술'이라는 명분에만 함몰되면 정작 사용성이 뒤처져 시장에서 외면 받는 결과를 초래할 수 있다"며 "모델의 성패가 사용자의 선택에 달려 있다"고 밝혔다. 이어 "국내 모델이 지속 가능한 선순환 구조를 만들려면 적시성 있는 답변과 높은 활용도 등 철저히 고객 친화적 개발 방향을 견지해야 할 것"이라며 "5개 컨소시엄들이 이 기술을 어떻게 '잘 팔리는 서비스'와 '매력적인 상품'으로 연결할지 치열하게 고민해야 할 시점"이라고 덧붙였다. 다만 일각에선 정부가 '프롬 스크래치'를 어디까지 허용할 것인지에 대한 세부 기술 기준을 공식 문서로 명시하진 않았다는 점에서 여전히 우려를 나타냈다. 오픈소스 아키텍처 활용 범위, 구조적 유사성의 허용선, 토크나이저 재사용 여부 등은 여전히 정책적 해석의 영역으로 남아 있어서다. 업계에선 이번 정부 방침을 독자 AI 평가가 '결과물 중심'에서 '개발 경로와 증빙 책임 중심'으로 이동하고 있음을 보여주는 신호로 받아들이는 분위기다. 성능 지표만으로는 설명할 수 없는 '독자성'을 앞으로 학습 이력과 로그로 입증해야 하는 단계에 들어섰다는 점에서 고무적으로 평가했다. 업계 관계자는 "이번 논란은 누가 맞고 틀렸는지를 가리는 사건이라기보다 한국 AI 생태계가 공개 검증과 공개 토론을 감당할 수 있는 단계에 들어섰음을 보여준 사례"라며 "이 경험이 제도와 기준으로 남는다면 독자 AI를 둘러싼 논쟁은 반복되지 않을 것"이라고 말했다. 배 부총리는 "지금의 논쟁은 대한민국 AI가 더 높이 도약하기 위해 반드시 거쳐야 할 과정"이라며 "정부는 공정한 심판이자 든든한 페이스메이커로서 우리 AI 생태계가 성숙하게 발전할 수 있도록 역할을 다하겠다"고 밝혔다.

2026.01.04 06:00장유미

[유미's 픽] 뿔난 업스테이지, '솔라 오픈 100B' 中 모델 파생 의혹에 공개 검증 '맞불'

정부에서 추진 중인 '독자 인공지능(AI) 파운데이션 모델 프로젝트'에 참가한 업스테이지가 첫 성과를 공개한 후 중국 모델을 복사해 미세 조정한 결과물로 추정되는 모델을 제출했다는 의혹에 휩싸였다. 업스테이지는 억울함을 표하며 모델 공개 검증 행사와 함께 향후 의혹 제기에 대해 강경 대응에 나설 것을 시사했다. 1일 업계에 따르면 고석현 사이오닉에이아이 대표는 이날 자신의 소셜 미디어(SNS)에 깃허브 리포트를 게재하며 업스테이지 '솔라 오픈 100B'가 중국 지푸(Zhipu) AI의 'GLM-4.5-에어'에서 파생된 모델이라고 주장했다. 고 대표는 "국민 세금이 투입된 프로젝트에서 중국 모델을 복사해 미세 조정한 결과물로 추정되는 모델이 제출됐다"며 "상당히 큰 유감"이라고 말했다. 이번 논란은 이날 오후 1시께 올라온 깃허브 리포트가 발단이 됐다. 이 리포트는 '솔라 오픈 100B'와 'GLM-4.5-에어'의 가중치 구조를 통계적으로 비교 분석한 결과를 담고 있다. 앞서 업스테이지는 지난 달 30일 독자 파운데이션 모델 '솔라 오픈 100B'를 LM 아레나 방식으로 해외 유명 모델들과 비교해 공개하며 '프롬 스크래치(From Scratch)'를 기반으로 개발했다고 소개했다. 프롬 스크래치는 AI 모델을 처음부터 직접 개발한다는 뜻으로, 데이터 수집과 모델 아키텍처 설계, 학습, 튜닝까지 모든 것을 자체적으로 수행하는 방식이다. 하지만 리포트 작성자는 '솔라 오픈 100B'와 'GLM-4.5-에어' 두 모델의 레이어별 파라미터 유사도를 측정한 결과 일부 계층에서 매우 높은 수준의 유사성이 관측됐다고 설명했다. 또 동일 모델 내부 레이어 비교보다 솔라와 GLM 간 동일 레이어 비교에서 더 높은 유사도가 나타났다고 주장하며, 이를 근거로 솔라 오픈 100B가 GLM-4.5-에어에서 파생됐다고 결론 내렸다. 다만 일각에서는 해당 분석이 두 모델의 학습 과정이나 개발 경로를 직접 확인한 것이 아니라는 점에서 해석에 신중할 필요가 있다는 지적이 나온다. 공개된 모델 가중치를 기반으로 한 사후적 통계 비교 방식으로 진행된 데다 실제 학습에 사용된 데이터셋, 학습 로그, 내부 코드베이스 등은 검증 대상에 포함되지 않았기 때문이다. 특정 가중치가 그대로 복사됐거나 모델 바이너리 차원에서 직접적인 공유가 있었다는 증거 역시 이번에 제시되지 않았다. 이 같은 의혹 제기에 대해 업스테이지는 즉각 반박에 나섰다. 고 대표가 게시물을 올린 지 2시간 후 김성훈 업스테이지 대표는 자신의 페이스북을 통해 "솔라 오픈 100B가 중국 모델을 복사해 미세 조정한 결과물이라는 주장은 사실과 다르다"며 "해당 모델은 명백히 프롬 스크래치 방식으로 학습됐다"고 강조했다. 그러면서 김 대표는 오는 2일 오후 3시 서울 강남역 부근에서 솔라 오픈 100B의 개발 과정을 공개적으로 검증받겠다고 밝혔다. 이 자리에는 의혹을 제기한 고석현 대표를 포함해 추가 검증에 참여하고 싶은 업계 및 정부 관계자들을 초청할 계획이다. 또 업스테이지 측은 이후에도 이 같은 의혹이 제기될 경우 더 강경하게 대응할지에 대해서도 내부 검토에 착수했다. 김 대표는 "학습에 사용한 중간 체크포인트(checkpoint)와 AI 모델 학습 과정과 실험 결과를 기록·관리하는 도구인 '웨이츠 앤 바이어시스(Weights & Biases·wandb)'를 모두 공개할 예정"이라며 "명확한 검증 절차를 공개해 사실 관계를 바로잡도록 할 것"이라고 말했다. 업계에서는 이번 공개 검증이 논란의 분수령이 될 수 있다는 평가를 내놨다. 실제 학습 체크포인트와 로그가 공개될 경우 '솔라 오픈 100B'가 특정 시점에서 외부 모델을 기반으로 파인튜닝됐는지, 독립적인 학습 경로를 거쳤는지를 보다 명확히 확인할 수 있기 때문이다. 동시에 통계적 유사성만으로 모델 복제 여부를 단정하기는 어렵다는 신중론도 제기된다. 대규모 언어모델 개발 과정에서는 유사한 아키텍처와 데이터, 학습 레시피를 사용할 경우 높은 유사도가 나타날 수 있어서다. 또 지식 증류(distillation)나 합성 데이터 활용 여부에 따라 통계적 패턴이 겹칠 가능성도 존재한다는 지적도 나온다. 업계 관계자는 "이번 논란이 주목받는 이유는 해당 모델이 정부 예산이 투입되는 '독자 AI 파운데이션 모델 프로젝트'의 결과물이기 때문"이라며 "사업 취지상 해외 모델에 대한 기술적 의존 여부와 개발 과정의 투명성은 핵심적인 검증 대상이 될 수밖에 없다"고 설명했다. 그러면서 "결국 이번 사안의 핵심은 통계 분석을 둘러싼 해석 논쟁을 넘어 실제 개발 과정에 대한 객관적 검증으로 옮겨가고 있다"며 "업스테이지가 예고한 공개 검증을 통해 솔라 오픈 100B의 학습 경로와 독립성이 어느 수준까지 입증될지에 많은 관심이 쏠리고 있다"고 덧붙였다.또 다른 관계자는 "이번 논란이 특정 기업의 문제를 넘어 독자 AI 파운데이션 모델 사업 전반의 검증 기준을 끌어올리는 계기가 될 수 있다"며 "다른 참여 기업들 역시 향후 모델 공개 과정에서 학습 출처와 개발 경로에 대한 설명 책임이 더 커질 가능성이 있다"고 말했다.

2026.01.01 18:09장유미

[유미's 픽] "주사위는 던져졌다"…국대 AI 첫 탈락자, 1차 발표회서 판가름?

우리나라를 대표할 인공지능(AI) 모델을 선발하는 정부 사업 '독자 AI 파운데이션 모델 프로젝트'의 첫 결과물이 공개된 가운데 어떤 기업이 이번 심사에서 살아남을지 관심이 집중된다. 각 사업자들이 내세운 모델의 성과가 달라 정부가 심사기준을 어떻게 세웠을지도 관심사다. 31일 업계에 따르면 네이버, LG AI연구원, SK텔레콤은 AI 임원, NC AI와 업스테이지는 대표가 지난 30일 오후 2시부터 서울 강남구 코엑스에서 개최된 독자 AI 파운데이션 모델 프로젝트 1차 발표회에 참여했다. 발표는 네이버를 시작으로 NC AI, 업스테이지, SK텔레콤, LG AI연구원 순서로 진행됐다. 독자 AI 파운데이션 모델 프로젝트는 그래픽처리장치(GPU)와 데이터 등 자원을 집중 지원해 국가 대표 AI 모델을 확보하는 정부 사업이다. 과학기술정보통신부는 이번 발표를 기반으로 심사를 통해 내년 1월 15일 1개 팀을 탈락시키고, 이후에도 6개월마다 평가를 거쳐 2027년에 최종 2개 팀을 선정한다. 모델 성과 제각각…정부 심사 기준이 관건 이번 심사에선 각 팀이 주어진 공통 과제를 얼마나 잘 수행했는지, 각자 제시한 목표대로 성과를 냈는지가 관건이다. 모든 팀은 최근 6개월 내 공개된 글로벌 최고 모델 대비 95% 이상의 성능을 달성해야 하는 과제가 주어진 상태다.지난 8월 정예팀으로 선정된 지 4개월만에 첫 성과를 공개해야 하는 만큼, 개발 시간이 부족한 상황에서 각자 기술력을 얼마나 끌어올렸을지도 관심사다. 각 팀의 GPU 지원 여부, 지원 받은 시기 등이 각각 달랐다는 점에서 정부가 이를 심사 시 고려할 지도 주목된다. 이번 프로젝트를 위해 SK텔레콤과 네이버클라우드는 정부에게 GPU를 임대해주고 있다. 이 탓에 두 업체는 올해 '독자 AI 파운데이션 모델 프로젝트' 진행 시 정부로부터 GPU를 지원 받지 못했다. SK텔레콤은 엔비디아의 B200 칩 1천24장을 업스테이지와 LG AI연구원에, 네이버클라우드는 H200 칩 1천24장을 NC AI에 지원하고 있다. 이 탓에 GPU가 각 업체에 지원된 시기는 다 달랐다. 업계에선 정부가 어떤 기준을 세울지에 따라 각 팀의 승패가 갈릴 것으로 봤다. 정부는 그간 5개팀과 여러 차례 만나 평가 기준에 대해 논의 후 이달 중순께 합의를 보고 공지했으나, 어떤 팀이 탈락할 지에 따라 여전히 논란의 불씨가 많은 것으로 알려졌다. 업계 관계자는 "당초 5개 팀이 선정될 당시 정부에 제시했던 목표치를 달성했는지가 가장 중요할 것"이라며 "각 팀이 목표로 하고 있는 모델의 크기, 성능, 활용성이 제각각인 만큼 목표 달성률을 가장 중요한 기준치로 삼아야 할 것"이라고 강조했다. 이어 "벤치마크를 활용한다는 얘기가 있지만 모델 크기가 클수록 다운로드 수 측면에서 불리할 수 있어 이를 객관적 기준으로 삼기에는 다소 무리가 있을 수 있다"며 "5개 팀과 정부가 어떤 기준에 대해 합의를 했는지, 어떤 전문가를 앞세워 심사에 나설지도 주목해야 할 부분"이라고 덧붙였다. 5개 팀 첫 성과 공개…프롬 스크래치·모델 크기·활용성 주목 이번 1차 결과 공개에서 가장 주목 받는 곳은 업스테이지다. 대기업 경쟁자들 사이에서 짧은 시간 내 '프롬 스크래치(From Scratch)'를 기반으로 가성비 최고 수준인 모델을 완성도 높게 공개했다는 점에서 많은 이들의 호응을 얻었다. 프롬 스크래치는 AI 모델을 처음부터 직접 개발한다는 뜻으로, 데이터 수집과 모델 아키텍처 설계, 학습, 튜닝까지 모든 것을 자체적으로 수행하는 방식이다. 이 개념은 거대언어모델(LLM) 개발 때 많이 언급되며 아무 것도 없는 상태에서 모델을 직접 설계하고 데이터를 수집 및 전처리해 학습시킨다는 점에서 이를 통해 AI 모델을 선보일 경우 기술력이 상당히 높다고 평가를 받는다. 오픈AI의 'GPT-4'나 구글 '제미나이', 메타 '라마', 앤트로픽 '클로드' 등이 여기에 속한다. 업스테이지는 이날 독자 파운데이션 모델 '솔라 오픈 100B'를 LM 아레나 방식으로 해외 유명 모델들과 비교해 공개하며 자신감을 표출했다. 특히 발표에 직접 나선 김성훈 대표가 '솔라 오픈 100B'를 개발하게 된 과정을 스토리텔링 형식으로 발표해 호응을 얻기도 했다. 김 대표는 향후 200B, 300B 모델과 함께 멀티모달 모델도 선보일 예정이다.업계 관계자는 "김 대표가 발표 때 딥 리서치나 슬라이드 제작 등 코딩 외에 실제로 현장에서 많이 써봤을 것 같은 서비스를 직접 라이브 데모로 보여준 부분이 인상적이었다"며 "504장의 B200 GPU로 두 달 남짓 훈련한 것을 고려하면 모델 크기나 사용된 토큰수(추정)를 정말 빡빡하게 잘 쓴 게 아닌가 싶다"고 평가했다. 이승현 포티투마루 부사장은 "(업스테이지 발표 때) 솔라 프로가 'GPT-4o-미니'나 '파이-3 미디엄'보다 벤치마크가 높아 동급 사이즈에선 가장 우수하다고 했는데, 실제 가성비가 최고 수준인 것으로 보인다"며 "당장 기업들이 가져다 쓰기에도 좋을 것 같다"고 말했다. 이어 "그동안 업스테이지의 상징과도 같았던 DUS(구조 일부를 변경해 자체화한 AI 모델 개발 방식)를 넘어 프롬 스크래치로 모델을 개발했다는 점이 인상적"이라며 "기술 리포트가 없는 게 아쉽지만, 모델 카드에 프롬 스크래치를 기재한 것과 함께 API도 공개해 자신감을 드러낸 것이 국가대표로 내세우기 적합해 보였다"고 덧붙였다. 배경훈 과학기술정보통신부 부총리 겸 장관을 배출한 LG AI연구원도 이번 발표가 끝난 후 개발 중인 모델이 국가대표로 인정받기에 손색이 없다는 평가를 받았다. 이곳은 '엑사원 4.0' 아키텍처를 기반으로 파라미터 크기를 약 7배 키워 초기화한 상태에서 새로 학습시킨 'K-엑사원'을 이번에 공개했다. 'K-엑사원'은 매개변수 236B 규모의 프런티어급 모델이다. LG AI연구원에 따르면 'K-엑사원'은 개발 착수 5개월 만에 알리바바의 '큐웬3 235B'를 뛰어 넘고 오픈AI의 최신 오픈 웨이트 모델을 앞서 글로벌 빅테크 최신 모델과 경쟁할 수 있는 가능성을 입증했다. 글로벌 13개 공통 벤치마크 평균 성능 대비 104%를 확보했다는 점도 눈에 띄는 요소다. LG AI연구원은 "기존 엑사원 4.0 대비 효율성을 높이면서도 메모리 요구량과 연산량을 줄여 성능과 경제성을 동시에 확보했다"며 "특히 전문가 혼합 모델 구조(MoE)에 하이브리드 어텐션 기술을 더해 메모리 및 연산 부담을 70% 줄이고, 고가의 최신 인프라가 아닌 A100급 GPU 환경에서 구동할 수 있도록 했다"고 설명했다. 이곳은 향후 조 단위 파라미터 규모 글로벌 최상위 모델과 경쟁할 수 있도록 성능을 고도화한다는 계획이다. 또 글로벌 프론티어 AI 모델을 뛰어넘는 경쟁력을 확보해 한국을 AI 3강으로 이끌 것이란 포부도 드러냈다. 이번 발표를 두고 업계에선 LG AI연구원이 5개 팀 중 기술적인 내용이 가장 많이 들어있어 신뢰도가 높았다고 평가했다. 또 추론 강화를 위해 아키텍처를 변형하고 커리큘럼 러닝을 적용했다는 점에서 모델이 '프롬 스크래치'임을 명백히 보여줬다고 평가했다. 다만 동일 아키텍처인 32B 모델의 리포트와 가중치만 공개돼 있고, 이번 모델인 236B는 공개하지 않았다는 점은 아쉬운 대목으로 지적됐다. 업계 관계자는 "'K-엑사원'은 구조, 가중치가 완전 국산이란 점에서 통제권과 설명 가능성이 충분히 확보돼 있다고 보인다"며 "국방, 외교, 행정망 등 국가 핵심 인프라에 충분히 쓰일 수 있을 듯 하다"고 말했다. 그러면서도 "이번 발표에서 자체 MoE나 하이브리드 어텐션(hybrid attention, 효율·성능을 위해 다양한 어텐션 방식을 상황별로 혼합한 구조), 아가포(AGAPO, 어텐션·파라미터 사용을 입력에 따라 동적으로 조절하는 내부 최적화 기법) 같은 기술들에서 인상 깊은 것이 없다는 것은 아쉽다"며 "다음에는 실질적 효과에 대한 정량적 수치가 잘 기술되면 좋을 듯 하다"고 덧붙였다.이에 대해 LG AI연구원 관계자는 "모델 제출 마감이 이번 주까지여서 제출 시점에 236B 모델을 공개할 것"이라며 "이 때 테크 리포트로 세부 사항도 담을 예정"이라고 설명했다. SK텔레콤도 이번 발표에서 많은 이들의 주목을 받았다. 짧은 시간 안에 국내 최초로 매개변수 5천억 개(500B) 규모를 자랑하는 초거대 AI 모델 'A.X K1'을 공개했기 때문이다. 특히 모델 크기가 경쟁사보다 상당히 크다는 점에서 AI 에이전트 구동 등에서 유리한 고지에 있다는 일부 평가도 나오고 있다. SK텔레콤은 모델 크기가 성능과 비례하는 AI 분야에서 한국이 AI 3강에 진출하려면 500B 규모의 AI 모델이 필수적이란 점을 강조하며 톱2까지 오를 것이란 야심을 드러내고 있다. 또 SK텔레콤은 모두의 AI를 목표로 기업과 소비자간 거래(B2C)와 기업간거래(B2B)를 아우르는 AI 확산 역량도 강조했다. 여기에 SK하이닉스, SK이노베이션, SK AX 등 관계사와 협업으로 한국의 AI 전환에 이바지하겠다는 포부도 밝혔다. 다만 일각에선 프롬 스크래치로 모델을 개발했는지에 대한 의구심을 드러내고 있어 심사 시 이를 제대로 입증해야 할 것으로 보인다. SK텔레콤은 MoE 구조라고 강조했으나, 각 전문가 모델들이 자체 개발인지, 오픈소스 튜닝인지 밝히지 않아 궁금증을 더했다. 또 모델카드는 공개했으나, 테크니컬 리포트를 공개하지 않았다는 점도 의구심을 더했다. 이승현 포티투마루 부사장은 "MoE 구조를 독자 개발했다면 보통 자랑스럽게 논문을 내는 것이 일반적"이라며 "SKT가 'A.X 3.1(34B)'라는 준수한 프롬 스크래치 모델이 있으나, 이를 15개 정도 복제해 MoE 기술로 묶은 것을 이번에 'A.X K1'으로 내놓은 것이라면 혁신은 아니라고 보여진다"고 평가했다. 이어 "정량적 벤치마크보다 서비스 적용 사례 위주로 발표가 돼 기술적 성취보다 '서비스 운영 효율'에 방점이 찍힌 듯 했다"며 "SKT가 'A.X 3.1' 모델 카드에 프롬 스크래치를 분명히 명시했지만, 이번에는 명시하지 않아 소버린 모델로 활용할 수 있을지에 대해선 아직 판단이 이르다"고 덧붙였다. 이에 대해 SKT는 다소 억울해하는 눈치다. 프롬 스크래치로 개발을 한 사실이 명백한 만큼, 조만간 발표될 테크니컬 리포트를 통해 일각의 우려를 해소시킬 것이란 입장이다. SKT 관계자는 "모델 카드에 밝혔듯 A.X K1은 192개의 소형 전문가(expert)를 가지는 MoE 구조로, A.X 3.1 모델을 단순히 이어 붙여서 만들 수 없는 복잡한 구조인 만큼 처음부터 프롬 스크래치로 학습됐다"며 "관련 세부 내용은 이달 5일 전후 테크니컬 리포트를 통해서 공개할 예정"이라고 밝혔다. 업계 관계자는 "SKT가 500B 모델을 만든다는 것을 사전에 알고 우려가 많았지만, 다른 팀에 비해 성공적으로 압도적으로 큰 모델을 공개했다는 것 자체는 굉장히 인상적"이라며 "내년 상반기까지 정부에서 지원하는 GPU를 쓰지 않기 때문에 SKT가 얼마나 많은 GPU를 투입했는지 알 수는 없지만, 500B를 충분히 학습하기에는 (성능을 끌어 올리기에) 시간이 부족했을 것 같다"고 말했다. 그러면서도 "2T까지 만들겠다는 포부는 높이 평가한다"며 "성공적인 2T 모델이 나오기를 기대한다"고 부연했다. 네이버클라우드는 국내 최초 네이티브 옴니모달 구조를 적용한 파운데이션 모델 '하이퍼클로바 X 시드 8B 옴니'를 오픈소스로 공개하며 자신감을 드러냈다.이곳은 독자 AI 파운데이션 모델 전략 핵심으로 텍스트·이미지·음성을 통합한 '옴니 모델'을 제시했다. 옴니 모델은 텍스트, 이미지, 오디오, 비디오 등 다양한 데이터 형태를 하나의 모델에서 동시에 학습하고 추론하는 구조다. 사후적으로 기능을 결합하는 방식이 아닌, 처음부터 모든 감각을 하나의 모델로 공동 학습시키는 점이 기존 모델과의 차별점이다. 또 네이버클라우드는 기존 추론형 AI에 시각·음성·도구 활용 역량을 더한 고성능 추론모델 '하이퍼클로바 X 시드 32B 씽크'도 오픈소스로 공개했다. 이 모델은 올해 대학수학능력시험(수능) 문제를 풀이한 결과 국어·수학·영어·한국사 등 주요 과목에서 모두 1등급에 해당하는 성과를 거뒀다. 영어와 한국사에서는 만점을 기록했다. 네이버클라우드 성낙호 기술총괄은 "옴니 모델 기반 구조는 그래프·차트·이미지 등 시각 정보 해석에서 별도의 광학문자인식(OCR)이나 복수 모델 호출이 필요 없다"며 "개발과 운영 구조가 단순해지면서 구축 비용과 서비스 확장 부담도 크게 낮출 수 있다"고 강조했다. 업계에선 네이버클라우드의 발표를 두고 실제 '애니-투-애니(Any-to-Any) 모델'을 작은 사이즈로 공개한 부분에 대해 인상적이라고 평가했다. '애니-투-애니 모델'은 입력과 출력의 모달리티(형식)를 가리지 않고 어떤 조합이든 처리할 수 있는 멀티·옴니모달 모델이다. 또 유일하게 '덴스(Dense) 모델'을 썼다는 점도 주목을 받았다. '덴스 모델'은 모든 파라미터가 매번 계산에 참여하는 전통적인 모델 구조로, 어떤 것을 입력하든지 항상 같은 경로로 계산이 돼 지연 시간과 비용이 MoE에 비해 안정적이라고 평가된다. 이로 인해 네이버클라우드는 경쟁사들에 비해 전체 파라미터 수는 굉장히 작아 평가 시 다소 불리한 위치에 놓여 있다는 의견도 있다. 당초 1차 심사 때 14B를 선보일 것이라고 목표했던 것과 달리 모델 크기가 8B에 그쳤다는 점도 아쉬운 점으로 지목됐다. 업계 관계자는 "네이버가 태생부터 멀티모달인 '네이티브 옴니' 아키텍처를 설계했다는 점에서 방향성이 완벽하고 독자모델로도 입증을 했지만, 경량 모델을 공개했다는 점이 아쉽다"며 "거대 모델로 스케일업 했을 때의 추론 능력과 비용 효율성이 아직 검증되지 않았다는 것이 우려된다"고 짚었다. 이어 "옴니모달은 구글, 오픈AI도 지향하는 최신 아키텍처"라며 "네이버가 이를 '패치워크(여러 모델 붙이기)'가 아닌 '네이티브'로 구현했다고 강조했다는 점에서 소버린 모델로는 충분한 가치가 있다"고 덧붙였다. NC AI는 이연수 대표가 직접 발표에 나서 산업 특화 AI를 위한 파운데이션 모델 '베키(VAETKI)'를 소개했다. 또 1단계 추진 과정에서 고품질 한국어·산업 특화 데이터를 확보하고 100B급 LLM 개발도 마쳤다고 공개했다. NC AI에 따르면 현재 베키는 제조·물류·공공·국방·콘텐츠 등 28개 이상 산업 현장에 적용돼 실질적인 성과를 창출하고 있다. NC AI는 AI 모델 바로크에 3차원(3D) 생성 기술이 결합된 바로크 3D를 활용해 전 산업군에 최적화된 버티컬 AI 설루션을 제공한다는 계획이다. 이 대표는 "우리는 1차로 100B(1천억 개)급 파운데이션 모델의 틀을 마련했다"며 "2차에서 200B, 3차에서 300B급으로 글로벌 모델급 성능을 달성하려고 한다"고 강조했다. 업계에선 NC AI의 이번 발표를 두고 경쟁력 있는 모델을 다수 보유하고 있는 것에 비해 전달력이 미흡했다고 평가했다. 100B 모델과 함께 서비스에 특화된 7B, 20B, VLM 7B까지 다양한 모델을 준비했으나, 발표 구성이 미흡해 강점이 충분히 전달되지 못했다는 의견도 나왔다. 업계 관계자는 "NC AI의 텍스트로 3D 에셋을 만드는 성능은 확실한 산업적 가치를 보여주지만, 그 이상의 것은 없어 아쉽다"며 "100B 모델을 기반으로 게임에 특화된 AI 활용을 좀 더 많이 보여줬다면 훨씬 좋았을 것 같다"고 말했다. 성과 확인 '끝'…1차 발표회 호평 속 투명한 검증 '과제' 업계에선 이번 1차 발표회의 전반적인 진행에 대해 긍정적인 평가와 함께 정부가 앞으로 조금 더 구체적인 국가대표 AI 육성 평가를 내놓을 필요가 있다고 지적했다. 이번 발표회에서 소버린 AI를 강조하는 곳은 많지만, 그 실체를 증명하는 기준이 조금 느슨해보였다는 평가도 나왔다. 업계 관계자는 "이번 발표회에서 각 팀들이 얼마나, 어떻게 혁신적인 모델을 개발해 공개했는지에 대한 구체적인 설명이 없어 아쉬움이 컸다"며 "단순한 제품 홍보 발표회 느낌을 많이 받았지만, 단기간에 모든 팀이 굉장한 일을 정부 지원을 토대로 해냈다는 것에 대해선 기대감을 가지게 했다"고 밝혔다. 이어 "최소 100B급 이상의 모델을 학습시킬만한 인프라 운용과 더불어 학습 노하우를 갖추고 있어 보여 좋았다"며 "단기간 내 실험 시간의 물리적 제한이 있었음에도 기본적으로 초거대 AI 모델을 학습시킬 기본 역량은 대부분 갖췄다고 보여져 놀라웠다"고 덧붙였다. 그러면서도 "2차 발표에선 오거나이징 하는 측에서 명확한 발표 가이드를 제시해주면 더 좋을 것 같다"며 "김성훈 업스테이지 대표의 말처럼 국민 세금이 많이 투입되고 있기 때문에 짧지만 굉장히 효과적인 발표회가 앞으로도 진행될 수 있길 바란다"고 언급했다. 또 다른 관계자는 "독자 AI 파운데이션 모델의 핵심은 어떤 데이터로, 어떤 아키텍처를 써서 어떤 방식으로 학습했는지가 투명해야 한다"며 "그 결과물은 글로벌 시장에서 통할 수 있는 객관적 수치로 증명돼야 하고, 각 팀들은 기술 리포트와 모델 카드를 의무적으로 공개해야 제대로 프롬 스크래치로 개발했는지 검증할 수 있다"고 강조했다. 그러면서 "프롬 스크래치가 만능은 아니지만 투명성은 필수"라며 "무늬만 국가대표가 아닌 실력 있는 국가대표를 가려내기 위해선 마케팅의 거품을 걷어내고 기술의 족보를 따지는 엄격한 검증 시스템이 필요하다고 본다"고 덧붙였다.

2025.12.31 17:59장유미

[유미's 픽] "사명감 없으면 힘들 걸?"…정부 '특화 AI' 사업 추진에 업계 반응 '떨떠름'

"사명감을 가지고 하지 않는 이상 이번 정부 사업에 참가하긴 힘들지 않을까요?" 정부가 글로벌 수준의 특화 인공지능(AI) 모델 개발 사업에 본격 나선 가운데 지원책이 아쉽다는 지적이 일고 있다. 앞서 5개 사업자가 선발된 '독자 AI 파운데이션 모델 프로젝트(국가대표 AI, K-AI)'에 비해 데이터, 인재 등에 대한 지원이 없는 데다 참여하는 것에 대한 명분도 크지 않다는 점에서다. 19일 업계에 따르면 과학기술정보통신부(과기정통부)는 산업 특화 AI 모델 개발 사업자로 선정된 최종 2팀에게 엔비디아의 최신 그래픽처리장치(GPU) 'B200'을 각각 256장씩 제공한다. GPU는 엘리스그룹이 공급한다. 이번 사업은 독자 AI 사업자 선발 때 SK텔레콤과 네이버클라우드가 최종 5개팀에 포함되면서 정부가 확보했던 추경 예산이 남게 되자 새롭게 만들어졌다. 'GPU 임차 지원 사업'에도 참여하게 된 SK텔레콤과 네이버클라우드가 독자 AI 사업에서 정부로부터 1차 GPU 지원을 받을 수 없어서다. 하지만 이번 특화 AI 사업은 지원 규모가 독자 AI에 비해 너무 줄었다는 점에서 기업들의 흥미를 끌어들이지 못하고 있다. GPU 외에 인력, 데이터 등 다른 형태의 정부 지원이 거의 전무하기 때문이다. 일단 정부지원금은 GPU 개수와 GPU 월별 단가, 협약개월 수를 곱해 책정된다. 정부가 산출한 GPU 1장당 월별 단가는 B200 기준 660만원이다. 총 사업비는 정부지원금과 민간부담금으로 구성된다. 민간부담금은 참여인력 인건비 및 보유 유형 자산이 포함된 '현물'과 '현금'으로 구성된다. 정부가 지원하는 GPU 자원의 가치에 상응하는 민간부담금 편성 부분은 이번에 기업들의 관심을 떨어뜨린 요인이 됐다. 최종 사업자로 선발되면 기업 규모와 개발 모델의 오픈소스 공개 여부에 따라 차등적으로 책정된 비용을 현금과 현물로 부담해야 하는데, 정부 지원에 비해 참여한 곳들의 희생을 더 요구하는 구조여서다. 실제 모델을 상업용 오픈소스로 공개할 경우 기업 규모별 자부담율은 ▲대기업 10% ▲중견기업 6% ▲중소기업 5%로 책정됐다. 연구용 오픈소스는 ▲대기업 25% ▲중견기업 15% ▲중소기업 12.5% 등의 비율로 사업비를 부담해야 한다. 만약 모델을 오픈소스로 공개하지 않게 되면 자부담율은 ▲대기업 50% ▲중견기업 30% ▲중소기업 25% 등으로 2배 이상 늘어나게 된다. 민간 부담금 중 현금 부담 비율도 정해졌다. ▲중소기업은 총 부담금의 10% 이상 ▲중견기업은 13% 이상 ▲대기업은 15% 이상을 반드시 현금으로 마련해야 한다. 다만 최종 사업자로 선정된 곳이 정부로부터 GPU를 공급 받지 않는다고 할 경우 민간부담금은 사라진다. 이 경우 정부의 아무런 지원 없이 최종 사업자의 비용으로만 모델을 개발해야 하는 구조다. 업계 관계자는 "GPU만 지원하고 데이터 구매·활용 시에도 사업자가 부담해야 한다는 점에서 당장 개발하는 모델로 수익을 내지 못하는 기업들은 참여하기 힘들 것"이라며 "조건이 참여를 할 만큼 좋은 편은 아니다"고 지적했다. 이어 "당장 돈이 되지 않는 정부 사업을 기업들이 가진 리소스를 투입해 참여해야 하는 지도 의문"이라며 "돈이 된다 싶은 걸 오픈소스로 공개해버리면 그것대로 경쟁만 치열해질 게 뻔해 참여한 곳들이 비용만 투입하고 건질 것은 없는 구조"라고 일침했다. 대기업이 주관사가 아닌 참여기관으로만 참여할 수 있다는 점에서도 사업의 흥행이 보장될 수 없게 됐다. 주관기관은 국내 기업·대학·연구기관만 가능하도록 한다는 점에서 대기업들이 사업적으로 얻게 될 이득이 크지 않다는 분석이 나온다. 해외기업이 글로벌 서비스 개발에 한해 합류할 수 있다는 전제가 포함됐지만, 특화 AI 사업의 열악한 조건 탓에 관심을 보이는 곳은 거의 없는 것으로 알려졌다. 컨소시엄을 구성할 때 특정 산업 도메인과 수요기관·수요처를 민간이 직접 제안해야 한다는 점도 참여 의욕을 떨어뜨리는 요소다. 정부가 도메인을 지정하는 대신 민간이 산업 수요를 발굴하도록 유도하고 있지만, 정작 관심을 보이고 있는 분야가 금융, 법률, 의료, 교육 등 공공성과 산업 수요가 맞닿는 곳에 국한된 모습을 보였다는 점 역시 한계로 지적됐다. 'K-AI' 엠블럼이 수여된 '독자 AI'와 달리 기업들에게 주어지는 상징적인 보상안이 없다는 점도 특화 AI 사업에 대한 기대치를 낮추게 했다는 지적이 나왔다. 독자 AI 사업자로 선정된 SK텔레콤·LG AI연구원·NC AI·업스테이지·네이버클라우드 등 5곳은 'K-AI' 엠블럼을 회사 홍보 등에 활용함으로써 국내외서 정부가 인정한 '국가대표 AI'라는 인식을 심어줄 수 있게 됐다. 그러나 특화 AI는 'K-AI' 엠블럼을 사용할 수 없다. 하지만 정부는 '특화 AI' 사업자로 참여할 팀에게 고난도의 기술만 요구하는 분위기다. 단순 서비스 개발이 아닌 '파운데이션 모델' 개발에 초점을 맞춘 만큼, 프롬스크래치 방식이나 기존 자체 모델의 프리 트레이닝 방식으로 모델을 개발해봤던 업체들이 사업자로 선정되기 유리한 구조로 조건을 걸었기 때문이다. 과기정통부 관계자는 "기존 모델을 일부 조정하는 '파인튜닝' 방식은 지원 대상이 아니다"며 "처음부터 모델을 설계하거나 기존 범용 모델에 대규모 데이터를 사전학습 시키는 방식만 가능하다"고 설명했다. 이어 "특정 분야에 쓰이는 만큼 낮은 환각 발생 가능성이 중요하다"며 "사전학습 단계부터 정제된 고품질 데이터로 학습하는 '프롬스크래치' 방식이 높은 신뢰성과 정확도를 담보할 뿐 아니라 세계 최고 수준의 모델을 만들겠다는 사업 목표와 직결된다"고 덧붙였다. 평가 기준도 ▲시장성·파급효과(40점) ▲개발 목표(30점) ▲기술력·개발 경험(30점) 등 기술 배점이 상당해 정부 지원금으로 사업을 시작해보려는 곳이 도전하기에는 힘든 구조다. 더구나 사업 기간은 오는 11월부터 내년 9월까지 약 10개월간으로 설정됐지만, 내년 3월에 1단계를 수행한 뒤 단계 평가를 치러야 한다는 점에서 모델 개발 경험이 없다면 사업을 지속하기 어렵다. 만약 성과를 검증해 2단계 지원을 이어 받는다고 해도 이 때 성과가 미흡하다면 중간 탈락할 가능성도 있어 사업 안정성도 낮게 평가 된다. 이 같은 조건 탓에 '독자 AI' 사업에서 쓴 맛을 봤던 기업들은 참여 여부에 대해 대체적으로 회의적인 반응을 보였다. 지난 15일 진행된 '특화 AI 사업 설명회'에는 삼성SDS, 마키나락스, 와이즈넛, 딥노이드, 모티프테크놀로지스, 코난테크놀로지, 루닛, KT, 카카오, 사이오닉AI, 솔트룩스, 딥브레인AI, 제논, 모비젠 등 다수 기업 관계자들이 참여했지만, 조건 공개 후 일부는 사업에 대한 관심을 접었다. 하지만 정부는 기술력 있는 기업들이 컨소시엄을 잘 구성해 특화 AI 사업에 도전할 것으로 기대했다. 또 초기 성과를 내기 위한 수요처도 컨소시엄 구성 시 잘 구성해야 유리할 것이라고 조언했다. 과기정통부 관계자는 "우리나라가 잘하는 분야를 중심으로 해당 기업이 얼마나 많은 데이터와 경험, 인력을 가지고 있는지가 평가 포인트가 될 것"이라며 "이를 고려해 컨소시엄을 얼마나 잘 구성할 것인지가 중요할 것"이라고 설명했다. 그러면서 "특화 AI 모델이 개발되면 특정 정부 공공 영역에서 쓰인다기 보다 해당 시장 영역에서 잘 쓰일 수 있는지도 관건"이라며 "컨소시엄에 어떤 수요기관을 얼마나 포함시켰는지를 면밀히 볼 것"이라고 덧붙였다. 또 정부의 지원이 부족하다는 지적에 대해선 "현재 수준으로만 일단 봐 달라"며 "2단계로 넘어갈 때 추가 지원 할 부분이 있는지에 대해 살펴볼 것"이라고 설명했다.

2025.09.19 18:05장유미

[유미's 픽] "진짜 승부는 이제부터"…4개월 후 웃을 'K-AI' 기업 어디?

대한민국 인공지능(AI) 시장을 이끌 대표주자 5개 팀이 확정된 가운데 이들의 향후 전략에 대한 관심이 쏠린다. 'K-AI'란 타이틀을 획득하는 것에 일단 성공했으나, 최종 2개 팀으로 선정되기 위해선 기술력이 얼마나 뒷받침 될 지가 가장 중요할 것으로 보인다. 5일 업계에 따르면 이번 관문을 넘은 네이버클라우드, 업스테이지, SK텔레콤, NC AI, LG AI연구원 등 5개 정예팀은 지난 4일 최종 사업자로 선정됨과 동시에 모델 개발을 위한 움직임에 돌입했다. 1개팀이 탈락하는 첫 심사가 오는 12월로 예정된 만큼, 시간을 허비할 수 없다는 판단에서다. 과학기술정보통신부는 5개 정예팀이 개발·확보한 AI 파운데이션 모델을 대상으로 반기마다 단계 평가를 진행해 한 팀씩 탈락시켜 2027년 상반기까지 최종 2개팀만 선발한다. 하지만 첫 평가일까지 4개월여밖에 남지 않았다는 점에서 각 업체들은 준비 시간에 대한 많은 부담감을 가지고 있는 상태다. 업계 관계자는 “6개월마다 진행되는 내년 평가와 달리 올해 진행되는 첫 평가는 2개월여의 시간이 부족하다”며 “최신 글로벌 AI 모델과 비교해 95% 이상의 성능을 지닌 AI 모델을 만들어야 한다는 정부의 지침에 맞춰 1차 평가에서 5개팀 모두 AI 모델을 내놓을 수 있을지 의문”이라고 짚었다. 그러면서 “'프롬 스크래치(From Scratch)' 방식으로 좋은 성능의 AI 모델을 개발해 본 경험이 없는 곳은 이를 실현하기가 쉽지 않을 것”이라며 “특히 1차 평가에서 각 팀이 제시한 목표치를 얼마나 달성했는지를 정부가 심사할 때 면밀히 보고, 달성하지 못했을 경우 평가에서 제외시켜야 공정성 논란이 없을 것”이라고 덧붙였다. 또 다른 관계자는 “각 팀에서 '전 국민 AI' 콘셉트에 맞게 새로운 모델을 개발한다고 얘기한 만큼, 자신만의 기술로 제대로 AI 모델을 개발했는지에 대해 1차 평가에서 주요하게 다뤄질 듯 하다”며 “시간이 빠듯한 만큼 기술력이 없으면 AI 모델을 시간에 맞춰 선보이기 쉽지 않을 것'이라고 전망했다. 업계에선 그래픽처리장치(GPU) 등 인프라만 있다면 4개월 내에 기술력을 지닌 팀들이 AI 모델을 새롭게 만드는 것은 큰 부담이 없을 것이라고 입을 모았다. 정부는 2개 정예팀에 엔비디아 'B200' 1천24장을, 1개 정예팀에 엔비디아 'H100' 1천24장을 지원할 예정으로, 업스테이지와 LG AI연구원, NC AI 등 3곳과 협의해 분배할 계획이다. SK텔레콤과 네이버클라우드는 이 프로젝트를 위해 정부에게 GPU를 임대해 줄 공급사로 선정돼 내년 상반기까지는 정부의 GPU 공급을 받을 수 없다. 업계 관계자는 ”기술력이 있고 GPU만 넉넉하게 갖고 있다면 성능 좋은 AI 모델을 개발하는 것이 크게 어려운 일은 아닐 듯 하다“면서도 ”사업 계획에 맞게 각 팀들이 GPU를 가져간다고 해도 자체적으로 보유한 데이터의 양과 질이 얼마나 좋은지에 따라서도 결과물이 갈릴 수 있을 것“이라고 말했다. 업계에선 각 팀들의 주관사들이 얼마나 주도적으로 역할을 잘 해나갈 지도 올 연말 심사 평가에서 중요한 기준이 될 것으로 봤다. 5개 정예팀에 선정되기 위해 다양한 참여기관, 수요기업들을 끌어 들여 놓은 만큼 이들의 요구 사항을 주관사가 얼마나 잘 조율할 지에 따라 AI 모델의 방향성이 달라질 수 있어서다. 업계 관계자는 ”참여기관이 많은 곳일수록 잡음이 생길 가능성이 높을 듯 하다“며 ”어느 한 쪽의 의견에 몰입하지 않고 중간자적 역할을 주관사가 잘 수행하는지도 정부에서 면밀히 들여다 볼 가능성이 높다“고 밝혔다. 현재 5개 정예팀은 프롬 스크래치부터 시작하는 독자 AI 개발 역량을 보유하고 상업용 활용이 가능한 높은 수준의 오픈소스 정책을 정부에 제시했다. 또 새롭게 개발하는 모델을 통해 기존 언어모델을 넘어서는 멀티모달·옴니모달로의 확장해 나갈 것이란 의지를 보였다. 업계 관계자는 ”각 팀들이 컨소시엄에 참여한 곳들과 어떤 식의 모델을 구축하겠다는 대략적인 계획만 제시했을 뿐 구체적인 사이즈와 성능, 어느 분야에 집중해 모델을 구축하겠다는 점은 전략상 드러내지 않은 상황“이라며 ”보안을 유지하며 각 업체들이 새로운 모델을 개발하겠지만 참여사들과 제대로 협업하지 않으면 1차 심사 때 기술 격차가 확연하게 드러날 가능성이 있다“고 짚었다. 정부는 올해 말까지 개발·확보한 각 팀의 AI 파운데이션 모델 등을 기반으로 오는 12월 말 1차 단계 평가를 진행해 1개팀을 탈락시킨다. 이번 평가에선 대국민·전문가 컨테스트도 진행할 예정으로, 세부 일정이나 방식은 추후 공개된다. 과기부는 ”1차 단계 평가는 입체적 평가를 지향하되 정예팀들과의 협의를 통해 평가 방안을 확정할 계획“이라며 ”각 정예팀이 개발·확보한 AI 파운데이션 모델의 AI 생태계 확장, 국민 AI 접근성 증진, 공공·경제·사회 분야의 AI 대전환(AX), 국방·안보적 활용 등을 적극 지원해 나갈 계획“이라고 밝혔다.

2025.08.05 18:04장유미

[유미's 픽] '국가대표 AI' PT 발표 막바지 속 정부 선택은

"PT 발표를 위해 100개가량의 예상 질문지를 작성해 답변을 만들고 여러 차례 리허설도 진행했습니다. 회사 전체의 명운이 걸린 일인 만큼 꼭 좋은 결과를 만들어 내고 싶습니다." '국가대표 인공지능(AI)' 타이틀을 노리고 PT 발표에 나선 10개 컨소시엄들이 최종 사업자 선정 발표만을 남겨두고 있는 가운데 정부가 어떤 결론을 내릴지 주목된다. 최종 선발될 총 5개 컨소시엄 중 3곳은 대기업, 2곳은 중견·중소기업들이 차지할 것이란 전망이 나오고 있는 분위기 속에 향후 결과에 관심이 쏠린다. 31일 업계에 따르면 과학기술정보통신부는 이날 '독자 AI 파운데이션 모델 프로젝트' 사업자 선정 1차 관문을 넘은 NC AI, 카카오, 업스테이지 등 5곳의 PT 발표를 진행한다. 지난 30일에는 네이버클라우드와 LG AI연구원, SK텔레콤, KT 등 5곳이 PT 발표를 마쳤다. PT 발표에선 심사위원들이 1차 서류 제출에서 지적했던 부분들을 각 컨소시엄들이 얼마나 잘 보완해 왔는지에 대한 질문들이 이어졌던 것으로 알려졌다. 현장에서 피드백을 더 줄 경우 평가 결과를 유추할 가능성이 높아 양측간 심층 토론 분위기는 아니었던 것으로 전해졌다. 현재까지 최종 사업자로 선정될 가능성이 가장 높은 컨소시엄으로는 LG AI연구원과 네이버클라우드가 유력하다고 보는 것이 중론이다. 이미 오픈소스 커뮤니티 '허깅페이스'에 오래 전부터 자체 개발 거대언어모델(LLM)들을 꾸준히 공개하며 기술력을 검증해왔던 탓이다. 특히 LG AI연구원의 '엑사원 4.0'은 최근 글로벌 AI 성능 분석 기관 '아티피셜 어낼리시스'의 평가에서 종합 순위 11위, 국내 AI 모델 중 1위를 차지해 기술력을 입증했다. 공개(오픈 웨이트) 모델 기준으로는 4위, 코딩은 7위, 수학 문제 해결 능력은 10위를 기록하며 영역별 '톱 10'을 달성했다. 이는 모델 크기가 수십 배에 달하는 미국 앤트로픽의 '클로드 4 오퍼스' 등 글로벌 프런티어 모델들과 어깨를 나란히 하는 성과다. 기술력뿐 아니라 시장의 관심도 뜨겁다. 지난 15일 글로벌 플랫폼 '허깅페이스'에 공개된 '엑사원 4.0'은 2주 만에 50만 다운로드를 돌파해 국산 AI 모델 최단 기록을 세웠다. '하이퍼클로바X'를 앞세운 네이버클라우드는 사업비 절감 측면에서도 경쟁력이 있다고 평가 받는다. 이곳은 지난 8일 과학기술정보통신부와 정보통신산업진흥원(NIPA)이 주관한 '그래픽처리장치(GPU) 임차 지원 사업'에서 2트랙 우선협상대상자로 선정된 상태다. 만약 '국가대표 AI' 정예팀으로 최종 발탁될 경우 정부가 직접 제공하는 1차 GPU 지원을 받을 수 없다. 이에 네이버클라우드는 자체 인프라와 사업 구조로 상쇄하며 개발과 공급 전략을 동시에 추진한다는 방침으로, 정부 입장에선 사업비 절감 효과가 있다. 이에 'GPU 임차 지원 사업'에서 1트랙 우선협상대상자로 선정된 SK텔레콤도 1차로 정부에서 GPU 지원을 받지 않는다는 점에서 가능성이 있을 것으로 보는 시각이 있다. 이달 들어 잇따라 새로운 AI 모델을 발표하며 기술력을 과시했던 것도 긍정적인 결과를 가져올 것이란 기대감이 나온다. 업계 관계자는 "이번에 정부가 GPU를 공급 받지 않는 2곳, GPU를 지원해야 하는 3곳을 최종 사업자로 선정할 것이란 얘기가 많다"며 "정부가 확보한 GPU를 기업들에게 집중적으로 배분하기 위해 이처럼 고민하고 있는 것으로 안다"고 말했다. 그러면서 "정부가 대기업 2~3곳, 통신사 1곳, 중소 스타트업 1곳을 최종 사업자로 선발할 가능성이 가장 높아 보인다"며 "중소 스타트업 분야에선 업스테이지와 컨소시엄이 공개되지 않은 카이스트 중 한 곳이 될 듯 하다"고 덧붙였다. 업계에선 NC AI도 선정 가능성이 높다고 보고 있다. 14년간 AI 기술력을 축적해 온 이곳은 지난 2023년 8월 '바르코 LLM'을 프롬 스크래치(From Scratch·모델의 첫 단계부터 모두 직접 구축)로 바닥부터 개발해 국내 최초로 AWS 마켓플레이스에 등재하며 글로벌 상용화에 성공한 저력이 있어서다. 또 컨소시엄 구성도 경쟁사들에 비해 가장 탄탄하다는 평가를 받고 있다. 우선 한국어 언어모델 '코버트' 등을 개발한 한국전자통신연구원(ETRI)을 비롯해 카이스트, 서울대학교, 고려대학교, 연세대학교 등 연구진이 NC AI 컨소시엄에 합류했다. 또 롯데이노베이트, 포스코DX, NHN 등 주요 대기업들이 기술 개발 및 확산 그룹에 동참키로 해 NC AI에 힘을 실어줬다. NC AI의 컨소시엄은 국내 산업, 연구, 학계 기관 14곳이 합류했고, 40곳이 수요기관으로 포함됐다. LG AI연구원도 LG CNS, LG유플러스 등 LG그룹 계열사와 한컴, 퓨리오사AI 등 각 분야의 최고 기술 기업들을 컨소시엄에 포함시켜 기대감을 키우고 있다. 특히 퓨리오사AI는 이날 총 1천700억원 규모의 투자 유치에 성공하며 자사 2세대 인공지능 반도체 '레니게이드' 양산과 3세대 제품 초기 개발에 속도를 낼 것이란 점에서 LG AI연구원 측에 많은 힘을 실어 줄 것으로 전망된다. 이곳은 최근 '레니게이드'를 LG AI연구원의 '엑사원'에 공급하며 기업 엔터프라이즈 시장에 진출했다. 퓨리오사AI의 기업가치는 이번에 1조원을 돌파하며 유니콘 반열에 올라섰다. SKT·KT 등 통신사와 코난테크놀로지·모티프테크놀로지스 등 중소업체들도 지난 21일 사업계획서를 제출한 후 전략을 대부분 노출했다. 모티프테크놀로지스는 모레를 비롯한 삼일회계법인, 서울대, 카이스트 외에 기업 및 공공기관 등으로 컨소시엄을 구축했다. AMD 기반으로 AI 모델을 구축하고 있으며 모레와의 시너지를 기대하고 있다. SK텔레콤은 이번에 포티투닷과 크래프톤, 라이너, 리벨리온, 셀렉트스타 등 여러 기업들과 서울대학교, 카이스트 등과 손잡았다. 또 수요 기업으로는 SK하이닉스와 SK이노베이션, SK AX, SKB 등 SK그룹사를 포함해 SKT가 주도하는 K-AI 얼라이언스에 참여 중인 몰로코(AI 광고), 씨메스(제조 AI), 가우스랩스(제조 AI), 스캐터랩(감성 AI) 등이 포함됐다. KT는 총 18개 기관과 함께 컨소시엄을 구성했다. 컨소시엄에는 ▲솔트룩스 ▲크라우드웍스 ▲매스프레소 ▲투모로 로보틱스 ▲경찰청 ▲고려대학교 의료원 ▲서울대학교 ▲고려대학교 외에 법률 기관, 로펌, 반도체 및 산업 AI 수요 기업 등이 포함됐다. 코난테크놀로지는 ▲사이냅소프트를 비롯해 ▲알체라 ▲페블러스 ▲고려대학교 ▲연세대학교 ▲포항공과대학교 ▲카이스트 등 8개 기관이 이름을 올렸다. 업스테이지도 지난 30일 김성훈 대표가 직접 자신의 소셜미디어(SNS)를 통해 컨소시엄에 포함된 기업을 공개했다. 김 대표는 "AI 데이터 가공 1위 플리토, AI 모델 경량·효율화 노타, GPU ops 글로벌 실력을 가진 래블업 등 스타트업과 뭉쳤다"고 밝혔다. 업계에선 중소기업 분야 경쟁에선 한 자리를 두고 코난테크놀로지와 업스테이지의 기싸움이 치열할 것으로 보고 있다. 코난테크놀로지는 실무 역량을 중심으로 팀을 구성한 데다 실제 파운데이션 모델을 직접 개발한 현장 적용 경험과 추진 역량이 이번에 드러났다는 점에서 경쟁력이 있다고 평가됐다. 업스테이지는 자체 개발 모델인 '솔라 프로2'가 메타, 딥시크 등의 모델들과 글로벌 AI 성능 평가에서 비슷한 수준을 기록했다는 점에서 기술력이 높다고 보는 시각이 많다. 문병로 서울대 컴퓨터공학과 교수는 자신의 SNS를 통해 "'솔라 프로 2'를 추가해 알고리즘 테스트를 진행 중으로 '챗GPT', '그록'에 밀리지 않는 느낌"이라며 "메이저 플레이들에 비하면 열악한 장비로 어떻게 저 수준에 이르렀는지 궁금할 정도로 대단하다고 보여진다"고 평가했다. 업계 관계자는 "'대기업 몰아주기' 논란을 의식한 정부가 중소기업·스타트업 참여를 고려할 경우 업스테이지를 최종 사업자 명단에 포함시킬 가능성이 크다"며 "네이버클라우드와 LG AI연구원도 각각 하정우 대통령실 인공지능미래기획수석과 배경훈 과기정통부 장관을 배출한 기업들인 데다 기술력도 검증된 곳인 만큼 최종 사업자가 될 것으로 보는 시각이 많다"고 말했다. 과기정통부는 이틀 간 진행된 2차 PT 평가 결과를 이르면 1일, 늦어도 4일께 발표할 것으로 알려졌다. 선발된 정예팀은 첨단 GPU, 데이터, 인재 등을 지원 받아 '국가대표 AI' 개발에 나서게 된다. 다만 사업 기간 동안 6개월 단위의 경쟁형 단계평가를 통해 최종 2개 팀으로 점차 압축된다. 업계 관계자는 "정부가 국산 LLM을 보유하기 위해 대규모 투자에 나서는 것도 중요하지만 LLM 개발과 GPU 인프라 확보에만 집중하고 있는 것은 다소 우려스럽다"며 "정작 AI를 통해 산업 생산성을 실질적으로 어떻게 끌어 올릴 수 있는지 등 '활용성'에 대한 고민은 뒷전으로 밀려나 있는 듯 해 아쉽다"고 지적했다. 또 다른 관계자는 "정부가 전략 산업, 국방 등 핵심 데이터를 가진 주요 안보 시설에 국가 LLM을 활용할 듯 하다"며 "다만 일반 사용자들을 위한 '전 국민 AI'로도 활용되기 위해선 정부가 요구하는 글로벌 톱 모델 성능의 95% 이상을 구현할 수 있는 모델을 만들 수 있는 기술력이 뒷받침 해야 한다"고 짚었다. 그러면서 "이를 고려할 때 적은 인프라로 얼마나 효율성 높은 LLM을 개발할 수 있는지에 대해 각 컨소시엄들이 PT 발표에서 제대로 입증해야 할 것"이라며 "인재 양성 및 확보도 기술력 검증 측면에선 중요 기준이 될 것으로 보인다"고 덧붙였다.

2025.07.31 12:16장유미

[단독] '국가대표 AI' 선발전, 한컴도 도전장…LG AI연구원 컨소시엄 '히든카드'

국내 인공지능(AI) 기술의 미래를 이끌어 갈 '독자 AI 파운데이션 모델 프로젝트' 사업자 선발전 2차 관문인 PT 발표가 30일부터 이틀 간 진행될 예정인 가운데 한컴이 LG AI연구원 컨소시엄에 참여한 것으로 드러나 주목된다. AI 사업을 새로운 먹거리로 삼고 영역 확대에 나선 김연수 한글과컴퓨터 대표의 노력과 한컴의 35년 문서 기술이 인정받은 결과로 풀이된다. 업계에 따르면 한컴은 이날 오후 진행될 것으로 알려진 '독자 AI 파운데이션 모델 구축 사업' PT 발표에 LG AI연구원이 주도하는 컨소시엄 일원으로서 함께한다. 이번 사업에 참여해 대한민국 AI 기술의 미래를 이끄는 기업으로서 이미지를 끌어올림과 동시에 세계적 수준의 거대언어모델(LLM) 개발을 목표로 하는 국가대표급 프로젝트에 동참함으로써 기술력도 입증하려는 의도로 해석된다. 과학기술정보통신부가 주관하는 이번 사업은 총 2천136억원의 예산이 투입되며 국가 AI 경쟁력의 핵심인 '소버린 AI' 주권 확보를 목표로 한다. 이를 위해 글로벌 최상위 모델 대비 95% 이상의 성능을 갖춘 국산 AI 기초 모델 개발이 추진된다. 한컴이 참여한 LG AI연구원 컨소시엄에는 LG CNS, LG유플러스, 퓨리오사AI 등 각 분야의 최고 기술 기업들이 포함돼 시너지를 극대화할 전망이다. 업계에서는 LG 컨소시엄이 한컴을 파트너로 선정한 것은 한컴의 독보적인 문서 데이터 처리 기술력을 높이 평가한 때문으로 분석했다. LLM 성능의 핵심인 고품질 학습 데이터 확보에 있어 한컴의 기술이 큰 역할을 할 것으로 기대되기 때문이다. 과기정통부가 제시한 까다로운 성능 목표를 달성하기 위해서는 방대한 양의 데이터를 AI가 학습 가능한 형태로 정밀하게 가공·처리하는 능력이 필수적이다. 한컴은 35년에 걸쳐 축적해온 전자문서 기술을 AI와 결합해 데이터 추출부터 학습·활용에 이르는 'AI 풀스택' 기술을 내재화했다. 특히 비정형 문서 데이터를 AI 학습용으로 변환하는 '한컴 데이터 로더'와 이를 기반으로 정확한 정보를 제공하는 AI 솔루션 '한컴피디아'는 이번 사업의 성공을 견인할 핵심 기술로 주목받고 있다. 한컴은 이미 다수의 대형 공공 프로젝트를 연이어 수주하며 국내 '소버린 AI' 시장에서 기술력과 사업 수행 능력을 입증해왔다. 올해 상반기에는 ▲국회 빅데이터 분석 플랫폼 ▲행정안전부 지능형 업무관리 플랫폼 ▲범정부 AI 공통 기반 구현 사업 등을 성공적으로 수주했다. 최근에는 경기도교육청의 디지털 플랫폼 구축 사업에도 AI 솔루션을 공급하며 공공 및 교육 시장에서 확고한 입지를 다지고 있다. 이처럼 한컴의 LG 컨소시엄 합류 소식이 점차 알려지면서 경쟁사들의 긴장감도 높아지는 분위기다. 이미 LG 컨소시엄이 '엑사원'의 기술력으로 유력 후보로 손꼽히고 있는 상황에서 한컴의 데이터 경쟁력까지 더해진 때문이다. 이틀간 진행될 PT 발표에선 그간 선보였던 기술력에 더해 프롬 스크래치(From Scratch·모델의 첫 단계부터 모두 직접 구축) 등 '전 국민 AI' 개발에 맞는 기술력을 함께 가지고 있는지에 대해서도 검증해야 하는 만큼 각 컨소시엄들의 부담감과 긴장감은 상당히 큰 상태다. LG 컨소시엄과 함께 총 5자리를 두고 PT 발표 경쟁을 벌이게 되는 곳은 ▲네이버클라우드 ▲모티프테크놀로지스 ▲카카오 ▲업스테이지 ▲KT ▲SK텔레콤 ▲코난테크놀로지 ▲NC AI ▲카이스트 등 10곳이다. 이들은 이번 발표에서 기술력 입증과 AI 모델 실증 사례 확산 계획을 제대로 증명해야 한다. 또 미리 제출한 5분 가량의 동영상에는 'AI 파운데이션 모델 개발 관련 역량'을 확인할 수 있는 내용이 담겨야 한다. 일부 참여 팀들은 이미 공개를 한 상태로, SKT·KT 등 통신사와 코난테크놀로지·모티프테크놀로지스 등 중소업체들이 지난 21일 사업계획서를 제출한 후 전략을 대부분 노출했다. 모티프테크놀로지스는 모레를 비롯한 삼일회계법인, 서울대, 카이스트 외에 기업 및 공공기관 등으로 컨소시엄을 구축했다. AMD 기반으로 AI 모델을 구축하고 있으며 모레와의 시너지를 기대하고 있다. SK텔레콤은 이번에 포티투닷과 크래프톤, 라이너, 리벨리온, 셀렉트스타 등 여러 기업들과 서울대학교, 카이스트 등과 손잡았다. 또 수요 기업으로는 SK하이닉스와 SK이노베이션, SK AX, SKB 등 SK그룹사를 포함해 SKT가 주도하는 K-AI 얼라이언스에 참여 중인 몰로코(AI 광고), 씨메스(제조 AI), 가우스랩스(제조 AI), 스캐터랩(감성 AI) 등이 포함됐다. KT는 총 18개 기관과 함께 컨소시엄을 구성했다. 컨소시엄에는 ▲솔트룩스 ▲크라우드웍스 ▲매스프레소 ▲투모로 로보틱스 ▲경찰청 ▲고려대학교 의료원 ▲서울대학교 ▲고려대학교 외에 법률 기관, 로펌, 반도체 및 산업 AI 수요 기업 등이 포함됐다. 코난테크놀로지는 ▲사이냅소프트를 비롯해 ▲알체라 ▲페블러스 ▲고려대학교 ▲연세대학교 ▲포항공과대학교 ▲카이스트 등 8개 기관이 이름을 올렸다. LG AI 연구원과 네이버클라우드, NC AI, 업스테이지, 카카오 등은 전략적으로 비공개 기조를 유지하며 컨소시엄 명단이 유출되지 않기 위해 고군분투하고 있다. 컨소시엄 구성을 먼저 공개하면 외부에 사업 전략이 노출되고 자칫 아이디어를 제공하는 빌미가 될 수 있다고 판단해서다. 하지만 시간이 지날수록 일부 기업들의 컨소시엄 구성도 조금씩 윤곽을 드러내고 있다. LG AI 연구원은 LG CNS, LG 유플러스 등 LG 그룹 계열사들과 함께 한컴, 퓨리오사AI, 프렌들리AI 등과 협업하는 것으로 알려졌다. 네이버클라우드는 네이버벤처스가 처음 투자한 AI 영상 검색 스타트업 트웰브랩스를 컨소시엄에 합류시켰고, 업스테이지는 AI 언어 데이터 전문기업 플리토 등이 함께하는 것으로 전해졌다. NC AI 역시 컨소시엄 구성 시 국내 주요 대기업들이 대거 몰린 것으로 파악됐다. 정부는 이르면 다음 달 1일께 최종 5개 정예팀을 확정, 협약 체결을 완료할 예정이다. 선발된 정예팀은 첨단 그래픽처리장치(GPU), 데이터, 인재 등을 지원 받아 '국가대표 AI' 개발에 나서게 된다. 업계 관계자는 "컨소시엄 구성도 PT 발표에서 핵심 기준이 될 것으로 보이는 만큼, 각 업체들이 얼마나 탄탄한 파트너들을 확보했는지를 강조하는 것도 중요한 요소가 될 것"이라며 "하지만 기술력을 제대로 설명하지 못하면 컨소시엄 구성이나 AI 실증 문제는 사실 공허한 얘기가 될 것으로 보여 심사위원들에게 기술 측면에서 어떤 점을 전략적으로 각인시킬 것인지를 두고 많은 고민을 해야 할 것"이라고 강조했다.

2025.07.30 10:08장유미

[유미's 픽] "너도 나도 프롬 스크래치?"…국가대표 AI 2차전, 자체 기술 평가 '관건'

"너도 나도 '프롬 스크래치(From Scratch)' 방식이래요. 마케팅 용어로 무분별하게 나오는 게 심사에 과연 도움이 될 지 모르겠어요." 최종 5개 팀을 뽑는 '독자 인공지능(AI) 파운데이션 모델 개발' 사업자 선정이 본격화되면서 업계가 각 업체의 AI 모델을 두고 혼란에 빠졌다. '프롬 스크래치' 방식으로 자체 AI 모델을 만들 수 있는지가 사업자 선정에 있어 핵심 기준이 될 것이란 전망이 나오자 제대로 된 검증 없이 홍보용으로 앞세우고 있어서다. 29일 업계에 따르면 '프롬 스크래치'는 AI 모델을 처음부터 직접 개발한다는 뜻으로, 데이터 수집과 모델 아키텍처 설계, 학습, 튜닝까지 모든 것을 자체적으로 수행하는 방식이다. 이 개념은 거대언어모델(LLM) 개발 때 많이 언급되며 아무 것도 없는 상태에서 모델을 직접 설계하고 데이터를 수집 및 전처리해 학습시킨다는 점에서 이를 통해 AI 모델을 선보일 경우 기술력이 상당히 높다고 평가를 받는다. 오픈AI의 'GPT-4'나 구글 '제미나이', 메타 '라마', 앤트로픽 '클로드' 등이 여기에 속한다. 국내에선 네이버 '하이퍼클로바X'와 LG AI 연구원 '엑사원', NC AI '바르코 LLM', KT '믿음', 카카오 '카나나' 등이 프롬 스크래치 방식을 제대로 구현해 만들어진 것으로 평가 받고 있다. 다만 일부 기업들은 프롬 스크래치 방식으로 분별하기엔 애매한 부분이 많음에도 불구하고 '독자 AI 파운데이션 모델 개발' 사업자로 선정되기 위해 마케팅 용어로 사용해 문제로 지적 받고 있다. 업계 관계자는 "일부 기업들이 '프롬 스크래치' 방식이 아닌 외국 AI 모델을 기반으로 재설계하거나 파인튜닝을 한 것을 활용했음에도 마치 자체 기술로 모두 개발한 것처럼 부풀려 홍보하는 경우가 최근 들어 많아졌다"며 "어디까지가 자체적으로 독자 기술을 사용했는지에 대한 판단 기준 없이 이를 마케팅 용어처럼 남발하는 것은 국내 AI 시장에 좋은 영향을 주진 못한다"고 짚었다. 이에 일각에선 모델 구조나 가중치가 기업들의 자체 기술로 얼마나 구현했는지에 따른 분류가 필요하다고 지적했다. 오픈소스 구조를 차용하거나 이를 기반으로 전체 재학습을 한 경우, 오픈소스 모델 공개 가중치를 그대로 이용하지만 전면 추가 학습을 한 경우 등 다양한 사례들이 많이 나오고 있어서다. 특히 이승현 디지털플랫폼정부위원회 국장은 최근 자신의 소셜 미디어(SNS)에 이를 좀 더 명확히 할 수 있는 분류 체계를 제안해 업계의 주목을 받고 있다. 이 국장은 정부가 '국가대표 LLM' 사업자를 선정하는데 있어 단순 모델 성능뿐 아니라 통제 가능성, 설명 가능성, 공급망 안전, 법·윤리 준수 등을 종합적으로 계량화 해 총 7단계로 모델을 구분할 수 있어야 한다고 주장했다. 이 기준에 맞춰 이 국장이 제안한 'T0'은 가장 낮은 등급으로, 외부 폐쇄 API 호출 후 프롬프트·필터만 추가한 LLM이다. 아키텍처, 가중치 기원은 100% 외산·폐쇄형이며 통제나 주권성이 거의 없어 API 계약, 쿼터에 의존한다. 챗GPT 기반 다수 PoC 서비스가 이에 해당된다. 'T1'은 폐쇄 가중치에 LoRA(저비용 경량 파인튜닝 방식), RAG(검색증강생성) 등 경량 튜닝을 더하는 것이다. 가중치 불투명성이 특징으로, 통제나 주권성 측면에서 설명 가능성과 재현성이 제한된다. 의료, 금융 시범 모델, UAE TAMM 3.0, KT 챗GPT-4oK(예정) 등이 여기에 속한다. 이 국장은 "T0~T1은 학습 비용과 시간을 최소화하고 최신 모델 성능을 즉시 활용할 수 있다"면서도 "하지만 API 차단, 가격 인상, 설명·통제 불가 등의 위험이 있을 것"이라고 평가했다. 'T2' 등급은 메타 '라마', 알리바바 '큐원' 등 공개 가중치를 100% 이용해 전면 추가 학습한 것들이다. 기반 모델 라이선스 준수가 필요하며 로컬 호스팅, 가중치 수정이 가능해 통제나 주권성이 중간 수준이다. SK텔레콤이 '큐원 2.5'를 기반으로 이달 초 선보인 '에이닷엑스 4.0(A.X 4.0)'이 대표적이다. 업계 관계자는 "T2 등급에 속하는 모델들이 한국어로 튜닝됐다는 이유만으로 이를 '한국형 모델'이라고 부르는 것은 맞지 않다"며 "모델의 '메모리'는 여전히 '큐원 2.5' 같은 해외 모델이라는 점에서 큐원에서 학습한 불투명한 정보가 국내 기업 AI 모델 내부에 그대로 내재돼 잘못된 결과물이 예기치 않게 출력될 가능성을 배제할 수 없다"고 지적했다. 이어 "'큐원 2.5'는 메타 '라마'와 달리 학습에 어떤 데이터를 사용했는지, 어떻게 수집·정제했는지조차 밝히지 않아 불투명한 모델이라는 지적을 받고 있다"며 "이를 활용한 모델들은 공공망, 정부망에 도입되는 것을 철저하게 막아야 한다"고 덧붙였다. 'T3'는 오픈소스 모델 구조·레이어를 확장한 후 전체 재학습한 LLM이다. 기반 모델 라이선스 부분 준수가 필요하다. 또 통제나 주권성이 중간 이상이지만 구조 혁신은 제한된다. 업스테이지 '솔라 프로 2(Phi‑4→DUS)'가 이 등급에 해당된다. DUS는 구조 일부를 변경해 자체화한 AI 모델 개발 방식이다. 이 국장은 "T2~T3 등급은 CPT(추가 사전학습)로 기존 오픈소스 모델에 대규모 한국어 토큰을 재훈련해 비용 5~10%로 성능을 크게 높일 수 있다"며 "DUS는 깊이만 확장해 파라미터와 성능을 올릴 수 있는 장점이 있다"고 분석했다. 그러면서도 "여전히 기반 모델 버전업 시 재호환 문제가 우려된다"며 "라이선스 조건 충족 등이 필요할 것으로 보인다"고 덧붙였다. 'T4' 등급부터는 라마-류 구조를 차용하고 가중치 전량을 자체 사전 학습한 것들이다. 구조 의존적이지만 가중치는 독립적이다. 또 통제나 주권성이 높으나 구조 혁신은 다소 제한된다. KT '믿음 2.0'과 SK텔레콤 '에이닷엑스 3.1' 등이 이 등급에 포함된다. 이 국장은 "라마식 프롬 스크래치라고 미묘하게 봐야 할 것 같다"며 "학습 데이터나 토크나이저 자체 설계로 통제권을 어느 정도 확보했지만 핵심 블록은 여전히 동일해 구조에 제한이 있어 특허, 트렌드에 영향이 있을 것으로 보인다"고 짚었다. 'T5'는 구조까지 변형하고 가중치 자체 학습을 하는 것이다. 구조와 가중치 모두 완전 국산이며 주권성과 통제 가능성이 매우 높다. LG AI연구원이 개발한 '엑사원 4.0', 네이버 '하이퍼클로바 X 씽크', NC AI '바르코 LLM' 등이 대표 사례다. 이 국장은 "T5 등급은 통제권과 설명 가능성을 확보했다"며 "그러나 막대한 투자 및 컴퓨트, 데이터가 필요하므로 효율성 부분에서 우려도 있을 것 같다"고 설명했다. 가장 높은 등급인 'T6'은 T5 등급 요건에 칩, 프레임워크, IDC, 데이터까지 완전 자립한 단계다. 공급망, 법적 완전 통제가 가능하며 통제나 주권성이 최고 수준이다. 현재 국내에선 T6 등급 구현 사업을 진행하고 있는 상태로, 중국 워다오(WuDao), UAE 팔콘 인프라 등이 T6에 해당되는 것으로 분류된다. 이 국장은 "T6 등급이야말로 이상향으로, 우리가 추구해야 하는 방향"이라며 "한국은 풀스택 생태계를 가지고 있는 몇 안 되는 나라"라고 강조했다. 해외에선 파운데이션 모델을 T4~T5 등급과 비슷하게 본다. 파인 튠드 모델은 T1~T2, 인스트럭션 튠드, 언라인먼트 튠드는 T2~T3에 해당된다. 멀티모달, 익스퍼트 모델은 T3~T5쯤에 해당된다. 이 국장은 "CPT까지는 기존 모델 가중치를 전부 계승하는 만큼 리스크가 존재해 자체 모델이나 독자모델로 보기는 좀 한계가 있는 것 같다"며 "DUS부터는 레이어를 확장해 파라미터를 부분적으로 자산화해 주권성이 높아지는 만큼 여기부터는 어느 정도 독자기술이라고 할 수도 있을 것 같다"고 분석했다. 그러면서 "프롬 스크래치(T4)·커스텀 아키텍처(T5)·풀스택(T6)으로 올라갈수록 공급망과 정보보호 리스크가 줄어든다"며 "정부는 등급별 허용 위험 한도를 명확히 설정해 국방·안보·개인정보 업무 등에 최적화된 모델을 지정할 수 있을 것"이라고 평가했다. 또 그는 "T5, T6 모델 확보는 결과적으로 글로벌 협상 및 경쟁에서 협상력을 높이는데 매우 중요할 것 같다"며 "공공, 국방, 외교는 T4 이상이거나 왠만하면 T5, 일반적인 행정민원서비스는 T3부터, 민간 B2B는 T0부터 활용할 수 있지 않을까 싶다"고 덧붙였다. 이같은 이 국장의 의견에 업계에선 대부분 동의하는 분위기다. 많은 비용을 들여 자체 기술력으로 모델을 개발한 곳들이 '프롬 스크래치'라는 용어에 함께 포함돼 해외 오픈소스 모델의 아키텍처를 재설계해 만들어진 모델들과 비슷한 수준으로 평가되는 사례가 빈번해지고 있어서다. 이에 이 국장은 모델 생성 이력에 대해 제대로 인지하고 등급 체계를 정리하게 되면 평가의 투명성과 형평성이 확보된다는 점에서 긍정적인 효과가 있을 것으로 봤다. 또 동일한 벤치마크 점수라도 T0(외부 API 래핑)와 T5(맞춤형 구조·가중치 전면 자체 학습)는 위험 구조가 전혀 다르기 때문에 각 모델을 '같은 출발선'으로 정규화해 공정하게 비교할 수 있는 등급화가 선정 과정에 대한 논란을 최소화 할 수 있을 것으로 예상했다. AI 모델을 등급화 할 경우 소버린 AI 관점에서의 리스크를 계층별로도 관리할 수 있을 것으로 관측했다. CPT에 머무르는 T2 모델은 업스트림 라이선스·업데이트에 전적으로 묶여 있지만, DUS 기반 T3 모델은 신규 층을 자산화해 일부 독립성을 확보할 것으로 봤다. 이 국장은 "프롬 스크래치(T4)·커스텀 아키텍처(T5)·풀스택(T6)으로 올라갈수록 공급망과 정보보호 리스크가 줄어든다"며 "정부는 등급별 허용 위험 한도를 명확히 설정해 국방·안보·개인정보 업무 등에 최적화된 모델을 지정할 수 있을 것"이라고 평가했다. 이 외에도 이 국장은 등급 구별에 따라서 예산과 컴퓨트 자원의 효율적 배분, 국제 규제 대응력과 국민 신뢰도 확보, 산업·학계 대상 명확한 로드맵과 투자 시그널 제시, 소버린 AI 관점에서 국제 협상력 강화 등의 효과도 기대했다. 이 국장은 "T5·T6급 모델과 국산 칩·프레임워크가 결합하면 우리나라는 글로벌 표준 논의에서 기술적 레버리지를 확보하고 동시다발적 파트너십을 주도할 수 있다"며 "반대로 T0~T2 수준에만 계속 머무르면 '파인튜너 국가'로 규정돼 외부 의존이 심화될 위험이 있다"고 말했다. 업계에선 이 국장의 등급 구별 제안을 정부가 '독자 AI 파운데이션 모델 개발' 사업자 선정 심사 시 고려하길 기대했다. 과학기술정보통신부는 이날 오전 11시까지 '독자 AI 파운데이션 모델 개발' 사업과 관련된 PT 발표 자료를 1차 관문을 통과한 10개 컨소시엄에게 받은 상태로, 각 컨소시엄들은 오는 30~31일 20분 가량의 발표를 진행한다. 이번 PT 발표에 참여하는 컨소시엄은 지난 25일 첫 관문을 통과한 ▲네이버클라우드 ▲LG AI연구원 ▲모티프테크놀로지스 ▲카카오 ▲업스테이지 ▲KT ▲SK텔레콤 ▲코난테크놀로지 ▲NC AI ▲카이스트 등 10곳이다. 이들은 이번 발표에서 기술력 입증과 AI 모델 실증 사례 확산 계획을 제대로 증명해야 한다. 또 미리 제출한 5분 가량의 동영상에는 'AI 파운데이션 모델 개발 관련 역량'을 확인할 수 있는 내용이 담겨야 한다. 정부는 8월 초까지 사업비 심의·조정 등 절차를 거쳐 최종 5개 정예팀을 확정, 협약 체결을 완료할 예정이다. 선발된 정예팀은 첨단 그래픽처리장치(GPU), 데이터, 인재 등을 지원 받아 '국가대표 AI' 개발에 나서게 된다. 업계 관계자는 "지금까지 업체들이 참여기업, 수요기업을 끌어 모은 컨소시엄 구성을 통해 약점을 보완하는 동시에 기술력이 있다는 점을 자체 LLM 신모델 공개를 통해 강조하려 했다"며 "하지만 PT 발표에선 그간의 모델 개발 기술력뿐 아니라 '전 국민 AI' 개발에 맞는 기술력을 함께 가지고 있는지에 대해 증명을 해야 하는 것이 더 중요한 만큼, 이를 입증하는 것이 각 팀별로 쉽지 않을 것"이라고 내다봤다. 그러면서 "기술력을 제대로 설명하지 못하면 실증 문제는 사실 공허한 얘기가 될 것"이라며 "심사위원들에게 기술 측면에서 어떤 점을 전략적으로 각인시킬 것인지를 두고 많은 고민을 해야 할 것"이라고 덧붙였다.

2025.07.29 13:36장유미

[유미's 픽] 국가대표 AI 선발, 오픈소스 비중·기술력·성능에 달렸다…新 모델 개발도 '관건'

이재명 정부의 핵심 국정 사업인 '글로벌 인공지능(AI) 강국' 꿈의 발판이 될 '국가대표 AI' 선정을 앞두고 사업 참여 의사를 밝힌 기업들이 잇따라 자체 개발한 추론 모델을 오픈소스로 개방하고 나섰다. 이번 정부 사업에선 '프롬 스크래치' 방식을 통한 기술력과 오픈소스 비중, AI 모델 성능이 당락을 좌우할 핵심 기준으로 지목되고 있다. 24일 업계에 따르면 지난 21일 마감된 '독자 AI 파운데이션 모델 개발 프로젝트'에는 총 15개 컨소시엄이 참여하는 것으로 집계됐다. 참가팀은 ▲네이버클라우드 ▲루닛 ▲모티프테크놀로지스 ▲바이오넥서스 ▲사이오닉에이아이 ▲업스테이지 ▲SK텔레콤 ▲NC AI ▲LG AI연구원 ▲정션메드 ▲카카오 ▲KT ▲코난테크놀로지 ▲파이온코퍼레이션 ▲한국과학기술원 등이다. 이 프로젝트는 글로벌 톱 수준의 국산 거대언어모델(LLM)을 만들겠다는 목표를 앞세워 추진하는 것으로, 정부에서 오는 2027년까지 약 2천136억원을 투입한다. 선발된 기업들은 정부로부터 그래픽처리장치(GPU)와 데이터, 전문 인력 등을 집중 지원받을 예정이다. 정부는 이번 선발전의 평가 기준을 크게 세 가지로 구분했다. 총점은 100점으로 ▲기술력 및 개발 경험(40점) ▲개발목표 및 전략·기술(30점) ▲파급효과 및 기여 계획(30점) 등을 눈여겨 볼 예정이다. 서면 평가는 이날부터 오는 26일까지 진행되며 총 10팀을 우선 선발한다. 서면 평가를 통과한 기업들은 이르면 26일, 늦어도 27일에 발표될 예정이다. PT 평가는 이달 30~31일에 진행되며 최종 사업자 발표는 8월 4~5일께 이뤄질 것으로 알려졌다. 심사위원 구성은 서면 평가가 7명 내외, PT 평가가 10명 내외인 것으로 전해졌다. 사업 초기에는 총 5개 기업이 우선 선발되며 이후 6개월 단위로 선별 축소할 예정이다. 성능·전략·파급효과 등을 기준으로 단계 평가를 거쳐 4개팀 → 3개팀 → 2개팀 식으로 줄여나갈 예정이다. 현재 업계에서 유력 후보로 보고 있는 곳은 네이버클라우드와 LG AI연구원, NC AI, 업스테이지 등으로 압축됐다. 또 해외 업체들과 활발한 협업에 나섰던 SK텔레콤, KT 등 통신사들은 정부가 이 프로젝트를 시작하며 대규모 자금 투입에 나서자 방향을 틀어 참여 의사를 밝힌 상태다. 중소·중견기업 중에선 코난테크놀로지도 사업자 선정에 대한 기대감을 높이고 있다. 카카오도 자체 개발한 LLM '카나나'를 앞세워 계열사의 다양한 서비스를 활용해 AI 모델 수요를 끌어 올릴 수 있다는 점을 경쟁력으로 내세운 것으로 전해졌다. 업계에선 기술 성숙도 측면에서 '프롬 스크래치(From Scratch·모델의 첫 단계부터 모두 직접 구축)'를 통한 AI 개발 경험이 핵심 기준이 될 것으로 봤다. 외국 거대언어모델(LLM)을 기반으로 파인튜닝하거나, 아키텍처를 재설계하는 식으로 모델을 만들어 본 경험만으로는 정부가 원하는 결과물을 내놓기 쉽지 않을 것으로 예상돼서다. 업계 관계자는 "정부가 '전국민 AI'에 쓸 AI 모델 수준을 현재 최고 수준으로 평가 받는 소타(SOTA·State-of-the-Art) 모델로 원하는 것으로 알고 있다"며 "이에 맞추기 위해선 '프롬 스크래치' 방식으로 300억 개(30B) 이상의 파라미터(매개변수)를 가진 대형 모델을 자체적으로 만들어 본 경험을 가지고 있어야 하는데, 여기에 맞는 기업이 손에 꼽힐 것으로 보여 유력 후보군이 상당히 압축될 수밖에 없다"고 봤다. 그러면서 "외국 AI 모델의 아키텍처를 재설계해 만든 모델임에도 최근 '프롬 스크래치' 방식이 주목 받기 시작하자 이를 마케팅으로 활용하는 기업들이 속속 나오고 있는 듯 하다"며 "해외 모델을 참고해 만들었음에도 '프롬 스크래치'라고 표현하는 것은 심사 위원뿐 아니라 업계 분위기를 흐리는 듯 해 '페이크 파운데이션 모델'로 분류하는 것도 필요해 보인다"고 지적했다. 업계에선 '프롬 스크래치' 방식을 그간 고집하며 대형 모델을 선보였던 네이버클라우드와 LG AI연구원, NC AI, KT가 이번 사업에서 다소 유리한 고지에 올랐다고 평가했다. 이들은 외국 회사의 오픈소스를 활용하지 않고 처음부터 끝까지 자체 기술만을 적용해 30B 이상의 대형 AI 모델을 개발해 본 경험이 있다. 코난테크놀로지, 카카오도 프롬 스크래치 방식으로 자체 모델을 개발했다고 주장하고 있다. 반면 업스테이지는 메타 '라마', 마이크로소프트(MS) '파이' 등 해외 빅테크 AI 모델의 아키텍처를 기반으로 재설계해 자체 LLM인 '솔라'를 선보이고 있다. SK텔레콤도 최근 '프롬 스크래치' 방식으로 만들었다고 강조하며 자체 LLM '에이닷엑스 3.1 라이트'를 공개했지만, 업스테이지와 동일하게 재설계된 모델인 것으로 알려졌다. 루닛과 컨소시엄을 구성한 트릴리온랩스가 지난 23일 공개한 자체 LLM '트리-21B'도 라마 등 해외 모델을 기반으로 한 것으로 업계에선 추정했다. 다만 회사 측은 '프롬 스크래치' 방식으로 그간 모델을 개발해왔던 만큼 이는 사실이 아니라는 입장이다. 정부는 일단 외국 AI 모델의 아키텍처를 재설계했을 경우에는 활용해도 된다는 입장이다. 기존 모델을 고도화할 경우 오픈AI 등 다른 회사와 라이센싱 이슈가 없어야 한다는 조건도 따로 내걸었다. 이는 국내에서 생산되는 양질의 중요 데이터가 자칫 외국으로 유출될 수 있다는 우려를 의식한 것으로 풀이된다. 업계 관계자는 "AI 모델을 자체 개발한 기업만 참가할 수 있게 한다면 대부분 국내 스타트업들은 어느 한 곳도 선발전에 참여할 수 없을 것"이라며 "정부가 이를 고려해 기준을 좀 더 넓게 본 것 같다"고 밝혔다. 그러면서 "이런 스타트업들은 현재 상태에선 프롬 스크래치 방식으로 AI 모델을 새롭게 만들 수 없는 상태"라며 "사업자로 선정된다고 해도 기존 모델을 업그레이드 하는 쪽으로만 방향성을 잡게 될 것"이라고 덧붙였다. 정부는 일단 독자 AI 모델 개발과 관련해 새로운 모델 개발 또는 기존 자체 모델을 고도화하는 방식을 모두 허용했다. 이 사업을 주도하고 있는 과학기술정보통신부는 어떤 방식이든 평가에 차등을 두지 않는다는 방침이다. 기존 자체 모델을 활용하는 곳은 LG AI연구원, KT가 대표적이다. 이들은 사업자로 선정됐을 시 기존에 선보였던 자체 LLM '엑사원', '믿:음'을 고도화 해 '전 국민 AI'로 활용하겠다는 계획을 밝혔다. 카카오도 자체 모델인 '카나나'를 활용해 모델 고도화 방향으로 전략을 짠 것으로 알려졌다. 반면 네이버클라우드, NC AI는 '전 국민 AI'에 맞춰 새로운 모델을 개발하는 것으로 방향을 잡았다. '프롬 스크래치' 방식으로 각각 '하이퍼클로바X', '바르코 LLM'을 개발해봤던 경험을 토대로 이미 기술력이 충분히 검증된 만큼, 한국에 특화된 LLM을 처음부터 새롭게 개발할 수 있다는 자신감을 내보이고 있다. SK텔레콤도 이달 들어 독자 구축 LLM인 '에이닷엑스'의 다양한 모델을 선보이고 있지만, 독자 AI 파운데이션 모델 사업자로 선정되면 새로운 모델 개발에 나설 것으로 파악됐다. 코난테크놀로지와 업스테이지 역시 새로운 모델을 개발한다는 계획이다. 이 같은 분위기 속에 일부 업체들은 자체 LLM을 오픈소스로 잇따라 공개하며 더 높은 점수를 받기 위해 고군분투하고 있다. 정부가 AI 모델 공개를 통해 국내 AI 생태계를 활성화시킬 수 있는지에 대한 여부도 주요 기준으로 삼고 있어서다. 네이버클라우드는 지난 22일 '하이퍼클로바 X 시드 14B 씽크'를 상업용으로 이용할 수 있는 무료 오픈소스를 공개했다. '하이퍼클로바 X 시드 14B 씽크'는 네이버의 독자 기술을 활용해 '프롬 스크래치'로 개발한 경량화 추론 모델로, 상용화된 해외 오픈소스 모델을 개조한 것이 아닌 원천기술로 추론 능력과 경량화 기술을 결합해 개발했다. 네이버클라우드는 추론모델을 연구용으로만 제한하지 않고 비즈니스에도 적용할 수 있게 이같은 결정을 내렸다. 다양한 산업 영역에서 만들어질 AI 에이전트의 기반 기술로 활용될 수 있게 함으로써 국내 AI 생태계를 한층 활성화시킬 것이란 방침이다. NC AI는 일찌감치 '바르코 LLM'을 학술적 용도뿐 아니라 상업적인 용도까지 활용할 수 있도록 오픈소스로 공개해왔다. 또 게임, 패션, 콘텐츠 등 다양한 산업군에서 실제 상용화된 AI 솔루션을 선보이고 있다는 점에서 이번 컨소시엄 구성에 국내 주요 대기업들이 대거 몰리기도 했다. 특히 오픈소스 모델 '바르코 비전 2.0'은 비전-언어 모델(VLM) 분야에서 최고 성능인 '소타'로 인정받아 눈길을 끌었다. LG AI연구원은 지난 해 8월 국내 최초로 연구용 오픈소스 모델인 '엑사원 3.0'을 공개했다. 같은 해 12월 공개한 '엑사원 3.5'는 국내 AI 모델 중 유일하게 스탠퍼드대에서 발간하는 AI 보고서에 포함돼 주목 받았다. 다만 최근 공개된 '엑사원 4.0'은 글로벌 오픈소스 AI 플랫폼 '허깅페이스'에 오픈웨이트(가중치 공개) 모델로만 공개했다. 또 LG AI연구원은 LG그룹 임직원 5만여 명이 사용하는 챗봇인 '챗엑사원'을 외부인도 사용해 볼 수 있도록 베타 버전을 공개해 문턱을 다소 낮췄다. 기업 사용자를 위한 API(애플리케이션인터페이스)도 공개해 '엑사원'을 다른 소프트웨어 개발에 사용할 수 있도록 했다. 기업들의 부담을 낮추기 위해 AI 모델 추론 서비스를 제공하는 스타트업 프렌들리AI와 손잡고 엑사원 API를 챗GPT의 10분의 1 가격으로 서비스하는 것도 강점으로 떠올랐다. 이와 별개로 LG AI연구원과 함께 컨소시엄을 구성한 것으로 알려진 LG CNS는 캐나다 AI 유니콘 기업 코히어와 손잡고 LLM 개발에 한창이다. 지난 5월 70억 파라미터의 한국어 특화 경량 LLM을 출시한 데 이어 두 달 만에 1천110억 개 파라미터를 갖춘 초대형 추론형 LLM을 공동 개발해 주목 받았다. 아직 이 모델들을 오픈소스로 공개하진 않았으나, 내부적으로는 검토 중인 것으로 전해졌다. 코난테크놀로지도 최근 매개변수 40억 개(4B) LLM '코난-LLM-IND'를 오픈소스로 공개했다. 이 모델은 중국 알리바바의 '큐원3'를 기반으로 한국어 최적화와 효율성 향상을 이뤘다는 평가를 받는다. 업스테이지는 신규 추론 AI 모델 '솔라 프로 2'를 중심으로 이번 정부 사업에 참여할 예정으로, 독립 LLM 성능 분석기관 아티피셜 애널리시스가 발표한 '지능 지표(Intelligence Index)'에서 국내 유일의 프런티어 모델로 선정돼 기술력을 입증했다. 이곳은 일찌감치 '솔라 10.7B'를 비롯한 여러 자체 모델을 허깅페이스 등 플랫폼에 공개했으며 해당 모델 가중치를 '아파치 2.0' 오픈소스 라이선스로 배포해 생태계 확장을 선도하고 있다는 평가를 받는다. SK텔레콤은 지난 11일 허깅페이스에 자체 LLM '에이닷 엑스 3.1 라이트'를 오픈소스로 공개했다. 70억 개(7B)의 매개변수를 기반으로 한 경량 모델로, 이 모델의 후속인 매개변수 340억 개(34B)의 프롬 스크래치 모델 '에이닷 엑스 3.1'을 조만간 오픈소스로 선보일 예정이다. KT 역시 지난 2023년 10월 공개한 '믿:음' 모델 중 70억 개 매개변수를 오픈소스로 제공했다. KT는 2천100억 개 매개변수를 가진 모델까지 개발하며 기술력을 과시한 바 있다. 업계 관계자는 "사업 당락은 독자 AI 모델의 오픈소스 공개 비중과 성능에 좌우될 것으로 예상된다"며 "정부가 AI 모델의 오픈소스 수준을 평가에 정밀하게 반영하고 정부 예산과 자부담 매칭 수준도 오픈소스 수준에 따라 차등화 한다는 방침을 세운 것으로 안다"고 말했다. 이어 "이번 사업은 LLM뿐 아니라 멀티모달 등 다양한 AI 모델 개발 역량과 자체 기술을 얼마나 활용하느냐에 따라 사업 성패가 갈릴 듯 하다"며 "정부가 이번에 업계에서 모두 인정할 만한 외국인 심사위원을 제대로 구성한 만큼, 이들이 여러 입김에 영향을 받지 않고 기술력으로만 공정한 심사를 할 것으로 기대된다"고 덧붙였다.

2025.07.24 09:03장유미

[유미's 픽] 韓 대표 AI 선발전, '프롬 스크래치'가 핵심…컨소시엄 신경전 '치열'

글로벌 톱 수준의 거대언어모델(LLM)을 만들 '인공지능(AI) 국가대표 정예팀' 선발전이 본격화된 가운데 '프롬 스크래치(From Scratch·모델의 첫 단계부터 모두 직접 구축)'를 통한 AI 개발 경험이 핵심 기준으로 지목되고 있다. 외국 LLM을 기반으로 파인튜닝하거나, 아키텍처를 재설계하는 식으로 모델을 만들어 본 경험만으로는 정부가 원하는 결과물을 내놓기 쉽지 않을 것으로 예상돼서다. 10일 업계에 따르면 과학기술정보통신부가 추진하고 있는 '독자 AI 파운데이션 모델 개발 지원 사업'에 선정된 컨소시엄은 ▲새로운 자체 아키텍처를 설계하고 독자적 학습 알고리즘·기법을 적용해 AI 모델을 처음부터 개발하거나 ▲이미 갖고 있는 AI 파운데이션 모델을 추가 학습을 통해 고도화해도 된다. 하지만 최근 선보인 SK텔레콤의 '에이닷 엑스 4.0'처럼 해외 업체 AI 모델을 활용하면 안된다. '에이닷 엑스 4.0'은 중국 알리바바의 AI 모델 '큐원2.5'에 한국어 데이터를 추가로 학습시킨 모델로, 온프레미스(내부 구축형) 방식을 적용해 데이터 보안을 강화했다고는 하지만 정보 유출의 위험성을 우려하는 목소리들이 나오고 있다. 업계 관계자는 "에이닷 엑스 4.0이 한국어로 튜닝됐다는 이유만으로 이를 '한국형 모델'이라고 부르는 것은 맞지 않다"며 "모델의 '메모리'는 여전히 '큐원2.5'라는 점에서 큐원에서 학습한 불투명한 정보가 에이닷 엑스 4.0 내부에 그대로 내재돼 잘못된 결과물이 예기치 않게 출력될 가능성을 배제할 수 없다"고 지적했다. 이어 "큐원2.5는 메타 라마와 달리 학습에 어떤 데이터를 사용했는지, 어떻게 수집·정제했는지조차 밝히지 않아 불투명한 모델이라는 지적을 받고 있어 이를 활용한 에이닷엑스 4.0 같은 모델들이 공공망, 정부망에 도입되는 것을 철저하게 막아야 한다"며 "공공 AI는 성능이 아무리 뛰어나더라도 설명책임과 검증가능성이라는 핵심 요건을 충족시켜야 한다는 점을 이번에 심사할 때 꼭 고려해야 할 것"이라고 덧붙였다. 또 다른 관계자는 "이번 사업으로 진정한 '소버린 AI'를 실현하기 위해선 성능보다는 통제 가능성이 우선돼야 한다는 점을 정부가 명심해야 할 것"이라며 "AI 모델의 설계부터 폐기까지 전 생애주기에 걸친 자국 통제권이 확보돼야 하는 만큼 단순한 튜닝이 아닌 각 기업들이 원천 기술을 보유하고 있는지가 중요하다"고 강조했다. 정부도 이를 고려해 기존 모델을 고도화할 경우 오픈AI 등 다른 회사와 라이센싱 이슈가 없어야 한다는 조건을 따로 내걸었다. 이는 국내에서 생산되는 양질의 중요 데이터가 자칫 외국으로 유출될 수 있다는 우려를 의식한 것으로 풀이된다. 다만 외국 AI 모델의 아키텍처를 재설계했을 경우에는 활용해도 된다는 입장이다. 과기정통부 관계자는 "메타의 '라마'든, 알리바바의 '큐원'이든 외국 업체들의 AI 모델 아키텍처를 참고해 이를 우리나라 상황에 맞게 재설계 해 처음부터 만들었다면 이번 사업에 참여할 수 있다"며 "아키텍처를 그대로 쓰면서 파인튜닝한 AI 모델로는 참여할 수 없다"고 설명했다. 그러면서 "완전 재설계한 모델은 라이센스 이슈가 없을 뿐더러 거기에 들어가는 데이터도 각 업체가 보유한 것을 넣은 것이기 때문에 문제 없을 것으로 본다"며 "이 경우에는 처음부터 본인의 기술력으로 만들어진 것인 만큼 프롬 스크래치 방식으로 봐도 된다"고 덧붙였다. 이를 두고 업계에선 정부가 일부 중소업체들을 참여시키기 위해 사업자 선정 기준을 좀 더 열어둔 것으로 봤다. 예컨대 업스테이지의 경우 해외 빅테크 AI 모델의 아키텍처를 기반으로 재설계해 자체 LLM인 '솔라'를 선보이고 있다. 업스테이지는 이를 기반으로 이날 추론 모델도 공개했다. 업계 관계자는 "현재 선발전에 나올 기업 중 해외 기업 AI 모델의 아키텍처를 재설계해서 모델을 선보이는 곳은 업스테이지가 대표적인 것으로 안다"며 "AI 모델을 자체 개발한 기업만 참가할 수 있게 한다면 업스테이지 같은 스타트업들은 어느 한 곳도 선발전에 참여할 수 없어 정부가 이를 고려해 기준을 좀 더 넓게 본 것 같다"고 밝혔다. 그러면서 "이런 스타트업들은 현재 상태에선 프롬 스크래치 방식으로 AI 모델을 만들 수 없는 상태"라며 "사업자로 선정된다고 해도 기존 모델을 업그레이드 하는 쪽으로만 방향성을 잡게 될 것"이라고 덧붙였다. 업계에선 '프롬 스크래치' 방식이 아닌 외국 AI 모델을 기반으로 재설계하거나 파인튜닝을 한 것을 활용한 기업들이 그간 많았다는 점에서 이번 선발전의 문턱을 넘을 수 있는 곳이 많지 않을 것으로 예상했다. 또 프롬 스크래치 방식을 그간 고집하며 대형 모델을 선보였던 KT와 네이버클라우드, LG AI 연구원, NC AI 정도가 사업자 선정에 유리할 것으로 봤다. 이들은 외국 회사의 오픈소스를 활용하지 않고 처음부터 끝까지 자체 기술만을 적용해 AI 모델을 개발해 본 경험이 있다. 코난테크놀로지, 솔트룩스, 카카오도 프롬 스크래치 방식으로 자체 모델을 개발한 만큼 이번에 사업자로 선정될 것이란 자신감을 보이고 있다. 이 중 코난테크놀로지는 지난 2023년 4월 국내 중소형 업체 중 최초로 자체 LLM인 '코난 LLM'을 출시한 곳으로, 이번 선발전에서 유력 후보로 떠오르고 있다. 지난 5월 자체 개발 LLM '루시아3'를 공개한 솔트룩스 역시 중소업체 중에서 주목 받고 있다. 업계에선 정부가 최종 선발될 '독자 AI 파운데이션 모델 프로젝트' 참여 정예팀을 대기업 3팀, 중소기업 2팀 등 최대 5팀을 초기에 선발할 것으로 보고 있다. 업계 관계자는 "300억 개(30B) 이상의 파라미터(매개변수)를 가진 대형 모델을 자체적으로 만들어 본 국내 업체는 사실 손꼽힌다"며 "이번 선발전은 일부 대기업을 중심으로 경쟁이 치열해질 가능성이 높다"고 봤다. 그러면서도 "다만 LG, 네이버 같은 일부 대기업은 기존 AI 모델을 전 국민이 쓰는 모델로 키워 나가기엔 수익이 결부돼 있어 내부 설득이 만만치 않을 듯 하다"며 "KT, SK텔레콤 등 통신사들은 최근까지 소버린 AI를 부정하고 해외 유력 빅테크 업체들과 협업하려고 노력했다가, 정부의 정책 변경에 발 맞춰 이번 사업에 들어오려는 모습을 보였다는 점에서 사업자로 선정되기엔 아쉬운 점이 많다"고 덧붙였다. 공개적으로 이번 선발전 참여를 예고했던 기업들은 최근 컨소시엄 구성을 두고도 치열한 주도권 경쟁을 벌이고 있다. 컨소시엄을 어떤 곳과 함께 구성하느냐에 따라 자신들의 전략이 노출될 가능성이 높은 만큼, 보안 유지에도 각별히 신경쓰는 분위기다. 현재까지 이번 선발전에 관심을 보이며 설명회에 참여한 기업은 KT와 SK텔레콤, LG유플러스, LG AI 연구원, 카카오, 네이버, 포티투마루, 업스테이지, 코난테크놀로지, NC AI, 솔트룩스, 레블업, 트릴리언랩스, 트웰브랩스, 이스트소프트, 모티프테크놀로지스 등으로 알려져 있다. 정부는 이번 선발전의 평가 기준을 크게 세 가지로 구분했다. 총점은 100점으로 ▲기술력 및 개발 경험(40점) ▲개발목표 및 전략·기술(30점) ▲파급효과 및 기여 계획(30점) 등을 눈여겨 볼 예정이다. 업계 관계자는 "각 업체들은 자신들의 장·단점을 철저하게 분석한 후 단점을 잘 커버할 수 있는 스타트업, 대학 등과 컨소시엄을 구성하기 위해 물밑 작업을 치열하게 벌이고 있는 것으로 안다"며 "다만 국내에 있는 대부분의 기업, 대학 등이 이번 선발전에 참여할 것으로 보여 이를 제대로 객관적으로 평가해 줄 심사위원들을 정부가 확보했을 지가 가장 큰 관심사"라고 말했다. 또 다른 관계자는 "공공 AI의 핵심 요구사항에서 기술적 성능을 넘어선 설명 책임과 투명성, 국가 인프라로서의 신뢰성과 지속가능성, 향후 에이전트 간 연동 등 확장성을 고려해야 한다"며 "'잘 작동하는 AI'와 '책임질 수 있는 AI'는 별개의 문제라는 점을 기준으로 삼고 성능 대비 통제권을 잘 가질 수 있는 부분에 대해 심사 시 신중히 봐야 할 것"이라고 밝혔다.

2025.07.10 17:00장유미

[유미's 픽] 알리바바 큐원 탑재한 SKT '에이닷엑스 4.0'…藥일까 毒일까

"2023년 12월 획득한 국내 정보보호 관리체계 인증(ISMS) 정책에도 한국 데이터를 외부로 반출하지 않는다는 게 필수입니다. 한국 데이터는 해외로 유출되지 않습니다." 지난 달 19일 기자간담회를 통해 이처럼 강조했던 알리바바 클라우드가 자사 인공지능(AI) 모델 '큐원'을 앞세워 SK텔레콤을 등에 업고 국내 시장 공략에 본격 나섰다. 올 초 오픈AI를 긴장하게 만든 딥시크에 이어 알리바바 '큐원'까지 영역 확장에 속도를 높이고 있지만, 중국 기업의 데이터 유출 우려 때문에 국내 시장에 제대로 안착할 수 있을지 주목된다. 6일 업계에 따르면 SK텔레콤이 지난 3일 공개한 AI 모델 '에이닷엑스 4.0'에는 알리바바의 오픈소스 거대언어모델(LLM)인 '큐원 2.5'가 적용된 것으로 파악됐다. 한국어에 맞게 SKT가 개량한 '에이닷엑스 4.0'은 특정 산업에 최적화된 '버티컬 AI 서비스'를 만든다는 목표로 만들어진 LLM으로, 오픈소스 커뮤니티 허깅페이스를 통해 A.X 4.0의 표준 모델과 경량 모델 2종이 공개됐다. 표준 모델은 720억개(72B), 경량 모델은 70억개(7B)의 매개변수를 갖추고 있다. 하지만 중국 기업의 AI 모델을 활용했다는 점에서 국외 정보 유출에 대한 의구심도 나오고 있다. SKT가 개인정보보호정책에 ▲이용자의 메시지나 답변은 저장하지 않는다 ▲이용자의 쿠키를 수집·저장하지 않는다 ▲기술적 보안과 프라이버시 보호를 위해 노력하겠다 등의 문구를 삽입하며 대응에 나섰지만, 우려를 불식시키기엔 미흡한 조치라는 평가가 나오고 있다. 특히 SKT를 활용하는 이용자들 사이에서 볼멘 소리가 나오고 있다. 누리꾼들은 "소식을 접하고 '에이닷' 어플을 바로 삭제했다", "중국산 AI 모델에 한국어를 학습시켰다고?", "중국 묻은 SKT, 빨리 탈출해야겠다" 등의 부정적인 반응을 내놓으며 실망감을 감추지 않았다. 업계 관계자는 "SKT가 유심 해킹 사건으로 고객들의 많은 신뢰를 잃은 상황에서 굳이 이미지가 좋지 않은 중국 AI 모델을 기반으로 파인튜닝 했다는 사실을 적극 알리는 것이 과연 득이 될 지 모르겠다"며 "한국어를 자체 데이터로 학습해 잘한다는 점을 내세우고 있지만 현 시점에서 이를 내놓은 것이 도움될 것 같진 않다"고 지적했다. 하지만 SKT는 'A.X 4.0'을 온프레미스(내부 구축형) 방식으로 제공하는 만큼, 기업 내부 서버에 직접 설치해 사용할 수 있어 데이터 보안에서 강점을 지녔다는 점을 적극 강조했다. 알리바바 클라우드 역시 지난 달 기자 간담회를 통해 중국계 기업에 대한 우려를 의식한 듯 보안과 컴플라이언스를 핵심 가치로 내세우며 '신뢰 받는 글로벌 파트너'로의 입지를 국내에서도 강화하겠다고 강조했다. 또 국내 투자 계획을 밝히며 사업 확장에 대한 의지도 내비쳤다. 알리바바 클라우드는 지난 2016년 국내 시장에 진출한 후 2022년 3월 국내 첫 데이터센터를 구축하고, 지난 달 서울에 또 다른 데이터센터를 가동한 상태다. 임종진 알리바바 클라우드 인텔리전스 수석 솔루션 아키텍트는 "중국의 데이터 보호법에 대해 구체적으로 말하긴 어렵지만, 글로벌 컴플라이언스 기준 150개 이상을 만족시키고 있다"며 "잠재 고객도 안전하게 운영할 수 있을 것이라고 자신 있게 말할 수 있다"고 말했다. 이를 기반으로 알리바바는 고객사들이 '큐원' 중심의 AI 오픈소스 생태계를 활성화하길 원했다. 또 SKT 외에도 자사 AI 모델을 활용한 사례를 공개하며 협업 확대에 대한 의지를 다졌다. 대표적인 곳이 AI 솔루션 기업 유니바다. 이곳은 알리바바 클라우드의 큐원 모델을 활용해 비용은 30% 절감하면서 한국어 처리 정확도를 45%에서 95%까지 끌어올린 에이전트 AI를 공개했다. 네이버 '스노우'는 알리바바 클라우드의 비디오 생성 모델 '완(Wan)'을 기반으로 중국 시장에서 개인화된 이미지 스타일링 기능을 제공 중이다. 라라스테이션은 알리바바 클라우드와 손잡고 글로벌 라이브 스트리밍 플랫폼을 개발해 동남아 시장으로 비즈니스를 확장하는 데 성공했다. 또 국내 시장 확대를 위해 메가존소프트·이테크시스템과도 협력 중이다. 윤용준 알리바바 클라우드 인텔리전스 한국 총괄 지사장은 "메가존소프트와 이테크시스템 외에 공개할 수는 없지만 대기업군 SI(시스템통합) 업체들도 파트너 에코에 이미 합류해 있다"고 밝혔다. 업계에선 '큐원'이 페이스북 모기업인 메타플랫폼의 '라마(LLaMA)'와 중국 딥시크 'R1' 모델을 제치고 사실상 전 세계 LLM 생태계에서 가장 빠르게 영향력을 키우고 있다는 점에서 SKT와 알리바바의 협업을 부정적으로만 봐선 안된다는 평가도 있다. 실제 '큐원' 모델은 현재 전 세계적으로 3억 건 이상 다운로드됐고 13만 개 이상의 파생 모델이 생성된 것으로 알려졌다. 특히 최신 모델 '큐원3-8B'의 지난 달 다운로드 수는 메타의 '라마-3.1-8B'를 거의 2배 앞섰다는 점에서 주목 받았다. 딥시크의 'R1' 시리즈 중 가장 인기 있는 최신 모델 '딥시크-R1-0528'에 비해서는 약 10배 많았다. 업계 관계자는 "큐원은 한국어 처리 능력과 온프레미스 버전에서 최적화가 가능해 산업별 맞춤형으로 튜닝을 거쳐 기업 차원으로 빠르게 확산되며 국내에서 존재감을 키우고 있다"며 "민간 데이터를 다루는 공공·금융에서도 온프레미스로 튜닝해 개발하거나 중소기업과 스타트업에서도 다양하게 튜닝하고 있다"고 말했다. 그러면서 "딥시크에 이어 큐원까지 중국 AI가 국내 산업 기반을 빠르게 장악할 것으로 예상된다"며 "향후 국내 기업 기술 완성도가 높아지더라도 기존 기술 장벽과 가격 등에서 후순위로 밀려날 가능성이 높다는 점에서 중국 AI 생태계에 종속될 것이란 우려도 높아지고 있다"고 덧붙였다.

2025.07.06 09:00장유미

[유미's 픽] 삼성·SKT도 등판?…李 정부 '국가대표 AI' 선발전, 판 커질까

약 2천억원을 투입해 글로벌 톱 수준의 거대언어모델(LLM)을 만들 '인공지능(AI) 국가대표 정예팀' 선발전이 이달부터 본격화된 가운데 어떤 기업이 사업자로 선정될 지를 두고 관심이 높아지고 있다. 이재명 정부가 배경훈 과학기술정보통신부 장관 후보자와 하정우 AI미래기획수석을 앞세워 '한국형 챗GPT' 개발에 대한 의지를 강하게 보이고 있는 만큼, 선발된 기업들에 대한 지원도 파격적일 것으로 기대된다. 27일 업계에 따르면 과학기술정보통신부는 이날 오후 서울 강남구 포스코타워에서 '독자 AI 파운데이션 모델 프로젝트'와 관련해 기업들을 대상으로 설명회를 진행한다. 이 자리에는 그간 공개적으로 참여 의지를 보였던 LG AI 연구원을 비롯해 코난테크놀로지, 이스트소프트를 비롯해 네이버와 카카오, 엔씨 AI, 솔트룩스, 업스테이지 등이 참여할 예정이다. 이 중 가장 관심을 받고 있는 기업은 LG AI 연구원이다. 올 초 국내 최초로 추론형 AI 모델을 선보인 이곳은 그간 자체 AI 모델인 '엑사원'을 내세워 에이전틱 AI와 산업별 영역에서 활용도를 높였다는 평가를 받는다. 최근 과학기술정보통신부 장관 후보자에 지명된 배경훈 LG AI연구원장이 '엑사원'을 개발하는 데 큰 공을 들였던 만큼 사업자 선정에 대한 기대감을 키우고 있다. 하정우 AI미래기획수석을 배출해 낸 네이버도 유력 사업자로 꼽힌다. 하 수석이 네이버클라우드 AI 혁신센터장 시절 개발·운영을 총괄했던 자체 LLM '하이퍼클로바X'를 기반으로 소버린 AI 구축을 늘 강조해왔던 탓이다. 카카오는 자체 개발한 AI 모델 '카나나'로 도전에 나설 예정이다. '카나나'는 최근 오픈소스로 공개한 모델이 한국어 LLM 성능 평가를 위해 설계된 벤치마크 플랫폼 '호랑이(Horang-i)' 리더보드에서 8B 사이즈(매개변수 80억 개) 이하 모델 가운데 1위를 차지하기도 했다. 카카오는 '카나나를 지속해 개발하는 한편, 국산 AI 경쟁력을 강화하기 위해 일부 모델을 오픈소스로 계속 제공할 예정이다. 국내 최초로 LLM을 개발한 코난테크놀로지도 충분히 경쟁력이 높다는 평가를 받는다. 지난 2023년 8월 131억 파라미터 규모의 모델 학습을 완료한 후 선보인 '코난 LLM'은 현재 한국남부발전, 한국중부발전, 국방부, 행정안전부, 국회사무처, 인천국제공항공사 등 주요 공공기관을 비롯해 한화손해보험, 신한라이프, KB증권, 제주항공 등 민간 분야까지 다양한 산업 전반에 걸쳐 구축 및 PoC를 수행해 생산성 향상을 이끌고 있다. 또 코난테크놀로지는 지난 5월 추론 모델 '코난 LLM ENT-11'도 공개해 주목 받았다. 최근에는 AI 반도체 스타트업 리벨리온과 손잡고 '국산 AI 인프라' 구축에도 속도를 내고 있다. 리벨리온의 신경망처리장치(NPU)에 코난테크놀로지의 생성형 AI 기술을 접목해 국산 기술 기반의 독자적 AI 생태계를 구축하고 장기적으로 소버린 AI 기술 자립도를 높인다는 구상이다. 이스트소프트는 자체 개발한 '앨런 LLM'을 최근 정식 출시하며 도전장을 던졌다. 이곳은 AI 검색 엔진 서비스 '앨런'을 바탕으로 검색 증강 생성(RAG) 기반 보고서 생성과 추론에 특화된 오픈소스 기반의 '앨런 LLM'을 만들었다. 이 모델은 데이터센터용 초거대 모델부터 온디바이스용 경량 모델까지 구성된 것이 특징이다. 솔트룩스도 이번 프로젝트에 많은 관심을 보이고 있다. 이곳은 지난 달 말 언어 생성과 이해에 특화된 '루시아3 LLM'을 공개했다. 업스테이지도 자체 LLM '솔라'를 앞세워 도전에 나설 예정으로, 최근에는 이를 고려해 국내 반도체 업체인 퓨리오사AI와 협업에 나섰다. 이번 일을 통해 '솔라'를 퓨리오사AI의 차세대 NPU '레니게이드'에 최적화 해 탑재할 예정이다. 또 두 회사는 NPU 기반으로 구동하는 온프레미스 AI 구축 사업을 공동 추진하고 국내는 물론 글로벌 시장 공략에도 함께 나설 방침이다. NC AI도 최근 다크호스로 떠올랐다. 엔씨소프트의 14년 연구 노하우를 바탕으로 올해 2월 분사한 이곳은 자체 개발한 LLM '바르코 LLM'을 앞세워 게임, 패션, 콘텐츠 등 다양한 산업군에서 실제 상용화된 AI 솔루션을 선보이고 있어 사업자로 선정되기에 최적화돼 있다는 평가를 받는다. 또 NC AI는 '바르코 LLM'을 학술적 용도뿐 아니라 상업적인 용도까지 활용할 수 있도록 오픈소스로 공개함으로써 '모두의 AI'에 기여한다는 계획이다. 일각에선 SK텔레콤, 삼성전자도 도전할 가능성이 있다고 봤다. 팀 단위로 사업 제안이 가능한 만큼, SK텔레콤이 K-AI 얼라이언스를 운영하고 자체 GPT 개발 경험이 있다는 점을 앞세워 이번에 나설 것으로 예상했다. 삼성전자는 사내에서 사용하고 있는 자체 거대언어모델(LLM) '삼성 가우스'가 있다는 점에서 참여를 할 것이란 기대감이 나온다. 과기정통부는 오는 7월 말께 최종 선발될 '독자 AI 파운데이션 모델 프로젝트' 참여 정예팀을 최대 5곳으로 선정한 뒤 6개월 단위로 선별해 축소한다. 성능·전략·파급효과 등을 기준으로 단계 평가를 거쳐 4개팀 → 3개팀 → 2개팀 식으로 줄여나가는 식이다. 정예팀 선정은 다양한 분야의 국내외 AI 전문가들이 참여하는 위원회를 구성해 진행한다. 국민 AI 접근성 증진, 공공·경제·사회 AI 전환 지원 등 국내 기여계획을 정예팀에 제시하도록 해 선정평가에 반영한다. 참여기업 규모와 오픈소스 수준에 따라 정예팀 자원 매칭 비율은 차등화할 예정이다. 대기업 3팀, 중소기업 2팀이 초기에 선발될 것으로 보는 것이 업계 중론이다. 처음 진행될 6개월 단위 단계 평가는 오는 12월로 예정돼 있다. 평가 기준은 ▲컨테스트 기반 국민·전문가 평가 ▲국내외 벤치마크와 한국어 성능·안전성 검증체계 기반 검증평가 ▲파생 AI모델 수 기반의 파생평가 등이 연계되는 입체적 평가가 추진된다. 업계 관계자는 "정부가 정예팀으로 선발된 컨소시엄에 지난 1차 추가경정예산으로 확보한 GPU 1만 장 사용을 지원하기로 돼 있다는 점에서 많은 기업들이 관심을 가지는 듯 하다"며 "정부가 추진하는 이번 독자 AI 파운데이션 모델은 실제 세계 톱(Top) 수준의 모델을 만든 경험이 있는가, 전 국민 AI로 공개할 수 있는가 등의 조건이 제일 중요한 듯 하다"고 말했다. 이어 "정부가 이날 진행하는 설명회 자리에서 평가 기준을 어떻게 삼을지에 따라 참여할 수 있는 기업들이 다소 걸러질 듯 하다"고 덧붙였다. 일각에선 정부가 헛돈을 쓰는 게 아닌지에 대한 우려를 내놓기도 했다. 기업들이 예산 지원을 받아 LLM 생태계를 구축한다고 해도 결국 갈라파고스가 될 것이란 판단에서다. 업계 관계자는 "챗GPT, 제미나이 등 글로벌 기업들의 AI 모델이 표준이 된 상황에서 이들의 95% 수준인 K모델을 쓰다간 AI 생태계에서 배제될 수도 있다"며 "국내 기업들의 AI 모델 경쟁력이 자본력을 앞세운 글로벌 기업을 따라가기에도 쉽지 않다는 점을 고려하면, 결국 K모델을 개발해 놓고 활용을 제대로 못하는 상황이 벌어질 수도 있다"고 짚었다. 그러면서 "자체 AI 모델 개발에 예산을 투입할 것이 아니라 K-컬처가 해외에서 빠르게 확산된 것처럼 우리만의 AI 콘텐츠 개발에 주력하는 것이 좀 더 효용 가치가 높을 수 있다"며 "정부에서도 AI 인프라에만 힘을 쏟을 것이 아니라 AI를 활용한 콘텐츠 개발에도 함께 나서야 할 것"이라고 피력했다.

2025.06.27 11:53장유미

관세 전쟁 '최대' 피해자…테슬라 美·中 사업 직격타

미국, 중국 간 관세 수위가 점차 고조되는 가운데 테슬라가 현지 사업에 상당한 타격을 입는 등 최대 피해자가 됐다는 분석이 나왔다. 미국이 자동차 산업에 대한 관세를 검토할 당시에는 상대적으로 테슬라가 수혜를 입을 것으로 관측된 것과 상반된 결과가 나온 셈이다. 20일 업계에 따르면 자동차 관세의 경우 초안과 달리 캐나다, 멕시코에 대해선 면제를 결정하면서 파급력이 크게 줄어들었다. 반면 국가별 상호관세 수위는 예상을 상회하면서 미국과 중국의 사업 비중이 큰 테슬라가 직격타를 맞게 됐다. 현재 미국은 중국산에 145%의 관세를, 중국은 미국산에 125%의 관세를 부과하고 있다. 로이터 통신 등 외신에 따르면 테슬라는 최근 사이버캡, 테슬라 세미 모델의 중국산 부품 조달 계획을 중단한 것으로 전해졌다. 핵심 원인이 관세로 꼽혔다. 해당 사안 관련 소식통은 상호관세 발표 직후 중국산 관세가 34%로 정해졌을 당시만 해도 부품을 계획대로 조달하려 했지만, 관세가 세 자릿수까지 치솟으면서 이 계획을 중단하게 됐다고 전했다. 테슬라는 사이버캡을 텍사스주, 테슬라 세미는 네바다주 공장에서 양산을 준비하고 있다. 사이버캡은 내년, 테슬라 세미는 올해 말로 양산 시점이 잡혀 있다. 중국 사업에도 어려움을 겪고 있다. 최근 테슬라는 중국 웹사이트와 SNS 등에서 모델S와 모델X 신규 주문 접수를 중단했다. 이와 관련해 구체적 설명을 내놓진 않았지만, 업계에선 관세 인상이 영향을 줬을 것이란 해석을 내놓고 있다. 모델S와 모델X는 미국 캘리포니아주 공장에서 생산돼 중국에 수출되고 있기 때문이다. 테슬라는 전체 매출의 약 50%는 미국에서, 30% 가량을 중국에서 거두는 등 양국 사업 비중이 상당한 편이다. 양국 간 무역 갈등이 지속될 경우 사업에 미칠 악영향이 클 전망이다. 도널드 트럼프 미국 행정부는 중국 외 국가에 대해서도 관세 압박을 행사하며 무역 갈등을 심화시키고 있다. 이런 가운데 일론 머스크 테슬라 최고경영자(CEO)가 트럼프 행정부의 정부효율부 수장으로 활동하는 등 밀접한 행보를 보이자 소비자 불매 운동도 여러 국가에서 나타나고 있다. 올해 1분기 차량 인도량도 33만6천681대로 전년 동기 대비 13% 감소한 수치를 기록했다.

2025.04.20 18:00김윤희

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

눈앞으로 다가온 '피지컬 AI'…CES 2026이 증명했다

페이커 소속 '팀 리드', 2026 LCK 시즌 오프닝 2년 연속 우승

인텔, 아크 B390 성능 공개 "노트북용 별도 GPU 필요없다"

[르포] 폭설에 얼어붙는 도시…전기차 보기 힘든 홋카이도 가다

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.