검색 - IT세상을 바꾸는 힘 지디넷코리아

ZDNet 검색 페이지

'모델 s'통합검색 결과 입니다. (20건)

태그
기간
- 3개월
- 1년
- 1년 이전

재검색

[유미's 픽] 젠슨 황 만난 LG·SKT·업스테이지…독자 AI 2차전 변수될까

젠슨 황 엔비디아 최고경영자(CEO)의 방한을 계기로 국내 독자 인공지능(AI) 파운데이션 모델 경쟁 구도에도 변화가 감지된다. LG AI연구원과 SK텔레콤이 엔비디아와 기술 협력 접점을 넓히고 업스테이지가 국내 대표 AI 스타트업으로 황 CEO와 만나면서 2차 평가를 앞둔 경쟁에 새 변수가 더해졌다는 분석이 나온다. 9일 업계에 따르면 정부의 독자 AI 파운데이션 모델 프로젝트에는 LG AI연구원, SK텔레콤, 업스테이지, 모티프테크놀로지스 등 4곳이 정예팀으로 참여하고 있다. 이들 기업은 오는 8월 2차 평가를 거쳐 1곳이 탈락하고, 내년 2월 최종 2곳이 선정되는 일정을 앞두고 있다. 1차 평가 이후 독자성 논란이 불거졌던 만큼 2차 평가에서는 모델 성능뿐 아니라 활용성, 기술 자립성, 산업 적용 가능성 등이 더 면밀히 다뤄질 가능성이 거론된다. 이 같은 상황에서 이번 엔비디아 협력은 LG AI연구원과 SK텔레콤에 비교적 직접적인 기회로 작용할 수 있을 것으로 예상된다. 두 회사 모두 엔비디아와의 협력 범위가 단순 회동을 넘어 모델 개발, 학습 인프라, AI 클라우드, 추론 최적화 등으로 연결돼 있어서다. 또 대규모 AI 모델 경쟁이 벤치마크 점수를 넘어 실제 서비스 구현 역량까지 따지는 방향으로 바뀌면서 글로벌 AI 인프라 기업과의 협력 가치도 커지고 있다. LG AI연구원은 자체 모델 엑사원(EXAONE) 고도화에 엔비디아 기술을 활용할 예정이다. LG와 엔비디아는 전날 서울 여의도 LG트윈타워에서 최고경영진 회의를 열고 피지컬 AI, AI 인프라, 모빌리티 등 차세대 AI 산업 협력 방안을 논의했다. 이 자리에서 엑사원 생태계 확장을 위한 기술 협력도 함께 다뤄졌다. LG AI연구원은 엑사원 성능 강화 과정에서 엔비디아의 최신 그래픽처리장치(GPU)인 블랙웰과 AI 개발 플랫폼 네모 프레임워크, 추론 성능 강화 소프트웨어 텐서RT-LLM을 활용할 계획이다. 또 AI 모델 데이터 학습 품질을 높이기 위해 엔비디아의 네모트론 오픈 데이터셋도 활용키로 했다. 이는 엑사원의 학습 효율과 추론 성능을 높이고 실제 산업 현장 적용 기반을 넓히려는 행보로 풀이된다. LG AI연구원은 1차 평가에서 K-엑사원을 앞세워 국내 모델 중 1위(90.2점)를 기록했다. 2차 평가에서는 모델 규모와 성능을 끌어올려 글로벌 최신 오픈웨이트 모델과 경쟁할 수 있는 수준을 목표로 하고 있다. 지식, 추론, 지시어 이행, 롱 컨텍스트뿐 아니라 에이전틱 툴 활용과 코딩 영역에서도 성능 개선을 추진 중이다. SK텔레콤은 엔비디아와의 협력을 모델 개발과 AI 인프라 사업 양쪽으로 연결하고 있다. 이곳은 독자 AI 파운데이션 모델 프로젝트에서 에이닷엑스 케이원(A.X K1)의 후속 모델인 에이닷엑스 케이투(A.X K2)를 개발하고 있다. 엔비디아와는 학습 데이터, 인프라, 프레임워크 전반에서 기술 협력을 이어가고 있다. SK그룹 차원의 협력도 SK텔레콤에 힘을 싣는 구조다. SK텔레콤은 엔비디아 DSX 플랫폼 기반 AI팩토리 구축과 운영을 맡는다. SK하이닉스는 엔비디아와 AI팩토리용 차세대 메모리를 공동 개발한다. SK텔레콤은 이를 기가와트급 인프라로 확장해 아시아 AI 클라우드 사업자로 도약하겠다는 구상을 제시했다. 3개 팀을 선별할 오는 8월 평가에서는 이 같은 인프라 구상이 A.X K2의 모델 경쟁력을 얼마나 보완할 수 있을지도 관심사다. 다만 AI 클라우드 사업 계획보다 모델 자체의 성능과 활용성이 별도로 검증될 가능성이 크다. 업스테이지는 LG AI연구원이나 SK텔레콤처럼 대규모 그룹 인프라를 갖춘 것은 아니지만, 지난 8일 오후 젠슨 황 CEO와 진행된 국내 AI 스타트업 간담회에 주요 기업으로 참석해 시장 주목도를 높였다. 다만 엔비디아와의 구체적인 기술 협력 발표가 나온 것은 아닌 만큼 독자 AI 파운데이션 모델 평가에서는 솔라 계열 모델의 실제 성능과 활용 사례가 더 중요한 판단 기준이 될 가능성이 크다. 모티프테크놀로지스는 이번 엔비디아 방한 흐름에서는 상대적으로 주목도가 낮지만, 독자 아키텍처를 앞세운 차별화 전략을 내세우고 있다. 뒤늦게 정예팀에 합류한 만큼 2차 평가까지 남은 기간 동안 성능 안정화와 기술 독자성을 얼마나 설득력 있게 보여줄지가 과제로 꼽힌다. 업계 관계자는 "엔비디아 협력이 평가 우위를 곧바로 보장하지는 않을 것"이라며 "정부 프로젝트가 지향하는 방향이 해외 AI 생태계와의 친밀도보다 국내 주도의 모델 개발 역량과 산업 활용 생태계 구축에 있기 때문"이라고 봤다. 그러면서 "각 기업이 자체 모델의 성능과 활용 사례, 기술 독자성을 얼마나 설득력 있게 보여주느냐가 더 중요하게 작용할 것"이라고 덧붙였다.

2026.06.09 10:31장유미 기자

[유미's 픽] "독파모 잊었다"…NC AI, 국방·산업·콘텐츠로 특화 AI 승부수

올해 초 독자 AI 파운데이션 모델 개발 사업에서 고배를 마신 NC AI가 산업 특화 인공지능(AI) 시장에서 반격의 발판을 마련하며 영역 확장에 속도를 내고 있다. 범용 초거대 AI 모델 경쟁에서 벗어나 로봇, 디지털 트윈, 3D 생성 AI 등 자사가 강점을 가진 분야로 사업 무게 중심을 빠르게 옮긴 분위기다. NC AI는 현대로템과 컨소시엄을 구성해 국방과학연구소가 발주한 '피지컬 AI 기반 통합 시뮬레이터 및 모듈형 로봇 시스템' 국책 연구개발 과제의 최종 사업자로 선정됐다고 28일 밝혔다. NC AI는 이번 과제에서 로봇 파운데이션 모델(RFM) 구현에 필요한 핵심 기술인 '월드모델' 개발을 총괄한다. 월드모델은 로봇이 현실 세계의 물리 법칙과 환경 변화를 가상 환경에서 학습하도록 돕는 기술이다. 무인 로봇이 실제 전장이나 야지 환경에 투입됐을 때 시뮬레이션과 현실 간 차이를 줄이는 데 활용된다. NC AI는 고정밀 3D 가상 세계 구축 역량과 자체 3D 생성 AI 기술을 결합해 로봇 학습용 합성 데이터 공급 체계를 구축할 계획이다. NC AI는 독자 AI 파운데이션 모델 개발 사업 1차 평가 탈락 이후 범용 모델 경쟁보다 산업 현장 적용에 초점을 맞추고 있다. 이번 국방 과제 선정도 이 같은 전략 변화를 보여주는 사례로, 파운데이션 모델을 기반 기술로 활용하면서도 실제 사업화는 산업별 솔루션과 멀티모달 모듈을 통해 추진하는 방향을 택했다. 올해 초에는 이노비즈협회와 중소기업 AX 혁신을 위한 업무협약을 체결하며 산업 현장형 AI 도입 모델 발굴에도 나섰다. NC AI는 2만3000여 개 이노비즈기업 및 회원사 네트워크를 기반으로 현재 업종, 규모, 디지털 수준에 맞춘 AI 솔루션 적용 방안을 논의하고 있다. 이는 범용 AI를 일괄 적용하기보다 산업별 업무 구조에 맞춘 버티컬 AI 모델을 확산하려는 전략으로 풀이된다. 피지컬 AI 영역에서도 협업 범위를 넓히고 있다. NC AI는 신한금융그룹과 월드모델, 시각언어행동(VLA), 디지털 트윈 기술을 오프라인 영업점 공간 분석과 운영 효율화에 적용하는 실증을 진행 중인 것으로 알려졌다. 또 강원 춘천시 AI 특화 시범도시 사업에도 참여하며 도시 인프라 단위의 공간 AI 적용 가능성을 모색하고 있다. 콘텐츠 분야에선 바르코(VARCO) 생태계를 앞세우고 있다. 영상, 3D, 오디오 등 멀티모달 기술 킷을 창작자와 기업 고객에게 개방하고, 생성형 AI 기반 광고영상 공모전 등을 통해 실무 접점을 늘리고 있다. 패션·라이프스타일 커머스 분야에서도 텍스트 기반 패션 생성, 가상 피팅, 초개인화 비주얼 에이전트 등 버티컬 AI 적용을 추진 중이다. 산업 모델 '배키(VAETKI)'도 국방, 제조, 물류 등 보안과 현장성이 중요한 분야를 겨냥하고 있다. 특정 산업 데이터와 업무 흐름을 반영한 모델을 통해 범용 AI와 다른 비용 효율성과 적용성을 내세우려는 시도다. 업계에선 NC AI가 독파모 탈락 이후 범용 모델 성능 경쟁보다 현장 적용성과 수익화 가능성에 초점을 맞추고 있다고 봤다. 국방 피지컬 AI 과제와 중소기업 AX, 금융·도시·콘텐츠 실증이 개별 프로젝트를 넘어 공통 기술 자산으로 축적될 경우 산업 AI 사업 확장에도 힘이 실릴 수 있다. 업계 관계자는 "범용 파운데이션 모델 경쟁에서는 컴퓨팅 자원과 대규모 자본이 중요하지만 산업 AI는 현장 데이터, 도메인 이해도, 구축 경험이 더 크게 작용한다"며 "NC AI가 월드모델과 3D·멀티모달 기술을 국방, 금융, 도시, 콘텐츠 분야에서 반복 적용 가능한 형태로 만들 수 있다면 독자적인 사업 기회를 확보할 수 있을 것"이라고 말했다.

2026.05.28 08:10장유미 기자

[유미's 픽] 독파모 올라탄 AI 기업들, 자금전 본격화…업스테이지·모티프 실탄 확보

정부의 '독자 인공지능(AI) 파운데이션 모델' 프로젝트를 계기로 국내 AI 기업들의 자금 확보 경쟁이 본격화되고 있다. 참여 기업들이 민간 투자와 정책금융을 잇달아 확보하며 대규모 모델 개발과 인프라 확충에 속도를 내는 모습이다. 모티프테크놀로지스는 240억원 규모 시리즈B 투자를 유치했다고 27일 밝혔다. 이번 투자 라운드에는 기존 투자사인 나이스투자파트너스와 노틸러스인베스트먼트가 후속 투자자로 참여했다. 디토인베스트먼트와 포레스트벤처스는 신규 투자자로 이름을 올렸다. 모티프테크놀로지스는 이번 투자금을 AI 딥테크 역량 강화와 기업 AX 솔루션 개발, 차세대 AI 인프라 및 서비스 고도화 등에 투입할 계획이다. 오는 8월 독자 AI 파운데이션 모델 단계평가를 앞두고 모델 개발과 인프라 고도화에 필요한 실탄을 확보한 셈이다. 모티프테크놀로지스는 AI 인프라 솔루션 기업 모레의 자회사로 지난해 2월 출범했다. 이 회사는 모델 아키텍처 연구개발(R&D), 그래픽처리장치(GPU) 인프라, 시스템 운영 솔루션, 사후학습·강화학습 방법론을 아우르는 풀스택 엔지니어링 역량을 강점으로 내세우고 있다. 또 설립 4개월 만에 프롬 스크래치 방식으로 개발한 소형언어모델(sLLM) '모티프(Motif)-2.6B'를 오픈소스로 공개해 주목받기도 했다. 이후 텍스트 기반 이미지 생성 모델 '모티프-이미지-6B(Motif-Image-6B)', 자체 개발 대규모언어모델(LLM) '모티프-2-12.7B' 등을 선보이며 모델 라인업을 확대했다. 여기에 모티프테크놀로지스는 지난 2월 과학기술정보통신부가 주관하는 독자 AI 파운데이션 모델 프로젝트 추가 공모에서 정예팀으로 선정되며 시장의 높은 관심을 받았다. 현재는 기존 정예팀인 LG AI연구원, SK텔레콤, 업스테이지와 함께 오는 8월 단계평가를 받기 위해 전력을 쏟고 있다. 모티프테크놀로지스는 모레, 서울대, 한국과학기술원, 삼일회계법인, 국가유산진흥원, HDC랩스 등 17개 기관과 함께 300B급 추론형 LLM도 개발하고 있다. 이후 310B급 시각언어모델(VLM), 320B급 시각언어행동(VLA) 모델로 단계적으로 고도화해 독자 AI 파운데이션 모델을 확보한다는 계획이다. 독자 AI 모델 개발 기업을 향한 자금 공급은 업스테이지에서도 두드러진다. 업스테이지는 지난달 국민성장펀드 직접투자 2호 기업으로 선정돼 차세대 AI 모델 개발 등을 위한 5600억원 규모의 직접투자 안건 승인을 받았다. 이 중 1000억원은 첨단전략산업기금으로 투입된다. 업스테이지는 기업·정부용 AI 솔루션과 LLM을 개발하는 국내 대표 AI 스타트업으로, 정부의 독자 AI 파운데이션 모델 프로젝트에서 벤처·중소기업 가운데 유일하게 1차 평가를 통과했다. 또 최근에는 1800억원 규모의 시리즈C 1차 투자도 마무리한 상태로, 국내 생성형 AI 스타트업 중 처음으로 기업가치 1조원을 인정받는 유니콘에 올랐다. 누적 투자금은 약 4000억원으로 확대됐다. 업스테이지는 자체 개발 LLM '솔라'와 문서처리 AI '다큐먼트 파스'를 앞세워 기업 시장을 공략하고 있다. 확보한 자금은 독자 파운데이션 모델 프로젝트 등 AI 모델 고도화를 위한 GPU 인프라 확충, 국내외 인재 영입, 미국·일본 등 해외 시장 개척에 투입할 방침이다. 김성훈 업스테이지 대표는 "한국을 넘어 글로벌 시장에서도 경쟁력 있는 자체 AI 모델을 고도화해 단순 기업가치가 아닌 매출로 증명하는 기업이 되겠다"며 "기업가치 1조원을 넘어 매출 1조원을 돌파하는 회사가 되기 위해 계속 앞으로 전진하겠다"고 말했다. 두 회사는 모두 독자 AI 파운데이션 모델 사업에 참여하고 있지만 성장 전략에는 차이가 있다. 업스테이지가 상용화 성과와 정책금융 지원을 기반으로 소버린 AI 기업으로 체급을 키우고 있다면, 모티프테크놀로지스는 독자 아키텍처와 풀스택 개발 역량을 앞세워 대규모 추론형 모델 개발에 무게를 두고 있다. 업계에선 독자 AI 파운데이션 모델 사업을 계기로 국내 AI 기업 간 경쟁축이 기술 개발에서 자금 조달로 확장되고 있다고 보고 있다. 대규모 모델 개발에는 GPU 인프라와 데이터, 고급 인재, 사후학습 역량, 상용화 능력이 동시에 요구되는 만큼, 안정적인 자금 확보 여부가 향후 단계평가와 글로벌 경쟁력의 핵심 변수로 떠오르고 있다. 특히 업스테이지가 정책금융을 통해 대규모 투자 승인이라는 발판을 마련하고, 모티프테크놀로지스가 민간 벤처투자 시장에서 후속 투자를 유치하면서 독자 AI 기업을 둘러싼 자본 경쟁은 더 치열해질 전망이다. 정부 사업을 통해 기술력을 검증받은 기업들이 민간 투자와 정책 자금을 동시에 끌어들이는 구조가 만들어지고 있다는 분석도 나온다. 임정환 모티프테크놀로지스 대표는 "이번 투자 유치는 모티프의 AI 딥테크 역량 강화의 발판이 될 것"이라며 "현재 진행 중인 프로젝트를 비롯해 기업 AX 솔루션 개발, 차세대 AI 인프라 및 서비스 고도화 등 다양한 사업을 계획대로 차질 없이 추진해 시장 경쟁력을 더욱 강화하겠다"고 밝혔다.

2026.05.27 15:53장유미 기자

너도나도 FSD 열풍…1억원대 테슬라, 1000대 넘게 팔았다

테슬라 완전자율주행(FSD)이 국내 수입차 시장의 고가차량 판매 흐름까지 바꾸고 있다. 올해 들어 1억원대 수입차 판매는 증가했지만, 1억5000만원 이상 초고가 시장은 감소세로 돌아섰다. 이는 자율주행 기술 기대감과 전기차 선호 확대가 맞물리면서 테슬라 모델S·X 등 1억원대 전기차 수요가 늘어난 것으로 풀이된다. 21일 한국수입자동차협회(KAIDA) 등록 통계에 따르면 올해 1월~4월 1억원 이상 수입차 판매량은 총 2만3216대로 집계됐다. 지난해 같은 기간(2만1832대) 대비 6.3% 증가한 수치다. 가격대별로 보면 1억원~1억5000만원 구간 판매량은 지난해 1월~4월 1만474대에서 올해 1만2404대로 18.4% 늘었다. 반면 1억5000만원 이상 차량은 같은 기간 1만1358대에서 1만812대로 4.8% 감소했다. 올해 1억원대 수입차 시장 확대는 테슬라가 주도한 것으로 분석된다. 테슬라는 국내 시장에 판매하고 있는 모델S·X가 포함된 1억원~1억5000만원 구간 판매량이 지난해 1월부터 4월까지 141대에서 올해 1315대로 832.6% 급증했다. 특히 3월 594대, 4월 402대를 기록하며 판매가 집중됐다. 메르세데스-벤츠 역시 같은 구간 판매량이 2624대에서 3342대로 718대(27.4%) 증가했고 BMW도 4088대에서 4410대로 322대(7.9%) 늘었다. 업계에서는 국내 FSD 서비스 도입이 영향을 준 것으로 보고 있다. 테슬라는 국내에서 FSD 기능을 활성화하면서 고가 모델 중심 판매 확대에 나서고 있다. 최근 모델S·모델X 단종 발표까지 이어지면서 고가 모델 선점 수요가 일부 몰린 영향도 있는 것으로 분석된다. 이 가운데 모델Y 판매 비중이 80% 수준을 차지하며 볼륨 모델과 고급 모델 판매가 동시에 확대되는 흐름을 보였다. 실제 테슬라는 지난달 국내 수입차 시장에서도 압도적인 판매량을 기록했다. 테슬라는 지난달 1만3190대를 판매하며 수입차 브랜드 가운데 1위를 기록했다. BMW(6658대), 메르세데스-벤츠(4796대)를 큰 격차로 앞섰다. 국내 전기차 시장 내 테슬라 영향력도 빠르게 확대되고 있다. 산업통상부가 발표한 '4월 자동차 산업 동향'에 따르면 지난달 전기차 내수 판매량은 3만8927대로 지난해 같은 달보다 139.7% 늘었는데, 테슬라는 지난달 국내 판매 순위에서 현대자동차·기아에 이어 3위에 올랐다. 반면 초고가 시장은 상대적으로 위축되는 분위기다. 1억5000만원 이상 구간에서는 포르쉐 판매 감소폭이 가장 컸다. 포르쉐는 지난해 1~4월 2025대에서 올해 1498대로 527대(26.0%) 감소했다. 메르세데스-벤츠도 3508대에서 3153대로 355대(10.1%) 줄었다. 다만 랜드로버는 같은 기간 744대에서 845대로 101대(13.6%) 증가하며 초고가 스포츠유틸리티차(SUV) 수요를 유지했다. 업계에서는 경기 둔화와 소비 양극화 영향으로 초고가 차량보다 상대적으로 접근성이 높은 1억원대 차량 수요가 늘어난 것으로 보고 있다. 여기에 FSD 등 자율주행 기술 기대감까지 더해지면서 테슬라 중심의 고가 전기차 수요 확대 흐름이 이어지고 있다는 평가다. 업계 관계자는 "테슬라는 단순한 수입 전기차 브랜드를 넘어 국내 전기차 시장 자체를 움직이는 핵심 플레이어가 됐다"며 "모델Y를 중심으로 상품성과 가격 경쟁력을 동시에 확보하면서 사실상 '국민 전기차' 수준의 대중성을 확보한 상태"라고 말했다.

2026.05.21 16:10김재성 기자

테슬라, 한정판 모델 S·X에 1년 재판매 제한...위반시 페널티

테슬라가 일부 고가 차량 구매자에게 1년간 재판매를 금지하는 등 이례적인 계약 조건을 적용하며 논란이 일고 있다. 희소성을 강조한 한정판 모델을 중심으로 '되팔기(플리핑)'를 차단하려는 전략으로 보인다. 16일(현지시간) 디지털트렌드 등 외신에 따르면 테슬라는 '시그니처 에디션' 모델 S와 모델 X 구매자에게 차량 인도 후 1년간 재판매를 금지하는 계약을 요구하고 있다. 이를 위반할 경우 최대 5만달러(약 7300만원)의 위약금 또는 재판매 수익 전액을 배상해야 하는 조건이 포함됐다. 테슬라는 재판매 과정에도 개입할 수 있는 권한을 확보했다. 차량 판매가 이뤄지기 전 회사가 먼저 해당 차량을 일정 조건에 따라 다시 매입할 수 있으며, 소유권 이전 자체를 제한할 수도 있다. 특히 이번 시그니처 에디션은 총 350대만 생산되는 한정 모델로, 모델 S 250대와 모델 X 100대가 포함된다. 차량은 '가넷 레드' 색상에 금색 포인트, 화이트 알칸타라 내장재, 고유 번호 플라크 등이 적용됐으며, 가격은 약 15만9천달러(약 2억3100만원) 수준이다. 재판매 제한은 단순 거래 완료뿐 아니라 판매 시도까지 포함된다. 구매자가 차량을 처분하려 할 경우 사전에 테슬라에 서면 통보해야 하며, 회사에 우선 매입 기회를 제공해야 한다. 다만 매입 조건도 구매자에게 불리하게 설계됐다는 지적이다. 테슬라는 최초 구매 가격에서 주행거리 마일당 0.25달러를 차감하고, 차량 마모 상태 및 자사 중고차 기준에 맞추기 위한 비용까지 반영해 가격을 산정한다. 테슬라가 매입을 거부하더라도 외부 판매에는 별도의 승인 절차가 필요하다. 이 같은 정책은 과거에도 시도된 바 있다. 테슬라는 2023년 말 사이버트럭 출시 당시 유사한 되팔기 제한 조항을 도입했지만, 공급이 늘고 프리미엄이 줄어들면서 논란 끝에 정책을 철회한 바 있다. 다만 외신은 이번에는 생산 물량이 제한된 만큼 희소성 근거가 더 강하다는 점에서 정책 유지 가능성에 관심이 쏠린다고 보도했다. 또한 실제로 계약 조항이 엄격하게 집행될지는 미지수라고도 봤다. 외신은 법적 분쟁보다는 향후 한정판 구매 기회 제한 등 비공식적 제재가 더 현실적인 수단이 될 수 있다고 분석했다.

2026.04.17 23:57안희정 기자

[유미's 픽] "연산보다 메모리"…구글 '터보퀀트' 등장에 엔비디아도 '긴장'

구글이 생성형 인공지능(AI) 운영의 핵심 병목으로 꼽혀온 '메모리 문제'를 소프트웨어 방식으로 풀어내는 기술을 공개하면서 AI 인프라 경쟁의 방향이 바뀌고 있다. 모델 규모 확대 중심이던 기존 경쟁 구도가 실행 효율과 메모리 최적화 중심으로 이동하고 있다는 분석이 나온다. 27일 업계에 따르면 최근 대규모언어모델(LLM) 운영에서는 연산 성능보다 메모리 처리 효율이 전체 성능을 좌우하는 사례가 늘고 있다. LLM은 답변 생성 과정에서 이전 정보를 반복적으로 참조하는 구조를 갖고 있어 데이터 접근 과정에서 발생하는 지연이 속도와 비용을 동시에 제한하는 요인으로 작용한다. 현재 엔비디아 H100 등 최신 그래픽처리장치(GPU) 도입으로 연산 성능은 크게 향상됐지만, 메모리 대역폭과 데이터 이동 효율은 상대적으로 제한돼 있다. 실제 서비스 환경에서는 GPU 연산보다 메모리 접근이 병목으로 작용하는 경우가 적지 않다. 이 같은 흐름 속에서 AI 추론 시스템을 구성하는 기술 구조에 대한 이해도 중요해지고 있다. AI 추론은 모델, 메모리 구조, 실행 소프트웨어, 하드웨어가 단계적으로 결합된 형태로 작동한다. 우선 모델은 연산 과정에서 생성된 정보를 메모리에 저장하고 이를 반복적으로 참조한다. 이 과정에서 메모리 사용량이 급격히 증가하며 병목이 발생한다. 이를 해결하기 위한 접근이 메모리 압축 기술로, 데이터 표현을 줄이는 양자화(Quantization) 방식과 데이터 구조를 효율적으로 인코딩하는 방식이 함께 발전하고 있다. 이 가운데 구글이 지난 24일 공개한 터보퀀트(TurboQuant)는 데이터 표현 방식을 재구성하는 양자화 기반 접근으로, 메모리 사용량을 줄이면서도 정확도를 유지하는 데 초점을 맞춘 기술로 평가받는다. 엔비디아 역시 같은 문제를 두고 다른 접근을 시도하고 있다. 특히 최근에는 KV 캐시를 효율적으로 저장하기 위한 'KV 캐시 트랜스폼 코딩(KV Cache Transform Coding)' 기반 기술을 앞세우고 있다. 이는 데이터를 단순히 제거하는 방식이 아닌, 정보 구조를 효율적으로 인코딩해 저장 효율을 높이는 접근에 가깝다. 다만 모델별 특성에 맞춘 보정 과정이 필요하다는 점에서 적용 방식에는 차이가 있다. 두 기술 모두 메모리 압축을 목표로 하지만 접근 방식에는 차이가 있다. 터보퀀트가 양자화를 기반으로 정확도 손실을 최소화하는 데 초점을 둔 반면, KV 캐시 트랜스폼 코딩은 인코딩 효율을 높여 압축률을 끌어올리는 기술로 분석된다. 두 기술은 기존 메모리 최적화 기술의 연장선에선 의미 있는 진전으로 평가된다. KV 캐시의 정밀도를 낮추는 양자화 기법은 GPTQ, AWQ 등 오픈소스 진영과 스타트업을 중심으로 확산돼 왔고, 중요도가 낮은 토큰을 선택적으로 제거하는 방식이나 슬라이딩 윈도우 기반 메모리 관리 기법도 일부 모델에 적용돼 왔다. 또 메모리 접근을 줄이는 어텐션 최적화 기술은 데이터 전송 횟수를 줄여 속도를 높이는 플래시어텐션(FlashAttention) 등으로 발전하며 주요 AI 기업과 연구 커뮤니티에서 활용되고 있다. 업계 관계자는 "양자화나 토큰 프루닝 같은 기법은 이미 널리 쓰이고 있지만, 실제 서비스에서는 정확도나 안정성 문제 때문에 적용 범위가 제한적인 경우가 많다"며 "KV 캐시 자체를 압축 대상으로 삼는 접근은 구현 난이도는 높지만, 제대로 적용되면 체감 성능을 크게 바꿀 수 있는 영역"이라고 밝혔다. 메모리 압축과 더불어 모델 실행 방식 자체를 개선하려는 소프트웨어 경쟁도 확대되고 있다. vLLM, 텐서RT-LLM(TensorRT-LLM)을 비롯해 라마(llama.cpp) 등 다양한 추론 엔진들이 등장하며 요청 처리 방식과 메모리 관리 효율을 높이는 방향으로 발전하고 있다. 특히 vLLM은 미국 UC버클리 연구진이 주도해 개발한 오픈소스 추론 엔진으로, 요청을 효율적으로 묶어 처리하고 페이지드어텐션(PagedAttention) 구조를 통해 메모리를 동적으로 관리하는 방식으로 처리 효율을 높인다. 엔비디아가 개발한 텐서RT-LLM(TensorRT-LLM) 역시 GPU 연산을 최적화해 추론 속도를 개선하는 소프트웨어로, 데이터센터 환경에서 널리 활용되고 있다. 추론 엔진은 모델 자체를 변경하지 않고도 실행 방식만으로 성능을 개선할 수 있다. 동일한 모델이라도 어떤 실행 소프트웨어를 사용하느냐에 따라 처리 속도와 비용이 달라지는 구조다. 업계 관계자는 "같은 모델이라도 vLLM이나 텐서RT 같은 추론 엔진 설정에 따라 처리량 차이가 크게 난다"며 "실제 서비스에서는 모델보다 실행 스택이 성능을 좌우하는 경우도 적지 않다"고 설명했다. 메모리 압축 기술과 추론 엔진이 결합된 뒤 최종 연산은 GPU에서 수행된다. 특히 최신 GPU 환경에서는 연산 성능보다 메모리 활용 효율이 전체 성능을 좌우하는 경우가 많아지면서 소프트웨어 기반 최적화의 중요성이 더욱 커지고 있다. 이와 함께 AI 경쟁의 방향도 변화하고 있다. 그동안 생성형 AI는 더 많은 데이터를 학습하고 더 큰 모델을 구축하는 데 집중해 왔지만, 최근에는 동일한 모델을 얼마나 빠르고 비용 효율적으로 운영할 수 있는지가 핵심 경쟁력으로 부상하고 있다. 업계 관계자는 "대규모 서비스에서는 모델 성능보다 추론 효율이 비용 구조를 좌우하는 경우가 더 많다"며 "메모리 구조와 추론 엔진을 함께 최적화하지 않으면 GPU를 늘려도 수익성을 맞추기 어려운 단계에 들어섰다"고 말했다.

2026.03.27 12:11장유미 기자

[유미's 픽] "해외선 '통제'가 핵심"…독자 AI 기준 두고 국내선 '온도차'

최근 1차 평가 결과 발표 후 '독자 인공지능(AI) 파운데이션 모델(K-AI)' 사업을 둘러싼 논란이 해외 소버린 AI 논의와 대비되며 확산되고 있다. 우리나라는 '프롬 스크래치(from scratch)' 여부와 가중치 주권 등 기술적 독자성 기준을 둘러싸고 공방이 지속되고 있는 반면, 해외 주요국은 데이터 통제와 운용 주권을 중심으로 소버린 AI 전략을 전개하고 있다는 점에서 대조적인 모습을 보이고 있다. 20일 업계에 따르면 과학기술정보통신부가 지난 15일 'K-AI' 1차 평가 결과를 발표한 이후 ▲독자 AI모델과 해외 모델의 유사성 ▲외부 가중치 활용 범위 ▲독자성 판단 기준 등을 둘러싼 논쟁이 국내에서 불거졌다. 특히 네이버클라우드, NC AI가 1차 평가에서 탈락하면서 성능 경쟁을 넘어 '어디까지를 독자 AI로 볼 것인가'를 둘러싼 정책·기술적 논의가 본격화됐다는 평가가 나온다. 이번 논란은 특정 기업의 성패를 넘어 한국 독자 AI 정책이 해외 소버린 AI 사례와 비교해 기술적 출발점과 설계 주체성에 과도하게 초점을 맞췄기 때문으로 분석된다. 해외에선 '누가 통제하고 어디서 운용하느냐'를 주권의 핵심으로 삼는 반면, 한국은 '직접 만들었는가'를 기준으로 삼으면서 논쟁의 강도가 커진 것으로 보인다. 이는 해외 주요국의 소버린 AI 접근 방식과 비교하면 차이가 더욱 두드러진다. 우선 유럽연합(EU)은 미국 빅테크 의존을 줄이기 위해 데이터 주권과 규제(AI Act)를 중심으로 전략을 전개하고 있다. 또 오픈소스 모델을 활용하더라도 유럽 내 인프라에서 통제 가능하고 법·가치 체계에 부합한다면 주권을 확보한 것으로 보는 경향이 강하다. 일본은 자국어 특화 대형언어모델(LLM) 개발을 지원하는 한편, 글로벌 기업과의 협력을 통한 인프라 구축을 병행하는 전략을 택하고 있다. 인도, 아랍에미리트(UAE)는 한국처럼 미국·중국에 대한 기술 종속을 경계하면서도 독자성을 정의하는 방식에서 보다 유연하고 실용적인 접근을 취하고 있다. 특히 인도는 정부가 단일 '국가대표 모델'을 직접 설계하기보다 여러 민간 기업을 선정해 자국 언어와 산업 환경에 특화된 파운데이션 모델 개발을 지원하는 방식에 방점을 찍고 있다. 수십 개의 공용어와 복잡한 산업 구조를 가진 인도에서는 '밑바닥부터 코드를 만들었는지'가 아닌 인도어 데이터와 현지 산업 맥락을 얼마나 효과적으로 반영했는지가 독자성의 핵심 기준으로 작용한다. 또 해외 모델을 활용하더라도 인도의 언어·데이터로 재학습하고 실사용 가능한 형태로 고도화한다면 소버린 AI의 일환으로 인정하는 구조다. 이는 기술적 혈통보다는 데이터 주권과 현지 적합성을 중시하는 분위기다. UAE는 오픈소스를 통한 글로벌 주도권 전략으로 주목받고 있다. 이곳은 정부 산하 기술혁신연구소(TII)가 개발한 '팔콘(Falcon)' 시리즈 모델을 오픈소스로 공개해 전 세계 개발자들이 이를 개선·확장하도록 유도하고 있다. 이를 통해 팔콘은 사실상 글로벌 기술 표준 중 하나로 자리 잡게 됐다. 또 최근에는 중국 모델 '큐원(Qwen)' 등 외부 오픈 웨이트 모델을 참고해 성능을 보완한 모델도 공개하며 기술적 순수성보다 실용성과 확장성을 강조하는 전략을 이어가고 있다. 이는 기술적 순수성보다 확산성과 영향력을 주권의 요소로 보는 UAE식 접근을 보여준 것으로 평가받는다. 반면 한국의 소버린 AI 논쟁은 모델 개발의 출발점과 내부 구조에 대한 기술적 독자성으로 집중되고 있다. 앞서 정부는 공모 단계에서 해외 AI 모델을 단순 미세조정(fine-tuning)한 파생형 모델은 독자 AI로 인정하지 않겠다는 원칙을 제시한 바 있다. 또 이번 1차 평가에서는 사전학습(pre-training) 단계에서 핵심 가중치를 자체적으로 학습·갱신했는지 여부가 주요 판단 기준으로 적용된 것으로 알려졌다.이를 두고 일각에선 가중치 초기화 여부만으로 독자성을 단정하기는 어렵다고 지적했다. 토크나이저 설계, 학습 데이터 구성, 모델 아키텍처 변형 여부 등 복합적인 요소가 함께 고려돼야 하지만, 정부가 이를 제대로 반영했는지에 대해 의구심을 드러냈다. 이 과정에서 성능보다는 학습의 출발점과 가중치 통제 여부가 평가의 핵심 변수로 작용했다는 의견도 제기됐다. 업계에선 글로벌 오픈소스 생태계 활용이 일반화된 상황 속에 정부가 외부 모델 활용의 허용 범위와 독자성 기준을 사전에 충분히 공유하지 않았다는 점이 논쟁을 키웠다고 보고 있다. 업계 관계자는 "독자성이 곧 '모든 것을 혼자 만드는 것'을 의미하는 것은 아니다"며 "외부 기술을 활용하더라도 이를 통제하고 개조하며 장기적으로 유지할 수 있는 역량 역시 주권의 중요한 요소"라고 짚었다. 이어 "데이터의 질과 현지 최적화, 글로벌 생태계와의 호흡이 기술적 혈통 못지않게 중요해지고 있다"고 지적했다. 이와 함께 과기정통부의 역할에 대한 요구도 커지고 있다. 정부가 가중치 초기화 여부, 사전학습 수행 범위, 컴포넌트별 오픈소스 허용 기준 등을 보다 명확히 제시해 독자성 판단의 불확실성을 줄여야 한다고 봐서다. 또 기술적 순수성 중심의 단일 기준에서 벗어나, 실질적 통제 가능성과 활용도를 함께 평가하는 다층적 기준이 필요하다는 의견도 제기된다. 업계 관계자는 "이번 논쟁이 특정 기업의 탈락 여부를 넘어 한국이 AI 주권을 어떤 기준으로 정의하고 확보할 것인지에 대한 시험대가 되고 있다"며 "정부가 단순한 예산 집행자를 넘어 인도, UAE 처럼 유연하면서도 현실적인 방향성을 제시할 수 있을지가 향후 독자 AI 정책의 성패를 가를 핵심 변수가 될 것"이라고 전망했다.

2026.01.20 10:01장유미 기자

[유미's 픽] 고석현發中 모델 의혹에 정부도 '움찔'…국가대표 AI 개발 경로까지 본다

정부가 독자 인공지능(AI) 파운데이션 모델 프로젝트 정예 5개 팀을 대상으로 최종 모델뿐 아니라 복수의 중간 학습 기록까지 제출받아 검증하기로 하면서 국가 AI 사업의 평가 기준이 성능 경쟁에서 개발 경로 검증 중심으로 전환되고 있다. 업스테이지의 '솔라 오픈 100B'를 둘러싼 모델 유사성 논란을 계기로, 정부가 '프롬 스크래치(from scratch)' 여부를 기술적으로 입증하는 체계를 본격화했다는 해석이 나온다. 4일 과학기술정보통신부에 따르면 정부는 다음 주부터 평가를 진행해 오는 15일께 독자 AI 파운데이션 모델 프로젝트 정예 5개 팀 중 한 팀을 탈락시킨다. 이번 평가에서는 모든 팀으로부터 최종 모델 파일과 함께 복수의 중간 체크포인트(checkpoint)를 제출받아 전문기관인 한국정보통신기술협회(TTA)를 통해 면밀한 기술 검증을 실시할 예정이다. 중간 체크포인트는 AI 모델이 학습 과정에서 일정 단계마다 저장한 가중치 상태로 ▲모델이 랜덤 초기화에서 출발했는지 ▲학습이 연속적인 경로를 거쳤는지 ▲외부 모델 가중치가 중간에 유입됐는지 여부를 사후적으로 확인할 수 있는 핵심 자료다. 단일 최종 결과물만으로는 확인하기 어려웠던 개발 이력을 추적할 수 있다는 점에서 업계에선 이번 방침을 프롬 스크래치 주장에 대한 증빙 책임을 제도화한 조치로 보고 있다.배경훈 과학기술정보통신부 부총리 겸 장관은 "평가 과정에서 모든 정예팀으로부터 개발 모델의 최종 파일과 복수의 중간 체크포인트 파일 등을 제출받아 검증할 예정"이라며 "전문가 평가위원회를 통해서도 같은 자료를 바탕으로 계획에 부합한 AI 모델이 개발됐는지 여부를 검증해 확인할 것"이라고 설명했다. 정부가 이처럼 나선 것은 고석현 사이오닉에이아이 대표가 지난 1일 업스테이지의 독자 AI 프로젝트 모델 '솔라 오픈 100B'가 중국 AI를 도용·파생했다는 의혹을 제기한 것이 계기가 됐다. 고 대표는 '솔라 오픈 100B'의 기술 분석 자료를 공개하고 중국 지푸AI의 'GLM-4.5-에어' 모델에 기반을 둔 파생 모델이라고 의혹을 제기했다. 또 정부가 독자 AI 프로젝트의 참여 조건으로 제시한 프롬 스크래치(처음부터 만드는 것) 방식으로 학습된 모델이라면 나타나기 어려운 유사도라고 강조했다.이에 업스테이지는 곧바로 다음날 서울 강남역 인근에서 기술 공개 검증 행사를 열어 단순 레이어 유사성만으로 모델 파생 여부를 단정하는 것은 무리가 있다고 반박했다. 김성훈 업스테이지 대표는 "학습된 다른 모델의 가중치를 그대로 가져왔다면 프롬 스크래치가 아니지만, 모델 아이디어나 인퍼런스 코드 스타일을 참조하는 건 허용된다"며 "오픈소스 생태계에서 모델이 상호 호환되려면 구조가 비슷해야 한다"고 주장했다. 이후 문제를 제기한 고 대표는 또 다른 게시물을 통해 "상이한 모델도 레이어 값에선 높은 유사도를 보일 수 있다고 본다"면서도 "중국 모델 코드와 구조를 잘 학습하는 게 국가적인 AI 사업의 방향으로 타당한지는 의문"이라고 재차 문제를 제기했다. 이를 두고 업계에선 고 대표가 제시한 분석이 기술적으로 성립하기 어렵다는 점을 지적하며 전반적으로 업스테이지의 손을 들어줬다. 고 대표 역시 이날 또 다시 입장문을 통해 자신의 분석 방법에 한계가 있었음을 인정하며 "해당 근거를 보다 엄밀하게 검증하지 않은 채 공개함으로써 불필요한 혼란과 논란을 야기했다"고 사과했다. 그러나 고 대표는 이번 사안을 단순한 기술적 도용 논쟁이 아니라 '소버린 AI'와 '독자 파운데이션 모델'의 기준을 어떻게 정의할 것인가에 대한 구조적 질문으로 봐야 한다는 입장은 여전히 유지했다. 해외 모델의 코드나 구조를 참고·학습하는 방식이 국가 주도 독자 AI 사업의 취지에 부합하는지, 독자성을 판단하는 기준이 기술·학술적으로 얼마나 명확히 정리돼 있는지에 대한 논의가 필요하다고도 주장했다. 일각에선 고 대표의 초기 문제 제기 방식에 대해선 비판적인 태도를 보였으나, 이번 논쟁을 통해 독자 AI 모델의 개발 경로, 외부 레퍼런스 활용 범위, 학습 과정 공개 수준 등에 대한 사회적 합의 필요성이 수면 위로 떠올랐다는 점에 대해선 긍정적으로 봤다. 업계 관계자는 "이번 논란은 누가 옳고 그르냐를 가르는 사건이라기보다 한국형 파운데이션 모델을 어떤 기준으로 검증하고 설명해야 하는지를 집단적으로 학습한 과정에 가깝다"며 "검증 로그 공개, 체크포인트 관리, 참고 문헌 표기 같은 관행이 정착되는 계기가 될 수 있다"고 말했다. 또 다른 관계자는 "(고 대표가) 의혹을 제기하는 과정에서는 분명히 성급했던 부분이 있었지만, 사과와 인정이 공개적으로 이뤄졌다는 점 자체가 국내 AI 생태계의 성숙도를 보여주는 장면"이라며 "장기적으로는 정부 프로젝트 전반의 신뢰성을 높이는 방향으로 이어질 가능성이 크다"고 평가했다.정부 역시 이번 사안을 계기로 독자 AI 파운데이션 모델 프로젝트의 평가 기준을 보다 구체화해야 한다는 과제를 안게 됐다. 성능 중심 평가를 넘어 학습 경로의 투명성, 외부 기술 활용에 대한 명확한 가이드라인, 검증 가능한 공개 방식 등이 제도적으로 보완될 필요가 있다는 지적이다.이번 일에 대해 배 부총리는 긍정적으로 평가하며 독자 AI 파운데이션 모델의 검증 체계를 보완해야 할 필요성을 언급했다. 또 이번 사안을 계기로 정부가 정의한 '독자 AI 파운데이션 모델'을 어떻게 기술적으로 검증할 것인가에 대해서도 고민하는 모습을 보였다. 그는 지난 3일 자신의 소셜 미디어(SNS)를 통해 "데이터 기반의 분석과 이에 대해 공개 검증으로 답하는 기업의 모습은 우리 AI 생태계가 이미 글로벌 수준의 자정 작용과 기술적 투명성을 갖추고 있음을 보여준다"며 "성장통 없는 혁신은 없다"고 밝혔다. 이어 "의혹 제기는 할 수 있는 것"이라며 "이를 공개 검증으로 증명한 기업과 인정하고 사과한 문제 제기자 모두에게 감사하다"고 덧붙였다.국가AI전략위원회 관계자들도 이번 일에 대해 긍정적으로 평가했다. 박태웅 국가AI전략위원회 공공 AX 분과장은 "순식간에 다양한 검증과 토론이 이뤄지는 과정을 통해 한국 AI 생태계의 저력을 확인했다"고 말했다. 임문영 국가AI전략위원회 부위원장 역시 "검증 논란을 통해 방법의 한계와 개선점이 드러났고, 이는 AI 생태계가 건강하게 작동하고 있음을 보여준다"고 밝혔다.조준희 국가AI전략위원회 산업 AX·생태계 분과장도 최근 독자 파운데이션 모델의 유사성 논란이 건강한 기술 토론으로 이어진 점을 매우 고무적이라고 평가했다. 그러면서도 이제는 기술의 원천에 대한 논쟁을 넘어 '우리 모델이 글로벌 빅테크 대비 어떠한 차별적 경쟁력을 갖출 것인가'라는 소비자 관점의 본질에 집중해야 한다는 점도 강조했다. 그는 "'독자 기술'이라는 명분에만 함몰되면 정작 사용성이 뒤처져 시장에서 외면 받는 결과를 초래할 수 있다"며 "모델의 성패가 사용자의 선택에 달려 있다"고 밝혔다. 이어 "국내 모델이 지속 가능한 선순환 구조를 만들려면 적시성 있는 답변과 높은 활용도 등 철저히 고객 친화적 개발 방향을 견지해야 할 것"이라며 "5개 컨소시엄들이 이 기술을 어떻게 '잘 팔리는 서비스'와 '매력적인 상품'으로 연결할지 치열하게 고민해야 할 시점"이라고 덧붙였다. 다만 일각에선 정부가 '프롬 스크래치'를 어디까지 허용할 것인지에 대한 세부 기술 기준을 공식 문서로 명시하진 않았다는 점에서 여전히 우려를 나타냈다. 오픈소스 아키텍처 활용 범위, 구조적 유사성의 허용선, 토크나이저 재사용 여부 등은 여전히 정책적 해석의 영역으로 남아 있어서다. 업계에선 이번 정부 방침을 독자 AI 평가가 '결과물 중심'에서 '개발 경로와 증빙 책임 중심'으로 이동하고 있음을 보여주는 신호로 받아들이는 분위기다. 성능 지표만으로는 설명할 수 없는 '독자성'을 앞으로 학습 이력과 로그로 입증해야 하는 단계에 들어섰다는 점에서 고무적으로 평가했다. 업계 관계자는 "이번 논란은 누가 맞고 틀렸는지를 가리는 사건이라기보다 한국 AI 생태계가 공개 검증과 공개 토론을 감당할 수 있는 단계에 들어섰음을 보여준 사례"라며 "이 경험이 제도와 기준으로 남는다면 독자 AI를 둘러싼 논쟁은 반복되지 않을 것"이라고 말했다. 배 부총리는 "지금의 논쟁은 대한민국 AI가 더 높이 도약하기 위해 반드시 거쳐야 할 과정"이라며 "정부는 공정한 심판이자 든든한 페이스메이커로서 우리 AI 생태계가 성숙하게 발전할 수 있도록 역할을 다하겠다"고 밝혔다.

2026.01.04 06:00장유미 기자

[유미's 픽] 뿔난 업스테이지, '솔라 오픈 100B' 中 모델 파생 의혹에 공개 검증 '맞불'

정부에서 추진 중인 '독자 인공지능(AI) 파운데이션 모델 프로젝트'에 참가한 업스테이지가 첫 성과를 공개한 후 중국 모델을 복사해 미세 조정한 결과물로 추정되는 모델을 제출했다는 의혹에 휩싸였다. 업스테이지는 억울함을 표하며 모델 공개 검증 행사와 함께 향후 의혹 제기에 대해 강경 대응에 나설 것을 시사했다. 1일 업계에 따르면 고석현 사이오닉에이아이 대표는 이날 자신의 소셜 미디어(SNS)에 깃허브 리포트를 게재하며 업스테이지 '솔라 오픈 100B'가 중국 지푸(Zhipu) AI의 'GLM-4.5-에어'에서 파생된 모델이라고 주장했다. 고 대표는 "국민 세금이 투입된 프로젝트에서 중국 모델을 복사해 미세 조정한 결과물로 추정되는 모델이 제출됐다"며 "상당히 큰 유감"이라고 말했다. 이번 논란은 이날 오후 1시께 올라온 깃허브 리포트가 발단이 됐다. 이 리포트는 '솔라 오픈 100B'와 'GLM-4.5-에어'의 가중치 구조를 통계적으로 비교 분석한 결과를 담고 있다. 앞서 업스테이지는 지난 달 30일 독자 파운데이션 모델 '솔라 오픈 100B'를 LM 아레나 방식으로 해외 유명 모델들과 비교해 공개하며 '프롬 스크래치(From Scratch)'를 기반으로 개발했다고 소개했다. 프롬 스크래치는 AI 모델을 처음부터 직접 개발한다는 뜻으로, 데이터 수집과 모델 아키텍처 설계, 학습, 튜닝까지 모든 것을 자체적으로 수행하는 방식이다. 하지만 리포트 작성자는 '솔라 오픈 100B'와 'GLM-4.5-에어' 두 모델의 레이어별 파라미터 유사도를 측정한 결과 일부 계층에서 매우 높은 수준의 유사성이 관측됐다고 설명했다. 또 동일 모델 내부 레이어 비교보다 솔라와 GLM 간 동일 레이어 비교에서 더 높은 유사도가 나타났다고 주장하며, 이를 근거로 솔라 오픈 100B가 GLM-4.5-에어에서 파생됐다고 결론 내렸다. 다만 일각에서는 해당 분석이 두 모델의 학습 과정이나 개발 경로를 직접 확인한 것이 아니라는 점에서 해석에 신중할 필요가 있다는 지적이 나온다. 공개된 모델 가중치를 기반으로 한 사후적 통계 비교 방식으로 진행된 데다 실제 학습에 사용된 데이터셋, 학습 로그, 내부 코드베이스 등은 검증 대상에 포함되지 않았기 때문이다. 특정 가중치가 그대로 복사됐거나 모델 바이너리 차원에서 직접적인 공유가 있었다는 증거 역시 이번에 제시되지 않았다. 이 같은 의혹 제기에 대해 업스테이지는 즉각 반박에 나섰다. 고 대표가 게시물을 올린 지 2시간 후 김성훈 업스테이지 대표는 자신의 페이스북을 통해 "솔라 오픈 100B가 중국 모델을 복사해 미세 조정한 결과물이라는 주장은 사실과 다르다"며 "해당 모델은 명백히 프롬 스크래치 방식으로 학습됐다"고 강조했다. 그러면서 김 대표는 오는 2일 오후 3시 서울 강남역 부근에서 솔라 오픈 100B의 개발 과정을 공개적으로 검증받겠다고 밝혔다. 이 자리에는 의혹을 제기한 고석현 대표를 포함해 추가 검증에 참여하고 싶은 업계 및 정부 관계자들을 초청할 계획이다. 또 업스테이지 측은 이후에도 이 같은 의혹이 제기될 경우 더 강경하게 대응할지에 대해서도 내부 검토에 착수했다. 김 대표는 "학습에 사용한 중간 체크포인트(checkpoint)와 AI 모델 학습 과정과 실험 결과를 기록·관리하는 도구인 '웨이츠 앤 바이어시스(Weights & Biases·wandb)'를 모두 공개할 예정"이라며 "명확한 검증 절차를 공개해 사실 관계를 바로잡도록 할 것"이라고 말했다. 업계에서는 이번 공개 검증이 논란의 분수령이 될 수 있다는 평가를 내놨다. 실제 학습 체크포인트와 로그가 공개될 경우 '솔라 오픈 100B'가 특정 시점에서 외부 모델을 기반으로 파인튜닝됐는지, 독립적인 학습 경로를 거쳤는지를 보다 명확히 확인할 수 있기 때문이다. 동시에 통계적 유사성만으로 모델 복제 여부를 단정하기는 어렵다는 신중론도 제기된다. 대규모 언어모델 개발 과정에서는 유사한 아키텍처와 데이터, 학습 레시피를 사용할 경우 높은 유사도가 나타날 수 있어서다. 또 지식 증류(distillation)나 합성 데이터 활용 여부에 따라 통계적 패턴이 겹칠 가능성도 존재한다는 지적도 나온다. 업계 관계자는 "이번 논란이 주목받는 이유는 해당 모델이 정부 예산이 투입되는 '독자 AI 파운데이션 모델 프로젝트'의 결과물이기 때문"이라며 "사업 취지상 해외 모델에 대한 기술적 의존 여부와 개발 과정의 투명성은 핵심적인 검증 대상이 될 수밖에 없다"고 설명했다. 그러면서 "결국 이번 사안의 핵심은 통계 분석을 둘러싼 해석 논쟁을 넘어 실제 개발 과정에 대한 객관적 검증으로 옮겨가고 있다"며 "업스테이지가 예고한 공개 검증을 통해 솔라 오픈 100B의 학습 경로와 독립성이 어느 수준까지 입증될지에 많은 관심이 쏠리고 있다"고 덧붙였다.또 다른 관계자는 "이번 논란이 특정 기업의 문제를 넘어 독자 AI 파운데이션 모델 사업 전반의 검증 기준을 끌어올리는 계기가 될 수 있다"며 "다른 참여 기업들 역시 향후 모델 공개 과정에서 학습 출처와 개발 경로에 대한 설명 책임이 더 커질 가능성이 있다"고 말했다.

2026.01.01 18:09장유미 기자

[유미's 픽] "주사위는 던져졌다"…국대 AI 첫 탈락자, 1차 발표회서 판가름?

우리나라를 대표할 인공지능(AI) 모델을 선발하는 정부 사업 '독자 AI 파운데이션 모델 프로젝트'의 첫 결과물이 공개된 가운데 어떤 기업이 이번 심사에서 살아남을지 관심이 집중된다. 각 사업자들이 내세운 모델의 성과가 달라 정부가 심사기준을 어떻게 세웠을지도 관심사다. 31일 업계에 따르면 네이버, LG AI연구원, SK텔레콤은 AI 임원, NC AI와 업스테이지는 대표가 지난 30일 오후 2시부터 서울 강남구 코엑스에서 개최된 독자 AI 파운데이션 모델 프로젝트 1차 발표회에 참여했다. 발표는 네이버를 시작으로 NC AI, 업스테이지, SK텔레콤, LG AI연구원 순서로 진행됐다. 독자 AI 파운데이션 모델 프로젝트는 그래픽처리장치(GPU)와 데이터 등 자원을 집중 지원해 국가 대표 AI 모델을 확보하는 정부 사업이다. 과학기술정보통신부는 이번 발표를 기반으로 심사를 통해 내년 1월 15일 1개 팀을 탈락시키고, 이후에도 6개월마다 평가를 거쳐 2027년에 최종 2개 팀을 선정한다. 모델 성과 제각각…정부 심사 기준이 관건 이번 심사에선 각 팀이 주어진 공통 과제를 얼마나 잘 수행했는지, 각자 제시한 목표대로 성과를 냈는지가 관건이다. 모든 팀은 최근 6개월 내 공개된 글로벌 최고 모델 대비 95% 이상의 성능을 달성해야 하는 과제가 주어진 상태다.지난 8월 정예팀으로 선정된 지 4개월만에 첫 성과를 공개해야 하는 만큼, 개발 시간이 부족한 상황에서 각자 기술력을 얼마나 끌어올렸을지도 관심사다. 각 팀의 GPU 지원 여부, 지원 받은 시기 등이 각각 달랐다는 점에서 정부가 이를 심사 시 고려할 지도 주목된다. 이번 프로젝트를 위해 SK텔레콤과 네이버클라우드는 정부에게 GPU를 임대해주고 있다. 이 탓에 두 업체는 올해 '독자 AI 파운데이션 모델 프로젝트' 진행 시 정부로부터 GPU를 지원 받지 못했다. SK텔레콤은 엔비디아의 B200 칩 1천24장을 업스테이지와 LG AI연구원에, 네이버클라우드는 H200 칩 1천24장을 NC AI에 지원하고 있다. 이 탓에 GPU가 각 업체에 지원된 시기는 다 달랐다. 업계에선 정부가 어떤 기준을 세울지에 따라 각 팀의 승패가 갈릴 것으로 봤다. 정부는 그간 5개팀과 여러 차례 만나 평가 기준에 대해 논의 후 이달 중순께 합의를 보고 공지했으나, 어떤 팀이 탈락할 지에 따라 여전히 논란의 불씨가 많은 것으로 알려졌다. 업계 관계자는 "당초 5개 팀이 선정될 당시 정부에 제시했던 목표치를 달성했는지가 가장 중요할 것"이라며 "각 팀이 목표로 하고 있는 모델의 크기, 성능, 활용성이 제각각인 만큼 목표 달성률을 가장 중요한 기준치로 삼아야 할 것"이라고 강조했다. 이어 "벤치마크를 활용한다는 얘기가 있지만 모델 크기가 클수록 다운로드 수 측면에서 불리할 수 있어 이를 객관적 기준으로 삼기에는 다소 무리가 있을 수 있다"며 "5개 팀과 정부가 어떤 기준에 대해 합의를 했는지, 어떤 전문가를 앞세워 심사에 나설지도 주목해야 할 부분"이라고 덧붙였다. 5개 팀 첫 성과 공개…프롬 스크래치·모델 크기·활용성 주목 이번 1차 결과 공개에서 가장 주목 받는 곳은 업스테이지다. 대기업 경쟁자들 사이에서 짧은 시간 내 '프롬 스크래치(From Scratch)'를 기반으로 가성비 최고 수준인 모델을 완성도 높게 공개했다는 점에서 많은 이들의 호응을 얻었다. 프롬 스크래치는 AI 모델을 처음부터 직접 개발한다는 뜻으로, 데이터 수집과 모델 아키텍처 설계, 학습, 튜닝까지 모든 것을 자체적으로 수행하는 방식이다. 이 개념은 거대언어모델(LLM) 개발 때 많이 언급되며 아무 것도 없는 상태에서 모델을 직접 설계하고 데이터를 수집 및 전처리해 학습시킨다는 점에서 이를 통해 AI 모델을 선보일 경우 기술력이 상당히 높다고 평가를 받는다. 오픈AI의 'GPT-4'나 구글 '제미나이', 메타 '라마', 앤트로픽 '클로드' 등이 여기에 속한다. 업스테이지는 이날 독자 파운데이션 모델 '솔라 오픈 100B'를 LM 아레나 방식으로 해외 유명 모델들과 비교해 공개하며 자신감을 표출했다. 특히 발표에 직접 나선 김성훈 대표가 '솔라 오픈 100B'를 개발하게 된 과정을 스토리텔링 형식으로 발표해 호응을 얻기도 했다. 김 대표는 향후 200B, 300B 모델과 함께 멀티모달 모델도 선보일 예정이다.업계 관계자는 "김 대표가 발표 때 딥 리서치나 슬라이드 제작 등 코딩 외에 실제로 현장에서 많이 써봤을 것 같은 서비스를 직접 라이브 데모로 보여준 부분이 인상적이었다"며 "504장의 B200 GPU로 두 달 남짓 훈련한 것을 고려하면 모델 크기나 사용된 토큰수(추정)를 정말 빡빡하게 잘 쓴 게 아닌가 싶다"고 평가했다. 이승현 포티투마루 부사장은 "(업스테이지 발표 때) 솔라 프로가 'GPT-4o-미니'나 '파이-3 미디엄'보다 벤치마크가 높아 동급 사이즈에선 가장 우수하다고 했는데, 실제 가성비가 최고 수준인 것으로 보인다"며 "당장 기업들이 가져다 쓰기에도 좋을 것 같다"고 말했다. 이어 "그동안 업스테이지의 상징과도 같았던 DUS(구조 일부를 변경해 자체화한 AI 모델 개발 방식)를 넘어 프롬 스크래치로 모델을 개발했다는 점이 인상적"이라며 "기술 리포트가 없는 게 아쉽지만, 모델 카드에 프롬 스크래치를 기재한 것과 함께 API도 공개해 자신감을 드러낸 것이 국가대표로 내세우기 적합해 보였다"고 덧붙였다. 배경훈 과학기술정보통신부 부총리 겸 장관을 배출한 LG AI연구원도 이번 발표가 끝난 후 개발 중인 모델이 국가대표로 인정받기에 손색이 없다는 평가를 받았다. 이곳은 '엑사원 4.0' 아키텍처를 기반으로 파라미터 크기를 약 7배 키워 초기화한 상태에서 새로 학습시킨 'K-엑사원'을 이번에 공개했다. 'K-엑사원'은 매개변수 236B 규모의 프런티어급 모델이다. LG AI연구원에 따르면 'K-엑사원'은 개발 착수 5개월 만에 알리바바의 '큐웬3 235B'를 뛰어 넘고 오픈AI의 최신 오픈 웨이트 모델을 앞서 글로벌 빅테크 최신 모델과 경쟁할 수 있는 가능성을 입증했다. 글로벌 13개 공통 벤치마크 평균 성능 대비 104%를 확보했다는 점도 눈에 띄는 요소다. LG AI연구원은 "기존 엑사원 4.0 대비 효율성을 높이면서도 메모리 요구량과 연산량을 줄여 성능과 경제성을 동시에 확보했다"며 "특히 전문가 혼합 모델 구조(MoE)에 하이브리드 어텐션 기술을 더해 메모리 및 연산 부담을 70% 줄이고, 고가의 최신 인프라가 아닌 A100급 GPU 환경에서 구동할 수 있도록 했다"고 설명했다. 이곳은 향후 조 단위 파라미터 규모 글로벌 최상위 모델과 경쟁할 수 있도록 성능을 고도화한다는 계획이다. 또 글로벌 프론티어 AI 모델을 뛰어넘는 경쟁력을 확보해 한국을 AI 3강으로 이끌 것이란 포부도 드러냈다. 이번 발표를 두고 업계에선 LG AI연구원이 5개 팀 중 기술적인 내용이 가장 많이 들어있어 신뢰도가 높았다고 평가했다. 또 추론 강화를 위해 아키텍처를 변형하고 커리큘럼 러닝을 적용했다는 점에서 모델이 '프롬 스크래치'임을 명백히 보여줬다고 평가했다. 다만 동일 아키텍처인 32B 모델의 리포트와 가중치만 공개돼 있고, 이번 모델인 236B는 공개하지 않았다는 점은 아쉬운 대목으로 지적됐다. 업계 관계자는 "'K-엑사원'은 구조, 가중치가 완전 국산이란 점에서 통제권과 설명 가능성이 충분히 확보돼 있다고 보인다"며 "국방, 외교, 행정망 등 국가 핵심 인프라에 충분히 쓰일 수 있을 듯 하다"고 말했다. 그러면서도 "이번 발표에서 자체 MoE나 하이브리드 어텐션(hybrid attention, 효율·성능을 위해 다양한 어텐션 방식을 상황별로 혼합한 구조), 아가포(AGAPO, 어텐션·파라미터 사용을 입력에 따라 동적으로 조절하는 내부 최적화 기법) 같은 기술들에서 인상 깊은 것이 없다는 것은 아쉽다"며 "다음에는 실질적 효과에 대한 정량적 수치가 잘 기술되면 좋을 듯 하다"고 덧붙였다.이에 대해 LG AI연구원 관계자는 "모델 제출 마감이 이번 주까지여서 제출 시점에 236B 모델을 공개할 것"이라며 "이 때 테크 리포트로 세부 사항도 담을 예정"이라고 설명했다. SK텔레콤도 이번 발표에서 많은 이들의 주목을 받았다. 짧은 시간 안에 국내 최초로 매개변수 5천억 개(500B) 규모를 자랑하는 초거대 AI 모델 'A.X K1'을 공개했기 때문이다. 특히 모델 크기가 경쟁사보다 상당히 크다는 점에서 AI 에이전트 구동 등에서 유리한 고지에 있다는 일부 평가도 나오고 있다. SK텔레콤은 모델 크기가 성능과 비례하는 AI 분야에서 한국이 AI 3강에 진출하려면 500B 규모의 AI 모델이 필수적이란 점을 강조하며 톱2까지 오를 것이란 야심을 드러내고 있다. 또 SK텔레콤은 모두의 AI를 목표로 기업과 소비자간 거래(B2C)와 기업간거래(B2B)를 아우르는 AI 확산 역량도 강조했다. 여기에 SK하이닉스, SK이노베이션, SK AX 등 관계사와 협업으로 한국의 AI 전환에 이바지하겠다는 포부도 밝혔다. 다만 일각에선 프롬 스크래치로 모델을 개발했는지에 대한 의구심을 드러내고 있어 심사 시 이를 제대로 입증해야 할 것으로 보인다. SK텔레콤은 MoE 구조라고 강조했으나, 각 전문가 모델들이 자체 개발인지, 오픈소스 튜닝인지 밝히지 않아 궁금증을 더했다. 또 모델카드는 공개했으나, 테크니컬 리포트를 공개하지 않았다는 점도 의구심을 더했다. 이승현 포티투마루 부사장은 "MoE 구조를 독자 개발했다면 보통 자랑스럽게 논문을 내는 것이 일반적"이라며 "SKT가 'A.X 3.1(34B)'라는 준수한 프롬 스크래치 모델이 있으나, 이를 15개 정도 복제해 MoE 기술로 묶은 것을 이번에 'A.X K1'으로 내놓은 것이라면 혁신은 아니라고 보여진다"고 평가했다. 이어 "정량적 벤치마크보다 서비스 적용 사례 위주로 발표가 돼 기술적 성취보다 '서비스 운영 효율'에 방점이 찍힌 듯 했다"며 "SKT가 'A.X 3.1' 모델 카드에 프롬 스크래치를 분명히 명시했지만, 이번에는 명시하지 않아 소버린 모델로 활용할 수 있을지에 대해선 아직 판단이 이르다"고 덧붙였다. 이에 대해 SKT는 다소 억울해하는 눈치다. 프롬 스크래치로 개발을 한 사실이 명백한 만큼, 조만간 발표될 테크니컬 리포트를 통해 일각의 우려를 해소시킬 것이란 입장이다. SKT 관계자는 "모델 카드에 밝혔듯 A.X K1은 192개의 소형 전문가(expert)를 가지는 MoE 구조로, A.X 3.1 모델을 단순히 이어 붙여서 만들 수 없는 복잡한 구조인 만큼 처음부터 프롬 스크래치로 학습됐다"며 "관련 세부 내용은 이달 5일 전후 테크니컬 리포트를 통해서 공개할 예정"이라고 밝혔다. 업계 관계자는 "SKT가 500B 모델을 만든다는 것을 사전에 알고 우려가 많았지만, 다른 팀에 비해 성공적으로 압도적으로 큰 모델을 공개했다는 것 자체는 굉장히 인상적"이라며 "내년 상반기까지 정부에서 지원하는 GPU를 쓰지 않기 때문에 SKT가 얼마나 많은 GPU를 투입했는지 알 수는 없지만, 500B를 충분히 학습하기에는 (성능을 끌어 올리기에) 시간이 부족했을 것 같다"고 말했다. 그러면서도 "2T까지 만들겠다는 포부는 높이 평가한다"며 "성공적인 2T 모델이 나오기를 기대한다"고 부연했다. 네이버클라우드는 국내 최초 네이티브 옴니모달 구조를 적용한 파운데이션 모델 '하이퍼클로바 X 시드 8B 옴니'를 오픈소스로 공개하며 자신감을 드러냈다.이곳은 독자 AI 파운데이션 모델 전략 핵심으로 텍스트·이미지·음성을 통합한 '옴니 모델'을 제시했다. 옴니 모델은 텍스트, 이미지, 오디오, 비디오 등 다양한 데이터 형태를 하나의 모델에서 동시에 학습하고 추론하는 구조다. 사후적으로 기능을 결합하는 방식이 아닌, 처음부터 모든 감각을 하나의 모델로 공동 학습시키는 점이 기존 모델과의 차별점이다. 또 네이버클라우드는 기존 추론형 AI에 시각·음성·도구 활용 역량을 더한 고성능 추론모델 '하이퍼클로바 X 시드 32B 씽크'도 오픈소스로 공개했다. 이 모델은 올해 대학수학능력시험(수능) 문제를 풀이한 결과 국어·수학·영어·한국사 등 주요 과목에서 모두 1등급에 해당하는 성과를 거뒀다. 영어와 한국사에서는 만점을 기록했다. 네이버클라우드 성낙호 기술총괄은 "옴니 모델 기반 구조는 그래프·차트·이미지 등 시각 정보 해석에서 별도의 광학문자인식(OCR)이나 복수 모델 호출이 필요 없다"며 "개발과 운영 구조가 단순해지면서 구축 비용과 서비스 확장 부담도 크게 낮출 수 있다"고 강조했다. 업계에선 네이버클라우드의 발표를 두고 실제 '애니-투-애니(Any-to-Any) 모델'을 작은 사이즈로 공개한 부분에 대해 인상적이라고 평가했다. '애니-투-애니 모델'은 입력과 출력의 모달리티(형식)를 가리지 않고 어떤 조합이든 처리할 수 있는 멀티·옴니모달 모델이다. 또 유일하게 '덴스(Dense) 모델'을 썼다는 점도 주목을 받았다. '덴스 모델'은 모든 파라미터가 매번 계산에 참여하는 전통적인 모델 구조로, 어떤 것을 입력하든지 항상 같은 경로로 계산이 돼 지연 시간과 비용이 MoE에 비해 안정적이라고 평가된다. 이로 인해 네이버클라우드는 경쟁사들에 비해 전체 파라미터 수는 굉장히 작아 평가 시 다소 불리한 위치에 놓여 있다는 의견도 있다. 당초 1차 심사 때 14B를 선보일 것이라고 목표했던 것과 달리 모델 크기가 8B에 그쳤다는 점도 아쉬운 점으로 지목됐다. 업계 관계자는 "네이버가 태생부터 멀티모달인 '네이티브 옴니' 아키텍처를 설계했다는 점에서 방향성이 완벽하고 독자모델로도 입증을 했지만, 경량 모델을 공개했다는 점이 아쉽다"며 "거대 모델로 스케일업 했을 때의 추론 능력과 비용 효율성이 아직 검증되지 않았다는 것이 우려된다"고 짚었다. 이어 "옴니모달은 구글, 오픈AI도 지향하는 최신 아키텍처"라며 "네이버가 이를 '패치워크(여러 모델 붙이기)'가 아닌 '네이티브'로 구현했다고 강조했다는 점에서 소버린 모델로는 충분한 가치가 있다"고 덧붙였다. NC AI는 이연수 대표가 직접 발표에 나서 산업 특화 AI를 위한 파운데이션 모델 '베키(VAETKI)'를 소개했다. 또 1단계 추진 과정에서 고품질 한국어·산업 특화 데이터를 확보하고 100B급 LLM 개발도 마쳤다고 공개했다. NC AI에 따르면 현재 베키는 제조·물류·공공·국방·콘텐츠 등 28개 이상 산업 현장에 적용돼 실질적인 성과를 창출하고 있다. NC AI는 AI 모델 바로크에 3차원(3D) 생성 기술이 결합된 바로크 3D를 활용해 전 산업군에 최적화된 버티컬 AI 설루션을 제공한다는 계획이다. 이 대표는 "우리는 1차로 100B(1천억 개)급 파운데이션 모델의 틀을 마련했다"며 "2차에서 200B, 3차에서 300B급으로 글로벌 모델급 성능을 달성하려고 한다"고 강조했다. 업계에선 NC AI의 이번 발표를 두고 경쟁력 있는 모델을 다수 보유하고 있는 것에 비해 전달력이 미흡했다고 평가했다. 100B 모델과 함께 서비스에 특화된 7B, 20B, VLM 7B까지 다양한 모델을 준비했으나, 발표 구성이 미흡해 강점이 충분히 전달되지 못했다는 의견도 나왔다. 업계 관계자는 "NC AI의 텍스트로 3D 에셋을 만드는 성능은 확실한 산업적 가치를 보여주지만, 그 이상의 것은 없어 아쉽다"며 "100B 모델을 기반으로 게임에 특화된 AI 활용을 좀 더 많이 보여줬다면 훨씬 좋았을 것 같다"고 말했다. 성과 확인 '끝'…1차 발표회 호평 속 투명한 검증 '과제' 업계에선 이번 1차 발표회의 전반적인 진행에 대해 긍정적인 평가와 함께 정부가 앞으로 조금 더 구체적인 국가대표 AI 육성 평가를 내놓을 필요가 있다고 지적했다. 이번 발표회에서 소버린 AI를 강조하는 곳은 많지만, 그 실체를 증명하는 기준이 조금 느슨해보였다는 평가도 나왔다. 업계 관계자는 "이번 발표회에서 각 팀들이 얼마나, 어떻게 혁신적인 모델을 개발해 공개했는지에 대한 구체적인 설명이 없어 아쉬움이 컸다"며 "단순한 제품 홍보 발표회 느낌을 많이 받았지만, 단기간에 모든 팀이 굉장한 일을 정부 지원을 토대로 해냈다는 것에 대해선 기대감을 가지게 했다"고 밝혔다. 이어 "최소 100B급 이상의 모델을 학습시킬만한 인프라 운용과 더불어 학습 노하우를 갖추고 있어 보여 좋았다"며 "단기간 내 실험 시간의 물리적 제한이 있었음에도 기본적으로 초거대 AI 모델을 학습시킬 기본 역량은 대부분 갖췄다고 보여져 놀라웠다"고 덧붙였다. 그러면서도 "2차 발표에선 오거나이징 하는 측에서 명확한 발표 가이드를 제시해주면 더 좋을 것 같다"며 "김성훈 업스테이지 대표의 말처럼 국민 세금이 많이 투입되고 있기 때문에 짧지만 굉장히 효과적인 발표회가 앞으로도 진행될 수 있길 바란다"고 언급했다. 또 다른 관계자는 "독자 AI 파운데이션 모델의 핵심은 어떤 데이터로, 어떤 아키텍처를 써서 어떤 방식으로 학습했는지가 투명해야 한다"며 "그 결과물은 글로벌 시장에서 통할 수 있는 객관적 수치로 증명돼야 하고, 각 팀들은 기술 리포트와 모델 카드를 의무적으로 공개해야 제대로 프롬 스크래치로 개발했는지 검증할 수 있다"고 강조했다. 그러면서 "프롬 스크래치가 만능은 아니지만 투명성은 필수"라며 "무늬만 국가대표가 아닌 실력 있는 국가대표를 가려내기 위해선 마케팅의 거품을 걷어내고 기술의 족보를 따지는 엄격한 검증 시스템이 필요하다고 본다"고 덧붙였다.

2025.12.31 17:59장유미 기자

[유미's 픽] "사명감 없으면 힘들 걸?"…정부 '특화 AI' 사업 추진에 업계 반응 '떨떠름'

"사명감을 가지고 하지 않는 이상 이번 정부 사업에 참가하긴 힘들지 않을까요?" 정부가 글로벌 수준의 특화 인공지능(AI) 모델 개발 사업에 본격 나선 가운데 지원책이 아쉽다는 지적이 일고 있다. 앞서 5개 사업자가 선발된 '독자 AI 파운데이션 모델 프로젝트(국가대표 AI, K-AI)'에 비해 데이터, 인재 등에 대한 지원이 없는 데다 참여하는 것에 대한 명분도 크지 않다는 점에서다. 19일 업계에 따르면 과학기술정보통신부(과기정통부)는 산업 특화 AI 모델 개발 사업자로 선정된 최종 2팀에게 엔비디아의 최신 그래픽처리장치(GPU) 'B200'을 각각 256장씩 제공한다. GPU는 엘리스그룹이 공급한다. 이번 사업은 독자 AI 사업자 선발 때 SK텔레콤과 네이버클라우드가 최종 5개팀에 포함되면서 정부가 확보했던 추경 예산이 남게 되자 새롭게 만들어졌다. 'GPU 임차 지원 사업'에도 참여하게 된 SK텔레콤과 네이버클라우드가 독자 AI 사업에서 정부로부터 1차 GPU 지원을 받을 수 없어서다. 하지만 이번 특화 AI 사업은 지원 규모가 독자 AI에 비해 너무 줄었다는 점에서 기업들의 흥미를 끌어들이지 못하고 있다. GPU 외에 인력, 데이터 등 다른 형태의 정부 지원이 거의 전무하기 때문이다. 일단 정부지원금은 GPU 개수와 GPU 월별 단가, 협약개월 수를 곱해 책정된다. 정부가 산출한 GPU 1장당 월별 단가는 B200 기준 660만원이다. 총 사업비는 정부지원금과 민간부담금으로 구성된다. 민간부담금은 참여인력 인건비 및 보유 유형 자산이 포함된 '현물'과 '현금'으로 구성된다. 정부가 지원하는 GPU 자원의 가치에 상응하는 민간부담금 편성 부분은 이번에 기업들의 관심을 떨어뜨린 요인이 됐다. 최종 사업자로 선발되면 기업 규모와 개발 모델의 오픈소스 공개 여부에 따라 차등적으로 책정된 비용을 현금과 현물로 부담해야 하는데, 정부 지원에 비해 참여한 곳들의 희생을 더 요구하는 구조여서다. 실제 모델을 상업용 오픈소스로 공개할 경우 기업 규모별 자부담율은 ▲대기업 10% ▲중견기업 6% ▲중소기업 5%로 책정됐다. 연구용 오픈소스는 ▲대기업 25% ▲중견기업 15% ▲중소기업 12.5% 등의 비율로 사업비를 부담해야 한다. 만약 모델을 오픈소스로 공개하지 않게 되면 자부담율은 ▲대기업 50% ▲중견기업 30% ▲중소기업 25% 등으로 2배 이상 늘어나게 된다. 민간 부담금 중 현금 부담 비율도 정해졌다. ▲중소기업은 총 부담금의 10% 이상 ▲중견기업은 13% 이상 ▲대기업은 15% 이상을 반드시 현금으로 마련해야 한다. 다만 최종 사업자로 선정된 곳이 정부로부터 GPU를 공급 받지 않는다고 할 경우 민간부담금은 사라진다. 이 경우 정부의 아무런 지원 없이 최종 사업자의 비용으로만 모델을 개발해야 하는 구조다. 업계 관계자는 "GPU만 지원하고 데이터 구매·활용 시에도 사업자가 부담해야 한다는 점에서 당장 개발하는 모델로 수익을 내지 못하는 기업들은 참여하기 힘들 것"이라며 "조건이 참여를 할 만큼 좋은 편은 아니다"고 지적했다. 이어 "당장 돈이 되지 않는 정부 사업을 기업들이 가진 리소스를 투입해 참여해야 하는 지도 의문"이라며 "돈이 된다 싶은 걸 오픈소스로 공개해버리면 그것대로 경쟁만 치열해질 게 뻔해 참여한 곳들이 비용만 투입하고 건질 것은 없는 구조"라고 일침했다. 대기업이 주관사가 아닌 참여기관으로만 참여할 수 있다는 점에서도 사업의 흥행이 보장될 수 없게 됐다. 주관기관은 국내 기업·대학·연구기관만 가능하도록 한다는 점에서 대기업들이 사업적으로 얻게 될 이득이 크지 않다는 분석이 나온다. 해외기업이 글로벌 서비스 개발에 한해 합류할 수 있다는 전제가 포함됐지만, 특화 AI 사업의 열악한 조건 탓에 관심을 보이는 곳은 거의 없는 것으로 알려졌다. 컨소시엄을 구성할 때 특정 산업 도메인과 수요기관·수요처를 민간이 직접 제안해야 한다는 점도 참여 의욕을 떨어뜨리는 요소다. 정부가 도메인을 지정하는 대신 민간이 산업 수요를 발굴하도록 유도하고 있지만, 정작 관심을 보이고 있는 분야가 금융, 법률, 의료, 교육 등 공공성과 산업 수요가 맞닿는 곳에 국한된 모습을 보였다는 점 역시 한계로 지적됐다. 'K-AI' 엠블럼이 수여된 '독자 AI'와 달리 기업들에게 주어지는 상징적인 보상안이 없다는 점도 특화 AI 사업에 대한 기대치를 낮추게 했다는 지적이 나왔다. 독자 AI 사업자로 선정된 SK텔레콤·LG AI연구원·NC AI·업스테이지·네이버클라우드 등 5곳은 'K-AI' 엠블럼을 회사 홍보 등에 활용함으로써 국내외서 정부가 인정한 '국가대표 AI'라는 인식을 심어줄 수 있게 됐다. 그러나 특화 AI는 'K-AI' 엠블럼을 사용할 수 없다. 하지만 정부는 '특화 AI' 사업자로 참여할 팀에게 고난도의 기술만 요구하는 분위기다. 단순 서비스 개발이 아닌 '파운데이션 모델' 개발에 초점을 맞춘 만큼, 프롬스크래치 방식이나 기존 자체 모델의 프리 트레이닝 방식으로 모델을 개발해봤던 업체들이 사업자로 선정되기 유리한 구조로 조건을 걸었기 때문이다. 과기정통부 관계자는 "기존 모델을 일부 조정하는 '파인튜닝' 방식은 지원 대상이 아니다"며 "처음부터 모델을 설계하거나 기존 범용 모델에 대규모 데이터를 사전학습 시키는 방식만 가능하다"고 설명했다. 이어 "특정 분야에 쓰이는 만큼 낮은 환각 발생 가능성이 중요하다"며 "사전학습 단계부터 정제된 고품질 데이터로 학습하는 '프롬스크래치' 방식이 높은 신뢰성과 정확도를 담보할 뿐 아니라 세계 최고 수준의 모델을 만들겠다는 사업 목표와 직결된다"고 덧붙였다. 평가 기준도 ▲시장성·파급효과(40점) ▲개발 목표(30점) ▲기술력·개발 경험(30점) 등 기술 배점이 상당해 정부 지원금으로 사업을 시작해보려는 곳이 도전하기에는 힘든 구조다. 더구나 사업 기간은 오는 11월부터 내년 9월까지 약 10개월간으로 설정됐지만, 내년 3월에 1단계를 수행한 뒤 단계 평가를 치러야 한다는 점에서 모델 개발 경험이 없다면 사업을 지속하기 어렵다. 만약 성과를 검증해 2단계 지원을 이어 받는다고 해도 이 때 성과가 미흡하다면 중간 탈락할 가능성도 있어 사업 안정성도 낮게 평가 된다. 이 같은 조건 탓에 '독자 AI' 사업에서 쓴 맛을 봤던 기업들은 참여 여부에 대해 대체적으로 회의적인 반응을 보였다. 지난 15일 진행된 '특화 AI 사업 설명회'에는 삼성SDS, 마키나락스, 와이즈넛, 딥노이드, 모티프테크놀로지스, 코난테크놀로지, 루닛, KT, 카카오, 사이오닉AI, 솔트룩스, 딥브레인AI, 제논, 모비젠 등 다수 기업 관계자들이 참여했지만, 조건 공개 후 일부는 사업에 대한 관심을 접었다. 하지만 정부는 기술력 있는 기업들이 컨소시엄을 잘 구성해 특화 AI 사업에 도전할 것으로 기대했다. 또 초기 성과를 내기 위한 수요처도 컨소시엄 구성 시 잘 구성해야 유리할 것이라고 조언했다. 과기정통부 관계자는 "우리나라가 잘하는 분야를 중심으로 해당 기업이 얼마나 많은 데이터와 경험, 인력을 가지고 있는지가 평가 포인트가 될 것"이라며 "이를 고려해 컨소시엄을 얼마나 잘 구성할 것인지가 중요할 것"이라고 설명했다. 그러면서 "특화 AI 모델이 개발되면 특정 정부 공공 영역에서 쓰인다기 보다 해당 시장 영역에서 잘 쓰일 수 있는지도 관건"이라며 "컨소시엄에 어떤 수요기관을 얼마나 포함시켰는지를 면밀히 볼 것"이라고 덧붙였다. 또 정부의 지원이 부족하다는 지적에 대해선 "현재 수준으로만 일단 봐 달라"며 "2단계로 넘어갈 때 추가 지원 할 부분이 있는지에 대해 살펴볼 것"이라고 설명했다.

2025.09.19 18:05장유미 기자

[유미's 픽] "진짜 승부는 이제부터"…4개월 후 웃을 'K-AI' 기업 어디?

대한민국 인공지능(AI) 시장을 이끌 대표주자 5개 팀이 확정된 가운데 이들의 향후 전략에 대한 관심이 쏠린다. 'K-AI'란 타이틀을 획득하는 것에 일단 성공했으나, 최종 2개 팀으로 선정되기 위해선 기술력이 얼마나 뒷받침 될 지가 가장 중요할 것으로 보인다. 5일 업계에 따르면 이번 관문을 넘은 네이버클라우드, 업스테이지, SK텔레콤, NC AI, LG AI연구원 등 5개 정예팀은 지난 4일 최종 사업자로 선정됨과 동시에 모델 개발을 위한 움직임에 돌입했다. 1개팀이 탈락하는 첫 심사가 오는 12월로 예정된 만큼, 시간을 허비할 수 없다는 판단에서다. 과학기술정보통신부는 5개 정예팀이 개발·확보한 AI 파운데이션 모델을 대상으로 반기마다 단계 평가를 진행해 한 팀씩 탈락시켜 2027년 상반기까지 최종 2개팀만 선발한다. 하지만 첫 평가일까지 4개월여밖에 남지 않았다는 점에서 각 업체들은 준비 시간에 대한 많은 부담감을 가지고 있는 상태다. 업계 관계자는 “6개월마다 진행되는 내년 평가와 달리 올해 진행되는 첫 평가는 2개월여의 시간이 부족하다”며 “최신 글로벌 AI 모델과 비교해 95% 이상의 성능을 지닌 AI 모델을 만들어야 한다는 정부의 지침에 맞춰 1차 평가에서 5개팀 모두 AI 모델을 내놓을 수 있을지 의문”이라고 짚었다. 그러면서 “'프롬 스크래치(From Scratch)' 방식으로 좋은 성능의 AI 모델을 개발해 본 경험이 없는 곳은 이를 실현하기가 쉽지 않을 것”이라며 “특히 1차 평가에서 각 팀이 제시한 목표치를 얼마나 달성했는지를 정부가 심사할 때 면밀히 보고, 달성하지 못했을 경우 평가에서 제외시켜야 공정성 논란이 없을 것”이라고 덧붙였다. 또 다른 관계자는 “각 팀에서 '전 국민 AI' 콘셉트에 맞게 새로운 모델을 개발한다고 얘기한 만큼, 자신만의 기술로 제대로 AI 모델을 개발했는지에 대해 1차 평가에서 주요하게 다뤄질 듯 하다”며 “시간이 빠듯한 만큼 기술력이 없으면 AI 모델을 시간에 맞춰 선보이기 쉽지 않을 것'이라고 전망했다. 업계에선 그래픽처리장치(GPU) 등 인프라만 있다면 4개월 내에 기술력을 지닌 팀들이 AI 모델을 새롭게 만드는 것은 큰 부담이 없을 것이라고 입을 모았다. 정부는 2개 정예팀에 엔비디아 'B200' 1천24장을, 1개 정예팀에 엔비디아 'H100' 1천24장을 지원할 예정으로, 업스테이지와 LG AI연구원, NC AI 등 3곳과 협의해 분배할 계획이다. SK텔레콤과 네이버클라우드는 이 프로젝트를 위해 정부에게 GPU를 임대해 줄 공급사로 선정돼 내년 상반기까지는 정부의 GPU 공급을 받을 수 없다. 업계 관계자는 ”기술력이 있고 GPU만 넉넉하게 갖고 있다면 성능 좋은 AI 모델을 개발하는 것이 크게 어려운 일은 아닐 듯 하다“면서도 ”사업 계획에 맞게 각 팀들이 GPU를 가져간다고 해도 자체적으로 보유한 데이터의 양과 질이 얼마나 좋은지에 따라서도 결과물이 갈릴 수 있을 것“이라고 말했다. 업계에선 각 팀들의 주관사들이 얼마나 주도적으로 역할을 잘 해나갈 지도 올 연말 심사 평가에서 중요한 기준이 될 것으로 봤다. 5개 정예팀에 선정되기 위해 다양한 참여기관, 수요기업들을 끌어 들여 놓은 만큼 이들의 요구 사항을 주관사가 얼마나 잘 조율할 지에 따라 AI 모델의 방향성이 달라질 수 있어서다. 업계 관계자는 ”참여기관이 많은 곳일수록 잡음이 생길 가능성이 높을 듯 하다“며 ”어느 한 쪽의 의견에 몰입하지 않고 중간자적 역할을 주관사가 잘 수행하는지도 정부에서 면밀히 들여다 볼 가능성이 높다“고 밝혔다. 현재 5개 정예팀은 프롬 스크래치부터 시작하는 독자 AI 개발 역량을 보유하고 상업용 활용이 가능한 높은 수준의 오픈소스 정책을 정부에 제시했다. 또 새롭게 개발하는 모델을 통해 기존 언어모델을 넘어서는 멀티모달·옴니모달로의 확장해 나갈 것이란 의지를 보였다. 업계 관계자는 ”각 팀들이 컨소시엄에 참여한 곳들과 어떤 식의 모델을 구축하겠다는 대략적인 계획만 제시했을 뿐 구체적인 사이즈와 성능, 어느 분야에 집중해 모델을 구축하겠다는 점은 전략상 드러내지 않은 상황“이라며 ”보안을 유지하며 각 업체들이 새로운 모델을 개발하겠지만 참여사들과 제대로 협업하지 않으면 1차 심사 때 기술 격차가 확연하게 드러날 가능성이 있다“고 짚었다. 정부는 올해 말까지 개발·확보한 각 팀의 AI 파운데이션 모델 등을 기반으로 오는 12월 말 1차 단계 평가를 진행해 1개팀을 탈락시킨다. 이번 평가에선 대국민·전문가 컨테스트도 진행할 예정으로, 세부 일정이나 방식은 추후 공개된다. 과기부는 ”1차 단계 평가는 입체적 평가를 지향하되 정예팀들과의 협의를 통해 평가 방안을 확정할 계획“이라며 ”각 정예팀이 개발·확보한 AI 파운데이션 모델의 AI 생태계 확장, 국민 AI 접근성 증진, 공공·경제·사회 분야의 AI 대전환(AX), 국방·안보적 활용 등을 적극 지원해 나갈 계획“이라고 밝혔다.

2025.08.05 18:04장유미 기자

[유미's 픽] '국가대표 AI' PT 발표 막바지 속 정부 선택은

"PT 발표를 위해 100개가량의 예상 질문지를 작성해 답변을 만들고 여러 차례 리허설도 진행했습니다. 회사 전체의 명운이 걸린 일인 만큼 꼭 좋은 결과를 만들어 내고 싶습니다." '국가대표 인공지능(AI)' 타이틀을 노리고 PT 발표에 나선 10개 컨소시엄들이 최종 사업자 선정 발표만을 남겨두고 있는 가운데 정부가 어떤 결론을 내릴지 주목된다. 최종 선발될 총 5개 컨소시엄 중 3곳은 대기업, 2곳은 중견·중소기업들이 차지할 것이란 전망이 나오고 있는 분위기 속에 향후 결과에 관심이 쏠린다. 31일 업계에 따르면 과학기술정보통신부는 이날 '독자 AI 파운데이션 모델 프로젝트' 사업자 선정 1차 관문을 넘은 NC AI, 카카오, 업스테이지 등 5곳의 PT 발표를 진행한다. 지난 30일에는 네이버클라우드와 LG AI연구원, SK텔레콤, KT 등 5곳이 PT 발표를 마쳤다. PT 발표에선 심사위원들이 1차 서류 제출에서 지적했던 부분들을 각 컨소시엄들이 얼마나 잘 보완해 왔는지에 대한 질문들이 이어졌던 것으로 알려졌다. 현장에서 피드백을 더 줄 경우 평가 결과를 유추할 가능성이 높아 양측간 심층 토론 분위기는 아니었던 것으로 전해졌다. 현재까지 최종 사업자로 선정될 가능성이 가장 높은 컨소시엄으로는 LG AI연구원과 네이버클라우드가 유력하다고 보는 것이 중론이다. 이미 오픈소스 커뮤니티 '허깅페이스'에 오래 전부터 자체 개발 거대언어모델(LLM)들을 꾸준히 공개하며 기술력을 검증해왔던 탓이다. 특히 LG AI연구원의 '엑사원 4.0'은 최근 글로벌 AI 성능 분석 기관 '아티피셜 어낼리시스'의 평가에서 종합 순위 11위, 국내 AI 모델 중 1위를 차지해 기술력을 입증했다. 공개(오픈 웨이트) 모델 기준으로는 4위, 코딩은 7위, 수학 문제 해결 능력은 10위를 기록하며 영역별 '톱 10'을 달성했다. 이는 모델 크기가 수십 배에 달하는 미국 앤트로픽의 '클로드 4 오퍼스' 등 글로벌 프런티어 모델들과 어깨를 나란히 하는 성과다. 기술력뿐 아니라 시장의 관심도 뜨겁다. 지난 15일 글로벌 플랫폼 '허깅페이스'에 공개된 '엑사원 4.0'은 2주 만에 50만 다운로드를 돌파해 국산 AI 모델 최단 기록을 세웠다. '하이퍼클로바X'를 앞세운 네이버클라우드는 사업비 절감 측면에서도 경쟁력이 있다고 평가 받는다. 이곳은 지난 8일 과학기술정보통신부와 정보통신산업진흥원(NIPA)이 주관한 '그래픽처리장치(GPU) 임차 지원 사업'에서 2트랙 우선협상대상자로 선정된 상태다. 만약 '국가대표 AI' 정예팀으로 최종 발탁될 경우 정부가 직접 제공하는 1차 GPU 지원을 받을 수 없다. 이에 네이버클라우드는 자체 인프라와 사업 구조로 상쇄하며 개발과 공급 전략을 동시에 추진한다는 방침으로, 정부 입장에선 사업비 절감 효과가 있다. 이에 'GPU 임차 지원 사업'에서 1트랙 우선협상대상자로 선정된 SK텔레콤도 1차로 정부에서 GPU 지원을 받지 않는다는 점에서 가능성이 있을 것으로 보는 시각이 있다. 이달 들어 잇따라 새로운 AI 모델을 발표하며 기술력을 과시했던 것도 긍정적인 결과를 가져올 것이란 기대감이 나온다. 업계 관계자는 "이번에 정부가 GPU를 공급 받지 않는 2곳, GPU를 지원해야 하는 3곳을 최종 사업자로 선정할 것이란 얘기가 많다"며 "정부가 확보한 GPU를 기업들에게 집중적으로 배분하기 위해 이처럼 고민하고 있는 것으로 안다"고 말했다. 그러면서 "정부가 대기업 2~3곳, 통신사 1곳, 중소 스타트업 1곳을 최종 사업자로 선발할 가능성이 가장 높아 보인다"며 "중소 스타트업 분야에선 업스테이지와 컨소시엄이 공개되지 않은 카이스트 중 한 곳이 될 듯 하다"고 덧붙였다. 업계에선 NC AI도 선정 가능성이 높다고 보고 있다. 14년간 AI 기술력을 축적해 온 이곳은 지난 2023년 8월 '바르코 LLM'을 프롬 스크래치(From Scratch·모델의 첫 단계부터 모두 직접 구축)로 바닥부터 개발해 국내 최초로 AWS 마켓플레이스에 등재하며 글로벌 상용화에 성공한 저력이 있어서다. 또 컨소시엄 구성도 경쟁사들에 비해 가장 탄탄하다는 평가를 받고 있다. 우선 한국어 언어모델 '코버트' 등을 개발한 한국전자통신연구원(ETRI)을 비롯해 카이스트, 서울대학교, 고려대학교, 연세대학교 등 연구진이 NC AI 컨소시엄에 합류했다. 또 롯데이노베이트, 포스코DX, NHN 등 주요 대기업들이 기술 개발 및 확산 그룹에 동참키로 해 NC AI에 힘을 실어줬다. NC AI의 컨소시엄은 국내 산업, 연구, 학계 기관 14곳이 합류했고, 40곳이 수요기관으로 포함됐다. LG AI연구원도 LG CNS, LG유플러스 등 LG그룹 계열사와 한컴, 퓨리오사AI 등 각 분야의 최고 기술 기업들을 컨소시엄에 포함시켜 기대감을 키우고 있다. 특히 퓨리오사AI는 이날 총 1천700억원 규모의 투자 유치에 성공하며 자사 2세대 인공지능 반도체 '레니게이드' 양산과 3세대 제품 초기 개발에 속도를 낼 것이란 점에서 LG AI연구원 측에 많은 힘을 실어 줄 것으로 전망된다. 이곳은 최근 '레니게이드'를 LG AI연구원의 '엑사원'에 공급하며 기업 엔터프라이즈 시장에 진출했다. 퓨리오사AI의 기업가치는 이번에 1조원을 돌파하며 유니콘 반열에 올라섰다. SKT·KT 등 통신사와 코난테크놀로지·모티프테크놀로지스 등 중소업체들도 지난 21일 사업계획서를 제출한 후 전략을 대부분 노출했다. 모티프테크놀로지스는 모레를 비롯한 삼일회계법인, 서울대, 카이스트 외에 기업 및 공공기관 등으로 컨소시엄을 구축했다. AMD 기반으로 AI 모델을 구축하고 있으며 모레와의 시너지를 기대하고 있다. SK텔레콤은 이번에 포티투닷과 크래프톤, 라이너, 리벨리온, 셀렉트스타 등 여러 기업들과 서울대학교, 카이스트 등과 손잡았다. 또 수요 기업으로는 SK하이닉스와 SK이노베이션, SK AX, SKB 등 SK그룹사를 포함해 SKT가 주도하는 K-AI 얼라이언스에 참여 중인 몰로코(AI 광고), 씨메스(제조 AI), 가우스랩스(제조 AI), 스캐터랩(감성 AI) 등이 포함됐다. KT는 총 18개 기관과 함께 컨소시엄을 구성했다. 컨소시엄에는 ▲솔트룩스 ▲크라우드웍스 ▲매스프레소 ▲투모로 로보틱스 ▲경찰청 ▲고려대학교 의료원 ▲서울대학교 ▲고려대학교 외에 법률 기관, 로펌, 반도체 및 산업 AI 수요 기업 등이 포함됐다. 코난테크놀로지는 ▲사이냅소프트를 비롯해 ▲알체라 ▲페블러스 ▲고려대학교 ▲연세대학교 ▲포항공과대학교 ▲카이스트 등 8개 기관이 이름을 올렸다. 업스테이지도 지난 30일 김성훈 대표가 직접 자신의 소셜미디어(SNS)를 통해 컨소시엄에 포함된 기업을 공개했다. 김 대표는 "AI 데이터 가공 1위 플리토, AI 모델 경량·효율화 노타, GPU ops 글로벌 실력을 가진 래블업 등 스타트업과 뭉쳤다"고 밝혔다. 업계에선 중소기업 분야 경쟁에선 한 자리를 두고 코난테크놀로지와 업스테이지의 기싸움이 치열할 것으로 보고 있다. 코난테크놀로지는 실무 역량을 중심으로 팀을 구성한 데다 실제 파운데이션 모델을 직접 개발한 현장 적용 경험과 추진 역량이 이번에 드러났다는 점에서 경쟁력이 있다고 평가됐다. 업스테이지는 자체 개발 모델인 '솔라 프로2'가 메타, 딥시크 등의 모델들과 글로벌 AI 성능 평가에서 비슷한 수준을 기록했다는 점에서 기술력이 높다고 보는 시각이 많다. 문병로 서울대 컴퓨터공학과 교수는 자신의 SNS를 통해 "'솔라 프로 2'를 추가해 알고리즘 테스트를 진행 중으로 '챗GPT', '그록'에 밀리지 않는 느낌"이라며 "메이저 플레이들에 비하면 열악한 장비로 어떻게 저 수준에 이르렀는지 궁금할 정도로 대단하다고 보여진다"고 평가했다. 업계 관계자는 "'대기업 몰아주기' 논란을 의식한 정부가 중소기업·스타트업 참여를 고려할 경우 업스테이지를 최종 사업자 명단에 포함시킬 가능성이 크다"며 "네이버클라우드와 LG AI연구원도 각각 하정우 대통령실 인공지능미래기획수석과 배경훈 과기정통부 장관을 배출한 기업들인 데다 기술력도 검증된 곳인 만큼 최종 사업자가 될 것으로 보는 시각이 많다"고 말했다. 과기정통부는 이틀 간 진행된 2차 PT 평가 결과를 이르면 1일, 늦어도 4일께 발표할 것으로 알려졌다. 선발된 정예팀은 첨단 GPU, 데이터, 인재 등을 지원 받아 '국가대표 AI' 개발에 나서게 된다. 다만 사업 기간 동안 6개월 단위의 경쟁형 단계평가를 통해 최종 2개 팀으로 점차 압축된다. 업계 관계자는 "정부가 국산 LLM을 보유하기 위해 대규모 투자에 나서는 것도 중요하지만 LLM 개발과 GPU 인프라 확보에만 집중하고 있는 것은 다소 우려스럽다"며 "정작 AI를 통해 산업 생산성을 실질적으로 어떻게 끌어 올릴 수 있는지 등 '활용성'에 대한 고민은 뒷전으로 밀려나 있는 듯 해 아쉽다"고 지적했다. 또 다른 관계자는 "정부가 전략 산업, 국방 등 핵심 데이터를 가진 주요 안보 시설에 국가 LLM을 활용할 듯 하다"며 "다만 일반 사용자들을 위한 '전 국민 AI'로도 활용되기 위해선 정부가 요구하는 글로벌 톱 모델 성능의 95% 이상을 구현할 수 있는 모델을 만들 수 있는 기술력이 뒷받침 해야 한다"고 짚었다. 그러면서 "이를 고려할 때 적은 인프라로 얼마나 효율성 높은 LLM을 개발할 수 있는지에 대해 각 컨소시엄들이 PT 발표에서 제대로 입증해야 할 것"이라며 "인재 양성 및 확보도 기술력 검증 측면에선 중요 기준이 될 것으로 보인다"고 덧붙였다.

2025.07.31 12:16장유미 기자

[단독] '국가대표 AI' 선발전, 한컴도 도전장…LG AI연구원 컨소시엄 '히든카드'

국내 인공지능(AI) 기술의 미래를 이끌어 갈 '독자 AI 파운데이션 모델 프로젝트' 사업자 선발전 2차 관문인 PT 발표가 30일부터 이틀 간 진행될 예정인 가운데 한컴이 LG AI연구원 컨소시엄에 참여한 것으로 드러나 주목된다. AI 사업을 새로운 먹거리로 삼고 영역 확대에 나선 김연수 한글과컴퓨터 대표의 노력과 한컴의 35년 문서 기술이 인정받은 결과로 풀이된다. 업계에 따르면 한컴은 이날 오후 진행될 것으로 알려진 '독자 AI 파운데이션 모델 구축 사업' PT 발표에 LG AI연구원이 주도하는 컨소시엄 일원으로서 함께한다. 이번 사업에 참여해 대한민국 AI 기술의 미래를 이끄는 기업으로서 이미지를 끌어올림과 동시에 세계적 수준의 거대언어모델(LLM) 개발을 목표로 하는 국가대표급 프로젝트에 동참함으로써 기술력도 입증하려는 의도로 해석된다. 과학기술정보통신부가 주관하는 이번 사업은 총 2천136억원의 예산이 투입되며 국가 AI 경쟁력의 핵심인 '소버린 AI' 주권 확보를 목표로 한다. 이를 위해 글로벌 최상위 모델 대비 95% 이상의 성능을 갖춘 국산 AI 기초 모델 개발이 추진된다. 한컴이 참여한 LG AI연구원 컨소시엄에는 LG CNS, LG유플러스, 퓨리오사AI 등 각 분야의 최고 기술 기업들이 포함돼 시너지를 극대화할 전망이다. 업계에서는 LG 컨소시엄이 한컴을 파트너로 선정한 것은 한컴의 독보적인 문서 데이터 처리 기술력을 높이 평가한 때문으로 분석했다. LLM 성능의 핵심인 고품질 학습 데이터 확보에 있어 한컴의 기술이 큰 역할을 할 것으로 기대되기 때문이다. 과기정통부가 제시한 까다로운 성능 목표를 달성하기 위해서는 방대한 양의 데이터를 AI가 학습 가능한 형태로 정밀하게 가공·처리하는 능력이 필수적이다. 한컴은 35년에 걸쳐 축적해온 전자문서 기술을 AI와 결합해 데이터 추출부터 학습·활용에 이르는 'AI 풀스택' 기술을 내재화했다. 특히 비정형 문서 데이터를 AI 학습용으로 변환하는 '한컴 데이터 로더'와 이를 기반으로 정확한 정보를 제공하는 AI 솔루션 '한컴피디아'는 이번 사업의 성공을 견인할 핵심 기술로 주목받고 있다. 한컴은 이미 다수의 대형 공공 프로젝트를 연이어 수주하며 국내 '소버린 AI' 시장에서 기술력과 사업 수행 능력을 입증해왔다. 올해 상반기에는 ▲국회 빅데이터 분석 플랫폼 ▲행정안전부 지능형 업무관리 플랫폼 ▲범정부 AI 공통 기반 구현 사업 등을 성공적으로 수주했다. 최근에는 경기도교육청의 디지털 플랫폼 구축 사업에도 AI 솔루션을 공급하며 공공 및 교육 시장에서 확고한 입지를 다지고 있다. 이처럼 한컴의 LG 컨소시엄 합류 소식이 점차 알려지면서 경쟁사들의 긴장감도 높아지는 분위기다. 이미 LG 컨소시엄이 '엑사원'의 기술력으로 유력 후보로 손꼽히고 있는 상황에서 한컴의 데이터 경쟁력까지 더해진 때문이다. 이틀간 진행될 PT 발표에선 그간 선보였던 기술력에 더해 프롬 스크래치(From Scratch·모델의 첫 단계부터 모두 직접 구축) 등 '전 국민 AI' 개발에 맞는 기술력을 함께 가지고 있는지에 대해서도 검증해야 하는 만큼 각 컨소시엄들의 부담감과 긴장감은 상당히 큰 상태다. LG 컨소시엄과 함께 총 5자리를 두고 PT 발표 경쟁을 벌이게 되는 곳은 ▲네이버클라우드 ▲모티프테크놀로지스 ▲카카오 ▲업스테이지 ▲KT ▲SK텔레콤 ▲코난테크놀로지 ▲NC AI ▲카이스트 등 10곳이다. 이들은 이번 발표에서 기술력 입증과 AI 모델 실증 사례 확산 계획을 제대로 증명해야 한다. 또 미리 제출한 5분 가량의 동영상에는 'AI 파운데이션 모델 개발 관련 역량'을 확인할 수 있는 내용이 담겨야 한다. 일부 참여 팀들은 이미 공개를 한 상태로, SKT·KT 등 통신사와 코난테크놀로지·모티프테크놀로지스 등 중소업체들이 지난 21일 사업계획서를 제출한 후 전략을 대부분 노출했다. 모티프테크놀로지스는 모레를 비롯한 삼일회계법인, 서울대, 카이스트 외에 기업 및 공공기관 등으로 컨소시엄을 구축했다. AMD 기반으로 AI 모델을 구축하고 있으며 모레와의 시너지를 기대하고 있다. SK텔레콤은 이번에 포티투닷과 크래프톤, 라이너, 리벨리온, 셀렉트스타 등 여러 기업들과 서울대학교, 카이스트 등과 손잡았다. 또 수요 기업으로는 SK하이닉스와 SK이노베이션, SK AX, SKB 등 SK그룹사를 포함해 SKT가 주도하는 K-AI 얼라이언스에 참여 중인 몰로코(AI 광고), 씨메스(제조 AI), 가우스랩스(제조 AI), 스캐터랩(감성 AI) 등이 포함됐다. KT는 총 18개 기관과 함께 컨소시엄을 구성했다. 컨소시엄에는 ▲솔트룩스 ▲크라우드웍스 ▲매스프레소 ▲투모로 로보틱스 ▲경찰청 ▲고려대학교 의료원 ▲서울대학교 ▲고려대학교 외에 법률 기관, 로펌, 반도체 및 산업 AI 수요 기업 등이 포함됐다. 코난테크놀로지는 ▲사이냅소프트를 비롯해 ▲알체라 ▲페블러스 ▲고려대학교 ▲연세대학교 ▲포항공과대학교 ▲카이스트 등 8개 기관이 이름을 올렸다. LG AI 연구원과 네이버클라우드, NC AI, 업스테이지, 카카오 등은 전략적으로 비공개 기조를 유지하며 컨소시엄 명단이 유출되지 않기 위해 고군분투하고 있다. 컨소시엄 구성을 먼저 공개하면 외부에 사업 전략이 노출되고 자칫 아이디어를 제공하는 빌미가 될 수 있다고 판단해서다. 하지만 시간이 지날수록 일부 기업들의 컨소시엄 구성도 조금씩 윤곽을 드러내고 있다. LG AI 연구원은 LG CNS, LG 유플러스 등 LG 그룹 계열사들과 함께 한컴, 퓨리오사AI, 프렌들리AI 등과 협업하는 것으로 알려졌다. 네이버클라우드는 네이버벤처스가 처음 투자한 AI 영상 검색 스타트업 트웰브랩스를 컨소시엄에 합류시켰고, 업스테이지는 AI 언어 데이터 전문기업 플리토 등이 함께하는 것으로 전해졌다. NC AI 역시 컨소시엄 구성 시 국내 주요 대기업들이 대거 몰린 것으로 파악됐다. 정부는 이르면 다음 달 1일께 최종 5개 정예팀을 확정, 협약 체결을 완료할 예정이다. 선발된 정예팀은 첨단 그래픽처리장치(GPU), 데이터, 인재 등을 지원 받아 '국가대표 AI' 개발에 나서게 된다. 업계 관계자는 "컨소시엄 구성도 PT 발표에서 핵심 기준이 될 것으로 보이는 만큼, 각 업체들이 얼마나 탄탄한 파트너들을 확보했는지를 강조하는 것도 중요한 요소가 될 것"이라며 "하지만 기술력을 제대로 설명하지 못하면 컨소시엄 구성이나 AI 실증 문제는 사실 공허한 얘기가 될 것으로 보여 심사위원들에게 기술 측면에서 어떤 점을 전략적으로 각인시킬 것인지를 두고 많은 고민을 해야 할 것"이라고 강조했다.

2025.07.30 10:08장유미 기자

[유미's 픽] "너도 나도 프롬 스크래치?"…국가대표 AI 2차전, 자체 기술 평가 '관건'

"너도 나도 '프롬 스크래치(From Scratch)' 방식이래요. 마케팅 용어로 무분별하게 나오는 게 심사에 과연 도움이 될 지 모르겠어요." 최종 5개 팀을 뽑는 '독자 인공지능(AI) 파운데이션 모델 개발' 사업자 선정이 본격화되면서 업계가 각 업체의 AI 모델을 두고 혼란에 빠졌다. '프롬 스크래치' 방식으로 자체 AI 모델을 만들 수 있는지가 사업자 선정에 있어 핵심 기준이 될 것이란 전망이 나오자 제대로 된 검증 없이 홍보용으로 앞세우고 있어서다. 29일 업계에 따르면 '프롬 스크래치'는 AI 모델을 처음부터 직접 개발한다는 뜻으로, 데이터 수집과 모델 아키텍처 설계, 학습, 튜닝까지 모든 것을 자체적으로 수행하는 방식이다. 이 개념은 거대언어모델(LLM) 개발 때 많이 언급되며 아무 것도 없는 상태에서 모델을 직접 설계하고 데이터를 수집 및 전처리해 학습시킨다는 점에서 이를 통해 AI 모델을 선보일 경우 기술력이 상당히 높다고 평가를 받는다. 오픈AI의 'GPT-4'나 구글 '제미나이', 메타 '라마', 앤트로픽 '클로드' 등이 여기에 속한다. 국내에선 네이버 '하이퍼클로바X'와 LG AI 연구원 '엑사원', NC AI '바르코 LLM', KT '믿음', 카카오 '카나나' 등이 프롬 스크래치 방식을 제대로 구현해 만들어진 것으로 평가 받고 있다. 다만 일부 기업들은 프롬 스크래치 방식으로 분별하기엔 애매한 부분이 많음에도 불구하고 '독자 AI 파운데이션 모델 개발' 사업자로 선정되기 위해 마케팅 용어로 사용해 문제로 지적 받고 있다. 업계 관계자는 "일부 기업들이 '프롬 스크래치' 방식이 아닌 외국 AI 모델을 기반으로 재설계하거나 파인튜닝을 한 것을 활용했음에도 마치 자체 기술로 모두 개발한 것처럼 부풀려 홍보하는 경우가 최근 들어 많아졌다"며 "어디까지가 자체적으로 독자 기술을 사용했는지에 대한 판단 기준 없이 이를 마케팅 용어처럼 남발하는 것은 국내 AI 시장에 좋은 영향을 주진 못한다"고 짚었다. 이에 일각에선 모델 구조나 가중치가 기업들의 자체 기술로 얼마나 구현했는지에 따른 분류가 필요하다고 지적했다. 오픈소스 구조를 차용하거나 이를 기반으로 전체 재학습을 한 경우, 오픈소스 모델 공개 가중치를 그대로 이용하지만 전면 추가 학습을 한 경우 등 다양한 사례들이 많이 나오고 있어서다. 특히 이승현 디지털플랫폼정부위원회 국장은 최근 자신의 소셜 미디어(SNS)에 이를 좀 더 명확히 할 수 있는 분류 체계를 제안해 업계의 주목을 받고 있다. 이 국장은 정부가 '국가대표 LLM' 사업자를 선정하는데 있어 단순 모델 성능뿐 아니라 통제 가능성, 설명 가능성, 공급망 안전, 법·윤리 준수 등을 종합적으로 계량화 해 총 7단계로 모델을 구분할 수 있어야 한다고 주장했다. 이 기준에 맞춰 이 국장이 제안한 'T0'은 가장 낮은 등급으로, 외부 폐쇄 API 호출 후 프롬프트·필터만 추가한 LLM이다. 아키텍처, 가중치 기원은 100% 외산·폐쇄형이며 통제나 주권성이 거의 없어 API 계약, 쿼터에 의존한다. 챗GPT 기반 다수 PoC 서비스가 이에 해당된다. 'T1'은 폐쇄 가중치에 LoRA(저비용 경량 파인튜닝 방식), RAG(검색증강생성) 등 경량 튜닝을 더하는 것이다. 가중치 불투명성이 특징으로, 통제나 주권성 측면에서 설명 가능성과 재현성이 제한된다. 의료, 금융 시범 모델, UAE TAMM 3.0, KT 챗GPT-4oK(예정) 등이 여기에 속한다. 이 국장은 "T0~T1은 학습 비용과 시간을 최소화하고 최신 모델 성능을 즉시 활용할 수 있다"면서도 "하지만 API 차단, 가격 인상, 설명·통제 불가 등의 위험이 있을 것"이라고 평가했다. 'T2' 등급은 메타 '라마', 알리바바 '큐원' 등 공개 가중치를 100% 이용해 전면 추가 학습한 것들이다. 기반 모델 라이선스 준수가 필요하며 로컬 호스팅, 가중치 수정이 가능해 통제나 주권성이 중간 수준이다. SK텔레콤이 '큐원 2.5'를 기반으로 이달 초 선보인 '에이닷엑스 4.0(A.X 4.0)'이 대표적이다. 업계 관계자는 "T2 등급에 속하는 모델들이 한국어로 튜닝됐다는 이유만으로 이를 '한국형 모델'이라고 부르는 것은 맞지 않다"며 "모델의 '메모리'는 여전히 '큐원 2.5' 같은 해외 모델이라는 점에서 큐원에서 학습한 불투명한 정보가 국내 기업 AI 모델 내부에 그대로 내재돼 잘못된 결과물이 예기치 않게 출력될 가능성을 배제할 수 없다"고 지적했다. 이어 "'큐원 2.5'는 메타 '라마'와 달리 학습에 어떤 데이터를 사용했는지, 어떻게 수집·정제했는지조차 밝히지 않아 불투명한 모델이라는 지적을 받고 있다"며 "이를 활용한 모델들은 공공망, 정부망에 도입되는 것을 철저하게 막아야 한다"고 덧붙였다. 'T3'는 오픈소스 모델 구조·레이어를 확장한 후 전체 재학습한 LLM이다. 기반 모델 라이선스 부분 준수가 필요하다. 또 통제나 주권성이 중간 이상이지만 구조 혁신은 제한된다. 업스테이지 '솔라 프로 2(Phi‑4→DUS)'가 이 등급에 해당된다. DUS는 구조 일부를 변경해 자체화한 AI 모델 개발 방식이다. 이 국장은 "T2~T3 등급은 CPT(추가 사전학습)로 기존 오픈소스 모델에 대규모 한국어 토큰을 재훈련해 비용 5~10%로 성능을 크게 높일 수 있다"며 "DUS는 깊이만 확장해 파라미터와 성능을 올릴 수 있는 장점이 있다"고 분석했다. 그러면서도 "여전히 기반 모델 버전업 시 재호환 문제가 우려된다"며 "라이선스 조건 충족 등이 필요할 것으로 보인다"고 덧붙였다. 'T4' 등급부터는 라마-류 구조를 차용하고 가중치 전량을 자체 사전 학습한 것들이다. 구조 의존적이지만 가중치는 독립적이다. 또 통제나 주권성이 높으나 구조 혁신은 다소 제한된다. KT '믿음 2.0'과 SK텔레콤 '에이닷엑스 3.1' 등이 이 등급에 포함된다. 이 국장은 "라마식 프롬 스크래치라고 미묘하게 봐야 할 것 같다"며 "학습 데이터나 토크나이저 자체 설계로 통제권을 어느 정도 확보했지만 핵심 블록은 여전히 동일해 구조에 제한이 있어 특허, 트렌드에 영향이 있을 것으로 보인다"고 짚었다. 'T5'는 구조까지 변형하고 가중치 자체 학습을 하는 것이다. 구조와 가중치 모두 완전 국산이며 주권성과 통제 가능성이 매우 높다. LG AI연구원이 개발한 '엑사원 4.0', 네이버 '하이퍼클로바 X 씽크', NC AI '바르코 LLM' 등이 대표 사례다. 이 국장은 "T5 등급은 통제권과 설명 가능성을 확보했다"며 "그러나 막대한 투자 및 컴퓨트, 데이터가 필요하므로 효율성 부분에서 우려도 있을 것 같다"고 설명했다. 가장 높은 등급인 'T6'은 T5 등급 요건에 칩, 프레임워크, IDC, 데이터까지 완전 자립한 단계다. 공급망, 법적 완전 통제가 가능하며 통제나 주권성이 최고 수준이다. 현재 국내에선 T6 등급 구현 사업을 진행하고 있는 상태로, 중국 워다오(WuDao), UAE 팔콘 인프라 등이 T6에 해당되는 것으로 분류된다. 이 국장은 "T6 등급이야말로 이상향으로, 우리가 추구해야 하는 방향"이라며 "한국은 풀스택 생태계를 가지고 있는 몇 안 되는 나라"라고 강조했다. 해외에선 파운데이션 모델을 T4~T5 등급과 비슷하게 본다. 파인 튠드 모델은 T1~T2, 인스트럭션 튠드, 언라인먼트 튠드는 T2~T3에 해당된다. 멀티모달, 익스퍼트 모델은 T3~T5쯤에 해당된다. 이 국장은 "CPT까지는 기존 모델 가중치를 전부 계승하는 만큼 리스크가 존재해 자체 모델이나 독자모델로 보기는 좀 한계가 있는 것 같다"며 "DUS부터는 레이어를 확장해 파라미터를 부분적으로 자산화해 주권성이 높아지는 만큼 여기부터는 어느 정도 독자기술이라고 할 수도 있을 것 같다"고 분석했다. 그러면서 "프롬 스크래치(T4)·커스텀 아키텍처(T5)·풀스택(T6)으로 올라갈수록 공급망과 정보보호 리스크가 줄어든다"며 "정부는 등급별 허용 위험 한도를 명확히 설정해 국방·안보·개인정보 업무 등에 최적화된 모델을 지정할 수 있을 것"이라고 평가했다. 또 그는 "T5, T6 모델 확보는 결과적으로 글로벌 협상 및 경쟁에서 협상력을 높이는데 매우 중요할 것 같다"며 "공공, 국방, 외교는 T4 이상이거나 왠만하면 T5, 일반적인 행정민원서비스는 T3부터, 민간 B2B는 T0부터 활용할 수 있지 않을까 싶다"고 덧붙였다. 이같은 이 국장의 의견에 업계에선 대부분 동의하는 분위기다. 많은 비용을 들여 자체 기술력으로 모델을 개발한 곳들이 '프롬 스크래치'라는 용어에 함께 포함돼 해외 오픈소스 모델의 아키텍처를 재설계해 만들어진 모델들과 비슷한 수준으로 평가되는 사례가 빈번해지고 있어서다. 이에 이 국장은 모델 생성 이력에 대해 제대로 인지하고 등급 체계를 정리하게 되면 평가의 투명성과 형평성이 확보된다는 점에서 긍정적인 효과가 있을 것으로 봤다. 또 동일한 벤치마크 점수라도 T0(외부 API 래핑)와 T5(맞춤형 구조·가중치 전면 자체 학습)는 위험 구조가 전혀 다르기 때문에 각 모델을 '같은 출발선'으로 정규화해 공정하게 비교할 수 있는 등급화가 선정 과정에 대한 논란을 최소화 할 수 있을 것으로 예상했다. AI 모델을 등급화 할 경우 소버린 AI 관점에서의 리스크를 계층별로도 관리할 수 있을 것으로 관측했다. CPT에 머무르는 T2 모델은 업스트림 라이선스·업데이트에 전적으로 묶여 있지만, DUS 기반 T3 모델은 신규 층을 자산화해 일부 독립성을 확보할 것으로 봤다. 이 국장은 "프롬 스크래치(T4)·커스텀 아키텍처(T5)·풀스택(T6)으로 올라갈수록 공급망과 정보보호 리스크가 줄어든다"며 "정부는 등급별 허용 위험 한도를 명확히 설정해 국방·안보·개인정보 업무 등에 최적화된 모델을 지정할 수 있을 것"이라고 평가했다. 이 외에도 이 국장은 등급 구별에 따라서 예산과 컴퓨트 자원의 효율적 배분, 국제 규제 대응력과 국민 신뢰도 확보, 산업·학계 대상 명확한 로드맵과 투자 시그널 제시, 소버린 AI 관점에서 국제 협상력 강화 등의 효과도 기대했다. 이 국장은 "T5·T6급 모델과 국산 칩·프레임워크가 결합하면 우리나라는 글로벌 표준 논의에서 기술적 레버리지를 확보하고 동시다발적 파트너십을 주도할 수 있다"며 "반대로 T0~T2 수준에만 계속 머무르면 '파인튜너 국가'로 규정돼 외부 의존이 심화될 위험이 있다"고 말했다. 업계에선 이 국장의 등급 구별 제안을 정부가 '독자 AI 파운데이션 모델 개발' 사업자 선정 심사 시 고려하길 기대했다. 과학기술정보통신부는 이날 오전 11시까지 '독자 AI 파운데이션 모델 개발' 사업과 관련된 PT 발표 자료를 1차 관문을 통과한 10개 컨소시엄에게 받은 상태로, 각 컨소시엄들은 오는 30~31일 20분 가량의 발표를 진행한다. 이번 PT 발표에 참여하는 컨소시엄은 지난 25일 첫 관문을 통과한 ▲네이버클라우드 ▲LG AI연구원 ▲모티프테크놀로지스 ▲카카오 ▲업스테이지 ▲KT ▲SK텔레콤 ▲코난테크놀로지 ▲NC AI ▲카이스트 등 10곳이다. 이들은 이번 발표에서 기술력 입증과 AI 모델 실증 사례 확산 계획을 제대로 증명해야 한다. 또 미리 제출한 5분 가량의 동영상에는 'AI 파운데이션 모델 개발 관련 역량'을 확인할 수 있는 내용이 담겨야 한다. 정부는 8월 초까지 사업비 심의·조정 등 절차를 거쳐 최종 5개 정예팀을 확정, 협약 체결을 완료할 예정이다. 선발된 정예팀은 첨단 그래픽처리장치(GPU), 데이터, 인재 등을 지원 받아 '국가대표 AI' 개발에 나서게 된다. 업계 관계자는 "지금까지 업체들이 참여기업, 수요기업을 끌어 모은 컨소시엄 구성을 통해 약점을 보완하는 동시에 기술력이 있다는 점을 자체 LLM 신모델 공개를 통해 강조하려 했다"며 "하지만 PT 발표에선 그간의 모델 개발 기술력뿐 아니라 '전 국민 AI' 개발에 맞는 기술력을 함께 가지고 있는지에 대해 증명을 해야 하는 것이 더 중요한 만큼, 이를 입증하는 것이 각 팀별로 쉽지 않을 것"이라고 내다봤다. 그러면서 "기술력을 제대로 설명하지 못하면 실증 문제는 사실 공허한 얘기가 될 것"이라며 "심사위원들에게 기술 측면에서 어떤 점을 전략적으로 각인시킬 것인지를 두고 많은 고민을 해야 할 것"이라고 덧붙였다.

2025.07.29 13:36장유미 기자

[유미's 픽] 국가대표 AI 선발, 오픈소스 비중·기술력·성능에 달렸다…新 모델 개발도 '관건'

이재명 정부의 핵심 국정 사업인 '글로벌 인공지능(AI) 강국' 꿈의 발판이 될 '국가대표 AI' 선정을 앞두고 사업 참여 의사를 밝힌 기업들이 잇따라 자체 개발한 추론 모델을 오픈소스로 개방하고 나섰다. 이번 정부 사업에선 '프롬 스크래치' 방식을 통한 기술력과 오픈소스 비중, AI 모델 성능이 당락을 좌우할 핵심 기준으로 지목되고 있다. 24일 업계에 따르면 지난 21일 마감된 '독자 AI 파운데이션 모델 개발 프로젝트'에는 총 15개 컨소시엄이 참여하는 것으로 집계됐다. 참가팀은 ▲네이버클라우드 ▲루닛 ▲모티프테크놀로지스 ▲바이오넥서스 ▲사이오닉에이아이 ▲업스테이지 ▲SK텔레콤 ▲NC AI ▲LG AI연구원 ▲정션메드 ▲카카오 ▲KT ▲코난테크놀로지 ▲파이온코퍼레이션 ▲한국과학기술원 등이다. 이 프로젝트는 글로벌 톱 수준의 국산 거대언어모델(LLM)을 만들겠다는 목표를 앞세워 추진하는 것으로, 정부에서 오는 2027년까지 약 2천136억원을 투입한다. 선발된 기업들은 정부로부터 그래픽처리장치(GPU)와 데이터, 전문 인력 등을 집중 지원받을 예정이다. 정부는 이번 선발전의 평가 기준을 크게 세 가지로 구분했다. 총점은 100점으로 ▲기술력 및 개발 경험(40점) ▲개발목표 및 전략·기술(30점) ▲파급효과 및 기여 계획(30점) 등을 눈여겨 볼 예정이다. 서면 평가는 이날부터 오는 26일까지 진행되며 총 10팀을 우선 선발한다. 서면 평가를 통과한 기업들은 이르면 26일, 늦어도 27일에 발표될 예정이다. PT 평가는 이달 30~31일에 진행되며 최종 사업자 발표는 8월 4~5일께 이뤄질 것으로 알려졌다. 심사위원 구성은 서면 평가가 7명 내외, PT 평가가 10명 내외인 것으로 전해졌다. 사업 초기에는 총 5개 기업이 우선 선발되며 이후 6개월 단위로 선별 축소할 예정이다. 성능·전략·파급효과 등을 기준으로 단계 평가를 거쳐 4개팀 → 3개팀 → 2개팀 식으로 줄여나갈 예정이다. 현재 업계에서 유력 후보로 보고 있는 곳은 네이버클라우드와 LG AI연구원, NC AI, 업스테이지 등으로 압축됐다. 또 해외 업체들과 활발한 협업에 나섰던 SK텔레콤, KT 등 통신사들은 정부가 이 프로젝트를 시작하며 대규모 자금 투입에 나서자 방향을 틀어 참여 의사를 밝힌 상태다. 중소·중견기업 중에선 코난테크놀로지도 사업자 선정에 대한 기대감을 높이고 있다. 카카오도 자체 개발한 LLM '카나나'를 앞세워 계열사의 다양한 서비스를 활용해 AI 모델 수요를 끌어 올릴 수 있다는 점을 경쟁력으로 내세운 것으로 전해졌다. 업계에선 기술 성숙도 측면에서 '프롬 스크래치(From Scratch·모델의 첫 단계부터 모두 직접 구축)'를 통한 AI 개발 경험이 핵심 기준이 될 것으로 봤다. 외국 거대언어모델(LLM)을 기반으로 파인튜닝하거나, 아키텍처를 재설계하는 식으로 모델을 만들어 본 경험만으로는 정부가 원하는 결과물을 내놓기 쉽지 않을 것으로 예상돼서다. 업계 관계자는 "정부가 '전국민 AI'에 쓸 AI 모델 수준을 현재 최고 수준으로 평가 받는 소타(SOTA·State-of-the-Art) 모델로 원하는 것으로 알고 있다"며 "이에 맞추기 위해선 '프롬 스크래치' 방식으로 300억 개(30B) 이상의 파라미터(매개변수)를 가진 대형 모델을 자체적으로 만들어 본 경험을 가지고 있어야 하는데, 여기에 맞는 기업이 손에 꼽힐 것으로 보여 유력 후보군이 상당히 압축될 수밖에 없다"고 봤다. 그러면서 "외국 AI 모델의 아키텍처를 재설계해 만든 모델임에도 최근 '프롬 스크래치' 방식이 주목 받기 시작하자 이를 마케팅으로 활용하는 기업들이 속속 나오고 있는 듯 하다"며 "해외 모델을 참고해 만들었음에도 '프롬 스크래치'라고 표현하는 것은 심사 위원뿐 아니라 업계 분위기를 흐리는 듯 해 '페이크 파운데이션 모델'로 분류하는 것도 필요해 보인다"고 지적했다. 업계에선 '프롬 스크래치' 방식을 그간 고집하며 대형 모델을 선보였던 네이버클라우드와 LG AI연구원, NC AI, KT가 이번 사업에서 다소 유리한 고지에 올랐다고 평가했다. 이들은 외국 회사의 오픈소스를 활용하지 않고 처음부터 끝까지 자체 기술만을 적용해 30B 이상의 대형 AI 모델을 개발해 본 경험이 있다. 코난테크놀로지, 카카오도 프롬 스크래치 방식으로 자체 모델을 개발했다고 주장하고 있다. 반면 업스테이지는 메타 '라마', 마이크로소프트(MS) '파이' 등 해외 빅테크 AI 모델의 아키텍처를 기반으로 재설계해 자체 LLM인 '솔라'를 선보이고 있다. SK텔레콤도 최근 '프롬 스크래치' 방식으로 만들었다고 강조하며 자체 LLM '에이닷엑스 3.1 라이트'를 공개했지만, 업스테이지와 동일하게 재설계된 모델인 것으로 알려졌다. 루닛과 컨소시엄을 구성한 트릴리온랩스가 지난 23일 공개한 자체 LLM '트리-21B'도 라마 등 해외 모델을 기반으로 한 것으로 업계에선 추정했다. 다만 회사 측은 '프롬 스크래치' 방식으로 그간 모델을 개발해왔던 만큼 이는 사실이 아니라는 입장이다. 정부는 일단 외국 AI 모델의 아키텍처를 재설계했을 경우에는 활용해도 된다는 입장이다. 기존 모델을 고도화할 경우 오픈AI 등 다른 회사와 라이센싱 이슈가 없어야 한다는 조건도 따로 내걸었다. 이는 국내에서 생산되는 양질의 중요 데이터가 자칫 외국으로 유출될 수 있다는 우려를 의식한 것으로 풀이된다. 업계 관계자는 "AI 모델을 자체 개발한 기업만 참가할 수 있게 한다면 대부분 국내 스타트업들은 어느 한 곳도 선발전에 참여할 수 없을 것"이라며 "정부가 이를 고려해 기준을 좀 더 넓게 본 것 같다"고 밝혔다. 그러면서 "이런 스타트업들은 현재 상태에선 프롬 스크래치 방식으로 AI 모델을 새롭게 만들 수 없는 상태"라며 "사업자로 선정된다고 해도 기존 모델을 업그레이드 하는 쪽으로만 방향성을 잡게 될 것"이라고 덧붙였다. 정부는 일단 독자 AI 모델 개발과 관련해 새로운 모델 개발 또는 기존 자체 모델을 고도화하는 방식을 모두 허용했다. 이 사업을 주도하고 있는 과학기술정보통신부는 어떤 방식이든 평가에 차등을 두지 않는다는 방침이다. 기존 자체 모델을 활용하는 곳은 LG AI연구원, KT가 대표적이다. 이들은 사업자로 선정됐을 시 기존에 선보였던 자체 LLM '엑사원', '믿:음'을 고도화 해 '전 국민 AI'로 활용하겠다는 계획을 밝혔다. 카카오도 자체 모델인 '카나나'를 활용해 모델 고도화 방향으로 전략을 짠 것으로 알려졌다. 반면 네이버클라우드, NC AI는 '전 국민 AI'에 맞춰 새로운 모델을 개발하는 것으로 방향을 잡았다. '프롬 스크래치' 방식으로 각각 '하이퍼클로바X', '바르코 LLM'을 개발해봤던 경험을 토대로 이미 기술력이 충분히 검증된 만큼, 한국에 특화된 LLM을 처음부터 새롭게 개발할 수 있다는 자신감을 내보이고 있다. SK텔레콤도 이달 들어 독자 구축 LLM인 '에이닷엑스'의 다양한 모델을 선보이고 있지만, 독자 AI 파운데이션 모델 사업자로 선정되면 새로운 모델 개발에 나설 것으로 파악됐다. 코난테크놀로지와 업스테이지 역시 새로운 모델을 개발한다는 계획이다. 이 같은 분위기 속에 일부 업체들은 자체 LLM을 오픈소스로 잇따라 공개하며 더 높은 점수를 받기 위해 고군분투하고 있다. 정부가 AI 모델 공개를 통해 국내 AI 생태계를 활성화시킬 수 있는지에 대한 여부도 주요 기준으로 삼고 있어서다. 네이버클라우드는 지난 22일 '하이퍼클로바 X 시드 14B 씽크'를 상업용으로 이용할 수 있는 무료 오픈소스를 공개했다. '하이퍼클로바 X 시드 14B 씽크'는 네이버의 독자 기술을 활용해 '프롬 스크래치'로 개발한 경량화 추론 모델로, 상용화된 해외 오픈소스 모델을 개조한 것이 아닌 원천기술로 추론 능력과 경량화 기술을 결합해 개발했다. 네이버클라우드는 추론모델을 연구용으로만 제한하지 않고 비즈니스에도 적용할 수 있게 이같은 결정을 내렸다. 다양한 산업 영역에서 만들어질 AI 에이전트의 기반 기술로 활용될 수 있게 함으로써 국내 AI 생태계를 한층 활성화시킬 것이란 방침이다. NC AI는 일찌감치 '바르코 LLM'을 학술적 용도뿐 아니라 상업적인 용도까지 활용할 수 있도록 오픈소스로 공개해왔다. 또 게임, 패션, 콘텐츠 등 다양한 산업군에서 실제 상용화된 AI 솔루션을 선보이고 있다는 점에서 이번 컨소시엄 구성에 국내 주요 대기업들이 대거 몰리기도 했다. 특히 오픈소스 모델 '바르코 비전 2.0'은 비전-언어 모델(VLM) 분야에서 최고 성능인 '소타'로 인정받아 눈길을 끌었다. LG AI연구원은 지난 해 8월 국내 최초로 연구용 오픈소스 모델인 '엑사원 3.0'을 공개했다. 같은 해 12월 공개한 '엑사원 3.5'는 국내 AI 모델 중 유일하게 스탠퍼드대에서 발간하는 AI 보고서에 포함돼 주목 받았다. 다만 최근 공개된 '엑사원 4.0'은 글로벌 오픈소스 AI 플랫폼 '허깅페이스'에 오픈웨이트(가중치 공개) 모델로만 공개했다. 또 LG AI연구원은 LG그룹 임직원 5만여 명이 사용하는 챗봇인 '챗엑사원'을 외부인도 사용해 볼 수 있도록 베타 버전을 공개해 문턱을 다소 낮췄다. 기업 사용자를 위한 API(애플리케이션인터페이스)도 공개해 '엑사원'을 다른 소프트웨어 개발에 사용할 수 있도록 했다. 기업들의 부담을 낮추기 위해 AI 모델 추론 서비스를 제공하는 스타트업 프렌들리AI와 손잡고 엑사원 API를 챗GPT의 10분의 1 가격으로 서비스하는 것도 강점으로 떠올랐다. 이와 별개로 LG AI연구원과 함께 컨소시엄을 구성한 것으로 알려진 LG CNS는 캐나다 AI 유니콘 기업 코히어와 손잡고 LLM 개발에 한창이다. 지난 5월 70억 파라미터의 한국어 특화 경량 LLM을 출시한 데 이어 두 달 만에 1천110억 개 파라미터를 갖춘 초대형 추론형 LLM을 공동 개발해 주목 받았다. 아직 이 모델들을 오픈소스로 공개하진 않았으나, 내부적으로는 검토 중인 것으로 전해졌다. 코난테크놀로지도 최근 매개변수 40억 개(4B) LLM '코난-LLM-IND'를 오픈소스로 공개했다. 이 모델은 중국 알리바바의 '큐원3'를 기반으로 한국어 최적화와 효율성 향상을 이뤘다는 평가를 받는다. 업스테이지는 신규 추론 AI 모델 '솔라 프로 2'를 중심으로 이번 정부 사업에 참여할 예정으로, 독립 LLM 성능 분석기관 아티피셜 애널리시스가 발표한 '지능 지표(Intelligence Index)'에서 국내 유일의 프런티어 모델로 선정돼 기술력을 입증했다. 이곳은 일찌감치 '솔라 10.7B'를 비롯한 여러 자체 모델을 허깅페이스 등 플랫폼에 공개했으며 해당 모델 가중치를 '아파치 2.0' 오픈소스 라이선스로 배포해 생태계 확장을 선도하고 있다는 평가를 받는다. SK텔레콤은 지난 11일 허깅페이스에 자체 LLM '에이닷 엑스 3.1 라이트'를 오픈소스로 공개했다. 70억 개(7B)의 매개변수를 기반으로 한 경량 모델로, 이 모델의 후속인 매개변수 340억 개(34B)의 프롬 스크래치 모델 '에이닷 엑스 3.1'을 조만간 오픈소스로 선보일 예정이다. KT 역시 지난 2023년 10월 공개한 '믿:음' 모델 중 70억 개 매개변수를 오픈소스로 제공했다. KT는 2천100억 개 매개변수를 가진 모델까지 개발하며 기술력을 과시한 바 있다. 업계 관계자는 "사업 당락은 독자 AI 모델의 오픈소스 공개 비중과 성능에 좌우될 것으로 예상된다"며 "정부가 AI 모델의 오픈소스 수준을 평가에 정밀하게 반영하고 정부 예산과 자부담 매칭 수준도 오픈소스 수준에 따라 차등화 한다는 방침을 세운 것으로 안다"고 말했다. 이어 "이번 사업은 LLM뿐 아니라 멀티모달 등 다양한 AI 모델 개발 역량과 자체 기술을 얼마나 활용하느냐에 따라 사업 성패가 갈릴 듯 하다"며 "정부가 이번에 업계에서 모두 인정할 만한 외국인 심사위원을 제대로 구성한 만큼, 이들이 여러 입김에 영향을 받지 않고 기술력으로만 공정한 심사를 할 것으로 기대된다"고 덧붙였다.

2025.07.24 09:03장유미 기자

[유미's 픽] 韓 대표 AI 선발전, '프롬 스크래치'가 핵심…컨소시엄 신경전 '치열'

글로벌 톱 수준의 거대언어모델(LLM)을 만들 '인공지능(AI) 국가대표 정예팀' 선발전이 본격화된 가운데 '프롬 스크래치(From Scratch·모델의 첫 단계부터 모두 직접 구축)'를 통한 AI 개발 경험이 핵심 기준으로 지목되고 있다. 외국 LLM을 기반으로 파인튜닝하거나, 아키텍처를 재설계하는 식으로 모델을 만들어 본 경험만으로는 정부가 원하는 결과물을 내놓기 쉽지 않을 것으로 예상돼서다. 10일 업계에 따르면 과학기술정보통신부가 추진하고 있는 '독자 AI 파운데이션 모델 개발 지원 사업'에 선정된 컨소시엄은 ▲새로운 자체 아키텍처를 설계하고 독자적 학습 알고리즘·기법을 적용해 AI 모델을 처음부터 개발하거나 ▲이미 갖고 있는 AI 파운데이션 모델을 추가 학습을 통해 고도화해도 된다. 하지만 최근 선보인 SK텔레콤의 '에이닷 엑스 4.0'처럼 해외 업체 AI 모델을 활용하면 안된다. '에이닷 엑스 4.0'은 중국 알리바바의 AI 모델 '큐원2.5'에 한국어 데이터를 추가로 학습시킨 모델로, 온프레미스(내부 구축형) 방식을 적용해 데이터 보안을 강화했다고는 하지만 정보 유출의 위험성을 우려하는 목소리들이 나오고 있다. 업계 관계자는 "에이닷 엑스 4.0이 한국어로 튜닝됐다는 이유만으로 이를 '한국형 모델'이라고 부르는 것은 맞지 않다"며 "모델의 '메모리'는 여전히 '큐원2.5'라는 점에서 큐원에서 학습한 불투명한 정보가 에이닷 엑스 4.0 내부에 그대로 내재돼 잘못된 결과물이 예기치 않게 출력될 가능성을 배제할 수 없다"고 지적했다. 이어 "큐원2.5는 메타 라마와 달리 학습에 어떤 데이터를 사용했는지, 어떻게 수집·정제했는지조차 밝히지 않아 불투명한 모델이라는 지적을 받고 있어 이를 활용한 에이닷엑스 4.0 같은 모델들이 공공망, 정부망에 도입되는 것을 철저하게 막아야 한다"며 "공공 AI는 성능이 아무리 뛰어나더라도 설명책임과 검증가능성이라는 핵심 요건을 충족시켜야 한다는 점을 이번에 심사할 때 꼭 고려해야 할 것"이라고 덧붙였다. 또 다른 관계자는 "이번 사업으로 진정한 '소버린 AI'를 실현하기 위해선 성능보다는 통제 가능성이 우선돼야 한다는 점을 정부가 명심해야 할 것"이라며 "AI 모델의 설계부터 폐기까지 전 생애주기에 걸친 자국 통제권이 확보돼야 하는 만큼 단순한 튜닝이 아닌 각 기업들이 원천 기술을 보유하고 있는지가 중요하다"고 강조했다. 정부도 이를 고려해 기존 모델을 고도화할 경우 오픈AI 등 다른 회사와 라이센싱 이슈가 없어야 한다는 조건을 따로 내걸었다. 이는 국내에서 생산되는 양질의 중요 데이터가 자칫 외국으로 유출될 수 있다는 우려를 의식한 것으로 풀이된다. 다만 외국 AI 모델의 아키텍처를 재설계했을 경우에는 활용해도 된다는 입장이다. 과기정통부 관계자는 "메타의 '라마'든, 알리바바의 '큐원'이든 외국 업체들의 AI 모델 아키텍처를 참고해 이를 우리나라 상황에 맞게 재설계 해 처음부터 만들었다면 이번 사업에 참여할 수 있다"며 "아키텍처를 그대로 쓰면서 파인튜닝한 AI 모델로는 참여할 수 없다"고 설명했다. 그러면서 "완전 재설계한 모델은 라이센스 이슈가 없을 뿐더러 거기에 들어가는 데이터도 각 업체가 보유한 것을 넣은 것이기 때문에 문제 없을 것으로 본다"며 "이 경우에는 처음부터 본인의 기술력으로 만들어진 것인 만큼 프롬 스크래치 방식으로 봐도 된다"고 덧붙였다. 이를 두고 업계에선 정부가 일부 중소업체들을 참여시키기 위해 사업자 선정 기준을 좀 더 열어둔 것으로 봤다. 예컨대 업스테이지의 경우 해외 빅테크 AI 모델의 아키텍처를 기반으로 재설계해 자체 LLM인 '솔라'를 선보이고 있다. 업스테이지는 이를 기반으로 이날 추론 모델도 공개했다. 업계 관계자는 "현재 선발전에 나올 기업 중 해외 기업 AI 모델의 아키텍처를 재설계해서 모델을 선보이는 곳은 업스테이지가 대표적인 것으로 안다"며 "AI 모델을 자체 개발한 기업만 참가할 수 있게 한다면 업스테이지 같은 스타트업들은 어느 한 곳도 선발전에 참여할 수 없어 정부가 이를 고려해 기준을 좀 더 넓게 본 것 같다"고 밝혔다. 그러면서 "이런 스타트업들은 현재 상태에선 프롬 스크래치 방식으로 AI 모델을 만들 수 없는 상태"라며 "사업자로 선정된다고 해도 기존 모델을 업그레이드 하는 쪽으로만 방향성을 잡게 될 것"이라고 덧붙였다. 업계에선 '프롬 스크래치' 방식이 아닌 외국 AI 모델을 기반으로 재설계하거나 파인튜닝을 한 것을 활용한 기업들이 그간 많았다는 점에서 이번 선발전의 문턱을 넘을 수 있는 곳이 많지 않을 것으로 예상했다. 또 프롬 스크래치 방식을 그간 고집하며 대형 모델을 선보였던 KT와 네이버클라우드, LG AI 연구원, NC AI 정도가 사업자 선정에 유리할 것으로 봤다. 이들은 외국 회사의 오픈소스를 활용하지 않고 처음부터 끝까지 자체 기술만을 적용해 AI 모델을 개발해 본 경험이 있다. 코난테크놀로지, 솔트룩스, 카카오도 프롬 스크래치 방식으로 자체 모델을 개발한 만큼 이번에 사업자로 선정될 것이란 자신감을 보이고 있다. 이 중 코난테크놀로지는 지난 2023년 4월 국내 중소형 업체 중 최초로 자체 LLM인 '코난 LLM'을 출시한 곳으로, 이번 선발전에서 유력 후보로 떠오르고 있다. 지난 5월 자체 개발 LLM '루시아3'를 공개한 솔트룩스 역시 중소업체 중에서 주목 받고 있다. 업계에선 정부가 최종 선발될 '독자 AI 파운데이션 모델 프로젝트' 참여 정예팀을 대기업 3팀, 중소기업 2팀 등 최대 5팀을 초기에 선발할 것으로 보고 있다. 업계 관계자는 "300억 개(30B) 이상의 파라미터(매개변수)를 가진 대형 모델을 자체적으로 만들어 본 국내 업체는 사실 손꼽힌다"며 "이번 선발전은 일부 대기업을 중심으로 경쟁이 치열해질 가능성이 높다"고 봤다. 그러면서도 "다만 LG, 네이버 같은 일부 대기업은 기존 AI 모델을 전 국민이 쓰는 모델로 키워 나가기엔 수익이 결부돼 있어 내부 설득이 만만치 않을 듯 하다"며 "KT, SK텔레콤 등 통신사들은 최근까지 소버린 AI를 부정하고 해외 유력 빅테크 업체들과 협업하려고 노력했다가, 정부의 정책 변경에 발 맞춰 이번 사업에 들어오려는 모습을 보였다는 점에서 사업자로 선정되기엔 아쉬운 점이 많다"고 덧붙였다. 공개적으로 이번 선발전 참여를 예고했던 기업들은 최근 컨소시엄 구성을 두고도 치열한 주도권 경쟁을 벌이고 있다. 컨소시엄을 어떤 곳과 함께 구성하느냐에 따라 자신들의 전략이 노출될 가능성이 높은 만큼, 보안 유지에도 각별히 신경쓰는 분위기다. 현재까지 이번 선발전에 관심을 보이며 설명회에 참여한 기업은 KT와 SK텔레콤, LG유플러스, LG AI 연구원, 카카오, 네이버, 포티투마루, 업스테이지, 코난테크놀로지, NC AI, 솔트룩스, 레블업, 트릴리언랩스, 트웰브랩스, 이스트소프트, 모티프테크놀로지스 등으로 알려져 있다. 정부는 이번 선발전의 평가 기준을 크게 세 가지로 구분했다. 총점은 100점으로 ▲기술력 및 개발 경험(40점) ▲개발목표 및 전략·기술(30점) ▲파급효과 및 기여 계획(30점) 등을 눈여겨 볼 예정이다. 업계 관계자는 "각 업체들은 자신들의 장·단점을 철저하게 분석한 후 단점을 잘 커버할 수 있는 스타트업, 대학 등과 컨소시엄을 구성하기 위해 물밑 작업을 치열하게 벌이고 있는 것으로 안다"며 "다만 국내에 있는 대부분의 기업, 대학 등이 이번 선발전에 참여할 것으로 보여 이를 제대로 객관적으로 평가해 줄 심사위원들을 정부가 확보했을 지가 가장 큰 관심사"라고 말했다. 또 다른 관계자는 "공공 AI의 핵심 요구사항에서 기술적 성능을 넘어선 설명 책임과 투명성, 국가 인프라로서의 신뢰성과 지속가능성, 향후 에이전트 간 연동 등 확장성을 고려해야 한다"며 "'잘 작동하는 AI'와 '책임질 수 있는 AI'는 별개의 문제라는 점을 기준으로 삼고 성능 대비 통제권을 잘 가질 수 있는 부분에 대해 심사 시 신중히 봐야 할 것"이라고 밝혔다.

2025.07.10 17:00장유미 기자

[유미's 픽] 알리바바 큐원 탑재한 SKT '에이닷엑스 4.0'…藥일까 毒일까

"2023년 12월 획득한 국내 정보보호 관리체계 인증(ISMS) 정책에도 한국 데이터를 외부로 반출하지 않는다는 게 필수입니다. 한국 데이터는 해외로 유출되지 않습니다." 지난 달 19일 기자간담회를 통해 이처럼 강조했던 알리바바 클라우드가 자사 인공지능(AI) 모델 '큐원'을 앞세워 SK텔레콤을 등에 업고 국내 시장 공략에 본격 나섰다. 올 초 오픈AI를 긴장하게 만든 딥시크에 이어 알리바바 '큐원'까지 영역 확장에 속도를 높이고 있지만, 중국 기업의 데이터 유출 우려 때문에 국내 시장에 제대로 안착할 수 있을지 주목된다. 6일 업계에 따르면 SK텔레콤이 지난 3일 공개한 AI 모델 '에이닷엑스 4.0'에는 알리바바의 오픈소스 거대언어모델(LLM)인 '큐원 2.5'가 적용된 것으로 파악됐다. 한국어에 맞게 SKT가 개량한 '에이닷엑스 4.0'은 특정 산업에 최적화된 '버티컬 AI 서비스'를 만든다는 목표로 만들어진 LLM으로, 오픈소스 커뮤니티 허깅페이스를 통해 A.X 4.0의 표준 모델과 경량 모델 2종이 공개됐다. 표준 모델은 720억개(72B), 경량 모델은 70억개(7B)의 매개변수를 갖추고 있다. 하지만 중국 기업의 AI 모델을 활용했다는 점에서 국외 정보 유출에 대한 의구심도 나오고 있다. SKT가 개인정보보호정책에 ▲이용자의 메시지나 답변은 저장하지 않는다 ▲이용자의 쿠키를 수집·저장하지 않는다 ▲기술적 보안과 프라이버시 보호를 위해 노력하겠다 등의 문구를 삽입하며 대응에 나섰지만, 우려를 불식시키기엔 미흡한 조치라는 평가가 나오고 있다. 특히 SKT를 활용하는 이용자들 사이에서 볼멘 소리가 나오고 있다. 누리꾼들은 "소식을 접하고 '에이닷' 어플을 바로 삭제했다", "중국산 AI 모델에 한국어를 학습시켰다고?", "중국 묻은 SKT, 빨리 탈출해야겠다" 등의 부정적인 반응을 내놓으며 실망감을 감추지 않았다. 업계 관계자는 "SKT가 유심 해킹 사건으로 고객들의 많은 신뢰를 잃은 상황에서 굳이 이미지가 좋지 않은 중국 AI 모델을 기반으로 파인튜닝 했다는 사실을 적극 알리는 것이 과연 득이 될 지 모르겠다"며 "한국어를 자체 데이터로 학습해 잘한다는 점을 내세우고 있지만 현 시점에서 이를 내놓은 것이 도움될 것 같진 않다"고 지적했다. 하지만 SKT는 'A.X 4.0'을 온프레미스(내부 구축형) 방식으로 제공하는 만큼, 기업 내부 서버에 직접 설치해 사용할 수 있어 데이터 보안에서 강점을 지녔다는 점을 적극 강조했다. 알리바바 클라우드 역시 지난 달 기자 간담회를 통해 중국계 기업에 대한 우려를 의식한 듯 보안과 컴플라이언스를 핵심 가치로 내세우며 '신뢰 받는 글로벌 파트너'로의 입지를 국내에서도 강화하겠다고 강조했다. 또 국내 투자 계획을 밝히며 사업 확장에 대한 의지도 내비쳤다. 알리바바 클라우드는 지난 2016년 국내 시장에 진출한 후 2022년 3월 국내 첫 데이터센터를 구축하고, 지난 달 서울에 또 다른 데이터센터를 가동한 상태다. 임종진 알리바바 클라우드 인텔리전스 수석 솔루션 아키텍트는 "중국의 데이터 보호법에 대해 구체적으로 말하긴 어렵지만, 글로벌 컴플라이언스 기준 150개 이상을 만족시키고 있다"며 "잠재 고객도 안전하게 운영할 수 있을 것이라고 자신 있게 말할 수 있다"고 말했다. 이를 기반으로 알리바바는 고객사들이 '큐원' 중심의 AI 오픈소스 생태계를 활성화하길 원했다. 또 SKT 외에도 자사 AI 모델을 활용한 사례를 공개하며 협업 확대에 대한 의지를 다졌다. 대표적인 곳이 AI 솔루션 기업 유니바다. 이곳은 알리바바 클라우드의 큐원 모델을 활용해 비용은 30% 절감하면서 한국어 처리 정확도를 45%에서 95%까지 끌어올린 에이전트 AI를 공개했다. 네이버 '스노우'는 알리바바 클라우드의 비디오 생성 모델 '완(Wan)'을 기반으로 중국 시장에서 개인화된 이미지 스타일링 기능을 제공 중이다. 라라스테이션은 알리바바 클라우드와 손잡고 글로벌 라이브 스트리밍 플랫폼을 개발해 동남아 시장으로 비즈니스를 확장하는 데 성공했다. 또 국내 시장 확대를 위해 메가존소프트·이테크시스템과도 협력 중이다. 윤용준 알리바바 클라우드 인텔리전스 한국 총괄 지사장은 "메가존소프트와 이테크시스템 외에 공개할 수는 없지만 대기업군 SI(시스템통합) 업체들도 파트너 에코에 이미 합류해 있다"고 밝혔다. 업계에선 '큐원'이 페이스북 모기업인 메타플랫폼의 '라마(LLaMA)'와 중국 딥시크 'R1' 모델을 제치고 사실상 전 세계 LLM 생태계에서 가장 빠르게 영향력을 키우고 있다는 점에서 SKT와 알리바바의 협업을 부정적으로만 봐선 안된다는 평가도 있다. 실제 '큐원' 모델은 현재 전 세계적으로 3억 건 이상 다운로드됐고 13만 개 이상의 파생 모델이 생성된 것으로 알려졌다. 특히 최신 모델 '큐원3-8B'의 지난 달 다운로드 수는 메타의 '라마-3.1-8B'를 거의 2배 앞섰다는 점에서 주목 받았다. 딥시크의 'R1' 시리즈 중 가장 인기 있는 최신 모델 '딥시크-R1-0528'에 비해서는 약 10배 많았다. 업계 관계자는 "큐원은 한국어 처리 능력과 온프레미스 버전에서 최적화가 가능해 산업별 맞춤형으로 튜닝을 거쳐 기업 차원으로 빠르게 확산되며 국내에서 존재감을 키우고 있다"며 "민간 데이터를 다루는 공공·금융에서도 온프레미스로 튜닝해 개발하거나 중소기업과 스타트업에서도 다양하게 튜닝하고 있다"고 말했다. 그러면서 "딥시크에 이어 큐원까지 중국 AI가 국내 산업 기반을 빠르게 장악할 것으로 예상된다"며 "향후 국내 기업 기술 완성도가 높아지더라도 기존 기술 장벽과 가격 등에서 후순위로 밀려날 가능성이 높다는 점에서 중국 AI 생태계에 종속될 것이란 우려도 높아지고 있다"고 덧붙였다.

2025.07.06 09:00장유미 기자

[유미's 픽] 삼성·SKT도 등판?…李 정부 '국가대표 AI' 선발전, 판 커질까

약 2천억원을 투입해 글로벌 톱 수준의 거대언어모델(LLM)을 만들 '인공지능(AI) 국가대표 정예팀' 선발전이 이달부터 본격화된 가운데 어떤 기업이 사업자로 선정될 지를 두고 관심이 높아지고 있다. 이재명 정부가 배경훈 과학기술정보통신부 장관 후보자와 하정우 AI미래기획수석을 앞세워 '한국형 챗GPT' 개발에 대한 의지를 강하게 보이고 있는 만큼, 선발된 기업들에 대한 지원도 파격적일 것으로 기대된다. 27일 업계에 따르면 과학기술정보통신부는 이날 오후 서울 강남구 포스코타워에서 '독자 AI 파운데이션 모델 프로젝트'와 관련해 기업들을 대상으로 설명회를 진행한다. 이 자리에는 그간 공개적으로 참여 의지를 보였던 LG AI 연구원을 비롯해 코난테크놀로지, 이스트소프트를 비롯해 네이버와 카카오, 엔씨 AI, 솔트룩스, 업스테이지 등이 참여할 예정이다. 이 중 가장 관심을 받고 있는 기업은 LG AI 연구원이다. 올 초 국내 최초로 추론형 AI 모델을 선보인 이곳은 그간 자체 AI 모델인 '엑사원'을 내세워 에이전틱 AI와 산업별 영역에서 활용도를 높였다는 평가를 받는다. 최근 과학기술정보통신부 장관 후보자에 지명된 배경훈 LG AI연구원장이 '엑사원'을 개발하는 데 큰 공을 들였던 만큼 사업자 선정에 대한 기대감을 키우고 있다. 하정우 AI미래기획수석을 배출해 낸 네이버도 유력 사업자로 꼽힌다. 하 수석이 네이버클라우드 AI 혁신센터장 시절 개발·운영을 총괄했던 자체 LLM '하이퍼클로바X'를 기반으로 소버린 AI 구축을 늘 강조해왔던 탓이다. 카카오는 자체 개발한 AI 모델 '카나나'로 도전에 나설 예정이다. '카나나'는 최근 오픈소스로 공개한 모델이 한국어 LLM 성능 평가를 위해 설계된 벤치마크 플랫폼 '호랑이(Horang-i)' 리더보드에서 8B 사이즈(매개변수 80억 개) 이하 모델 가운데 1위를 차지하기도 했다. 카카오는 '카나나를 지속해 개발하는 한편, 국산 AI 경쟁력을 강화하기 위해 일부 모델을 오픈소스로 계속 제공할 예정이다. 국내 최초로 LLM을 개발한 코난테크놀로지도 충분히 경쟁력이 높다는 평가를 받는다. 지난 2023년 8월 131억 파라미터 규모의 모델 학습을 완료한 후 선보인 '코난 LLM'은 현재 한국남부발전, 한국중부발전, 국방부, 행정안전부, 국회사무처, 인천국제공항공사 등 주요 공공기관을 비롯해 한화손해보험, 신한라이프, KB증권, 제주항공 등 민간 분야까지 다양한 산업 전반에 걸쳐 구축 및 PoC를 수행해 생산성 향상을 이끌고 있다. 또 코난테크놀로지는 지난 5월 추론 모델 '코난 LLM ENT-11'도 공개해 주목 받았다. 최근에는 AI 반도체 스타트업 리벨리온과 손잡고 '국산 AI 인프라' 구축에도 속도를 내고 있다. 리벨리온의 신경망처리장치(NPU)에 코난테크놀로지의 생성형 AI 기술을 접목해 국산 기술 기반의 독자적 AI 생태계를 구축하고 장기적으로 소버린 AI 기술 자립도를 높인다는 구상이다. 이스트소프트는 자체 개발한 '앨런 LLM'을 최근 정식 출시하며 도전장을 던졌다. 이곳은 AI 검색 엔진 서비스 '앨런'을 바탕으로 검색 증강 생성(RAG) 기반 보고서 생성과 추론에 특화된 오픈소스 기반의 '앨런 LLM'을 만들었다. 이 모델은 데이터센터용 초거대 모델부터 온디바이스용 경량 모델까지 구성된 것이 특징이다. 솔트룩스도 이번 프로젝트에 많은 관심을 보이고 있다. 이곳은 지난 달 말 언어 생성과 이해에 특화된 '루시아3 LLM'을 공개했다. 업스테이지도 자체 LLM '솔라'를 앞세워 도전에 나설 예정으로, 최근에는 이를 고려해 국내 반도체 업체인 퓨리오사AI와 협업에 나섰다. 이번 일을 통해 '솔라'를 퓨리오사AI의 차세대 NPU '레니게이드'에 최적화 해 탑재할 예정이다. 또 두 회사는 NPU 기반으로 구동하는 온프레미스 AI 구축 사업을 공동 추진하고 국내는 물론 글로벌 시장 공략에도 함께 나설 방침이다. NC AI도 최근 다크호스로 떠올랐다. 엔씨소프트의 14년 연구 노하우를 바탕으로 올해 2월 분사한 이곳은 자체 개발한 LLM '바르코 LLM'을 앞세워 게임, 패션, 콘텐츠 등 다양한 산업군에서 실제 상용화된 AI 솔루션을 선보이고 있어 사업자로 선정되기에 최적화돼 있다는 평가를 받는다. 또 NC AI는 '바르코 LLM'을 학술적 용도뿐 아니라 상업적인 용도까지 활용할 수 있도록 오픈소스로 공개함으로써 '모두의 AI'에 기여한다는 계획이다. 일각에선 SK텔레콤, 삼성전자도 도전할 가능성이 있다고 봤다. 팀 단위로 사업 제안이 가능한 만큼, SK텔레콤이 K-AI 얼라이언스를 운영하고 자체 GPT 개발 경험이 있다는 점을 앞세워 이번에 나설 것으로 예상했다. 삼성전자는 사내에서 사용하고 있는 자체 거대언어모델(LLM) '삼성 가우스'가 있다는 점에서 참여를 할 것이란 기대감이 나온다. 과기정통부는 오는 7월 말께 최종 선발될 '독자 AI 파운데이션 모델 프로젝트' 참여 정예팀을 최대 5곳으로 선정한 뒤 6개월 단위로 선별해 축소한다. 성능·전략·파급효과 등을 기준으로 단계 평가를 거쳐 4개팀 → 3개팀 → 2개팀 식으로 줄여나가는 식이다. 정예팀 선정은 다양한 분야의 국내외 AI 전문가들이 참여하는 위원회를 구성해 진행한다. 국민 AI 접근성 증진, 공공·경제·사회 AI 전환 지원 등 국내 기여계획을 정예팀에 제시하도록 해 선정평가에 반영한다. 참여기업 규모와 오픈소스 수준에 따라 정예팀 자원 매칭 비율은 차등화할 예정이다. 대기업 3팀, 중소기업 2팀이 초기에 선발될 것으로 보는 것이 업계 중론이다. 처음 진행될 6개월 단위 단계 평가는 오는 12월로 예정돼 있다. 평가 기준은 ▲컨테스트 기반 국민·전문가 평가 ▲국내외 벤치마크와 한국어 성능·안전성 검증체계 기반 검증평가 ▲파생 AI모델 수 기반의 파생평가 등이 연계되는 입체적 평가가 추진된다. 업계 관계자는 "정부가 정예팀으로 선발된 컨소시엄에 지난 1차 추가경정예산으로 확보한 GPU 1만 장 사용을 지원하기로 돼 있다는 점에서 많은 기업들이 관심을 가지는 듯 하다"며 "정부가 추진하는 이번 독자 AI 파운데이션 모델은 실제 세계 톱(Top) 수준의 모델을 만든 경험이 있는가, 전 국민 AI로 공개할 수 있는가 등의 조건이 제일 중요한 듯 하다"고 말했다. 이어 "정부가 이날 진행하는 설명회 자리에서 평가 기준을 어떻게 삼을지에 따라 참여할 수 있는 기업들이 다소 걸러질 듯 하다"고 덧붙였다. 일각에선 정부가 헛돈을 쓰는 게 아닌지에 대한 우려를 내놓기도 했다. 기업들이 예산 지원을 받아 LLM 생태계를 구축한다고 해도 결국 갈라파고스가 될 것이란 판단에서다. 업계 관계자는 "챗GPT, 제미나이 등 글로벌 기업들의 AI 모델이 표준이 된 상황에서 이들의 95% 수준인 K모델을 쓰다간 AI 생태계에서 배제될 수도 있다"며 "국내 기업들의 AI 모델 경쟁력이 자본력을 앞세운 글로벌 기업을 따라가기에도 쉽지 않다는 점을 고려하면, 결국 K모델을 개발해 놓고 활용을 제대로 못하는 상황이 벌어질 수도 있다"고 짚었다. 그러면서 "자체 AI 모델 개발에 예산을 투입할 것이 아니라 K-컬처가 해외에서 빠르게 확산된 것처럼 우리만의 AI 콘텐츠 개발에 주력하는 것이 좀 더 효용 가치가 높을 수 있다"며 "정부에서도 AI 인프라에만 힘을 쏟을 것이 아니라 AI를 활용한 콘텐츠 개발에도 함께 나서야 할 것"이라고 피력했다.

2025.06.27 11:53장유미 기자

관세 전쟁 '최대' 피해자…테슬라 美·中 사업 직격타

미국, 중국 간 관세 수위가 점차 고조되는 가운데 테슬라가 현지 사업에 상당한 타격을 입는 등 최대 피해자가 됐다는 분석이 나왔다. 미국이 자동차 산업에 대한 관세를 검토할 당시에는 상대적으로 테슬라가 수혜를 입을 것으로 관측된 것과 상반된 결과가 나온 셈이다. 20일 업계에 따르면 자동차 관세의 경우 초안과 달리 캐나다, 멕시코에 대해선 면제를 결정하면서 파급력이 크게 줄어들었다. 반면 국가별 상호관세 수위는 예상을 상회하면서 미국과 중국의 사업 비중이 큰 테슬라가 직격타를 맞게 됐다. 현재 미국은 중국산에 145%의 관세를, 중국은 미국산에 125%의 관세를 부과하고 있다. 로이터 통신 등 외신에 따르면 테슬라는 최근 사이버캡, 테슬라 세미 모델의 중국산 부품 조달 계획을 중단한 것으로 전해졌다. 핵심 원인이 관세로 꼽혔다. 해당 사안 관련 소식통은 상호관세 발표 직후 중국산 관세가 34%로 정해졌을 당시만 해도 부품을 계획대로 조달하려 했지만, 관세가 세 자릿수까지 치솟으면서 이 계획을 중단하게 됐다고 전했다. 테슬라는 사이버캡을 텍사스주, 테슬라 세미는 네바다주 공장에서 양산을 준비하고 있다. 사이버캡은 내년, 테슬라 세미는 올해 말로 양산 시점이 잡혀 있다. 중국 사업에도 어려움을 겪고 있다. 최근 테슬라는 중국 웹사이트와 SNS 등에서 모델S와 모델X 신규 주문 접수를 중단했다. 이와 관련해 구체적 설명을 내놓진 않았지만, 업계에선 관세 인상이 영향을 줬을 것이란 해석을 내놓고 있다. 모델S와 모델X는 미국 캘리포니아주 공장에서 생산돼 중국에 수출되고 있기 때문이다. 테슬라는 전체 매출의 약 50%는 미국에서, 30% 가량을 중국에서 거두는 등 양국 사업 비중이 상당한 편이다. 양국 간 무역 갈등이 지속될 경우 사업에 미칠 악영향이 클 전망이다. 도널드 트럼프 미국 행정부는 중국 외 국가에 대해서도 관세 압박을 행사하며 무역 갈등을 심화시키고 있다. 이런 가운데 일론 머스크 테슬라 최고경영자(CEO)가 트럼프 행정부의 정부효율부 수장으로 활동하는 등 밀접한 행보를 보이자 소비자 불매 운동도 여러 국가에서 나타나고 있다. 올해 1분기 차량 인도량도 33만6천681대로 전년 동기 대비 13% 감소한 수치를 기록했다.

2025.04.20 18:00김윤희 기자

Prev 1 Next

ZDNet 검색 페이지

'모델 s'통합검색 결과 입니다. (20건)

[유미's 픽] 젠슨 황 만난 LG·SKT·업스테이지…독자 AI 2차전 변수될까

[유미's 픽] "독파모 잊었다"…NC AI, 국방·산업·콘텐츠로 특화 AI 승부수