• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
인공지능
배터리
양자컴퓨팅
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'언어'통합검색 결과 입니다. (186건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

[AI는 지금] "국가대표 AI에 사활 건다"...선발전 앞두고 新 LLM 쏟아지는 이유는?

정부의 '독자 AI 파운데이션 모델' 프로젝트 공모가 오는 21일 마감되는 가운데 국내 주요 빅테크와 인공지능(AI) 스타트업들이 일제히 차세대 거대언어모델(LLM)을 선보이며 기술 경쟁에 불을 지폈다. 11일 업계에 따르면 '독자 AI 파운데이션 모델' 프로젝트는 최대 5개 AI 기업을 선정해 연간 100억원 규모 이상의 그래픽처리장치(GPU), 데이터, 인재 유치 비용 등을 지원하고 6개월 단위 경쟁을 거쳐 최종 모델을 압축하는 서바이벌 방식으로 진행된다. 이같은 상황 속에서 대기업, 통신사, 스타트업을 망라한 등 주요 AI 기업들이 새로운 LLM을 공개하며 출사표를 던졌다. 국가대표 AI 경쟁 뛰어든 기업들…핵심 모델과 전략은? SK텔레콤은 11일 오픈소스 커뮤니티를 통해 자체 개발한 경량 LLM '에이닷엑스 3.1 라이트(A.X 3.1 lite)'를 공개했다. 70억 파라미터 규모의 이 모델은 설계부터 학습까지 전 과정이 자체 기술로 제작된 '프롬 스크래치' 방식임을 강조했다. 이달 중에는 340억 파라미터의 중형 모델도 추가 공개하며 기술력을 과시할 예정이다. 김태윤 SK텔레콤 담당은 "꾸준히 쌓아 온 한국형 LLM 개발 역량을 바탕으로 AI 생태계 자립성을 높이겠다"고 말했다. 업스테이지는 지난 10일 310억 파라미터 규모의 '솔라 프로 2(Solar Pro 2)'를 출시하며 추론형 AI 시장에 본격적으로 진입했다. 질의응답용 '챗 모드'와 논리적 사고 기반의 '추론 모드'를 전환하는 하이브리드 방식이 특징으로, 실무 작업을 자율 수행하는 에이전트 구조까지 갖춰 글로벌 최상위 모델과 경쟁하겠다는 포부를 밝혔다. 김성훈 업스테이지 대표는 "자체 기술로 구현한 LLM으로 업무 방식을 근본적으로 혁신할 것"이라고 말했다. 같은 날 LG CNS도 캐나다 코히어(Cohere)와 협력해 개발한 1천110억 파라미터의 초대형 추론형 LLM을 선보였다. 초대형 규모임에도 2장의 GPU로 구동 가능한 고압축 기술을 핵심 경쟁력으로 내세웠다. 다만 LG CNS는 정부 프로젝트 직접 참여 여부를 밝히지는 않은 상태다. KT 역시 지난 3일 자체 개발한 '믿음 2.0' LLM을 오픈소스로 공개하며 '한국적 AI' 개발을 기치로 내걸었다. '믿음 2.0'은 법률, 특허 등 양질의 한국어 데이터를 학습하고 자체 토크나이저를 적용한 '토종 AI'임을 강조하며 115억 파라미터 '베이스' 모델과 23억 파라미터 '미니' 모델 2종을 선보였다. 신동훈 KT 젠AI랩장은 기술 자립에 대해 "기간통신사업자로서 생성형 AI 원천기술을 반드시 확보해야 한다"고 강조했다. 이외에도 네이버는 지난달 30일 멀티모달 추론 기능을 강화한 '하이퍼클로바X 씽크'를, 이스트소프트는 지난달 17일 검색증강생성(RAG)에 특화된 '앨런 LLM'을 출시하며 경쟁에 가세했다. 이같이 지난달부터 기술 발표가 집중된 가운데 AI 주도권 확보를 위한 물밑 경쟁은 그 이전부터 치열하게 이어져 왔다. 코난테크놀로지는 지난 3월 추론 기능을 통합한 320억 파라미터 모델 '코난 LLM ENT-11'을 출시하며 효율적인 코딩 성능을 과시했다. 솔트룩스 역시 지난 5월 복잡한 질문에 깊게 사고하는 320억 파라미터의 '루시아 3'를 선보이며 독자 기술력을 입증했다. LG그룹의 AI 개발을 주도하는 LG AI연구원의 행보도 주목된다. 지난 3월 추론 특화 모델 '엑사원 딥'을 선보인 데 이어 오는 22일에는 이를 통합한 차세대 모델 '엑사원 4.0' 공개 행사를 예고했다. 프로젝트 신청 마감 직전에 기술력의 정점을 보여주려는 핵심적인 전략적 포석으로 풀이된다. 게임업계와 신흥 스타트업의 도전도 거세다. 엔씨소프트의 AI 전문 자회사 NC AI는 지난해 자체 개발 '바르코 LLM'을 오픈소스로 공개하며 콘텐츠 생성 분야의 기술력을 선보였던 바 있다. 네이버클라우드 AI 연구자 출신의 신재민 대표가 설립한 트릴리온랩스 역시 한국어에 특화된 210억 파라미터 모델을 이르면 이번주 내에 공개할 예정으로, 정부 프로젝트 참여 의사를 분명히 하고 있다. K-LLM 쏟아지는 진짜 이유…"기술 증명 넘어 미래 표준 본다" 업계에서는 이같이 AI 기업들이 일제히 신기술을 공개하며 프로젝트에 사활을 거는 이유 중 하나를 '증명'에 있다고 본다. 프로젝트 참여 의사를 알리는 신호를 넘어 심사 과정에서 가장 중요한 평가 요소인 '독자 기술력'을 시장과 정부에 선제적으로 증명하려는 의도라는 것이다. 장기적으로는 정부가 내건 '전 국민 AI' 시대의 표준 모델이 되겠다는 보다 큰 야망도 깔려 있다. 프로젝트의 최종 승자는 '모두의 AI' 등 향후 공공 및 정부 시스템에 도입될 AI의 표준을 선점해 막대한 후속 사업 기회를 거머쥘 수 있기 때문이다. 동시에 연간 수백억 원에 달하는 GPU·데이터·인재 등 파격적인 지원을 통해 단숨에 글로벌 수준으로 도약할 수 있다는 현실적인 목표 역시 중요한 동기다. 한 업계 이익단체 관계자는 "이번 프로젝트에는 LLM 기업뿐만 아니라 AI 서비스 기업들도 콘소시엄 형태로 사활을 걸고 뛰어들고 있다"며 "이는 '독자 파운데이션' 사업이 단순히 개발에만 집중된 것이 아니라 실제 수요로도 이어지기 때문"이라고 평가했다. 이번 기술 경쟁은 최근 국내 LLM의 발전 방향을 명확히 보여준다는 점에서도 의미가 깊다. 단순히 패러미터 크기를 늘리던 양적 경쟁에서 벗어나 복잡한 문제를 논리적으로 해결하는 '추론(Reasoning)', 스스로 도구를 사용해 과업을 완수하는 '에이전트(Agent)', 텍스트와 이미지를 함께 이해하는 '멀티모달(Multimodal)' 기능이 핵심 화두로 떠올랐기 때문이다. 한 업계 전문가는 "개발자들 사이에서도 이제는 LLM 벤치마크 점수가 실제 성능을 온전히 대변하지 못한다는 공감대가 형성되고 있다"며 "결국 해외 선도 기업들처럼 실제 비즈니스 문제를 해결할 수 있는 추론 능력과 에이전트 구현 가능성이 기술력의 새로운 척도가 되고 있는 상황"이라고 설명했다.

2025.07.11 17:19조이환

업스테이지, '추론형 AI' 상용화로 정면 승부…"글로벌 LLM 판 흔든다"

생성형 인공지능(AI) 산업의 추론형 모델 전환이 본격화된 가운데 업스테이지가 국내 스타트업 최초로 글로벌 경쟁 모델과 어깨를 나란히 하는 추론 모델을 완성했다. 업스테이지는 10일 차세대 거대언어모델(LLM) '솔라 프로 2(Solar Pro 2)'를 공개했다. 이 모델은 파라미터 규모를 310억으로 확대했으며 고도화된 추론 능력을 갖춘 '하이브리드 모드'를 도입한 것이 특징이다. 사용자는 빠른 질의응답을 위한 '챗 모드'와 논리적 사고 기반의 '추론 모드'를 상황에 따라 선택할 수 있다. '솔라 프로 2'는 수학 문제 풀이 성능을 측정하는 '매스500', 코딩 과제 해결력을 평가하는 '에스더블유이(SWE) 벤치', 종합 지식 기반의 추론 능력을 보는 '엠엠엘유(MMLU) 프로' 등 고난도 벤치마크에서 오픈AI 'GPT-4o', 딥시크 'R1', 미스트랄 '스몰 3.2'와 유사한 성능을 기록했다. 특히 '생각의 사슬(CoT)' 기법을 적용한 추론 모드가 뚜렷한 성능 향상을 이끌었다. 한국어 성능도 주목할 만하다. '솔라 프로 2'는 케이오-엠엠엘유(Ko-MMLU), 해례(Hae-Rae), 아레나-하드-오토(Arena-Hard-Auto) 등 벤치마크에서 글로벌 오픈모델을 넘어서는 결과를 보였고 어휘와 문맥 이해는 물론 금융·법률·의료 등 전문 분야 질의에도 실효성 있는 답변을 도출하는 수준에 도달했다. 모델 구조도 기능 중심으로 진화했다. 단순 문장 응답을 넘어 사용자의 의도를 파악하고 외부 도구를 호출해 실질적인 결과물을 도출하는 '에이전트형 LLM' 구조가 탑재됐다. 일례로 실시간 웹 검색, 정보 정리, 프레젠테이션 초안 작성까지 일련의 업무를 자율적으로 수행할 수 있다. 업계에서는 최근 국내 대기업들이 잇따라 추론 특화 모델을 공개한 데 이어 업스테이지가 스타트업 최초로 이 영역에 진입한 점에 주목하고 있다. LG AI연구원은 지난 3월 다중 입력을 처리하는 멀티모달 기반의 에이전트형 LLM '엑사원 2.0'을 선보이며 본격적인 추론 경쟁에 가세했다. 네이버도 지난달 '하이퍼클로바X 씽크'를 공개하며 언어와 시각 정보를 모두 다루는 추론 구조를 구현한 모델을 제시했다. 이어 업스테이지가 상용 모델을 내놓으면서 국내 LLM 개발 주체는 대기업에서 벤처로까지 외연을 넓히는 양상이다. 김성훈 업스테이지 대표는 "'솔라 프로 2'는 단순히 말을 잘하는 AI가 아니라 문제를 이해하고 논리적으로 사고하며 실질적인 행동까지 수행하는 AI 에이전트"라며 "자체 기술로 구현한 세계 최고 수준의 LLM을 기반으로, AI가 업무 방식을 근본적으로 혁신하고 '일의 미래'를 앞당길 수 있도록 기술을 고도화해 나가겠다"고 밝혔다.

2025.07.10 08:00조이환

코난테크놀로지, LLM 탑재 AI PC 조달청 '등록'…공공시장 '정조준'

코난테크놀로지가 자체 거대언어모델(LLM)을 탑재한 인공지능(AI) PC의 공공 조달 체계를 확보하며 시장 진입을 본격화했다. 온디바이스 생성형 AI 시스템을 전면에 내세운 만큼 공공기관 특화 요구를 정조준했다는 평가다. 코난테크놀로지는 TG삼보와 협력해 AI PC '코난 AI스테이션(AIStation)'을 조달청 나라장터 종합쇼핑몰에 공식 등록했다고 9일 밝혔다. 이에 따라 공공기관은 해당 장비를 별도 입찰 없이 조달청을 통해 직접 구매할 수 있게 됐다. 이 제품은 코난테크놀로지가 자체 개발한 한국어 특화 LLM을 탑재한 AI 내장형 PC다. 사양별로 보급형과 고급형 두 가지 모델로 등록됐으며 고급형에는 64기가바이트 '디디알5(DDR5)' 메모리와 엔비디아 '알티엑스 4070(RTX 4070)' 칩이 장착됐다. 실시간 문서 분석, 보고서 작성, 생성형 AI 기반 행정처리에 최적화된 구성이란 설명이다. 기기는 인터넷 연결 없이도 윈도우 환경에서 생성형 AI 기능을 실행할 수 있다. 모든 연산이 로컬에서 이뤄져 민감 정보의 외부 유출 위험을 원천 차단할 수 있도록 설계됐다. 이는 공공 업무 특성상 클라우드 기반 AI 사용에 제약이 있는 기관들에게 현실적인 대안이 될 수 있다. 코난테크놀로지와 TG삼보는 지난 5월 자사 행사에서 연간 40만 대 규모의 공공 조달 시장 공략 계획을 밝힌 바 있다. 이번 등록은 이 계획의 실질적 첫걸음으로, 조달 등록과 동시에 현장 영업 확대도 병행되고 있다. 영업은 TG삼보가 하드웨어 공급을, 코난테크놀로지가 LLM 기반 소프트웨어를 제공하는 구조다. TG삼보는 10여 년간 정부 납품 1위 자리를 지켜온 기업으로, 기존 공공 유통망을 활용한 빠른 확산이 가능할 것으로 보인다. 김영섬 코난테크놀로지 대표는 "생성형 AI 어플라이언스 판매 확대를 위한 첫걸음을 내디뎠다"며 "공공 시장 점유율을 끌어올리고 매출 성장에 박차를 가하겠다"고 밝혔다. 지승현 TG삼보 대표는 "이번 등록이 전국 공공기관 공급 확대의 전환점이 될 것"이라고 강조했다.

2025.07.09 15:04조이환

[기고] 가장 쉽고 빠르게 AI 서비스를 구축하는 방법, 문서중앙화

최근 '소버린 AI'에 대한 기업·정부·언론의 관심이 급격히 높아지고 있다. 관심의 본질은 데이터 주권(Data Sovereignty)에 있다. 인공지능(AI)이 신뢰할 수 있는 결과를 내기 위해서는 반드시 기업 고유의 데이터, 더 나아가 자국 경계 안에 존재하는 데이터를 기반으로 작동해야 한다는 공감대가 형성된 것이다. 실제 레퍼런스 구현 방식으로는 검색증강생성(RAG) 아키텍처가 가장 많이 거론된다. 대규모언어모델(LLM)이 자체 지식을 최소화하고 사내 문서를 검색해 응답을 생성하기 때문에 데이터 주권·보안 요구에 부합하기 때문이다. 그러나 현장의 목소리는 "첫 단추부터 막힌다"는 데 모아진다. 핵심 병목은 데이터 품질 확보다. 가트너는 AI 도입 성공을 위해 지속적인 데이터 정렬, 검증, 그리고 거버넌스를 핵심 요소로 제시한다. 많은 기업이 그 중요성을 인지하고 있음에도 불구하고 실제 실행이 어려운 이유는, 데이터 관리 체계를 처음부터 새로 구축하고 정의하는 작업이 어렵고 복잡하기 때문이다. 이로 인해 데이터 품질이 낮아지면 AI 학습에 사용할 수 있는 데이터 양이 부족해지고, 권한 관리 미흡이나 기밀 정보의 노출 위험, 결과의 신뢰성 부족 등 다양한 운영 리스크로 이어질 수 있다. 그런데 이러한 관리 체계가 이미 최적화된 형태로 제공되는 플랫폼이 존재한다. 바로 문서중앙화 플랫폼이다. 이 플랫폼은 파일의 수집부터 폐기까지 원시 데이터를 체계적으로 저장·관리할 수 있다. 이 플랫폼은 기업들이 겪는 데이터 관리의 어려움을 대부분 해결할 수 있다. 분산되고 파편화된 파일을 중앙 집중식으로 저장하고, 개인 중심의 저장 방식을 업무 중심의 분류 체계로 전환하며, 소유권·권한 관리, 파일의 이력과 버전 관리, 보안 정책 적용 및 메타정보의 구성까지 통합적으로 관리한다. 기업내의 비정형 데이터의 통합 스토리지 역할을 하고, 이 데이터 관리 체계와 권한 체계는 그대로 생성형 AI의 데이터 파이프라인과 연계될 수 있다. 결과적으로 문서 중앙화 플랫폼을 통해 지식화된 데이터는 자연스럽게 AI 처리 흐름으로 연결되어 자동으로 처리되며, 문서의 구조와 의미, 유사성 파악과 함께 보안 기준이 통합적으로 적용된다. 이를 통해 기업은 정보와 관리의 사각지대를 제거하고, AI 기반 서비스 운영에 필요한 신뢰성과 관리 효율성을 동시에 확보할 수 있게 된다 문서중앙화 플랫폼과 RAGOps의 통합은 3가지 핵심적인 특징을 제공한다. 첫 번째 "문서중앙화가 전처리의 시작점이자 AI의 기반이 된다" AI 서비스를 도입할 때 별도의 데이터 체계를 새로 구축하기보다, 기존의 문서중앙화 시스템을 데이터 기반으로 삼고 그 위에 AI를 접목하는 것이 핵심 전략이다. RAG옵스(Ops) 플랫폼을 기반으로, 데이터 파이프라인 자동화, 자연어 기반 검색, 요약, 회의록 생성 등 다양한 AI 서비스를 제공하며, 기존 문서중앙화에 AI 기능이 더해져 업무 효율성과 서비스 확장성이 크게 향상된다. 두 번째 "일관된 메타정보 체계를 통해 운영 가능한 AI를 만든다" AI가 안정적으로 운영되기 위해서는 데이터 운영체계와 AI 운영체계가 일관된 관리 기준을 공유해야 한다. 비정형 데이터만으로는 한계가 있으며, 이를 보완하는 표준화된 메타정보 체계가 필수적이다. 문서중앙화 플랫폼과 RAG옵스와 메타체계를 공유하며, 비정형 문서와 함께 메타 정보도 자동 연동·관리된다. 또한, 문서 의미 정보와 함께 등급·분류·관리 속성 등 메타정보까지 벡터화하여 저장함으로써, 검색 정확도와 생성 응답의 신뢰성을 크게 향상시키고, 운영 가능한 실용 AI로 발전시킨다. 세 번째, "RAG옵스 플랫폼을 통해 지속적인 개선과 확장이 보장된다" 문서중앙화 플랫폼의 AI 서비스는 RAG옵스 기반의 자동화된 AI 파이프라인을 통해 지속적으로 개선된다. 데이터 수집부터 임베딩, 검색, 생성까지 전 과정이 최적화되어 데이터 품질 향상에 기여하며, 평가 모델과 피드백 루프를 통해 응답 품질도 지속적으로 향상된다. 이를 통해 문서 기반 AI 시스템은 지속적인 발전과 운영 확장이 가능한 구조를 제공한다. 문서중앙화 플랫폼과 RAG옵스 플랫폼의 결합은 기업이 AI 시대의 복잡한 데이터 과제를 해결하고, AI의 진정한 잠재력을 안전하고 효율적으로 실현할 수 있는 견고한 기반을 제공한다. 인젠트의 도큐먼트(document) 플랫폼과 RAG옵스 결합은 이를 입증한다. AI를 빠르고 안전하게, 그리고 지속적으로 확장하려는 기업에게 문서중앙화는 가장 효율적이고 전략적인 선택지다. 기존 문서 자산을 체계적으로 관리하고 AI와 자연스럽게 연계함으로써, 데이터 기반 AI 서비스의 구현을 빠르고 효과적으로 가능하게 한다. 특히 RAG옵스 기반의 지속적인 개선 체계를 통해 AI 품질까지도 함께 진화할 수 있다는 점에서, 가장 실용적이고 전략적인 AI 도입 방식이라 할 수 있다.

2025.07.09 13:51박정권

[유미's 픽] 알리바바 큐원 탑재한 SKT '에이닷엑스 4.0'…藥일까 毒일까

"2023년 12월 획득한 국내 정보보호 관리체계 인증(ISMS) 정책에도 한국 데이터를 외부로 반출하지 않는다는 게 필수입니다. 한국 데이터는 해외로 유출되지 않습니다." 지난 달 19일 기자간담회를 통해 이처럼 강조했던 알리바바 클라우드가 자사 인공지능(AI) 모델 '큐원'을 앞세워 SK텔레콤을 등에 업고 국내 시장 공략에 본격 나섰다. 올 초 오픈AI를 긴장하게 만든 딥시크에 이어 알리바바 '큐원'까지 영역 확장에 속도를 높이고 있지만, 중국 기업의 데이터 유출 우려 때문에 국내 시장에 제대로 안착할 수 있을지 주목된다. 6일 업계에 따르면 SK텔레콤이 지난 3일 공개한 AI 모델 '에이닷엑스 4.0'에는 알리바바의 오픈소스 거대언어모델(LLM)인 '큐원 2.5'가 적용된 것으로 파악됐다. 한국어에 맞게 SKT가 개량한 '에이닷엑스 4.0'은 특정 산업에 최적화된 '버티컬 AI 서비스'를 만든다는 목표로 만들어진 LLM으로, 오픈소스 커뮤니티 허깅페이스를 통해 A.X 4.0의 표준 모델과 경량 모델 2종이 공개됐다. 표준 모델은 720억개(72B), 경량 모델은 70억개(7B)의 매개변수를 갖추고 있다. 하지만 중국 기업의 AI 모델을 활용했다는 점에서 국외 정보 유출에 대한 의구심도 나오고 있다. SKT가 개인정보보호정책에 ▲이용자의 메시지나 답변은 저장하지 않는다 ▲이용자의 쿠키를 수집·저장하지 않는다 ▲기술적 보안과 프라이버시 보호를 위해 노력하겠다 등의 문구를 삽입하며 대응에 나섰지만, 우려를 불식시키기엔 미흡한 조치라는 평가가 나오고 있다. 특히 SKT를 활용하는 이용자들 사이에서 볼멘 소리가 나오고 있다. 누리꾼들은 "소식을 접하고 '에이닷' 어플을 바로 삭제했다", "중국산 AI 모델에 한국어를 학습시켰다고?", "중국 묻은 SKT, 빨리 탈출해야겠다" 등의 부정적인 반응을 내놓으며 실망감을 감추지 않았다. 업계 관계자는 "SKT가 유심 해킹 사건으로 고객들의 많은 신뢰를 잃은 상황에서 굳이 이미지가 좋지 않은 중국 AI 모델을 기반으로 파인튜닝 했다는 사실을 적극 알리는 것이 과연 득이 될 지 모르겠다"며 "한국어를 자체 데이터로 학습해 잘한다는 점을 내세우고 있지만 현 시점에서 이를 내놓은 것이 도움될 것 같진 않다"고 지적했다. 하지만 SKT는 'A.X 4.0'을 온프레미스(내부 구축형) 방식으로 제공하는 만큼, 기업 내부 서버에 직접 설치해 사용할 수 있어 데이터 보안에서 강점을 지녔다는 점을 적극 강조했다. 알리바바 클라우드 역시 지난 달 기자 간담회를 통해 중국계 기업에 대한 우려를 의식한 듯 보안과 컴플라이언스를 핵심 가치로 내세우며 '신뢰 받는 글로벌 파트너'로의 입지를 국내에서도 강화하겠다고 강조했다. 또 국내 투자 계획을 밝히며 사업 확장에 대한 의지도 내비쳤다. 알리바바 클라우드는 지난 2016년 국내 시장에 진출한 후 2022년 3월 국내 첫 데이터센터를 구축하고, 지난 달 서울에 또 다른 데이터센터를 가동한 상태다. 임종진 알리바바 클라우드 인텔리전스 수석 솔루션 아키텍트는 "중국의 데이터 보호법에 대해 구체적으로 말하긴 어렵지만, 글로벌 컴플라이언스 기준 150개 이상을 만족시키고 있다"며 "잠재 고객도 안전하게 운영할 수 있을 것이라고 자신 있게 말할 수 있다"고 말했다. 이를 기반으로 알리바바는 고객사들이 '큐원' 중심의 AI 오픈소스 생태계를 활성화하길 원했다. 또 SKT 외에도 자사 AI 모델을 활용한 사례를 공개하며 협업 확대에 대한 의지를 다졌다. 대표적인 곳이 AI 솔루션 기업 유니바다. 이곳은 알리바바 클라우드의 큐원 모델을 활용해 비용은 30% 절감하면서 한국어 처리 정확도를 45%에서 95%까지 끌어올린 에이전트 AI를 공개했다. 네이버 '스노우'는 알리바바 클라우드의 비디오 생성 모델 '완(Wan)'을 기반으로 중국 시장에서 개인화된 이미지 스타일링 기능을 제공 중이다. 라라스테이션은 알리바바 클라우드와 손잡고 글로벌 라이브 스트리밍 플랫폼을 개발해 동남아 시장으로 비즈니스를 확장하는 데 성공했다. 또 국내 시장 확대를 위해 메가존소프트·이테크시스템과도 협력 중이다. 윤용준 알리바바 클라우드 인텔리전스 한국 총괄 지사장은 "메가존소프트와 이테크시스템 외에 공개할 수는 없지만 대기업군 SI(시스템통합) 업체들도 파트너 에코에 이미 합류해 있다"고 밝혔다. 업계에선 '큐원'이 페이스북 모기업인 메타플랫폼의 '라마(LLaMA)'와 중국 딥시크 'R1' 모델을 제치고 사실상 전 세계 LLM 생태계에서 가장 빠르게 영향력을 키우고 있다는 점에서 SKT와 알리바바의 협업을 부정적으로만 봐선 안된다는 평가도 있다. 실제 '큐원' 모델은 현재 전 세계적으로 3억 건 이상 다운로드됐고 13만 개 이상의 파생 모델이 생성된 것으로 알려졌다. 특히 최신 모델 '큐원3-8B'의 지난 달 다운로드 수는 메타의 '라마-3.1-8B'를 거의 2배 앞섰다는 점에서 주목 받았다. 딥시크의 'R1' 시리즈 중 가장 인기 있는 최신 모델 '딥시크-R1-0528'에 비해서는 약 10배 많았다. 업계 관계자는 "큐원은 한국어 처리 능력과 온프레미스 버전에서 최적화가 가능해 산업별 맞춤형으로 튜닝을 거쳐 기업 차원으로 빠르게 확산되며 국내에서 존재감을 키우고 있다"며 "민간 데이터를 다루는 공공·금융에서도 온프레미스로 튜닝해 개발하거나 중소기업과 스타트업에서도 다양하게 튜닝하고 있다"고 말했다. 그러면서 "딥시크에 이어 큐원까지 중국 AI가 국내 산업 기반을 빠르게 장악할 것으로 예상된다"며 "향후 국내 기업 기술 완성도가 높아지더라도 기존 기술 장벽과 가격 등에서 후순위로 밀려날 가능성이 높다는 점에서 중국 AI 생태계에 종속될 것이란 우려도 높아지고 있다"고 덧붙였다.

2025.07.06 09:00장유미

KAIST, 무한대 음성 학습·평가 가능한 언어모델 공개

이론적으로 무한대로 음성을 생성할 수 있는 음성언어모델(SLM)이 공개됐다. 이 모델은 영어로된 텍스트를 자연스럽게 음성으로 전달한다. KAIST(총장 이광형)는 전기및전자공학부 노용만 교수 연구팀 박세진 연구원(박사과정)이 새로운 음성 언어 모델 '스피치SSM'을 개발했다고 4일 밝혔다. 노용만 교수는 "현재 공개한 건 영어 텍스트를 여성 음성으로 만들었다"며 "향후 박세진 연구생(박사과정)이 메타(페이스북) 인턴을 마치고 돌아오면 한글로 된 음성도 만들어 공개하게 될 것"이라고 말했다. 연구 결과는 머신러닝 국제 컨퍼런스(ICML) 2025에 구두 논문 발표 대상으로 확정됐다. 구글 딥마인드와 협력해 오는 16일 열릴 국제머신러닝학회(ICML)에서 구두로 발표할 예정이다 음성 언어 모델(SLM)은 중간에 텍스트로 변환하지 않고 음성을 직접 처리한다. 인간 화자 고유의 음향적 특성을 활용할 수 있어 대규모 모델에서도 고품질 음성을 빠르게 생성할 수 있다. 이같은 장점에도 불구하고 SLM은 음성을 아주 세밀하게 잘게 쪼개 자세한 정보까지 담는 경우, '음성 토큰 해상도'가 높아지고 메모리 소비도 증가해 장시간 일관성 있는 음성 생성이 어려웠다. 연구팀은 이 문제를 해결하기 위해 긴 음성 시퀀스를 효율적으로 처리하고 생성할 수 있도록 정보에 집중하는 '어텐션 레이어'와 전체 이야기 흐름(장기적인 맥락)을 오래 기억하는 '순환 레이어'를 교차 배치한 '하이브리드 구조' 로 설계했다. 노용만 교수는 "이 구조가 긴 시간 음성을 생성해도 흐름을 잃지 않고 이야기를 잘 이어간다는 것을 연구팀이 확인했다"고 설명했다. 연구팀은 또 음성 데이터를 각 단위별로 독립적으로 처리하고, 전체 긴 음성을 만들 경우에는 다시 붙이는 방식을 활용해 쉽게 긴 음성을 만들었다. 음성 생성 단계에서는 한 글자, 한 단어 차례대로 천천히 만들어내지 않고, 여러 부분을 한꺼번에 빠르게 만들어내는 '비자기회귀' 방식의 오디오 합성 모델을 사용해, 고품질 음성을 빠르게 생성할 수 있도록 했다. 연구팀은 "기존은 100초 정도 짧은 음성 모델을 평가했지만, 우리는 16분까지 생성할 수 있도록 자체 구축한 새로운 벤치마크 데이터셋인 '라이브리스피치-롱(LibriSpeech-Long)'을 기반으로 음성을 생성하는 평가 태스크를 새롭게 만들었다"고 설명했다. 논문 제1저자인 박세진 연구생(박사과정)은 “긴 문맥에서도 일관된 내용을 유지하면서, 기존 방식보다 더 효율적이고 빠르게 실시간으로 응답한다"며 "다양한 음성 콘텐츠 제작과 음성비서 등 음성 AI 분야에 크게 기여할 것으로 기대한다”고 덧붙였다.

2025.07.04 09:01박희범

"챗GPT보다 싸고 빠르다"…라이너, 검색 LLM으로 AI 검색 시장 '정조준'

라이너가 '챗GPT'보다 정확하고 비용 효율적인 자체 검색 인공지능(AI) 성능을 공개했다. 핵심은 리서치에 최적화된 검색 결과를 신속히 제공하는 구조와 이를 뒷받침하는 데이터 기반 학습 역량이다. 라이너는 자사 '라이너 검색 LLM'이 AI 검색 컴포넌트 성능 비교 평가에서 오픈AI 'GPT-4.1'보다 우수한 결과를 기록했다고 3일 밝혔다. 이번 모델은 기존 오픈 소스 기반 구조 위에 10여 년간 축적한 방대한 사용자 데이터를 사후 학습 방식으로 적용해 정확도와 처리 속도를 높였다. 토큰당 비용도 평균 30~50% 절감한 것으로 나타났다. '라이너 검색 LLM'은 질문 분석부터 답변 생성까지 검색형 에이전트의 전 과정을 처리하는 데 필요한 8개 컴포넌트를 통합 구성한 모델이다. 이 중 카테고리 분류, 과제 분류, 외부 도구 실행, 중간 답변 생성 컴포넌트는 성능·속도·비용 전 항목에서 'GPT-4.1'을 상회했다. 특히 실제 서비스 환경에서 재현성과 신뢰성을 기반으로 성능을 측정한 점이 주목된다. 단순 벤치마크 수치가 아니라 실사용 기반 결과를 중심으로 비용·속도·정확도의 균형을 검증한 구조다. 이로 인해 기존 대형 모델 대비 가볍고 빠른 검색형 LLM 구현이 가능해졌다는 평가다. 라이너는 수년간 테스트와 개선을 반복하며 LLM 학습 구조를 고도화해 왔다. 자사 사용자 데이터를 활용한 정밀 학습을 통해 질문 처리 구조를 체계화하고 할루시네이션 가능성을 줄이는 방향으로 검색 정확도를 끌어올렸다는 설명이다. 검색 LLM의 비용 경쟁력 역시 차별점으로 꼽힌다. 'GPT-4.1' 대비 평균 30~50% 낮은 토큰당 처리 비용으로, 대규모 트래픽이 발생하는 검색형 에이전트 환경에서도 운영 효율성과 수익성 확보가 가능하다는 계산이다. 조현석 라이너 테크 리드는 "'라이너 검색 LLM'은 8가지 모든 컴포넌트에서 '챗GPT'를 뛰어넘는 성능을 입증했다"며 "어떤 데이터를 어떻게 학습하고 어떤 구조로 질문을 처리하느냐가 AI 할루시네이션을 줄이는 핵심"이라고 밝혔다. 이어 "데이터 학습과 연구 개발에 꾸준히 집중해 온 노력이 차별화된 AI 에이전트 기술 경쟁력으로 이어졌다는 점에서 의미가 크다"고 말했다.

2025.07.03 16:56조이환

"AI는 누구나 쓸 수 있어야"…레드햇이 제시하는 인프라 장벽 해결방안은?

인공지능(AI)은 이제 산업 전체를 바꾸는 거대한 흐름으로 자리잡고 있다. 하지만 많은 기업들은 아직 그 속도를 따라가지 못하고 있는 상황이다. AI 학습과 활용을 위한 그래픽처리장치(GPU)는 비싸고 전문 인력은 부족하다. 복잡한 모델과 배포 환경은 기술력을 갖춘 일부 기업만의 영역처럼 여겨지고 있다. 레드햇(Red Hat)은 이러한 문제를 해결하기 위한 방안으로 가상언어모델(vLLM)을 제시했다. 레드햇 브라이언 스티븐스 최고기술책임자(CTO)는 2일 여의도 레드햇코리아 사옥에서 "AI는 모든 기업이 활용해야 할 기술이지 일부 빅테크 기업의 전유물이 돼선 안 된다"며 "레드햇은 인프라 부담을 없애는 방식으로 AI의 대중화를 실현하려 한다"고 강조했다. 복잡한 인프라 없이도 AI활용… 오픈소스 기반 AI 플랫폼 'vLLM' 지난달 한국산업기술진흥협회가 연구개발(R&D) 조직을 보유한 국내 기업 1천479곳을 대상으로 '기업 AI 활용 실태'를 조사한 결과 전체 응답 기업의 76.9%가 'AI 도입이 필요하다'고 응답했다. 하지만 실제 업무에 활용하거나 도입을 검토하는 기업은 절반에도 못 미치고 있는 것으로 나타났다. 브라이언 스티븐스 CTO는 기업에 AI 도입이 어려운 이유로 그들이 처한 현실을 지적했다. 기술보다 환경의 문제라는 것이다. 그는 "많은 기업들이 AI를 써보려는 생각은 하지만 현실적인 장벽이 너무 많다"며 "GPU 가격은 너무 비싸고 엔비디아 스택은 배우기 어려우며 AI 엔지니어 확보 경쟁은 치열하다"고 설명했다. 이어 "지속되는 불황으로 투자 여유가 없는 상황에서 'AI는 각 기업에게 상관없는 기술'처럼 느껴지게 된다"고 밝혔다. 레드햇은 AI 활용을 위한 여러 장벽 중 가장 문제로 지적되는 인프라를 해결하기 위한 방안으로 vLLM을 선보이고 있다. vLLM은 오픈소스 기반의 AI 추론 서버 플랫폼이다. GPT 같은 대규모 언어모델(LLM)을 기업 내부 서버나 클라우드에서 구동할 수 있게 도와주는 소프트웨어(SW)다. 스티븐스 CTO는 vLLM을 서버나 클라우드를 운영하기 위한 핵심 운영체제(OS)인 리눅스(Linux)에 비유했다. 그는 "vLLM은 특정 하드웨어에 종속되지 않고 복잡한 설정 없이 모델을 실행할 수 있다"며 "엔비디아, AMD, 인텔 등 어떤 GPU든 상관을 뿐 아니라 AI 엔지니어가 아니어도 명령어 하나만 입력하면 모델을 구축하고 운영할 수 있다"고 설명했다. vLLM은 오픈소스 플랫폼 허깅페이스와 연동되며 사용자 친화적인 API와 관리 인터페이스도 제공한다. 중소기업도 서버 한두 대만 있으면 최신 AI 모델을 실행할 수 있으며 대기업은 데이터센터 단위로 확장 가능한 구조다. "GPU는 줄이고 속도는 4배로"…레드햇의 경량화 기법 레드햇이 vLLM을 통해 해결하고자 한 또 하나의 과제는 바로 AI 운영 효율성이다. 최근 LLM의 규모는 갈수록 커지고 있다. 자연어를 이해하고 생성하는 능력이 향상되면서 모델이 처리해야 할 데이터 양도 함께 늘어나고 있기 때문이다. 이렇게 모델이 커질수록 이를 실제로 돌리기 위해서는 고성능의 GPU가 더 많이 필요하고 메모리도 많이 차지한다는 점이다. 이로 인해 전력 소비와 장비 비용이 눈덩이처럼 커진다. 레드햇은 이 문제에 대한 해법으로 모델 경량화 기술인 '양자화(Quantization)'를 제시했다. 이는 AI 모델이 계산에 사용하는 숫자의 표현 단위를 줄여 연산 부담은 낮추면서도 결과의 정확도는 유지할 수 있도록 돕는 기술이다. 그는 "기존 AI 모델은 계산을 위해 소수점 네 자리 정도까지 표현할 수 있는 숫자 형식인 FP16을 사용한다"며 "이 방식은 GPU 메모리를 많이 차지하고 처리 속도도 느리다는 단점이 있다"고 지적했다. 이어 "레드햇은 이를 FP8이나 FP4처럼 절반 이하 수준의 더 간단한 형식으로 바꾸는 기술을 갖추고 있다"고 설명하며 "덕분에 모델 크기는 작아지고 연산 속도는 빨라진다. 실제로 처리 속도는 최대 4배까지 향상됐고 GPU 메모리 사용량도 크게 줄었다"고 소개했다. 레드햇은 'LLM 컴프레서'라는 자체 기술을 통해 이 양자화를 오픈소스로 공개했다. 이 덕분에 정확도는 99% 이상 유지하면서도 모델 경량화가 가능하다. 실제로 허깅페이스에서 매달 100만 건 이상 관련 모델이 다운로드되고 있다. "설정 없이 바로 쓴다"…기업을 위한 '완성형 AI 인프라' 이와 함께 레드햇은 오픈소스 기반의 vLLM과 양자화 기술을 한데 묶은 상용 서비스인 레드햇 AI 인퍼런스 서버도 출시했다. 이 제품은 AI 추론 서버를 기업이 실제 환경에서 바로 쓸 수 있도록 구성했다. vLLM 기반으로 기업에 최적화된 AI 모델, 양자화 도구, 보안 업데이트, 기업용 기술지원이 함께 제공된다. 레드햇 엔터프라이즈 리눅스(RHEL), 오픈시프트(OpenShift) 등 레드햇이 제공하는 서비스와 모두 호환되며 기술지원을 위한 서비스수준협약(SLA)도 제공한다. 그는 "오픈소스 vLLM이 개발자들을 위한 도구라면 인퍼런스 서버는 기업을 위한 완성된 제품"이라며 "컨테이너 형태로 제공돼 누구나 바로 배포하고 운영할 수 있는 것이 강점"이라고 강조했다. 이어 "AI는 더 이상 선택이 아닌 생존의 조건으로 지금은 복잡한 기술을 공부할 때가 아니라 우리 기업의 어디에 AI를 적용할지 고민해야 할 때"라며 "레드햇은 그 진입 장벽을 최대한 낮추기 위해 노력할 것"이라고 덧붙였다.

2025.07.02 10:59남혁우

토스랩, 더네이쳐홀딩스도 협업툴 '잔디' 쓴다

업무용 협업툴 '잔디'를 서비스하는 토스랩(대표 김대현)은 글로벌 패션 기업 더네이쳐홀딩스가 AI기능이 탑재된 잔디를 도입했다고 1일 밝혔다. 더네이쳐홀딩스는 내셔널지오그래픽, 배럴, 마크 곤잘레스, 브롬톤 런던 등 유수의 글로벌 브랜드를 개발·생산하고 유통하는 기업이다. 홍콩·대만·마카오·인도네이사 등 해외 시장에서도 활발히 비즈니스를 전개하고 있다. 글로벌 오피스 간 협업이 빈번한 만큼, 더네이쳐홀딩스는 소통 채널을 통합하고 체계적인 디지털 업무환경을 마련하기 위해 협업툴 잔디를 도입했다. 특히 협업툴 잔디에 내장된 AI 기능인 스프링클러를 활용해 구성원간 언어 장벽을 해소하고 있다. 메시지 입력창에 AI를 활용해 작성한 내용을 영어, 일본어, 중국어, 베트남어 등 14개 언어로 실시간 번역할 수 있으며, 외국어로 작성된 메시지도 원클릭으로 자동 번역되어 즉시 확인할 수 있다. 또 지식 베이스 기능을 활용하면 더네이쳐홀딩스만의 사내 문서 및 정보를 기반으로 보다 정확한 자연어 답변을 제공받을 수 있다. 아울러 해당 답변이 참조한 원문까지 확인 가능해 정보 신뢰도 또한 높다. 더네이쳐홀딩스 관계자는 “글로벌 성장을 가속하기 위해서는 언어의 장벽 없이 자유롭게 소통하고 협업할 수 있는 협업툴이 필수”라며 “사내 규정과 같은 사내 정보 자산을 기반으로 고품질의 답변을 받을 수 있어 사용자 만족도가 높다”고 밝혔다. 김대현 토스랩 대표는 “빠르게 변화하는 트렌드에 대응하며 협업하는 패션 기업이 잔디 AI를 도입한 이유는 협업의 핵심인 소통의 품질을 AI로 끌어올릴 수 있기 때문”이라며 “글로벌로 비즈니스를 확장하는 과정에서 축적되는 데이터를 가치 있게 활용할 수 있도록 잔디 AI가 지속적으로 지원할 것”이라고 말했다.

2025.07.01 22:20백봉삼

지미션, LLM 문서처리 솔루션 출시…기업 문서 자동화 시장 본격 진입

지미션이 핵심정보를 자동으로 분류·요약하는 문서처리 거대언어모델(LLM)을 통해 기업 문서 자동화 시장에 진입했다. 지미션은 신제품 '닥스훈드(DXHUND)'를 정식 출시하고 공공기관·금융사·대기업 등을 주요 타깃군으로 삼아 시장 확산을 추진 중이라고 30일 밝혔다. 제품명은 정보 탐지에 특화된 견종 닥스훈트에서 착안했으며 복잡한 문서 속에서도 의미 기반 핵심정보를 빠짐없이 찾아낸다는 기술적 기획이 반영됐다. '닥스훈드'는 광학문자인식(OCR) 기술을 기반으로 이미지 문서를 디지털 텍스트로 변환한 뒤 문서 구조를 해석해 항목별 정보를 자동 추출하거나 사용자 목적에 맞춰 내용을 요약·분류하는 기능을 제공한다. 계약서, 진술서, 지시문 등 비정형 문서가 많은 업무 환경에서 반복 업무를 줄이는 데 특히 적합하다는 평가다. 또 문서 내 포함된 개인정보를 자동 탐지해 비식별화하거나 마스킹할 수 있으며 사용자가 자연어로 문서 검색과 필터링을 수행할 수 있는 질의응답형 인터페이스도 함께 제공된다. 단순한 문서 처리 도구가 아닌 검색-분류-대응까지 하나의 흐름으로 연결되는 통합형 솔루션이라는 점이 차별 포인트다. 지미션은 해당 제품에 자사 기존 기술력인 AI OCR, 자연어처리(NLP), 개인정보 비식별화 역량과 더불어 최근 확보한 LLM 엔진까지 통합 적용했다고 설명했다. 사전 처리와 후처리의 품질을 모두 감안한 종단 간 문서처리 체계를 구현했다는 의미다. 이번 제품 출시는 기업 문서 업무에서 가장 처리 비용이 크고 리스크가 높은 '비정형 문서 처리'를 기술로 대응하려는 산업적 수요 증가에 맞춰 기획된 것으로 보인다. 특히 하루 단위로 대량 문서를 수작업 검토하는 조직일수록 효과가 뚜렷할 수 있다. 한준섭 지미션 대표는 "'닥스훈드'는 기술의 역할과 한계를 냉정하게 인식한 상태에서 반복적이지만 복잡한 문서 업무를 효율화하려는 조직에 실질적인 도움이 되도록 설계했다"며 "기술 중심의 과잉 마케팅보다 실사용 데이터를 기반으로 시장을 확장해나갈 것"이라고 밝혔다.

2025.06.30 15:00조이환

美 NSA·CISA "메모리 오류, 국가안보 위협"

미국 국가안보국(NSA)과 사이버보안·인프라보안국(CISA)이 공동으로 소프트웨어(SW) 개발자들에게 '메모리 안전 언어(MSL)'의 사용을 적극 권장하고 나섰다. NSA와 CISA는 메모리 오류를 근본적으로 차단하기 위한 방안으로 메모리 안전 프로그래밍 언어 채택을 촉구하는 지침을 30일 발표했다. 이들은 "메모리 오류는 단순한 버그를 넘어 국가안보와 주요 기반 인프라를 위협할 수 있는 심각한 문제"라며 메모리 안전 언어가 이를 구조적으로 해결할 수 있는 해법이라고 강조했다. 두 기관은 대표적인 사례로 '하트블리드(Heartbleed)'와 '배드알록(BadAlloc)' 보안 사고를 언급하며 메모리 오류가 얼마나 심각한 결과를 초래할 수 있는지를 경고했다. 하트블리드는 2014년 전 세계 80만 개 이상의 웹사이트에서 발견된 보안 결함으로 병원 환자 기록을 포함한 민감한 개인정보가 대규모로 유출됐다. 배드알록은 차량, 산업 제어 시스템, 임베디드 기기를 포함해 1억9천500만 대 이상의 시스템에 영향을 미친 대규모 메모리 취약점 기반 사고였다. 이들 사례의 공통점은 C, C++와 같은 전통적인 프로그래밍 언어에서 메모리를 수동으로 할당하고 해제하는 과정에서 발생한 오류에서 비롯됐다는 것이다. 이런 오류는 공격자가 시스템을 장악하거나 민감 정보를 탈취하는 데 악용될 수 있다. NSA와 CISA가 권장하는 MSL은 이러한 오류를 애초에 차단하는 기능을 언어 자체에 내장하고 있다. 대표적으로 러스트(Rust), 고(GO), 자바(Java), C#, 파이썬(Python), 스위프트(Swift) 등이 있다. 이들은 버퍼 오버플로우, 초기화되지 않은 메모리 접근 등의 취약점을 언어 차원에서 예방할 수 있도록 설계돼 있다. 러스트는 '소유권(Ownership)' 개념을 기반으로 메모리를 안전하게 관리하고 자바, 고는 '가비지 컬렉션(Garbage Collection)' 기능으로 불필요한 메모리를 자동으로 회수한다. NSA는 이런 메커니즘이 개발자 실수로 인한 보안 사고를 줄이는 동시에 시스템 안정성과 개발 생산성 향상에도 효과적이라고 분석했다. 다만 보고서는 기존 시스템 전체를 MSL로 전면 재작성하는 방식은 현실적으로 어렵다며 단계적이고 전략적인 도입을 권장했다. 신규로 개발되는 소프트웨어에는 MSL을 우선 적용하고 기존 시스템은 네트워크 서비스, 파일 파서, 암호화 처리처럼 보안 위협에 노출되기 쉬운 고위험 구성요소부터 점진적으로 전환하는 방식이다. 언어를 선택할 때는 성능, 개발자 숙련도, 기존 코드와의 호환성 등도 고려해야 한다. 이 같은 전략은 실제 사례에서도 효과가 입증됐다. 구글 안드로이드 팀은 2019년부터 러스트와 자바를 신규 코드에 적용하기 시작했고 2024년까지 전체 보안 취약점 중 메모리 관련 비중을 76%에서 24%로 낮추는 성과를 냈다. 보고서는 "전체 코드를 재작성하지 않고도, 신규 개발에 MSL을 적용하는 전략만으로도 실질적인 보안 향상을 이끌어낼 수 있었다"고 설명했다. 더불어 MSL 도입을 가속화하려면 개발자 생태계 전반의 변화가 필요하다고 강조했다. 현재 컴퓨터공학 교육 과정에는 자바나 파이썬 등 가비지 컬렉션 기반 언어 수업은 널리 포함돼 있지만 러스트처럼 메모리 안전성과 성능을 동시에 지닌 언어 교육은 아직 부족하다는 지적이다. 이에 따라 미국 DARPA는 기존 C 코드를 러스트로 자동 변환하는 '트랙터(TRACTOR)' 프로젝트, 메모리 안전 파서를 생성하는 'V-스펠(V-SPELLS)', 안전한 문서 처리용 '세이프독스(SafeDocs)' 같은 연구를 진행하고 있다. 기업들도 MSL 역량을 채용 조건에 포함시키는 방식으로 도입을 유도하고 있다. 아울러 NSA와 CISA는 C, C++ 같은 기존 프로그래밍 언어가 여전히 중요한 역할을 하는 분야도 분명히 존재한다고 인정했다. 초고속 처리가 필요하거나, 하드웨어를 정밀하게 제어해야 하는 시스템에서는 여전히 C, C++이 불가피하게 사용된다는 것이다. 이 경우에도 보다 안전하게 기존 언어를 활용할 수 있는 현실적인 보완책을 병행해야 한다고 제언했다. 예를 들어 C++에서는 스마트 포인터(smart pointer)를 통해 메모리를 자동으로 관리할 수 있고, 정적 분석이나 동적 분석 도구를 사용해 코드 내 취약점을 사전에 탐지할 수 있다. 또 컴파일 시 보안 강화를 위한 옵션을 적용하면 치명적인 오류나 시스템 침해 가능성을 줄이는 데 도움이 된다. 보고서는 이러한 방법들을 적절히 활용하면 기존 언어로도 일정 수준의 메모리 안전성을 확보할 수 있다고 평가하면서도, 장기적으로는 가능한 범위 내에서 MSL 도입을 점차 확대해 나가는 것이 바람직하다고 강조했다. 또 기존 언어와 새로운 언어의 현실적인 공존과 점진적인 전환을 병행하는 전략이 필요하다는 설명이다. NSA와 CISA 측은 "메모리 안전 언어의 도입은 미래의 사이버 재난을 막는 가장 구조적인 대응책"이라며 "지금 투자하지 않으면 나중에 사고 수습과 긴급 패치에 훨씬 더 많은 비용을 치르게 될 것"이라고 경고했다.

2025.06.30 10:44남혁우

"크리에이터, 목소리만 주면 된다"…NC AI, 샌드박스 글로벌화 '전면 지원'

NC AI가 MCN 업계 선두주자 샌드박스네트워크와 손잡고 크리에이터의 글로벌 진출을 지원한다. NC AI는 서울 용산 샌드박스 본사에서 샌드박스네트워크와 '기술지원 및 사업활동 공동협력' 양해각서(MOU)를 체결했다고 26일 밝혔다. 행사에는 이연수 NC AI 대표, 이필성 샌드박스 대표, 샌드박스 공동창업자이자 최고크리에이티브책임자(CCO)인 도티가 참석했다. 이번 협력을 통해 NC AI는 자사의 버티컬 미디어 AI 기술과 바르코 거대언어모델(LLM) 기반 솔루션을 샌드박스에 제공한다. 샌드박스는 200여 팀 이상의 크리에이터 네트워크를 통해 이를 실전 현장에 접목한다. 양사는 단순 협업을 넘어 독자 인공지능(AI) 파운데이션 모델 개발에도 공동으로 나서며 글로벌 경쟁력을 키운다는 계획이다. NC AI가 제공하는 기술에는 실시간 AI 번역, 다국어 음성 합성, 3D 아바타 생성, 실시간 다국어 채팅 번역 등 미디어 콘텐츠 전용 AI 솔루션이 포함돼 있다. 현재는 영어, 일본어, 중국어 등을 중심으로 게임과 콘텐츠 특화 번역 기능을 우선 적용하고 있다. 보이스 액팅 기술은 크리에이터 목소리를 짧은 샘플만으로 재현해 감정과 말투까지 유지한 다국어 더빙을 구현한다. 도티 같은 인기 크리에이터도 기존 콘텐츠 하나로 여러 언어의 팬과 동시에 소통할 수 있는 구조다. 기술적으로는 자막이나 기계식 더빙이 아닌 '실제 목소리 기반'의 몰입형 팬 경험을 목표로 한다. 실시간 다국어 챗봇 기술은 특히 라이브 방송과 팬미팅 현장에 바로 적용된다. 한국어로 진행되는 스트리밍에서도 영어, 일본어, 유럽권 언어로 실시간 대화가 가능해지며, 글로벌 커뮤니티 형성과 관리가 수월해진다. 3D 콘텐츠 측면에선 간단한 2D 이미지를 기반으로 크리에이터 고유 굿즈, 아바타를 제작할 수 있는 도구도 제공된다. 패션 AI 역시 바르코 아트 기술과 결합해 자유로운 의상 디자인, 착장 시연이 가능하다. 크리에이터가 브랜드화에 필요한 시각 요소를 AI로 자체 생성할 수 있는 기반이 마련된 셈이다. 콘텐츠 품질과 확장성 면에서도 효과음, 모션 생성, 애니메이션 등 고비용 작업을 자동화해 진입 장벽을 낮췄다. 특히 숏폼, 웹툰, 광고 등 다양한 장르에 필요한 시청각 요소를 AI가 대체하면서 제작자 역량의 범위가 넓어진다. 양사의 협력은 크리에이터 생태계 자체를 기술로 전환하는 시도이기도 하다. 단순한 솔루션 제공을 넘어 크리에이터의 개성과 지적재산권(IP)을 유지하면서도 다국어·다문화 콘텐츠로 확장할 수 있도록 설계돼 있다. NC AI는 샌드박스 협력을 기반으로 AI 솔루션의 사업화를 확대하고 산업 맞춤형 미디어 AI 생태계 구축에도 속도를 낸다. 이연수 NC AI 대표는 "샌드박스와 함께 국내 크리에이터들이 '바르코 LLM'과 미디어 버티컬 AI를 활용해 본연의 개성을 살리고 글로벌 팬들과 자유롭게 소통할 수 있도록 지원하겠다"고 밝혔다.

2025.06.26 10:44조이환

[AI는 지금] 'K-AI' 노리는 코난테크·업스테이지, 韓 반도체 기업과 협업 나선 까닭은

한국형 인공지능(AI) 모델 개발을 위한 정부의 '독자 AI 파운데이션 모델' 프로젝트 사업자 선정에 도전장을 내민 AI 업체들이 국내 반도체 기업과 손잡고 경쟁력 끌어올리기에 본격 나섰다. 25일 업계에 따르면 코난테크놀로지는 최근 AI 반도체 기업 리벨리온의 신경망처리장치(NPU)에 자사 거대언어모델(LLM)이 탑재된 '코난 AI 스테이션 서버'를 접목했다. 이를 위해 두 회사는 지난해 8월 AI 모델과 AI 반도체 기술을 결합하는 공동 연구개발 협약을 맺고 국산 AI 소프트웨어와 반도체 기술을 융합한다고 발표한 바 있다. 코난 AI 스테이션 서버는 팀이나 조직 단위가 함께 사용하는 생성형 AI 인프라로 사용자 수에 따라 그래픽처리장치(GPU), 메모리, 스토리지를 유연하게 구성할 수 있다. 지난달 출시한 기업형 AI 서버 코난 AI 스테이션 서버에는 코난 LLM이 기본 탑재된 상태로, 리벨리온의 최신 NPU에서 작동되고 있다. 두 회사는 현재 최적화 작업을 진행 중이다. 업스테이지도 국내 반도체 팹리스 기업인 퓨리오사AI와 '신경망처리장치(NPU) 기반 생성형 AI 사업 협력'을 위한 양해각서(MOU)를 체결했다. 이번 일로 업스테이지는 자체 거대언어모델(LLM) '솔라'를 퓨리오사AI의 차세대 NPU '레니게이드'에 최적화해 탑재할 계획이다. 또 두 회사는 NPU 기반으로 구동하는 온프레미스 AI 구축 사업을 공동 추진하고 국내는 물론 글로벌 시장까지 함께 공략할 방침이다. 이들이 이처럼 나선 것은 최근 AI 반도체 시장을 미국 엔비디아가 사실상 독점하며 이에 따른 글로벌 공급난과 가격 급등으로 인해 불안정성이 지속되고 있어서다. 여기에 최근 미국, 중국 등 해외 빅테크 LLM의 공세가 거세지면서 국내 AI 산업 전반에 상당한 부담이 가중되고 있다는 점도 주효했다. 더불어 최근 정부가 '독자 AI 파운데이션 모델' 프로젝트 사업자 선정에 나서고 있는 것도 영향이 크다. 코난테크놀로지와 업스테이지는 각각 자체 LLM을 보유하고 있는 곳으로, 이번 정부의 프로젝트에 사업자로 참여하고 싶다는 의지를 강하게 드러내고 있다. 이들의 LLM이 대표 AI 모델로 선정되면 'K-AI 모델', 개발사는 'K-AI 기업' 등 명칭을 쓸 수 있게 된다. 정부는 이 사업에 총 1천936억원을 투입해 선발 기업에게 최대 3년간 GPU와 데이터, 인재 등 필요한 자원을 집중적으로 지원한다. 초기에 최대 5개 기업을 선발할 예정으로, 평가를 거쳐 점차 지원기업을 압축해 나갈 계획이다. 이 사업에는 두 회사 외에도 네이버와 카카오, LG AI 연구원, KT, 솔트룩스, 이스트소프트 등이 참여 의사를 적극 내비치고 있다. 업계 관계자는 "국내 대표 AI 소프트웨어와 하드웨어 기업이 힘을 모아 국산 AI 경쟁력을 강화하기 위해 나서려는 분위기가 조성되고 있다는 점은 긍정적"이라며 "이들의 움직임이 정부가 추진하는 프로젝트 사업자 선정에 어떤 영향을 줄 지 기대된다"고 말했다. 그러면서 "국산 NPU 기반 생성형 AI 솔루션의 상용화는 해외 기술 의존도를 낮추고 AI 인프라의 자립화와 기술 주권 확보에 기여할 것으로 보인다"고 덧붙였다.

2025.06.25 10:10장유미

LG AI연구원 '엑사원 4.0' 개발 중…추론형 AI 역량 강화 시동

LG가 차세대 인공지능(AI) '엑사원'의 후속 버전 개발에 속도를 내고 있다. 24일 업계에 따르면 LG AI연구원은 '엑사원 4.0'과 조직병리 특화 모델 '엑사원 패스 2.0'을 개발 중이다. 현재까지 관련 공식 행사 계획은 없으며 공개 일정도 논의 단계에 머물러 있는 것으로 알려졌다. '엑사원 4.0'은 기존 모델에 추론형 모델 '엑사원 딥'을 통합하는 형태로, 대용량 장문 처리와 과학·의료 등 고도화된 전문 영역 활용을 목표로 설계되고 있다. '3.5' 버전은 A4 100페이지 수준의 문서를 단일 입력으로 처리할 수 있을 정도의 처리 능력을 보인 바 있다. 함께 준비 중인 '엑사원 패스 2.0'은 병리 이미지 기반의 암 진단 AI 모델로, 유전자 검사 대비 검사 시간을 줄이는 데 목적이 있다. 두 모델 모두 오픈소스로 공개해 활용성과 투명성을 높인다는 것이 LG 측 내부 방향성이다. 지난 23일 과학기술정보통신부 장관으로 지명된 배경훈 LG AI연구원장은 지난 3월 엔비디아 개발자 행사에서 "'엑사원 4.0'부터 통합 모델을 선보일 것"이라며 "상반기 출시를 목표로 한다"고 말했다. LG 관계자는 "모델은 개발 중인 것이 맞고 행사는 미정"이라고 밝혔다.

2025.06.24 15:12조이환

[AI는 지금] 정부, '국가 파운데이션 모델' 추진…업계 "설계는 훌륭, 실행이 관건"

정부가 글로벌 생성형 인공지능(AI) 시장에서 독립적 경쟁력을 확보하기 위한 '독자 파운데이션 모델' 개발에 착수했다. 모델을 오픈소스로 공개해 민간 활용도를 극대화하겠다는 구상이다. 업계에서는 방향성과 의도에 대해 긍정적인 평가가 나오지만 실질 집행에 대한 지속적인 모니터링은 필요하다는 시각도 병존한다. 24일 업계에 따르면 과학기술정보통신부는 지난 20일 정보통신산업진흥원(NIPA), 지능정보사회진흥원(NIA), 정보통신기획평가원(IITP) 등과 함께 '독자 AI 파운데이션 모델' 프로젝트를 공식 발표했다. 해당 사업은 기존 '월드 베스트 거대언어모델(LLM)'로 불리던 기획의 정식 명칭으로, 다음달 7월 21일까지 국내 AI 정예팀 공모를 진행해 최대 5개 팀을 선발하고 단계별 압축 평가를 통해 상위팀으로 압축할 계획이다. 이번 사업은 최근 6개월 내 출시된 글로벌 최신 AI 모델 대비 95% 이상의 성능을 목표로 삼고 있다. 다만 고정된 성능 수치에 집착하기보다는 '무빙 타겟' 방식을 도입해 기술환경 변화에 따라 목표와 평가 기준을 유연하게 조정하는 전략을 채택했다. 과기정통부는 이와 같은 방식을 미국 방위고등연구계획국(DARPA)의 모델에 빗대어 'DARPA형'이라고 정의했다. 기술주권 위한 'K-AI 전략' 본격화…정예팀 자율 설계·정부 전폭 지원 구조 이 프로젝트를 위해 정예팀은 AI 모델 개발 전략과 방법론을 스스로 제시해야 한다. 정부는 GPU, 데이터, 인재 등 자원 항목에 대해 '희망 수요'를 정예팀이 먼저 요청하도록 하고 평가를 통해 적정 수준을 매칭 지원한다. 이 과정에서 오픈소스 공개 범위가 넓을수록 정부의 지원 매칭 비율은 높아진다. 그래픽 처리장치(GPU)는 당장 1차 추경 예산 1천576억원 규모를 활용해 민간 GPU를 임차해 지원한다. 팀 당 초기 지원 수량은 GPU 500장 수준이며 평가 결과에 따라 1천 장 이상까지 확대된다. 내년 하반기부터는 정부가 직접 구매한 첨단 GPU 1만 장을 본격 투입할 예정이다. 데이터는 공통수요와 개별수요로 나눠 지원된다. 정예팀이 필요로 하는 저작물 기반 학습데이터를 연간 100억원 규모로 공동구매하고 팀별 데이터 구축 및 가공은 연간 30억~50억원 수준으로 지원한다. 학습 효율성과 저작권 이슈를 동시에 감안한 전략이다. 인재 지원은 해외 우수 연구자 유치를 전제로 한다. 정예팀이 해외 팀이나 재외 한인 인재를 유치하면 정부가 연간 20억원 내외의 인건비 및 연구비를 매칭한다. 이 항목은 정예팀이 탈락하더라도 오는 2027년까지 지속 지원된다. 모델 성능 평가는 6개월 주기로 진행된다. 국민과 전문가가 함께 참여하는 콘테스트 기반 평가, 국내외 벤치마크 기준에 따른 검증 평가, 파생 모델 수를 기준으로 한 파생 평가 등을 결합한 입체적 방식이다. 단계평가를 통해 5개 팀에서 4개, 3개, 2개로 점차 압축하는 경쟁형 설계를 따를 예정이다. 모델 개발 완료 후에는 오픈소스를 통해 국내 AI 생태계 전반에 확산될 예정이다. 정예팀은 공모 시 '국민 AI 접근성 향상'과 '공공·경제·사회 전반의 AI 전환'을 위한 활용 계획을 함께 제출해야 하며 정부는 필요에 따라 이에 매칭해 후속 지원도 가능하다고 밝혔다. AI 안전성 확보도 주요 과제로 포함된다. 정부는 AI 안전연구소(K-AISI)와 협력해 파운데이션 모델의 신뢰성과 확장성을 검증하고 일정 수준 이상에 도달한 모델에 대해 'K-AI 모델', 'K-AI 기업' 등 명칭을 부여해 글로벌 시장에서의 공신력을 제고한다는 방침이다. 송상훈 과기정통부 정보통신정책실장은 "이번 프로젝트는 단순히 AI 모델을 만드는 데 그치지 않고 기술주권을 확보하고 모두가 활용할 수 있는 AI 생태계를 조성하는 출발점이 될 것"이라며 "정예팀들이 글로벌 수준의 독자 모델을 확보해 대한민국이 AI 강국으로 도약하는 기반을 마련하길 기대한다"고 밝혔다. 설계는 잘 했다…'기술·자원·평가' 운용이 진짜 시험대 업계에서는 정부의 독자 파운데이션 모델 추진을 대체로 긍정적으로 평가하고 있다. 국가가 주도해 자국 모델을 구축하려는 흐름은 이미 전 세계적으로 확산 중이며 한국의 이번 시도도 그 연장선에 있다는 분석이다. 실제로 국가 주도 모델 개발은 미국 오픈AI, 앤트로픽 등과 중국 딥시크 만의 경쟁 구도가 아니다. 프랑스는 오픈소스 기반 생성형 AI 기업 미스트랄을 중심으로 자체 모델을 개발하고 있으며 에마뉘엘 마크롱 대통령이 직접 나서 수천억 원대 민간 투자와 글로벌 협력을 이끌고 있다. 싱가포르 역시 '씨라이언(SEA-LION)' 프로젝트를 통해 동남아 현지 언어 기반 LLM을 개발 중이다. 최근에는 칠레 AI센터를 중심으로 아르헨티나, 브라질 등 남미 12개국이 연합해 '라탐-GPT' 개발을 공식화하며 오는 9월 공개를 예고한 상태다. 라지브 쿠마르 한국외국어대학교 연구교수는 "국가가 주도해 독자적인 파운데이션 모델을 개발하는 건 지금 전 세계적인 흐름으로, 한국 정부의 이번 시도는 매우 긍정적으로 본다"며 "인도도 스타트업 중심의 개발을 정책적으로 지원하면서 정부 차원에서 국내 생태계를 강화하려는 시도가 있다"고 말했다. 더불어 업계에서는 이번 프로젝트가 단순히 모델 하나를 만드는 데 그치지 않고 자원 배분 방식과 생태계 설계까지 포괄하고 있다는 점에 주목하고 있다. 'GPU·데이터·인재'라는 AI 핵심 자원을 수요 기반으로 자율 신청받고 이를 정부가 평가 후 매칭하는 구조가 민간 주도성과 정부 책임성을 동시에 확보하려는 시도로 보고 대체로 긍정적으로 반응하는 상황이다. 다만 실무 현장에서는 자원 지원이 선언에만 머물 경우 효과가 반감될 수 있다는 우려도 제기된다. 일례로 GPU의 경우 1천576억원 규모의 예산이 잡혀 있다 해도 실제 장비 임차·세팅·운영까지 이뤄지는 시간 차를 간과해선 안 된다는 게 중론이다. 단순한 GPU 확보가 아니라 팀별 물리적 접근성과 운영 안정성까지 감안한 체계 설계가 필요하다는 것이다. 데이터 항목도 비슷한 맥락이다. 정예팀이 요청하는 데이터에 대한 품질 기준과 저작권 검토 체계가 정비되지 않을 경우 향후 오픈소스 공개 과정에서 법적 리스크나 생태계 혼란을 야기할 수 있다. 특히 저작물 데이터의 공동구매가 연간 100억원 규모로 설정된 만큼, 명확한 선별 기준과 기술적 정제 절차가 병행돼야 한다는 의견이 나온다. 인재 유치 항목에 대해선 방향성은 맞지만 실질 효과는 제약이 클 수 있다는 관측도 있다. 단순히 해외 인재에게 연구비를 매칭 지원한다고 해서 국내에 안착하는 건 어렵다는 것으로 국내 기관의 위상, 프로젝트 자체의 매력도, 그리고 연구 독립성 등이 종합적으로 뒷받침돼야 할 것으로 관측된다. 오픈소스 정책 역시 마찬가지다. 오픈소스 정책이 산업 육성과 충돌하지 않도록 장기적으로는 파라미터 제한이나 일부 모듈 비공개 등에 대한 세분화된 가이드라인이 수립될 필요가 있다는 것이다. 한 업계 관계자는 "오픈소스를 전제로 한 모델 전략은 지금 시기에 필요하다"면서도 "오픈소스에 대한 구체적인 정의가 프로젝트가 진행되면서 확립돼야 할 것으로 보인다"고 말했다. "이어 기술 보호 없이 모든 걸 일괄적으로 공개할 경우 산업적 격차를 키울 수 있다"고 우려했다. 일각에서는 이 프로젝트가 '국가대표 AI'를 선발하는 성격인 만큼 평가 기준의 엄정성과 공정성이 핵심이라는 지적도 있다. 단순한 국내 경쟁이 아니라 세계적 기술 경쟁의 문턱을 넘는 출발점이 되려면 국제적인 벤치마크와 기술 평가 기준을 적극 반영해야 한다는 주장이다. 또 다른 업계 관계자는 프로젝트를 두고 "파운데이션 모델 구축을 위한 기술력과 역량은 충분하지만 자원이 부족했던 강소기업에게는 매우 훌륭한 육성 프로젝트로 보인다"며 "다만 기술적 발전이 빠른 만큼 평가 기준에는 국제적인 수준이 반영돼야 그 공신력이 확보되고 국가대표로서도 의미가 있을 것"이라고 말했다. 이와 함께 모델 규모에 대한 조건이 명확히 규정돼 있지 않다는 점도 일부에서 우려되는 대목이다. 개발 전략과 방법론을 정예팀이 자율적으로 제안하는 'DARPA형' 설계는 기술 진화에 유연하게 대응할 수 있다는 점에서 긍정적이지만 자칫 자원 격차에 따른 구조적 불균형을 초래할 수 있다는 지적이다. 업계 관계자는 "모델 규모에 대한 규정이 자칫 잘못되면 큰 모델들만이 성능과 역량이 좋게 평가를 받을 것"이라며 "기울어진 운동장이 될 수도 있으므로 이를 방지하기 위한 노력을 기울여야 할 것"이라고 평가했다.

2025.06.24 11:21조이환

"軍 AI 싹쓸이"…코난테크놀로지, 국방 AI 서밋 연다

코난테크놀로지가 국방 인공지능(AI) 기술력을 집약한 만남의 장을 열어 방산 시장 공략에 속도를 내고 있다. 코난테크놀로지는 다음달 16일 서울 용산 전쟁기념관 내 로얄파크컨벤션에서 '국방 AI 테크 서밋 2025'를 개최한다고 23일 밝혔다. 이 행사에는 군 관계자, 방산 협력업체 관계자 등 200여 명이 참석하며 국방 AI 관련 성과와 활용 전략을 공유하는 세션으로 구성된다. 이번 서밋은 코난테크놀로지가 지난 10년간 수행해온 국방 AI 사업 사례를 외부에 처음으로 공개하는 자리다. 주요 세션으로는 ▲국방 AI 기술 추진 전략 및 도입사례 ▲AI 거버넌스 기반 플랫폼 구축 전략 ▲감시정찰 체계를 위한 지능형 의사결정 전략 ▲에이전틱 AI 기반 정보 분석 전략 등이 포함됐다. 행사장에는 관련 기술과 제품의 시연도 진행된다. 코난테크놀로지는 AI 기반 화력운용시스템, 공중전투 기동훈련 체계, 스마트 인재관리 시스템 등 핵심 군 사업에 AI를 공급해온 국내 유일 기업으로, 현재 국방 및 민간 방산 전문기업 20여 곳과 협업 중이다. 특히 지능형 CCTV와 이동형 드론은 국내 최초로 한국인터넷진흥원(KISA) 인증을 받아 재난 구조 현장에서 실전 투입되고 있다. 일례로 'AI 파일럿' 등 유무인 복합 전투체계 실증에도 착수했으며 지난해 '방산혁신기업 100'에 이름을 올린 바 있다 더불어 지난 2023년 자체 개발한 대규모 언어모델 '코난LLM'을 기반으로 공공 및 민간 시장에 AI 솔루션을 공급 중이다. 해당 모델은 지난해 미국 스탠퍼드대 생태계 그래프에 등재됐다. 공공 프로젝트 기반의 신뢰를 바탕으로 의료 AI 영역으로도 확장 중으로, 지난 2월 한림대의료원과 국내 첫 거대언어모델(LLM) 기반 진료 플랫폼 공동 개발을 시작했다. 출시 2년차인 '코난LLM'은 현재 온디바이스, 프로페셔널, 엔터프라이즈 모델로 라인업을 구성해 고객 맞춤형 대응에 나섰다. 지난 3월에는 일반·추론 모드를 통합한 '이엔티-11(ENT-11)' 모델도 출시하며 범용성과 유연성을 높였다. 오는 7월 자사 기술을 탑재한 AI PC도 공개될 예정이다. 김규훈 코난테크놀로지 국방AI사업부 이사는 "AI 기술의 전략적 도입을 통해 국방력 강화에 기여하는 실질적 해법을 고객과 함께 모색할 계획"이라며 "실전성과 신뢰성 기반의 AI 솔루션으로 국방 분야의 새로운 기준을 만들겠다"고 밝혔다.

2025.06.23 16:47조이환

정부, '국가대표 AI' 만든다…글로벌 수준 모델 개발에 '총력'

대한민국 정부가 인공지능(AI) 기술 자립과 생태계 확장을 목표로 국내 정예팀을 뽑아 독자 모델 개발에 나선다. 글로벌 기업 중심의 AI 주도권 구도를 견제하고 기술 주권을 확보하기 위해서다. 과학기술정보통신부(과기정통부)는 '독자 AI 파운데이션 모델 프로젝트'를 공식 출범하고 다음달 21일까지 참여 정예팀 공모에 착수한다고 20일 밝혔다. 과기정통부 외에도 정보통신산업진흥원, 한국지능정보사회진흥원, 정보통신기획평가원이 공동으로 추진하는 이번 사업은 기존 '월드베스트 거대언어모델(World Best LLM)' 프로젝트의 공식화다. 이번 공모는 성능·전략·파급효과 등을 기준으로 최대 5개 정예팀을 선정한 뒤 단계별 평가를 통해 점진적으로 압축하는 방식으로 진행된다. 최신 글로벌 AI 모델 성능의 95% 이상 달성을 목표로, 참여팀은 자체적인 개발 전략과 방법론을 자유롭게 설계할 수 있다. 프로젝트는 일괄지원이 아닌 6개월 단위 경쟁형 압축 방식을 도입해 민첩한 기술 진화를 유도한다. 지원 자원은 그래픽 처리장치(GPU), 데이터, 인재라는 세 가지 축으로 구성된다. GPU는 올해부터 내년 상반기까지 민간 GPU 임차 형태로, 이후엔 정부 구매 GPU를 활용해 정예팀당 최대 1천 장 이상이 단계별로 지원된다. 데이터는 저작물 중심의 공동구매와 개별 가공 작업에 연간 최대 150억원 규모의 예산이 투입된다. 인재 분야는 해외 연구자 유치 시 연 20억원 한도 내에서 인건비와 연구비를 매칭해 준다. 특히 대학·대학원생의 참여를 필수로 명시하며 미래 인재 양성을 병행하는 구조다. 동시에 참여팀은 국민 AI 접근성 향상, 공공·경제·사회 전환(AX) 기여계획도 함께 제출해야 한다. 오픈소스 수준에 따라 정부 매칭 비율과 자부담 비율이 달라지는 구조도 설계됐다. 프로젝트는 단순한 기술개발에 머무르지 않는다. 국민 대상 사용성 평가, 컨테스트형 단계 심사, 벤치마크와 한국어 성능·안전성 검증 등 다층적 방식으로 완성도를 높인다. 우수한 모델에는 'K-AI' 명칭 부여 등 글로벌 브랜딩도 병행한다. 안전성 확보를 위해 AI안전연구소(K-ASIS)와의 협력도 예정돼 있다. 이 밖에 공공영역은 물론 국방·안보 등 민감 분야 활용도 계획에 포함돼 있다. 정부는 개발된 모델을 오픈소스화해 민간 AI 서비스 생태계 확산에도 적극 활용할 방침이다. 송상훈 과학기술정보통신부 정보통신정책실장은 "이번 프로젝트는 AI 기술 주권 확보와 모두의 성장을 위한 생태계 구축이 목표"라며 "글로벌 수준의 독자 AI 모델을 통해 대한민국이 진정한 AI 강국으로 도약하길 기대한다"고 밝혔다.

2025.06.20 13:37조이환

이스트소프트, AI 휴먼 키오스크 사업 시동…자체 LLM 첫 상용화

이스트소프트(대표 정상원)가 자체 개발한 경량 대규모언어모델(LLM) '앨런'을 앞세워 온디바이스 AI 시장 공략에 본격 나선다. 이스트소프트는 이큐비알과 대화형 AI 휴먼 솔루션 'AI 라이브 챗' 공급 계약을 체결했다고 19일 밝혔다. 이 계약을 통해 양사는 온디바이스 AI 키오스크 시장 공략에 본격 나선다. 이번 계약은 이스트소프트기 '앨런 LLM'과 AI 휴먼 기술을 기반으로 한 온디바이스 소프트웨어 개발 키트(Full On-Device SDK)를 이큐비알에 공급하는 내용이다. 이를 통해 양사는 온디바이스 AI 휴먼 키오스크를 빠른 시일 내에 제품화하고, 초도 물량 20억원 규모를 시작으로 순차적 유통에 돌입한다. 이스트소프트는 키오스크에 탑재되는 AI 라이브 챗이 독립 환경에서 구동돼 ▲높은 보안성 ▲지연시간 최소화 ▲클라우드 인프라 비용 절감 등의 장점을 제공한다고 설명했다. 여기에 검색 기반 생성형 AI(RAG), 음성합성(TTS), AI 휴먼 인터페이스 등 온디바이스 최적화를 위한 기술 고도화를 지속 추진하고 있다. 이큐비알은 금융권 SI 사업에서 쌓은 구축·유통·운영 노하우를 기반으로 키오스크 현장 설치와 유지보수까지 전반을 담당하게 된다. 양사는 기술-사업 연계 모델을 통해 온디바이스 기반 LLM 서비스의 상용화 속도를 높이겠다는 계획이다. 이스트소프트는 이번 계약을 통해 자체 개발한 앨런 LLM을 처음으로 상업 공급하게 됐으며, 이를 기점으로 에이전트 AI 구축 사업과 LLM 플랫폼 확장에 속도를 낼 방침이다. 하반기에는 LLM 기반 온디바이스 솔루션 사업을 주력으로 추진한다. 정상원 이스트소프트 대표는 "이번 계약은 자체 LLM 기술을 온디바이스 환경에 상용화한 상징적인 첫 사례"라며 "AI 라이브 챗을 포함한 다양한 솔루션을 통해 온디바이스 AI 생태계를 선도하고, LLM 기반 사업의 본격 성장을 이끌겠다"고 강조했다. 향후 양사는 공공, 의료, 유통, 관광 등 다양한 분야로 온디바이스 AI 키오스크 사업을 확대하고, 베리어프리 키오스크 도입 의무화에 선제 대응할 계획이다.

2025.06.19 09:43남혁우

韓 LLM 만들 'AI 국가대표' 선발 시동…하정우 입김 작용할까

약 2천억원이 투입되는 글로벌 톱 수준의 거대언어모델(LLM)을 만들 '인공지능(AI) 국가대표 정예팀' 선발전이 이달부터 본격화된다. 17일 업계에 따르면 과학기술정보통신부는 이르면 이번주, 늦어도 다음주 초쯤 '국가대표 초거대 AI 모델 육성' 사업, 일명 '월드베스트 LLM(World Best Language Model, WBL)' 사업자 선정을 위한 제안요청서(RFP)를 공고한다. 이 사업은 AI 정예팀을 선발해 단시간에 세계 최고 수준의 LLM을 개발할 수 있도록 필요한 데이터와 그래픽처리장치(GPU) 등 핵심 인프라를 전폭적으로 지원하는 것이 주 내용이다. 투입 예산은 1천936억원으로, 선발된 기업에겐 최대 3년간 GPU와 데이터, 인재 등 필요한 자원을 집중적으로 지원한다. 이경우 국가인공지능위원회 지원단장은 지난 2월 브리핑을 통해 "파운데이션 모델인 월드 베스트 LLM이 연내 나와줘야 효과가 있을 것"이라며 "예를 들어 10팀을 뽑아 한 팀이 GPU가 1천 개 이상 필요하다면 그걸 1년 동안 마음껏 쓸 수 있도록 해야 한다"고 설명했다. 그러면서 "세계적인 제도와 비교해 파격적으로 지원하라는 요청이 있었기에 그걸 감안해서 과기정통부에서도 실행 계획을 잡을 것"이라며 "여야정 협의체에서도 지원 방안을 강구해줄 것"이라고 덧붙였다. 업계에선 과기정통부가 이에 맞춰 오는 7월까지 사업자 평가를 마무리 해 최종 정예 개발팀 선발을 마무리 할 것으로 봤다. 최대 5개의 정예 개발팀이 선발될 예정으로, 대기업 3곳, 중소기업 2곳이 사업자로 선정될 가능성이 높은 것으로 점쳐졌다. 정부는 기업 규모나 오픈소스 수준 등에 따라 자부담도 최소화하겠다는 방침을 내세우고 있다. 이 프로젝트는 ▲신규 파운데이션 모델을 스크래치부터 개발하는 방식 ▲기존 모델을 고도화하고 산업 특화형 모델로 확장하는 방식으로 나뉜다. 이를 위해 정부에선 선정 기업에게 올해까지 GPU를 민간 임차 방식으로 제공한 후 내년부터 국가AI컴퓨팅센터가 구매한 GPU 자원을 직접 투입시킬 방침이다. 또 데이터는 공통적으로 사용할 수 있는 저작물 기반 데이터셋과 각 팀의 요구에 맞춘 데이터 구축·가공 작업을 병행 지원한다. 여기에 해외 우수 연구자 유치 시 인건비와 체제비도 매칭 방식으로 지원된다. 정부는 선정 기업들이 개발한 모델을 향후 공공사업에 우선 활용하도록 연계할 방침이다. 또 AI 생태계와 실사용 환경 연동에도 적극 나설 계획이다. 과기정통부 관계자는 "이번주에 사업 공고를 내는 것이 일단 목표"라며 "자세한 내용은 현재로선 밝히기 어렵다"고 말했다. 이처럼 정부가 WBL 프로젝트를 추진한다고 나서자 일부 기업들은 자체 LLM을 갖고 있다는 점을 앞세워 도전 의사를 적극 내비치고 있다. 현재 사업에 관심을 보이고 있는 곳은 네이버와 LG AI연구원, 삼성, KT, SKT, 코난테크놀로지, NC AI, 이스트소프트, 업스테이지 등으로 알려졌다. 가장 의지를 보이는 곳은 코난테크놀로지다. 이곳은 국내 처음으로 지난 2023년 자체 개발한 LLM '코난 LLM'을 선보인 데 이어 이듬해에는 미국 스탠퍼드대 에코시스템 그래프에 등재되며 한국을 대표하는 소버린 AI로 인정 받았다. 또 출범 3년차를 맞은 '코난 LLM'은 현재 공공과 민간을 아우르는 다양한 현장에 도입됐으며 올해 4월에는 국내 유일의 추론 통합모델인 'ENT-11'을 선보이며 '딥시크 R1' 대비 우수한 추론 성능을 입증하기도 했다. 최근에는 국산 AI 기술의 자립과 실질적 경쟁력 확보를 위해 반도체 기업인 리벨리온과도 적극 협력에 나서 기업형 AI 서버 '코난 AI 스테이션 서버'를 출시해 주목 받았다. 이스트소프트도 이날 자체 개발한 LLM '앨런 LLM'을 정식 출시하며 공개적으로 WBL에 도전장을 던졌다. 특히 AI 검색 엔진에 최적화된 자체 LLM을 개발하며 에이전틱 AI(Agentic AI) 서비스화에 있어 독립적인 기술 생태계를 구축하게 됐다는 점에서 경쟁력이 있다고 자신하고 있다. 이 중 업계에선 LG AI연구원과 함께 네이버, NC AI, 코난테크놀로지, 업스테이지 등 5곳을 사업자에 선정될 유력 기업으로 보고 있다. 특히 LG AI연구원은 2021년 12월 최초로 '엑사원 1.0'을 공개한 후 다양한 버전을 선보이며 지속적으로 고도화 해 왔던 만큼 사업자로 선정되기 충분한 요건을 갖췄다는 평가다. 네이버 역시 자체 개발한 초대규모 생산형 AI 언어모델인 '하이퍼클로바'를 갖고 있다는 점이 강점으로 꼽혔다. NC AI는 국내 게임사 최초로 자체 개발해 지난 2023년 공개한 생성 AI 언어모델 '바르코 LLM'으로 패션, 미디어 등 다양한 영역에서 사업을 펼치고 있다는 점에서 주목받고 있다. 업스테이지는 LLM 모델 '솔라'와 광학문자인식(OCR) 기반 '다큐먼트 AI' 등 자체 솔루션을 보유하고 있다. 업계 관계자는 "이제는 외부 모델을 가져와 파인튜닝(미세 조정)하는 방식만으로는 세계 시장에서 기술적으로 차별화 할 수 없을 것"이라며 "한국이 자체 파운데이션 모델 개발에 지금 집중하지 않으면 AI 시장에서 더 뒤처져 선두 그룹과 격차가 더 벌어지게 될 것"이라고 우려했다. 하지만 일각에선 최근 네이버클라우드 AI 혁신센터장 출신인 하정우 AI 미래기획수석이 최근 임명되면서 WBL 프로젝트 사업자 공고가 더 늦춰질 것이란 전망도 내놨다. 하 수석이 GPU를 더 적은 기업에게 몰아줘야 한다고 주장해왔던 만큼, 과기정통부가 준비했던 요건이 달라질 수 있다고 봐서다. 업계 관계자는 "하 수석이 그간 얘기했던 것을 보면 한 곳에 좀 더 힘을 몰아줘야 한다는 식인데, 만약에 이 같은 안으로 변경이 된다고 하면 네이버와 경쟁을 다른 기업들이 제대로 할 수 있을지 의문이 든다"며 "정부가 당초엔 5개 기업을 선정할 것이라고 했지만, 하 수석이 선임된 후 몇 개 기업을 선정할 지에 대한 것도 가늠이 안돼 답답하다"고 하소연했다. 그러면서 "WBL 프로젝트 공고도 사실 지난주쯤 나올 거라고 했다가 시기가 밀려 결국 하 수석이 임명된 후 정부가 요건을 새롭게 만든다는 얘기들도 나오고 있다"며 "이렇게 되면 과기정통부에서 말한 대로 이번주에 공고가 나올 수 있을지도 미지수"라고 덧붙였다. 이에 대해 과기정통부 관계자는 "이전부터 준비를 해왔던 프로젝트"아려 "그 사이에 정권이 바뀌었고 AI 수석도 새로 오긴 했지만, 원래 준비했던 대로 (공고를 내려고) 하고 있다"고 강조했다.

2025.06.17 17:37장유미

모티프, 국산 sLLM 첫 공개…미스트랄·구글·메타 제쳤다

인공지능(AI) 스타트업 모티프테크놀로지스가 자체 개발한 소형언어모델(sLLM) '모티프(Motif) 2.6B'를 공개했다. 이 모델은 구글, 메타, 미스트랄 등 글로벌 빅테크의 동급 혹은 중대형 모델들을 뛰어넘는 성능을 기록해 관심을 모았다. 임정환 모티프 대표는 10일 서울 강남구 조선 팰리스에서 열린 '레노버 테크데이 2025' 현장에서 모티프 2.6B를 처음 소개했다. 그는 "AI는 크기보다 얼마나 잘 만들었는지가 중요하다"며, 소형 모델의 전략적 가치와 기술 완성도를 강조했다. 모티프 2.6B는 총 26억 개의 파라미터를 가진 국산 sLLM으로 AMD의 MI250 GPU 한 장만으로도 추론이 가능하다. 임 대표는 "일반적인 대형언어모델(LLM)이 수십~수백 개의 GPU를 요구하는 것과 대비되는 경량구조를 갖췄다"며 "엔비디아 기반 인프라 대비 약 60% 수준의 비용으로 학습과 운영이 가능하다"고 설명했다. 특히 그는 70억 파라미터 규모의 미스트랄 7B보다 높은 벤치마크 점수를 기록하는 등 낮은 요구사항에도 높은 성능을 제공한다고 강조했다. 현장에서 공개된 벤치마크 결과에 따르면 모티프 2.6B는 프랑스 미스트랄의 70억 파라미터 모델 '미스트랄 7B'보다 134% 높은 점수를 기록했다. 구글의 젬마 2B와 비교해 191%, 메타의 라마 3.2(1B) 대비 139%, AMD 인스텔라(3B)보다 112%, 알리바바 첸(Qwen) 2.5(3B)와는 104% 성능 우위를 보였다. 임 대표는 각 모델의 공식 테크니컬 리포트에서 공개한 설정값과 지표를 그대로 적용해 비교했다며 벤치마크의 신뢰성과 투명성을 동시에 확보했다고 강조했다. 또한 모티프 2.6B는 문장 내 문맥 파악과 응답 정확도 향상에 초점을 맞춘 설계가 특징이다. 핵심 문맥에 집중하고 흐름에서 벗어난 단어 선택을 줄이기 위해 어텐션 메커니즘을 정밀하게 조정했다. 이로써 단순한 언어 생성 능력을 넘어, 실제 사용에 적합한 AI 성능을 확보했다. 임 대표는 이 sLLM이 단순한 파인튜닝 모델이 아니라 모델 구조 설계부터 학습 데이터 구성, 학습 파이프라인까지 처음부터 끝까지 전부 독자적으로 개발했다고 밝혔다. 그는 "남이 만든 모델을 조금씩 바꾸는 방식으로는 세계 수준에 도달할 수 없다고 판단했다"며 "그래서 처음부터 끝까지 전부 직접 만들었다"고 말했다. 모티프는 이번 모델을 계기로 온디바이스 AI와 에이전틱 AI 분야로 확장을 본격화한다. 경량화를 통해 슈퍼컴퓨터 없이도 구동이 가능해, 산업 현장에서의 적용성이 높기 때문이다. 또한 올해 말에는 텍스트 투 이미지(T2I), 텍스트 투 비디오(T2V)와 같은 멀티모달 생성형 AI 모델도 오픈소스로 공개할 계획이다. 이들 모델 역시 AMD 기반 인프라에서 학습 및 서비스가 가능하도록 설계되고 있다. 현재 모티프는 이미지·비디오 생성, AI 챗봇, 의료 상담형 모델 등 다양한 서비스형 AI를 직접 운영하고 있으며 AMD 기반의 102B 모델 호스팅 서비스도 병행하고 있다. 임 대표는 "가트너에 따르면 sLLM의 산업 수요는 2027년까지 대형 LLM보다 3배 이상 늘어날 것으로 보고 있다"며, "모티프 2.6B는 그 흐름을 준비하는 전략적 모델"이라고 말했다. 이어 "우리는 단순히 모델 하나 잘 만드는 회사를 넘어, 인프라부터 서비스까지 아우르는 풀스택 AI 생태계를 직접 구축하고 있다"며, "모티프는 누구나 접근할 수 있는 강력하고 효율적인 AI를 만들어, 국산 AI도 글로벌 무대에서 통할 수 있다는 걸 증명해 보이겠다"고 포부를 밝혔다.

2025.06.10 20:01남혁우

  Prev 1 2 3 4 5 6 7 8 9 10 Next  

지금 뜨는 기사

이시각 헤드라인

이재명 대통령 "AI 혁신에만 전념할 환경 만들겠다"

통신사가 직접 'AI 스마트폰' 만들어 판다

JMS 그 이후...넷플릭스, ‘나는 신이다’ 후속 ‘나는 생존자다’ 공개

국내 OTT, 해외서도 끊김 없이 보려면…여름휴가·연휴 안전한 시청법

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.