검색 - IT세상을 바꾸는 힘 지디넷코리아

ZDNet 검색 페이지

'AI 언어'통합검색 결과 입니다. (107건)

태그
기간
- 3개월
- 1년
- 1년 이전

재검색

"AI는 누구나 쓸 수 있어야"…레드햇이 제시하는 인프라 장벽 해결방안은?

인공지능(AI)은 이제 산업 전체를 바꾸는 거대한 흐름으로 자리잡고 있다. 하지만 많은 기업들은 아직 그 속도를 따라가지 못하고 있는 상황이다. AI 학습과 활용을 위한 그래픽처리장치(GPU)는 비싸고 전문 인력은 부족하다. 복잡한 모델과 배포 환경은 기술력을 갖춘 일부 기업만의 영역처럼 여겨지고 있다. 레드햇(Red Hat)은 이러한 문제를 해결하기 위한 방안으로 가상언어모델(vLLM)을 제시했다. 레드햇 브라이언 스티븐스 최고기술책임자(CTO)는 2일 여의도 레드햇코리아 사옥에서 "AI는 모든 기업이 활용해야 할 기술이지 일부 빅테크 기업의 전유물이 돼선 안 된다"며 "레드햇은 인프라 부담을 없애는 방식으로 AI의 대중화를 실현하려 한다"고 강조했다. 복잡한 인프라 없이도 AI활용… 오픈소스 기반 AI 플랫폼 'vLLM' 지난달 한국산업기술진흥협회가 연구개발(R&D) 조직을 보유한 국내 기업 1천479곳을 대상으로 '기업 AI 활용 실태'를 조사한 결과 전체 응답 기업의 76.9%가 'AI 도입이 필요하다'고 응답했다. 하지만 실제 업무에 활용하거나 도입을 검토하는 기업은 절반에도 못 미치고 있는 것으로 나타났다. 브라이언 스티븐스 CTO는 기업에 AI 도입이 어려운 이유로 그들이 처한 현실을 지적했다. 기술보다 환경의 문제라는 것이다. 그는 "많은 기업들이 AI를 써보려는 생각은 하지만 현실적인 장벽이 너무 많다"며 "GPU 가격은 너무 비싸고 엔비디아 스택은 배우기 어려우며 AI 엔지니어 확보 경쟁은 치열하다"고 설명했다. 이어 "지속되는 불황으로 투자 여유가 없는 상황에서 'AI는 각 기업에게 상관없는 기술'처럼 느껴지게 된다"고 밝혔다. 레드햇은 AI 활용을 위한 여러 장벽 중 가장 문제로 지적되는 인프라를 해결하기 위한 방안으로 vLLM을 선보이고 있다. vLLM은 오픈소스 기반의 AI 추론 서버 플랫폼이다. GPT 같은 대규모 언어모델(LLM)을 기업 내부 서버나 클라우드에서 구동할 수 있게 도와주는 소프트웨어(SW)다. 스티븐스 CTO는 vLLM을 서버나 클라우드를 운영하기 위한 핵심 운영체제(OS)인 리눅스(Linux)에 비유했다. 그는 "vLLM은 특정 하드웨어에 종속되지 않고 복잡한 설정 없이 모델을 실행할 수 있다"며 "엔비디아, AMD, 인텔 등 어떤 GPU든 상관을 뿐 아니라 AI 엔지니어가 아니어도 명령어 하나만 입력하면 모델을 구축하고 운영할 수 있다"고 설명했다. vLLM은 오픈소스 플랫폼 허깅페이스와 연동되며 사용자 친화적인 API와 관리 인터페이스도 제공한다. 중소기업도 서버 한두 대만 있으면 최신 AI 모델을 실행할 수 있으며 대기업은 데이터센터 단위로 확장 가능한 구조다. "GPU는 줄이고 속도는 4배로"…레드햇의 경량화 기법 레드햇이 vLLM을 통해 해결하고자 한 또 하나의 과제는 바로 AI 운영 효율성이다. 최근 LLM의 규모는 갈수록 커지고 있다. 자연어를 이해하고 생성하는 능력이 향상되면서 모델이 처리해야 할 데이터 양도 함께 늘어나고 있기 때문이다. 이렇게 모델이 커질수록 이를 실제로 돌리기 위해서는 고성능의 GPU가 더 많이 필요하고 메모리도 많이 차지한다는 점이다. 이로 인해 전력 소비와 장비 비용이 눈덩이처럼 커진다. 레드햇은 이 문제에 대한 해법으로 모델 경량화 기술인 '양자화(Quantization)'를 제시했다. 이는 AI 모델이 계산에 사용하는 숫자의 표현 단위를 줄여 연산 부담은 낮추면서도 결과의 정확도는 유지할 수 있도록 돕는 기술이다. 그는 "기존 AI 모델은 계산을 위해 소수점 네 자리 정도까지 표현할 수 있는 숫자 형식인 FP16을 사용한다"며 "이 방식은 GPU 메모리를 많이 차지하고 처리 속도도 느리다는 단점이 있다"고 지적했다. 이어 "레드햇은 이를 FP8이나 FP4처럼 절반 이하 수준의 더 간단한 형식으로 바꾸는 기술을 갖추고 있다"고 설명하며 "덕분에 모델 크기는 작아지고 연산 속도는 빨라진다. 실제로 처리 속도는 최대 4배까지 향상됐고 GPU 메모리 사용량도 크게 줄었다"고 소개했다. 레드햇은 'LLM 컴프레서'라는 자체 기술을 통해 이 양자화를 오픈소스로 공개했다. 이 덕분에 정확도는 99% 이상 유지하면서도 모델 경량화가 가능하다. 실제로 허깅페이스에서 매달 100만 건 이상 관련 모델이 다운로드되고 있다. "설정 없이 바로 쓴다"…기업을 위한 '완성형 AI 인프라' 이와 함께 레드햇은 오픈소스 기반의 vLLM과 양자화 기술을 한데 묶은 상용 서비스인 레드햇 AI 인퍼런스 서버도 출시했다. 이 제품은 AI 추론 서버를 기업이 실제 환경에서 바로 쓸 수 있도록 구성했다. vLLM 기반으로 기업에 최적화된 AI 모델, 양자화 도구, 보안 업데이트, 기업용 기술지원이 함께 제공된다. 레드햇 엔터프라이즈 리눅스(RHEL), 오픈시프트(OpenShift) 등 레드햇이 제공하는 서비스와 모두 호환되며 기술지원을 위한 서비스수준협약(SLA)도 제공한다. 그는 "오픈소스 vLLM이 개발자들을 위한 도구라면 인퍼런스 서버는 기업을 위한 완성된 제품"이라며 "컨테이너 형태로 제공돼 누구나 바로 배포하고 운영할 수 있는 것이 강점"이라고 강조했다. 이어 "AI는 더 이상 선택이 아닌 생존의 조건으로 지금은 복잡한 기술을 공부할 때가 아니라 우리 기업의 어디에 AI를 적용할지 고민해야 할 때"라며 "레드햇은 그 진입 장벽을 최대한 낮추기 위해 노력할 것"이라고 덧붙였다.

2025.07.02 10:59남혁우 기자

토스랩, 더네이쳐홀딩스도 협업툴 '잔디' 쓴다

업무용 협업툴 '잔디'를 서비스하는 토스랩(대표 김대현)은 글로벌 패션 기업 더네이쳐홀딩스가 AI기능이 탑재된 잔디를 도입했다고 1일 밝혔다. 더네이쳐홀딩스는 내셔널지오그래픽, 배럴, 마크 곤잘레스, 브롬톤 런던 등 유수의 글로벌 브랜드를 개발·생산하고 유통하는 기업이다. 홍콩·대만·마카오·인도네이사 등 해외 시장에서도 활발히 비즈니스를 전개하고 있다. 글로벌 오피스 간 협업이 빈번한 만큼, 더네이쳐홀딩스는 소통 채널을 통합하고 체계적인 디지털 업무환경을 마련하기 위해 협업툴 잔디를 도입했다. 특히 협업툴 잔디에 내장된 AI 기능인 스프링클러를 활용해 구성원간 언어 장벽을 해소하고 있다. 메시지 입력창에 AI를 활용해 작성한 내용을 영어, 일본어, 중국어, 베트남어 등 14개 언어로 실시간 번역할 수 있으며, 외국어로 작성된 메시지도 원클릭으로 자동 번역되어 즉시 확인할 수 있다. 또 지식 베이스 기능을 활용하면 더네이쳐홀딩스만의 사내 문서 및 정보를 기반으로 보다 정확한 자연어 답변을 제공받을 수 있다. 아울러 해당 답변이 참조한 원문까지 확인 가능해 정보 신뢰도 또한 높다. 더네이쳐홀딩스 관계자는 “글로벌 성장을 가속하기 위해서는 언어의 장벽 없이 자유롭게 소통하고 협업할 수 있는 협업툴이 필수”라며 “사내 규정과 같은 사내 정보 자산을 기반으로 고품질의 답변을 받을 수 있어 사용자 만족도가 높다”고 밝혔다. 김대현 토스랩 대표는 “빠르게 변화하는 트렌드에 대응하며 협업하는 패션 기업이 잔디 AI를 도입한 이유는 협업의 핵심인 소통의 품질을 AI로 끌어올릴 수 있기 때문”이라며 “글로벌로 비즈니스를 확장하는 과정에서 축적되는 데이터를 가치 있게 활용할 수 있도록 잔디 AI가 지속적으로 지원할 것”이라고 말했다.

2025.07.01 22:20백봉삼 기자

지미션, LLM 문서처리 솔루션 출시…기업 문서 자동화 시장 본격 진입

지미션이 핵심정보를 자동으로 분류·요약하는 문서처리 거대언어모델(LLM)을 통해 기업 문서 자동화 시장에 진입했다. 지미션은 신제품 '닥스훈드(DXHUND)'를 정식 출시하고 공공기관·금융사·대기업 등을 주요 타깃군으로 삼아 시장 확산을 추진 중이라고 30일 밝혔다. 제품명은 정보 탐지에 특화된 견종 닥스훈트에서 착안했으며 복잡한 문서 속에서도 의미 기반 핵심정보를 빠짐없이 찾아낸다는 기술적 기획이 반영됐다. '닥스훈드'는 광학문자인식(OCR) 기술을 기반으로 이미지 문서를 디지털 텍스트로 변환한 뒤 문서 구조를 해석해 항목별 정보를 자동 추출하거나 사용자 목적에 맞춰 내용을 요약·분류하는 기능을 제공한다. 계약서, 진술서, 지시문 등 비정형 문서가 많은 업무 환경에서 반복 업무를 줄이는 데 특히 적합하다는 평가다. 또 문서 내 포함된 개인정보를 자동 탐지해 비식별화하거나 마스킹할 수 있으며 사용자가 자연어로 문서 검색과 필터링을 수행할 수 있는 질의응답형 인터페이스도 함께 제공된다. 단순한 문서 처리 도구가 아닌 검색-분류-대응까지 하나의 흐름으로 연결되는 통합형 솔루션이라는 점이 차별 포인트다. 지미션은 해당 제품에 자사 기존 기술력인 AI OCR, 자연어처리(NLP), 개인정보 비식별화 역량과 더불어 최근 확보한 LLM 엔진까지 통합 적용했다고 설명했다. 사전 처리와 후처리의 품질을 모두 감안한 종단 간 문서처리 체계를 구현했다는 의미다. 이번 제품 출시는 기업 문서 업무에서 가장 처리 비용이 크고 리스크가 높은 '비정형 문서 처리'를 기술로 대응하려는 산업적 수요 증가에 맞춰 기획된 것으로 보인다. 특히 하루 단위로 대량 문서를 수작업 검토하는 조직일수록 효과가 뚜렷할 수 있다. 한준섭 지미션 대표는 "'닥스훈드'는 기술의 역할과 한계를 냉정하게 인식한 상태에서 반복적이지만 복잡한 문서 업무를 효율화하려는 조직에 실질적인 도움이 되도록 설계했다"며 "기술 중심의 과잉 마케팅보다 실사용 데이터를 기반으로 시장을 확장해나갈 것"이라고 밝혔다.

2025.06.30 15:00조이환 기자

"크리에이터, 목소리만 주면 된다"…NC AI, 샌드박스 글로벌화 '전면 지원'

NC AI가 MCN 업계 선두주자 샌드박스네트워크와 손잡고 크리에이터의 글로벌 진출을 지원한다. NC AI는 서울 용산 샌드박스 본사에서 샌드박스네트워크와 '기술지원 및 사업활동 공동협력' 양해각서(MOU)를 체결했다고 26일 밝혔다. 행사에는 이연수 NC AI 대표, 이필성 샌드박스 대표, 샌드박스 공동창업자이자 최고크리에이티브책임자(CCO)인 도티가 참석했다. 이번 협력을 통해 NC AI는 자사의 버티컬 미디어 AI 기술과 바르코 거대언어모델(LLM) 기반 솔루션을 샌드박스에 제공한다. 샌드박스는 200여 팀 이상의 크리에이터 네트워크를 통해 이를 실전 현장에 접목한다. 양사는 단순 협업을 넘어 독자 인공지능(AI) 파운데이션 모델 개발에도 공동으로 나서며 글로벌 경쟁력을 키운다는 계획이다. NC AI가 제공하는 기술에는 실시간 AI 번역, 다국어 음성 합성, 3D 아바타 생성, 실시간 다국어 채팅 번역 등 미디어 콘텐츠 전용 AI 솔루션이 포함돼 있다. 현재는 영어, 일본어, 중국어 등을 중심으로 게임과 콘텐츠 특화 번역 기능을 우선 적용하고 있다. 보이스 액팅 기술은 크리에이터 목소리를 짧은 샘플만으로 재현해 감정과 말투까지 유지한 다국어 더빙을 구현한다. 도티 같은 인기 크리에이터도 기존 콘텐츠 하나로 여러 언어의 팬과 동시에 소통할 수 있는 구조다. 기술적으로는 자막이나 기계식 더빙이 아닌 '실제 목소리 기반'의 몰입형 팬 경험을 목표로 한다. 실시간 다국어 챗봇 기술은 특히 라이브 방송과 팬미팅 현장에 바로 적용된다. 한국어로 진행되는 스트리밍에서도 영어, 일본어, 유럽권 언어로 실시간 대화가 가능해지며, 글로벌 커뮤니티 형성과 관리가 수월해진다. 3D 콘텐츠 측면에선 간단한 2D 이미지를 기반으로 크리에이터 고유 굿즈, 아바타를 제작할 수 있는 도구도 제공된다. 패션 AI 역시 바르코 아트 기술과 결합해 자유로운 의상 디자인, 착장 시연이 가능하다. 크리에이터가 브랜드화에 필요한 시각 요소를 AI로 자체 생성할 수 있는 기반이 마련된 셈이다. 콘텐츠 품질과 확장성 면에서도 효과음, 모션 생성, 애니메이션 등 고비용 작업을 자동화해 진입 장벽을 낮췄다. 특히 숏폼, 웹툰, 광고 등 다양한 장르에 필요한 시청각 요소를 AI가 대체하면서 제작자 역량의 범위가 넓어진다. 양사의 협력은 크리에이터 생태계 자체를 기술로 전환하는 시도이기도 하다. 단순한 솔루션 제공을 넘어 크리에이터의 개성과 지적재산권(IP)을 유지하면서도 다국어·다문화 콘텐츠로 확장할 수 있도록 설계돼 있다. NC AI는 샌드박스 협력을 기반으로 AI 솔루션의 사업화를 확대하고 산업 맞춤형 미디어 AI 생태계 구축에도 속도를 낸다. 이연수 NC AI 대표는 "샌드박스와 함께 국내 크리에이터들이 '바르코 LLM'과 미디어 버티컬 AI를 활용해 본연의 개성을 살리고 글로벌 팬들과 자유롭게 소통할 수 있도록 지원하겠다"고 밝혔다.

2025.06.26 10:44조이환 기자

[AI는 지금] 'K-AI' 노리는 코난테크·업스테이지, 韓 반도체 기업과 협업 나선 까닭은

한국형 인공지능(AI) 모델 개발을 위한 정부의 '독자 AI 파운데이션 모델' 프로젝트 사업자 선정에 도전장을 내민 AI 업체들이 국내 반도체 기업과 손잡고 경쟁력 끌어올리기에 본격 나섰다. 25일 업계에 따르면 코난테크놀로지는 최근 AI 반도체 기업 리벨리온의 신경망처리장치(NPU)에 자사 거대언어모델(LLM)이 탑재된 '코난 AI 스테이션 서버'를 접목했다. 이를 위해 두 회사는 지난해 8월 AI 모델과 AI 반도체 기술을 결합하는 공동 연구개발 협약을 맺고 국산 AI 소프트웨어와 반도체 기술을 융합한다고 발표한 바 있다. 코난 AI 스테이션 서버는 팀이나 조직 단위가 함께 사용하는 생성형 AI 인프라로 사용자 수에 따라 그래픽처리장치(GPU), 메모리, 스토리지를 유연하게 구성할 수 있다. 지난달 출시한 기업형 AI 서버 코난 AI 스테이션 서버에는 코난 LLM이 기본 탑재된 상태로, 리벨리온의 최신 NPU에서 작동되고 있다. 두 회사는 현재 최적화 작업을 진행 중이다. 업스테이지도 국내 반도체 팹리스 기업인 퓨리오사AI와 '신경망처리장치(NPU) 기반 생성형 AI 사업 협력'을 위한 양해각서(MOU)를 체결했다. 이번 일로 업스테이지는 자체 거대언어모델(LLM) '솔라'를 퓨리오사AI의 차세대 NPU '레니게이드'에 최적화해 탑재할 계획이다. 또 두 회사는 NPU 기반으로 구동하는 온프레미스 AI 구축 사업을 공동 추진하고 국내는 물론 글로벌 시장까지 함께 공략할 방침이다. 이들이 이처럼 나선 것은 최근 AI 반도체 시장을 미국 엔비디아가 사실상 독점하며 이에 따른 글로벌 공급난과 가격 급등으로 인해 불안정성이 지속되고 있어서다. 여기에 최근 미국, 중국 등 해외 빅테크 LLM의 공세가 거세지면서 국내 AI 산업 전반에 상당한 부담이 가중되고 있다는 점도 주효했다. 더불어 최근 정부가 '독자 AI 파운데이션 모델' 프로젝트 사업자 선정에 나서고 있는 것도 영향이 크다. 코난테크놀로지와 업스테이지는 각각 자체 LLM을 보유하고 있는 곳으로, 이번 정부의 프로젝트에 사업자로 참여하고 싶다는 의지를 강하게 드러내고 있다. 이들의 LLM이 대표 AI 모델로 선정되면 'K-AI 모델', 개발사는 'K-AI 기업' 등 명칭을 쓸 수 있게 된다. 정부는 이 사업에 총 1천936억원을 투입해 선발 기업에게 최대 3년간 GPU와 데이터, 인재 등 필요한 자원을 집중적으로 지원한다. 초기에 최대 5개 기업을 선발할 예정으로, 평가를 거쳐 점차 지원기업을 압축해 나갈 계획이다. 이 사업에는 두 회사 외에도 네이버와 카카오, LG AI 연구원, KT, 솔트룩스, 이스트소프트 등이 참여 의사를 적극 내비치고 있다. 업계 관계자는 "국내 대표 AI 소프트웨어와 하드웨어 기업이 힘을 모아 국산 AI 경쟁력을 강화하기 위해 나서려는 분위기가 조성되고 있다는 점은 긍정적"이라며 "이들의 움직임이 정부가 추진하는 프로젝트 사업자 선정에 어떤 영향을 줄 지 기대된다"고 말했다. 그러면서 "국산 NPU 기반 생성형 AI 솔루션의 상용화는 해외 기술 의존도를 낮추고 AI 인프라의 자립화와 기술 주권 확보에 기여할 것으로 보인다"고 덧붙였다.

2025.06.25 10:10장유미 기자

LG AI연구원 '엑사원 4.0' 개발 중…추론형 AI 역량 강화 시동

LG가 차세대 인공지능(AI) '엑사원'의 후속 버전 개발에 속도를 내고 있다. 24일 업계에 따르면 LG AI연구원은 '엑사원 4.0'과 조직병리 특화 모델 '엑사원 패스 2.0'을 개발 중이다. 현재까지 관련 공식 행사 계획은 없으며 공개 일정도 논의 단계에 머물러 있는 것으로 알려졌다. '엑사원 4.0'은 기존 모델에 추론형 모델 '엑사원 딥'을 통합하는 형태로, 대용량 장문 처리와 과학·의료 등 고도화된 전문 영역 활용을 목표로 설계되고 있다. '3.5' 버전은 A4 100페이지 수준의 문서를 단일 입력으로 처리할 수 있을 정도의 처리 능력을 보인 바 있다. 함께 준비 중인 '엑사원 패스 2.0'은 병리 이미지 기반의 암 진단 AI 모델로, 유전자 검사 대비 검사 시간을 줄이는 데 목적이 있다. 두 모델 모두 오픈소스로 공개해 활용성과 투명성을 높인다는 것이 LG 측 내부 방향성이다. 지난 23일 과학기술정보통신부 장관으로 지명된 배경훈 LG AI연구원장은 지난 3월 엔비디아 개발자 행사에서 "'엑사원 4.0'부터 통합 모델을 선보일 것"이라며 "상반기 출시를 목표로 한다"고 말했다. LG 관계자는 "모델은 개발 중인 것이 맞고 행사는 미정"이라고 밝혔다.

2025.06.24 15:12조이환 기자

[AI는 지금] 정부, '국가 파운데이션 모델' 추진…업계 "설계는 훌륭, 실행이 관건"

정부가 글로벌 생성형 인공지능(AI) 시장에서 독립적 경쟁력을 확보하기 위한 '독자 파운데이션 모델' 개발에 착수했다. 모델을 오픈소스로 공개해 민간 활용도를 극대화하겠다는 구상이다. 업계에서는 방향성과 의도에 대해 긍정적인 평가가 나오지만 실질 집행에 대한 지속적인 모니터링은 필요하다는 시각도 병존한다. 24일 업계에 따르면 과학기술정보통신부는 지난 20일 정보통신산업진흥원(NIPA), 지능정보사회진흥원(NIA), 정보통신기획평가원(IITP) 등과 함께 '독자 AI 파운데이션 모델' 프로젝트를 공식 발표했다. 해당 사업은 기존 '월드 베스트 거대언어모델(LLM)'로 불리던 기획의 정식 명칭으로, 다음달 7월 21일까지 국내 AI 정예팀 공모를 진행해 최대 5개 팀을 선발하고 단계별 압축 평가를 통해 상위팀으로 압축할 계획이다. 이번 사업은 최근 6개월 내 출시된 글로벌 최신 AI 모델 대비 95% 이상의 성능을 목표로 삼고 있다. 다만 고정된 성능 수치에 집착하기보다는 '무빙 타겟' 방식을 도입해 기술환경 변화에 따라 목표와 평가 기준을 유연하게 조정하는 전략을 채택했다. 과기정통부는 이와 같은 방식을 미국 방위고등연구계획국(DARPA)의 모델에 빗대어 'DARPA형'이라고 정의했다. 기술주권 위한 'K-AI 전략' 본격화…정예팀 자율 설계·정부 전폭 지원 구조 이 프로젝트를 위해 정예팀은 AI 모델 개발 전략과 방법론을 스스로 제시해야 한다. 정부는 GPU, 데이터, 인재 등 자원 항목에 대해 '희망 수요'를 정예팀이 먼저 요청하도록 하고 평가를 통해 적정 수준을 매칭 지원한다. 이 과정에서 오픈소스 공개 범위가 넓을수록 정부의 지원 매칭 비율은 높아진다. 그래픽 처리장치(GPU)는 당장 1차 추경 예산 1천576억원 규모를 활용해 민간 GPU를 임차해 지원한다. 팀 당 초기 지원 수량은 GPU 500장 수준이며 평가 결과에 따라 1천 장 이상까지 확대된다. 내년 하반기부터는 정부가 직접 구매한 첨단 GPU 1만 장을 본격 투입할 예정이다. 데이터는 공통수요와 개별수요로 나눠 지원된다. 정예팀이 필요로 하는 저작물 기반 학습데이터를 연간 100억원 규모로 공동구매하고 팀별 데이터 구축 및 가공은 연간 30억~50억원 수준으로 지원한다. 학습 효율성과 저작권 이슈를 동시에 감안한 전략이다. 인재 지원은 해외 우수 연구자 유치를 전제로 한다. 정예팀이 해외 팀이나 재외 한인 인재를 유치하면 정부가 연간 20억원 내외의 인건비 및 연구비를 매칭한다. 이 항목은 정예팀이 탈락하더라도 오는 2027년까지 지속 지원된다. 모델 성능 평가는 6개월 주기로 진행된다. 국민과 전문가가 함께 참여하는 콘테스트 기반 평가, 국내외 벤치마크 기준에 따른 검증 평가, 파생 모델 수를 기준으로 한 파생 평가 등을 결합한 입체적 방식이다. 단계평가를 통해 5개 팀에서 4개, 3개, 2개로 점차 압축하는 경쟁형 설계를 따를 예정이다. 모델 개발 완료 후에는 오픈소스를 통해 국내 AI 생태계 전반에 확산될 예정이다. 정예팀은 공모 시 '국민 AI 접근성 향상'과 '공공·경제·사회 전반의 AI 전환'을 위한 활용 계획을 함께 제출해야 하며 정부는 필요에 따라 이에 매칭해 후속 지원도 가능하다고 밝혔다. AI 안전성 확보도 주요 과제로 포함된다. 정부는 AI 안전연구소(K-AISI)와 협력해 파운데이션 모델의 신뢰성과 확장성을 검증하고 일정 수준 이상에 도달한 모델에 대해 'K-AI 모델', 'K-AI 기업' 등 명칭을 부여해 글로벌 시장에서의 공신력을 제고한다는 방침이다. 송상훈 과기정통부 정보통신정책실장은 "이번 프로젝트는 단순히 AI 모델을 만드는 데 그치지 않고 기술주권을 확보하고 모두가 활용할 수 있는 AI 생태계를 조성하는 출발점이 될 것"이라며 "정예팀들이 글로벌 수준의 독자 모델을 확보해 대한민국이 AI 강국으로 도약하는 기반을 마련하길 기대한다"고 밝혔다. 설계는 잘 했다…'기술·자원·평가' 운용이 진짜 시험대 업계에서는 정부의 독자 파운데이션 모델 추진을 대체로 긍정적으로 평가하고 있다. 국가가 주도해 자국 모델을 구축하려는 흐름은 이미 전 세계적으로 확산 중이며 한국의 이번 시도도 그 연장선에 있다는 분석이다. 실제로 국가 주도 모델 개발은 미국 오픈AI, 앤트로픽 등과 중국 딥시크 만의 경쟁 구도가 아니다. 프랑스는 오픈소스 기반 생성형 AI 기업 미스트랄을 중심으로 자체 모델을 개발하고 있으며 에마뉘엘 마크롱 대통령이 직접 나서 수천억 원대 민간 투자와 글로벌 협력을 이끌고 있다. 싱가포르 역시 '씨라이언(SEA-LION)' 프로젝트를 통해 동남아 현지 언어 기반 LLM을 개발 중이다. 최근에는 칠레 AI센터를 중심으로 아르헨티나, 브라질 등 남미 12개국이 연합해 '라탐-GPT' 개발을 공식화하며 오는 9월 공개를 예고한 상태다. 라지브 쿠마르 한국외국어대학교 연구교수는 "국가가 주도해 독자적인 파운데이션 모델을 개발하는 건 지금 전 세계적인 흐름으로, 한국 정부의 이번 시도는 매우 긍정적으로 본다"며 "인도도 스타트업 중심의 개발을 정책적으로 지원하면서 정부 차원에서 국내 생태계를 강화하려는 시도가 있다"고 말했다. 더불어 업계에서는 이번 프로젝트가 단순히 모델 하나를 만드는 데 그치지 않고 자원 배분 방식과 생태계 설계까지 포괄하고 있다는 점에 주목하고 있다. 'GPU·데이터·인재'라는 AI 핵심 자원을 수요 기반으로 자율 신청받고 이를 정부가 평가 후 매칭하는 구조가 민간 주도성과 정부 책임성을 동시에 확보하려는 시도로 보고 대체로 긍정적으로 반응하는 상황이다. 다만 실무 현장에서는 자원 지원이 선언에만 머물 경우 효과가 반감될 수 있다는 우려도 제기된다. 일례로 GPU의 경우 1천576억원 규모의 예산이 잡혀 있다 해도 실제 장비 임차·세팅·운영까지 이뤄지는 시간 차를 간과해선 안 된다는 게 중론이다. 단순한 GPU 확보가 아니라 팀별 물리적 접근성과 운영 안정성까지 감안한 체계 설계가 필요하다는 것이다. 데이터 항목도 비슷한 맥락이다. 정예팀이 요청하는 데이터에 대한 품질 기준과 저작권 검토 체계가 정비되지 않을 경우 향후 오픈소스 공개 과정에서 법적 리스크나 생태계 혼란을 야기할 수 있다. 특히 저작물 데이터의 공동구매가 연간 100억원 규모로 설정된 만큼, 명확한 선별 기준과 기술적 정제 절차가 병행돼야 한다는 의견이 나온다. 인재 유치 항목에 대해선 방향성은 맞지만 실질 효과는 제약이 클 수 있다는 관측도 있다. 단순히 해외 인재에게 연구비를 매칭 지원한다고 해서 국내에 안착하는 건 어렵다는 것으로 국내 기관의 위상, 프로젝트 자체의 매력도, 그리고 연구 독립성 등이 종합적으로 뒷받침돼야 할 것으로 관측된다. 오픈소스 정책 역시 마찬가지다. 오픈소스 정책이 산업 육성과 충돌하지 않도록 장기적으로는 파라미터 제한이나 일부 모듈 비공개 등에 대한 세분화된 가이드라인이 수립될 필요가 있다는 것이다. 한 업계 관계자는 "오픈소스를 전제로 한 모델 전략은 지금 시기에 필요하다"면서도 "오픈소스에 대한 구체적인 정의가 프로젝트가 진행되면서 확립돼야 할 것으로 보인다"고 말했다. "이어 기술 보호 없이 모든 걸 일괄적으로 공개할 경우 산업적 격차를 키울 수 있다"고 우려했다. 일각에서는 이 프로젝트가 '국가대표 AI'를 선발하는 성격인 만큼 평가 기준의 엄정성과 공정성이 핵심이라는 지적도 있다. 단순한 국내 경쟁이 아니라 세계적 기술 경쟁의 문턱을 넘는 출발점이 되려면 국제적인 벤치마크와 기술 평가 기준을 적극 반영해야 한다는 주장이다. 또 다른 업계 관계자는 프로젝트를 두고 "파운데이션 모델 구축을 위한 기술력과 역량은 충분하지만 자원이 부족했던 강소기업에게는 매우 훌륭한 육성 프로젝트로 보인다"며 "다만 기술적 발전이 빠른 만큼 평가 기준에는 국제적인 수준이 반영돼야 그 공신력이 확보되고 국가대표로서도 의미가 있을 것"이라고 말했다. 이와 함께 모델 규모에 대한 조건이 명확히 규정돼 있지 않다는 점도 일부에서 우려되는 대목이다. 개발 전략과 방법론을 정예팀이 자율적으로 제안하는 'DARPA형' 설계는 기술 진화에 유연하게 대응할 수 있다는 점에서 긍정적이지만 자칫 자원 격차에 따른 구조적 불균형을 초래할 수 있다는 지적이다. 업계 관계자는 "모델 규모에 대한 규정이 자칫 잘못되면 큰 모델들만이 성능과 역량이 좋게 평가를 받을 것"이라며 "기울어진 운동장이 될 수도 있으므로 이를 방지하기 위한 노력을 기울여야 할 것"이라고 평가했다.

2025.06.24 11:21조이환 기자

"軍 AI 싹쓸이"…코난테크놀로지, 국방 AI 서밋 연다

코난테크놀로지가 국방 인공지능(AI) 기술력을 집약한 만남의 장을 열어 방산 시장 공략에 속도를 내고 있다. 코난테크놀로지는 다음달 16일 서울 용산 전쟁기념관 내 로얄파크컨벤션에서 '국방 AI 테크 서밋 2025'를 개최한다고 23일 밝혔다. 이 행사에는 군 관계자, 방산 협력업체 관계자 등 200여 명이 참석하며 국방 AI 관련 성과와 활용 전략을 공유하는 세션으로 구성된다. 이번 서밋은 코난테크놀로지가 지난 10년간 수행해온 국방 AI 사업 사례를 외부에 처음으로 공개하는 자리다. 주요 세션으로는 ▲국방 AI 기술 추진 전략 및 도입사례 ▲AI 거버넌스 기반 플랫폼 구축 전략 ▲감시정찰 체계를 위한 지능형 의사결정 전략 ▲에이전틱 AI 기반 정보 분석 전략 등이 포함됐다. 행사장에는 관련 기술과 제품의 시연도 진행된다. 코난테크놀로지는 AI 기반 화력운용시스템, 공중전투 기동훈련 체계, 스마트 인재관리 시스템 등 핵심 군 사업에 AI를 공급해온 국내 유일 기업으로, 현재 국방 및 민간 방산 전문기업 20여 곳과 협업 중이다. 특히 지능형 CCTV와 이동형 드론은 국내 최초로 한국인터넷진흥원(KISA) 인증을 받아 재난 구조 현장에서 실전 투입되고 있다. 일례로 'AI 파일럿' 등 유무인 복합 전투체계 실증에도 착수했으며 지난해 '방산혁신기업 100'에 이름을 올린 바 있다 더불어 지난 2023년 자체 개발한 대규모 언어모델 '코난LLM'을 기반으로 공공 및 민간 시장에 AI 솔루션을 공급 중이다. 해당 모델은 지난해 미국 스탠퍼드대 생태계 그래프에 등재됐다. 공공 프로젝트 기반의 신뢰를 바탕으로 의료 AI 영역으로도 확장 중으로, 지난 2월 한림대의료원과 국내 첫 거대언어모델(LLM) 기반 진료 플랫폼 공동 개발을 시작했다. 출시 2년차인 '코난LLM'은 현재 온디바이스, 프로페셔널, 엔터프라이즈 모델로 라인업을 구성해 고객 맞춤형 대응에 나섰다. 지난 3월에는 일반·추론 모드를 통합한 '이엔티-11(ENT-11)' 모델도 출시하며 범용성과 유연성을 높였다. 오는 7월 자사 기술을 탑재한 AI PC도 공개될 예정이다. 김규훈 코난테크놀로지 국방AI사업부 이사는 "AI 기술의 전략적 도입을 통해 국방력 강화에 기여하는 실질적 해법을 고객과 함께 모색할 계획"이라며 "실전성과 신뢰성 기반의 AI 솔루션으로 국방 분야의 새로운 기준을 만들겠다"고 밝혔다.

2025.06.23 16:47조이환 기자

정부, '국가대표 AI' 만든다…글로벌 수준 모델 개발에 '총력'

대한민국 정부가 인공지능(AI) 기술 자립과 생태계 확장을 목표로 국내 정예팀을 뽑아 독자 모델 개발에 나선다. 글로벌 기업 중심의 AI 주도권 구도를 견제하고 기술 주권을 확보하기 위해서다. 과학기술정보통신부(과기정통부)는 '독자 AI 파운데이션 모델 프로젝트'를 공식 출범하고 다음달 21일까지 참여 정예팀 공모에 착수한다고 20일 밝혔다. 과기정통부 외에도 정보통신산업진흥원, 한국지능정보사회진흥원, 정보통신기획평가원이 공동으로 추진하는 이번 사업은 기존 '월드베스트 거대언어모델(World Best LLM)' 프로젝트의 공식화다. 이번 공모는 성능·전략·파급효과 등을 기준으로 최대 5개 정예팀을 선정한 뒤 단계별 평가를 통해 점진적으로 압축하는 방식으로 진행된다. 최신 글로벌 AI 모델 성능의 95% 이상 달성을 목표로, 참여팀은 자체적인 개발 전략과 방법론을 자유롭게 설계할 수 있다. 프로젝트는 일괄지원이 아닌 6개월 단위 경쟁형 압축 방식을 도입해 민첩한 기술 진화를 유도한다. 지원 자원은 그래픽 처리장치(GPU), 데이터, 인재라는 세 가지 축으로 구성된다. GPU는 올해부터 내년 상반기까지 민간 GPU 임차 형태로, 이후엔 정부 구매 GPU를 활용해 정예팀당 최대 1천 장 이상이 단계별로 지원된다. 데이터는 저작물 중심의 공동구매와 개별 가공 작업에 연간 최대 150억원 규모의 예산이 투입된다. 인재 분야는 해외 연구자 유치 시 연 20억원 한도 내에서 인건비와 연구비를 매칭해 준다. 특히 대학·대학원생의 참여를 필수로 명시하며 미래 인재 양성을 병행하는 구조다. 동시에 참여팀은 국민 AI 접근성 향상, 공공·경제·사회 전환(AX) 기여계획도 함께 제출해야 한다. 오픈소스 수준에 따라 정부 매칭 비율과 자부담 비율이 달라지는 구조도 설계됐다. 프로젝트는 단순한 기술개발에 머무르지 않는다. 국민 대상 사용성 평가, 컨테스트형 단계 심사, 벤치마크와 한국어 성능·안전성 검증 등 다층적 방식으로 완성도를 높인다. 우수한 모델에는 'K-AI' 명칭 부여 등 글로벌 브랜딩도 병행한다. 안전성 확보를 위해 AI안전연구소(K-ASIS)와의 협력도 예정돼 있다. 이 밖에 공공영역은 물론 국방·안보 등 민감 분야 활용도 계획에 포함돼 있다. 정부는 개발된 모델을 오픈소스화해 민간 AI 서비스 생태계 확산에도 적극 활용할 방침이다. 송상훈 과학기술정보통신부 정보통신정책실장은 "이번 프로젝트는 AI 기술 주권 확보와 모두의 성장을 위한 생태계 구축이 목표"라며 "글로벌 수준의 독자 AI 모델을 통해 대한민국이 진정한 AI 강국으로 도약하길 기대한다"고 밝혔다.

2025.06.20 13:37조이환 기자

이스트소프트, AI 휴먼 키오스크 사업 시동…자체 LLM 첫 상용화

이스트소프트(대표 정상원)가 자체 개발한 경량 대규모언어모델(LLM) '앨런'을 앞세워 온디바이스 AI 시장 공략에 본격 나선다. 이스트소프트는 이큐비알과 대화형 AI 휴먼 솔루션 'AI 라이브 챗' 공급 계약을 체결했다고 19일 밝혔다. 이 계약을 통해 양사는 온디바이스 AI 키오스크 시장 공략에 본격 나선다. 이번 계약은 이스트소프트기 '앨런 LLM'과 AI 휴먼 기술을 기반으로 한 온디바이스 소프트웨어 개발 키트(Full On-Device SDK)를 이큐비알에 공급하는 내용이다. 이를 통해 양사는 온디바이스 AI 휴먼 키오스크를 빠른 시일 내에 제품화하고, 초도 물량 20억원 규모를 시작으로 순차적 유통에 돌입한다. 이스트소프트는 키오스크에 탑재되는 AI 라이브 챗이 독립 환경에서 구동돼 ▲높은 보안성 ▲지연시간 최소화 ▲클라우드 인프라 비용 절감 등의 장점을 제공한다고 설명했다. 여기에 검색 기반 생성형 AI(RAG), 음성합성(TTS), AI 휴먼 인터페이스 등 온디바이스 최적화를 위한 기술 고도화를 지속 추진하고 있다. 이큐비알은 금융권 SI 사업에서 쌓은 구축·유통·운영 노하우를 기반으로 키오스크 현장 설치와 유지보수까지 전반을 담당하게 된다. 양사는 기술-사업 연계 모델을 통해 온디바이스 기반 LLM 서비스의 상용화 속도를 높이겠다는 계획이다. 이스트소프트는 이번 계약을 통해 자체 개발한 앨런 LLM을 처음으로 상업 공급하게 됐으며, 이를 기점으로 에이전트 AI 구축 사업과 LLM 플랫폼 확장에 속도를 낼 방침이다. 하반기에는 LLM 기반 온디바이스 솔루션 사업을 주력으로 추진한다. 정상원 이스트소프트 대표는 "이번 계약은 자체 LLM 기술을 온디바이스 환경에 상용화한 상징적인 첫 사례"라며 "AI 라이브 챗을 포함한 다양한 솔루션을 통해 온디바이스 AI 생태계를 선도하고, LLM 기반 사업의 본격 성장을 이끌겠다"고 강조했다. 향후 양사는 공공, 의료, 유통, 관광 등 다양한 분야로 온디바이스 AI 키오스크 사업을 확대하고, 베리어프리 키오스크 도입 의무화에 선제 대응할 계획이다.

2025.06.19 09:43남혁우 기자

모티프, 국산 sLLM 첫 공개…미스트랄·구글·메타 제쳤다

인공지능(AI) 스타트업 모티프테크놀로지스가 자체 개발한 소형언어모델(sLLM) '모티프(Motif) 2.6B'를 공개했다. 이 모델은 구글, 메타, 미스트랄 등 글로벌 빅테크의 동급 혹은 중대형 모델들을 뛰어넘는 성능을 기록해 관심을 모았다. 임정환 모티프 대표는 10일 서울 강남구 조선 팰리스에서 열린 '레노버 테크데이 2025' 현장에서 모티프 2.6B를 처음 소개했다. 그는 "AI는 크기보다 얼마나 잘 만들었는지가 중요하다"며, 소형 모델의 전략적 가치와 기술 완성도를 강조했다. 모티프 2.6B는 총 26억 개의 파라미터를 가진 국산 sLLM으로 AMD의 MI250 GPU 한 장만으로도 추론이 가능하다. 임 대표는 "일반적인 대형언어모델(LLM)이 수십~수백 개의 GPU를 요구하는 것과 대비되는 경량구조를 갖췄다"며 "엔비디아 기반 인프라 대비 약 60% 수준의 비용으로 학습과 운영이 가능하다"고 설명했다. 특히 그는 70억 파라미터 규모의 미스트랄 7B보다 높은 벤치마크 점수를 기록하는 등 낮은 요구사항에도 높은 성능을 제공한다고 강조했다. 현장에서 공개된 벤치마크 결과에 따르면 모티프 2.6B는 프랑스 미스트랄의 70억 파라미터 모델 '미스트랄 7B'보다 134% 높은 점수를 기록했다. 구글의 젬마 2B와 비교해 191%, 메타의 라마 3.2(1B) 대비 139%, AMD 인스텔라(3B)보다 112%, 알리바바 첸(Qwen) 2.5(3B)와는 104% 성능 우위를 보였다. 임 대표는 각 모델의 공식 테크니컬 리포트에서 공개한 설정값과 지표를 그대로 적용해 비교했다며 벤치마크의 신뢰성과 투명성을 동시에 확보했다고 강조했다. 또한 모티프 2.6B는 문장 내 문맥 파악과 응답 정확도 향상에 초점을 맞춘 설계가 특징이다. 핵심 문맥에 집중하고 흐름에서 벗어난 단어 선택을 줄이기 위해 어텐션 메커니즘을 정밀하게 조정했다. 이로써 단순한 언어 생성 능력을 넘어, 실제 사용에 적합한 AI 성능을 확보했다. 임 대표는 이 sLLM이 단순한 파인튜닝 모델이 아니라 모델 구조 설계부터 학습 데이터 구성, 학습 파이프라인까지 처음부터 끝까지 전부 독자적으로 개발했다고 밝혔다. 그는 "남이 만든 모델을 조금씩 바꾸는 방식으로는 세계 수준에 도달할 수 없다고 판단했다"며 "그래서 처음부터 끝까지 전부 직접 만들었다"고 말했다. 모티프는 이번 모델을 계기로 온디바이스 AI와 에이전틱 AI 분야로 확장을 본격화한다. 경량화를 통해 슈퍼컴퓨터 없이도 구동이 가능해, 산업 현장에서의 적용성이 높기 때문이다. 또한 올해 말에는 텍스트 투 이미지(T2I), 텍스트 투 비디오(T2V)와 같은 멀티모달 생성형 AI 모델도 오픈소스로 공개할 계획이다. 이들 모델 역시 AMD 기반 인프라에서 학습 및 서비스가 가능하도록 설계되고 있다. 현재 모티프는 이미지·비디오 생성, AI 챗봇, 의료 상담형 모델 등 다양한 서비스형 AI를 직접 운영하고 있으며 AMD 기반의 102B 모델 호스팅 서비스도 병행하고 있다. 임 대표는 "가트너에 따르면 sLLM의 산업 수요는 2027년까지 대형 LLM보다 3배 이상 늘어날 것으로 보고 있다"며, "모티프 2.6B는 그 흐름을 준비하는 전략적 모델"이라고 말했다. 이어 "우리는 단순히 모델 하나 잘 만드는 회사를 넘어, 인프라부터 서비스까지 아우르는 풀스택 AI 생태계를 직접 구축하고 있다"며, "모티프는 누구나 접근할 수 있는 강력하고 효율적인 AI를 만들어, 국산 AI도 글로벌 무대에서 통할 수 있다는 걸 증명해 보이겠다"고 포부를 밝혔다.

2025.06.10 20:01남혁우 기자

"동남아판 챗GPT 만든다"…싱가포르, '멀티모달 LLM'에 '7천만 달러' 투입

싱가포르 정부가 자체 거대언어모델(LLM) 개발에 착수했다. 글로벌 인공지능(AI) 경쟁 속 지역 주권을 확보하고 다언어·다문화 환경에 최적화된 동남아판 소버린 AI를 실현하겠다는 포부다. 1일 싱가포르 정보통신미디어개발청(IMDA)에 따르면 이 조직은 현재 과학기술연구청(A*STAR), AI 싱가포르(AISG)와 함께 '국가 멀티모달 LLM 프로그램(NMLP)'을 운영하고 있다. 해당 사업은 싱가포르 국가연구재단(NRF)이 7천만 싱가포르 달러(약 700억원)를 투자해 추진되며 '국가 AI 전략 2.0 및 연구혁신기업(RIE) 2025 계획'과 연계해 내년까지 총 2년간 진행된다. 이번 프로젝트는 AI 인재 양성, 산업 생산성 향상, 신뢰 가능한 거버넌스 환경 조성 등 세 갈래 목표로 설계됐다. 국내 연구자에게는 고성능 컴퓨팅 자원을 지원하고 산업계는 다언어 고객 응대와 자율적 의사결정 시스템을 도입할 수 있도록 유도하는 것이다. 또 LLM의 작동 방식과 위험 요소를 규명하는 연구를 통해 신뢰 기반 AI 사용환경도 구축할 계획이다. 'NMLP'는 크게 두 가지 축으로 구동된다. 첫번째 축인 '머라이언(MERaLiON)'은 과학기술연구청 정보통신연구소가 주도한 모델로, 싱가포르와 동남아에서 흔한 언어·방언 혼용 대화를 인식하고 이해하는 데 초점을 맞췄다. 이 모델은 텍스트, 음성, 장면 정보를 통합하는 멀티모달 처리 능력을 갖췄고 구어체를 이해해 문맥 인식 정확도를 높였다. 구체적으로는 음성 인식·번역, 음성 요약, 음성 질의응답, 장면 인식, 감정 및 분위기 파악, 지역 방언 해석 등 6가지 주요 기능을 갖췄다. 이를 통해 공공·민간 부문의 고객지원, 인사이트 도출, 자동화 의사결정 등에 폭넓게 활용될 수 있다는 게 당국의 설명이다. 싱가포르 정부가 설립한 국가 AI 연구개발(R&D) 추진 기관이자 AI 국가 전략을 실행하는 중심 조직인 'AI 싱가포르'가 개발한 '시라이언(SEA-LION)'은 동남아 다국어 학습에 특화된 LLM 모델이다. 태국어, 베트남어, 인도네시아어 등 주요 지역 언어를 학습해 서구권이나 중화권 중심의 모델보다 높은 문맥 적합성과 응답 품질을 보이는 것이 특징이다. 언어적 대표성의 불균형 문제를 해소하고 포용적 AI 개발을 추진하는 데 목적을 둔다. 현재까지 개발된 '시라이언' 모델은 동남아 전역에서 작동 중으로, 동급 오픈소스 모델을 성능 면에서 앞서고 있는 것으로 알려졌다. 산업계 참여도 이미 활발하다. 과학기술연구청은 정보통신미디어개발청과 함께 머라이언 AI 컨소시엄을 조직했고 DBS은행, 그랩, 마이크로소프트, SPH미디어, 국가슈퍼컴퓨팅센터(NSCC) 등 13개 기관이 1차 멤버로 합류했다. 이들은 다언어 고객상담, 감정 및 건강정보 분석, 자율 의사결정 솔루션 등을 함께 개발 중이다. 컨소시엄은 공통 수요 집약을 통해 개발·통합 비용을 줄이고 데이터와 전문성을 공유해 모델 역량을 빠르게 개선할 방침이다. 또 기업 실무에 즉시 적용할 수 있는 형태의 교육과 도구를 제공하고, 투자 대비 수익(ROI) 검증을 위한 초기 개념증명(POC) 과제를 병행 추진한다. AI 싱가포르는 '시라이언'의 기능 확대와 품질 향상을 위해 외부 협력도 개방했다. 오픈소스화된 결과물을 토대로 다양한 파트너십을 구축해 공동 개발 체계를 유지한다는 계획이다. 싱가포르 정부는 이번 프로젝트를 통해 AI 기술의 지역 적합성과 전략적 자립성을 동시에 확보할 수 있을 것으로 기대하고 있다. 프로젝트 총괄 기관인 정보통신미디어개발청은 "싱가포르가 다언어 사회인 만큼 AI도 지역 현실을 반영할 수 있어야 한다"며 "이번 모델들이 산업 혁신뿐 아니라 AI 거버넌스에도 기여하길 기대한다"고 밝혔다.

2025.06.01 08:29조이환 기자

정부, '1.6조원' 규모 GPU 대전 시작…"WBL 훈련용 반도체, 민간과 함께 확보"

과학기술정보통신부가 민간 클라우드 기업들과 손잡고 총 1조6천300억원 규모의 그래픽처리장치(GPU) 확보·임차 사업을 추진한다. 세계 최고 수준의 초거대 언어모델 개발과 국내 산학연의 인공지능(AI) 인프라 확충을 위한 행보다. 과기정통부와 정보통신산업진흥원은 29일 서울 강남 코엑스에서 클라우드 기업을 대상으로 GPU 확보·임차 사업 통합설명회를 개최했다. 이달 1차 추가경정예산을 통해 관련 예산을 확정한 이후 다음달 4주차까지 협력 기업 공모에 본격 착수한 상태다. 이번 사업은 ▲총 1조4천600억원 규모의 GPU 확보 사업과 ▲1천723억원 규모의 GPU 임차 사업으로 구성된다. 확보 사업은 정부와 민간이 협력해 첨단 GPU를 직접 구매·구축하는 방식이고 임차 사업은 클라우드 기업이 보유한 GPU를 임차해 활용하는 구조다. 임차된 GPU는 가칭 '월드 베스트 LLM(WBL)' 프로젝트와 국내 산학연 등에 지원될 예정이다. 정부는 국내 고성능 연산 자원 부족 문제를 해소하고 AI 기술의 자립 기반을 확보하는 데 사업의 목적이 있다고 설명했다. 설명회 현장에선 사업 개요와 정책 방향 외에도 공모 절차, 평가 기준, 지원 조건 등의 세부 사항이 구체적으로 안내됐다. 참석자들은 질의응답을 통해 공모 준비에 필요한 사항들을 직접 확인할 수 있었다. 과기정통부와 정보통신산업진흥원(NIPA)은 다음달 4주차까지 공모 접수를 마감하고 오는 7월 중 평가와 협약 체결을 마무리할 계획이다. 이후 GPU 인프라 확보 및 배포를 신속히 추진하겠다는 입장이다. 과기정통부는 "보다 구체적인 공모 내용과 사업 안내는 과기정통부 및 NIPA 홈페이지를 통해 확인할 수 있다"고 밝혔다.

2025.05.29 17:18조이환 기자

"국산 LLM의 반격"…업스테이지, 31B 모델로 '글로벌 70B급' 뛰어넘었다

업스테이지가 경량 언어모델 '솔라 프로 2' 프리뷰를 내세워 글로벌 생성형 인공지능(AI) 시장에 정면승부를 걸었다. 자체 기술력으로 초대형 언어모델을 뛰어넘는 성능을 구현하며 국산 소형모델의 반격을 선언한 것이다. 업스테이지는 자체 개발한 거대언어모델 '솔라 프로 2'를 프리뷰 형태로 공개하고 응용프로그램 인터페이스(API)를 통한 무료 테스트 사용을 허용했다고 20일 밝혔다. '솔라 프로 2'는 오는 7월 정식 출시 예정이다. 이번 모델은 지난해 12월 공개된 '솔라 프로'의 후속으로, 패러미터는 기존 22B에서 31B로 약 1.5배 확대됐다. 주요 성능 지표도 크게 향상돼 동일 계열의 30B급 모델 중에서는 유일하게 메타와 알리바바의 70B급 모델을 벤치마크에서 앞섰다. '솔라 프로 2'는 종합지식(MMLU)·지시이행(IFeval) 평가에서 '라마 4 스카우트', '라마 3.3 70B', '큐원 2.5 72B' 등을 모두 웃도는 결과를 냈다. 한국어 성능도 'KMMLU', '해례' 벤치마크에서 최고 수준으로 확인됐다. 이번 모델에는 업스테이지 LLM 중 처음으로 '하이브리드 모드'가 탑재됐다. 사용자 선택에 따라 빠른 응답용 '챗 모드'와 단계적 추론을 위한 '추론 모드' 중 선택할 수 있으며 특히 추론 모드엔 '생각 사슬(CoT)' 기법이 적용돼 복잡한 수학·코딩 문제에 강점을 보인다. 성능 외에 사용성도 개선됐다. 최대 처리 토큰 수는 기존 대비 두 배 이상 확장된 6만4천 토큰으로 긴 문서 처리에 유리하다. 한국어 맞춤형 토크나이저 개선으로 최대 30%의 토큰 절감이 가능해 응답 속도와 비용 효율도 크게 높아졌다. 김성훈 업스테이지 대표는 "'솔라 프로 2'는 31B라는 효율적 규모로도 70B 모델 수준의 성능을 구현하며 작지만 강력한 소형언어모델의 새 기준을 제시한다"며 "특히 최고 추론 성능에 탁월한 한국어 성능을 갖춘 이번 모델을 통해 보다 많은 업무 혁신을 기대한다"고 밝혔다.

2025.05.20 15:00조이환 기자

인텔리콘연구소, 보고서 자동화 시장 '정조준'…국정원 보안도 '통과'

인텔리콘연구소가 기업 보고서 자동 생성 인공지능(AI) '딥리서치 울트라'를 선보였다. 기업 내부 문서와 외부 지식을 동시에 분석해 맞춤형 리서치를 지원하기 위함이다. 인텔리콘연구소는 공공기관, 로펌, 기업 대상 보고서 작성용 AI '딥리서치 울트라'를 개발했다고 14일 밝혔다. 이 기술은 자체 보유한 법률 추론 원천기술과 다단계 추론형 멀티 에이전트 기술을 결합해 만들어졌으며 외부 정보뿐 아니라 사내문서 기반 분석을 병행할 수 있는 것이 특징이다. 연구소는 '딥리서치 울트라'가 기존 오픈AI나 구글의 리서치 툴과 달리 기업 내부의 방대한 문서 자산과 규정, 정책, 법률자료 등을 바탕으로 리서치 보고서를 자동 생성할 수 있다고 밝혔다. 단순 웹 검색이 아닌 심층 문서 분석을 통해 보고서의 정밀도를 높였다는 설명이다. 이 솔루션은 인텔리콘의 문서 분석 솔루션 '도큐브레인'과 연동돼 사용된다. '도큐브레인'은 검색증강생성(RAG) 기반의 기업형 검색 시스템으로 대용량 문서에서 의미 있는 정보를 추출하는 기능을 제공하며 '딥리서치 울트라'와 함께 내부 정보에 특화된 리서치 결과를 생성할 수 있도록 돕는다. '도큐브레인'은 보안성 검증도 완료했다. 한국산업인력공단 도입 사례에서 국가정보원 보안 심사를 통과했으며 국무조정실 산하 기관의 보안 테스트와 모의해킹 절차도 모두 통과한 것으로 알려졌다. 인텔리콘 측은 이 같은 보안성 확보가 공공기관과 기업의 디지털 전환 리스크를 줄이는 데 기여할 수 있다고 설명했다. 이번 기술 출시는 인텔리콘이 리걸테크 영역에서 쌓아온 기술 역량의 연장선이다. 도큐브레인은 조달청 혁신제품으로 지정된 바 있으며 법률 문서 분석 특화 거대언어모델(LLM)로 기업과 공공기관의 문서 업무 자동화 수요를 충족시켜왔다. 임영익 인텔리콘연구소 대표는 "이번에 출시한 기업용 보고서 생성 AI는 단순한 정보 검색 도구를 넘어 기관 및 기업의 핵심 업무 효율성을 극대화하는 혁신적인 솔루션"이라며 "국정원 및 국무조정실의 보안 심사를 통과해 공공기관 및 기업들이 안심하고 사용할 수 있으며 '도큐브레인'과의 결합을 통해 문서 분석 및 보고서 생성 기능을 더욱 강화해 차별화된 가치를 제공할 것"이라고 밝혔다.

2025.05.14 13:04조이환 기자

"단행본 70권도 거뜬"…업스테이지, 한글 AI 교열 도구 '에디트업' 출시

업스테이지가 자체 거대언어모델(LLM) '솔라'를 기반으로 교열 서비스를 내놓았다. 전문가 수준의 문맥 교정 기능을 앞세워 인공지능(AI) 문서 편집 도구 시장에서 영향력을 확대한다는 전략이다. 업스테이지는 한글 교열 서비스 '에디트업'의 정식 서비스를 시작한다고 13일 밝혔다. 이 솔루션은 웹 기반 외에도 구글 크롬 확장 프로그램, 마이크로소프트 워드, 한컴오피스 플러그인으로도 이용할 수 있다. '에디트업'은 기사·보고서 등 다양한 문서 파일을 입력하면 오탈자와 띄어쓰기 오류를 자동으로 탐지해 수정 방향을 제시한다. 기존 맞춤법 검사기와 달리 문맥 기반 판단이 가능해 부적절한 어휘나 어색한 문장도 대체 문구를 제안해준다. 업스테이지의 자체 검증 결과 교정 정확도는 95%를 넘어서는 것으로 나타났다. 요금제는 ▲베이직 ▲프리미엄 ▲엔터프라이즈의 세 가지로 구성되며 각각 500자 기준 호출량이 연간 약 삼만 회, 십만 회, 오십만 회까지 지원되고 가장 저렴한 요금제 기준으로도 약 천오백만 자에 단행본 70권 분량 문서를 교열할 수 있다. 더불어 '에디트업'은 1대1 설치 지원과 플러그인 호환성을 내세워 출판사·언론사·공공기관 등에서 대용량 문서 작업에 강점을 갖는 구조다. 전문 교열 인력 부족 문제를 해소할 수 있는 대안으로 기대된다는 것이 업계의 분석이다. 업스테이지는 신조어, 유행어, 외국 인명 등 최신 데이터를 지속적으로 업데이트해 교열 정확도를 강화할 방침이다. 향후에는 영어 실시간 번역 기능도 더해 글로벌 업무 환경에서도 확장 활용될 수 있도록 할 계획이다. 김성훈 업스테이지 대표는 "많은 시간과 노력이 필요한 교열은 대표적인 노동 집약 분야"라며 "'에디트업'은 이를 자동화해 업무 효율성을 극대화하는 혁신적 도구"라고 밝혔다.

2025.05.13 14:41조이환 기자

[현장] 통합형 LLM·멀티소스 RAG로 '출격'…코난테크놀로지, 올해 실적 반등 노린다

"생성형 인공지능(AI)의 핵심은 더 이상 모델 성능의 경쟁이 아닙니다. 이제는 얼마나 실질적인 업무 수요를 반영하고 이를 통해 실제 성과를 만들어낼 수 있는가가 관건입니다." 김영섬 코난테크놀로지 대표는 13일 서울 광화문 호텔 코리아나에서 열린 기자간담회에서 이같이 밝히며 자체 개발한 차세대 거대언어모델(LLM), 신규 인공지능(AI) 제품군, 이를 아우르는 사업화 전략과 기술 로드맵을 공개했다. '추론 통합형 LLM부터 AI PC까지'라는 주제로 진행된 이번 간담회는 실제 업무 현장에서 검증 가능한 생성형 AI 기술을 중심으로, 코난테크놀로지가 독자 개발한 코난 LLM 'ENT-11', 레거시 연동형 검색증강생성(RAG) 시스템 'RAG-X', 그리고 온디바이스 AI 솔루션 'AI스테이션' 등을 소개하는 자리였다. 김 대표는 환영사에서 "지난 26년간 축적해온 기술 역량을 기반으로 우리는 단순 모델 성능이 아닌 비즈니스 실효성과 현장 접목 가능성에 초점을 맞춘 생성형 AI 전략을 펼쳐가고 있다"며 "제품군 확장을 통해 AI의 도입 허들을 낮추고 시장 성과로 이어지는 환경을 주도하겠다"고 강조했다. 실무형 RAG·통합형 LLM 앞세워…공공·의료 레퍼런스 '확보' 임완택 코난테크놀로지 전략기획본부 상무는 이날 간담회에서 검색증강생성 기술 기반의 신규 제품 '코난 RAG-X'를 소개했다. 발표에 앞서 그는 "LLM은 아무리 고성능이어도 최신 정보를 반영하지 못하고 사내 문서처럼 민감한 내부 데이터를 다루지 못하는 아키텍처 상의 한계가 있다"며 "우리는 이 한계를 실무 환경에서 해결하기 위해 RAG 기술을 핵심으로 재설계했다"고 설명했다. 임 상무에 따르면 '코난 RAG-X'는 단순한 외부 검색용 챗봇이 아니라 내부 데이터베이스(DB), 레거시 시스템, 공공기관 데이터, 뉴스, 논문, 커뮤니티 자료 등 다양한 정보를 연동해 활용할 수 있도록 구성된 멀티소스 기반의 B2B 특화형 시스템이다. 퍼플렉시티처럼 외부 웹에 의존하는 B2C형 RAG 솔루션과 달리 온프레미스 환경에서 구동돼 사내 민감 데이터가 외부로 유출될 우려 없이 운용 가능하다. 그는 기술 구조에도 차별점이 있다고 설명했다. 단일 질문에 대해 즉시 응답하는 일반형 RAG와 달리 '코난 RAG-X'는 하나의 복합 질문을 다단계 질의로 나누고 각 하위 질의에 대해 순차적으로 정보를 검색·검증한 뒤 최종 응답을 조합하는 구조다. 일례로 "최근 3개월간 대출 연체가 발생한 건설사를 알려주고 각 기업의 자본금, 분양 실적, 관련 뉴스 반응을 종합해 리스크 대응 전략을 보고서로 만들어줘" 같은 질의도 단계별로 자동 처리 가능하다는 설명이다. 이러한 구조 덕분에 'RAG-X'가 금융, 공공, 제조업처럼 의사결정 과정이 복잡하고 규제 요건이 엄격한 B2B 환경에서 유효하는 설명이다. 실제 도입을 검토하는 고객들도 질문부터 보고서 작성에 이르는 전 과정을 하나의 AI로 대체할 수 있다는 점에 높은 관심을 보이고 있다는 것이다. 이어 발표를 맡은 도원철 코난테크놀로지 연구소 상무는 회사의 최신 LLM '코난 ENT-11'을 중심으로 단일 모델 구조와 추론 성능 개선 내용을 발표했다. 그는 "'ENT-11'은 일반 모드와 추론 모드를 하나의 엔진으로 통합한 국내 유일의 모델"이라며 "별도 모델을 병행 도입할 필요 없이 다양한 업무에 확장 적용할 수 있다"고 강조했다. 도 상무는 'ENT-11'이 기존의 범용 생성 모델과 달리 정밀 추론에 특화된 구조를 갖췄다고 설명했다. 단순 질의응답을 넘어 수학 계산, 법률 문서 해석, 테이블 기반 질의 등 복합 태스크까지 하나의 모델로 처리할 수 있도록 설계됐다는 설명이다. 현장에서는 세 가지 시연이 진행됐다. 첫 번째는 법원 판결문을 기반으로 양형 인자 항목을 추출하는 과제였다. 'ENT-11'은 해당되는 양형 인자를 골라낸 뒤 문서 내 근거 문장까지 함께 출력해 응답의 신뢰성을 높였다. 더불어 신축 건물 정보를 담은 테이블에서 대지 면적의 총합을 계산하는 과제에서는 테이블 내 조건 필터링, 수치 추출, 합산 계산을 모두 수행해 정확한 결과를 출력했다. 또 유명한 AI 수학 벤치마크인 'MATH500' 문제를 'ENT-11'이 풀었고 94점을 기록했다는 결과도 공유됐다. 도 상무는 "'ENT-11'이 딥시크 'R1' 대비 20분의 1 규모의 파라미터로 유사한 수준의 성능을 냈고 한국어 추론에서는 더 높은 정확도를 확보했다"며 "설명 가능한 추론 과정을 한국어로 출력하는 기능은 현재 ENT-11이 유일하다"고 덧붙였다. 이어 이형주 코난테크놀로지 AI사업부 이사는 코난 LLM의 실제 도입 사례와 산업별 적용 효과를 소개했다. 이 이사에 따르면 한국남부발전은 발전사 최초로 생성형 AI를 전사 35개 태스크와 15개 시스템에 연동해 구축했다. 발전소 운영에 필요한 기술문서, 정책 자료, 현장 보고서 등을 자동 분류·요약·생성하는 데 코난 LLM이 적용됐으며 연간 약 10만 시간의 업무 절감과 최대 51억원 규모의 생산성 향상이 기대된다. 한림대학교의료원 역시 의료진이 매일 작성하는 일일 경과기록지 초안을 자동 생성하는 데 코난 LLM을 도입했다. 기존 수작업 대신 전자의무기록(EMR) 기반으로 초안을 자동 작성한 뒤 의료진이 검토·승인하는 방식으로, 연간 약 9만5천시간의 업무 시간을 줄이고 의사 1인당 약 36일의 진료 가능 시간을 확보할 수 있을 것으로 분석된다. 이와 함께 국민권익위원회는 행정심판 청구서 작성에 생성형 AI를 적용해 유사 판례 검색부터 청구서 초안 생성까지의 과정을 자동화했다. 전체 작성 시간이 최대 60% 이상 단축됐으며 민원인의 정보 접근성과 업무 담당자의 처리 효율 모두 개선된 것으로 나타났다. 이형주 이사는 "이제는 개념검증(PoC)을 넘어서 실질적 수익확보 단계로 넘어가고 있다"며 "생성형 AI는 '자동화 툴'이 아니라 '업무 자산'으로 재정의돼야 한다"고 말했다. 폐쇄망 AI스테이션·서버 공개…공공·B2B 실무 자동화 '정조준' 코난테크놀로지는 이번 행사에서 자사의 자체 개발 LLM이 탑재된 온디바이스형 AI PC '코난 AI스테이션(AIStation)'과 기업형 AI 서버 'AI스테이션 서버(aiStation Server)'를 공개하며 제품군 확장을 마무리했다. 발표는 조인배 TG삼보 팀장과 이형주 코난테크놀로지 AI사업부 이사가 각각 맡았다. 조인배 팀장은 'AI PC가 바꾸는 업무환경'을 주제로 "'AI스테이션'은 인터넷 없이도 AI 기능을 활용할 수 있어 공공기관의 보안 요건과 반복 업무 자동화 수요를 동시에 충족할 수 있는 실무형 장비"라며 "민원 응대, 보고서 작성, 외국어 안내 등 반복적인 행정 태스크에 특히 효과적"이라고 설명했다. 조 팀장은 AIStation의 핵심 기능으로 ▲문서 요약 및 질의응답 ▲다국어 번역 ▲RAG 기반 정보 생성 ▲유해 콘텐츠 차단 등을 꼽았다. 더불어 RAG 기능이 내장돼 있기 때문에 단순한 생성형 응답을 넘어 맥락에 기반한 응답 생성이 가능하다는 점을 주요 장점으로 꼽았다. 'AI스테이션'의 하드웨어는 인텔 14세대 i7·i9 CPU, 엔비디아 RTX 그래픽처리장치(GPU), 고용량 SSD 등으로 구성된다. 보급형과 고급형 모델로 나뉘어 오는 7월 조달 등록이 예정돼 있다. 이어 발표를 진행한 이형주 코난테크놀로지 AI사업부 이사는 기업형 AI 서버 제품 'AI스테이션 서버'를 소개했다. 그는 "중소기업이나 연구기관 입장에선 고가의 다중 서버 LLM 환경을 도입하기 어렵다"며 "'AI스테이션 서버'는 폐쇄망 기반에서도 단일 장비로 생성형 AI 환경을 구축할 수 있도록 설계된 어플라이언스형 제품"이라고 말했다. 'AI스테이션 서버'는 코난 LLM을 중심으로 문서 임베딩, 개인정보 필터링, 유해 질의 차단, 시스템 관리 기능이 통합된 단일 서버 구조다. 생산성은 높이고 보안과 비용 부담은 줄이기 위해 하나의 서버에 모든 기능을 통합해 50명 이하 소규모부터 300명 규모 조직까지 대응할 수 있다는 설명이다. 현장 시연에서는 사내 매뉴얼 기반 계획서 자동 생성, 보험업무 대응 화법 작성, 다국어 이메일 자동화 사례 등이 공개됐다. 유통 전략은 에스넷 그룹과의 협력을 중심으로 구축된다. 현재 서울, 대전, 대구, 부산의 에스넷 물류 거점을 통해 전국 단위 서비스 체계를 갖췄으며 에스넷 계열사들과 연계해 공공, 금융, 연구 기관 대상 B2B 사업화가 추진될 예정이다. 이형주 이사는 "AI스테이션 서버는 하나의 서버에 문서 검색, 요약, 보고서 생성, 다국어 대응 등 실질적인 B2B 태스크를 통합한 제품"이라며 "LLM이 단순한 기술이 아니라 현장 자동화 도구로 기능할 수 있다는 것을 입증하는 플랫폼이 될 것"이라고 강조했다. 실적 반등 신호…공공 조달·GPU 효율로 수익성 강화 노려 현장 질의응답에서는 실적 전망, 제품 가격, 기술 우위 등을 두고 구체적인 설명이 이어졌다. 임완택 전략기획본부 상무는 회사의 실적과 관련된 기자의 질문에 "지난 1분기 실적은 오는 15일 공시될 예정"이라며 "지난해 다수의 PoC가 마무리되며 올해는 본계약과 실 매출이 빠르게 증가하는 구간에 진입했다"고 밝혔다. 그는 공공·국방·대기업 중심으로 파이프라인이 확대되고 있다며 매출은 전년 대비 큰 폭으로 증가하고 적자 규모는 대폭 축소될 것으로 내다봤다. AI스테이션의 조달 전략을 묻는 질문에 대해서는 연간 40만 대 이상 규모의 데스크톱 조달 시장에서 5~10% 점유율 확보를 목표로 하고 있다는 조인배 TG삼보 팀장의 설명이 나왔다. 일정 비율만 확보해도 자체 LLM 수요 확대와 매출 증가로 이어질 수 있다는 판단에서다. 제품 가격은 천만 원 이하로 조율 중이다. GPU는 예산 구조와 성능 효율을 고려해 엔비디아 '지포스 RTX 4070'이 탑재됐다. 조인배 팀장은 "고성능 대비 최적화 작업을 통해 비용을 최소화했다"며 "공공기관에선 AI 서버보다 AI 기능 탑재 PC 형태로 접근하는 게 현실적"이라고 설명했다. LG '엑사원', 솔트룩스 '루시아' 등 타사 모델과의 성능 차이를 묻는 질문에는 GPU 사용 효율을 중심으로 비교 설명이 나왔다. 도원철 코난테크놀로지 연구소 상무는 'ENT-11'이 일반 생성형 모델과 추론 특화 모델을 하나로 통합한 구조라며 동일 작업을 처리할 때 필요한 GPU 자원이 절반 수준으로 줄어든다고 설명했다. 기존에는 쉬운 질의응답과 복잡한 추론 태스크에 각각 다른 모델을 띄워야 했지만 'ENT-11'은 하나의 모델로 모두 처리해 비용과 운용 부담을 동시에 낮추는 등 경쟁력을 갖췄다는 설명이다. 도원철 상무는 "두 모델을 따로 띄우는 구조는 GPU 자원이 2배로 들 수밖에 없다"며 "'ENT-11'은 단일 모델로 동일 기능을 처리해 훨씬 효율적이며 한국어 기반 추론 정확도도 타 모델 대비 높게 나온다"고 말했다.

2025.05.13 14:23조이환 기자

'문서 AI'가 더 똑똑해졌다…"서류 속 문맥·구조까지 파악"

문서 인공지능(AI) 기술이 단순 텍스트 인식을 넘어 문맥·구조까지 이해하는 방향으로 진화했다. 복잡한 문서에서도 주요 정보를 자동 식별하고 고도화된 자동화 처리까지 가능해졌다. 11일 IT 업계에 따르면 최근 문서 처리 시장에서는 비전언어모델(VLM) 기반 광학 문자 인식(OCR) 기술이 주목받고 있다. 이 기술은 계약서, 보고서 등 여러 형식과 맥락으로 이뤄진 문서 속 표, 조항, 제목, 본문을 AI로 식별해 구조화된 데이터로 변환할 수 있다. VLM은 이미지와 언어 정보를 동시에 이해하는 AI 모델이다. 일종의 '이미지 전문가'와 '언어 전문가'가 한 팀처럼 협업하는 방식으로 작동한다. 우선 이 모델은 문서에서 표, 문장, 도장, 손글씨 등 다양한 이미지 요소를 구분한다. 이후 각 영역의 텍스트를 분석해 의미를 파악하고, 이를 종합적으로 해석한다. 이 과정에서 시각 정보와 언어 정보가 실시간으로 상호작용하며 정답을 조율한다. 정보 하나가 잘못 인식되면 다른 정보가 이를 보완하고, 누락된 부분은 이미지 단서를 활용해 추론하는 식이다. 예를 들어, 사용자가 계약서에 VLM 기반 OCR을 적용하면 '계약 당사자'와 '계약 기간' '주요 조항' '서명란' 등을 자동으로 식별해 체계적으로 정리할 수 있다. 이를 통해 문서 처리 자동화 수준을 높이고 반복 작업과 인적 오류를 줄일 수 있다. 기존 OCR은 이미지 속 텍스트를 디지털 문자로 바꾸는 데만 초점 맞췄다. 문서 레이아웃이나 의미적 맥락은 이해하지 못해 데이터 활용에 한계가 있었다. 이에 추가 인력이 이를 수작업으로 정리해야만 했다. VLM OCR, 정확도·사업성 모두 잡아 한국딥러닝은 '딥 OCR 플러스' 출시로 VLM OCR 서비스를 이미 상용화했다. 이 솔루션은 별도 학습 없이 여러 형식 문서를 처리할 수 있다. 한국어·영어·숫자·특수문자가 섞인 복잡한 구조도 정확하게 인식할 수 있도록 설계됐다. 딥 OCR 플러스는 문서의 표나 문단을 자동 분석해 핵심 정보를 요약하고, 추출 데이터를 표준 포맷으로 제공해 업무 시스템과 연동된다. 한국딥러닝은 이 솔루션으로 문서 검토 시간을 최대 80% 줄이고, 일관된 데이터 품질을 유지할 수 있다고 강조했다. 앞서 업스테이지도 AI 기반 문서 구조화 솔루션 '다큐먼트 파스'를 출시해 보험, 금융, 의료 등 산업 현장에서 문서 자동화를 지원하고 있다. 고정밀 벤치마크에서 아마존·마이크로소프트 모델보다 높은 정확도를 기록한 것으로 전해졌다. 올해 6월 모델 '솔라'를 결합한 '솔라 다큐브엘엠'도 출시한다. 솔라 타큐브엘엠은 시각 정보와 언어 정보 통합 처리 역량을 강화해 문서 기반 요약, 질의응답, 자동 분류까지 수행할 수 있도록 구성됐다. 특히 비정형 문서나 복잡한 레이아웃 문서에서도 높은 인식률을 보일 것이란 평가를 받고 있다. 김지현 한국딥러닝 대표는 "비전 OCR은 돈 버는 AI"라며 "정확도와 사업성을 모두 잡을 수 있는 실용 기술"이라고 강조했다.

2025.05.11 14:40김미정 기자

LG AI연구원, '마곡 집결'로 재정비…AI R&D 시너지 '승부수'

LG AI연구원이 인공지능(AI) 기술 경쟁력 강화를 위한 조직 재편에 나섰다. 핵심 연구진을 한데 모아 연구개발 역량을 끌어올리려는 전략이다. LG AI연구원은 최근 본사를 서울 여의도에서 마곡 디앤오 사옥으로 이전했다고 9일 밝혔다. 본사는 3층부터 7층까지 5개 층 규모로 조성됐으며 기존 여의도와 마곡에 분산돼 근무하던 연구원 300여 명이 한 곳으로 통합됐다. 이번 이전을 통해 연구원은 공간 설계에 집중해 약 50개의 다양한 회의실을 마련했다. 자유로운 협업을 유도하고 창의적인 아이디어 발현을 유도하려는 목적이다. LG AI연구원은 지난 2020년 12월 출범 이후 그룹 차원의 전폭적인 지원을 바탕으로 LG의 AI 전환 전략을 이끄는 핵심 조직으로 성장했다. 특히 자체 초거대 AI 모델 '엑사원' 시리즈를 통해 기술 고도화를 이어왔다. 지난해 12월 공개된 '엑사원 3.5'에 이어 지난 3월에는 국내 최초 추론형 AI '엑사원 딥'도 선보였다. 계열사 제품과 서비스에 실제 적용되며 그룹 전반의 AI 내재화에 기여하고 있다. 대표 사례로는 LG전자의 AI 노트북 '그램'과 LG유플러스의 통화 에이전트 '익시오'에 엑사원 기술이 탑재됐다. 기업용 AI 에이전트 '챗엑사원'은 현재 LG 사무직 임직원의 절반 수준인 4만 명 이상이 활용 중이다. AI 인재 양성을 위한 교육도 병행되고 있다. AI 리터러시 교육부터 석·박사 과정 운영까지 전주기 체계를 구축했으며 지난 4년간 1만5천 명 이상의 임직원이 참여했다. 기술력 확보 성과도 가시적이다. LG AI연구원은 국제인공지능학회(AAAI), 국제컴퓨터언어학회(ACL), 국제 컴퓨터 비전 및 패턴 인식 학술대회(CVPR) 등 글로벌 최상위 학회에 234건의 논문을 발표했으며 국내외 특허 출원도 총 228건에 달한다. 연구원은 온디바이스 AI 성능 고도화에도 집중하고 있다. 외부 서버 연결 없이 기기 내 데이터 처리를 가능케 해 보안성과 개인정보 보호 측면에서 경쟁력을 강화하려는 전략이다. 향후 계획으로는 '에이전틱 AI' 구현을 목표로 하고 있다. 계열사 업무 효율화, 생산성 제고, 나아가 신소재와 신약 개발 영역까지 AI 적용을 확장한다는 구상이다. LG AI연구원 관계자는 "엑사원을 중심으로 산업 현장과 제품, 서비스까지 AI를 연결하는 전략을 차근차근 실현해나가고 있다"며 "기술력과 협업 역량 모두에서 세계적 수준을 목표로 하고 있다"고 밝혔다.

2025.05.09 10:38조이환 기자

"글로벌 수준"...카카오, 멀티모달 언어모델 'Kanana-o' 성능 공개

카카오가 새로운 인공지능 모델을 통해 기술 경쟁력 강화를 이어간다. 카카오(대표 정신아)는 공식 테크블로그를 통해 통합 멀티모달 언어모델 'Kanana-o'와 오디오 언어모델 'Kanana-a'의 성능과 개발 후기를 1일 공개했다. 통합 멀티모달 언어모델인 Kanana-o는 텍스트와 음성, 이미지까지 다양한 형태의 정보를 동시에 이해하고 처리할 수 있는 모델이다. 텍스트, 음성, 이미지 중 어떠한 조합으로 질문을 입력하더라도 처리 가능하며, 상황에 맞는 텍스트나 자연스러운 음성으로 응답 가능한 구조로 설계됐다. 카카오는 '모델 병합' 기술을 기반으로 이미지 처리에 특화된 모델 'Kanana-v'와 오디오 이해 및 생성에 특화된 'Kanana-a' 모델을 통합, 단기간 내 효율적으로 Kanana-o를 개발했다. 통합 후에는 이미지, 오디오, 텍스트 데이터를 동시에 학습하는 '병합 학습'을 통해 시각과 청각 정보를 동시에 이해하고, 텍스트와 연결 지을 수 있도록 통합 훈련을 거쳤다. 이런 과정을 통해 기존 LLM 구조에서 이미지 이해 능력과 음성 인식과 합성, 감정 이해 등 고도화된 오디오 능력을 확장시킨 통합 멀티모달 언어모델이 구현됐다. Kanana-o는 음성 감정 인식 기술을 통해 사용자의 의도를 올바르게 해석하고, 상황에 맞는 적절한 반응과 답변을 제공해준다. 억양, 말투, 목소리 떨림 등 비언어적 신호를 분석하고, 대화 맥락에 맞는 감정적이고 자연스러운 음성의 응답을 생성하는 것이 특징이다. 대규모 한국어 데이터셋을 활용해 한국어의 특수한 발화 구조, 억양, 어미 변화 등을 정밀하게 반영하기도 했다. 특히 제주도, 경상도 등 지역 방언을 인식하고 이를 표준어로 변환해 자연스러운 음성을 생성할 수 있다. 지속적인 성능의 고도화를 위해 카카오는 현재 독자적인 한국어 음성 토크나이저(오디오 신호를 일정 단위로 작게 분해하는 도구) 개발을 진행 중이다. 스트리밍 방식의 음성합성 기술을 적용해 사용자가 긴 대기 시간 없이 응답을 제공하는 강점도 보유했다. 예를 들어, 이미지와 함께 "이 그림에 어울리는 동화를 만들어 줘"라고 입력하면, Kanana-o는 해당 음성을 이해하고 사용자의 억양과 감정 등을 분석해 자연스럽고 창의적인 이야기를 실시간으로 생성해 들려준다. Kanana-o는 한국어 및 영어 벤치마크에서 글로벌 최고 모델들과 유사 수준을 기록했으며, 한국어 벤치마크에서는 높은 우위를 보였다. 특히, 감정인식 능력에서는 한국어와 영어 모두에서 큰 격차를 기록하며, 감정까지 이해하고 소통할 수 있는 AI 모델의 가능성을 입증했다. 이미지와 음성을 통합적으로 이해해야 하는 '이미지-음성 QA(질의응답)' 태스크에서도 강력한 성능을 달성하며, 통합 멀티모달 언어모델로서의 글로벌 경쟁력을 확인했다. 카카오는 향후 Kanana-o를 통해 ▲다중 턴 대화 처리 ▲양방향 데이터 동시 송수신 기술 대응 능력 강화 ▲부적절한 응답 방지를 위한 안전성 확보 등을 목표로 연구 개발을 지속해 갈 계획이다. 이를 통해 다중 음성 대화 환경에서의 사용자 경험을 혁신하고, 실제 대화에 가까운 자연스러운 상호작용을 실현해가는 것이 목표다. 카카오 김병학 카나나 성과리더는 "카나나 모델은 복합적인 형태의 정보를 통합적으로 처리함으로써 기존의 텍스트 중심 AI를 넘어 사람처럼 보고 듣고 말하며 공감하는 AI로 진화하고 있다"며 "독자적인 멀티모달 기술을 바탕으로 자사의 인공지능 기술 경쟁력을 강화하는 한편, 지속적 연구 결과 공유를 통해 국내 AI 생태계 발전에 꾸준히 기여할 계획"이라고 말했다.

2025.05.01 10:13백봉삼 기자

Prev 1 2 3 4 5 6 Next