• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
인공지능
배터리
양자컴퓨팅
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'인공지능 모델'통합검색 결과 입니다. (169건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

"軍 AI 싹쓸이"…코난테크놀로지, 국방 AI 서밋 연다

코난테크놀로지가 국방 인공지능(AI) 기술력을 집약한 만남의 장을 열어 방산 시장 공략에 속도를 내고 있다. 코난테크놀로지는 다음달 16일 서울 용산 전쟁기념관 내 로얄파크컨벤션에서 '국방 AI 테크 서밋 2025'를 개최한다고 23일 밝혔다. 이 행사에는 군 관계자, 방산 협력업체 관계자 등 200여 명이 참석하며 국방 AI 관련 성과와 활용 전략을 공유하는 세션으로 구성된다. 이번 서밋은 코난테크놀로지가 지난 10년간 수행해온 국방 AI 사업 사례를 외부에 처음으로 공개하는 자리다. 주요 세션으로는 ▲국방 AI 기술 추진 전략 및 도입사례 ▲AI 거버넌스 기반 플랫폼 구축 전략 ▲감시정찰 체계를 위한 지능형 의사결정 전략 ▲에이전틱 AI 기반 정보 분석 전략 등이 포함됐다. 행사장에는 관련 기술과 제품의 시연도 진행된다. 코난테크놀로지는 AI 기반 화력운용시스템, 공중전투 기동훈련 체계, 스마트 인재관리 시스템 등 핵심 군 사업에 AI를 공급해온 국내 유일 기업으로, 현재 국방 및 민간 방산 전문기업 20여 곳과 협업 중이다. 특히 지능형 CCTV와 이동형 드론은 국내 최초로 한국인터넷진흥원(KISA) 인증을 받아 재난 구조 현장에서 실전 투입되고 있다. 일례로 'AI 파일럿' 등 유무인 복합 전투체계 실증에도 착수했으며 지난해 '방산혁신기업 100'에 이름을 올린 바 있다 더불어 지난 2023년 자체 개발한 대규모 언어모델 '코난LLM'을 기반으로 공공 및 민간 시장에 AI 솔루션을 공급 중이다. 해당 모델은 지난해 미국 스탠퍼드대 생태계 그래프에 등재됐다. 공공 프로젝트 기반의 신뢰를 바탕으로 의료 AI 영역으로도 확장 중으로, 지난 2월 한림대의료원과 국내 첫 거대언어모델(LLM) 기반 진료 플랫폼 공동 개발을 시작했다. 출시 2년차인 '코난LLM'은 현재 온디바이스, 프로페셔널, 엔터프라이즈 모델로 라인업을 구성해 고객 맞춤형 대응에 나섰다. 지난 3월에는 일반·추론 모드를 통합한 '이엔티-11(ENT-11)' 모델도 출시하며 범용성과 유연성을 높였다. 오는 7월 자사 기술을 탑재한 AI PC도 공개될 예정이다. 김규훈 코난테크놀로지 국방AI사업부 이사는 "AI 기술의 전략적 도입을 통해 국방력 강화에 기여하는 실질적 해법을 고객과 함께 모색할 계획"이라며 "실전성과 신뢰성 기반의 AI 솔루션으로 국방 분야의 새로운 기준을 만들겠다"고 밝혔다.

2025.06.23 16:47조이환

정부, '국가대표 AI' 만든다…글로벌 수준 모델 개발에 '총력'

대한민국 정부가 인공지능(AI) 기술 자립과 생태계 확장을 목표로 국내 정예팀을 뽑아 독자 모델 개발에 나선다. 글로벌 기업 중심의 AI 주도권 구도를 견제하고 기술 주권을 확보하기 위해서다. 과학기술정보통신부(과기정통부)는 '독자 AI 파운데이션 모델 프로젝트'를 공식 출범하고 다음달 21일까지 참여 정예팀 공모에 착수한다고 20일 밝혔다. 과기정통부 외에도 정보통신산업진흥원, 한국지능정보사회진흥원, 정보통신기획평가원이 공동으로 추진하는 이번 사업은 기존 '월드베스트 거대언어모델(World Best LLM)' 프로젝트의 공식화다. 이번 공모는 성능·전략·파급효과 등을 기준으로 최대 5개 정예팀을 선정한 뒤 단계별 평가를 통해 점진적으로 압축하는 방식으로 진행된다. 최신 글로벌 AI 모델 성능의 95% 이상 달성을 목표로, 참여팀은 자체적인 개발 전략과 방법론을 자유롭게 설계할 수 있다. 프로젝트는 일괄지원이 아닌 6개월 단위 경쟁형 압축 방식을 도입해 민첩한 기술 진화를 유도한다. 지원 자원은 그래픽 처리장치(GPU), 데이터, 인재라는 세 가지 축으로 구성된다. GPU는 올해부터 내년 상반기까지 민간 GPU 임차 형태로, 이후엔 정부 구매 GPU를 활용해 정예팀당 최대 1천 장 이상이 단계별로 지원된다. 데이터는 저작물 중심의 공동구매와 개별 가공 작업에 연간 최대 150억원 규모의 예산이 투입된다. 인재 분야는 해외 연구자 유치 시 연 20억원 한도 내에서 인건비와 연구비를 매칭해 준다. 특히 대학·대학원생의 참여를 필수로 명시하며 미래 인재 양성을 병행하는 구조다. 동시에 참여팀은 국민 AI 접근성 향상, 공공·경제·사회 전환(AX) 기여계획도 함께 제출해야 한다. 오픈소스 수준에 따라 정부 매칭 비율과 자부담 비율이 달라지는 구조도 설계됐다. 프로젝트는 단순한 기술개발에 머무르지 않는다. 국민 대상 사용성 평가, 컨테스트형 단계 심사, 벤치마크와 한국어 성능·안전성 검증 등 다층적 방식으로 완성도를 높인다. 우수한 모델에는 'K-AI' 명칭 부여 등 글로벌 브랜딩도 병행한다. 안전성 확보를 위해 AI안전연구소(K-ASIS)와의 협력도 예정돼 있다. 이 밖에 공공영역은 물론 국방·안보 등 민감 분야 활용도 계획에 포함돼 있다. 정부는 개발된 모델을 오픈소스화해 민간 AI 서비스 생태계 확산에도 적극 활용할 방침이다. 송상훈 과학기술정보통신부 정보통신정책실장은 "이번 프로젝트는 AI 기술 주권 확보와 모두의 성장을 위한 생태계 구축이 목표"라며 "글로벌 수준의 독자 AI 모델을 통해 대한민국이 진정한 AI 강국으로 도약하길 기대한다"고 밝혔다.

2025.06.20 13:37조이환

KAIST-네이버AI랩, 창의성 강화한 AI 기술 개발..."뻔한 건 안그려"

KAIST(총장 이광형)는 김재철AI대학원 최재식 교수 연구팀이 네이버 AI 랩과 공동으로 추가 학습 없이 인공지능(AI) 생성 모델의 창의적 생성을 강화하는 기술을 개발했다고 19일 밝혔다. 이 기술은 '뻔한' 이미지는 절대 그리지 않는다. 텍스트 기반 이미지 생성 모델의 내부 특징 맵을 증폭해 창의적 생성을 강화하는 식이다. 연구팀은 모델 내부의 얕은 블록들이 창의적 생성에 중요한 역할을 한다는 것을 발견하고, 특징 맵을 주파수 영역으로 변환 후 높은 주파수 영역에 해당하는 부분의 값을 증폭했다. 이 결과 연구팀은 노이즈나 작게 조각난 색깔 패턴의 형태가 유발되는 것을 확인했다. 권다희 연구생(박사과정, 공동제1저자)은 "얕은 블록의 낮은 주파수 영역을 증폭했더니 창의적 생성이 강화됐다"고 설명했다. 연구팀은 또 생성 모델 내부 각 블록 별로 최적의 증폭 값을 자동으로 선택하는 알고리즘도 개발했다. 이 알고리즘은 사전 학습된 스테이블 디퓨전 모델의 내부 특징 맵을 적절히 증폭해 추가적인 분류 데이터나 학습 없이 창의적 생성을 강화한다. 한지연 연구생(박사과정, 공동제1저자)은 "SDXL-터보 모델에서 발생하는 모드 붕괴 문제를 완화, 이미지 다양성이 증가한 것을 확인했다"고 말했다. 최재식 교수(교신저자)는 "생성 모델을 새로 학습하거나 미세조정 학습하지 않고 생성 모델의 창의적인 생성을 강화하는 최초의 방법론ˮ이라며 "학습된 인공지능 생성 모델 내부에 잠재된 창의성을 특징 맵 조작을 통해 강화할 수 있게 됐다"고 덧붙였다. 최 교수는 또 “이번 연구는 기존 학습된 모델에서도 텍스트만으로 창의적 이미지를 손쉽게 생성할 수 있게 됐으며, 이를 통해 창의적인 상품 디자인 등 다양한 분야에서 새로운 영감을 제공하고, 인공지능 모델이 창의적 생태계에서 실질적으로 유용하게 활용될 수 있도록 기여할 것"으로 기대했다. 연구결과는 국제 학술지 `국제 컴퓨터 비전 및 패턴인식 학술대회(CVPR)'에서 지난 15일 발표됐다. 연구는 KAIST-네이버 초창의적 AI 연구센터, 과학기술정보통신부의 재원으로 수행됐다.

2025.06.19 11:37박희범

'중력' 이해하는 AI 등장…메타, 물리 세계 추론 AI '브이-제파 2' 공개

메타가 3D 환경과 물리적 객체의 움직임을 이해할 수 있는 새로운 인공지능(AI) 모델을 출시했다. 12일 CNBC 등 주요 외신에 따르면 메타는 '월드 모델'이라는 명칭의 오픈소스 AI 모델 '브이-제파 2'를 공개했다. 월드 모델은 AI가 중력과 같은 물리적 세계의 규칙을 스스로 학습하고 다음 행동을 예측·계획할 수 있는 시스템이다. 이를 구현하는 브이-제파 2는 100만 시간 이상의 영상 데이터를 학습한 것으로 알려졌다. 메타 측은 "월드 모델은 실제 카메라로 촬영된 짧은 영상 한 편만으로 장면 내 물체의 3D 구조, 움직임, 물리 법칙 등을 학습한다"며 "마치 인간이 경험을 바탕으로 세상을 추론하듯 AI도 주변 환경을 직관적으로 파악한다"고 설명했다. 메타에 따르면 일부 벤치마크에서 브이-제파 2가 엔비디아의 코스모스 모델보다 추론 연산 속도가 30배 빠른 것으로 나타났다. 메타는 이 기술이 앞으로 범용 인공지능(AGI) 개발은 물론 실제 산업에 적용되는 실용적인 AI 기술의 밑거름이 될 것이라 내다봤다. 특히 메타는 브이-제파 2를 자율주행차 및 로봇공학 등 복잡한 실시간 판단이 필요한 산업 분야에 적용·확대시켜 나갈 계획이다. 메타의 얀 르쿤 수석 AI 과학자는 "월드 모델이 로봇 공학의 새로운 시대를 열어 AI 에이전트가 엄청난 양의 로봇 훈련 데이터 없이도 집안일과 물리적 작업을 도울 수 있을 것"이라고 강조했다.

2025.06.12 10:36한정호

모티프, 국산 sLLM 첫 공개…미스트랄·구글·메타 제쳤다

인공지능(AI) 스타트업 모티프테크놀로지스가 자체 개발한 소형언어모델(sLLM) '모티프(Motif) 2.6B'를 공개했다. 이 모델은 구글, 메타, 미스트랄 등 글로벌 빅테크의 동급 혹은 중대형 모델들을 뛰어넘는 성능을 기록해 관심을 모았다. 임정환 모티프 대표는 10일 서울 강남구 조선 팰리스에서 열린 '레노버 테크데이 2025' 현장에서 모티프 2.6B를 처음 소개했다. 그는 "AI는 크기보다 얼마나 잘 만들었는지가 중요하다"며, 소형 모델의 전략적 가치와 기술 완성도를 강조했다. 모티프 2.6B는 총 26억 개의 파라미터를 가진 국산 sLLM으로 AMD의 MI250 GPU 한 장만으로도 추론이 가능하다. 임 대표는 "일반적인 대형언어모델(LLM)이 수십~수백 개의 GPU를 요구하는 것과 대비되는 경량구조를 갖췄다"며 "엔비디아 기반 인프라 대비 약 60% 수준의 비용으로 학습과 운영이 가능하다"고 설명했다. 특히 그는 70억 파라미터 규모의 미스트랄 7B보다 높은 벤치마크 점수를 기록하는 등 낮은 요구사항에도 높은 성능을 제공한다고 강조했다. 현장에서 공개된 벤치마크 결과에 따르면 모티프 2.6B는 프랑스 미스트랄의 70억 파라미터 모델 '미스트랄 7B'보다 134% 높은 점수를 기록했다. 구글의 젬마 2B와 비교해 191%, 메타의 라마 3.2(1B) 대비 139%, AMD 인스텔라(3B)보다 112%, 알리바바 첸(Qwen) 2.5(3B)와는 104% 성능 우위를 보였다. 임 대표는 각 모델의 공식 테크니컬 리포트에서 공개한 설정값과 지표를 그대로 적용해 비교했다며 벤치마크의 신뢰성과 투명성을 동시에 확보했다고 강조했다. 또한 모티프 2.6B는 문장 내 문맥 파악과 응답 정확도 향상에 초점을 맞춘 설계가 특징이다. 핵심 문맥에 집중하고 흐름에서 벗어난 단어 선택을 줄이기 위해 어텐션 메커니즘을 정밀하게 조정했다. 이로써 단순한 언어 생성 능력을 넘어, 실제 사용에 적합한 AI 성능을 확보했다. 임 대표는 이 sLLM이 단순한 파인튜닝 모델이 아니라 모델 구조 설계부터 학습 데이터 구성, 학습 파이프라인까지 처음부터 끝까지 전부 독자적으로 개발했다고 밝혔다. 그는 "남이 만든 모델을 조금씩 바꾸는 방식으로는 세계 수준에 도달할 수 없다고 판단했다"며 "그래서 처음부터 끝까지 전부 직접 만들었다"고 말했다. 모티프는 이번 모델을 계기로 온디바이스 AI와 에이전틱 AI 분야로 확장을 본격화한다. 경량화를 통해 슈퍼컴퓨터 없이도 구동이 가능해, 산업 현장에서의 적용성이 높기 때문이다. 또한 올해 말에는 텍스트 투 이미지(T2I), 텍스트 투 비디오(T2V)와 같은 멀티모달 생성형 AI 모델도 오픈소스로 공개할 계획이다. 이들 모델 역시 AMD 기반 인프라에서 학습 및 서비스가 가능하도록 설계되고 있다. 현재 모티프는 이미지·비디오 생성, AI 챗봇, 의료 상담형 모델 등 다양한 서비스형 AI를 직접 운영하고 있으며 AMD 기반의 102B 모델 호스팅 서비스도 병행하고 있다. 임 대표는 "가트너에 따르면 sLLM의 산업 수요는 2027년까지 대형 LLM보다 3배 이상 늘어날 것으로 보고 있다"며, "모티프 2.6B는 그 흐름을 준비하는 전략적 모델"이라고 말했다. 이어 "우리는 단순히 모델 하나 잘 만드는 회사를 넘어, 인프라부터 서비스까지 아우르는 풀스택 AI 생태계를 직접 구축하고 있다"며, "모티프는 누구나 접근할 수 있는 강력하고 효율적인 AI를 만들어, 국산 AI도 글로벌 무대에서 통할 수 있다는 걸 증명해 보이겠다"고 포부를 밝혔다.

2025.06.10 20:01남혁우

"동남아판 챗GPT 만든다"…싱가포르, '멀티모달 LLM'에 '7천만 달러' 투입

싱가포르 정부가 자체 거대언어모델(LLM) 개발에 착수했다. 글로벌 인공지능(AI) 경쟁 속 지역 주권을 확보하고 다언어·다문화 환경에 최적화된 동남아판 소버린 AI를 실현하겠다는 포부다. 1일 싱가포르 정보통신미디어개발청(IMDA)에 따르면 이 조직은 현재 과학기술연구청(A*STAR), AI 싱가포르(AISG)와 함께 '국가 멀티모달 LLM 프로그램(NMLP)'을 운영하고 있다. 해당 사업은 싱가포르 국가연구재단(NRF)이 7천만 싱가포르 달러(약 700억원)를 투자해 추진되며 '국가 AI 전략 2.0 및 연구혁신기업(RIE) 2025 계획'과 연계해 내년까지 총 2년간 진행된다. 이번 프로젝트는 AI 인재 양성, 산업 생산성 향상, 신뢰 가능한 거버넌스 환경 조성 등 세 갈래 목표로 설계됐다. 국내 연구자에게는 고성능 컴퓨팅 자원을 지원하고 산업계는 다언어 고객 응대와 자율적 의사결정 시스템을 도입할 수 있도록 유도하는 것이다. 또 LLM의 작동 방식과 위험 요소를 규명하는 연구를 통해 신뢰 기반 AI 사용환경도 구축할 계획이다. 'NMLP'는 크게 두 가지 축으로 구동된다. 첫번째 축인 '머라이언(MERaLiON)'은 과학기술연구청 정보통신연구소가 주도한 모델로, 싱가포르와 동남아에서 흔한 언어·방언 혼용 대화를 인식하고 이해하는 데 초점을 맞췄다. 이 모델은 텍스트, 음성, 장면 정보를 통합하는 멀티모달 처리 능력을 갖췄고 구어체를 이해해 문맥 인식 정확도를 높였다. 구체적으로는 음성 인식·번역, 음성 요약, 음성 질의응답, 장면 인식, 감정 및 분위기 파악, 지역 방언 해석 등 6가지 주요 기능을 갖췄다. 이를 통해 공공·민간 부문의 고객지원, 인사이트 도출, 자동화 의사결정 등에 폭넓게 활용될 수 있다는 게 당국의 설명이다. 싱가포르 정부가 설립한 국가 AI 연구개발(R&D) 추진 기관이자 AI 국가 전략을 실행하는 중심 조직인 'AI 싱가포르'가 개발한 '시라이언(SEA-LION)'은 동남아 다국어 학습에 특화된 LLM 모델이다. 태국어, 베트남어, 인도네시아어 등 주요 지역 언어를 학습해 서구권이나 중화권 중심의 모델보다 높은 문맥 적합성과 응답 품질을 보이는 것이 특징이다. 언어적 대표성의 불균형 문제를 해소하고 포용적 AI 개발을 추진하는 데 목적을 둔다. 현재까지 개발된 '시라이언' 모델은 동남아 전역에서 작동 중으로, 동급 오픈소스 모델을 성능 면에서 앞서고 있는 것으로 알려졌다. 산업계 참여도 이미 활발하다. 과학기술연구청은 정보통신미디어개발청과 함께 머라이언 AI 컨소시엄을 조직했고 DBS은행, 그랩, 마이크로소프트, SPH미디어, 국가슈퍼컴퓨팅센터(NSCC) 등 13개 기관이 1차 멤버로 합류했다. 이들은 다언어 고객상담, 감정 및 건강정보 분석, 자율 의사결정 솔루션 등을 함께 개발 중이다. 컨소시엄은 공통 수요 집약을 통해 개발·통합 비용을 줄이고 데이터와 전문성을 공유해 모델 역량을 빠르게 개선할 방침이다. 또 기업 실무에 즉시 적용할 수 있는 형태의 교육과 도구를 제공하고, 투자 대비 수익(ROI) 검증을 위한 초기 개념증명(POC) 과제를 병행 추진한다. AI 싱가포르는 '시라이언'의 기능 확대와 품질 향상을 위해 외부 협력도 개방했다. 오픈소스화된 결과물을 토대로 다양한 파트너십을 구축해 공동 개발 체계를 유지한다는 계획이다. 싱가포르 정부는 이번 프로젝트를 통해 AI 기술의 지역 적합성과 전략적 자립성을 동시에 확보할 수 있을 것으로 기대하고 있다. 프로젝트 총괄 기관인 정보통신미디어개발청은 "싱가포르가 다언어 사회인 만큼 AI도 지역 현실을 반영할 수 있어야 한다"며 "이번 모델들이 산업 혁신뿐 아니라 AI 거버넌스에도 기여하길 기대한다"고 밝혔다.

2025.06.01 08:29조이환

정부, '1.6조원' 규모 GPU 대전 시작…"WBL 훈련용 반도체, 민간과 함께 확보"

과학기술정보통신부가 민간 클라우드 기업들과 손잡고 총 1조6천300억원 규모의 그래픽처리장치(GPU) 확보·임차 사업을 추진한다. 세계 최고 수준의 초거대 언어모델 개발과 국내 산학연의 인공지능(AI) 인프라 확충을 위한 행보다. 과기정통부와 정보통신산업진흥원은 29일 서울 강남 코엑스에서 클라우드 기업을 대상으로 GPU 확보·임차 사업 통합설명회를 개최했다. 이달 1차 추가경정예산을 통해 관련 예산을 확정한 이후 다음달 4주차까지 협력 기업 공모에 본격 착수한 상태다. 이번 사업은 ▲총 1조4천600억원 규모의 GPU 확보 사업과 ▲1천723억원 규모의 GPU 임차 사업으로 구성된다. 확보 사업은 정부와 민간이 협력해 첨단 GPU를 직접 구매·구축하는 방식이고 임차 사업은 클라우드 기업이 보유한 GPU를 임차해 활용하는 구조다. 임차된 GPU는 가칭 '월드 베스트 LLM(WBL)' 프로젝트와 국내 산학연 등에 지원될 예정이다. 정부는 국내 고성능 연산 자원 부족 문제를 해소하고 AI 기술의 자립 기반을 확보하는 데 사업의 목적이 있다고 설명했다. 설명회 현장에선 사업 개요와 정책 방향 외에도 공모 절차, 평가 기준, 지원 조건 등의 세부 사항이 구체적으로 안내됐다. 참석자들은 질의응답을 통해 공모 준비에 필요한 사항들을 직접 확인할 수 있었다. 과기정통부와 정보통신산업진흥원(NIPA)은 다음달 4주차까지 공모 접수를 마감하고 오는 7월 중 평가와 협약 체결을 마무리할 계획이다. 이후 GPU 인프라 확보 및 배포를 신속히 추진하겠다는 입장이다. 과기정통부는 "보다 구체적인 공모 내용과 사업 안내는 과기정통부 및 NIPA 홈페이지를 통해 확인할 수 있다"고 밝혔다.

2025.05.29 17:18조이환

디지털 클론, 광고의 미래인가 위험의 서막인가

AI가 만들어낸 가상의 인물, 이른바 '디지털 클론'이 실제 인간과 구분하기 어려울 정도로 정교해지고 있다. 최근에는 정치적 목적이나 기업 마케팅 전략에도 점점 더 널리 활용되고 있는데, 특히 패션 산업에서 디지털 클론의 활용이 빠르게 확산되고 있다. 이에 경영 전략 전문가 루아나 카르카노 씨는 그 장점과 문제점을 분석했다. 컨버세이션닷컴 외신 보도에 따르면, 패션 업계는 '디지털 클론'이 가장 활발히 활동 중인 분야 중 하나다. 패션 트렌드는 인플루언서를 통해 확산되는 경우가 많은데, 글로벌 인플루언서 시장 규모는 2025년까지 약 320억 달러(한화 약 43.7조원) 이상 성장할 전망이다. 하지만 실제 인플루언서와 협업하려면 시간과 비용이 많이 들기 때문에 브랜드 전용 디지털 클론을 제작해 홍보에 활용하면 비용을 절감하면서도 캠페인을 유연하게 운영할 수 있다. 실제로 글로벌 패션 브랜드 H&M은 올 3월, 자사 마케팅 캠페인과 소셜네트워크(SNS) 콘텐츠에 사용할 '디지털 모델 클론'을 제작할 계획을 발표했다. 이 디지털 클론은 완전히 가상의 인물이 아니라, 실제 모델의 외형을 기반으로 만들어졌다. 해당 모델은 디지털 클론의 초상권을 보유하고 있으며, 그에 따른 사용료를 받는 조건으로 계약됐다. H&M의 최고 크리에이티브 책임자 요르겐 앤더슨은 "우리는 개인의 스타일을 존중하면서도, 새로운 크리에이티브 방식으로 패션을 표현하고자 한다"면서 "신기술의 장점을 적극적으로 받아들이고 있다"고 밝혔다. H&M은 이 기술을 통해 촬영 비용을 줄이고, 카탈로그 제작 속도도 높일 수 있다고 설명했다. 하지만 한편으로는 모델, 메이크업 아티스트, 사진가 등 기존 인력의 일자리를 대체할 수 있어, 업계 전반에서 윤리적 우려와 논쟁도 커지고 있다. 카르카노 씨는 디지털 클론 사용에서 가장 중요한 이슈로 '동의'와 '보상'을 강조했다. H&M처럼 사전 계약을 통해 제작되는 경우도 있지만, 일부 기업이나 개인은 원래 인물의 얼굴이나 이미지 데이터를 무단으로 학습시켜 디지털 클론을 만들어내는 사례도 있어 문제가 되고 있다. 또 다른 문제는 다양성이다. AI는 매개변수를 조절해 다양한 인종, 연령, 체형의 인물을 만들어낼 수 있지만, 학습된 데이터에 따라 편향이 반영될 위험도 크다. AI가 다양성을 '연출'할 수는 있지만, 그럼에도 중대한 편견이 포함될 수 있다는 지적이다. 카르카노 씨는 디지털 클론이 패스트 패션 브랜드에게는 다양한 체형과 스타일을 표현할 수 있는 유용한 도구가 될 수 있지만, 윤리적 문제를 해결하려면 '투명성'이 무엇보다 중요하다고 강조했다. 사용자의 동의, 명확한 권한 부여, 그리고 개인정보와 초상권 보호를 위한 법적 기준이 마련돼야 한다는 주장이다. 그는 마지막으로 “브랜드가 AI 기술로 창의성을 높이기 위해서는 성실성, 포괄성, 법적 책임을 아우르는 윤리적 프레임워크를 도입해야 한다”고 강조했다.

2025.05.25 08:58백봉삼

"국산 LLM의 반격"…업스테이지, 31B 모델로 '글로벌 70B급' 뛰어넘었다

업스테이지가 경량 언어모델 '솔라 프로 2' 프리뷰를 내세워 글로벌 생성형 인공지능(AI) 시장에 정면승부를 걸었다. 자체 기술력으로 초대형 언어모델을 뛰어넘는 성능을 구현하며 국산 소형모델의 반격을 선언한 것이다. 업스테이지는 자체 개발한 거대언어모델 '솔라 프로 2'를 프리뷰 형태로 공개하고 응용프로그램 인터페이스(API)를 통한 무료 테스트 사용을 허용했다고 20일 밝혔다. '솔라 프로 2'는 오는 7월 정식 출시 예정이다. 이번 모델은 지난해 12월 공개된 '솔라 프로'의 후속으로, 패러미터는 기존 22B에서 31B로 약 1.5배 확대됐다. 주요 성능 지표도 크게 향상돼 동일 계열의 30B급 모델 중에서는 유일하게 메타와 알리바바의 70B급 모델을 벤치마크에서 앞섰다. '솔라 프로 2'는 종합지식(MMLU)·지시이행(IFeval) 평가에서 '라마 4 스카우트', '라마 3.3 70B', '큐원 2.5 72B' 등을 모두 웃도는 결과를 냈다. 한국어 성능도 'KMMLU', '해례' 벤치마크에서 최고 수준으로 확인됐다. 이번 모델에는 업스테이지 LLM 중 처음으로 '하이브리드 모드'가 탑재됐다. 사용자 선택에 따라 빠른 응답용 '챗 모드'와 단계적 추론을 위한 '추론 모드' 중 선택할 수 있으며 특히 추론 모드엔 '생각 사슬(CoT)' 기법이 적용돼 복잡한 수학·코딩 문제에 강점을 보인다. 성능 외에 사용성도 개선됐다. 최대 처리 토큰 수는 기존 대비 두 배 이상 확장된 6만4천 토큰으로 긴 문서 처리에 유리하다. 한국어 맞춤형 토크나이저 개선으로 최대 30%의 토큰 절감이 가능해 응답 속도와 비용 효율도 크게 높아졌다. 김성훈 업스테이지 대표는 "'솔라 프로 2'는 31B라는 효율적 규모로도 70B 모델 수준의 성능을 구현하며 작지만 강력한 소형언어모델의 새 기준을 제시한다"며 "특히 최고 추론 성능에 탁월한 한국어 성능을 갖춘 이번 모델을 통해 보다 많은 업무 혁신을 기대한다"고 밝혔다.

2025.05.20 15:00조이환

인텔리콘연구소, 보고서 자동화 시장 '정조준'…국정원 보안도 '통과'

인텔리콘연구소가 기업 보고서 자동 생성 인공지능(AI) '딥리서치 울트라'를 선보였다. 기업 내부 문서와 외부 지식을 동시에 분석해 맞춤형 리서치를 지원하기 위함이다. 인텔리콘연구소는 공공기관, 로펌, 기업 대상 보고서 작성용 AI '딥리서치 울트라'를 개발했다고 14일 밝혔다. 이 기술은 자체 보유한 법률 추론 원천기술과 다단계 추론형 멀티 에이전트 기술을 결합해 만들어졌으며 외부 정보뿐 아니라 사내문서 기반 분석을 병행할 수 있는 것이 특징이다. 연구소는 '딥리서치 울트라'가 기존 오픈AI나 구글의 리서치 툴과 달리 기업 내부의 방대한 문서 자산과 규정, 정책, 법률자료 등을 바탕으로 리서치 보고서를 자동 생성할 수 있다고 밝혔다. 단순 웹 검색이 아닌 심층 문서 분석을 통해 보고서의 정밀도를 높였다는 설명이다. 이 솔루션은 인텔리콘의 문서 분석 솔루션 '도큐브레인'과 연동돼 사용된다. '도큐브레인'은 검색증강생성(RAG) 기반의 기업형 검색 시스템으로 대용량 문서에서 의미 있는 정보를 추출하는 기능을 제공하며 '딥리서치 울트라'와 함께 내부 정보에 특화된 리서치 결과를 생성할 수 있도록 돕는다. '도큐브레인'은 보안성 검증도 완료했다. 한국산업인력공단 도입 사례에서 국가정보원 보안 심사를 통과했으며 국무조정실 산하 기관의 보안 테스트와 모의해킹 절차도 모두 통과한 것으로 알려졌다. 인텔리콘 측은 이 같은 보안성 확보가 공공기관과 기업의 디지털 전환 리스크를 줄이는 데 기여할 수 있다고 설명했다. 이번 기술 출시는 인텔리콘이 리걸테크 영역에서 쌓아온 기술 역량의 연장선이다. 도큐브레인은 조달청 혁신제품으로 지정된 바 있으며 법률 문서 분석 특화 거대언어모델(LLM)로 기업과 공공기관의 문서 업무 자동화 수요를 충족시켜왔다. 임영익 인텔리콘연구소 대표는 "이번에 출시한 기업용 보고서 생성 AI는 단순한 정보 검색 도구를 넘어 기관 및 기업의 핵심 업무 효율성을 극대화하는 혁신적인 솔루션"이라며 "국정원 및 국무조정실의 보안 심사를 통과해 공공기관 및 기업들이 안심하고 사용할 수 있으며 '도큐브레인'과의 결합을 통해 문서 분석 및 보고서 생성 기능을 더욱 강화해 차별화된 가치를 제공할 것"이라고 밝혔다.

2025.05.14 13:04조이환

"단행본 70권도 거뜬"…업스테이지, 한글 AI 교열 도구 '에디트업' 출시

업스테이지가 자체 거대언어모델(LLM) '솔라'를 기반으로 교열 서비스를 내놓았다. 전문가 수준의 문맥 교정 기능을 앞세워 인공지능(AI) 문서 편집 도구 시장에서 영향력을 확대한다는 전략이다. 업스테이지는 한글 교열 서비스 '에디트업'의 정식 서비스를 시작한다고 13일 밝혔다. 이 솔루션은 웹 기반 외에도 구글 크롬 확장 프로그램, 마이크로소프트 워드, 한컴오피스 플러그인으로도 이용할 수 있다. '에디트업'은 기사·보고서 등 다양한 문서 파일을 입력하면 오탈자와 띄어쓰기 오류를 자동으로 탐지해 수정 방향을 제시한다. 기존 맞춤법 검사기와 달리 문맥 기반 판단이 가능해 부적절한 어휘나 어색한 문장도 대체 문구를 제안해준다. 업스테이지의 자체 검증 결과 교정 정확도는 95%를 넘어서는 것으로 나타났다. 요금제는 ▲베이직 ▲프리미엄 ▲엔터프라이즈의 세 가지로 구성되며 각각 500자 기준 호출량이 연간 약 삼만 회, 십만 회, 오십만 회까지 지원되고 가장 저렴한 요금제 기준으로도 약 천오백만 자에 단행본 70권 분량 문서를 교열할 수 있다. 더불어 '에디트업'은 1대1 설치 지원과 플러그인 호환성을 내세워 출판사·언론사·공공기관 등에서 대용량 문서 작업에 강점을 갖는 구조다. 전문 교열 인력 부족 문제를 해소할 수 있는 대안으로 기대된다는 것이 업계의 분석이다. 업스테이지는 신조어, 유행어, 외국 인명 등 최신 데이터를 지속적으로 업데이트해 교열 정확도를 강화할 방침이다. 향후에는 영어 실시간 번역 기능도 더해 글로벌 업무 환경에서도 확장 활용될 수 있도록 할 계획이다. 김성훈 업스테이지 대표는 "많은 시간과 노력이 필요한 교열은 대표적인 노동 집약 분야"라며 "'에디트업'은 이를 자동화해 업무 효율성을 극대화하는 혁신적 도구"라고 밝혔다.

2025.05.13 14:41조이환

[현장] 통합형 LLM·멀티소스 RAG로 '출격'…코난테크놀로지, 올해 실적 반등 노린다

"생성형 인공지능(AI)의 핵심은 더 이상 모델 성능의 경쟁이 아닙니다. 이제는 얼마나 실질적인 업무 수요를 반영하고 이를 통해 실제 성과를 만들어낼 수 있는가가 관건입니다." 김영섬 코난테크놀로지 대표는 13일 서울 광화문 호텔 코리아나에서 열린 기자간담회에서 이같이 밝히며 자체 개발한 차세대 거대언어모델(LLM), 신규 인공지능(AI) 제품군, 이를 아우르는 사업화 전략과 기술 로드맵을 공개했다. '추론 통합형 LLM부터 AI PC까지'라는 주제로 진행된 이번 간담회는 실제 업무 현장에서 검증 가능한 생성형 AI 기술을 중심으로, 코난테크놀로지가 독자 개발한 코난 LLM 'ENT-11', 레거시 연동형 검색증강생성(RAG) 시스템 'RAG-X', 그리고 온디바이스 AI 솔루션 'AI스테이션' 등을 소개하는 자리였다. 김 대표는 환영사에서 "지난 26년간 축적해온 기술 역량을 기반으로 우리는 단순 모델 성능이 아닌 비즈니스 실효성과 현장 접목 가능성에 초점을 맞춘 생성형 AI 전략을 펼쳐가고 있다"며 "제품군 확장을 통해 AI의 도입 허들을 낮추고 시장 성과로 이어지는 환경을 주도하겠다"고 강조했다. 실무형 RAG·통합형 LLM 앞세워…공공·의료 레퍼런스 '확보' 임완택 코난테크놀로지 전략기획본부 상무는 이날 간담회에서 검색증강생성 기술 기반의 신규 제품 '코난 RAG-X'를 소개했다. 발표에 앞서 그는 "LLM은 아무리 고성능이어도 최신 정보를 반영하지 못하고 사내 문서처럼 민감한 내부 데이터를 다루지 못하는 아키텍처 상의 한계가 있다"며 "우리는 이 한계를 실무 환경에서 해결하기 위해 RAG 기술을 핵심으로 재설계했다"고 설명했다. 임 상무에 따르면 '코난 RAG-X'는 단순한 외부 검색용 챗봇이 아니라 내부 데이터베이스(DB), 레거시 시스템, 공공기관 데이터, 뉴스, 논문, 커뮤니티 자료 등 다양한 정보를 연동해 활용할 수 있도록 구성된 멀티소스 기반의 B2B 특화형 시스템이다. 퍼플렉시티처럼 외부 웹에 의존하는 B2C형 RAG 솔루션과 달리 온프레미스 환경에서 구동돼 사내 민감 데이터가 외부로 유출될 우려 없이 운용 가능하다. 그는 기술 구조에도 차별점이 있다고 설명했다. 단일 질문에 대해 즉시 응답하는 일반형 RAG와 달리 '코난 RAG-X'는 하나의 복합 질문을 다단계 질의로 나누고 각 하위 질의에 대해 순차적으로 정보를 검색·검증한 뒤 최종 응답을 조합하는 구조다. 일례로 "최근 3개월간 대출 연체가 발생한 건설사를 알려주고 각 기업의 자본금, 분양 실적, 관련 뉴스 반응을 종합해 리스크 대응 전략을 보고서로 만들어줘" 같은 질의도 단계별로 자동 처리 가능하다는 설명이다. 이러한 구조 덕분에 'RAG-X'가 금융, 공공, 제조업처럼 의사결정 과정이 복잡하고 규제 요건이 엄격한 B2B 환경에서 유효하는 설명이다. 실제 도입을 검토하는 고객들도 질문부터 보고서 작성에 이르는 전 과정을 하나의 AI로 대체할 수 있다는 점에 높은 관심을 보이고 있다는 것이다. 이어 발표를 맡은 도원철 코난테크놀로지 연구소 상무는 회사의 최신 LLM '코난 ENT-11'을 중심으로 단일 모델 구조와 추론 성능 개선 내용을 발표했다. 그는 "'ENT-11'은 일반 모드와 추론 모드를 하나의 엔진으로 통합한 국내 유일의 모델"이라며 "별도 모델을 병행 도입할 필요 없이 다양한 업무에 확장 적용할 수 있다"고 강조했다. 도 상무는 'ENT-11'이 기존의 범용 생성 모델과 달리 정밀 추론에 특화된 구조를 갖췄다고 설명했다. 단순 질의응답을 넘어 수학 계산, 법률 문서 해석, 테이블 기반 질의 등 복합 태스크까지 하나의 모델로 처리할 수 있도록 설계됐다는 설명이다. 현장에서는 세 가지 시연이 진행됐다. 첫 번째는 법원 판결문을 기반으로 양형 인자 항목을 추출하는 과제였다. 'ENT-11'은 해당되는 양형 인자를 골라낸 뒤 문서 내 근거 문장까지 함께 출력해 응답의 신뢰성을 높였다. 더불어 신축 건물 정보를 담은 테이블에서 대지 면적의 총합을 계산하는 과제에서는 테이블 내 조건 필터링, 수치 추출, 합산 계산을 모두 수행해 정확한 결과를 출력했다. 또 유명한 AI 수학 벤치마크인 'MATH500' 문제를 'ENT-11'이 풀었고 94점을 기록했다는 결과도 공유됐다. 도 상무는 "'ENT-11'이 딥시크 'R1' 대비 20분의 1 규모의 파라미터로 유사한 수준의 성능을 냈고 한국어 추론에서는 더 높은 정확도를 확보했다"며 "설명 가능한 추론 과정을 한국어로 출력하는 기능은 현재 ENT-11이 유일하다"고 덧붙였다. 이어 이형주 코난테크놀로지 AI사업부 이사는 코난 LLM의 실제 도입 사례와 산업별 적용 효과를 소개했다. 이 이사에 따르면 한국남부발전은 발전사 최초로 생성형 AI를 전사 35개 태스크와 15개 시스템에 연동해 구축했다. 발전소 운영에 필요한 기술문서, 정책 자료, 현장 보고서 등을 자동 분류·요약·생성하는 데 코난 LLM이 적용됐으며 연간 약 10만 시간의 업무 절감과 최대 51억원 규모의 생산성 향상이 기대된다. 한림대학교의료원 역시 의료진이 매일 작성하는 일일 경과기록지 초안을 자동 생성하는 데 코난 LLM을 도입했다. 기존 수작업 대신 전자의무기록(EMR) 기반으로 초안을 자동 작성한 뒤 의료진이 검토·승인하는 방식으로, 연간 약 9만5천시간의 업무 시간을 줄이고 의사 1인당 약 36일의 진료 가능 시간을 확보할 수 있을 것으로 분석된다. 이와 함께 국민권익위원회는 행정심판 청구서 작성에 생성형 AI를 적용해 유사 판례 검색부터 청구서 초안 생성까지의 과정을 자동화했다. 전체 작성 시간이 최대 60% 이상 단축됐으며 민원인의 정보 접근성과 업무 담당자의 처리 효율 모두 개선된 것으로 나타났다. 이형주 이사는 "이제는 개념검증(PoC)을 넘어서 실질적 수익확보 단계로 넘어가고 있다"며 "생성형 AI는 '자동화 툴'이 아니라 '업무 자산'으로 재정의돼야 한다"고 말했다. 폐쇄망 AI스테이션·서버 공개…공공·B2B 실무 자동화 '정조준' 코난테크놀로지는 이번 행사에서 자사의 자체 개발 LLM이 탑재된 온디바이스형 AI PC '코난 AI스테이션(AIStation)'과 기업형 AI 서버 'AI스테이션 서버(aiStation Server)'를 공개하며 제품군 확장을 마무리했다. 발표는 조인배 TG삼보 팀장과 이형주 코난테크놀로지 AI사업부 이사가 각각 맡았다. 조인배 팀장은 'AI PC가 바꾸는 업무환경'을 주제로 "'AI스테이션'은 인터넷 없이도 AI 기능을 활용할 수 있어 공공기관의 보안 요건과 반복 업무 자동화 수요를 동시에 충족할 수 있는 실무형 장비"라며 "민원 응대, 보고서 작성, 외국어 안내 등 반복적인 행정 태스크에 특히 효과적"이라고 설명했다. 조 팀장은 AIStation의 핵심 기능으로 ▲문서 요약 및 질의응답 ▲다국어 번역 ▲RAG 기반 정보 생성 ▲유해 콘텐츠 차단 등을 꼽았다. 더불어 RAG 기능이 내장돼 있기 때문에 단순한 생성형 응답을 넘어 맥락에 기반한 응답 생성이 가능하다는 점을 주요 장점으로 꼽았다. 'AI스테이션'의 하드웨어는 인텔 14세대 i7·i9 CPU, 엔비디아 RTX 그래픽처리장치(GPU), 고용량 SSD 등으로 구성된다. 보급형과 고급형 모델로 나뉘어 오는 7월 조달 등록이 예정돼 있다. 이어 발표를 진행한 이형주 코난테크놀로지 AI사업부 이사는 기업형 AI 서버 제품 'AI스테이션 서버'를 소개했다. 그는 "중소기업이나 연구기관 입장에선 고가의 다중 서버 LLM 환경을 도입하기 어렵다"며 "'AI스테이션 서버'는 폐쇄망 기반에서도 단일 장비로 생성형 AI 환경을 구축할 수 있도록 설계된 어플라이언스형 제품"이라고 말했다. 'AI스테이션 서버'는 코난 LLM을 중심으로 문서 임베딩, 개인정보 필터링, 유해 질의 차단, 시스템 관리 기능이 통합된 단일 서버 구조다. 생산성은 높이고 보안과 비용 부담은 줄이기 위해 하나의 서버에 모든 기능을 통합해 50명 이하 소규모부터 300명 규모 조직까지 대응할 수 있다는 설명이다. 현장 시연에서는 사내 매뉴얼 기반 계획서 자동 생성, 보험업무 대응 화법 작성, 다국어 이메일 자동화 사례 등이 공개됐다. 유통 전략은 에스넷 그룹과의 협력을 중심으로 구축된다. 현재 서울, 대전, 대구, 부산의 에스넷 물류 거점을 통해 전국 단위 서비스 체계를 갖췄으며 에스넷 계열사들과 연계해 공공, 금융, 연구 기관 대상 B2B 사업화가 추진될 예정이다. 이형주 이사는 "AI스테이션 서버는 하나의 서버에 문서 검색, 요약, 보고서 생성, 다국어 대응 등 실질적인 B2B 태스크를 통합한 제품"이라며 "LLM이 단순한 기술이 아니라 현장 자동화 도구로 기능할 수 있다는 것을 입증하는 플랫폼이 될 것"이라고 강조했다. 실적 반등 신호…공공 조달·GPU 효율로 수익성 강화 노려 현장 질의응답에서는 실적 전망, 제품 가격, 기술 우위 등을 두고 구체적인 설명이 이어졌다. 임완택 전략기획본부 상무는 회사의 실적과 관련된 기자의 질문에 "지난 1분기 실적은 오는 15일 공시될 예정"이라며 "지난해 다수의 PoC가 마무리되며 올해는 본계약과 실 매출이 빠르게 증가하는 구간에 진입했다"고 밝혔다. 그는 공공·국방·대기업 중심으로 파이프라인이 확대되고 있다며 매출은 전년 대비 큰 폭으로 증가하고 적자 규모는 대폭 축소될 것으로 내다봤다. AI스테이션의 조달 전략을 묻는 질문에 대해서는 연간 40만 대 이상 규모의 데스크톱 조달 시장에서 5~10% 점유율 확보를 목표로 하고 있다는 조인배 TG삼보 팀장의 설명이 나왔다. 일정 비율만 확보해도 자체 LLM 수요 확대와 매출 증가로 이어질 수 있다는 판단에서다. 제품 가격은 천만 원 이하로 조율 중이다. GPU는 예산 구조와 성능 효율을 고려해 엔비디아 '지포스 RTX 4070'이 탑재됐다. 조인배 팀장은 "고성능 대비 최적화 작업을 통해 비용을 최소화했다"며 "공공기관에선 AI 서버보다 AI 기능 탑재 PC 형태로 접근하는 게 현실적"이라고 설명했다. LG '엑사원', 솔트룩스 '루시아' 등 타사 모델과의 성능 차이를 묻는 질문에는 GPU 사용 효율을 중심으로 비교 설명이 나왔다. 도원철 코난테크놀로지 연구소 상무는 'ENT-11'이 일반 생성형 모델과 추론 특화 모델을 하나로 통합한 구조라며 동일 작업을 처리할 때 필요한 GPU 자원이 절반 수준으로 줄어든다고 설명했다. 기존에는 쉬운 질의응답과 복잡한 추론 태스크에 각각 다른 모델을 띄워야 했지만 'ENT-11'은 하나의 모델로 모두 처리해 비용과 운용 부담을 동시에 낮추는 등 경쟁력을 갖췄다는 설명이다. 도원철 상무는 "두 모델을 따로 띄우는 구조는 GPU 자원이 2배로 들 수밖에 없다"며 "'ENT-11'은 단일 모델로 동일 기능을 처리해 훨씬 효율적이며 한국어 기반 추론 정확도도 타 모델 대비 높게 나온다"고 말했다.

2025.05.13 14:23조이환

"지포스 RTX와 쿠다로 무장"…엔비디아 'LM 스튜디오' 성능 폭발

엔비디아가 지포스 그래픽처리장치(GPU)와 쿠다를 기반으로 자체 로컬 거대언어모델(LLM) 실행 도구의 성능을 대폭 강화했다. 로딩·응답 속도 향상과 더불어 개발자 제어 기능을 확장해 로컬 AI 활용 생태계를 본격적으로 견인하는 전략이다. 엔비디아는 최근 'LM 스튜디오' 0.3.15 버전을 발표했다고 12일 밝혔다. 이번 버전은 지포스 '레이 트레이싱 익스피리언스(RTX)' GPU 환경에서 성능을 최대 27%까지 끌어올릴 수 있게 '쿠다' 그래프와 플래시 어텐션 최적화를 적용했다. 지포스 'RTX 20' 시리즈부터 최신 블랙웰 GPU까지 폭넓은 하드웨어 호환성도 확보했다. 'LM 스튜디오'는 고성능 추론과 데이터 보안을 동시에 확보할 수 있는 로컬 LLM 실행 도구다. '라마.cpp(llama.cpp)' 기반 런타임을 바탕으로 오프라인에서도 모델 실행이 가능하고 오픈AI 응용 프로그램 인터페이스(API) 호환 엔드포인트로도 작동해 맞춤형 워크플로우에 쉽게 통합된다. 새 버전은 '툴_초이스(tool_choice)' 패러미터를 도입해 도구 호출 방식에 대한 세밀한 제어를 제공한다. 외부 도구 연동 여부를 개발자가 지정하거나 모델이 동적으로 결정하게 할 수 있어 검색 증강 생성(RAG), 에이전트 파이프라인 등에 최적화된 구조를 제공한다. 시스템 프롬프트 편집기도 새롭게 설계돼 복잡하거나 장문 프롬프트에 대한 대응력이 향상됐다. 프리셋 기반의 다양한 모델과 양자화 방식도 지원되며 '젬마', '라마3', '미스트랄', '오르카' 등 주요 오픈소스 모델이 모두 포함됐다. 이같은 구조는 '옵시디언'과 같은 노트 기반 앱에 플러그인 형태로 연결돼 텍스트 생성, 연구 요약, 노트 검색을 클라우드 없이 수행할 수 있게 한다. 이 모든 과정은 'LM 스튜디오' 내의 로컬 서버를 통해 이뤄져 빠르고 프라이버시 중심의 상호작용이 가능하다. 성능 개선의 핵심은 '라마.cpp' 백엔드에 적용된 쿠다 그래프와 플래시 어텐션이다. 쿠다 그래프는 컴퓨팅처리장치(CPU) 호출 횟수를 줄여 모델 처리량을 최대 35%까지 높였다. 플래시 어텐션은 메모리 부담 없이 긴 컨텍스트 대응 능력을 강화하며 최대 15% 속도 향상을 이끌었다. RTX GPU 사용자라면 별도 설정 없이도 '쿠다 12.8' 기반의 성능 향상을 경험할 수 있다. 드라이버 호환 시 자동 업그레이드가 적용되며 얇은 노트북부터 고성능 워크스테이션까지 전 범위 RTX 인공지능(AI) PC에서 효율적인 추론이 가능하다. 'LM 스튜디오'는 윈도우, 맥OS, 리눅스에서 모두 실행 가능하며 무료로 다운로드해 사용할 수 있다. 데스크톱 채팅, 오픈AI API 개발자 모드 등 다양한 인터페이스도 제공된다. 엔비디아 측은 "'LM 스튜디오' 최신 업데이트는 RTX AI PC에서 최고의 성능과 유연성을 제공한다"며 "로컬 LLM 도입 장벽을 낮추고 사용자의 AI 실험과 배포를 적극 지원할 것"이라고 밝혔다.

2025.05.12 15:33조이환

'문서 AI'가 더 똑똑해졌다…"서류 속 문맥·구조까지 파악"

문서 인공지능(AI) 기술이 단순 텍스트 인식을 넘어 문맥·구조까지 이해하는 방향으로 진화했다. 복잡한 문서에서도 주요 정보를 자동 식별하고 고도화된 자동화 처리까지 가능해졌다. 11일 IT 업계에 따르면 최근 문서 처리 시장에서는 비전언어모델(VLM) 기반 광학 문자 인식(OCR) 기술이 주목받고 있다. 이 기술은 계약서, 보고서 등 여러 형식과 맥락으로 이뤄진 문서 속 표, 조항, 제목, 본문을 AI로 식별해 구조화된 데이터로 변환할 수 있다. VLM은 이미지와 언어 정보를 동시에 이해하는 AI 모델이다. 일종의 '이미지 전문가'와 '언어 전문가'가 한 팀처럼 협업하는 방식으로 작동한다. 우선 이 모델은 문서에서 표, 문장, 도장, 손글씨 등 다양한 이미지 요소를 구분한다. 이후 각 영역의 텍스트를 분석해 의미를 파악하고, 이를 종합적으로 해석한다. 이 과정에서 시각 정보와 언어 정보가 실시간으로 상호작용하며 정답을 조율한다. 정보 하나가 잘못 인식되면 다른 정보가 이를 보완하고, 누락된 부분은 이미지 단서를 활용해 추론하는 식이다. 예를 들어, 사용자가 계약서에 VLM 기반 OCR을 적용하면 '계약 당사자'와 '계약 기간' '주요 조항' '서명란' 등을 자동으로 식별해 체계적으로 정리할 수 있다. 이를 통해 문서 처리 자동화 수준을 높이고 반복 작업과 인적 오류를 줄일 수 있다. 기존 OCR은 이미지 속 텍스트를 디지털 문자로 바꾸는 데만 초점 맞췄다. 문서 레이아웃이나 의미적 맥락은 이해하지 못해 데이터 활용에 한계가 있었다. 이에 추가 인력이 이를 수작업으로 정리해야만 했다. VLM OCR, 정확도·사업성 모두 잡아 한국딥러닝은 '딥 OCR 플러스' 출시로 VLM OCR 서비스를 이미 상용화했다. 이 솔루션은 별도 학습 없이 여러 형식 문서를 처리할 수 있다. 한국어·영어·숫자·특수문자가 섞인 복잡한 구조도 정확하게 인식할 수 있도록 설계됐다. 딥 OCR 플러스는 문서의 표나 문단을 자동 분석해 핵심 정보를 요약하고, 추출 데이터를 표준 포맷으로 제공해 업무 시스템과 연동된다. 한국딥러닝은 이 솔루션으로 문서 검토 시간을 최대 80% 줄이고, 일관된 데이터 품질을 유지할 수 있다고 강조했다. 앞서 업스테이지도 AI 기반 문서 구조화 솔루션 '다큐먼트 파스'를 출시해 보험, 금융, 의료 등 산업 현장에서 문서 자동화를 지원하고 있다. 고정밀 벤치마크에서 아마존·마이크로소프트 모델보다 높은 정확도를 기록한 것으로 전해졌다. 올해 6월 모델 '솔라'를 결합한 '솔라 다큐브엘엠'도 출시한다. 솔라 타큐브엘엠은 시각 정보와 언어 정보 통합 처리 역량을 강화해 문서 기반 요약, 질의응답, 자동 분류까지 수행할 수 있도록 구성됐다. 특히 비정형 문서나 복잡한 레이아웃 문서에서도 높은 인식률을 보일 것이란 평가를 받고 있다. 김지현 한국딥러닝 대표는 "비전 OCR은 돈 버는 AI"라며 "정확도와 사업성을 모두 잡을 수 있는 실용 기술"이라고 강조했다.

2025.05.11 14:40김미정

"美 기업 3곳 중 1곳이 오픈AI 구독자"…앤트로픽·구글 뒤처져

미국서 오픈AI의 기업 유료 구독 증가율이 구글, 앤트로픽을 넘어섰다는 조사 결과가 나왔다. 7일 미국 핀테크 기업 램프가 '램프 AI 인덱스'를 인용해 조사한 결과에 따르면 미국 기업 중 32.4%가 오픈AI의 AI 모델·플랫폼에 유료로 가입한 것으로 나타났다. 이는 올해 1월 18.9%, 3월 28%에서 꾸준히 증가한 수치다. 반면 앤트로픽은 4.6%에서 8%로 증가하는 데 그쳤다. 구글은 2월 2.3%에서 4월 0.1%로 오히려 감소했다. 경쟁사들이 정체된 사이 오픈AI는 가장 빠른 고객 증가세를 기록한 것이다. 램프는 약 3만 개 기업의 카드·청구서 결제 데이터를 기반으로 AI 관련 구독 지출을 분석해 이같은 결과를 발표했다. 다수 외신은 오픈AI가 빠르게 기업 고객 기반을 넓히고 있다고 평가했다. 또 AI 기술을 업무에 도입하려는 기업이 오픈AI를 주요 선택지로 삼고 있다고 봤다. 오픈AI는 "4월 기준 200만 개 이상의 기업 계정을 보유하고 있다"며 "기업 시장에서 얻는 수익이 향후 핵심 재원이 될 것"이라고 밝힌 바 있다. 이는 지난해 9월 100만 개 대비 두 배 수준으로 증가한 규모다. 블룸버그는 오픈AI가 올해 127억 달러(약 17조7천700억원) 매출을 올리고 2026년에는 294억 달러(약 41조원)까지 확대될 것으로 전망했다. 오픈AI는 2029년까지 현금흐름 기준 흑자를 달성하지 못할 것으로 보고 있다. 다만 기업 고객에게 수천 달러 수준의 맞춤형 AI 에이전트를 판매하는 방안을 검토하고 있으며, 이를 통해 수익 기반을 다질 계획이다. 램프 이코노미스트 아라 카르지안은 "오픈AI는 다른 어떤 기업보다 고객을 빠르게 확보하고 있다"며 "기업 채택률이 경쟁 모델보다 빠르게 증가하고 있음을 보여준다"고 밝혔다.

2025.05.11 14:23김미정

LG AI연구원, '마곡 집결'로 재정비…AI R&D 시너지 '승부수'

LG AI연구원이 인공지능(AI) 기술 경쟁력 강화를 위한 조직 재편에 나섰다. 핵심 연구진을 한데 모아 연구개발 역량을 끌어올리려는 전략이다. LG AI연구원은 최근 본사를 서울 여의도에서 마곡 디앤오 사옥으로 이전했다고 9일 밝혔다. 본사는 3층부터 7층까지 5개 층 규모로 조성됐으며 기존 여의도와 마곡에 분산돼 근무하던 연구원 300여 명이 한 곳으로 통합됐다. 이번 이전을 통해 연구원은 공간 설계에 집중해 약 50개의 다양한 회의실을 마련했다. 자유로운 협업을 유도하고 창의적인 아이디어 발현을 유도하려는 목적이다. LG AI연구원은 지난 2020년 12월 출범 이후 그룹 차원의 전폭적인 지원을 바탕으로 LG의 AI 전환 전략을 이끄는 핵심 조직으로 성장했다. 특히 자체 초거대 AI 모델 '엑사원' 시리즈를 통해 기술 고도화를 이어왔다. 지난해 12월 공개된 '엑사원 3.5'에 이어 지난 3월에는 국내 최초 추론형 AI '엑사원 딥'도 선보였다. 계열사 제품과 서비스에 실제 적용되며 그룹 전반의 AI 내재화에 기여하고 있다. 대표 사례로는 LG전자의 AI 노트북 '그램'과 LG유플러스의 통화 에이전트 '익시오'에 엑사원 기술이 탑재됐다. 기업용 AI 에이전트 '챗엑사원'은 현재 LG 사무직 임직원의 절반 수준인 4만 명 이상이 활용 중이다. AI 인재 양성을 위한 교육도 병행되고 있다. AI 리터러시 교육부터 석·박사 과정 운영까지 전주기 체계를 구축했으며 지난 4년간 1만5천 명 이상의 임직원이 참여했다. 기술력 확보 성과도 가시적이다. LG AI연구원은 국제인공지능학회(AAAI), 국제컴퓨터언어학회(ACL), 국제 컴퓨터 비전 및 패턴 인식 학술대회(CVPR) 등 글로벌 최상위 학회에 234건의 논문을 발표했으며 국내외 특허 출원도 총 228건에 달한다. 연구원은 온디바이스 AI 성능 고도화에도 집중하고 있다. 외부 서버 연결 없이 기기 내 데이터 처리를 가능케 해 보안성과 개인정보 보호 측면에서 경쟁력을 강화하려는 전략이다. 향후 계획으로는 '에이전틱 AI' 구현을 목표로 하고 있다. 계열사 업무 효율화, 생산성 제고, 나아가 신소재와 신약 개발 영역까지 AI 적용을 확장한다는 구상이다. LG AI연구원 관계자는 "엑사원을 중심으로 산업 현장과 제품, 서비스까지 AI를 연결하는 전략을 차근차근 실현해나가고 있다"며 "기술력과 협업 역량 모두에서 세계적 수준을 목표로 하고 있다"고 밝혔다.

2025.05.09 10:38조이환

기상청, 동아시아·한반도에 적합한 '국가기후예측시스템' 개발 착수

기상청이 기후위기 대응을 위해 급변하는 동아시아·한반도 기후환경에 적합한 국가기후예측시스템 개발에 나선다. 기상청은 국가기후예측시스템을 개발해 1개월~10년 기후예측정보를 독자적으로 생산하는 체계를 마련해 2050 탄소중립 이행과 실효성 있는 기후위기 대응 국가정책·계획·제도 추진 전략 수립 등을 지원할 계획이다. 국가기후예측시스템은 올해부터 2031년까지 7년 동안 495억원을 투입해 개발한다. 기상청 현업 수치예보모델을 기반으로 한 국내 고유 기후예측시스템 개발을 목표로 지난달 30일 첫 삽을 떴다. 기상청 관계자는 “기후변화 가속화로 지구환경이 급변하면서 기후재난에 따른 사회경제적 손실과 인명피해가 증가하고 있어 동아시아·한반도 기후환경을 반영한 기후예측정보를 기반으로 한 기후위기 대응 정책 추진이 시급하다”며 개발배경을 설명했다. 기상청은 2013년부터 영국기상청 기후예측시스템을 도입해 1년 이내 기후예측정보를 제공 중이어서 변화하는 동아시아와 한반도 기후환경을 기후예측시스템에 즉각 반영해 개선하는 데는 어려움을 겪어왔다. 기상청은 국가기후예측시스템을 통해 한반도 기후환경에 적합한 기후예측정보를 1개월~10년까지 일관되게 생산해 2031년 이후에는 다양한 수요자가 요구하는 요소와 형태로 매년 제공될 예정이다. 기상청은 두 차례 사업기획연구를 통해 2단계(3+4년), 7년(2025~2031년)에 걸친 연구개발 계획을 수립하고 첫해인 올해에는 48억원의 예산을 확보해 울산과학기술원(UNIST)·서울대학교 등 약 270여 명의 국내 기후예측연구진이 참여하는 '기후위기 대응 국가기후예측시스템 개발'에 착수했다. 기상청 현업 수치예보모델을 기반으로 대기·대기화학, 해양, 해빙, 지면, 생태계 등을 포괄적으로 동시에 예측하는 지구시스템 기후모델 기술 개발을 통해 1개월~10년 기후예측정보를 생산하고 방재, 재난, 건설, 금융·보험, 에너지 등 다양한 분야에서 필요한 기온, 강수, 극한기후, 눈, 우박, 폭풍, 서리 등 예측정보를 제공할 계획이다. 또 인공지능(AI) 기반 기후예측 객관화 기술과 지속가능한 민관협력 기후예측모델링 생태계 조성 및 수요자 활용 편의성을 고려한 기후예측정보 제공 시스템도 함께 개발할 예정이다. 장동언 기상청장은 “기후변화의 가속화로 급변하는 동아시아·한반도 기후환경에 적합한 국가기후예측시스템과 자료 가공·활용 기술 개발을 통해 다양한 기후예측 정보 수요에 대한 적시 대응과 탄소중립 실현에 기여하고 기후재난으로부터 국민 안전을 지키는 데 최선을 다하겠다”고 밝혔다.

2025.05.01 15:38주문정

"글로벌 수준"...카카오, 멀티모달 언어모델 'Kanana-o' 성능 공개

카카오가 새로운 인공지능 모델을 통해 기술 경쟁력 강화를 이어간다. 카카오(대표 정신아)는 공식 테크블로그를 통해 통합 멀티모달 언어모델 'Kanana-o'와 오디오 언어모델 'Kanana-a'의 성능과 개발 후기를 1일 공개했다. 통합 멀티모달 언어모델인 Kanana-o는 텍스트와 음성, 이미지까지 다양한 형태의 정보를 동시에 이해하고 처리할 수 있는 모델이다. 텍스트, 음성, 이미지 중 어떠한 조합으로 질문을 입력하더라도 처리 가능하며, 상황에 맞는 텍스트나 자연스러운 음성으로 응답 가능한 구조로 설계됐다. 카카오는 '모델 병합' 기술을 기반으로 이미지 처리에 특화된 모델 'Kanana-v'와 오디오 이해 및 생성에 특화된 'Kanana-a' 모델을 통합, 단기간 내 효율적으로 Kanana-o를 개발했다. 통합 후에는 이미지, 오디오, 텍스트 데이터를 동시에 학습하는 '병합 학습'을 통해 시각과 청각 정보를 동시에 이해하고, 텍스트와 연결 지을 수 있도록 통합 훈련을 거쳤다. 이런 과정을 통해 기존 LLM 구조에서 이미지 이해 능력과 음성 인식과 합성, 감정 이해 등 고도화된 오디오 능력을 확장시킨 통합 멀티모달 언어모델이 구현됐다. Kanana-o는 음성 감정 인식 기술을 통해 사용자의 의도를 올바르게 해석하고, 상황에 맞는 적절한 반응과 답변을 제공해준다. 억양, 말투, 목소리 떨림 등 비언어적 신호를 분석하고, 대화 맥락에 맞는 감정적이고 자연스러운 음성의 응답을 생성하는 것이 특징이다. 대규모 한국어 데이터셋을 활용해 한국어의 특수한 발화 구조, 억양, 어미 변화 등을 정밀하게 반영하기도 했다. 특히 제주도, 경상도 등 지역 방언을 인식하고 이를 표준어로 변환해 자연스러운 음성을 생성할 수 있다. 지속적인 성능의 고도화를 위해 카카오는 현재 독자적인 한국어 음성 토크나이저(오디오 신호를 일정 단위로 작게 분해하는 도구) 개발을 진행 중이다. 스트리밍 방식의 음성합성 기술을 적용해 사용자가 긴 대기 시간 없이 응답을 제공하는 강점도 보유했다. 예를 들어, 이미지와 함께 "이 그림에 어울리는 동화를 만들어 줘"라고 입력하면, Kanana-o는 해당 음성을 이해하고 사용자의 억양과 감정 등을 분석해 자연스럽고 창의적인 이야기를 실시간으로 생성해 들려준다. Kanana-o는 한국어 및 영어 벤치마크에서 글로벌 최고 모델들과 유사 수준을 기록했으며, 한국어 벤치마크에서는 높은 우위를 보였다. 특히, 감정인식 능력에서는 한국어와 영어 모두에서 큰 격차를 기록하며, 감정까지 이해하고 소통할 수 있는 AI 모델의 가능성을 입증했다. 이미지와 음성을 통합적으로 이해해야 하는 '이미지-음성 QA(질의응답)' 태스크에서도 강력한 성능을 달성하며, 통합 멀티모달 언어모델로서의 글로벌 경쟁력을 확인했다. 카카오는 향후 Kanana-o를 통해 ▲다중 턴 대화 처리 ▲양방향 데이터 동시 송수신 기술 대응 능력 강화 ▲부적절한 응답 방지를 위한 안전성 확보 등을 목표로 연구 개발을 지속해 갈 계획이다. 이를 통해 다중 음성 대화 환경에서의 사용자 경험을 혁신하고, 실제 대화에 가까운 자연스러운 상호작용을 실현해가는 것이 목표다. 카카오 김병학 카나나 성과리더는 "카나나 모델은 복합적인 형태의 정보를 통합적으로 처리함으로써 기존의 텍스트 중심 AI를 넘어 사람처럼 보고 듣고 말하며 공감하는 AI로 진화하고 있다"며 "독자적인 멀티모달 기술을 바탕으로 자사의 인공지능 기술 경쟁력을 강화하는 한편, 지속적 연구 결과 공유를 통해 국내 AI 생태계 발전에 꾸준히 기여할 계획"이라고 말했다.

2025.05.01 10:13백봉삼

[기고] 텍스트만 읽는 AI는 한계…이미지까지 이해하는 'VLM 시대' 왔다

텍스트만 바라보던 인공지능(AI)이 이미지도 읽기 시작했다. 생성형 AI 열풍 정점에 서 있던 거대언어모델(LLM)이 세상을 바꾼 지 채 2년이 되기도 전에 산업계는 벌써 비전언어모델(VLM) 이라는 새로운 반열을 주목하고 있다. LLM은 인터넷 전체에 해당하는 방대한 문서, 코드, 게시글 등을 토큰 단위로 분해해 빈도와 순서를 학습하는 통계 기반 언어 모델이다. 이를 통해 문장 구조, 주제 흐름, 단어 간 연관도 등을 정교하게 파악할 수 있다. 그러나 LLM은 픽셀로 구성된 시각 정보를 직접 해석하지 못한다. 특히 스캔본 한 장 안에 담긴 표, 도장, 서명, 손글씨, 이미지 등 다양한 비정형 요소 앞에서는 입력 자체를 받지 못해 무력해진다. 이 때문에 반드시 광학문자인식(OCR)을 거쳐 텍스트로 전처리한 후에야 분석이 가능하다. 이 과정에서 발생하는 정보 손실이나 오인식이 전체 모델 성능에 결정적 영향을 미친다. 이 한계를 근본적으로 보완하는 방식이 VLM이다. VLM은 쉽게 말해 '사진 전문가'와 '언어 전문가'가 한 팀이 된 모델이다. 우선 이미지를 보고 표, 문장, 도장, 필기 영역을 구분한 후 텍스트 기반으로 의미를 해석한다. 이를 실시간으로 교차 어텐션(Cross-Attention) 층에서 주고 받으며 정답을 보정한다. 한 영역이 잘못 인식되면 다른 쪽이 보완하고, 누락된 정보는 이미지의 시각 단서 바탕으로 추론해 빈칸을 채운다. 언어와 시각 정보가 동일 공간에서 상호작용하듯 작동하는 식이다. 구조가 복잡하거나 손글씨가 섞인 문서도 훨씬 자연스럽게 이해할 수 있다. 예를 들어 물결 무늬 배경 때문에 일부 금액 텍스트가 흐릿해진 스캔 이미지에서도 VLM은 표 헤더와 숫자 패턴을 근거로 '이 칸은 청구 금액일 것'이라고 추론한다. 텍스트만 해석하던 기존 LLM 방식과 달리, VLM은 이미지와 문장이 함께 대화하는 구조로 작동하기 때문에 비정형 문서에 강력한 성능을 발휘한다. 실제 산업 현장에서 VLM 기반 OCR은 이미 도입 초기부터 기존 접근법보다 뚜렷한 개선 효과를 보이고 있다. 이미 업계에서는 VLM을 통한 생산성 향상 효과가 나오고 있다. 신생 물류기업 L사는 하루 평균 4만 장의 송장을 스캔하는데, 양식 종류가 600종을 넘어서면서 OCR 오류율이 18%까지 상승했다. VLM을 탑재한 OCR을 적용한 결과 첫 달에 오류율이 4%까지 떨어졌고, 급히 투입된 15명의 검수 인력을 4명으로 줄일 수 있었다. 금융·보험 분야에서도 VLM은 의미 있는 변화를 만들어냈다. 보험 손해 사정사 워크플로에 도입된 VLM 기반 OCR 엔진은 의료 영수증, 처방전, 수기 메모가 섞인 PDF 문서를 분석해 질병 코드와 치료 기간, 총 청구액 등 핵심 정보를 의미 단위로 자동 매핑했다. 결과적으로 도입 3개월 만에 평균 심사 시간이 건당 4.7분 단축됐다. 부실 청구 탐지율은 2.3배 향상됐다. 실질적인 VLM 구현을 위해선 세 가지 핵심 과제가 수반된다. 첫째는 중앙처리장치(GPU) 비용이다. 이미지 해상도가 높을수록 메모리 요구량은 기하급수적으로 증가한다. 둘째는 데이터 보안이다. 문서 이미지에는 신분증과 도장, 주소 등 민감한 개인정보가 포함된다. 저장 암호화와 접근 제어 등 보안 설계가 모델 설계 초기부터 명확히 반영돼야 한다. 마지막으로 운영 측면에서의 ML옵스 통합이다. VLM은 텍스트와 이미지 양쪽에서 오류가 누적될 수 있으므로, 라벨 재검수·재학습 주기를 기존보다 촘촘하게 설정해 지속적 품질을 수행해야 한다. 이런 기술 과제를 극복할 수 있다면 VLM은 단순 OCR을 넘어 멀티모달 로봇프로세스자동화(RPA)로 진화할 수 있다. VLM이 문서 의미를 이해하게 되면 수준 높은 복합 워크플로까지 자동화할 수 있을 것이다. 실제 모바일 스캐너나 드론 카메라처럼 네트워크 지연이 큰 현장에서는 경량화된 VLM을 엣지 디바이스에서 구동하는 방향으로 연구가 진행되고 있으며, 실제 적용 사례도 점차 증가하고 있다. 유럽연합(EU)의 AI법 등 주요 규제는 이미지 데이터의 편향성과 프라이버시를 명확히 규정하기 시작했다. 이로 인해 향후 VLM 개발자는 학습 데이터셋의 출처와 라벨링 과정을 투명하게 기록해야 하는 책임도 함께 지게 될 전망이다. 기업과 공공기관이 다양한 형식의 데이터를 한 눈에 이해하는 AI를 원한다면 VLM OCR 전략을 로드맵에 포함해야 한다. 문서 인식부터 업무 자동화까지 이어지는 다음 혁신의 축은 '텍스트‑이미지 융합형 AI'가 될 가능성이 크다. 현재 기술 기업들의 도전이 이 변화를 앞당기고 있으며, 실제 도입 성공 사례는 더 빠르게 쌓일 것이다. 텍스트 AI만으로 충분하다고 느끼는 지금 이 순간이, 어쩌면 VLM 전환을 준비할 마지막 골든타임일지 모른다.

2025.04.30 15:54김지현

[AI는 지금] 국산 오픈 LLM '출격'…엑사원·하이퍼클로바X 등 잇따라 공개

국산 오픈소스 대형 언어모델(LLM) 경쟁이 본격화되고 있다. LG AI연구원과 네이버가 잇따라 오픈 LLM을 선보이며 국내 AI 생태계에 활력을 불어넣고 있는 가운데 카카오도 자체 모델을 공개하며 흐름에 합류하는 모양새다. 27일 업계에 따르면 네이버는 최근 '하이퍼클로바X 시드(Seed)' 시리즈를 공개하며 국산 오픈소스 LLM 흐름을 이어가고 있다. 이는 지난해 LG AI연구원이 12월 '엑사원(Exaone)-3.5'를 공개하며 포문을 연 이후 국내에서도 오픈소스 LLM 시장이 본격적으로 형성되기 시작한 흐름을 잇는 것이다. LG AI연구원은 '엑사원-3.5' 공개 이후 후속 업데이트를 지속하고 있으며 최근에는 '엑사원 딥(DEEP)' 모델도 허깅페이스에 오픈소스로 공개했다. 엑사원 시리즈는 케엠엠엘유(KMMLU), 해래벤치(HAERAE-Bench), 코베스트(KoBEST) 등 다양한 한국어 특화 벤치마크에서도 준수한 성능을 기록하며 기술력을 입증하고 있다. 더불어 원라인에이아이 발표에 따르면 '엑사원-3.5'는 한국어와 영어 모두에서 일관된 성능을 보여주는 안정성이 강점으로 꼽혔다. 최근 회사가 자체적으로 진행한 '구구단 문제(1부터 100까지 두 자리 곱셈)' 실험에서 한국어와 영어 입력 모두에서 균형 잡힌 답변 정확도를 기록해 주목받았다. 특히 제곱수나 10의 자리 곱셈 문제에서는 높은 정확도를 보였으며 피연산자의 순서에 따라 미세한 성능 차이가 발생하는 특성도 관찰됐다. 업계에서는 엑사원이 한국어 오픈소스 모델 시장에서 핵심 모델 중 하나로 자리잡았다는 평가를 내놓고 있다. 커뮤니티의 반응도 대체로 긍정적이다. 최근 레딧 'LLM' 및 '오픈소스AI' 관련 커뮤니티에서는 '엑사원 딥' 모델에 대해 "7B 모델이 GPQA+ 고난도 벤치마크에서 62% 성능을 기록했다"거나 "2.4B 모델이 라즈베리파이나 스마트폰에서도 실행 가능할 정도로 경량화됐다"는 평가가 나왔다. 네이버 클라우드는 지난 24일 '하이퍼클로바X 시드(Seed)' 시리즈를 공개하며 국산 오픈소스 LLM 경쟁에 본격 합류했다. '하이퍼클로바X 시드'는 30억 파라미터 규모의 소형 모델로, 한국어 벤치마크 'KMMLU'에서 48.47점을 기록했다. 이는 절대 점수만 보면 과거 53.4점을 기록했던 '하이퍼클로바X-라지'보다 낮지만 대형 서버 모델이 아닌 온디바이스 환경까지 염두에 둔 경량 모델이라는 점을 고려하면 의미 있는 결과로 평가된다. '하이퍼클로바X' 시드는 케이엠엠엘유 외에도 해래벤치, 클릭(CLICK) 등 주요 한국어 벤치마크에서도 안정적인 성능을 보였다. 또 공개 하루 만에 다운로드 수가 2천400건을 넘겼고 커머셜 라이선스로 제공돼 스타트업이나 기업들이 상업적 활용까지 가능하다. 허깅페이스에서는 시드를 기반으로 한 파인튜닝 및 양자화 파생모델들이 빠르게 확산되며 생태계 확장 속도도 빨라지고 있다. 실제로 뉴욕대 조경현 교수, 스퀴즈비츠 김형준 대표, 바이오넥서스 김태형 대표 등은 직접 사용 후 긍정적인 후기를 SNS에 남기며 기대감을 나타냈다. 다만 일부 아쉬운 부분도 확인됐다. '하이퍼클로바X 시드'는 구구단 문제 실험에서 문제 자체는 정확히 풀었지만 정답을 요구되는 형식으로 출력하지 않아 평가 점수가 낮게 나오는 사례가 발생했다. 네이버는 이와 같은 포맷 일관성 문제를 해결하기 위해 한국어 데이터셋을 보강할 계획이다. 카카오 역시 '카나나' 시리즈를 통해 오픈소스 LLM 경쟁에 참가하고 있다. 다만 원라인에이아이의 구구단 실험 결과에 따르면 '카나나'는 한국어 입력에서는 비교적 양호한 성능을 보였으나 영어 입력에서는 답변 길이 문제로 인해 성능이 저하되는 모습을 보였다. 실험에 따르면 토큰 제한을 완화할 경우 영어 성능도 개선될 여지가 있는 것으로 나타났다. 현재 국내에 공개된 국산 오픈 LLM들이 아직 경량화 모델 위주로 구성돼 있다는 한계가 있다는 지적도 나온다. 업계는 향후 다양한 크기의 모델들이 추가로 등장할 경우 한국어 기반 AI 생태계의 경쟁력 또한 한층 강화될 것으로 기대하고 있다. 손규진 원라인에이아이 자연어처리(NLP) 연구원은 자신의 링크드인을 통해 "국내에서는 아직 소형 모델 위주로 공개돼 'HRM8K' 같은 고난도 수학 벤치마크로 평가하기에는 아쉬운 점이 있다"며 "향후 더 다양한 크기의 모델이 등장해 한국어 기반 AI 생태계가 한층 발전하기를 기대한다"고 말했다.

2025.04.27 07:21조이환

  Prev 1 2 3 4 5 6 7 8 9 Next  

지금 뜨는 기사

이시각 헤드라인

SK하이닉스, HBM4 개발 완료…'세계 최초' 양산 체제 구축

AI 시대 인재·성장·협업 모든 것 'HR테크 리더스 데이 4' 열린다

이마트 '트레이더스' 잘 나가네…롯데마트 ‘맥스’는?

"한 곳만 참여해도 유찰 없다"…국가AI컴퓨팅센터 신속 추진

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.