• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
  • AI의 눈
AI의 눈
HR컨퍼런스
디지털트러스트
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'AI 모델'통합검색 결과 입니다. (393건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

메타, 차세대 영상 AI 모델 '망고' 공개 예고…내년 상반기 출시

메타가 내부적으로 새로운 인공지능(AI) 모델 개발 상황을 공유하며 향후 기술 전략과 조직 개편 방향도 함께 제시한 것으로 전해졌다. 이미지·영상과 텍스트 분야를 각각 겨냥한 차세대 AI 모델을 개발해 시장 경쟁력을 높인다는 목표다. 19일 월스트리트저널(WSJ)에 따르면 메타는 이미지와 영상 생성에 특화된 새로운 AI 모델 '망고'와 차세대 대규모언어모델(LLM) '아보카도'를 개발 중인 것으로 알려졌다. 이들 모델은 최근 진행된 메타 내부 질의응답 자리에서 공개됐으며 내년 상반기 출시가 목표다. 텍스트 기반 모델인 아보카도는 특히 코딩 역량 강화를 핵심 과제로 삼고 있다. 메타는 이와 함께 시각 정보를 바탕으로 주변 환경을 학습하는 이른바 '월드 모델' 개발 가능성도 초기 단계에서 검토 중인 것으로 전해졌다. 이는 단순한 생성 기능을 넘어 현실 세계를 이해하는 범용 AI로의 확장을 염두에 둔 행보로 풀이된다. 메타는 올해 AI 조직을 대대적으로 재편하며 알렉산더 왕 전 스케일 AI 최고경영자(CEO)를 영입해 '메타 슈퍼인텔리전스 랩스'라는 신규 조직을 출범시켰다. 마크 저커버그 CEO는 직접 인재 영입에 나서 오픈AI 출신 연구원 등 20명 이상을 영입했으며 현재 50명 이상의 AI 연구·엔지니어 인력이 새롭게 합류한 상태다. 최근 이미지와 영상 생성 기술은 주요 AI 기업 간 경쟁의 핵심 전장으로 부상하고 있다. 메타는 지난 9월 스타트업 미드저니와 협업해 AI 영상 생성기 '바이브스'를 공개했으며 오픈AI는 이에 맞서 자체 영상 생성 앱 '소라'를 선보였다. 구글 역시 이미지 생성 도구 '나노 바나나'를 앞세워 제미나이 이용자 수를 빠르게 확대했다. 메타 알렉산더 왕 최고AI책임자는 "차세대 텍스트 모델은 코딩 성능을 핵심적으로 강화하는 데 초점을 맞추고 있다"며 "이미지와 영상을 이해하는 새로운 모델을 통해 AI가 환경을 학습하는 방향도 함께 모색 중"이라고 밝혔다.

2025.12.19 12:12한정호 기자

이노룰스 "AI 기술보다 전문성 먼저"...보험 AX 세미나 성료

이노룰스가 단순한 기술 기업이 아닌 보험을 가장 잘 아는 인공지능(AI) 파트너로서의 차별화된 역량을 제시했다. 이노룰스는 지난 17일 보험 업계 관계자 대상으로 'AI 에이전트 시대 보험사 변화 동향 및 미래 발전 방향' 세미나를 개최했다고 18일 밝혔다. 이번 세미나는 총 4개 세션으로 진행됐다. 삼일PWC 손준호 파트너가 AI 에이전트 시대 보험사 변화 동향과 발전 방향을 제시했고 이노룰스 AX 전략본부장 유승영 상무는 '이노룰스가 제안하는 AI 전환(AX) 전략'을 발표하며 보험사들이 AI 초창기에 겪었던 실패 사례들을 분석했다. 유 상무는 "보스턴컨설팅그룹(BCG) 보고서에 따르면 기업의 AI 투자 95%가 실패했고 실질적 성과는 5%에 불과한 것으로 나타났다"며 "AI 기술 자체에 대한 집착과 목적 인식 부족, 업에 대한 경험 없는 추진이 실패 원인"이라고 설명했다. 이어 "적정한 AI 기술 도입, AI 데이터 확보, 프로세스 재설계가 핵심"이라고 강조했다. 이노룰스 최규웅 이사는 '가입설계 업무 혁신을 위한 AI 에이전트 구축 사례'를 공유했다. 최 이사는 AI 가입설계 구축 사례를 통해 설계사가 음성이나 채팅으로 요청하면 고객 정보 확인부터 상품·담보 추천, 인수지침 체크, 보험료 산출까지 원스톱으로 처리하는 데 평균 2시간 걸리던 시간을 단축하고 45%에 달하던 청약 전 오류율을 크게 낮췄다고 밝혔다. 인수지침 위배사항을 자동으로 탐지해 해소하고 머신러닝(ML) 기반 심사 예측 모델과 검색증강생성(RAG)·거대언어모델(LLM)을 활용한 하이브리드 모델로 판단 근거까지 제시하는 것이 특징이다. 유 상무는 '보험 요율산출 자동화를 통한 상품 개발 리드타임 단축 및 효율화 사례'에 대해서도 발표했다. 이노룰스의 보험요율 산출 시스템은 담당자별로 엑셀과 VBA로 수작업하던 가격산출 업무를 자동화해 상품 개발 기간을 대폭 단축했다. 산출 기초 데이터를 통합 관리하고 표준 산출식을 활용한 일괄 처리, 감독규정 자동 체크, 산출 결과값 비교 검증 등을 통해 오류 발생 가능성을 제거했다. 현재 국내 유수의 보험사 등에 공급 계약도 체결한 바 있다. 이날 참석한 업계 관계자는 이노룰스가 국내 보험 분야의 대표적인 소프트웨어 기업으로서 보험사의 복잡한 상품 구조, 끊임없이 변하는 규제, 방대한 약관과 인수지침 등 업무 특수성을 깊이 이해하고 있다고 평가했다. 또 기존 룰 베이스를 통한 업무 자동화 사업에 전문성이 있는 만큼 ML·RAG·LLM 등 다양한 AI 기술을 보험 업무 프로세스에 최적화해 적용하는 데 강점이 있을 것으로 기대된다고 전했다. 장인수 이노룰스 대표는 "우리는 기술이 아닌 보험 업무에 대한 깊은 이해를 바탕으로 접근하는 회사"라며 "AI를 한다가 아니라 AI로 무엇을 실제로 해결하느냐가 중요하다"고 강조했다. 이어 "우리의 목표는 보험업계 AI를 논의할 때 가장 먼저 떠오르는 회사가 되는 것"이라며 "보험 업무를 누구보다 잘 이해하는 AI 기업으로서 기술력과 현장 이해도, 실행력에서 1등으로 인정받겠다"고 덧붙였다.

2025.12.18 13:51한정호 기자

이미지 생성 AI 모델 경쟁 심화…오픈AI, 'GPT 이미지 1.5' 공개

오픈AI가 이미지 생성과 편집 성능을 강화한 새로운 모델을 선보이며 생성형 인공지능(AI) 이미지 시장 경쟁에 다시 불을 지폈다. 기존보다 정교한 지시 수행과 빠른 처리 속도를 앞세워 이미지 생성 도구를 실험 단계를 넘어 실사용 중심의 창작·업무 도구로 끌어올린다는 전략이다. 17일 테크크런치에 따르면 오픈AI는 새로운 이미지 생성 모델 'GPT 이미지 1.5'를 기반으로 한 챗GPT 이미지의 업데이트를 발표했다. 이번 모델은 지시 이행 정확도 향상, 세밀한 이미지 편집, 최대 4배 빠른 이미지 생성 속도가 특징으로, 모든 챗GPT 사용자에 순차적으로 제공된다. GPT 이미지 1.5는 오픈AI가 구글의 제미나이 시리즈와 이미지 생성 모델 경쟁을 본격화하는 과정과 맞물려 공개됐다. 구글이 최신 플래그십 모델과 이미지 생성기 '나노 바나나 프로'로 시장 점유율을 확대하는 가운데, 오픈AI가 이미지 모델 출시 시점을 앞당긴 것으로 풀이된다. 오픈AI의 이전 이미지 모델 출시는 지난 4월이었다. 이번 업데이트의 핵심은 반복 편집과 일관성이다. 기존 생성형 이미지 도구들이 특정 요소만 수정해 달라는 요청에도 이미지 전체를 다시 해석하는 한계가 있었던 반면, GPT 이미지 1.5는 얼굴 생김새, 조명, 구도, 색감 등 핵심 시각 요소를 유지한 채 요청한 부분만 정밀하게 수정할 수 있다. 이를 통해 실용적인 사진 보정은 물론 의상·헤어스타일 시뮬레이션, 원본 이미지를 유지한 스타일 변환 작업이 가능해졌다. 텍스트 렌더링 성능도 개선됐다. 작은 글자나 복잡한 텍스트 배치에서도 가독성이 높아졌으며 다수의 인물이 등장하는 이미지에서 얼굴 표현의 자연스러움도 향상됐다. 오픈AI는 이러한 개선을 통해 단순 이미지 생성뿐 아니라 마케팅·디자인·이커머스·커뮤니케이션 등 비즈니스 워크플로우 전반에서 활용도를 높일 수 있다고 설명했다. 사용자 경험 측면에서도 변화가 있다. 챗GPT 내부에 이미지 전용 공간이 새롭게 마련돼 모바일 앱과 웹 사이드바에서 접근할 수 있다. 사전 설정된 필터와 트렌드 기반 프롬프트를 활용해 보다 직관적인 이미지 탐색과 반복 시도가 가능해졌다. 오픈AI는 이 공간을 '크리에이티브 스튜디오'에 가깝게 설계했다고 밝혔다 . 다만 오픈AI는 이번 업데이트가 의미 있는 진전이지만 완성 단계는 아니라고 평가했다. 다양한 테스트 사례에서 성능 개선이 확인됐으나, 여전히 반복적인 개선이 필요한 영역이 남아 있으며 향후 업데이트를 통해 품질을 지속적으로 끌어올릴 계획이다. 피지 시모 오픈AI 애플리케이션 부문 CEO는 "챗GPT 사용자의 생각과 그것을 현실로 구현하는 능력 사이의 거리를 계속 좁혀 나가겠다"고 강조했다.

2025.12.17 15:04한정호 기자

중동 넘어 아프리카로…노타, 케냐 나이로비 스마트교차로 구축 참여

노타가 인공지능(AI) 경량화·최적화 기술을 중동에 이어 아프리카 교통 체계에 적용한다. 노타는 케냐 나이로비의 지능형 교통 체계(ITS) 구축 사업에 스마트교차로 시스템 기술 공급 계약을 체결했다고 17일 밝혔다. 이번 계약은 케냐 도시도로공사(KURA)와 LG CNS가 함께 진행하는 교통관제 센터 구축 프로젝트의 일환으로, 한일 에스티엠이 시스템 설계와 관리를 맡고 노타는 AI 모델 경량화·최적화 기술 기반의 스마트교차로 시스템을 엣지 환경에 맞게 구현한다. 노타의 AI 경량화·최적화 기술은 AI 모델의 연산량과 메모리 사용을 줄여 엣지 환경에서 효율적으로 구동되도록 만드는 기술로, 저전력과 저지연이 필요한 환경에 효율적으로 평가된다. 이번에 도입되는 AI 경량화·최적화 기반 스마트교차로 시스템은 분석에 필요한 모델의 크기를 경량화한다. 이를 교차로 현장 CCTV에 최적화해 서버 개입 없이 실시간으로 차종 분류와 교통량, 대기행렬 등 교통 상황을 분석해 교통 흐름 개선에 기여할 계획이다. 특히 경량화 기술을 통해 엣지 디바이스 하나로 다수의 CCTV 채널을 동시에 관리하고 실시간 데이터를 처리할 수 있어 높은 비용 효율성 제공할 예정이다. 나아가 관리자는 실시간 데이터를 바탕으로 교통 상황을 파악하는 것은 물론 향후 교차로 운영 효율 향상을 위한 데이터로 활용 가능하다. 엣지 환경에서 구현되므로 서버 비용 부담을 줄이고 안정된 시스템 운영도 지원한다. 앞서 노타는 ITS 성능 평가와 기업 및 지방자치단체를 통한 기술 검증으로 기술력을 인정받았다. 노타의 기술로 완성된 스마트교차로 시스템과 돌발상황 검지 시스템은 실시간성과 정확도가 핵심지표인 ITS 기본성능평가에서 최상급 성적을 획득한 바 있다. 또 최근 영천 ITS 보강 사업에서도 전 항목 평균 99.5%의 성능을 보이며 준공했다. 이같은 기술력을 바탕으로 노타는 ITS 기술 수익화에도 속도를 내고 있다. ▲아랍에미리트 교통 인프라 기업 'ATS' 파트너십 ▲두바이 교통국과 ITS 솔루션 공급 계약 ▲아부다비 교통청 ITS 구축 사업 추진 논의 ▲소니와 미국 레이크우드 지역 내 보행자 안전 지원과 교통량 분석 검증 성공 등 기술을 선보여왔다. 이번 케냐 나이로비 프로젝트 참여를 통해 아프리카 지역까지 기술 적용을 확대했다. 채명수 노타 대표는 "우리의 AI 경량화·최적화 기술이 두바이에 이어 나이로비의 교통 혁신에 기여하게 돼 기쁘다"며 "이번 프로젝트를 성공적으로 마쳐 글로벌 시장에서 AI 경량화·최적화 기술의 영향력을 더욱 확장해 나갈 것"이라고 밝혔다.

2025.12.17 15:04한정호 기자

엔비디아, 오픈 모델 '네모트론 3' 시리즈 공개…"추론 속도 4배↑"

엔비디아가 에이전틱 인공지능(AI) 애플리케이션 구축을 위한 오픈 모델 제품군을 공개했다. 엔비디아는 오픈 모델과 데이터, 라이브러리로 구성된 '네모트론 3' 시리즈를 17일 발표했다. 네모트론 3는 '하이브리드 잠재 전문가 혼합(MoE)' 아키텍처로 대규모 멀티 에이전트 시스템 신뢰성을 높였다. 개발자는 이를 통해 통신 과부하와 맥락 이탈, 높은 추론 비용 등 기존 협업형 AI 시스템이 겪던 기술적 난제를 해결할 수 있다. 이 시리즈는 나노, 슈퍼, 울트라로 구성됐다. 네모트론 3 나노는 300억 개의 파라미터를 갖춘 소형 모델이다. 전 세대 대비 4배 높은 처리량을 갖췄다. 소프트웨어 디버깅이나 콘텐츠 요약 같은 작업에 최적화됐다. 추론 토큰 생성량을 최대 60%까지 줄일 수 있다. 내년 상반기 출시 예정인 슈퍼와 울트라 모델은 각각 1천억 개, 5천억 개의 파라미터를 탑재했다. 해당 시리즈는 엔비디아 블랙웰 아키텍처 기반의 고효율 훈련 포맷으로 이뤄져 메모리 요구 사항을 줄이면서도 훈련 속도를 높일 수 있다. 엔비디아는 이번 제품군을 통해 각국 조직이 데이터와 규제, 가치에 부합하는 소버린 AI를 구축하도록 적극 지원한다고 밝혔다. 이미 서비스나우, 퍼플렉시티, 지멘스 등 글로벌 기업들이 네모트론 모델을 자사 워크플로에 통합해 제조, 보안, 미디어 등 다양한 산업 분야에서 활용 중이다. 이날 엔비디아는 전문화된 에이전트 구축을 돕기 위해 3조 개 토큰으로 구성된 훈련 데이터셋과 '네모 짐' 등 오픈소스 라이브러리도 공개했다. 모든 도구와 데이터셋은 깃허브와 허깅 페이스를 통해 즉시 이용 가능하다. 젠슨 황 엔비디아 최고경영자(CEO)는 "오픈 혁신은 AI 발전의 토대"라며 "네모트론을 통해 첨단 AI를 개방형 플랫폼으로 전환하고, 개발자들이 대규모 환경에서 에이전틱 시스템을 구축하는 데 필요한 투명성과 효율성을 제공하겠다"고 밝혔다.

2025.12.17 14:37김미정 기자

SKT 컨소시엄, '독자 AI 파운데이션 모델' 5대 핵심 경쟁력 공개

SK텔레콤이 정부의 '독자 AI 파운데이션 모델' 구축 사업을 수행 중인 'SK텔레콤 컨소시엄'의 5대 핵심 경쟁력을 공개하고, 한국형 인공지능(AI) 풀스택 개발에 속도를 낸다. SK텔레콤은 14일 자사 뉴스룸을 통해 컨소시엄에 참여한 라이너·셀렉트스타·크래프톤·포티투닷·리벨리온 등 기업 5곳의 역할과 기술적 강점을 소개했다. 우선 AI 검색 분야 스타트업 '라이너'는 모델의 '정확성'을 책임진다. 라이너는 자체 전문 지식 검색 에이전트를 통해 확보한 데이터 처리 능력을 바탕으로, AI 모델의 정보 정확도를 높이는 역할을 맡았다. 특히 한국어 환경에 특화된 정보 처리 능력과 실제 서비스에서 검증된 기술력을 토대로 실사용 품질을 고도화할 계획이다. 데이터 전문 기업 '셀렉트스타'는 모델의 '신뢰성' 검증을 주도한다. 자체 플랫폼 '다투모 이밸'을 활용해 한국어 환경에 맞는 평가 체계도 구축한다. 개발 초기 단계부터 오류와 편향을 탐지해 안정적인 AI 모델의 기초도 다진다. 국내 대표 게임사 '크래프톤'은 멀티모달 기술과 대규모 서비스 운영 경험을 바탕으로 '확장성'을 강화한다. 전 세계 사용자를 대상으로 축적한 데이터와 시뮬레이션 기술을 모델에 적용해 글로벌 경쟁력을 확보한다는 전략이다. 모빌리티 기술 기업 '포티투닷'은 온디바이스 AI 기술을 통해 '범용성'을 확보한다. 차량 내 실시간 데이터 처리와 경량화 모델 최적화 역량을 투입, 하드웨어 제약 없이 다양한 환경에서 구동 가능한 모델 구조를 설계한다. AI 반도체 팹리스 '리벨리온'은 국산 신경망처리장치NPU() 기반의 '효율성' 극대화를 맡는다. 국산 모델과 반도체를 결합한 최적화 작업을 통해 저비용·고효율의 AI 추론 인프라를 구축, 모델의 상용화 가능성을 높일 예정이다. SK텔레콤은 "독자 AI 파운데이션 모델 프로젝트를 중심으로 국내 AI 생태계의 경쟁력을 강화할 것"이라며 "국가대표 AI 3강 진입을 향한 기반을 강화해 한국형 풀스택 AI 모델이 가진 가능성을 확장해 나갈 예정"이라고 밝혔다.

2025.12.14 16:44진성우 기자

팀네이버, 독자 파운데이션 모델로 버티컬 AI 스타트업 키운다

네이버클라우드가 독자 파운데이션 모델 기반의 산업 인고지능(AI) 고도화와 글로벌 시장 진출 지원에 나선다. 네이버클라우드와 네이버 아라비아는 코리아스타트업포럼(코스포)과 독자 AI 파운데이션 모델 기반의 버티컬 AI 스타트업 육성을 지원하고 중동 지역을 중심으로 한 글로벌 협력을 확대하기 위한 업무협약(MOU)을 체결했다고 12일 밝혔다. 이번 협약은 국내 AI 생태계의 선순환 구조를 구축하고 유망 스타트업의 글로벌 경쟁력 확보를 목표로 한다. 특히 네이버클라우드가 국가대표 AI 프로젝트로 진행 중인 독자 AI 파운데이션 모델을 스타트업이 활용해 산업별 AI 서비스를 고도화하고 국내 소버린 AI 생태계를 적극 확대하는 데 3사가 협력할 방침이다. 네이버클라우드와 코스포는 각 사의 기술 역량과 기업 발굴 역량을 연계해 AI 기술을 적용할 수 있는 유망 스타트업을 공동 발굴한다. 이를 통해 산업 현장에서 활용 가능한 버티컬 AI 사례를 만들어 업계 전반의 혁신을 촉진한다는 계획이다. 선발된 스타트업에는 공모전과 멘토링 등 다양한 방식의 지원 프로그램을 운영하고 네이버클라우드의 거대언어모델(LLM) '하이퍼클로바X'와 클라우드 인프라 등 최신 AI 기술과 플랫폼 활용 환경을 제공해 기술 성장을 지원한다. 또 스타트업의 글로벌 진출 기회도 제공한다. 네이버 아라비아와의 협력을 통해 중동 현지 시장 정보뿐 아니라 현지 파트너사와의 네트워크 형성 및 협력 기회를 제공해 실질적인 시장 진출 기반을 마련할 계획이다. 최근 중동 시장은 산업별 디지털 전환과 AI 수요가 빠르게 증가하고 있는 지역으로, 이번 협약을 통해 국내 스타트업이 서비스를 글로벌 무대로 확장하는 교두보를 마련한다는 목표다. 한편 네이버클라우드는 독자 AI 파운데이션 모델 프로젝트의 일환으로 텍스트·이미지·오디오·비디오 등 이종 데이터를 통합적으로 이해하고 생성하는 '옴니 파운데이션 모델'을 개발해 선보일 계획이다. 김유원 네이버클라우드 대표는 "이번 협력은 국내 기술로 개발된 독자 파운데이션 모델이 스타트업을 통해 산업 전반에 확산되고 소버린 AI 생태계를 한 단계 확장하는 데 중요한 역할을 할 것"이라며 "유망 스타트업이 중동을 비롯한 글로벌 시장에서 성장할 수 있도록 아낌없이 지원할 것"이라고 말했다.

2025.12.12 15:49한정호 기자

오픈AI, 한 달 만에 GPT-5.2 공개…구글 제미나이에 반격 나섰다

구글 제미나이의 거센 추격 속에서 오픈AI가 한 달 만에 프런티어 모델 'GPT-5.2'를 내놓으며 정면 돌파에 나섰다. 챗GPT 트래픽 감소와 내부 '코드 레드' 비상 체제까지 겹친 상황에서 강화된 성능의 신모델이 경쟁 구도를 다시 뒤흔들 것이라는 평가가 나온다. 오픈AI는 11일(현지시간) GPT-5.2 시리즈를 출시한다고 발표했다. 새 모델은 즉답·사고·프로 등 세 가지 모드로 구성되며 전문 지식 업무와 장시간 에이전트 실행에 최적화된 것이 특징이다. GPT-5.2는 챗GPT 유료 구독자에게 순차 제공되며 개발자들은 API를 통해 즉시 이용할 수 있다. GPT-5.1은 앞으로 3개월 뒤 지원이 종료된다. 이번 공개는 단순한 기능 업그레이드를 넘어 최근 제미나이 3의 급성장으로 흔들린 인공지능(AI) 시장 판도에 오픈AI가 다시 우위를 확보하려는 전략으로 풀이된다. 시장조사업체 시밀러웹에 따르면 챗GPT 트래픽 점유율은 1년 전 87%에서 최근 71.3%까지 떨어진 반면, 구글 제미나이는 같은 기간 5.7%에서 15.1%로 뛰어올랐다. 내부적으로도 샘 알트먼 오픈AI 최고경영자(CEO)는 직원들에게 코드 레드를 선언하며 챗GPT 모델 품질 개선을 최우선 과제로 지시한 바 있다. 이번에 공개된 GPT-5.2는 추론·코딩·수학·장문 분석·비전·도구 활용 등 전 영역에서 성능이 향상됐다. 오픈AI 자체 평가에서 사고 모드는 70.9%, 프로 모드는 74.1%를 기록해 인간 전문가와 대등하거나 능가하는 수준으로 평가됐다. 이전 버전 GPT-5의 38.8%와 비교하면 압도적인 성장이다. SWE 벤치마크에서도 80%를 기록하며 구글 제미나이 3 프로(76.2%)를 넘어섰고 앤트로픽 클로드 오퍼스4.5(80.9%)와도 1% 미만 차이에 불과한 것으로 나타났다. 또 사고 모드의 환각 오류율은 6.2%로 전작 대비 약 30% 감소했으며 긴 문서 맥락 이해와 이미지·그래프 분석 능력, 다단계 업무 처리 능력도 상향됐다. 복잡한 논리·수학 문제 해결 과정에 있어서도 이전보다 38% 적은 오류를 냈고 추론·코딩·과학 벤치마크에서도 최고치를 기록했다. 개발자들을 위한 API 측면에서는 추론 강도를 선택할 수 있는 다섯 단계의 옵션을 제공해 복잡한 프로젝트 수행 능력을 강화했다. 오픈AI 피지 시모 최고제품책임자(CPO)는 "GPT-5.2는 스프레드시트 제작, 프레젠테이션 구성, 코드 작성, 이미지 이해, 장문 맥락 추론, 도구 활용 등 실제 업무에서 큰 경제적 가치를 제공하도록 설계됐다"고 설명했다. 이번 공개는 오픈AI가 빠른 속도로 AI 모델을 출시하는 전환점으로 평가된다. GPT-5.1 발표 후 불과 한 달 만의 출시로, 이는 챗GPT 서비스를 시작한 2022년 이후 가장 짧은 주기다. 월스트리트저널과 여러 외신은 오픈AI가 내부 비상 상황 속에서 제미나이 3 프로의 벤치마크 공세를 의식해 GPT-5.2 출시 일정을 당긴 것으로 분석했다. 이번 GPT-5.2 공개로 오픈AI·구글·앤트로픽 간 경쟁이 한층 격렬해질 전망이다. 한편 오픈AI 내부에서는 고도화된 추론 모델 중심 전략이 높은 연산 비용 부담으로 이어질 수 있다는 우려도 제기되고 있다. 업계에서는 오픈AI의 추론 비용 상당 부분이 클라우드 이용료가 아닌 현금으로 지불되고 있다는 관측도 나온다. 오픈AI는 "더 효율적인 모델 구조와 강화된 성능을 통해 동일 비용 대비 더 높은 지능을 제공하는 방향으로 나아가고 있다"며 "앞으로도 안전성과 신뢰성을 강화하고 사용자가 기대하는 품질을 꾸준히 발전시켜 나가겠다"고 밝혔다.

2025.12.12 10:08한정호 기자

과기정통부 "AI 3대 강국, 정부·민간 협력 생태계 구축해 달성한다"

"인공지능(AI)을 국가 성장의 핵심축으로 삼고 민간과 함께 생태계를 구축하겠습니다." 과학기술정보통신부 장기철 인공지능데이터진흥과장은 11일 서울 중구 신라호텔에서 열린 'AI & 클라우드 컨퍼런스 2025(ACC 2025)'에서 국가 AI 경쟁력 강화와 디지털 인프라 전환에 대해 이같이 밝혔다. 지디넷코리아가 주최한 ACC 2025는 AI와 클라우드 분야의 실질적 비즈니스 성과 창출 방안을 모색하는 대표 기술 컨퍼런스다. 올해 행사에는 과기정통부 비롯해 구글 클라우드·삼성SDS·뉴타닉스 코리아·아카마이·알리바바 클라우드·나무기술 등 글로벌 및 국내 주요 기업들이 대거 참여해 성황을 이뤘다. 이날 장 과장은 글로벌 'AI 3대 강국(AI G3)' 도약을 목표로 하는 정부의 AI 정책 확대 로드맵을 공유했다. 그는 "현재 우리나라 AI의 수준은 미국·중국을 뒤따르는 3위권 그룹으로, 앞으로는 압도적인 3강을 굳히는 것이 목표"라고 말했다. 특히 글로벌 AI 모델 평가 지표에서 LG AI연구원의 '엑사원', 업스테이지 '솔라' 모델이 상위권에 오른 점을 언급하며 "우리도 톱티어 모델을 만들 역량이 있다"고 덧붙였다. 정부는 AI G3 도약을 위해 내년 대규모 예산을 투입한다. 정부 AI 예산 10조원, 국민성장펀드를 통한 AI 투자 30조원 등을 통해 GPU·데이터·반도체·모델·인재까지 이어지는 AI 풀스택 역량을 모두 강화한다는 방침이다. 특히 2030년까지 엔비디아 26만 장 그래픽처리장치(GPU)를 확보하는 계획을 바탕으로 한국형 'AI 고속도로' 구축에 속도를 낼 전망이다. 장 과장은 AI 인재 문제도 시급한 과제로 꼽았다. 국내에서 충분한 GPU를 써볼 기회가 없어 연구자들이 해외로 빠져나가는 현실을 타개하고자 정부는 ▲해외 AI 인재 특별비자 도입 ▲AI대학원·AX 융합대학원 확대 ▲AI 스타펠로우십 지원 등 제도 개선을 추진하고 있다. 또 '독자 AI 파운데이션 모델 프로젝트'에도 속도를 낸다. 장 과장은 "프롬 스크래치 기술을 갖춘 우수 국내 AI 기업들과 함께 글로벌 톱 모델 확보에 도전한다"며 "공공·민간의 데이터와 GPU, 인재 등 기술과 정부 지원 역량을 결합해 글로벌 모델 10위권에 진입할 것"이라고 밝혔다. AI 기반 국가 대전환 전략도 소개됐다. 제조·지역·공공·과학 분야로 구분된 AX 전략을 통해 AI 로봇·AI 공장·AI 복지·AI 납세 관리 등 전 산업·행정 분야의 디지털 혁신을 동시 추진한다는 구상이다. 장 과장은 "대통령 직속 국가AI전략위원회를 중심으로 범부처 협업을 강화해 AI 정부로 전환되고 있다"고 강조했다. 아울러 지난 9월 국가정보자원관리원 화재 사고 이후 국가가 운영하는 디지털 인프라의 안정성 확보 대책도 언급됐다. 그는 "국가에서 관리하는 데이터센터들이 민간 클라우드를 더 많이 활용할 수 있도록 방안을 마련 중"이라며 "국가AI전략위원회에서 별도 대책을 준비하고 있어 이른 시일 내 발표될 것"이라고 말했다. 장 과장은 AI G3 도약을 위한 향후 정부의 역할도 공유했다. 예산 측면에서는 마중물 역할을, 산업 측면에서는 규제 완화와 공공 조달을 통한 초기 시장 조성을 핵심 방향으로 제시했다. 그는 "정부가 AI에 있어 모든 것을 다 할 수 있다고 생각하지 않는다"며 "민간이 AI 비즈니스를 잘할 수 있도록 적절한 제도와 환경을 만드는 데 집중하겠다"고 말했다.

2025.12.11 17:34한정호 기자

바이트플러스 "AI, 이제 '사람' 아닌 'AI'가 통제"

바이트플러스가 이제는 사람이 인공지능(AI)을 컨트롤하는 시대가 아닌 'AI가 AI를 컨트롤 하는 시대'가 될 것이란 전망을 내놨다. 이미나 바이트플러스 솔루션즈 아키텍트는 11일 서울 중구 신라호텔에서 열린 'ACC 2025'에서 "이것이 바이트플러스가 제안하는 자동화의 미래"라며 "자사 생성형 AI 솔루션은 단순히 콘텐츠를 만드는 것이 아니라 스스로 검증하고 분석하고 지휘한다"고 강조했다.'ACC 2025'는 지디넷코리아가 주관, 주최하고 과학기술정보통신부, 바이트플러스, 네이버 등이 후원하는 행사다. 먼저 이 솔루션즈 아키텍트는 생성형 AI를 활용한 콘텐츠 제작이 여전히 어려운 이유로 프롬프트 작성의 어려움, 수동 반복 생성, 파편화된 워크 플로우, 일관성의 부재, 부족한 제어 가능성, 수동 후반 작업을 꼽았다. 그는 이같은 문제를 해결하기 위한 방법으로 자사 크리에이티브 에이전트를 제시했다. 바이트플러스의 크리에이티브 에이전트는 AI 에이전트가 초거대 언어모델(LLM) 뿐만 아니라 이미지 생성 모델, 영상 생성 모델, 디지털 휴먼, 3D 모델에 이르기까지 수많은 생성형 AI 솔루션을 통합 지휘하는 것이 특징이다. 이 솔루션즈 아키텍트는 "크리에이티브 에이전트는 생성형 AI 솔루션 뿐만 아니라 기타 솔루션까지 모두 통합 지휘해 고품질 콘텐츠를 순식간에 만들어 주는 멀티모달 자동화 파이프라인"이라고 설명했다. 크리에이티브 에이전트를 구현하는 데는 바이트플러스의 이미지 생성 모델 '씨드림(seedream)' 4.5, 영상 생성 모델 '씨댄스(seedance)' 1.0, 디지털 휴먼 모델 '옴니휴먼(omnihuman) 1.0'이 필요하다. 그는 바이트플러스의 크리에이티브 에이전트의 장점으로 낮은 비용과 빠른 제작속도, 일관성 등을 들었다. 이 솔루션즈 아키텍트는 "비용은 극적으로 낮아지고 또 제작 속도는 혁신적으로 올라간다"며 "이 모든 콘텐츠는 압도적인 일관성을 가지게 되고 누구나 고품질 콘텐츠를 만들 수 있어 (콘텐츠) 제작 장벽 자체가 사라진다"고 말했다. 또 이 솔루션즈 아키텍트는 "더 이상 사람이 AI 컨트롤 하는 시대가 아니다"며 "AI가 AI를 컨트롤함으로써 복잡한 작업 과정을 완벽하게 자동화시킨다"고 마무리했다.

2025.12.11 14:48박서린 기자

수퍼톤, 새 TTS모델 '소나 스피치2' 출시..."웃음소리 완벽 구현"

AI 음성 기업 수퍼톤은 새로운 TTS 모델인 '소나 스피치2'를 출시했다고 9일 밝혔다. 이 모델의 이전 버전인 '소나 스피치1'은 지난 2월 정식 출시된 AI 음성 서비스 '수퍼톤 플레이'를 비롯해 수퍼톤 API 등 다양한 TTS 서비스에 적용돼 왔다. 실제 사람의 발화 스타일과 감정 정보까지 학습해 자연스러운 음성을 구현해 호평을 받고 있는 수퍼톤 TTS 기술의 핵심이다. 출시와 동시에 '수퍼톤 플레이'에 탑재된 소나 스피치2는 텍스트를 자연스럽게 읽는 수준을 뛰어넘어 문맥을 이해해 발화 속도, 호흡, 억양을 재현하고, 웃음 소리나 목을 가다듬는 소리 같은 비언어적인 표현까지 생생하게 구현한다. 소나 스피치1이 맑고 안정적인 음성에 자연스러운 표현력을 더한 것이 특징이라면, 소나 스피치2는 캐릭터성이 살아있는 음성을 만들어주기 때문에 오디오북처럼 실제 사람이 연기하는 것 같이 몰입도가 중요한 콘텐츠를 제작할 때 유용하다. 지원하는 언어 역시 국내 TTS 솔루션 가운데 최대다. 이전 버전에서 제공하던 한국어·영어·일본어는 물론, 프랑스어·독일어·스페인어·중국어(간체·번체)·베트남어·인도네시아어·태국어·러시아어·아랍어 등까지 더해져 총 23개 언어를 지원하며, 향후 30개로 확대할 계획이다. 23개의 언어에 대해 '보이스 클로닝' 기능도 제공해 사용자들은 단 한 번의 녹음만으로 자신의 목소리 톤은 유지한 채 언어 장벽 없이 텍스트를 음성으로 변환할 수 있다. 지난달 오픈소스로 공개한 바 있는 온디바이스 기반 TTS 모델 '수퍼토닉'도 '수퍼톤 플레이'에 탑재됐다. 수퍼토닉은 사용자 기기 자체에서 AI 연산 처리가 되는 온디바이스 모델로, GPU나 클라우드, 네트워크 연결 없이 실시간 수준으로 텍스트를 음성으로 바꿔준다. 클라우드로 데이터를 전송하지 않기 때문에 보안이 필수적인 금융, 의료, 보안 산업 분야에서 활용도가 높다. 특히 이번 '수퍼토닉' 모델에서는 오픈소스 공개 버전에서는 없었던 보이스 클로닝 기능을 제공하는가 하면, 한국어·영어·일본어·스페인어·포르투갈어 등 5개의 언어를 지원해 사용자의 편의성을 높였다. 이번에 다양한 TTS 모델이 대거 추가되면서 사용자들의 선택지도 많아졌다. 수퍼톤 플레이를 이용할 때 사용자들은 콘텐츠의 목적과 제작 환경에 따라 기존의 소나 스피치1을 비롯해, 새롭게 추가된 소나 스피치2, 수퍼토닉 중 최적의 모델을 선택해 활용할 수 있다. 예컨대, 챗GPT를 이용할 때 원하는 AI 모델을 선택할 수 있는 것처럼 감정 표현이나 자연스러운 연기가 필요하거나 보다 다양한 언어로 된 콘텐츠를 제작할 때는 소나 스피치2를, GPU나 클라우드, 네트워크 연결이 어렵거나 보안이 요구되는 환경에서는 수퍼토닉을 선택하면 된다. 이 밖에, 소나 스피치2와 수퍼토닉은 API(application Programming Interface)로도 서비스된다. API는 개발자들이 다른 서비스에서 제공하는 데이터나 기능을 가져와 자사 서비스에 내재화할 수 있는 일종의 디지털 연결고리다. 다양한 TTS 모델이 API로 제공됨에 따라 개발자들은 구현하고자 하는 서비스의 특징이나 개발 환경에 따라 모델을 선택해서 개발에 활용할 수 있다. 수퍼톤은 사용자의 PC에 다운로드해서 이용할 수 있는 '수퍼톤 플레이 데스크톱'을 지난달 19일 베타 출시하기도 했다. 이는 클라우드가 없는 일반 PC 환경에서도 빠르고 편리하게 텍스트를 다양한 캐릭터의 음성으로 바꿔주는 윈도우(Windows) 및 맥(Mac)용 소프트웨어다. 수퍼톤은 이달 22일부터 수퍼톤 플레이 데스크톱 사용자 중 프로(Pro) 요금제를 이용할 경우, 무제한으로 음성을 생성할 수 있는 혜택을 제공할 예정이다. 수퍼톤 관계자는 “소나 스피치2는 언어의 장벽을 넘어 누구나 글로벌 시장에서 활동할 수 있는 창작 환경을, 수퍼토닉은 장소와 장비 제약 없는 완전한 실시간 제작 환경을 제공한다”며 “앞으로도 AI 음성 기술을 지속해서 선보여 서비스 품질을 높이고, 창작자들이 원하는 방식으로 기술을 활용하고 창작할 수 있는 생태계를 만들어가겠다”고 밝혔다.

2025.12.09 10:08안희정 기자

"AI 모델 고민 해결"…인포뱅크, 협업 플랫폼 '인세븐' 자동 라우팅 고도화

인포뱅크가 기업들이 인공지능(AI) 협업 플랫폼에서 업무 목표에 적합한 모델을 부담 없이 활용할 수 있는 기반을 마련했다. 인포뱅크는 자사 플랫폼 '인세븐(IN7)'에 업무 목적에 따라 다양한 AI 모델을 자동으로 선택·실행하는 'AI 모델 자동 라우팅' 기능을 고도화했다고 4일 밝혔다. 현재 많은 기업이 다양한 AI 모델을 업무 성격에 맞춰 병행 사용하지만 모델별 가격과 성능 차이로 최적 선택이 어렵고 다중 구독이나 좌석 단위 구매로 비용 부담이 증가하는 문제를 겪고 있다. 이러한 운영 구조는 AI 전환(AX)을 가로막는 주요 장애 요인으로 지적돼왔다. 인세븐은 업무 유형을 기반으로 최적 모델을 자동 분기하는 AI 모델 자동 라우팅 기술을 적용해 선택 부담과 비용 문제를 동시에 해결한다. 해당 기술은 업무 성격을 분석해 오픈AI·앤트로픽·구글·xAI에서 제공하는 AI 모델 20여 종 중 가장 효율적인 모델을 자동 선택한다. GPT-5.1, 제미나이 3 프로와 같은 고성능 모델부터 GPT-5 미니, 제미나이-2.5-플래시 계열의 경량 모델까지 상황에 맞춰 분기하며 고비용 모델은 꼭 필요한 순간에만 활용된다. 이를 통해 AI 비용은 30~60% 절감되고 처리 속도는 3~7배 향상돼 기업은 복잡한 모델 비교 없이 자동으로 최적화된 환경을 활용할 수 있다는 게 인포뱅크 측 설명이다. 또 자동 라우팅 기반 위에 고급 분석 기능 '딥리서치'를 적용해 보고서 수준의 심층 분석 결과물을 자동 생성한다. 딥리서치는 GPT-5, 클로드, 제미나이 등 복수 대형 모델을 조합해 웹·문서·데이터 기반 조사를 수행하고 정보를 비교·정리·구조화해 최종 분석 결과를 도출한다. 사용자는 한 번의 질문으로 조사부터 요약까지 전체 과정을 일괄 처리할 수 있으며 시장·경쟁사·기술 분석 시간은 평균 57% 단축된다. 인세븐의 자동 라우팅과 딥리서치 기술은 목적 기반 모델 매칭, 비용 조건 분기, 성능 및 비용우선 모드 지원 등의 기능을 통해 AI 도입 장벽이 높은 중소·중견 기업에도 합리적인 비용으로 AX를 경험할 수 있도록 설계됐다. 특히 문서 기반 검색증강생성(RAG)과 멀티 모델 조합 기술을 적용해 전문성과 결과 품질을 높인 점도 차별화 요소다. 인포뱅크는 최신 글로벌 AI 모델을 빠르게 도입하고 국내 최저 수준의 비용 체계를 구축해 기업의 AI 활용 환경을 지속 강화할 방침이다. 제조·금융·유통·헬스케어 등 산업별 요구에 맞춘 딥리서치 템플릿도 고도화해 산업 맞춤형 AI 분석 생태계를 확대해 나갈 계획이다. 인포뱅크 강진범 최고기술책임자(CTO)는 "앞으로 기업은 어떤 모델을 선택할지, 비용을 관리할지 고민할 필요가 없을 것"이라며 "인세븐은 성능과 비용 효율을 자동 최적화하는 AI 플랫폼으로 자리매김할 것"이라고 강조했다.

2025.12.04 16:46한정호 기자

오픈AI, 스타트업 '넵튠' 인수…AI 모델 훈련 강화

챗GPT 개발사 오픈AI가 인공지능(AI) 모델 교육 과정을 향상시키기 위해 스타트업 넵튠을 인수한다. 3일(현지시간) 블룸버그 등 외신에 따르면 이번 거래는 주식 형태로 이뤄지지만, 구체적인 조건은 공개되지 않았다. 넵튠은 다른 고객들이 AI 모델을 개발할 때 훈련 실행 상황을 분석하고 문제를 발견하는데 도움을 주는 소프트웨어를 만든다. 오픈AI는 지난 1년간 넵튠의 도구를 이용해 여러 실험을 수행하고 다양한 모델 버전을 비교해왔다. 폴란드에 본사를 두고 있는 넵튠은 약 60명의 직원을 보유하고 있다. 오픈AI가 넵튠을 인수하기로 했지만, 이들 모두의 고용이 승계되는 것은 아니다. 오픈AI는 앞으로 넵튠의 도구를 자사 내부용으로만 유지하고 삼성전자, HP 등 다른 고객사들에 대한 서비스는 종료할 계획이다. 야쿠프 파초츠키 오픈AI 최고과학책임자(CSO)는 “(넵튠이) 연구자들이 복잡한 훈련 워크플로를 분석할 수 있도록 해주는 빠르고 정말한 시스템을 구축했다”며 “(넵튠의 도구가) 자사 모델이 어떻게 학습하는지에 대한 가시성을 확장하는데 도움이 될 것”이라고 전망했다.

2025.12.04 09:54박서린 기자

트웰브랩스, 차세대 영상 이해 모델 '마렝고 3.0' 공개…"업계 최고 수준"

트웰브랩스가 영상 속 장면의 텍스트·음성·움직임·상황 맥락을 통합적으로 이해하는 인공지능(AI)을 선보인다. 트웰브랩스는 차세대 영상 AI 파운데이션 모델 '마렝고 3.0'을 공식 출시했다고 2일 밝혔다. 마렝고 3.0은 영상 속 대사와 몇 분 후에 등장하는 동작을 연결해 해석하고 사물·행동·감정·상황 변화를 시간의 흐름에 따라 추적하는 등 인간에 가까운 수준의 영상 이해 능력을 구현한다. 특히 이미지와 텍스트를 동시에 검색할 수 있는 '복합 이미지 검색' 기능과 사람이나 제품을 별도로 등록해 찾아볼 수 있는 '고유명사 검색' 기능도 도입됐다. 이번 모델은 36개 언어를 지원해 글로벌 기업 환경에서도 안정적으로 활용할 수 있다. 또 스토리지 비용 50% 절감, 인덱싱 속도 2배 향상 등의 효율성 개선도 확인했다는 게 트웰브랩스 측 설명이다. 마렝고 3.0은 기존 프레임 기반 분석이나 이미지·오디오 모델의 단순 조합 방식에서 벗어나 영상 이해를 위해 처음부터 설계된 네이티브 파운데이션 구조를 갖췄다. 영상 전체를 시간·공간적으로 해석하는 방식이다. 장면 간의 연속성과 맥락을 자연스럽게 파악하며 스포츠·미디어·엔터테인먼트·광고 등 고난도 콘텐츠에 대한 이해 능력이 대폭 강화된 것이다. 공공·보안 등의 영상 분석 환경에서도 높은 정확도를 보인다. 마렝고 3.0은 다양한 산업 현장에서 즉시 활용 가능하다. 프로 스포츠 리그에서는 특정 선수의 득점 장면이나 결정적 플레이만을 즉시 검색해서 찾아내 하이라이트를 빠르게 제작할 수 있으며 경기 분석 효율 향상을 지원한다. 방송·포스트 프로덕션 분야에서는 수십 년치 아카이브에서 특정 유명인의 얼굴을 '고유명사'로 등록해 원하는 행동을 하는 장면을 몇 초 만에 찾아낼 수 있다. 공공보안 쪽에서는 CCTV 영상 전체를 몇시간씩 볼 필요 없이 빠르게 원하는 장면만을 정확하게 찾아낼 수 있다. 이커머스 분야에서도 브랜드, 제품 혹은 호스트가 언제 등장하고 어떤 행동을 하고 있는지 원하는대로 즉시 검색해 볼 수 있다. 이재성 트웰브랩스 대표는 "전 세계 디지털 데이터의 90%가 영상인데 사람이 직접 분석하기에 너무 오래 걸리고 기존 기술로는 모든 것을 파악하기가 어려워 그동안 대부분 제대로 활용되지 못했다"며 "이 문제를 해결하는 것이 우리의 목표"라고 말했다. 이어 "마렝고 3.0은 그동안 영상 이해 기술이 가졌던 한계를 완전히 뛰어넘는 모델로, 기업과 개발자에게 기존과 다른 혁신적인 기준을 제시할 것"이라고 덧붙였다. AWS 니샨트 메타 AI 인프라 부문 부사장은 "트웰브랩스의 영상 이해 기술은 그동안 수작업 중심이었던 영상 분석 프로세스에 전례 없는 속도와 효율성을 제공하며 산업 전반의 혁신을 이끌고 있다"며 "마렝고와 페가수스 모델이 아마존 베드록에서 큰 성과를 거둔 데 이어, 마렝고 3.0은 세계 최고 수준의 영상 이해 능력을 필요로 하는 고객들에게 최적의 솔루션이 될 것으로 기대한다"고 강조했다.

2025.12.02 17:51한정호 기자

포지큐브, '고성능컴퓨팅 지원사업' 선정…국산 문서파싱 VLM 개발 가속

포지큐브가 그래픽처리장치(GPU) 자원 확보를 통해 국산 문서파싱 비전언어모델(VLM) 개발을 가속한다. 포지큐브는 정보통신산업진흥원(NIPA)의 '2025년 고성능컴퓨팅 지원사업'에 선정됐다고 27일 밝혔다. 포지큐브는 이번 사업을 통해 한글 기반 문서 분석과 마크다운 자동 생성을 수행하는 경량 비전언어모델(SVLM) 개발을 완료할 계획이다. 고성능컴퓨팅 지원사업은 과학기술정보통신부와 NIPA가 민간 클라우드 사업자를 통해 GPU 기반 인공지능(AI) 컴퓨팅 인프라를 확보하고 국내 AI 연구·개발 기업과 기관에 대규모 GPU 자원을 제공하는 프로그램이다. 고성능 연산 환경을 지원해 AI 기술 개발 경쟁력을 강화하는 것이 목적이다. 포지큐브는 이번 사업을 통해 7B 모델로 큐웬 2.5VL-32B급의 문서 분석·마크다운 생성 성능을 확보하는 것을 목표로 한다. 이를 통해 PDF·PPT·워드·스캔 이미지 등 다양한 문서를 정밀하게 이해하고 7B 모델 특유의 낮은 연산 비용을 기반으로 실시간 응답형 API 서비스로 활용할 수 있도록 할 예정이다. 특히 해외 모델이 처리하지 못하는 국내 공공·금융기관 고유 문서 서식의 한계를 보완할 수 있다는 점이 차별점이다. 포지큐브는 개발된 VLM을 자사 솔루션 '로비 G'에 적용해 온프레미스 기반 문서 자동화, 거대언어모델(LLM) API 비용 절감, 응답 속도 개선 등 효과를 기대하고 있다. 더불어 문서 변환 엔진인 로비 G 데이터렉스에 탑재되는 핵심 모델을 독립 제품으로 판매하는 투트랙 전략도 추진한다. 또 7B 모델을 바탕으로 금융 도메인 특화 70B급 대형 모델 개발·상용화를 추진해 기업의 AI 전환(AX)을 지원할 계획이다. 포지큐브는 "국내 문서 자동화 시장은 공공·금융기관을 중심으로 급속하게 성장 중이며 국산 SVLM은 필수 기술"이라며 "이번 연구를 통해 한국형 문서 AI 생태계를 선도하겠다"고 밝혔다.

2025.11.27 18:39한정호 기자

노타, 삼성 '엑시노스'에 AI 최적화 기술 공급…"온디바이스 기술력·시장성 입증"

노타가 삼성전자의 최신 애플리케이션 프로세서(AP)에 인공지능(AI) 최적화 기술을 탑재해 온디바이스 생성형 AI 대중화에 박차를 가한다. 노타는 자사 AI 모델 최적화 기술을 삼성전자의 '엑시노스 2500'에 공급하는 계약을 체결했다고 26일 밝혔다. 이번 계약을 통해 노타는 삼성전자의 AI 모델 최적화 툴체인 '엑시노스 AI 스튜디오'에 핵심 기술을 제공하며 엑시노스 2500 AP에서 고도화된 생성형 AI 경험이 구현될 수 있도록 기술적 기반을 마련했다. 엑시노스 AI 스튜디오는 고객이 개발한 AI 모델을 엑시노스 프로세서에 최적화해 효율적으로 구동할 수 있도록 지원하는 툴체인이다. 여기에 노타의 기술이 접목되면서 모델 최적화 효율과 성능이 향상되는 것은 물론 클라우드 연결 없이도 스마트폰에서 한층 강화된 온디바이스 AI 경험이 가능해졌다. 삼성전자 모바일 AP S/W 개발팀 조철민 상무는 "엑시노스 AI 스튜디오에 노타의 AI 모델 최적화 기술이 적용되면서 온디바이스 AI 모델 개발 효율성이 전작 대비 향상됐다"며 "양사 간 기술 협업으로 좋은 성과를 낼 수 있어 기쁘다"고 밝혔다. 노타는 이번 삼성전자와의 협업으로 기술력에 더해 시장성과 사업성을 입증했다고 강조했다. 노타는 최근 코스닥 시장에 공식 상장했으며 확보한 자금을 북미·유럽·중동 등 주요 글로벌 시장에서의 사업 확장에 투입할 계획이다. 이를 통해 온디바이스 생성형 AI의 상용화를 선도하고 글로벌 AI 기술 리더로서의 입지를 공고히 한다는 방침이다. 채명수 노타 대표는 "삼성전자와의 협업은 우리의 AI 최적화 기술이 글로벌 소비자용 제품에 적용돼 상용화된 의미 있는 사례"라며 "AI 반도체와 소프트웨어의 유기적 결합을 통해 온디바이스에서 고성능 생성형 AI를 구현했다"고 말했다. 이어 "앞으로도 삼성전자 및 글로벌 파트너들과 함께 온디바이스 AI 생태계 확장을 주도해 나가겠다"고 덧붙였다.

2025.11.26 16:23한정호 기자

와이즈넛-리스크제로, AI 에이전트로 산업현장 안전 재설계

와이즈넛(대표 강용성)과 리스크제로가산업현장 안전관리 패러다임 전환에 속도를 내고 있다. 와이즈넛은 리스크제로와 산업안전 혁신을 위한 특화 에이전트 및 서비스 개발 업무협약(MOU)을 체결했다고 26일 밝혔다. 양사는 이번 협력을 통해 산업현장의 안전역량을 강화하고, 신속한 의사결정을 지원하는 AI 기반 안전관리 체계 구축에 나선다. 이번 협약은 와이즈넛의 도메인 특화 LLM과 검색증강생성(RAG) 기술에 리스크제로의 건설공사·도급사업 등 산업안전 분야 스마트 안전관리 통합 서비스를 결합하는 것이 핵심이다. 현장에 산재한 지식과 데이터를 AI가 실시간으로 분석해 위험요소를 미리 감지하고 담당자에게 최적의 대응 방안을 제시하는 구조를 구현하겠다는 구상이다. 양사는 우선 실제 현장을 대상으로 한 실증 프로젝트를 통해 성공모델을 확보한 뒤, 이를 건설·제조·플랜트 등 산업안전 전반으로 확산할 계획이다. 특히 건설공사 도급사업 관련 법령과 지침을 반영한 특화 LLM을 개발·적용해 안전점검, 서류 작성, 위험성 평가 등 안전관리 전 과정을 데이터 중심·AI 중심 프로세스로 전환하는 데 중점을 둘 예정이다. 와이즈넛은 AI 에이전트 대표 상장사로 공공·금융·법률·제조 등 다양한 산업에서 특화 AI 에이전트 구축 성공 사례를 50건 이상 확보한 기업이다. 이번 협력을 계기로 도메인 특화 에이전트 LLM '와이즈 로아(WISE LLOA)'와 GS인증을 획득한 RAG 솔루션 '와이즈 아이랙(WISE iRAG)'등 AI 에이전트 풀스택 소프트웨어를 산업안전 분야에 본격 적용해 산업별 AI전환(AX)을 더욱 가속화한다는 방침이다. 리스크제로는 스마트 안전통합 서비스 전문기업으로 국내 최고 수준의 안전전문가 컨설팅 역량과 중대재해처벌법 대응 안전관리 구독형 서비스, 스마트 안전관리 플랫폼을 보유하고 있다. 한국남동발전, 국토안전관리원, 국가철도공단, 경기주택도시공사 등 주요 공공기관의 스마트 안전관리 플랫폼 구축 경험과 현장 노하우를 기반으로 산업 현장 맞춤형 안전관리 체계를 제시해 왔다. 최영호 리스크제로 대표는 "AI 기술은 산업 현장 안전관리에 있어 안전 수준을 혁신적으로 끌어올릴 핵심 수단이 될 것"이라며 "이번 협력을 통해 리스크제로가 축적해 온 산업안전 전문성과 와이즈넛의 LLM 기술을 결합해 한 단계 진화한 스마트 안전관리 서비스를 선보이겠다"고 말했다. 강용성 와이즈넛 대표는 "산업현장의 안전을 지키는 핵심 인프라로서 AI 기술 활용은 이제 본격적인 태동기를 맞이하고 있다"며 "와이즈넛은 이번 협력을 통해 스마트 안전관리의 새로운 표준을 제시하고 실제 현장에서 안전성과 효율성을 동시에 높이는 실질적 가치를 만들어가겠다"고 밝혔다.

2025.11.26 15:44남혁우 기자

뇌분야 AI파운데이션 모델 첫 개발…"당장 실용화 가능"

딥러닝 기반 뇌신호 분석에서 한계로 꼽혀 온 '레이블 데이터 부족' 문제를 국내 연구진이 새로운 AI 파운데이션 모델로 해결했다. 기술성숙도(TRL)로는 실용화 수준인 5단계 정도로, 상용화 바로 전단계라는 것이 연구진 설명이다. DGIST는 지능형로봇연구부 안진웅 박사 연구팀이 뇌신호를 스스로 학습하도록 설계, 극도로 적은 양의 레이블만으로도 기존 대비 높은 정확도(최저8~최고20% 향상)를 구현할 수 있는 AI파운데이션 모델을 개발했다고 26일 밝혔다. 이번 연구는 안진웅 박사(지능형로봇연구부 책임연구원, 융합전공 겸무교수)와 정의진 박사후연수연구원(로봇및기계전자공학연구소, 바이오체화형피지컬AI연구단)이 공동 수행했다. 연구팀은 "EEG(뇌파)와 fNIRS(기능적 뇌혈류) 신호를 모두 이해하고 분석할 수 있는 '뇌파–기능뇌혈류 멀티모달 파운데이션 모델'을 세계 최초로 구현했다"고 말했다. 이들은 총 918명으로부터 약 1천250시간에 걸친 초대형 뇌신호 데이터를 확보해, 레이블 없이 비지도 방식으로 모델을 학습시켰다. 이를 통해 EEG와 fNIRS 각각의 고유한 특징뿐 아니라 두 신호가 공유하는 잠재적인 표현까지 동시에 파악할 수 있도록 설계했다. 기존에는 EEG와 fNIRS를 동시에 측정한 데이터 확보가 거의 불가능해 멀티모달 AI 구축에 큰 제약이 있었지만, 이번 연구에서 개발된 모델은 동시계측 데이터 없이도 학습이 가능하도록 설계했다. 소량의 레이블만으로도 높은 정확도를 구현하며 EEG 단독 분석, fNIRS 단독 분석, 두 신호를 결합한 멀티모달 분석까지 하나의 모델로 모두 수행할 수 있어 기존 기술의 구조적 한계를 완전히 넘어섰다. 안진웅 박사는 “멀티모달 뇌신호 분석이 가진 구조적 제약을 뛰어넘은 최초의 프레임워크"라며 "뇌신호 AI 분야에서 근본적인 혁신을 이뤄냈다”고 설명했다. 안 박사는 또 “특히 두 신호 간 공유 정보를 정렬하는 대조 학습 전략이 모델의 표현력을 대폭 확장했고, 이는 뇌창발인공지능(Brain-Inspired AI)과 뇌–컴퓨터 인터페이스(BCI) 등 미래 뇌공학 기술 발전에 중요한 전환점이 될 것”이라고 말했다. 공동 연구자인 정의진 박사후연수연구원은 "실용화가 바로 가능한 수준이다. 안진웅 박사가 대표로 있는 포피엠엑스를 통해 상용화를 추진 중"이라고 덧붙였다. 이 연구는 과학기술정보통신부와 한국연구재단의 지원을 받아 수행됐더. 연구결과는 계산생물학 및 의료정보학 분야 국제 학술지(Computers in Biology and Medicine)에 게재됐다.

2025.11.26 10:20박희범 기자

[현장] 국산 AI 반도체·클라우드 결합 '시동'…국가 인프라 강화 선언

국산 인공지능(AI) 반도체와 클라우드 산업의 융합이 궤도에 올랐다. 초거대 AI 시대를 맞아 국가 인프라의 근간이 되는 클라우드가 스마트화와 지능형 자원 운영이라는 새로운 전환점을 맞이하면서 국산 기술 중심의 풀스택 생태계 구축이 본격화되고 있다. 오픈K클라우드 커뮤니티는 25일 서울 강남 과학기술회관에서 '오픈K클라우드 데브데이 2025'를 열고 국산 AI 반도체와 클라우드 융합 전략을 공유했다. 오픈K클라우드 커뮤니티에는 한국전자통신연구원(ETRI), 한국전자기술연구원(KETI), 이노그리드, 오케스트로, 경희대학교, 연세대학교, 한국클라우드산업협회(KACI), 퓨리오사AI 등 산·학·연 주요 기관이 공동 참여한다. 이번 행사는 커뮤니티의 첫 공식 기술 교류 행사로, 국산 AI 반도체를 중심으로 한 클라우드·소프트웨어(SW) 전주기 기술을 한자리에서 조망하며 국가 AI 인프라 경쟁력 제고 방안을 논의했다. ETRI 최현화 박사는 "이제 AI 서비스의 경쟁력은 모델을 누가 더 잘 만드느냐보다 누가 더 나은 인프라로 지속적으로 운영하느냐가 핵심"이라고 강조하며 클라우드의 대전환기를 진단했다. 최 박사는 최근 글로벌 거대언어모델(LLM) 발전의 특징을 멀티모달 확장, 컨텍스트 윈도우의 급격한 증가, 툴 연동 기반 정확도 향상으로 정리했다. 특히 메타가 공개한 오픈소스 LLM '라마'의 컨텍스트 윈도우가 1천만 토큰 수준으로 확장된 점을 언급했다. 그는 이러한 추세 속에서 국내 클라우드 산업이 ▲AI 가속기 이질성의 심화 ▲메모리 병목 문제 ▲추론 비용의 급증 ▲에이전트 폭증에 따른 관리 복잡도 증가 등 여러 난제를 동시에 마주하고 있다고 짚었다. 가장 먼저 꼽힌 것은 AI 가속기의 이질성 문제다. 엔비디아 그래픽처리장치(GPU) 중심 생태계가 유지되고 있지만 국내외에서 신경망처리장치(NPU)·AI칩·메모리 내 연산(PIM) 등 다양한 가속기와 인터커넥트 기술이 빠르게 등장하면서 단일 아키텍처에 의존하는 방식은 지속 가능하지 않다는 지적이다. 이어 LLM 추론의 핵심 병목으로 작용하는 '메모리 월'도 문제로 제기됐다. GPU 성능이 가파르게 증가하는 동안 메모리 기술 향상 속도는 더디기 때문이다. 최 박사는 SK하이닉스의 'AiMX', CXL 기반 차세대 메모리 사례를 언급하며 "AI 추론은 본질적으로 메모리 중심 작업이기에 차세대 메모리가 성능의 핵심을 좌우하게 될 것"이라고 말했다. LLM 스케일링 문제 역시 중요한 도전 과제로 다뤄졌다. 사용자 요구는 계속 높아지지만 단일 모델의 크기 확장에는 한계가 있어 여러 전문가 모델을 조합하는 '전문가 혼합(MoE)' 방식이 중요한 돌파구가 될 것이라고 강조했다. AI 모델마다 강점이 다른 만큼 다중 LLM 기반 지능형 추론은 필연적인 흐름이라는 설명이다. 추론 비용 문제도 빠지지 않았다. 최 박사는 "엔비디아 B200 급 GPU의 전력 소비가 1킬로와트(kW)에 이르는데, 이러한 DGX 서버 100대를 하루 운영하면 테슬라 전기차로 지구를 일곱 바퀴 도는 전력량에 해당한다"고 설명했다. 그러면서 "전력·비용 최적화는 하드웨어(HW) 스펙뿐 아니라 스케줄링, 클러스터 재구성이 필수"라고 말했다. 또 LLM·에이전트·데이터소스가 동적으로 연결되는 시대가 되면서 모니터링 복잡성이 기하급수적으로 커지고 있다는 점도 지적했다. 기존에는 레이턴시와 처리량을 중심으로 모니터링했다면 이제는 LLM의 할루시네이션 여부, 에이전트 간 호출 관계, 로직 변경 이력까지 관측해야 안정적 운영이 가능하다는 것이다. 이 같은 문제를 해결하기 위해 ETRI는 과학기술정보통신부가 추진하는 'AI 반도체 클라우드 플랫폼 구축 및 최적화 기술 개발' 과제에 참여했다. 이를 통해 ▲이종 AI 반도체 관리 ▲클라우드 오케스트레이션 ▲자동 디바이스 감지 ▲협상 기반 스케줄링 ▲국산 NPU 특화 관측 기술을 포함한 오픈소스형 '오픈K클라우드 플랫폼'을 개발 중이다. ETRI는 5년간 진행되는 사업에서 2027년 파라미터 규모 640억 LLM, 2029년 3천200억 LLM 지원을 목표로 풀스택 AI 클라우드 생태계를 구축할 계획이다. 오픈K클라우드 커뮤니티에 참여하는 퓨리오사AI, 이노그리드, 오케스트로도 이날 국산 AI 반도체와 클라우드 융합 생태계 활성화를 위한 기술 전략을 발표했다. 퓨리오사AI 이병찬 수석은 엔비디아 의존을 극복하기 위해 전력·운영 효율성을 높인 '레니게이드' 칩과 SW 스택을 소개했다. 이노그리드 김바울 수석은 다양한 반도체가 혼재된 클라우드 구조를 성능·전력·비용 최적화로 통합한 옵저버빌리티의 전략을 공유했다. 오케스트로 박의규 소장은 자연어 요구 기반 코딩과 자동화된 테스트·배포를 지원하는 에이전트형 AI SW 개발환경(IDE) 트렌드와 국내 시장의 변화에 대해 발표했다. 최 박사는 "앞으로 오픈K클라우드 플랫폼을 통해 국산 AI 반도체가 국가 핵심 인프라에 적용될 수 있는 계기를 만들겠다"고 강조했다. 이어 "아직 확정은 아니지만 정부가 추진하는 '국가AI컴퓨팅센터' 사업에 우리 플랫폼을 탑재할 수 있는 계기를 만들 것"이라며 "국산 AI 반도체 실사용자의 요구사항을 반영해 레퍼런스를 쌓아가는 것이 목표"라고 덧붙였다.

2025.11.25 17:10한정호 기자

앤트로픽, 차세대 AI '클로드 오퍼스4.5' 출시…챗GPT·제미나이 제쳤다

앤트로픽이 차세대 인공지능(AI) 모델 '클로드 오퍼스4.5'를 선보이며 코딩·에이전트·사무 작업 자동화 등 다양한 영역에서 경쟁사 대비 우수성을 앞세워 시장 공략에 속도를 낸다. 특히 소프트웨어 엔지니어링(SWE) 벤치마크에서 세계 최고 수준의 성능을 기록하며 기업용 AI 시장 공략을 본격화한다. 앤트로픽은 자사 AI 모델 중 최상위 모델인 '오퍼스'의 최신 버전 클로드 오퍼스4.5를 24일(현지시간) 출시했다. 오퍼스4.5는 복잡한 추론과 고난도 전문 작업 수행에 최적화된 모델로, 기존 오퍼스 대비 코딩 자동화·버그 수정·다단계 작업 수행 능력이 크게 강화됐다. 국제 표준 벤치마크 결과에 따르면 SWE-벤치에서 80.9%의 정확도를 기록해 오픈AI GPT-5.1 코덱스 맥스(77.9%), 구글 제미나이 3 프로(76.2%)를 앞섰다. 또 기존 학습 데이터 없이 AI가 스스로 문제를 해결하는 ARC-AGI-2 평가에서도 37.6%를 기록하면서 경쟁 모델 대비 우수한 성능을 보였다. 앤트로픽은 "오퍼스4.5가 몇 주 전만 해도 우리의 '소넷4.5' 모델이 해결하지 못한 문제까지 풀어낸다"며 "실제 시험 환경에서 인간 지원자보다 높은 점수를 기록했다"고 설명했다. 아울러 내부 테스트에서도 SWE-벤치 다국어 테스트 8개 중 7개 부문에서 1위를 차지한 것으로 나타났다. 새 모델은 사무 자동화 기능도 강화됐다. 재무 분석, 프레젠테이션 작성, 스프레드시트 처리 등 사무용 워크플로우에 특화된 업데이트가 적용됐으며 마이크로소프트(MS) 엑셀 내에서 직접 클로드를 활용할 수 있는 기능도 추가됐다. 이를 통해 기업 고객은 엑셀 기반 데이터 분석과 문서 작업을 자연어로 수행하게 됐다. 개발자 도구도 확장됐다. 장기 실행형 에이전트 기능과 데스크톱·크롬 환경에서의 클로드 활용성 개선, 자동 요약을 통한 긴 대화 맥락 유지 기능 등을 추가했다. AI 연산량을 조절하는 '노력 매개변수'를 적용해 동일 성능 대비 필요한 토큰 수를 50% 가까이 줄인 것도 특징이다. API 가격 역시 대폭 인하됐다. 오퍼스4.5 API 요금은 100만 토큰당 입력 5달러·출력 25달러로 기존 대비 3분의 1 수준으로 낮아졌다. 모델은 클로드 앱, API, 아마존웹서비스(AWS)·애저·구글 클라우드를 통해 즉시 이용할 수 있다. 앤트로픽은 "오퍼스 4.5를 통해 다양한 산업에서 생산성과 문제 해결 능력을 한 단계 더 끌어올릴 수 있을 것"이라고 밝혔다.

2025.11.25 10:37한정호 기자

  Prev 1 2 3 4 5 6 7 8 9 10 Next  

지금 뜨는 기사

이시각 헤드라인

"AI발 '해킹 대재앙' 이미 시작됐다"

이마트24-CU, 성수·명동 찍고 '한강 대전' 맞장

LG전자 "엔비디아와 로봇·AIDC·모빌리티 협력 논의"

[현장] 윤송이 전 엔씨 사장 "AI 시대 진짜 경쟁력은 가장 인간다운 인간"

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.