• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
스테이블코인
인공지능
배터리
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'인공지능 모델'통합검색 결과 입니다. (218건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

노타, 유탑소프트와 온디바이스 AI 튜터 개발 '맞손'…비용 효율화 실현

노타가 인공지능(AI) 에듀테크 기업 유탑소프트와 손잡고 온디바이스 AI 튜터 개발에 나선다. 노타는 지난 18일 유탑소프트와 온디바이스 AI 기반 교육 서비스 사업 협력을 위한 양해각서(MOU) 체결식을 진행했다고 19일 밝혔다. 이번 체결식은 유탑소프트가 보유한 교육 업체 대상 AI 튜터 개발 역량과 노타의 AI 경량화 기술을 결합해 교육 전용 디바이스에 최적화된 생성형 AI 기반 AI 튜터 서비스를 상용화하고자 마련됐다. 양사가 구상 중인 온디바이스 AI 튜터는 외부 서버를 거치지 않고 태블릿 기기 자체에서 AI 튜터가 구동되는 방식을 기본으로 하되, 추론의 결과가 많이 필요한 경우에 한해 외부 서버와 연동하는 하이브리드 방식의 적용이 검토되고 있다. 기존 생성형 AI 기반 서비스의 고질적인 문제로 꼽히는 ▲막대한 서버 운영 비용 ▲네트워크 지연 속도 ▲데이터 보안 문제를 효율적으로 개선한다는 목표다. 향후 협력이 구체화되면 유탑소프트는 우선적으로 영어 스피킹 특화 AI 튜터 모델과 거대언어모델(LLM) 기반 문제은행 특화 AI 튜터 모델의 기획과 개발을 주도할 계획이다. 이에 맞춰 노타는 자사 핵심 기술인 AI 모델 최적화 플랫폼 '넷츠프레소'를 활용해 데이터 기반 파인튜닝 및 해당 AI 튜터 모델을 태블릿 등의 하드웨어(HW) 성능에 맞춰 압축·최적화하는 과정에서 긴밀히 협력해 나갈 방침이다. 이를 통해 구현되는 AI 튜터 솔루션은 학생 사용자수 증가에 따라 기하급수적으로 늘어나는 AI 서비스 운용 비용을 획기적으로 절감할 수 있을 것이라는 게 회사 측 설명이다. 또 인터넷 연결이 원활하지 않은 환경에서도 학생들이 끊김 없이 AI 튜터의 질문·답변 서비스를 이용할 수 있어 학습 효율성을 극대화할 전망이다. 김성범 유탑소프트 대표는 "노타와의 협력은 에듀테크 시장의 화두인 비용 효율화와 개인화 교육을 동시에 실현하는 계기가 될 것"이라며 "교육 업체가 고비용의 LLM 도입으로 발생되는 운영 비용의 부담을 하이브리드 지원 온디바이스 AI 튜터를 통해 합리적이고 안전한 솔루션을 교육 업체에 제공하겠다"고 밝혔다. 채명수 노타 대표는 "교육 업체를 위한 AI 서비스 모델 경량화는 HW 제약이 많은 모바일 교육 환경에서 필수적인 기술"이라며 "유탑소프트의 풍부한 교육 서비스 구축 경험이 우리의 온디바이스 AI 기술과 만나 실제 교육 현장에서 의미 있는 혁신 사례를 만들 수 있도록 적극 지원하겠다"고 말했다.

2025.12.19 15:32한정호

메타, 차세대 영상 AI 모델 '망고' 공개 예고…내년 상반기 출시

메타가 내부적으로 새로운 인공지능(AI) 모델 개발 상황을 공유하며 향후 기술 전략과 조직 개편 방향도 함께 제시한 것으로 전해졌다. 이미지·영상과 텍스트 분야를 각각 겨냥한 차세대 AI 모델을 개발해 시장 경쟁력을 높인다는 목표다. 19일 월스트리트저널(WSJ)에 따르면 메타는 이미지와 영상 생성에 특화된 새로운 AI 모델 '망고'와 차세대 대규모언어모델(LLM) '아보카도'를 개발 중인 것으로 알려졌다. 이들 모델은 최근 진행된 메타 내부 질의응답 자리에서 공개됐으며 내년 상반기 출시가 목표다. 텍스트 기반 모델인 아보카도는 특히 코딩 역량 강화를 핵심 과제로 삼고 있다. 메타는 이와 함께 시각 정보를 바탕으로 주변 환경을 학습하는 이른바 '월드 모델' 개발 가능성도 초기 단계에서 검토 중인 것으로 전해졌다. 이는 단순한 생성 기능을 넘어 현실 세계를 이해하는 범용 AI로의 확장을 염두에 둔 행보로 풀이된다. 메타는 올해 AI 조직을 대대적으로 재편하며 알렉산더 왕 전 스케일 AI 최고경영자(CEO)를 영입해 '메타 슈퍼인텔리전스 랩스'라는 신규 조직을 출범시켰다. 마크 저커버그 CEO는 직접 인재 영입에 나서 오픈AI 출신 연구원 등 20명 이상을 영입했으며 현재 50명 이상의 AI 연구·엔지니어 인력이 새롭게 합류한 상태다. 최근 이미지와 영상 생성 기술은 주요 AI 기업 간 경쟁의 핵심 전장으로 부상하고 있다. 메타는 지난 9월 스타트업 미드저니와 협업해 AI 영상 생성기 '바이브스'를 공개했으며 오픈AI는 이에 맞서 자체 영상 생성 앱 '소라'를 선보였다. 구글 역시 이미지 생성 도구 '나노 바나나'를 앞세워 제미나이 이용자 수를 빠르게 확대했다. 메타 알렉산더 왕 최고AI책임자는 "차세대 텍스트 모델은 코딩 성능을 핵심적으로 강화하는 데 초점을 맞추고 있다"며 "이미지와 영상을 이해하는 새로운 모델을 통해 AI가 환경을 학습하는 방향도 함께 모색 중"이라고 밝혔다.

2025.12.19 12:12한정호

이노룰스 "AI 기술보다 전문성 먼저"...보험 AX 세미나 성료

이노룰스가 단순한 기술 기업이 아닌 보험을 가장 잘 아는 인공지능(AI) 파트너로서의 차별화된 역량을 제시했다. 이노룰스는 지난 17일 보험 업계 관계자 대상으로 'AI 에이전트 시대 보험사 변화 동향 및 미래 발전 방향' 세미나를 개최했다고 18일 밝혔다. 이번 세미나는 총 4개 세션으로 진행됐다. 삼일PWC 손준호 파트너가 AI 에이전트 시대 보험사 변화 동향과 발전 방향을 제시했고 이노룰스 AX 전략본부장 유승영 상무는 '이노룰스가 제안하는 AI 전환(AX) 전략'을 발표하며 보험사들이 AI 초창기에 겪었던 실패 사례들을 분석했다. 유 상무는 "보스턴컨설팅그룹(BCG) 보고서에 따르면 기업의 AI 투자 95%가 실패했고 실질적 성과는 5%에 불과한 것으로 나타났다"며 "AI 기술 자체에 대한 집착과 목적 인식 부족, 업에 대한 경험 없는 추진이 실패 원인"이라고 설명했다. 이어 "적정한 AI 기술 도입, AI 데이터 확보, 프로세스 재설계가 핵심"이라고 강조했다. 이노룰스 최규웅 이사는 '가입설계 업무 혁신을 위한 AI 에이전트 구축 사례'를 공유했다. 최 이사는 AI 가입설계 구축 사례를 통해 설계사가 음성이나 채팅으로 요청하면 고객 정보 확인부터 상품·담보 추천, 인수지침 체크, 보험료 산출까지 원스톱으로 처리하는 데 평균 2시간 걸리던 시간을 단축하고 45%에 달하던 청약 전 오류율을 크게 낮췄다고 밝혔다. 인수지침 위배사항을 자동으로 탐지해 해소하고 머신러닝(ML) 기반 심사 예측 모델과 검색증강생성(RAG)·거대언어모델(LLM)을 활용한 하이브리드 모델로 판단 근거까지 제시하는 것이 특징이다. 유 상무는 '보험 요율산출 자동화를 통한 상품 개발 리드타임 단축 및 효율화 사례'에 대해서도 발표했다. 이노룰스의 보험요율 산출 시스템은 담당자별로 엑셀과 VBA로 수작업하던 가격산출 업무를 자동화해 상품 개발 기간을 대폭 단축했다. 산출 기초 데이터를 통합 관리하고 표준 산출식을 활용한 일괄 처리, 감독규정 자동 체크, 산출 결과값 비교 검증 등을 통해 오류 발생 가능성을 제거했다. 현재 국내 유수의 보험사 등에 공급 계약도 체결한 바 있다. 이날 참석한 업계 관계자는 이노룰스가 국내 보험 분야의 대표적인 소프트웨어 기업으로서 보험사의 복잡한 상품 구조, 끊임없이 변하는 규제, 방대한 약관과 인수지침 등 업무 특수성을 깊이 이해하고 있다고 평가했다. 또 기존 룰 베이스를 통한 업무 자동화 사업에 전문성이 있는 만큼 ML·RAG·LLM 등 다양한 AI 기술을 보험 업무 프로세스에 최적화해 적용하는 데 강점이 있을 것으로 기대된다고 전했다. 장인수 이노룰스 대표는 "우리는 기술이 아닌 보험 업무에 대한 깊은 이해를 바탕으로 접근하는 회사"라며 "AI를 한다가 아니라 AI로 무엇을 실제로 해결하느냐가 중요하다"고 강조했다. 이어 "우리의 목표는 보험업계 AI를 논의할 때 가장 먼저 떠오르는 회사가 되는 것"이라며 "보험 업무를 누구보다 잘 이해하는 AI 기업으로서 기술력과 현장 이해도, 실행력에서 1등으로 인정받겠다"고 덧붙였다.

2025.12.18 13:51한정호

이미지 생성 AI 모델 경쟁 심화…오픈AI, 'GPT 이미지 1.5' 공개

오픈AI가 이미지 생성과 편집 성능을 강화한 새로운 모델을 선보이며 생성형 인공지능(AI) 이미지 시장 경쟁에 다시 불을 지폈다. 기존보다 정교한 지시 수행과 빠른 처리 속도를 앞세워 이미지 생성 도구를 실험 단계를 넘어 실사용 중심의 창작·업무 도구로 끌어올린다는 전략이다. 17일 테크크런치에 따르면 오픈AI는 새로운 이미지 생성 모델 'GPT 이미지 1.5'를 기반으로 한 챗GPT 이미지의 업데이트를 발표했다. 이번 모델은 지시 이행 정확도 향상, 세밀한 이미지 편집, 최대 4배 빠른 이미지 생성 속도가 특징으로, 모든 챗GPT 사용자에 순차적으로 제공된다. GPT 이미지 1.5는 오픈AI가 구글의 제미나이 시리즈와 이미지 생성 모델 경쟁을 본격화하는 과정과 맞물려 공개됐다. 구글이 최신 플래그십 모델과 이미지 생성기 '나노 바나나 프로'로 시장 점유율을 확대하는 가운데, 오픈AI가 이미지 모델 출시 시점을 앞당긴 것으로 풀이된다. 오픈AI의 이전 이미지 모델 출시는 지난 4월이었다. 이번 업데이트의 핵심은 반복 편집과 일관성이다. 기존 생성형 이미지 도구들이 특정 요소만 수정해 달라는 요청에도 이미지 전체를 다시 해석하는 한계가 있었던 반면, GPT 이미지 1.5는 얼굴 생김새, 조명, 구도, 색감 등 핵심 시각 요소를 유지한 채 요청한 부분만 정밀하게 수정할 수 있다. 이를 통해 실용적인 사진 보정은 물론 의상·헤어스타일 시뮬레이션, 원본 이미지를 유지한 스타일 변환 작업이 가능해졌다. 텍스트 렌더링 성능도 개선됐다. 작은 글자나 복잡한 텍스트 배치에서도 가독성이 높아졌으며 다수의 인물이 등장하는 이미지에서 얼굴 표현의 자연스러움도 향상됐다. 오픈AI는 이러한 개선을 통해 단순 이미지 생성뿐 아니라 마케팅·디자인·이커머스·커뮤니케이션 등 비즈니스 워크플로우 전반에서 활용도를 높일 수 있다고 설명했다. 사용자 경험 측면에서도 변화가 있다. 챗GPT 내부에 이미지 전용 공간이 새롭게 마련돼 모바일 앱과 웹 사이드바에서 접근할 수 있다. 사전 설정된 필터와 트렌드 기반 프롬프트를 활용해 보다 직관적인 이미지 탐색과 반복 시도가 가능해졌다. 오픈AI는 이 공간을 '크리에이티브 스튜디오'에 가깝게 설계했다고 밝혔다 . 다만 오픈AI는 이번 업데이트가 의미 있는 진전이지만 완성 단계는 아니라고 평가했다. 다양한 테스트 사례에서 성능 개선이 확인됐으나, 여전히 반복적인 개선이 필요한 영역이 남아 있으며 향후 업데이트를 통해 품질을 지속적으로 끌어올릴 계획이다. 피지 시모 오픈AI 애플리케이션 부문 CEO는 "챗GPT 사용자의 생각과 그것을 현실로 구현하는 능력 사이의 거리를 계속 좁혀 나가겠다"고 강조했다.

2025.12.17 15:04한정호

중동 넘어 아프리카로…노타, 케냐 나이로비 스마트교차로 구축 참여

노타가 인공지능(AI) 경량화·최적화 기술을 중동에 이어 아프리카 교통 체계에 적용한다. 노타는 케냐 나이로비의 지능형 교통 체계(ITS) 구축 사업에 스마트교차로 시스템 기술 공급 계약을 체결했다고 17일 밝혔다. 이번 계약은 케냐 도시도로공사(KURA)와 LG CNS가 함께 진행하는 교통관제 센터 구축 프로젝트의 일환으로, 한일 에스티엠이 시스템 설계와 관리를 맡고 노타는 AI 모델 경량화·최적화 기술 기반의 스마트교차로 시스템을 엣지 환경에 맞게 구현한다. 노타의 AI 경량화·최적화 기술은 AI 모델의 연산량과 메모리 사용을 줄여 엣지 환경에서 효율적으로 구동되도록 만드는 기술로, 저전력과 저지연이 필요한 환경에 효율적으로 평가된다. 이번에 도입되는 AI 경량화·최적화 기반 스마트교차로 시스템은 분석에 필요한 모델의 크기를 경량화한다. 이를 교차로 현장 CCTV에 최적화해 서버 개입 없이 실시간으로 차종 분류와 교통량, 대기행렬 등 교통 상황을 분석해 교통 흐름 개선에 기여할 계획이다. 특히 경량화 기술을 통해 엣지 디바이스 하나로 다수의 CCTV 채널을 동시에 관리하고 실시간 데이터를 처리할 수 있어 높은 비용 효율성 제공할 예정이다. 나아가 관리자는 실시간 데이터를 바탕으로 교통 상황을 파악하는 것은 물론 향후 교차로 운영 효율 향상을 위한 데이터로 활용 가능하다. 엣지 환경에서 구현되므로 서버 비용 부담을 줄이고 안정된 시스템 운영도 지원한다. 앞서 노타는 ITS 성능 평가와 기업 및 지방자치단체를 통한 기술 검증으로 기술력을 인정받았다. 노타의 기술로 완성된 스마트교차로 시스템과 돌발상황 검지 시스템은 실시간성과 정확도가 핵심지표인 ITS 기본성능평가에서 최상급 성적을 획득한 바 있다. 또 최근 영천 ITS 보강 사업에서도 전 항목 평균 99.5%의 성능을 보이며 준공했다. 이같은 기술력을 바탕으로 노타는 ITS 기술 수익화에도 속도를 내고 있다. ▲아랍에미리트 교통 인프라 기업 'ATS' 파트너십 ▲두바이 교통국과 ITS 솔루션 공급 계약 ▲아부다비 교통청 ITS 구축 사업 추진 논의 ▲소니와 미국 레이크우드 지역 내 보행자 안전 지원과 교통량 분석 검증 성공 등 기술을 선보여왔다. 이번 케냐 나이로비 프로젝트 참여를 통해 아프리카 지역까지 기술 적용을 확대했다. 채명수 노타 대표는 "우리의 AI 경량화·최적화 기술이 두바이에 이어 나이로비의 교통 혁신에 기여하게 돼 기쁘다"며 "이번 프로젝트를 성공적으로 마쳐 글로벌 시장에서 AI 경량화·최적화 기술의 영향력을 더욱 확장해 나갈 것"이라고 밝혔다.

2025.12.17 15:04한정호

엔비디아, 오픈 모델 '네모트론 3' 시리즈 공개…"추론 속도 4배↑"

엔비디아가 에이전틱 인공지능(AI) 애플리케이션 구축을 위한 오픈 모델 제품군을 공개했다. 엔비디아는 오픈 모델과 데이터, 라이브러리로 구성된 '네모트론 3' 시리즈를 17일 발표했다. 네모트론 3는 '하이브리드 잠재 전문가 혼합(MoE)' 아키텍처로 대규모 멀티 에이전트 시스템 신뢰성을 높였다. 개발자는 이를 통해 통신 과부하와 맥락 이탈, 높은 추론 비용 등 기존 협업형 AI 시스템이 겪던 기술적 난제를 해결할 수 있다. 이 시리즈는 나노, 슈퍼, 울트라로 구성됐다. 네모트론 3 나노는 300억 개의 파라미터를 갖춘 소형 모델이다. 전 세대 대비 4배 높은 처리량을 갖췄다. 소프트웨어 디버깅이나 콘텐츠 요약 같은 작업에 최적화됐다. 추론 토큰 생성량을 최대 60%까지 줄일 수 있다. 내년 상반기 출시 예정인 슈퍼와 울트라 모델은 각각 1천억 개, 5천억 개의 파라미터를 탑재했다. 해당 시리즈는 엔비디아 블랙웰 아키텍처 기반의 고효율 훈련 포맷으로 이뤄져 메모리 요구 사항을 줄이면서도 훈련 속도를 높일 수 있다. 엔비디아는 이번 제품군을 통해 각국 조직이 데이터와 규제, 가치에 부합하는 소버린 AI를 구축하도록 적극 지원한다고 밝혔다. 이미 서비스나우, 퍼플렉시티, 지멘스 등 글로벌 기업들이 네모트론 모델을 자사 워크플로에 통합해 제조, 보안, 미디어 등 다양한 산업 분야에서 활용 중이다. 이날 엔비디아는 전문화된 에이전트 구축을 돕기 위해 3조 개 토큰으로 구성된 훈련 데이터셋과 '네모 짐' 등 오픈소스 라이브러리도 공개했다. 모든 도구와 데이터셋은 깃허브와 허깅 페이스를 통해 즉시 이용 가능하다. 젠슨 황 엔비디아 최고경영자(CEO)는 "오픈 혁신은 AI 발전의 토대"라며 "네모트론을 통해 첨단 AI를 개방형 플랫폼으로 전환하고, 개발자들이 대규모 환경에서 에이전틱 시스템을 구축하는 데 필요한 투명성과 효율성을 제공하겠다"고 밝혔다.

2025.12.17 14:37김미정

팀네이버, 독자 파운데이션 모델로 버티컬 AI 스타트업 키운다

네이버클라우드가 독자 파운데이션 모델 기반의 산업 인고지능(AI) 고도화와 글로벌 시장 진출 지원에 나선다. 네이버클라우드와 네이버 아라비아는 코리아스타트업포럼(코스포)과 독자 AI 파운데이션 모델 기반의 버티컬 AI 스타트업 육성을 지원하고 중동 지역을 중심으로 한 글로벌 협력을 확대하기 위한 업무협약(MOU)을 체결했다고 12일 밝혔다. 이번 협약은 국내 AI 생태계의 선순환 구조를 구축하고 유망 스타트업의 글로벌 경쟁력 확보를 목표로 한다. 특히 네이버클라우드가 국가대표 AI 프로젝트로 진행 중인 독자 AI 파운데이션 모델을 스타트업이 활용해 산업별 AI 서비스를 고도화하고 국내 소버린 AI 생태계를 적극 확대하는 데 3사가 협력할 방침이다. 네이버클라우드와 코스포는 각 사의 기술 역량과 기업 발굴 역량을 연계해 AI 기술을 적용할 수 있는 유망 스타트업을 공동 발굴한다. 이를 통해 산업 현장에서 활용 가능한 버티컬 AI 사례를 만들어 업계 전반의 혁신을 촉진한다는 계획이다. 선발된 스타트업에는 공모전과 멘토링 등 다양한 방식의 지원 프로그램을 운영하고 네이버클라우드의 거대언어모델(LLM) '하이퍼클로바X'와 클라우드 인프라 등 최신 AI 기술과 플랫폼 활용 환경을 제공해 기술 성장을 지원한다. 또 스타트업의 글로벌 진출 기회도 제공한다. 네이버 아라비아와의 협력을 통해 중동 현지 시장 정보뿐 아니라 현지 파트너사와의 네트워크 형성 및 협력 기회를 제공해 실질적인 시장 진출 기반을 마련할 계획이다. 최근 중동 시장은 산업별 디지털 전환과 AI 수요가 빠르게 증가하고 있는 지역으로, 이번 협약을 통해 국내 스타트업이 서비스를 글로벌 무대로 확장하는 교두보를 마련한다는 목표다. 한편 네이버클라우드는 독자 AI 파운데이션 모델 프로젝트의 일환으로 텍스트·이미지·오디오·비디오 등 이종 데이터를 통합적으로 이해하고 생성하는 '옴니 파운데이션 모델'을 개발해 선보일 계획이다. 김유원 네이버클라우드 대표는 "이번 협력은 국내 기술로 개발된 독자 파운데이션 모델이 스타트업을 통해 산업 전반에 확산되고 소버린 AI 생태계를 한 단계 확장하는 데 중요한 역할을 할 것"이라며 "유망 스타트업이 중동을 비롯한 글로벌 시장에서 성장할 수 있도록 아낌없이 지원할 것"이라고 말했다.

2025.12.12 15:49한정호

오픈AI, 한 달 만에 GPT-5.2 공개…구글 제미나이에 반격 나섰다

구글 제미나이의 거센 추격 속에서 오픈AI가 한 달 만에 프런티어 모델 'GPT-5.2'를 내놓으며 정면 돌파에 나섰다. 챗GPT 트래픽 감소와 내부 '코드 레드' 비상 체제까지 겹친 상황에서 강화된 성능의 신모델이 경쟁 구도를 다시 뒤흔들 것이라는 평가가 나온다. 오픈AI는 11일(현지시간) GPT-5.2 시리즈를 출시한다고 발표했다. 새 모델은 즉답·사고·프로 등 세 가지 모드로 구성되며 전문 지식 업무와 장시간 에이전트 실행에 최적화된 것이 특징이다. GPT-5.2는 챗GPT 유료 구독자에게 순차 제공되며 개발자들은 API를 통해 즉시 이용할 수 있다. GPT-5.1은 앞으로 3개월 뒤 지원이 종료된다. 이번 공개는 단순한 기능 업그레이드를 넘어 최근 제미나이 3의 급성장으로 흔들린 인공지능(AI) 시장 판도에 오픈AI가 다시 우위를 확보하려는 전략으로 풀이된다. 시장조사업체 시밀러웹에 따르면 챗GPT 트래픽 점유율은 1년 전 87%에서 최근 71.3%까지 떨어진 반면, 구글 제미나이는 같은 기간 5.7%에서 15.1%로 뛰어올랐다. 내부적으로도 샘 알트먼 오픈AI 최고경영자(CEO)는 직원들에게 코드 레드를 선언하며 챗GPT 모델 품질 개선을 최우선 과제로 지시한 바 있다. 이번에 공개된 GPT-5.2는 추론·코딩·수학·장문 분석·비전·도구 활용 등 전 영역에서 성능이 향상됐다. 오픈AI 자체 평가에서 사고 모드는 70.9%, 프로 모드는 74.1%를 기록해 인간 전문가와 대등하거나 능가하는 수준으로 평가됐다. 이전 버전 GPT-5의 38.8%와 비교하면 압도적인 성장이다. SWE 벤치마크에서도 80%를 기록하며 구글 제미나이 3 프로(76.2%)를 넘어섰고 앤트로픽 클로드 오퍼스4.5(80.9%)와도 1% 미만 차이에 불과한 것으로 나타났다. 또 사고 모드의 환각 오류율은 6.2%로 전작 대비 약 30% 감소했으며 긴 문서 맥락 이해와 이미지·그래프 분석 능력, 다단계 업무 처리 능력도 상향됐다. 복잡한 논리·수학 문제 해결 과정에 있어서도 이전보다 38% 적은 오류를 냈고 추론·코딩·과학 벤치마크에서도 최고치를 기록했다. 개발자들을 위한 API 측면에서는 추론 강도를 선택할 수 있는 다섯 단계의 옵션을 제공해 복잡한 프로젝트 수행 능력을 강화했다. 오픈AI 피지 시모 최고제품책임자(CPO)는 "GPT-5.2는 스프레드시트 제작, 프레젠테이션 구성, 코드 작성, 이미지 이해, 장문 맥락 추론, 도구 활용 등 실제 업무에서 큰 경제적 가치를 제공하도록 설계됐다"고 설명했다. 이번 공개는 오픈AI가 빠른 속도로 AI 모델을 출시하는 전환점으로 평가된다. GPT-5.1 발표 후 불과 한 달 만의 출시로, 이는 챗GPT 서비스를 시작한 2022년 이후 가장 짧은 주기다. 월스트리트저널과 여러 외신은 오픈AI가 내부 비상 상황 속에서 제미나이 3 프로의 벤치마크 공세를 의식해 GPT-5.2 출시 일정을 당긴 것으로 분석했다. 이번 GPT-5.2 공개로 오픈AI·구글·앤트로픽 간 경쟁이 한층 격렬해질 전망이다. 한편 오픈AI 내부에서는 고도화된 추론 모델 중심 전략이 높은 연산 비용 부담으로 이어질 수 있다는 우려도 제기되고 있다. 업계에서는 오픈AI의 추론 비용 상당 부분이 클라우드 이용료가 아닌 현금으로 지불되고 있다는 관측도 나온다. 오픈AI는 "더 효율적인 모델 구조와 강화된 성능을 통해 동일 비용 대비 더 높은 지능을 제공하는 방향으로 나아가고 있다"며 "앞으로도 안전성과 신뢰성을 강화하고 사용자가 기대하는 품질을 꾸준히 발전시켜 나가겠다"고 밝혔다.

2025.12.12 10:08한정호

과기정통부 "AI 3대 강국, 정부·민간 협력 생태계 구축해 달성한다"

"인공지능(AI)을 국가 성장의 핵심축으로 삼고 민간과 함께 생태계를 구축하겠습니다." 과학기술정보통신부 장기철 인공지능데이터진흥과장은 11일 서울 중구 신라호텔에서 열린 'AI & 클라우드 컨퍼런스 2025(ACC 2025)'에서 국가 AI 경쟁력 강화와 디지털 인프라 전환에 대해 이같이 밝혔다. 지디넷코리아가 주최한 ACC 2025는 AI와 클라우드 분야의 실질적 비즈니스 성과 창출 방안을 모색하는 대표 기술 컨퍼런스다. 올해 행사에는 과기정통부 비롯해 구글 클라우드·삼성SDS·뉴타닉스 코리아·아카마이·알리바바 클라우드·나무기술 등 글로벌 및 국내 주요 기업들이 대거 참여해 성황을 이뤘다. 이날 장 과장은 글로벌 'AI 3대 강국(AI G3)' 도약을 목표로 하는 정부의 AI 정책 확대 로드맵을 공유했다. 그는 "현재 우리나라 AI의 수준은 미국·중국을 뒤따르는 3위권 그룹으로, 앞으로는 압도적인 3강을 굳히는 것이 목표"라고 말했다. 특히 글로벌 AI 모델 평가 지표에서 LG AI연구원의 '엑사원', 업스테이지 '솔라' 모델이 상위권에 오른 점을 언급하며 "우리도 톱티어 모델을 만들 역량이 있다"고 덧붙였다. 정부는 AI G3 도약을 위해 내년 대규모 예산을 투입한다. 정부 AI 예산 10조원, 국민성장펀드를 통한 AI 투자 30조원 등을 통해 GPU·데이터·반도체·모델·인재까지 이어지는 AI 풀스택 역량을 모두 강화한다는 방침이다. 특히 2030년까지 엔비디아 26만 장 그래픽처리장치(GPU)를 확보하는 계획을 바탕으로 한국형 'AI 고속도로' 구축에 속도를 낼 전망이다. 장 과장은 AI 인재 문제도 시급한 과제로 꼽았다. 국내에서 충분한 GPU를 써볼 기회가 없어 연구자들이 해외로 빠져나가는 현실을 타개하고자 정부는 ▲해외 AI 인재 특별비자 도입 ▲AI대학원·AX 융합대학원 확대 ▲AI 스타펠로우십 지원 등 제도 개선을 추진하고 있다. 또 '독자 AI 파운데이션 모델 프로젝트'에도 속도를 낸다. 장 과장은 "프롬 스크래치 기술을 갖춘 우수 국내 AI 기업들과 함께 글로벌 톱 모델 확보에 도전한다"며 "공공·민간의 데이터와 GPU, 인재 등 기술과 정부 지원 역량을 결합해 글로벌 모델 10위권에 진입할 것"이라고 밝혔다. AI 기반 국가 대전환 전략도 소개됐다. 제조·지역·공공·과학 분야로 구분된 AX 전략을 통해 AI 로봇·AI 공장·AI 복지·AI 납세 관리 등 전 산업·행정 분야의 디지털 혁신을 동시 추진한다는 구상이다. 장 과장은 "대통령 직속 국가AI전략위원회를 중심으로 범부처 협업을 강화해 AI 정부로 전환되고 있다"고 강조했다. 아울러 지난 9월 국가정보자원관리원 화재 사고 이후 국가가 운영하는 디지털 인프라의 안정성 확보 대책도 언급됐다. 그는 "국가에서 관리하는 데이터센터들이 민간 클라우드를 더 많이 활용할 수 있도록 방안을 마련 중"이라며 "국가AI전략위원회에서 별도 대책을 준비하고 있어 이른 시일 내 발표될 것"이라고 말했다. 장 과장은 AI G3 도약을 위한 향후 정부의 역할도 공유했다. 예산 측면에서는 마중물 역할을, 산업 측면에서는 규제 완화와 공공 조달을 통한 초기 시장 조성을 핵심 방향으로 제시했다. 그는 "정부가 AI에 있어 모든 것을 다 할 수 있다고 생각하지 않는다"며 "민간이 AI 비즈니스를 잘할 수 있도록 적절한 제도와 환경을 만드는 데 집중하겠다"고 말했다.

2025.12.11 17:34한정호

"AI 모델 고민 해결"…인포뱅크, 협업 플랫폼 '인세븐' 자동 라우팅 고도화

인포뱅크가 기업들이 인공지능(AI) 협업 플랫폼에서 업무 목표에 적합한 모델을 부담 없이 활용할 수 있는 기반을 마련했다. 인포뱅크는 자사 플랫폼 '인세븐(IN7)'에 업무 목적에 따라 다양한 AI 모델을 자동으로 선택·실행하는 'AI 모델 자동 라우팅' 기능을 고도화했다고 4일 밝혔다. 현재 많은 기업이 다양한 AI 모델을 업무 성격에 맞춰 병행 사용하지만 모델별 가격과 성능 차이로 최적 선택이 어렵고 다중 구독이나 좌석 단위 구매로 비용 부담이 증가하는 문제를 겪고 있다. 이러한 운영 구조는 AI 전환(AX)을 가로막는 주요 장애 요인으로 지적돼왔다. 인세븐은 업무 유형을 기반으로 최적 모델을 자동 분기하는 AI 모델 자동 라우팅 기술을 적용해 선택 부담과 비용 문제를 동시에 해결한다. 해당 기술은 업무 성격을 분석해 오픈AI·앤트로픽·구글·xAI에서 제공하는 AI 모델 20여 종 중 가장 효율적인 모델을 자동 선택한다. GPT-5.1, 제미나이 3 프로와 같은 고성능 모델부터 GPT-5 미니, 제미나이-2.5-플래시 계열의 경량 모델까지 상황에 맞춰 분기하며 고비용 모델은 꼭 필요한 순간에만 활용된다. 이를 통해 AI 비용은 30~60% 절감되고 처리 속도는 3~7배 향상돼 기업은 복잡한 모델 비교 없이 자동으로 최적화된 환경을 활용할 수 있다는 게 인포뱅크 측 설명이다. 또 자동 라우팅 기반 위에 고급 분석 기능 '딥리서치'를 적용해 보고서 수준의 심층 분석 결과물을 자동 생성한다. 딥리서치는 GPT-5, 클로드, 제미나이 등 복수 대형 모델을 조합해 웹·문서·데이터 기반 조사를 수행하고 정보를 비교·정리·구조화해 최종 분석 결과를 도출한다. 사용자는 한 번의 질문으로 조사부터 요약까지 전체 과정을 일괄 처리할 수 있으며 시장·경쟁사·기술 분석 시간은 평균 57% 단축된다. 인세븐의 자동 라우팅과 딥리서치 기술은 목적 기반 모델 매칭, 비용 조건 분기, 성능 및 비용우선 모드 지원 등의 기능을 통해 AI 도입 장벽이 높은 중소·중견 기업에도 합리적인 비용으로 AX를 경험할 수 있도록 설계됐다. 특히 문서 기반 검색증강생성(RAG)과 멀티 모델 조합 기술을 적용해 전문성과 결과 품질을 높인 점도 차별화 요소다. 인포뱅크는 최신 글로벌 AI 모델을 빠르게 도입하고 국내 최저 수준의 비용 체계를 구축해 기업의 AI 활용 환경을 지속 강화할 방침이다. 제조·금융·유통·헬스케어 등 산업별 요구에 맞춘 딥리서치 템플릿도 고도화해 산업 맞춤형 AI 분석 생태계를 확대해 나갈 계획이다. 인포뱅크 강진범 최고기술책임자(CTO)는 "앞으로 기업은 어떤 모델을 선택할지, 비용을 관리할지 고민할 필요가 없을 것"이라며 "인세븐은 성능과 비용 효율을 자동 최적화하는 AI 플랫폼으로 자리매김할 것"이라고 강조했다.

2025.12.04 16:46한정호

트웰브랩스, 차세대 영상 이해 모델 '마렝고 3.0' 공개…"업계 최고 수준"

트웰브랩스가 영상 속 장면의 텍스트·음성·움직임·상황 맥락을 통합적으로 이해하는 인공지능(AI)을 선보인다. 트웰브랩스는 차세대 영상 AI 파운데이션 모델 '마렝고 3.0'을 공식 출시했다고 2일 밝혔다. 마렝고 3.0은 영상 속 대사와 몇 분 후에 등장하는 동작을 연결해 해석하고 사물·행동·감정·상황 변화를 시간의 흐름에 따라 추적하는 등 인간에 가까운 수준의 영상 이해 능력을 구현한다. 특히 이미지와 텍스트를 동시에 검색할 수 있는 '복합 이미지 검색' 기능과 사람이나 제품을 별도로 등록해 찾아볼 수 있는 '고유명사 검색' 기능도 도입됐다. 이번 모델은 36개 언어를 지원해 글로벌 기업 환경에서도 안정적으로 활용할 수 있다. 또 스토리지 비용 50% 절감, 인덱싱 속도 2배 향상 등의 효율성 개선도 확인했다는 게 트웰브랩스 측 설명이다. 마렝고 3.0은 기존 프레임 기반 분석이나 이미지·오디오 모델의 단순 조합 방식에서 벗어나 영상 이해를 위해 처음부터 설계된 네이티브 파운데이션 구조를 갖췄다. 영상 전체를 시간·공간적으로 해석하는 방식이다. 장면 간의 연속성과 맥락을 자연스럽게 파악하며 스포츠·미디어·엔터테인먼트·광고 등 고난도 콘텐츠에 대한 이해 능력이 대폭 강화된 것이다. 공공·보안 등의 영상 분석 환경에서도 높은 정확도를 보인다. 마렝고 3.0은 다양한 산업 현장에서 즉시 활용 가능하다. 프로 스포츠 리그에서는 특정 선수의 득점 장면이나 결정적 플레이만을 즉시 검색해서 찾아내 하이라이트를 빠르게 제작할 수 있으며 경기 분석 효율 향상을 지원한다. 방송·포스트 프로덕션 분야에서는 수십 년치 아카이브에서 특정 유명인의 얼굴을 '고유명사'로 등록해 원하는 행동을 하는 장면을 몇 초 만에 찾아낼 수 있다. 공공보안 쪽에서는 CCTV 영상 전체를 몇시간씩 볼 필요 없이 빠르게 원하는 장면만을 정확하게 찾아낼 수 있다. 이커머스 분야에서도 브랜드, 제품 혹은 호스트가 언제 등장하고 어떤 행동을 하고 있는지 원하는대로 즉시 검색해 볼 수 있다. 이재성 트웰브랩스 대표는 "전 세계 디지털 데이터의 90%가 영상인데 사람이 직접 분석하기에 너무 오래 걸리고 기존 기술로는 모든 것을 파악하기가 어려워 그동안 대부분 제대로 활용되지 못했다"며 "이 문제를 해결하는 것이 우리의 목표"라고 말했다. 이어 "마렝고 3.0은 그동안 영상 이해 기술이 가졌던 한계를 완전히 뛰어넘는 모델로, 기업과 개발자에게 기존과 다른 혁신적인 기준을 제시할 것"이라고 덧붙였다. AWS 니샨트 메타 AI 인프라 부문 부사장은 "트웰브랩스의 영상 이해 기술은 그동안 수작업 중심이었던 영상 분석 프로세스에 전례 없는 속도와 효율성을 제공하며 산업 전반의 혁신을 이끌고 있다"며 "마렝고와 페가수스 모델이 아마존 베드록에서 큰 성과를 거둔 데 이어, 마렝고 3.0은 세계 최고 수준의 영상 이해 능력을 필요로 하는 고객들에게 최적의 솔루션이 될 것으로 기대한다"고 강조했다.

2025.12.02 17:51한정호

포지큐브, '고성능컴퓨팅 지원사업' 선정…국산 문서파싱 VLM 개발 가속

포지큐브가 그래픽처리장치(GPU) 자원 확보를 통해 국산 문서파싱 비전언어모델(VLM) 개발을 가속한다. 포지큐브는 정보통신산업진흥원(NIPA)의 '2025년 고성능컴퓨팅 지원사업'에 선정됐다고 27일 밝혔다. 포지큐브는 이번 사업을 통해 한글 기반 문서 분석과 마크다운 자동 생성을 수행하는 경량 비전언어모델(SVLM) 개발을 완료할 계획이다. 고성능컴퓨팅 지원사업은 과학기술정보통신부와 NIPA가 민간 클라우드 사업자를 통해 GPU 기반 인공지능(AI) 컴퓨팅 인프라를 확보하고 국내 AI 연구·개발 기업과 기관에 대규모 GPU 자원을 제공하는 프로그램이다. 고성능 연산 환경을 지원해 AI 기술 개발 경쟁력을 강화하는 것이 목적이다. 포지큐브는 이번 사업을 통해 7B 모델로 큐웬 2.5VL-32B급의 문서 분석·마크다운 생성 성능을 확보하는 것을 목표로 한다. 이를 통해 PDF·PPT·워드·스캔 이미지 등 다양한 문서를 정밀하게 이해하고 7B 모델 특유의 낮은 연산 비용을 기반으로 실시간 응답형 API 서비스로 활용할 수 있도록 할 예정이다. 특히 해외 모델이 처리하지 못하는 국내 공공·금융기관 고유 문서 서식의 한계를 보완할 수 있다는 점이 차별점이다. 포지큐브는 개발된 VLM을 자사 솔루션 '로비 G'에 적용해 온프레미스 기반 문서 자동화, 거대언어모델(LLM) API 비용 절감, 응답 속도 개선 등 효과를 기대하고 있다. 더불어 문서 변환 엔진인 로비 G 데이터렉스에 탑재되는 핵심 모델을 독립 제품으로 판매하는 투트랙 전략도 추진한다. 또 7B 모델을 바탕으로 금융 도메인 특화 70B급 대형 모델 개발·상용화를 추진해 기업의 AI 전환(AX)을 지원할 계획이다. 포지큐브는 "국내 문서 자동화 시장은 공공·금융기관을 중심으로 급속하게 성장 중이며 국산 SVLM은 필수 기술"이라며 "이번 연구를 통해 한국형 문서 AI 생태계를 선도하겠다"고 밝혔다.

2025.11.27 18:39한정호

노타, 삼성 '엑시노스'에 AI 최적화 기술 공급…"온디바이스 기술력·시장성 입증"

노타가 삼성전자의 최신 애플리케이션 프로세서(AP)에 인공지능(AI) 최적화 기술을 탑재해 온디바이스 생성형 AI 대중화에 박차를 가한다. 노타는 자사 AI 모델 최적화 기술을 삼성전자의 '엑시노스 2500'에 공급하는 계약을 체결했다고 26일 밝혔다. 이번 계약을 통해 노타는 삼성전자의 AI 모델 최적화 툴체인 '엑시노스 AI 스튜디오'에 핵심 기술을 제공하며 엑시노스 2500 AP에서 고도화된 생성형 AI 경험이 구현될 수 있도록 기술적 기반을 마련했다. 엑시노스 AI 스튜디오는 고객이 개발한 AI 모델을 엑시노스 프로세서에 최적화해 효율적으로 구동할 수 있도록 지원하는 툴체인이다. 여기에 노타의 기술이 접목되면서 모델 최적화 효율과 성능이 향상되는 것은 물론 클라우드 연결 없이도 스마트폰에서 한층 강화된 온디바이스 AI 경험이 가능해졌다. 삼성전자 모바일 AP S/W 개발팀 조철민 상무는 "엑시노스 AI 스튜디오에 노타의 AI 모델 최적화 기술이 적용되면서 온디바이스 AI 모델 개발 효율성이 전작 대비 향상됐다"며 "양사 간 기술 협업으로 좋은 성과를 낼 수 있어 기쁘다"고 밝혔다. 노타는 이번 삼성전자와의 협업으로 기술력에 더해 시장성과 사업성을 입증했다고 강조했다. 노타는 최근 코스닥 시장에 공식 상장했으며 확보한 자금을 북미·유럽·중동 등 주요 글로벌 시장에서의 사업 확장에 투입할 계획이다. 이를 통해 온디바이스 생성형 AI의 상용화를 선도하고 글로벌 AI 기술 리더로서의 입지를 공고히 한다는 방침이다. 채명수 노타 대표는 "삼성전자와의 협업은 우리의 AI 최적화 기술이 글로벌 소비자용 제품에 적용돼 상용화된 의미 있는 사례"라며 "AI 반도체와 소프트웨어의 유기적 결합을 통해 온디바이스에서 고성능 생성형 AI를 구현했다"고 말했다. 이어 "앞으로도 삼성전자 및 글로벌 파트너들과 함께 온디바이스 AI 생태계 확장을 주도해 나가겠다"고 덧붙였다.

2025.11.26 16:23한정호

와이즈넛-리스크제로, AI 에이전트로 산업현장 안전 재설계

와이즈넛(대표 강용성)과 리스크제로가산업현장 안전관리 패러다임 전환에 속도를 내고 있다. 와이즈넛은 리스크제로와 산업안전 혁신을 위한 특화 에이전트 및 서비스 개발 업무협약(MOU)을 체결했다고 26일 밝혔다. 양사는 이번 협력을 통해 산업현장의 안전역량을 강화하고, 신속한 의사결정을 지원하는 AI 기반 안전관리 체계 구축에 나선다. 이번 협약은 와이즈넛의 도메인 특화 LLM과 검색증강생성(RAG) 기술에 리스크제로의 건설공사·도급사업 등 산업안전 분야 스마트 안전관리 통합 서비스를 결합하는 것이 핵심이다. 현장에 산재한 지식과 데이터를 AI가 실시간으로 분석해 위험요소를 미리 감지하고 담당자에게 최적의 대응 방안을 제시하는 구조를 구현하겠다는 구상이다. 양사는 우선 실제 현장을 대상으로 한 실증 프로젝트를 통해 성공모델을 확보한 뒤, 이를 건설·제조·플랜트 등 산업안전 전반으로 확산할 계획이다. 특히 건설공사 도급사업 관련 법령과 지침을 반영한 특화 LLM을 개발·적용해 안전점검, 서류 작성, 위험성 평가 등 안전관리 전 과정을 데이터 중심·AI 중심 프로세스로 전환하는 데 중점을 둘 예정이다. 와이즈넛은 AI 에이전트 대표 상장사로 공공·금융·법률·제조 등 다양한 산업에서 특화 AI 에이전트 구축 성공 사례를 50건 이상 확보한 기업이다. 이번 협력을 계기로 도메인 특화 에이전트 LLM '와이즈 로아(WISE LLOA)'와 GS인증을 획득한 RAG 솔루션 '와이즈 아이랙(WISE iRAG)'등 AI 에이전트 풀스택 소프트웨어를 산업안전 분야에 본격 적용해 산업별 AI전환(AX)을 더욱 가속화한다는 방침이다. 리스크제로는 스마트 안전통합 서비스 전문기업으로 국내 최고 수준의 안전전문가 컨설팅 역량과 중대재해처벌법 대응 안전관리 구독형 서비스, 스마트 안전관리 플랫폼을 보유하고 있다. 한국남동발전, 국토안전관리원, 국가철도공단, 경기주택도시공사 등 주요 공공기관의 스마트 안전관리 플랫폼 구축 경험과 현장 노하우를 기반으로 산업 현장 맞춤형 안전관리 체계를 제시해 왔다. 최영호 리스크제로 대표는 "AI 기술은 산업 현장 안전관리에 있어 안전 수준을 혁신적으로 끌어올릴 핵심 수단이 될 것"이라며 "이번 협력을 통해 리스크제로가 축적해 온 산업안전 전문성과 와이즈넛의 LLM 기술을 결합해 한 단계 진화한 스마트 안전관리 서비스를 선보이겠다"고 말했다. 강용성 와이즈넛 대표는 "산업현장의 안전을 지키는 핵심 인프라로서 AI 기술 활용은 이제 본격적인 태동기를 맞이하고 있다"며 "와이즈넛은 이번 협력을 통해 스마트 안전관리의 새로운 표준을 제시하고 실제 현장에서 안전성과 효율성을 동시에 높이는 실질적 가치를 만들어가겠다"고 밝혔다.

2025.11.26 15:44남혁우

[현장] 국산 AI 반도체·클라우드 결합 '시동'…국가 인프라 강화 선언

국산 인공지능(AI) 반도체와 클라우드 산업의 융합이 궤도에 올랐다. 초거대 AI 시대를 맞아 국가 인프라의 근간이 되는 클라우드가 스마트화와 지능형 자원 운영이라는 새로운 전환점을 맞이하면서 국산 기술 중심의 풀스택 생태계 구축이 본격화되고 있다. 오픈K클라우드 커뮤니티는 25일 서울 강남 과학기술회관에서 '오픈K클라우드 데브데이 2025'를 열고 국산 AI 반도체와 클라우드 융합 전략을 공유했다. 오픈K클라우드 커뮤니티에는 한국전자통신연구원(ETRI), 한국전자기술연구원(KETI), 이노그리드, 오케스트로, 경희대학교, 연세대학교, 한국클라우드산업협회(KACI), 퓨리오사AI 등 산·학·연 주요 기관이 공동 참여한다. 이번 행사는 커뮤니티의 첫 공식 기술 교류 행사로, 국산 AI 반도체를 중심으로 한 클라우드·소프트웨어(SW) 전주기 기술을 한자리에서 조망하며 국가 AI 인프라 경쟁력 제고 방안을 논의했다. ETRI 최현화 박사는 "이제 AI 서비스의 경쟁력은 모델을 누가 더 잘 만드느냐보다 누가 더 나은 인프라로 지속적으로 운영하느냐가 핵심"이라고 강조하며 클라우드의 대전환기를 진단했다. 최 박사는 최근 글로벌 거대언어모델(LLM) 발전의 특징을 멀티모달 확장, 컨텍스트 윈도우의 급격한 증가, 툴 연동 기반 정확도 향상으로 정리했다. 특히 메타가 공개한 오픈소스 LLM '라마'의 컨텍스트 윈도우가 1천만 토큰 수준으로 확장된 점을 언급했다. 그는 이러한 추세 속에서 국내 클라우드 산업이 ▲AI 가속기 이질성의 심화 ▲메모리 병목 문제 ▲추론 비용의 급증 ▲에이전트 폭증에 따른 관리 복잡도 증가 등 여러 난제를 동시에 마주하고 있다고 짚었다. 가장 먼저 꼽힌 것은 AI 가속기의 이질성 문제다. 엔비디아 그래픽처리장치(GPU) 중심 생태계가 유지되고 있지만 국내외에서 신경망처리장치(NPU)·AI칩·메모리 내 연산(PIM) 등 다양한 가속기와 인터커넥트 기술이 빠르게 등장하면서 단일 아키텍처에 의존하는 방식은 지속 가능하지 않다는 지적이다. 이어 LLM 추론의 핵심 병목으로 작용하는 '메모리 월'도 문제로 제기됐다. GPU 성능이 가파르게 증가하는 동안 메모리 기술 향상 속도는 더디기 때문이다. 최 박사는 SK하이닉스의 'AiMX', CXL 기반 차세대 메모리 사례를 언급하며 "AI 추론은 본질적으로 메모리 중심 작업이기에 차세대 메모리가 성능의 핵심을 좌우하게 될 것"이라고 말했다. LLM 스케일링 문제 역시 중요한 도전 과제로 다뤄졌다. 사용자 요구는 계속 높아지지만 단일 모델의 크기 확장에는 한계가 있어 여러 전문가 모델을 조합하는 '전문가 혼합(MoE)' 방식이 중요한 돌파구가 될 것이라고 강조했다. AI 모델마다 강점이 다른 만큼 다중 LLM 기반 지능형 추론은 필연적인 흐름이라는 설명이다. 추론 비용 문제도 빠지지 않았다. 최 박사는 "엔비디아 B200 급 GPU의 전력 소비가 1킬로와트(kW)에 이르는데, 이러한 DGX 서버 100대를 하루 운영하면 테슬라 전기차로 지구를 일곱 바퀴 도는 전력량에 해당한다"고 설명했다. 그러면서 "전력·비용 최적화는 하드웨어(HW) 스펙뿐 아니라 스케줄링, 클러스터 재구성이 필수"라고 말했다. 또 LLM·에이전트·데이터소스가 동적으로 연결되는 시대가 되면서 모니터링 복잡성이 기하급수적으로 커지고 있다는 점도 지적했다. 기존에는 레이턴시와 처리량을 중심으로 모니터링했다면 이제는 LLM의 할루시네이션 여부, 에이전트 간 호출 관계, 로직 변경 이력까지 관측해야 안정적 운영이 가능하다는 것이다. 이 같은 문제를 해결하기 위해 ETRI는 과학기술정보통신부가 추진하는 'AI 반도체 클라우드 플랫폼 구축 및 최적화 기술 개발' 과제에 참여했다. 이를 통해 ▲이종 AI 반도체 관리 ▲클라우드 오케스트레이션 ▲자동 디바이스 감지 ▲협상 기반 스케줄링 ▲국산 NPU 특화 관측 기술을 포함한 오픈소스형 '오픈K클라우드 플랫폼'을 개발 중이다. ETRI는 5년간 진행되는 사업에서 2027년 파라미터 규모 640억 LLM, 2029년 3천200억 LLM 지원을 목표로 풀스택 AI 클라우드 생태계를 구축할 계획이다. 오픈K클라우드 커뮤니티에 참여하는 퓨리오사AI, 이노그리드, 오케스트로도 이날 국산 AI 반도체와 클라우드 융합 생태계 활성화를 위한 기술 전략을 발표했다. 퓨리오사AI 이병찬 수석은 엔비디아 의존을 극복하기 위해 전력·운영 효율성을 높인 '레니게이드' 칩과 SW 스택을 소개했다. 이노그리드 김바울 수석은 다양한 반도체가 혼재된 클라우드 구조를 성능·전력·비용 최적화로 통합한 옵저버빌리티의 전략을 공유했다. 오케스트로 박의규 소장은 자연어 요구 기반 코딩과 자동화된 테스트·배포를 지원하는 에이전트형 AI SW 개발환경(IDE) 트렌드와 국내 시장의 변화에 대해 발표했다. 최 박사는 "앞으로 오픈K클라우드 플랫폼을 통해 국산 AI 반도체가 국가 핵심 인프라에 적용될 수 있는 계기를 만들겠다"고 강조했다. 이어 "아직 확정은 아니지만 정부가 추진하는 '국가AI컴퓨팅센터' 사업에 우리 플랫폼을 탑재할 수 있는 계기를 만들 것"이라며 "국산 AI 반도체 실사용자의 요구사항을 반영해 레퍼런스를 쌓아가는 것이 목표"라고 덧붙였다.

2025.11.25 17:10한정호

앤트로픽, 차세대 AI '클로드 오퍼스4.5' 출시…챗GPT·제미나이 제쳤다

앤트로픽이 차세대 인공지능(AI) 모델 '클로드 오퍼스4.5'를 선보이며 코딩·에이전트·사무 작업 자동화 등 다양한 영역에서 경쟁사 대비 우수성을 앞세워 시장 공략에 속도를 낸다. 특히 소프트웨어 엔지니어링(SWE) 벤치마크에서 세계 최고 수준의 성능을 기록하며 기업용 AI 시장 공략을 본격화한다. 앤트로픽은 자사 AI 모델 중 최상위 모델인 '오퍼스'의 최신 버전 클로드 오퍼스4.5를 24일(현지시간) 출시했다. 오퍼스4.5는 복잡한 추론과 고난도 전문 작업 수행에 최적화된 모델로, 기존 오퍼스 대비 코딩 자동화·버그 수정·다단계 작업 수행 능력이 크게 강화됐다. 국제 표준 벤치마크 결과에 따르면 SWE-벤치에서 80.9%의 정확도를 기록해 오픈AI GPT-5.1 코덱스 맥스(77.9%), 구글 제미나이 3 프로(76.2%)를 앞섰다. 또 기존 학습 데이터 없이 AI가 스스로 문제를 해결하는 ARC-AGI-2 평가에서도 37.6%를 기록하면서 경쟁 모델 대비 우수한 성능을 보였다. 앤트로픽은 "오퍼스4.5가 몇 주 전만 해도 우리의 '소넷4.5' 모델이 해결하지 못한 문제까지 풀어낸다"며 "실제 시험 환경에서 인간 지원자보다 높은 점수를 기록했다"고 설명했다. 아울러 내부 테스트에서도 SWE-벤치 다국어 테스트 8개 중 7개 부문에서 1위를 차지한 것으로 나타났다. 새 모델은 사무 자동화 기능도 강화됐다. 재무 분석, 프레젠테이션 작성, 스프레드시트 처리 등 사무용 워크플로우에 특화된 업데이트가 적용됐으며 마이크로소프트(MS) 엑셀 내에서 직접 클로드를 활용할 수 있는 기능도 추가됐다. 이를 통해 기업 고객은 엑셀 기반 데이터 분석과 문서 작업을 자연어로 수행하게 됐다. 개발자 도구도 확장됐다. 장기 실행형 에이전트 기능과 데스크톱·크롬 환경에서의 클로드 활용성 개선, 자동 요약을 통한 긴 대화 맥락 유지 기능 등을 추가했다. AI 연산량을 조절하는 '노력 매개변수'를 적용해 동일 성능 대비 필요한 토큰 수를 50% 가까이 줄인 것도 특징이다. API 가격 역시 대폭 인하됐다. 오퍼스4.5 API 요금은 100만 토큰당 입력 5달러·출력 25달러로 기존 대비 3분의 1 수준으로 낮아졌다. 모델은 클로드 앱, API, 아마존웹서비스(AWS)·애저·구글 클라우드를 통해 즉시 이용할 수 있다. 앤트로픽은 "오퍼스 4.5를 통해 다양한 산업에서 생산성과 문제 해결 능력을 한 단계 더 끌어올릴 수 있을 것"이라고 밝혔다.

2025.11.25 10:37한정호

[현장] 시행 앞둔 AI 기본법…대응 전략은 '사람 개입·거버넌스'

내년 우리나라 '인공지능(AI) 기본법' 시행을 앞두고 기업과 기관의 AI 활용 방식이 근본적으로 재편될 조짐이 나타나고 있다. 고영향 AI에 대한 규제 체계가 구체화되면서 기존 자동화·AI 기반 서비스의 의사결정 구조를 전면 재설계해야 하는 상황이다. 업계에서는 AI를 더 많이 활용해야 하는 시대적 흐름과 동시에, 투명성 확보·위험 관리·책임 구조 정비라는 새로운 의무가 부상하면서 대응 전략 마련이 시급하다는 목소리가 나온다. 한국능률협회컨설팅(KMAC)과 법무법인 린은 21일 서울 역삼 포스코타워에서 '고영향 AI 활용에 따른 비즈니스 설계와 실행 전략' 세미나를 개최해 AI 기본법 시행의 핵심 쟁점과 실무 대응 방향을 제시했다. 행사는 AI 기본법이 내년 1월 본격 적용되면서 조직이 마주하게 될 법적·운영적 변화에 대비하기 위한 자리로 마련됐다. EU는 설계부터 규제, 한국은 고지 중심…느슨한 범용 AI 규정 첫 발표자로 나선 법무법인 린 방석호 AI산업센터장은 유럽연합(EU) AI법과 국내 AI 기본법의 차이를 짚으며 "국내 법은 EU의 '고위험' 개념을 '고영향'으로 대체했지만, 범용 AI 규제는 상당 부분 비워놓은 구조"라고 설명했다. 그는 EU가 학습 데이터와 모델 구조 등 기술적 투명성 공개를 의무화한 반면, 한국은 최종 이용자에게 '이 서비스는 AI가 사용됐다'는 사실만 고지하면 되는 수준에 그쳐 규제 밀도가 낮다고 평가했다. 또 방 센터장은 "국내 기준은 최근 발표된 미국 캘리포니아의 프론티어 모델 기준을 사실상 그대로 가져와, 학습 연산량 10²⁶ 플롭스(FLOPs) 이상만 고영향으로 추정하도록 했다"며 "결국 국내 사업자는 범용 AI 규제에서 빠져 있는 셈이지만, 고영향 분야로 응용하는 순간 책임은 훨씬 커진다"고 강조했다. 이어 법무법인 린 구태언 변호사는 업권별로 고영향 AI 지정 가능성을 분석하며 기업이 취해야 할 방향을 제시했다. 그는 "대출 자동심사, 채용 서류 자동평가, 교육·의료 영역의 자동 의사결정 등은 사람이 개입하지 않으면 고영향 AI로 판단될 소지가 크다"며 "특히 '사람이 최종 결정한다'는 구조를 명확히 포함해야 지정 위험을 피할 수 있다"고 말했다. 구 변호사는 금융 분야 사례를 언급하며 "앱에서 10분 만에 대출 승인 여부가 나오는 현재 프로세스는 사실상 완전 자동화된 AI 의사결정"이라며 "이 경우 개인은 '내 금리가 왜 이렇게 나왔는지 설명하라'고 요구할 수 있고 이는 고영향 지정 요청으로 이어질 수 있다"고 경고했다. 그러면서 "채용 영역에서도 AI가 정량·정성 평가를 수행해 지원자를 컷오프하는 구조는 고영향 판단 위험이 높다"며 "면접·평가 결과를 참고자료로만 활용하고 사람이 이를 재검토한 기록을 남기는 절차가 필요하다"고 설명했다. AI 기본법 대응 핵심은 '사람 개입·문서화·거버넌스' KMAC 손권상 AI·빅데이터 본부장은 기업이 실무적으로 대응해야 할 'AI 거버넌스 체계'를 제시했다. 그는 "기업 대부분이 AI를 쓰고 있지만, 실제로 어떤 모델을 어디에 쓰고 있는지조차 정리되지 않은 곳이 많다"며 "프로세스 단계별로 AI 개입 여부, 의사결정 영향력, 위험 수준을 평가하는 것이 첫 단계"라고 강조했다. 손 본부장은 금융권 대출 심사와 HR 채용 프로세스를 사례로 들며 기업이 AI 기반 업무를 다시 설계하는 과정을 세부적으로 설명했다. 업무 프로세스에서 AI가 판단을 내린 뒤 사람이 이를 재검토하는 구조가 반드시 포함돼야 하고 AI 결과를 '참고값'으로 낮춰 최종 결정은 사람이 하는 체계를 문서화하는 것이 핵심이다. 또 고영향 판단 여부를 ▲사람 개입성 ▲결과의 확정성 ▲영향력의 크기 세 항목으로 분류해 진단할 것을 제안했다. 손 본부장은 "고객 리스크 사전분류, 신용등급 자동 산출, AI 면접 평가 등은 고영향으로 판정될 가능성이 높기 때문에 별도의 모니터링 절차와 재검토 체계가 필요하다"고 짚었다. 아울러 기업 내부에 AI 윤리위원회와 전담 조직을 설치해 지속적인 모니터링 체계를 갖출 필요가 있다고 강조했다. AI 윤리 기준 수립, 모델 검증 매뉴얼, 데이터 처리 가이드라인 등 전사 AI 운영지침을 마련해야 한다는 것이다. 손 본부장은 "AI 기본법이 규정하는 고영향 AI는 앞으로 더 많은 산업과 업무 영역에서 등장할 것"이라며 "사전 검토·위험·감독·문서화·법적 대응이라는 5단계 구조를 실무 절차에 그대로 이식하는 것이 가장 현실적 대응"이라고 조언했다. 이어 "앞으로 AI를 도입하면 기술만 바꾸는 것이 아니라 기업의 일하는 방식 전체가 재설계되는 패러다임 변화가 찾아올 것"이라며 "기업이 이러한 전환을 효과적으로 헤쳐나갈 수 있도록 전문성을 바탕으로 지원하겠다"고 덧붙였다.

2025.11.21 18:11한정호

배스트데이터-래블업, 韓 AI 모델 개발 지원 가속

배스트데이터가 래블업 손잡고 '독자 파운데이션 인공지능(AI) 모델' 개발 지원을 위한 인프라를 구축했다. 배스트데이터는 '백엔드닷AI' 개발사 래블업과 협업해 국가 AI 컨소시엄이 대규모 언어 모델을 국내 인프라에서 직접 학습·배포할 수 있도록 데이터 기반을 구축했다고 21일 밝혔다. 래블업은 정부가 추진하는 독자 AI 파운데이션 모델 프로젝트의 참여 기업이다. 백엔드닷AI는 그래픽처리장치(GPU)와 중앙처리장치(CPU) 자원을 아우르는 통합형 모델 학습·배포·추론 환경을 제공한다. 이번 협력으로 백엔드닷AI에 배스트 AI 운영체제가 결합되면서 학습 데이터, 체크포인트, 모델 아티팩트를 높은 처리량과 복원력으로 관리하고 실시간 서비스까지 이어지는 데이터 흐름을 확보하도록 설계됐다. 래블업은 초거대 모델 학습에서 기존 스토리지 인프라가 요구 성능을 충족하기 어렵다고 판단해 배스트데이터를 선택했다고 밝혔다. 두 기업은 멀티테넌트 연구 환경에서 필요한 성능·통제·신뢰성을 유지하면서도 병목을 제거해 데이터 레이어를 현대화했다. SK텔레콤 소버린 AI 클러스터에서 구동되는 백엔드닷AI·배스트 AI OS 통합 환경은 고성능 GPU 전반에 걸쳐 모델 학습을 자동화·가속화한다. 국내 연구기관은 이를 기반으로 훈련부터 추론까지 아우르는 통합 AI 컴퓨팅 환경을 확보한다. 백엔드닷AI는 배스트의 분리형 공유(DASE) 아키텍처 기반으로 컴퓨팅과 스토리지를 독립적으로 확장한다. 단일 글로벌 네임스페이스 '배스트 데이터스페이스'를 통해 연구자들은 체크포인트와 데이터셋, 출력물을 프로젝트 간 지연 없이 공유할 수 있다. 통합 환경은 소버린 데이터 통제, 고처리량 데이터 액세스, 단일 네임스페이스 제공, 안전한 멀티테넌트 확장성 등을 구현한다. 국가 컨소시엄 내부 협업은 간소화되고 GPU 전반의 일관된 성능이 확보되며, 정부·학계·기업은 독립적 확장성과 예측 가능한 품질을 보장받는다. 또 이 기반은 향후 추론·에이전틱 AI까지 대비하는 구조다. 배스트 데이터엔진은 대규모 데이터셋을 실시간으로 오케스트레이션하며, 고객이 고정형 모델 학습을 넘어 지속 학습·적응·서비스가 가능한 지능형 시스템으로 확장하도록 돕는다. 배스트 AI OS는 래블업의 자체 인프라에도 적용됐다. 이를 통해 모델 개발·테스트·오케스트레이션을 지원한다. 양사는 초기 지연 문제를 공동 엔지니어링으로 해결해 안정적이고 확장 가능한 학습 환경을 구축했다. 현재 백엔드닷AI와 배스트 AI 운영체제는 한국형 파운데이션 모델 컨소시엄에서 초거대 규모 데이터를 처리하며 대형 사전 트레이닝과 파인튜닝을 수행하는 인프라로 활용되고 있다. 알론 호레브 배스트데이터 공동 창업자 겸 최고기술책임자(CTO)는 "우리는 컴퓨트 오케스트레이션과 데이터 인텔리전스를 통합해 병목을 제거할 수 있을 것"이라며 "한국이 AI 혁신을 스스로 소유하고 통제하며 가속할 수 있는 단일 패브릭을 구축했다"고 말했다.

2025.11.21 15:52김미정

챗GPT, 금융 서비스 품는다…오픈AI-인튜이트 플랫폼 통합 협력

오픈AI가 회계 소프트웨어(SW) 기업 인튜이트와 손잡고 '개인 금융 비서 시대'를 연다. 19일 월스트리트저널(WSJ)에 따르면 양사는 1억 달러(약 1천464억원) 이상의 매출을 목표로 한 대규모 전략적 파트너십을 체결하며 챗GPT 안에서 터보택스·퀵북스 등 주요 금융 서비스를 직접 이용할 수 있도록 통합한다. 다년간 파트너십을 통해 인튜이트의 핵심 금융 애플리케이션들이 챗GPT 플랫폼과 연동하고 개인·중소기업 고객을 지원할 계획이다. 이번 계약을 통해 오픈AI는 1억 달러(약 1천464억원) 이상 규모의 수익을 올릴 것으로 예상되며 인튜이트는 오픈AI의 프론티어 모델을 자사 서비스 전반에 적용해 현금흐름 예측, 세무 준비, 급여 관리 등 다양한 인공지능(AI) 기반 자동화 기능을 강화할 예정이다. 이번 협력의 목표는 챗GPT를 단순한 대화형 도구를 넘어 실제 금융 의사결정을 도와주는 개인 슈퍼 어시스턴트로 발전시키는 데 있다. 인튜이트 앱들은 앞으로 챗GPT 내에서 직접 실행할 수 있게 돼 사용자들은 세금 환급 추정, 적합한 신용 상품 추천, 세금 전문가 연결 등 다양한 금융 활동을 챗GPT 안에서 바로 처리할 수 있다. 인튜이트의 금융 데이터·신용 모델과 오픈AI 모델이 결합하며 개인과 중소기업을 위한 예측 기반 금융 서비스가 한층 강화될 것이라는 전망이 나온다. 기업 사용자를 위한 기능도 확대된다. 퀵북스·메일침프 등 인튜이트의 주요 비즈니스 앱은 실시간 비즈니스 데이터를 기반으로 맞춤형 현금흐름 개선 인사이트를 제공하고 고객 도달 기능을 자동화해 생산성과 수익성을 높이도록 설계된다. 이번 계약에는 인튜이트의 챗GPT 엔터프라이즈 활용도 포함됐다. 인튜이트 직원들은 최신 챗GPT 모델을 활용해 생산성을 강화하고 회사 차원에서는 챗GPT 외에도 서드파티 거대언어모델(LLM) 활용과 자체 모델 개발을 병행할 예정이다. 사산 구다르지 인튜이트 최고경영자(CEO)는 "이번 협력은 우리의 독점 금융 데이터, 신용 모델, AI 플랫폼 역량을 오픈AI의 최첨단 모델과 결합해 사용자들에게 필요한 금융 우위를 제공할 것"이라고 말했다.

2025.11.19 10:20한정호

인핸스, 국군재정관리단과 AI 기술 협력…국방 혁신 가속

인핸스가 국방 분야 인공지능(AI) 혁신에 앞장선다. 인핸스는 국군의 날을 맞이해 국군재정관리단과 AI 기술 협력을 위한 전략적 업무협약을 체결했다고 18일 밝혔다. 국군재정관리단은 국방 예산의 집행과 재정 분야의 효율적 관리를 담당하는 국방부 산하 기관이다. 이번 협약은 국방 분야의 AI 전환을 가속화하고 국군재정관리단 업무에 최신 AI 기술을 적용하기 위해 마련됐다. 양 기관은 이번 협약으로 국군재정관리단 AI 에이전트 모델 및 프로세스 적용 등 다양한 분야에서 상호 협력할 예정이다. 이번 협력은 민간 기업의 AI 기술력과 국방 조직의 전문성을 결합한 상생 협력 모델로 평가된다. 이번 협약을 통해 양 기관은 민·관 협업 기반을 더욱 강화하고 국방 재정 업무의 AI 전환을 가속화할 수 있는 기반을 마련할 계획이다. 이승현 인핸스 대표는 "국군재정관리단과의 협력을 통해 국방 분야의 AI 혁신에 기여할 수 있게 돼 기쁘게 생각한다"며 "민간 기업의 AI 기술력과 국방 조직의 전문성이 결합된 모범적인 상생 협력 사례를 만들어가겠다"고 밝혔다.

2025.11.18 18:06한정호

  Prev 1 2 3 4 5 6 7 8 9 10 Next  

지금 뜨는 기사

이시각 헤드라인

"쿠팡 등 미국 상장사 건들지마"...美 트럼프 행정부, 韓 규제 발끈

이렇게 화려한 포토존 봤나요...IPX '조앤프렌즈' 팝업 가보니

장원영 렌즈 '하파크리스틴' 매장, 뭐가 다를까 들어갔더니

전동화 속도 줄고 SDV는 격차…딜레마 빠진 현대차

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.