• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
창간특집
인공지능
배터리
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'아마존 노바'통합검색 결과 입니다. (7건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

"목소리에 영혼 담겼다"…아마존, 음성 모델 '노바 소닉' 공개

아마존이 사용자 말투와 감정 변화까지 실시간 반영할 수 있는 음성 기반 인공지능(AI) 모델을 공개했다. 9일 아마존은 자사 AI 플랫폼 '아마존 베드록'을 통해 음성 이해와 생성을 통합한 모델 '노바 소닉(Nova Sonic)'을 공식 홈페이지를 통해 발표했다. 이 모델은 고객 서비스와 여행, 헬스케어, 교육 등 산업 분야에서 음성 기반 AI 서비스에 활용된다. 기존 음성 애플리케이션은 음성 인식과 텍스트 처리, 음성 생성 등 기능별로 나뉜 모델을 결합해 사용해야 했다. 이는 시스템 복잡성를 높이고 대화의 자연스러움과 맥락 유지에 한계가 생길 수 있다. 노바 소닉은 음성의 맥락, 말투, 말하는 스타일까지 한 모델에서 반영할 수 있도록 설계됐다. 입력된 음성의 음향 정보를 인식하고, 그에 어울리는 응답을 실시간으로 생성하는 방식이다. 망설임이나 말 끊김, 어조 변화 등 대화의 미묘한 차이를 인지하고 반응할 수 있다. 예를 들어 노바 소닉 기반 여행용 AI 어시스턴트는 사용자의 감정 변화에 따라 목소리 톤과 응답 방식을 조정할 수 있다. 노바 소닉은 텍스트 전사 기능도 갖췄다. 개발자는 이 기능을 통해 음성 입력 데이터 기반으로 외부 API를 호출하거나 여러 툴과 연계한 서비스를 만들 수 있다. 항공편 실시간 조회, 일정 예약, 고객 응대 자동화 등 고차원 작업이 가능한 셈이다. 아마존은 노바 소닉의 추론 속도가 빠르다고 강조했다. 거대언어모델(LLM)과 달리 실시간 응답성에 최적화됐다는 이유에서다. 이에 엔터프라이즈 환경에서도 손쉬운 도입이 가능하다고 강조했다. 아마존은 "노바 소닉은 단일 모델로 음성의 이해와 생성을 모두 처리하는 최초의 시도 중 하나"라며 "향후 음성 기반 AI 기술의 방향성을 제시할 것"이라고 밝혔다.

2025.04.09 16:46김미정

"오픈AI·앤트로픽 겨냥"…아마존, 신형 AI 모델 '노바 액트' 출시

아마존이 에이전트 인공지능(AI) 시장에 뛰어들며 웹 기반 자동화 기술 고도화에 나섰다. 기존 거대언어모델(LLM)이 대화 응답에 머물렀던 한계를 넘어서 사람을 대신해 실제 작업을 수행하는 범용 에이전트 구현에 속도를 내는 행보다. 오픈AI, 앤트로픽, 마누스 등 주요 기업들이 각축전을 벌이는 가운데 아마존도 차세대 AI 주도권을 겨냥해 본격 경쟁에 가세한 모습이다. 2일 테크크런치 등 외신에 따르면 아마존은 신형 AI 모델 '노바 액트(Nova Act)'를 연구용 프리뷰 형태로 공개했다. 해당 모델은 웹 브라우저 내에서 사용자 대신 클릭, 입력, 전환 등 복잡한 작업을 자동으로 수행할 수 있는 기능을 갖췄으며 개발자용 소프트웨어 개발 키트(SDK)는 아마존 노바 공식 홈페이지를 통해 제공된다. '노바 액트'는 기존 LLM 기반 시스템과 달리 화면의 버튼, 드롭다운, 달력 등의 유저인터페이스(UI) 요소를 실제로 식별하고 조작할 수 있다. 이를 통해 애플리케이션 프로그램 인터페이스(API) 연동이 어려운 환경에서도 사람처럼 브라우저를 탐색하고 양식을 제출하거나 예약을 완료하는 식의 멀티스텝 작업이 가능해진다. 아마존은 이 모델이 내부 기준 벤치마크에서 경쟁 제품 대비 높은 정확도를 기록했다고 밝혔다. 실제로 '스크린스팟 웹 텍스트', '스크린스팟 웹 아이콘', '그라운드 UI 웹' 테스트에서 각각 0.939, 0.879, 0.805의 점수를 기록한 것으로 알려졌다. 이는 오픈AI와 앤트로픽 기반 모델보다 높은 수치다. 개발자는 SDK를 활용해 "보험 추가는 하지 마세요"처럼 아주 구체적인 지시를 단계별로 입력할 수 있다. 브라우저를 실제로 조작하는 자동화 도구인 플레이라이트도 함께 사용할 수 있고 파이썬 코드를 이용해 여러 작업을 동시에 처리하거나 중간 점검을 넣는 것도 가능하다. 아마존은 앞으로 '노바 액트'를 보다 똑똑하게 만들기 위해 다양한 환경에서 스스로 학습하는 방식인 강화학습을 점차 확대해 나갈 계획이다. 이 모델은 추후 음성 비서 '알렉사+'에도 통합돼 "내일 휴가 내줘" 같은 음성 명령만으로 사내 포털 로그인부터 양식 작성, 일정 등록까지 자동화할 수 있도록 한다는 구상이다. 이미 '매주 화요일 저녁 샐러드 자동 주문'과 같은 반복 작업을 에이전트가 수행하는 사례도 내부 프로토타입에서 구현된 바 있다. 다만 현장 반응은 엇갈린다. 미국 직장인 커뮤니티 블라인드에서는 한 아마존 직원이 "노바 모델로 시작한 '알렉사+'는 정확도가 20%에 불과했고 기본적인 일조차 제대로 못 했다"고 밝혔다. 또 다른 아마존 직원은 "우리는 너무 뒤처져 있고 이렇게 돈만 쓰는 게 민망하다"고 평가했다. 반대로 "텍스트 생성은 충분히 괜찮고 이미지 생성은 매우 우수하다"는 긍정적인 의견도 올라왔다. 또다른 직원은 "어차피 반복하면서 개선하면 된다"며 개선 가능성에 무게를 뒀다. 아마존은 공식 발표문에서 "복잡한 다단계 작업을 똑똑하고 신뢰성 있게 수행하려면 에이전트는 다양한 유용한 환경에서 강화학습을 통해 훈련돼야 한다고 믿는다"며 "이 여정에 함께할 개발자들과 빠르게 피드백을 주고받을 것"이라고 말했다.

2025.04.02 18:22조이환

AWS, 아태·EU에 '아마존 노바' 출시…"더 똑똑하고 저렴"

아마존웹서비스(AWS)가 새 인공지능(AI) 모델로 아시아·태평양, 유럽 고객사 확보에 나섰다. AWS는 차세대 파운데이션 모델(FM) '아마존 노바(Amazon Nova)'를 아태지역과 유럽EU 지역에 출시했다고 7일 밝혔다. 아마존 노바는 서울과 도쿄, 뭄바이, 싱가포르, 시드니, 스톡홀름, 프랑크푸르트, 아일랜드, 파리 리전을 통해 교차 리전 추론을 지원한다. 이를 통해 고객 요청을 소스 리전 우선으로 처리하면서도 여러 리전에 자동 분산해 지연 시간을 줄일 수 있다. 요금은 소스 리전 기준으로만 부과돼 추가 비용 부담이 없다. 아마존 노바는 세 가지 모델로 구성된다. '아마존 노바 마이크로'는 텍스트 전용 모델로 저비용 고속 응답을 지원한다. '아마존 노바 라이트'는 텍스트뿐 아니라 이미지와 비디오 입력을 처리할 수 있는 멀티모달 모델이다. '아마존 노바 프로'는 정확성 속도 비용의 균형을 갖춘 고성능 멀티모달 모델로 설계됐다. 노바 시리즈는 200개 이상의 언어를 지원하며, 텍스트와 영상 미세 조정을 할 수 있다. AWS는 이를 '아마존 베드록'에 통합해 기업이 자체 데이터·애플리케이션과 쉽게 연계할 수 있게 돕는다. 특히 아마존 베드록 날리지 베이스를 활용해 조직별 맞춤형 AI 응답을 생성도 가능하다. AWS는 아마존 노바 모델이 기존 아마존 베드록 내 유사 성능 모델 대비 최소 75% 저렴하다고 밝혔다. 또 베드록 내 가장 빠른 모델이며 낮은 비용을 동시에 실현했다고 평가했다. 아마존 노바는 맞춤형 미세 조정을 지원한다. 사용자가 특정 데이터를 입력해 모델을 학습시키면 보다 높은 정확도의 응답을 받을 수 있다. 또 대형 고성능 모델에서 소형 모델로 지식을 전달하는 증류 기법도 제공돼 실행 속도 향상과 비용 절감이 가능하다. 모델에 검색증강생성(RAG) 기술도 포함됐다. 아마존 베드록 날리지 베이스와 연계해 조직의 자체 데이터에 기반한 응답을 생성할 수 있도록 설계됐다. 다단계 작업 수행이 필요한 에이전트 애플리케이션에도 최적화돼 조직 내부 시스템과 유기적으로 연계된다. AWS는 이미 여러 기업이 아마존 노바 모델을 활용하고 있다고 밝혔다. SAP는 AI 코어 인프라 내 생성형 AI 허브에 아마존 노바를 포함했다. 딜로이트는 고객 맞춤형 AI 솔루션 개발에 아마존 노바 모델을 활용 중이다. 팔란티어테크놀로지스는 자사 AI 플랫폼과 통합해 공급망·보험 에이전트 업무의 효율성 높이기에 나섰다. AWS는 이번 모델 출시와 함께 'AWS AI 서비스 카드'를 도입해 사용 사례와 제한 사항을 명확히 하고 책임 있는 AI 개발을 위한 가이드라인을 제공할 계획이다. AWS 로힛 프라사드 일반인공지능(AGI) 수석부사장은 "아마존 내부에서만 1천개 이상의 생성형 AI 애플리케이션이 개발되고 있다"며 "아마존 노바 모델은 지연 시간 비용 효율성 맞춤화 검색 증강 생성 에이전트 기능에서 의미 있는 진전을 이루고자 한다"고 말했다.

2025.03.07 14:34김미정

"고객 AI 수익창출 돕겠다"…AWS, 자체 GPU 공급·개발 인프라 강화

"인공지능(AI)을 단순히 클라우드에 올리는 것만으로 충분하지 않습니다. 클라우드상에서 AI가 잘 작동하는 환경을 구축하는 것이 핵심입니다. 아마존웹서비스(AWS)는 자체 모델과 애플리케이션, 인프라를 통해 AI에 최적화된 환경을 제공하겠습니다. 이를 통해 고객이 AI로 돈 벌 수 있게 돕겠습니다." 함기호 AWS코리아 대표는 5일 서울 AWS코리아 오피스에서 열린 신년 간담회에서 국내 사업 전략을 이같이 밝혔다. 고객이 생성형 AI로 실질적인 비즈니스 가치 창출할 수 있도록 지원하겠다는 설명이다. 그는 AI를 클라우드에 마이그레이션하는 것만으론 충분하지 않다고 주장했다. 기업이 생성형 AI로 실질적인 비즈니스 가치를 창출하려면 모더나이제이션이 필수 요소라고 강조했다. 마이그레이션은 단순히 기존 시스템을 클라우드로 옮기는 단계다. 반면 모더나이제이션은 클라우드 환경이 최대한 활용될 수 있도록 시스템을 개선하는 과정이다. 함 대표는 올해 모더나이제이션 지원을 확대하겠다고 밝혔다. 우선 SAP와 협력을 강화한다. VM웨어 기반 시스템 마이그레이션 지원도 본격화한다. 또 생성형 AI 기반 마이그레이션 솔루션을 제공한다. 산업별 특화 파트너십까지 확대해 맞춤형 AI 솔루션을 공급할 방침이다. AWS코리아는 올해도 생성형 AI를 최우선 전략으로 삼았다. 이를 위해 그래픽처리장치(GPU) 공급을 원활히 한다고 밝혔다. 함 대표는 "자체 개발한 트레이니움(Trainium)과 인퍼런시아(Inferentia) 칩을 통해 고객의 AI 훈련·추론 비용을 절감할 것"이라며 "엔비디아 GPU 의존도까지 낮출 것"이라고 강조했다. 그는 "현재 트레이니움 기반 AI 훈련은 대규모 학습이 필요한 기업 중심으로 활용이 확대되고 있는 추세"라며 "국내 기업과 협력해 트레이닝 테스트·파일럿 프로젝트를 수행 중"이라고 설명했다. 이어 "조만간 구체적인 결과를 공유할 수 있을 것"이라고 덧붙였다. AWS코리아는 아마존 파운데이션 모델 '노바'와 개발자용 AI 애플리케이션이 국내 시장에서 더 활성화될 것으로 봤다. 그는 "노바는 타 모델에 비해 저렴한 비용과 빠른 성능을 갖췄다"며 "특히 한국어 지원에 대한 고객 피드백이 긍정적이다"고 설명했다. 이어 "현재 한국 고객들 사이에서 노바 수요가 늘고 있다"며 "추후 프리미엄 모델까지 공개할 예정"이라고 덧붙였다. 그는 개발 애플리케이션 '아마존Q 디벨로퍼'와 '아마존Q 비즈니스'를 통해 AI와 데이터 분석 영역 연계를 더 확장할 것이라고 설명했다. "공공클라우드 사업 구상 중"…아마존 한국 투자 내용은 비공개 함 대표는 공공클라우드 사업과 국가AI컴퓨팅센터 참여 계획을 언급했다. 정부는 지난해 국가정보원의 클라우드 보안인증제(CSAP)를 개선하고, 금융 분야의 망 분리 규제를 완화한다고 발표했다. CSAP는 해외 클라우드 기업이 국내 공공기관에 서비스를 제공하려면 취득해야 하는 보안요건이다. 현재 구글클라우드와 마이크로소프트는 한국인터넷진흥원(KISA)의 클라우드 서비스 보안인증제(CSAP)에서 '하' 등급을 받았다. 이에 국내 공공기관 대상으로 클라우드 서비스 제공 기반을 마련했다. 현재 AWS도 하 등급을 신청한 상태다. 함 대표는 "정부 가이드라인과 시체계에 맞춰 오랜 기간 동안 공공클라우드 사업 준비를 해오고 있다"며 "원활히 준비가 진행되고 있다"고 말했다. 또 국가AI컴퓨팅센터 관련해서는 "사업 내용을 정확히 확인할 필요가 있다"며 "정부 관계자들과 긴밀한 협력을 통해 계획을 세워야 효력이 생길 수 있을 것 같다"고 덧붙였다. 함 대표는 아마존의 국내 투자 계획을 공유했다. 앞서 아마존은 2027년까지 한국 클라우드 컴퓨팅 인프라에 약 7조9천억원을 투자하겠다고 밝힌 바 있다. 자금은 데이터 센터 확장 및 재생 가능 에너지 구매에 활용된다. 앞서 SK E&S 손잡고 60메가와트급 재생에너지를 확보한 바 있다. 시각장애인과 청각장애인을 위한 AI 기반 지원 프로그램 운영에도 자금이 활용될 예정이다. 그는 "올해 구체적인 투자 규모나 용처에 대해 공유할 수 있는 사항이 제한적"이라며 "다만 데이터 센터 확장·재생 가능 에너지 구매는 반드시 포함될 것"이라고 말했다.

2025.03.05 13:21김미정

AWS, 2025년 클라우드 핵심 트렌드 발표… 생성형 AI·스토리지·자동화 강화

아마존웹서비스(AWS)가 2025년을 주도할 클라우드 트렌드로 생성형 인공지능(AI)앱 확산과 멀티모달 AI, 생산성 향상 서비스 강화, 스토리지 혁신 등을 선정했다. 해당 트렌드는 지난해 12월 실시한 AWS 리인벤트의 주요 발표 내용과 이슈를 중심으로 선정됐다. 4일 AWS는 글로벌 기술 컨퍼런스인 AWS 리인벤트의 주요 내용을 소개하는 AWS 리인벤트 리캡(re:Invent recap) 온라인 세미나를 개최했다. 이번 리인벤트 리캡은 AWS 리인벤트 2024에 참여한 AWS 히어로들이 향후 클라우드 및 AI 시장의 핵심 흐름을 제시했다. AWS 히어로는 클라우드 기술에 대한 활발한 지식 공유를 통해 개발자 커뮤니티에 많은 영향을 제공한 전문가들이다. 이번 세미나에는 서버리스 히어로인 당근의 변규현 ML 데이터 플랫폼 엔지니어와 머신러닝 히어로 카카오스타일 소성운 AI 추천검색 총괄리더 그리고 커뮤니티 히어로인 무신사의 신재현 SRE 엔지니어가 참석했다. 이들은 각자의 실무 경험을 기반으로 생성형 AI의 실용화, 대규모 데이터 분석의 필요성, 개발자의 생산성을 높이는 자동화 기술의 도입, 보안 강화를 위한 데이터 보호 및 관리 방안을 중점적으로 평가했다. 변규현 엔지니어는 스토리지, 데이터베이스, 컴퓨팅 인프라 등 클라우드의 기본 서비스에 대한 지원이 개선됐다고 강조했다. 그는 "지난 수년간 AI에 대한 폭발적인 관심으로 인해 기존 서비스가 소홀해졌다는 의견이 있었는데 이번 발표를 통해 이를 불식시킬 수 있을 것 같다"고 설명했다. AWS는 지속적인 하드웨어 투자를 통해 ARM기반의 4세대 그라비톤 칩을 예고했다. 이 프로세서는 데이터베이스나 웹 앱 구동시 이전 세대에 비해 각 40%, 30% 향상된 성능을 지원한다. EC2 I8g 인스턴스는 스토리지 집약적인 워크로드로 컴퓨팅과 스토리지 부문에서 각 60%와 65%의 성능향상을 기록했다. AWS는 데이터 보호 및 관리 기능을 강화한 새로운 스토리지 서비스인 아마존 S3 테이블 서비스도 발표했다. 기존 S3 대비 3배 빠른 처리량, 10배 높은 TPS를 지원하며, 대규모 데이터 분석 및 AI 학습을 위한 최적화된 스토리지 서비스다. AWS 내 다른 계정으로 EFS 데이터를 자동 복제하여 보안과 재해 복구(DR)를 강화할 수 있는 EFS 크로스 어카운트 복제 기능도 선보인다. 또한, S3 메타데이터 자동 관리 기능을 통해 AI 및 데이터 분석을 위한 자동 메타데이터 생성 및 SQL 쿼리 기능을 제공한다. 새로운 서버리스 분산형 SQL 데이터베이스인 아마존 오로라 DSQL도 소개했다. 이 데이터베이스는 3개의 가용영역(AZ)에서 액티브-액티브인 단일 리전 클러스터를 제공하여 복제 지연과 기존 데이터베이스 장애 조치 작업을 최소화한다. 이를 통해 일관성을 강화하며 기존보다 4배 높은 속도를 지원한다. 변규현 엔지니어는 "오로라 DSQL은 리전간 원자시계 수준의 시간 싱크와 락이 없는 방식을 이용해 멀티리전간 빠른 읽기와 쓰기를 지원하며 서버리스 구성으로 활용하기 간단하다"고 설명했다. 이어 "당근도 글로벌 서비스를 시작한 만큼 이런 서비스에 대해 관심있게 눈여겨 보려 한다"고 말했다. 소성운 총괄리더는 생성형AI가 본격적으로 비즈니스 가치 실현에 나서는 기업이 늘어날 것으로 예상하며 이를 위한 서비스로 아마존 노바 시리즈를 소개했다. 아마존 노바는 AWS가 리인벤트 2024에서 발표한 자체 개발 생성형AI 모델로 멀티모달 AI 기능을 지원하는 것이 특징이다. 텍스트, 이미지, 비디오까지 동시에 이해하고 생성할 수 있는 AI 모델로 AI 기반 추천 시스템, 검색 최적화, 콘텐츠 제작 등 다양한 분야에 활용할 수 있도록 개발됐다. 더불어 각 기업에 따른 다양한 요구사항에 맞춰 다양한 옵션을 제공한다. 노바 캔버스(Nova Canvas)는 초고해상도 이미지(최대 2000px)를 AI로 생성할 수 있어 마케팅 및 디자인 업무에서 유용하며, 노바 릴(Nova Reel)은 텍스트나 이미지를 입력하면 AI가 6초 길이의 짧은 비디오를 생성하는 기능으로 광고 및 소셜미디어 콘텐츠 제작에 활용될 수 있다. 완전관리형 생성AI 서비스 아마존 베드록은 100개 이상의 LLM을 지원하며 타 기업의 LLM 모델을 구독해 사용하는 등 개발 과정을 간소화하는데 초점을 맞춘 것이 특징이다. 신재현 엔지니어는 AI를 활용한 개발 생산성 향상 서비스를 주목했다. 아마존 Q 디벨로퍼는 AWS가 17년간 축적한 개발 데이터를 바탕으로 학습된 AI서비스로 개발자가 코드를 작성할 때 AI가 자동으로 코드 리뷰를 수행하고, 유닛 테스트를 생성해 주며, 프로젝트 문서도 자동으로 정리해 준다. 더불어 데이터 활용 중 외부 유출이나 잘못된 AI 학습 등을 방지하기 위한 AI 가드레일도 지원한다. 또한 자바 8/11로 작성된 코드를 자바 17로 변환하는 등 레거시 코드 변환 기능을 지원하며 자동 인프라 코드 생성 기능을 제공한다. 또한 테라폼과 클라우드포메이션을 지원해 개발자가 더 빠르고 효율적으로 인프라를 설정할 수 있도록 돕는다. EKS 자동 모드도 소개했다. 이 서비스는 개발자가 직접 설정하지 않아도 AWS가 자동으로 쿠버네티스 클러스터를 구성하고 최적의 리소스를 배치하는 서비스로 운영 부담을 줄이고 효율성을 높일 수 있다. 또한, AWS 람다 스냅스타트는 서버리스 함수가 실행될 때 발생하는 초기 지연 시간을 줄여 애플리케이션이 더 빠르게 실행되도록 지원한다. 그동안 자바만 지원했지만 이번 업데이트로 Python 및 .NET도 지원하도록 개선됐다. AWS의 윤석찬 수석테크에반젤리스트는 "AWS 리인벤트는 매년 전세계 6만여명이 모이는 글로벌 클라우드 기술 컨퍼런스로 2천개 이상의 강연과 워크샵으로 이뤄졌다"며 "리인벤트에서 발표된 신규 기능에 대해 AWS 리인벤트 리캡을 통해 확인하길 바란다"고 말했다.

2025.02.04 17:50남혁우

"AI 에이전트, 우리가 주도"…구글, 더 똑똑한 '제미나이 2.0'으로 승부수

구글이 멀티모달(복합 정보처리) 능력이 향상된 차세대 인공지능(AI) 모델을 앞세워 급성장하고 있는 'AI 에이전트(비서)' 시장 공략에 본격 나선다. 챗봇을 넘어 사용자 대신 행동까지 수행하는 'AI 에이전트'가 AI 시대의 새로운 트렌드로 자리 잡으면서 글로벌 빅테크들의 기술 경쟁도 한층 강화된 모습이다. 12일 블룸버그통신 등에 따르면 구글은 지난 11일(현지 시간) '제미나이 2.0'을 새롭게 출시했다. 구글의 새 AI 모델 출시는 올해 2월 '제미나이 1.5'를 내놓은 지 약 10개월 만이다. 자체 개발한 6세대 칩(TPU)인 '트릴리움(Trillium)'을 기반으로 구축된 '제미나이 2.0'은 구글이 지금까지 선보인 AI 모델 중 가장 뛰어난 성능을 가진 것으로 평가됐다. 텍스트는 물론 이미지와 동영상 기능을 갖춘 멀티모달 기능도 전작 대비 한층 더 개선된 것으로 나타났다. 주요 벤치마크에선 '제미나이1.5 프로'에 비해 속도가 2배 빠른 것으로 평가됐다. 구글은 이날부터 '제미나이2.0 플래시'를 개발자를 위한 플랫폼인 '구글 AI 스튜디오'와 기업용 플랫폼인 '버텍스 AI'에서 실험 모델로 제공한다. 이 중 '플래시' 모델은 울트라, 프로, 나노 등 매개변수 크기에 따른 제미나이 제품군 가운데 프로 모델을 경량화한 모델로, 지난 1.5 버전부터 선보였다. 구글은 '제미나이 2.0'의 고급 추론 기능을 10억 명이 이용하는 AI 검색 서비스 'AI 오버뷰'에도 적용할 예정이다. 수학 방정식이나 멀티모달 질문 및 코딩 등 더 복잡한 질문도 처리할 수 있도록 할 계획이다. 또 구글 검색을 시작으로 전 제품에 빠르게 '제미나이 2.0'을 적용될 계획이다. 순다 피차이 구글 최고경영자(CEO)는 "(이번 일로) 범용 어시스턴트라는 우리의 비전에 더 가까이 다가갈 수 있게 됐다"고 말했다. 구글은 '제미나이 2.0'을 기반으로 한 새로운 AI 에이전트도 이날 함께 선보였다. 실험 단계인 '프로젝트 마리너'는 '제미나이 2.0'을 탑재해 브라우저 화면을 이해하고 추론하는 등 복잡한 작업을 지원한다. 개발자를 위한 AI 에이전트 '줄스'는 코딩 작업을 도와준다. 지난 5월 선보인 '프로젝트 아스트라'에도 '제미나이 2.0'이 탑재됐다. 이에 따라 이용자와의 대화가 더욱 자연스러워지고 응답 속도가 빠르며 최대 10분간 대화 내용을 기억하는 등 기억력도 강화됐다. 또 다국어로 대화하는 것뿐 아니라 구글 검색과 구글 렌즈, 구글 맵스 등 다양한 기능도 활용할 수 있게 됐다. 구글은 제미나이 애플리케이션뿐 아니라 안경 형태의 폼팩터에서도 프로젝트 아스트라를 구현할 예정이다. 데미스 허사비스 구글 딥마인드 최고경영자(CEO)는 "'제미나이 2.0'은 다양한 기능 조합, 더욱 자연스러운 상호작용, 빠른 응답 속도, 복잡한 작업 처리 능력을 통해 완전히 새로운 차원의 에이전트형 기반 경험을 제공한다"며 "아직 항상 정확하지는 않고 작업을 완료하는 속도가 느리지만 시간이 지나며 빠르게 개선될 것"이라고 설명했다. 구글은 이날 '제미나이 2.0'을 장착해 복잡한 연구 보고서 작성을 도와주는 AI 어시스턴트 '딥 리서치'도 함께 공개했다. AI를 활용해 복잡한 주제를 탐구한 뒤 결과를 이해하기 쉬운 보고서로 제공하는 것이 특징이다. '딥 리서치'는 유료 구독제인 제미나이 어드밴스드를 통해 이용할 수 있다. 이번 일로 주요 글로벌 빅테크들의 AI 에이전트 경쟁은 한층 더 치열해질 것으로 보인다. 현재 AI 에이전트 개발에 두각을 나타내는 곳은 마이크로소프트(MS)로, 오픈AI와 손잡고 AI 비서 '코파일럿'을 공개한 데 이어 올해 11월에는 연례 행사인 '이그나이트 2024'를 통해 '자율형 AI 에이전트' 기술력을 뽐냈다. 아마존 역시 이달 초 개최한 'AWS 리인벤트 2024'에서 새로운 에이전트 기능을 선보여 눈길을 끌었다. 올해 공개한 기업용 AI 에이전트인 '아마존 Q 비즈니스'에 워크 플로우 자동화 기능을 추가한 것으로, 기업들이 사내 업무를 자동화 할 수 있게 만들었다. 이 외에 새 대규모언어모델(LLM) '노바'뿐 아니라 '노바 스피치 투 스피치 모델'과 '애니 투 애니 모델' 등 멀티모달 모델도 공개했다. 앤트로픽이 만든 AI 에이전트 기능 '컴퓨터 유즈'도 업계의 주목을 받고 있다. 이는 앤트로픽의 최신 AI 모델인 '클로드 3.5 소네트'를 기반으로 작동하는 AI 에이전트로, 키보드와 마우스 입력 등을 조작할 때 '인간처럼' 스스로 수행한다. '챗GPT' 등으로 AI 시장을 주도하고 있는 오픈AI도 코드명 '오퍼레이트'로 알려진 AI 에이전트 출시를 준비 중이다. 세라 프라이어 오픈AI 최고재무책임자(CFO)는 최근 파이낸셜타임스(FT)와의 인터뷰에서 "정보 수집과 예약, 상품 구매 등을 웹에서 실행하는 챗봇 비서 같은 'AI 에이전트'의 출시가 내년의 핵심 초점"이라며 "사람들의 일상을 돕는 매우 성공적인 에이전트가 배치되는 것을 보게 될 것"이라고 밝혔다. 이처럼 빅테크들이 AI 에이전트 시장에 경쟁적으로 나온 것은 성장성이 높아서다. 글로벌 시장조사기관 그랜드뷰리서치에 따르면 지난해 AI 에이전트 시장 규모는 약 58억2천만 달러로, 2030년까지 연평균 42.8% 성장할 것으로 전망된다. 2030년 시장 규모는 약 705억3천만 달러(약 100조원)로 전망된다. 하지만 해외 빅테크들과 달리 국내 업체들의 대응은 다소 더디다. 네이버, 카카오는 아직 본격적으로 서비스를 선보이지 못하고 있고, 통신사들이 운영하는 AI 에이전트는 부가 서비스 수준에 그치고 있다는 평가다. 업계 관계자는 "글로벌 빅테크들에 비해 국내 업체들의 움직임이 더디면서 AI 에이전트 시장에서 기술 격차가 더 벌어질 것으로 보인다"며 "빅테크들은 자체 LLM을 기반으로 다양한 AI 서비스 출시와 함께 수익화에 나서고 있지만, 국내 업체들은 갈수록 입지가 줄어드는 분위기"라고 말했다.

2024.12.12 10:03장유미

[인터뷰] AWS는 생성형AI 환각 어떻게 극복하고 있나

[라스베이거스(미국)=김미정 기자] "기업은 인공지능(AI) 모델을 선택할 때 정확도와 비용, 속도를 가장 많이 봅니다. 이중 정확도가 낮으면 나머지는 무용지물입니다. '아마존베드락'에 자동화 추론 기능을 추가한 이유입니다. 이는 타사 AI 시스템에 없는 정확도 측정 기술입니다. 이 기술은 답변 정확도 측정뿐 아니라 명확한 답변을 위한 명령어까지 추천합니다." AWS 셰리 마커스 생성형 AI 기술개발 총괄은 2~6일 미국 라스베이거스에서 열린 'AWS 리인벤트'에서 인터뷰를 통해 이같이 밝혔다. 마커스 총괄은 AWS 생성형 AI 제품 뒷단에 들어가는 가드레일, 에이전트, 검색증강생성(RAG) 등 기술 개발을 총괄하고 있다. 그는 '아마존베드락 추론 체크 자동화' 기능을 설명했다. 이번 AWS 리인벤트에서 처음 소개된 기능이다. 이 기술은 생성형 AI가 사용자 질문에 대한 답에 오류가 있는지 수학적으로 평가하고 명령어를 교정해 줄 수 있다. 해당 기능은 답변에 핵심 참조 내용이 포함됐는지, 질의 내용과 답변이 통일성 있는지, 답변과 질문 관련성이 얼마나 높은지를 동시에 측정한다. 답변에 오류가 섞이거나 답변 품질이 일정 기준 미만이면 사용자에게 답을 제공하지 않는다. 또 정확한 답변을 생성하기 위한 프롬프트를 사용자에게 추천해 주기도 한다. 자체적으로 명령어가 부실하다고 평가됐을 때 추가 정보를 요구하기도 한다. 마커스 총괄은 "생성형 AI를 통한 답변 정확도는 프롬프트 내용에 달렸다"며 "단순히 답변 수준을 체크하는 것을 넘어 프롬프트까지 교정해 준다"고 강조했다. 앞서 AWS는 아마존베드락 내 AI 모델에서 발생할 수 있는 환각현상 극복을 위해 노력해 왔다. 지난 8월 미국 뉴욕서 열린 AWS 행사에서 생성형 AI 결과물에 정확도 점수를 매기는 문맥 그라운딩 체크를 아마존베드락에 탑재한 바 있다. 베드락이 답변에 신뢰성·정확성 점수를 자체적으로 매겨 답변 품질을 평가하는 식이다. 마커스 총괄은 "문맥 그라운딩 체크는 답변 품질만을 평가하지만 신규 기능은 정확도 높은 답변을 위한 프롬프트까지 추천해 준다"며 "타사 AI 플랫폼에선 제공되지 않는 독보적 기능"이라고 설명했다. 이어 "고객은 의료, 금융, 방산 등 미션 크리티컬한 애플리케이션에 생성형 AI를 적용할 때 이 기능을 유용하게 사용할 것"이라며 "향후 아마존베드락 유스케이스가 늘어날 것으로 본다"고 내다봤다. "갓 태어난 '아마존 노바' 성능 객관적으로 증명할 것" 마커스 총괄은 이번 리인벤트서 공개된 새 AI 모델 시리즈 '아마존 노바'와 모델 신뢰성 향상을 위한 방안을 공유했다. 그는 "아마존 노바는 자사 거대언어모델(LLM) '타이탄' 확장판"이라며 "성능을 객관적으로 증명할 수 있도록 노력할 것"이라고 강조했다. 마커스 총괄은 노바를 비롯한 AI 모델 성능 검증 방식을 바꿔야 한다고 주장했다. 그동안 벤치마크 점수로 모델을 평가하는 시대는 끝났다는 설명이다. 대신 모델에 고객 데이터를 넣은 후 성능 평가하는 것이 진정한 성능 검증이라고 강조했다. 그는 "고객이 기대하는 정확성을 충족시키기 위해서는 모델 자체 성능만을 검증하면 안 된다"며 "고객 데이터를 모델에 넣고 정확도와 신뢰도를 측정해야 진짜다"고 재차 강조했다. 현재 마커스 총괄은 정확한 모델 성능 비교를 할 수 있는 도구를 개발하는 것을 목표로 잡았다. 그는 "고객은 AI 모델을 선택할 때 속도와 비용, 정확도를 가장 많이 본다"며 "이를 기준으로 성능 비교 가능한 도구 개발에 힘쓸 것"이라고 말했다.

2024.12.04 17:22김미정

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

TSMC 손 잡은 SK하이닉스, HBM4 로직 다이 비용 압박↑

美, EDA 업체 중국 수출 금지...K반도체에 영향은?

‘드론 100개 발사’...中 드론 항공모함, 다음 달 하늘 난다

"아이폰17, 전작과 동일한 A18칩·8GB 램 탑재"

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현