• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
2026전망
스테이블코인
배터리
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'아마존 노바'통합검색 결과 입니다. (8건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

"클로드·GPT 능가"…아마존, '노바 2' 시리즈 출시

아마존이 인공지능(AI) 모델 '노바' 시리즈를 업데이트하며 글로벌 AI 산업 경쟁력을 강화했다. 아마존은 미국 라스베이거스에서 열린 'AWS 리인벤트 2025'에서 프런티어급 노바 2 모델 시리즈와 기업 맞춤형 모델 구축 서비스 '노바 포지', 고신뢰성 AI 에이전트 구축 서비스 '노바 액트'를 공개했다고 4일 밝혔다. 새 노바 2 시리즈인 '노바 2 라이트' '노바 2 프로' '노바 2 옴니' '노바 2 소닉'는 여러 AI 영역에서 속도, 비용, 지능 간 균형을 제공하며 다양한 용도로 노바를 사용하는 수만 개 기업을 지원한다. 해당 모델은 고품질 콘텐츠 제작, 다단계 작업 자동화, AI 에이전트 개발 가속화 등에 활용된다. 노바 2 라이트는 일상적인 워크로드를 위한 빠르고 비용 효율적인 추론 모델이다. 텍스트와 이미지, 동영상을 입력으로 받아 처리할 수 있다. 아마존은 노바 2 라이트가 클로드 하이쿠 4.5, GPT-5 미니, 제미나이 2.5 플래시 등 경쟁 모델 대비 대다수 벤치마크에서 동등하거나 더 우수한 성능을 보였다고 강조했다. 노바 2 프로는 에이전트 코딩, 장기 계획 수립 등 최고 수준의 정확도가 필수적인 고난도 작업에 최적화된 모델이다. 노바 2 옴니는 텍스트와 이미지, 동영상, 음성 입력을 처리하면서 텍스트와 이미지를 모두 생성할 수 있는 업계 최초 통합 멀티모달 모델로 평가받는다. 이 모델은 전체 제품 카탈로그, 긴 동영상 등 수백 페이지의 문서를 한 번에 동시 분석할 수 있어, 여러 특화 모델을 연결하는 데 따르는 비용과 복잡성을 제거했다. 노바 2 소닉은 인간과 유사한 실시간 대화형 AI 구현을 위한 스피치-투-스피치 모델이다. 아마존은 이 모델이 오픈AI의 GPT 리얼타임이나 제미나이 2.5 플래시 대비 높은 가성비와 품질을 제공한다고 밝혔다. 노바 포지는 기업이 자체 프런티어 AI 모델을 구축하도록 돕는 서비스다. 아마존은 여기에 '오픈 트레이닝'을 처음 도입했다. 이를 통해 고객은 사전 훈련, 중간 훈련 등 노바 모델 체크포인트에 대한 독점적 접근 권한을 얻을 수 있다. 또 데이터를 아마존 노바가 큐레이션한 데이터셋과 혼합해 훈련할 수 있다. 그 결과 노바의 첨단 역량에 각 조직의 깊이 있는 비즈니스 전문성이 결합된 맞춤형 모델인 '노벨라'가 나온다. 노바 액트는 웹 브라우저에서 작업을 수행하는 높은 신뢰성의 AI 에이전트를 구축하고 배포하는 신규 서비스다. 이 서비스는 브라우저 기반 사용자 인터페이스(UI) 자동화 작업에서 90%의 신뢰성을 기록했으며, 관련 벤치마크에서 경쟁 모델을 능가하는 성능을 보인다. 노바 액트는 시뮬레이션된 웹 환경에서 강화 학습을 통해 훈련돼, 고객관계관리(CRM) 시스템 업데이트나 웹사이트 기능 테스트 같은 UI 기반 워크플로에 활용 가능하다. 노바 2 라이트와 노바 2 프로 모델은 모두 웹 그라운딩과 코드 실행 기능을 내장해 응답이 훈련 데이터뿐 아니라 최신 사실에 기반하도록 보장한다. 시스코를 비롯한 지멘스, 트렐릭스 같은 기업들은 에이전트 기반 위협 탐지부터 동영상 이해에 이르기까지 노바 2 모델을 다양한 애플리케이션에 사용하고 있다. 또 부킹닷컴, 레딧, 소니 등은 노바 포지를 사용해 조직 고유의 요구사항을 충족하는 자체 모델을 구축 중이다. 크리스 슬로우 레딧 최고기술책임자(CTO)는 "노바 포지를 사용해 우리 콘텐츠 모더레이션 시스템을 더욱 통합된 형태로 개선하고 있다"며 "여러 전문 머신러닝 워크플로를 통합된 접근 방식으로 대체할 수 있다는 점이 인상적"이라고 밝혔다.

2025.12.04 17:04김미정

AWS "엔비디아 GPU 대비 50% 비용 절감"…자체 AI칩 공개

아마존웹서비스(AWS)가 전력 효율성을 대폭 개선한 자체 인공지능(AI) 칩을 선보였다. 구글에 이어 AWS도 엔비디아가 사실상 독점해 온 AI 칩 시장 공략에 본격적으로 나설 것이라는 전망이 나온다. 더불어 초거대 AI 시대를 겨냥해 다수의 데이터센터를 연계하는 인프라 전략과 엔터프라이즈 업무에 최적화된 AI 에이전트 플랫폼을 앞세워 AI 분야 전반에서 선두 지위를 공고히 하겠다는 구상이다. 맷 가먼 AWS 최고경영자(CEO)는 2일(현지시간) 미국 라스베이거스에서 열린 리인벤트 2025 기조연설에서 "앞으로 기업 안에서는 수십억 개의 AI 에이전트가 업무를 수행하게 될 것"이라며 "AWS는 이 에이전트들을 떠받칠 인프라와 플랫폼을 제공하겠다"고 말하며 AI 비즈니스 전략을 제시했다. "트레이니엄3, 엔비디아 GPU 대비 50% 비용 절감" AWS는 초거대 AI 시대를 겨냥해 여러 데이터센터를 통합하는 차세대 인프라 청사진을 선보였다. 맷 가먼 CEO는 "예전에는 데이터센터가 새로운 컴퓨터라고 말하곤 했지만 초거대 AI 모델을 학습, 추론하고 수십억 개 에이전트를 동시에 운영하는 시대에는 이제 데이터센터 캠퍼스가 새로운 컴퓨터가 될 것"이라고 인프라 전망을 제시했다. 그는 급격하게 발전하는 AI와 이를 처리하기 위한 데이터 규모, 그리고 업무에 도입되는 AI 에이전트 사용량이 동시에 급증하면서 개별 서버 랙이나 단일 데이터센터만으로는 감당하기 어려운 상황이 벌어지고 있다고 설명했다. 이에 따라 다수의 데이터센터와 전용 전력·냉각·네트워크가 통합된 캠퍼스 단위를 하나의 거대한 AI 컴퓨터처럼 설계해야 한다는 것이다. 맷 가먼 CEO는 초거대 AI 인프라의 핵심은 칩과 서버, 그리고 이를 엮는 네트워크라고 강조하며 이를 위한 전용 제품으로 차세대 칩 '트레이니엄(Trainium) 3'과 이를 기반으로 한 울트라 서버를 공개했다. 트레이니엄3는 3나노 공정으로 제작된 AI칩으로 대규모 AI 환경에 맞춰 성능을 개선하고 소비 전력을 최소화한 것이 특징이다. 맷 가먼 CEO)는 "트레이니엄3는 대규모 AI 훈련과 추론 분야에서 업계 최고의 비용 효율성을 보인다"며 엔비디아의 GPU보다 AI 모델 훈련·운영 비용을 최대 50%까지 절감할 수 있다"고 강조했다. 울트라 서버는 수십만에서 수백만대의 AI칩을 연결하는 기업 환경에 맞춰 최대 144개 트레이니엄 3 칩을 한 번에 연결할 수 있는 구조로 개발됐다. 더불어 AWS가 직접 설계한 뉴런(Neuron) 스위치와 엘라스틱 패브릭 어댑터(EFA) 네트워크를 붙여 수십만 개 칩까지 스케일아웃이 가능하도록 설계한 것이 특징이다. 맷 가먼 CEO는 "단일 인스턴스가 수백 페타플롭스(FP)에 달하는 연산 성능과 수백 테라바이트/초 수준의 메모리 대역폭을 제공할 수 있다"고 소개했다. 소버린 AI 환경 조성을 위한 'AI 팩토리(AI Factories)' 전략도 공개했다. 데이터 공개가 제한되는 정부 조직이나 대형 기업이 보유한 자체 데이터센터 안에 GPU 서버와 베드록, 세이지메이커 등 AI 서비스를 통째로 제공하는 개념이다. 고객사에서 확보한 데이터센터 공간, 전력, 보안 환경은 그대로 유지하면서 프라이빗 AWS 리전에 가까운 전용 AI 존을 구축해 주는 방식이다. 퍼블릭 클라우드를 쓰기 어렵거나 데이터 주권·규제 이슈가 강한 영역에서도 동일한 AWS AI 인프라와 개발·운영 모델을 적용할 수 있도록 하겠다는 구상이다. 맷 가먼 CEO는 "AWS는 고객이 어느 나라, 어떤 규제 환경에 있든 동일한 수준의 AI 컴퓨팅 역량을 제공해 AI 시대의 기본 인프라 레이어가 되겠다"고 강조했다. 기업 특화 AI모델 '노바 포지'로 엔터프라이즈 저변 확대 AWS는 기업 업무 환경에 최적화한 생성형AI 모델 최신 버전은 노바 2를 공개했다. 노바2는 저비용·저지연 실무형 모델 노바 2 라이트와 복잡한 추론과 에이전트 워크플로에 맞춘 고성능 모델 '노바 2 프로', 실시간 음성 기반 인터페이스를 위한 '노바 2 소닉'으로 구성됐다. 노바 2는 문서 요약, 정보 추출, 코드 생성, 툴 호출, 데이터 분석 등 실제 기업에서 주로 활용하는 반복 업무를 빠르고 저렴하게 처리할 수 있는지에 초점을 맞춘 것이 특징이다. 가만 CEO는 "노바 2 라이트의 경우 클로드 하이쿠나 GPT 나노 등 경쟁사에 비해 도구 호출, 코드 생성, 문서 처리 영역에서 비슷하거나 우수한 성능을 유지하면서도 비용과 지연 시간을 줄였다고 강조했다. 고성능 모델 노바 2 프로는 복잡한 에이전트 시나리오에서 도구를 조합해 사용하는 능력과 추론 능력을 앞세워, 에이전트 기반 애플리케이션의 두뇌 역할을 맡도록 설계됐다. 이와 함께 기업 전용 AI 모델 '노바 포지'를 선보였다. 일반적인 미세조정 작업은 완성된 모델 위에 추가 데이터를 얹어 미세 조정하는 수준이지만 노바 포지는 프런티어 모델의 학습 과정 중간 단계에 기업 데이터를 깊게 섞어 넣는다는 점이 특징이다. 가먼 CEO는"어린 시절부터 언어를 배운 사람과, 성인이 된 뒤 뒤늦게 새로운 언어를 배우는 사람의 차이처럼, 모델도 학습 초기·중간 단계부터 도메인 데이터와 규정을 노출시켜야 해당 분야를 자연스럽게 이해하고 추론할 수 있다"고 노바포지의 특징을 설명했다. 그는 노바 포지로 학습한 모델이 커뮤니티 안전·콘텐츠 정책 준수 같은 복잡한 도메인에서 기존 파인튜닝 방식보다 더 높은 정확도와 일관성을 보였다고 소개했다. 아마존은 베드록 에이전트 코어를 비롯해 실무에 최적화된 AI 에이전트 제품군도 공개했다. 아마존 베드록 에이전트 코어는 기업용 AI 에이전트를 배포·운영하기 위한 일종의 운영체계로, 서버리스 기반 런타임과 단기·장기 메모리, 사내 시스템·데이터·외부 API 연계를 담당하는 게이트웨이, 인증·권한 관리, 관측 기능을 묶어 제공해 대규모 에이전트 서비스를 안정적으로 운영할 수 있게 한다. 키라 자율 에이전트는 개발자의 요청을 목표 단위로 받아들이고 코드베이스 전체를 분석해 작업을 쪼개 병렬로 수행하는 개발 전용 에이전트다. 가먼 CEO는 30명 개발자가 18개월간 수행해야 할 작업으로 예상된 한 대규모 프로젝트에 키라를 적극 활용한 결과 6명의 개발자가 76일 만에 마무리했다고 밝혔다. AWS 시큐리티 에이전트는 설계·개발·운영 전 단계에 걸쳐 보안 점검을 자동화하는 보안 전담 에이전트로 아키텍처 문서를 읽어 사내 보안 규정 준수 여부를 검토하고 코드 단계에서 취약점을 찾아 수정 코드를 제안하며, 운영 환경에서는 침투 테스트에 가까운 검사를 상시 수행한다. AWS 데브옵스 에이전트는 장애 대응과 성능 최적화를 돕는 운영 전용 에이전트로, 클라우드워치와 써드파티 모니터링 도구, CI/CD 파이프라인, 코드 저장소 데이터를 함께 분석해 서비스 토폴로지와 의존 관계를 파악하고, 경보 발생 시 로그·지표·최근 배포 내역을 엮어 잠재적 원인을 제시하는 역할을 맡는다. 소니·어도비 등 초거대 인프라 구축 초거대 인프라·모델·에이전트 플랫폼을 실제로 활용하고 있는 기업 사례도 소개됐다. 소니 그룹 존 코데라 CDO는 게임·음악·영화·애니메이션 등 다양한 엔터테인먼트 서비스 환경을 위해 그룹 전체에서 발생하는 하루 수백 테라바이트 규모의 데이터를 통합하고 분석하는 플랫폼 '데이터 오션'을 AWS 위에 구축했다고 설명했다. 이와 함께 노바 포지를 도입해 자체 문서, 규정, 심사 데이터를 AI에 학습시켜 문서 검토·준법 체크 작업 속도를 1백배 이상 향상시키는 것을 목표로 하고 있다. 어도비는 파이어플라이와 익스프레스, 애크로뱃 스튜디오 등 주요 서비스에서 활용하는 AI 기능을 AWS 인프라로 구현했다. 기업용 에이전트 플랫폼 스타트업 라이터는 AWS와의 파트너십을 통해 마스, 아스트라제네카, 퀄컴 등 대기업의 복잡한 업무 프로세스를 자동화했다고 밝혔다, 맷 가먼 CEO는 "AWS는 전 세계에서 가장 크고 가장 널리 배치된 AI 클라우드 인프라를 보유하고 있다"며 "수백만 고객사가 상상할 수 있는 거의 모든 유형의 워크로드가 AWS의 서비스 기반으로 운영 중으로 앞으로도 기업의 자동화를 지원하기 위해 행성 규모(planet scale) 인프라와 기업 전용 AI 플랫폼을 제공하겠다"며 비전을 제시했다.

2025.12.03 11:40남혁우

플로우·노바 등 북미만 쓰는 최신 AI, 나도 써보고 싶다면?

급격히 진화하는 인공지능(AI) 기술은 이제 기업의 경쟁력을 강화하고 개인의 역량을 확대하는 핵심 수단으로 자리잡았다. 생존을 위해 최신 AI 도구를 신속하게 도입하고 활용하는 것이 중요해진 동시에, 이를 위한 필수 요소로 가상사설망(VPN)이 떠오르고 있다. 구글을 비롯한 글로벌 빅테크 기업들이 대부분의 AI 신기능을 북미 지역에서 우선적으로 출시하고 있기 때문이다. 11일 관련 업계에 따르면 최근 구글이 발표한 생성형 AI 서비스 플로우(Flow)를 비롯해, 차세대 AI 프로젝트 마리너(Mariner), 아마존웹서비스(AWS)의 노바(Nova) 등은 북미 지역에서 제한적으로 서비스 중이다. 빅테크를 중심으로 차세대 AI 서비스가 빠르게 쏟아지고 있지만, 국내 사용자들은 정작 해당 서비스에 접속조차 하지 못하는 '서비스 격차' 현실에 직면하고 있다는 지적이 나온다. 구글의 플로우(Flow)는 텍스트 한 줄만으로 고품질 시네마틱 영상 시퀀스를 자동 생성할 수 있는 생성형 AI 도구다. 카메라 앵글, 렌즈, 장면 전환 효과까지 자동으로 적용되며, 대사와 배경음악, 효과음까지 삽입할 수 있어 개인이 영화를 만드는 것도 가능하다는 평가를 받고 있다. 특히 구글의 기존 영상·이미지·언어 생성 모델인 비오3(Veo 3), 이메진(Imagen), 제미나이(Gemini) 등을 통합해 보다 세밀하고 일관된 영상 표현이 가능한 상위 플랫폼으로 설계됐다. 단순한 영상 생성기를 넘어 창작 의도를 반영한 고도화된 시각 스토리텔링 구현이 가능한 도구로 평가받는다. 하지만 이 서비스는 현재 미국 내 가입자에게만 제공되며, 한국을 포함한 다수 국가에서는 사용이 제한된다. 마찬가지로 구글이 준비 중인 새로운 AI 검색·지식 작업 플랫폼 프로젝트 마리너' 역시 북미 사용자 대상으로만 초기 테스트가 진행되고 있다. 출시 일정과 지원 확대 계획은 미공개 상태다. AWS 역시 북미 시장을 중심으로 주요 기능을 우선 공개하고 있으며 일부 기능은 한국 리전에서는 사용할 수 없거나 제한적으로만 제공되고 있는 상황이다. 고급 AI 서비스 파운데이션 AI 노바(Nova) 역시 자연어 프롬프트로 텍스트, 코드, 이미지 등을 생성할 수 있는 범용 AI 서비스지만 국내 사용자 대상 공식 출시는 이뤄지지 않았다. 이처럼 글로벌 AI 트렌드를 선도하는 핵심 서비스들이 북미 중심으로 선출시되며, 국가 간 접근권 격차가 벌어지고 있는 현실이 드러나고 있다. 이는 단순한 마케팅 전략의 문제가 아니라, 데이터 센터 인프라, 규제 환경, 언어 지원, 보안 표준 등의 복합적 요인이 얽힌 구조적인 문제다. 이러한 장벽을 넘기 위한 현실적인 대안으로 VPN이 주목받고 있다. VPN은 사용자의 인터넷 접속 위치를 미국 등 지원 국가로 변경해주는 기술로 이를 통해 한국에서도 북미 전용 AI 서비스에 접속할 수 있게 된다. 하지만 단순한 VPN만으로 모든 문제가 해결되지는 않는다. 특히 플로우처럼 고용량의 영상·오디오 데이터를 실시간으로 생성·전송하는 도구는 VPN의 속도, 안정성, 보안 수준이 전반적인 사용 경험에 큰 영향을 준다. 접속 지연, 데이터 누락, 개인 정보 노출 등의 리스크를 방지하기 위해서는 신뢰성 높은 상용 VPN 선택이 필수적이다. 전문가들은 VPN을 선택할 때 고속 연결을 위한 프로토콜과 글로벌 서버 분산도, 암호화 수준, 개인정보 보호 정책 등을 종합적으로 검토할 것을 권장한다. 특히 업무나 콘텐츠 제작 등 민감한 데이터를 다루는 사용자라면, VPN은 단순한 도구가 아니라 업무 인프라의 핵심 구성 요소로 작동해야 한다는 인식 전환이 필요하다. 또한 무료 VPN의 경우, 사용자 활동 정보를 수집해 제3자에게 판매하는 사례도 있어 개인정보 유출 위험이 크다는 점에서 검증된 유료 서비스를 활용하는 것이 권장된다. 대표적으로 노드VPN은 전 세계 7천400개 이상의 서버를 십수년간 운영하며 안정성을 확보하고 AI 서비스에서 요구하는 높은 네트워크 속도를 지원하기 위한 노드링스(NordLynx)를 지원한다. 이와 함께 AES-256 암호화, 위협 방지 기능 등을 사용자 보호를 위한 기능도 강화했다. 한 소프트웨어(SW) 기업 임원은 "빠르게 변화하는 시장에서 앞선 트렌드를 읽고 경쟁 우위를 확보하려면 최신 AI 기술을 누구보다 먼저 경험해보는 것이 중요하다"며 "특히 북미 우선 출시가 많은 최신 AI 도구를 활용하려면 VPN은 더 이상 선택이 아닌, 기술 활용을 위한 필수 인프라로 자리잡고 있다"고 말했다.

2025.06.11 16:05남혁우

"목소리에 영혼 담겼다"…아마존, 음성 모델 '노바 소닉' 공개

아마존이 사용자 말투와 감정 변화까지 실시간 반영할 수 있는 음성 기반 인공지능(AI) 모델을 공개했다. 9일 아마존은 자사 AI 플랫폼 '아마존 베드록'을 통해 음성 이해와 생성을 통합한 모델 '노바 소닉(Nova Sonic)'을 공식 홈페이지를 통해 발표했다. 이 모델은 고객 서비스와 여행, 헬스케어, 교육 등 산업 분야에서 음성 기반 AI 서비스에 활용된다. 기존 음성 애플리케이션은 음성 인식과 텍스트 처리, 음성 생성 등 기능별로 나뉜 모델을 결합해 사용해야 했다. 이는 시스템 복잡성를 높이고 대화의 자연스러움과 맥락 유지에 한계가 생길 수 있다. 노바 소닉은 음성의 맥락, 말투, 말하는 스타일까지 한 모델에서 반영할 수 있도록 설계됐다. 입력된 음성의 음향 정보를 인식하고, 그에 어울리는 응답을 실시간으로 생성하는 방식이다. 망설임이나 말 끊김, 어조 변화 등 대화의 미묘한 차이를 인지하고 반응할 수 있다. 예를 들어 노바 소닉 기반 여행용 AI 어시스턴트는 사용자의 감정 변화에 따라 목소리 톤과 응답 방식을 조정할 수 있다. 노바 소닉은 텍스트 전사 기능도 갖췄다. 개발자는 이 기능을 통해 음성 입력 데이터 기반으로 외부 API를 호출하거나 여러 툴과 연계한 서비스를 만들 수 있다. 항공편 실시간 조회, 일정 예약, 고객 응대 자동화 등 고차원 작업이 가능한 셈이다. 아마존은 노바 소닉의 추론 속도가 빠르다고 강조했다. 거대언어모델(LLM)과 달리 실시간 응답성에 최적화됐다는 이유에서다. 이에 엔터프라이즈 환경에서도 손쉬운 도입이 가능하다고 강조했다. 아마존은 "노바 소닉은 단일 모델로 음성의 이해와 생성을 모두 처리하는 최초의 시도 중 하나"라며 "향후 음성 기반 AI 기술의 방향성을 제시할 것"이라고 밝혔다.

2025.04.09 16:46김미정

"오픈AI·앤트로픽 겨냥"…아마존, 신형 AI 모델 '노바 액트' 출시

아마존이 에이전트 인공지능(AI) 시장에 뛰어들며 웹 기반 자동화 기술 고도화에 나섰다. 기존 거대언어모델(LLM)이 대화 응답에 머물렀던 한계를 넘어서 사람을 대신해 실제 작업을 수행하는 범용 에이전트 구현에 속도를 내는 행보다. 오픈AI, 앤트로픽, 마누스 등 주요 기업들이 각축전을 벌이는 가운데 아마존도 차세대 AI 주도권을 겨냥해 본격 경쟁에 가세한 모습이다. 2일 테크크런치 등 외신에 따르면 아마존은 신형 AI 모델 '노바 액트(Nova Act)'를 연구용 프리뷰 형태로 공개했다. 해당 모델은 웹 브라우저 내에서 사용자 대신 클릭, 입력, 전환 등 복잡한 작업을 자동으로 수행할 수 있는 기능을 갖췄으며 개발자용 소프트웨어 개발 키트(SDK)는 아마존 노바 공식 홈페이지를 통해 제공된다. '노바 액트'는 기존 LLM 기반 시스템과 달리 화면의 버튼, 드롭다운, 달력 등의 유저인터페이스(UI) 요소를 실제로 식별하고 조작할 수 있다. 이를 통해 애플리케이션 프로그램 인터페이스(API) 연동이 어려운 환경에서도 사람처럼 브라우저를 탐색하고 양식을 제출하거나 예약을 완료하는 식의 멀티스텝 작업이 가능해진다. 아마존은 이 모델이 내부 기준 벤치마크에서 경쟁 제품 대비 높은 정확도를 기록했다고 밝혔다. 실제로 '스크린스팟 웹 텍스트', '스크린스팟 웹 아이콘', '그라운드 UI 웹' 테스트에서 각각 0.939, 0.879, 0.805의 점수를 기록한 것으로 알려졌다. 이는 오픈AI와 앤트로픽 기반 모델보다 높은 수치다. 개발자는 SDK를 활용해 "보험 추가는 하지 마세요"처럼 아주 구체적인 지시를 단계별로 입력할 수 있다. 브라우저를 실제로 조작하는 자동화 도구인 플레이라이트도 함께 사용할 수 있고 파이썬 코드를 이용해 여러 작업을 동시에 처리하거나 중간 점검을 넣는 것도 가능하다. 아마존은 앞으로 '노바 액트'를 보다 똑똑하게 만들기 위해 다양한 환경에서 스스로 학습하는 방식인 강화학습을 점차 확대해 나갈 계획이다. 이 모델은 추후 음성 비서 '알렉사+'에도 통합돼 "내일 휴가 내줘" 같은 음성 명령만으로 사내 포털 로그인부터 양식 작성, 일정 등록까지 자동화할 수 있도록 한다는 구상이다. 이미 '매주 화요일 저녁 샐러드 자동 주문'과 같은 반복 작업을 에이전트가 수행하는 사례도 내부 프로토타입에서 구현된 바 있다. 다만 현장 반응은 엇갈린다. 미국 직장인 커뮤니티 블라인드에서는 한 아마존 직원이 "노바 모델로 시작한 '알렉사+'는 정확도가 20%에 불과했고 기본적인 일조차 제대로 못 했다"고 밝혔다. 또 다른 아마존 직원은 "우리는 너무 뒤처져 있고 이렇게 돈만 쓰는 게 민망하다"고 평가했다. 반대로 "텍스트 생성은 충분히 괜찮고 이미지 생성은 매우 우수하다"는 긍정적인 의견도 올라왔다. 또다른 직원은 "어차피 반복하면서 개선하면 된다"며 개선 가능성에 무게를 뒀다. 아마존은 공식 발표문에서 "복잡한 다단계 작업을 똑똑하고 신뢰성 있게 수행하려면 에이전트는 다양한 유용한 환경에서 강화학습을 통해 훈련돼야 한다고 믿는다"며 "이 여정에 함께할 개발자들과 빠르게 피드백을 주고받을 것"이라고 말했다.

2025.04.02 18:22조이환

AWS, 아태·EU에 '아마존 노바' 출시…"더 똑똑하고 저렴"

아마존웹서비스(AWS)가 새 인공지능(AI) 모델로 아시아·태평양, 유럽 고객사 확보에 나섰다. AWS는 차세대 파운데이션 모델(FM) '아마존 노바(Amazon Nova)'를 아태지역과 유럽EU 지역에 출시했다고 7일 밝혔다. 아마존 노바는 서울과 도쿄, 뭄바이, 싱가포르, 시드니, 스톡홀름, 프랑크푸르트, 아일랜드, 파리 리전을 통해 교차 리전 추론을 지원한다. 이를 통해 고객 요청을 소스 리전 우선으로 처리하면서도 여러 리전에 자동 분산해 지연 시간을 줄일 수 있다. 요금은 소스 리전 기준으로만 부과돼 추가 비용 부담이 없다. 아마존 노바는 세 가지 모델로 구성된다. '아마존 노바 마이크로'는 텍스트 전용 모델로 저비용 고속 응답을 지원한다. '아마존 노바 라이트'는 텍스트뿐 아니라 이미지와 비디오 입력을 처리할 수 있는 멀티모달 모델이다. '아마존 노바 프로'는 정확성 속도 비용의 균형을 갖춘 고성능 멀티모달 모델로 설계됐다. 노바 시리즈는 200개 이상의 언어를 지원하며, 텍스트와 영상 미세 조정을 할 수 있다. AWS는 이를 '아마존 베드록'에 통합해 기업이 자체 데이터·애플리케이션과 쉽게 연계할 수 있게 돕는다. 특히 아마존 베드록 날리지 베이스를 활용해 조직별 맞춤형 AI 응답을 생성도 가능하다. AWS는 아마존 노바 모델이 기존 아마존 베드록 내 유사 성능 모델 대비 최소 75% 저렴하다고 밝혔다. 또 베드록 내 가장 빠른 모델이며 낮은 비용을 동시에 실현했다고 평가했다. 아마존 노바는 맞춤형 미세 조정을 지원한다. 사용자가 특정 데이터를 입력해 모델을 학습시키면 보다 높은 정확도의 응답을 받을 수 있다. 또 대형 고성능 모델에서 소형 모델로 지식을 전달하는 증류 기법도 제공돼 실행 속도 향상과 비용 절감이 가능하다. 모델에 검색증강생성(RAG) 기술도 포함됐다. 아마존 베드록 날리지 베이스와 연계해 조직의 자체 데이터에 기반한 응답을 생성할 수 있도록 설계됐다. 다단계 작업 수행이 필요한 에이전트 애플리케이션에도 최적화돼 조직 내부 시스템과 유기적으로 연계된다. AWS는 이미 여러 기업이 아마존 노바 모델을 활용하고 있다고 밝혔다. SAP는 AI 코어 인프라 내 생성형 AI 허브에 아마존 노바를 포함했다. 딜로이트는 고객 맞춤형 AI 솔루션 개발에 아마존 노바 모델을 활용 중이다. 팔란티어테크놀로지스는 자사 AI 플랫폼과 통합해 공급망·보험 에이전트 업무의 효율성 높이기에 나섰다. AWS는 이번 모델 출시와 함께 'AWS AI 서비스 카드'를 도입해 사용 사례와 제한 사항을 명확히 하고 책임 있는 AI 개발을 위한 가이드라인을 제공할 계획이다. AWS 로힛 프라사드 일반인공지능(AGI) 수석부사장은 "아마존 내부에서만 1천개 이상의 생성형 AI 애플리케이션이 개발되고 있다"며 "아마존 노바 모델은 지연 시간 비용 효율성 맞춤화 검색 증강 생성 에이전트 기능에서 의미 있는 진전을 이루고자 한다"고 말했다.

2025.03.07 14:34김미정

"고객 AI 수익창출 돕겠다"…AWS, 자체 GPU 공급·개발 인프라 강화

"인공지능(AI)을 단순히 클라우드에 올리는 것만으로 충분하지 않습니다. 클라우드상에서 AI가 잘 작동하는 환경을 구축하는 것이 핵심입니다. 아마존웹서비스(AWS)는 자체 모델과 애플리케이션, 인프라를 통해 AI에 최적화된 환경을 제공하겠습니다. 이를 통해 고객이 AI로 돈 벌 수 있게 돕겠습니다." 함기호 AWS코리아 대표는 5일 서울 AWS코리아 오피스에서 열린 신년 간담회에서 국내 사업 전략을 이같이 밝혔다. 고객이 생성형 AI로 실질적인 비즈니스 가치 창출할 수 있도록 지원하겠다는 설명이다. 그는 AI를 클라우드에 마이그레이션하는 것만으론 충분하지 않다고 주장했다. 기업이 생성형 AI로 실질적인 비즈니스 가치를 창출하려면 모더나이제이션이 필수 요소라고 강조했다. 마이그레이션은 단순히 기존 시스템을 클라우드로 옮기는 단계다. 반면 모더나이제이션은 클라우드 환경이 최대한 활용될 수 있도록 시스템을 개선하는 과정이다. 함 대표는 올해 모더나이제이션 지원을 확대하겠다고 밝혔다. 우선 SAP와 협력을 강화한다. VM웨어 기반 시스템 마이그레이션 지원도 본격화한다. 또 생성형 AI 기반 마이그레이션 솔루션을 제공한다. 산업별 특화 파트너십까지 확대해 맞춤형 AI 솔루션을 공급할 방침이다. AWS코리아는 올해도 생성형 AI를 최우선 전략으로 삼았다. 이를 위해 그래픽처리장치(GPU) 공급을 원활히 한다고 밝혔다. 함 대표는 "자체 개발한 트레이니움(Trainium)과 인퍼런시아(Inferentia) 칩을 통해 고객의 AI 훈련·추론 비용을 절감할 것"이라며 "엔비디아 GPU 의존도까지 낮출 것"이라고 강조했다. 그는 "현재 트레이니움 기반 AI 훈련은 대규모 학습이 필요한 기업 중심으로 활용이 확대되고 있는 추세"라며 "국내 기업과 협력해 트레이닝 테스트·파일럿 프로젝트를 수행 중"이라고 설명했다. 이어 "조만간 구체적인 결과를 공유할 수 있을 것"이라고 덧붙였다. AWS코리아는 아마존 파운데이션 모델 '노바'와 개발자용 AI 애플리케이션이 국내 시장에서 더 활성화될 것으로 봤다. 그는 "노바는 타 모델에 비해 저렴한 비용과 빠른 성능을 갖췄다"며 "특히 한국어 지원에 대한 고객 피드백이 긍정적이다"고 설명했다. 이어 "현재 한국 고객들 사이에서 노바 수요가 늘고 있다"며 "추후 프리미엄 모델까지 공개할 예정"이라고 덧붙였다. 그는 개발 애플리케이션 '아마존Q 디벨로퍼'와 '아마존Q 비즈니스'를 통해 AI와 데이터 분석 영역 연계를 더 확장할 것이라고 설명했다. "공공클라우드 사업 구상 중"…아마존 한국 투자 내용은 비공개 함 대표는 공공클라우드 사업과 국가AI컴퓨팅센터 참여 계획을 언급했다. 정부는 지난해 국가정보원의 클라우드 보안인증제(CSAP)를 개선하고, 금융 분야의 망 분리 규제를 완화한다고 발표했다. CSAP는 해외 클라우드 기업이 국내 공공기관에 서비스를 제공하려면 취득해야 하는 보안요건이다. 현재 구글클라우드와 마이크로소프트는 한국인터넷진흥원(KISA)의 클라우드 서비스 보안인증제(CSAP)에서 '하' 등급을 받았다. 이에 국내 공공기관 대상으로 클라우드 서비스 제공 기반을 마련했다. 현재 AWS도 하 등급을 신청한 상태다. 함 대표는 "정부 가이드라인과 시체계에 맞춰 오랜 기간 동안 공공클라우드 사업 준비를 해오고 있다"며 "원활히 준비가 진행되고 있다"고 말했다. 또 국가AI컴퓨팅센터 관련해서는 "사업 내용을 정확히 확인할 필요가 있다"며 "정부 관계자들과 긴밀한 협력을 통해 계획을 세워야 효력이 생길 수 있을 것 같다"고 덧붙였다. 함 대표는 아마존의 국내 투자 계획을 공유했다. 앞서 아마존은 2027년까지 한국 클라우드 컴퓨팅 인프라에 약 7조9천억원을 투자하겠다고 밝힌 바 있다. 자금은 데이터 센터 확장 및 재생 가능 에너지 구매에 활용된다. 앞서 SK E&S 손잡고 60메가와트급 재생에너지를 확보한 바 있다. 시각장애인과 청각장애인을 위한 AI 기반 지원 프로그램 운영에도 자금이 활용될 예정이다. 그는 "올해 구체적인 투자 규모나 용처에 대해 공유할 수 있는 사항이 제한적"이라며 "다만 데이터 센터 확장·재생 가능 에너지 구매는 반드시 포함될 것"이라고 말했다.

2025.03.05 13:21김미정

AWS, 2025년 클라우드 핵심 트렌드 발표… 생성형 AI·스토리지·자동화 강화

아마존웹서비스(AWS)가 2025년을 주도할 클라우드 트렌드로 생성형 인공지능(AI)앱 확산과 멀티모달 AI, 생산성 향상 서비스 강화, 스토리지 혁신 등을 선정했다. 해당 트렌드는 지난해 12월 실시한 AWS 리인벤트의 주요 발표 내용과 이슈를 중심으로 선정됐다. 4일 AWS는 글로벌 기술 컨퍼런스인 AWS 리인벤트의 주요 내용을 소개하는 AWS 리인벤트 리캡(re:Invent recap) 온라인 세미나를 개최했다. 이번 리인벤트 리캡은 AWS 리인벤트 2024에 참여한 AWS 히어로들이 향후 클라우드 및 AI 시장의 핵심 흐름을 제시했다. AWS 히어로는 클라우드 기술에 대한 활발한 지식 공유를 통해 개발자 커뮤니티에 많은 영향을 제공한 전문가들이다. 이번 세미나에는 서버리스 히어로인 당근의 변규현 ML 데이터 플랫폼 엔지니어와 머신러닝 히어로 카카오스타일 소성운 AI 추천검색 총괄리더 그리고 커뮤니티 히어로인 무신사의 신재현 SRE 엔지니어가 참석했다. 이들은 각자의 실무 경험을 기반으로 생성형 AI의 실용화, 대규모 데이터 분석의 필요성, 개발자의 생산성을 높이는 자동화 기술의 도입, 보안 강화를 위한 데이터 보호 및 관리 방안을 중점적으로 평가했다. 변규현 엔지니어는 스토리지, 데이터베이스, 컴퓨팅 인프라 등 클라우드의 기본 서비스에 대한 지원이 개선됐다고 강조했다. 그는 "지난 수년간 AI에 대한 폭발적인 관심으로 인해 기존 서비스가 소홀해졌다는 의견이 있었는데 이번 발표를 통해 이를 불식시킬 수 있을 것 같다"고 설명했다. AWS는 지속적인 하드웨어 투자를 통해 ARM기반의 4세대 그라비톤 칩을 예고했다. 이 프로세서는 데이터베이스나 웹 앱 구동시 이전 세대에 비해 각 40%, 30% 향상된 성능을 지원한다. EC2 I8g 인스턴스는 스토리지 집약적인 워크로드로 컴퓨팅과 스토리지 부문에서 각 60%와 65%의 성능향상을 기록했다. AWS는 데이터 보호 및 관리 기능을 강화한 새로운 스토리지 서비스인 아마존 S3 테이블 서비스도 발표했다. 기존 S3 대비 3배 빠른 처리량, 10배 높은 TPS를 지원하며, 대규모 데이터 분석 및 AI 학습을 위한 최적화된 스토리지 서비스다. AWS 내 다른 계정으로 EFS 데이터를 자동 복제하여 보안과 재해 복구(DR)를 강화할 수 있는 EFS 크로스 어카운트 복제 기능도 선보인다. 또한, S3 메타데이터 자동 관리 기능을 통해 AI 및 데이터 분석을 위한 자동 메타데이터 생성 및 SQL 쿼리 기능을 제공한다. 새로운 서버리스 분산형 SQL 데이터베이스인 아마존 오로라 DSQL도 소개했다. 이 데이터베이스는 3개의 가용영역(AZ)에서 액티브-액티브인 단일 리전 클러스터를 제공하여 복제 지연과 기존 데이터베이스 장애 조치 작업을 최소화한다. 이를 통해 일관성을 강화하며 기존보다 4배 높은 속도를 지원한다. 변규현 엔지니어는 "오로라 DSQL은 리전간 원자시계 수준의 시간 싱크와 락이 없는 방식을 이용해 멀티리전간 빠른 읽기와 쓰기를 지원하며 서버리스 구성으로 활용하기 간단하다"고 설명했다. 이어 "당근도 글로벌 서비스를 시작한 만큼 이런 서비스에 대해 관심있게 눈여겨 보려 한다"고 말했다. 소성운 총괄리더는 생성형AI가 본격적으로 비즈니스 가치 실현에 나서는 기업이 늘어날 것으로 예상하며 이를 위한 서비스로 아마존 노바 시리즈를 소개했다. 아마존 노바는 AWS가 리인벤트 2024에서 발표한 자체 개발 생성형AI 모델로 멀티모달 AI 기능을 지원하는 것이 특징이다. 텍스트, 이미지, 비디오까지 동시에 이해하고 생성할 수 있는 AI 모델로 AI 기반 추천 시스템, 검색 최적화, 콘텐츠 제작 등 다양한 분야에 활용할 수 있도록 개발됐다. 더불어 각 기업에 따른 다양한 요구사항에 맞춰 다양한 옵션을 제공한다. 노바 캔버스(Nova Canvas)는 초고해상도 이미지(최대 2000px)를 AI로 생성할 수 있어 마케팅 및 디자인 업무에서 유용하며, 노바 릴(Nova Reel)은 텍스트나 이미지를 입력하면 AI가 6초 길이의 짧은 비디오를 생성하는 기능으로 광고 및 소셜미디어 콘텐츠 제작에 활용될 수 있다. 완전관리형 생성AI 서비스 아마존 베드록은 100개 이상의 LLM을 지원하며 타 기업의 LLM 모델을 구독해 사용하는 등 개발 과정을 간소화하는데 초점을 맞춘 것이 특징이다. 신재현 엔지니어는 AI를 활용한 개발 생산성 향상 서비스를 주목했다. 아마존 Q 디벨로퍼는 AWS가 17년간 축적한 개발 데이터를 바탕으로 학습된 AI서비스로 개발자가 코드를 작성할 때 AI가 자동으로 코드 리뷰를 수행하고, 유닛 테스트를 생성해 주며, 프로젝트 문서도 자동으로 정리해 준다. 더불어 데이터 활용 중 외부 유출이나 잘못된 AI 학습 등을 방지하기 위한 AI 가드레일도 지원한다. 또한 자바 8/11로 작성된 코드를 자바 17로 변환하는 등 레거시 코드 변환 기능을 지원하며 자동 인프라 코드 생성 기능을 제공한다. 또한 테라폼과 클라우드포메이션을 지원해 개발자가 더 빠르고 효율적으로 인프라를 설정할 수 있도록 돕는다. EKS 자동 모드도 소개했다. 이 서비스는 개발자가 직접 설정하지 않아도 AWS가 자동으로 쿠버네티스 클러스터를 구성하고 최적의 리소스를 배치하는 서비스로 운영 부담을 줄이고 효율성을 높일 수 있다. 또한, AWS 람다 스냅스타트는 서버리스 함수가 실행될 때 발생하는 초기 지연 시간을 줄여 애플리케이션이 더 빠르게 실행되도록 지원한다. 그동안 자바만 지원했지만 이번 업데이트로 Python 및 .NET도 지원하도록 개선됐다. AWS의 윤석찬 수석테크에반젤리스트는 "AWS 리인벤트는 매년 전세계 6만여명이 모이는 글로벌 클라우드 기술 컨퍼런스로 2천개 이상의 강연과 워크샵으로 이뤄졌다"며 "리인벤트에서 발표된 신규 기능에 대해 AWS 리인벤트 리캡을 통해 확인하길 바란다"고 말했다.

2025.02.04 17:50남혁우

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

AI PC 확산 본격화... 새해도 GPU·NPU 성능 경쟁 예고

KT 위약금 면제 첫날 5800여명 이탈...시장은 눈치 싸움

엔씨 '아이온2', 달라진 '소통 운영'에 새해 전망도 '맑음'

정부, 쿠팡 사태에 "법적으로 가능한 모든 방안 조치"

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.