• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
  • AI의 눈
반도체
AI의 눈
디지털트러스트
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'그래비톤'통합검색 결과 입니다. (2건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

[AI 고속도로] "GPU 의존 낮춘다"…AWS 자체 칩 생태계, 핀터레스트 합류로 탄력

아마존웹서비스(AWS)가 자체 개발 칩을 앞세워 인공지능(AI) 인프라 시장에서 존재감을 키우고 있다. 생성형 AI 확산으로 그래픽처리장치(GPU) 수요가 폭증한 가운데 대규모 플랫폼 기업들이 비용 효율과 공급 안정성을 확보하기 위해 클라우드 사업자의 맞춤형 반도체를 선택하는 흐름이 강해지고 있어서다. 5일 AWS 공식 뉴스룸에 따르면 핀터레스트는 오는 2031년까지 AWS 클라우드 서비스에 40억 달러를 투입하는 장기 계약을 맺었다. 핀터레스트 역사상 최대 규모 인프라 계약이다. 양사는 2010년부터 협력 관계를 이어왔으며 이번 계약을 통해 AI 모델 학습·추론과 플랫폼 인프라 전반에서 협력을 확대한다. AWS 자체 칩 활용 확대도 이번 계약의 주요 축이다. 핀터레스트는 AWS 트레이니움으로 개인화 시각 검색과 AI 기반 발견 기능을 구동하는 대규모 언어모델(LLM)과 비전언어모델(VLM)을 운영할 계획이다. AWS 그래비톤 사용도 늘린다. 그래비톤은 이미 핀터레스트 컴퓨팅 인프라의 약 3분의 1을 담당하고 있다. 이처럼 핀터레스트가 AWS 자체 칩 활용을 늘리는 것은 AI 기능 확대에 따른 인프라 부담을 줄이기 위한 행보로 풀이된다. 핀터레스트는 이미지 기반 검색과 추천, 쇼핑, 광고를 핵심 사업으로 한다. 이용자가 이미지를 통해 상품과 아이디어를 찾는 과정에서 추천 정확도와 검색 품질은 체류 시간, 광고 노출, 구매 전환에 영향을 준다. 업계 관계자는 "추천 정확도와 검색 품질을 높이려면 AI 모델 고도화가 필요하지만, 그만큼 연산 비용도 늘어날 수밖에 없다"며 "수억 명 이용자를 대상으로 개인화 검색과 추천 기능을 실시간 제공하려면 학습뿐 아니라 추론 인프라도 대규모로 필요하다"고 짚었다. 이어 "핀터레스트가 이번에 AWS 트레이니움과 그래비톤을 활용하는 것도 AI 서비스 확장과 인프라 비용 효율을 동시에 노리는 움직임으로 보인다"고 덧붙였다. 이 소식에 시장도 즉각 반응했다. 4일(현지시간) 뉴욕증시에서 핀터레스트 주가는 전 거래일보다 4.45% 오른 21.59달러에 거래를 마쳤다. 장중에는 22.12달러까지 올랐다. 이는 투자자들이 이번 계약을 단기 비용 부담보다 AI 검색·광고 경쟁력 강화 신호로 받아들였기 때문이다. AWS도 이번 계약으로 자체 AI 반도체 생태계 확장에 속도를 내게 됐다. 클라우드 시장에서 AWS는 마이크로소프트 애저, 구글 클라우드와 AI 인프라 주도권을 놓고 경쟁하고 있다. AI 반도체 시장은 엔비디아 GPU 중심으로 성장해 왔지만, 최근 빅테크들은 GPU 공급망 의존도를 낮추기 위해 자체 칩과 맞춤형 클라우드 인프라를 병행하는 전략을 펴고 있다. AWS는 트레이니움과 그래비톤을 통해 이 수요를 흡수하고 있다. 트레이니움은 AI 학습과 추론을 겨냥한 AWS 자체 가속기다. 그래비톤은 Arm 기반 중앙처리장치(CPU)로, 범용 워크로드와 AI 서비스 운영에 필요한 효율성을 앞세운다. 또 스노우플레이크, 메타 등도 최근 AWS 자체 칩 사용을 확대하는 계약을 맺은 것으로 알려졌다. 여기에 핀터레스트까지 가세하면서 AWS 자체 칩 생태계가 기업 AI 인프라의 주요 선택지로 부상하는 모습이다. 업계 관계자는 "AI 서비스 확산으로 최근 기업들의 인프라 비용 부담도 커지고 있다"며 "검색, 추천, 광고, 쇼핑처럼 실시간 추론이 많은 서비스는 GPU 성능뿐 아니라 CPU, 네트워크, 데이터센터, 쿠버네티스 운영 효율까지 따져야 한다"고 설명했다. 이어 "핀터레스트가 이번에 AWS 자체 칩을 활용하는 것도 AI 기능 확대에 필요한 인프라를 장기적으로 확보하면서 비용 효율을 높이려는 것"이라고 덧붙였다. 이처럼 AWS의 자체 칩 확산은 클라우드 시장의 고객 확보 경쟁으로도 이어지고 있다. AI 워크로드는 데이터 저장, 모델 학습, 추론, 배포 환경이 함께 움직이는 구조로, 기업이 특정 클라우드 기반으로 AI 서비스를 구축하면 이후 다른 사업자로 옮기는 데 기술적 부담과 비용이 커질 수 있다. 또 클라우드 사업자 입장에선 자체 칩을 앞세운 장기 계약이 대형 고객을 붙잡아두는 수단이 될 수도 있다. 고객사는 GPU 공급 불안과 비용 부담을 줄일 수 있지만, 특정 클라우드 생태계에 대한 의존도가 높아지는 부담도 안게 된다. 국내 플랫폼 기업들도 비슷한 과제를 안고 있다. 네이버, 카카오, 쿠팡, 무신사, 당근 등 이용자 기반이 큰 기업들은 검색, 추천, 광고, 커머스 영역에서 AI 적용을 확대하고 있다. AI 기능이 서비스 전면에 배치될수록 추론 비용과 인프라 효율은 수익성에 직접 영향을 미친다. 이에 따라 AI 인프라 투자 방식도 더 세분화될 전망이다. 모델 학습에는 GPU를 활용하더라도 검색, 추천, 광고처럼 반복적으로 발생하는 추론 업무에는 비용 효율이 높은 칩과 클라우드 인프라를 조합하려는 수요가 커질 수 있다. 이에 자체 데이터센터와 외부 클라우드를 어떤 비중으로 나눠 쓸지도 서비스 안정성과 비용 구조를 좌우하는 변수가 될 것으로 보인다. 업계 관계자는 "기업들이 AI 서비스를 실제 사업에 적용하기 시작하면서 인프라 전략도 비용과 운영 효율 중심으로 바뀌고 있다"며 "핀터레스트 사례는 클라우드 사업자의 자체 칩이 GPU 중심 인프라를 보완하는 선택지이자 장기 고객 확보 수단으로 활용될 수 있다는 점을 보여준다"고 말했다.

2026.06.05 11:36장유미 기자

AWS, '그래비톤5' 공개…"성능 최대 25%↑"

아마존웹서비스(AWS)가 인공지능(AI) 칩 시장을 주도하기 위해 '그래비톤'을 업그레이드했다. AWS는 미국 라스베이거스에서 열린 'AWS 리인벤트 2025'에서 최첨단 맞춤형 칩 '그래비톤5' 프로세서를 공개했다고 5일 밝혔다. 그래비톤5는 이전 세대 대비 최대 25% 향상된 컴퓨팅 성능을 제공하면서도 뛰어난 에너지 효율성을 유지하는 것이 특징이다. 이는 애플리케이션을 빠르게 실행하고, 비용을 절감하며, 지속가능성 목표를 달성하도록 지원한다. EC2 M9g 인스턴스는 단일 패키지당 192개의 코어를 제공해 아마존 EC2 내 가장 높은 중앙처리장치(CPU) 코어 밀도를 구현했다. 이 설계는 코어 간 데이터 이동 거리를 줄여 통신 지연 시간을 최대 33% 단축했다. 또 네트워크 대역폭은 최대 15%, 아마존 EBS 대역폭은 최대 20% 향상돼 데이터 전송 속도가 눈에 띄게 빨라진다. 그래비톤5에는 자주 접근하는 데이터를 보관하는 고속 메모리 버퍼인 L3 캐시가 기존보다 5배 큰 용량으로 탑재됐다. 각 코어가 더 많은 L3 캐시에 접근해 데이터 대기 지연을 줄이고 애플리케이션 응답 속도를 높인다. 이 프로세서는 최신 3나노미터(nm) 공정을 채택하고 AWS 사용 사례에 맞춰 설계가 최적화됐다. 그래비톤5는 AWS 니트로 시스템을 기반으로 구축돼 높은 보안 수준을 유지한다. 6세대 니트로 카드를 활용해 서버의 리소스를 워크로드에 직접 제공하면서도, 다른 시스템이나 사람이 EC2 서버에 접근하는 것을 원천 차단하는 '제로 오퍼레이터 액세스' 설계를 구현한다. 또 니트로 아이솔레이션 엔진을 도입해 워크로드 간 격리를 수학적으로 보장한다. 슈테판 보이얼레 SAP 하나 클라우드 및 지속성 부문 수석 부사장은 "그래비톤5 기반 아마존 EC2 M9g 인스턴스를 사용해 SAP 하나 클라우드의 OLTP 쿼리 성능이 무려 35~60% 향상됐다"며 "단일 세대에서 이룬 뛰어난 발전"이라고 평가했다.

2025.12.05 15:29김미정 기자

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

젠슨 황, 방한 선물 공개…메모리 대규모 주문 시사

젠슨 황 '삼소회동'에 뜬 세븐일레븐·하이트진로...빙그레

기술은 모방돼도 권리는 남는다…자율주행 시장의 마지막 승부

엔비디아, AI 기술센터 설립…장소 "서울 유력"

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.