[AI 고속도로] "GPU 의존 낮춘다"…AWS 자체 칩 생태계, 핀터레스트 합류로 탄력
아마존웹서비스(AWS)가 자체 개발 칩을 앞세워 인공지능(AI) 인프라 시장에서 존재감을 키우고 있다. 생성형 AI 확산으로 그래픽처리장치(GPU) 수요가 폭증한 가운데 대규모 플랫폼 기업들이 비용 효율과 공급 안정성을 확보하기 위해 클라우드 사업자의 맞춤형 반도체를 선택하는 흐름이 강해지고 있어서다. 5일 AWS 공식 뉴스룸에 따르면 핀터레스트는 오는 2031년까지 AWS 클라우드 서비스에 40억 달러를 투입하는 장기 계약을 맺었다. 핀터레스트 역사상 최대 규모 인프라 계약이다. 양사는 2010년부터 협력 관계를 이어왔으며 이번 계약을 통해 AI 모델 학습·추론과 플랫폼 인프라 전반에서 협력을 확대한다. AWS 자체 칩 활용 확대도 이번 계약의 주요 축이다. 핀터레스트는 AWS 트레이니움으로 개인화 시각 검색과 AI 기반 발견 기능을 구동하는 대규모 언어모델(LLM)과 비전언어모델(VLM)을 운영할 계획이다. AWS 그래비톤 사용도 늘린다. 그래비톤은 이미 핀터레스트 컴퓨팅 인프라의 약 3분의 1을 담당하고 있다. 이처럼 핀터레스트가 AWS 자체 칩 활용을 늘리는 것은 AI 기능 확대에 따른 인프라 부담을 줄이기 위한 행보로 풀이된다. 핀터레스트는 이미지 기반 검색과 추천, 쇼핑, 광고를 핵심 사업으로 한다. 이용자가 이미지를 통해 상품과 아이디어를 찾는 과정에서 추천 정확도와 검색 품질은 체류 시간, 광고 노출, 구매 전환에 영향을 준다. 업계 관계자는 "추천 정확도와 검색 품질을 높이려면 AI 모델 고도화가 필요하지만, 그만큼 연산 비용도 늘어날 수밖에 없다"며 "수억 명 이용자를 대상으로 개인화 검색과 추천 기능을 실시간 제공하려면 학습뿐 아니라 추론 인프라도 대규모로 필요하다"고 짚었다. 이어 "핀터레스트가 이번에 AWS 트레이니움과 그래비톤을 활용하는 것도 AI 서비스 확장과 인프라 비용 효율을 동시에 노리는 움직임으로 보인다"고 덧붙였다. 이 소식에 시장도 즉각 반응했다. 4일(현지시간) 뉴욕증시에서 핀터레스트 주가는 전 거래일보다 4.45% 오른 21.59달러에 거래를 마쳤다. 장중에는 22.12달러까지 올랐다. 이는 투자자들이 이번 계약을 단기 비용 부담보다 AI 검색·광고 경쟁력 강화 신호로 받아들였기 때문이다. AWS도 이번 계약으로 자체 AI 반도체 생태계 확장에 속도를 내게 됐다. 클라우드 시장에서 AWS는 마이크로소프트 애저, 구글 클라우드와 AI 인프라 주도권을 놓고 경쟁하고 있다. AI 반도체 시장은 엔비디아 GPU 중심으로 성장해 왔지만, 최근 빅테크들은 GPU 공급망 의존도를 낮추기 위해 자체 칩과 맞춤형 클라우드 인프라를 병행하는 전략을 펴고 있다. AWS는 트레이니움과 그래비톤을 통해 이 수요를 흡수하고 있다. 트레이니움은 AI 학습과 추론을 겨냥한 AWS 자체 가속기다. 그래비톤은 Arm 기반 중앙처리장치(CPU)로, 범용 워크로드와 AI 서비스 운영에 필요한 효율성을 앞세운다. 또 스노우플레이크, 메타 등도 최근 AWS 자체 칩 사용을 확대하는 계약을 맺은 것으로 알려졌다. 여기에 핀터레스트까지 가세하면서 AWS 자체 칩 생태계가 기업 AI 인프라의 주요 선택지로 부상하는 모습이다. 업계 관계자는 "AI 서비스 확산으로 최근 기업들의 인프라 비용 부담도 커지고 있다"며 "검색, 추천, 광고, 쇼핑처럼 실시간 추론이 많은 서비스는 GPU 성능뿐 아니라 CPU, 네트워크, 데이터센터, 쿠버네티스 운영 효율까지 따져야 한다"고 설명했다. 이어 "핀터레스트가 이번에 AWS 자체 칩을 활용하는 것도 AI 기능 확대에 필요한 인프라를 장기적으로 확보하면서 비용 효율을 높이려는 것"이라고 덧붙였다. 이처럼 AWS의 자체 칩 확산은 클라우드 시장의 고객 확보 경쟁으로도 이어지고 있다. AI 워크로드는 데이터 저장, 모델 학습, 추론, 배포 환경이 함께 움직이는 구조로, 기업이 특정 클라우드 기반으로 AI 서비스를 구축하면 이후 다른 사업자로 옮기는 데 기술적 부담과 비용이 커질 수 있다. 또 클라우드 사업자 입장에선 자체 칩을 앞세운 장기 계약이 대형 고객을 붙잡아두는 수단이 될 수도 있다. 고객사는 GPU 공급 불안과 비용 부담을 줄일 수 있지만, 특정 클라우드 생태계에 대한 의존도가 높아지는 부담도 안게 된다. 국내 플랫폼 기업들도 비슷한 과제를 안고 있다. 네이버, 카카오, 쿠팡, 무신사, 당근 등 이용자 기반이 큰 기업들은 검색, 추천, 광고, 커머스 영역에서 AI 적용을 확대하고 있다. AI 기능이 서비스 전면에 배치될수록 추론 비용과 인프라 효율은 수익성에 직접 영향을 미친다. 이에 따라 AI 인프라 투자 방식도 더 세분화될 전망이다. 모델 학습에는 GPU를 활용하더라도 검색, 추천, 광고처럼 반복적으로 발생하는 추론 업무에는 비용 효율이 높은 칩과 클라우드 인프라를 조합하려는 수요가 커질 수 있다. 이에 자체 데이터센터와 외부 클라우드를 어떤 비중으로 나눠 쓸지도 서비스 안정성과 비용 구조를 좌우하는 변수가 될 것으로 보인다. 업계 관계자는 "기업들이 AI 서비스를 실제 사업에 적용하기 시작하면서 인프라 전략도 비용과 운영 효율 중심으로 바뀌고 있다"며 "핀터레스트 사례는 클라우드 사업자의 자체 칩이 GPU 중심 인프라를 보완하는 선택지이자 장기 고객 확보 수단으로 활용될 수 있다는 점을 보여준다"고 말했다.