삼바노바·인텔, AI 추론 인프라 하반기 공급
미국 AI 인프라 스타트업 삼바노바가 8일(현지시간) 인텔과 협력한 AI 추론 솔루션을 올 하반기부터 본격 공급한다고 밝혔다. 삼바노바는 2월 말 새 AI 추론용 칩인 SN50을 공개한 바 있다. SN50은 엔비디아 등 GPU 대비 초당 토큰 생성 등 처리 속도는 최대 5배 높이고 총소유비용(TCO)은 30% 수준으로 낮췄다. 양사가 하반기부터 공급할 솔루션은 인텔 서버용 제온6 프로세서와 삼바노바 SN50으로 구성된다. 제온6 프로세서는 메모리 대역폭과 PCI 익스프레스 레인(lane, 데이터 전송 통로), 내장 가속기와 운영체제·응용프로그램 실행을 담당한다. 랙 단위 시스템은 제온6 프로세서와 SN50 칩 256개로 구성되며 랙당 전력 소모는 30kW 수준이다. 삼바노바는 자체 측정 결과를 토대로 "LLVM 컴파일시 제온6는 Arm 기반 서버용 CPU 대비 50% 이상 빠르다"고 설명했다. 로드리고 리앙 삼바노바 공동 설립자 겸 CEO는 "에이전틱 AI가 상용화 단계에 들어가는 가운데 AI 전처리(프리필) 과정은 GPU, 실행 과정은 제온6, 최종 처리는 삼바노바 칩이 신속히 처리하는 것이 가장 합리적 패턴"이라고 설명했다. 이어 "인텔과 함게 기존 공랭식 데이터센터에 배치할 수 있고 오늘날 이미 널리 쓰이는 코딩 에이전트와 소프트웨어 도구를 처리할 수 있는 x86 기반 솔루션 청사진을 제시한다"고 덧붙였다. 케보크 케치찬 인텔 데이터센터그룹(DCG) 수석부사장은 "개발자와 기업, 클라우드 서비스 제공자가 신뢰하고 검증된 데이터센터 소프트웨어 생태계는 x86과 제온 기반 위에 구축돼 있다"고 설명했다. 또 "향후 이기종 컴퓨팅 구조가 요구되는 환경에서 삼바노바와의 협력을 통해 비용 효율적이면서도 고성능의 AI 추론 인프라를 제공할 것"이라고 말했다. 제온6 프로세서와 SN50 기반 랙 단위 시스템은 코딩 에이전트와 에이전틱 AI를 대규모로 구현하기 원하는 기업과 클라우드 서비스 제공자, 소버린 AI 등 대상으로 올 하반기부터 공급될 예정이다.