AMD, 생성형 AI 가속 위한 인스팅트 MI300X GPU 공개
AMD가 13일(미국 현지시간) 거대언어모델(LLM) 등 생성형 AI와 고성능 컴퓨팅(HPC) 가속을 위한 서버용 칩인 '인스팅트 MI300X' GPU를 공개했다. 인스팅트 MI300X는 CDNA 3 GPU와 192GB HBM3, 칩렛당 초당 최대 896GB를 전송 가능한 인피니티 패브릭으로 구성됐다. TSMC 5나노급(N5) 공정에서 생산된 칩렛 12개를 결합했으며 트랜지스터 수는 1천530억 개다. 리사 수 AMD CEO는 "MI300X 칩은 엔비디아 H100 대비 2.4배 더 많은 HBM을 탑재했고 대역폭은 1.6배 이상이다. 엔비디아 H100 대비 더 큰 AI 모델을 구동할 수 있다"고 설명했다. AMD는 지난 1월 CES 2023을 통해 젠4 CPU 코어 24개와 CDNA 3 아키텍처 기반 GPU, 128GB HBM3(고대역폭 메모리)를 결합한 인스팅트 MI300A를 공개한 바 있다. 인스팅트 MI300A는 TSMC 5나노급 공정에서 생산된 총 13개 칩렛으로 구성되었으며 내장된 트랜지스터 수는 1천460억 개에 달한다. AMD는 현재 주요 고객사에 인스팅트 MI300A 시제품을 공급중이다. 인스팅트 MI300X와 GPU를 결합한 플랫폼은 오는 3분기에 시제품을 공급하고 4분기 정식 출시 예정이다.