인텔, AI 가속 내장한 5세대 제온 '에메랄드래피즈' 출시
인텔코리아는 18일 서울 여의도 전경련회관에서 진행된 "AI 에브리웨어' 기자간담회에서 인공지능(AI) 가속기를 내장한 5세대 인텔 제온 스케일러블 프로세서(코드명 에메랄드래피즈)를 공개했다. 5세대 인텔 제온 프로세서는 AI, 고성능컴퓨팅(HPC), 네트워킹, 스토리지, 데이터베이스 및 보안을 위한 중요 워크로드에서 와트당 성능을 높이고, 총소유비용(TCO)을 낮췄다. 당초 일정보다 앞당겨져 올해 두 번째 제온 제품군 업그레이드로, 이전 세대와 동등한 전력 사용량으로 더욱 높은 컴퓨팅 성능과 빠른 메모리 속도를 경험할 수 있다.2 또한, 4세대 인텔® 제온® 프로세서와 소프트웨어 및 플랫폼 호환이 가능해, 비용과 탄소 배출을 절감하는 동시에 인프라 투자 수명을 업그레이드하고 극대화할 수 있다. AI를 고려해 설계된 5세대 인텔 제온 프로세서는 클라우드, 네트워크 및 엣지 사용사례 전반에 걸쳐 AI 기능을 배포하는 고객에게 더 뛰어난 성능을 제공한다. 5세대 제온 프로세서는 모든 코어에서 AI 가속 기능을 지원해 추론 성능을 42%까지 높이고, 파라미터 수가 최대 200억 개인 대규모언어모델(LLM)의 지연 시간을 100밀리초 미만으로 유지하는 등 까다로운 엔드투엔드 AI 워크로드 문제를 해결한다. 인텔은 이를 통해 별도의 외장형 가속기를 별도로 추가할 필요가 없다고 강조한다. 신규 프로세서는 이전 제온 세대와 비교하면 광범위한 고객 워크로드에서 범용 컴퓨팅의 평균 성능 이득을 21%까지 개선하고, 와트당 평균 성능을 36%까지 높일 수 있다. 일반적으로 5년 주기로 업그레이드하는 고객 및 심지어 더욱 이전 세대에서 업그레이드하는 고객들도 최대 77% TCO 절감 효과를 경험할 수 있다. 5세대 제온 프로세서는 이전 세대를 기반으로 새로운 혁신을 구현해 성능과 효율 측면에서 고객에게 다양한 이점을 제공한다. 5세대 제온 프로세서는 CPU 1개당 지원되는 코어 수가 최대 64개이고, 최대 마지막 레벨 캐시가 이전 세대와 비교 시 거의 3배에 이른다. 또한 CPU 1개당 DDR5 채널을 8개 제공하고, 초당 최대 5,600메가트랜스퍼(MT/s)로 DDR5를 지원하고, 인텔 UPI 2.0을 통해 소켓 간 대역폭을 높여 초당 최대 20기가트랜스퍼(GT/s)까지 제공한다. 그 밖에도 일부 5세대 제온 프로세서 기반 인스턴스는 앞으로 선두 클라우드 서비스 제공업체(CSP)를 통해 컴퓨팅 익스프레스 링크(CXL) 타입 3 워크플로우를 지원할 예정이다. 5세대 제온 프로세서는 이전 세대와 핀 호환이 가능하며, 나아가 시스코, 델, HPE, 인스퍼일렉트로닉인포메이션, 레노버, 슈퍼마이크로컴퓨터 등 주문자상표부착생산(OEM) 업체가 내년 1분기부터 1소켓 및 2소켓 시스템을 다양하게 제공할 계획이다. 주요 CSP 업체들은 1년에 걸쳐 5세대 제온 프로세서 기반 인스턴스의 출시를 발표할 것으로 기대된다. 인텔 트러스트 도메인 확장(TDX)은 가상 머신(VM) 수준에서 기밀성과 보안을 강화해 더욱 강력한 개인정보 보호와 데이터 제어를 제공한다. 올해 4세대 제온 프로세서에서 도입돼 일부 CSP에서만 제공했던 인텔 TDX는 이제 5세대 제온 프로세서의 출시와 함께 모든 OEM 및 CSP 솔루션 공급업체에서 이용할 수 있다. 인텔 TDX 기밀 VM에서는 게스트 운영 체제와 VM 애플리케이션이 플랫폼의 클라우드 호스트, 하이퍼바이저, 기타 VM에서 액세스하지 못하도록 격리된다. 인텔의 새로운 프로세서는 기업 고객 및 파트너를 위해 성능을 크게 높이고 포괄적인 이점을 제공할 뿐만 아니라 주요 워크로드에서 성능을 개선 및 최적화할 수 있다. 인텔은 앞서 고객에게 약속한 로드맵을 변함없이 실천해 나갈 방침이다. 내년 출시되는 차세대 인텔 제온 프로세서의 경우, 전력 효율 및 성능 측면에서 크게 향상된 모습을 보일 것으로 기대를 모은다. 2024년 상반기에는 E-코어 기반의 시에라 포레스트를 출시하고, 곧 이어 P-코어 기반 그래나이트 래피즈를 출시할 예정이다. 인텔코리아 나승주 상무는 “5세대 인텔 제온 프로세서는 AI 워크로드를 효율적으로 처리하기 위해 설계된 제품으로, 고객이 클라우드, 네트워크에서 엣지에 이르는 광범위한 인프라에서 AI 역량을 갖추도록 지원할 것”라며 “인텔은 AI 인프라 구축 및 배포를 쉽게 만드는 하드웨어와 소프트웨어를 함께 제공함으로써 개발자가 어디서나 AI를 구현할 수 있도록 지원할 것”이라고 밝혔다. 나승주 상무는 “5세대 인텔 제온 프로세서 제품군이 이전 세대 제품 대비 성능과 효율성에서 확연한 개선을 보였다”며 “초대형 AI 모델뿐 아니라 엣지 및 클라이언트에서 점차 증가하는 민첩한 소규모 AI 모델 수요를 충족시키며 하이브리드 AI 성장을 지원한다고 강조했다. 인텔은 지난 14일 미국 뉴욕에서 개최한 행사에서 제온 프로세서 도입을 통해 AI 워크로드 및 데이터 처리 성능을 향상시킨 고객 사례를 발표했다. IBM은 자체 테스트 결과 자사의 데이터 레이크하우스 플랫폼 왓슨x.데이터에서 5세대 인텔 제온 프로세서가 이전 세대 제품 대비 최대 2.7배 향상된 쿼리 쓰루풋을 달성했다고 밝혔다. 구글 클라우드는 팔로알토 네트워크가 자사의 위협 탐지 딥러닝 모델 구동을 위해 구글 클라우드를 통해 4세대 제온 프로세서의 가속 기능을 사용한 결과 2배 향상된 성능을 확보했다. 인디 게임 스튜디오인 갈리움 스튜디오는 실리콘밸리의 신경과학 AI 솔루션 전문기업 누멘타의 제온 프로세서 상에서 구동되는 AI 플랫폼을 도입함으로써 GPU 기반 클라우드 인스턴스 대비 6.5배 높은 추론 성능을 달성했다.