오라클, 스타게이트 핵심 인프라 'OCI 제타스케일10' 공개
[라스베이거스(미국)=남혁우 기자] 오라클이 초대형 인공지능(AI) 연산 수행을 위한 최대 16제타플롭스(zettaFLOPS) 연산 성능을 갖춘 차세대 인공지능(AI) 슈퍼컴퓨터를 선보였다. 오라클은 14일(현지시간) 미국 라스베이거스 베네시안 컨벤션 센터에서 열린 'AI 월드 2025에서 'OCI 제타스케일10'을 공개했다. 이 시스템은 수십만 개의 엔비디아(NVIDIA) GPU를 여러 데이터센터에 연결해 최대 16제타플롭스의 피크 연산 성능을 제공한다. 해당 인프라는 오픈AI와 공동 구축 중인 스타게이트 슈퍼클러스터의 핵심 기반으로 사용된다. 제타스케일10은 지난해 9월 공개한 제타스케일 클러스터의 후속 버전이다. 오라클의 자체 네트워크 기술 '오라클 엑셀러론 RoCE'와 엔비디아의 풀스택 AI 인프라를 결합해 초저지연 통신과 전력 효율 향상을 구현했다. 제타스케일10은 최대 80만 개의 엔비디아 AI 그래픽처리장치(GPU)를 탑재할 수 있으며, 클러스터 간 예측 가능한 성능과 비용 효율성을 제공한다. 엔비디아 이안 벅 하이퍼스케일 담당 부사장은 "오라클과 엔비디아가 결합해 전례 없는 규모의 AI 컴퓨팅 패브릭을 구현했다"며 "이는 실험 단계를 넘어 산업 수준의 AI 운영으로 나아가는 핵심 인프라가 될 것"이라고 설명했다. OCI 제타스케일10은 반경 2킬로미터 내 초밀집 구조로 설계된 기가와트급 데이터센터 캠퍼스에 배치된다. 이러한 구조는 GPU 간 지연시간을 최소화해 초대형 AI 모델 학습 효율을 극대화한다. 이번 인프라의 핵심 기술은 오라클의 '엑셀러론 RoCE' 네트워킹 아키텍처다. 이는 최신 GPU 네트워크 인터페이스 카드(NIC)의 스위칭 기능을 활용해 여러 개의 독립된 네트워크 평면(plane)에 동시에 연결되도록 설계됐다. 특정 평면에 장애나 혼잡이 발생할 경우 자동으로 트래픽을 분산시켜 대규모 학습의 중단이나 재시작을 방지한다. 또한 평면 단위 유지보수와 독립적 네트워크 OS 업데이트가 가능해 다운타임을 최소화한다. OCI 제타스케일10은 현재 사전 주문을 받고 있으며 내년 하반기부터 정식 제공될 예정이다. 오라클은 이를 통해 초대형 AI 기업, 연구기관, 정부 프로젝트 등을 대상으로 멀티 기가와트급 AI 클러스터를 제공하고, 클라우드 슈퍼컴퓨터 시장의 새로운 표준을 제시한다는 방침이다. 오라클 마헤시 티아가라잔 클라우드 인프라(OCI) 담당 부사장은 "OCI의 엑셀러론 RoCE 네트워크와 엔비디아 AI 인프라를 결합해 멀티 기가와트급 AI 용량을 제공할 수 있게 됐다"며 "고객은 더 적은 전력으로 더 높은 성능을 내고 안정적 운영과 데이터 주권까지 확보할 수 있다"고 말했다. 오픈AI 피터 호셸레 인프라 담당 부사장는 "제타스케일10 네트워크 패브릭은 스타게이트 프로젝트의 핵심으로 RoCE 설계가 전력 효율과 성능을 동시에 극대화했다"며 "애빌린을 비롯한 초대형 슈퍼클러스터 확장을 계속 이어갈 것"이라고 밝혔다.