검색 - IT세상을 바꾸는 힘 지디넷코리아

ZDNet 검색 페이지

'블랙웰 GPU'통합검색 결과 입니다. (36건)

태그
기간
- 3개월
- 1년
- 1년 이전

재검색

AI 내재화 확산에 서버용 고출력 전원 솔루션 주목

기업이나 조직 내에서 기업 비밀이나 민감한 개인정보 외부 유출을 막고 오픈소스·자체개발 AI 모델을 활용한 추론과 에이전틱 AI 구동을 위해 AI 서비스를 일부, 또는 전부 자체 서버로 전환하려는 움직임이 활발해지고 있다. 이를 위해 엔비디아·AMD 등 GPU 제조사 기반 서버 도입도 늘고 있다. 문제는 이 서버들이 활용하는 전력이 과거 수백 W에 불과했던 x86 서버 대비 최소 두 배 이상 늘어났다는 것이다. 예를 들어 엔비디아 DGX A100(6U) 기반 서버는 시스템 한 대당 최대 6.5kW(킬로와트)의 전력을 소비한다. 일반 웹서버나 가상화 서버에 쓰이는 x86 1U 서버의 전력 소모량인 300W의 20배 이상이다. 24일 한미마이크로닉스 관계자는 "고성능 GPU 서버 등장으로 단일 서버가 아닌 랙 단위 전력 수요가 증가하고 있는 상황"이라며 "데이터센터 운영 기업들이 전력 효율과 안정성을 높이기 위한 고효율·이중화 서버 전원 솔루션 도입을 확대중"이라고 설명했다. 고성능 AI 서버가 바꾼 전원 인프라 시장 고성능 GPU를 구동하는 서버 환경에서 서버용 전원공급장치의 중요성도 커지고 있다. 대용량 전력을 장시간 안정적으로 공급해야 하며, 이에 실패하면 내부 서비스 중단과 이로 인한 손해가 발생할 수 있다. 현재 주류 GPU인 엔비디아 블랙웰 GB200은 블랙웰 GPU 2개와 그레이스 CPU 1개로 구성되며 최대 2.7kW까지 소비한다. 이는 전세대 주력 제품인 H100의 700W 대비 4배 가까이 늘어난 것이다. AI 서버 전력 수요 증가에 대응해 글로벌 서버 제조사와 전원 솔루션 업체들도 고출력 PSU 및 파워쉘프 개발 경쟁을 벌이고 있다. 한미마이크로닉스 "AI 전원 솔루션 공급 확대" 한미마이크로닉스는 올해 2월 글로벌 전원 솔루션 전문기업 그레이트월과 AI·서버 및 엔터프라이즈 전원 솔루션 분야 협력을 위한 업무협약을 체결했다. 이 회사 관계자는 "이는 기존 PC와 워크스테이션 등에 집중됐던 포트폴리오를 서버 등 AI 인프라로 확장하기 위한 시도"라고 밝혔다. 현재 한미마이크로닉스는 그레이트월 제품군 중 엔비디아 GB300 구동을 위한 33kW급 파워쉘프, 서버용 특수 전원공급장치인 CRPS 제품 4종을 국내 유통중이다. CRPS는 서비스 운영 중단이 허용되지 않는 데이터센터 환경을 위해 설계된 특수 전원공급장치다. 전원 공급을 이중화해 문제가 생겨도 전원 차단 없이 교체가 가능해 다운타임을 크게 줄일 수 있다. "기존 GPU 서버 매각시 전원 교체 필요" AI 서버 도입 확대와 함께 기존 장비 교체 수요도 증가하고 있다. 기업들은 신규 AI 서버를 도입하면서 기존 서버 자산의 매각과 재활용, 유지보수 체계 구축에도 관심을 높이고 있다. 한미마이크로닉스는 올 상반기 진행된 자체 제품 발표 행사와 주요 AI 관련 전시회 등에 AI 인프라 환경을 고려한 그레이트월의 GB300 파워쉘프와 CRPS 시리즈를 비롯해 서버용 전력·냉각 인프라 제품군 전시에 나서기도 했다. 이 회사 관계자는 "기업들이 단가 최소 수천만원 이상인 GPU 서버를 교체하며 기존 제품을 매각하는 방식으로 비용 보전에 나서고 있으며, 이 과정에서 기존 전원공급장치를 신규 제품으로 교체하는 수요도 상당하다"고 설명했다. "전원부터 섀시, 추론 서버까지 포트폴리오 확대" 한미마이크로닉스는 전원 솔루션 외에도 서버 섀시와 냉각 솔루션, AI 서버 플랫폼 등 관련 인프라 사업을 확대하고 있다. 최근 출시한 1U 랙마운트 서버 케이스 RM100은 이중화 전원과 다양한 서버 환경 구성을 지원하며, 이 외에도 4U~6U 서버 섀시, 스토리지 서버 케이스, 듀얼 CPU 서버용 쿨러 및 산업용 고풍압 팬 등 서버 인프라 관련 포트폴리오를 확대 중이다. 자체 개발 제품 투입도 준비 중이다. 7U 규모 AI 추론용 서버 'GSR7 P2G8M24'는 GPU 최대 8개를 탑재 가능하며 핫스왑 기반 스토리지와 이중화 전원 설계를 통해 안정적인 운용이 가능하다. 업계에서는 AI 데이터센터 확산으로 전력 확보와 전력 효율 개선이 핵심 과제로 떠오르고 있다고 보고 있다. GPU 성능 경쟁이 이어지는 가운데 서버 전원공급장치와 파워쉘프 등 전력 인프라 시장 역시 함께 성장할 것으로 전망된다.

2026.06.24 17:25권봉석 기자

래블업 "인텔 '아크 프로 B70', RTX 프로 4000 대비 추론 처리량 높아"

AI 시장의 중심이 모델 학습에서 추론과 에이전틱 AI 서비스 운영으로 이동하면서 GPU 내장 메모리 용량의 중요성이 커지고 있다. 거대언어모델(LLM)에서 길게 이어지는 대화의 맥락을 처리하고 여러 이용자를 동시에 처리하려면 대용량 메모리가 중요하다. 특히 에이전틱 AI는 장시간 대화 맥락을 유지하고 여러 작업을 병렬 처리해야 하는 만큼 GPU 메모리 사용량이 급격히 증가한다. 이 과정에서 이전 추론 결과를 저장하는 'KV 캐시(Key-Value Cache)'가 중요한 역할을 한다. KV 캐시가 충분하지 않으면 기존 KV 캐시 데이터를 제거하거나 재배치해야 하며 이 과정에서 처리량이 감소하거나 응답 지연이 발생할 수 있다. 반대로 KV 캐시를 담을 메모리 용량이 충분하면 더 많은 사용자 요청과 긴 컨텍스트를 동시에 처리할 수 있다. 래블업, '백엔드.AI'에서 LLM 2종 대상 벤치마크 수행 국내 AI 플랫폼 기업인 래블업은 최근 엔터프라이즈 AI 인프라 운영 플랫폼 '백엔드.AI'에서 인텔 아크 프로 B70과 엔비디아 RTX 프로 4000 블랙웰을 대상으로 한 LLM 벤치마크 결과를 공개했다.(인텔 제온 w9-3475X, 우분투 25.10 환경) 인텔 아크 프로 B70은 지난 3월 말 출시된 워크스테이션용 GPU로 AI 추론 수요를 겨냥했다. Xe2 코어 32개와 32GB 메모리 기반으로 대용량 AI 모델을 분할 없이 구동할 수 있다는 점이 차별화 포인트다. 연산 성능은 최대 367 INT8 TOPS(초당 1조 회 연산) 수준이며 GDDR6 32GB 메모리를 탑재해 중소규모 기업과 개발자가 대형 언어모델(LLM)을 로컬 환경에서 직접 구동할 수 있게 했다. 비교 대상이 된 RTX 프로 4000 블랙웰은 쿠다 코어 8960개, ECC GDDR7 24GB 메모리를 탑재했고 메모리 대역폭은 672GB/s 수준이다. Qwen3 8B 모델에서 동시 요청시 초당 처리량 향상 현재 기업들이 활용하는 7B~30B급 오픈소스 LLM은 추론 과정에서 상당한 KV 캐시 공간을 요구하기 때문에 24GB와 32GB 메모리의 차이가 실제 처리량 격차로 이어질 수 있다. 래블업이 Qwen3 8B 모델을 기반으로 수행한 8K 컨텍스트 테스트에서 아크 프로 B70은 동시 요청 수가 늘어나도 초당 처리량이 꾸준히 높아졌다. 반면 RTX 프로 4000 블랙웰은 동시 요청 수가 16개 수준에 도달하자 메모리 부족 현상으로 처리량이 급감했다. 이 테스트에서 아크 프로 B70은 엔비디아 GPU 대비 최대 2.24배 높은 처리량을 기록했다. 컨텍스트 길이를 32K까지 늘린 환경에서는 격차가 더욱 커졌고 특정 구간에서는 아크 프로 B70이 최대 4배 이상 높은 처리량을 보였다. 이는 AI 에이전트 시대에 GPU 연산 성능 못지않게 메모리 용량이 중요해지고 있음을 시사한다. GPT-OSS 20B에서도 RTX 프로 4000 대비 처리량 25% 우위 GPT-OSS 20B 모델을 이용한 테스트에서도 비슷한 경향이 확인됐다. 아크 프로 B70은 동시 요청 수가 증가해도 안정적으로 성능을 유지했으며 32개 동시 요청 환경에서 RTX 프로 4000 블랙웰 대비 25% 처리량이 높았다. 래블업은 실제 벤치마크에서 아크 프로 B70의 KV 캐시 활용 가능 용량이 RTX 프로 4000 블랙웰 대비 평균 2배 수준으로 나타났다고 설명했다. 래블업 관계자는 "이에 따라 모델 가중치를 적재한 이후에도 더 많은 메모리 여유 공간을 확보할 수 있다"고 설명했다. 이어 "처리량과 가격을 함께 고려한 비용 효율 분석에서도 아크 프로 B70이 더 나은 결과를 보였고 AI 서비스 운영에 중요한 토큰당 비용 기준으로는 최대 8배 이상의 효율 향상이 가능하다"고 분석했다. AI 에이전트 등장에 GPU 메모리 용량 중요성 ↑ 래블업은 "장비와 솔루션 도입 시 토큰 처리 비용은 주요 검토 항목 중 하나이며 처리량과 GPU 가격에 따라 결정된다. 정가 기준 아크 프로 B70은 1099달러(약 149만원), RTX 프로 4000 블랙웰은 2199달러(약 297만원)로 벤치마크 결과를 반영하면 두 제품 간 비용 효율 격차는 더욱 커진다"고 설명했다. 다만 이번 결과는 특정 모델과 특정 추론 환경에서 측정된 것으로, AI 학습 성능이나 모든 워크로드에서 동일한 우위를 의미하지는 않는다. 또 AI 생태계 전반에서는 여전히 엔비디아의 영향력이 압도적이다. 쿠다(CUDA)를 중심으로 구축된 개발 환경과 풍부한 소프트웨어 지원은 AMD나 인텔 등 경쟁사가 단시간에 따라잡기 힘들다. 그러나 오픈소스 기반 인텔 AI 프레임워크인 '오픈비노'를 비롯해 vLLM, llama.cpp 등 주요 AI 프레임워크가 인텔 GPU 지원을 확대하고 있다. 업계에서는 아크 프로 B70이 AI 추론 시장을 겨냥한 실용적인 대안으로 자리잡을 가능성이 높다고 보고 있다. AI 에이전트가 확산될 수록 연산 성능뿐 아니라 메모리 용량과 비용 효율이 중요해지고 있기 때문이다.

2026.06.18 16:08권봉석 기자

에이수스, 엔비디아 GB300 NVL72 서버 출하 성과 공개

[타이베이(대만)=권봉석 기자] 에이수스는 '컴퓨텍스 타이베이 2026' 개막을 하루 앞둔 1일(현지시간) 업계 주요 인사를 대상으로 'ISBG VIP 쇼케이스'를 진행하고 엔비디아 GB300(블랙웰 울트라) NVL72 기반 AI 서버의 조기 출하 성과를 공개했다고 밝혔다. 에이수스가 최근 조기 출하에 들어간 엔비디아 GB300 NVL72 기반 랙 스케일 시스템 '에이수스 AI포드 XA GB721-E2'는 Arm 기반 그레이스 CPU 32개, 블랙웰 울트라 GPU 72개와 5세대 NV링크 기술을 탑재해 대규모 AI 추론과 학습을 동시 지원한다. 조셉 루 에이수스 인프라솔루션 비즈니스그룹(ISBG) 이사는 "에이수스 AI포드 XA GB721-E2는 고객사의 첫 토큰 산출 시간 단축과 AI 서비스 신속 출시를 지원한다"고 밝혔다. 이어 "엔비디아 HGX B300 탑재 'XA NB3I-E12' 서버도 전 세계 출하를 시작했다"고 덧붙였다. 에이수스는 2011년부터 엔비디아 M2070 기반 '포모사4' 부터 2025년 엔비디아 H200/GB200 NVL72 기반 81.55 페타플롭급 서버 '나노4'에 이르기까지 대만 국가고속네트워크센터(NCHC) 프로젝트를 지속 수주했다. 조셉 루 이사는 이날 "대만 NCHC 프로젝트 수주 성과를 바탕으로 최근 UAE, 베트남, 미국 등 글로벌 시장으로 영역을 확장하고 있다"고 설명했다. 에이수스는 단순 서버 제조업체를 넘어 자체 연구개발 역량을 바탕으로 하드웨어 설계부터 바이오스/펌웨어, 소프트웨어까지 모든 과정을 내재화했다. 또 이를 뒷받침하는 RD 랩, QTR 랩, 열역학 랩 등 3대 전문 검증 시설을 자체 운영중이다. RD 랩은 공랭과 수랭 등이 혼합된 하이브리드 환경에서 실제 데이터센터 조건을 재현해 엔비디아 GB300 NVL72 등 고집적 GPU 랙을 풀 스케일로 검증한다. 조셉 루 이사는 "기존 7°C 냉각기 대신 20°C 냉각 전용 시스템 도입으로 연간 전력 사용량을 약 30% 절감하는 성과를 거뒀다"고 설명했다. QTR 랩에서는 영하 40°C에서 영상 85°C, 습도 10~98% 범위의 극한 환경에서 신뢰성을 검증하며, 열역학 랩은 핫/콜드 아일랜드 구성을 시뮬레이션해 냉각 효율성을 최적화한다. 에이수스는 이날 원클릭 자동화 배포를 지원하는 '에이수스 인프라 배포 센터(AIDC)', HPC/AI/엔터프라이즈 인프라를 단일 콘솔에서 관리할 수 있는 '에이수스 컨트롤 센터(ACC) 데이터센터 에디션'도 함께 시연했다. 조셉 루 이사는 "AIDC와 ACC 등 소프트웨어 솔루션에 더해 전략 컨설팅부터 성능 튜닝, 라이프사이클 관리까지 포괄하는 '에이수스 프로페셔널 서비스'를 통해 엔드투엔드 지원 체계를 갖췄다"고 밝혔다. 에이수스코리아 관계자는 "이번 VIP 쇼케이스를 통해 에이수스가 설계-검증-운영-서비스를 아우르는 'AI 인프라 플랫폼 기업'으로 전환하고 있음을 입증했다"고 설명했다. 이어 "에이수스는 엔비디아 DSX와 연계한 AI 팩토리 솔루션을 앞세워 글로벌 AI 데이터센터 시장 공략에 속도를 낼 것"이라고 덧붙였다.

2026.06.03 07:00권봉석 기자

Arm "엔비디아 RTX 스파크, 차세대 에이전틱 PC 이정표"

[타이베이(대만)=권봉석 기자] Arm은 1일(현지시간) 엔비디아가 컴퓨텍스 타이베이 2026 기조연설에서 공개한 Arm 기반 고성능 AI PC 'RTX 스파크'에 대해 "PC 기반 에이전틱 컴퓨팅의 미래에 중요한 의미를 지닌 제품"이라고 강조했다. 엔비디아는 1일 오전 타이베이 뮤직센터에서 진행한 기조연설에서 블랙웰 GB10 기반으로 설계된 윈도용 Arm PC 'RTX 스파크'를 공개했다. RTX 스파크는 고성능 Arm 코어텍스-X925 10코어와 저전력·고효율 Arm 코어텍스-A725 10코어로 구성된 20코어 그레이스 CPU, 블랙웰 RTX GPU와 완전 통합 메모리를 결합했다. 고성능 CPU와 GPU를 활용해 고도화된 AI 워크로드, 콘텐츠 제작, 게임 및 에이전틱 컴퓨팅 경험을 제공하도록 설계됐다. Arm은 "RTX 스파크는 윈도 온 Arm 생태계에 중요한 이정표로, 차세대 에이전틱 PC에 대한 공동 비전을 중심으로 엔비디아, Arm, 마이크로소프트와 주요 PC 제조사의 협력을 이끌어 낼 역할을 할 것"이라고 밝혔다. 이날 크리스 버기 Arm 엣지 AI 사업부문 총괄 수석부사장은 "AI 에이전트가 이용자를 대신해 점점 더 많은 추론, 계획 및 작업 실행을 수행함에 따라 복잡한 AI 워크로드를 조율하는 CPU의 중요성이 더욱 더 커지고 있다"고 밝혔다. 이어 "RTX 스파크는 Arm의 고성능·고효율 컴퓨팅 플랫폼과 엔비디아의 GPU 리더십을 결합해 지능적이고 반응성이 뛰어난 새로운 유형의 에이전틱 PC를 구현했다"고 평가했다.

2026.06.01 18:15권봉석 기자

엔비디아, 12분기 연속 매출 신기록…AI 데이터센터 매출 92% 폭증

세계 인공지능(AI) 칩 시장을 장악하고 있는 엔비디아가 12분기 연속 역대 최대 매출 기록을 또 갈아치웠다. 지난주 기업공개(IPO)를 마친 세레브라스 시스템즈와 AMD 등 경쟁사 등장과 최근 AI 모델과 추론용 자체 개발 칩을 공개한 구글 등 경쟁이 격화하는 상황에서 호실적을 기록한 셈이다. 엔비디아는 20일(현지시간) 올 1분기(2~4월, 회계연도 기준 2027년 1분기) 매출은 816억 1500만 달러(약 122조 2503억원)로 전년 동기(440억 달러, 약 65조 9072억원) 대비 85% 증가했다고 발표했다. 지난 2월 자체 전망치인 780억 달러(약 116조 8354억원), 시장 전망치인 787억 달러(약 117조 8839원)를 30억 달러 이상 넘어섰다. 영업이익은 535억 달러(약 80조 1371억원)로 전년 동기(187억 달러, 약 28조 105억원) 대비 세 배 이상 증가했다. 엔비디아는 올 1분기부터 사업 실적을 '데이터센터'와 '엣지 컴퓨팅' 등 두 개 시장으로 구분해 발표한다. 현재와 미래 성장 동력을 보다 명확히 반영하기 위해서라는 것이다. 데이터센터 부문은 ▲ 글로벌 클라우드 기업과 대형 인터넷 기업 매출을 포함한 '하이퍼스케일(Hyperscale)' ▲ AI 클라우드, 산업, 기업 부문을 일컫는 'ACIE'로 구분된다. 데이터센터 부문 매출은 752억 달러(약 112조 6413억원)로 전년 동기(391억 달러, 약 58조 5675억원) 대비 두 배 가까운 92% 폭증했다. 또 1분기 전체 매출의 92%가 데이터센터 부문에서 나왔다. 엔비디아는 "블랙웰 GB300 생샨량 증가와 함께 NV링크, 스펙트럼-X 네트워킹 등 수요 증가에 따른 결과"라고 설명했다. 단 작년 1분기 대비 중국 시장에서 매출은 전혀 발생하지 않았다. 엣지 컴퓨팅 부문은 PC, 게임 콘솔, 워크스테이션, AI-RAN 기지국, 로보틱스, 오토모티브(자동차) 등 에이전틱 AI 및 피지컬 AI용 기기를 포함한다. 이 부문의 1분기 매출은 64억 달러(약 9조 5865억원)이며 전년 동기 대비 29% 늘어났다. 엔비디아는 "메모리와 완제품 가격 상승으로 일반 소비자용 PC 수요가 줄고 있지만 RTX 프로 6000 블랙웰 워크스테이션 등 강력한 수요로 달성한 결과"라고 밝혔다. 엔비디아는 오는 6월 26일 배당금을 주당 기존 1센트에서 25센트로 상향해 지급한다고 밝혔다. 배당락은 6월 4일이다. 엔비디아는 올해 2분기(5~7월) 910억 달러(약 136조 3080억원) 수준으로 예상했다. 다만 이는 중국 시장 매출을 전혀 반영하지 않은 수치다. 실적 발표 이후 주가는 시간 외 거래에서 종가(223.47달러) 대비 1% 내외로 등락을 이어가고 있다.

2026.05.21 07:33권봉석 기자

에이서 자회사 알토스컴퓨팅, AI 엑스포서 서버 제품 전시

글로벌 PC 제조사 에이서 자회사, 알토스컴퓨팅이 작년 국내 진출 이후 처음으로 국내 행사에 참가했다. 엔비디아 GPU 탑재 AI 서버와 솔루션, 웹 기반 모니터링 도구를 시연했다. 알토스컴퓨팅은 2017년 에이서 자회사로 설립돼 고성능컴퓨팅(HPC)과 AI 인프라 관련 서버 완제품과 소프트웨어, 솔루션을 공급중이다. 6일 오전 서울 삼성동 코엑스 'AI 엑스포' 행사장에는 GPU 서버 3종과 개인용 AI 워크스테이션, 모니터링 툴을 전시했다. 알토스 브레인스피어 R880 F7은 대규모 모델 학습, 생성 AI와 HPC 등 클라우드서비스제공자나 대기업의 온프레미스 환경을 위해 설계된 서버다. 8U 규격 서버로 엔비디아 HGX B200 기반 GPU를 최대 8개 탑재 가능하다. 알토스 브레인스피어 R680 F7은 인텔 제온 6700/6500 프로세서 기반 GPU 서버다. 4U 규격으로 엔비디아 H200이나 RTX 프로 6000 블랙웰 서버 에디션, L40S 등 예산에 맞는 GPU를 최대 8개 탑재 가능하다. 현장에서 만난 알토스컴퓨팅 대만 본사 엔지니어는 "국내 공공 연구기관 중 한 곳이 H200 GPU 8개를 탑재한 구성으로 제품 두 대를 도입 예정"이라고 설명했다. 알토스 브레인스피어 R380 F7은 2U 구성으로 엔비디아 RTX 프로 6000 맥스Q와 RTX 6000 에이다, L40s GPU를 최대 두 개 장착할 수 있다. 알토스컴퓨팅 관계자는 "중소/중견기업에 적합한 구성으로 GPU를 유연하게 선택할 수 있다"고 밝혔다. 알토스 브레인스피어 GB10 F1은 엔비디아가 개인 개발자와 전문가용으로 개발한 CPU·GPU 통합 SoC(시스템반도체) GB10 기반 AI 워크스테이션이다. 통합 메모리 용량(LPDDR5X 128GB)과 최대 구동 가능 모델(2천억 개 매개변수) 등 주요 제원은 타사 제품과 같다. 알토스컴퓨팅 관계자는 차별화 요소로 자체 개발한 소프트웨어인 'AI 지니(aiGeni)'를 들었다. 이 관계자는 "AI 지니는 CPU 점유율과 메모리 이용량 등 모니터링 기능과 함께 파이토치, 텐서플로 등 주요 AI 라이브러리 연동을 지원한다"고 설명했다. 알토스 서버 제품에는 웹 기반 통합 관리 솔루션 'AI웍스(aiWorks)'가 탑재된다. 다수의 서버 노드와 GPU 자원을 한 화면에서 통합 관리 가능하다. 알토스컴퓨팅 관계자는 "사용자별·조직별 그룹 별 권한 설정, 교사·연구실·팀 등 단위 계정 설정 기능에 더해 기간·사용자·그룹별 사용량 집계와 이에 따른 내부 정산 체계까지 구축 가능하다"고 설명했다. 알토스컴퓨팅 국내 지사 관계자는 "이번에 전시한 서버 3종과 솔루션을 시작으로 연내 포트폴리오를 확보해 국내 기업들이 AI를 실제 비즈니스 성과로 전환할 수 있도록 지원하고, 한국 시장 내 AI 혁신을 지원할 것"이라고 설명했다.

2026.05.06 17:05권봉석 기자

엔비디아 젠슨 황 "中에 최신 GPU 공급은 제한해야"

젠슨 황 엔비디아 CEO가 4일(현지시간) 중국 시장과 AI 반도체 수출 전략에 대해, 성능을 제한한 제품은 계속 공급하되 최신·고성능 제품 공급은 제한할 필요가 있다는 견해를 밝혔다. 젠슨 황 CEO는 로스앤젤레스에서 열린 밀컨연구소 글로벌 컨퍼런스 기간 중 대담 세션에 참여했다. 진행자가 "중국에는 H200 같은 칩은 공급해야 한다는 생각이냐"라고 묻자 젠슨 황 CEO 역시 이에 동의했다. 반면 "중국이 최신·최고사양 반도체를 가져야 하느냐"는 사회자 질문에는 "아니다"라고 즉답했다. 이는 중국을 완전히 배제하기보다 미국 기술 생태계 안에 묶어두는 방식이 더 효과적이라는 메시지로 해석된다. 그는 이어 "미국이 AI 분야에서 가장 뛰어난 최신 기술을 가장 먼저, 가장 많이 가져야 한다. 미국 기업들이 세계 시장에 AI 가속기를 판매하면 세수 확대와 경제 성장으로 이어지고, 이는 다시 국가 안보 강화에 기여한다"고 덧붙였다. 이번 발언은 젠슨 황 CEO가 작년 하반기 이후 실적발표 등 공개석상에서 지속적으로 강조한 메시지와도 일치한다. 엔비디아는 도널드 트럼프 2기 행정부 출범 이후 중국 시장 수출 규제가 강화되자 H200 등 중국 전용 저사양 AI 칩을 별도로 설계해 대응해 왔다. 그러나 양국 정부의 승인 절차가 지연이나 보류되며 엔비디아의 중국 시장 내 AI 가속기 점유율은 0% 수준까지 떨어졌다. 이번 발언은 미국 정부의 최첨단 제품 수출 제한은 수용하되, 성능이 한 단계 낮은 제품의 수출은 허가하고 미국 기업의 글로벌 경쟁력은 유지돼야 한다는 이중 전략을 내세운 것으로 보인다. 최첨단 제품은 미국 중심으로 묶어두되, 범용·하위 사양 제품 판매까지 전면 차단하는 방식은 오히려 중국 반도체 생태계를 키울 수 있다는 현실론이다.

2026.05.06 10:02권봉석 기자

AI 뜨니, 게이밍 GPU 소외…엔비디아 '지포스 홀대' 논란

인공지능(AI) 수요 급증으로 인한 메모리 부족 사태 속에서 엔비디아가 게이밍 GPU보다 인공지능(AI) 칩에 집중하면서 게이머들의 불만이 커지고 있다는 지적이 나왔다. 엔비디아가 최근 블랙웰, 루빈 등 데이터센터용 AI 칩셋 생산을 우선 추진하면서 소비자용 지포스 GPU가 상대적으로 소외되고 있다고 미국 경제매체 CNBC가 19일(현지시간) 보도했다. 엔비디아는 2000년대 초 GPU를 대중화하며 게임 산업 핵심 기업으로 자리 잡았다. 특히 1999년 '지포스 256' 출시 당시 위기 상황에 놓였던 회사는 게이머들의 적극적인 구매에 힘입어 반등에 성공했다. 하지만 지금은 상황이 크게 달라졌다. AI 시장이 폭발적으로 성장하면서 엔비디아의 매출 대부분이 데이터센터용 AI 칩에서 발생하고 있다. 번스타인 리서치의 스테이시 라스곤은 “게임 부문은 더 이상 회사의 핵심 성장 동력이 아니다”라고 평가했다. AI 칩 생산 확대는 메모리 수급에도 영향을 미치고 있다. 제한된 메모리 자원을 두고 우선순위를 정하는 과정에서 엔비디아는 수익성이 높은 AI GPU에 집중하고 있으며, 이로 인해 게이밍 GPU 생산은 상대적으로 줄어들고 있다는 분석이다. 실제로 업계에서는 최신 게이밍 GPU 생산량이 최대 40%까지 감소할 수 있다는 전망도 나오고 있다. 제품 출시 일정에도 변화가 감지된다. 분석가들은 올해가 엔비디아가 30년 만에 처음으로 차세대 지포스 GPU를 출시하지 않는 해가 될 가능성이 높다고 보고 있다. 현재 판매 중인 '지포스 RTX 50 시리즈'는 지난해 1월 공개됐지만, 올해 주요 행사에서는 후속 제품이 발표되지 않았다. 가격 구조 역시 이러한 전략 변화를 뒷받침한다. 업계에 따르면 블랙웰 GPU는 개당 최대 4만 달러(약 5900만 원), 베라 루빈 시스템은 최대 400만 달러(약 59억 원)에 이를 것으로 추정된다. 반면 지포스 RTX 50 시리즈는 299달러에서 1999달러 수준으로, 수익성 측면에서 큰 차이를 보인다. 한편, 최근 공개된 차세대 그래픽 기술 'DLSS 5'를 둘러싼 논란도 이어지고 있다. 젠슨 황 CEO는 지난 3월 연례 개발자 행사에서 해당 기술을 소개했지만, 일부 게이머들은 AI 기반 렌더링이 원작의 예술적 의도를 훼손할 수 있다고 비판하고 있다. 특히 시연 과정에서 게임 캐릭터 표현이 과도하게 보정된 것처럼 보인다는 지적이 제기되며 논쟁이 확산되고 있다. 엔비디아는 이에 대해 “게이머는 여전히 중요한 고객”이라며, 게임 기술 개발과 제품 출시를 지속하고 있다고 밝혔다.

2026.04.20 16:39이정현 미디어연구소

중부권 최대 민간 GPU센터 추진…"슈마컴 루빈급 32만장 공급 약속"

블랙웰 급 6만2,500장 이상을 수용할 중부권 최대 GPU 데이터 센터가 들어설 전망이다. 건물과 송전 및 냉각시설, GPU 랙 등을 설치할 시설비만 2조 2,500억원 규모다. 한남대학교는 16일 대전 본교에서 케빈 창 슈퍼마이크로컴퓨터 부사장과 정시우 BKB에너지 대표, 성제현 KT수도권강북법인고객본부장를 비롯한 황정아·장철민 의원 등 내외빈 150여 명이 참석한 가운데 'AX클러스터 & 고성능 GPU 거점센터' 기공식을 개최했다. 이 프로젝트에서 GPU 조달은 엔비디아 GPU 공급업체인 슈퍼마이크로컴퓨터가 맡기로 했다. 사업 주체는 슈퍼마이크로컴퓨터와 BKB에너지, KT, 터보스케일 등이다. 이들이 GPU 공급과 냉각시스템 등 시설 설치 일체를 맡는다. 이들 간에는 GPU가 필요할 땐 언제든 공급하기로 하는 협약(NDA, 비밀보호협정)도 체결했다는 것이 한남대 측 설명이다. 이준원 한남대학교 인공지능전략위원회 부위원장(자유전공학부 교수)은 "GPU를 총 32만장 정도 가져올 수 있는데, 당장은 블랙웰급으로 6만 2,500장부터 들여올 계획이다. 향후엔 최상급인 베라루빈 이상으로 언제든 원할 때 들여올 수 있는 계약을 체결했다"고 말했다. 이 부위원장은 "GPU와 관련해서 정부나 지자체 지원없이 순수 민간 자본으로 구축한다"며 "해외에서는 미국과 캐나다, 프랑스 자본이 투입되고, 국내에서는 메리츠화재, 우리투자증권, BKB에너지 자금이 유입될 것"이라고 말했다. 이 부위원장은 또 "GPU 80%정도는 수냉식으로 열관리할 계획"이라며 "물 공급 부분은 수자원공사에서 책임지기로 했고, 전기 공급은 한전측과 기술평가를 실시한 결과 우선 40MW부터 공급하기로 했다"고 말했다. 향후엔 ESS(에너지저장시스템)를 활용한 추가 전력 100MW 정도를 확보할 계획이다. 한남대는 우선 올해내 건물 설계를 모두 마친뒤 내년부터 본격 건립 작업에 들어갈 계획이다.

2026.04.16 15:25박희범 기자

[유미's 픽] "GPU만 사오면 끝?"…정부, 1.5만장 구축 사업서 '설계 능력' 보는 까닭

정부의 대규모 그래픽처리장치(GPU) 인프라 사업 경쟁이 장비 확보에서 운용 능력 중심으로 재편되고 있다. 최신 GPU 도입 여부보다 이를 얼마나 효율적으로 설계·운영할 수 있는지가 올해 사업 선정의 핵심 변수로 떠오른 가운데, 정부가 국내 기업들의 인프라 경쟁력을 끌어올리기 위해 본격 나선 모양새다. 30일 업계에 따르면 과학기술정보통신부는 다음달 13일까지 GPU 1만5000장을 구축하기 위한 사업자 공모에 나선다. 총 2조800억원을 투입해 GPU 서버와 부대 장비를 구매한 후 산·학·연에 공급할 예정으로, 최신 GPU를 신속히 확보하고 이를 대규모로 묶어(클러스터링) 구축·운용할 수 있는 민간 기업을 선정한다는 방침이다. 앞서 정부는 지난해 추가경정예산 1조4000억원을 투입해 확보한 엔비디아 B200 등 첨단 GPU 1만3000장을 NHN클라우드, 네이버클라우드, 카카오엔터프라이즈 등을 통해 구축했다. 또 이 물량을 최근 산·학·연에 3000장, 국가 프로젝트에 4000장, 독자 AI 파운데이션 모델에 3000장씩 배분했다. 또 지난 25일부터 산학연을 대상으로 2000장에 대한 추가 공모에도 들어갔다. 올해 5월 중 선정될 사업자는 연내 GPU 1만5000장 구축 및 서비스를 개시해 2031년 12월 31일까지 운영하게 된다. 이 물량 역시 산·학·연 및 국가 프로젝트를 대상으로 자원 배분과 운영이 이어진다. 이병묵 NIPA AI인프라확충팀장은 "올해 블랙웰급 이상의 최신 GPU 1만5000장 확보를 목표로 한다"며 "고성능 GPU를 대규모로 공급할 수 있는 사업자가 높은 평가를 받을 것"이라고 말했다. 정부는 이번 사업을 통해 참여 기업들의 기술 경쟁력을 끌어올린다는 목표다. 그간 GPU 물량 싸움 중심으로 인프라 구축 사업을 펼친 결과 수행 과정에서 한계가 곳곳에서 드러났던 탓이다. 특히 지난해 처음 GPU 구축 사업에 나서면서 일부 기업들이 H100, B200급을 확보해두고도 소프트웨어, 구성 문제로 실제 성능 효율이 낮은 사례가 발생하자 정부가 이에 대해 문제의식을 크게 느낀 것으로 알려졌다. 대규모 GPU 클러스터는 데이터 흐름과 메모리 구조, 네트워크 구성에 따라 전체 성능이 좌우되는 만큼 단일 장비 성능만으로는 효율을 담보하기 어렵다.또 B200 도입에 따라 수냉식 등 최신 냉각 기술을 적용해야 함에도 불구하고 하중 보강 공사, 구조 변경 등이 빠르게 뒷받침 되지 못해 구축 일정이 지연되는 사례도 벌어지자 정부가 난감해 한 것으로 전해졌다. 업계 관계자는 "정부가 GPU 1만3000장 구축 사업을 진행하면서 GPU만 사오면 끝나면 사업이 아니란 점을 뼈저리게 느낀 듯 하다"며 "지난해엔 얼마나 GPU를 많이 확보하고 싸게 제안했는지를 중점적으로 들여다 본 탓에 정작 운용능력이 뒷받침되지 않아 정부도 속앓이를 많이 한 것으로 안다"고 지적했다. 이에 정부는 올해 사업 평가 기준을 대폭 수정했다. 단순한 장비 확보 능력보다 실제 운영 효율을 검증할 수 있는 요소들을 대거 평가 체계에 포함한 것이다. 실제 이번 사업의 주요 평가 항목 및 배점을 살펴보면 절반인 50점이 사업 준비도 및 경쟁력에 배정됐다. 이 중 인프라 준비도(18점)와 구축 계획의 구체성(32점)은 핵심 평가 항목으로 제시됐다. 특히 데이터센터 상면 확보 여부를 비롯해 전력·냉각 설비, 네트워크 구성, 자원 관리 체계 등 물리적·논리적 인프라를 종합적으로 검증하겠다는 방침을 내세웠다. 이는 단순 가격 경쟁이나 물량 확보보다 실제 대규모 GPU 클러스터를 구축해 안정적으로 운영할 수 있는 역량을 우선 보겠다는 의미다. 특히 32점이 배정된 구축계획 우수성은 정부가 이번 사업을 사실상 '설계 능력 평가'로 보고 있음을 보여준다. 어떤 GPU를 얼마나 들여오겠다는 수준을 넘어 이를 어떤 구조로 묶고 어떤 일정으로 구축하며 실제 서비스 단계까지 어떻게 연결할 것인지를 구체적으로 입증해야 높은 점수를 받을 수 있는 구조란 점에서다. 업계 관계자는 "GPU 활용 효율을 입증할 수 있는 성능 지표 제시가 요구되면서 사업자들의 부담이 한층 커진 상황"이라며 "실제 연산 효율을 얼마나 끌어올릴 수 있는지에 대한 구체적인 방법론과 결과를 함께 제시해야 하기 때문"이라고 말했다. 업계에선 이를 두고 정부가 사업 방향을 '물량 경쟁'에서 '효율 경쟁'으로 전환한 것으로 보고 있다. 동일한 GPU 환경에서도 메모리 활용 방식, 데이터 전송 구조, 추론 엔진 설계에 따라 처리 성능과 비용 효율이 크게 달라지기 때문이다. 이 과정에서 메모리 처리 구조와 데이터 흐름 최적화 등 소프트웨어 역량이 핵심 변수로 부상하고 있다. GPU 연산 성능이 높아도 메모리 대역폭이나 데이터 처리 구조가 이를 뒷받침하지 못할 경우 전체 성능이 제한되는 구조적 한계 때문이다. 이에 일부 기업들은 이러한 병목 현상을 해소하기 위해 추론 엔진 최적화, 모델 경량화, 데이터 처리 구조 개선 등 다양한 기술 경쟁을 벌이고 있다. 같은 GPU를 사용하더라도 운영 방식에 따라 처리 가능한 작업량이 크게 달라져서다. 업계 관계자는 "정부가 차세대 GPU인 '베라루빈' 제안 시 평가에 우대 조건으로 반영할 수 있도록 한 것도 이러한 흐름과 맞닿아 있다"며 "단순 도입 여부보다 고성능 장비를 안정적으로 운용할 수 있는 인프라 설계 능력을 함께 보겠다는 의미"라고 해석했다. 다만 베라루빈과 같은 차세대 GPU는 수냉 기반 구조 등으로 인해 기존 대비 장비 무게와 전력 요구 수준이 크게 높아지는 만큼, 일각에선 이를 수용할 수 있는 데이터센터 인프라 확보 여부가 새로운 변수가 될 것으로 봤다. 실제 올해 사업에서는 데이터센터 하중 구조를 사전에 점검해 제출하도록 하는 요건이 추가된 것으로 알려졌다. 지난해 일부 사업자가 수냉식 장비 도입 과정에서 구조 보강 문제로 일정 지연을 겪은 경험이 반영된 결과다. 업계 관계자는 "작년에는 장비 확보와 단가 경쟁이 중심이었다면, 올해는 성능 효율과 운영 구조까지 함께 검증하는 방향으로 완전히 바뀌었다"며 "실제 서비스를 돌릴 수 있는 수준의 설계 역량을 갖추지 않으면 사업 참여 자체가 쉽지 않은 구조"라고 밝혔다. 전문가들은 이번 사업이 국내 AI 인프라 경쟁 방식 자체를 바꾸는 계기가 될 것으로 보고 있다. 단순한 하드웨어 투자에서 벗어나 소프트웨어와 운영 기술까지 포함한 종합 경쟁력 확보가 요구되고 있기 때문이다. 또 다른 관계자는 "이제는 GPU를 얼마나 확보했는지가 아니라 같은 자원으로 얼마나 높은 효율을 내느냐가 경쟁력의 핵심"이라며 "이번 사업은 국내 기업들이 글로벌 수준의 인프라 운용 역량을 갖추도록 유도하는 전환점이 될 것"이라고 말했다.

2026.03.30 16:27장유미 기자

[AI 고속도로] '베라루빈' 확보 속도전…'AI G3' 노린 정부, 주도권 경쟁 본격화

정부가 엔비디아의 차세대 그래픽처리장치(GPU) '베라루빈' 확보에 공을 들이고 있다. 생성형 인공지능(AI) 경쟁이 단기간 내 판가름 날 수 있다는 판단 아래 최신 GPU를 조기에 도입해 기술 격차를 좁히겠다는 전략으로, 'AI 3강(G3)'에 안착할 수 있는 기반 마련에 본격 나선 분위기다.과학기술정보통신부와 정보통신산업진흥원(NIPA)은 20일 오후 2시 서울 강남구 포스코타워에서 '2026년 AI 컴퓨팅 자원 활용기반 강화사업' 설명회를 갖고 올해 최신 GPU 약 1만5000장 수준을 확보할 것이란 계획을 밝혔다. 이번 사업은 약 2조805억원 규모로, GPU 서버를 비롯해 랙·냉각장치·스토리지·네트워크 등 부대장비 구매에 예산이 집중 투입된다. GPU 인프라는 올해 선 구축과 함께 서비스를 시작하고 2027년 내 구축을 완료하는 일정이다. 이 사업의 핵심은 블랙웰급을 넘어서는 차세대 GPU 도입 여부다. 정부는 공모 요건에서 특정 제품을 명시하지는 않았지만, 설명회 과정에서 베라루빈과 같은 차세대 하이엔드 GPU를 제안할 경우 평가에서 긍정적으로 반영할 수 있다는 입장을 내놨다. 베라루빈은 엔비디아가 차세대 아키텍처로 준비 중인 GPU로, 기존 제품 대비 연산 성능과 에너지 효율이 크게 향상될 것으로 기대된다. 다만 아직 상용화 초기 단계에 있어 글로벌 빅테크 기업을 중심으로 공급이 이뤄질 가능성이 높은 제품이다. 업계 관계자는 "정부가 이번에 베라루빈 도입 가능성을 열어둔 점이 눈에 띈다"며 "AI 인프라 경쟁에서 뒤처지지 않겠다는 의지가 반영된 조치로 보인다"고 말했다. 이날 설명회에서는 차세대 GPU 확보 시점과 관련해 일반적인 출시 일정보다 국내 도입을 앞당기기 위한 협의가 진행되고 있다는 점도 언급됐다. 글로벌 공급 구조상 후순위로 밀릴 가능성을 고려해 초기 물량 확보를 선제적으로 추진하려는 전략으로 해석된다. 정부가 이처럼 차세대 GPU 확보에 적극 나선 것은 AI 경쟁 구도가 급변했다는 점이 반영된 것으로 풀이된다. 생성형 AI 확산 이후 모델 개발과 서비스 적용까지 걸리는 시간이 크게 단축되면서, 컴퓨팅 인프라 확보 시점 자체가 경쟁력을 좌우하는 요소로 떠올랐기 때문이다. 이병묵 NIPA AI인프라확충팀장은 "AI 기술은 몇 개월 내로 개발과 적용이 이뤄지고 있다"며 "올 하반기나 내년 상반기면 경쟁 구도가 결정될 수 있다"고 강조했다. 이 같은 상황에서 차세대 GPU 확보 여부는 이번 사업의 핵심 변수로 꼽힌다. 최신 GPU 기반 대규모 클러스터를 구축할 경우 국내 기업과 연구기관이 고성능 AI 모델을 개발·학습할 수 있는 환경이 마련된다. 반면 차세대 GPU 도입이 지연될 경우 인프라 수준 격차가 기술 경쟁력 차이로 이어질 수 있다는 우려도 제기된다. 정부는 이번 사업을 통해 단순히 GPU를 도입하는 데 그치지 않고, 이를 기반으로 한 AI 생태계 확장을 함께 추진한다는 계획이다. 확보된 GPU 자원은 산업계·학계·연구계에 배분돼 AI 모델 개발과 서비스 고도화에 활용된다. 특히 대규모 클러스터를 통한 학습 환경을 제공함으로써 국내에서도 초거대 AI 개발이 가능한 기반을 마련하겠다는 구상이다. 업계에선 베라루빈 도입 여부가 이번 사업의 방향성을 가늠할 핵심 변수로 보고 있다. 차세대 GPU 확보 속도가 기술 경쟁력과 직결되는 만큼, 도입 시점과 규모에 따라 사업 성격이 달라질 수 있다는 분석이다. 업계 관계자는 "베라루빈은 단순히 성능이 좋은 GPU라기보다 '최신 기술을 얼마나 빠르게 가져올 수 있느냐'를 보여주는 상징적인 장비"라며 "정부가 이 부분을 강조하는 것은 글로벌 AI 경쟁에서 뒤처지지 않겠다는 메시지로 읽힌다"고 말했다. 정부 역시 차세대 GPU 도입과 관련해 일정 수준의 유연성을 두고 대응할 방침이다. 공급 상황과 시장 변수에 따라 도입 시점과 물량이 달라질 수 있는 만큼, 향후 협상 과정에서 세부 조건을 조정하겠다는 입장이다. NIPA 관계자는 "차세대 GPU는 출시 시점과 공급 상황이 유동적인 만큼, 선정 이후 협상을 통해 구축 시기와 방식 등을 현실적으로 조율할 계획"이라며 "국내 AI 경쟁력 확보를 위해 필요한 자원은 최대한 빠르게 확보하겠다"고 밝혔다.

2026.03.20 17:39장유미 기자

엔비디아 '깐부' AWS, AI 경쟁력 강화…클라우드 주도권 굳히기 박차

엔비디아가 아마존웹서비스(AWS)와 협력을 확대하며 클라우드 기반 AI 인프라 주도권 굳히기에 나섰다. 그래픽처리장치(GPU) 중심의 기존 우위를 바탕으로 데이터 처리와 AI 모델까지 영역을 넓히며 경쟁사들과의 격차 확대에 나선 모양새다.엔비디아는 17일(현지시간) 미국 새너제이에서 열린 'GTC 2026'에서 AWS와의 협력을 통해 GPU 가속 솔루션을 확대한다고 밝혔다. 양사는 AWS 환경에서 엔비디아 기반 데이터 처리 기능을 확장하고 네모트론(Nemotron) 오픈 모델 제품군 지원을 추가할 계획이다. 이번 협력은 단순 인프라 제공을 넘어 풀스택 AI 생태계 구축으로 이어진다는 점에서 주목된다. 엔비디아와 AWS는 2010년부터 협업을 이어오며 GPU 인프라, 소프트웨어, 서비스 전반을 통합한 솔루션을 제공해왔고 이를 통해 기업의 AI 구축 및 배포 시간을 단축해왔다. 특히 이번 발표에서 주목되는 부분은 최신 GPU의 클라우드 도입이다. 엔비디아의 'RTX 프로 4500 블랙웰 서버 에디션' GPU는 아마존 EC2 인스턴스를 통해 AWS에 처음 도입될 예정이다. AWS는 해당 GPU를 지원하는 최초의 클라우드 사업자로, 이를 통해 고객은 온프레미스 수준의 블랙웰 성능을 클라우드에서도 활용할 수 있게 된다. 해당 인스턴스는 AWS 니트로 시스템 기반으로 설계돼 보안성과 안정성을 강화했으며 아마존 EMR과 결합 시 대규모 데이터 처리 워크로드에 최적화된 성능을 제공한다. 이는 데이터 분석 및 AI 학습 환경에서 클라우드 활용도를 한층 끌어올릴 것으로 전망된다. AI 모델 측면에서도 협력 범위가 확대됐다. 엔비디아의 '네모트론 나노 3' 모델은 세일즈포스의 AI 플랫폼 '에이전트포스'에 아마존 베드록을 통해 제공된다. 해당 모델은 높은 처리량이 요구되는 B2C 애플리케이션 환경에서도 활용 가능하며 세일즈포스 벤치마크 기준 요약 및 생성 작업에서 높은 비용 효율성을 보인 것으로 평가된다. 또 AWS는 아마존 베드록에서 네모트론 모델을 위한 강화 학습 기반 파인튜닝(RFT) 기능을 지원할 예정이다. 이를 통해 개발자는 특정 산업에 맞춰 모델의 추론 방식과 응답 구조를 정밀하게 조정할 수 있다. 이는 법률, 헬스케어, 금융 등 고도화된 전문 영역에서 AI 활용도를 높이는 핵심 기능으로 꼽힌다. AWS 역시 이번 협력을 통해 AI 인프라 경쟁력 강화에 나선 것으로 해석된다. 기업들이 엔비디아 '쿠다(CUDA)' 생태계를 중심으로 AI를 개발하는 상황에서 최신 GPU를 선제 확보해 고객 이탈을 막고, 아마존 EMR과 베드록 등 자사 서비스와 결합해 AI 워크로드를 플랫폼 내부에 묶어두려는 전략이다. 업계에선 AWS가 자체 AI 칩과 엔비디아 GPU를 병행하는 '투트랙 전략'을 통해 성능과 비용 경쟁력을 동시에 확보하려는 행보로 보고 있다. 업계 관계자는 "AWS는 단순히 GPU를 도입하는 수준을 넘어 AI 인프라 전반을 자사 플랫폼 중심으로 재편하려는 듯 하다"며 "이번 일을 기점으로 향후 생성형 AI 서비스 경쟁에서 클라우드 사업자의 영향력이 더 커질 가능성이 있다"고 말했다.

2026.03.18 12:15장유미 기자

엔비디아, GTC 2026서 AI 준비형 워크스테이션 생태계 확장

엔비디아는 미국 캘리포니아 주 새너제이에서 진행중인 'GTC 2026' 컨퍼런스 중 주요 PC 제조사가 인텔 제온 600 프로세서와 RTX 프로 블랙웰 GPU를 탑재한 AI 준비형 워크스테이션 제품군을 공개했다고 밝혔다. 인텔 제온 600 프로세서(그래나이트래피즈-WS)는 2024년 8월 말 공개된 전세대 제품인 제온W 3500 프로세서 대비 최대 코어 수를 30% 가량 높이고 극자외선(EUV) 기반 인텔 3(Intel 3) 공정을 활용해 전력 효율성을 개선했다. 각종 AI GPU 가속기나 추론 모듈, SSD 등 고성능 입출력을 위해 PCI 익스프레스 5.0 레인(통로) 최대 128개를 지원한다. 메모리는 DDR5-6400MHz를 최대 8채널로 구성 가능하다. 최신 드라이버를 탑재한 RTX 프로 블랙웰 GPU는 엔비디아 네모트론 오픈 모델과 주요 커뮤니티 모델을 도입 즉시 실행 가능하다. 개발자와 팀이 AI 워크로드를 워크스테이션에서 즉시 실험하고 배포할 수 있도록 한다. 올라마, SG랭, LM스튜디오 등 주요 소프트웨어 제공 업체도 RTX 프로에 최적화된 모델과 도구를 제공한다. 오픈소스 기반 에이전틱 AI 모델인 오픈클로의 보안을 강화한 네모클로 구동도 가능하다. 행사 기간 중 레노버 씽크스테이션 P5 2세대, 델테크놀로지스 델 프로 프리시전 9 T2, T4, T6 등이 공개됐다. HP는 향후 출시될 엔비디아 GPU를 지원할 수 있도록 Z 워크스테이션을 미래 대비 사양으로 설계할 예정이다.

2026.03.18 09:39권봉석 기자

게이밍 GPU 교체주기 장기화...AI 기능으로 '공백 메우기'

글로벌 빅테크 기업의 대규모 AI 인프라 투자 경쟁 속에서 데이터센터용 GPU 수요가 급증하면서, 게이머나 일반 소비자용 GPU의 신제품 투입 우선순위가 내려가고 있다. 엔비디아는 현행 블랙웰과 차기 제품인 루빈에 GPU 신제품 개발과 생산 역량을 집중하는 한편 일반 소비자용 신제품 투입 시기를 미루고 있다. 올해에서 내년까지 새 GPU 투입이 미뤄질 것이라는 전망도 나온 바 있다. 엔비디아는 AI 기반 소프트웨어 기술을 활용한 업스케일링·프레임 생성 등으로 신제품 공백을 메우고 있다. 올 초 CES에서 DLSS 4.5를 공개한 데 이어 올해 중 업데이트를 통해 이를 강화할 예정이다. 2024년 이후 데스크톱 PC용 GPU 신제품 출시가 없는 인텔 역시 AI 기반 프레임 생성 기능을 현행 최신 제품 뿐만 아니라 2022년 출시된 전 세대 GPU까지 확장했다. 그래픽카드 시장의 경쟁 축도 AI 알고리듬 경쟁으로 향하고 있다. 엔비디아, 게이밍 GPU 신제품 투입 연기 엔비디아는 일반 소비자용 GPU 출시 이후 일정 시간이 지나면 작동 클록을 높이고 메모리 탑재량을 늘린 '슈퍼' 시리즈를 추가 출시했다. 이는 제품 수명을 연장하고 최대 경쟁사인 AMD 대응력을 유지하기 위한 수단이다. 올 초 CES를 앞두고도 파생 제품 출시가 예상됐지만 이는 실현되지 않았다. 글로벌 빅테크가 AI 인프라 투자에 경쟁적으로 나서면서 일반 소비자용 GPU 추가 출시는 우선 순위에서 밀린 것으로 판단된다. 이달 초 미국 IT 매체 디인포메이션은 익명을 요구한 관계자를 인용해 "RTX 50 파생 제품의 설계는 이미 끝났지만 메모리 반도체 수급난과 공급 부족 때문에 출시가 보류됐다"고 설명했다. DLSS, AI 기반 프레임 생성으로 성능 강화 엔비디아가 CES에서 새 GPU 대신 내세운 기술은 AI를 활용해 게임 프레임 수를 향상시킬 수 있는 기능인 DLSS(딥러닝 슈퍼샘플링) 4.5다. DLSS는 AI를 이용해 저해상도 게임 화면을 고해상도로 처리한다. 그래픽칩셋 부하는 줄이고 화질 저하는 최소화하며 초당 프레임 수는 높일 수 있다. RTX 5090 등 최상위 GPU가 아니어도 충분히 높은 프레임을 뽑아낼 수 있다. DLSS 4.5는 지포스 RTX 40/50 시리즈 GPU에서 작동한다. 지난 해 초 CES 2025에서 공개된 DLSS 4를 보완했고 2세대 트랜스포머 모델을 이용해 화질 저하 현상을 개선했다. 인텔, 2022년 출시 GPU까지 XeSS 확장 인텔 역시 아크 A/B시리즈용 GPU의 AI 연산 기능을 활용한 XeSS(Xe 슈퍼샘플링) 기능을 구현한 상태다. 코어 울트라 시리즈3(팬서레이크)에 탑재된 아크 B390 GPU에는 기준 프레임 두 개로 최대 세 개 중간 프레임을 AI로 생성하는 XeSS-MFG(다프레임 생성) 기능이 추가됐다. 지난 13일 업데이트된 아크 GPU 드라이버는 XeSS-MFG 기능을 2022년 출시된 데스크톱 PC용 그래픽카드인 아크 A770, 코어 울트라 시리즈1(메테오레이크)/시리즈2(루나레이크)에 탑재된 아크 GPU까지 확장했다. 이를 이용하면 아크 A770 등 구형 그래픽카드에서도 초당 프레임을 최대 네 배까지 끌어올릴 수 있다. 그래픽카드 교체주기 연장... AI 기반 부가기능으로 보완 디인포메이션 등에 따르면 엔비디아는 새 GPU 아키텍처 '루빈(Rubin)'을 적용한 RTX 50 시리즈 후속 제품을 2027년 말 대량 생산하려던 계획도 연기한 것으로 추정된다. 올해 뿐만 아니라 내년까지 새 PC용 GPU가 등장하지 않을 수 있다는 의미다. HBM뿐 아니라 고성능 GDDR 메모리 확보도 점점 어려워지면서 소비자용 GPU 생산 일정이 영향을 받고 있다는 분석도 나온다. 일반 소비자용 그래픽카드 교체 주기가 길어지고 AI 기반 성능 개선 기술 의존도가 높아질 전망이다. 엔비디아는 지난 해 출시한 RTX 50 시리즈 GPU의 성능 향상을 위한 DLSS 4.5 추가 업데이트도 준비중이다. AI 생성 프레임을 6배로 늘리는 한편 모니터 최대 화면주사율에 맞춰 화질과 프레임의 균형을 자동으로 조절하는 기능이 포함될 예정이다.

2026.02.25 16:31권봉석 기자

엔비디아, 메타에 AI칩 수백만개 공급 예정…장기 파트너십 체결

엔비디아가 글로벌 주요 클라우드서비스제공자(CSP) 메타와 장기간·대규모 AI 반도체 공급에 대한 계약을 체결했다. 17일(현지시간) 엔비디아는 메타와 온프레미스, 클라우드 및 AI 인프라에 대한 다년간의 전략적 파트너십을 맺었다고 밝혔다. 이번 협력으로 엔비디아는 메타에 수백만 개의 '블랙웰' 및 '루빈' GPU를 공급할 예정이다. 해당 GPU는 AI 데이터센터에 필요한 초고성능 칩이다. 특히 루빈의 경우, 올해 본격적인 상용화가 예상된다. 또한 메타는 자사 데이터센터에 엔비디아의 그레이스 CPU를 단독으로 도입하기로 했다. 주요 CSP 기업 중 엔비디아의 그레이스 CPU만을 채용한 사례는 이번이 처음이다. 그간 메타는 Arm 기반의 CPU를 자사 AI칩의 보조 프로세서로 활용해 왔다. 이와 관련해 로이터통신은 "고객사향 매출을 공개한 적은 없지만, 메타는 엔비디아의 최근 분기 매출의 61%를 차지하는 4대 CSP 중 하나"라며 "엔비디아가 이번 계약을 강조한 것은 메타와의 대규모 사업 관계 유지와 CPU 시장에서의 입지 강화를 보여주기 위한 것"이라고 평가했다. 젠슨 황 엔비디아 최고경영자(CEO)는 "엔비디아는 CPU, GPU, 네트워킹 및 소프트웨어 전반에 걸친 심층적인 공동 설계로 메타가 차세대 AI 인프라를 구축하는 데 필요한 모든 플랫폼을 제공할 것"이라고 말했다. 마크 저커버크 메타 CEO는 "엔비디아와의 파트너십 확대로 베라 루빈 플랫폼을 활용한 최첨단 클러스터를 구축하고, 전 세계 모든 사람에게 맞춤형 인공지능을 제공하게 돼 기쁘다"고 밝혔다.

2026.02.18 10:10장경윤 기자

엔비디아, Arm 윈도 PC 칩 'N1X/N1' 상반기 출시하나

엔비디아가 2024년 하반기부터 대만 팹리스 미디어텍과 개발을 시작한 윈도 PC용 Arm 기반 시스템반도체(SoC)인 N1X/N1이 올 상반기 안에 정식 제품으로 등장할 수 있다는 전망이 나왔다. N1X/N1은 고성능 CPU 코어와 블랙웰 GPU를 결합한 SoC로, 엔비디아 개인용 AI 워크스테이션 'DGX 스파크' 등에 에 적용된 GB10과 유사한 구성이다. 기존 Arm 윈도 노트북의 한계로 지적돼 온 그래픽 성능을 대폭 끌어올릴 수 있다. 대만 디지타임스는 엔비디아가 오는 3월 'GTC 2026' 행사에서 N1X/N1을 정식 공개하고, 6월 '컴퓨텍스 타이베이 2026' 행사 중 실제 제품을 공개할 가능성이 높다고 짚었다. 그러나 게임과 안티치트 등을 포함한 소프트웨어 호환성이 최대 변수로 꼽힌다. 2024년 하반기부터 N1/N1X 개발설 흘러나와 엔비디아가 대만 팹리스 미디어텍과 협력해 윈도 PC용 Arm 칩을 개발중이라는 루머는 2024년 하반기부터 대만 내 공급망을 중심으로 간헐적으로 흘러나왔다. 엔비디아가 개발중인 칩은 ▲ Arm 코어텍스(Cortex)-X925 CPU 코어 10개, 저전력·고효율 코어텍스-A725 코어 10개와 블랙웰 GPU를 결합한 'N1X' ▲ 코어 수를 줄이고 GPU 성능도 낮춘 'N1' 등 두 개다. 이 중 CPU와 GPU는 지난해 4분기부터 우분투 리눅스 기반 'DGX OS'를 탑재하고 시장에 출시된 개인용 AI 워크스테이션 'DGX 스파크' 내장 GB10과 거의 구성이 같은 것으로 알려져 있다. 작년 컴퓨텍스 공개는 불발... 벤치마크 수치는 노출 작년 5월 '컴퓨텍스 타이베이 2025' 개최를 앞두고 엔비디아와 미디어텍 두 회사가 N1X/N1 칩을 공개할 수 있다는 전망도 나왔다. 그간 컴퓨텍스를 포함해 공개석상에 등장하지 않았던 차이리싱(蔡力行) 미디어텍 CEO가 기조연설에 나섰다는 사실 때문이다. 그러나 엔비디아 기조연설이나 미디어텍 기조연설에서 N1X나 N1 관련 내용은 등장하지 않았다. 차이리싱 미디어텍 CEO와 젠슨 황 엔비디아 CEO도 GB10 관련 내용만 소개하는 데 그쳤다. 이후 작년 7월에는 N1X 칩 성능을 Arm용 윈도11에서 실행한 결과가 공개되기도 했다. CPU 성능은 인텔 14세대급 프로세서와, 내장 GPU 성능은 인텔 코어 울트라 시리즈3의 Xe3와 비슷할 것으로 예상된다. 디지타임스 "2분기부터 실제 제품 등장 전망" 대만 디지타임스는 지난 19일 공급망 관계자를 인용해 "엔비디아 N1X 칩 기반 노트북이 이르면 올 1분기 시장에 출시되고 2분기부터 본격적으로 시장에 공급될 것"이라고 보도했다. 실제로 작년 11월 경 주요 PC 제조사인 델테크놀로지스가 엔비디아 N1X 기반 '델 16 프리미엄' 노트북 시제품을 운송했다는 기록이 드러나기도 했다. 또 레노버도 최근 게이밍 노트북 '리전'에 탑재되는 소프트웨어인 '리전 스페이스' 관련 기술지원 문서에 'Legion 7 15N1X11'이라는 미출시 제품 명칭을 표기했다. 이는 '15인치 디스플레이와 엔비디아 N1X를 탑재한 리전 7 노트북'으로 해석될 수 있다. 이를 종합하자면 엔비디아가 오는 3월 중순 미국 새너제이에서 진행될 컨퍼런스 'GTC 2026'에서 N1X/N1칩을 공개하고, 6월 초순 대만에서 진행될 '컴퓨텍스 타이베이 2026'에서 실제 제품을 출시하는 스케줄로 이어질 수 있다. 게임 호환성이 관건... 최근 Arm용 X박스 앱 공개 엔비디아 N1X/N1 SoC는 현재까지 출시된 노트북용 SoC 중 그래픽 성능 면에서 최상위에 있다. Arm 진영에서는 배터리 지속시간과 휴대성이 중요한 업무용 노트북 수요가 퀄컴 스냅드래곤 X 엘리트로, 게임용 고성능 노트북은 엔비디아 N1X로 양분될 가능성도 있다. 그러나 오히려 GPU 성능보다는 주로 게임이나 안티치트 등 소프트웨어 호환성이 더 큰 문제가 될 것으로 보인다. 엔비디아에 한 발 앞서 Arm 윈도 PC 시장에 참여한 퀄컴도 별도 조직을 만들고 호환성 문제를 해결하는 데 10여 년 가량을 투자했다. 특히 GPU 등에 직접 접근해야 하는 게임 특성상 여러 문제가 발생할 수 있다. 다만 지난 21일 마이크로소프트가 Arm용 X박스 앱을 공개했고 X박스 게임 패스 카탈로그에 등록된 게임 중 85% 가량이 현재 Arm용 윈도11을 지원한다. 엔비디아가 자체 운영하는 클라우드 게이밍인 '지포스 나우'를 Arm용으로 개발하는 방안도 있다.

2026.01.26 16:39권봉석 기자

엔비디아, 차세대 AI GPU '루빈' 공개

[라스베이거스(미국)=권봉석] 엔비디아가 5일(이하 현지시간) 라스베이거스 퐁텐블로 시어터에서 진행한 기조연설에서 데이터센터용 차세대 AI GPU 플랫폼 '루빈'(Rubin)을 공개했다. 엔비디아는 2024년 컴퓨텍스 기조연설에서 블랙웰을 시작으로 매년 새 GPU를 출시하겠다고 밝힌 바 있다. 지난 해 블랙웰을 강화한 '블랙웰 울트라'에 이어 올해는 CPU와 GPU를 새로 설계한 '루빈'이 투입된다. 루빈은 단일 GPU를 넘어 CPU, 네트워크, 보안, 스토리지를 하나의 슈퍼컴퓨터로 통합한 랙 스케일 아키텍처로, 대규모 학습과 추론 비용을 획기적으로 낮추는 데 초점을 맞췄다. 루빈 GPU는 3세대 트랜스포머 엔진과 하드웨어 가속 적응형 압축을 적용해 추론에서 50페타플롭스(NVFP4) 연산 성능을 제공한다. GPU 간 연결에는 6세대 NV링크를 적용해 GPU당 3.6TB/s, NVL72 랙 기준 260TB/s 대역폭을 구현했다. CPU는 Arm IP 기반 새 제품인 '베라'이며 에이전틱 AI 추론을 겨냥했다. 최대 88개 코어로 구성된 CPU가 루빈 GPU와 직접 연결돼 전력 효율과 데이터 이동 성능을 동시에 확보했다. 엔비디아는 루빈 플랫폼을 구성하는 베라(Vera) CPU와 루빈 GPU, GPU 사이에서 데이터를 주고 받는 NV링크 6 스위치, 데이터 전송에 관여하는 블루필드4 DPU 등을 통합설계했다. 이를 이용해 루빈이 블랙웰 대비 1/10 수준의 토큰 비용으로 대규모 '혼합 전문가'(MoE) 모델 추론을 수행할 수 있으며 동일한 모델 학습에 필요한 GPU 수를 25% 수준으로 줄일 수 있다는 것이 엔비디아 설명이다. 엔비디아는 루빈이 올 하반기부터 주요 클라우드와 서버 파트너를 통해 본격 공급될 것이라고 밝혔다. AWS, 구글 클라우드, 마이크로소프트, OCI를 비롯해 다수의 AI 연구소와 기업들이 루빈을 도입 예정이다.

2026.01.06 08:01권봉석 기자

엔비디아, RTX 프로 5000 72GB 블랙웰 GPU 출시

엔비디아가 19일 데스크톱 PC용 RTX 프로 5000 72GB 블랙웰 GPU를 정식 출시했다. RTX 프로 5000 72GB 블랙웰은 기존 출시 제품(48GB) 대비 용량을 50% 늘린 72GB로 늘려 AI 개발자, 데이터 과학자, 크리에이티브 전문가의 대용량 메모리 기반 워크플로우 수행을 돕는다. 연산 성능은 최대 2,142 TOPS(1초당 1조 번 연산)이며 GDDR7 72GB 메모리에 더 큰 규모의 모델을 올려 훈련, 튜닝할 수 있다. 클라우드 대비 낮은 지연시간으로 외부 유출이 힘든 사내 자료나 민감한 데이터를 처리할 수 있다. 아놀드, 카오스 V-레이, 블렌더, D5 렌더, 레드시프트 등 공학/산업용/크리에이티브 응용프로그램에서 렌더링 시간을 최대 4.7배 단축한다. 엔비디아 RTX PRO 5000 72GB 블랙웰 GPU는 현재 잉그램 마이크로, 리드텍, 유니스플렌더, 엑스퓨전 등 파트너사를 통해 출시됐다. 글로벌 시스템 빌더를 통한 더 넓은 공급은 내년 초 시작될 예정이다.

2025.12.19 10:51권봉석 기자

슈퍼마이크로, 엔비디아 HGX B300 수냉식 서버 출하…고집적·고효율 인프라 구현

슈퍼마이크로가 고집적·고효율 인공지능(AI) 인프라 수요에 대응하기 위해 엔비디아 최신 그래픽처리장치(GPU) 플랫폼을 적용한 수냉식 서버 솔루션을 전면에 내세웠다. 하이퍼스케일 데이터센터와 AI 팩토리를 겨냥한 이번 신제품을 통해 GPU 집적도와 에너지 효율을 동시에 끌어올린다는 전략이다. 슈퍼마이크로는 엔비디아 HGX B300 기반 4U 및 2-OU(OCP) 수냉식 솔루션 출시·출하를 시작했다고 15일 밝혔다. 이번에 선보인 제품은 엔비디아 블랙웰 아키텍처 기반으로 설계됐으며 슈퍼마이크로의 데이터센터 빌딩 블록 솔루션(DCBBS)이 핵심 구성 요소로 자리 잡았다. 신제품은 하이퍼스케일 데이터센터와 AI 팩토리가 요구하는 고성능 연산과 높은 GPU 집적도를 충족하는 동시에 전력·냉각 효율을 개선한 것이 특징이다. 특히 수냉식(DLC) 기술을 적용해 고전력 GPU 환경에서도 안정적인 운영이 가능하도록 설계됐다. 2-OU(OCP) 수냉식 솔루션은 21인치 OCP 오픈 랙 V3(ORV3) 규격에 맞춰 구성됐다. 랙당 최대 144개의 GPU를 탑재할 수 있는 고수준의 집적도를 제공하며 블라인드-메이트 매니폴드 커넥션과 모듈형 GPU·CPU 트레이 아키텍처를 통해 서비스성과 확장성을 동시에 확보했다. 이를 통해 제한된 공간에서 보다 많은 AI 워크로드를 처리할 수 있도록 지원한다. 해당 시스템은 엔비디아 블랙웰 울트라 GPU 8개를 단일 노드에 탑재해 GPU당 최대 1천100와트(W)의 전력을 소화한다. 단일 ORV3 랙은 최대 18개 노드, 총 144개의 GPU 구성이 가능하며 엔비디아 퀀텀-X800 인피니밴드 스위치와 슈퍼마이크로의 1.8메가와트(MW) 인로우 CDU를 통해 대규모 클러스터로 확장할 수 있다. 이같이 구성된 슈퍼클러스터는 최대 1천152개의 GPU까지 확장 가능하다. 함께 공개된 4U 전면 I/O 수냉식 솔루션은 기존 19인치 EIA 랙 환경을 그대로 활용할 수 있도록 설계됐다. 대규모 AI 팩토리에 이미 구축된 표준 랙 인프라에서도 2-OU(OCP) 솔루션과 동일한 연산 성능과 냉각 효율을 제공한다. 특히 DLC 기술을 통해 시스템 발열의 최대 98%를 수냉식으로 제거해 에너지 효율을 높이고 소음을 줄였다. 엔비디아 HGX B300 기반 두 솔루션은 시스템당 최대 2.1테라바이트(TB)의 HBM3e GPU 메모리를 지원한다. 이를 통해 대규모언어모델(LLM) 학습과 멀티모달 추론 등 고부하 AI 워크로드를 보다 효율적으로 처리할 수 있도록 돕는다. 엔비디아 퀀텀-X800 인피니밴드 및 스펙트럼-4 이더넷과 결합할 경우 커넥트X-8 슈퍼NICs를 통해 최대 800기가비피에스(Gb/s)의 네트워크 처리량도 확보할 수 있다는 설명이다. 운영 효율성과 총소유비용(TCO) 절감도 이번 제품의 핵심 요소다. 슈퍼마이크로의 DLC-2 기술은 데이터센터 에너지 사용량을 최대 40%까지 줄이고 45도 온수 냉각 방식을 적용해 물 사용량도 최소화한다. 기존 냉각수나 압축기가 필요 없는 구조로, 데이터센터 운영 부담을 낮췄다. 또 DCBBS 기반으로 L11·L12 단계의 사전 검증을 거쳐 랙 단위로 출하돼 대규모 AI 인프라 구축 시 가동 준비 시간을 단축할 수 있도록 지원한다. 찰스 리앙 슈퍼마이크로 최고경영자(CEO)는 "이번에 선보인 엔비디아 HGX B300 기반 수냉식 솔루션은 하이퍼스케일 데이터센터와 AI 팩토리가 요구하는 성능 집적도와 에너지 효율성을 충족한다"며 "업계에서 가장 컴팩트한 엔비디아 HGX B300 탑재 솔루션으로, 단일 랙에서 최대 144개의 GPU를 지원하고 검증된 DLC 기술을 통해 에너지 소비량과 냉각 비용을 절감한다"고 강조했다. 이어 "우리는 DCBBS를 통해 대규모 AI 인프라 구축을 지원하며 준비 시간 단축, 와트 당 최고 성능 구현, 설계부터 배포까지의 엔드투엔드를 통합 제공한다"고 덧붙였다.

2025.12.15 16:41한정호 기자

젠슨 황, 'AI 거품론' 부정..."엔비디아는 다르다"

젠슨 황 엔비디아 CEO가 19일(현지시간) 3분기 실적발표 이후 컨퍼런스콜에서 AI 시장 과열 논란을 정면으로 반박했다. 그는 이달 초부터 나오기 시작한 'AI 버블'을 둘러싼 시장 우려에 자사 기술력과 수요의 견고함을 강조했다. 젠슨 황 CEO는 "AI 버블에 대한 이야기가 많지만, 우리의 관점에서 보이는 것은 완전히 다르다. 엔비디아는 어느 가속기 제조사와 다르다. 훈련 전, 훈련 후, 추론 등 AI 모든 단계에서 경쟁력을 확보했다"고 밝혔다. 젠슨 황 CEO는 지난 10월 GTC 워싱턴 행사에서 올 초부터 내년 말까지 GPU 수주 잔고가 5천억 달러(734조 7천500억원)에 달한다고 밝히기도 했다. 이날 콜렛 크레스 엔비디아 CFO는 "이 수치는 현 세대 GPU인 블랙웰과 차세대 GPU인 루빈(Rubin)을 모두 포함한 것이다. 앤트로픽 등 신규 고객사가 추가되며 이 수치는 더 늘어날 것"이라고 설명했다. 엔비디아는 올 3분기 매출 중 중국 시장용으로 설계된 H20 GPU의 매출은 극히 미미했다고 밝힌 바 있다. 콜렛 크레스 CFO는 "3분기에는 지정학적 이슈와 현지 경쟁 심화로 중국 시장에서 대규모 발주는 없었다"고 설명했다. 이어 "4분기 전망에는 중국 시장의 데이터센터 관련 매출을 0(제로)으로 가정하고 있다. 더 경쟁력 있는 제품을 중국에 공급하지 못한 점은 아쉽지만, 미국 정부와 중국 정부 모두와 지속적으로 협력할 것"이라고 밝혔다. 젠슨 황 CEO는 생산·공급망 전략과 관련해 "엔비디아의 공급망은 사실상 전 세계 모든 기술 기업을 포함하고 있다. TSMC와 패키징 파트너들, 메모리 공급업체들, 그리고 모든 시스템 ODM이 우리와 함께 매우 잘 준비해 왔다"고 설명했다. 콜렛 크레스 CFO도 "글로벌 공급망에서 복원력을 강화하는 데 집중하고 있다. 지난 10월 미국(애리조나 주 TSMC 팹)에서 첫 블랙웰 웨이퍼가 생산됐고 향후 수 년간 폭스콘, 위스트론, 앰코와 함께 미국 내 생산을 확대할 것"이라고 밝혔다.

2025.11.20 08:33권봉석 기자

Prev 1 2 Next