검색 - IT세상을 바꾸는 힘 지디넷코리아

ZDNet 검색 페이지

'DGX-A100 GPU'통합검색 결과 입니다. (500건)

태그
기간
- 3개월
- 1년
- 1년 이전

재검색

[AI 고속도로] AI 클라우드 판 흔드는 GPU 전쟁…네오클라우드, 82조 시장 '정조준'

그래픽처리장치(GPU) 집약형 인공지능(AI) 워크로드가 급증하면서 AI·고성능 컴퓨팅에 특화된 '네오클라우드'가 클라우드 시장의 새 축으로 떠오르고 있다. 생성형 AI 확산으로 대규모 학습·추론 인프라 수요가 커진 가운데 GPU 용량과 가격 경쟁력, 데이터 주권 확보 역량이 기업 클라우드 전략의 주요 변수로 부상했다. 24일 시장조사기관 가트너에 따르면 네오클라우드 공급업체는 오는 2030년까지 2670억 달러 규모 AI 클라우드 시장에서 20%를 차지할 전망이다. 원화 기준으로는 약 410조원 시장 가운데 82조원 규모다. 네오클라우드는 AI와 고성능 워크로드에 특화된 클라우드 공급업체를 의미한다. 가트너는 생성형 AI 도입이 확산되면서 GPU 기반 컴퓨팅 수요가 전례 없는 수준으로 늘고 있으며, 이 과정에서 기존 범용 클라우드 모델의 한계가 드러나고 있다고 분석했다. 엔리케 카스테라 가트너 수석 애널리스트는 "미국의 하이퍼스케일러가 자체 소버린 서비스를 출시하고 있는 가운데 네오클라우드 공급업체가 주목을 받고 있다"며 "네오클라우드는 AI 최적화 인프라와 고성능 워크로드에 중점을 둔다는 점에서 차별점이 있다"고 말했다. 소버린 클라우드도 네오클라우드의 주요 경쟁력으로 꼽힌다. 일부 네오클라우드 사업자는 데이터와 운영이 특정 관할권 안에 유지되도록 보장하는 기능을 강화하고 있다. 데이터, 운영, 거버넌스 등 클라우드 환경 일부 또는 전체를 국경 안에 두도록 해 해외 법적 청구나 역외 접근으로부터 보호하는 방식이다. 글로벌 AI 클라우드 시장에선 GPU 특화 사업자의 인프라 확장도 이어지고 있다. 코어위브는 엔비디아와 협력을 확대해 2030년까지 5GW 이상 규모 AI 팩토리를 구축하겠다는 계획을 내놨고, 람다는 엔비디아 베라 루빈 NVL72와 GB300 NVL72 기반 베어메탈 인스턴스를 준비하고 있다. 네비우스도 엔비디아와 전략적 협력을 맺고 차세대 풀스택 AI 클라우드 구축에 나섰다. 카스테라 애널리스트는 "네오클라우드는 AI 워크로드에 최적화된 성능, 유연한 배포 모델, 강력한 데이터 주권 보장을 바탕으로 차별화된 가치를 제공하고 가격 경쟁력에서도 앞선다"며 "주권, 성능, 인프라 전문성이 기업의 주요 의사결정 요인으로 부상하면서 AI 클라우드 시장은 새로운 국면에 접어들었다"고 설명했다. 가트너는 기업도 중앙집중형 글로벌 클라우드 모델을 넘어 현지화된 하이브리드 아키텍처로 전환하는 움직임을 보이고 있다고 봤다. 인프라 및 운영(I&O)을 비롯한 IT 리더는 전문 네오클라우드 공급업체를 평가해 고성능 AI 인프라와 한정된 GPU 용량을 확보하고 기존 하이퍼스케일러에 국한되지 않는 다각화 전략을 추진해야 한다고 제언했다. 카스테라 애널리스트는 "기업은 네오클라우드 공급업체를 활용해 AI 역량을 강화하면서 데이터 주권과 규제 준수에 대한 통제권도 함께 확보할 수 있을 것"이라며 "이들은 AI 워크로드에 특화된 고성능 인프라에 대해 보다 유연하게 접근할 수 있도록 지원함으로써 기업의 혁신 속도를 높인다"고 말했다.

2026.06.24 10:07장유미 기자

"AI 도입보다 어려운 건 운영"…락플레이스, '통제형 자율 운영' 해법 제시

인공지능(AI) 확산이 기업 디지털 전환을 가속화하며 생산성을 끌어올리고 있다. 하지만 생성형 AI와 그래픽처리장치(GPU) 인프라, 클라우드 네이티브 기술 도입이 본격화되면서 IT 운영 환경은 갈수록 복잡해지는 추세다. 성능과 비용, 보안, 장애 대응을 아우르는 통합 운영 체계 구축이 새로운 과제로 부상하면서 안정적인 서비스 운영 역량이 기업 경쟁력을 좌우하는 핵심 요소로 떠오르는 모습이다. 22일 락플레이스는 이러한 변화에 대응하기 위해 플랫폼 표준화와 옵저버빌리티, AI옵스(AIOps), 자동화를 결합한 통합 운영 모델 '로드(RO@D)'를 앞세워 통제형 자율 운영 전략을 제시했다. 기업 IT 환경은 디지털 서비스 확대와 데이터 주권, 비용 최적화 요구에 따라 단일 데이터센터 중심 구조에서 하이브리드·멀티 클라우드 환경으로 빠르게 전환되고 있다. 특히 생성형 AI 도입이 본격화되면서 대규모 GPU 자원과 탄력적 확장성이 요구되는 AI 워크로드와 강력한 보안 및 안정성이 요구되는 기존 레거시 업무 시스템이 서로 다른 인프라 환경에서 분산 운영되는 사례가 늘고 있다. 여기에 쿠버네티스 기반 컨테이너 애플리케이션과 마이크로서비스 아키텍처(MSA) 확산까지 더해지면서 IT 운영 조직이 관리해야 할 복잡성은 한층 높아지는 상황이다. 문제는 AI 서비스가 기존 애플리케이션과 다른 운영 특성을 가진다는 점이다. AI 서비스는 GPU 사용량과 거대언어모델(LLM) 호출 횟수, 데이터 처리량, 추론 비용 등 다양한 요소가 복합적으로 작용하며 실시간 변동성을 만들어낸다. 단순히 서버 가동 여부를 확인하는 수준을 넘어 인프라와 애플리케이션, 데이터 파이프라인, 사용자 경험, 비용 구조까지 하나의 흐름으로 파악해야 하는 이유다. 이를 해결하기 위한 방안으로 다양한 옵저버빌리티 플랫폼이 등장하고 있다. 하지만 업계에서는 가시성 확보만으로는 복잡해진 운영 환경을 관리하는 데 한계가 있다는 지적도 나온다. 장애 발생 시 원인 분석과 조치, 검증 과정은 여전히 운영자의 경험과 수작업에 의존하는 경우가 많기 때문이다. 락플레이스는 단순 관측을 넘어 지능형 분석과 대응 자동화, 거버넌스까지 운영 전 과정을 하나의 흐름으로 통합하는 클라우드 네이티브 운영 모델 '로드'를 제시했다. 로드는 클라우드 플랫폼과 옵저버빌리티, 자동화를 단일 체계로 통합한 것이 특징이다. 가상머신(VM)과 컨테이너, AI 워크로드를 하나의 인프라 체계에서 관리할 수 있도록 구조화했다. 옵저버빌리티와 AI옵스(AIOps), 런북(Runbook) 자동화를 유기적으로 결합해 실시간 탐지부터 분석, 조치, 검증까지 이어지는 전방위적 운영 프로세스를 제공한다. 락플레이스는 엔터프라이즈 시장에서 검증된 '레드햇 오픈시프트' 기반 플랫폼으로 VM과 컨테이너, AI 워크로드를 일관된 기준으로 다룰 수 있는 토대를 마련했다. 여기에 '다이나트레이스(Dynatrace)' 기반 옵저버빌리티를 더해 서비스 흐름과 의존관계, 사용자 영향도, 인프라 상태를 입체적으로 분석한다. 더불어 운영자 승인과 정책 통제를 포함하는 '휴먼인더루프(Human-in-the-Loop)' 방식 통제형 자율 운영 모델로 안정성을 높였다. 반복 업무는 자동화하되 최종 의사결정과 통제 권한은 운영자가 보유함으로써 엔터프라이즈 환경에 필요한 거버넌스와 감사 가능성을 확보할 수 있도록 돕는다. 회사는 기업의 운영 성숙도에 맞춰 단계적으로 자율 운영 체계를 구축할 수 있도록 지원할 계획이다. 운영 진단과 플랫폼 표준화를 시작으로 옵저버빌리티 구축, AIOps 기반 원인 분석, 런북(Runbook) 자동화, 거버넌스 고도화 단계로 확장하는 방식이다. 락플레이스 관계자는 "AI 시대에는 단순히 인프라를 구축하는 것보다 복잡한 운영 데이터를 얼마나 빠르게 분석하고 실행 가능한 판단으로 연결하느냐가 중요하다"며 "로드를 통해 기업들이 클라우드 네이티브 환경에서 운영 가시성과 안정성, 효율성을 동시에 확보할 수 있도록 지원할 것"이라고 말했다.

2026.06.22 11:36남혁우 기자

[AI 고속도로] 같은 GPU, 다른 결과…AI 인프라도 산업별 맞춤형 설계

인공지능(AI) 인프라 시장의 경쟁 축이 단순 그래픽처리장치(GPU) 확보에서 산업별 워크로드 최적화로 이동하고 있다. 로봇과 자율주행, 바이오, AI 에이전트 등 활용 분야가 다양해지면서 같은 GPU라도 데이터 특성과 운영 방식에 따라 필요한 인프라 구조가 달라지고 있다는 분석이 나온다. 21일 업계에 따르면 최근 젠슨 황 엔비디아 최고경영자(CEO)가 방한해 로보틱스·제조·모빌리티 분야 AI 활용 가능성을 강조하면서 한국형 피지컬 AI가 화두로 떠올랐다. 다만 업계에선 피지컬 AI 확산이 곧 획일적인 인프라 수요 증가로 이어지지는 않을 것으로 보고 있다. 산업마다 AI 모델을 학습·검증·배포하는 방식이 다르고 GPU 사용 규모와 기간, 배치 환경도 제각각이기 때문이다. 이에 대해 안재만 베슬AI 대표는 "AI 인프라 수요는 더 이상 하나의 덩어리로 움직이지 않는다"며 "GPU를 얼마나 확보하느냐 못지않게 누가·어떻게·어디서 쓰는지에 따라 인프라 설계가 달라지고 있다"고 말했다. 피지컬 AI 확산…LLM과 다른 인프라 필요 피지컬 AI는 로봇과 자율주행차처럼 현실 공간에서 동작하는 AI를 의미한다. 대규모언어모델(LLM)이 인터넷 기반 텍스트 데이터로 학습하는 것과 달리 물체 파지나 충돌 반응 등 물리 데이터를 필요로 한다. 이에 시뮬레이션 환경에서 데이터를 생성하고 실제 데이터와 결합하는 과정이 중요해지고 있다. 인프라 구조 역시 LLM과 차이가 있다. 베슬AI에 따르면 시뮬레이션 데이터 생성부터 비전·언어·행동(VLA) 모델 학습, 이후 로봇이나 차량의 온보드 컴퓨터에 탑재해 실시간으로 구동하는 과정까지 고려해야 한다. 안 대표는 "스토리지, 네트워크, 데이터 공급 구조까지 함께 설계해야 피지컬 AI 학습 효율을 높일 수 있다"고 밝혔다. 대학은 짧고 기업은 길게…GPU 사용 패턴도 차별화 실제 GPU 활용 방식도 기관 성격에 따라 뚜렷하게 구분된다. 베슬AI가 최근 30일간 자사 플랫폼 '베슬 클라우드' 운영 데이터를 분석한 결과 대학과 연구기관의 평균 동시 사용 GPU 중앙값은 1.8장 수준으로 나타났다. 반면 기업 고객의 경우 46%가 한 번에 8장 이상 GPU를 사용했으며 최대 32장 규모의 멀티노드 환경까지 확장한 사례도 확인됐다. 배치 환경 역시 산업별 특성이 반영된다. 방산과 금융, 바이오, 통신 분야는 민감 데이터를 다루는 만큼 온프레미스나 폐쇄망 환경을 선호해 왔지만 최근에는 보안 인증을 갖춘 클라우드 활용도 함께 검토하는 추세다. 실제 베슬AI 고객사에도 통신과 보험, 의료, 방산 기업이 포함된 것으로 전해졌다. 로봇·에이전트·바이오마다 다른 GPU 전략 베슬AI는 산업별 특성에 맞춰 GPU 기종과 계약 방식, 노드 구성, 배치 환경을 달리 제공하고 있다. A100과 H100은 물론 B200·B300급 GPU까지 지원하며 온디맨드와 단기·장기 약정 방식, 단일 GPU와 멀티노드 클러스터 등을 워크로드에 맞춰 조합하는 구조다. 베슬AI는 각 고객별 맞춤형 AI 인프라를 지원하고 있다. 대표적으로 휴머노이드 로봇용 파운데이션 모델을 개발하는 기업은 시뮬레이션 데이터와 실제 로봇 데이터를 함께 학습해야 하는 만큼 테라바이트(TB)급 대규모 스토리지와 고성능 GPU를 제공했다. 여러 고객사 프로젝트를 동시 운영할 수 있는 격리된 개발 환경이 중요했던 B2B AI 에이전트 기업에는 학습 환경 추상화 레이어와 클러스터 공유 스토리지를 제공해 다중 워크스페이스 운영을 지원했다. 또 바이오·신약 AI 기업은 보안성이 높은 프라이빗 환경과 클라우드 자원을 유연하게 활용하는 구조를 선호하기에 베슬AI는 글로벌 'SOC 2 Type II' 인증과 초기 도입 부담을 완화한 소규모 시범 사용 크레딧을 제공하고 있다. 안 대표는 "AI 인프라 시장은 GPU를 빌려주는 단계를 넘어 산업별 워크로드가 실제로 작동할 수 있는 환경을 설계하는 방향으로 진화하고 있다"며 "앞으로는 피지컬 AI, 바이오, AI 에이전트 등 산업별 수요에 맞춰 유연한 GPU 인프라 운영 모델을 제공하는 것이 중요하다"고 강조했다.

2026.06.21 15:00한정호 기자

엔비디아 성공 공식, 구글이 따라 쓴다…TPU로 'GPU 장벽' 넘을까

구글이 자체 인공지능(AI) 반도체인 텐서처리장치(TPU) 사업을 앞세워 엔비디아 중심 AI 컴퓨팅 시장에서 영역 확장에 본격 나섰다. 엔비디아가 그래픽처리장치(GPU) 판매 확대에 활용해온 데이터센터 금융 지원 방식을 본격 적용하며 외부 고객 확보에 속도를 내는 모습이다. 18일(현지시간) 월스트리트저널(WSJ)에 따르면 구글은 미국 뉴욕주 서부 온타리오호 인근 AI 데이터센터 클러스터 '레이크 매리너' 프로젝트에 32억 달러(약 4조9000억원) 규모 금융보증을 제공했다. 이 프로젝트는 AI 인프라 기업 테라울프와 구글이 투자한 클라우드 업체 플루이드스택이 추진 중이다. 해당 데이터센터의 컴퓨팅 자원은 앤트로픽에 임대될 예정이다. 이 같은 구글의 전략은 엔비디아가 AI 칩 시장 지배력을 키울 때 활용한 방식과 유사하다. 데이터센터 사업자가 낮은 비용으로 자금을 조달할 수 있도록 지원하고, 이 자금이 다시 칩 구매와 컴퓨팅 임대 계약으로 이어지도록 만드는 구조다. 구글은 TPU 공급과 클라우드 계약, 대형 AI 고객 수요를 함께 묶어 엔비디아 GPU 의존도를 낮추려 하고 있다. AI 경쟁 축이 모델 개발에서 컴퓨팅 자원 확보로 이동하면서 자체 칩을 보유한 빅테크의 영향력도 커지고 있다. 구글은 검색과 AI 서비스 운영을 위해 TPU를 장기간 내부적으로 사용해 왔다. 이후 생성형 AI 수요가 급증하자 구글 클라우드를 통해 외부 기업에 TPU를 제공하기 시작했다. 최근에는 TPU 사업을 더 공격적으로 확장하고 있다. 지난달 TPU를 고객에게 직접 판매하겠다는 계획을 발표했고, AI 추론에 특화한 첫 TPU도 공개했다. 추론은 이용자 질의에 AI 모델이 답변을 생성하는 과정으로, 생성형 AI 서비스 확산에 따라 수요가 빠르게 늘고 있다. 하지만 엔비디아의 진입장벽은 여전히 높은 상태다. 엔비디아는 AI 칩 시장에서 90% 이상 점유율을 가진 것으로 추정된다. 이는 GPU 성능에 더해 쿠다(CUDA) 소프트웨어 생태계, 네트워킹 장비, 서버 시스템을 결합한 전체 하드웨어 스택이 강점으로 작용하고 있어서다. 또 AI 클라우드 업체들이 엔비디아 제품 배정 물량을 의식해 경쟁사 칩 도입에 부담을 느끼고 있기 때문이란 분석도 있다. 여기에 젠슨 황 엔비디아 최고경영자(CEO)는 구글 TPU의 경쟁력을 낮게 보고 있다. 그는 지난 4월 팟캐스트 인터뷰에서 엔비디아가 구글과 ASIC 업체보다 훨씬 넓은 시장 접근성을 갖췄다고 말했다. 앤트로픽 외에 TPU의 의미 있는 외부 고객이 많지 않다는 취지의 언급도 내놨다. 황 CEO는 "TPU가 비용 우위를 갖췄다는 점을 입증해 보였으면 한다"며 "엔비디아는 구글 TPU나 주문형 반도체(ASIC)보다 훨씬 앞서 있다"고 말했다. 이에 구글은 자금력을 앞세워 엔비디아에 맞설 기반을 넓히고 있다. 특히 이달에는 AI 인프라 투자를 위해 850억 달러 규모 자본 조달 계획을 밝히기도 했다. 또 루이지애나주 배턴루지 인근 70억 달러 규모 AI 데이터센터 프로젝트 '리버 벤드'에도 금융 지원을 제공하고 있다. 텍사스주 콜로라도시티 AI 컴퓨팅 임대 프로젝트에는 14억 달러 규모 금융보증을 제공 중이다. 더불어 구글은 블랙스톤과 50억 달러 규모 클라우드 서비스 합작법인 설립 계약도 체결했다. 이 법인은 엔비디아 칩을 기반으로 성장한 코어위브, 네비우스 등 AI 클라우드 업체와 경쟁한다. 아민 바흐다트 구글 AI 인프라 최고기술책임자(CTO)는 "엔비디아와의 경쟁에만 초점을 맞추고 있지 않다"며 "우리에게 중요한 것은 구글과 고객을 위한 더 나은 제품을 만드는 것"이라고 말했다.

2026.06.19 17:45장유미 기자

래블업 "인텔 '아크 프로 B70', RTX 프로 4000 대비 추론 처리량 높아"

AI 시장의 중심이 모델 학습에서 추론과 에이전틱 AI 서비스 운영으로 이동하면서 GPU 내장 메모리 용량의 중요성이 커지고 있다. 거대언어모델(LLM)에서 길게 이어지는 대화의 맥락을 처리하고 여러 이용자를 동시에 처리하려면 대용량 메모리가 중요하다. 특히 에이전틱 AI는 장시간 대화 맥락을 유지하고 여러 작업을 병렬 처리해야 하는 만큼 GPU 메모리 사용량이 급격히 증가한다. 이 과정에서 이전 추론 결과를 저장하는 'KV 캐시(Key-Value Cache)'가 중요한 역할을 한다. KV 캐시가 충분하지 않으면 기존 KV 캐시 데이터를 제거하거나 재배치해야 하며 이 과정에서 처리량이 감소하거나 응답 지연이 발생할 수 있다. 반대로 KV 캐시를 담을 메모리 용량이 충분하면 더 많은 사용자 요청과 긴 컨텍스트를 동시에 처리할 수 있다. 래블업, '백엔드.AI'에서 LLM 2종 대상 벤치마크 수행 국내 AI 플랫폼 기업인 래블업은 최근 엔터프라이즈 AI 인프라 운영 플랫폼 '백엔드.AI'에서 인텔 아크 프로 B70과 엔비디아 RTX 프로 4000 블랙웰을 대상으로 한 LLM 벤치마크 결과를 공개했다.(인텔 제온 w9-3475X, 우분투 25.10 환경) 인텔 아크 프로 B70은 지난 3월 말 출시된 워크스테이션용 GPU로 AI 추론 수요를 겨냥했다. Xe2 코어 32개와 32GB 메모리 기반으로 대용량 AI 모델을 분할 없이 구동할 수 있다는 점이 차별화 포인트다. 연산 성능은 최대 367 INT8 TOPS(초당 1조 회 연산) 수준이며 GDDR6 32GB 메모리를 탑재해 중소규모 기업과 개발자가 대형 언어모델(LLM)을 로컬 환경에서 직접 구동할 수 있게 했다. 비교 대상이 된 RTX 프로 4000 블랙웰은 쿠다 코어 8960개, ECC GDDR7 24GB 메모리를 탑재했고 메모리 대역폭은 672GB/s 수준이다. Qwen3 8B 모델에서 동시 요청시 초당 처리량 향상 현재 기업들이 활용하는 7B~30B급 오픈소스 LLM은 추론 과정에서 상당한 KV 캐시 공간을 요구하기 때문에 24GB와 32GB 메모리의 차이가 실제 처리량 격차로 이어질 수 있다. 래블업이 Qwen3 8B 모델을 기반으로 수행한 8K 컨텍스트 테스트에서 아크 프로 B70은 동시 요청 수가 늘어나도 초당 처리량이 꾸준히 높아졌다. 반면 RTX 프로 4000 블랙웰은 동시 요청 수가 16개 수준에 도달하자 메모리 부족 현상으로 처리량이 급감했다. 이 테스트에서 아크 프로 B70은 엔비디아 GPU 대비 최대 2.24배 높은 처리량을 기록했다. 컨텍스트 길이를 32K까지 늘린 환경에서는 격차가 더욱 커졌고 특정 구간에서는 아크 프로 B70이 최대 4배 이상 높은 처리량을 보였다. 이는 AI 에이전트 시대에 GPU 연산 성능 못지않게 메모리 용량이 중요해지고 있음을 시사한다. GPT-OSS 20B에서도 RTX 프로 4000 대비 처리량 25% 우위 GPT-OSS 20B 모델을 이용한 테스트에서도 비슷한 경향이 확인됐다. 아크 프로 B70은 동시 요청 수가 증가해도 안정적으로 성능을 유지했으며 32개 동시 요청 환경에서 RTX 프로 4000 블랙웰 대비 25% 처리량이 높았다. 래블업은 실제 벤치마크에서 아크 프로 B70의 KV 캐시 활용 가능 용량이 RTX 프로 4000 블랙웰 대비 평균 2배 수준으로 나타났다고 설명했다. 래블업 관계자는 "이에 따라 모델 가중치를 적재한 이후에도 더 많은 메모리 여유 공간을 확보할 수 있다"고 설명했다. 이어 "처리량과 가격을 함께 고려한 비용 효율 분석에서도 아크 프로 B70이 더 나은 결과를 보였고 AI 서비스 운영에 중요한 토큰당 비용 기준으로는 최대 8배 이상의 효율 향상이 가능하다"고 분석했다. AI 에이전트 등장에 GPU 메모리 용량 중요성 ↑ 래블업은 "장비와 솔루션 도입 시 토큰 처리 비용은 주요 검토 항목 중 하나이며 처리량과 GPU 가격에 따라 결정된다. 정가 기준 아크 프로 B70은 1099달러(약 149만원), RTX 프로 4000 블랙웰은 2199달러(약 297만원)로 벤치마크 결과를 반영하면 두 제품 간 비용 효율 격차는 더욱 커진다"고 설명했다. 다만 이번 결과는 특정 모델과 특정 추론 환경에서 측정된 것으로, AI 학습 성능이나 모든 워크로드에서 동일한 우위를 의미하지는 않는다. 또 AI 생태계 전반에서는 여전히 엔비디아의 영향력이 압도적이다. 쿠다(CUDA)를 중심으로 구축된 개발 환경과 풍부한 소프트웨어 지원은 AMD나 인텔 등 경쟁사가 단시간에 따라잡기 힘들다. 그러나 오픈소스 기반 인텔 AI 프레임워크인 '오픈비노'를 비롯해 vLLM, llama.cpp 등 주요 AI 프레임워크가 인텔 GPU 지원을 확대하고 있다. 업계에서는 아크 프로 B70이 AI 추론 시장을 겨냥한 실용적인 대안으로 자리잡을 가능성이 높다고 보고 있다. AI 에이전트가 확산될 수록 연산 성능뿐 아니라 메모리 용량과 비용 효율이 중요해지고 있기 때문이다.

2026.06.18 16:08권봉석 기자

엠키스코어, HPE 'AI 파트너상' 2년 연속 수상…국내기업 유일

엠키스코어가 HPE로부터 2년 연속 수상하며 인공지능(AI) 인프라 기술력을 인정받았다. 엠키스코어는 미국 라스베이거스에서 열린 HPE 파트너 그로스 서밋에서 아시아태평양(APAC) 채널 파트너 부문 'AI 파트너상'을 수상했다고 17일 밝혔다. 이 상은 전 세계 HPE 파트너사 중 비즈니스 성과와 기술 혁신을 종합 평가해 수여한다. 엠키스코어는 올해 수상 명단에 한국 기업으로는 유일하게 이름을 올렸다. 엠키스코어는 지난해에도 한국 HPE 파트너 중 최초로 'AI 솔루션 프로바이더상'을 받았다. 이번 수상으로 이 회사는 2년 연속 글로벌 무대에서 기술력을 검증받았다. 엠키스코어는 국내 최초로 수랭식 AI 데이터센터 데모센터를 구축해 운영 중이다. 해당 시설을 기반으로 실제 고객 환경에서 검증된 수랭 기반 턴키 솔루션을 제공해 왔다. 이 기술은 고성능 그래픽처리장치(GPU) 서버의 전력과 발열 문제를 해소하는 대안으로 꼽힌다. 지속가능한 AI 인프라 구축 측면에서도 효율성이 높다는 평가를 받는다. 정문기 엠키스코어 대표는 "2년 연속 글로벌 기업으로부터 기술력과 혁신성을 인정받게 돼 매우 기쁘다"며 "앞으로도 국내 최대 규모 수랭 전환 레퍼런스를 구축한 경험과 기술력을 바탕으로 국내 AI 데이터센터 인프라 시장을 선도해 나가겠다"고 말했다.

2026.06.18 10:45남혁우 기자

Arm "GPU에 AI 가속기 접목, 중저가폰 게임 성능 향상"

영국에 본사를 둔 반도체 설계자산(IP) 기업 Arm이 AI를 활용한 차세대 그래픽 기술 '뉴럴 렌더링(Neural Rendering)'을 공개했다. 모바일 게임 그래픽 품질 향상과 함께 Arm이 자체 개발한 GPU IP의 경쟁력 강화를 노렸다. 모바일 게임 업계는 그래픽 품질을 높일수록 전력 소모와 발열이 증가하는 근본적 문제 해결을 위해 노력해 왔다. Arm이 15일 공개한 모바일 게임 '뉴럴 던(Neural Dawn)'은 이런 한계를 극복하기 위해 뉴럴 렌더링을 전면에 내세웠다. 최신 모바일용 Arm GPU와 NPU, AI 기술을 결합해 CPU·GPU의 부하는 줄이고 배터리 소모와 발열을 줄일 수 있다는 것이 Arm 설명이다. 스마트폰 GPU 시장, 자체 GPU 경쟁 치열 시장조사업체 카운터포인트리서치에 따르면 올해 1분기 세계 스마트폰 SoC 시장 점유율은 미디어텍 32%, 퀄컴 23%, 애플 19%, 삼성전자 7% 순이다. 이 가운데 퀄컴은 수년 전부터 자체 설계 GPU인 아드레노를 발전시켜 왔고, 삼성전자는 AMD RDNA 아키텍처 기반 엑스클립스 GPU를 플래그십 제품에 적용하고 있다. 애플 역시 자체 GPU를 설계해 아이폰에 탑재한다. 반면 미디어텍은 대부분 제품군에서 Arm GPU IP를 활용한다. Arm 입장에서는 말리 GPU를 채택하는 제조사들의 경쟁력을 높이는 것이 중요하다. 최근 모바일 게임이 콘솔 수준의 그래픽을 요구하면서 GPU 성능 중요성이 더욱 커지고 있지만, 중저가 스마트폰은 전력과 발열, 제조 원가 문제로 플래그십 수준 GPU를 탑재하기 어렵다. Arm의 해법, AI 접목 '뉴럴 렌더링' Arm이 게임 스튜디오 스모 디지털과 함께 제작한 게임 '뉴럴 던'은 이러한 문제에 대한 해법을 제시한다. 뉴럴 던은 Arm의 최신 GPU 아키텍처인 이모탈리스(Immortalis)를 기반으로 제작됐다. 여기에 하드웨어 레이트레이싱과 향후 GPU에 탑재될 신경망 가속기를 결합한 뉴럴 렌더링 기술이 적용됐다. 원리는 PC 게임 분야에서 널리 쓰이는 AI 업스케일링 기술과 유사하다. GPU가 먼저 상대적으로 낮은 해상도로 화면을 생성한 뒤 AI 신경망 모델이 이를 분석해 고품질 이미지로 복원한다. 이를 통해 GPU 연산량을 줄이면서도 높은 해상도와 프레임을 유지할 수 있다. Arm은 여기에 스마트폰의 NPU를 일부 활용해 AI 관련 연산을 분산 처리하는 방안도 제시했다. 중저가 스마트폰 시장의 게임 경쟁력 강화에 방점 Arm의 말리 GPU 기반 뉴럴 렌더링 기술은 GPU 성능 여유가 상대적으로 적은 보급형·중급형 스마트폰에서 효과가 클 것으로 기대된다. 고가 스마트폰은 이미 강력한 GPU를 탑재해 고사양 게임 구동이 가능하다. 반면 중저가 스마트폰은 GPU 성능 제약으로 인해 그래픽 품질과 프레임 유지에 어려움을 겪는다. 뉴럴 렌더링은 GPU가 수행해야 할 작업을 줄이는 대신 AI를 활용해 화질을 보완한다. 같은 하드웨어에서도 더 높은 프레임과 그래픽 품질을 구현할 수 있는 것이다. 결국 Arm의 목표는 말리 GPU가 적용된 대중형 스마트폰의 게임 성능을 끌어올리는 데 있다. 모바일 GPU 성능 경쟁 역시 AI를 활용해 더 높은 프레임과 그래픽 품질을 구현하는 방향으로 이동할 수 있다. 언리얼엔진과 협력... 생태계 확대 추진 Arm은 이번 뉴럴 던 데모에서 언리얼엔진5의 차세대 조명 기술인 '메가라이트(MegaLights)'도 모바일 환경에서 구현했다. 메가라이트는 수백 개 광원을 효율적으로 처리해 보다 사실적인 빛과 그림자 효과를 구현하는 기술이다. 기존에는 PC나 콘솔 수준의 하드웨어가 필요한 기능으로 여겨졌다. Arm은 개발자들이 뉴럴 렌더링을 쉽게 활용할 수 있도록 언리얼엔진 개발사인 에픽게임스와 협력해 전용 플러그인을 제공할 예정이다. 또 오는 7월에는 Arm 신경망 그래픽 개발 키트도 업데이트할 계획이다.

2026.06.17 15:45권봉석 기자

KAIST-MIT-마이크로소프트 "비전 알고리즘 구글 대비 성능 20% 개선"

저해상 시각정보를 제한된 GPU 메모리만으로 고해상도로 손쉽게 복원하는 기술이 개발됐다. 구글이 최근 내놓은 컴퓨터 비전 알고리즘보다 최소 20%이상 성능이 우수하다는 것이 연구진 설명이다. 연구는 김창익 KAIST 전기및전자공학부 교수 연구팀이 미국 MIT 및 마이크로소프트 연구진과 공동으로 제한된 GPU 메모리만으로도 AI의 시각 성능을 원본대비 90%이상 높일 수 있는 '업샘플 애니띵(Upsample Anything)'을 개발했다고 17일 밝혔다. 연구결과는 인공지능 및 컴퓨터 비전 분야 세계 최고 학회인 'CVPR 2026'에서 계산 자원의 효율적 활용을 인정받아 'CVPR 컴퓨트 골드 스타(CVPR Compute Gold Star)'를 수상했다. 골드스타는 전체 논문 가운데 최고를 의미한다. 이와함께 연구 과정 투명성과 재현 가능성 부문 '트랜스패런시 챔피언(Transparency Champion)'에도 선정됐다. 논문 제1저자인 서민석 KAIST 전기및전자공학부 박사과정생은 전화통화에서 "휴머노이드는 대부분 수입 제품을 쓰는데, 비전 분야에서 이미지는 보통 16배 압축해 쓰기 때문에 해상도가 많이 떨어지는데다, 유니트리 등 각 회사들이 자체 기준에 따라 제품을 출시하기 때문에 복원 이미지 품질이 제각각"이라며 "이를 연구 목적에 맞게 바꾸는 추가 작업이 많이 번거롭다"고 설명했다. 서민석 박사과정생은 "예를 들어 자율주행을 하면서 글자를 읽거나 제조공정에서 흠집 등을 제대로 잡지 못하는 어려움이 있다. 이를 해결하기 위해서는 픽셀 100만개의 경우 최소 256회의 연산이 필요하다"며 "이 문제를 해결하기 위해 이 기술을 개발했다"고 말했다. 연구팀은 우선 학습이 필요없는 테스트 시점 최적화(TTO) 기반 업샘플링 프레임워크를 설계했다. 먼저 고해상도 이미지를 저해상도 이미지로 다운샘플링한 뒤, 다시 원본 이미지를 가장 잘 복원할 수 있도록 픽셀별 적응형 가우시안 커널을 최적화한다. 이를 통해 각 픽셀은 주변 영역 공간적 거리와 색상 유사도를 동시에 고려하는 엣지-어웨어(edge-aware) 복원 방식을 학습하게 되며, 이미지 경계와 구조를 유지하면서 고해상도 복원을 수행할 수 있다. 연구팀은 "이 과정은 새로운 값을 생성하는 생성형 방식이 아니라, 기존 특징 정보를 공간적으로 재배치하고 혼합하는 방식이기 때문에 모델 구조나 도메인에 관계없이 높은 범용성을 가진다"고 설명했다. 성능 시험 결과 224×224 해상도 기준 약 0.4초, 1,000×1,000 해상도 기준 3초 수준의 경량 최적화만으로 동작한다. 기존 테스트 시점 최적화 기반 기법 대비 메모리 사용량도 16분의 1에 불과하다는 것. 연구팀은 또 기존 업샘플링 구조인 JBU와 GS 장점을 결합해, 경계 보존 능력과 연속적 공간 표현 능력을 동시에 활용할 수 있는 업샘플링 구조를 제안했다. 이는 픽셀별 방향성과 공간 구조를 반영하는 적응형 업샘플링이라고 연구팀은 부연 설명했다. 김창익 교수는 “적은 메모리 자원으로도 인공지능 시각 정밀도를 크게 높일 수 있는 알고리즘"이라며 "휴머노이드 로봇과 온디바이스 AI 실용화를 앞당길 것"으로 기대했다.

2026.06.17 08:49박희범 기자

엘리스그룹, AICA 국가 AI데이터센터 'GPU 엔진' 맡는다

엘리스그룹이 국가 인공지능(AI) 연구개발을 지원하는 공공 그래픽처리장치(GPU) 클라우드 사업에 앞장선다. 자체 모듈형 AI 데이터센터와 고성능 GPU 인프라를 앞세워 국내 AI 생태계 공용 인프라 구축에 힘을 보태며 국가 AI 경쟁력 강화에 기여한다는 목표다. 엘리스그룹은 광주 인공지능산업융합사업단(AICA)이 추진하는 '2026년 국가 AI데이터센터 고도화 사업' GPU 클라우드 공급사로 선정됐다고 16일 밝혔다. AICA가 추진하는 이번 사업은 국내 기업과 기관, 대학을 대상으로 연구·개발·서비스에 특화된 고성능 AI 컴퓨팅 자원과 서비스를 제공해 국가 AI 산업 경쟁력을 높이는 것을 목표로 한다. 엘리스그룹은 복수 공급사 가운데 한 곳으로 참여해 자사 AI 클라우드 서비스인 '엘리스클라우드'를 통해 GPU 인프라를 제공한다. 협약 기간은 이달부터 12월 말까지 약 7개월이다. 회사는 엔비디아 H100과 최신 GPU인 B200 기반 클라우드 자원을 지원한다. 대규모 AI 학습과 추론에 필요한 인피니밴드 기반 고성능컴퓨팅(HPC) 멀티노드·단일노드 환경을 제공하며 공공기관 활용을 위한 클라우드 보안인증(CSAP) 존도 함께 운영한다. 특히 이번 사업에는 엘리스그룹이 자체 개발한 모듈형 AI 데이터센터 '엘리스 AI PMDC' 기술이 활용된다. 엘리스 AI PMDC는 고밀도 전력 인프라와 고효율 냉각 시스템을 적용해 고성능 GPU를 안정적으로 운영할 수 있도록 설계된 것이 특징이다. 엘리스그룹은 이를 기반으로 서비스수준협약(SLA)에 따른 장애 대응과 보안 모니터링 등 AI 클라우드 운영 전반을 지원할 계획이다. 연구기관과 대학, 기업들이 인프라 구축 부담 없이 AI 연구개발에 집중할 수 있는 환경을 제공한다는 목표다. 김재원 엘리스그룹 대표는 "AICA 국가 AI데이터센터는 국내 AI 생태계 공용 인프라 역할을 하는 만큼, 안정적인 GPU 클라우드 기반을 확보하는 것이 중요하다"며 "이번 사업을 통해 검증된 GPU 클라우드 인프라를 제공해 연구·개발 환경 제약을 줄이고 대규모 인프라 운영 경험을 바탕으로 국내 AI 인프라 고도화와 국가 AI 경쟁력 강화에 기여하겠다"고 밝혔다.

2026.06.16 11:33한정호 기자

엔비디아, 구글 '디퓨전젬마' 지원…"로컬 AI 추론 속도 높여"

엔비디아가 구글딥마인드 디퓨전 언어 모델을 그래픽처리장치(GPU)와 개인용 인공지능(AI) 시스템에 최적화했다. 엔비디아는 구글딥마인드 '디퓨전젬마'를 지포스 RTX GPU와 RTX 프로 플랫폼, DGX 스파크 시스템 전반에서 더 빠르게 실행할 수 있도록 최적화했다고 12일 밝혔다. 디퓨전젬마는 텍스트를 한 단어씩 순차 생성하는 기존 자기회귀 방식과 달리 여러 단어를 병렬로 생성한다. 각 단계에서 최대 256개 토큰을 디노이징해 텍스트 블록 전체를 출력하는 구조다. 이 방식은 대화형 채팅과 에이전틱 루프, 온디바이스 어시스턴트처럼 응답 속도가 중요한 단일 사용자 작업에 적합하다. 개발자와 연구자, AI 사용자는 로컬 기기에서 기존보다 빠른 텍스트 생성을 활용할 수 있다. 디퓨전젬마는 젬마 4 기반으로 구축됐다. 젬마 4는 260억 개 파라미터를 갖춘 전문가 혼합 모델이며, 단계마다 38억 개 파라미터를 활성화한다. 엔비디아는 디퓨전젬마가 동급 자기회귀 모델보다 최대 4배 빠른 성능을 제공한다고 설명했다. 단일 엔비디아 H100 텐서 코어 GPU에서는 초당 1천 개 토큰, DGX 스파크에서는 초당 150개 토큰, DGX 스테이션에서는 최대 초당 2천 개 토큰 성능을 낸다. 구글딥마인드는 디퓨전젬마를 연구·실험 목적용이라고 당부했다. 속도와 병렬 생성에 초점을 맞춘 만큼 전체 출력 품질은 기존 자기회귀 기반 젬마4 모델보다 낮다고 밝혔다. 디퓨전젬마는 아파치 2.0 라이선스 기반 오픈 웨이트 모델로 제공된다. RTX와 DGX 스파크에서 완전히 실행될 수 있으며 클라우드나 토큰당 비용 없이 허깅페이스 트랜스포머, vLLM, 언슬로스에서 기본 지원된다. 엔비디아는 DGX 스파크와 RTX 프로 6000 워크스테이션, DGX 스테이션에서 디퓨전젬마 실행을 지원한다. 지포스 RTX 그래픽처리장치에서는 향후 라마.cpp 지원도 추가될 예정이다. 개발자는 허깅페이스 트랜스포머를 통해 지포스 RTX 5090이나 DGX 스파크에서 디퓨전젬마를 테스트할 수 있다. 더 높은 처리량이 필요한 경우 vLLM을 활용할 수 있으며 언슬로스와 엔비디아 네모 프레임워크를 통해 파인튜닝도 가능하다.

2026.06.12 11:13김미정 기자

[현장] 시뮬리아 CEO "시뮬레이션 빠르고 저렴하게…GPU 최적화 속도"

"우리 목표는 고객이 인공지능(AI)으로 설계 검증에 걸리는 시간을 줄이고 제품을 더 빨리 시장에 내놓도록 돕는 것입니다. 앞으로 시뮬레이션·AI뿐 아니라 그래픽처리장치(GPU) 인프라까지 최적화해 산업용 AI 생태계 구축에 힘쓰겠습니다." 미쉘 애쉬 다쏘시스템 시뮬리아 최고경영자(CEO)는 11일 파르나스 서울에서 열린 '시뮬리아 유저 데이 2026' 기조연설에서 '시뮬리아' 사업 전략을 이같이 밝혔다. '시뮬리아'는 다쏘시스템 시뮬레이션 브랜드다. 제품이 실제 환경에서 받는 충격, 열, 유체 흐름, 전자지 영향, 소음 등을 가상 환경에서 분석한다. 이를 통해 제품 개발 과정 시행착오를 줄이는 역할을 한다. 애쉬 CEO는 AI가 엔지니어를 대체하는 것이 아니라 작업 역량을 확장한다는 데 맞춰져 있다고 재차 강조했다. AI가 설계·제조·영업 등 조직 내 사일로를 허물고, 사람과 기계가 함께 일하는 방식을 새롭게 만들 것이라고 내다봤다. 그는 "AI와 시뮬레이션을 결합해 엔지니어링 업무 방식을 바꿀 것"이라며 "기계와 해석, 검증에 걸리는 시간을 줄이고 더 많은 제품 설계안을 빠르고 저렴하게 얻을 수 있는 작업 환경을 열 것"이라고 밝혔다. 이를 위해 다쏘시스템은 엔비디아 그래픽처리장치(GPU)를 활용한 시뮬레이션 연산 최적화에도 속도를 내고 있다. 복잡한 구조·유체·전자기 시뮬레이션은 계산량이 많아 기존 중앙처리장치(CPU) 기반 환경에서는 해석 시간이 길어지는 경우가 많았는데, 이를 GPU 기반 병렬 연산으로 전환해 처리 속도와 비용 효율을 높이겠다는 것이다. 관련 시뮬리아 제품군에는 구조 해석용 '아바쿠스(Abaqus)', 유체 해석용 '파워플로우(PowerFLOW)', 전자기 해석용 'CST 스튜디오 스위트', 다물체 동역학 해석용 '심팩(Simpack)' 등이 포함된다. 애쉬 CEO는 "우리는 이런 솔버를 GPU 환경에 맞게 고도화하고 있다"며 "실제 기존 대비 시뮬레이션 속도를 3배에서 최대 125배까지 올릴 수 있을 것으로 본다"고 밝혔다. 이같은 다쏘씨스템 전략은 엔비디아와의 산업용 AI 협력과도 연결된다. 두 기업은 올해 2월 산업용 AI 플랫폼 구축을 위한 파트너십을 발표한 바 있다. 애쉬 CEO는 "우리는 버추얼트윈과 가속 컴퓨팅을 결합해 설계·시뮬레이션·제조 운영 전반을 지원하겠다"고 밝혔다. 애쉬 CEO는 올해부터 내년까지 시뮬리아 추가 기능을 단계적으로 출시할 계획이라고 밝혔다. 시뮬리아의 AI·머신러닝 기반 물리 거동 예측 기능과 테스트 도구는 7월 출시 예정이다. 버추얼 컴패니언 기능은 7월부터 연말까지 고객 테스트와 배포가 순차적으로 진행된다. 전자기와 유체 분야의 설계 성능 분석 기능은 올해 말과 내년 초에 걸쳐 확대될 예정이다. 그는 "AI는 엔지니어를 대체하는 것이 아니라 업무 역량을 확장한다는 데 맞춰졌다"며 "우리는 버추얼 트윈에서 설계·검증 방식을 바꿀 것"이라고 말했다.

2026.06.11 11:05김미정 기자

"텍스트 생성 더 빠르게"…구글, '디퓨전젬마' 공개

구글이 기존보다 4배 빠른 텍스트 생성 속도를 갖춘 '젬마' 버전을 내놨다. 구글딥마인드는 10일(현지시간) 텍스트 디퓨전 방식을 적용한 오픈소스 실험 모델 '디퓨전젬마(DiffusionGemma)'를 출시했다고 공식 블로그에 밝혔다. 이 모델은 '아파치 2.0 라이선스'로 배포되며 전체 260억개 파라미터 규모전문가혼합(MoE) 구조를 기반으로 이뤄졌다. 디퓨전젬마의 핵심은 기존 거대언어모델(LLM)처럼 토큰을 한 개씩 순차 생성하지 않는다는 점이다. 256개 토큰 블록을 한 번에 생성한 뒤, 여러 차례 수정과 보완을 거쳐 최종 결과를 만드는 텍스트 디퓨전 방식으로 작동한다. 이를 통해 그래픽처리장치(GPU)에서 최대 4배 빠른 텍스트 생성 속도를 구현했다. 구글딥마인드는 "이 모델은 단일 엔비디아 'H100'에서는 초당 1000개 이상 토큰을 생성한다"며 "엔비디아 '지포스 RTX 5090'에서는 초당 700개 이상 토큰을 처리할 수 있다"고 밝혔다. 해당 모델은 전체 260억개 파라미터를 갖고 있지만 실제 추론 과정에서는 38억개 파라미터만 활성화한다. 양자화 기준으로 18기가바이트(GB) 비디오램(VRAM) 환경에서도 구동할 수 있어 고급 소비자용 GPU에서도 활용 가능한 셈이다. 또 모든 토큰이 서로를 참조하는 양방향 어텐션 구조를 적용했다. 인라인 편집과 코드 인필링, 아미노산 서열 생성, 수학 그래프 생성 등 비선형 작업에 강한 것으로 알려졌다. 디퓨전젬마는 생성 과정에서 전체 텍스트를 한 번에 검토하며 오류를 수정하는 자기 정제 기능도 갖췄다. 복잡한 마크다운 형식을 정확하게 마무리하거나 코드 생성과 렌더링을 거의 실시간으로 수행할 수 있는 셈이다. 구글딥마인드는 디퓨전젬마를 연구·실험 목적용이라고 당부했다. 속도와 병렬 생성에 초점을 맞춘 만큼 전체 출력 품질은 기존 자기회귀 기반 젬마4 모델보다 낮다고 설명했다. 또 디퓨전젬마 성능 이점으로 로컬 또는 낮은 동시성 환경에서 가장 크게 나타난다고 밝혔다. 대규모 클라우드 서비스 환경에서는 자기회귀 모델도 높은 연산 활용률을 확보할 수 있어 속도 우위가 줄어들 수 있다고 덧붙였다. 구글딥마인드는 "이번 모델은 속도가 중요한 인터랙티브 로컬 워크플로를 탐색하는 연구자와 개발자를 위해 설계됐다"고 밝혔다.

2026.06.11 09:35김미정 기자

엔비디아, 6G 안테나 전용 GPU 개발 추진

엔비디아가 6G 통신 기지국 무선 안테나(RU) 전용 칩을 개발한다는 소식이 전해져 이목을 끈다. 라이트리딩닷컴에 따르면 엔비디아는 무선장비에 GPU를 적용하는 계획을 세우며 AI-RAN 전략의 고도화 단계에 진입했다. 엔비디아의 기존 AI-RAN 전략은 그레이스 호퍼(Grace Hopper) 슈퍼칩을 활용해 기지국의 중앙처리장치(CU)와 분산처리장치(DU)에 사용되는 전용 ASIC을 대체하는 데 집중했다. 안테나 장비까지 GPU 컴퓨팅을 도입하는 점은 고려하지 않았는데, 6G에서는 매시브 MIMO 기술 확산에 따라 별도의 컴퓨팅이 필요하다는 판단을 내린 것이다. 외신은 엔비디아가 RU에서 처리하는 빔포밍을 담당하는 ASIC를 대체하려는 움직임이라고 분석했다. RU에서 안테나 수가 최대 128개까지 늘어나는데 이에 따른 연산량도 32배 이상 늘어난다는 이유다. 그런 가운데 6G 환경에선 최대 1024개까지 늘어날 수도 있다는 전망이 별도의 고도화된 컴퓨팅 도입을 불러일으킨 것이다. 그간 DU와 RU에서 동일한 반도체 회사 제품이 쓰이는 경우가 많다. 서로 다른 회사의 칩을 사용하면 소프트웨어 개발과 최적화가 복잡하기 때문이다. 엔비디아는 RU 시장의 주요 공급사인 마벨에 올해 20억 달러를 투자했다. 마벨은 주로 엔비디아 투자를 받은 노키아의 협력사다. 이에 따라 AI-RAN 전략으로 DU 시장을 시작으로 RU 시장까지 넘보겠다는 뜻이다. 다만 RU에서 GPU 컴퓨팅을 도입할 경우 전력 사용량이 늘어나는 점이 한계로 꼽힌다. 통신사의 네트워크 운영 비용이 늘어나는 점이 발목을 잡을 수 있다는 설명이다.

2026.06.11 08:30박수형 기자

[현장] 김명진 이노그리드 "2030년 AI 클라우드 솔루션 1위 기업 될 것"

"2030년 이노그리드는 인공지능(AI) 클라우드 솔루션 1위 기업이 되겠습니다." 김명진 이노그리드 대표는 9일 포시즌스 호텔 서울에서 열린 '테크 비전 데이 2026'에서 이같은 미래 비전을 밝혔다. 단순 클라우드 솔루션 기업을 넘어 AI 인프라와 플랫폼 전 영역을 아우르는 통합 사업자로 도약한다는 선언이다. 그래픽처리장치(GPU) 등 AI 인프라 자원을 효율적으로 운영하는 차세대 기술 로드맵과 플랫폼을 앞세워 고객사 1000곳을 확보하는 사업자로 성장한다는 목표다. 매출 1천억·고객 1천곳 목표 김 대표는 이날 '비전 플러스 2030'을 공개했다. NHN인재아이엔씨 인수 후 2030년까지 국내 클라우드 솔루션 시장 1위 기업으로 도약한다는 청사진으로, 2~3년 안에 매출 1000억원을 달성할 방침이다. 수익성과 제품 고도화 후에는 해외 사업도 전략적으로 추진할 계획이다. 이를 위해 매출과 시장 점유율, 브랜드 가치 확대를 추진하고 현재 약 10종 수준인 클라우드 솔루션·서비스 포트폴리오를 15종 이상으로 확대할 예정이다. 고객 수도 현재 약 500개에서 1000개 이상으로 늘려 국내 클라우드 생태계를 대표하는 기업으로 자리매김한다는 구상이다. 김 대표는 "기술 기반 사업 구조를 더욱 강화해 클라우드 솔루션 시장을 선도하는 기업으로 도약하겠다"며 "비전 플러스 2030 달성을 위해 기술 경쟁력과 고객 가치를 함께 성장시킬 것"이라고 말했다. AI 시대 핵심은 운영…차세대 아키텍처 'TAFA' 공개 이번 행사에서 이노그리드는 차세대 기술 로드맵 '프롬 xPU 투 AI 플랫폼(From xPU to AI Platform)'을 공개했다. 그래픽처리장치(GPU)·신경망처리장치(NPU)·중앙처리장치(CPU)·양자처리장치(QPU) 등 다양한 연산 자원과 클라우드 인프라, AI 개발·운영 환경을 하나의 구조로 통합 제어하는 AI 클라우드 플랫폼 전략이다. 이를 실현할 'TAFA(Trusted AI Fabric Architecture)' 아키텍처도 선보였다. TAFA는 AI 인프라의 복잡성·단절·불신 문제를 '타파(打破)'한다는 의미를 담고 있으며 데이터와 컴퓨팅, 보안, 운영을 단일 컨트롤 플레인으로 연결하는 차세대 AI 아키텍처다. 서비스형 GPU(GPUaaS), AI 클라우드 관리 플랫폼(CMP), AI 서비스형 플랫폼(PaaS) 등을 한 플랫폼으로 통합해 AI 서비스 전 주기를 지원한다는 목표다. xPU 자원 추상화, 통합 실행 환경, AI 컨트롤 플레인 기반 단일 제어 체계를 기반으로 민간·공공 고객이 특정 클라우드나 칩 벤더에 종속되지 않고도 다양한 연산 자원을 통합 운영할 수 있도록 하겠다는 전략이다. 권경민 이노그리드 최고기술책임자(CTO) "과거에는 GPU를 얼마나 많이 확보했느냐가 중요했다면 이제는 확보한 자원을 얼마나 효율적으로 운영하느냐가 핵심"이라며 "실제 현장에선 GPU 활용률이 30~40% 수준에 머무르는 경우가 많고 인프라 구축보다 운영 단계에서 더 많은 문제가 발생하고 있다"고 설명했다. 이어 "AI 인프라는 학습 중심에서 추론 중심으로 빠르게 이동하고 있는 만큼, 이기종 GPU를 최적화하는 운영의 중요성이 커지고 있다"며 "우리가 갖춘 GPU 오케스트레이션, AI CMP, AI PaaS 등 핵심 기술을 기반으로 TAFA 기반 AI 클라우드 플랫폼 구조를 고도화해 나가겠다"고 덧붙였다. NHN클라우드와 '원팀'…글로벌 시장도 정조준 행사에서 김 대표는 NHN인재아이엔씨 인수 이후 모회사 NHN클라우드와의 시너지 확대 방안도 언급했다. 김 대표는 "NHN클라우드는 국내 클라우드 서비스 사업자(CSP) 가운데 가장 큰 규모의 오픈스택·쿠버네티스 기반 데이터센터 운영 경험을 보유한 기업"이라며 "이노그리드 역시 글로벌 표준인 오픈스택 엔진을 토대로 하기에 NHN클라우드의 대규모 운영 경험에 양사 기술력이 결합되면 상당한 시너지를 낼 수 있을 것"이라고 전망했다. 이노그리드는 공공·엔터프라이즈 시장에서 GPU 인프라를 클릭 한 번으로 배포·운영할 수 있는 원스톱 플랫폼 구축에도 나설 계획이다. 아울러 글로벌 시장 진출을 목표로 오픈소스 기반 표준 기술 체계를 강화하고 정부 연구개발(R&D) 과제도 지속 수행해 원천 기술 확보에 박차를 가한다는 방침이다. 이번 행사에선 이노그리드가 진행 중인 주요 R&D 과제와 기술 연계 방향도 소개됐다. 한국전자기술연구원(KETI), 한국전자통신연구원(ETRI), 대학 및 민간기업 등 주요 기관이 이노그리드와의 AI 인프라 기술 개발 협력을 중심으로 다양한 세션 발표를 진행했다. 김 대표는 "내년 매출 1000억원을 달성하고 클라우드 솔루션 업계에서 가장 빠르게 턴어라운드하는 기업이 될 것"이라며 "이노그리드와 NHN인재아이엔씨 통합 법인은 국내 AI 클라우드 시장을 선도하는 대표 기업으로 성장하겠다"고 강조했다.

2026.06.09 13:01한정호 기자

[유미's 픽] 젠슨 황 만난 LG·SKT·업스테이지…독자 AI 2차전 변수될까

젠슨 황 엔비디아 최고경영자(CEO)의 방한을 계기로 국내 독자 인공지능(AI) 파운데이션 모델 경쟁 구도에도 변화가 감지된다. LG AI연구원과 SK텔레콤이 엔비디아와 기술 협력 접점을 넓히고 업스테이지가 국내 대표 AI 스타트업으로 황 CEO와 만나면서 2차 평가를 앞둔 경쟁에 새 변수가 더해졌다는 분석이 나온다. 9일 업계에 따르면 정부의 독자 AI 파운데이션 모델 프로젝트에는 LG AI연구원, SK텔레콤, 업스테이지, 모티프테크놀로지스 등 4곳이 정예팀으로 참여하고 있다. 이들 기업은 오는 8월 2차 평가를 거쳐 1곳이 탈락하고, 내년 2월 최종 2곳이 선정되는 일정을 앞두고 있다. 1차 평가 이후 독자성 논란이 불거졌던 만큼 2차 평가에서는 모델 성능뿐 아니라 활용성, 기술 자립성, 산업 적용 가능성 등이 더 면밀히 다뤄질 가능성이 거론된다. 이 같은 상황에서 이번 엔비디아 협력은 LG AI연구원과 SK텔레콤에 비교적 직접적인 기회로 작용할 수 있을 것으로 예상된다. 두 회사 모두 엔비디아와의 협력 범위가 단순 회동을 넘어 모델 개발, 학습 인프라, AI 클라우드, 추론 최적화 등으로 연결돼 있어서다. 또 대규모 AI 모델 경쟁이 벤치마크 점수를 넘어 실제 서비스 구현 역량까지 따지는 방향으로 바뀌면서 글로벌 AI 인프라 기업과의 협력 가치도 커지고 있다. LG AI연구원은 자체 모델 엑사원(EXAONE) 고도화에 엔비디아 기술을 활용할 예정이다. LG와 엔비디아는 전날 서울 여의도 LG트윈타워에서 최고경영진 회의를 열고 피지컬 AI, AI 인프라, 모빌리티 등 차세대 AI 산업 협력 방안을 논의했다. 이 자리에서 엑사원 생태계 확장을 위한 기술 협력도 함께 다뤄졌다. LG AI연구원은 엑사원 성능 강화 과정에서 엔비디아의 최신 그래픽처리장치(GPU)인 블랙웰과 AI 개발 플랫폼 네모 프레임워크, 추론 성능 강화 소프트웨어 텐서RT-LLM을 활용할 계획이다. 또 AI 모델 데이터 학습 품질을 높이기 위해 엔비디아의 네모트론 오픈 데이터셋도 활용키로 했다. 이는 엑사원의 학습 효율과 추론 성능을 높이고 실제 산업 현장 적용 기반을 넓히려는 행보로 풀이된다. LG AI연구원은 1차 평가에서 K-엑사원을 앞세워 국내 모델 중 1위(90.2점)를 기록했다. 2차 평가에서는 모델 규모와 성능을 끌어올려 글로벌 최신 오픈웨이트 모델과 경쟁할 수 있는 수준을 목표로 하고 있다. 지식, 추론, 지시어 이행, 롱 컨텍스트뿐 아니라 에이전틱 툴 활용과 코딩 영역에서도 성능 개선을 추진 중이다. SK텔레콤은 엔비디아와의 협력을 모델 개발과 AI 인프라 사업 양쪽으로 연결하고 있다. 이곳은 독자 AI 파운데이션 모델 프로젝트에서 에이닷엑스 케이원(A.X K1)의 후속 모델인 에이닷엑스 케이투(A.X K2)를 개발하고 있다. 엔비디아와는 학습 데이터, 인프라, 프레임워크 전반에서 기술 협력을 이어가고 있다. SK그룹 차원의 협력도 SK텔레콤에 힘을 싣는 구조다. SK텔레콤은 엔비디아 DSX 플랫폼 기반 AI팩토리 구축과 운영을 맡는다. SK하이닉스는 엔비디아와 AI팩토리용 차세대 메모리를 공동 개발한다. SK텔레콤은 이를 기가와트급 인프라로 확장해 아시아 AI 클라우드 사업자로 도약하겠다는 구상을 제시했다. 3개 팀을 선별할 오는 8월 평가에서는 이 같은 인프라 구상이 A.X K2의 모델 경쟁력을 얼마나 보완할 수 있을지도 관심사다. 다만 AI 클라우드 사업 계획보다 모델 자체의 성능과 활용성이 별도로 검증될 가능성이 크다. 업스테이지는 LG AI연구원이나 SK텔레콤처럼 대규모 그룹 인프라를 갖춘 것은 아니지만, 지난 8일 오후 젠슨 황 CEO와 진행된 국내 AI 스타트업 간담회에 주요 기업으로 참석해 시장 주목도를 높였다. 다만 엔비디아와의 구체적인 기술 협력 발표가 나온 것은 아닌 만큼 독자 AI 파운데이션 모델 평가에서는 솔라 계열 모델의 실제 성능과 활용 사례가 더 중요한 판단 기준이 될 가능성이 크다. 모티프테크놀로지스는 이번 엔비디아 방한 흐름에서는 상대적으로 주목도가 낮지만, 독자 아키텍처를 앞세운 차별화 전략을 내세우고 있다. 뒤늦게 정예팀에 합류한 만큼 2차 평가까지 남은 기간 동안 성능 안정화와 기술 독자성을 얼마나 설득력 있게 보여줄지가 과제로 꼽힌다. 업계 관계자는 "엔비디아 협력이 평가 우위를 곧바로 보장하지는 않을 것"이라며 "정부 프로젝트가 지향하는 방향이 해외 AI 생태계와의 친밀도보다 국내 주도의 모델 개발 역량과 산업 활용 생태계 구축에 있기 때문"이라고 봤다. 그러면서 "각 기업이 자체 모델의 성능과 활용 사례, 기술 독자성을 얼마나 설득력 있게 보여주느냐가 더 중요하게 작용할 것"이라고 덧붙였다.

2026.06.09 10:31장유미 기자

대기업들 엔비디아와 밀착 행보…조준희 회장 "국산 AI·SW 생태계도 함께 키워야"

젠슨 황 엔비디아 최고경영자(CEO) 방한을 계기로 국내 주요 그룹들이 엔비디아와 인공지능(AI) 협력 확대에 속도를 내는 가운데 국내 AI·소프트웨어(SW) 업계에서 공개적인 경고음이 나왔다. 그래픽처리장치(GPU)를 장악한 엔비디아가 피지컬 AI 핵심 영역인 로보틱스 파운데이션 모델과 월드모델까지 영향력을 넓히는 상황을 방치해선 안 된다고 봐서다. 9일 업계에 따르면 조준희 한국인공지능소프트웨어산업협회(KOSA) 회장은 전날 자신의 페이스북에 최근 젠슨 황 CEO 방한을 둘러싼 국내 AI 산업 흐름에 대한 입장을 밝혔다. 조 회장은 "산업회장으로서 작금의 이벤트에 꼭 짚고 싶은 말씀을 드리고 싶다"며 "GPU의 지배 사업자에 의해 피지컬 AI의 핵심인 로보틱스 파운데이션 모델, 월드모델까지의 종속은 반드시 막아야 된다"고 강조했다. 이어 "고대역폭메모리(HBM) 구매를 무기로 GPU 사업자에게 억지춘향이 되지 말아야 한다"며 "역설로 HBM 독점 사업자 중심으로 판을 바꿔야 된다"고 덧붙였다. 이 같은 발언은 황 CEO 방한 기간 동안 국내 주요 대기업들이 엔비디아와 협력 확대에 잇따라 나선 가운데 나왔다는 점에서 주목받고 있다. 황 CEO는 지난 5일부터 3박 4일간 SK, 현대차, LG, 네이버, 삼성전자 등 국내 주요 기업과 만나 반도체, 로봇, 데이터센터, AI팩토리 등 분야에서 협력 방안을 논의했다. 이번 방한에선 국내 주요 그룹 총수와 최고경영진이 직접 황 CEO를 맞이하는 장면도 이어졌다. 특히 최태원 SK그룹 회장, 정의선 현대차그룹 회장, 구광모 LG그룹 회장, 네이버 경영진, 삼성전자 반도체 경영진 등은 황 CEO와 회동하며 AI 협력 의지를 드러냈다. 국내 대표 기업들이 AI 전략의 핵심 파트너로 엔비디아를 전면에 세운 것이다. 업계에선 이 같은 흐름이 한국 AI 산업의 엔비디아 의존도를 높일 수 있다고 봤다. 또 엔비디아와의 협력은 글로벌 AI 생태계 진입을 위한 주요 통로로 꼽히지만, 국내 주요 기업들이 일제히 엔비디아와 접점을 넓히는 과정에서 AI 산업 주도권이 해외 플랫폼 기업 중심으로 기울 것으로 우려했다. 엔비디아의 최근 움직임도 심상치 않다. 엔비디아는 GPU 시장 지배력을 기반으로 로봇, 자율주행, 스마트팩토리 등 피지컬 AI 영역까지 보폭을 넓히고 있다. 피지컬 AI는 현실 세계의 물리 환경을 인식하고 예측하는 기술이 핵심으로, 로보틱스 파운데이션 모델과 월드모델이 차세대 산업용 AI 플랫폼의 기반으로 꼽힌다. 이에 GPU뿐 아니라 AI 모델, 개발도구, 시뮬레이션, 데이터 파이프라인까지 엔비디아 생태계에 묶일 경우 국내 기업의 기술 선택권과 협상력은 약화될 수 있을 것이란 분석도 제기됐다. AI 인프라 구축 과정에서 엔비디아와 협력하더라도 핵심 모델과 SW 영역까지 특정 사업자 중심으로 굳어지면 국내 AI·SW 기업의 성장 공간이 줄어들 수 있다고 봐서다. 하드웨어 비용 상승이 국내 SW 기업에 부담으로 전가되고 있다는 점도 업계 불만을 키우고 있다. 실제 HBM, GPU, AI 서버 등 AI 인프라 비용이 빠르게 오르는 반면, 기업과 공공 고객의 IT 예산은 제한적인 상황이다. 이 때문에 늘어난 장비 비용을 맞추기 위해 SW 개발비, 라이선스비, 유지보수비가 줄어드는 사례가 점차 증가하는 추세다. 이 같은 분위기 탓에 국내 SW 업계는 대기업의 엔비디아 협력 확대가 국내 생태계 강화로 이어져야 한다고 주장했다. 삼성전자와 SK하이닉스가 HBM을 앞세워 엔비디아 공급망의 핵심 축으로 부상한 만큼, 이를 단순 부품 공급 관계에 그치게 해서는 안 된다고 봤다. 업계 관계자는 "국내 기업들이 HBM과 제조 역량을 앞세워 엔비디아 공급망의 핵심 파트너로 올라선 상황"이라며 "앞으로는 GPU 구매와 플랫폼 활용에 끌려가는 방식이 아니라 국내 AI·SW 기업까지 포함한 협력 구조를 만들어야 한다"고 강조했다. 또 업계에선 대기업의 AI 투자가 하드웨어 확보 경쟁에 집중될수록 국내 SW 기업의 설 자리가 줄어들 수 있다고 주장했다. HBM, GPU, AI 서버 가격 상승으로 전체 IT 투자비 중 장비 비용 비중이 커지는 상황에서 고객사들이 총 예산을 늘리지 않으면 SW 개발비와 라이선스비가 먼저 조정 대상이 될 수밖에 없다는 이유에서다. 업계 관계자는 "대기업이 엔비디아와 협력을 확대하는 과정에서 국산 AI·SW 생태계를 함께 키우는 역할도 맡아야 한다"며 "글로벌 AI 인프라 기업과의 협력은 필요하지만, 국내 기업들이 엔비디아 생태계 편입을 경쟁하는 모습만 반복될 경우 한국 AI 산업의 협상력과 자생력이 함께 약화될 수 있다"고 밝혔다. 또 다른 관계자는 "엔비디아와 협력하는 것은 필요하지만 대기업 총수들까지 나서 엔비디아 생태계 편입을 경쟁하는 듯한 모습은 국내 AI 산업의 주도권을 약화시킬 수 있다"며 "AI 3강을 말하려면 GPU 확보뿐 아니라 국내 모델, SW, 서비스 기업이 함께 수익을 낼 수 있는 구조부터 만들어야 한다"고 말했다.

2026.06.09 08:36장유미 기자

젠슨 황 "SK하이닉스 캐파 2배 확대로는 불충분"

젠슨 황 엔비디아 최고경영자(CEO)가 SK하이닉스의 장기 생산능력 확대 계획에 대해 "충분치 않다"고 말했다. 앞서 최태원 SK그룹 회장은 "앞으로 5년 안에 전체 웨이퍼 생산능력을 2배로 늘릴 것"이라고 말한 바 있다. 8일 젠슨 황 CEO는 서울 중구 신라호텔에서 열린 '코리아 AI 에코시스템 리셉션' 후 기자들과 만나 "(SK하이닉스 계획은) 충분치 않다고 생각한다"며 "우리는 스마트(smart)해져야 한다. 엔비디아는 SK가 생산하는 모든 메모리를 최대한 똑똑하게 사용할 것"이라고 밝혔다. 그는 "엔비디아는 인공지능(AI) 가속기 시장 80%를 점유하고 있고, 시장 점유율을 계속 확대하고 있다"며 "우리는 매년 거의 100%씩 성장하고 있고, 성장은 더 가속되는 것으로 보인다"고 강조했다. 황 CEO는 "AI 붐(Boom)은 거대하다. AI가 드디어 유용해졌기 때문이다. AI는 이제 우리가 소프트웨어 프로그래밍을 효과적으로 할 수 있도록 돕는다"며 "전 세계에서 소프트웨어 코딩을 사용하지 않는 기업은 없다"고 설명했다. 그는 "AI는 수익성이 좋다. AI가 너무 유용하기 때문에 기업들은 AI를 사용하기 위해 기꺼이 프리미엄을 지불한다"며 "무언가가 수익성이 높다면, 그것을 더 많이 만들고 싶어진다. 아주 가까운 미래에 AI가 얼마나 믿을 수 없을 정도로 수익성이 높은지 깨닫게 될 것"이라고 덧붙였다. 황 CEO는 이번 방한 최대 성과로 국내 기업들과 협력을 꼽았다. 그는 "우리는 SK하이닉스와 매우 긴밀하게 협력해 왔다. 그들(SK)의 기술과 우리(엔비디아)의 기술이 매우 긴밀하게 작동하도록 만들 것"이라고 말했다. LG와 현대자동차, 삼성전자, 네이버도 언급했다. 황 CEO는 "데이터센터 기술, 데이터센터 아키텍처, 로보틱스 분야에서 LG와 장기간 같이 작업했다"며 "자율주행과 로보틱스 기술 분야에선 현대와 함께 일했고, 삼성전자와도 정말 오랫동안 함께 했다. 네이버와도 함께 일한지 오래됐다"고 설명했다. 황 CEO는 이날 행사에서 "지금이 바로 한국의 시간"이라며 이 기회를 살려야 한다고 조언했다. 그는 "한국은 올바른 문화 기반과 산업 기반, 지정학 위치를 모두 갖췄다"며 "지금이 이것들을 활용할 절호의 기회"라고 강조했다. 간담회에는 삼성전자와 SK하이닉스, SK텔레콤, 현대차그룹, LG전자, 네이버, 크래프톤 등 주요 대기업이 참석했다. 업스테이지, NC AI, 프렌들리AI, 트웰브랩스, 파일러, 노타 등 AI 스타트업과 두산로보틱스, 리얼월드, 로보티즈, 엔닷라이트, 에이로봇 등 로봇·피지컬 AI 기업도 함께 했다.

2026.06.08 21:49진운용 기자

[현장] 김유원 네이버클라우드 대표 "GW급 AI 인프라, 해외 거점까지 염두"

네이버가 엔비디아와 추진하는 기가와트(GW)급 인공지능(AI) 팩토리 구상이 국내 단일 데이터센터 확장에 그치지 않고 해외 거점까지 포함한 장기 인프라 전략으로 추진된다. 김유원 네이버클라우드 대표는 8일 저녁 서울 중구 신라호텔에서 젠슨 황 엔비디아 최고경영자(CEO)와 회동 후 지디넷코리아와 만나 GW급 AI 인프라 구축 구상과 관련해 "각 세종 이외에 다른 해외 거점까지 염두에 둔 것"이라고 말했다. 앞서 네이버는 이날 엔비디아와 글로벌 AI 팩토리 공동 구축 사업을 추진한다고 밝힌 바 있다. 양사는 글로벌 AI 인프라 수요 증가에 대응해 대규모 AI 팩토리를 공동 구축·운영하고 글로벌 AI 컴퓨트 시장을 공략한다는 방침이다. 이번 협력은 기존 GPU 공급 협력을 넘어 데이터센터 구축·운영, 글로벌 고객 확보, AI 클라우드 사업 확대까지 포괄하는 전략적 동맹 성격이 짙다. 네이버는 데이터센터 부지 확보와 구축·운영을 주도하고, 엔비디아는 그래픽처리장치(GPU) 공급과 글로벌 고객 발굴을 맡는다. 사업 리스크와 성과도 양사가 공동 부담하는 구조다. 양사는 네이버의 하이퍼스케일 데이터센터 '각 세종'을 시작으로 AI 인프라를 단계적으로 확대할 예정이다. 내년 상반기 55MW 규모 AI 인프라 가동을 시작으로 같은 해 말에는 누적 100MW, 2028년 200MW까지 확장할 계획이다. 장기적으로는 국내외 거점을 포함해 GW급 AI 팩토리 체계를 구축한다는 목표다. 또 네이버는 이번 협력을 바탕으로 유럽과 중동 지역 소버린 AI 시장 공략에도 속도를 낼 계획이다. 엔비디아의 글로벌 네트워크와 결합해 현지 정부·기업 고객 확보에도 나설 것으로 보인다. 다만 전력 공급과 부지 확보는 향후 핵심 변수로 꼽힌다. AI 팩토리는 대규모 전력과 냉각 인프라를 필요로 하는 만큼 안정적인 전력망과 데이터센터 입지 확보가 사업 확장의 관건이 될 것으로 보인다. 이에 네이버는 각 세종 외 추가 데이터센터 임차도 검토 중이다. 앞서 네이버클라우드는 정부가 추진하는 GPU 1만 5000장 구축 사업 참여를 앞두고 LG CNS 삼송 데이터센터 임차 계약을 체결한 바 있다. 이번 협력에는 엔비디아 차세대 AI 팩토리 플랫폼 'DSX'도 포함된다. DSX는 데이터센터 설계와 전력 공급, GPU 시스템, 네트워크, 소프트웨어 운영을 통합 관리하는 AI 팩토리 전용 플랫폼이다. 양사는 이를 통해 AI 데이터센터 운영 효율을 높이고 AI 모델 구축 기간과 토큰 생성 비용을 줄인다는 구상이다. 업계에선 이번 협력이 네이버클라우드의 사업 무게중심을 AI 모델 경쟁력 강화에서 AI 인프라와 클라우드 서비스 사업 확대 쪽으로 넓히는 계기가 될 것으로 보고 있다. 또 하이퍼클로바X 등 네이버 AI 서비스가 핵심 수요처 역할을 맡고, 수익화 축은 AI 데이터센터와 AI 클라우드 사업으로 확장될 가능성이 크다고 전망했다. 이해진 네이버 의장은 "이번 동맹을 통해 전 세계 각 지역과 국가가 독자적인 소버린 AI 역량을 구축할 수 있는 구체적인 대안을 제시할 수 있게 돼 고무적"이라며 "우리가 보유한 기술 인프라 경쟁력이 글로벌 시장으로 한 단계 도약할 수 있는 계기를 마련했다"고 강조했다.

2026.06.08 21:16장유미 기자

정부, 엔비디아 GPU 9704장 확보…이달 구매 발주 진행

정부가 2조원대 규모 엔비디아 그래픽처리장치(GPU) 9704장을 확보했다. 과학기술정보통신부는 '첨단 GPU 확보·구축·운용지원 사업' 참여 기업으로 네이버클라우드와 삼성SDS, 엘리스그룹 등 3개 민간 클라우드 기업을 선정했다고 8일 밝혔다. 이번 사업 규모는 2026년 기준 2조800억원이다. 이번 사업은 정부가 추진 중인 'AI 고속도로 구축'의 핵심 인프라 사업이다. 과기정통부는 선정된 클라우드 서비스 기업과 협력해 첨단 GPU 총 9704장을 확보하고 민간·공공의 AI 혁신 수요에 필요한 GPU 자원을 지원할 계획이다. 확보 대상 GPU는 차세대 모델인 '베라루빈' 2016장과 'B300' 7688장이다. 네이버클라우드는 베라루빈 1008장과 B300 3112장을 받고, 삼성SDS는 베라루빈 1008장과 B300 2016장을 받는다. 엘리스그룹은 B300 2560장을 구축할 예정이다. 정부는 당초 B200 1만 5000장 규모를 목표로 했으나 최신 고성능 모델 도입을 통해 목표를 웃도는 성능을 확보하게 됐다고 설명했다. 과기정통부에 따르면 이번 확보 물량은 B200 약 1만 9000장 규모에 해당해 당초 목표 대비 약 30% 높은 성능을 제공한다. 베라루빈은 이번 사업에서 가장 주목되는 엔비디아의 차세대 GPU다. 과기정통부는 베라루빈이 기존 모델보다 대역폭과 연산 속도가 크게 향상돼 데이터 병목을 줄이고 동일 시간 안에 더 많은 사용자 요청을 처리할 수 있다고 설명했다. AI 모델 학습에 드는 시간과 비용도 줄어들 것으로 기대했다. 확보 물량 중 베라루빈 2016장과 B300 4360장은 정부 활용분으로 쓰인다. 이 자원은 독자 AI 파운데이션 모델 개발, 국가 AI 프로젝트, 산·학·연 AI 모델·서비스 개발과 고도화 지원에 투입된다. 나머지 B300 3328장은 민간 자체 활용분으로 배정된다. 선정된 클라우드 기업들은 이를 클라우드 기반 GPU 서비스 공급과 자체 AI 모델·서비스 고도화에 활용된다. 정부는 6월 중 선정된 3개 기업과 GPU 구매 발주 등을 추진한다. B300은 입고와 구축이 완료된 기업을 통해 연내 순차적으로 서비스를 시작하고 베라루빈은 출시 일정을 고려해 2027년 상반기 안에 순차적으로 서비스를 개시할 예정이다. 앞서 젠슨 황 엔비디아 최고경영자(CEO)는 지난 5일 방한해 삼성전자와 네이버, SK하이닉스, 현대자동차, LG그룹 등 국내 주요 기업 총수들과 잇따라 만났다. 젠슨 황 CEO는 이들과 AI 인프라 구축과 피지컬 AI 협력 방안 등을 논의한 것으로 알려졌다. 배경훈 부총리 겸 과기정통부 장관은 "베라루빈 등 이번에 확보할 첨단 GPU가 AI 연구 개발 속도와 기술 역량을 한 차원 끌어올리는 핵심 동력이 될 것"이라며 "세계 최고 수준의 AI 인프라 역량을 확보하여, 국내 기업과 연구 기관 등의 AI 혁신과 성장을 지원하겠다"고 밝혔다.

2026.06.08 16:39김미정 기자

[AI 고속도로] 네이버-엔비디아, 초대형 AI 인프라 '동맹'…유럽·중동 소버린 공략한다

네이버가 엔비디아와 손잡고 기가와트(GW)급 초대형 인공지능(AI) 팩토리 구축에 나선다. 단순 그래픽처리장치(GPU) 공급 협력을 넘어 데이터센터 구축·운영과 글로벌 고객 확보, AI 클라우드 사업 확대까지 함께 추진하는 전략적 동맹이다. 네이버는 엔비디아와 글로벌 AI 팩토리 공동 구축 사업을 추진한다고 8일 밝혔다. 글로벌 AI 인프라 수요 증가에 대응해 대규모 AI 팩토리를 공동 구축·운영하고 글로벌 AI 컴퓨트 시장을 선점한다는 목표다. 네이버는 데이터센터 부지 확보와 구축·운영을 주도하고 엔비디아는 GPU 공급과 글로벌 고객 발굴을 맡는 한편 사업 리스크와 성과를 공동 부담하는 형태로 협력할 방침이다. '각 세종' 시작으로 2028년 200MW…최종 1GW급 확장 이번 협력으로 양사는 '각 세종' 데이터센터를 시작으로 AI 인프라를 단계적으로 확대해 아시아를 넘어 유럽·중동 소버린 AI 시장까지 공략할 계획이다. 내년 상반기 55메가와트(MW) 규모 AI 인프라 가동을 시작으로 같은 해 말까지 누적 100MW, 2028년 200MW까지 단계적으로 확대할 예정이다. 장기적으로는 1기가와트(GW)급 AI 팩토리 구축이 목표다. 이는 엔비디아 첨단 GPU 수십만 장을 동시에 수용할 수 있는 국내에서 전례 없는 규모로 평가된다. 첫 거점은 네이버가 운용하는 하이퍼스케일 데이터센터 '각 세종'이다. 이곳은 네이버 AI 서비스와 클라우드 사업의 핵심 기반 인프라로, 고밀도 AI 연산 환경에 최적화된 데이터센터다. 양사는 각 세종을 주축으로 아시아·태평양 지역뿐 아니라 유럽과 중동 시장까지 인프라를 확장한다는 방침이다. 네이버는 이미 유럽과 중동 지역 소버린 AI 시장 진출을 추진해왔다. 이번 협력 확대 발표로 엔비디아의 글로벌 네트워크와 결합해 현지 정부·기업 고객을 확보한다는 전략이다. 이번 협력에는 엔비디아 차세대 AI 팩토리 플랫폼 'DSX'도 포함된다. DSX는 데이터센터 설계와 전력 공급, GPU 시스템, 네트워크, 소프트웨어 운영을 통합 관리하는 AI 팩토리 전용 플랫폼이다. 이를 통해 양사는 AI 데이터센터 운영 효율을 높이고 AI 모델 구축 기간과 토큰 생성 비용을 줄일 수 있을 것으로 보고 있다. "한국 핵심 AI 클라우드 파트너"…협력 관계 한층 확대 엔비디아는 이번 발표에서 네이버를 한국 내 핵심 AI 클라우드 파트너로 평가했다. 엔비디아는 네이버가 보유한 클라우드 역량과 데이터센터 운영 경험, 대규모 GPU 클러스터 구축 노하우를 높게 평가한 것으로 알려졌다. 양사 협력은 이번이 처음이 아니다. 네이버는 엔비디아 GPU를 기반으로 국내 최대 규모 AI 데이터센터인 각 세종을 운영해 왔으며, 지난해 경주 아시아태평양경제협력체(APEC) 정상회의를 계기로 추진된 한국 AI 인프라 확대 계획에서도 엔비디아와 긴밀한 협력 관계를 이어왔다. 당시 엔비디아는 2030년까지 한국에 GPU 26만 장을 공급하기로 했고 이 가운데 네이버는 국내 기업 중 가장 많은 6만 장을 확보했다. 업계에선 이번 협력이 기존 GPU 공급·수급 협력을 넘어 AI 데이터센터와 AI 클라우드 사업을 공동 추진하는 수준으로 발전했다는 평가가 나온다. 네이버클라우드 역시 이번 협력을 단순 모델 경쟁력 강화보다 AI 인프라와 클라우드 서비스 사업(CSP) 역량 확대의 계기로 활용할 것으로 풀이된다. '하이퍼클로바X' 등 네이버 AI 서비스가 이를 뒷받침하는 핵심 수요처 역할을 맡고 수익화 중심축은 AI 데이터센터와 AI 클라우드 사업에 맞춰질 것이란 관측이다. 이외에도 네이버는 정부가 추진하는 서비스형 GPU(GPUaaS) 프로젝트에도 지난해부터 지속 참여해왔다. 각 세종 외 추가 데이터센터 임차 검토 네이버는 이번 협력에 맞춰 AI 수요 확대에 대응하고자 각 세종 외 추가 데이터센터 임차도 검토 중이다. 앞서 네이버클라우드는 지난 4월 정부가 추진하는 GPU 1만 5000장 구축 사업 참여를 앞두고 LG CNS의 삼송 데이터센터 임차 계약도 체결한 바 있다. 네이버클라우드 관계자는 "각 세종에 더해 다른 데이터센터를 임차해 IT 인프라 용량을 확대하는 방안을 고려하고 있다"며 "구체적인 위치는 아직 공개하기 어렵다"고 말했다. 아직 엔비디아 GPU 도입 규모나 '베라 루빈' 등 특정 칩 적용 계획도 공개되진 않았다. 이 관계자는 "베라 루빈을 포함해 어떤 GPU가 연간 몇 대씩 도입되는지 등 세부 계획은 아직 공개 가능한 단계가 아니다"라고 설명했다. 젠슨 황 엔비디아 최고경영자(CEO)는 이날 오후 성남 네이버 1784 사옥을 방문해 이해진 네이버 이사회 의장과 회동할 예정이다. 양측은 AI 인프라 사업 로드맵과 글로벌 시장 공동 진출 전략 등을 논의할 것으로 전망된다. 이해진 네이버 의장은 "이번 동맹을 통해 전 세계 각 지역과 국가가 독자적인 소버린 AI 역량을 구축할 수 있는 구체적인 대안을 제시할 수 있게 돼 고무적"이라며 "우리가 보유한 기술 인프라 경쟁력이 글로벌 시장으로 한 단계 도약할 수 있는 계기를 마련했다"고 강조했다. 젠슨 황 엔비디아 CEO는 "네이버는 기업·개발자·산업 생태계를 지원할 AI 팩토리 인프라를 구축하고 있다"며 "엔비디아 DSX를 통해 한국이 AI 에이전트부터 AI 팩토리, 피지컬 AI에 이르는 에이전틱 시대 소버린 인텔리전스 인프라를 확장할 수 있도록 지원할 것"이라고 밝혔다.

2026.06.08 11:48한정호 기자

Prev 1 2 3 4 5 6 7 8 9 10 Next