• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
  • AI의 눈
반도체
AI의 눈
디지털트러스트
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'베라'통합검색 결과 입니다. (33건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

엔비디아 '베라 CPU' 외부 판매...삼성·SK LPDDR 수요 촉진

엔비디아가 저전력 D램(LPDDR) 수요를 또 한번 크게 촉진시킬 것으로 기대된다. 자체 설계한 '베라(Vera)' CPU를 외부 고객사에 판매하기로 하면서, 최근 앤트로픽·오픈AI·스페이스X 등과의 협력을 공식화했다. 베라 CPU에는 최첨단 LPDDR이 대거 탑재된다. 이에 삼성전자, SK하이닉스 등 국내 주요 메모리 기업들도 고부가 AI 메모리의 추가 성장 동력을 확보할 수 있게 됐다. 22일 업계에 따르면 엔비디아의 CPU 외부 판매 전략에 따라 삼성전자·SK하이닉스의 LPDDR 매출 성장성은 기존 대비 커질 전망이다. 베라 CPU는 오는 하반기부터 본격 출하가 예상되는 엔비디아의 최신형 CPU 제품이다. Arm 아키텍처를 기반으로 자체 개발한 올림푸스 코어 88개를 탑재했으며, LPDDR5X 기반의 SoCAMM2(Small Outline Compression Attached Memory Module2) 모듈이 최대 8개 집적된다. SoCAMM은 엔비디아가 독자 표준으로 개발해 온 차세대 메모리 모듈로, 16단으로 적층된 LPDDR5X를 4개씩 포함한다. 그간 엔비디아는 자체 CPU를 내부 GPU와 결합해 AI 가속기를 만드는 용도로만 활용해 왔다. 그러나 이번 베라 CPU부터는 전략을 바꿔, 외부 고객사에 칩을 별도 판매하기로 했다. 성과는 이미 가시화되고 있다. 회사가 지난 18일(현지시간) 블로그에 게재한 글에 따르면, 베라 CPU는 이달 앤트로픽·오픈AI·스페이스X 등 글로벌 빅테크 기업들의 사무소로 전달됐다. 또한 젠슨 황 엔비디아 최고경영자(CEO)는 최근 실적발표 컨퍼런스콜에서 "베라 CPU 단독으로만 200억 달러(한화 약 30조원) 수준의 시장 규모를 예상한다"며 "블랙웰, 루빈 GPU에 이어 회사의 두 번째로 큰 매출원이 될 것"이라고 밝혔다. 엔비디아의 CPU 사업 모델 확장은 삼성전자·SK하이닉스·마이크론 등 메모리 기업들에게 수혜로 작용할 전망이다. LPDDR5X는 현재 상용화된 가장 최신 세대의 저전력 D램이다. 특히 AI 산업 내에서 저전력·고효율 메모리 수요가 증가하면서, LPDDR5X의 부가가치도 크게 높아지는 추세다. 반도체 기판업계 관계자는 "올해 초와 비교해, LPDDR 및 SoCAMM에 탑재되는 반도체 기판 수요 전망을 최근 상향 조정했다"며 "다만 주요 메모리 기업들의 생산능력이 이미 풀가동 상황인 만큼 당장 물량을 크게 늘릴 수는 없는 상황"이라고 설명했다. 채민숙 한국투자증권 연구원은 최근 보고서를 통해 "올해 주요 D램 3사의 SoCAMM 공급량은 300억Gb로, 엔비디아의 베라 CPU 단독 판매 및 GPU와 결합된 서버 랙 판매를 모두 포함한 수요 전망은 이를 초과할 것으로 추정된다"며 "LPDDR은 물론 전체 D램 쇼티지가 갈수록 심화될 수밖에 없다"고 밝혔다.

2026.05.22 11:10장경윤 기자

'AI 거품설' 일축...엔비디아 "AI 투자 3조 달러 시대 온다"

"에이전틱 AI 시대에 접어들어 AI가 실제로 생산적이고 가치 있는 일을 수행하기 시작했다. 연산 역량이 매출과 영업이익에 직결되는 시대가 왔다. 토큰이 수익을 내고 주요 AI 기업들이 더 많은 서비스를 생산하기 위한 경쟁에 돌입했다." 20일(현지시간) 1분기(2~4월, 회계연도 기준 2027년 1분기) 실적 발표 이후 진행된 컨퍼런스콜에서 젠슨 황 엔비디아 CEO가 이렇게 강조했다. 이날 엔비디아가 공개한 1분기 매출은 816억 1500만 달러(약 122조 2503억원)로 전년 동기(440억 달러) 대비 85% 늘어났다. 영업이익은 535억 달러(약 80조 1371억원)로 전년 동기(187억 달러) 대비 세 배 이상 늘어났다. 젠슨 황 CEO는 "현재 AI 인프라 수요는 포물선 형태로 늘어나고 있다. 엔비디아는 모든 프론티어 AI 모델을 지원하는 유일한 플랫폼이며 하이퍼스케일 클라우드뿐 아니라 AI 네이티브 클라우드, 소버린 AI, 산업용 AI, 로보틱스까지 모두 지원한다"고 강조했다. "차세대 GPU '베라 루빈', 올 3분기부터 공급 시작" 이날 콜렛 크레스 엔비디아 최고재무책임자(CFO)는 "베라 루빈 출하는 올 3분기부터 시작해 4분기부터 대량 생산에 들어간다. 내년 1분기에는 큰 규모의 매출이 일어날 것"이라고 설명했다. 이어 "이미 주요 고객들의 주문 계획이 확정된 상태이며 수요 역시 충분히 확보됐다. 현재는 복잡한 시스템 조립과 생산 타이밍이 핵심 변수"라고 덧붙였다. 젠슨 황 CEO도 "모든 선도 AI 모델 기업이 베라 루빈을 도입할 것으로 예상된다. 베라 루빈은 블랙웰보다 더 성공적인 제품이 될 것"이라고 강조했다. 베라 루빈은 Arm 기반 88개 코어 탑재 CPU인 '베라'와 GPU '루빈'으로 구성된다. 엔비디아는 전 세대와 달리 올해부터는 베라 CPU를 별도로 분리해 공급할 예정이다. 젠슨 황 CEO는 "수십억 개 AI 에이전트가 등장하면 이들이 사용하는 도구와 오케스트레이션 작업은 CPU가 담당하게 된다. 올해 CPU에서 200억 달러 매출이 예상된다"고 설명했다. "AI 투자, 연 3조 달러 규모 간다" 젠슨 황 CEO는 글로벌 클라우드 업체와 하이퍼스케일러의 투자 규모에 대해서 낙관론을 내놨다. 그는 "애널리스트들은 하이퍼스케일러 투자가 내년 1조 달러에 달할 것이며 장기적으로는 3~4조 달러까지 지속 성장할 것"이라고 말했다. 그는 “AI 기업들은 과거 SaaS 기업들이 10년 걸려 달성했던 성장을 단 몇 달 만에 만들어내고 있다”며 “AI는 엄청난 수준의 컴퓨팅을 필요로 한다”고 설명했다. 특히 엔비디아는 향후 AI 데이터센터 시장이 단순 하이퍼스케일러를 넘어 산업·기업·국가 단위로 확대될 것으로 전망했다. 젠슨 황 CEO는 "현재 두 번째 시장군인 AI 네이티브 클라우드, 엔터프라이즈, 산업용 AI, 소버린 AI 시장이 매우 빠르게 성장하고 있다. 장기적으로 이 시장 규모가 하이퍼스케일러 시장보다 더 커질 가능성이 높다"고 말했다. "피지컬 AI와 로보틱스·추론 시장 확대 전망" 젠슨 황 CEO는 향후 AI 시장의 중심 축이 피지컬 AI와 로보틱스로 확장될 것으로 전망했다. "전 세계 수십만 개 기업들이 자체 AI 팩토리를 구축하게 될 것이며 특히 제조·산업 분야는 클라우드가 아닌 온프레미스 인프라가 필요하다"고 강조했다. 그는 "앞으로 수십억 개의 자율주행·로봇 시스템이 실제 세계에서 작동하는 시대가 올 것이며 엔비디아는 30년에 걸쳐 컴퓨팅 플랫폼을 구축해왔다"고 말했다. 젠슨 황 CEO는 추론 시장 점유율 확대도 전망했다. 그는 "올해 앤트로픽과 전략적 협력을 시작했고 AWS, 마이크로소프트 애저, 코어위브 등 다양한 클라우드 사업자를 통해 대규모 컴퓨팅 용량을 공급하고 있다"고 설명했다. "미국 정부 승인에도 중국 GPU 사업 여전히 불투명" 젠슨 황 CEO는 지난 주 미-중 정상회담 당시 도널드 트럼프 미국 대통령 전용기에 함께 탑승해 중국 베이징으로 향했다. 정상회담 직후 로이터통신은 "미국 상무부가 알리바바, 텐센트, 징둥닷컴 등 중국 기업 10여 곳에 H200 GPU 공급을 승인했다"고 보도했다. 그러나 콜렛 크레스 CFO는 "실제로 매출은 발생하지 않았다. 중국 정부의 수입 허가 여부도 불확실하다. 이 때문에 지난 분기와 마찬가지로 이번 가이던스에도 중국 시장 매출은 포함하지 않았다"고 설명했다.

2026.05.21 07:56권봉석 기자

[유미's 픽] 2조 GPU 사업 '승자의 저주' 되나…네이버·삼성·엘리스 3파전 압축

정부의 2조원대 그래픽처리장치(GPU) 확충 사업이 막판 검증 국면에 들어갔다. 대규모 물량 확보보다 이를 한데 묶어 안정적으로 돌릴 수 있는 클러스터 운영 능력과 수익성이 최종 변수로 떠오르면서 사업자별 희비도 엇갈리고 있다. 14일 업계에 따르면 과학기술정보통신부와 정보통신산업진흥원(NIPA)은 현재 추진 중인 '2026년 AI컴퓨팅자원 활용기반 강화사업'의 발표 평가를 최근 마치고 지난 11일부터 차례대로 데이터센터 현장실사 단계에 들어갔다. 현장실사 대상에는 네이버클라우드, 삼성SDS, 엘리스그룹이 오른 것으로 파악됐다. 당초 제안서를 낸 쿠팡과 KT클라우드는 발표평가 단계에서 제외된 것으로 알려졌다. 이번 사업은 총 2조805억원을 투입해 최신 GPU와 관련 부대장비를 국내 데이터센터에 구축하고 연내 서비스 개시까지 추진하는 프로젝트다. 정부는 단순한 GPU 수량 확보를 넘어 대규모 클러스터링, 직접 구축·운용 역량, 최신 장비 도입, 연내 서비스 개시 등을 핵심 평가 요소로 제시했다. 또 동일 데이터센터 내 집적 구축과 전력·냉각·네트워크 설계 역량까지 요구되면서 사업 난도도 높아졌다. 정부는 지난해에도 약 1조4000억원을 투입해 GPU 1만3000여 장 확보를 추진했다. 당시 네이버클라우드와 NHN클라우드, 카카오가 최종 선정됐다. 업계 관계자는 "이번 사업은 제안 물량을 크게 쓰는 것만으로는 통과하기 어려운 구조"라며 "연내 구축 가능성, 동일 데이터센터 내 집적 구축, 전력·냉각 여건을 실제로 입증할 수 있느냐가 발표평가를 가른 것으로 보인다"고 말했다. GPU 물량 경쟁 속 클러스터 역량 부상 업계에선 네이버클라우드가 이번 사업에서 GPU 9000장 안팎을, 삼성SDS는 4000장 안팎을 제안한 것으로 보고 있다. 엘리스그룹은 2000장 수준의 물량을 배정받을 가능성이 거론되고 있다. 정부는 공모 과정에서 정부 활용분 최소 1개 클러스터를 256서버 이상으로 구성하도록 요구한 것으로 알려졌다. 통상 AI 서버 1대에 GPU 8장이 탑재되는 점을 감안하면 최소 2048장 규모의 클러스터를 구성해야 하는 셈이다. 이처럼 수천 장의 GPU를 하나의 클러스터로 묶어 성능을 내려면 단순 물량 확보를 넘어 서버 간 통신 지연을 줄일 네트워크 대역폭, 스토리지 성능, 전력·냉각 설계가 함께 뒷받침돼야 한다. 업계 관계자는 "이번 사업은 GPU 물량보다 이를 단일 클러스터로 안정적으로 묶어 운용할 수 있는지가 중요하다"며 "전력과 냉각, 네트워크 설계가 뒷받침되지 않으면 대규모 물량을 확보해도 효율을 내기 어렵다"고 말했다. 네이버 대규모 물량 유력…삼성SDS·엘리스도 추격 네이버클라우드는 공모 참여 기업 중 상면 확보에 가장 적극적으로 나서며 사업자 선정 의지를 드러내고 있다. 이를 위해 최근에는 LG CNS 삼송 데이터센터를 임차한 데 이어 내년 개소 예정인 KT클라우드 부천 데이터센터도 임차 계약을 맺은 것으로 알려졌다. 또 네이버클라우드가 지난해 1차 GPU 사업을 통해 H200 3056장을 직접 구축·운영한 경험이 있다는 점도 강점으로 꼽힌다. 정부가 대규모 클러스터링과 직접 구축·운용 역량을 핵심 평가 요소로 제시한 데다 외부 데이터센터 상면까지 추가로 확보하면서 이번에 대규모 물량을 배정받을 가능성이 높은 것으로 점쳐진다. 삼성SDS도 주요 후보로 꼽힌다. 삼성SDS는 삼성 클라우드 플랫폼(SCP)을 기반으로 공공·기업 AI 인프라 사업을 확대하고 있다. 국가AI컴퓨팅센터 구축 사업에서 컨소시엄 주관기관으로 참여한 바 있고, NIPA 고성능컴퓨팅(HPC) 지원 사업을 통해 최신 GPU 자원을 공급한 이력도 있다. 동탄 AI 전용 데이터센터 운영 경험과 기업 고객 기반도 강점으로 거론된다. 업계 관계자는 "삼성SDS는 제안 물량은 네이버클라우드보다 적지만 그룹 내 AI·클라우드 수요와 기업 고객 기반을 갖춘 점이 강점"이라며 "공공 공급 비중이 높은 사업 구조상 자체 활용과 외부 수요를 어떻게 결합하느냐가 수익성에 영향을 줄 것"이라고 말했다. 엘리스그룹은 이동형 모듈러 데이터센터(PMDC)를 앞세워 차별화한 제안을 낸 것으로 알려졌다. 엘리스그룹은 이미 베라 루빈을 지원하는 PMDC 개발을 완료한 상태로, 엔비디아 B300 기준 최대 1만368장 규모의 GPU 클러스터링이 가능하다는 입장이다. 다만 실제 배정 물량은 2000장 안팎이 거론된다. 정부가 최소 1개 클러스터를 256서버, GPU 기준 2048장 이상 규모로 구축하도록 요구한 만큼, 엘리스그룹이 이 기준을 충족할 수 있을지가 관건이다. 모듈러 방식은 부지 조성, 모듈 제작, IT 장비 설치를 병행할 수 있어 구축 기간을 줄일 수 있지만, 대규모 GPU 클러스터를 안정적으로 운영하려면 전력 인입과 냉각, 네트워크 설계가 함께 뒷받침돼야 한다. 업계 관계자는 "엘리스그룹은 2000장 수준의 물량을 배정받을 가능성이 있지만 전력 확보 여부가 관건이 될 것"이라며 "PMDC가 상면 확보에는 유리할 수 있어도 대규모 GPU 클러스터 운영에는 전력과 냉각 안정성이 중요하다"고 말했다. 쿠팡 재도전 불발…KT클라우드도 고배 쿠팡은 지난해 1차 사업에서 탈락한 뒤 올해 재도전에 나섰지만, 발표평가 이후 현장실사 대상에는 포함되지 않은 것으로 알려졌다. 쿠팡은 싱가포르 데이터센터 전문기업 엠피리온디지털의 서울 양재동 데이터센터를 활용해 GPU 인프라를 구축·운영하는 방안을 제안한 것으로 알려졌다. 양재 데이터센터는 서울 도심 입지와 액체냉각 설비를 갖춘 점에서 주목받았다. 일부 층에는 고밀도 랙을 지원하는 액체냉각 방식이 도입된 것으로 알려졌다. 서울 도심 입지 특성상 엔지니어 수급과 지연시간 측면의 장점도 거론됐다. 그러나 정부 사업은 상면 확보뿐 아니라 정부 활용분 클러스터 구성, 서비스형 GPU(GPUaaS) 운영 실적, 연내 서비스 개시, 공공 공급 안정성 등을 종합적으로 따진다. 쿠팡의 도심형 상면과 AI 인프라 투자 계획이 주목받았지만, 발표 평가는 통과하지 못한 것으로 보인다. KT클라우드 역시 발표평가 단계에서 제외된 것으로 알려졌다. KT클라우드는 그간 공공 클라우드 운영 경험과 다수 데이터센터 인프라를 보유한 사업자로 꼽혀 왔다. 또 가산 AI 데이터센터와 부천 삼정 데이터센터 등 AI 인프라 확장 계획도 추진해 왔다. 다만 이번 제안에서는 GPU 물량을 1000장 단위로 여러 상면에 나눠 배치하는 방안을 제시한 것으로 알려졌다. 여기에 최근 대표 교체와 조직 재정비, 대형 투자 의사결정 지연 등이 맞물리며 이번 수주전에서 성과를 내지 못한 것 아니냐는 분석도 나오고 있다. KT클라우드는 수주 불발 관측 이후 내부 분위기도 좋지 않은 것으로 알려졌다.업계 관계자는 "최신 GPU 서버는 무게와 전력 밀도, 냉각 요건이 까다로워 2000장급 클러스터를 한 곳에서 안정적으로 수용할 수 있는지가 중요하다"며 "1000장씩 분산 배치하는 방식은 동일 데이터센터 내 대규모 클러스터링을 요구한 이번 평가에서 불리하게 작용했을 가능성이 있다"고 말했다. 또 다른 관계자는 "KT클라우드가 독립 클라우드 사업자로서 AI 인프라 경쟁력을 보여줄 기회를 이번에 놓친 듯 하다"며 "향후 KT그룹 내에서 KT클라우드의 역할과 투자 방향에도 영향을 줄 수 있다"고 관측했다. GPU값 1억원대에 인피니밴드 수급난 우려…수익성 부담 클 듯 일각에선 이번 사업이 '승자의 저주'가 될 수 있다고 우려했다. GPU 가격이 1년 사이 크게 오른 데다 서버, 네트워크 장비, 전력 설비, 냉각 장치, 데이터센터 보강 비용까지 함께 부담해야 하기 때문이다. 또 중동전쟁 여파로 GPU 클러스터 구성에 필요한 네트워크 장비 수급난도 고민거리로 떠올랐다. 대규모 GPU를 하나의 클러스터로 묶으려면 데이터센터 내 서버 간 고속 통신을 담당하는 인피니밴드 장비가 필수적인데, 관련 장비 상당 부분을 이스라엘에서 공급받아야 해 조달 일정을 맞추기가 쉽지 않아졌기 때문이다. 이에 GPU를 확보하더라도 네트워크 장비와 전력·냉각 인프라가 제때 갖춰지지 않으면 연내 서비스 개시에 차질이 생길 수 있다. 정부 사업 구조도 변수다. 이번 사업은 정부 예산으로 GPU를 구매해 소유권이 NIPA에 귀속되는 방식이다. 사업자는 공공 공급 물량을 제외한 일부 자원을 자체 서비스나 고객 수요에 활용할 수 있지만, 공공 공급 비중을 높일수록 자체 활용 여지는 줄어든다. 지난해 사업에서도 참여사들은 평가 점수를 고려해 자체 활용 비중을 낮게 설정한 것으로 알려졌다. 올해는 GPU 가격과 부대장비 비용 부담까지 커진 만큼, 최종 협상에서 자체 활용 비중을 두고 사업자들의 셈법이 더 복잡해질 전망이다. 지난해 약 8000장 규모 GPU 물량을 확보한 NHN클라우드가 올해 공모에 참여하지 않은 것도 비용 부담과 수익성 등을 고려한 선택으로 풀이된다. 업계 관계자는 "지난해 GPU 가격은 1대당 6000만~7000만원 수준이었지만 올해는 1억원 수준으로 오른 것으로 안다"며 "네트워크 장비와 전력·냉각 비용까지 감안하면 이번 사업은 수익성 확보가 쉽지 않을 수 있다"고 말했다. 베라 루빈, 가점에도 연내 도입 난항…최종 물량 협상 변수 이번 사업에서는 대규모 클러스터링뿐 아니라 엔비디아의 차세대 GPU 플랫폼인 '베라 루빈' 구축 여부도 승부수로 떠오르고 있다. 정부가 베라 루빈 도입을 제안하는 사업자에게 평가상 우대 방침을 밝히면서, 현장실사 대상에 오른 사업자들도 관련 도입 계획을 제안서에 포함한 것으로 알려졌다. 그러나 업계에선 베라 루빈의 연내 국내 도입이 쉽지 않을 것으로 보고 있다. 초기 공급 물량이 제한적인 데다 고전력·고밀도 랙을 수용할 데이터센터 인프라도 갖춰야 하기 때문이다. 업계 관계자는 "베라 루빈은 올해 들어오기 어려울 것으로 보인다"며 "다만 내년 3월까지 들여오기만 하면 정부가 우대해주는 구조로 알고 있다"고 말했다. 현장실사 이후에도 최종 배정 물량은 유동적이다. 사업비 심의·조정과 협약 체결 과정에서 GPU 구매 기종과 수량, 클러스터 규모, 자체 활용 허용 비중, 베라 루빈 반입 시점 등이 조정될 수 있기 때문이다. 정부는 현장실사와 후속 검토를 거쳐 이달 중 최종 수행기관을 선정한다는 목표다. 이후 선정 사업자는 GPU 발주와 데이터센터 구축, 장비 설치 및 성능 검증 등에 착수하게 된다. 업계에서는 선정 시점이 늦어질수록 GPU 가격 상승 부담과 공급 불확실성이 커질 수 있다고 보고 있다. 업계 관계자는 "최종 협상에서는 도입 물량과 자체 활용 비중, 베라 루빈 반입 시점 등이 핵심 쟁점이 될 것"이라며 "수익성과 구축 안정성을 함께 따져야 하는 만큼 사업자별 물량은 조정될 가능성이 있다"고 말했다.

2026.05.14 16:12장유미 기자

SK하이닉스, 엔비디아향 차세대 '소캠2' 본격 양산 개시

SK하이닉스가 10나노급 6세대(1c) LPDDR5X 저전력 D램 기반 차세대 메모리 모듈 규격인 소캠(SOCAMM)2 192GB(기가바이트) 제품을 본격 양산한다고 20일 밝혔다. 소캠2는 주로 스마트폰 등 모바일 제품에 사용되던 저전력 메모리를 서버 환경에 맞게 변형한 모듈로 차세대 AI 서버 등에 주력으로 활용된다. 기존 모듈 대비 얇은 두께와 높은 확장성을 갖췄으며, 압착식 커넥터를 통해 신호 무결성을 높이고 모듈 교체가 용이한 장점이 있다. SK하이닉스는 "1c 나노 공정을 적용한 소캠2 제품은 기존 RDIMM 대비 2배 이상의 대역폭과 75% 이상 개선된 에너지 효율을 실현해 고성능 AI 연산에 최적화된 설루션"이라고 강조했다. 특히 이번 소캠2 제품은 엔비디아의 베라 루빈(Vera Rubin)에 최적화 설계됐다. SK하이닉스는 "수천 억 개의 파라미터를 보유한 초거대 AI 모델의 학습과 추론 과정에서 발생하는 메모리 병목 현상을 근본적으로 해소함으로써 전체 시스템의 처리 속도를 비약적으로 높이는 데 기여할 것으로 기대된다"고 밝혔다. 회사는 이어 “AI 시장이 학습에서 추론 중심으로 본격 전환되면서, 거대언어모델을 저전력으로 구동할 수 있는 소캠2가 차세대 메모리 설루션으로 주목받고 있다”며 “글로벌 CSP 고객 수요에 발맞춰 양산 체제를 조기 안정화 했다”고 덧붙였다. 김주선 SK하이닉스 AI 인프라 사장(CMO)은 “소캠2 192GB 제품 공급으로 AI 메모리 성능의 새로운 기준을 세웠다”며 “글로벌 AI 고객과 긴밀한 협력을 바탕으로 고객이 가장 신뢰하는 AI 메모리 설루션 기업으로 자리매김하겠다”고 말했다.

2026.04.20 09:07장경윤 기자

중부권 최대 민간 GPU센터 추진…"슈마컴 루빈급 32만장 공급 약속"

블랙웰 급 6만2,500장 이상을 수용할 중부권 최대 GPU 데이터 센터가 들어설 전망이다. 건물과 송전 및 냉각시설, GPU 랙 등을 설치할 시설비만 2조 2,500억원 규모다. 한남대학교는 16일 대전 본교에서 케빈 창 슈퍼마이크로컴퓨터 부사장과 정시우 BKB에너지 대표, 성제현 KT수도권강북법인고객본부장를 비롯한 황정아·장철민 의원 등 내외빈 150여 명이 참석한 가운데 'AX클러스터 & 고성능 GPU 거점센터' 기공식을 개최했다. 이 프로젝트에서 GPU 조달은 엔비디아 GPU 공급업체인 슈퍼마이크로컴퓨터가 맡기로 했다. 사업 주체는 슈퍼마이크로컴퓨터와 BKB에너지, KT, 터보스케일 등이다. 이들이 GPU 공급과 냉각시스템 등 시설 설치 일체를 맡는다. 이들 간에는 GPU가 필요할 땐 언제든 공급하기로 하는 협약(NDA, 비밀보호협정)도 체결했다는 것이 한남대 측 설명이다. 이준원 한남대학교 인공지능전략위원회 부위원장(자유전공학부 교수)은 "GPU를 총 32만장 정도 가져올 수 있는데, 당장은 블랙웰급으로 6만 2,500장부터 들여올 계획이다. 향후엔 최상급인 베라루빈 이상으로 언제든 원할 때 들여올 수 있는 계약을 체결했다"고 말했다. 이 부위원장은 "GPU와 관련해서 정부나 지자체 지원없이 순수 민간 자본으로 구축한다"며 "해외에서는 미국과 캐나다, 프랑스 자본이 투입되고, 국내에서는 메리츠화재, 우리투자증권, BKB에너지 자금이 유입될 것"이라고 말했다. 이 부위원장은 또 "GPU 80%정도는 수냉식으로 열관리할 계획"이라며 "물 공급 부분은 수자원공사에서 책임지기로 했고, 전기 공급은 한전측과 기술평가를 실시한 결과 우선 40MW부터 공급하기로 했다"고 말했다. 향후엔 ESS(에너지저장시스템)를 활용한 추가 전력 100MW 정도를 확보할 계획이다. 한남대는 우선 올해내 건물 설계를 모두 마친뒤 내년부터 본격 건립 작업에 들어갈 계획이다.

2026.04.16 15:25박희범 기자

[유미's 픽] 2조 GPU 사업 오늘 마감…네이버·삼성 양강 속 AWS 참전하나

정부가 추진하는 2조원 규모의 '인공지능(AI) 컴퓨팅 인프라 구축 사업' 참여 기업들의 윤곽이 13일 드러난다. 우리나라 AI 주권과 직결되는 'AI 고속도로' 구축의 본게임이 또 다시 시작된 가운데 막대한 인프라를 갖춘 전통의 강자들과 신흥 세력 간의 수주 경쟁이 본격화된 양상이다. 과학기술정보통신부와 정보통신산업진흥원(NIPA)이 주관하는 이번 사업 공모는 이날 오후 3시 접수를 마감하고 본격적인 심사에 돌입한다. 총 사업비 2조800억원을 투입해 최신 그래픽처리장치(GPU) 1만5000장을 확보하는 이번 프로젝트는 장비 수급부터 데이터센터(IDC) 하중 설계, 전력 인프라 확보까지 고도의 기술력이 요구되는 고난도 과제로 평가받는다. 이번 사업에서 가장 까다로운 조건으로 꼽히는 것은 IDC 하중 진단 및 제출 요건이다. 엔비디아 최신 GPU가 수냉 기반 냉각 시스템을 기본 적용하면서 장비 무게가 기존보다 크게 늘었기 때문이다. 이에 일반적인 IDC 설계만으로는 이를 견디기 어려워 별도의 보강 공사가 사실상 필수다. 실제 지난해 최신 인프라를 도입하던 과정에서 일부 기업은 하중 문제에 따른 설비 보강으로 구축 일정이 수개월 이상 지연됐다. 이 경험은 올해 사업 요건 강화에 결정적인 영향을 미친 것으로 알려졌다.업계 관계자는 "단순히 장비를 확보하는 능력을 넘어 이를 버텨낼 물리적 상면과 설계 역량을 사전에 검증받아야 하는 구조가 이번에 형성됐다"며 "인프라를 미리 확보한 사업자들에게 유리한 지형이 만들어졌다"고 말했다. 업계에선 이번 GPU 1만5000장 구축의 유력 사업자로 네이버클라우드, 삼성SDS를 꼽았다. 경쟁사들에 비해 상면과 전력 확보 여력이 충분하다고 봐서다. 또 네이버클라우드는 가장 많은 GPU를 배정받을 것으로 관측됐고, 삼성SDS는 약 4000장 규모를 구축할 것으로 내다봤다. KT클라우드도 대표와 주요 임원 교체에 따른 조직 재정비 분위기 속에서도 이번 사업 참여 쪽으로 가닥을 잡는 분위기다. 당초 KT그룹 차원의 경영 재정비 영향으로 작년 말부터 신규 대형 투자 의사결정이 지연돼 이번 사업도 참여가 힘들 것으로 점쳐졌으나, 막판에 방향을 튼 것으로 전해졌다. 업계에선 KT클라우드가 공공 클라우드 운영 경험과 일정 수준의 상면을 기반으로 제안 작업에 참여하고 있는 것으로 보고 있다. 이 외에 엘리스그룹의 행보도 주목된다. 엘리스그룹은 이동형 모듈러 데이터센터 기술을 강점으로 내세워 대규모 GPU 클러스터링 시장에 도전장을 내밀었다. 다만 대규모 전력 확보와 클러스터링 운용 경험 면에서 네이버클라우드나 삼성SDS와 같은 대형 CSP(클라우드 서비스 제공사)들과 어떻게 차별화를 꾀할지는 관건이다. 업계 관계자는 "엘리스그룹은 컨테이너형 모듈러 데이터센터를 활용해 공간 제약은 상대적으로 덜하지만, 결국 전력 확보 여부가 당락을 가를 핵심 변수가 될 듯 하다"며 "특히 이번 심사 항목에 현장 실사가 포함된 만큼, 실제 신청에 나설 경우 일정 수준 이상의 전력과 상면을 사전 확보했을지가 주목할 부분"이라고 밝혔다. 반면 지난해 사업에서 괄목할 성과를 냈던 NHN클라우드는 내년 사업에 승부수를 띄울 가능성이 크다. 또 이번 공모에선 추가 확장보다 기존 인프라 운영 안정화에 무게를 두고 관망하는 분위기다. 업계에선 공공 물량 중심의 낮은 수익 구조를 감안할 때 무리한 추가 수주보다 기존 GPU 클러스터의 가동률과 수익성 개선에 집중하는 전략으로 해석하고 있다. 해외 CSP인 아마존웹서비스(AWS)의 상징적 참전 가능성이 높다는 점도 관점 포인트다. 올해 공모에서 '국내 주 사업장' 요건이 삭제되면서 외국계 기업의 문호가 열렸기 때문이다. 이에 AWS가 향후 공공 AI 인프라 시장 확대를 노리고 있다는 점을 감안하면, 초기 레퍼런스를 확보하고 정책 시장 내 입지를 선점하기 위해 전략적으로 이번 사업에 나설 것으로 관측된다.업계 관계자는 "실제 수주 여부와 별개로 AWS가 이번 사업에 참여할 가능성이 높다"며 "외국계 기업에 열린 문이 다시 닫히지 않도록 존재감을 보여주기 위해 나설 듯 하다"고 말했다. 이번 GPU 사업은 수익성과 공공성 사이의 '딜레마'도 주요 변수로 꼽힌다. 정부 예산으로 GPU를 구매하는 만큼 소유권은 국가에 귀속되고, 사업자는 저렴한 수수료로 자원을 공급해야 한다. 이 때문에 지난해와 달리 올해는 상징성보다 수익성 판단이 훨씬 중요해졌다는 게 업계 중론이다. 여기에 고환율과 글로벌 공급망 불안까지 겹치며 목표 물량 확보에도 빨간불이 켜졌다. 일각에선 지난해 사업 당시 1400원 안팎이던 원·달러 환율 기준이 최근 1500원선까지 오른 점을 감안하면 단순 계산으로도 확보 가능 물량이 약 10% 줄어 1만3500장 수준에 그칠 수 있다는 추산도 내놓고 있다. 이와 관련해 과기정통부 관계자는 "가격이 많이 오르긴 했지만 실제 공모에서는 경쟁이 붙는 부분도 있는 만큼 최대한 1만5000장 목표 달성을 위해 노력해보자는 상황"이라며 "GPU와 메모리 가격, 환율 부담으로 업계 상황이 어렵다는 점은 정부도 파악하고 있다"고 말했다.엔비디아의 차세대 GPU '베라루빈'의 출시 지연 가능성도 이번 사업의 변수로 꼽힌다. 정부는 이번 사업에서 베라루빈과 같은 차세대 하이엔드 GPU를 제안할 경우 평가에서 긍정적으로 반영할 것이란 입장을 내놨지만, 6세대 고대역폭메모리(HBM4)의 검증 병목으로 연내 양산 불확실성이 커지고 있어서다. 시장에서도 베라루빈의 올해 점유율 전망치를 대폭 낮췄다. 시장조사업체 트렌드포스에 따르면 올해 엔비디아의 하이엔드 GPU 출하 구조에서 블랙웰 시리즈가 차지하는 비중은 기존 전망치인 61%에서 71%로 대폭 상향 조정됐다. 반면 차세대 모델 베라루빈 시리즈의 비중은 기존 29%에서 22%로 하향됐다. 투자은행 키뱅크는 보고서를 통해 "SK하이닉스와 마이크론의 HBM4 승인 관련 문제로 루빈의 양산 일정이 늦춰지고 있다"며 "엔비디아가 올해 루빈 생산 목표를 기존 200만 개에서 150만 개로 하향 조정한 것으로 파악된다"고 밝혔다. 이에 대해 과기정통부는 별도 목표치를 두기보다 사업자 제안에 맡기되, 엔비디아와의 협의를 통해 국내 우선 배정을 지원한다는 계획이다. 과기정통부 관계자는 "엔비디아코리아 측에서도 베라루빈 물량이 국내에 우선 배정될 수 있도록 본사와 협상하고 있는 것으로 안다"며 "실제 도입 규모는 사업자들이 상면과 비용 등을 감안해 제안하게 될 것"이라고 설명했다. 그러나 업계에선 정부의 우선 배정 지원 의지와 별개로 실제 연내 대규모 물량 확보는 여전히 불확실하다는 시각이 우세하다. HBM4 검증 지연과 수냉 기반 전력·하중 설계 부담까지 겹치면서 사업자들도 현실적으로는 블랙웰 중심의 제안에 무게를 둘 가능성이 크다는 분석이다. 업계 관계자는 "베라루빈 수급 불안정은 최신 인프라를 조기에 구축하려던 정부 계획에 부담으로 작용할 듯 하다"며 "현실적으로는 이번 사업도 블랙웰 중심의 구축에 머물 수밖에 없을 것"이라고 우려했다. 그러면서 "수냉 기반 구조와 높은 전력 소비, IDC 하중 설계 요건 역시 사업 참여를 가로막는 진입 장벽이 됐다"며 "높은 환율과 중동전쟁 여파로 네트워크 장비 수급도 쉽지 않아 베라루빈은커녕 블랙웰도 정부가 목표한대로 1만5000장을 확보하지 못할 가능성이 높다"고 짚었다. 또 다른 관계자는 "GPU 수급 지연과 IDC 하중 리스크 등 사업 환경이 어느 때보다 가혹한 상황"이라며 "단순한 장비 확보 경쟁을 넘어 데이터센터의 물리적 한계를 극복할 수 있는 실질적인 운영 체력을 입증하는 것이 이번 수주전의 최대 관건이 될 것"이라고 말했다.

2026.04.13 11:16장유미 기자

삼성전기, '그록3 LPU'용 FC-BGA 공급

삼성전기가 '그록(Groq)3 언어처리장치(LPU)'용 반도체 패키지기판의 주력 공급망 지위를 확보했다. 그록3 LPU는 엔비디아의 최첨단 인공지능(AI) 반도체 '베라 루빈(Vera Rubin)' 성능을 높일 추론 가속기 칩이다. AI 산업에서 추론 중요성이 커지는 만큼, 삼성전기도 엔비디아 AI 반도체 생태계 내 영역을 확장할 것으로 기대된다. 8일 지디넷코리아 취재에 따르면 삼성전기는 최근 그록3 LPU용 플립칩-볼그레이드어레이(FC-BGA) 양산 준비에 돌입했다. 삼성전기는 그록3 LPU용 FC-BGA의 '퍼스트 벤더(공급량 1위 업체)' 지위를 확보했고, 올 2분기부터 본격 양산할 것으로 관측된다. 그록3 LPU는 4나노 공정 기반의 AI 추론 가속기 칩이다. 삼성전자 파운드리에서 양산한다. 삼성 파운드리가 그록3 LPU에 할당한 웨이퍼 투입량은 월 1만장 수준으로 추산된다. FC-BGA는 반도체 칩과 기판을 '플립칩 범프(칩을 뒤집는 방식)'로 연결하는 패키지기판이다. 기존 와이어 본딩 대비 전기적·열적 특성이 높다. 초도 물량은 적지만, 삼성전기는 이번 FC-BGA 공급으로 엔비디아 AI 반도체 생태계 내 영역을 확장할 수 있다. 앞서 삼성전기는 올해 초 'NV스위치' 칩용 FC-BGA 공급을 확정하며 엔비디아 공급망에 진입한 바 있다. NV스위치는 서버 내 복수 그래픽처리장치(GPU)를 연결하는 데 쓰인다. 그록 LPU 역시 엔비디아 AI 반도체 플랫폼에 채택된 만큼, 향후 출하량 확대가 기대된다. 이와 관련, 젠슨 황 엔비디아 최고경영자(CEO)는 지난달 16일(현지시간) 미국 캘리포니아 새너제이에서 열린 'GTC 2026' 기조연설에서 첨단 AI 반도체 플랫폼 변화를 발표했다. 엔비디아가 올해 하반기 출시하는 베라 루빈 플랫폼은 당초 '루빈' GPU와 '베라' 중앙처리장치(CPU)를 비롯해 '블루필드-4' 데이터처리장치(DPU), 스위치 등 6개의 칩으로 구성됐다. 그러나 젠슨 황 CEO는 베라 루빈 플랫폼에 그록 3 LPU을 추가해, 총 7개의 칩 구조로 변화시켰다. 256개의 그록 3 LPU를 탑재한 추론 전용 랙 '그록 3 LPX'를 엔비디아 베라 루빈 NV72 랙에 통합하는 방식이다. NV72는 72개의 루빈 GPU와 36개의 베라 CPU로 구성된다. 그록 3 LPU는 D램 대비 용량이 작지만 데이터 전송속도가 빠른 S램을 탑재했다. 덕분에 LLM의 추론 단계에서 기존 단일 GPU 시스템에서 발생하던 지연(레이턴시) 현상을 크게 줄일 수 있다. LPX가 결합된 베라 루빈의 경우, 1조 매개변수 모델에서 메가와트당 최대 35배 더 높은 처리량을 제공할 수 있다고 엔비디아는 설명한다. 이에 엔비디아는 지난해 말 약 29조원을 들여 그록을 우회 인수하는 등 적극적인 협력 체계를 구축하고 있다. 반도체 업계 한 관계자는 "엔비디아가 각 영역에 특화된 칩으로 전체 AI 플랫폼을 구상하는 전략을 강화하고 있다"며 "그록 LPU 채택량도 더 늘어날 것으로 전망되고, 협력사들도 수혜를 입을 것"이라고 설명했다.

2026.04.08 10:35장경윤 기자

[유미's 픽] "GPU만 사오면 끝?"…정부, 1.5만장 구축 사업서 '설계 능력' 보는 까닭

정부의 대규모 그래픽처리장치(GPU) 인프라 사업 경쟁이 장비 확보에서 운용 능력 중심으로 재편되고 있다. 최신 GPU 도입 여부보다 이를 얼마나 효율적으로 설계·운영할 수 있는지가 올해 사업 선정의 핵심 변수로 떠오른 가운데, 정부가 국내 기업들의 인프라 경쟁력을 끌어올리기 위해 본격 나선 모양새다. 30일 업계에 따르면 과학기술정보통신부는 다음달 13일까지 GPU 1만5000장을 구축하기 위한 사업자 공모에 나선다. 총 2조800억원을 투입해 GPU 서버와 부대 장비를 구매한 후 산·학·연에 공급할 예정으로, 최신 GPU를 신속히 확보하고 이를 대규모로 묶어(클러스터링) 구축·운용할 수 있는 민간 기업을 선정한다는 방침이다. 앞서 정부는 지난해 추가경정예산 1조4000억원을 투입해 확보한 엔비디아 B200 등 첨단 GPU 1만3000장을 NHN클라우드, 네이버클라우드, 카카오엔터프라이즈 등을 통해 구축했다. 또 이 물량을 최근 산·학·연에 3000장, 국가 프로젝트에 4000장, 독자 AI 파운데이션 모델에 3000장씩 배분했다. 또 지난 25일부터 산학연을 대상으로 2000장에 대한 추가 공모에도 들어갔다. 올해 5월 중 선정될 사업자는 연내 GPU 1만5000장 구축 및 서비스를 개시해 2031년 12월 31일까지 운영하게 된다. 이 물량 역시 산·학·연 및 국가 프로젝트를 대상으로 자원 배분과 운영이 이어진다. 이병묵 NIPA AI인프라확충팀장은 "올해 블랙웰급 이상의 최신 GPU 1만5000장 확보를 목표로 한다"며 "고성능 GPU를 대규모로 공급할 수 있는 사업자가 높은 평가를 받을 것"이라고 말했다. 정부는 이번 사업을 통해 참여 기업들의 기술 경쟁력을 끌어올린다는 목표다. 그간 GPU 물량 싸움 중심으로 인프라 구축 사업을 펼친 결과 수행 과정에서 한계가 곳곳에서 드러났던 탓이다. 특히 지난해 처음 GPU 구축 사업에 나서면서 일부 기업들이 H100, B200급을 확보해두고도 소프트웨어, 구성 문제로 실제 성능 효율이 낮은 사례가 발생하자 정부가 이에 대해 문제의식을 크게 느낀 것으로 알려졌다. 대규모 GPU 클러스터는 데이터 흐름과 메모리 구조, 네트워크 구성에 따라 전체 성능이 좌우되는 만큼 단일 장비 성능만으로는 효율을 담보하기 어렵다.또 B200 도입에 따라 수냉식 등 최신 냉각 기술을 적용해야 함에도 불구하고 하중 보강 공사, 구조 변경 등이 빠르게 뒷받침 되지 못해 구축 일정이 지연되는 사례도 벌어지자 정부가 난감해 한 것으로 전해졌다. 업계 관계자는 "정부가 GPU 1만3000장 구축 사업을 진행하면서 GPU만 사오면 끝나면 사업이 아니란 점을 뼈저리게 느낀 듯 하다"며 "지난해엔 얼마나 GPU를 많이 확보하고 싸게 제안했는지를 중점적으로 들여다 본 탓에 정작 운용능력이 뒷받침되지 않아 정부도 속앓이를 많이 한 것으로 안다"고 지적했다. 이에 정부는 올해 사업 평가 기준을 대폭 수정했다. 단순한 장비 확보 능력보다 실제 운영 효율을 검증할 수 있는 요소들을 대거 평가 체계에 포함한 것이다. 실제 이번 사업의 주요 평가 항목 및 배점을 살펴보면 절반인 50점이 사업 준비도 및 경쟁력에 배정됐다. 이 중 인프라 준비도(18점)와 구축 계획의 구체성(32점)은 핵심 평가 항목으로 제시됐다. 특히 데이터센터 상면 확보 여부를 비롯해 전력·냉각 설비, 네트워크 구성, 자원 관리 체계 등 물리적·논리적 인프라를 종합적으로 검증하겠다는 방침을 내세웠다. 이는 단순 가격 경쟁이나 물량 확보보다 실제 대규모 GPU 클러스터를 구축해 안정적으로 운영할 수 있는 역량을 우선 보겠다는 의미다. 특히 32점이 배정된 구축계획 우수성은 정부가 이번 사업을 사실상 '설계 능력 평가'로 보고 있음을 보여준다. 어떤 GPU를 얼마나 들여오겠다는 수준을 넘어 이를 어떤 구조로 묶고 어떤 일정으로 구축하며 실제 서비스 단계까지 어떻게 연결할 것인지를 구체적으로 입증해야 높은 점수를 받을 수 있는 구조란 점에서다. 업계 관계자는 "GPU 활용 효율을 입증할 수 있는 성능 지표 제시가 요구되면서 사업자들의 부담이 한층 커진 상황"이라며 "실제 연산 효율을 얼마나 끌어올릴 수 있는지에 대한 구체적인 방법론과 결과를 함께 제시해야 하기 때문"이라고 말했다. 업계에선 이를 두고 정부가 사업 방향을 '물량 경쟁'에서 '효율 경쟁'으로 전환한 것으로 보고 있다. 동일한 GPU 환경에서도 메모리 활용 방식, 데이터 전송 구조, 추론 엔진 설계에 따라 처리 성능과 비용 효율이 크게 달라지기 때문이다. 이 과정에서 메모리 처리 구조와 데이터 흐름 최적화 등 소프트웨어 역량이 핵심 변수로 부상하고 있다. GPU 연산 성능이 높아도 메모리 대역폭이나 데이터 처리 구조가 이를 뒷받침하지 못할 경우 전체 성능이 제한되는 구조적 한계 때문이다. 이에 일부 기업들은 이러한 병목 현상을 해소하기 위해 추론 엔진 최적화, 모델 경량화, 데이터 처리 구조 개선 등 다양한 기술 경쟁을 벌이고 있다. 같은 GPU를 사용하더라도 운영 방식에 따라 처리 가능한 작업량이 크게 달라져서다. 업계 관계자는 "정부가 차세대 GPU인 '베라루빈' 제안 시 평가에 우대 조건으로 반영할 수 있도록 한 것도 이러한 흐름과 맞닿아 있다"며 "단순 도입 여부보다 고성능 장비를 안정적으로 운용할 수 있는 인프라 설계 능력을 함께 보겠다는 의미"라고 해석했다. 다만 베라루빈과 같은 차세대 GPU는 수냉 기반 구조 등으로 인해 기존 대비 장비 무게와 전력 요구 수준이 크게 높아지는 만큼, 일각에선 이를 수용할 수 있는 데이터센터 인프라 확보 여부가 새로운 변수가 될 것으로 봤다. 실제 올해 사업에서는 데이터센터 하중 구조를 사전에 점검해 제출하도록 하는 요건이 추가된 것으로 알려졌다. 지난해 일부 사업자가 수냉식 장비 도입 과정에서 구조 보강 문제로 일정 지연을 겪은 경험이 반영된 결과다. 업계 관계자는 "작년에는 장비 확보와 단가 경쟁이 중심이었다면, 올해는 성능 효율과 운영 구조까지 함께 검증하는 방향으로 완전히 바뀌었다"며 "실제 서비스를 돌릴 수 있는 수준의 설계 역량을 갖추지 않으면 사업 참여 자체가 쉽지 않은 구조"라고 밝혔다. 전문가들은 이번 사업이 국내 AI 인프라 경쟁 방식 자체를 바꾸는 계기가 될 것으로 보고 있다. 단순한 하드웨어 투자에서 벗어나 소프트웨어와 운영 기술까지 포함한 종합 경쟁력 확보가 요구되고 있기 때문이다. 또 다른 관계자는 "이제는 GPU를 얼마나 확보했는지가 아니라 같은 자원으로 얼마나 높은 효율을 내느냐가 경쟁력의 핵심"이라며 "이번 사업은 국내 기업들이 글로벌 수준의 인프라 운용 역량을 갖추도록 유도하는 전환점이 될 것"이라고 말했다.

2026.03.30 16:27장유미 기자

[AI 고속도로] 정부가 점찍은 '베라루빈'…국내 안착 가능할까

정부가 '인공지능(AI) 고속도로' 구축을 위해 차세대 그래픽처리장치(GPU) 확보에 속도를 내는 가운데, 엔비디아의 최신 아키텍처 '베라루빈' 도입이 핵심 과제로 떠오르고 있다. 기존 시스템과 다른 구조와 높은 인프라 요구 조건 등으로 인해 업계에선 국내 안착 가능성을 두고 신중론이 확산되는 분위기다. 29일 업계에 따르면 과학기술정보통신부는 약 2조원 규모의 AI 컴퓨팅 인프라 구축 사업을 추진하며 최신 GPU 확보에 나섰다. 특히 '블랙웰'급 이상 차세대 GPU 아키텍처인 베라루빈을 제안할 경우 평가에서 우대하는 방안을 검토하면서 업계 관심이 집중되고 있다. 이번 사업은 단순 GPU 물량 확보를 넘어 최신 아키텍처 기반 대규모 클러스터 구축을 목표로 한다. 최소 256노드, 2048장 이상 GPU를 하나의 클러스터로 구성하는 조건이 제시되며 전력·냉각·네트워크 등 데이터센터 전반의 인프라 역량이 핵심 평가 요소로 반영된다. 정부가 베라루빈 도입까지 열어둔 것은 글로벌 AI 경쟁이 물량에서 세대 경쟁으로 전환됐다는 판단이 작용한 것으로 풀이된다. 실제 최신 GPU 확보 시점이 AI 서비스 경쟁력으로 직결되는 상황에서 차세대 칩 선점이 중요해졌다는 분석이다. 다만 업계 시각은 다소 엇갈린다. 베라루빈은 기존 x86 기반 중앙처리장치(CPU)와 GPU 조합이 아닌 'Arm' 아키텍처 기반 CPU와 GPU를 결합한 슈퍼칩 구조로 설계돼 기존 인프라와 호환성이 보장되지 않는 새로운 플랫폼이기 때문이다. 이같은 구조적 차이는 장비 도입을 넘어 운영 방식 자체의 변화를 요구할 전망이다. 기존 GPU 서버가 서버 단위로 확장되는 구조였다면 베라루빈은 랙 단위에서 수십 개 GPU를 하나의 시스템처럼 묶어 사용하는 형태로 설계돼 인프라 설계와 운영 난도가 크게 높아질 수 있다는 예상이다. 문제는 국내 환경에서 이러한 초대형 시스템을 수용할 준비가 충분하지 않다는 점이다. 현재 국내 GPU 인프라는 대부분 일반적인 서버 중심 GPU 구조인 NVL8 기반으로 운영되고 있으며 슈퍼칩 시스템 도입 사례는 사실상 전무한 것으로 평가된다. 비용 부담도 가장 큰 장벽으로 꼽힌다. 베라루빈은 수십억~수백억 원 단위의 장비 투자와 함께 고밀도 전력 공급, 액체 냉각 설비 등 별도 인프라 구축이 필수적이다. 업계에선 상징적 도입은 가능하겠지만 대규모 확산은 쉽지 않을 것이라는 전망이 나온다. 전력과 냉각 문제도 핵심 변수다. 베라루빈과 같은 차세대 GPU는 기존 공랭 방식으로는 감당이 어려운 수준의 발열을 발생시키며 다이렉트 리퀴드 쿨링(DLC) 등 액체 냉각 기술이 필수로 요구된다. 이는 국내 데이터센터 설계 자체를 바꾸는 수준의 변화로 이어질 수 있다. 이 과정에서 인프라 구축뿐 아니라 운영 역량도 중요한 요소로 부각된다. AI 인프라는 단순 장비 도입이 아니라 데이터센터, GPU 클러스터, AI 플랫폼이 유기적으로 결합된 형태로 운영돼야 하며 이를 안정적으로 관리할 수 있는 경험과 노하우가 요구된다. 또 다른 변수는 활용성이다. 베라루빈은 단순 연산 성능을 넘어 추론 중심 AI 시대를 겨냥한 플랫폼으로 평가되지만, 이를 실제 서비스에 적용하기 위해서는 소프트웨어 최적화와 운영 체계 구축이 필수적이다. 정부 역시 이러한 현실을 인지하고 있는 분위기다. 베라루빈 도입을 강제 조건이 아닌 우대 요소로 설정하고 블랙웰 등 기존 GPU와 병행 도입을 허용하는 등 유연한 접근을 취하고 있다. 이번 사업은 단순한 GPU 확보를 넘어 국내 AI 인프라 구조 전환의 시험대가 될 전망이다. 최신 아키텍처 도입을 통한 경쟁력 확보와 현실적인 인프라 제약 사이에서 균형을 찾는 것이 관건으로 꼽힌다. 데이터센터 업계 관계자는 "베라루빈은 기술적으로 매력적이지만 전력·냉각·비용 등 현실적인 허들이 높아 국내에서 빠르게 확산되기는 쉽지 않을 것"이라며 "결국 일부 선도 사업자를 중심으로 제한적 도입이 이뤄질 가능성이 크다"고 말했다. 과기정통부 관계자는 "차세대 GPU 도입은 국내 AI 경쟁력 확보를 위한 중요한 선택지"라며 "공급 상황과 인프라 여건을 고려해 민간과 협력하면서 현실적인 방식으로 도입을 추진해 나가겠다"고 밝혔다.

2026.03.29 14:32한정호 기자

[AI 고속도로] '베라루빈' 도입·연내 구축 가능할까…정부 GPU 확충 쟁점은

정부가 '인공지능(AI) 고속도로' 구현을 위한 2조원 규모 최신 그래픽처리장치(GPU) 확충 사업에 착수한다. 엔비디아가 공개한 차세대 GPU '베라루빈' 도입 가능성까지 포함되면서 사업 방향과 세부 기준에 대한 업계 관심이 높아지고 있다. 과학기술정보통신부와 정보통신산업진흥원(NIPA)은 20일 서울 포스코타워 역삼에서 '2026년 AI컴퓨팅자원 활용기반 강화사업(GPU 확보·구축·운용지원)' 공모 사업설명회를 개최했다. 이날 현장에선 사업 구조와 평가 기준, 데이터센터 요건 등을 설명하고 현장 질의응답을 진행했다. 이병묵 NIPA AI인프라확충팀장은 "단기간 성패가 좌우되는 AI 시장에서 국가 차원의 첨단 GPU를 수요가 높은 곳에 조기 확보해 서비스로 지원할 계획"이라며 "민관 협력을 통해 AI 컴퓨팅 인프라를 즉각 확충하고 생태계 활력과 글로벌 경쟁 기반을 동시에 확보하겠다"고 밝혔다. 이날 설명회에는 지난해 사업에 선정된 네이버클라우드·NHN클라우드·카카오엔터프라이즈를 비롯해 KT클라우드 등 국내 클라우드 서비스 제공사(CSP)와 엘리스그룹이 자리했다. 또 삼성SDS·LG CNS 등 SI 기업과 메가존클라우드·디딤365, 레드햇·클러쉬, 델·HPE·IBM·넷앱·슈퍼마이크로 등 인프라 기업, 엔비디아·AMD·인텔, MS·구글 클라우드, SK텔레콤·쿠팡 등 60여개 기업 200여 명이 참석했다. 현장 질의응답에선 차세대 GPU 도입 기준을 비롯해 데이터센터 구축 방식, 글로벌 공급망 위협과 환율 변동에 따른 비용 부담, 연내 구축 일정 등 주요 쟁점을 중심으로 사업 참여를 검토하는 기업들의 질의가 이어졌다. 특히 베라루빈 도입 여부와 구축 일정 간 균형, 국내 인프라 중심 운영 원칙 등이 핵심 관심사로 부각됐다. 최신 GPU 중심 평가…베라루빈 도입 기준·일정 변수는 -사업 요건의 비용 대비 높은 GPU 성능은 어떤 기준으로 평가되나. "경제성 항목은 단순히 장비 수량을 많이 확보하는 개념이 아니라, 최신 GPU 기준으로 성능 대비 얼마나 효율적으로 제안하느냐를 보는 것이다. 동일한 예산 안에서 최신 아키텍처 GPU를 얼마나 확보할 수 있는지가 핵심이다. 구형 GPU를 대량으로 제안하는 방식보다는 최신 GPU 중심으로 실제 AI 학습과 추론에 적합한 성능을 확보했는지가 평가 포인트가 된다. 성능 대비 비용, 그 성능이 실제 AI 활용에 얼마나 적합한지를 종합적으로 볼 것이다." -베라루빈 제안 시 클러스터 구축 기준은 어떻게 적용되나. "베라루빈은 아직 구체적인 구성 방식이나 클러스터 단위가 완전히 정형화되지 않은 차세대 GPU다. 기존 블랙웰 계열과 동일한 기준을 그대로 적용하기는 어려울 수 있다. 이 부분은 칩 제조사와 공급망을 통해 확인해야 하는 영역이다. 제안 단계에선 가능한 범위에서 구성 계획을 제시하되, 세부 기준은 제조사 스펙과 실제 공급 조건을 반영해 판단하게 된다. 중요한 것은 차세대 GPU 도입 의지와 실현 가능성이다." -특정 제조사의 GPU만을 고려해 평가가 이뤄지는지. "이번 사업은 특정 칩 제조사를 배제하거나 제한하려는 것이 아니라, 국가 차원에서 AI 인프라를 가장 빠르게 확보하는 것이 목적이다. 현재 시장에서 대규모 AI 모델 학습과 서비스에 가장 널리 활용되는 최신 GPU를 중심으로 판단하게 된다. 다양한 선택지가 있을 수 있지만 실제 활용성과 안정성, 공급 가능성을 종합적으로 고려할 수밖에 없다." -베라 루빈 출시 일정과 연내 구축 목표가 충돌할 경우 기준은. "기본적으로 이번 사업은 연내 구축과 서비스 개시가 중요한 목표다. 다만 차세대 GPU 도입은 평가에서 우대 요소로 반영된다. 베라 루빈의 경우 일반적인 글로벌 공급 일정과 달리 국내 도입 시점이 앞당겨질 가능성도 있다. 관계 부처와 제조사 간 협의를 통해 국내 물량 확보를 추진해 왔다. 결국 일정과 최신성 두 요소를 함께 고려하되, 현실적인 공급 상황을 반영해 판단할 것이다." -GPU 납기 지연 등 변수 발생 시 일정 조정이 가능한가. "사업자가 최종 선정된 이후 협약 단계에서 시장 상황을 반영해 일부 조정은 가능하다. 기본 원칙은 유지하되, 실제 납기나 공급 이슈가 불가피하게 발생하는 경우까지 일률적으로 적용하기는 어렵다. 협약 과정에서 합리적으로 논의할 수 있는 여지는 있다." "국내 데이터센터 집적이 원칙"…냉각 인프라도 예산에 포함 -복수 데이터센터를 활용한 구축·운용이 가능한가. "데이터센터를 여러 개 제안하는 것은 가능하다. 다만 사업에서 요구하는 최소 클러스터 단위는 반드시 동일 공간 또는 동일 층에 물리적으로 집적돼야 한다. 대규모 AI 연산을 위해서는 GPU 간 통신 지연을 최소화하는 구조가 필요하기 때문이다. 따라서 분산 배치는 가능하지만, 핵심 클러스터는 집적형으로 구성해야 한다." -동일 제조사 내 서로 다른 GPU 모델을 혼합해 제안할 수 있나. "가능은 하지만 단순 혼합이 아니라, 각각의 GPU 구성에 대한 명확한 목적과 타당성을 제시해야 한다. 어떤 워크로드에 어떤 GPU를 쓰는지, 클러스터 단위 기준을 어떻게 충족하는지를 설명해야 한다. 단순히 여러 모델을 섞는 방식은 설득력이 떨어질 수 있다." -해외 데이터 연동이나 네트워크 활용은 원천 불가능한가. "사업의 기본 원칙은 국내 데이터센터에서 GPU를 직접 운영·통제하는 것이다. 국가 AI 인프라라는 특성상 데이터 주권과 보안이 중요하다. 다만 실제 운영 과정에서 필요한 세부 사항은 추가 논의를 통해 정리할 수 있다." -수냉 배관 등 데이터센터 공사 비용도 사업 지원비에 포함되나. "GPU 서버가 최고 성능을 낼 수 있도록 필요한 환경이라면 통합 구축 범위에 포함해 제안할 수 있다. 단순히 장비만 도입하는 것이 아니라 실제 운영 가능한 인프라를 구축하는 것이 목적이다. 전력·냉각·네트워크까지 포함한 전체 시스템 관점에서 제안하는 것이 중요하다." -콜드플레이트 등 냉각 구성 요소는 어떻게 반영해야 하나. "세부적인 하드웨어 구성은 서버 벤더와 칩 제조사 기준을 따르는 것이 바람직하다. GPU 성능을 충분히 발휘할 수 있는 구성이라면 관련 부대장비까지 포함해 제안하면 된다. 단순 장비 나열이 아니라 완성된 인프라로서 제안해야 한다." 환율 변수에도 제안가 기준…"사업 종료 후 관리는 정부가" -환율 변동에 따른 가격 차이는 추후 어떻게 반영되나. "기본적으로는 제안 시점에서 확보한 가격을 기준으로 본다. 공모 사업 특성상 사후 정산 구조이기 때문에 가격 변동이 발생하더라도 그 기준을 중심으로 관리하게 된다." -환율 급등 등 외부 변수 발생 시 대응은. "원칙은 제안 가격 기준이다. 다만 전쟁이나 글로벌 공급망 충격과 같은 불가피한 상황이 발생할 경우에는 협약 단계에서 논의가 필요할 수 있다. 모든 변수를 사전에 규정하기는 어렵지만 현실적인 범위에서 대응할 예정이다." -정부 활용분과 기업 자체 활용분은 어떤 기준으로 산정되나. "정부 활용분에 대해 요구되는 최소 클러스터 규모를 먼저 충족해야 하고 그 이후 남는 자원을 자체 활용분으로 설정하는 구조다. GPU 종류나 성능이 서로 다른 경우에는 단순 장수 기준만으로 판단하지 않고 도입 비용과 활용 목적까지 함께 고려해 전체 구성의 타당성을 평가한다. 단순 비율이 아니라 정부 활용 목적에 부합하는지와 자원 배분의 합리성을 종합적으로 볼 것이다." -정부 활용분 GPU에 대한 수요는 보장되나. "수요 모집과 배분은 정부가 담당한다. 사업자는 인프라를 제공하고 운영을 지원하는 역할을 수행하게 된다. 수요 확보 부담을 사업자에게 전가하는 구조는 아니다." -사업 종료 후 GPU 자산은 어떻게 되나. "GPU와 부대장비는 NIPA 자산으로 관리된다. 이후 처리 방식은 관련 규정과 절차에 따라 결정된다. 매각이나 이전 등 다양한 방안을 검토할 예정이다."

2026.03.20 17:58한정호 기자

[AI 고속도로] '베라루빈' 확보 속도전…'AI G3' 노린 정부, 주도권 경쟁 본격화

정부가 엔비디아의 차세대 그래픽처리장치(GPU) '베라루빈' 확보에 공을 들이고 있다. 생성형 인공지능(AI) 경쟁이 단기간 내 판가름 날 수 있다는 판단 아래 최신 GPU를 조기에 도입해 기술 격차를 좁히겠다는 전략으로, 'AI 3강(G3)'에 안착할 수 있는 기반 마련에 본격 나선 분위기다.과학기술정보통신부와 정보통신산업진흥원(NIPA)은 20일 오후 2시 서울 강남구 포스코타워에서 '2026년 AI 컴퓨팅 자원 활용기반 강화사업' 설명회를 갖고 올해 최신 GPU 약 1만5000장 수준을 확보할 것이란 계획을 밝혔다. 이번 사업은 약 2조805억원 규모로, GPU 서버를 비롯해 랙·냉각장치·스토리지·네트워크 등 부대장비 구매에 예산이 집중 투입된다. GPU 인프라는 올해 선 구축과 함께 서비스를 시작하고 2027년 내 구축을 완료하는 일정이다. 이 사업의 핵심은 블랙웰급을 넘어서는 차세대 GPU 도입 여부다. 정부는 공모 요건에서 특정 제품을 명시하지는 않았지만, 설명회 과정에서 베라루빈과 같은 차세대 하이엔드 GPU를 제안할 경우 평가에서 긍정적으로 반영할 수 있다는 입장을 내놨다. 베라루빈은 엔비디아가 차세대 아키텍처로 준비 중인 GPU로, 기존 제품 대비 연산 성능과 에너지 효율이 크게 향상될 것으로 기대된다. 다만 아직 상용화 초기 단계에 있어 글로벌 빅테크 기업을 중심으로 공급이 이뤄질 가능성이 높은 제품이다. 업계 관계자는 "정부가 이번에 베라루빈 도입 가능성을 열어둔 점이 눈에 띈다"며 "AI 인프라 경쟁에서 뒤처지지 않겠다는 의지가 반영된 조치로 보인다"고 말했다. 이날 설명회에서는 차세대 GPU 확보 시점과 관련해 일반적인 출시 일정보다 국내 도입을 앞당기기 위한 협의가 진행되고 있다는 점도 언급됐다. 글로벌 공급 구조상 후순위로 밀릴 가능성을 고려해 초기 물량 확보를 선제적으로 추진하려는 전략으로 해석된다. 정부가 이처럼 차세대 GPU 확보에 적극 나선 것은 AI 경쟁 구도가 급변했다는 점이 반영된 것으로 풀이된다. 생성형 AI 확산 이후 모델 개발과 서비스 적용까지 걸리는 시간이 크게 단축되면서, 컴퓨팅 인프라 확보 시점 자체가 경쟁력을 좌우하는 요소로 떠올랐기 때문이다. 이병묵 NIPA AI인프라확충팀장은 "AI 기술은 몇 개월 내로 개발과 적용이 이뤄지고 있다"며 "올 하반기나 내년 상반기면 경쟁 구도가 결정될 수 있다"고 강조했다. 이 같은 상황에서 차세대 GPU 확보 여부는 이번 사업의 핵심 변수로 꼽힌다. 최신 GPU 기반 대규모 클러스터를 구축할 경우 국내 기업과 연구기관이 고성능 AI 모델을 개발·학습할 수 있는 환경이 마련된다. 반면 차세대 GPU 도입이 지연될 경우 인프라 수준 격차가 기술 경쟁력 차이로 이어질 수 있다는 우려도 제기된다. 정부는 이번 사업을 통해 단순히 GPU를 도입하는 데 그치지 않고, 이를 기반으로 한 AI 생태계 확장을 함께 추진한다는 계획이다. 확보된 GPU 자원은 산업계·학계·연구계에 배분돼 AI 모델 개발과 서비스 고도화에 활용된다. 특히 대규모 클러스터를 통한 학습 환경을 제공함으로써 국내에서도 초거대 AI 개발이 가능한 기반을 마련하겠다는 구상이다. 업계에선 베라루빈 도입 여부가 이번 사업의 방향성을 가늠할 핵심 변수로 보고 있다. 차세대 GPU 확보 속도가 기술 경쟁력과 직결되는 만큼, 도입 시점과 규모에 따라 사업 성격이 달라질 수 있다는 분석이다. 업계 관계자는 "베라루빈은 단순히 성능이 좋은 GPU라기보다 '최신 기술을 얼마나 빠르게 가져올 수 있느냐'를 보여주는 상징적인 장비"라며 "정부가 이 부분을 강조하는 것은 글로벌 AI 경쟁에서 뒤처지지 않겠다는 메시지로 읽힌다"고 말했다. 정부 역시 차세대 GPU 도입과 관련해 일정 수준의 유연성을 두고 대응할 방침이다. 공급 상황과 시장 변수에 따라 도입 시점과 물량이 달라질 수 있는 만큼, 향후 협상 과정에서 세부 조건을 조정하겠다는 입장이다. NIPA 관계자는 "차세대 GPU는 출시 시점과 공급 상황이 유동적인 만큼, 선정 이후 협상을 통해 구축 시기와 방식 등을 현실적으로 조율할 계획"이라며 "국내 AI 경쟁력 확보를 위해 필요한 자원은 최대한 빠르게 확보하겠다"고 밝혔다.

2026.03.20 17:39장유미 기자

[AI 고속도로] 고성능 GPU 확보 나선 정부, 2조 규모 인프라 사업에 기업 관심 ↑

정부가 약 2조800억원 규모의 '인공지능(AI) 컴퓨팅 인프라 구축 사업'을 추진하며 첨단 그래픽처리장치(GPU) 확보에 속도를 내고 있다. 생성형 AI 경쟁이 짧은 기간 내 판가름 날 수 있다는 판단에 따라 최신 GPU를 조기에 대규모로 확보해 'AI 고속도로'를 구축하겠다는 구상이지만, 사업 구조와 요구 조건 측면에서 기업들의 부담이 적지 않을 것이란 관측도 나오고 있다. 과학기술정보통신부와 정보통신산업진흥원(NIPA)은 20일 오후 2시 서울 강남구 포스코타워에서 '2026년 AI 컴퓨팅 자원 활용기반 강화사업' 설명회를 갖고 올해 최신 GPU 약 1만5000장 수준을 확보할 것이란 계획을 밝혔다. 이번 사업은 약 2조805억원 규모로, GPU 서버를 비롯해 랙·냉각장치·스토리지·네트워크 등 부대장비 구매에 예산이 집중 투입된다. GPU 인프라는 올해 선 구축과 함께 서비스를 시작하고 2027년 내 구축을 완료하는 일정이다. 이후 사업 협약 종료 시점인 2031년 12월 31일까지 산업계·학계·연구계 및 국가 프로젝트를 대상으로 자원 배분과 운영이 이어진다. 사업은 민간 클라우드 사업자(CSP)를 선정해 국내 데이터센터에 GPU 클러스터를 구축·운영하도록 하는 방식으로 추진된다. 정부는 GPU 서버와 스토리지, 네트워크, 냉각장치 등 장비 구매 비용만 지원하고, 운영 비용은 사업자가 부담하도록 했다. 대신 일부 GPU 자원은 자체 활용을 허용해 수익을 확보할 수 있도록 했다. 이번 사업의 핵심은 '최신성'과 '대규모 클러스터'다. 정부는 최소 256노드, 2048장 이상의 GPU를 단일 클러스터로 구성하는 방안을 기본으로 제시하며 블랙웰급 이상 최신 GPU 도입을 사실상 전제로 삼았다. 차세대 GPU인 베라루빈 계열도 제안 가능 대상으로 열어두면서 최신 기술 도입을 적극 유도하는 모습이다. 특히 베라루빈 도입을 둘러싼 논의는 이번 사업의 방향성을 보여주는 대목으로 꼽힌다. 당초 사업 요건에 베라루빈을 명시적으로 포함하는 방안까지 검토됐던 것으로 전해졌으나, 최종 공모에선 강제 조건으로 포함시키지 않았다. 업계에선 정부가 엔비디아와의 협의를 통해 국내 물량 확보 가능성을 타진하면서도, 아직 레퍼런스가 부족한 점을 감안해 기업 자율 제안으로 방향을 조정한 것으로 보고 있다. 그러나 실제 도입 규모는 제한적일 것이라는 전망이 우세하다. 차세대 GPU 특성상 공급 물량이 충분하지 않고, 성능 검증 사례도 부족해 기업들이 대규모로 제안하기에는 부담이 크다는 이유에서다. 업계에선 일부 상징적 물량 수준에서 제안이 이뤄질 가능성에 무게를 두고 있다. 평가 기준을 보면 정부가 무엇을 우선순위로 두고 있는지도 드러난다. 총 100점 가운데 50점이 사업 준비도 및 경쟁력에 배정됐으며, 이 중 인프라 준비도 18점, 구축계획 우수성 32점이 핵심이다. 데이터센터 상면 확보를 비롯해 전력·냉각 설비, 네트워크 구성, 보안·안정성 체계 등이 주요 평가 항목에 포함됐다. 이는 대규모 GPU를 실제로 안정적으로 운영할 수 있는 인프라 역량을 가장 중요한 기준으로 삼겠다는 의미다. GPU 물량보다 성능을 중시하는 평가 방식도 특징이다. 동일 예산 기준에서 구형 GPU를 대량 확보하는 방식보다 최신 GPU 기반 고성능 클러스터를 구축하는 제안이 더 유리한 구조다. 서비스 개시 시점이 빠를수록 가점을 부여하는 항목도 포함돼 조기 구축과 실제 활용 가능성 역시 핵심 평가 요소로 설정됐다. 이병묵 NIPA AI인프라확충팀장은 "AI 기술은 개발에서 서비스까지 걸리는 시간이 크게 단축된 상황"이라며 "최신 GPU를 신속하게 확보해 국내에 공급하는 것이 경쟁력 확보의 핵심"이라고 강조했다. 업계에선 이번 사업을 두고 참여 문턱이 높은 것 같다는 평가를 내놨다. 대규모 GPU 클러스터를 구축하려면 충분한 데이터센터 상면과 전력, 고성능 냉각 인프라가 필수적인데 이를 단기간 내 확보할 수 있는 기업이 제한적이기 때문이다. 수도권 중심 데이터센터 전력 수급 문제도 부담 요인으로 지목된다. 운영비 부담도 주요 변수다. 정부 지원은 장비 구매에 한정되고 실제 운영비는 사업자가 부담해야 하기 때문이다. 자체 활용 GPU로 수익을 확보할 수는 있지만, 정부 활용 자원 비중이 높을수록 평가에서 유리한 구조여서 사업성과 점수 간 균형을 맞추기 쉽지 않다는 지적이 나온다. 가격과 환율 리스크도 기업들이 부담으로 꼽는 대목이다. GPU 조달 비용은 대부분 달러 기반으로 형성되는데, 사업 구조상 비용 절감분은 정산 대상인 반면 가격 상승에 따른 리스크는 일정 부분 사업자가 떠안아야 한다. 차세대 GPU의 경우 납기와 가격 변동성이 커 불확실성이 더 크다.여기에 올해부터 서비스 수준 협약(SLA) 요건이 새롭게 포함되면서 운영 부담은 더 커질 전망이다. 장애 대응, 성능 유지, 기술 지원 체계를 구체적으로 제시해야 하는 만큼, 단일 CSP가 이를 모두 감당하기는 쉽지 않다는 평가다. 이에 따라 CSP가 운영·관리 전문기업(MSP)과 협력하는 컨소시엄 형태가 늘어날 것이라는 관측이 나온다.업계 관계자는 "단순히 GPU를 구축하는 수준이 아니라 24시간 대응 체계와 서비스 품질까지 함께 요구되면서 사업 난도가 크게 올라갔다"며 "운영과 기술지원 역량을 동시에 갖춘 구조를 만들어야 하는 부담이 커진 상황"이라고 말했다.이번 사업으로 구축되는 GPU와 부대장비는 NIPA 소유로 귀속되며 사업자는 운영과 유지보수를 맡는다. 보안성과 안정성 확보를 위해 정보보호관리체계(ISMS), 클라우드 보안인증(CSAP) 등 인증 보유 여부와 확보 계획, 데이터의 국내 운영·통제 체계, 자원 관리 시스템, 기술지원 인력 구성 등도 주요 평가 항목에 포함됐다. 특히 AI 워크로드를 이해하는 전문 인력과 24시간 대응이 가능한 기술지원 체계를 반드시 제시해야 한다는 점도 이번에 강조됐다. 단순 인프라 운영을 넘어 AI 모델 개발과 서비스까지 지원할 수 있는 수준의 역량이 요구된다는 점에서 기업 부담이 추가로 커졌다는 평가가 나온다.설계 부담도 적지 않을 것으로 보인다. 특히 차세대 GPU인 베라루빈을 적용할 경우 클러스터 구성 단위와 성능 기준이 명확히 정해져 있지 않아 기업이 직접 제조사와 협의를 통해 구성 방안을 검토해야 하는 상황이다. GPU 종류별로 클러스터 구조와 성능 산정 방식이 달라질 수 있는 만큼, 제안 단계에서부터 기술적 검증과 설계 부담이 기업에 상당 부분 전가됐다는 평가가 나온다. 이번 설명회에는 네이버클라우드, KT클라우드, NHN클라우드, 카카오엔터프라이즈, SK텔레콤, 삼성SDS 등 주요 클라우드 사업자를 비롯해 메가존클라우드, LG CNS 등 클라우드 서비스 운영 관리 기업(MSP)과 델, 시스코, HPE, 엔비디아 등 글로벌 장비·반도체 기업까지 대거 참석했다. 이 같은 구조를 감안하면 실제 경쟁은 일부 대형 사업자 중심으로 형성될 가능성이 크다. 업계에선 네이버클라우드와 KT클라우드를 유력 후보로 거론하는 가운데 삼성SDS와 SK텔레콤 등도 경쟁군으로 함께 언급했다. NHN클라우드 등은 컨소시엄 형태로 참여할 가능성이 제기된다. 아마존웹서비스(AWS), 마이크로소프트 애저, 구글 클라우드 등 해외 CSP 역시 참여는 가능하지만 국내 데이터센터 기반과 직접 운영·통제 요구 등을 고려할 때 진입 장벽은 여전히 높다는 평가다. 업계 관계자는 "베라루빈 같은 차세대 GPU는 상징적으로 일부 들어갈 수는 있겠지만, 실제 사업은 전력과 냉각, 운영 역량 확보가 더 큰 변수"라며 "SLA까지 포함되면서 기업 부담이 상당히 커진 구조"라고 말했다. NIPA 관계자는 "시장 상황과 공급 여건이 쉽지 않다는 점을 충분히 인지하고 있다"며 "선정 이후 협상 과정에서 일정과 세부 조건은 현실적으로 조정해 나가고, 민간과 협력해 AI 인프라를 빠르게 구축하겠다"고 밝혔다.

2026.03.20 17:02장유미 기자

글로벌 서버 시장, 엔비디아 '베라 루빈' 중심 재편…통합 인프라에 방점

엔비디아의 차세대 인공지능(AI) 슈퍼컴퓨팅 아키텍처 '베라 루빈'이 공개되면서 글로벌 서버·인프라 시장이 빠르게 재편되고 있다. 델 테크놀로지스, 슈퍼마이크로, HPE 등 주요 기업들이 일제히 해당 플랫폼을 중심으로 제품과 전략을 내놓으며 AI 인프라 경쟁이 차세대 아키텍처 선점 국면으로 본격 진입하는 양상이다. 19일 엔비디아는 미국 새너제이에서 열린 'GTC 2026'에서 차세대 AI 컴퓨팅 플랫폼 베라 루빈을 중심으로 한 인프라 전략을 공개하고 주요 파트너사들과의 협력 확대를 발표했다. 가장 공격적으로 움직인 곳은 델 테크놀로지스다. 델은 '엔비디아 기반 델 AI 팩토리'를 전면 고도화하며 베라 루빈 기반 서버를 핵심 축으로 내세웠다. 대표적으로 '파워엣지 XE9812'는 베라 루빈 NVL72 플랫폼을 기반으로 설계된 수랭식 서버로, 대규모 AI 학습과 추론을 동시에 지원하는 차세대 주력 제품으로 꼽힌다. 델은 단순 서버 공급을 넘어 데이터 플랫폼, 네트워크, 서비스까지 통합한 엔드투엔드 구조를 통해 AI를 파일럿에서 실제 운영 단계로 확장하는 데 초점을 맞췄다. 델 AI 팩토리는 전 세계 4000여 기업에서 활용되며 최대 2.6배 수준의 투자수익률(ROI)을 기록한 것으로 나타났다. 마이클 델 델 테크놀로지스 회장은 "이제 기업들은 AI 도입 여부가 아니라 데이터를 어떻게 AI에 적합하게 만들고 이를 운영 환경에서 어떻게 확장하며 ROI를 어떻게 입증할지를 고민하고 있다"며 "엔비디아 기반 델 AI 팩토리는 이러한 과제에 대한 검증된 해답을 제공한다"고 강조했다. 슈퍼마이크로는 인프라 구조 측면에서 베라 루빈 활용을 전면에 내세웠다. 회사는 데이터센터 빌딩 블록 솔루션(DCBBS)에 베라 루빈 NVL72와 HGX 루빈 NVL8, 베라 CPU를 통합한 차세대 플랫폼을 공개했다. 이 플랫폼은 단일 랙 기준 최대 3.6엑사플롭스의 추론 성능과 75테라바이트 메모리, 초당 1.6페타바이트에 달하는 대역폭을 제공하는 것이 특징이다. 기존 대비 와트당 성능을 최대 10배까지 끌어올리고 토큰 처리 비용은 10분의 1 수준으로 낮추는 것이 목표다. 슈퍼마이크로는 수냉식 기반 랙 스케일 설계를 통해 전력·냉각·네트워크를 통합한 'AI 팩토리형 데이터센터'를 구현하는 데 집중하고 있다. 이는 대규모 추론과 장문 컨텍스트 처리, 에이전틱 AI 워크로드 증가에 대응하기 위한 전략이다. 찰스 리앙 슈퍼마이크로 최고경영자(CEO)는 "이제 모든 조직이 AI 팩토리를 필요로 하는 시대에 들어섰다"며 "추론 중심 워크로드가 데이터센터 설계 기준 자체를 바꾸고 있다"고 말했다. HPE는 운영 가능한 AI에 방점을 찍었다. 베라 루빈 기반 시스템을 포함한 'HPE 기반 엔비디아 AI 컴퓨팅' 포트폴리오를 확대하며 보안과 확장성을 동시에 확보한 프로덕션 환경 구축에 나서고 있다. 특히 'HPE 프라이빗 클라우드 AI'를 중심으로 최대 128개 그래픽처리장치(GPU)까지 확장 가능한 환경과 에어갭 구조를 제공해 금융·공공 등 규제 산업에서도 활용 가능한 AI 인프라를 구현했다. 또 엔비디아 인증 스토리지를 기반으로 데이터 파이프라인 병목 문제 해결에도 나섰다. 안토니오 네리 HPE CEO는 "AI 경쟁의 핵심은 속도와 규모, 신뢰"라며 "엔비디아와 함께 턴키 방식 AI 인프라를 제공해 기업이 AI를 실제 비즈니스 가치로 전환할 수 있도록 지원하고 있다"고 밝혔다. 이번 GTC 2026의 핵심은 베라 루빈을 중심으로 한 AI 인프라 재편이다. 기존 GPU 중심 경쟁을 넘어 CPU·네트워크·스토리지·소프트웨어까지 통합된 AI 팩토리 구조가 새로운 표준으로 자리 잡고 있다는 평가가 나온다. 델은 엔드투엔드 플랫폼으로, 슈퍼마이크로는 고집적 인프라 설계로, HPE는 운영·보안 중심 전략으로 각각 차별화를 꾀하고 있다. AI 경쟁이 모델 성능에서 인프라 효율과 운영 역량으로 이동하는 가운데, 베라 루빈이 블랙웰의 뒤를 이어 향후 글로벌 AI 데이터센터 차세대 표준으로 자리 잡을 전망이다. 젠슨 황 엔비디아 CEO는 "모든 기업과 국가가 AI를 구축하는 시대에 접어들었다"며 "우리는 통합 데이터 플랫폼과 확장 가능한 인프라, 구축 전문성을 결합할 것"이라고 밝혔다.

2026.03.19 17:20한정호 기자

엔비디아 "베라 CPU, 88코어 단일 제품만 공급"

엔비디아가 올 하반기부터 공급할 자체 개발 CPU '베라(Vera)'를 단 한 종류만 공급할 것이라고 밝혔다. 18일(현지시간) 젠슨 황 엔비디아 CEO가 GTC 2026 행사 중 진행된 브리핑에서 이렇게 설명했다. 베라 CPU는 엔비디아가 현재 블랙웰 GPU와 함께 공급하는 '그레이스(Grace)' CPU 후속 제품이다. Arm IP(지적재산권) 기반으로 자체 개발한 올림푸스 코어 88개를 탑재했다. 엔비디아는 그레이스 CPU를 블랙웰 GPU 제어 등에 활용하고 따로 판매하지 않았다. 그러나 올해부터는 베라 CPU를 별도로 분리해 공급할 예정이다. 18일(현지시간) 미국 톰스하드웨어에 따르면, 젠슨 황 엔비디아 CEO는 "베라 CPU는 단 한 종류(88코어)만 만들 것"이라고 설명했다. 인텔이나 AMD 등 기존 x86 프로세서 경쟁사 등과 달리 제품 라인업을 세분화하지 않겠다는 것이다. 젠슨 황 CEO는 "현재 데이터센터 수요가 소수의 하이퍼스케일러에 집중돼 있으며, 이들이 요구하는 것은 가장 빠른 컴퓨터"라고 밝혔다. 이어 "같은 제품을 대규모 생산하는 것이 제조와 검증, 그리고 소프트웨어 최적화 측면에서 훨씬 유리하며 단일 제품으로도 수십억 달러의 매출을 올릴 수 있다"고 덧붙였다. 엔비디아는 베라 CPU를 단일 칩뿐 아니라 256개 CPU를 묶은 액체 냉각 랙 시스템 형태로도 제공할 계획이다. 이 시스템은 2만2000개 이상의 CPU 환경을 동시에 실행할 수 있어 대규모 AI 서비스 운영에 적합하다.

2026.03.19 08:56권봉석 기자

우주 데이터센터, 엔비디아도 뛰어든다

엔비디아가 우주 환경에서 AI 연산을 수행하겠다는 비전을 제시했다. 궤도 데이터센터(ODC)란 개념을 내놓으면서 위성에 데이터센터를 올리겠다는 구상인데 우주 공간에서 차폐 등의 제약을 타개할 방안은 내놓지 않고 컴퓨팅이 구현할 수 있다는 점만 강조했다. 16일(현지시간) 엔비디아 뉴스룸에 따르면 엔비디아는 GTC에서 스페이스-1 베라루빈 모듈, IGX토르, 젯슨 오린 플랫폼을 통해 우주 공간에서도 데이터센터급 AI 연산을 구현할 수 있다고 밝혔다. 위성에 실어야 하는 데이터센터의 크기와 무게, 전력 제약이 큰 환경에서도 AI 추론과 영상 분석, 센서 데이터 처리를 수행할 수 있도록 설계됐다는 설명이다. 스페이스-1 베라루빈 모듈은 향후 출시 예정이며 나머지는 현재 상용화된 솔루션이다. 엔비디아는 “베라루민 모듈에 탑재된 루빈 GPU는 H100 대비 최대 25배 높은 AI 연산 성능을 제공해 지리공간 정보 분석과 자율 우주 운영을 지원한다”며 “IGX토르와 젯슨 오린 플랫폼은 저전력 고성능 AI 추론 기능을 제공해 우주에서 엣지 컴퓨팅을 구현할 수 있다”고 설명했다. 이어, “지상에서는 RTX PRO 6000 블랙웰 서버 에디션 GPU로 대규모 위성 이미지 데이터를 분석할 수 있고 기존 CPU 기반 시스템보다 최대 100배 빠른 처리 성능을 게공한다”고 덧붙였다. 엔비디아의 우주 데이터센터 협력 파트너로 케플러커뮤니케이션, 플래닛, 소피아스페이스, 스타클라우드 등이 꼽혔다. 그간 우주 데이터센터는 지상의 제한된 전력 문제로 떠오른 개념인데, 엔비디아는 데이터센터 위치를 지표면에서 우주로 옮기는 것 외에 우주에서 발생하는 데이터를 처리한다는 데 초점을 둔 점이 눈길을 끄는 부부분이다. 젠슨 황 엔비디아 CEO는 “AI는 데이터가 생성되는 곳에서 직접 처리돼야 하고 이는 위성과 우주선을 실시간 의사결정이 가능한 자율 시스템으로 바꿀 것”이라고 말했다.

2026.03.17 10:34박수형 기자

삼성전자, 엔비디아 '4나노' 새 추론 칩 만든다

젠슨 황 엔비디아 최고경영자(CEO)가 삼성전자 파운드리와의 협력을 공식적으로 언급했다. 엔비디아의 최신형 AI 가속기 '베라 루빈' 기반 시스템과 결합되는 그록(Groq)의 언어처리장치(LPU)를 삼성 파운드리에서 양산하는 구조다. 젠슨 황 CEO는 16일(현지시간) 미국 캘리포니아 새너제이에서 열린 'GTC 2026' 기조연설에서 AI 칩 생산 파트너를 소개하는 과정에서 "삼성전자가 그록3 LPU 칩을 제조하고 있다"고 밝혔다. 그록은 엔비디아가 지난해 말 약 29조원을 들여 우회 인수한 팹리스 스타트업이다. 거대언어모델(LLM)의 추론 작업 속도를 높이는 LPU를 전문으로 개발해 왔다. 그록3 LPU는 이 기업의 최신 칩으로, 4나노미터(nm) 공정 기반으로 알려졌다. 젠슨 황 CEO는 "삼성이 우리를 위해 그록3 LPU 칩을 제조하고 있다. 지금 가능한 한 최대한 빠르게 생산을 늘리고 있다"며 "삼성에게 정말 감사드린다"고 강조했다. 그록3 LPU는 현재 양산 단계에 들어갔다. 젠슨 황 CEO가 예상한 출하 시점은 오는 3분기다. 이번 발언은 삼성 파운드리가 엔비디아의 차세대 AI 칩 생산에 참여하고 있음을 공개적으로 언급한 것으로, AI 반도체 공급망에서 양사의 협력이 긴밀하게 이어지고 있음을 보여주는 대목으로 평가된다. 또한 삼성전자는 지난 2월 엔비디아향 HBM4(6세대 고대역폭메모리) 양산 출하를 공식 발표한 바 있다. 이를 통해 삼성전자는 엔비디아 AI 생태계 확장을 위한 메모리·파운드리 공급사로서 협력 영역을 더 확장할 수 있게 됐다.

2026.03.17 09:34장경윤 기자

마이크론, 엔비디아 '베라 루빈'향 HBM4 공급 공식화…"1분기 대량 양산"

미국 메모리 기업 마이크론이 최근 불거진 고대역폭메모리(HBM) 성능 논란에 대해 정면 반박했다. 엔비디아의 최신 AI 가속기향으로 개발한 자사 HBM4(6세대 HBM)가 대량 양산(High-Volume Production) 체제에 돌입했음을 공식적으로 밝혔다. 마이크론은 엔비디아 '베라 루빈(Vera Rubin)'향으로 36GB 12단 HBM4의 양산을 올 1분기 시작했다고 16일(현지시간) 밝혔다. 마이크론은 "HBM4를 통해 11Gb/s 이상의 핀 속도를 달성해 2.8TB/s 이상의 대역폭을 제공한다"며 "이는 HBM3E 대비 2.3배의 대역폭과 20% 이상의 전력 효율성 향상을 의미한다"고 설명했다. 또한 마이크론은 HBM4 16단 샘플을 고객사에 출하했다. 16단 HBM은 내부의 각 D램을 더 밀도있게 적층해야 하기 때문에, 고도의 패키징 기술이 요구된다. 수밋 사다나 마이크론 수석 부사장은 "엔비디아와의 긴밀한 협력을 통해 컴퓨팅과 메모리가 처음부터 함께 확장될 수 있도록 설계하고 있다"며 "이러한 혁신의 핵심에는 AI의 엔진인 마이크론의 HBM4가 있고, 이는 전례 없는 대역폭과 용량, 전력 효율성을 제공한다"고 밝혔다. 그는 이어 "HBM4와 업계 최초의 SOCAMM2 및 Gen6 SSD가 대량 생산에 돌입하면서, 마이크론의 메모리와 스토리지는 차세대 AI의 잠재력을 최대한 발휘할 수 있는 핵심 기반을 형성한다"고 강조했다. 마이크론의 이번 발표는 최근 불거진 HBM4 성능 논란을 불식시키기 위한 것으로 풀이된다. 앞서 반도체 업계는 마이크론의 엔비디아향 HBM4 상용화 일정이 다소 지연될 것이라는 의견을 제기해 왔다. 엔비디아가 HBM4에 필요한 성능 기준을 강화하면서, 국내 기업 대비 뒤쳐진 공정을 채택한 마이크론이 기술적으로 한계에 부딪혔다는 시각에서다. 마이크론은 HBM4에 HBM3E와 마찬가지로 1b(5세대 10나노급) D램을 코어 다이로 활용한다. 컨트롤러 역할의 베이스 다이도 기존과 마찬가지로 D램 공정에서 양산한다. 현재 삼성전자는 자사 파운드리 4나노미터(nm) 공정을, SK하이닉스가 TSMC 12나노 공정을 활용하고 있다. 한편 마이크론의 SOCAMM2는 엔비디아 베라 루빈 NVL72 시스템 및 독립형 엔비디아 베라 CPU 플랫폼 용으로 설계됐다. CPU 당 최대 2TB의 메모리와 1.2TB/s의 대역폭을 지원한다.

2026.03.17 09:01장경윤 기자

엔비디아, 우주용 AI 플랫폼 '스페이스1' 구상 공개

엔비디아가 16일(현지시간) GPU 기반 AI 컴퓨팅 플랫폼 '베라 루빈'을 우주에서 구동하기 위한 '스페이스1' 구상을 공개했다. 이날 미국 캘리포니아 주 새너제이에서 개막한 연례 기술행사 'GTC 2026' 기조연설에서 공개된 스페이스1은 베라 루빈을 기반으로 위성이나 우주 인프라에서 직접 AI 연산을 수행할 수 있도록 설계됐다. 젠슨 황 엔비디아 CEO는 "스페이스1은 AI 연산을 지구 밖으로 확장해 우주에서도 AI 모델을 실행하고 데이터를 처리할 수 있는 새로운 컴퓨팅 환경"이라고 밝혔다. 현재 많은 위성 시스템은 수집한 데이터를 지상으로 전송한 뒤 분석을 수행한다. 그러나 우주에서 직접 AI 연산을 수행하면 데이터 처리 속도를 크게 높이고 통신 비용을 줄일 수 있다. 이러한 방식은 지구 관측, 우주 탐사, 통신 네트워크 운영 등 다양한 분야에서 활용될 수 있다. 엔비디아는 차세대 데이터센터 플랫폼인 베라 루빈 기반으로 우주에서도 작동할 수 있는 AI 컴퓨팅 기술을 연구하고 있다. 특히 AI가 위성 이미지 분석, 우주 탐사 데이터 처리, 자율 위성 운영 등에 활용될 수 있는 만큼 우주 컴퓨팅 시장 역시 새로운 성장 영역이 될 것으로 전망된다. 젠슨 황 CEO는 "우주 공간에서는 대기를 이용한 전도·대류가 없어 냉각이 어렵고 복사 방식으로 열을 방출해야 한다"고 설명했다. 엔비디아는 이런 과제를 해결하기 위해 액시옴 스페이스, 플래닛랩스, 케플러 커뮤니케이션 등 여러 우주 관련 기업과 협력할 예정이다. 스페이스1 베라 루빈 모듈 출시일은 미정이다.

2026.03.17 07:15권봉석 기자

엔비디아, Arm 기반 에이전틱 AI 특화 '베라' CPU 출시

엔비디아가 16일 미국 캘리포니아 주 새너제이에서 개막한 연례 기술행사 'GTC 2026' 기조연설에서 Arm IP(지적재산권) 기반으로 자체 개발한 '베라(Vera)' CPU를 정식 출시했다. 엔비디아는 전 세대인 '그레이스(Grace)' CPU는 자체 설계했지만 블랙웰 GPU 제어 등에 활용하고 따로 판매하지 않았다. 그러나 올해부터는 베라 CPU를 별도로 분리해 공급할 예정이다. 베라 CPU는 Arm 기반 아키텍처 위에 엔비디아가 설계한 올림푸스 코어 88개를 탑재했다. GPU와 NV링크 인터페이스로 연결되며 AI 모델 실행과 데이터 이동을 효율적으로 처리하도록 설계됐다. 데이터 전송 대역폭은 최대 1.8TB/s 수준이다. 젠슨 황 엔비디아 CEO는 "베라 CPU는 AI 데이터센터에 특화된 맞춤형 CPU로 기존 서버용 CPU 대비 성능은 50% 향상됐고 전력 효율은 두 배로 높아졌다"고 설명했다. 알리바바와 코어위브, 메타와 오라클 클라우드 등 클라우드 서비스 제공사(CSP), 델테크놀로지스와 HPE, 레노버, 슈퍼마이크로 등 서버 제조사들이 베라 CPU 도입을 위해 엔비디아와 협업하고 있다. 엔비디아는 베라 CPU를 단일 칩뿐 아니라 256개 CPU를 묶은 액체 냉각 랙 시스템 형태로도 제공할 계획이다. 이 시스템은 2만2000개 이상의 CPU 환경을 동시에 실행할 수 있어 대규모 AI 서비스 운영에 적합하다. 젠슨 황 CEO는 "베라 CPU와 루빈 GPU 등 차세대 AI 인프라 플랫폼 관련 매출은 2025년부터 2027년까지 최소 1조 달러(약 1491조 5000억원)에 달할 것"이라고 전망했다.

2026.03.17 06:51권봉석 기자

엔비디아 "피지컬AI가 성장 주도…훈련→추론으로"

"AI가 생성 AI와 디지털 에이전트를 넘어 현실 세계에서 작동하는 단계로 진화하고 있다. 로봇과 자율주행으로 대표되는 '피지컬 AI'가 AI 산업의 다음 성장 축이 될 것이다." 16일(현지시간) 미국 캘리포니아 주 새너제이에서 개막한 연례 기술행사 'GTC 2026' 기조연설에서 젠슨 황 엔비디아 CEO가 이렇게 강조했다. 엔비디아는 이날 기조연설에서 AI 컴퓨팅 인프라 전략, 차세대 데이터센터 플랫폼 '베라 루빈', 기업용 에이전틱 AI 솔루션, 로봇과 자율주행까지 이어지는 장기 로드맵을 제시했다. "AI 산업, 모델 훈련에서 추론 중심으로 이동" 이날 젠슨 황 CEO는 AI 산업 핵심이 모델 훈련 중심에서 추론 중심으로 이동하고 있다고 강조했다. 생성 AI와 에이전틱 AI가 실제 서비스에 사용되기 시작하면서 AI가 지속적으로 판단하고 행동해야 하기 때문에 컴퓨팅 수요가 급격히 늘어나고 있다는 것이다. 젠슨 황 CEO는 "이런 추세에 따라 연산 요구량은 과거와 비교할 수 없을 정도로 증가하고 있다"며 "AI는 이제 단순한 모델이 아니라 지속적으로 작동하는 시스템이 되고 있다"고 설명했다. 최대 144개 GPU 연결 '루빈 울트라' 플랫폼 공개 엔비디아는 CES 2026 기조연설에서 올 하반기부터 투입될 데이터센터용 차세대 AI GPU '베라 루빈'을 공개한 바 있다. 베라 루빈은 Arm 기반 CPU '베라'와 차세대 GPU '루빈'을 결합해 대규모 AI 모델 학습과 추론을 동시에 처리할 수 있도록 설계됐다. 젠슨 황 CEO는 이날 최대 144개의 루빈 GPU를 연결한 루빈 울트라도 새로 공개했다. 내년에는 새 CPU인 '로자(Rosa)', 새 GPU 아키텍처 '파인만'을 결합한 차세대 플랫폼이 등장 예정이다. 젠슨 황 CEO는 "AI 산업은 수년 단위로 인프라 투자가 이루어지기 때문에 장기적인 플랫폼 로드맵이 중요하다"며 "매년 새로운 아키텍처를 시장에 투입할 예정"이라고 말했다. 베라 루빈에 그록 LPU 통합... 올 3분기 출시 이날 엔비디아는 베라 루빈 플랫폼에 작년 12월 인수한 추론 특화 칩 스타트업 '그록(Groq)'을 통합할 계획도 발표했다. 그록은 AI 모델의 추론이나 실행을 위해 설계된 '언어처리장치(LPU)'로 거대언어모델(LLM) 처리 가속 기술을 개발하는 회사다. 베라 루빈 플랫폼에 추가되는 그록 LPX는 256개 LPU를 모은 랙 단위 AI 추론 시스템이며 추론시 지연 시간을 낮춘다. 젠슨 황 CEO는 "그록3 칩은 삼성전자가 생산하고 있으며 이를 활용한 LPX 시스템은 올 3분기부터 시장에 출시 예정"이라고 설명했다. 보안 강화한 에이전틱 AI '니모클로' 공개 오픈소스 기반 에이전틱 AI 모델인 '오픈클로'는 강력한 자동화 기능을 갖췄지만 기업 환경에서는 예측 불가능한 행동과 데이터 유출이 문제로 지적됐다. 엔비디아는 이날 기업 환경에서 오픈클로를 활용할 수 있는 '니모클로(NemoClaw)'를 공개했다. 정책 기반 보안과 프라이버시 제어 기능을 추가하는 한편 AI 에이전트가 외부 시스템과 상호작용할 때 데이터 처리 방식과 권한을 통제할 수 있다. 젠슨 황 CEO는 "에이전틱 AI는 단순한 챗봇을 벗어나 기업 업무를 수행할 것이며 이런 에이전트를 배치하려면 보안, 정책 관리, 데이터 접근 제어 등이 필요하다. 니모클로는 이런 역할을 담당할 것"이라고 말했다. 자율주행 파트너사에 현대차그룹 합류 엔비디아는 메르세데스 벤츠와 토요타, GM 등 글로벌 완성차 업체와 함께 자율주행 플랫폼을 구축하고 이를 실제 상용차에 투입하고 있다. 이날 젠슨 황 CEO는 "BYD와 현대차그룹, 닛산과 지리 등이 자율주행 파트너로 새롭게 합류했으며 기존 파트너사를 합하면 연간 생산 규모는 1천800만 대가 될 것"이라고 밝혔다. 현대차그룹은 올 초 신임 AVP본부장 겸 포티투닷(42dot) 대표이사로 박민우 전 엔비디아 부사장을 선임하는 등 독자 자율주행 체계 구축 대신 엔비디아와 협업을 예고한 바 있다. 젠슨 황 CEO는 이어 "전세계에 네트워크를 갖춘 우버와 함께 자율주행 로보택시 네트워크 구축도 추진할 것"이라고 설명했다. 기조연설 말미에 겨울왕국 '올라프' 로봇 등장 기조연설 말미에는 월트디즈니 내 연구조직인 '디즈니 리서치'가 엔비디아와 협업해 개발한 로봇인 '올라프(Olaf)'가 등장했다. 올라프는 겨울왕국 시리즈에 등장하는 캐릭터이며 이를 로봇으로 구현하기 위해 실제 세계를 시뮬레이션하는 옴니버스 기술과 피지컬 AI, 로봇 기술이 적용됐다. 올라프는 엔비디아의 피지컬 AI 기술과 로봇 응용 가능성을 보여주는 역할을 했다. 무대 위에 올라 관객을 향해 인사하고 젠슨 황 CEO와 자연스런 대화를 나누기도 했다. 젠슨 황 CEO는 "AI는 이제 소프트웨어를 넘어 현실 세계로 확장되고 있다"며 “로봇과 자율 시스템이 새로운 AI 산업을 만들어 갈 것”이라고 말했다.

2026.03.17 06:34권봉석 기자

  Prev 1 2 Next  

지금 뜨는 기사

이시각 헤드라인

"AI 전환 힘 실었지만, SW 생태계 개선 미흡"…소프트웨어 B학점

쿠팡이츠 "무료배달 비용 입점업체 전가 없어"

[AI 리더스] 유용균 국가과학AI센터 단장 "'AI 과학자'로 노벨상급 성과 목표"

엔비디아 '베라 CPU' 외부 판매...삼성·SK LPDDR 수요 촉진

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.