• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
  • AI의 눈
반도체
AI의 눈
디지털트러스트
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'루빈'통합검색 결과 입니다. (42건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

엔비디아 "피지컬AI가 성장 주도…훈련→추론으로"

"AI가 생성 AI와 디지털 에이전트를 넘어 현실 세계에서 작동하는 단계로 진화하고 있다. 로봇과 자율주행으로 대표되는 '피지컬 AI'가 AI 산업의 다음 성장 축이 될 것이다." 16일(현지시간) 미국 캘리포니아 주 새너제이에서 개막한 연례 기술행사 'GTC 2026' 기조연설에서 젠슨 황 엔비디아 CEO가 이렇게 강조했다. 엔비디아는 이날 기조연설에서 AI 컴퓨팅 인프라 전략, 차세대 데이터센터 플랫폼 '베라 루빈', 기업용 에이전틱 AI 솔루션, 로봇과 자율주행까지 이어지는 장기 로드맵을 제시했다. "AI 산업, 모델 훈련에서 추론 중심으로 이동" 이날 젠슨 황 CEO는 AI 산업 핵심이 모델 훈련 중심에서 추론 중심으로 이동하고 있다고 강조했다. 생성 AI와 에이전틱 AI가 실제 서비스에 사용되기 시작하면서 AI가 지속적으로 판단하고 행동해야 하기 때문에 컴퓨팅 수요가 급격히 늘어나고 있다는 것이다. 젠슨 황 CEO는 "이런 추세에 따라 연산 요구량은 과거와 비교할 수 없을 정도로 증가하고 있다"며 "AI는 이제 단순한 모델이 아니라 지속적으로 작동하는 시스템이 되고 있다"고 설명했다. 최대 144개 GPU 연결 '루빈 울트라' 플랫폼 공개 엔비디아는 CES 2026 기조연설에서 올 하반기부터 투입될 데이터센터용 차세대 AI GPU '베라 루빈'을 공개한 바 있다. 베라 루빈은 Arm 기반 CPU '베라'와 차세대 GPU '루빈'을 결합해 대규모 AI 모델 학습과 추론을 동시에 처리할 수 있도록 설계됐다. 젠슨 황 CEO는 이날 최대 144개의 루빈 GPU를 연결한 루빈 울트라도 새로 공개했다. 내년에는 새 CPU인 '로자(Rosa)', 새 GPU 아키텍처 '파인만'을 결합한 차세대 플랫폼이 등장 예정이다. 젠슨 황 CEO는 "AI 산업은 수년 단위로 인프라 투자가 이루어지기 때문에 장기적인 플랫폼 로드맵이 중요하다"며 "매년 새로운 아키텍처를 시장에 투입할 예정"이라고 말했다. 베라 루빈에 그록 LPU 통합... 올 3분기 출시 이날 엔비디아는 베라 루빈 플랫폼에 작년 12월 인수한 추론 특화 칩 스타트업 '그록(Groq)'을 통합할 계획도 발표했다. 그록은 AI 모델의 추론이나 실행을 위해 설계된 '언어처리장치(LPU)'로 거대언어모델(LLM) 처리 가속 기술을 개발하는 회사다. 베라 루빈 플랫폼에 추가되는 그록 LPX는 256개 LPU를 모은 랙 단위 AI 추론 시스템이며 추론시 지연 시간을 낮춘다. 젠슨 황 CEO는 "그록3 칩은 삼성전자가 생산하고 있으며 이를 활용한 LPX 시스템은 올 3분기부터 시장에 출시 예정"이라고 설명했다. 보안 강화한 에이전틱 AI '니모클로' 공개 오픈소스 기반 에이전틱 AI 모델인 '오픈클로'는 강력한 자동화 기능을 갖췄지만 기업 환경에서는 예측 불가능한 행동과 데이터 유출이 문제로 지적됐다. 엔비디아는 이날 기업 환경에서 오픈클로를 활용할 수 있는 '니모클로(NemoClaw)'를 공개했다. 정책 기반 보안과 프라이버시 제어 기능을 추가하는 한편 AI 에이전트가 외부 시스템과 상호작용할 때 데이터 처리 방식과 권한을 통제할 수 있다. 젠슨 황 CEO는 "에이전틱 AI는 단순한 챗봇을 벗어나 기업 업무를 수행할 것이며 이런 에이전트를 배치하려면 보안, 정책 관리, 데이터 접근 제어 등이 필요하다. 니모클로는 이런 역할을 담당할 것"이라고 말했다. 자율주행 파트너사에 현대차그룹 합류 엔비디아는 메르세데스 벤츠와 토요타, GM 등 글로벌 완성차 업체와 함께 자율주행 플랫폼을 구축하고 이를 실제 상용차에 투입하고 있다. 이날 젠슨 황 CEO는 "BYD와 현대차그룹, 닛산과 지리 등이 자율주행 파트너로 새롭게 합류했으며 기존 파트너사를 합하면 연간 생산 규모는 1천800만 대가 될 것"이라고 밝혔다. 현대차그룹은 올 초 신임 AVP본부장 겸 포티투닷(42dot) 대표이사로 박민우 전 엔비디아 부사장을 선임하는 등 독자 자율주행 체계 구축 대신 엔비디아와 협업을 예고한 바 있다. 젠슨 황 CEO는 이어 "전세계에 네트워크를 갖춘 우버와 함께 자율주행 로보택시 네트워크 구축도 추진할 것"이라고 설명했다. 기조연설 말미에 겨울왕국 '올라프' 로봇 등장 기조연설 말미에는 월트디즈니 내 연구조직인 '디즈니 리서치'가 엔비디아와 협업해 개발한 로봇인 '올라프(Olaf)'가 등장했다. 올라프는 겨울왕국 시리즈에 등장하는 캐릭터이며 이를 로봇으로 구현하기 위해 실제 세계를 시뮬레이션하는 옴니버스 기술과 피지컬 AI, 로봇 기술이 적용됐다. 올라프는 엔비디아의 피지컬 AI 기술과 로봇 응용 가능성을 보여주는 역할을 했다. 무대 위에 올라 관객을 향해 인사하고 젠슨 황 CEO와 자연스런 대화를 나누기도 했다. 젠슨 황 CEO는 "AI는 이제 소프트웨어를 넘어 현실 세계로 확장되고 있다"며 “로봇과 자율 시스템이 새로운 AI 산업을 만들어 갈 것”이라고 말했다.

2026.03.17 06:34권봉석 기자

엔비디아 "AI 인프라 투자, 일시적 사이클 아니다"

엔비디아가 25일(현지시간) 2026 회계연도 4분기(11~1월) 실적발표 이후 진행된 컨퍼런스 콜에서 인공지능(AI) 인프라 투자가 단기 사이클이 아니라 구조적인 성장 국면에 진입했다고 설명했다. 젠슨 황 엔비디아 CEO는 "에이전틱 AI의 전환점이 이미 찾아왔고 기업 전반에서 이를 처리하기 위한 연산 수요가 급증하고 있다. 토큰을 생성하려면 연산 능력이 요구되며 토큰 없이는 매출이 없다. '연산 능력이 곧 매출'인 시대"라고 설명했다. 그는 또 "주요 클라우드 고객들의 현금흐름 역시 AI 수요 확대에 따라 성장할 것이다. 이제 데이터센터는 AI 공장이며, 기업들은 매출을 창출하기 위해 연산 능력 증대에 투자할 수밖에 없다"고 강조했다. 베라 CPU, 데이터 후처리 등 작업에 큰 역할 할 것 엔비디아는 올 초 CES 2026에서 베라(Vera) CPU와 루빈(Rubin) GPU를 공개하고 올 하반기부터 본격 공급에 들어간다고 밝힌 바 있다. 젠슨 황 CEO는 "베라 CPU는 데이터 중심 AI 워크로드에 최적화됐다. 데이터 전처리부터 학습 이후 단계까지 CPU 활용이 늘고 있으며, 베라는 이러한 후처리와 데이터 작업에 매우 중요한 역할을 할 것"이라고 설명했다. 콜렛 크레스 엔비디아 최고재무책임자(CFO)는 "루빈 아키텍처는 전력 효율과 성능 개선 측면에서 기존 세대를 크게 뛰어넘는 것이 목표이며 성능 대비 전력과 가격 경쟁력을 지속적으로 개선해 장기적으로 높은 수익성을 유지할 것"이라고 설명했다. "공급망 전반 협력으로 생산 능력 확보에 집중" 글로벌 빅테크의 AI 인프라 투자로 지난 해 말부터 D램과 낸드 플래시메모리 등 메모리 반도체 수급난이 계속되고 있다. 특히 AI 서버 확산 과정에서 고대역폭 메모리(HBM) 등 핵심 부품의 공급이 제한적이라는 점은 업계 공통 과제로 지적되고 있다. 이날 컨퍼런스 콜에서도 공급망과 수급 문제가 주요 문제로 지적됐다. 이에 대해 콜렛 크레스 CFO는 "현재 공급망 전반에 대한 투자와 협력을 통해 필요한 생산 능력을 확보하는 데 집중하고 있다"고 설명했다. H200 수출 승인에도 실제 실적은 '제로' 도널드 트럼프 2기 행정부는 올 초 블랙웰 아키텍처 기반 H200 GPU의 중국 수출을 비 군사적 목적으로, 미국 내 고객사에 판매하는 물량 중 50%만 허용하기로 했다. 그러나 현재는 중국 정부가 H200 GPU 수입을 제한하고 있는 상황이다. 콜렛 크레스 CFO는 "미국 정부의 H200 수출 승인은 있었지만 아직 매출은 발생하지 않은 상황이다. 중국 내 수입이 언제 허용될지는 현재로서는 알 수 없다"고 설명했다. 이어 "최근 중국 내 경쟁사가 기업공개(IPO)로 자본력을 강화하고 기술적인 진전을 이루고 있다. 미국이 AI 분야에서 리더십을 유지하려면 중국을 포함한 전 세계 모든 개발자와 기업을 플랫폼 생태계 안으로 포용해야 한다"고 밝혔다.

2026.02.26 10:24권봉석 기자

엔비디아, 작년 4분기 영업익 61.2조…또 사상 최대

엔비디아가 25일(현지시간) 2025년 4분기(11~1월, 회계연도 기준 2026년 4분기) 실적과 매출을 발표했다. 매출은 자체 전망치를 5% 이상 넘어섰고 영업이익도 전년 동기 대비 두 배 이상 늘어났다. 엔비디아 4분기 매출은 681억 2700만 달러(약 97조 1800억원)로 전년 동기(393억 달러, 약 56조 1000억원) 대비 73% 이상 늘어났다. 또 작년 11월 회사 자체 전망치인 650억 달러(약 92조8000억 원)를 크게 넘어섰다. 영업이익은 429억 달러(약 61조 2000억원)로 전년 동기(220억 달러, 약 31조4000억원) 대비 두 배 가까이 증가했다. 젠슨 황 최고경영자(CEO)는 "컴퓨팅 수요가 기하급수적으로 증가하고 있으며, 에이전틱 AI 전환의 변곡점이 왔다"고 설명했다. 이어 "그레이스 블랙웰은 현재 추론 시장에서 토큰당 비용을 한 자릿수 수준으로 낮추며 주도적 위치를 확보했고, 베라 루빈 아키텍처는 이러한 리더십을 더욱 확대할 것"이라고 밝혔다. 인공지능(AI) 칩과 관련 부품을 포함하는 데이터센터 부문 매출은 623억 달러(약 88조 9000억원)로 전년 동기 대비 75%, 전 분기 대비 22% 증가했다. 전체 매출의 약 91%를 데이터센터 부문이 차지했다. 데스크톱과 노트북용 지포스 GPU 등을 공급하는 게이밍 부문 매출은 37억 달러(약 5조 3000억원)로 전년 동기 대비 47% 늘었다. 이 부문은 과거 핵심 사업이었지만 서버와 데이터센터 중심으로 사업 구조가 재편되면서 상대적 비중이 축소됐다. 워크스테이션과 쿼드로 등 전문가용 GPU를 공급하는 프로페셔널 비주얼라이제이션 부문 매출은 13억 달러(약 1조 8500억원)로 전년 동기 대비 2.5배 가까이 증가했다. 엔비디아는 "4분기 중 출시한 전문가용 그래픽카드 'RTX 프로 5000 72GB 블랙웰'과 GB10 기반 DGX 스파크의 출시 국가 확대, 성능 업데이트가 영향을 미쳤다"고 설명했다. 오토모티브(자동차) 및 로보틱스 부문 매출은 6억 달러(약 8600억원)로 전년 대비 6% 증가했다. 엔비디아는 4분기 말 기준 자사주 매입 승인 한도 가운데 585억 달러(약 83조 5000억 원)가 남아 있으며, 오는 4월 1일 주당 1센트 배당을 지급할 예정이라고 밝혔다. 배당락은 3월 11일이다. 엔비디아는 올해 1분기(2~4월) 매출을 780억 달러(약 111조 3000억원) 수준으로 전망했다. 다만 이는 중국 시장 매출을 전혀 반영하지 않은 수치다. 실적 발표 이후 주가는 시간 외 거래에서 종가(195.56달러) 대비 1% 내외로 등락을 이어가고 있다.

2026.02.26 08:48권봉석 기자

게이밍 GPU 교체주기 장기화...AI 기능으로 '공백 메우기'

글로벌 빅테크 기업의 대규모 AI 인프라 투자 경쟁 속에서 데이터센터용 GPU 수요가 급증하면서, 게이머나 일반 소비자용 GPU의 신제품 투입 우선순위가 내려가고 있다. 엔비디아는 현행 블랙웰과 차기 제품인 루빈에 GPU 신제품 개발과 생산 역량을 집중하는 한편 일반 소비자용 신제품 투입 시기를 미루고 있다. 올해에서 내년까지 새 GPU 투입이 미뤄질 것이라는 전망도 나온 바 있다. 엔비디아는 AI 기반 소프트웨어 기술을 활용한 업스케일링·프레임 생성 등으로 신제품 공백을 메우고 있다. 올 초 CES에서 DLSS 4.5를 공개한 데 이어 올해 중 업데이트를 통해 이를 강화할 예정이다. 2024년 이후 데스크톱 PC용 GPU 신제품 출시가 없는 인텔 역시 AI 기반 프레임 생성 기능을 현행 최신 제품 뿐만 아니라 2022년 출시된 전 세대 GPU까지 확장했다. 그래픽카드 시장의 경쟁 축도 AI 알고리듬 경쟁으로 향하고 있다. 엔비디아, 게이밍 GPU 신제품 투입 연기 엔비디아는 일반 소비자용 GPU 출시 이후 일정 시간이 지나면 작동 클록을 높이고 메모리 탑재량을 늘린 '슈퍼' 시리즈를 추가 출시했다. 이는 제품 수명을 연장하고 최대 경쟁사인 AMD 대응력을 유지하기 위한 수단이다. 올 초 CES를 앞두고도 파생 제품 출시가 예상됐지만 이는 실현되지 않았다. 글로벌 빅테크가 AI 인프라 투자에 경쟁적으로 나서면서 일반 소비자용 GPU 추가 출시는 우선 순위에서 밀린 것으로 판단된다. 이달 초 미국 IT 매체 디인포메이션은 익명을 요구한 관계자를 인용해 "RTX 50 파생 제품의 설계는 이미 끝났지만 메모리 반도체 수급난과 공급 부족 때문에 출시가 보류됐다"고 설명했다. DLSS, AI 기반 프레임 생성으로 성능 강화 엔비디아가 CES에서 새 GPU 대신 내세운 기술은 AI를 활용해 게임 프레임 수를 향상시킬 수 있는 기능인 DLSS(딥러닝 슈퍼샘플링) 4.5다. DLSS는 AI를 이용해 저해상도 게임 화면을 고해상도로 처리한다. 그래픽칩셋 부하는 줄이고 화질 저하는 최소화하며 초당 프레임 수는 높일 수 있다. RTX 5090 등 최상위 GPU가 아니어도 충분히 높은 프레임을 뽑아낼 수 있다. DLSS 4.5는 지포스 RTX 40/50 시리즈 GPU에서 작동한다. 지난 해 초 CES 2025에서 공개된 DLSS 4를 보완했고 2세대 트랜스포머 모델을 이용해 화질 저하 현상을 개선했다. 인텔, 2022년 출시 GPU까지 XeSS 확장 인텔 역시 아크 A/B시리즈용 GPU의 AI 연산 기능을 활용한 XeSS(Xe 슈퍼샘플링) 기능을 구현한 상태다. 코어 울트라 시리즈3(팬서레이크)에 탑재된 아크 B390 GPU에는 기준 프레임 두 개로 최대 세 개 중간 프레임을 AI로 생성하는 XeSS-MFG(다프레임 생성) 기능이 추가됐다. 지난 13일 업데이트된 아크 GPU 드라이버는 XeSS-MFG 기능을 2022년 출시된 데스크톱 PC용 그래픽카드인 아크 A770, 코어 울트라 시리즈1(메테오레이크)/시리즈2(루나레이크)에 탑재된 아크 GPU까지 확장했다. 이를 이용하면 아크 A770 등 구형 그래픽카드에서도 초당 프레임을 최대 네 배까지 끌어올릴 수 있다. 그래픽카드 교체주기 연장... AI 기반 부가기능으로 보완 디인포메이션 등에 따르면 엔비디아는 새 GPU 아키텍처 '루빈(Rubin)'을 적용한 RTX 50 시리즈 후속 제품을 2027년 말 대량 생산하려던 계획도 연기한 것으로 추정된다. 올해 뿐만 아니라 내년까지 새 PC용 GPU가 등장하지 않을 수 있다는 의미다. HBM뿐 아니라 고성능 GDDR 메모리 확보도 점점 어려워지면서 소비자용 GPU 생산 일정이 영향을 받고 있다는 분석도 나온다. 일반 소비자용 그래픽카드 교체 주기가 길어지고 AI 기반 성능 개선 기술 의존도가 높아질 전망이다. 엔비디아는 지난 해 출시한 RTX 50 시리즈 GPU의 성능 향상을 위한 DLSS 4.5 추가 업데이트도 준비중이다. AI 생성 프레임을 6배로 늘리는 한편 모니터 최대 화면주사율에 맞춰 화질과 프레임의 균형을 자동으로 조절하는 기능이 포함될 예정이다.

2026.02.25 16:31권봉석 기자

엔비디아, Arm 주식 110만주 전량 매각... 지분 관계 청산

엔비디아가 영국 Arm 인수를 위해 2020년부터 매입한 주식 중 남아있던 110만 주를 모두 처분했다. 엔비디아는 2020년 9월 400억 달러(약 47조 5000억원)를 투입해 일본 소프트뱅크 그룹이 보유한 Arm을 인수하겠다고 밝힌 바 있다. 그러나 이 같은 시도는 영국 경쟁시장청, 미국 연방거래위원회(FTC) 등 각국 경쟁당국의 심사 단계에서 가로막혔다. 퀄컴과 구글, 마이크로소프트와 아마존, 삼성전자 등 Arm 설계자산을 라이선스해 반도체를 만드는 주요 기업들도 이를 반대했다. 엔비디아와 소프트뱅크 그룹은 2022년 2월 "양사의 선의에도 불구하고 각국 규제로 거래를 완수할 수 없는 중대한 제약사항이 발생했기 때문에 인수-양도 계약을 중단한다"고 밝혔다. 엔비디아는 Arm 대주주인 일본 소프트뱅크 그룹에 위약금으로 12억 5000만 달러(약 1조 4790억원)를 지급했다. 소프트뱅크는 2023년 미국 나스닥 시장에 Arm을 재상장해 투자금을 회수했다. 엔비디아는 16일(현지시간) 1억 4000만 달러(약 2031억 9600만원) 상당 Arm 주식 110만 주를 모두 처분하고 지분관계도 청산했다. 단 엔비디아와 Arm의 협력은 지속될 것으로 보인다. 엔비디아는 2022년 인수 시도 무산 이후에도 Arm과 20년 단위 장기 라이선스 계약을 새로 맺었다. 블랙웰 구동에 쓰이는 그레이스 CPU, 올 하반기 출시될 차세대 GPU 루빈에 쓰이는 베라 CPU 모두 Arm IP 기반이다. 반면 GPU 제어에는 오픈소스 반도체 IP인 리스크파이브(RISC-V)를 활용하는 것으로 알려져 있다.

2026.02.19 10:16권봉석 기자

엔비디아, 메타에 AI칩 수백만개 공급 예정…장기 파트너십 체결

엔비디아가 글로벌 주요 클라우드서비스제공자(CSP) 메타와 장기간·대규모 AI 반도체 공급에 대한 계약을 체결했다. 17일(현지시간) 엔비디아는 메타와 온프레미스, 클라우드 및 AI 인프라에 대한 다년간의 전략적 파트너십을 맺었다고 밝혔다. 이번 협력으로 엔비디아는 메타에 수백만 개의 '블랙웰' 및 '루빈' GPU를 공급할 예정이다. 해당 GPU는 AI 데이터센터에 필요한 초고성능 칩이다. 특히 루빈의 경우, 올해 본격적인 상용화가 예상된다. 또한 메타는 자사 데이터센터에 엔비디아의 그레이스 CPU를 단독으로 도입하기로 했다. 주요 CSP 기업 중 엔비디아의 그레이스 CPU만을 채용한 사례는 이번이 처음이다. 그간 메타는 Arm 기반의 CPU를 자사 AI칩의 보조 프로세서로 활용해 왔다. 이와 관련해 로이터통신은 "고객사향 매출을 공개한 적은 없지만, 메타는 엔비디아의 최근 분기 매출의 61%를 차지하는 4대 CSP 중 하나"라며 "엔비디아가 이번 계약을 강조한 것은 메타와의 대규모 사업 관계 유지와 CPU 시장에서의 입지 강화를 보여주기 위한 것"이라고 평가했다. 젠슨 황 엔비디아 최고경영자(CEO)는 "엔비디아는 CPU, GPU, 네트워킹 및 소프트웨어 전반에 걸친 심층적인 공동 설계로 메타가 차세대 AI 인프라를 구축하는 데 필요한 모든 플랫폼을 제공할 것"이라고 말했다. 마크 저커버크 메타 CEO는 "엔비디아와의 파트너십 확대로 베라 루빈 플랫폼을 활용한 최첨단 클러스터를 구축하고, 전 세계 모든 사람에게 맞춤형 인공지능을 제공하게 돼 기쁘다"고 밝혔다.

2026.02.18 10:10장경윤 기자

엔비디아 "한국 반도체 업체와 피지컬 AI 협력 지속"

"한국은 삼성전자, SK하이닉스, 현대차그룹, LG전자 등 세계적 제조기업을 보유한 전략적 거점이다. 엔비디아가 추진하는 디지털 트윈과 피지컬 AI 기반 협력을 주도하는 전초기지 역햘을 수행하고 있다." 11일 서울 코엑스에서 열린 '세미콘 코리아 2026' 기조연설에서 정소영 엔비디아코리아 대표가 이렇게 설명했다. 이날 엔비디아는 반도체 설계부터 제조까지 산업 전반에 걸친 단계에서 생산성과 효율을 강화할 수 있는 AI 모델과 디지털 트윈 기술을 소개했다. 또 반도체 생태계를 넘어 산업 전반의 혁신 기업으로 역할을 확대해 나가겠다는 비전을 제시했다. 제품 대신 지능 생산하는 'AI 팩토리' 대두 이날 정소영 대표는 AI 시대 산업 패러다임의 전환이 'AI 팩토리'와 '피지컬 AI' 등 두 축을 중심으로 일어나고 있다고 설명했다. 정 대표는 "전통적인 공장은 사람과 자원을 투입해 제품을 생산한 반면 AI 시대의 공장은 데이터와 전기를 투입해 지능(인텔리전스)를 생산하는 공간"이라고 정의했다. 이어 "AI 팩토리에서 생성된 인텔리전스가 반도체·제조·자동차·통신 등 다양한 산업에 접목되며 실질적인 변화를 만들어내고 있다. 이미 글로벌 주요 산업 현장에서 AI 기반 혁신이 가속화되고 있다"고 덧붙였다. 그는 피지컬 AI에 대해 "이는 단순히 로봇을 움직이는 것이 아니라 현실 세계에 존재하는 다양한 물리적 개체(entity)에 지능을 결합해 우리 삶과 생산 현장 전반에 AI의 영향을 확장시키는 단계"라고 밝혔다. "엔비디아, AI 팩토리 구성 인프라 제공" 엔비디아는 2020년대 이후 AI 연산을 수행하는 GPU에 머무르던 것에서 벗어나 AI 처리 인프라를 제공하는 기업으로 포지션 변화를 시도하고 있다. 정소영 대표는 "AI 팩토리는 GPU를 시작으로 클라우드와 온프레미스 데이터센터, 그 위에서 구동되는 AI 모델과 고부가가치 소프트웨어·서비스로 구성된다. 엔비디아는 이런 가속 컴퓨팅 기반을 산업 전반에 제공하는 인프라 기업"이라고 말했다. 이어 "올 하반기 출시할 차세대 GPU 플랫폼 '베라 루빈'은 베라 CPU, 루빈 GPU와 네트워킹 칩, 스위치 등 6개 요소를 동시 개발하고 최적화하며 AI 플랫폼을 구현중"이라고 덧붙였다. "CPU 대신 GPU 활용해 소요시간 단축" 엔비디아는 CPU 대신 GPU를 활용하는 쿠다(CUDA)-X 라이브러리로 고성능·장시간 연산이 필요한 산업계 과제의 소요 시간 단축을 제공하고 있다. 2023년 엔비디아가 개발한 소프트웨어 라이브러리인 cu리소(cuLitho)는 반도체 식각 공정에 쓰이는 포토마스크 설계 시간을 크게 단축한다. 기존 CPU로 2주 이상 걸리던 연산 시간을 하루 내외로 줄였다. 정소영 대표는 "주요 반도체 소자를 시뮬레이션하는 TCAD, 리소그래피, 전자설계자동화(EDA) 등 반도체 전 분야에 AI 기반 모델이 적용된다. 삼성전자·SK하이닉스 등 국내 주요 업체도 설계 시간 단축, 시뮬레이션 고도화 등을 추진중"이라고 밝혔다. 시뮬레이션 플랫폼 '옴니버스', 반도체 생산 자동화 가속 엔비디아는 현실 세계 물리 법칙과 환경을 시뮬레이션 할 수 있는 플랫폼 '옴니버스'를 피지컬 AI 구현에 활용하고 있다. 자율주행차와 휴머노이드 로봇, 자율이동로봇(AMR) 등 다양한 장비 개발 소요 시간을 단축하고 정밀도를 높일 수 있다. 정소영 대표는 옴니버스 활용 사례로 "어플라이드 머티어리얼즈(AMAT)와는 디지털 트윈 기반 생산 공정 제어에 협력하고 있고 램리서치 및 LG디스플레이 등과도 협업을 확대하고 있다"고 설명했다. 정 대표는 "반도체 산업은 축적된 방대한 부품·공정 데이터를 보유하고 있어 AI 에이전트를 통한 자동화와 EDA 가속화에 유리하다. 실제로 아드반테스트와 AI 에이전트를 활용한 제품 테스트 자동화도 공동 개발 중"이라고 밝혔다.

2026.02.11 15:41권봉석 기자

[유미's 픽] 李 'AI 고속도로'가 바꾼 판…정부 GPU 지원, 스타트업 실험에 불 붙였다

'인공지능(AI) 고속도로' 구축을 위해 이재명 정부가 추진해온 고성능 그래픽처리장치(GPU) 지원 사업이 국내 AI 스타트업 생태계 조성에 실질적인 역할을 했다는 평가가 나오고 있다. 대규모 연산 자원이 필수적인 파운데이션 모델 개발과 차세대 AI 구조 연구에서 초기 자본이 부족한 스타트업들도 정부 덕에 기술 실험을 지속할 수 있는 토대가 마련됐다는 분석이다. 10일 업계에 따르면 트릴리온랩스는 지난해 9월부터 4개월여간 정부로부터 엔비디아 H200 GPU 80장 규모의 고성능 연산 자원을 지원받아 차세대 AI 구조 연구를 진행했다. 이를 통해 초거대 모델 학습뿐 아니라 기존 트랜스포머 구조의 연산 효율을 개선하기 위한 신규 아키텍처 실험과 대규모 검증을 병행할 수 있는 환경을 구축했다. 이 연산 인프라는 구체적인 기술 성과로도 이어졌다. 트릴리온랩스는 지원받은 GPU 자원을 활용해 지난 달 디퓨전 기반 대규모 언어 모델 '트리다(Trida)-7B'를 개발했다. '트리다-7B'는 단어를 하나씩 순차적으로 생성하는 기존 방식에서 벗어나 문장 전체를 병렬로 생성하는 확산(diffusion) 기법을 언어 모델에 적용한 것이 특징이다. 또 이미지 생성에 주로 활용되던 디퓨전 기술을 언어 모델 구조에 이식함으로써 추론 속도와 연산 효율을 동시에 끌어올렸다. 이와 함께 지난해 10월에는 소규모 프록시 모델을 활용해 대형 언어모델의 성능을 사전에 예측하는 '알브릿지(rBridge)' 기법도 개발했다. 실제 대형 모델을 반복 실행하지 않고도 성능을 가늠할 수 있는 구조로, 연산 효율을 최대 700배 이상 개선하고 거대언어모델(LLM) 개발 비용을 대폭 절감할 수 있는 가능성을 제시했다. 대규모 모델 학습에 앞서 시행착오를 줄일 수 있다는 점에서 파운데이션 모델 개발 방식 자체를 바꿀 수 있는 접근으로 평가된다. 업계에선 이러한 성과가 단순한 개별 기술 개발을 넘어 AI 연구·개발의 비용과 시간, 자원 구조를 근본적으로 재설계했다는 점에 주목하고 있다. 대형 모델을 '더 많이 돌리는 방식'이 아니라 '덜 돌리고도 더 많이 검증하는 방식'으로 전환할 수 있는 가능성을 보여줬다는 점에서다. 이는 스타트업이 제한된 자원 환경에서도 고난도 연구를 지속할 수 있는 실질적인 해법으로 꼽힌다. 이 같은 결과 뒤에는 과학기술정보통신부와 정보통신산업진흥원(NIPA)의 지원 방식도 한 몫 했다는 평가다. 앞서 정부는 삼성SDS·KT클라우드·엘리스클라우드를 '고성능컴퓨팅 지원사업' 공급사로 선정한 후 지난해 9월부터 12월까지 국내 민간 중소·중견·스타트업 기업과 대학·병원·연구기관 등에 총 1천 장의 GPU를 지원했다. 당시 삼성SDS와 엘리스그룹은 각각 H100 GPU 200장과 400장을, KT클라우드는 H200 GPU 400장 수준을 공급했다. 당시 정부에선 그간 단순히 GPU를 일괄 배분하는 데 그치지 않고 연구 단계와 실험 난이도에 맞춰 자원 활용 계획을 조정하며 과제 수행 전반을 관리했다. 또 개발 과정에서 발생하는 변수에 따라 지원 방식을 유연하게 조정하고 현장의 피드백을 즉각 반영하는 방식으로 연구 완성도를 높였다. 이 과정에서 정부는 단순한 예산 집행 기관을 넘어 프로젝트의 '내비게이터' 역할을 수행하며 실질적인 성과를 견인했다는 평가를 받았다. 또 단순히 규모가 큰 기업이 아닌, 독보적인 기술력과 성장 잠재력을 보유한 스타트업을 정밀하게 선별해 과제 수행 기업으로 낙점하려는 노력이 참여 기업으로부터 큰 호응을 얻었다. 업계 관계자는 "정부가 행정적 관리에 그치지 않고 모델 출시 과정에서 발생하는 변수에 맞춰 지원 체계를 업데이트했다"며 "현장의 목소리를 즉각 반영해 모델의 완성도를 높이는 실질적인 가이드도 제공해줬다"고 말했다.이어 "무한정한 지원 대신, 한정된 예산 내에서 최선의 결과물을 낼 수 있도록 목표 난이도를 정교하게 조정해준 점도 인상 깊었다"며 "이를 통해 자원의 낭비를 막고 효율적인 사용 위에 최대의 성과를 이끌어냈다"고 덧붙였다. 트릴리온랩스 역시 정부 인프라 지원을 발판 삼아 국내에서 시도된 적 없는 기술 실험을 진행할 수 있었다고 평가했다. 독자적인 모델 구조와 학습 기법을 실제 대규모 환경에서 반복 검증하며 스타트업이 겪는 컴퓨팅 파워 한계를 일정 부분 극복할 수 있었다는 것이다. 신재민 트릴리온랩스 대표는 "정부의 GPU 지원 사업이 단순한 인프라 제공을 넘어 기술 기업의 도전 방식을 바꿨다"며 "자본력보다 기술적 실험과 구조 혁신에 집중할 수 있는 조건을 마련했다는 점에서 국내 AI 생태계에 미친 영향이 적지 않다"고 강조했다. 이 같은 분위기 속에 정부가 추가경정예산으로 확보한 고성능 GPU 자원으로 어떤 AI 연구 기관, 기업들이 수혜를 받을지 관심이 쏠린다. 정부는 총 1만3천136장 규모의 GPU를 최대 12개월까지 이용할 수 있도록 한 사업을 공고한 후 지난 달 28일 마감했다. 이번에는 학계·연구기관은 무상으로, 산업계는 자부담 방식으로 지원받는 구조다. 구축·운영은 민간 클라우드 3사가 맡는다. 네이버클라우드는 세종 데이터센터에 H200 2296장을 안착시켰고, 카카오는 안산 데이터센터에 B200 2040장을 클러스터 형태로 구축했다. NHN클라우드는 3월께 B200 6120장을 갖출 계획이다. 정부는 이 사업에 예산 1조4590억원을 투입했다. 이번 프로젝트는 과제별로 H200, B200 중 하나만 신청할 수 있다. 신청은 서버 묶음 기준으로 이뤄진다. H200은 최소 서버 2대(16장)에서 최대 서버 32대(256장)까지, B200은 최소 서버 2대(16장)에서 최대 서버 16대(128장)까지다. 조만간 선정될 수요 기업은 원격 접속 방식인 GPUaaS(GPU as a Service)로 고성능 컴퓨팅 자원을 손쉽게 이용할 수 있다. 정부가 고수한 '1사 1지원' 원칙을 사실상 폐기해 중복 신청 문턱이 낮아진 점도 눈에 띈다. 이 일로 동일 기업 내 복수 부서도 각각 GPU 자원을 확보할 수 있게 됐다. 다만 연구 인력의 독립성과 과제 주제는 차별돼야 한다. 여기에 정부는 지난해 확보한 1만3000장에 이어 올해는 B200 기준 1만5000장을 투입해 지원 범위를 넓힐 계획이다. 이를 구축하기 위해 총 2조831억원(출연금)이 투입될 이번 사업 공고는 이달 중 나올 예정으로, 과기정통부 단일 사업 기준 최대 규모 프로젝트로 평가된다. 또 단일 사업자가 전체 물량을 감당하기 어려운 만큼, 사업 구조 자체를 어떻게 설계할지가 관건이 될 전망이다. 과기정통부 관계자는 "주요 클라우드 서비스 제공업체(CSP)들과 면담한 결과 데이터센터 상면(물리적 수용 공간) 확보는 어느 정도 가능한 수준으로 파악됐다"며 "최신 GPU를 확보하는 것이 유리한 만큼 엔비디아 차세대 AI 칩 '베라루빈'을 업체들이 제안할 경우 가점을 줄 지에 대한 방안에 대해선 고민 중"이라고 밝혔다. 업계에선 정부의 고성능 연산 인프라 지원이 일회성 사업에 그치지 않고 파운데이션 모델·신규 아키텍처·산업 특화 AI로 이어지는 연속적인 연구 생태계로 정착할 수 있을지가 향후 사업 성공 여부의 관건이 될 것이라고 전망했다. 업계 관계자는 "특히 연산 자원 접근성이 기술 경쟁력으로 직결되는 AI 산업 특성을 감안할 때 정부의 GPU 지원 정책이 국내 스타트업들의 글로벌 도전 여력을 좌우하는 핵심 변수로 작용할 것으로 예상된다"며 "단기 성과보다 중장기 연구 축적이 가능한 구조로 설계될 경우 정부 지원이 국내 AI 산업의 체질을 바꾸는 계기가 될 수 있다"고 말했다.

2026.02.10 11:43장유미 기자

AI에 밀린 지포스..."엔비디아, RTX 50 GPU 추가 출시 보류"

엔비디아가 올해 성능을 강화한 '지포스 RTX 50 시리즈' GPU 신제품을 출시하지 않을 것이라는 전망이 나왔다. 미국 IT매체 디인포메이션이 5일(현지시간) 엔비디아 내 복수 관계자를 인용해 이같이 보도했다. 엔비디아는 일반 소비자용 GPU 출시 이후 일정 시간이 지나면 작동 클록을 높이고 메모리 탑재량을 늘린 '슈퍼' 시리즈를 추가 출시했다. 이는 제품 수명을 연장하고 최대 경쟁사인 AMD 대응력을 유지하기 위한 수단이다. 그러나 엔비디아는 올 초 CES 2026에서 PC용 그래픽카드 새 제품이나 파생 제품을 공개하지 않았다. 디인포메이션은 "RTX 50 파생 제품의 설계는 이미 끝났지만 메모리 반도체 수급난과 공급 부족 때문에 출시가 보류됐다"고 설명했다. 디인포메이션은 또 관계자를 인용해 "엔비디아는 새 GPU 아키텍처 '루빈(Rubin)'을 적용한 RTX 50 시리즈 후속 제품을 2027년 말 대량 생산하려던 계획도 연기했다"고 주장했다. 작년 1월에 출시된 블랙웰 아키텍처 기반 지포스 RTX 50 시리즈가 내년까지 최대 3년간 유지될 것이라는 의미다. 2년 간격으로 지포스 새 GPU를 투입하던 과거 행보와 달리 이례적이다. 엔비디아가 GPU 생산에서 일반 소비자용 지포스 GPU 대신 블랙웰/루빈 등 AI 관련 GPU 가속기를 우선하는 데는 구조적인 이유가 있다. 현재 엔비디아의 매출 중 절대 다수는 데이터센터 부문에서 나온다. 엔비디아의 최근 실적발표(2025년 11월 3분기)에 따르면 전체 매출 570억 600만 달러(약 83조 7988억원) 중 데이터센터 부문 매출은 512억 달러(약 75조 2640억원)로 89%에 달한다. 반면 지포스 RTX 시리즈 등 게이밍 부문 매출은 42억 6500만 달러(약 6조 2696억원)로 전체 매출의 7.3% 수준까지 하락했다. 또 최대 경쟁사인 AMD가 중저가 GPU에 집중하고 있고 고성능 제품에서는 경쟁 제품이 사실상 없다. 엔비디아는 디인포메이션에 "지포스 RTX GPU 수요가 높고 메모리 공급에는 제약이 있지만 모든 지포스 제품군을 계속해서 공급 중이며 메모리를 최대한 확보하기 위해 공급사와 긴밀히 협력하고 있다"고 밝혔다.

2026.02.06 08:47권봉석 기자

류제명 차관 "엔비디아, 내년 양산 GPU 한국에 우선 공급"

류제명 과학기술정보통신부 제2차관이 12일 “엔비디아에서 (블랙웰 아키텍처 기반 AI 서버용) GB300을 한국에 조기에 공급하고, 2027년 양산 계획인 베라루빈을 한국에 우선 공급을 추진한다”고 밝혔다. 류 차관은 미국 라스베이거스에서 열린 CES 출장을 마치고 한국에 돌아와 이날 자신의 페이스북 계정에 “하정우 청와대 AI미래기획수석 의견대로 제가 베라루빈은 한국에 제일 먼저 공급해 주면 좋겠다고 했는데 (엔비디아에서) 그렇게 하겠다고 답했다”며 이같이 적었다. 이어, “최신 GPU를 가장 먼저 써볼 수 있다는 것도 AI 모델 경쟁에 매우 중요한 역할을 하는 상황이라 큰 의미가 있는 일”이라고 평가했다. 류 차관은 또 “국내 엔비디아 연구소 설립 문제도 젠슨황 CEO가 직접 챙기고 있다고 학인했다”며 “스탠포드대 교수이자 세계적인 AI 석학인 최예진 교수가 엔비디아 연구팀에 합류해 핵심적인 역할을 하고 있다. 조만간 가시적 일정이 구체화 될 것”이라고 했다. 그러면서 “피지컬AI가 급진전되고 있는 상황에서 이를 주도하는 엔비디아가 국내에 관련 연구소를 세우기로 한 것은 엔비디아가 피지컬AI 시대에 한국을 얼마나 중요하게 생각하는지 보여주는 일”이라고 강조했다. CES를 둘러본 결과 주요 특징으로는 AI의 전면화, AI 생태계 자체의 고도화를 키워드로 꼽았다. 류 차관은 “CES에서 가장 많이 들은 단어가 피지컬AI”라며 “피지컬AI 파운데이션 모델 경쟁, 관련 반도체 경쟁, 그리고 자율주행차와 휴머노이드 등 피지컬AI를 둘러싼 기술개발이 급진전되고 있다”고 진단했다. 아울러 “엔비디아다 자율주행차용 AI 모델인 알파마요를 개발하고 벤츠와 협력해 1분기에 세계 최초로 추론형 AV를 미국시장에 내놓기로 하는 등 피지컬AI 풀스택을 완성했다고 하고, 모바일 시대를 주도한 퀄컴이 자율주행차와 휴머노이드 피지컬AI 반도체에 사활을 걸고 투자를 하는 것도 인상적이었다”고 덧붙였다. 아마존 자율주행차 죽스(ZOOX)와 구글 웨이모 탑승 경험을 이야기하면서 “현대차가 국내 규제 때문에 미국서 시험 운행을 하고 있다는 이야기에 안타까움과 한국이 자율주행차 시대에 낙오하거나 도태까지 되겠다는 절박한 생각이 들었다”고 전했다.

2026.01.12 23:27박수형 기자

엔비디아 '베라 루빈' 시대 임박…고전력에 서버·클라우드 판 바뀐다

엔비디아가 차세대 그래픽처리장치(GPU) 아키텍처 '베라 루빈'의 본격적인 상용화를 앞두면서 서버·클라우드 업계 전반의 긴장감이 높아지고 있다. 10일 외신과 업계에 따르면 루빈 GPU 단일 칩 기준 소비 전력이 1천와트를 넘길 수 있다는 전망이 나오면서, 인프라 경쟁 초점이 성능에서 전력과 냉각 설계로 이동하는 분위기다. 엔비디아는 최근 CES 2026에서 베라 루빈 플랫폼이 이미 양산 단계에 돌입했으며 올해 하반기부터 주요 클라우드 사업자와 서버 파트너를 통해 본격 공급될 것이라고 밝혔다. 루빈은 기존 블랙웰을 잇는 차세대 GPU 아키텍처로, 대규모 인공지능(AI) 학습과 장거리 추론에 필요한 연산 밀도를 크게 끌어올리는 데 초점을 맞췄다. 베라 루빈은 단일 GPU를 넘어 CPU·네트워크·보안·스토리지를 하나의 슈퍼컴퓨터로 통합한 랙 스케일 아키텍처다. 루빈 GPU와 베라 CPU, NV링크 6 스위치, 블루필드-4 DPU, 차세대 네트워킹 인터페이스를 결합해 데이터 이동 병목을 최소화하고 확장된 컨텍스트 처리와 고밀도 연산 환경을 지원하도록 설계됐다. 이같은 비약적 성능 향상과 함께 전력 소모 역시 급격히 증가할 것으로 관측된다. 업계에서는 베라 루빈 기반 GPU가 최대 부하 시 단일 가속기 기준 소비 전력이 1천와트를 넘어설 가능성이 높다고 보고 있다. 이는 기존 공랭 기반 서버 설계로는 안정적인 운용이 어렵다는 의미로, 데이터센터 인프라 전반의 구조적 변화가 불가피하다는 평가다. 냉각 방식 변화는 이미 가시화되고 있다. 엔비디아는 베라 루빈 랙이 100% 액체 냉각을 전제로 설계됐다고 밝혔다. 특히 45도 섭씨의 고온수를 활용한 직접 수냉 방식으로 냉각할 수 있어 별도의 칠러 없이도 데이터센터 운영이 가능하다는 점을 강조하고 있다. 이러한 변화에 서버 제조사들도 발 빠르게 대응하고 있다. 슈퍼마이크로는 베라 루빈 NVL72 및 HGX 루빈 NVL8을 지원하는 수냉식 AI 서버를 공개하고 제조 역량과 냉각 기술을 확대하겠다는 전략을 내놨다. 고밀도 GPU 집적 환경에서 공랭의 한계를 넘어서는 직접 액체 냉각(DLC)이 핵심 경쟁력으로 부상하고 있다는 판단이다. 클라우드 사업자들의 준비도 본격화되는 모습이다. 아마존웹서비스(AWS)는 엔비디아 루빈 플랫폼을 자사 클라우드 인프라에 결합해 고객들에게 제공할 계획을 공식화했다. 기존 인프라에 GPU를 단순 추가하는 방식이 아니라 전력 밀도와 냉각 구조를 포함한 데이터센터 설계 전반을 재검토하는 단계에 들어갔다는 설명이다. 신흥 AI 인프라 기업인 '네오클라우드' 사업자들의 움직임도 눈에 띈다. 네비우스는 미국과 유럽 데이터센터를 기반으로 루빈 NVL72 시스템을 제공할 계획이며 코어위브는 올 하반기부터 루빈 NVL72 랙을 자사 AI 인프라에 도입할 예정이다. 이들 기업은 자체 오케스트레이션과 진단 플랫폼을 통해 고전력 AI 서버를 관리하는 전략을 택하고 있다. 이번 베라 루빈 발표는 향후 데이터센터 운영 전략에도 직접적인 영향을 미칠 전망이다. 고전력·고발열 AI 서버를 수용하기 위해 랙 단위 전력 인입 용량을 확대하고 수냉 전용 존을 별도로 설계하는 방안이 검토되고 있는 상황이다. 코로케이션 데이터센터 사업자들 역시 AI 고객 유치를 위해 전력 밀도와 냉각 역량을 핵심 경쟁 요소로 삼는 분위기다. 엔비디아는 루빈 아키텍처가 전력 효율 측면에서도 진전을 이뤘다고 설명했다. 내부 테스트 기준으로 루빈은 이전 세대인 블랙웰 대비 학습 성능은 3.5배, 추론 성능은 최대 5배 향상됐으며 토큰당 연산 비용도 크게 낮아졌다. 다만 전체 시스템 전력 사용량이 증가하는 만큼, 효율 개선과 물리적 한계 사이의 균형이 과제로 제기된다. 업계에서는 베라 루빈을 기점으로 AI 인프라 경쟁 양상이 달라질 것으로 보고 있다. 단순히 GPU 성능을 얼마나 빠르게 도입하느냐보다, 이를 안정적으로 운용할 수 있는 전력·냉각·운영 역량이 클라우드와 서버 업체의 경쟁력을 좌우하는 요소로 부상할 것이라는 분석이다. 데이터센터 냉각 전문기업 액셀시어스의 루카스 베란 제품 마케팅 디렉터는 "AI 서버 전력과 발열 수준이 공랭의 한계를 넘어서면서 액체 냉각은 더 이상 선택지가 아니다"라며 "베라 루빈은 데이터센터 냉각 방식 전환을 앞당기는 계기가 될 것"이라고 말했다.

2026.01.10 09:01한정호 기자

슈퍼마이크로, 엔비디아 '베라 루빈' 지원 발표…수냉식 AI 인프라 공개

슈퍼마이크로가 CES 2026에서 공개된 차세대 엔비디아 베라 루빈과 플랫폼 지원을 위한 수냉식 인공지능(AI) 인프라 구축을 공식 발표했다. 슈퍼마이크로는 엔비디아와 협력해 베라 루빈 NVL72 및 HGX 루빈 NVL8 플랫폼을 지원하는 수냉식 AI 인프라 솔루션을 신속히 제공하기 위해 제조 역량과 냉각 기술을 확대한다고 8일 밝혔다. 이번 협력을 통해 슈퍼마이크로는 엔비디아 베라 루빈 NVL72 슈퍼클러스터와 HGX 루빈 NVL8 솔루션을 신속히 공급한다는 목표다. 랙 스케일 설계와 모듈형 데이터센터 빌딩 블록 솔루션(DCBBS)을 기반으로 다양한 구성 옵션과 신속한 구축을 지원해 대규모 AI 인프라 도입 기간을 단축할 계획이다. 엔비디아 베라 루빈 NVL72 슈퍼클러스터는 엔비디아 루빈 그래픽처리장치(GPU) 72개와 엔비디아 베라 중앙처리장치(CPU) 36개를 하나의 랙 스케일 솔루션으로 통합한 플래그십 AI 인프라다. 엔비디아 NV링크 6 기반 고속 인터커넥트와 커넥트X-9 슈퍼 NIC, 블루필드-4 DPU를 통해 GPU 및 CPU 간 고속 통신을 지원하며 인피니밴드와 이더넷 기반 네트워크로 대규모 클러스터 확장이 가능하다. 슈퍼마이크로가 공개한 2U 수냉식 엔비디아 HGX 루빈 NVL8 솔루션은 8-GPU 기반 고밀도 시스템으로 AI와 고성능컴퓨팅(HPC) 워크로드에 최적화됐다. 고속 NV링크와 HBM4 메모리 대역폭을 제공하며 차세대 인텔 제온 및 AMD 에픽 프로세서를 지원하는 x86 기반 구성 옵션을 갖췄다. 직접 수냉식(DLC) 기술도 적용돼 집적도와 에너지 효율도 높였다. 이와 함께 슈퍼마이크로는 엔비디아 스펙트럼-X 이더넷 포토닉스 네트워킹과 블루필드-4 DPU를 지원하는 서버·스토리지 솔루션을 통해 네트워크 및 데이터 처리 성능을 강화했다. 확장된 제조 시설과 엔드투엔드 수냉식 기술 스택을 바탕으로 하이퍼스케일러와 엔터프라이즈 고객의 대규모 AI 인프라 구축 수요에 대응할 방침이다. 찰스 리앙 슈퍼마이크로 최고경영자(CEO)는 "확장된 제조 역량과 수냉식 기술을 바탕으로 하이퍼스케일러와 엔터프라이즈 고객이 베라 루빈 및 플랫폼 기반 AI 인프라를 대규모로 신속하고 효율적으로 구축할 수 있도록 지원할 것"이라고 밝혔다.

2026.01.08 17:09한정호 기자

맷 가먼 AWS CEO "엔비디아 '루빈' GPU 결합 기대"…협력 의사 공식화

글로벌 클라우드 시장 핵심 플레이어인 아마존웹서비스(AWS)가 엔비디아의 차세대 그래픽처리장치(GPU) 아키텍처 '루빈'을 중심으로 한 협력 의지를 드러냈다. 맷 가먼 AWS 최고경영자(CEO)는 6일 링크드인을 통해 "엔비디아가 발표한 루빈 플랫폼을 고객들에게 제공할 수 있기를 기대한다"고 밝혔다. 이어 "루빈은 우리의 규모·보안·AI 서비스와 결합돼 고객들이 가장 까다로운 AI 워크로드를 더 빠르고 비용 효율적으로 구축·학습·배포할 수 있도록 도울 것"이라고 강조했다. 가먼 CEO의 발언은 엔비디아가 미국 라스베이거스에서 열린 CES 2026에서 루빈을 공식 공개한 직후 나왔다. 젠슨 황 엔비디아 CEO는 기조연설을 통해 루빈이 기존 '블랙웰'을 잇는 차세대 AI 컴퓨팅 플랫폼이며 이미 본격적인 양산 단계에 돌입했다고 발표했다. 황 CEO에 따르면 루빈은 단일 GPU를 넘어 CPU·네트워크·보안·스토리지를 하나의 슈퍼컴퓨터로 통합한 랙 스케일 아키텍처다. 대규모 AI 학습과 추론 과정에서 병목으로 작용해온 데이터 이동 문제를 해소하고 전체 시스템 효율을 극대화하는 데 초점을 맞췄다. 특히 루빈 GPU는 3세대 트랜스포머 엔진과 하드웨어 가속 적응형 압축 기술을 적용해 추론 성능을 크게 끌어올렸다. 엔비디아는 루빈이 블랙웰 대비 동일 모델 기준 토큰당 비용을 10분의 1 수준으로 낮추고 학습에 필요한 GPU 수를 25%까지 줄일 수 있다고 설명했다. 또 루빈 아키텍처가 AI가 단순 응답을 넘어 추론 중심으로 진화하는 시장 환경에 대응하기 위한 핵심 플랫폼이라고 강조했다. 내부 테스트 기준으로 루빈은 블랙웰 대비 학습 성능은 3.5배, 추론 성능은 최대 5배까지 향상됐으며 전력 효율 역시 크게 개선됐다. AWS는 이러한 루빈 플랫폼을 자사 클라우드 인프라에 결합해 고객들에게 보다 효율적인 AI 학습·추론 환경을 제공한다는 계획이다. 엔비디아와 15년 이상 이어온 협력 관계를 바탕으로 AWS의 글로벌 인프라와 AI 서비스 역량을 결합해 고객 선택권과 유연성을 확대한다는 구상이다. 엔비디아는 루빈을 주요 클라우드 사업자와 AI 기업들에 올해 연말부터 공급할 예정이다. AWS를 비롯해 구글 클라우드·마이크로소프트·오라클은 물론 오픈AI·앤트로픽·xAI 등 주요 AI 기업과 연구기관이 루빈을 도입할 전망이다. 가먼 CEO는 "우리와 엔비디아의 오랜 협력을 바탕으로 고객들이 차세대 AI 혁신을 빠르게 실현할 수 있도록 지원할 것"이라고 밝혔다.

2026.01.06 16:16한정호 기자

엔비디아, 차세대 AI GPU '루빈' 공개

[라스베이거스(미국)=권봉석] 엔비디아가 5일(이하 현지시간) 라스베이거스 퐁텐블로 시어터에서 진행한 기조연설에서 데이터센터용 차세대 AI GPU 플랫폼 '루빈'(Rubin)을 공개했다. 엔비디아는 2024년 컴퓨텍스 기조연설에서 블랙웰을 시작으로 매년 새 GPU를 출시하겠다고 밝힌 바 있다. 지난 해 블랙웰을 강화한 '블랙웰 울트라'에 이어 올해는 CPU와 GPU를 새로 설계한 '루빈'이 투입된다. 루빈은 단일 GPU를 넘어 CPU, 네트워크, 보안, 스토리지를 하나의 슈퍼컴퓨터로 통합한 랙 스케일 아키텍처로, 대규모 학습과 추론 비용을 획기적으로 낮추는 데 초점을 맞췄다. 루빈 GPU는 3세대 트랜스포머 엔진과 하드웨어 가속 적응형 압축을 적용해 추론에서 50페타플롭스(NVFP4) 연산 성능을 제공한다. GPU 간 연결에는 6세대 NV링크를 적용해 GPU당 3.6TB/s, NVL72 랙 기준 260TB/s 대역폭을 구현했다. CPU는 Arm IP 기반 새 제품인 '베라'이며 에이전틱 AI 추론을 겨냥했다. 최대 88개 코어로 구성된 CPU가 루빈 GPU와 직접 연결돼 전력 효율과 데이터 이동 성능을 동시에 확보했다. 엔비디아는 루빈 플랫폼을 구성하는 베라(Vera) CPU와 루빈 GPU, GPU 사이에서 데이터를 주고 받는 NV링크 6 스위치, 데이터 전송에 관여하는 블루필드4 DPU 등을 통합설계했다. 이를 이용해 루빈이 블랙웰 대비 1/10 수준의 토큰 비용으로 대규모 '혼합 전문가'(MoE) 모델 추론을 수행할 수 있으며 동일한 모델 학습에 필요한 GPU 수를 25% 수준으로 줄일 수 있다는 것이 엔비디아 설명이다. 엔비디아는 루빈이 올 하반기부터 주요 클라우드와 서버 파트너를 통해 본격 공급될 것이라고 밝혔다. AWS, 구글 클라우드, 마이크로소프트, OCI를 비롯해 다수의 AI 연구소와 기업들이 루빈을 도입 예정이다.

2026.01.06 08:01권봉석 기자

슈퍼마이크로, 엔비디아 '베라 루빈' 플랫폼 도입…정부용 AI 인프라 강화

슈퍼마이크로가 엔비디아와의 협력을 강화해 정부 기관의 까다로운 요구사항을 충족하도록 최적화된 첨단 인공지능(AI) 인프라 솔루션을 선보인다. 슈퍼마이크로는 내년 출시 예정인 엔비디아 베라 루빈 NVL144 및 NVL144 CPX 플랫폼 기반 솔루션을 출시할 계획이라고 4일 밝혔다. 해당 플랫폼은 이전 세대 블랙웰 울트라 대비 3배 이상 향상된 AI 어텐션 가속 성능을 제공해 복잡한 AI 학습·추론 워크로드를 효율적으로 처리할 수 있도록 지원한다. 슈퍼마이크로는 엔비디아 HGX B300·B200, GB300·GB200, RTX PRO 6000 블랙웰 서버 에디션그래픽처리장치(GPU)를 기반으로 최신 제품군을 확장 중이다. 이 솔루션들은 ▲사이버 보안 및 리스크 탐지 ▲엔지니어링·설계 ▲헬스케어·생명과학 ▲데이터 분석·융합 플랫폼 ▲모델링·시뮬레이션 ▲보안 가상 인프라 등 주요 연방 정부 워크로드를 위한 연산 성능·효율성·확장성을 제공한다. 슈퍼마이크로는 미국 내 제조 역량을 기반으로 모든 정부용 시스템을 캘리포니아 새너제이에 위치한 글로벌 본사에서 개발·구축·검증한다. 이를 통해 무역협정법과 미국산우선구매법(BAA)을 모두 준수하며 공급망 보안을 강화하고 연방 정부의 신뢰성과 품질 요건을 충족한다는 방침이다. 슈퍼마이크로는 엔비디아 베라 루빈 NVL144 및 NVL144 CPX 플랫폼 기반 솔루션과 함께 자사 제품 중 가장 컴팩트한 2OU 엔비디아 HGX B300 8-GPU 솔루션도 공개했다. 해당 솔루션은 슈퍼마이크로의 데이터센터 빌딩 블록 솔루션(DCBBS) 기반의 OCP랙 스케일 아키텍처로, 하나의 랙당 최대 144개의 GPU를 지원한다. 이를 통해 정부의 데이터센터 내 대규모 AI 및 고성능 컴퓨터(HPC) 구축에 필요한 성능과 확장성을 제공한다. 또 슈퍼마이크로는 정부용 엔비디아 AI 팩토리 표준 설계를 지원하기 위해 AI 솔루션 제품군을 확장하고 있다. 이 표준 설계는 온프레미스와 하이브리드 클라우드 환경에서 다중 AI 워크로드를 구축·관리할 수 있도록 지원하는 엔드투엔드 풀스택 아키텍처로, 정부 기관의 보안성·신뢰성·확장성 표준을 충족하도록 설계됐다. 새롭게 확장된 제품군에는 엔비디아 GB300 기반 슈퍼 AI 스테이션과 새로운 랙 스케일 엔비디아 GB200 NVL4 HPC 솔루션이 포함된다. 찰스 리앙 슈퍼마이크로 사장 겸 최고경영자(CEO)는 "엔비디아와의 긴밀한 협력과 미국 내 제조 역량을 기반으로 미국 연방 정부가 신뢰할 수 있는 AI 구축 파트너로 자리매김하고 있다"며 "실리콘밸리의 중심지인 캘리포니아 새너제이에 본사와 제조시설, R&D 센터를 모두 두고 있어 연방 정부 고객을 위한 선도적 솔루션을 신속히 개발·구축·검증·제조할 수 있는 독보적 역량을 갖췄다"고 강조했다. 이어 "엔비디아와의 오랜 협력 관계를 바탕으로 미국 AI 인프라 개발의 선구자로서의 입지를 더욱 공고히 할 것"이라고 덧붙였다.

2025.11.04 15:29한정호 기자

젠슨 황의 조언 "AI 인프라 조성? AI 공장부터 먼저 지어라"

[경주=권봉석 기자] "한국은 피지컬 AI와 로보틱스를 결합해 세계 제조업 혁신을 주도할 잠재력을 가진 나라다. 성공적인 AI 팩토리 구축이 향후 생태계 성장을 좌우할 것이다." 31일 저녁 경주예술의전당 원화홀에서 국내외 기자단을 마주한 젠슨 황 엔비디아 CEO가 여러 번 강조한 메시지다. 젠슨 황 CEO는 이날 오후 경북 경주 예술의전당에서 진행 중인 '아시아태평양경제협력체(APEC) 최고경영자(CEO) 서밋' 마지막 순서인 특별 연설에서 엔비디아가 주도하는 GPU 기반 가속컴퓨팅의 혁신과 AI 산업의 잠재력을 설명했다. "AI 생태계 조성, 인프라 먼저 만들어라" 조언 젠슨 황 CEO는 '국내 AI 생태계 조성을 위해 가장 필요한 것이 무엇인가'라는 질문에 "인프라가 중요하다. GPU를 이용해 AI 구성 요소인 '토큰'을 생산하는 AI 팩토리 없이는 AI를 만들 수 없다"고 단언했다. 이어 "한국 정부와 기업이 도입하기로 한 GPU 26만 장은 스타트업·대학·연구기관이 함께 성장할 토대가 될 것이다. 또 AI는 작동하는 지역을 가리지 않으며 한국은 아시아의 AI 허브로 도약할 기회를 갖고 있다"고 설명했다. 그는 "피지컬 AI는 한국 뿐만 아니라 세계적인 문제인 노동력 부족 문제를 AI와 로봇으로 해결할 수 있으며 한국이 조선·자동차·반도체 등 물리 기반 산업을 보유한 만큼 피지컬 AI를 통해 급속히 성장할 수 있다"고 내다봤다. "차세대 GPU 순항중... 韓 메모리 기술 세계 최고" 엔비디아는 내년 하반기 출시를 목표로 차세대 GPU '루빈'(Rubin)을 개발중이다. 젠슨 황 CEO는 "현재 루빈 GPU 개발은 순조롭게 진행중이며 내년 하반기 출시 일정에도 변함이 없다"고 밝혔다. 고대역폭메모리(HBM) 공급사인 삼성전자와 SK하이닉스에 대해 그는 "두 회사는 집중(SK하이닉스)와 다양성(삼성전자) 등 서로 다른 강점을 지닌 회사다. 두 회사의 HBM4 시제품 모두 정상 작동중이며 앞으로도 꾸준히 협력할 것"이라고 평가했다. 이어 "한국의 메모리 기술은 세계 최고 수준이다. 여러분들은 자부심을 가져도 좋다. 양사 모두 엔비디아 성장을 지탱하는 핵심 축"이라고 극찬했다. "화웨이, 다양한 기술 강점 지녀... 과소평가 금물" 중국 화웨이는 스마트폰용 시스템반도체(SoC) 자체 설계와 생산에서 쌓은 노하우를 바탕으로 최근 AI 가속기 등 반도체로 역량을 확장하고 있다. 젠슨 황 CEO는 이런 화웨이의 행보에 "엔비디아는 세계 최고 AI 인프라 회사로 리더십을 유지하고 있지만, 화웨이를 과소평가하는 것은 어리석은 일"이라고 경계했다. 이어 "화웨이는 5G와 스마트폰, 네트워킹 등 다양한 기술에 강점을 지녔다. 이런 기업과 경쟁을 벌이는 것은 전체 업계와 산업 발전을 촉진할 것"이라고 설명했다. 한편 그는 중국 시장에서 엔비디아 영향력이 축소되는 상황에 아쉬움을 드러냈다. "중국은 크고 중요한 시장이며 개발자들이 많다. 또 엔비디아는 미국 회사이며 미국 AI 기술이 널리 보급되기를 바란다." "AI 경쟁력 우위 확보 위해 모든 요소 1년에 한 번씩 갈아 엎는다" 젠슨 황 CEO는 엔비디아가 경쟁자를 압도할 수 있는 이유로 CPU와 GPU, 네트워킹 칩과 소프트웨어를 통합 개발하는 '극한의 동시 디자인'(Extreme Co-Design)을 들었다. 그는 "AI는 단일 칩이 아니라 시스템의 문제이며, 이를 위해 매년 CPU와 GPU, 네트워킹 칩, 스위치 등 총 6개 칩을 새로 설계하며 아키텍처·시스템·소프트웨어를 동시에 설계한다. 어렵고 힘든 일이지만 다른 회사는 불가능하다"고 강조했다. 약 한 시간 동안 국내외 취재진의 질문에 답한 젠슨 황 CEO는 "컴퓨팅이 60년 만에 완전히 재설계되고 있다. 이제 시작된 AI 산업의 기회는 상상 이상이며 삼성전자와 SK하이닉스 두 파트너와 새로운 시대를 함께 열 것"이라고 말했다.

2025.10.31 21:23권봉석 기자

SK, HBM4 동작속도 10Gbps 이상 구현...마이크론 발등에 불?

SK하이닉스가 12일 내년 시장이 본격 개화되는 HBM4(6세대 고대역폭메모리) 개발을 완료하고 세계 첫 양산 체제를 구축했다고 발표하면서 기술 경쟁력을 한껏 뽐내고 있다. 경쟁사 대비 빠른 속도로, 동작속도 역시 업계 표준을 웃도는 10Gbps 이상을 구현한 것도 SK하이닉스의 시장 지배력 지속을 위한 긍정 신호로 평가되는 대목이다. 또한 주요 고객사인 엔비디아가 최근 HBM4에 필요한 동작속도 요구치를 올린 데 따른 대응으로 풀이된다. 반면 주요 경쟁사인 미국 마이크론은 위기를 맞았다는 평가다. HBM의 동작속도를 높이기 위해서는 '베이스 다이'의 성능이 중요한데, 마이크론의 경우 SK하이닉스, 삼성전자 대비 공정의 기술적 수준이 낮기 때문이다. 이에 업계는 마이크론이 오는 23일(현지시간) 진행하는 회계연도 4분기(6~8월) 실적발표에서 어떠한 대응책을 제시할 지 주목하고 있다. HBM4 동작속도 10Gbps 이상 구현…개발 속도 올려 HBM은 여러 개의 D램을 수직으로 연결해 데이터 처리 속도를 크게 끌어올린 메모리다. HBM4는 6세대 제품으로, 엔비디아가 내년 출시할 최신 AI 가속기인 '루빈' 칩에 채택될 예정이다. SK하이닉스의 이번 HBM4 개발 완료 발표는 업계의 예상을 앞서는 수준이다. 당초 엔비디아 측이 메모리사와 논의한 공식적인 퀄(품질) 테스트 시점은 내년 초쯤이다. 이에 따라 각 메모리 기업들은 올 3분기 엔비디아에 샘플을 대량으로 공급하며 개발 일정을 소화해 왔다. 다만 SK하이닉스는 이와 별개로 최근까지 HBM4에 대한 내부 인증을 마무리 수순까지 끌어올렸다. 이를 기반으로 개발 완료 일정을 최대한 앞당긴 것으로 풀이된다. HBM4에 구현한 동작속도도 눈에 띈다. SK하이닉스는 HBM4에 10Gbps(초당 10기가비트) 이상의 동작속도를 구현했는데, JEDEC(국제반도체표준화기구)의 표준 동작 속도인 8Gbps를 크게 뛰어 넘은 성과다. SK하이닉스가 동작속도를 강조한 이유는 바로 엔비디아에 있다. HBM4는 엔비디아가 내년 출시할 AI 가속기 '루빈(Rubin)' 칩에 채택될 예정이다. 당초 엔비디아는 HBM4에 8~9Gbps 수준의 동작속도를 요구했으나, 최근에는 기준을 10Gbps 이상으로 높인 것으로 알려졌다. 베이스 다이서 '열위' 평가 받는 마이크론…실적 발표서 대응 주목 HBM의 동작 속도 향상을 위해서는 HBM의 베이스(로직) 다이 성능이 중요하다는 게 업계 전문가들의 시각이다. 로직 다이는 HBM을 적층한 코어 다이의 메모리 컨트롤러 기능을 담당하는 칩으로, HBM과 GPU 등의 시스템반도체를 PHY(물리계층)으로 연결한다. SK하이닉스는 이전까지 HBM의 로직 다이를 D램 공정에서 제조해 왔다. 그러나 HBM4부터는 대만 주요 파운드리인 TSMC의 12나노미터(nm) 공정에 로직다이 양산을 맡겼다. 삼성전자도 자사 파운드리 사업부의 4나노 공정을 활용해, 성능 우위를 꾀하고 있다. 반면 마이크론은 HBM4에서도 D램 공정에서 로직 다이를 자체 제작하는 방안을 고수하기로 했다. 때문에 업계에서는 마이크론이 삼성전자·SK하이닉스 대비 엔비디아의 HBM4 동작속도 요구치에 부합하기 힘들 것이라는 전망이 우세해지고 있다. 이 경우 마이크론은 엔비디아의 하이엔드 제품향 HBM4 공급에 제한이 생길 수밖에 없다. 마이크론의 공식 대응이 주목되는 이유다. 마이크론은 삼성전자, SK하이닉스 등 국내 메모리 기업보다 한 달 앞서 분기 실적 발표를 진행한다. 마이크론의 회계연도 4분기 실적발표는 오는 23일로 예정돼 있다.

2025.09.12 13:29장경윤 기자

"1억 달러 넣으면 50억 달러 번다"…엔비디아, AI 추론 수익 모델 제시

엔비디아가 인공지능(AI) 추론 시장의 판도를 바꿀 특수 목적 그래픽처리장치(GPU)를 앞세워 '긴 컨텍스트' 시대의 기술 패권 장악에 나섰다. 엔비디아는 9일(현지시간) 회사 공식 블로그를 통해 새로운 루빈 아키텍처 기반의 '루빈 씨피엑스(CPX)' GPU와 이를 탑재한 '베라 루빈 엔브이엘144 씨피엑스(NVL144 CPX)' 랙 시스템을 공개했다. 이번에 공개된 '루빈 CPX'는 AI 추론의 두 단계 중 컴퓨팅 성능이 많이 필요한 '컨텍스트 단계'를 가속화하는 데 초점을 맞춘다. 기존 인프라가 방대한 데이터를 처리하며 겪던 병목 현상을 해결하는 것이 핵심이다. 이 GPU는 ▲30페타플롭스의 NVFP4 연산 성능 ▲128기가바이트(GB) GDDR7 메모리 ▲하드웨어 비디오 인코딩·디코딩 기능을 갖췄다. 기존 모델 대비 어텐션 가속 성능은 3배 향상됐다. 함께 선보인 '베라 루빈 NVL144 CPX' 랙은 단일 시스템에 '루빈 CPX' GPU 144개, 루빈 GPU 144개, 베라 중앙처리장치(CPU) 36개를 통합했다. 이를 통해 8엑사플롭스의 연산 성능과 100테라바이트(TB)의 고속 메모리를 제공한다. 메모리 대역폭은 초당 1.7페타바이트(PB/s)에 달한다. 이러한 구조는 추론 과정을 컴퓨팅 집약적인 컨텍스트 단계와 메모리 대역폭이 중요한 생성 단계로 분리해 처리하는 '분리형 추론' 아키텍처에 기반한다. 각 단계에 최적화된 하드웨어를 할당해 전체 효율을 극대화한다. 엔비디아는 이 플랫폼이 대규모 배포 시 30배에서 50배의 투자수익률(ROI)을 달성할 수 있다고 설명했다. 1억 달러(한화 약 1천388억원)의 자본 지출이 최대 50억 달러(한화 약 6조9천400억원)의 매출로 이어질 수 있다는 분석이다. 엔비디아 측은 "루빈 CPX GPU와 베라 루빈 NVL144 CPX 랙은 확장 가능한 다차원적 성능과 아키텍처 혁신을 통해 새로운 표준을 제시한다"며 "생성형 AI 애플리케이션의 새로운 가능성을 열 것"이라고 밝혔다.

2025.09.11 15:30조이환 기자

엔비디아, 루빈 울트라·파인만 AI칩 공개…"차세대 HBM 탑재"

엔비디아가 인공지능(AI) 반도체 산업의 주도권을 유지하기 위한 차세대 GPU를 추가로 공개했다. 오는 2027년 HBM4E(7세대 고대역폭메모리)를 탑재한 '루빈 울트라'를, 2028년에는 이를 뛰어넘을 '파인만(Feynman)' GPU를 출시할 예정이다. 파인만에 대한 구체적인 정보는 아직 공개되지 않았지만, '차세대 HBM(Next HBM)'을 비롯해 다양한 혁신 기술이 적용될 것으로 전망된다. 18일(현지시간) 젠슨 황 엔비디아 최고경영자(CEO)는 미국 실리콘밸리 새너제이 컨벤션 센터에서 열린 연례행사인 'GTC 2025' 무대에 올라 AI 데이터센터용 GPU 로드맵을 발표했다. 이날 발표에 따르면, 엔비디아는 최신형 AI 가속기인 '블랙웰' 시리즈의 최고성능 제품인 '블랙웰 울트라'를 올해 하반기 출시한다. 해당 칩은 12단 HBM3E(5세대 HBM)를 탑재했으며, AI 성능을 이전 세대 대비 1.5배 높인 것이 특징이다. 이어 엔비디아는 HBM4를 탑재한 '루빈' 시리즈를 내년 하반기 출시한다. 루빈부터는 기존 '그레이스' CPU가 아닌 '베라' CPU가 채용된다. 루빈의 최고성능 제품인 루빈 울트라는 내후년인 2027년 하반기께 출시가 목표다. 루빈 울트라에는 HBM4E가 채용돼, 메모리 성능이 블랙웰 울트라 대비 8배나 늘어난다. 그동안 드러나지 않았던 차차세대 AI 가속기에 대한 정보도 공개됐다. 엔비디아는 루빈 이후의 제품명을 파인만으로 확정했다. 미국의 저명한 이론 물리학자인 리처드 파인만에서 이름을 따왔다. 엔비디아는 파인만에 대해 차세대 HBM(Next HBM)을 탑재한다고 기술했다. 다만 구체적인 세대명은 공개하지 않았다. 파인만은 오는 2028년 출시될 예정이다.

2025.03.19 08:43장경윤 기자

엔비디아 'GTC 2025' 개막...젠슨 황 입 주목

엔비디아가 생성형 인공지능(AI)과 고성능 컴퓨팅 미래 비전을 제시한다. 엔비디아는 17일부터 21일(현지시간)까지 미국 캘리포니아 산호세에서 'GPU 테크놀로지 컨퍼런스(GTC) 2025'를 개최해 AI 시대 필요한 차세대 그래픽처리장치(GPU)를 비롯한 AI 칩, 소프트웨어(SW) 플랫폼을 발표한다. 이번 행사는 세션 약 1천개, 연사 2천명, 전시 400개로 구성됐다. 젠슨 황 엔비디아 최고경영자(CEO)는 18일 오전 10시 SAP 센터에서 기조연설을 진행한다. 매년 글로벌 기술 업계는 황 CEO 발표 내용에 주목했다. 엔비디아는 이번 황 CEO 연설이 AI와 고성능 컴퓨팅 기술에 초점을 맞출 예정이라고 밝혔다. 로보틱스, 소버린 AI, AI 에이전트, 자동차 분야 관련 발표도 진행된다. 다수 외신은 이번 행사에서 블랙웰 칩 라인업 업그레이드 버전이 공개될 가능성이 크다고 봤다. 앞서 황 CEO는 최근 실적 발표에서 차세대 블랙웰 B300 시리즈 '블랙웰 울트라'가 올해 하반기 출시될 예정이라고 밝힌 바 있다. 블랙웰 울트라는 기존보다 더 높은 컴퓨팅 성능을 제공하며, 288GB 메모리를 탑재했다. 메모리 집약적인 AI 모델을 실행하고 학습하는 데 적합할 것이라는 평가를 받고 있다. 차세대 GPU 시리즈인 '루빈'도 이번 GTC에서 언급될 것이란 분석도 이어지고 있다. 루빈은 2026년 출시 예정이다. 테크크런치는 "이번 행사에 루빈 이후 제품에 대한 내용도 일부 공개될 전망"이라며 "루빈 울트라 GPU 혹은 루빈 다음 세대의 GPU 아키텍처일 수도 있다"고 봤다. 엔비디아는 '퀀덤 데이'를 통해 양자 컴퓨팅 전략도 제시한다. 양자 컴퓨팅 분야 주요 인사들과 양자 애플리케이션 개발을 위한 로드맵을 논의할 예정이다. 외신은 엔비디아가 올해 행사 성과가 비즈니스에 영향 미칠 것이라고 봤다. 초기 블랙웰 GPU 과열 문제와 미국 수출 통제로 인한 관세 우려가 엔비디아 주가 하락으로 이어진 바 있다. 여기에 중국 AI 스타트업 딥시크가 딥시크-R1 모델을 출시하면서 투자자들은 고성능 GPU 수요에 대한 우려를 표하고 있다. 이 외에도 엔비디아는 이번 GTC에서 글로벌 기업과 연구 기관, 정부와 맺은 전략적 협업 사례와 성과도 소개한다고 밝혔다. 개발자와 기술 전문가를 위한 교육 세션을 전년보다 확대했다. 또 데이터 보안 등 AI 윤리적 측면을 다룬 토론회도 진행될 예정이다. 엔비디아는 "이번 GTC는 AI와 가속 컴퓨팅 미래를 결정짓는 중요한 자리가 될 것"이라며 "기술 혁신을 선도하고 글로벌 산업의 발전을 이끄는 계기가 될 것"이라고 공식 홈페이지를 통해 밝혔다.

2025.03.16 09:21김미정 기자

  Prev 1 2 3 Next  

지금 뜨는 기사

이시각 헤드라인

온플법, AI 시대에 낡은 규제 될 수도…플랫폼 B+학점

[현장] 미토스 충격파…"에이전틱 AI 체계, 선점이 곧 표준"

[영상] "데이터 유출 90%, 개발 환경서 발생"...느슨한 테스트 환경 원인

코스피 사상 첫 8000 돌파 마감…한때 8100 넘기도

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.