• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
  • AI의 눈
AI의 눈
HR컨퍼런스
디지털트러스트
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'GTC'통합검색 결과 입니다. (48건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

엔비디아, 개방형 휴머노이드 로봇 파운데이션 모델 공개

엔비디아가 18일(현지시간) 미국 새너제이에서 열린 'GTC 2025'에서 개방형 휴머노이드 로봇 파운데이션 모델인 '아이작 GR00T N1'을 발표했다. 엔비디아 아이작 GR00T N1은 일반화된 휴머노이드 추론과 기술을 위한 세계 최초 완전 맞춤형 개방형 파운데이션 모델이다. 젠슨 황 엔비디아 최고경영자(CEO)는 "일반적인 작업을 수행하는 로봇 기술의 시대가 도래했다"며 "GR00T N1과 새로운 데이터 생성 및 로봇 학습 프레임워크를 통해 전 세계 로봇 개발자들이 AI 시대의 새로운 지평을 열게 될 것"이라고 말했다. GR00T N1은 인간 인지 원리에서 착안한 이중 시스템 아키텍처를 채택했다. 시스템 1은 인간의 반사신경이나 직관을 반영한 신속한 사고 행동 모델이고, 시스템 2는 신중하고 체계적인 의사결정을 위한 모델이다. 로봇이 물체를 잡거나 이동시키는 등 일상작업을 물론 복잡한 단계를 거쳐야 하는 작업도 수행할 수 있다. 긴 맥락과 일반적인 기술의 조합이 필요한 다단계 작업도 수행할 수 있게 된다. 개발자들은 특정 휴머노이드 로봇과 작업에 맞춰 실제 또는 합성 데이터를 사용해 GR00T N1을 사후 훈련시킬 수 있다. 보스턴다이내믹스와 어질리티로보틱스, 멘티 로보틱스 등 주요 휴머노이드 개발사들이 GR00T N1을 미리 접근해 이용하고 있다. 엔비디아는 구글 딥마인드, 디즈니 리서치와 손잡고 로봇 개발용 오픈소스 물리 엔진 '뉴턴' 개발 소식도 전했다. 뉴턴은 워프 프레임워크를 기반으로 한다. 구글 딥마인드의 무조코와 엔비디아 아이작 랩 등 시뮬레이션 프레임워크와 호환된다. 구글 딥마인드와는 로보틱스 머신 러닝 작업을 70배 이상 가속화할 것으로 기대되는 '무조코-워프'를 공동 개발하고 있다. 디즈니 리서치는 GTC에서 선보인 스타워즈 BDX 드로이드를 포함해 차세대 엔터테인먼트 로봇 구동에 뉴턴을 활용할 예정이다. 엔비디아는 로봇 개발에 필요한 대규모 합성 조작 모션을 생성하기 위해 '아이작 GR00T 블루프린트'도 개발했다. 옴니버스와 코스모스 트랜스퍼를 기반으로 구축됐다. 소수의 인간 시연 데이터를 바탕으로 합성 모션 데이터를 대량 생성할 수 있다. 엔비디아 관계자는 "블루프린트를 이용해 사람이 9개월간 시연할 수 있는 데이터에 해당하는 78만 개의 합성 경로를 단 11시간 만에 생성했다"며 "데이터는 허깅 페이스를 통해 오픈소스로 공개했다"고 말했다.

2025.03.20 09:46신영빈 기자

엔비디아, 구글과 손잡고 AI 판도 재편…옴니버스로 '피지컬 AI' 혁신

엔비디아가 인공지능(AI) 추론, 기상 예측, 피지컬 AI 기반 산업 자동화 기술을 종합적으로 혁신하고 있다. 오픈소스 소프트웨어와 협력 이니셔티브를 통해 반도체 강자로서의 입지를 공고히 하는 동시에 AI 시대에서도 지속적인 경쟁력을 확보하기 위한 초읽기에 들어갔다. 엔비디아는 18일(현지 시간) 미국 새너제이에서 열린 GTC 2025에서 '다이나모', '어스-2', '옴니버스' 등의 AI 기술을 발표하고 알파벳과의 협력 이니셔티브를 공개했다. 지난 17일부터 닷새간 진행되는 이번 행사는 회사가 발전시킨 주요 기술과 업계 협력 사례를 공개하기 위해 마련됐다. 엔비디아는 '다이나모'를 통해 AI 추론 최적화를 실현하고 '어스-2'로 초정밀 기상 예측 솔루션을 선보였다. 더불어 알파벳·구글과 협력해 물리 AI 기반 로봇·신약 개발·전력망 최적화 등 다양한 산업 분야에서 AI 자동화를 추진하며 세부 기술력을 한층 고도화하고 있다. '다이나모'로 AI 추론 성능 극대화…'어스-2'로 기상 예측 혁신 엔비디아는 GTC 2025에서 '다이나모'와 '어스-2' 플랫폼을 공개했다. 각각 AI 모델의 성능 향상과 기상 예측 정밀도를 높이는 데 초점을 맞추고 있지만 두 기술 모두 엔비디아 GPU의 가속 성능을 극대화해 기존보다 효율적이면서도 신속한 모델 운영을 지원한다. '다이나모'는 대규모 그래픽처리장치(GPU) 클러스터에서 AI 추론을 최적화하는 소프트웨어다. 다수의 GPU를 활용해 AI 모델이 더 많은 데이터를 빠르게 처리하도록 돕는다. 특히 언어 모델의 추론을 각 단계별로 다른 GPU에 분산하는 '분리 서빙' 방식을 채택해 처리량을 극대화하고 비용을 절감할 수 있다. 기존 AI 추론 방식에는 모델이 한 번 계산한 데이터를 다시 연산하는 비효율이 존재했다. 이에 '다이나모'는 '스마트 라우터' 기능을 도입해 이미 연산된 정보를 특정 GPU에 저장하고 필요할 때 재사용할 수 있도록 한다. 이로써 대규모 AI 팩토리에서 토큰 수익을 극대화하고 GPU 활용도를 높일 수 있게 됐다. 특히 엔비디아 최신 GPU 아키텍처인 '호퍼' 기반 시스템에서 '다이나모'를 활용할 경우 동일한 수의 GPU에서 AI 모델의 처리량을 두 배 이상 증가시킬 수 있다. 또 'GB200 NVL72' 랙에서 딥시크 'R1' 모델을 실행할 때는 GPU당 생성되는 토큰 수가 30배 이상 증가하는 것으로 나타났다. 엔비디아는 AI 추론뿐만 아니라 기상 예측 기술도 혁신하고 있다. '다이나모'와 동시에 공개된 '어스-2 기상 분석용 블루프린트'는 AI 기반 고해상도 기상 예측 솔루션이다. 기후 변화로 인한 재해 위험이 증가하는 가운데 보다 정확하고 빠른 기상 예측이 가능하도록 지원한다. '어스-2 블루프린트'에는 AI 기상 모델 '포캐스트넷'과 고해상도 데이터 변환 모델 '코디프'가 포함됐다. 이들은 기존 CPU 기반 기상 예측보다 최대 500배 빠른 연산 속도를 제공한다. 또 GPU 기반 AI 기상 분석을 통해 보다 세밀한 지역별 기상 예측이 가능하며 예측 정확도도 향상됐다. 엔비디아는 이번 블루프린트를 통해 다양한 기업과 연구 기관이 기상 분석과 재해 대응에 AI를 활용할 수 있도록 돕고 있다. 실제로 아랍에미리트 국립기상센터(UAE NCM), 기상 리스크 관리 기업 JBA 리스크 매니지먼트, 위성 데이터 분석 기업 스파이어 글로벌 등이 어스-2 블루프린트를 도입해 자체 AI 예측 모델을 구축하고 있다. 특히 스파이어 글로벌은 엔비디아 GPU를 활용해 기존 물리 기반 기상 모델보다 1천배 빠른 예측 시스템을 개발했다. 이 시스템은 위성 데이터를 분석해 최대 45일간의 기후 변화를 예측할 수 있다. 젠슨 황 엔비디아 창립자 겸 최고경영자(CEO)는 "어느 때보다도 극심한 기상 이변과 자연재해가 인류의 생명, 재산을 위협하고 있다"며 "'어스-2용 옴니버스 블루프린트'는 전 세계 산업들을 도와 기후 변화와 기상 관련 재난의 대비, 피해 완화에 기여할 것"이라고 말했다. 알파벳과 함께 '물리 AI' 혁신 맞손…'옴니버스'로 산업 자동화 확대 엔비디아는 물리 분야에서도 AI 혁신을 주도하고 있다. 알파벳·구글과 협력해 물리 AI(Physical AI) 개발을 강화하고 산업용 AI 운영체제 '옴니버스'를 통해 산업 자동화를 가속하고 있다. 실제로 엔비디아는 이번 행사에서 알파벳과 함께 'AI 발전을 위한 공동 이니셔티브'를 발표했다. 이번 협력으로 엔비디아의 AI 가속 기술과 알파벳의 인공지능·로보틱스 연구가 결합돼 의료·제조·에너지·스포츠 등 산업 전반에서 AI 혁신을 가속화할 전망이다. 알파벳의 계열사인 구글 클라우드는 엔비디아의 최신 AI 인프라 'GB300 NVL72 랙 스케일 솔루션'과 'RTX PRO 6000 블랙웰 서버 에디션'을 가장 먼저 도입한다. AI 연구와 생산 시스템을 위한 인프라 최적화를 목표로, 생성형 AI의 투명성을 높이기 위해 구글 딥마인드의 AI 워터마킹 기술 '신스ID'도 도입하기로 했다. 알파벳의 로봇 연구 조직인 인트린직은 엔비디아의 '아이작 매니퓰레이터 파운데이션 모델'을 활용해 AI 기반 로봇 자동화 기술을 개발하고 있다. 이를 통해 산업용 로봇이 보다 정교한 작업을 수행할 수 있도록 지원하며 제조업체들이 AI 기반 로봇을 보다 쉽게 적용할 수 있도록 한다. 엔비디아는 물리 AI의 확장을 위해 '옴니버스 물리 AI 운영체제' 역시 전면 업그레이드했다. 옴니버스는 현실 데이터를 디지털 환경과 연결하는 산업용 AI 운영체제로, 제조업·물류·데이터센터·전력망 관리 등 다양한 분야에서 AI 최적화를 지원한다. 특히 이번 GTC 2025에서는 ▲AI 기반 로봇 공장 ▲물류 자동화 ▲데이터센터 디지털 트윈 ▲대규모 합성 데이터 생성을 포함한 4개의 새로운 '옴니버스 블루프린트'를 공개했다. 이를 통해 공장 자동화와 물류 시스템의 효율성을 높이고, AI 로봇의 학습 속도를 더욱 향상시킬 수 있도록 했다. 폭스콘, GM, 현대자동차, 메르세데스-벤츠 등 글로벌 제조 기업들은 이미 '옴니버스'를 도입해 생산라인과 물류 시스템을 최적화하고 있다. 현대차는 보스턴 다이내믹스의 '아틀라스' 로봇을 생산 공정에 적용해 테스트하고 있으며 메르세데스-벤츠는 '아폴로' 휴머노이드 로봇을 활용해 차량 조립 작업을 혁신하고 있다. 또 데이터센터 운영 효율을 높이기 위해 옴니버스를 활용한 디지털 트윈 시스템도 공개됐다. AI 팩토리 디지털 트윈을 통해 공장의 냉각·전력 시스템을 설계하고 시뮬레이션할 수 있어 AI 기반 데이터센터의 에너지 절감 효과를 극대화할 수 있다. 엔비디아는 클라우드 환경에서도 옴니버스 사용을 확대하고 있다. 아마존웹서비스(AWS), 마이크로소프트 애저, 오라클 클라우드, 구글 클라우드에서도 옴니버스를 지원해 개발자들이 보다 쉽게 AI 모델을 학습하고 배포할 수 있도록 하고 있다. 젠슨 황 엔비디아 CEO는 "우리는 알파벳과 AI 인프라 및 소프트웨어 구축부터 대규모 산업에서의 AI 활용을 촉진하는 데까지 오랜 기간 협력해 왔다"며 "신약 개발에서 로보틱스에 이르기까지 구글과 엔비디아의 연구진과 엔지니어들이 협력해 어려운 과제들을 해결해 나가는 모습을 보면 매우 뿌듯하다”고 말했다.

2025.03.19 11:50조이환 기자

지코어-미란티스, AI 모델 배포 효율성 강화 협력

지코어가 인공지능(AI) 추론 워크로드 배포 효율성을 높이기에 나섰다. 지코어가 오는 21일까지 미국 새너자이에서 열리는 AI 컨퍼런스 'GTC 2025'에서 미란티스와 협력한다고 19일 밝혔다. 이번 협력은 지코어의 AI 추론 솔루션 '에브리웨어 인퍼런스'를 미란티스의 오픈소스 플랫폼 관리 솔루션 '코어던트'에 통합하는 것이 핵심이다. 코어던트는 멀티 클라우드·하이브리드 환경에서 인프라 운영을 지원하는 솔루션이다. 이번 통합으로 기업은 그래픽처리장치(GPU) 등 컴퓨팅 자원을 최적화하고 AI 모델 배포를 간소화할 수 있다. 또 성능 모니터링과 비용 관리 기능이 향상되며, 지역별 데이터 주권 규정 준수도 용이해진다. AI 모델은 클라우드뿐만 아니라 온프레미스, 하이브리드, 엣지 환경에서도 배포 가능해졌다. 기업은 이를 활용해 대규모 AI 추론을 신속하게 운영할 수 있다. 알렉스 프리들랜드 미란티스 최고경영자(CEO)는 "오픈소스 기술은 글로벌 인프라 운영의 자율성과 제어권을 유지하는 데 중요한 역할을 한다"며 "지코어와의 협력으로 머신러닝 운영(MLOps)과 플랫폼 엔지니어가 직면한 문제 해결이 더욱 가속화될 것"이라고 말했다. 지코어 세바 베이너 엣지 클라우드·AI 제품 디렉터는 "이번 협력은 AI 추론 과정에서 발생하는 문제를 해결하기 위한 것"이라며 "기업이 AI 프로젝트를 보다 신속하게 시장에 출시하고 투자대비수익률(ROI)를 개선하는 데 기여할 것"이라고 밝혔다. 미쉬 스트로츠 렛츠AI CEO는 "기존 AI 모델 배포에는 많은 시간과 리소스가 필요했다"며 "이번 협력으로 몇 번의 클릭만으로 모델을 배포하고, 새로운 GPU도 몇 시간 내에 온보딩할 수 있어 생산성이 크게 향상될 것"이라고 평가했다.

2025.03.19 10:26김미정 기자

"삼성SDS도 신뢰한 AI 팩토리"…델-엔비디아, 기업용 AI 시장 공략 '박차'

델 테크놀로지스가 엔비디아와 손잡고 인공지능(AI) 인프라를 전면 업그레이드한다. 기업들의 AI 도입 장벽을 낮추고 혁신 속도를 끌어올려 시장 경쟁력을 강화하려는 행보다. 델 테크놀로지스는 18일 온라인 미디어 브리핑에서 '엔비디아 기반 델 AI 팩토리'의 최신 포트폴리오를 공개했다. 엔비디아의 'GTC 2025'와 동시에 열린 이번 간담회에서는 엔비디아와 델의 협력 성과가 집중 조명됐다. 델은 AI PC, 서버, 스토리지, 네트워킹 등 AI 인프라 전반을 아우르는 신제품을 대거 선보였다. 이날 발표를 진행한 바룬 차브라 델 인프라 및 텔레콤 마케팅 수석 부사장은 AI의 본격적인 산업 적용이 시작되면서 기업들은 AI 도입에 있어 여러 장애물을 마주하고 있는 점을 지적했다. 차브라 부사장에 따르면 현재 기업들은 ▲비용 통제 ▲데이터 관리 ▲기존 시스템과의 통합 ▲전문 인력 부족을 주요 도전 과제로 직면해 전체 중 77%의 기업이 AI 인프라 구축을 위해 '단일 벤더'를 선호하고 있다. 이에 따라 델은 엔비디아와의 협력을 통해 이 같은 시장 수요를 적극 공략할 계획이다. 실제로 델은 이번 브리핑에서 AI PC 시장 공략을 위한 신제품을 대거 선보였다. '델 프로 맥스 AI PC' 라인업에는 엔비디아의 최신 '그레이스 블랙웰' 아키텍처가 적용됐다. 기존 데이터센터에서만 활용되던 AI 개발용 그래픽처리장치(GPU) 성능을 데스크톱에서도 구현한 것이 특징이다. 연구자와 개발자를 위한 소형 워크스테이션뿐 아니라 784기가바이트(GB) 메모리와 20페타플롭스(PFLOPS) 성능을 갖춘 고성능 AI 개발용 PC도 함께 공개됐다. 데이터센터 부문에서도 델과 엔비디아의 협력은 강화된다. 차브라 부사장에 따르면 델은 엔비디아의 최신 블랙웰 GPU와 커넥트X8 슈퍼닉스를 지원한다. 특히 곧 출시될 '델 파워엣지 XE 8712(PowerEdge XE8712)' 서버는 노드당 2개의 그레이스 CPU와 4개의 블랙웰 GPU를 탑재해 데이터센터 내 AI 성능을 극대화할 것으로 예상된다. 한 랙에 144개의 GPU를 수용할 수 있어 초고밀도 AI 연산 환경을 구축할 수 있다. AI 데이터 관리 역시 델의 핵심 혁신 분야 중 하나다. 이를 위해 '델 AI 데이터 팩토리 위드 엔비디아(Dell AI Factory with NVIDIA)'는 기업들이 AI 데이터를 더 빠르게 처리하고 보다 안전하게 보호할 수 있도록 설계됐다. 이 플랫폼은 대량의 데이터를 실시간으로 받아들이는 데이터 인제스천 기능을 지원하며 GPU 가속 기반 '스파크 쿼리'를 활용해 기존 대비 최대 220% 향상된 속도로 데이터를 분석하고 처리할 수 있다. 차브라 부사장은 "AI의 성능을 극대화하려면 데이터를 빠르게 처리하고 안전하게 보관하는 것이 필수"라며 "우리 AI 데이터 팩토리는 대규모 AI 워크로드를 보다 효율적으로 운영할 수 있도록 설계돼 기업들의 AI 도입 속도를 한층 끌어올릴 것"이라고 설명했다. AI 소프트웨어 분야에서도 델과 엔비디아의 협력은 이어지고 있다. 델은 '에이전트 AI' 시스템 개발을 지원하는 엔비디아의 AI 개발 프레임워크인 '에이전틱 AI'와 이를 위한 AI 최적화 도구를 AI 팩토리에 통합했다. 이에 따라 기업들은 AI가 단순한 질의응답을 넘어 스스로 의사 결정을 내릴 수 있는 시스템을 구축할 수 있게 됐다. 회사는 AI 인프라 구축뿐만 아니라 AI 네트워킹 및 배포 서비스도 강화하고 있다. 네트워크 최적화, GPU 서버 구축, 다중 벤더 환경 통합 등 다양한 AI 전문 서비스를 제공하며 AI 프로젝트의 초기 단계부터 운영까지 전 과정을 지원한다. 이같이 AI 도입이 빠르게 확산되면서 델과 엔비디아의 협력도 지속적인 탄력을 받고 있다. 양사는 지난해 GTC에서 '델 AI 팩토리 위드 엔비디아'를 공개한 이후 지난 1년간 100개 이상의 신규 AI 제품을 출시하고 2천 개 이상의 고객을 확보했다. 특히 삼성SDS는 델과 협력해 AI 팩토리를 구축했으며 이를 통해 모델 정확도를 98%까지 향상시키고 업무 생산성을 70% 이상 개선한 것으로 알려졌다. 스콧 구 삼성SDS 클라우드 서비스 사업부문 부사장은 델-엔비디아 협력을 두고 "우리는 모든 고객을 위한 AI 팩토리를 구축하고 있다"며 "이를 서비스 형태로 안전하게 제공하거나 고객의 자체 환경에 배포할 수 있도록 하고 있다"고 말했다. 향후에도 델은 엔비디아와 협력해 AI 시장에서의 입지를 더욱 강화할 계획이다. 바룬 초프라 델 수석 부사장은 "우리는 엔비디아와 AI 도입을 가속화할 수 있는 완벽한 파트너"라며 "AI 생태계 전반에서 기업들이 혁신을 실현할 수 있도록 지원할 것"이라고 강조했다.

2025.03.19 08:32조이환 기자

"AI 에이전트 시대 주도"…엔비디아, 추론 강화 돕는 SW 공개

엔비디아가 인공지능(AI) 에이전트 시대 본격화를 위한 기술 로드맵을 공개했다. AI 에이전트 개발·유지에 필요한 소프트웨어(SW) 기술을 비롯한 오픈소스 추론 모델 시리즈, 기업용 AI 워크플로 솔루션까지 잇따라 선보였다. 엔비디아는 17~21일까지(현지시간) 미국 새너제이에서 열리는 개발자 회의 'GTC 2025' 미디어 프리브리핑에서 AI 에이전트 개발·추론 강화에 필요한 SW 기술을 공개했다. 이를 통해 AI 에이전트 기술 생태계를 선점하고 기업용 AI 시장에서 주도권을 확보 하려는 전략이다. 이번에 발표할 주요 SW 제품으로는 AI 추론 모델 성능 강화를 돕는 '엔비디아 다이나모(NVIDIA Dynamo)'와 오픈소스 모델 '라마 네모트톤(Llama Nemotron)' 시리즈, '엔비디아 IQ 블루프린트'다. 엔비디아는 해당 제품 모두 AI 에이전트 구축 필수 요소로 자리잡을 것이라 재차 강조했다. '엔비디아 다이나모'로 AI 모델 추론 강화 이번 행사에서 엔비디아는 '엔비디아 다이나모'를 발표한다. 엔비디아 다니어모는 대규모 AI 추론 모델 성능을 올리는 오픈소스 소프트웨어(SW)다. 엔비디아 다이나모는 전체 데이터센터에서 분산·분해 방식으로 작동한다. 분산 방식은 하나의 AI 작업을 여러 개 GPU로 나눠 동시 처리하는 식이다. 기존에는 단일 GPU가 연산을 수행하는 방식이었다면, 다이나모는 동일 작업을 여러 GPU가 협력해 처리하도록 설계됐다. 이를 통해 대량 데이터를 더 빠르고 효율적으로 분석할 수 있다는 설명이다. 엔비디아는 다이나모 분해 방식도 핵심 요소로 꼽았다. 이 방식은 AI 모델이 하나의 질문을 받으면 이를 작은 단위로 쪼개 여러 GPU에 나눠 연산을 수행한다. 이후 최종 결과를 합치는 식이다. 이는 GPU 간 연산 부담을 줄이고 처리 속도를 높일 수 있다. 특히 데이터센터 내 수백~수천 개 GPU가 동시에 운영될 경우, 다이나모 최적화 기술이 GPU 성능 향상을 극대화할 수 있다. 다이나모는 해당 작동방식에 기반해 쿼리 하나를 최대 1천개 그래픽장치(GPU)로 확장할 수 있도록 설계됐다. 기존 방식보다 GPU 활용도를 높여 동일 개수의 GPU로도 처리량을 두 배까지 늘릴 수 있다. AI 모델이 데이터 처리하는 속도가 늘면 자연스럽게 비용 절감 효과와 처리 가능한 데이터 양도 는다. 향후 AI 기반 서비스 운영 효율성을 높이는 핵심 요소로 작용할 전망이다. 여기에 엔비디아의 최신 GPU 네트워크 기술 'NY링크'를 결합하면 성능 향상 폭이 더욱 커진다. NY링크는 GPU 간 데이터 전송 속도를 높이는 기술이다. AI 모델 연산 과정에서 병목현상을 줄이는 역할을 한다. 이를 통해 같은 개수의 GPU를 사용하면서도 최대 30배까지 처리 성능을 끌어올릴 수 있다. 이 외에도 다이나모는 파이토치(PyTorch)를 비롯한 텐서RT, sglang 등 다양한 AI 프레임워크와 호환되는 개방형 아키텍처를 지원한다. 이를 통해 기존 AI 모델을 변경하지 않고도 성능을 개선할 수 있다. 엔비디아는 "딥시크처럼 대규모 데이터를 처리하는 모델은 연산량이 많아 GPU의 확장성이 중요하다"며 "다이나모는 이런 대형 모델 연산 부담을 효과적으로 분산시키는 역할을 한다"고 강조했다. "똑똑한 AI 에이전트 구축"…오픈소스 모델 '라마 네모트론' 시리즈 엔비디아는 AI 에이전트 추론 능력 강화를 위해 새 오픈소스 AI 모델 '라마 니모트론(Llama Nemotron)' 시리즈를 내놨다. 이는 비즈니스 환경에서 즉시 활용 가능한 AI 추론 모델이다. 주로 복잡한 문제 해결을 위한 고급 AI 에이전트 구축에 사용된다. 메타의 오픈소스 모델 '라마' 기반으로 작동한다. 엔비디아는 "해당 모델은 알고리즘적으로 가지치기 과정을 거쳐 모델 크기를 줄였다"며 "이로 인해 컴퓨팅 자원을 덜 소모하면서도 정확도를 유지할 수 있게 최적화됐다"고 설명했다. 또 "사후학습 기법을 통해 라마 니모트론 모델을 더욱 개선했다"고 말했다. 그러면서 "주로 수학 문제 해결과 도구 호출, 명령어 처리, 대화 기능 등 여러 분야에서 최상의 추론 성능을 발휘할 수 있다"고 말했다. 라마 니모트론 모델군은 '나노(Nano)'와 '수퍼(Super)' '울트라(Ultra)' 버전으로 이뤄졌다. 나노는 해당 모델 크기에서 가장 높은 추론 정확도를 제공한다. 수퍼는 단일 데이터센터 GPU에서 가장 빠른 처리 속도를 제공한다. 울트라는 데이터센터급 멀티 GPU 환경에서 AI 에이전트 추론 정확도 극대화를 돕는 모델이다. 나노와 수퍼는 이번 GTC에서 NIM 마이크로서비스 형태로 제공된다. 울트라 모델은 추후 공개된다. 해당 모델 시리즈는 데이터셋 관련 기술과 패키지 형태로 제공된다. 이 데이터셋은 엔비디아가 생성한 600억 개 토큰으로 구성한 합성 데이터셋이다. 약 36만 시간의 H100 GPU 추론 수행과 4만 5천 시간의 인간 주석 작업을 통해 개발됐다. 이 외에도 해당 모델 시리즈는 추론 기능을 온·오프(toggle on/off)할 수 있는 옵션도 제공한다. 이는 오픈 모델에서는 드문 기능인 것으로 평가받고 있다. '엔비디아 IQ 블루프린트'로 AI 에이전트 유연성 높였다 엔비디아는 '엔비디아 IQ 블루프린트'를 출시했다. 해당 솔루션은 4월부터 이용 가능하다. IQ 블루프린트는 개발자가 NIM으로 AI 에이전트를 구축하고 이를 엔터프라이즈 비즈니스 시스템과 연결하게 돕는 AI 워크플로 도구다. 이를 통해 AI 에이전트가 텍스트, 이미지, 영상 등 여러 데이터 유형을 검색·활용할 수 있게 지원한다. 웹 검색이나 다른 AI 에이전트와 같은 외부 도구 활용도 가능하다. 또 다수 AI 에이전트가 팀을 이뤄 협력할 때 개발자가 AI 시스템 작동 과정을 모니터링하고 성능을 개선할 수 있도록 가시성과 투명성을 제공한다. 엔비디아는 "IQ 블루프린트를 활용하면 AI 에이전트 정확도를 높이고, 복잡한 작업 처리 시간을 몇 시간에서 몇 분으로 단축할 수 있다"고 강조했다. 또 엔비디아는 주요 데이터 스토리지 기업과 협력해 AI 데이터 플랫폼을 개발 중이라고 밝혔다. 해당 플랫폼에는 네모 리트리버와 IQ 블루프린트, 블랙웰 GPU, 스펙트럼-X 네트워킹, 블루필드 DPU 등이 포함된다. 이를 통해 실시간에 가까운 데이터 기능을 제공할 방침이다. 엔비디아는 "앞으로 엔터프라이즈 데이터가 AI 에이전트를 위한 핵심 자원으로 활용될 전망"이리며 데이터 플랫폼 개발 배경을 밝혔다. 그러면서 "현재 기업 데이터 저장 시스템은 단순히 파일을 저장하고 제공하는 역할만 수행하고 있다"며 "AI 에이전트가 도입되면, 기업은 데이터 저장·관리 시스템을 지식 제공 시스템으로 전환할 수 있다"고 강조했다.

2025.03.19 05:02김미정 기자

SK하이닉스, 엔비디아 연례 행사서 HBM4·SOCAMM 등 공개

SK하이닉스는 17일부터 21일(현지시간)까지 미국 새너제이에서 엔비디아가 주최하는 글로벌 AI 컨퍼런스인 'GTC 2025'에 참가해, 'Memory, Powering AI and Tomorrow(메모리가 불러올 AI의 내일)'를 주제로 부스를 운영한다고 18일 밝혔다. 회사는 HBM을 포함해 AI 데이터센터, 온디바이스, 오토모티브 분야 메모리 설루션 등 AI 시대를 이끌 다양한 메모리 제품을 전시한다. 회사는 "HBM3E 12단 이외에 새로운 AI 서버용 메모리 표준으로 주목받고 있는 SOCAMM(저전력 D램 기반의 AI 서버 특화 메모리 모듈)도 함께 전시해, 선도적인 AI 메모리 기술력을 선보이겠다"고 말했다. 이번 행사에는 곽노정 대표이사 사장(CEO), 김주선 AI Infra(인프라) 사장(CMO), 이상락 부사장(Global S&M 담당) 등 회사 주요 경영진이 참석해 글로벌 AI 산업 리더들과의 협력을 공고히 할 예정이다. 세계 최초로 5세대 HBM(HBM3E) 12단 제품을 양산해 고객사에 공급 중인 SK하이닉스는 올 하반기 내로 HBM4 12단 제품 양산 준비를 마치고, 고객이 원하는 시점에 맞춰 공급을 시작한다는 방침이다. 이번 전시에는 개발중인 HBM4 12단의 모형도 함께 전시될 예정이다. 김주선 SK하이닉스 사장은 “이번 GTC에서 AI 시대의 선도 제품을 선보여 뜻 깊게 생각한다”며 “차별화된 AI 메모리 경쟁력을 통해 '풀 스택 AI 메모리 프로바이더(Full Stack AI Memory Provider)'로서의 미래를 앞당길 것”이라고 말했다.

2025.03.19 05:00장경윤 기자

엔비디아 'GTC 2025' 개막...젠슨 황 입 주목

엔비디아가 생성형 인공지능(AI)과 고성능 컴퓨팅 미래 비전을 제시한다. 엔비디아는 17일부터 21일(현지시간)까지 미국 캘리포니아 산호세에서 'GPU 테크놀로지 컨퍼런스(GTC) 2025'를 개최해 AI 시대 필요한 차세대 그래픽처리장치(GPU)를 비롯한 AI 칩, 소프트웨어(SW) 플랫폼을 발표한다. 이번 행사는 세션 약 1천개, 연사 2천명, 전시 400개로 구성됐다. 젠슨 황 엔비디아 최고경영자(CEO)는 18일 오전 10시 SAP 센터에서 기조연설을 진행한다. 매년 글로벌 기술 업계는 황 CEO 발표 내용에 주목했다. 엔비디아는 이번 황 CEO 연설이 AI와 고성능 컴퓨팅 기술에 초점을 맞출 예정이라고 밝혔다. 로보틱스, 소버린 AI, AI 에이전트, 자동차 분야 관련 발표도 진행된다. 다수 외신은 이번 행사에서 블랙웰 칩 라인업 업그레이드 버전이 공개될 가능성이 크다고 봤다. 앞서 황 CEO는 최근 실적 발표에서 차세대 블랙웰 B300 시리즈 '블랙웰 울트라'가 올해 하반기 출시될 예정이라고 밝힌 바 있다. 블랙웰 울트라는 기존보다 더 높은 컴퓨팅 성능을 제공하며, 288GB 메모리를 탑재했다. 메모리 집약적인 AI 모델을 실행하고 학습하는 데 적합할 것이라는 평가를 받고 있다. 차세대 GPU 시리즈인 '루빈'도 이번 GTC에서 언급될 것이란 분석도 이어지고 있다. 루빈은 2026년 출시 예정이다. 테크크런치는 "이번 행사에 루빈 이후 제품에 대한 내용도 일부 공개될 전망"이라며 "루빈 울트라 GPU 혹은 루빈 다음 세대의 GPU 아키텍처일 수도 있다"고 봤다. 엔비디아는 '퀀덤 데이'를 통해 양자 컴퓨팅 전략도 제시한다. 양자 컴퓨팅 분야 주요 인사들과 양자 애플리케이션 개발을 위한 로드맵을 논의할 예정이다. 외신은 엔비디아가 올해 행사 성과가 비즈니스에 영향 미칠 것이라고 봤다. 초기 블랙웰 GPU 과열 문제와 미국 수출 통제로 인한 관세 우려가 엔비디아 주가 하락으로 이어진 바 있다. 여기에 중국 AI 스타트업 딥시크가 딥시크-R1 모델을 출시하면서 투자자들은 고성능 GPU 수요에 대한 우려를 표하고 있다. 이 외에도 엔비디아는 이번 GTC에서 글로벌 기업과 연구 기관, 정부와 맺은 전략적 협업 사례와 성과도 소개한다고 밝혔다. 개발자와 기술 전문가를 위한 교육 세션을 전년보다 확대했다. 또 데이터 보안 등 AI 윤리적 측면을 다룬 토론회도 진행될 예정이다. 엔비디아는 "이번 GTC는 AI와 가속 컴퓨팅 미래를 결정짓는 중요한 자리가 될 것"이라며 "기술 혁신을 선도하고 글로벌 산업의 발전을 이끄는 계기가 될 것"이라고 공식 홈페이지를 통해 밝혔다.

2025.03.16 09:21김미정 기자

'AI 대장주' 엔비디아, 투자자 기대 부응할까

'인공지능(AI) 대장주' 엔비디아는 투자자들의 기대에 부응하는 실적을 내놓을 수 있을까? 비즈니스인사이더는 25일(현지시간) 엔비디아 실적 발표를 하루 앞두고 월가 분석가들의 전망을 정리한 이 내놓은 엔비디아의 실적 발표 전망을 모아서 25일 보도했다. 엔비디아는 26일 2024 회계연도 4분기 실적을 발표할 예정이다. 미즈호 증권 “단기적으로 성장 고통도 예상” 미즈호증권 분석가들은 엔비디아가 탄탄한 실적을 공개할 것으로 예상하면서도 "성장의 고통도 있을 것”이라고 전망했다. 블랙웰의 강력한 상승세가 올해 상반기 매출 손실을 만회할 것으로 기대하기 때문에 하반기 실적에 초점을 맞추고 있다고 설명했다. 또 "엔비디아가 강력한 고객 관계를 구축한 통합 하드웨어(HW) 플랫폼을 비롯해 CUDA(쿠다) 생태계를 통해 강력한 업계 리더십을 계속 유지 중"이라며, "주요 고객인 마이크로소프트(MS), 아마존, 알파벳이 올해 말 블랙웰 그래픽처리장치(GPU) 구매를 확대할 것으로 예상한다"고 덧붙였다. 미즈호는 엔비디아에 시장 평균보다 더 잘했다는 '아웃퍼폼'(Outperform) 등급을 부여하고 목표 가격을 175달러로 제시했다. 웨드부시 증권 “좋은 소식 기대” 웨드부시 증권은 "젠슨 황이 블랙웰과 AI 자본지출(Capex)의 엄청난 수요를 견인하는 요인을 설명하며 투자자들의 불안을 달래줄 엔비디아의 강력한 실적과 '비트 앤레이즈'(실적이 분석가 예상치를 웃돌고 향후 전망치도 상향하는 것)를 기대한다”고 밝혔다. 그러면서 "어떤 고객도 엔비디아의 차세대 칩과 관련해 '줄을 서다 자리를 잃는' 일은 원하지 않는다"라며 딥시크로 인해 엔비디아의 영향력이 줄지 않았다고 평했다. 뱅크오브아메리카(BofA) “다음 촉매는 GTC 컨퍼런스” BofA 분석가들은 엔비디아 실적이 추정치를 뛰어넘을 것으로 예상하며, 올해 데이터센터 매출이 전년 대비 60% 급증할 것으로 예상한다고 밝혔다. 비벡 아리아 BoA 분석가는 이달 초 "딥시크의 혁명적 최적화에도 불구하고 MS, 메타를 비롯한 엔비디아의 대형 고객들의 지출 계획은 지금까지 변화가 없다”고 밝혔다. 또, “HW와 소프트웨어(SW) 최적화가 '컴퓨팅의 핵심 부분'이라고 말하며, 딥시크로 인해 엔비디아의 매출이 감소하는 일은 일어나지 않을 것”으로 내다봤다. 또, 오는 3월 개최될 GTC 컨퍼런스가 큰 촉매제라고 밝혔다. 여기서 투자자들의 초점이 기존 블랙웰에서 벗어나 루빈(Rubin) GPU와 자율 로봇 솔루션 등 차세대 제품으로 이동할 수 있을 것으로 기대했다. BoA는 엔비디아에 '매수' 등급을 매기고 목표가를 190달러로 책정했다. 블룸버그 인텔리전스 “블랙웰, 궤도에 올랐다” 블룸버그 인텔리전스 기술 분석가 쿤잔 소브하니는 지난 주 엔비디아가 "블랙웰 GPU의 상당한 증가에 따라 4분기 매출 전망치를 충족하고 1분기 가이던스를 상향 조정할 것으로 보인다”고 밝혔다. 또, "주요 고객에 대한 초기 선적은 오는 4분기에 시작돼 내년 1분기까지 증가할 것"이라며, “메타, MS, 아마존 웹서비스, 구글 등의 자본지출 가이던스 증가는 단기 판매에 대한 확신을 높여준다"고 설명했다. 비즈니스인사이더는 이번 실적 발표에서 차세대 블랙웰 칩의 수요가 여전히 높고 중국 딥시크로 인해 엔비디아가 부정적인 영향을 받지 않았다는 점을 투자자들에게 증명해야 할 것으로 보인다고 전했다. 최근 중국 딥시크가 등장하면서 데이터센터 운영에 예상했던 만큼의 컴퓨팅 능력이 필요치 않아 엔비디아의 GPU 판매가 줄어들 것이라는 투자자들의 우려가 나왔다. 이에 젠슨 황 엔비디아 최고경영자(CEO)는 "딥시크의 효율성 향상으로 인해 AI 도입과 발전하는 속도가 더욱 빨라질 뿐"이라고 주장했다. 블룸버그 자료에 따르면, 엔비디아의 작년 4분기 매출은 작년 같은 기간의 약 200억 달러에 비해 73% 증가한 382억 달러에 달할 것으로 예상된다.

2025.02.26 16:03이정현 미디어연구소

  Prev 1 2 3 Next  

지금 뜨는 기사

이시각 헤드라인

SK하이닉스 1분기 영업이익률이 무려 72%...마이크론-TSMC 제쳐

"엔비디아 제친다"…구글, 학습·추론용 '8세대 TPU' 공개

고유가 지원금 코 앞인데…CU 물류 파업에 촉각

괴물 보안AI '미토스' 해킹 당했나…앤트로픽, 또 보안사고

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.