• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
  • AI의 눈
AI의 눈
HR컨퍼런스
디지털트러스트
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'엔비디아 GTC'통합검색 결과 입니다. (44건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

"AI 에이전트 시대 주도"…엔비디아, 추론 강화 돕는 SW 공개

엔비디아가 인공지능(AI) 에이전트 시대 본격화를 위한 기술 로드맵을 공개했다. AI 에이전트 개발·유지에 필요한 소프트웨어(SW) 기술을 비롯한 오픈소스 추론 모델 시리즈, 기업용 AI 워크플로 솔루션까지 잇따라 선보였다. 엔비디아는 17~21일까지(현지시간) 미국 새너제이에서 열리는 개발자 회의 'GTC 2025' 미디어 프리브리핑에서 AI 에이전트 개발·추론 강화에 필요한 SW 기술을 공개했다. 이를 통해 AI 에이전트 기술 생태계를 선점하고 기업용 AI 시장에서 주도권을 확보 하려는 전략이다. 이번에 발표할 주요 SW 제품으로는 AI 추론 모델 성능 강화를 돕는 '엔비디아 다이나모(NVIDIA Dynamo)'와 오픈소스 모델 '라마 네모트톤(Llama Nemotron)' 시리즈, '엔비디아 IQ 블루프린트'다. 엔비디아는 해당 제품 모두 AI 에이전트 구축 필수 요소로 자리잡을 것이라 재차 강조했다. '엔비디아 다이나모'로 AI 모델 추론 강화 이번 행사에서 엔비디아는 '엔비디아 다이나모'를 발표한다. 엔비디아 다니어모는 대규모 AI 추론 모델 성능을 올리는 오픈소스 소프트웨어(SW)다. 엔비디아 다이나모는 전체 데이터센터에서 분산·분해 방식으로 작동한다. 분산 방식은 하나의 AI 작업을 여러 개 GPU로 나눠 동시 처리하는 식이다. 기존에는 단일 GPU가 연산을 수행하는 방식이었다면, 다이나모는 동일 작업을 여러 GPU가 협력해 처리하도록 설계됐다. 이를 통해 대량 데이터를 더 빠르고 효율적으로 분석할 수 있다는 설명이다. 엔비디아는 다이나모 분해 방식도 핵심 요소로 꼽았다. 이 방식은 AI 모델이 하나의 질문을 받으면 이를 작은 단위로 쪼개 여러 GPU에 나눠 연산을 수행한다. 이후 최종 결과를 합치는 식이다. 이는 GPU 간 연산 부담을 줄이고 처리 속도를 높일 수 있다. 특히 데이터센터 내 수백~수천 개 GPU가 동시에 운영될 경우, 다이나모 최적화 기술이 GPU 성능 향상을 극대화할 수 있다. 다이나모는 해당 작동방식에 기반해 쿼리 하나를 최대 1천개 그래픽장치(GPU)로 확장할 수 있도록 설계됐다. 기존 방식보다 GPU 활용도를 높여 동일 개수의 GPU로도 처리량을 두 배까지 늘릴 수 있다. AI 모델이 데이터 처리하는 속도가 늘면 자연스럽게 비용 절감 효과와 처리 가능한 데이터 양도 는다. 향후 AI 기반 서비스 운영 효율성을 높이는 핵심 요소로 작용할 전망이다. 여기에 엔비디아의 최신 GPU 네트워크 기술 'NY링크'를 결합하면 성능 향상 폭이 더욱 커진다. NY링크는 GPU 간 데이터 전송 속도를 높이는 기술이다. AI 모델 연산 과정에서 병목현상을 줄이는 역할을 한다. 이를 통해 같은 개수의 GPU를 사용하면서도 최대 30배까지 처리 성능을 끌어올릴 수 있다. 이 외에도 다이나모는 파이토치(PyTorch)를 비롯한 텐서RT, sglang 등 다양한 AI 프레임워크와 호환되는 개방형 아키텍처를 지원한다. 이를 통해 기존 AI 모델을 변경하지 않고도 성능을 개선할 수 있다. 엔비디아는 "딥시크처럼 대규모 데이터를 처리하는 모델은 연산량이 많아 GPU의 확장성이 중요하다"며 "다이나모는 이런 대형 모델 연산 부담을 효과적으로 분산시키는 역할을 한다"고 강조했다. "똑똑한 AI 에이전트 구축"…오픈소스 모델 '라마 네모트론' 시리즈 엔비디아는 AI 에이전트 추론 능력 강화를 위해 새 오픈소스 AI 모델 '라마 니모트론(Llama Nemotron)' 시리즈를 내놨다. 이는 비즈니스 환경에서 즉시 활용 가능한 AI 추론 모델이다. 주로 복잡한 문제 해결을 위한 고급 AI 에이전트 구축에 사용된다. 메타의 오픈소스 모델 '라마' 기반으로 작동한다. 엔비디아는 "해당 모델은 알고리즘적으로 가지치기 과정을 거쳐 모델 크기를 줄였다"며 "이로 인해 컴퓨팅 자원을 덜 소모하면서도 정확도를 유지할 수 있게 최적화됐다"고 설명했다. 또 "사후학습 기법을 통해 라마 니모트론 모델을 더욱 개선했다"고 말했다. 그러면서 "주로 수학 문제 해결과 도구 호출, 명령어 처리, 대화 기능 등 여러 분야에서 최상의 추론 성능을 발휘할 수 있다"고 말했다. 라마 니모트론 모델군은 '나노(Nano)'와 '수퍼(Super)' '울트라(Ultra)' 버전으로 이뤄졌다. 나노는 해당 모델 크기에서 가장 높은 추론 정확도를 제공한다. 수퍼는 단일 데이터센터 GPU에서 가장 빠른 처리 속도를 제공한다. 울트라는 데이터센터급 멀티 GPU 환경에서 AI 에이전트 추론 정확도 극대화를 돕는 모델이다. 나노와 수퍼는 이번 GTC에서 NIM 마이크로서비스 형태로 제공된다. 울트라 모델은 추후 공개된다. 해당 모델 시리즈는 데이터셋 관련 기술과 패키지 형태로 제공된다. 이 데이터셋은 엔비디아가 생성한 600억 개 토큰으로 구성한 합성 데이터셋이다. 약 36만 시간의 H100 GPU 추론 수행과 4만 5천 시간의 인간 주석 작업을 통해 개발됐다. 이 외에도 해당 모델 시리즈는 추론 기능을 온·오프(toggle on/off)할 수 있는 옵션도 제공한다. 이는 오픈 모델에서는 드문 기능인 것으로 평가받고 있다. '엔비디아 IQ 블루프린트'로 AI 에이전트 유연성 높였다 엔비디아는 '엔비디아 IQ 블루프린트'를 출시했다. 해당 솔루션은 4월부터 이용 가능하다. IQ 블루프린트는 개발자가 NIM으로 AI 에이전트를 구축하고 이를 엔터프라이즈 비즈니스 시스템과 연결하게 돕는 AI 워크플로 도구다. 이를 통해 AI 에이전트가 텍스트, 이미지, 영상 등 여러 데이터 유형을 검색·활용할 수 있게 지원한다. 웹 검색이나 다른 AI 에이전트와 같은 외부 도구 활용도 가능하다. 또 다수 AI 에이전트가 팀을 이뤄 협력할 때 개발자가 AI 시스템 작동 과정을 모니터링하고 성능을 개선할 수 있도록 가시성과 투명성을 제공한다. 엔비디아는 "IQ 블루프린트를 활용하면 AI 에이전트 정확도를 높이고, 복잡한 작업 처리 시간을 몇 시간에서 몇 분으로 단축할 수 있다"고 강조했다. 또 엔비디아는 주요 데이터 스토리지 기업과 협력해 AI 데이터 플랫폼을 개발 중이라고 밝혔다. 해당 플랫폼에는 네모 리트리버와 IQ 블루프린트, 블랙웰 GPU, 스펙트럼-X 네트워킹, 블루필드 DPU 등이 포함된다. 이를 통해 실시간에 가까운 데이터 기능을 제공할 방침이다. 엔비디아는 "앞으로 엔터프라이즈 데이터가 AI 에이전트를 위한 핵심 자원으로 활용될 전망"이리며 데이터 플랫폼 개발 배경을 밝혔다. 그러면서 "현재 기업 데이터 저장 시스템은 단순히 파일을 저장하고 제공하는 역할만 수행하고 있다"며 "AI 에이전트가 도입되면, 기업은 데이터 저장·관리 시스템을 지식 제공 시스템으로 전환할 수 있다"고 강조했다.

2025.03.19 05:02김미정 기자

SK하이닉스, 엔비디아 연례 행사서 HBM4·SOCAMM 등 공개

SK하이닉스는 17일부터 21일(현지시간)까지 미국 새너제이에서 엔비디아가 주최하는 글로벌 AI 컨퍼런스인 'GTC 2025'에 참가해, 'Memory, Powering AI and Tomorrow(메모리가 불러올 AI의 내일)'를 주제로 부스를 운영한다고 18일 밝혔다. 회사는 HBM을 포함해 AI 데이터센터, 온디바이스, 오토모티브 분야 메모리 설루션 등 AI 시대를 이끌 다양한 메모리 제품을 전시한다. 회사는 "HBM3E 12단 이외에 새로운 AI 서버용 메모리 표준으로 주목받고 있는 SOCAMM(저전력 D램 기반의 AI 서버 특화 메모리 모듈)도 함께 전시해, 선도적인 AI 메모리 기술력을 선보이겠다"고 말했다. 이번 행사에는 곽노정 대표이사 사장(CEO), 김주선 AI Infra(인프라) 사장(CMO), 이상락 부사장(Global S&M 담당) 등 회사 주요 경영진이 참석해 글로벌 AI 산업 리더들과의 협력을 공고히 할 예정이다. 세계 최초로 5세대 HBM(HBM3E) 12단 제품을 양산해 고객사에 공급 중인 SK하이닉스는 올 하반기 내로 HBM4 12단 제품 양산 준비를 마치고, 고객이 원하는 시점에 맞춰 공급을 시작한다는 방침이다. 이번 전시에는 개발중인 HBM4 12단의 모형도 함께 전시될 예정이다. 김주선 SK하이닉스 사장은 “이번 GTC에서 AI 시대의 선도 제품을 선보여 뜻 깊게 생각한다”며 “차별화된 AI 메모리 경쟁력을 통해 '풀 스택 AI 메모리 프로바이더(Full Stack AI Memory Provider)'로서의 미래를 앞당길 것”이라고 말했다.

2025.03.19 05:00장경윤 기자

엔비디아 'GTC 2025' 개막...젠슨 황 입 주목

엔비디아가 생성형 인공지능(AI)과 고성능 컴퓨팅 미래 비전을 제시한다. 엔비디아는 17일부터 21일(현지시간)까지 미국 캘리포니아 산호세에서 'GPU 테크놀로지 컨퍼런스(GTC) 2025'를 개최해 AI 시대 필요한 차세대 그래픽처리장치(GPU)를 비롯한 AI 칩, 소프트웨어(SW) 플랫폼을 발표한다. 이번 행사는 세션 약 1천개, 연사 2천명, 전시 400개로 구성됐다. 젠슨 황 엔비디아 최고경영자(CEO)는 18일 오전 10시 SAP 센터에서 기조연설을 진행한다. 매년 글로벌 기술 업계는 황 CEO 발표 내용에 주목했다. 엔비디아는 이번 황 CEO 연설이 AI와 고성능 컴퓨팅 기술에 초점을 맞출 예정이라고 밝혔다. 로보틱스, 소버린 AI, AI 에이전트, 자동차 분야 관련 발표도 진행된다. 다수 외신은 이번 행사에서 블랙웰 칩 라인업 업그레이드 버전이 공개될 가능성이 크다고 봤다. 앞서 황 CEO는 최근 실적 발표에서 차세대 블랙웰 B300 시리즈 '블랙웰 울트라'가 올해 하반기 출시될 예정이라고 밝힌 바 있다. 블랙웰 울트라는 기존보다 더 높은 컴퓨팅 성능을 제공하며, 288GB 메모리를 탑재했다. 메모리 집약적인 AI 모델을 실행하고 학습하는 데 적합할 것이라는 평가를 받고 있다. 차세대 GPU 시리즈인 '루빈'도 이번 GTC에서 언급될 것이란 분석도 이어지고 있다. 루빈은 2026년 출시 예정이다. 테크크런치는 "이번 행사에 루빈 이후 제품에 대한 내용도 일부 공개될 전망"이라며 "루빈 울트라 GPU 혹은 루빈 다음 세대의 GPU 아키텍처일 수도 있다"고 봤다. 엔비디아는 '퀀덤 데이'를 통해 양자 컴퓨팅 전략도 제시한다. 양자 컴퓨팅 분야 주요 인사들과 양자 애플리케이션 개발을 위한 로드맵을 논의할 예정이다. 외신은 엔비디아가 올해 행사 성과가 비즈니스에 영향 미칠 것이라고 봤다. 초기 블랙웰 GPU 과열 문제와 미국 수출 통제로 인한 관세 우려가 엔비디아 주가 하락으로 이어진 바 있다. 여기에 중국 AI 스타트업 딥시크가 딥시크-R1 모델을 출시하면서 투자자들은 고성능 GPU 수요에 대한 우려를 표하고 있다. 이 외에도 엔비디아는 이번 GTC에서 글로벌 기업과 연구 기관, 정부와 맺은 전략적 협업 사례와 성과도 소개한다고 밝혔다. 개발자와 기술 전문가를 위한 교육 세션을 전년보다 확대했다. 또 데이터 보안 등 AI 윤리적 측면을 다룬 토론회도 진행될 예정이다. 엔비디아는 "이번 GTC는 AI와 가속 컴퓨팅 미래를 결정짓는 중요한 자리가 될 것"이라며 "기술 혁신을 선도하고 글로벌 산업의 발전을 이끄는 계기가 될 것"이라고 공식 홈페이지를 통해 밝혔다.

2025.03.16 09:21김미정 기자

'AI 대장주' 엔비디아, 투자자 기대 부응할까

'인공지능(AI) 대장주' 엔비디아는 투자자들의 기대에 부응하는 실적을 내놓을 수 있을까? 비즈니스인사이더는 25일(현지시간) 엔비디아 실적 발표를 하루 앞두고 월가 분석가들의 전망을 정리한 이 내놓은 엔비디아의 실적 발표 전망을 모아서 25일 보도했다. 엔비디아는 26일 2024 회계연도 4분기 실적을 발표할 예정이다. 미즈호 증권 “단기적으로 성장 고통도 예상” 미즈호증권 분석가들은 엔비디아가 탄탄한 실적을 공개할 것으로 예상하면서도 "성장의 고통도 있을 것”이라고 전망했다. 블랙웰의 강력한 상승세가 올해 상반기 매출 손실을 만회할 것으로 기대하기 때문에 하반기 실적에 초점을 맞추고 있다고 설명했다. 또 "엔비디아가 강력한 고객 관계를 구축한 통합 하드웨어(HW) 플랫폼을 비롯해 CUDA(쿠다) 생태계를 통해 강력한 업계 리더십을 계속 유지 중"이라며, "주요 고객인 마이크로소프트(MS), 아마존, 알파벳이 올해 말 블랙웰 그래픽처리장치(GPU) 구매를 확대할 것으로 예상한다"고 덧붙였다. 미즈호는 엔비디아에 시장 평균보다 더 잘했다는 '아웃퍼폼'(Outperform) 등급을 부여하고 목표 가격을 175달러로 제시했다. 웨드부시 증권 “좋은 소식 기대” 웨드부시 증권은 "젠슨 황이 블랙웰과 AI 자본지출(Capex)의 엄청난 수요를 견인하는 요인을 설명하며 투자자들의 불안을 달래줄 엔비디아의 강력한 실적과 '비트 앤레이즈'(실적이 분석가 예상치를 웃돌고 향후 전망치도 상향하는 것)를 기대한다”고 밝혔다. 그러면서 "어떤 고객도 엔비디아의 차세대 칩과 관련해 '줄을 서다 자리를 잃는' 일은 원하지 않는다"라며 딥시크로 인해 엔비디아의 영향력이 줄지 않았다고 평했다. 뱅크오브아메리카(BofA) “다음 촉매는 GTC 컨퍼런스” BofA 분석가들은 엔비디아 실적이 추정치를 뛰어넘을 것으로 예상하며, 올해 데이터센터 매출이 전년 대비 60% 급증할 것으로 예상한다고 밝혔다. 비벡 아리아 BoA 분석가는 이달 초 "딥시크의 혁명적 최적화에도 불구하고 MS, 메타를 비롯한 엔비디아의 대형 고객들의 지출 계획은 지금까지 변화가 없다”고 밝혔다. 또, “HW와 소프트웨어(SW) 최적화가 '컴퓨팅의 핵심 부분'이라고 말하며, 딥시크로 인해 엔비디아의 매출이 감소하는 일은 일어나지 않을 것”으로 내다봤다. 또, 오는 3월 개최될 GTC 컨퍼런스가 큰 촉매제라고 밝혔다. 여기서 투자자들의 초점이 기존 블랙웰에서 벗어나 루빈(Rubin) GPU와 자율 로봇 솔루션 등 차세대 제품으로 이동할 수 있을 것으로 기대했다. BoA는 엔비디아에 '매수' 등급을 매기고 목표가를 190달러로 책정했다. 블룸버그 인텔리전스 “블랙웰, 궤도에 올랐다” 블룸버그 인텔리전스 기술 분석가 쿤잔 소브하니는 지난 주 엔비디아가 "블랙웰 GPU의 상당한 증가에 따라 4분기 매출 전망치를 충족하고 1분기 가이던스를 상향 조정할 것으로 보인다”고 밝혔다. 또, "주요 고객에 대한 초기 선적은 오는 4분기에 시작돼 내년 1분기까지 증가할 것"이라며, “메타, MS, 아마존 웹서비스, 구글 등의 자본지출 가이던스 증가는 단기 판매에 대한 확신을 높여준다"고 설명했다. 비즈니스인사이더는 이번 실적 발표에서 차세대 블랙웰 칩의 수요가 여전히 높고 중국 딥시크로 인해 엔비디아가 부정적인 영향을 받지 않았다는 점을 투자자들에게 증명해야 할 것으로 보인다고 전했다. 최근 중국 딥시크가 등장하면서 데이터센터 운영에 예상했던 만큼의 컴퓨팅 능력이 필요치 않아 엔비디아의 GPU 판매가 줄어들 것이라는 투자자들의 우려가 나왔다. 이에 젠슨 황 엔비디아 최고경영자(CEO)는 "딥시크의 효율성 향상으로 인해 AI 도입과 발전하는 속도가 더욱 빨라질 뿐"이라고 주장했다. 블룸버그 자료에 따르면, 엔비디아의 작년 4분기 매출은 작년 같은 기간의 약 200억 달러에 비해 73% 증가한 382억 달러에 달할 것으로 예상된다.

2025.02.26 16:03이정현 미디어연구소

  Prev 1 2 3 Next  

지금 뜨는 기사

이시각 헤드라인

유럽 최대 AI 기업도 미국에 의존…'소버린 AI'는 가능한가

[ZD브리핑] 기름값 묶자 소비 늘었다?…최고가격제 ‘연장 논쟁’

콧대 높던 패션 브랜드 변했다...네이버·쿠팡 멀티채널 본격화

삼성 파운드리 4나노 내년까지 '풀부킹'…하반기 흑자전환 시동

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.