• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
스테이블코인
배터리
AI의 눈
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'NVIDIA'통합검색 결과 입니다. (4건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

엘리스그룹-엔비디아, 원데이 워크숍에 20명 초청한다

AI 교육 솔루션 기업 엘리스그룹(대표 김재원)이 7월 5일 '엘리스 x NVIDIA 원데이 워크숍'을 진행한다. 지난해 11월 NVIDIA(이하 엔비디아)와 교육 파트너십을 맺은 이후 처음으로 여는 공개 워크숍이다. 엘리스그룹은 엔비디아 딥 러닝 인스티튜트(Deep Learning Institute, 이하 DLI) 공식 교육 서비스 파트너로서 AI 분야에서 필수적인 최신 기술 교육을 제공하기 위해 협력하고 있다. 이번 공개 워크숍 역시 양사의 AI 솔루션 및 서비스로 최적의 AI 교육을 지원한다. 교육은 서울 성수에 위치한 오프라인 교육 플랫폼 엘리스랩 서울센터에서 진행된다. 엔비디아 DLI 공인 강사가 엔비디아에서 개발한 딥 러닝 교육 콘텐츠를 활용해 'LLM을 활용한 앱 개발'을 강의할 계획이다. 워크숍 참여자들은 딥러닝, LLM 뿐만 아니라 생성형 AI 시대에 주목받는 RAG 기술, GPT 스타일의 디코더 모델 등 현업에 적용 가능한 LLM 기술 교육을 집중적으로 배울 수 있다. 워크샵 수료 후에는 글로벌 역량 인증서를 발급할 예정이다. 원데이 워크숍으로 진행되며 양질의 교육을 제공하고자 수강 인원은 20명으로 한정한다. 제조, 유통, 통신 기업 재직자를 포함해 관심있는 기업 개발자라면 누구든지 참여할 수 있다. 수강을 원하는 이들은 엘리스그룹 성인 AI 실무 교육 브랜드 '엘카데미' 홈페이지에서 자세한 정보를 확인하고, 신청할 수 있다. 김재원 엘리스그룹 대표는 "엘리스그룹은 엔비디아를 비롯해 다양한 글로벌 빅테크들과 협력을 강화하며 AI 인프라부터 AI 교육 분야까지 이어지는 강력한 AI 생태계를 구축해 나가고 있다"며 "이번 엔비디아 공개 워크숍에 참가하는 이들이 실제 산업 현장에서 요구하는 AI 기술 역량을 빠르게 습득할 수 있도록 최적의 AI 교육 환경을 제공할 것"이라고 말했다.

2025.06.19 08:54백봉삼 기자

HPE, 인텔리전트 통합 데이터 레이어 공개…에이전틱 AI 시대 선도

HPE가 인공지능(AI) 시대를 겨냥해 AI, 데이터 기반 비즈니스 혁신을 위한 전략을 본격화한다. HPE는 인텔리전트 통합 데이터 레이어를 발표하고 엔비디아(NVIDIA)와의 협력을 강화한다고 20일 밝혔다. 엔비디아와의 협력을 통해 HPE는 AI 추론을 위한 전반적인 데이터 파이프라인을 혁신하고, AI 애플리케이션과 모델, 에이전트에 최적화된 'AI-레디 데이터'를 제공하는 데 집중하고 있다. 이를 위해 엔비디아의 최신 AI 데이터 플랫폼(NVIDIA AI Data Platform)을 지원하며 고성능 인프라와 통합된 맞춤형 레퍼런스 디자인을 통해 AI 데이터 수명주기를 대폭 단축할 계획이다. AI 데이터 플랫폼은 엔비디아 가속 컴퓨팅, 네트워킹 및 AI 소프트웨어와 함께 HPE의 프라이빗 클라우드 AI 및 스토리지 솔루션과 통합돼 AI 추론 워크로드를 최적화한다. 특히 엔비디아 AI 엔터프라이즈 소프트웨어와 함께 AI 추론 성능을 강화하는 다양한 에이전트와 도구들이 제공된다. HPE는 이번 발표를 통해 정형 및 비정형 데이터를 통합 관리하는 통합 데이터 레이어를 공개했다. HPE 데이터 패브릭 소프트웨어와 HPE 알레트라 스토리지 MP X10000을 기반으로 하며 아파치 아이스버그를 지원해 고품질 스트리밍 데이터를 AI 모델에 일관되게 제공한다. AI 워크로드에 적합한 자동화된 메타데이터 태깅 기능도 새롭게 도입됐다. HPE는 데이터 보호를 위한 통합 랜섬웨어 탐지 및 복구 기능도 발표했다. HPE 알레트라 스토리지 MP B10000은 기본 내장된 랜섬웨어 탐지 기능과 제르토(Zerto)의 복구 솔루션을 결합해 고객 데이터를 보호하며, 마이크로소프트 애저 기반의 소프트웨어 정의 스토리지 'HPE 알레트라 블록 스토리지 포 애저'를 통해 하이브리드 클라우드 환경에서의 데이터 관리 효율성을 높였다. 업계 최초로 단일 OS와 아키텍처 기반에서 블록 및 파일 스토리지를 분리형으로 지원하는 유연한 통합 스토리지 아키텍처도 소개됐다. 이를 통해 기업은 온프레미스와 클라우드 간 데이터 이동을 원활하게 수행할 수 있으며, AI 기반 AIOps를 활용한 자율 스토리지 관리도 가능하다. HPE 그린레이크 포 파일 스토리지는 엔비디아 인증 스토리지 프로그램을 통과해, 기업용 AI 팩토리 구축에 적합한 고성능 데이터 솔루션으로 검증됐다. 이를 통해 기업은 신뢰할 수 있는 스토리지 인프라 기반에서 AI 개발 및 배포를 가속화할 수 있다. 보다폰지그고의 제니 미네마 운영 지원 시스템 책임자는 “HPE 데이터 패브릭은 보다폰지그고의 네트워크 데이터 허브(NDH)의 기반이 되어 데이터 중심 자율 네트워크로의 전환을 지원하고 있다”고 전했다. HPE 데이터 패브릭은 HPE 프라이빗 클라우드 AI 및 HPE 알레트라 스토리지 MP X10000과 함께 올 여름 출시 예정이다. HPE 피델마 루소 하이브리드 클라우드 사장 겸 CTO는 "에이전틱 AI 시대에서 데이터 관리의 근본적 변화가 필요하다"며 "HPE는 인텔리전트 스토리지와 클라우드 기반 AI 플랫폼을 통해 고도로 분산된 데이터를 신속히 활용할 수 있도록 지원한다"고 강조했다.

2025.03.20 17:37남혁우 기자

"AI 에이전트 시대 주도"…엔비디아, 추론 강화 돕는 SW 공개

엔비디아가 인공지능(AI) 에이전트 시대 본격화를 위한 기술 로드맵을 공개했다. AI 에이전트 개발·유지에 필요한 소프트웨어(SW) 기술을 비롯한 오픈소스 추론 모델 시리즈, 기업용 AI 워크플로 솔루션까지 잇따라 선보였다. 엔비디아는 17~21일까지(현지시간) 미국 새너제이에서 열리는 개발자 회의 'GTC 2025' 미디어 프리브리핑에서 AI 에이전트 개발·추론 강화에 필요한 SW 기술을 공개했다. 이를 통해 AI 에이전트 기술 생태계를 선점하고 기업용 AI 시장에서 주도권을 확보 하려는 전략이다. 이번에 발표할 주요 SW 제품으로는 AI 추론 모델 성능 강화를 돕는 '엔비디아 다이나모(NVIDIA Dynamo)'와 오픈소스 모델 '라마 네모트톤(Llama Nemotron)' 시리즈, '엔비디아 IQ 블루프린트'다. 엔비디아는 해당 제품 모두 AI 에이전트 구축 필수 요소로 자리잡을 것이라 재차 강조했다. '엔비디아 다이나모'로 AI 모델 추론 강화 이번 행사에서 엔비디아는 '엔비디아 다이나모'를 발표한다. 엔비디아 다니어모는 대규모 AI 추론 모델 성능을 올리는 오픈소스 소프트웨어(SW)다. 엔비디아 다이나모는 전체 데이터센터에서 분산·분해 방식으로 작동한다. 분산 방식은 하나의 AI 작업을 여러 개 GPU로 나눠 동시 처리하는 식이다. 기존에는 단일 GPU가 연산을 수행하는 방식이었다면, 다이나모는 동일 작업을 여러 GPU가 협력해 처리하도록 설계됐다. 이를 통해 대량 데이터를 더 빠르고 효율적으로 분석할 수 있다는 설명이다. 엔비디아는 다이나모 분해 방식도 핵심 요소로 꼽았다. 이 방식은 AI 모델이 하나의 질문을 받으면 이를 작은 단위로 쪼개 여러 GPU에 나눠 연산을 수행한다. 이후 최종 결과를 합치는 식이다. 이는 GPU 간 연산 부담을 줄이고 처리 속도를 높일 수 있다. 특히 데이터센터 내 수백~수천 개 GPU가 동시에 운영될 경우, 다이나모 최적화 기술이 GPU 성능 향상을 극대화할 수 있다. 다이나모는 해당 작동방식에 기반해 쿼리 하나를 최대 1천개 그래픽장치(GPU)로 확장할 수 있도록 설계됐다. 기존 방식보다 GPU 활용도를 높여 동일 개수의 GPU로도 처리량을 두 배까지 늘릴 수 있다. AI 모델이 데이터 처리하는 속도가 늘면 자연스럽게 비용 절감 효과와 처리 가능한 데이터 양도 는다. 향후 AI 기반 서비스 운영 효율성을 높이는 핵심 요소로 작용할 전망이다. 여기에 엔비디아의 최신 GPU 네트워크 기술 'NY링크'를 결합하면 성능 향상 폭이 더욱 커진다. NY링크는 GPU 간 데이터 전송 속도를 높이는 기술이다. AI 모델 연산 과정에서 병목현상을 줄이는 역할을 한다. 이를 통해 같은 개수의 GPU를 사용하면서도 최대 30배까지 처리 성능을 끌어올릴 수 있다. 이 외에도 다이나모는 파이토치(PyTorch)를 비롯한 텐서RT, sglang 등 다양한 AI 프레임워크와 호환되는 개방형 아키텍처를 지원한다. 이를 통해 기존 AI 모델을 변경하지 않고도 성능을 개선할 수 있다. 엔비디아는 "딥시크처럼 대규모 데이터를 처리하는 모델은 연산량이 많아 GPU의 확장성이 중요하다"며 "다이나모는 이런 대형 모델 연산 부담을 효과적으로 분산시키는 역할을 한다"고 강조했다. "똑똑한 AI 에이전트 구축"…오픈소스 모델 '라마 네모트론' 시리즈 엔비디아는 AI 에이전트 추론 능력 강화를 위해 새 오픈소스 AI 모델 '라마 니모트론(Llama Nemotron)' 시리즈를 내놨다. 이는 비즈니스 환경에서 즉시 활용 가능한 AI 추론 모델이다. 주로 복잡한 문제 해결을 위한 고급 AI 에이전트 구축에 사용된다. 메타의 오픈소스 모델 '라마' 기반으로 작동한다. 엔비디아는 "해당 모델은 알고리즘적으로 가지치기 과정을 거쳐 모델 크기를 줄였다"며 "이로 인해 컴퓨팅 자원을 덜 소모하면서도 정확도를 유지할 수 있게 최적화됐다"고 설명했다. 또 "사후학습 기법을 통해 라마 니모트론 모델을 더욱 개선했다"고 말했다. 그러면서 "주로 수학 문제 해결과 도구 호출, 명령어 처리, 대화 기능 등 여러 분야에서 최상의 추론 성능을 발휘할 수 있다"고 말했다. 라마 니모트론 모델군은 '나노(Nano)'와 '수퍼(Super)' '울트라(Ultra)' 버전으로 이뤄졌다. 나노는 해당 모델 크기에서 가장 높은 추론 정확도를 제공한다. 수퍼는 단일 데이터센터 GPU에서 가장 빠른 처리 속도를 제공한다. 울트라는 데이터센터급 멀티 GPU 환경에서 AI 에이전트 추론 정확도 극대화를 돕는 모델이다. 나노와 수퍼는 이번 GTC에서 NIM 마이크로서비스 형태로 제공된다. 울트라 모델은 추후 공개된다. 해당 모델 시리즈는 데이터셋 관련 기술과 패키지 형태로 제공된다. 이 데이터셋은 엔비디아가 생성한 600억 개 토큰으로 구성한 합성 데이터셋이다. 약 36만 시간의 H100 GPU 추론 수행과 4만 5천 시간의 인간 주석 작업을 통해 개발됐다. 이 외에도 해당 모델 시리즈는 추론 기능을 온·오프(toggle on/off)할 수 있는 옵션도 제공한다. 이는 오픈 모델에서는 드문 기능인 것으로 평가받고 있다. '엔비디아 IQ 블루프린트'로 AI 에이전트 유연성 높였다 엔비디아는 '엔비디아 IQ 블루프린트'를 출시했다. 해당 솔루션은 4월부터 이용 가능하다. IQ 블루프린트는 개발자가 NIM으로 AI 에이전트를 구축하고 이를 엔터프라이즈 비즈니스 시스템과 연결하게 돕는 AI 워크플로 도구다. 이를 통해 AI 에이전트가 텍스트, 이미지, 영상 등 여러 데이터 유형을 검색·활용할 수 있게 지원한다. 웹 검색이나 다른 AI 에이전트와 같은 외부 도구 활용도 가능하다. 또 다수 AI 에이전트가 팀을 이뤄 협력할 때 개발자가 AI 시스템 작동 과정을 모니터링하고 성능을 개선할 수 있도록 가시성과 투명성을 제공한다. 엔비디아는 "IQ 블루프린트를 활용하면 AI 에이전트 정확도를 높이고, 복잡한 작업 처리 시간을 몇 시간에서 몇 분으로 단축할 수 있다"고 강조했다. 또 엔비디아는 주요 데이터 스토리지 기업과 협력해 AI 데이터 플랫폼을 개발 중이라고 밝혔다. 해당 플랫폼에는 네모 리트리버와 IQ 블루프린트, 블랙웰 GPU, 스펙트럼-X 네트워킹, 블루필드 DPU 등이 포함된다. 이를 통해 실시간에 가까운 데이터 기능을 제공할 방침이다. 엔비디아는 "앞으로 엔터프라이즈 데이터가 AI 에이전트를 위한 핵심 자원으로 활용될 전망"이리며 데이터 플랫폼 개발 배경을 밝혔다. 그러면서 "현재 기업 데이터 저장 시스템은 단순히 파일을 저장하고 제공하는 역할만 수행하고 있다"며 "AI 에이전트가 도입되면, 기업은 데이터 저장·관리 시스템을 지식 제공 시스템으로 전환할 수 있다"고 강조했다.

2025.03.19 05:02김미정 기자

엔비디아 'GTC 2025' 개막...젠슨 황 입 주목

엔비디아가 생성형 인공지능(AI)과 고성능 컴퓨팅 미래 비전을 제시한다. 엔비디아는 17일부터 21일(현지시간)까지 미국 캘리포니아 산호세에서 'GPU 테크놀로지 컨퍼런스(GTC) 2025'를 개최해 AI 시대 필요한 차세대 그래픽처리장치(GPU)를 비롯한 AI 칩, 소프트웨어(SW) 플랫폼을 발표한다. 이번 행사는 세션 약 1천개, 연사 2천명, 전시 400개로 구성됐다. 젠슨 황 엔비디아 최고경영자(CEO)는 18일 오전 10시 SAP 센터에서 기조연설을 진행한다. 매년 글로벌 기술 업계는 황 CEO 발표 내용에 주목했다. 엔비디아는 이번 황 CEO 연설이 AI와 고성능 컴퓨팅 기술에 초점을 맞출 예정이라고 밝혔다. 로보틱스, 소버린 AI, AI 에이전트, 자동차 분야 관련 발표도 진행된다. 다수 외신은 이번 행사에서 블랙웰 칩 라인업 업그레이드 버전이 공개될 가능성이 크다고 봤다. 앞서 황 CEO는 최근 실적 발표에서 차세대 블랙웰 B300 시리즈 '블랙웰 울트라'가 올해 하반기 출시될 예정이라고 밝힌 바 있다. 블랙웰 울트라는 기존보다 더 높은 컴퓨팅 성능을 제공하며, 288GB 메모리를 탑재했다. 메모리 집약적인 AI 모델을 실행하고 학습하는 데 적합할 것이라는 평가를 받고 있다. 차세대 GPU 시리즈인 '루빈'도 이번 GTC에서 언급될 것이란 분석도 이어지고 있다. 루빈은 2026년 출시 예정이다. 테크크런치는 "이번 행사에 루빈 이후 제품에 대한 내용도 일부 공개될 전망"이라며 "루빈 울트라 GPU 혹은 루빈 다음 세대의 GPU 아키텍처일 수도 있다"고 봤다. 엔비디아는 '퀀덤 데이'를 통해 양자 컴퓨팅 전략도 제시한다. 양자 컴퓨팅 분야 주요 인사들과 양자 애플리케이션 개발을 위한 로드맵을 논의할 예정이다. 외신은 엔비디아가 올해 행사 성과가 비즈니스에 영향 미칠 것이라고 봤다. 초기 블랙웰 GPU 과열 문제와 미국 수출 통제로 인한 관세 우려가 엔비디아 주가 하락으로 이어진 바 있다. 여기에 중국 AI 스타트업 딥시크가 딥시크-R1 모델을 출시하면서 투자자들은 고성능 GPU 수요에 대한 우려를 표하고 있다. 이 외에도 엔비디아는 이번 GTC에서 글로벌 기업과 연구 기관, 정부와 맺은 전략적 협업 사례와 성과도 소개한다고 밝혔다. 개발자와 기술 전문가를 위한 교육 세션을 전년보다 확대했다. 또 데이터 보안 등 AI 윤리적 측면을 다룬 토론회도 진행될 예정이다. 엔비디아는 "이번 GTC는 AI와 가속 컴퓨팅 미래를 결정짓는 중요한 자리가 될 것"이라며 "기술 혁신을 선도하고 글로벌 산업의 발전을 이끄는 계기가 될 것"이라고 공식 홈페이지를 통해 밝혔다.

2025.03.16 09:21김미정 기자

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

[비욘드IT] 초창기 챗GPT 닮은 '몰트북', AI 진화의 필연적 진통인가

[AI는 지금] 오픈소스AI, 미·중 패권경쟁 흔든다…"韓, 전략적 활용 시급"

"자율주행차 맞아?"...웨이모, '문 닫는 알바' 쓴다

블록체인 지갑 만드는 토스…디지털자산 담는 '슈퍼앱' 구상

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.