• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
창간특집
인공지능
배터리
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'Nvidia'통합검색 결과 입니다. (7건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

HPE, 인텔리전트 통합 데이터 레이어 공개…에이전틱 AI 시대 선도

HPE가 인공지능(AI) 시대를 겨냥해 AI, 데이터 기반 비즈니스 혁신을 위한 전략을 본격화한다. HPE는 인텔리전트 통합 데이터 레이어를 발표하고 엔비디아(NVIDIA)와의 협력을 강화한다고 20일 밝혔다. 엔비디아와의 협력을 통해 HPE는 AI 추론을 위한 전반적인 데이터 파이프라인을 혁신하고, AI 애플리케이션과 모델, 에이전트에 최적화된 'AI-레디 데이터'를 제공하는 데 집중하고 있다. 이를 위해 엔비디아의 최신 AI 데이터 플랫폼(NVIDIA AI Data Platform)을 지원하며 고성능 인프라와 통합된 맞춤형 레퍼런스 디자인을 통해 AI 데이터 수명주기를 대폭 단축할 계획이다. AI 데이터 플랫폼은 엔비디아 가속 컴퓨팅, 네트워킹 및 AI 소프트웨어와 함께 HPE의 프라이빗 클라우드 AI 및 스토리지 솔루션과 통합돼 AI 추론 워크로드를 최적화한다. 특히 엔비디아 AI 엔터프라이즈 소프트웨어와 함께 AI 추론 성능을 강화하는 다양한 에이전트와 도구들이 제공된다. HPE는 이번 발표를 통해 정형 및 비정형 데이터를 통합 관리하는 통합 데이터 레이어를 공개했다. HPE 데이터 패브릭 소프트웨어와 HPE 알레트라 스토리지 MP X10000을 기반으로 하며 아파치 아이스버그를 지원해 고품질 스트리밍 데이터를 AI 모델에 일관되게 제공한다. AI 워크로드에 적합한 자동화된 메타데이터 태깅 기능도 새롭게 도입됐다. HPE는 데이터 보호를 위한 통합 랜섬웨어 탐지 및 복구 기능도 발표했다. HPE 알레트라 스토리지 MP B10000은 기본 내장된 랜섬웨어 탐지 기능과 제르토(Zerto)의 복구 솔루션을 결합해 고객 데이터를 보호하며, 마이크로소프트 애저 기반의 소프트웨어 정의 스토리지 'HPE 알레트라 블록 스토리지 포 애저'를 통해 하이브리드 클라우드 환경에서의 데이터 관리 효율성을 높였다. 업계 최초로 단일 OS와 아키텍처 기반에서 블록 및 파일 스토리지를 분리형으로 지원하는 유연한 통합 스토리지 아키텍처도 소개됐다. 이를 통해 기업은 온프레미스와 클라우드 간 데이터 이동을 원활하게 수행할 수 있으며, AI 기반 AIOps를 활용한 자율 스토리지 관리도 가능하다. HPE 그린레이크 포 파일 스토리지는 엔비디아 인증 스토리지 프로그램을 통과해, 기업용 AI 팩토리 구축에 적합한 고성능 데이터 솔루션으로 검증됐다. 이를 통해 기업은 신뢰할 수 있는 스토리지 인프라 기반에서 AI 개발 및 배포를 가속화할 수 있다. 보다폰지그고의 제니 미네마 운영 지원 시스템 책임자는 “HPE 데이터 패브릭은 보다폰지그고의 네트워크 데이터 허브(NDH)의 기반이 되어 데이터 중심 자율 네트워크로의 전환을 지원하고 있다”고 전했다. HPE 데이터 패브릭은 HPE 프라이빗 클라우드 AI 및 HPE 알레트라 스토리지 MP X10000과 함께 올 여름 출시 예정이다. HPE 피델마 루소 하이브리드 클라우드 사장 겸 CTO는 "에이전틱 AI 시대에서 데이터 관리의 근본적 변화가 필요하다"며 "HPE는 인텔리전트 스토리지와 클라우드 기반 AI 플랫폼을 통해 고도로 분산된 데이터를 신속히 활용할 수 있도록 지원한다"고 강조했다.

2025.03.20 17:37남혁우

"AI 에이전트 시대 주도"…엔비디아, 추론 강화 돕는 SW 공개

엔비디아가 인공지능(AI) 에이전트 시대 본격화를 위한 기술 로드맵을 공개했다. AI 에이전트 개발·유지에 필요한 소프트웨어(SW) 기술을 비롯한 오픈소스 추론 모델 시리즈, 기업용 AI 워크플로 솔루션까지 잇따라 선보였다. 엔비디아는 17~21일까지(현지시간) 미국 새너제이에서 열리는 개발자 회의 'GTC 2025' 미디어 프리브리핑에서 AI 에이전트 개발·추론 강화에 필요한 SW 기술을 공개했다. 이를 통해 AI 에이전트 기술 생태계를 선점하고 기업용 AI 시장에서 주도권을 확보 하려는 전략이다. 이번에 발표할 주요 SW 제품으로는 AI 추론 모델 성능 강화를 돕는 '엔비디아 다이나모(NVIDIA Dynamo)'와 오픈소스 모델 '라마 네모트톤(Llama Nemotron)' 시리즈, '엔비디아 IQ 블루프린트'다. 엔비디아는 해당 제품 모두 AI 에이전트 구축 필수 요소로 자리잡을 것이라 재차 강조했다. '엔비디아 다이나모'로 AI 모델 추론 강화 이번 행사에서 엔비디아는 '엔비디아 다이나모'를 발표한다. 엔비디아 다니어모는 대규모 AI 추론 모델 성능을 올리는 오픈소스 소프트웨어(SW)다. 엔비디아 다이나모는 전체 데이터센터에서 분산·분해 방식으로 작동한다. 분산 방식은 하나의 AI 작업을 여러 개 GPU로 나눠 동시 처리하는 식이다. 기존에는 단일 GPU가 연산을 수행하는 방식이었다면, 다이나모는 동일 작업을 여러 GPU가 협력해 처리하도록 설계됐다. 이를 통해 대량 데이터를 더 빠르고 효율적으로 분석할 수 있다는 설명이다. 엔비디아는 다이나모 분해 방식도 핵심 요소로 꼽았다. 이 방식은 AI 모델이 하나의 질문을 받으면 이를 작은 단위로 쪼개 여러 GPU에 나눠 연산을 수행한다. 이후 최종 결과를 합치는 식이다. 이는 GPU 간 연산 부담을 줄이고 처리 속도를 높일 수 있다. 특히 데이터센터 내 수백~수천 개 GPU가 동시에 운영될 경우, 다이나모 최적화 기술이 GPU 성능 향상을 극대화할 수 있다. 다이나모는 해당 작동방식에 기반해 쿼리 하나를 최대 1천개 그래픽장치(GPU)로 확장할 수 있도록 설계됐다. 기존 방식보다 GPU 활용도를 높여 동일 개수의 GPU로도 처리량을 두 배까지 늘릴 수 있다. AI 모델이 데이터 처리하는 속도가 늘면 자연스럽게 비용 절감 효과와 처리 가능한 데이터 양도 는다. 향후 AI 기반 서비스 운영 효율성을 높이는 핵심 요소로 작용할 전망이다. 여기에 엔비디아의 최신 GPU 네트워크 기술 'NY링크'를 결합하면 성능 향상 폭이 더욱 커진다. NY링크는 GPU 간 데이터 전송 속도를 높이는 기술이다. AI 모델 연산 과정에서 병목현상을 줄이는 역할을 한다. 이를 통해 같은 개수의 GPU를 사용하면서도 최대 30배까지 처리 성능을 끌어올릴 수 있다. 이 외에도 다이나모는 파이토치(PyTorch)를 비롯한 텐서RT, sglang 등 다양한 AI 프레임워크와 호환되는 개방형 아키텍처를 지원한다. 이를 통해 기존 AI 모델을 변경하지 않고도 성능을 개선할 수 있다. 엔비디아는 "딥시크처럼 대규모 데이터를 처리하는 모델은 연산량이 많아 GPU의 확장성이 중요하다"며 "다이나모는 이런 대형 모델 연산 부담을 효과적으로 분산시키는 역할을 한다"고 강조했다. "똑똑한 AI 에이전트 구축"…오픈소스 모델 '라마 네모트론' 시리즈 엔비디아는 AI 에이전트 추론 능력 강화를 위해 새 오픈소스 AI 모델 '라마 니모트론(Llama Nemotron)' 시리즈를 내놨다. 이는 비즈니스 환경에서 즉시 활용 가능한 AI 추론 모델이다. 주로 복잡한 문제 해결을 위한 고급 AI 에이전트 구축에 사용된다. 메타의 오픈소스 모델 '라마' 기반으로 작동한다. 엔비디아는 "해당 모델은 알고리즘적으로 가지치기 과정을 거쳐 모델 크기를 줄였다"며 "이로 인해 컴퓨팅 자원을 덜 소모하면서도 정확도를 유지할 수 있게 최적화됐다"고 설명했다. 또 "사후학습 기법을 통해 라마 니모트론 모델을 더욱 개선했다"고 말했다. 그러면서 "주로 수학 문제 해결과 도구 호출, 명령어 처리, 대화 기능 등 여러 분야에서 최상의 추론 성능을 발휘할 수 있다"고 말했다. 라마 니모트론 모델군은 '나노(Nano)'와 '수퍼(Super)' '울트라(Ultra)' 버전으로 이뤄졌다. 나노는 해당 모델 크기에서 가장 높은 추론 정확도를 제공한다. 수퍼는 단일 데이터센터 GPU에서 가장 빠른 처리 속도를 제공한다. 울트라는 데이터센터급 멀티 GPU 환경에서 AI 에이전트 추론 정확도 극대화를 돕는 모델이다. 나노와 수퍼는 이번 GTC에서 NIM 마이크로서비스 형태로 제공된다. 울트라 모델은 추후 공개된다. 해당 모델 시리즈는 데이터셋 관련 기술과 패키지 형태로 제공된다. 이 데이터셋은 엔비디아가 생성한 600억 개 토큰으로 구성한 합성 데이터셋이다. 약 36만 시간의 H100 GPU 추론 수행과 4만 5천 시간의 인간 주석 작업을 통해 개발됐다. 이 외에도 해당 모델 시리즈는 추론 기능을 온·오프(toggle on/off)할 수 있는 옵션도 제공한다. 이는 오픈 모델에서는 드문 기능인 것으로 평가받고 있다. '엔비디아 IQ 블루프린트'로 AI 에이전트 유연성 높였다 엔비디아는 '엔비디아 IQ 블루프린트'를 출시했다. 해당 솔루션은 4월부터 이용 가능하다. IQ 블루프린트는 개발자가 NIM으로 AI 에이전트를 구축하고 이를 엔터프라이즈 비즈니스 시스템과 연결하게 돕는 AI 워크플로 도구다. 이를 통해 AI 에이전트가 텍스트, 이미지, 영상 등 여러 데이터 유형을 검색·활용할 수 있게 지원한다. 웹 검색이나 다른 AI 에이전트와 같은 외부 도구 활용도 가능하다. 또 다수 AI 에이전트가 팀을 이뤄 협력할 때 개발자가 AI 시스템 작동 과정을 모니터링하고 성능을 개선할 수 있도록 가시성과 투명성을 제공한다. 엔비디아는 "IQ 블루프린트를 활용하면 AI 에이전트 정확도를 높이고, 복잡한 작업 처리 시간을 몇 시간에서 몇 분으로 단축할 수 있다"고 강조했다. 또 엔비디아는 주요 데이터 스토리지 기업과 협력해 AI 데이터 플랫폼을 개발 중이라고 밝혔다. 해당 플랫폼에는 네모 리트리버와 IQ 블루프린트, 블랙웰 GPU, 스펙트럼-X 네트워킹, 블루필드 DPU 등이 포함된다. 이를 통해 실시간에 가까운 데이터 기능을 제공할 방침이다. 엔비디아는 "앞으로 엔터프라이즈 데이터가 AI 에이전트를 위한 핵심 자원으로 활용될 전망"이리며 데이터 플랫폼 개발 배경을 밝혔다. 그러면서 "현재 기업 데이터 저장 시스템은 단순히 파일을 저장하고 제공하는 역할만 수행하고 있다"며 "AI 에이전트가 도입되면, 기업은 데이터 저장·관리 시스템을 지식 제공 시스템으로 전환할 수 있다"고 강조했다.

2025.03.19 05:02김미정

엔비디아 'GTC 2025' 개막...젠슨 황 입 주목

엔비디아가 생성형 인공지능(AI)과 고성능 컴퓨팅 미래 비전을 제시한다. 엔비디아는 17일부터 21일(현지시간)까지 미국 캘리포니아 산호세에서 'GPU 테크놀로지 컨퍼런스(GTC) 2025'를 개최해 AI 시대 필요한 차세대 그래픽처리장치(GPU)를 비롯한 AI 칩, 소프트웨어(SW) 플랫폼을 발표한다. 이번 행사는 세션 약 1천개, 연사 2천명, 전시 400개로 구성됐다. 젠슨 황 엔비디아 최고경영자(CEO)는 18일 오전 10시 SAP 센터에서 기조연설을 진행한다. 매년 글로벌 기술 업계는 황 CEO 발표 내용에 주목했다. 엔비디아는 이번 황 CEO 연설이 AI와 고성능 컴퓨팅 기술에 초점을 맞출 예정이라고 밝혔다. 로보틱스, 소버린 AI, AI 에이전트, 자동차 분야 관련 발표도 진행된다. 다수 외신은 이번 행사에서 블랙웰 칩 라인업 업그레이드 버전이 공개될 가능성이 크다고 봤다. 앞서 황 CEO는 최근 실적 발표에서 차세대 블랙웰 B300 시리즈 '블랙웰 울트라'가 올해 하반기 출시될 예정이라고 밝힌 바 있다. 블랙웰 울트라는 기존보다 더 높은 컴퓨팅 성능을 제공하며, 288GB 메모리를 탑재했다. 메모리 집약적인 AI 모델을 실행하고 학습하는 데 적합할 것이라는 평가를 받고 있다. 차세대 GPU 시리즈인 '루빈'도 이번 GTC에서 언급될 것이란 분석도 이어지고 있다. 루빈은 2026년 출시 예정이다. 테크크런치는 "이번 행사에 루빈 이후 제품에 대한 내용도 일부 공개될 전망"이라며 "루빈 울트라 GPU 혹은 루빈 다음 세대의 GPU 아키텍처일 수도 있다"고 봤다. 엔비디아는 '퀀덤 데이'를 통해 양자 컴퓨팅 전략도 제시한다. 양자 컴퓨팅 분야 주요 인사들과 양자 애플리케이션 개발을 위한 로드맵을 논의할 예정이다. 외신은 엔비디아가 올해 행사 성과가 비즈니스에 영향 미칠 것이라고 봤다. 초기 블랙웰 GPU 과열 문제와 미국 수출 통제로 인한 관세 우려가 엔비디아 주가 하락으로 이어진 바 있다. 여기에 중국 AI 스타트업 딥시크가 딥시크-R1 모델을 출시하면서 투자자들은 고성능 GPU 수요에 대한 우려를 표하고 있다. 이 외에도 엔비디아는 이번 GTC에서 글로벌 기업과 연구 기관, 정부와 맺은 전략적 협업 사례와 성과도 소개한다고 밝혔다. 개발자와 기술 전문가를 위한 교육 세션을 전년보다 확대했다. 또 데이터 보안 등 AI 윤리적 측면을 다룬 토론회도 진행될 예정이다. 엔비디아는 "이번 GTC는 AI와 가속 컴퓨팅 미래를 결정짓는 중요한 자리가 될 것"이라며 "기술 혁신을 선도하고 글로벌 산업의 발전을 이끄는 계기가 될 것"이라고 공식 홈페이지를 통해 밝혔다.

2025.03.16 09:21김미정

싸토리우스, NVIDIA와 AI 협력 확대…첨단 기술로 신약 개발 가속

싸토리우스가 인공지능(AI) 기술을 활용한 신약 개발 및 제조 혁신에 박차를 가한다. 싸토리우스는 올해부터 본격적으로 미국의 AI기업 NVIDIA와의 협력을 확대했다고 밝혔다. 이번 협력 확대를 통해 싸토리우스의 생명과학 및 바이오프로세싱 전문성과 NVIDIA의 AI 기반 컴퓨팅 플랫폼 및 소프트웨어 기술을 결합해 새롭고 더 나은 치료제 개발이 가능할 것으로 전망된다. 독일 생명과학기업 싸토리우스는 2020년부터 NVIDIA의 기술을 자사 장비에 통합해 실험실에서 AI 기반 분석이 가능한 라이브 셀 이미징 플랫폼을 상용화했다. 특히 동물 실험을 대체할 수 있는 줄기세포 유래 오가노이드의 예측 AI 모델 개발에 주력해왔다. 이번 협력 확대로 싸토리우스는 NVIDIA의 AI 컴퓨팅 플랫폼인 'Clara 제품군'을 자사 생태계에 더욱 폭넓게 도입할 계획이다. 또 싸토리우스의 방대하고 전문화된 데이터셋을 기반으로 한 강력한 기반 모델을 개발 및 상용화할 예정이다. 더 나아가 양사는 3D 바이오프린팅 기술로 제작된 복잡한 스페로이드와 오가노이드, 또는 싸토리우스 세포주를 기반으로 설계된 합성 생물학적 경로 및 유기체의 컴퓨터 기반 설계와 시뮬레이션 등 첨단 기술 탐구를 통해 혁신적인 치료제와 요법 개발을 가속화할 계획이다. 싸토리우스는 “AI 기술과 생명과학 전문성의 결합은 생물학적 상호작용의 복잡성을 단순화하고 바이오 제약 분야의 발전을 가속화할 것”이라며 “이번 협력으로 고객사와 궁극적으로는 환자들에게 혜택을 줄 수 있는 기술 혁신을 이뤄낼 것”이라고 밝혔다.

2024.12.09 11:01조민규

AI, 자동차 제조 확 바꿨다…'고효율·저비용' 혁명

인공지능(AI)이 세상을 삼키고 있다. 일상생활뿐 아니라 첨단 비즈니스 영역까지 뒤흔들고 있다. 특히 챗GPT를 비롯한 생성형 AI는 다양한 산업 분야의 기본 문법을 바꿔놓으면서 새로운 혁신의 밑거름이 되고 있다. 반면, 기업에서는 AI 도입이 경쟁력 강화를 위한 기회라는 점을 알면서도 불확실성을 포함한 위험 요인 때문에 도입을 주저하고 있는 것도 현실이다. 지디넷코리아는 창간 24주년을 맞아 법무법인 세종의 AI센터와 함께 이런 변화를 진단하는 'GenAI 시대' 특별 기획을 마련했다. 이번 기획에서는 기업이 AI 규제에 효과적으로 대응하면서 도입 가능한 AI 거버넌스에 대해 살펴본다. 아울러, 소프트웨어, 통신, 인터넷, 헬스바이오, 유통, 전자, 재계, 자동차, 게임, 블록체인, 금융 등 11개 분야별로 AI가 어떤 변화를 일으키고 있는 지 심층 분석한다. 또 AI 기술 발전과 함께 논의되어야 할 윤리적, 사회적 문제들에 대한 다각적인 논점을 제시해 건강한 AI 생태계 조성에 기여하고자 한다. [편집자주] "인공지능이 자동차 제작 방식을 바꾸고 있다." 미국 시사주간지 '뉴스위크'는 자동차 산업에 부는 생성형 인공지능(AI) 광풍에 대해 이 같이 진단했다. 현대자동차, 토요타 등 글로벌 완성차 제조업체뿐만 아니라 메르세데스-벤츠, BMW 등도 AI 기술을 적극적으로 적용하고 있다. AI와 전통 자동차 제조업의 접목은 단 한 치의 오차도 사고로 이어지는 품질 문제 해결에 실마리를 줬다. 품질 문제를 해결하면서도 여러 번의 수정을 거칠 필요 없는 첨단 자동차 제조방식은 원가를 낮춰 제조업체의 이익향상에 도움을 주기 때문에 앞으로 차세대 제조방식으로 자리 잡을 전망이다. 자동차 업계는 AI를 도입한 설비시설 설립에 빠르게 적용하고자 나선 곳 중 하나다. 현대차는 지난해 11월 싱가포르 서부 주룽 혁신지구에 위치한 '현대차그룹 싱가포르 글로벌 혁신센터(HMGICS)' 준공식을 진행했다. HMGICS는 AI, 로보틱스 첨단기술이 적용된 자동화셀(Cell) 기반 생산부터 판매까지 통합된 첨단 공장이다. HMGICS는 앞으로 미국 조지아에 짓는 현대차그룹 메타플랜트 아메리카(HMGMA)와 울산 전기차 전용 신공장에 들어갈 설비들을 먼저 실험해 보는 장소기도 하다. 약 200개의 로봇과 AI, 첨단 비전 기술로 무장한 HMGICS는 운송과 조립 과정 등 상당 부분이 자동화됐다. BMW도 디지털 트윈(현실세계 기계·장비·사물 등을 컴퓨터 속 가상세계에 구현하는 기술) 기반의 신공장을 짓고 있다. 벤츠는 헝가리 캐치케메트 공장에 AI 소프트웨어를 사용해 개조하는 방식을 택했다. 이를 통해 공장을 계속 가동하면서도 노후화된 조립 설비를 새로 정리하고 건설하는 동안에 화재 방지 대책도 마련할 수 있었다. AI를 사용한 공장 건설은 이점이 많다. 벤츠는 이 방법을 통해 건설 속도는 두 배로 높이면서 수정 과정은 50% 줄였다. 디지털 트윈을 통해 가상 세계에서 문제를 예측할 수 있었기 때문이다. 에너지 절약도 가능했다. AI는 독일 메르세데스 라슈타트 공장에서 도색 공정 모니터링을 맡았는데, 업계에 따르면 AI 도입 이전보다 에너지가 20% 절약됐다. 벤츠는 AI 공정을 점차 확대할 방침이다. BMW와 벤츠는 엔비디아의 옴니버스 플랫폼을 사용한 차세대 전기차 신공장에 로봇 공학을 접목했다. 2025년 헝가리 데브레첸에 준공될 신공장은 AI와 로보틱스의 결정체가 될 것으로 전망된다. BMW는 이미 2022년 i팩토리라는 공장 콘셉트를 도입한 바 있다. i팩토리는 BMW의 모든 광장과 차량을 3D로 스캔해 가상공간으로 만들어냈다. 이 공간은 언제든 수정을 거칠 수 있고 가상 공간에서 미리 검사해 효율성을 늘리는데 주안점을 뒀다. BMW는 AI의 사용이 95%의 효율성 향상으로 이어졌다고 자부하기도 했다. 토요타는 2016년부터 AI를 적극 활용해 왔다. 토요타 세이프티 커넥트에 탑재된 AI는 사고 시 충돌 시기와 위치를 파악하고 콜센터에 알림을 보내는 서비스로 발전했다. 지난해 9월에는 생성 AI를 사용해 로봇을 교육하는 기술을 발표하기도 했다. 혼다도 공장의 차량 검사와 설계, 테스트 단계까지 AI를 활용하고 있다. 혼다는 딥러닝과 AI로 부품을 설계한다. 이를 위해 혼다는 설계를 위한 모놀리스AI와 차량 검사에 사용하는 UVeye와 협력하고 있다. 고태봉 하이투자증권 자동차센터장은 "자동차산업의 비즈니스모델도 구조적 변화에 적극적으로 대처해 소프트웨어와 서비스 중심의 구독경제 구현을 해야한다"며 "국가경쟁력을 위해 대한민국이 거대한 하나의 연구실이 돼야 한다"고 설명했다. 이어 "스마트팩토리를 통한 생산비용 낮추는 등 비용절감 없이는 경쟁에서 성공하기 힘들다"고 덧붙였다.

2024.05.02 14:05김재성

"AI 영역 확장"…엔비디아, 이스라엘 SW 기업 두 곳 인수

엔비디아가 이스라엘 소프트웨어(SW) 제공업체 두 곳을 인수하면서 인공지능(AI) 시장 영역 확장에 나섰다. 24일(현지시간) 미국 디인포메이션을 비롯한 외신들은 엔비디아가 이스라엘 SW 스타트업 런:AI를 인수했다고 보도했다. 엔비디아는 또 다른 이스라엘 업체인 데시도 인수도 조만한 공식 발표할 것것이라고 외신들이 전했다. 런:AI는 쿠버네티스 오픈소스 플랫폼을 통해 고객에게 워크로드 관리와 오케스트레이션 SW를 제공한다. 이를 통해 기업 고객은 온프레미스를 비롯한 클라우드, 하이브리드 환경에서 컴퓨팅 인프라를 최적화할 수 있다. 엔비디아는 "런:AI 인수를 통해 고객이 AI 컴퓨팅 자원을 보다 효율적으로 활용할 수 있을 것"이라고 했다. 엔비디아의 런:AI 인수 규모는 공개되지 않았다. 하지만 테크크런치는 소식통을 인용, 런:AI 인수 규모가 7억 달러 수준이라고 보도했다. 데시는 클라우드, 엣지, 모바일 등 모든 환경에서 AI 모델을 구축, 배포할 수 있는 딥러닝 가속 플랫폼을 운영하고 있다. 지난 3월에는 생성형 AI 개발 플랫폼을 출시했다. 이 플랫폼은 파인튜닝 가능한 거대언어모델(LLM) 시리즈와 추론 엔진, AI 클러스터 관리 솔루션으로 이뤄졌다. 엔비디아는 데시 인수를 통해 텍스트, 이미지, 코드를 생성하는 AI 모델 개발에 드는 시간과 비용을 낮추는 것을 목표로 했다. 미국 투자정보 업체 피치북에 따르면 엔비디아는 지난해 30개 넘는 스타트업에 투자한 바 있다. 업계에선 이 기업이 투자뿐 아니라 인수에도 속도를 높일 것으로 예측하고 있다. 디인포메이션은 "엔비디아는 이번 인수를 통해 AI 모델에 활용하는 H100 등 자사 제품 수요를 유지할 것"이라고 분석했다.

2024.04.25 10:12김미정

엔비디아, 생성형 AI·디지털 트윈 세계 확장했다

엔비디아가 생성형 인공지능(AI)과 디지털 트윈 세계를 확장한다. AI 추론 속도를 높였고, 협업을 통해 디지털 트윈 플랫폼 활용도까지 넓혔다. 엔비디아는 18일(현지시간) 미국 캘리포니아주 새너제이에서 열린 GTC2024에서 AI 추론 속도를 높이는 소프트웨어 '엔비디아 인퍼런스 마이크로서비스(NIM)'와 디지털 트윈 플랫폼 '옴니버스' 업그레이드 내용을 발표했다. NIM은 생성형 AI 앱 개발·추론 속도를 높였다. 현재 개발자는 '엔비디아 AI 엔터프라이즈 버전 5.0'에서 NIM을 활용할 수 있다. 옴니버스는 PC를 넘어 애플의 '애플 비전프로'에 들어갔다. "NIM으로 생성형 AI 앱 구축·배포 더 빠르게" 엔비디아는 개발자가 생성형 AI 앱을 빠르게 구축·배포할 수 있도록 돕는 솔루션 NIM을 내놨다. NIM은 AI 모델과 통합 코드를 포함해 추론에 필요한 기능을 패키지 형태로 제공한다. 보통 개발자가 생성형 AI 앱이나 거대언어모델(LLM)을 제작한 후 배포할 때 복잡한 과정을 거쳐야 한다. 추론 작업에 필요한 하드웨어 크기 조정, 검색증강생성(RAG)용 데이터 통합, 랭체인 같은 도구를 통한 엔지니어링 작업을 별도로 진행해야 한다. 이는 업무 시간과 비용이 많이 든다. 해당 과정에 데이터 과학자도 필수다. 반면 NIM은 이러한 과정을 한 플랫폼 내에서 간소화할 수 있다. 엔비디아 마누비르 다스 엔터프라이즈 컴퓨팅담당 부사장은 이번 행사에서 "NIM은 이러한 모든 번거로운 과정을 생략하고 한 플랫폼 내에서 모든 작업을 처리할 수 있도록 한다"며 "이를 통해 개발자는 NIM을 통해 생성형 AI 앱을 구축하자마자 별도의 과정 없이 바로 배포 단계에 들어설 수 있다"고 강조했다. NIM은 생성형 AI 앱 개발에 필요한 모든 작업을 한데 모아 패키지로 구성된 셈이다. 고객은 NIM을 통해 오픈AI, 메타, 미스트랄 등의 다양한 독점·오픈 소스 LLM에 접근할 수도 있다. NIM은 보안 기능도 갖췄다. 다스 부사장은 "클라우드에서 실행되는 대형 H100부터 엣지에서 진행되는 엔비디아 젯슨 같은 소형 제품까지 다양한 엔비디아 그래픽처리장치(GPU)에서 작동하는 모델 보안 문제도 바로 잡았다"며 "개발자는 NIM에서 걱정 없이 생성형 AI 앱 개발 과정만 진행하기만 하면 된다"고 강조했다. 다스 부사장은 "엔비디아는 개발자가 수행해야 하는 개발 작업의 양을 줄이고 속도를 높도록 도울 것"이라며 "이를 통해 기업은 막 개발한 생성형 AI 앱을 몇분 만에 배포 가능한 상태로 전환할 수 있다"고 강조했다. 현재 NIM을 탑재한 엔비디아 AI 엔터프라이즈 가격은 GPU당 연간 4천500달러(약 602만원)다. 고객은 시간당 GPU 1달러(약 1천337원)로 클라우드를 통해 접근할 수도 있다. 디지털 트윈 플랫폼 '옴니버스', 애플 비전프로 속으로 엔비디아는 디지털 트윈 플랫폼 '옴니버스'를 애플의 '애플 비전프로'에 탑재한다고 밝혔다. 사용자는 애플 비전프로를 통해 다양한 산업에서 디지털 트윈 기술을 활용할 수 있다. 활용법은 간단하다. 옴니버스 클라우드 API를 통해 접속한 후, 애플비전 프로로 직접 스트리밍해 주는 그래픽 전송 네트워크를 통해 디지털 트윈 기능을 이용할 수 있다. 엔비디아 레바레디언 시뮬레이션 담당 부사장은 "기업 고객은 애플 비전프로를 통해 성능 저하 없이 디지털 트윈 작업을 실현할 수 있다"며 "이를 옴니버스 내에서 활용한다면 더욱 확장된 기능에 접근할 수 있다"고 강조했다. 이번 행사에서 엔비디아는 직접 옴니버스가 설치된 애플 비전프로로 디지털 트윈 기술을 선보이는 시연회도 진행했다. 한 디자이너가 비전 프로를 통해 자동차 제작 프로그램에 접속하는 시연이었다. 개발자가 차량의 다양한 측면을 옴니버스로 설계·조작한 후 해당 차량에 탑승하는 장면을 보여줬다. 외신은 이번 솔루션 결합은 엔비디아와 애플 모두에게 이득이라고 판단했다. 우선 엔비디아는 옴니버스 고객층을 늘릴 수 있다. PC뿐 아니라 애플 비전프로 사용자도 자사 고객으로 만들 수 있기 때문이다. 애플도 마찬가지다. 기업들이 비전프로를 다양한 산업에서 활용할 가능성이 높아졌다. 그동안 해당 제품은 개인의 엔터테인먼트용으로만 활용됐다. 다만 3천499 달러(약 4백67만원)라는 가격 장벽으로 인해 판매량을 좀처럼 늘릴 수 없었다. 두 기업의 솔루션 통합으로 새로운 고객층을 만들 수 있는 셈이다.

2024.03.19 10:01김미정

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

폴더블 아이폰, 펀치홀 카메라 탑재 유력

배민·요기요, 먹통 뒤 정상화..."금요일 밤 비 내린 탓"

과학자들, 납으로 금 만들었다…'연금술사의 꿈' 실현되나

SKT 유심교체 누적 193만...교체 예약 대기 686만

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현