• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
창간특집
인공지능
배터리
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'NIM'통합검색 결과 입니다. (6건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

엔비디아 "지포스 RTX 50, 게임·콘텐츠 제작 바꿀 것"

엔비디아는 20일 오후 서울 삼성동 스튜디오 159에서 진행된 '엔비디아 RTX AI PC 데이' 행사에서 "곧 출시될 지포스 RTX 50 시리즈는 게임과 콘텐츠 제작, 영상 제작 등 모든 분야에서 활용될 것"이라고 밝혔다. 먼저 주요 게임 개발사들은 생성 AI를 게임 캐릭터에 결합한 '아바타 클라우드 엔진'(ACE)를 도입할 예정이다. 크래프톤은 CES 2025에서 배틀그라운드에 플레이어의 음성을 인식하고 지시를 따르는 AI 기반 전우조인 '펍지 엘라이'(PUBG Ally)를 도입하겠다고 밝혔다. 위메이드가 언리얼엔진5 기반으로 개발중인 오픈월드 게임인 '미르5'에는 엔비디아 ACE 기술 기반으로 플레이어의 패턴을 학습하는 보스 캐릭터가 등장한다. RTX 50 시리즈에 내장된 영상 인코딩/디코딩 엔진인 NVENC는 9세대로 업데이트돼 색상 정보를 보다 풍부하게 담고 계단 현상을 줄일 수 있는 4:2:2 압축 방식을 지원한다. 4K 60p 영상을 최대 9개까지 동시에 처리해 렌더링 시간도 단축한다. 엔비디아는 2월부터 주위 소음을 줄이고 음성을 최적화하는 '스튜디오 보이스', 방송 출연자의 조명을 AI로 최적화하는 '가상 키라이트'를 적용한 방송 애플리케이션을 제공 예정이다. 엔비디아가 제공하는 NIM(엔비디아 추론 마이크로서비스)은 클라우드 뿐만 아니라 RTX GPU에서도 실행될 수 있도록 최적화돼 PC에서도 실행할 수 있다. RTX용 AI 블루프린트는 클라우드나 PC에 최적화된 레퍼런스 디자인을 제공하며, 데모 UI가 내장되어 있고 필요한 경우 미세조정도 가능하다. RTX용 엔비디아 NIM 등 개발 도구는 오는 2월부터 제공 예정이다. 제프 옌 엔비디아 아태지역 기술마케팅 이사는 이날 "게임 개발자, 콘텐츠 크리에이터, AI 개발자들이 RTX 50 시리즈를 통해 새로운 차원의 AI 기능을 구현할 수 있다"고 밝혔다.

2025.01.21 08:47권봉석

HPE-엔비디아, 생성형 AI 인프라 협업 포트폴리오 출시

HPE는 엔비디아와 공동 개발한 AI 솔루션 'HPE 기반 엔비디아 AI 컴퓨팅(NVIDIA AI Computing by HPE) 포트폴리오'를 19일 출시했다. 이는 HPE가 기업 고객들이 생성형 AI 도입을 가속할 수 있도록 엔비디아와 협력해 개발한 AI 솔루션 및 고투마켓 포트폴리오다. 포트폴리오의 주요 제공 서비스 중 하나는 HPE 프라이빗 클라우드 AI다. HPE 프라이빗 클라우드 AI는 엔비디아의 AI 컴퓨팅, 네트워킹과 소프트웨어를 HPE의 AI 스토리지, 컴퓨팅, 및 HPE 그린레이크 클라우드와 가장 견고하게 통합됐다. IT 운영이 워크로드 및 IT 효율성을 향상시킬 수 있도록 새로운 옵스램프 AI 코파일럿을 제공한다. 전체 수명주기 관리를 포함한 셀프 서비스 클라우드 경험을 제공하며, 다양한 AI 워크로드와 사용 사례를 지원하기 위해 4가지 사이즈의 다른 구성으로 제공된다. HPE가 제공하는 모든 엔비디아 AI 컴퓨팅 제품 및 서비스는 양사의 공통 고투마켓 전략을 기반으로 제공되며, 이 전략에는 판매팀 및 채널 파트너, 교육, 그리고 딜로이트, HCL테크, 인포시스, TCS 및 위프로 등 SI 업체를 아우르는 글로벌 네트워크를 포함한다. HPE 프라이빗 클라우드 AI는 혁신을 가속화하고 투자 수익을 높이는 동시에 AI로 인한 기업의 리스크를 관리할 수 있는 독특한 클라우드 기반 경험을 제공한다. 이 솔루션은 고유 데이터를 활용한 추론, 미세 조정 및 RAG AI 워크로드를 지원한다. 데이터 프라이버시, 보안, 투명성, 거버넌스 요건을 위한 엔터프라이즈급 제어 기능을 제공하며, 생산성 향상을 위한 IT옵스 및 AI옵스 기능을 포함한 클라우드 경험을 갖췄다. AI 및 데이터 소프트웨어 스택의 기반은 엔비디아 NIM 추론 마이크로 서비스를 포함한 엔비디아 AI 엔터프라이즈 소프트웨어 플랫폼으로 시작된다. 엔비디아 AI 엔터프라이즈는 데이터 사이언스 파이프라인을 가속하고, 프로덕션급 코파일럿 및 기타 생성형 AI 애플리케이션의 개발 및 배포를 간소화한다. 엔비디아 AI 엔터프라이즈에 포함된 엔비디아 NIM은 최적화된 AI 모델 추론을 위한 사용하기 쉬운 마이크로서비스를 제공하여 다양한 사용 사례에 대해 프로토타입에서 안전한 AI 모델 배포로 원활하게 전환할 수 있도록 한다. 엔비디아 AI 엔터프라이즈 및 엔비디아 NIM을 보완하는 HPE AI 에센셜 소프트웨어는 적응형 솔루션, 지속적인 기업 지원, 안전한 AI 서비스를 제공하는 통합 컨트롤 플레인을 갖춘 준비된AI 및 데이터 기반 툴 세트를 제공하며, 이를 통해 데이터 및 모델 준수, 확장 가능한 기능 등 AI 수명 주기 전반에 걸쳐, AI 파이프라인이 규정을 준수하는 동시에 설명 및 재현이 가능하도록 보장한다. HPE 프라이빗 클라우드 AI는 엔비디아 스펙트럼-X 이더넷 네트워킹, HPE 알레트라 MP 파일 스토리지, 엔비디아 L40S·H100 NVL 텐서코어 GPU·GH200 NVL2 등을 지원하는 HPE 프로라이언트 서버로 구성된다. HPE 프라이빗 클라우드 AI는 HPE 그린레이크 클라우드 기반의 셀프 서비스 클라우드 환경을 제공한다. HPE 그린레이크 클라우드 서비스를 이용하는 고객들은 단일 플랫폼 기반 컨트롤 플레인을 통해 하이브리드 환경 전반에서 엔드포인트, 워크로드 및 데이터를 자동화, 조정 및 관리할 수 있는 관리 기능 및 옵저버빌리티를 제공 받으며, 워크로드 및 엔드포인트의 지속 가능성 관련 지표도 확인할 수 있다. 옵스램프의 IT 운영은 HPE 그린레이크 클라우드와 통합돼 모든 HPE 제품 및 서비스에 대한 통합 옵저버빌리티 및 AI옵스를 제공한다. 또한, 엔비디아 NIM 및 AI 소프트웨어 같은 엔비디아 가속 컴퓨팅 스택과 엔비디아 텐서 코어 GPU, AI 클러스터 및 엔비디아 퀀텀 인피니밴드, 엔비디아 스펙트럼 이더넷 스위치에 대한 엔드투엔드 통합 옵저버빌리티도 제공한다. 옵스램프 운영 코파일럿은 엔비디아의 가속 컴퓨팅 플랫폼을 활용해 대규모 데이터를 대화형 어시스턴트를 통해 분석하고 통찰력을 제공하여 운영 관리의 생산성을 높인다. 옵스램프는 또한 크라우드스트라이크 API와 통합돼 전체 인프라와 애플리케이션 전반에 걸친 엔드포인트 보안 현황을 한눈에 볼 수 있도록 한다. 안토니오 네리 HPE 회장 겸 CEO는 “생성형 AI는 기업 혁신을 위한 엄청난 잠재력을 가지고 있지만, 단편화된 AI 기술의 복잡성은 대규모 기업의 AI 기술 도입을 어렵게 하는 많은 리스크와 장애물을 포함하고 있어 기업의 가장 가치있는 자산인 고유 데이터를 위험에 처하게 할 수 있다”며 “HPE와 엔비디아는 기업에서 생성형 AI의 엄청난 잠재력을 발휘할 수 있도록 하기 위해 AI를 위한 포괄적인 턴키 프라이빗 클라우드를 공동 개발했다”고 말했다. 젠슨 황 엔비디아 참립자 겸 CEO는 “생성형 AI와 가속 컴퓨팅은 모든 산업이 산업 혁명에 동참하기 위해 경쟁하면서 근본적인 변화를 일으키고 있다”며 “엔비디아와 HPE는 우리의 기술을 이렇게 깊게 통합한 적이 없었으며, 엔비디아의 전체 AI 컴퓨팅 스택과 HPE의 프라이빗 클라우드 기술을 결합해 기업 고객과 AI 전문가들에게 AI의 경계를 확장할 수 있는 가장 진보된 컴퓨팅 인프라와 서비스를 제공할 계획”이라고 강조했다.

2024.06.19 15:30김우용

"엔터프라이즈 AI의 시대가 왔다"

[샌프란시스코(미국)=김우용 기자] “엔터프라이즈 AI의 시대가 도래했습니다.” 슈리다 라마스워미 스노우플레이크 최고경영자(CEO)는 3일(현지시간) 미국 샌프란시스코에서 개최한 연례 컨퍼런스 '스노우플레이크 서밋 2024' 기조연설에서 이같이 밝혔다. 슈리다 라마스워미 CEO는 “우리의 통합 플랫폼은 그 어느 때보다 우수하고 강력하게 복잡한 것을 간단하고 정교하며 비용 효율적으로 만든다”며 “아이디어를 뒷받침하는 통합 데이터 플랫폼에 내장된 쉽고 효율적이며 신뢰할 수 있는 AI를 여러분 모두에게 제공하기 위해 엄청난 속도로 작동하고 있다”고 강조했다. 스노우플레이크는 기업이 자사 플랫폼에서 엔비디아AI를 기반으로 맞춤형 AI 데이터 애플리케이션을 구축할 수 있도록 엔비디아와의 협력을 강화한다고 발표했다. 양사 협력을 통해 스노우플레이크는 엔비디아 AI 엔터프라이즈 소프트웨어를 적용, 네모 리트리버 마이크로서비스를 완전 관리형 LLM 및 벡터 검색 서비스인 스노우플레이크 코텍스 AI에 통합했다. 고객은 맞춤형 모델을 다양한 비즈니스 데이터에 원활히 연결하고 정확한 응답을 제공할 수 있게 된다. 엔터프라이즈급 LLM 스노우플레이크 아크틱은 엔비디아 텐서RT-LLM 소프트웨어를 지원해 고도로 최적화된 성능을 제공한다. 또, 엔비디아 NIM(추론 마이크로서비스)로도 사용할 수 있게 돼 더 많은 개발자가 아크틱에서 인사이트를 얻을 수 있다. 기업은 AI를 적용할 수 있는 다양한 방법들을 모색하고 있고, 맞춤화된 모델을 생성하기 위해 데이터 활용은 더욱 중요해졌다. 스노우플레이크와 엔비디아의 협력으로 기업들은 맞춤형 사례별 AI 솔루션을 빠른 속도로 구축할 수 있고, 이를 통해 기업들은 엔터프라이즈 AI의 잠재력을 실현하고 있다. 슈리다 라마스워미 CEO는 “엔비디아의 풀스택 가속 컴퓨팅 및 소프트웨어와 스노우플레이크의 최신 AI 기능을 코텍스 AI에 통합시키는 것은 시장 판도를 바꿀 것”이라며 “양사는 모든 산업과 모든 기술 수준의 고객이 쉽고 효율적이며 안전하게 맞춤형 AI 애플리케이션을 기업 데이터에 구축할 수 있는 AI 의 새로운 시대를 열고자 노력하고 있다”고 강조했다. 젠슨 황 엔비디아 CEO는 타이완 타이베이에서 온라인 생중계로 기조연설에 참석했다. 그는 “AI는 매우 큰 규모의 컴퓨팅을 필요로 하며, 인프라 임대 기간이 짧을수록 비용을 줄이고 모델을 더 많이 반복 학습할 수 있으며 시장에 더 빨리 출시할 수 있다”며 “AI 모델이 토큰을 생성하는 생성형 AI의 시대에 모두가 비용을 낮출 수 있도록 빠르게 생성하기를 원하는 가운데 토큰 생성을 위한 혁신적인 런타임인 텐서 RT LM 통합에 스노우플레이크 팀과 협력하게 돼 기쁘다”고 밝혔다. 라마스워미 CEO는 엔비디아 H100 텐서코어 GPU를 활용해 스노우플레이크 아크틱을 3개월만에 구축할 수 있었다고 밝혔다. 지난 4월 출시된 최신 LLM 스노우플레이크 아크틱은 엔비디아 H100 텐서 코어 GPU를 통해 학습됐다. 엔비디아 NIM에 통합돼 사용할 수 있어 몇 초 만에 시작할 수 있다. 엔비디아가 호스팅하는 아크틱 NIM은 엔비디아 AI 카탈로그를 통해 실시간으로 제공돼 개발자가 무료 크레딧을 사용해 선호하는 인프라를 선택해 개방성이 가장 높은 기업용 LLM을 배포할 수 있도록 지원한다. 젠슨 황 CEO는 “네모 리트리버는 의미 체계 쿼리 라이브러리로서 데이터를 포함하며 가장 중요한 데이터는 기업 독점 데이터이고, 스노우플레이크에 있다”며 “이제 더 나은 인덱스 가이드, 더 나은 순위를 검색하고 몰입감 있는 방식으로 매우 크고 독점적인 데이터를 채팅 기능에 직접 연결할 수 있도록 도울 수 있게 됐다”고 말했다. 이어 “기업이 스노우플레이크에 보유한 데이터의 양이 너무 커서 처리를 위해 다른 곳으로 옮길 수 없게 됐으므로, 컴퓨팅을 데이터쪽으로 옮기는 것이 훨씬 더 쉬운 방법”이라며 “엔비디아 가속 컴퓨팅과 생성형 AI 컴퓨팅이 스노우플레이크 코텍스 AI에서 바로 처리를 수행할 수 있는 동일한 위치에 있게 돼 완전히 혁신적”이라고 강조했다. 스노우플레이크와 엔비디아는 네모 리트리버와 같은 엔비디아의 AI 엔터프라이즈 소프트웨어 제품군의 핵심 기술을 코텍스 AI에 통합하기 위해 협력하고 있다. 이를 통해 기업은 AI 투자를 극대화하는 맞춤형 AI 기반 애플리케이션을 효율적으로 구축하고 활용할 수 있게 된다. 엔비디아 네모 리트리버는 코텍스 AI 내에서 검색 증강 생성(RAG) 기반의 AI 애플리케이션을 구축하는 기업이 보다 정확하고 효율적인 결과를 도출할 수 있는 정보 검색 기능을 제공한다. 엔비디아 트리톤 인퍼런스 서버는 모든 플랫폼의 모든 애플리케이션에 대해 AI 추론을 배포, 실행 및 확장할 수 있는 기능을 제공한다. 양사 협력을 통해 고객들은 엔비디아 AI 소프트웨어 기반의 AI 솔루션 NIM을 스노우파크 컨테이너 서비스에 네이티브 앱의 형태로 배포해 사용할 수 있다. 이를 통해 기업은 스노우플레이크 내 일련의 파운데이션 모델을 쉽게 배포할 수 있게 된다. 젠슨 황 엔비디아 CEO는 “생성형 AI의 속도는 무어의 법칙을 따르지 않고 6개월마다 두배 빨라지고 있다”며 “여기서 정말 중요한 것은 이 기차에 최대한 빨리 뛰어들어야 한다는 것이고, 이 비행을 바라보는 것은 좋은 전략이 아니다”라고 조언했다. 슈리다 라마스워미 CEO는 “스노우플레이크의 AI 데이터 클라우드에서 매일 50억개의 쿼리가 발생하고 있는데 이는 구글의 일일 검색수와 같은 규모”라며 “스노우플레이크는 고객의 성공에 계속 집착할 것이고, 복잡한 작업을 단순하고 비용효율적으로 만드는 단일 통합 플랫폼을 구축한다는 약속은 변하지 않는다”고 강조했다. 슈리다 라마스워미 CEO는 “모든 스노우플레이크 사용자에게 생성형 AI를 제공하는 완전 관리형 서비스인 코텍스 AI를 출시함으로써 기존 SaaS 모델에서 불가능했던 애플리케이션을 구축하고 실행하게 했다”며 “AI 데이터 클라우드에서 1천 개 이상의 앱이 실행중이고 그중 160개는 스노우플레이크 마켓플레이스에서 사용가능하다”고 덧붙였다.

2024.06.04 19:24김우용

"엣지 플랫폼, 새로운 AI 담도록 진화한다"

[라스베이거스(미국)=김우용 기자] “엣지 플랫폼은 점점 더 많은 AI 여정을 수용하고 있다.” 피에르루카 치오델리 델테크놀로지스 엣지포트폴리오제품관리 수석부사장은 22일(현지시간) 미국 라스베이거스에서 열린 '델테크놀로지스월드(DTW) 2024'에서 한국기자단과 만나 이같이 강조했다. 피에르루카 치오델리 부사장은 델테크놀로지스에서 스토리지 관련 신규 비즈니스 구축을 담당해왔다고 자신을 소개했다. 그는 델테크놀로지스 파워스토어를 개발했으며, CTO실에서 VM웨어 모든 공동 전략 프로젝트 감독조직을 이끌었다. 그는 “델테크놀로지스는 2년전 프로젝트 프론티어를 발표하고 작년 델 네이티브엣지 신제품을 발표하며 엣지 비즈니스를 개발해왔다”며 “디지털시티부터 제조, 소매, 에너지 등의 전문가 팀을 구성해 제품을 연구한 결과 제로 터치를 확보할 수 있는 엣지 플랫폼을 수평적으로 구축해야 한다는 결론을 내렸다”고 말했다. 그는 “델 네이티브엣지는 제로트러스트와 제로토치를 통해 애플리케이션과 워크로드를 엣지에 배포할 수 있는 플랫폼”이라고 설명했다. 델테크놀로지스는 올해 행사에서 델 네이티브엣지의 최신 버전을 발표했다. 델 네이티브엣지 2.1 버전은 엔비디아, 서비스나우, 마이크로소프트와 파트너십을 강화하고, 엣지에서 메어메탈 컨테이너 기반으로 AI 애플리케이션 개발, 배포, 확장 등을 간소화할 수 있게 됐다. 올해 델테크놀로지스월드2024의 전체 주제가 AI로 관통하는 만큼 '델 네이티브엣지'도 새로운 AI 환경 구현에 주목했다. 그는 “AI는 아주 오랫동안 엣지에 존재하며 사용돼 왔고, 예전의 AI는 매우 최적화된 알고리즘 혹은 모델로서 간단한 조작에서 수년간 매우 정확하게 사용돼왔다”며 “지금은 AI 모델을 학습시켜 엣지로 추론을 가져와야 하는데, 엔비디아와 함께 네이티브엣지의 청사진을 통해 즉각적으로 엔비디아 NIM을 배포할 수 있는 기능을 발표했다”고 말했다. 그는 “네이티브엣지는 현재 엣지로 엔비디아 NIM을 사용할 수 있는 최초의 제품”이라며 “또, AI 실행은 매일 패키지를 변경하고, 계속 업데이트하면서 재교육을 해야 하기 때문에, 중앙부터 엣지까지 보안이 필요하다”고 강조했다. 그는 “AI 모델은 더 세련될 필요가 있고, 훈련을 받아야 하며, 또한 멀티모달 종류와 같은 더 다른 차원을 추가해야 한다”며 “따라서 AI 공장에서 만든 모델을 제조 공간이나 소매 공간으로 옮겨야 하는데 보안을 위해 쉽게 패키징할 수 있는 게 필요하다”고 덧붙였다. 델 네이티브엣지 최신 버전은 올해 행사에서 발표된 '델 AI 팩토리'의 일환으로 프로덕션급 애플리케이션의 개발 및 배포를 위한 엔비디아 NIM과 기타 마이크로서비스를 포함하는 엔드투엔드 소프트웨어 플랫폼인 '엔비디아 AI 엔터프라이즈'를 제공한다. 델 네이티브엣지와 엔비디아 AI 도구 및 SDK가 결합됐고, 엔비디아 메트로폴리스를 사용한 비디오 분석, 엔비디아 리바를 사용한 음성 및 번역, 엔비디아 NIM을 사용한 엣지에서 최적화된 추론 등에 이르는 엔비디아 AI 프레임워크를 엣지로 자동 제공할 수 있다. 델 네이티브엣지는 서비스나우의 나우플랫폼과 통합돼 엣지에서 AI 애플리케이션 개발 및 배포를 단순화한다. 기업은 IT 운영을 핵심 데이터 센터에서 엣지까지 효율적으로 확장할 수 있으며, 1일차 초기 배포부터 2일차 이상의 운영까지 아우르는 자동화된 엣지 관리 솔루션을 구축할 수 있다. 치오델리 부사장은 “이같은 폐쇄 루프 자동화를 통해 엣지 컴퓨팅 리소스의 오케스트레이션, 관리 및 워크플로를 단순화하고, 여러 산업 전반에 걸쳐 AI 및 기타 엣지 워크로드를 위한 보다 효율적이고 민첩하며 안전한 운영 및 서비스 모델을 제공할 것”이라며 “또 마이크로소프트 애저 아크 활성화 자동화 도입으로 엣지에서 추진력이 더욱 증폭됐다”고 말했다. 델테크놀로지스는 더 나은 비즈니스 성과와 엣지 사용 사례를 추진하기 위해 제조, 소매 및 디지털 도시에 서비스를 제공하는 ISV를 위한 6가지 새로운 네이티브엣지 솔루션을 도입했다. 대표적으로, 아비바 솔루션을 갖춘 새로운 통합 운영 센터는 도시 계획에 대한 360도 운영 뷰를 제공해 데이터 관리 및 시민 서비스를 향상시킨다. 플랫폼 자체 개선 사항으로 엣지 애플리케이션 성능, 확장성 및 보안이 향상됐다. 더 나은 성능, 확장성 및 보안을 제공하는 베어메탈 컨테이너에 애플리케이션을 배포하는 기능을 포함하며, 델네이티브엣지용 REST API를 도입해 데브옵스 워크플로에 통합하고 애플리케이션 통합을 개발하는 데 도움을 주는 비주얼스튜디오 플러그인 같은 새 도구를 제공한다. 델 에이펙스를 통한 단일 월간 구독으로 네이티브엣지 소프트웨어와 네이티브엣지 엔드포인트를 모두 활용할 수 있다. 델 '델 프리시전 워크스테이션'과 파워엣지 T160 서버 등의 새 엣지 하드웨어를 엣지 인프라 지원에 포함시켰다. 델 파워엣지 T160은 이전 제품보다 42% 작은 크기로 소매점 같은 작은 공간에 이상적이다. 엣지 및 인프라를 위한 프로컨설트 자문서비스와 엣지용 애플리케이션 디자인 서비스 등의 새 엣지 서비스를 출시했다. 델 서비스 전문가는 현재 상태를 평가하고 원하는 상태에 도달하기 위한 엣지 전략을 구축할 뿐만 아니라 효율성, 성능 및 ROI를 극대화하도록 엣지 환경을 설계하는 데 도움을 준다. 그는 네이티브엣지를 사용해 청사진 기술을 조정할 수 있고, 모든 것을 제로트러스트와 제로터치로 자동화하면서, 요구사항과 필요한 모든 소프트웨어를 패키지에 넣을 수 있다”며 “비용을 절감하고 완전한 보안을 달성하면서, 추론을 엣지에서 수행하고 모델을 재훈련시키는 전체 루프를 갖게 된다”고 강조했다. 그는 생성형 AI를 산업 엣지 환경에서 활용이 이제 막 시작됐다고 밝혔다. 그는 “큰 교량의 상황을 분석하고 품질을 관리한다고 할 때 현재의 컴퓨터비전으로 할 수 있는 건 얼마나 녹슬었는지 보는 정도였다”며 “생성형 AI를 활용한다면, 녹슨 교량 주변의 나무나, 다른 종류의 변색, 진동, 소음 등을 포함해 생성형 AI 기반의 3D 모델을 만들어내는 식이 가능할 것”이라고 예를 들었다. 그는 “올해 플랫폼을 지속적으로 혁신하면서 더 많은 릴리스를 출시할 예정”이라며 “플랫폼 기능을 더 확장하고, 파트너 생태계를 더욱 확장함으로써 고객에게 엣지를 위한 최고의 기반을 제공할 것”이라고 밝혔다.

2024.05.24 00:07김우용

엔비디아, 생성형 AI·디지털 트윈 세계 확장했다

엔비디아가 생성형 인공지능(AI)과 디지털 트윈 세계를 확장한다. AI 추론 속도를 높였고, 협업을 통해 디지털 트윈 플랫폼 활용도까지 넓혔다. 엔비디아는 18일(현지시간) 미국 캘리포니아주 새너제이에서 열린 GTC2024에서 AI 추론 속도를 높이는 소프트웨어 '엔비디아 인퍼런스 마이크로서비스(NIM)'와 디지털 트윈 플랫폼 '옴니버스' 업그레이드 내용을 발표했다. NIM은 생성형 AI 앱 개발·추론 속도를 높였다. 현재 개발자는 '엔비디아 AI 엔터프라이즈 버전 5.0'에서 NIM을 활용할 수 있다. 옴니버스는 PC를 넘어 애플의 '애플 비전프로'에 들어갔다. "NIM으로 생성형 AI 앱 구축·배포 더 빠르게" 엔비디아는 개발자가 생성형 AI 앱을 빠르게 구축·배포할 수 있도록 돕는 솔루션 NIM을 내놨다. NIM은 AI 모델과 통합 코드를 포함해 추론에 필요한 기능을 패키지 형태로 제공한다. 보통 개발자가 생성형 AI 앱이나 거대언어모델(LLM)을 제작한 후 배포할 때 복잡한 과정을 거쳐야 한다. 추론 작업에 필요한 하드웨어 크기 조정, 검색증강생성(RAG)용 데이터 통합, 랭체인 같은 도구를 통한 엔지니어링 작업을 별도로 진행해야 한다. 이는 업무 시간과 비용이 많이 든다. 해당 과정에 데이터 과학자도 필수다. 반면 NIM은 이러한 과정을 한 플랫폼 내에서 간소화할 수 있다. 엔비디아 마누비르 다스 엔터프라이즈 컴퓨팅담당 부사장은 이번 행사에서 "NIM은 이러한 모든 번거로운 과정을 생략하고 한 플랫폼 내에서 모든 작업을 처리할 수 있도록 한다"며 "이를 통해 개발자는 NIM을 통해 생성형 AI 앱을 구축하자마자 별도의 과정 없이 바로 배포 단계에 들어설 수 있다"고 강조했다. NIM은 생성형 AI 앱 개발에 필요한 모든 작업을 한데 모아 패키지로 구성된 셈이다. 고객은 NIM을 통해 오픈AI, 메타, 미스트랄 등의 다양한 독점·오픈 소스 LLM에 접근할 수도 있다. NIM은 보안 기능도 갖췄다. 다스 부사장은 "클라우드에서 실행되는 대형 H100부터 엣지에서 진행되는 엔비디아 젯슨 같은 소형 제품까지 다양한 엔비디아 그래픽처리장치(GPU)에서 작동하는 모델 보안 문제도 바로 잡았다"며 "개발자는 NIM에서 걱정 없이 생성형 AI 앱 개발 과정만 진행하기만 하면 된다"고 강조했다. 다스 부사장은 "엔비디아는 개발자가 수행해야 하는 개발 작업의 양을 줄이고 속도를 높도록 도울 것"이라며 "이를 통해 기업은 막 개발한 생성형 AI 앱을 몇분 만에 배포 가능한 상태로 전환할 수 있다"고 강조했다. 현재 NIM을 탑재한 엔비디아 AI 엔터프라이즈 가격은 GPU당 연간 4천500달러(약 602만원)다. 고객은 시간당 GPU 1달러(약 1천337원)로 클라우드를 통해 접근할 수도 있다. 디지털 트윈 플랫폼 '옴니버스', 애플 비전프로 속으로 엔비디아는 디지털 트윈 플랫폼 '옴니버스'를 애플의 '애플 비전프로'에 탑재한다고 밝혔다. 사용자는 애플 비전프로를 통해 다양한 산업에서 디지털 트윈 기술을 활용할 수 있다. 활용법은 간단하다. 옴니버스 클라우드 API를 통해 접속한 후, 애플비전 프로로 직접 스트리밍해 주는 그래픽 전송 네트워크를 통해 디지털 트윈 기능을 이용할 수 있다. 엔비디아 레바레디언 시뮬레이션 담당 부사장은 "기업 고객은 애플 비전프로를 통해 성능 저하 없이 디지털 트윈 작업을 실현할 수 있다"며 "이를 옴니버스 내에서 활용한다면 더욱 확장된 기능에 접근할 수 있다"고 강조했다. 이번 행사에서 엔비디아는 직접 옴니버스가 설치된 애플 비전프로로 디지털 트윈 기술을 선보이는 시연회도 진행했다. 한 디자이너가 비전 프로를 통해 자동차 제작 프로그램에 접속하는 시연이었다. 개발자가 차량의 다양한 측면을 옴니버스로 설계·조작한 후 해당 차량에 탑승하는 장면을 보여줬다. 외신은 이번 솔루션 결합은 엔비디아와 애플 모두에게 이득이라고 판단했다. 우선 엔비디아는 옴니버스 고객층을 늘릴 수 있다. PC뿐 아니라 애플 비전프로 사용자도 자사 고객으로 만들 수 있기 때문이다. 애플도 마찬가지다. 기업들이 비전프로를 다양한 산업에서 활용할 가능성이 높아졌다. 그동안 해당 제품은 개인의 엔터테인먼트용으로만 활용됐다. 다만 3천499 달러(약 4백67만원)라는 가격 장벽으로 인해 판매량을 좀처럼 늘릴 수 없었다. 두 기업의 솔루션 통합으로 새로운 고객층을 만들 수 있는 셈이다.

2024.03.19 10:01김미정

긴축 완화 기대↑…신평업계 "은행 이자 마진 악화" 전망

한국은행과 미국 연방준비제도의 통화긴축 완화에 대한 기대감이 높아지고 있다. 신용평가업계에선 높은 여신금리로 영업이익을 늘려왔던 은행과 금융권의 실적 감소가 머지않았다고 분석한다. 한국신용평가 노재웅 금융·구조화평가본부 실장은 “올해 중앙은행의 기준금리 인하 기대감으로 시장금리 및 대출금리 하락이 예상된다”며 “이 영향으로 순이자마진(NIM) 하락세가 지속될 것으로 전망된다”고 설명했다. 한국투자증권 백두산 연구원은 “한국은행의 연내 기준금리 인하로 국내은행 NIM은 2023년보다 4bp(1bp=0.01%포인트) 하락할 것”이라고 분석했다. NIM이란 은행 등 금융기관의 수익성을 나타내는 지표로 회사가 자산을 운용해 낸 수익에서 조달비용을 뺀 나머지를 운용자산 총액으로 나눈 금액이다. 한국신용평가가 국내 12개 일반은행을 대상으로 집계한 분기별 NIM을 보면 ▲2021년 4분기 1.55% ▲2022년 2분기 1.69% ▲2022년 4분기 1.80%로 정점을 기록 후 ▲2023년 1분기 1.76% ▲2023년 3분기 1.72%로 하락세를 기록했다. 증권업계에선 한국은행이 3.50%인 기준금리를 연내 0.25% 이상 내릴 것으로 전망하고 있다. 대신증권은 오는 2분기 중 금리인하를, 키음중권과 현대차증권은 하반기 중 통화정책 완화를 점쳤다. 이 밖에 IBK투자증권은 연내 기준금리 2회 인하를 예상했다. 기준금리 인하에 대한 기대감이 높아지는 것과 달리 각 금융사의 이자수익은 감소할 것으로 예상된다. 실제 금융감독원 금융통계정보시스템 공시를 살펴보면, 지난해 3분기 기준 국민은행과 신한·우리·하나·경남·광주·대구·부산·전북·농협·수협·카카오·케이뱅크·토스뱅크 등 14개 은행의 이자순이익(당기순이익)은 11조8천76억원으로 2022년 동기 대비 4.15%(4천711억원) 증가하는 데 그쳤다. 2022년 9월 이들 은행사의 이자순이익이 2021년 대비 24.51%(2조2천320억원) 증가했다는 점을 감안하면 4%대 성장은 크게 위축된 것이다. 지난해 3분기 기준 국내은행의 이자순이익 성장률이 앞선 2021~2022년 구간과 비교해 떨어진 이유는 은행들의 NIM 비율이 떨어졌기 때문으로 해석된다. 같은 기간 기준금리 인상 폭을 보면, 2023년 9월에는 3.50%로 전년 동월 대비 1.0%포인트 올랐다. 이는 2022년 9월 기준 기준금리가 2.50%로 2021년 9월 대비 1.75%포인트 오른 것과 비교해 적은 인상 폭이다. 하지만 은행업계에선 아직 NIM과 실적 전망을 예단하기 어렵다는 목소리도 나온다. 은행업계 한 관계자는 “아직 중앙은행이 기준금리 인하를 단행한 게 아니기 때문에 이자마진을 전망하긴 이르다”면서 “기준금리가 실제로 내려간다면 각 은행사가 개별 여건에 맞는 대응책을 준비할 것”이라고 말했다.

2024.01.09 16:30조성진

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

"요금 올리거나, 무료 풀거나"…OTT, 전략 분화

"책 대신 '아이패드'로 수업을"…디지털이 바꾼 교실 풍경은

과학자들, 납으로 금 만들었다…'연금술사의 꿈' 실현되나

[써보고서] 괴물 카메라를 가진 폰 '샤오미 15 울트라'

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현