• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
인공지능
배터리
양자컴퓨팅
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'GTC'통합검색 결과 입니다. (26건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

도시·은행·통신망까지…유럽 AI 인프라, 전부 엔비디아가 깐다

엔비디아가 유럽 전역의 주요 산업을 겨냥한 인공지능(AI) 인프라 확장에 박차를 가하고 있다. 스마트 시티, 통신, 금융 등 전략적 영역에서 AI 팩토리와 디지털 트윈을 통해 현지 맞춤형 AI 도입을 주도하는 상황이다. 엔비디아는 16일 프랑스 파리에서 기술 컨퍼런스 'GTC 파리'를 개최했다. 이 행사에서 회사는 스마트 시티용 옴니버스 블루프린트, 유럽 통신사 협업 기반 소버린 AI 인프라, 금융기관 맞춤형 AI 도구 등을 공개했다. 모든 발표는 AI 모델의 생성, 배포, 데이터 처리 효율화에 초점을 맞췄다. 이들은 대부분 엔비디아의 디지엑스(DGX) 슈퍼컴퓨팅 인프라와 소프트웨어 스택 위에 구축됐다. 엔비디아가 제시한 공통 접근법은 현지화된 디지털 트윈 기반 인프라를 구축하고 이를 통해 생성형 AI 모델을 학습시킨 뒤 업무용 AI 에이전트를 배포하는 수직 통합형 프레임워크다. 적용 대상은 도시, 통신, 금융 등 서로 다른 산업이지만 그 기본 구조는 동일하다. 유럽 전역에 '물리 AI' 배포… 교통·보안·에너지까지 스마트시티 '구축' 엔비디아는 스마트시티 AI 전환을 위한 설계도인 '옴니버스 블루프린트'를 발표했다. 디지털 트윈을 실시간 운영 가능한 수준으로 끌어올려 도시 전체를 물리 기반 AI로 통제할 수 있도록 설계됐다. 기존 시뮬레이션 중심 AI와 달리 센서와 영상 기반 데이터를 활용해 실제 도시의 동적 운영 데이터를 실시간으로 분석할 수 있다는 점이 핵심이다. 이 설계도는 엔비디아의 옴니버스, 코스모스, 네모, 메트로폴리스 등 주요 플랫폼 전부를 통합하는 형태로 구성됐다. 디지털 트윈 생성부터 모델 훈련, 실시간 영상 분석까지의 전체 과정을 하나의 워크플로우로 연결해 개발과 배포를 가속한다. 특히 항공 이미지와 위성 지도 데이터를 활용한 초현실적 도시 복제와 합성 데이터를 이용한 AI 에이전트 훈련이 차별점이다. 실제 적용 사례는 유럽 주요 도시로 확산되고 있다. 프랑스 국영철도는 마르세유와 모나코 기차역에 엔비디아 블루프린트를 적용해 예측 정비 완수율 100%를 기록했다. 영상 데이터 기반 군중 감시, 비상 상황 대응 자동화, 에너지 사용 최적화 등을 통해 운영 효율성과 안전성을 동시에 확보했다. 이탈리아 시칠리아 팔레르모 시는 1천 개 이상의 영상 스트림을 분석해 도시 내 사건사고를 실시간 탐지하고 있다. K2K와 협력해 구축한 디지털 트윈 기반 AI 에이전트는 코스모스 합성 데이터를 활용해 교통사고를 예측하며 초당 10만 건 이상의 예측 작업을 수행 중이다. 대만 가오슝에서는 링커비전과 AVES가 협력해 디지털 트윈을 활용한 영상 AI 분석 시스템을 구축했다. 이 시스템은 5만 개 영상 스트림을 실시간으로 분석해 홍수, 사고, 범죄 등의 상황을 인지하고 80% 이상 대응 시간을 줄였다. 통합된 플랫폼 위에서 부서 간 데이터 공유가 가능해 공공 대응 체계 전반의 구조를 재편하고 있다. 유럽 통신망 위에 AI 공장 깔린다…오렌지·텔레노르 등, 각국 소버린 확장 더불어 엔비디아는 유럽 주요 통신사들과 손잡고 소버린 AI 팩토리 구축에 나섰다. 각국 산업에 최적화된 에이전틱 AI를 생성하고 이를 안전하게 배포할 수 있는 국가 단위의 인프라를 전제로 한다. AI 기술의 국지화와 주권화를 동시에 해결하려는 해법이다. 이번 협력에 참여한 통신사는 오렌지, 텔레포니카, 텔레노르, 스위스컴, 패스트웹 등이다. 이들은 엔비디아의 DGX 인프라와 엔터프라이즈 소프트웨어 스택을 활용해 자체 클라우드, 엣지 인프라, 언어 모델 생태계를 확장하고 있다. 5개 대륙 18개 통신사에 엔비디아 AI 팩토리가 가동되고 있다. 오렌지는 기업용 생성형 AI 플랫폼 '라이브 인텔리전스'를 통해 프랑스와 유럽, 아프리카 전역 기업에 AI 모델 학습과 배포 기능을 제공하고 있다. 내부적으로도 7만 명 이상 직원이 업무 지원에 AI를 활용 중이며 이 모든 운용은 오렌지의 클라우드 애비뉴에서 이루어진다. 노르웨이 텔레노르는 완전한 재생 에너지 기반 AI 데이터센터를 신설해 내부와 외부 수요를 동시에 처리하고 있다. 번역 도구 바벨스피크는 엔비디아 AI로 구동돼 노르웨이 적십자사에서 시범 운영 중이며 텔레노르는 이를 통해 공공부문 AI 채택을 본격화했다. 인프라 자체도 잉여 에너지를 전력망에 재공급하는 구조로 설계돼 지속 가능성까지 확보했다. 스위스컴은 기업용 AI 서비스 플랫폼인 '젠AI 스튜디오'를 발표하며 자국 내 대기업과 기관의 에이전틱 AI 배포를 지원하고 있다. 모델 카탈로그, AI 워크허브 등의 기능을 통해 AI 서비스 개발부터 추론 배포까지 단일 파이프라인을 제공한다. 호스팅은 자사 DGX 기반 팩토리에서 이루어지며 급증하는 수요 대응을 위해 탄력 확장이 가능하다. 텔레포니카는 스페인 전역에 엣지 AI 인프라를 배포하고 있으며 데이터가 생성되는 지점 근처에서 즉시 추론이 가능한 구조를 도입하고 있다. 그래픽 처리장치(GPU) 기반 엣지 노드 수백 개를 통해 저지연, 고보안 AI 서비스를 제공하고 있으며 정부와 금융 같은 민감 분야에 집중하고 있다. 해당 구조는 엔비디아 'NIM 마이크로서비스'와 AI 엔터프라이즈 소프트웨어 기반이다. 이탈리아 통신사 패스트웹은 자국어 특화 언어모델 '미아(MIIA)'를 훈련하고 배포 중이다. 이 역시 엔비디아의 DGX 슈퍼컴퓨터 기반 모델로, 이탈리아에서 생성형 AI 활용을 대중화하는 데 핵심 역할을 맡고 있다. 국가별 언어·규제·인프라 환경에 맞춘 AI 로컬라이제이션이 엔비디아 전략의 관통점이다. 사기 탐지부터 고객 포트폴리오까지… 엔비디아, 금융AI 인프라 뿌린다 엔비디아는 유럽 금융기관을 위한 AI 팩토리 구축을 본격화하고 있다. 금융 데이터를 실시간 분석하고 업무 프로세스를 자동화할 수 있는 에이전틱 AI 모델을 각국 기관별로 현지화해 배포하려는 전략이다. 사기 감지, 고객 응대, 리스크 분석 등 금융 전 과정이 대상이다. 독일 저축은행 금융그룹의 기술 자회사 피난츠 인포르마틱은 온프레미스 AI 팩토리를 확대하고 있다. 이들은 엔비디아 AI 엔터프라이즈 소프트웨어를 기반으로 AI 어시스턴트를 운영하며 직원 업무를 자동화하고 내부 은행 데이터를 효율적으로 처리하고 있다. 금융 내재화된 모델 중심 구조다. 네오뱅크 번크는 엔비디아 가속 'XG부스트'와 '씨유디에프(cuDF)'를 활용해 사기 탐지 속도와 정확도를 크게 끌어올렸다. GPU 기반 학습으로 모델 훈련 속도는 100배, 데이터 처리 속도는 5배까지 상승했다. 번크는 이 기술을 자금세탁 위험 탐지와 개인 어시스턴트 '핀' 운영에도 확장 적용 중이다. 핀은 LLM 기반 에이전트로, 의미 기반 검색을 수행하는 '네모 리트리버'와 'NIM 마이크로서비스'를 통합해 구축됐다. 고객 질문에 문맥 기반 응답을 제공하며 기업 내부 데이터를 빠르게 추출·순위 재정렬할 수 있다. 생성형 AI 도입을 전면에 내세운 금융 서비스의 사례다. 런던 기반 결제사 체크아웃닷컴은 엔비디아 '씨유디에프' 가속기를 활용해 데이터 분석 시간을 수 분 단위에서 10초 이내로 줄였다. 또 '씨유엠엘(cuML)'과 아파치 스파크용 래피즈 액셀러레이터를 병행 도입해 테라바이트 단위 데이터 분석을 실시간 수준으로 끌어올리고 있다. 분석 파이프라인 효율이 기존 대비 획기적으로 개선된 셈이다. 엔비디아는 데이터이쿠, KX, 테메노스 등 AI 솔루션 기업들과 금융 특화 블루프린트도 병행 개발 중이다. KX는 네모트론과 NIM 기반 'AI 뱅커 에이전트' 블루프린트를 선보였다. 데이터이쿠는 자체 LLM 메시와 엔비디아 통합으로 은행·보험사 대상 에이전트 시스템을 확대하고 있다. 테메노스는 신용평가, 사기 감지, 고객 서비스 자동화에 AI를 활용하는 대표적인 서비스형 소프트웨어(SaaS) 기반 모델 배포사다. 젠슨 황 엔비디아 최고경영자(CEO)는 "AI 시대에는 모든 제조업체가 두 개의 공장이 필요한데 하나는 물리적인 제품을 만들기 위한 것이고 다른 하나는 그것을 구동할 인텔리전스를 만드는 것"이라며 "제조업이 AI 기반 스마트 생산으로 전환되려면 엔비디아의 AI 팩토리 모델이 필수"라고 말했다.

2025.06.16 15:57조이환

젠슨 황 "에이전트용 'AI 팩토리' 필요…유럽과 구축할 것"

"전 세계 어디서든 인공지능(AI) 에이전트를 실행할 수 있는 시대가 왔습니다. 에이전트를 제대로 활용하려면 이에 맞는 새로운 AI 팩토리가 필요합니다. 우리는 유럽과 손잡고 에이전틱 시대에 맞는 컴퓨터와 로보틱스, 차세대 추론 기술을 개발하겠습니다." 젠슨 황 엔비디아 최고경영자(CEO)는 프랑스 파리에서 열린 '엔비디아 GTC 파리' 기조연설에서 유럽이 AI 산업을 스스로 구축할 준비가 됐다며 이같이 강조했다. 이날 황 CEO는 엔비디아의 최신 AI 슈퍼컴퓨터인 GB200 NVL72와 이를 바탕으로 한 AI 팩토리 개념을 소개했다. GB200 시스템은 자가 추론과 계획, 대화 기능을 갖춘 '생각하는 기계'다. AI 팩토리는 이 시스템을 통해 추론 토큰을 생산하는 새로운 데이터센터 유형이다. 엔비디아는 유럽 각국 정부와 통신사, 클라우드 기업과 협력해 AI 인프라와 팩토리 구축을 확대할 방침이다. 현재 독일과 스페인, 이탈리아 등 주요 국가에는 기술 허브를 추가로 설치했으며, 유럽 전역에 DGX 클라우드 플랫폼인 '렙톤'을 배치하고 있다. 황 CEO는 유럽 양자 기업과 기술 융합도 본격화했다고 밝혔다. 현재 덴마크 슈퍼컴퓨터 '게피온'에 쿠다-Q 플랫폼을 탑재하고, 하이브리드 양자-AI 연구를 확대하고 있다. 그는 "이 기술은 오류 수정이 필요한 양자컴퓨팅에 실질적 돌파구가 될 것"이라고 전망했다. 엔비디아는 유럽 현지 수요에 맞는 소버린 모델 개발도 속도를 내고 있다. 네모트론 모델을 통해 다국어 AI를 지원하고 있으며, 이를 퍼플렉시티 검색엔진과 통합해 안전한 AI 응답 환경을 제공하고 있는 근황도 알렸다. 황 CEO는 모든 기업이 자체 AI 에이전트를 보유하게 될 것이라 예측하고, 이를 위한 '에이전틱 AI 안전성 블루프린트'와 'AI 플라이휠 구축을 위한 네모 에이전트 툴킷'도 발표했다. 또 엔비디아는 유럽 제조기업과 협력해 대규모 시뮬레이션, 자동화, 최적화 작업을 지원하는 산업 전용 AI 클라우드를 선보일 계획이다. 엔비디아의 AV 플랫폼 '드라이브'는 현재 양산 단계에 진입했으며, 자율주행차부터 소형 로봇까지 다양한 물리 기반 에이전트가 도입될 예정이다. 엔비디아는 디즈니, 딥마인드와 협력해 차세대 물리 시뮬레이션 엔진 '뉴턴'도 개발 중이다. 황 CEO는 "우리는 물리적 로봇과 정보 기반 로봇을 모두 에이전트라 부른다"며 "해당 기술이 AI 추론 수요를 충족시킬 핵심 기반이 될 것"이라 전망했다. 그러면서 "이제 사고와 추론을 위한 블랙웰 기반 컴퓨터가 필요하다"며 "새로운 AI 팩토리가 필요하다"고 말했다. 이어 "이제 하나의 모델 아키텍처와 한 번의 배포로 전 세계 어디서든 AI 에이전트를 실행할 수 있는 시대"라며 "유럽과 협력해 소버린 인프라, 로보틱스, 차세대 추론 시대를 열어가겠다"고 강조했다.

2025.06.13 14:51김미정

"기후 디지털 트윈 시대 연다"…엔비디아, AI 모델 'c보틀' 발표

엔비디아가 기후 시뮬레이션 정확도를 강화한 생성형 인공지능(AI) 모델을 공개했다. 엔비디아는 어스-2 플랫폼 기반의 파운데이션 모델 'c보틀'을 발표했다고 11일 밝혔다. c보틀은 '클라이밋 인 어 보틀(Climate in a Bottle)' 약자다. 킬로미터급 해상도로 지구 기후를 정밀하게 시뮬레이션하도록 설계됐다. 이 모델은 하루 시간대를 비롯한 연중 시기, 해수면 온도 등 다양한 입력값에 따라 사실적인 대기 상태를 생성할 수 있다. 기존 수치 모델보다 수천 배 빠르면서도 정확도 저하 없이 에너지 효율적인 기후 예측이 가능하다는 평을 받고 있다. c보틀은 고해상도 물리 시뮬레이션과 지난 50년간 관측 데이터를 기반으로 훈련됐다. 단 4주치 킬로미터급 데이터만으로도 학습이 가능할 정도로 데이터 효율성이 높다. 개발자는 해당 모델로 수십 페타바이트 규모의 데이터를 압축하고 손상된 정보를 복원하거나 편향된 데이터를 수정할 수도 있다. 저해상도 데이터를 고해상도로 변환하거나 관측 기반의 정보 생성도 가능하다. 엔비디아는 어스-2 플랫폼에 AI, 그래픽처리장치(GPU) 가속, 물리 시뮬레이션, 컴퓨터 그래픽 기능을 통합했다. 이를 통해 실시간 날씨 시뮬레이션과 시각화가 가능한 디지털 트윈 환경을 구축하고 있다. 주요 연구기관들도 c보틀을 활용한 공동연구에 착수했다고 밝혔다. 막스플랑크 기상 연구소는 엔비디아 GPU 기반으로 최초의 킬로미터급 전지구 시뮬레이션을 수행했고, 앨런 인공지능연구소는 c보틀을 기후 데이터 분석과 모델링에 접목하고 있다. c보틀은 세계기후연구프로그램이 주관한 글로벌 KM-스케일 해커톤에서 실증 테스트를 완료했다. 해당 행사는 8개국 10개 시뮬레이션 센터가 참여해 고충실도 기후 데이터의 접근성과 활용 방안을 검토했다. 엔비디아는 개발자들이 어스-2 플랫폼에서 c보틀을 사용해 인터랙티브한 기후 디지털 트윈을 구축할 수 있다고 설명했다. 낮은 지연 시간과 높은 처리량으로 다양한 기후 시나리오를 예측하는 데 활용될 수 있다. 현재 c보틀은 얼리 액세스 형태로 제공되며 연구자들은 깃허브에서 코드베이스를, 아카이브에서 논문을 열람할 수 있다. 비욘 스티븐스 막스플랑크 기상 연구소장은 "우리는 엔비디아의 첨단 AI와 가속 컴퓨팅을 활용해 지구의 디지털 트윈을 구축하고 있다"며 "이는 모두가 기후 과학에 접근하고 실행할 수 있는 새로운 시대를 열 것"이라고 밝혔다.

2025.06.11 16:14김미정

아이온큐 "우린 10년 전 엔비디아"…양자컴퓨팅 리더 자신

"아이온큐는 10년 전 엔비디아가 GPU로 산업을 변화시키기 시작했던 성장 궤적과 유사한 위치에 있다. 10년 후에는 엔비디아처럼 세계적인 기술 기업으로 성장하길 기대한다." 피터 채프먼 아이온큐 최고경영자(CEO)는 20일(현지시간) 미국 새너제이에서 열린 엔비디아 GTC 2025 퀀텀 데이 행사의 '양자 컴퓨팅: 현재 위치와 미래' 토론회에 참석해 이 같이 발언했다. 엔비디아가 GPU 분야에서 이룬 성과에 빗대 아이온큐의 성장 가능성에 대한 자신감을 드러냈다. 채프먼은 "10년 전만 해도 엔비디아의 GPU 기반 병렬 컴퓨팅이 지금처럼 전 산업 표준이 될 것으로 믿는 사람은 많지 않았다"며 "하지만 단단한 로드맵과 생태계 구축으로 끝내 시장을 재편했다"고 말했다. 이어 "아직 초기 단계이긴 하지만 아이온큐도 10년 전 엔비디아처럼 대형 생태계를 만들어갈 충분한 잠재력을 보유하고 있다"고 강조했다. 아이온큐는 현재 약 36큐빗 규모 이온 방식 양자컴퓨터를 상온에서 구동하는 것이 장점이라고 주장했다. 이를 통해 냉각·배선 등 하드웨어 문제를 비교적 덜 받으면서도, 높은 2큐빗 게이트 충실도(99% 이상)를 유지하는 성과를 거두고 있다. 이어 채프먼 CEO는 엔비디아 등 파트너사와 함께 달성한 양자컴퓨팅의 성과를 소개했다. 먼저 앤시스의 복합 물리 시뮬레이션 소프트웨어인 LS-DYNA를 아이온큐의 양자컴퓨터에서 실행시켜 기존 컴퓨팅 환경 대비 최대 12% 처리 성능 향상 기록을 달성했다. 이를 통해 혈액 펌프와 같은 고도로 복잡한 유체역학(FSI) 문제를 포함한 생체 의료기기 시뮬레이션을 개선하는 등 양자컴퓨터를 활용해 실제 산업 환경에서 실질적인 효율 개선을 입증한 사례 중 하나로 꼽히고 있다. 또한 엔비디아, 아마존웹서비스(AWS), 아스트라제네카 공동 진행한 화학·의약 시뮬레이션에서도 기존 고전 컴퓨팅 대비 최대 20배의 성능 향상을 달성했다. 채프먼 CEO는 "현재 약 36큐빗 수준의 양자컴퓨터 하드웨어를 연내 64큐빗으로 확장할 경우 이론적으로 기하급수적 성능 향상을 기대할 수 있을 것"이라고 설명했다. 젠슨 황 CEO는 10년 전 엔비디아 같다는 피터 채프먼 CEO의 비유에 대해 "양자컴퓨팅 업계가 지금 어느 시점을 지나고 있는가 보여주는 좋은 예"라며 "엔비디아 역시 처음에는 병렬 컴퓨팅이 생소해 혹독한 시행착오를 겪었지만 결국 GPU가 AI·HPC 산업 표준이 된 만큼 양자 분야도 마찬가지 과정을 거칠 수 있다"고 웃으며 공감을 표했다. 이어 "아이온큐가 벌써 산업에서 양자컴퓨터의 가속 효과를 입증했다는 점이 고무적"이라며 "초전도 등 다른 방식과 비교해 상온이라는 특성이`` 주는 이점은 분명 크다"며 아이온큐의 기술 전략에 긍정적인 평가를 내렸다. 엔비디아가 매년 개최하는 GPU 테크놀로지 컨퍼런스(GTC)에서 올해 처음으로 양자컴퓨팅에 초점을 맞춘 별도 행사인 '퀀텀 데이'가 진행됐다. 이 행사를 통해 엔비디아는 기존 컴퓨팅 인프라와 양자컴퓨팅을 결합한 하이브리드 생태계로 시야를 확장할 것임을 밝히며 보스턴 지역에 양자 연구소를 설립하고, MIT·하버드 등과 협업하겠다는 계획도 발표했다. 더불어 퀀덤데이에서는 젠슨 황 CEO의 주재로 아이온큐를 비롯해 리게티 컴퓨팅, 디웨이브, 퀀티뉴엄, 아톰컴퓨팅, 싸이퀀텀 등 주요 양자컴퓨팅 기업의 CEO 및 리더들이 대거 참여한 토론회가 진행됐다. 참가자들은 ▲양자컴퓨터의 에러 보정 및 스케일업 과제 ▲고전컴퓨팅과의 결합전략 ▲현재 상업 적용사례와 향후 전망 등에 대해 의견을 나눴다. 젠슨 황 CEO는 "이번 행사를 통해 양자컴퓨팅은 아직 너무 이르다는 오해를 어느 정도 해소했으면 한다"며 "다만 양자컴퓨터는 스프레드시트를 빠르게 돌리기 위한 것이 아니라 물리학·화학 등 복잡한 문제를 해결하는 정밀 과학 도구"라며 양자컴퓨터가 당장 모든 것을 해결할 수 있을 것이란 과도한 기대는 줄일 필요가 있다"고 말했다.

2025.03.21 09:17남혁우

젠슨 황 "양자컴퓨터 20년 소요 발언 철회…주가 영향 죄송"

젠슨 황 엔비디아 최고경영자(CEO)가 '양자컴퓨터 실용화까지는 20년이 걸릴 것'이라는 발언을 공식 철회했다. 더불어 해당 발언으로 인해 양자컴퓨팅 상장기업 주가에 영향을 미친 데 대해 사과했다. 2일(현지시간) 미국 새너제이에서 개최된 GTC 2025 퀀텀 데이 행사 양자컴퓨팅 리더 토론회에서 젠슨 황 CEO는 양자컴퓨팅 생태계와의 협력 의지를 분명히 하며 실용화 가능성을 재평가했다. 젠슨 황은 행사 중 토론회 중 "양자컴퓨터 실용화까지 20년이 걸릴 것이다라는 이전 발언은 철회한다"고 말했다. 그는 또 "상장된 양자컴퓨팅 기업이 있다는 사실을 몰랐다"면서 "그 발언이 상장 기업의 주가에 영향을 준 것 같아 정말 미안하게 생각한다"고 덧붙였다. 이어 "현재 양자컴퓨팅 발전 속도는 생각보다 빠르며, 일부 기업은 이미 실제 산업에서 의미 있는 성과를 내고 있다"고 강조했다. 젠슨 황 CEO는 양자컴퓨터가 복잡한 과학 문제를 해결할 수 있는 정밀 도구로서 실제 산업에서 활용되고 있다면서 양자생태계 발전을 위해 지원을 확대할 것임을 밝혔다. 특히 양자컴퓨터 자체를 직접 개발하지 않고 자사 GPU 기반 병렬 컴퓨팅과 양자 연산을 결합한 하이브리드 컴퓨팅 생태계를 구축할 계획이다. 이를 위해 양자 스타트업 및 연구기관과의 협업을 강화하며 보스턴에 세계적 수준의 양자연구소(Quantum Research Lab) 설립한다. 이 연구소는 MIT, 하버드, 퀀티뉴엄, 퀀컴 머신 등과 협력해 기존 컴퓨팅 인프라와 양자컴퓨터를 연결하는 하이브리드 컴퓨팅 기술 개발에 주력할 예정이다. 젠슨 황 CEO는 "우리는 양자 컴퓨터와 GPU, CPU가 하나의 시스템에서 자연스럽게 연동될 수 있도록 생태계를 조율할 것"이라며 "각 기업이 자유롭게 기술을 개발하되 효율적으로 통합될 수 있는 인프라를 제공하는 것이 우리의 역할"이라고 말했다. 이어 "엔비디아의 목표는 양자컴퓨팅 시장을 이끄는 플레이어가 아니라, 그 성장을 돕는 '가속기(accelerator)'가 되는 것이라며 "우리 모두 함께 이 미래를 만들어가야 할 것"이라고 강조했다.

2025.03.21 07:30남혁우

[현장] 아이온큐 "양자컴퓨팅, 이미 도입…현대차·에어버스도 활용"

"양자컴퓨팅 도입은 현재 진행 중이며 산업 전반에서 활용이 점진적으로 확대되고 있습니다. 지난달 젠슨황 엔비디아 회장의 '양자컴퓨팅 30년' 발언은 맥락이 오해된 것으로, 이 기술이 완전히 보편화되는 시점으로서 언급된 것이라고 봅니다. 현재 양자컴퓨팅은 보안, 금융, 제조 등 다양한 산업을 혁신하며 기존 컴퓨팅 패러다임을 변화시키고 있습니다." 아리엘 브라운슈타인 아이온큐 제품 및 응용 부문 수석부사장(SVP)은 20일 서울 마포구 aSSIST 핀란드타워에서 개최된 'AI 인사이트 포럼'에서 이같이 말했다. 그는 양자컴퓨팅 기술이 기존 인공지능(AI)이나 고성능 컴퓨팅(HPC)과는 근본적으로 다른 접근 방식을 갖고 있으며 특정 문제에서는 더 강력한 연산 능력을 발휘할 수 있다는 점을 강조했다. 브라운슈타인 부사장에 따르면 양자컴퓨터는 초고속 연산이 가능하며 기존 AI나 슈퍼컴퓨터가 해결하지 못하는 복잡한 문제를 처리할 수 있는 점이 가장 큰 차별점이다. 특히 AI는 대규모 데이터를 학습해 확률적 근사 해법을 도출하는 반면 양자컴퓨팅은 정밀한 최적해를 도출할 수 있어 산업 전반에 근본적인 변화를 가져올 것이라는 설명이다. 양자컴퓨팅, 금융·제조·물류 혁신할 것…"현대차와 협력, 韓 센터 설립 가능" 아이온큐의 양자 기술은 자연 원자를 이용해 양자정보 단위인 '큐비트'를 형성하는 것이 특징이다. 회사가 사용하는 '트랩트 이온' 방식은 자연적으로 높은 안정성과 긴 코히어런스(coherence) 시간을 제공해 다른 방식보다 우수하다. 이 방식은 큐비트 간 '올투올(All-to-All) 연결성'을 지원해 복잡한 계산에서도 효율성이 높다는 설명이다. 실제로 회사는 이미 현대자동차, 에어버스 등 글로벌 기업과 협력해 실질적인 성과를 내고 있다. 현대차와는 자율주행 기술을 위한 양자 머신러닝(Quantum Machine Learning) 연구를 진행 중이며 에어버스와는 항공 화물 적재 최적화 문제를 해결하는 데 양자컴퓨팅을 적용하고 있다. 이같이 양자컴퓨팅은 금융, 물류, 제조업 등 다양한 분야에서 활용될 전망이다. 브라운슈타인 부사장은 "양자컴퓨팅은 금융 리스크 관리, 공급망 최적화, 가격 예측 등에서 AI와 함께 새로운 가능성을 열 것"이라고 말했다. 업계에서는 국내 시장도 아이온큐의 중요한 타깃이 될 것으로 보고 있다. 브라운슈타인 부사장은 "한국 주요 기업과 협력을 확대할 계획"이라며 "현재 전 세계에 연구개발 센터를 개소하고 있는 만큼, 한국에도 개발센터를 세울 가능성이 있다"고 밝혔다. 업계 관계자는 "양자컴퓨팅이 아직 대중화되기까지는 시간이 걸리겠지만 특정 산업에서는 이미 실질적인 성과를 내고 있다"며 "국내 기업들도 기술 선점을 위한 투자와 협력을 강화해야 할 시점"이라고 강조했다. "젠슨황, 양자컴퓨팅 과소평가한 것 아냐…보편화와 도입 시점 구분해야" 이어진 질의응답 세션에서는 청중들의 관심이 집중된 핵심 질문들이 쏟아졌다. 특히 중국의 양자컴퓨팅 전략에 대한 질문이 나오자 브라운슈타인 부사장은 "중국은 실리콘 반도체 제조 강국으로, 초전도 방식에 집중하고 있다"며 "이는 연산 속도가 빠르다는 장점이 있지만 큐비트 간 연결성이 낮고 오류율이 높아 기술적 한계가 존재한다"고 분석했다. 구글과 IBM 역시 초전도 기반 양자컴퓨팅을 연구하고 있다. 이에 대한 질문에 그는 "초전도 방식은 연산 속도가 빠르지만 안정성이 낮아 장시간 연산이 어렵다"며 "반대로 우리 트랩트 이온(Trapped Ion) 방식은 자연 원자를 이용해 오랜 시간 동안 오류 없이 정밀한 계산이 가능하다"고 강조했다. 세션에서는 젠슨황 엔비디아 최고경영자(CEO)의 '양자컴퓨팅 상용화까지 30년' 발언에 대한 질문도 있었다. 이에 대해 브라운슈타인 부사장은 "젠슨 황 회장의 발언이 맥락 없이 해석된 것 같다"며 "양자컴퓨팅은 이미 산업에서 활용되고 있으며 AI와 GPU처럼 점진적으로 도입이 진행돼 30년 후에는 '완전히 보편화'된다는 의미로 본다"고 반박했다. 이어 "GTC 2025에서 양자컴퓨팅 관련 세션이 대폭 늘어났는데 황 회장이 자신의 발언이 과장되게 해석된 점을 바로잡으려는 조치를 취한 것 같다"고 설명했다. 블록체인과의 관계도 주요 쟁점이었다. 브라운슈타인 부사장은 "현재의 블록체인 암호화 방식은 양자컴퓨터가 본격화될 경우 위협받을 수 있다"며 "암호화 기술이 양자컴퓨팅 공격을 방어할 수 있도록 업그레이드돼야 한다"고 말했다. 이어 "양자컴퓨팅이 블록체인 분석과 최적화를 가능하게 할 수도 있다"며 "금융 리스크 관리, 공급망 최적화, 컴퓨팅 화학 등 다양한 산업에서 파급력을 가질 것"이라고 전망했다. 마지막으로 양자컴퓨팅이 스마트폰이나 PC 등 온디바이스 환경에서 활용될 가능성에 대한 질문도 나왔다. 이에 대해 브라운슈타인 부사장은 "아직까지 양자컴퓨터는 비용이 높고 실시간 처리가 어려워 단말기에 직접 내장되기는 어렵다"고 설명했다. 다만 클라우드 환경에서 AI 모델의 최적화와 개선을 지원하는 방식으로 활용될 것이라고 전망했다. 실제로 현재 삼성 갤럭시 등 일부 기기에 양자 보안 기술이 탑재됐지만 이는 양자컴퓨터가 아니라 단순한 암호화 기술이다. 진정한 양자컴퓨팅은 장기적으로 클라우드 중심으로 발전할 것이라는 것이라는 설명이다. 발표를 마치며 브라운슈타인 부사장은 양자컴퓨팅이 먼 미래의 기술이 아니라 이미 산업에 도입되고 있음을 강조했다. 그는 "양자컴퓨팅은 점진적으로 산업 전반에 확산될 것으로, 이 기술이 새로운 기회를 창출할 것이니 관심을 가져야 한다"며 "최근 한국과학기술정보연구원(KISTI)를 방문해 협력 방안을 논의했는데 한국 시장에서도 더 많은 기회가 열릴 것으로 전망한다"고 밝혔다.

2025.03.20 12:41조이환

엔비디아, 개방형 휴머노이드 로봇 파운데이션 모델 공개

엔비디아가 18일(현지시간) 미국 새너제이에서 열린 'GTC 2025'에서 개방형 휴머노이드 로봇 파운데이션 모델인 '아이작 GR00T N1'을 발표했다. 엔비디아 아이작 GR00T N1은 일반화된 휴머노이드 추론과 기술을 위한 세계 최초 완전 맞춤형 개방형 파운데이션 모델이다. 젠슨 황 엔비디아 최고경영자(CEO)는 "일반적인 작업을 수행하는 로봇 기술의 시대가 도래했다"며 "GR00T N1과 새로운 데이터 생성 및 로봇 학습 프레임워크를 통해 전 세계 로봇 개발자들이 AI 시대의 새로운 지평을 열게 될 것"이라고 말했다. GR00T N1은 인간 인지 원리에서 착안한 이중 시스템 아키텍처를 채택했다. 시스템 1은 인간의 반사신경이나 직관을 반영한 신속한 사고 행동 모델이고, 시스템 2는 신중하고 체계적인 의사결정을 위한 모델이다. 로봇이 물체를 잡거나 이동시키는 등 일상작업을 물론 복잡한 단계를 거쳐야 하는 작업도 수행할 수 있다. 긴 맥락과 일반적인 기술의 조합이 필요한 다단계 작업도 수행할 수 있게 된다. 개발자들은 특정 휴머노이드 로봇과 작업에 맞춰 실제 또는 합성 데이터를 사용해 GR00T N1을 사후 훈련시킬 수 있다. 보스턴다이내믹스와 어질리티로보틱스, 멘티 로보틱스 등 주요 휴머노이드 개발사들이 GR00T N1을 미리 접근해 이용하고 있다. 엔비디아는 구글 딥마인드, 디즈니 리서치와 손잡고 로봇 개발용 오픈소스 물리 엔진 '뉴턴' 개발 소식도 전했다. 뉴턴은 워프 프레임워크를 기반으로 한다. 구글 딥마인드의 무조코와 엔비디아 아이작 랩 등 시뮬레이션 프레임워크와 호환된다. 구글 딥마인드와는 로보틱스 머신 러닝 작업을 70배 이상 가속화할 것으로 기대되는 '무조코-워프'를 공동 개발하고 있다. 디즈니 리서치는 GTC에서 선보인 스타워즈 BDX 드로이드를 포함해 차세대 엔터테인먼트 로봇 구동에 뉴턴을 활용할 예정이다. 엔비디아는 로봇 개발에 필요한 대규모 합성 조작 모션을 생성하기 위해 '아이작 GR00T 블루프린트'도 개발했다. 옴니버스와 코스모스 트랜스퍼를 기반으로 구축됐다. 소수의 인간 시연 데이터를 바탕으로 합성 모션 데이터를 대량 생성할 수 있다. 엔비디아 관계자는 "블루프린트를 이용해 사람이 9개월간 시연할 수 있는 데이터에 해당하는 78만 개의 합성 경로를 단 11시간 만에 생성했다"며 "데이터는 허깅 페이스를 통해 오픈소스로 공개했다"고 말했다.

2025.03.20 09:46신영빈

엔비디아, 구글과 손잡고 AI 판도 재편…옴니버스로 '피지컬 AI' 혁신

엔비디아가 인공지능(AI) 추론, 기상 예측, 피지컬 AI 기반 산업 자동화 기술을 종합적으로 혁신하고 있다. 오픈소스 소프트웨어와 협력 이니셔티브를 통해 반도체 강자로서의 입지를 공고히 하는 동시에 AI 시대에서도 지속적인 경쟁력을 확보하기 위한 초읽기에 들어갔다. 엔비디아는 18일(현지 시간) 미국 새너제이에서 열린 GTC 2025에서 '다이나모', '어스-2', '옴니버스' 등의 AI 기술을 발표하고 알파벳과의 협력 이니셔티브를 공개했다. 지난 17일부터 닷새간 진행되는 이번 행사는 회사가 발전시킨 주요 기술과 업계 협력 사례를 공개하기 위해 마련됐다. 엔비디아는 '다이나모'를 통해 AI 추론 최적화를 실현하고 '어스-2'로 초정밀 기상 예측 솔루션을 선보였다. 더불어 알파벳·구글과 협력해 물리 AI 기반 로봇·신약 개발·전력망 최적화 등 다양한 산업 분야에서 AI 자동화를 추진하며 세부 기술력을 한층 고도화하고 있다. '다이나모'로 AI 추론 성능 극대화…'어스-2'로 기상 예측 혁신 엔비디아는 GTC 2025에서 '다이나모'와 '어스-2' 플랫폼을 공개했다. 각각 AI 모델의 성능 향상과 기상 예측 정밀도를 높이는 데 초점을 맞추고 있지만 두 기술 모두 엔비디아 GPU의 가속 성능을 극대화해 기존보다 효율적이면서도 신속한 모델 운영을 지원한다. '다이나모'는 대규모 그래픽처리장치(GPU) 클러스터에서 AI 추론을 최적화하는 소프트웨어다. 다수의 GPU를 활용해 AI 모델이 더 많은 데이터를 빠르게 처리하도록 돕는다. 특히 언어 모델의 추론을 각 단계별로 다른 GPU에 분산하는 '분리 서빙' 방식을 채택해 처리량을 극대화하고 비용을 절감할 수 있다. 기존 AI 추론 방식에는 모델이 한 번 계산한 데이터를 다시 연산하는 비효율이 존재했다. 이에 '다이나모'는 '스마트 라우터' 기능을 도입해 이미 연산된 정보를 특정 GPU에 저장하고 필요할 때 재사용할 수 있도록 한다. 이로써 대규모 AI 팩토리에서 토큰 수익을 극대화하고 GPU 활용도를 높일 수 있게 됐다. 특히 엔비디아 최신 GPU 아키텍처인 '호퍼' 기반 시스템에서 '다이나모'를 활용할 경우 동일한 수의 GPU에서 AI 모델의 처리량을 두 배 이상 증가시킬 수 있다. 또 'GB200 NVL72' 랙에서 딥시크 'R1' 모델을 실행할 때는 GPU당 생성되는 토큰 수가 30배 이상 증가하는 것으로 나타났다. 엔비디아는 AI 추론뿐만 아니라 기상 예측 기술도 혁신하고 있다. '다이나모'와 동시에 공개된 '어스-2 기상 분석용 블루프린트'는 AI 기반 고해상도 기상 예측 솔루션이다. 기후 변화로 인한 재해 위험이 증가하는 가운데 보다 정확하고 빠른 기상 예측이 가능하도록 지원한다. '어스-2 블루프린트'에는 AI 기상 모델 '포캐스트넷'과 고해상도 데이터 변환 모델 '코디프'가 포함됐다. 이들은 기존 CPU 기반 기상 예측보다 최대 500배 빠른 연산 속도를 제공한다. 또 GPU 기반 AI 기상 분석을 통해 보다 세밀한 지역별 기상 예측이 가능하며 예측 정확도도 향상됐다. 엔비디아는 이번 블루프린트를 통해 다양한 기업과 연구 기관이 기상 분석과 재해 대응에 AI를 활용할 수 있도록 돕고 있다. 실제로 아랍에미리트 국립기상센터(UAE NCM), 기상 리스크 관리 기업 JBA 리스크 매니지먼트, 위성 데이터 분석 기업 스파이어 글로벌 등이 어스-2 블루프린트를 도입해 자체 AI 예측 모델을 구축하고 있다. 특히 스파이어 글로벌은 엔비디아 GPU를 활용해 기존 물리 기반 기상 모델보다 1천배 빠른 예측 시스템을 개발했다. 이 시스템은 위성 데이터를 분석해 최대 45일간의 기후 변화를 예측할 수 있다. 젠슨 황 엔비디아 창립자 겸 최고경영자(CEO)는 "어느 때보다도 극심한 기상 이변과 자연재해가 인류의 생명, 재산을 위협하고 있다"며 "'어스-2용 옴니버스 블루프린트'는 전 세계 산업들을 도와 기후 변화와 기상 관련 재난의 대비, 피해 완화에 기여할 것"이라고 말했다. 알파벳과 함께 '물리 AI' 혁신 맞손…'옴니버스'로 산업 자동화 확대 엔비디아는 물리 분야에서도 AI 혁신을 주도하고 있다. 알파벳·구글과 협력해 물리 AI(Physical AI) 개발을 강화하고 산업용 AI 운영체제 '옴니버스'를 통해 산업 자동화를 가속하고 있다. 실제로 엔비디아는 이번 행사에서 알파벳과 함께 'AI 발전을 위한 공동 이니셔티브'를 발표했다. 이번 협력으로 엔비디아의 AI 가속 기술과 알파벳의 인공지능·로보틱스 연구가 결합돼 의료·제조·에너지·스포츠 등 산업 전반에서 AI 혁신을 가속화할 전망이다. 알파벳의 계열사인 구글 클라우드는 엔비디아의 최신 AI 인프라 'GB300 NVL72 랙 스케일 솔루션'과 'RTX PRO 6000 블랙웰 서버 에디션'을 가장 먼저 도입한다. AI 연구와 생산 시스템을 위한 인프라 최적화를 목표로, 생성형 AI의 투명성을 높이기 위해 구글 딥마인드의 AI 워터마킹 기술 '신스ID'도 도입하기로 했다. 알파벳의 로봇 연구 조직인 인트린직은 엔비디아의 '아이작 매니퓰레이터 파운데이션 모델'을 활용해 AI 기반 로봇 자동화 기술을 개발하고 있다. 이를 통해 산업용 로봇이 보다 정교한 작업을 수행할 수 있도록 지원하며 제조업체들이 AI 기반 로봇을 보다 쉽게 적용할 수 있도록 한다. 엔비디아는 물리 AI의 확장을 위해 '옴니버스 물리 AI 운영체제' 역시 전면 업그레이드했다. 옴니버스는 현실 데이터를 디지털 환경과 연결하는 산업용 AI 운영체제로, 제조업·물류·데이터센터·전력망 관리 등 다양한 분야에서 AI 최적화를 지원한다. 특히 이번 GTC 2025에서는 ▲AI 기반 로봇 공장 ▲물류 자동화 ▲데이터센터 디지털 트윈 ▲대규모 합성 데이터 생성을 포함한 4개의 새로운 '옴니버스 블루프린트'를 공개했다. 이를 통해 공장 자동화와 물류 시스템의 효율성을 높이고, AI 로봇의 학습 속도를 더욱 향상시킬 수 있도록 했다. 폭스콘, GM, 현대자동차, 메르세데스-벤츠 등 글로벌 제조 기업들은 이미 '옴니버스'를 도입해 생산라인과 물류 시스템을 최적화하고 있다. 현대차는 보스턴 다이내믹스의 '아틀라스' 로봇을 생산 공정에 적용해 테스트하고 있으며 메르세데스-벤츠는 '아폴로' 휴머노이드 로봇을 활용해 차량 조립 작업을 혁신하고 있다. 또 데이터센터 운영 효율을 높이기 위해 옴니버스를 활용한 디지털 트윈 시스템도 공개됐다. AI 팩토리 디지털 트윈을 통해 공장의 냉각·전력 시스템을 설계하고 시뮬레이션할 수 있어 AI 기반 데이터센터의 에너지 절감 효과를 극대화할 수 있다. 엔비디아는 클라우드 환경에서도 옴니버스 사용을 확대하고 있다. 아마존웹서비스(AWS), 마이크로소프트 애저, 오라클 클라우드, 구글 클라우드에서도 옴니버스를 지원해 개발자들이 보다 쉽게 AI 모델을 학습하고 배포할 수 있도록 하고 있다. 젠슨 황 엔비디아 CEO는 "우리는 알파벳과 AI 인프라 및 소프트웨어 구축부터 대규모 산업에서의 AI 활용을 촉진하는 데까지 오랜 기간 협력해 왔다"며 "신약 개발에서 로보틱스에 이르기까지 구글과 엔비디아의 연구진과 엔지니어들이 협력해 어려운 과제들을 해결해 나가는 모습을 보면 매우 뿌듯하다”고 말했다.

2025.03.19 11:50조이환

지코어-미란티스, AI 모델 배포 효율성 강화 협력

지코어가 인공지능(AI) 추론 워크로드 배포 효율성을 높이기에 나섰다. 지코어가 오는 21일까지 미국 새너자이에서 열리는 AI 컨퍼런스 'GTC 2025'에서 미란티스와 협력한다고 19일 밝혔다. 이번 협력은 지코어의 AI 추론 솔루션 '에브리웨어 인퍼런스'를 미란티스의 오픈소스 플랫폼 관리 솔루션 '코어던트'에 통합하는 것이 핵심이다. 코어던트는 멀티 클라우드·하이브리드 환경에서 인프라 운영을 지원하는 솔루션이다. 이번 통합으로 기업은 그래픽처리장치(GPU) 등 컴퓨팅 자원을 최적화하고 AI 모델 배포를 간소화할 수 있다. 또 성능 모니터링과 비용 관리 기능이 향상되며, 지역별 데이터 주권 규정 준수도 용이해진다. AI 모델은 클라우드뿐만 아니라 온프레미스, 하이브리드, 엣지 환경에서도 배포 가능해졌다. 기업은 이를 활용해 대규모 AI 추론을 신속하게 운영할 수 있다. 알렉스 프리들랜드 미란티스 최고경영자(CEO)는 "오픈소스 기술은 글로벌 인프라 운영의 자율성과 제어권을 유지하는 데 중요한 역할을 한다"며 "지코어와의 협력으로 머신러닝 운영(MLOps)과 플랫폼 엔지니어가 직면한 문제 해결이 더욱 가속화될 것"이라고 말했다. 지코어 세바 베이너 엣지 클라우드·AI 제품 디렉터는 "이번 협력은 AI 추론 과정에서 발생하는 문제를 해결하기 위한 것"이라며 "기업이 AI 프로젝트를 보다 신속하게 시장에 출시하고 투자대비수익률(ROI)를 개선하는 데 기여할 것"이라고 밝혔다. 미쉬 스트로츠 렛츠AI CEO는 "기존 AI 모델 배포에는 많은 시간과 리소스가 필요했다"며 "이번 협력으로 몇 번의 클릭만으로 모델을 배포하고, 새로운 GPU도 몇 시간 내에 온보딩할 수 있어 생산성이 크게 향상될 것"이라고 평가했다.

2025.03.19 10:26김미정

"삼성SDS도 신뢰한 AI 팩토리"…델-엔비디아, 기업용 AI 시장 공략 '박차'

델 테크놀로지스가 엔비디아와 손잡고 인공지능(AI) 인프라를 전면 업그레이드한다. 기업들의 AI 도입 장벽을 낮추고 혁신 속도를 끌어올려 시장 경쟁력을 강화하려는 행보다. 델 테크놀로지스는 18일 온라인 미디어 브리핑에서 '엔비디아 기반 델 AI 팩토리'의 최신 포트폴리오를 공개했다. 엔비디아의 'GTC 2025'와 동시에 열린 이번 간담회에서는 엔비디아와 델의 협력 성과가 집중 조명됐다. 델은 AI PC, 서버, 스토리지, 네트워킹 등 AI 인프라 전반을 아우르는 신제품을 대거 선보였다. 이날 발표를 진행한 바룬 차브라 델 인프라 및 텔레콤 마케팅 수석 부사장은 AI의 본격적인 산업 적용이 시작되면서 기업들은 AI 도입에 있어 여러 장애물을 마주하고 있는 점을 지적했다. 차브라 부사장에 따르면 현재 기업들은 ▲비용 통제 ▲데이터 관리 ▲기존 시스템과의 통합 ▲전문 인력 부족을 주요 도전 과제로 직면해 전체 중 77%의 기업이 AI 인프라 구축을 위해 '단일 벤더'를 선호하고 있다. 이에 따라 델은 엔비디아와의 협력을 통해 이 같은 시장 수요를 적극 공략할 계획이다. 실제로 델은 이번 브리핑에서 AI PC 시장 공략을 위한 신제품을 대거 선보였다. '델 프로 맥스 AI PC' 라인업에는 엔비디아의 최신 '그레이스 블랙웰' 아키텍처가 적용됐다. 기존 데이터센터에서만 활용되던 AI 개발용 그래픽처리장치(GPU) 성능을 데스크톱에서도 구현한 것이 특징이다. 연구자와 개발자를 위한 소형 워크스테이션뿐 아니라 784기가바이트(GB) 메모리와 20페타플롭스(PFLOPS) 성능을 갖춘 고성능 AI 개발용 PC도 함께 공개됐다. 데이터센터 부문에서도 델과 엔비디아의 협력은 강화된다. 차브라 부사장에 따르면 델은 엔비디아의 최신 블랙웰 GPU와 커넥트X8 슈퍼닉스를 지원한다. 특히 곧 출시될 '델 파워엣지 XE 8712(PowerEdge XE8712)' 서버는 노드당 2개의 그레이스 CPU와 4개의 블랙웰 GPU를 탑재해 데이터센터 내 AI 성능을 극대화할 것으로 예상된다. 한 랙에 144개의 GPU를 수용할 수 있어 초고밀도 AI 연산 환경을 구축할 수 있다. AI 데이터 관리 역시 델의 핵심 혁신 분야 중 하나다. 이를 위해 '델 AI 데이터 팩토리 위드 엔비디아(Dell AI Factory with NVIDIA)'는 기업들이 AI 데이터를 더 빠르게 처리하고 보다 안전하게 보호할 수 있도록 설계됐다. 이 플랫폼은 대량의 데이터를 실시간으로 받아들이는 데이터 인제스천 기능을 지원하며 GPU 가속 기반 '스파크 쿼리'를 활용해 기존 대비 최대 220% 향상된 속도로 데이터를 분석하고 처리할 수 있다. 차브라 부사장은 "AI의 성능을 극대화하려면 데이터를 빠르게 처리하고 안전하게 보관하는 것이 필수"라며 "우리 AI 데이터 팩토리는 대규모 AI 워크로드를 보다 효율적으로 운영할 수 있도록 설계돼 기업들의 AI 도입 속도를 한층 끌어올릴 것"이라고 설명했다. AI 소프트웨어 분야에서도 델과 엔비디아의 협력은 이어지고 있다. 델은 '에이전트 AI' 시스템 개발을 지원하는 엔비디아의 AI 개발 프레임워크인 '에이전틱 AI'와 이를 위한 AI 최적화 도구를 AI 팩토리에 통합했다. 이에 따라 기업들은 AI가 단순한 질의응답을 넘어 스스로 의사 결정을 내릴 수 있는 시스템을 구축할 수 있게 됐다. 회사는 AI 인프라 구축뿐만 아니라 AI 네트워킹 및 배포 서비스도 강화하고 있다. 네트워크 최적화, GPU 서버 구축, 다중 벤더 환경 통합 등 다양한 AI 전문 서비스를 제공하며 AI 프로젝트의 초기 단계부터 운영까지 전 과정을 지원한다. 이같이 AI 도입이 빠르게 확산되면서 델과 엔비디아의 협력도 지속적인 탄력을 받고 있다. 양사는 지난해 GTC에서 '델 AI 팩토리 위드 엔비디아'를 공개한 이후 지난 1년간 100개 이상의 신규 AI 제품을 출시하고 2천 개 이상의 고객을 확보했다. 특히 삼성SDS는 델과 협력해 AI 팩토리를 구축했으며 이를 통해 모델 정확도를 98%까지 향상시키고 업무 생산성을 70% 이상 개선한 것으로 알려졌다. 스콧 구 삼성SDS 클라우드 서비스 사업부문 부사장은 델-엔비디아 협력을 두고 "우리는 모든 고객을 위한 AI 팩토리를 구축하고 있다"며 "이를 서비스 형태로 안전하게 제공하거나 고객의 자체 환경에 배포할 수 있도록 하고 있다"고 말했다. 향후에도 델은 엔비디아와 협력해 AI 시장에서의 입지를 더욱 강화할 계획이다. 바룬 초프라 델 수석 부사장은 "우리는 엔비디아와 AI 도입을 가속화할 수 있는 완벽한 파트너"라며 "AI 생태계 전반에서 기업들이 혁신을 실현할 수 있도록 지원할 것"이라고 강조했다.

2025.03.19 08:32조이환

"AI 에이전트 시대 주도"…엔비디아, 추론 강화 돕는 SW 공개

엔비디아가 인공지능(AI) 에이전트 시대 본격화를 위한 기술 로드맵을 공개했다. AI 에이전트 개발·유지에 필요한 소프트웨어(SW) 기술을 비롯한 오픈소스 추론 모델 시리즈, 기업용 AI 워크플로 솔루션까지 잇따라 선보였다. 엔비디아는 17~21일까지(현지시간) 미국 새너제이에서 열리는 개발자 회의 'GTC 2025' 미디어 프리브리핑에서 AI 에이전트 개발·추론 강화에 필요한 SW 기술을 공개했다. 이를 통해 AI 에이전트 기술 생태계를 선점하고 기업용 AI 시장에서 주도권을 확보 하려는 전략이다. 이번에 발표할 주요 SW 제품으로는 AI 추론 모델 성능 강화를 돕는 '엔비디아 다이나모(NVIDIA Dynamo)'와 오픈소스 모델 '라마 네모트톤(Llama Nemotron)' 시리즈, '엔비디아 IQ 블루프린트'다. 엔비디아는 해당 제품 모두 AI 에이전트 구축 필수 요소로 자리잡을 것이라 재차 강조했다. '엔비디아 다이나모'로 AI 모델 추론 강화 이번 행사에서 엔비디아는 '엔비디아 다이나모'를 발표한다. 엔비디아 다니어모는 대규모 AI 추론 모델 성능을 올리는 오픈소스 소프트웨어(SW)다. 엔비디아 다이나모는 전체 데이터센터에서 분산·분해 방식으로 작동한다. 분산 방식은 하나의 AI 작업을 여러 개 GPU로 나눠 동시 처리하는 식이다. 기존에는 단일 GPU가 연산을 수행하는 방식이었다면, 다이나모는 동일 작업을 여러 GPU가 협력해 처리하도록 설계됐다. 이를 통해 대량 데이터를 더 빠르고 효율적으로 분석할 수 있다는 설명이다. 엔비디아는 다이나모 분해 방식도 핵심 요소로 꼽았다. 이 방식은 AI 모델이 하나의 질문을 받으면 이를 작은 단위로 쪼개 여러 GPU에 나눠 연산을 수행한다. 이후 최종 결과를 합치는 식이다. 이는 GPU 간 연산 부담을 줄이고 처리 속도를 높일 수 있다. 특히 데이터센터 내 수백~수천 개 GPU가 동시에 운영될 경우, 다이나모 최적화 기술이 GPU 성능 향상을 극대화할 수 있다. 다이나모는 해당 작동방식에 기반해 쿼리 하나를 최대 1천개 그래픽장치(GPU)로 확장할 수 있도록 설계됐다. 기존 방식보다 GPU 활용도를 높여 동일 개수의 GPU로도 처리량을 두 배까지 늘릴 수 있다. AI 모델이 데이터 처리하는 속도가 늘면 자연스럽게 비용 절감 효과와 처리 가능한 데이터 양도 는다. 향후 AI 기반 서비스 운영 효율성을 높이는 핵심 요소로 작용할 전망이다. 여기에 엔비디아의 최신 GPU 네트워크 기술 'NY링크'를 결합하면 성능 향상 폭이 더욱 커진다. NY링크는 GPU 간 데이터 전송 속도를 높이는 기술이다. AI 모델 연산 과정에서 병목현상을 줄이는 역할을 한다. 이를 통해 같은 개수의 GPU를 사용하면서도 최대 30배까지 처리 성능을 끌어올릴 수 있다. 이 외에도 다이나모는 파이토치(PyTorch)를 비롯한 텐서RT, sglang 등 다양한 AI 프레임워크와 호환되는 개방형 아키텍처를 지원한다. 이를 통해 기존 AI 모델을 변경하지 않고도 성능을 개선할 수 있다. 엔비디아는 "딥시크처럼 대규모 데이터를 처리하는 모델은 연산량이 많아 GPU의 확장성이 중요하다"며 "다이나모는 이런 대형 모델 연산 부담을 효과적으로 분산시키는 역할을 한다"고 강조했다. "똑똑한 AI 에이전트 구축"…오픈소스 모델 '라마 네모트론' 시리즈 엔비디아는 AI 에이전트 추론 능력 강화를 위해 새 오픈소스 AI 모델 '라마 니모트론(Llama Nemotron)' 시리즈를 내놨다. 이는 비즈니스 환경에서 즉시 활용 가능한 AI 추론 모델이다. 주로 복잡한 문제 해결을 위한 고급 AI 에이전트 구축에 사용된다. 메타의 오픈소스 모델 '라마' 기반으로 작동한다. 엔비디아는 "해당 모델은 알고리즘적으로 가지치기 과정을 거쳐 모델 크기를 줄였다"며 "이로 인해 컴퓨팅 자원을 덜 소모하면서도 정확도를 유지할 수 있게 최적화됐다"고 설명했다. 또 "사후학습 기법을 통해 라마 니모트론 모델을 더욱 개선했다"고 말했다. 그러면서 "주로 수학 문제 해결과 도구 호출, 명령어 처리, 대화 기능 등 여러 분야에서 최상의 추론 성능을 발휘할 수 있다"고 말했다. 라마 니모트론 모델군은 '나노(Nano)'와 '수퍼(Super)' '울트라(Ultra)' 버전으로 이뤄졌다. 나노는 해당 모델 크기에서 가장 높은 추론 정확도를 제공한다. 수퍼는 단일 데이터센터 GPU에서 가장 빠른 처리 속도를 제공한다. 울트라는 데이터센터급 멀티 GPU 환경에서 AI 에이전트 추론 정확도 극대화를 돕는 모델이다. 나노와 수퍼는 이번 GTC에서 NIM 마이크로서비스 형태로 제공된다. 울트라 모델은 추후 공개된다. 해당 모델 시리즈는 데이터셋 관련 기술과 패키지 형태로 제공된다. 이 데이터셋은 엔비디아가 생성한 600억 개 토큰으로 구성한 합성 데이터셋이다. 약 36만 시간의 H100 GPU 추론 수행과 4만 5천 시간의 인간 주석 작업을 통해 개발됐다. 이 외에도 해당 모델 시리즈는 추론 기능을 온·오프(toggle on/off)할 수 있는 옵션도 제공한다. 이는 오픈 모델에서는 드문 기능인 것으로 평가받고 있다. '엔비디아 IQ 블루프린트'로 AI 에이전트 유연성 높였다 엔비디아는 '엔비디아 IQ 블루프린트'를 출시했다. 해당 솔루션은 4월부터 이용 가능하다. IQ 블루프린트는 개발자가 NIM으로 AI 에이전트를 구축하고 이를 엔터프라이즈 비즈니스 시스템과 연결하게 돕는 AI 워크플로 도구다. 이를 통해 AI 에이전트가 텍스트, 이미지, 영상 등 여러 데이터 유형을 검색·활용할 수 있게 지원한다. 웹 검색이나 다른 AI 에이전트와 같은 외부 도구 활용도 가능하다. 또 다수 AI 에이전트가 팀을 이뤄 협력할 때 개발자가 AI 시스템 작동 과정을 모니터링하고 성능을 개선할 수 있도록 가시성과 투명성을 제공한다. 엔비디아는 "IQ 블루프린트를 활용하면 AI 에이전트 정확도를 높이고, 복잡한 작업 처리 시간을 몇 시간에서 몇 분으로 단축할 수 있다"고 강조했다. 또 엔비디아는 주요 데이터 스토리지 기업과 협력해 AI 데이터 플랫폼을 개발 중이라고 밝혔다. 해당 플랫폼에는 네모 리트리버와 IQ 블루프린트, 블랙웰 GPU, 스펙트럼-X 네트워킹, 블루필드 DPU 등이 포함된다. 이를 통해 실시간에 가까운 데이터 기능을 제공할 방침이다. 엔비디아는 "앞으로 엔터프라이즈 데이터가 AI 에이전트를 위한 핵심 자원으로 활용될 전망"이리며 데이터 플랫폼 개발 배경을 밝혔다. 그러면서 "현재 기업 데이터 저장 시스템은 단순히 파일을 저장하고 제공하는 역할만 수행하고 있다"며 "AI 에이전트가 도입되면, 기업은 데이터 저장·관리 시스템을 지식 제공 시스템으로 전환할 수 있다"고 강조했다.

2025.03.19 05:02김미정

SK하이닉스, 엔비디아 연례 행사서 HBM4·SOCAMM 등 공개

SK하이닉스는 17일부터 21일(현지시간)까지 미국 새너제이에서 엔비디아가 주최하는 글로벌 AI 컨퍼런스인 'GTC 2025'에 참가해, 'Memory, Powering AI and Tomorrow(메모리가 불러올 AI의 내일)'를 주제로 부스를 운영한다고 18일 밝혔다. 회사는 HBM을 포함해 AI 데이터센터, 온디바이스, 오토모티브 분야 메모리 설루션 등 AI 시대를 이끌 다양한 메모리 제품을 전시한다. 회사는 "HBM3E 12단 이외에 새로운 AI 서버용 메모리 표준으로 주목받고 있는 SOCAMM(저전력 D램 기반의 AI 서버 특화 메모리 모듈)도 함께 전시해, 선도적인 AI 메모리 기술력을 선보이겠다"고 말했다. 이번 행사에는 곽노정 대표이사 사장(CEO), 김주선 AI Infra(인프라) 사장(CMO), 이상락 부사장(Global S&M 담당) 등 회사 주요 경영진이 참석해 글로벌 AI 산업 리더들과의 협력을 공고히 할 예정이다. 세계 최초로 5세대 HBM(HBM3E) 12단 제품을 양산해 고객사에 공급 중인 SK하이닉스는 올 하반기 내로 HBM4 12단 제품 양산 준비를 마치고, 고객이 원하는 시점에 맞춰 공급을 시작한다는 방침이다. 이번 전시에는 개발중인 HBM4 12단의 모형도 함께 전시될 예정이다. 김주선 SK하이닉스 사장은 “이번 GTC에서 AI 시대의 선도 제품을 선보여 뜻 깊게 생각한다”며 “차별화된 AI 메모리 경쟁력을 통해 '풀 스택 AI 메모리 프로바이더(Full Stack AI Memory Provider)'로서의 미래를 앞당길 것”이라고 말했다.

2025.03.19 05:00장경윤

엔비디아 'GTC 2025' 개막...젠슨 황 입 주목

엔비디아가 생성형 인공지능(AI)과 고성능 컴퓨팅 미래 비전을 제시한다. 엔비디아는 17일부터 21일(현지시간)까지 미국 캘리포니아 산호세에서 'GPU 테크놀로지 컨퍼런스(GTC) 2025'를 개최해 AI 시대 필요한 차세대 그래픽처리장치(GPU)를 비롯한 AI 칩, 소프트웨어(SW) 플랫폼을 발표한다. 이번 행사는 세션 약 1천개, 연사 2천명, 전시 400개로 구성됐다. 젠슨 황 엔비디아 최고경영자(CEO)는 18일 오전 10시 SAP 센터에서 기조연설을 진행한다. 매년 글로벌 기술 업계는 황 CEO 발표 내용에 주목했다. 엔비디아는 이번 황 CEO 연설이 AI와 고성능 컴퓨팅 기술에 초점을 맞출 예정이라고 밝혔다. 로보틱스, 소버린 AI, AI 에이전트, 자동차 분야 관련 발표도 진행된다. 다수 외신은 이번 행사에서 블랙웰 칩 라인업 업그레이드 버전이 공개될 가능성이 크다고 봤다. 앞서 황 CEO는 최근 실적 발표에서 차세대 블랙웰 B300 시리즈 '블랙웰 울트라'가 올해 하반기 출시될 예정이라고 밝힌 바 있다. 블랙웰 울트라는 기존보다 더 높은 컴퓨팅 성능을 제공하며, 288GB 메모리를 탑재했다. 메모리 집약적인 AI 모델을 실행하고 학습하는 데 적합할 것이라는 평가를 받고 있다. 차세대 GPU 시리즈인 '루빈'도 이번 GTC에서 언급될 것이란 분석도 이어지고 있다. 루빈은 2026년 출시 예정이다. 테크크런치는 "이번 행사에 루빈 이후 제품에 대한 내용도 일부 공개될 전망"이라며 "루빈 울트라 GPU 혹은 루빈 다음 세대의 GPU 아키텍처일 수도 있다"고 봤다. 엔비디아는 '퀀덤 데이'를 통해 양자 컴퓨팅 전략도 제시한다. 양자 컴퓨팅 분야 주요 인사들과 양자 애플리케이션 개발을 위한 로드맵을 논의할 예정이다. 외신은 엔비디아가 올해 행사 성과가 비즈니스에 영향 미칠 것이라고 봤다. 초기 블랙웰 GPU 과열 문제와 미국 수출 통제로 인한 관세 우려가 엔비디아 주가 하락으로 이어진 바 있다. 여기에 중국 AI 스타트업 딥시크가 딥시크-R1 모델을 출시하면서 투자자들은 고성능 GPU 수요에 대한 우려를 표하고 있다. 이 외에도 엔비디아는 이번 GTC에서 글로벌 기업과 연구 기관, 정부와 맺은 전략적 협업 사례와 성과도 소개한다고 밝혔다. 개발자와 기술 전문가를 위한 교육 세션을 전년보다 확대했다. 또 데이터 보안 등 AI 윤리적 측면을 다룬 토론회도 진행될 예정이다. 엔비디아는 "이번 GTC는 AI와 가속 컴퓨팅 미래를 결정짓는 중요한 자리가 될 것"이라며 "기술 혁신을 선도하고 글로벌 산업의 발전을 이끄는 계기가 될 것"이라고 공식 홈페이지를 통해 밝혔다.

2025.03.16 09:21김미정

'AI 대장주' 엔비디아, 투자자 기대 부응할까

'인공지능(AI) 대장주' 엔비디아는 투자자들의 기대에 부응하는 실적을 내놓을 수 있을까? 비즈니스인사이더는 25일(현지시간) 엔비디아 실적 발표를 하루 앞두고 월가 분석가들의 전망을 정리한 이 내놓은 엔비디아의 실적 발표 전망을 모아서 25일 보도했다. 엔비디아는 26일 2024 회계연도 4분기 실적을 발표할 예정이다. 미즈호 증권 “단기적으로 성장 고통도 예상” 미즈호증권 분석가들은 엔비디아가 탄탄한 실적을 공개할 것으로 예상하면서도 "성장의 고통도 있을 것”이라고 전망했다. 블랙웰의 강력한 상승세가 올해 상반기 매출 손실을 만회할 것으로 기대하기 때문에 하반기 실적에 초점을 맞추고 있다고 설명했다. 또 "엔비디아가 강력한 고객 관계를 구축한 통합 하드웨어(HW) 플랫폼을 비롯해 CUDA(쿠다) 생태계를 통해 강력한 업계 리더십을 계속 유지 중"이라며, "주요 고객인 마이크로소프트(MS), 아마존, 알파벳이 올해 말 블랙웰 그래픽처리장치(GPU) 구매를 확대할 것으로 예상한다"고 덧붙였다. 미즈호는 엔비디아에 시장 평균보다 더 잘했다는 '아웃퍼폼'(Outperform) 등급을 부여하고 목표 가격을 175달러로 제시했다. 웨드부시 증권 “좋은 소식 기대” 웨드부시 증권은 "젠슨 황이 블랙웰과 AI 자본지출(Capex)의 엄청난 수요를 견인하는 요인을 설명하며 투자자들의 불안을 달래줄 엔비디아의 강력한 실적과 '비트 앤레이즈'(실적이 분석가 예상치를 웃돌고 향후 전망치도 상향하는 것)를 기대한다”고 밝혔다. 그러면서 "어떤 고객도 엔비디아의 차세대 칩과 관련해 '줄을 서다 자리를 잃는' 일은 원하지 않는다"라며 딥시크로 인해 엔비디아의 영향력이 줄지 않았다고 평했다. 뱅크오브아메리카(BofA) “다음 촉매는 GTC 컨퍼런스” BofA 분석가들은 엔비디아 실적이 추정치를 뛰어넘을 것으로 예상하며, 올해 데이터센터 매출이 전년 대비 60% 급증할 것으로 예상한다고 밝혔다. 비벡 아리아 BoA 분석가는 이달 초 "딥시크의 혁명적 최적화에도 불구하고 MS, 메타를 비롯한 엔비디아의 대형 고객들의 지출 계획은 지금까지 변화가 없다”고 밝혔다. 또, “HW와 소프트웨어(SW) 최적화가 '컴퓨팅의 핵심 부분'이라고 말하며, 딥시크로 인해 엔비디아의 매출이 감소하는 일은 일어나지 않을 것”으로 내다봤다. 또, 오는 3월 개최될 GTC 컨퍼런스가 큰 촉매제라고 밝혔다. 여기서 투자자들의 초점이 기존 블랙웰에서 벗어나 루빈(Rubin) GPU와 자율 로봇 솔루션 등 차세대 제품으로 이동할 수 있을 것으로 기대했다. BoA는 엔비디아에 '매수' 등급을 매기고 목표가를 190달러로 책정했다. 블룸버그 인텔리전스 “블랙웰, 궤도에 올랐다” 블룸버그 인텔리전스 기술 분석가 쿤잔 소브하니는 지난 주 엔비디아가 "블랙웰 GPU의 상당한 증가에 따라 4분기 매출 전망치를 충족하고 1분기 가이던스를 상향 조정할 것으로 보인다”고 밝혔다. 또, "주요 고객에 대한 초기 선적은 오는 4분기에 시작돼 내년 1분기까지 증가할 것"이라며, “메타, MS, 아마존 웹서비스, 구글 등의 자본지출 가이던스 증가는 단기 판매에 대한 확신을 높여준다"고 설명했다. 비즈니스인사이더는 이번 실적 발표에서 차세대 블랙웰 칩의 수요가 여전히 높고 중국 딥시크로 인해 엔비디아가 부정적인 영향을 받지 않았다는 점을 투자자들에게 증명해야 할 것으로 보인다고 전했다. 최근 중국 딥시크가 등장하면서 데이터센터 운영에 예상했던 만큼의 컴퓨팅 능력이 필요치 않아 엔비디아의 GPU 판매가 줄어들 것이라는 투자자들의 우려가 나왔다. 이에 젠슨 황 엔비디아 최고경영자(CEO)는 "딥시크의 효율성 향상으로 인해 AI 도입과 발전하는 속도가 더욱 빨라질 뿐"이라고 주장했다. 블룸버그 자료에 따르면, 엔비디아의 작년 4분기 매출은 작년 같은 기간의 약 200억 달러에 비해 73% 증가한 382억 달러에 달할 것으로 예상된다.

2025.02.26 16:03이정현

젠슨 황, 삼성 HBM3E에 친필로 '승인' 사인...엔비디아에 공급 기대감

젠슨 황 엔비디아 최고경영자(CEO)가 미국 캘리포니아주 새너제이에서 열린 'GTC 2024' 행사에 전시된 삼성전자의 5세대 고대역폭메모리 12단 'HBM3E'에 친필 사인을 남겼다. 엔비디아 AI 반도체에 삼성전자의 HBM3E가 탑재될 가능성에 기대감이 커진다. 21일 한진만 삼성전자 반도체(DS)부문 미주총괄(DSA) 부사장은 자신의 사회관계망서비스(SNS)에 황 CEO가 삼성전자 부스에서 12단 HBM3E 실물에 남긴 친필 사인과 부스에 있던 직원들과 함께 찍은 사진을 공유했다. 삼성전자는 12단 HBM3E 실물을 공개한 것은 이번 GTC 행사가 처음이다. 한 부사장은 "젠슨 황 CEO가 우리 부스에 들러줘서 고맙고, 만나지 못해 아쉽다"라며 "삼성 HBM3E에 승인 도장(stamp of approval)을 찍어줘 기쁘다. 삼성 반도체와 엔비디아의 다음 행보가 기대된다"고 전했다. 특이 황 CEO의 삼성전자 부스 방문은 앞서 19일(현지시간) 엔비디아 GTC 2024 글로벌 미디어 행사에서 "우리는 지금 삼성전자의 HBM을 테스트(qualifying)하고 있으며, 기대가 크다"고 발언한 직후여서 업계의 관심이 쏠린다. HBM은 여러 개 D램을 수직으로 연결해 기존 D램보다 데이터 처리 속도를 대폭 끌어올린 고성능 제품이다. HBM은 1세대(HBM)·2세대(HBM2)·3세대(HBM2E)에 이어 4세대(HBM3) 제품이 공급되고 있으며, 올해부터 5세대(HBM3E) 양산이 시작된다. HBM3E는 HBM3의 확장 버전이다. 엔비디아는 AI 반도체로 사용되는 그래픽처리장치(GPU) 시장에서 80% 점유율로 사실상을 독점체제를 구축하고 있기에, HBM 시장에서 핵심 고객사다. SK하이닉스가 HBM 시장에서 점유율 1위를 차지한 데는 지난해 엔비디아에 HBM3을 독점 공급한 영향이 크다. 최근 엔비디아가 공급망 관리를 위해 HBM3E 탑재부터 공급망을 다변화하기로 결정하면서 삼성전자는 HBM3E 물량을 확보하기 위해 적극적으로 나서고 있다. 삼성전자의 12단 HBM3E는 24기가비트(Gb) D램 칩을 실리콘 관통 전극(TSV) 기술로 12단까지 적층해 업계 최대인 36기가바이트(GB) 용량을 구현한 제품이다. 삼성전자는 지난달 27일 12단 HBM3E 샘플을 고객사(엔비디아 포함)에 공급했다고 공식 발표한 바 있다. 삼성전자는 이 제품을 상반기 양산할 예정이다. HBM 시장 경쟁은 가열되고 있다. SK하이닉스는 GTC 2024 전시 부스에서 12단 HBM3E를 전시했으며, 행사 첫날인 지난 18일 업계 최초로 8단 HBM3E 양산을 시작했다고 공식적으로 알리며 시장 우위를 강조했다. 업계에 따르면 SK하이닉스 또한 최근 엔비디아에 12단 HBM3E 샘플을 공급한 것으로 알려져 있다. 또 미국 마이크론도 지난달 HBM3E 양산을 시작했다고 밝히며 경쟁에 뛰어들었다. HBM 시장에서 후발주자인 미국 마이크론은 HBM3 양산을 건너뛰고 HBM3E 대량 생산체제를 갖추면서 삼성전자, SK하이닉스와 전면 경쟁에 돌입했다. 경계현 삼성전자 DS 부문장(사장)은 전날(20일) 삼성전자 정기 주주총회에서 HBM이 한발 늦었다는 지적에 대해 "앞으로 다시는 그런 일이 생기지 않도록 더 잘 준비하고 있다"며 "12단을 쌓은 HBM을 기반으로 HBM3와 HBM3E 시장의 주도권을 찾을 것"이라고 밝혔다. 한편, 시장조사업체 트렌드포스는 지난 13일 "삼성전자는 이미 HBM3에서 상당한 진전을 이뤘다"라며 "HBM3E 검증이 곧 완료될 것으로 예상되며, 연말까지 SK하이닉스와의 시장 점유율 격차를 크게 줄여 HBM 시장의 경쟁 구도를 재편할 태세다"고 진단했다.

2024.03.21 15:54이나리

스노우플레이크, 엔비디아와 풀스택 AI 플랫폼 제공

스노우플레이크는 엔비디아와 파트너십을 강화해 풀스택 AI 플랫폼을 제공한다고 21일 발표했다. 인공지능(AI)을 활용해 기업 고객의 생산성을 높일 수 있도록 지원하는 것으로, 스노우플레이크의 데이터 기반과 안정성 높은 데이터 클라우드의 AI 기술을 풀스택 엔비디아 가속 플랫폼에 결합할 수 있게 된다. 양사는 AI의 생산성과 비즈니스 속도를 높이고 여러 산업군에 걸쳐 새로운 비즈니스 기회를 확대하도록 설계된 인프라와 컴퓨팅 기술을 결합해 안전하고 강력한 기능을 제공한다. 지난해 6월 스노우플레이크와 엔비디아가 엔비디아 네모 통합 기능을 확대한다고 발표했다.. 강화된 파트너십에서 스노우플레이크는 자사 플랫폼에서 데이터 보안, 개인정보보호 및 거버넌스를 원활하게 유지하면서 직접 엔비디아의 네모 리트리버를 활용할 수 있게 된다. 네모 리트리버는 기업이 맞춤형 LLM을 기업 데이터에 연결할 수 있는 생성형 AI 마이크로 서비스다. 이를 기반으로 챗봇 애플리케이션의 성능과 확장성을 개선하고 스노우플레이크 코텍스(프리뷰 공개)로 AI 애플리케이션을 구축한 400개 이상의 기업이 보다 빠르게 비즈니스 가치를 실현할 수 있도록 지원한다. 또한 딥 러닝 추론 애플리케이션에 짧은 지연 시간과 높은 처리량을 제공하는 엔비디아 텐서RT를 활용할 수 있어 기업 고객의 LLM 기반 검색 기능이 향상될 것으로 기대된다. SQL 사용자는 스노우플레이크 코텍스 LLM 기능을 통해 소규모 LLM을 활용해 감정 분석, 번역 및 요약 등의 특정 작업을 몇 초 만에 비용 효율적으로 처리할 수 있다. 미스트랄AI, 메타 등의 고성능 모델을 활용한 AI 애플리케이션의 개발에도 적용할 수 있다. 스노우플레이크의 새로운 LLM 기반 어시스턴트로, 자연어를 통해 스노우플레이크의 코딩 작업에 생성형 AI를 적용한다. 사용자들이 대화 형식으로 질문하면 관련 테이블을 활용해 SQL 쿼리를 작성해 주며 쿼리를 개선하고 인사이트를 필터링하는 등의 작업을 수행할 수 있다. 도큐먼트 AI는 기업들이 LLM을 사용해 문서에서 청구 금액 또는 계약 약관 등의 내용을 쉽게 추출하고 시각화 인터페이스와 자연어를 사용해 결과를 섬세하게 조정할 수 있도록 지원한다. 고객사는 도큐먼트 AI를 사용해 수작업으로 인한 오류를 줄이고 자동 문서 처리를 통해 효율성을 강화한다. 슈리다 라마스워미 스노우플레이크 CEO는 “데이터는 AI의 원동력으로, 효과적인 AI 전략 수립에 매우 중요하다”며 “스노우플레이크는 엔비디아와 협력으로 신뢰할 수 있는 기업 데이터를 위한 안전하고 확장 가능하며 사용이 용이한 플랫폼을 제공하게 됐다”고 밝혔다. 그는 “특히 기술 전문성에 상관없이 모든 사용자가 AI를 사용할 수 있게 해 누구나 AI 기술 혜택을 얻도록 지원한다”고 덧붙였다. 젠슨 황 엔비디아 창립자 겸 CEO는 “기업 데이터는 비즈니스 인텔리전스를 확보할 수 있는 커스터마이징 AI 애플리케이션의 근간”이라며 “엔비디아 가속 컴퓨팅 및 소프트웨어를 스노우플레이크의 데이터 플랫폼에 적용함으로써 고객이 기업 전용의 생성형 AI 애플리케이션을 구축, 배포 및 관리할 수 있게 된다”고 강조했다.

2024.03.21 09:39김우용

오라클, 엔비디아와 '소버린 AI' 제공 협력 발표

오라클은 엔비디아와 협력 관계를 확장해, 전 세계 고객들을 대상으로 소버린 AI 솔루션을 제공하기 위한 계획을 20일 발표했다. 이 협력을 통해 오라클의 분산형 클라우드와 AI 인프라스트럭처, 생성형 AI 서비스는 엔비디아의 가속 컴퓨팅 및 생성형 AI 소프트웨어와 결합해 각국 정부 및 기업의 AI 팩토리 배포를 지원한다. 양사의 AI 팩토리는 광범위한 운영 통제 기능을 통해 클라우드 서비스를 국가 또는 기업 조직의 안전한 자체 지역 내 로컬 환경에서 운영하고, 이를 통해 경제 성장을 촉진하고 다각화하기 위한 주권 목표를 지원한다. OCI 전용 리전과 오라클 알로이, 오라클 EU 소버린 클라우드, 오라클 정부 클라우드 등에 배포 가능한 오라클의 기업용 AI 서비스는 엔비디아의 풀스택 AI 플랫폼과 결합돼 데이터의 운영과 위치 및 보안에 대한 제어력을 강화하여 고객의 디지털 주권을 지원하는 최첨단 AI 솔루션을 제공한다. 현재 세계 각국은 자국의 문화적, 경제적 목표를 달성하기 위해 AI 인프라 투자를 늘려 나가고 있다. 기업 고객들은 26개국에 위치한 66개의 오라클 클라우드 리전을 통해 인프라 및 애플리케이션 전반에 걸쳐 100여 개 클라우드 및 AI 서비스에 접근할 수 있고, 이를 통해 IT 마이그레이션, 현대화 및 혁신을 추진할 수 있다. 양사의 통합 오퍼링은 유연한 운영 통제 기능을 바탕으로 퍼블릭 클라우드를 통하거나 특정한 위치의 고객사 데이터센터에 직접 배포 가능하다. 오라클은 고객이 원하는 모든 장소에서 로컬 방식으로 AI 서비스 및 자사의 완전한 클라우드 서비스를 제공할 수 있는 유일한 하이퍼스케일러다. OCI는 배포 유형과 관계없이 동일한 서비스 및 가격 정책을 일관되게 제공하여 클라우드 서비스 이용을 보다 간단하게 계획하고 이전 및 관리할 수 있도록 한다. 오라클의 클라우드 서비스는 엔비디아 가속 컴퓨팅 인프라와 엔비디아 AI 엔터프라이즈 소프트웨어 플랫폼 등 다양한 엔비디아 스택을 활용하고 있다. 엔비디아 텐서RT, 엔비디아 텐서RT-LLM, 엔비디아 트리톤 추론 서버 등 엔비디아 추론 소프트웨어를 기반으로 구축되어 최근 발표된 엔비디아 NIM 추론 마이크로서비스도 엔비디아 AI 엔터프라이즈 소프트웨어 플랫폼에 포함된다. 스위스 뱅킹 소프트웨어 제공업체인 아발록은 자체 데이터센터에서 완전한 OCI 퍼블릭 클라우드 리전을 운용하기 위해 OCI 전용 리전을 도입했다. 아발록의 마틴 부치 최고 기술 책임자는 "OCI 전용 리전은 최신 클라우드 인프라에 대한 액세스를 제공하면서도 데이터 보존을 최대한 제어하려는 아발록의 노력과 부합한다"며 "이는 우리가 은행과 자산 관리사의 디지털 혁신을 지속적으로 추진하는 데 큰 도움이 된다”고 설명했다. 뉴질랜드의 선도적인 정보 관리 서비스 제공업체인 팀 아이엠은 뉴질랜드 최초로 현지 기업이 소유 및 운영하는 하이퍼스케일 클라우드인 팀 클라우드를 구축하기 위해 오라클 알로이를 도입했다. 팀 아이엠의 이언 로저스 CEO는 "클라우드의 성능은 십분 활용하면서도 뉴질랜드 국경 내에서 데이터 무결성을 유지할 수 있는 독자적인 하이퍼스케일 클라우드 솔루션에 대한 뉴질랜드 기업들의 수요가 갈수록 증가하고 있다"며 "팀 아이엠은 오라클 알로이와 더불어, 엔비디아 AI 플랫폼을 자사 클라우드 서비스에 통합할 수 있는 가능성을 통해 공공 분야 및 민간 기업, 뉴질랜드 원주민 단체들이 디지털 환경의 복잡성을 해소하고 디지털 혁신 과정을 최적화하는 과정에 기여할 수 있는 클라우드 서비스 제공업체로 자리 매김했다"고 밝혔다. 오라클은 엔비디아 GTC에서 발표된 최신 엔비디아 그레이스 블랙웰 컴퓨팅 플랫폼을 자사의 OCI 슈퍼클러스터 및 OCI 컴퓨트 서비스 전반에 도입함으로써 지속적으로 증가하는 고객의 AI 모델에 대한 요구사항에 대응해 나갈 계획이다. OCI 슈퍼클러스터는 새로운 OCI 컴퓨트 베어 메탈 인스턴스와 초저지연 RDMA 네트워킹, 고성능 스토리지를 통해 훨씬 더 빠른 속도를 제공할 전망이다. OCI 컴퓨트에는 엔비디아 GB200 그레이스 블랙웰 슈퍼칩과 엔비디아 블랙웰 B200 텐서 코어 GPU가 모두 탑재된다. 엔비디아 GB200 그레이스 블랙웰 슈퍼칩은 컴퓨팅의 새로운 시대를 선도할 획기적 성능을 제공한다. 전 세대 GPU 대비 최대 30배 빠른 실시간 대규모 언어 모델(LLM) 추론, 25배 낮은 TCO, 25배 적은 에너지 소모량 등을 자랑하는 GB200은 AI 학습, 데이터 처리, 엔지니어링 설계 및 시뮬레이션 등의 작업 성능을 대폭 강화해 준다. 엔비디아 블랙웰 B200 텐서 코어 GPU는 가장 높은 성능이 요구되는 AI, 데이터 분석, 고성능 컴퓨팅(HPC) 워크로드를 처리하기 위해 설계됐다. 또한 검색 증강 생성(RAG) 추론 배포를 위한 엔비디아 네모 리트리버를 비롯한 엔비디아 NIM 및 쿠다-X 마이크로서비스는 OCI 고객이 자체 데이터를 사용해 생성형 AI 코파일럿 및 기타 생산성 도구에 더 많은 인사이트를 제공하는 동시에, 해당 도구들의 정확성을 향상시키는 작업에도 도움이 될 것으로 보인다. 점점 더 복잡해지는 AI 모델에 대한 고객의 수요 증가에 부응하기 위해 오라클과 엔비디아는 OCI 상에서 구동되는 엔비디아 DGX 클라우드 서비스에 엔비디아 그레이스 블랙웰 슈퍼칩을 추가할 예정이다. 고객들은 LLM의 매개변수가 조 단위에 달하게 된 현 시점에 보다 에너지 효율적인 학습 및 추론을 지원하기 위해 양사가 함께 설계한 슈퍼컴퓨팅 서비스인 엔비디아 DGX 클라우드를 통해 새로운 GB200 NVL72 기반 인스턴스에 액세스 할 수 있다. DGX 클라우드 클러스터의 전체 구성에는 2만개 이상의 GB200 가속기와 엔비디아 CX8 인피니밴드 네트워킹이 포함돼 더욱 탁월한 확장성 및 성능을 갖춘 클라우드 인프라를 제공할 예정이다. 해당 클러스터는 5세대 NV링크가 탑재된 72개의 블랙웰 GPU NVL 72와 36개 그레이스 CPU로 구성된다. 사프라 카츠 오라클 CEO는 "AI가 전 세계의 비즈니스, 산업 및 정책을 재편함에 따라, 국가와 기업 조직은 가장 중요한 데이터를 안전하게 보호하기 위해 디지털 주권을 강화해야 한다"며 "오라클은 엔비디아와의 지속적인 협력 관계와 클라우드 리전을 로컬 차원에서 신속히 배포할 수 있는 독보적인 역량을 통해 전 세계에서 보안에 대한 타협과 우려 없이 AI를 활용할 수 있도록 보장할 것"이라고 밝혔다. 젠슨 황 엔비디아 설립자 겸 CEO는 "생성형 AI가 혁신을 주도하는 시대에 데이터 주권은 문화적, 경제적 필수 요소"라며 "엔비디아의 가속 컴퓨팅 및 생성형 AI 서비스와 결합된 오라클의 통합 클라우드 애플리케이션 및 인프라 서비스는 각 국가 및 지역이 데이터 주권을 바탕으로 스스로 미래를 직접 설계할 수 있는 유연성과 보안을 제공한다."라고 강조했다. 오라클과 엔비디아가 공동 제공하는 소버린 AI 솔루션은 발표와 함께 바로 사용 가능하다.

2024.03.20 10:45김우용

젠슨 황 CEO "블랙웰 칩 가격 3만~4만 달러"

엔비디아가 'GTC 2024'에서 선보인 차세대 인공지능(AI) GPU '블랙웰'(Blackwell)의 가격대가 공개됐다. 젠슨 황 엔비디아 최고경영자(CEO)는 19일(현지시간) CNBC의 '스쿼크 온 더 스트리트'(Squawk on the Street)와의 인터뷰에서 블랙웰 'B200' 칩 가격이 3만~4만 달러(약 4천만 원~5천300만원) 수준이라고 밝혔다. 그는 "우리는 그것을 가능하게 하기 위해 몇 가지 새로운 기술을 개발해야 했다"며, 해당 칩의 연구개발에 약 100억 달러(약 13조 3천800억원)의 예산이 들어갔을 것으로 추정했다. 하루 전 엔비디아는 "텍스트와 이미지, 그래프 뿐만 아니라 전세계 언어로 구성된 영상을 학습하고 이를 흉내내려면 더 큰 GPU가 필요하다"며 차세대 AI GPU 블랙웰을 공개했으나 가격대는 밝히지 않았다. 엔비디아의 기존 H100은 칩당 2만5천 달러~4만 달러에 달하는 것으로 알려져 있기 때문에 블랙웰 칩의 가격도 H100과 크게 다른 수준은 아닌 것으로 보인다. IT매체 톰스가이드는 엔비디아는 가속기 자체를 공급하는 것보다 데이터센터 블록 전체를 판매하는 경향이 있기 때문에 3만~4만 달러라는 가격은 대략적인 가격이라고 평했다.

2024.03.20 09:54이정현

SK하이닉스, 'GTC 2024'서 온디바이스 AI PC용 SSD 신제품 공개

SK하이닉스는 18일부터 21일(미국시간)까지 미국 캘리포니아주 새너제이에서 열리고 있는 엔비디아 주최 세계 최대 AI 개발자 컨퍼런스인 'GTC(GPU Technology Conference) 2024'에서 업계 최고 성능이 구현된 SSD 신제품인 'PCB01' 기반의 소비자용 제품을 공개했다고 20일 밝혔다. PCB01은 온디바이스(On-Device) AI PC에 탑재되는 PCIe 5세대 SSD로, 최근 글로벌 주요 고객사로부터 성능 및 안정성 검증을 마쳤다. SK하이닉스는 “올해 상반기 중 PCB01의 개발을 완료하고, 연내 대형 고객사향 제품과 일반 소비자용 제품을 함께 출시할 계획"이라고 설명했다. PCB01은 연속 읽기속도 초당 14GB(기가바이트), 연속 쓰기속도는 초당 12GB로 업계 최고 속도가 구현된 제품이다. 이전 세대 대비 2배 향상된 속도로, AI 학습과 추론에 필요한 거대언어모델(LLM)을 1초 내에 로딩하는 수준이다. PC 제조업체는 온디바이스 AI를 구현하기 위해 PC 내부 스토리지에 LLM을 저장하고, AI 작업이 시작되면 단시간 내 D램으로 데이터를 전송하는 구조로 설계한다. 이 과정에서 PC 내부에 탑재된 PCB01은 LLM 로딩을 신속하게 지원하면서 온디바이스 AI의 속도와 품질을 크게 높여주는 역할을 해줄 것으로 SK하이닉스는 기대하고 있다. PCB01은 이전 세대 대비 전력 효율이 30% 개선돼 대규모 AI 연산 작업 시 효율성을 높이는 데 기여한다. 또한 SK하이닉스 기술진은 이 제품에 'SLC 캐싱' 기술을 적용했다. SLC 캐싱은 낸드의 저장 영역인 셀 일부를 처리 속도가 빠른 SLC로 동작하게 해 필요한 데이터만 신속하게 읽고 쓸 수 있게 해주는 기술이다. 이를 통해 AI 서비스 외 일반 PC 작업 속도도 빨라지도록 도와준다. 윤재연 SK하이닉스 부사장(NAND Product Planning & Enablement 담당)은 “PCB01은 업계 최고 성능 제품으로 Al PC뿐 아니라 게이밍, 하이엔드 PC 등 최고 사양 PC 시장에서도 각광받을 것”이라며 “이를 통해 당사는 HBM은 물론, 온디바이스 AI 분야에서도 '글로벌 No.1 AI 메모리 컴퍼니' 위상을 탄탄하게 다질 수 있을 것”이라고 말했다. 한편 SK하이닉스는 GTC 2024에서 PCB01 외에도 36GB(기가바이트) 12단 HBM3E, CXL, GDDR7 등 차세대 주력 기술 및 제품을 선보였다. 앞서 회사는 지난 19일 세계 최초로 HBM 5세대 제품인 HBM3E의 양산에 들어간다고 발표한 바 있다. 또한 GDDR7은 이전 세대 제품인 GDDR6 대비 대역폭이 2배 이상 확대되고, 전력 효율성이 40% 개선돼 현장에서 큰 관심을 받았다.

2024.03.20 09:45장경윤

젠슨 황 CEO "삼성전자 HBM 테스트 중...기대 크다"

젠슨 황 엔비디아 최고경영자(CEO)가 삼성전자의 고대역폭 메모리(HBM)을 현재 테스트 중이며 기대가 크다고 말했다. 또 최근 관심이 쏠리고 있는 일반인공지능(AGI) 구현 시기에 대해선 "정의하기에 따라 다르다"고 밝혔다. 젠슨 황은 19일(현지시간) 미국 캘리포니아주 새너제이에서 열린 'GTC2024' 미디어 간담회에서 이같이 말했다. 이날 간담회에서 젠슨 황은 "AGI를 규정하는 명확한 개념은 없다"며 "AGI를 예측하는 시기는 사람마다 다를 수 있다"고 설명했다. 젠슨 황은 AGI 개념을 'AI가 사람보다 특정 테스트에서 8% 이상 우수한 상태'로 정의했다. 관련 테스트는 수학을 비롯한 읽기, 논리, 의학 시험, 변호사 시험이다. 그는 "현재 AI의 테스트 능력을 봤을 때, AGI는 이를 곧 따라잡을 것"이라며 "해당 조건에서 AGI는 5년 내 올 것 같다"고 예측했다. 젠슨 황은 생성형 AI의 환각 현상에 대해 "충분한 연구를 통해 해결할 수 있는 문제"라고 말했다. 그는 "생성형 AI에 규칙을 꾸준히 추가해야 한다"며 "AI는 모든 답을 하기 전에 이에 대한 근거까지 찾아야 한다"고 했다. 그는 "AI는 단순히 답변만 하는 것이 아니라 어떤 답이 가장 좋은지 판단해야 한다"며 "이를 위한 조사를 스스로 할 수 있는 검색증강생성(RAG) 능력이 뛰어나야 한다"고 강조했다. 황 CEO는 생성형 AI의 답변에 '당신의 질문에 대한 답을 찾지 못했습니다' 또는 '이 질문에 대한 정답이 무엇인지에 대한 합의에 도달할 수 없습니다' '아직 34대 대통령이 나오지 않았기 때문에 인물을 말할 수 없습니다'와 같은 옵션도 반드시 있어야 한다는 점도 덧붙였다. 이 외에도 젠슨 황 CEO는 삼성전자의 고대역폭 메모리 등을 사용하고 있진 않지만 현재 테스트 중"이라며 "기대가 크다"고 답했다. 이번 행사에서 엔비디아는 차세대 AI 그래픽처리장치(GPU) 블랙웰을 비롯한 옴니버스, 엔비디아 인퍼런스 마이크로서비스(NIM) 등 최신 기술을 소개했다.

2024.03.20 09:06김미정

  Prev 1 2 Next  

지금 뜨는 기사

이시각 헤드라인

2나노에 묶인 삼성 '엑시노스' 로드맵…최적화가 성패 가른다

서로 닮아가는 채용 플랫폼…데이팅·사주로 차별화 꾀하기도

작고 강하게…한국형 '로봇 손' 주도권 놓고 각축전

"따로 또 같이"...글로벌 서비스 ‘라인’은 현지화+기술통합 어떻게 하나

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.