• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
인공지능
배터리
양자컴퓨팅
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'엔비디아'통합검색 결과 입니다. (663건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

美·中 무역전쟁에 발 묶인 엔비디아 'H20' GPU

미국 도널드 트럼프 2기 행정부가 대 중국 GPU 수출 규제를 한층 강화했다. 전임자인 조 바이든 행정부는 연산 성능이나 대역폭 등 성능을 낮추는 선에서 수출을 허용했지만 트럼프 2기 행정부는 이마저도 무기한 허가하지 않을 방침이다. 엔비디아는 15일(이하 현지시각) 중국 시장용으로 설계된 H20 GPU 수출 제한 조치를 공시하며 "H20의 재고와 구매 약정, 관련 충당금 등으로 최대 55억 달러(약 7조 8천556억원) 추가 비용이 들 것"이라고 밝혔다. 엔비디아 뿐만 아니라 지난 해부터 성능을 제한한 중국 시장용 GPU를 생산하는 AMD에도 유사한 규제가 주어질 가능성이 크다. 한편 이런 규제가 엔비디아의 가장 큰 경쟁자로 꼽히는 중국 화웨이를 키워주는 결과를 낳을 것이라는 관측도 나온다. 엔비디아, 美 정부 규제에 따라 두 차례 GPU 성능 낮춰 미국 정부가 중국 대상으로 AI 가속과 머신러닝, 딥러닝용 GPU 수출 규제에 나선 것은 2022년 10월부터다. 당시 미국 정부는 엔비디아 A100, H100 등 GPU를 포함해 AMD 제품까지 수출 규제 대상에 포함시켰다. 엔비디아는 이들 제품에서 최대 대역폭을 절반인 400GB/s까지 낮춘 A800, H800 GPU를 생산해 공급했다. 그러나 미국 정부가 2023년 10월 규제 범위를 확대하자 성능을 더 낮춘 H20, L20, L2 등 3종을 추가 개발해 이를 작년부터 중국 시장에 공급했다. 이번에 미국 정부가 제동을 건 H20 GPU는 HBM3 메모리 용량을 96GB로 제한하고 메모리 대역폭은 4TB/s, AI 연산 성능은 FP16(부동소수점 16비트) 기준 148 테라플롭스, FP32(부동소수점 32비트) 기준 44 테라플롭스로 제한됐다. H800으로 구현한 LLM '딥시크 R1'이 역린 건드렸나 미국 정부가 H20 GPU의 중국 수출 규제를 강화한 이유는 아직 명확하지 않다. 그러나 지난 1월 중국 AI 스타트업 딥시크(DeepSeek)가 하순 공개한 추론 특화 AI 모델 'R1'이 영향을 미쳤을 것으로 추정된다. 딥시크 R1은 AI 모델 훈련을 위해 메타가 라마(LLaMa) 등 AI 모델 개발에 투입한 비용의 10% 수준인 557만6천달러(약 80억원)를 지출한 것으로 알려져 있다. 또 미국 상무부 수출 통제 기준을 준수하는 H800 GPU를 이용했다. 당시 엔비디아는 "딥시크가 활용한 GPU는 미국 수출 규정을 준수했으며 추론은 상당히 많은 엔비디아 GPU와 고성능 네트워킹이 필요하다. 이와 같은 딥시크의 혁신이 GPU 수요를 더욱 증가시킬 것"이라고 밝혔다. 실제로 미국 CNBC와 대만 공상시보 등 경제 매체에 따르면 딥시크 R1 공개 이후 텐센트, 알리바바, 바이트댄스 등 중국 주요 IT 기업들이 H20 GPU 발주량을 크게 늘렸다. 엔비디아, 중국 내 최대 경쟁사로 화웨이 꼽아 미국 정부는 거대언어모델(LLM) 등에서 중국의 성장 속도를 지연시키기 위해 GPU 수출 규제를 활용하고 있다. 그러나 이런 규제는 오히려 중국 내 엔비디아 최대 경쟁자로 꼽히는 화웨이 성장을 돕는 결과를 낳을 수 있다. 화웨이가 개발한 어센드(Ascend) 910B는 FP16 기준 320 테라플롭스, INT8(정수 8비트) 기준 640 TOPS(1초당 1조 번 연산)급 성능을 갖춰 엔비디아 A100과 비슷한 수준으로 평가된다. 지난 해 공개된 후속 제품인 어센드 910C는 지난 2월 딥시크가 수행한 추론 벤치마크에서 엔비디아 H100의 60%에 달하는 성능을 냈다. 엔비디아도 지난 2월 말 미국 증권거래위원회에 제출한 연간 보고서에서 주요 경쟁자 중 하나로 2년 연속 화웨이를 꼽았다. 칩과 클라우드 서비스, Arm IP 기반 컴퓨터 프로세서와 네트워킹 제품 등 4개 분야에서 화웨이를 주요 경쟁사로 분류했다. 엔비디아 이어 AMD GPU 사업에도 영향 불가피 미국 정부의 수출 규제 확대는 엔비디아 뿐만 아니라 AMD에도 영향을 미칠 가능성이 크다. AMD는 작년 중국 시장을 겨냥해 성능을 제한한 AI GPU 가속기인 인스팅트 MI309를 설계했지만 미국 상무부는 '여전히 성능이 강력하다'는 이유로 수출을 불허했다. 2023년 11월 중국 시장에서는 데스크톱PC용 지포스 RTX 4090 그래픽카드를 분해해 서버용으로 개조하기도 했지만 올해는 이런 시도가 일어나기 힘들다. 엔비디아가 2월부터 중국 시장에 공급중인 지포스 RTX 5090D 그래픽카드에 이미 여러 제약이 가해졌기 때문이다. 지포스 RTX 5090D 그래픽카드는 미국 정부의 규제를 충족하기 위해 AI 연산 성능을 RTX 5090(3,352 TOPS) 대비 29% 가량 줄인 2,375 TOPS 수준으로 낮췄다. 한 PC나 서버에 GPU를 여러 개 꽂아 성능을 높이는 '멀티 GPU' 구성도 불가능하다. 다만 국내 주요 메모리 기업들에게 미칠 악영향은 제한적일 것으로 분석된다. 현재 SK하이닉스는 엔비디아의 AI 가속기에 필요한 HBM(고대역폭메모리)을 대거 공급하고 있으며, 삼성전자 역시 지속적으로 공급망 진입을 시도 중이다.

2025.04.16 14:37권봉석

엔비디아, 데스크톱 PC용 지포스 RTX 5060·5060 Ti 출시

엔비디아가 16일 데스크톱 PC용 지포스 RTX 5060·5060 Ti 탑재 그래픽카드를 정식 출시했다. 지포스 RTX 5060 Ti와 RTX 5060은 블랙웰 아키텍처 기반 GB206 GPU를 기반으로 한다. RTX 5060 Ti는 그래픽을 처리하는 스트리밍 멀티프로세서(SM)을 36개 활성화했지만, RTX 5060은 이를 30개로 줄이고 GPU 작동 클록과 L2 캐시 용량을 하향 조정했다. 저해상도 이미지를 AI로 처리해 처리 속도를 높이는 DLSS 4 기술, 각종 영상 데이터를 실시간 처리하는 9세대 NVENC 인코더를 내장했고 NIM(엔비디아 추론 마이크로서비스), AI 블루프린트 등 엔비디아 AI 소프트웨어를 활용할 수 있다. RTX 5060 Ti는 16GB와 8GB 등 두 가지 버전으로, RTX 5060은 메모리 8GB 단일 구성으로 출시된다. 엔비디아가 책정한 권장가는 RTX 5060 Ti 16GB 버전이 429달러(약 61만원), 8GB 버전이 379달러(약 54만원)이며 RTX 5060은 299달러(약 43만원)로 책정됐다. 에이수스, 기가바이트, 팰릿 등 글로벌 그래픽카드 제조사는 오늘(17일)부터 지포스 RTX 5060 Ti 기반 그래픽카드를 국내 시장에 공급한다. RTX 5060 탑재 그래픽카드 출시 일정은 미정.

2025.04.16 14:25권봉석

700조원 투자한다 했는데...美, 엔비디아 'H20' 무기한 수출 규제

엔비디아의 중국향 AI 가속기가 수출 규제 명단에 포함된 것으로 나타났다. 이에 따라 엔비디아는 올 1분기 약 7조4천억원에 이르는 비용을 처리하게 됐다. 최근 엔비디아는 미국 내 700조원에 이르는 대규모 투자를 발표하는 등 적극적으로 대응책을 펼쳤으나, 미중 갈등에 따른 여파를 피하지 못했다. 15일 엔비디아는 미국 정부로부터 자사의 AI 반도체 'H20'에 대한 무기한 수출 규제를 통보받았다고 공시했다. 엔비디아는 "미국 정부는 당사가 H20을 중국(홍콩 및 마카오 포함)이나 중국에 본사를 둔 기업들에 수출할 경우, 수출 허가를 취득해야 한다고 요구했다"며 "추가로 미국 정부는 해당 수출 규제가 무기한으로 유효할 것이라고 통보했다"고 밝혔다. H20은 엔비디아가 중국에 대한 첨단 반도체 수출 규제를 피하기 위해 기존 AI 가속기인 'H100'의 성능을 대폭 낮춘 개조품이다. 미국 정부의 통보로 엔비디아는 오는 4월 27일 종료되는 2026년 회계연도 1분기에 H20 수출 규제에 따른 손실을 반영할 계획이다. 엔비디아에 따르면, H20 제품과 관련한 재고, 구매 계약, 기타 관련 충당금 등으로 약 55억 달러(한화 약 7조4천억원)의 비용이 발생할 것으로 분석된다. 앞서 엔비디아는 바로 전날 미국에 향후 4년간 최대 5천억(한화 약 700조원) 달러의 AI 인프라를 구축하겠다고 밝힌 바 있다. 애리조나주와 텍사스주에 약 30만평의 부지를 확보해 AI 반도체 및 AI 슈퍼컴퓨터 제조 공장을 설립하는 것이 주 골자다. 이에 업계는 도널드 트럼프 미국 대통령이 H20에 대한 수출 규제를 완화하거나 철회할 것으로 예상해 왔다. 그러나 미국 정부가 수출 규제에 대해 완강한 입장을 취하면서, 세계 AI 반도체 시장을 둘러싼 불확실성은 더욱 커질 전망이다. 다만 국내 주요 메모리 기업들에게 미칠 악영향은 제한적일 것으로 분석된다. 현재 SK하이닉스는 엔비디아의 AI 가속기에 필요한 HBM(고대역폭메모리)을 대거 공급하고 있으며, 삼성전자 역시 지속적으로 공급망 진입을 시도 중이다. 채민숙 한국투자증권 연구원은 "삼성전자는 아직 H20용으로 HBM 판매가 없고, SK하이닉스는 H20용 HBM에 대한 추가 판매를 3월 완료해 엔비디아처럼 재고 손실처리 등의 비용 반영은 없을 것"이라며 "H20은 기존 계획 대비 추가된 물량이므로 제재로 인한 연간 HBM 계획 변동 및 실적 추정치 변경은 없을 것으로 추정한다"고 설명했다.

2025.04.16 09:42장경윤

엔비디아, 美에 AI 슈퍼컴 공급망 구축…삼성·SK도 대응 필요

엔비디아가 향후 4년간 약 5천억 달러(한화 약 700조원)를 들여 미국에 AI 반도체·슈퍼컴퓨터 양산 공장을 짓는다. TSMC·암코·폭스콘 등 주요 협력사들과 전체적인 공급망을 구축할 계획으로, 최근 자국 우선주의를 강조하는 미국에 대응하기 위한 전략으로 관측된다. 이에 따라 삼성전자, SK하이닉스 등 국내 기업들도 긴밀한 대응이 필요할 것으로 예상된다. 15일 엔비디아는 자사 공식 블로그를 통해 미국에 AI 슈퍼컴퓨터 생산 인프라를 최초로 구축하겠다고 밝혔다. 엔비디아는 전 세계 AI 반도체 산업을 주도하는 글로벌 빅테크다. 이 회사의 AI 가속기인 '블랙웰' 시리즈는 주요 CSP(클라우드서비스제공자)로부터 폭발적인 주문을 받고 있다. 엔비디아는 미국에 향후 4년간 최대 5천억 달러의 AI 인프라를 구축할 계획이다. 애리조나주와 텍사스주에 약 30만평의 부지를 확보해 AI 반도체 및 AI 슈퍼컴퓨터 제조 공장을 설립할 예정으로, 주요 협력사들이 대거 참여한다. 대표적으로 대만 주요 파운드리인 TSMC는 애리조나 피닉스 지역의 신규 공장에서 엔비디아 블랙웰 칩 양산을 시작했다. 폭스콘(Foxconn), 위스트론(Wistron)은 각각 텍사스 휴스턴과 댈러스에 슈퍼컴퓨터 제조 공장을 건설 중이다. 양산은 향후 12~15개월 내 시작될 것으로 예상된다. 반도체 칩의 패키징 및 테스트는 애리조나주에 공장을 둔 주요 OSAT(외주반도체패키징테스트) 기업 암코(Amkor), SPIL과 협력한다. 젠슨 황 엔비디아 최고경영자(CEO)는 "세계 AI 인프라의 엔진이 처음으로 미국 내에서 구축되고 있다"며 "미국 제조업을 강화함으로써 AI 반도체와 슈퍼컴퓨터에 대한 급증하는 수요를 효과적으로 충족하고, 공급망을 강화하며, 회복탄력성을 높일 수 있을 것"이라고 강조했다. 엔비디아의 이 같은 발표는 도날드 트럼프 미국 대통령의 강경한 관세 정책에 맞춰 미국과의 협력을 강화하려는 의도로 풀이된다. 최근 젠슨 황 CEO는 트럼프 대통령의 마러라고 사저를 방문한 바 있다. 회동 뒤 트럼프 대통령은 엔비디아의 중국향 AI 반도체인 'H20'의 수출 규제 계획을 철회한 것으로 알려졌다. 엔비디아의 선제적인 움직임에 따라, 국내 주요 반도체 기업들도 긴밀한 대응이 필요할 것으로 분석된다. 현재 삼성전자는 텍사스주 테일러시에 신규 파운드리 팹을 건설하고 있다. 총 투자 규모는 370억 달러에 이른다. 해당 팹은 최첨단 영역인 2나노미터(nm) 및 4나노 공정을 목표로 한다. 다만 해당 공정에서 고객사 수요를 충분히 확보하지 못해, 투자 계획이 지속 연기되고 있는 것으로 파악됐다. SK하이닉스는 인디애나주에 약 38억7천만 달러를 들여 패키징 제조 시설을 짓기로 했다. 현재 SK하이닉스가 엔비디아 AI 가속기에 필요한 HBM(고대역폭메모리)의 핵심 공급사로 자리하고 있는 만큼, 해당 공장의 역할이 중요해질 것으로 관측된다. 반도체 업계 관계자는 "SK하이닉스의 경우 올 연말부터 미국 인디애나주에 기초적인 설비투자를 시작하겠다는 논의를 협력사와 진행 중"이라고 설명했다.

2025.04.15 08:51장경윤

엔비디아 中 사업 '숨통'..."트럼프, H20 수출 규제 계획 철회"

도널드 트럼프 미국 대통령이 엔비디아의 중국 수출용 AI 반도체 'H20'에 대한 수출 제한 조치 계획을 철회했다고 미국 공영 방송기관 NPR이 9일 보도했다. 앞서 트럼프 대통령은 지난주 플로리다주 마러라고(Mar-a-Lago)에서 젠슨 황 엔비디아 최고경영자(CEO)와 만찬을 가진 바 있다. NPR은 두 소식통을 인용해 "마러라고 만찬 이후 백악관이 H20 칩에 대한 방침을 바꿔 추가 제한 계획을 보류했다"며 "본래 H20에 대한 미국의 수출 규제는 수개월 동안 준비돼 왔으며, 이번 주 중으로 시행될 준비가 됐었다"고 말했다. 백악관의 이러한 입장 변경은 엔비디아가 트럼프 행정부에 AI 데이터 센터에 대한 신규 미국향 투자를 약속한 후에 이뤄진 것으로 알려졌다. H20은 엔비디아가 중국에 대한 첨단 반도체 수출 규제를 피하기 위해 기존 AI 가속기인 'H100'의 성능을 대폭 낮춘 개조품이다. 트럼프 대통령은 올해 초부터 해당 칩과 관련한 수출 통제 방안을 고려해 왔다. 엔비디아는 이번 조치로 중국 시장에서의 호조세를 이어갈 수 있을 것으로 전망된다. 미국 IT전문 매체 디 인포메이션의 최근 보도에 따르면, 올해 첫 3개월간 중국 주요 테크 기업들의 H20 주문량은 160억 달러(한화 약 21조6천억원)를 기록했다.

2025.04.10 08:46장경윤

[인터뷰] "엔비디아 사로 잡은 비결, '델 AI 팩토리' 덕분"

"바이 델(Buy Dell·델 제품을 사세요), 바이 델, 바이 델!" 지난 달 18일. 미국 새너제이에서 열린 엔비디아 연례 개발자 회의 GTC 행사에 마련된 델 테크놀로지스 부스에선 '인공지능(AI) 대부'로 불리는 젠슨 황 엔비디아 최고경영자(CEO)가 목청을 높여 이처럼 외쳤다. 컴퓨터를 필요로 하는 이들이라면 누구나 알고 있는 '델'의 PC뿐 아니라 AI 인프라 경쟁력을 인정하며 엔비디아의 가장 최고 파트너라는 점을 치켜 세워준 것이다. AI 열풍이 한창이던 1년 전 엔비디아 GTC 행사에서도 황 CEO는 델 테크놀로지스를 공개 석상에서 언급하며 끈끈한 관계를 과시했다. 당시 황 CEO는 "정보기술(IT)과 관련해 무엇이든 필요한 것이 있다면 델에 전화하면 된다"고 밝혔다. 이는 델 테크놀로지스 주가에도 영향을 줘 지난해 5월 시가총액이 1천억 달러를 넘기도 했다. 이처럼 엔비디아의 두터운 신임을 받고 있는 델 테크놀로지스가 올해 AI 인프라를 전면 업그레이드하며 시장 강자의 면모를 다시 한 번 드러내고 있다. 엔비디아 기반 델 AI 팩토리의 최신 포트폴리오를 앞세워 최근 달궈지고 있는 글로벌 AI 인프라 시장에서 주도권 굳히기에 본격 나선 모습이다. 최근 지디넷코리아와 만난 양원석 델 테크놀로지스 인프라스트럭처 솔루션 사업부 전무는 "우리는 AI PC부터 엣지, 코어 데이터센터, 클라우드까지 엔드 투 엔드(end-to-end) AI 솔루션 포트폴리오를 가지고 있다는 것이 강점"이라며 "서버 자체 기술력, 공급망 관리 능력, 영업 능력, 기술 지원 능력 등을 갖추고 있는 덕분에 글로벌뿐 아니라 한국에서도 서버 부문 1위 업체로 인정 받고 있다"고 운을 뗐다. 그러면서 "글로벌뿐 아니라 한국 스토리지 하드웨어(HW) 및 소프트웨어(SW) 부문 1위 업체로서의 저력을 갖고 있는 만큼, 데이터 및 데이터관리에 대해 전 세계에서 제일 잘 알고 있는 기업이라고 자부할 수 있다"며 "젠슨 황 CEO가 엔비디아 GTC 현장에서 '델'을 언급한 것도 이런 점을 인정한 것이라고 볼 수 있다"고 덧붙였다. 실제로 델 테크놀로지스는 글로벌 AI 인프라 시장에서 경쟁력을 입증 받아 독보적인 점유율을 유지하며 꾸준한 성장세를 보이고 있다. 특히 슈퍼마이크로, HPE 등과 경쟁하고 있는 AI 서버 시장에선 다양한 포트폴리오를 앞세워 압도적인 우위에 올라서 있다는 평가를 받고 있다. 7일 시장조사업체 IDC에 따르면 델 테크놀로지스는 지난해 3분기 전 세계 X86 서버 시장 판매대수 기준으로 11.4%의 점유율을 차지하며 1위를 유지했다. 매출 기준 점유율도 12.4%로 1위를 차지했다. 델 테크놀로지스와 경쟁하고 있는 슈퍼마이크로와 HPE, IEIT 시스템즈, 레노버는 그 뒤를 이었다. 이처럼 델 테크놀로지스가 시장 우위를 견고히 하고 있는 상황에서 전체 서버 시장의 성장세가 높다는 점은 호재로 작용하고 있다. 지난해 4분기 서버 시장 매출은 전년 동기 대비 91% 증가한 733억 달러를 기록, 2019년 이후 두 번째로 높은 성장률을 보였다. 특히 GPU가 내장된 서버 매출은 전년 동기보다 192.6%나 성장해 전체 서버 시장 매출의 절반 이상을 차지할 정도로 급성장한 모습을 보였다. 엔비디아는 전체 출하량의 90% 이상을 차지하며 서버 GPU 분야에서 독주를 이어갔다. 지난해 전체 서버 시장 규모는 2020년 이후 두 배 이상 성장한 2천357억 달러에 달했다. 엔비디아와 밀접한 관계를 맺고 있는 델 테크놀로지스도 지난해 호실적을 기록했다. 특히 AI 서버 출하액은 98억 달러로, 사업을 시작한 지 2년도 채 안되는 기간에 급속도로 성장한 모습을 보였다. AI 관련 기업 고객 역시 2천 곳 이상을 확보한 상태로, 올해 고객사 수가 더 늘어나 AI 매출이 50% 성장할 것으로 예상됐다. 올해 AI 서버 출하액은 약 150억 달러에 달할 것으로 전망했다. 양 전무는 "지난해 엔비디아 GTC에서 처음 선보인 '델 AI 팩토리 위드 엔비디아(Dell AI Factory with NVIDIA)'를 통해 다양한 솔루션과 제품을 선보이며 엄청난 컴퓨팅 파워를 시장에 공급했다고 자부하고 있다"며 "해외뿐 아니라 국내에서도 AI 시장 수요가 점차 '엔터프라이즈 AI'로 이동하고 있는 만큼 올해도 수요는 더 많아질 것으로 보인다"고 설명했다. 이어 "지난해까진 클라우드 서비스 제공자(CSP), 특히 하이퍼스케일러 또는 코어위브 같은 NCP(NVIDIA Cloud Partner) 업체들이 주축이 돼 시장 성장을 주도했지만, 올해는 더 많은 대기업, 대학, 연구기관 등 다양한 분야에서 수요가 많을 듯 하다"며 "10대 미만~수십대 등 작은 규모에서부터 거대 규모에 이르기까지 서버 규모 면에서도 더 다양해질 듯 하다"고 덧붙였다. 양 전무는 최근 국내에서 sLM(small Language Model), 온프레미스에 AI 서버를 두고 API를 사용해 클라우드 업체가 제공하는 AI 서비스와 연결해 사용하는 활용 사례(Use Case)가 늘어나고 있다는 점도 주목했다. 또 엔비디아 'H100' 위주로 형성된 GPU 시장이 향후 블랙웰, 그레이스블랙웰, AMD, 인텔 등 다양한 실리콘으로 확대될 것으로 봤다. 하지만 국내 고객들이 생성형 AI를 도입, 활용할 때 걸림돌이 많아 아직 시장이 활성화 되지 못했다는 점에 대해선 아쉬워 했다. 양 전무는 "국내에선 생성형 AI 활용 시 거버넌스와 개인정보 보호, 법적 규제 등을 고려해야 해 적절한 데이터를 수집·준비하는 과정에 있어 많은 어려움이 있을 수 있다"며 "생성형 AI를 위한 인프라는 기존 데이터센터 인프라 기술과는 달라 이를 위해 내부 역량을 확보하거나, 외부 전문 인력 채용 등을 함께 추진해야 하는 데 쉽지 않은 것이 현실"이라고 분석했다. 이어 "이에 따라 AI와 관련해 데이터 준비, 전략 수립을 위한 컨설팅, 활용 사례 생성 및 구축 등에 있어 전문 서비스를 활용하는 것이 좀 더 안전하고 체계적일 수 있다"며 "비용 측면에서 고가의 GPU에 투자하거나 퍼블릭 클라우드 서비스 사용 시 높은 운영 비용을 감당하는 데 기업들이 부담을 느끼는 경우가 많다"고 덧붙였다. 이 같은 상황에서 양 전무는 델 테크놀로지스가 좋은 대안이 될 것이라고 강조했다. 또 엔터프라이즈 기업의 경우 생성형 AI를 위해 안정적이며 보안 측면에서 신뢰할 수 있고 관리하기 쉬운 데다 데이터와 가까운 곳에 위치한 고성능의 데이터센터 인프라를 구축해야 한다고 조언했다. 양 전무는 "자사 서버 제품들은 효율화 및 생산성 향상을 위한 라이프사이클 관리의 지능적 설계 및 제어가 가능하다"며 "클라우드 인프라의 대부분의 이점도 온프레미스에서 서비스 형태(As a Service)로 제공할 수 있다"고 설명했다. 그러면서 "'델 AI 솔루션'은 경쟁사들에 비해 AI PC부터 엣지, 코어 데이터센터, 클라우드까지 엔드 투 엔드(End-to-end) AI 솔루션 포트폴리오를 갖추고 있는 데다 자사가 국내외서 스토리지 HW 및 SW 부문 1위 업체로서 데이터 및 데이터 관리에 대해 전 세계에서 가장 잘 알고 있다는 것이 강점"이라며 "코로케이션 및 호스팅 공급업체부터 AI 모델의 기반이 되는 반도체 공급업체에 이르기까지 포괄적인 파트너 생태계 스택을 제공하고 있다는 것도 매력적인 요소"라고 덧붙였다. 또 그는 "엔비디아, 마이크로소프트, 퀄컴, AMD, 허깅페이스, 인텔, 메타, 레드햇 등 광범위한 에코시스템을 통해 협력 관계를 탄탄히 구축하고 있는 것도 장점"이라며 "공장 팩토리 레벨에서 준비된 솔루션을 공급할 수 있도록 엔지니어링 단계에서부터 엔비디아와 협력하고 있다는 것도 우리만의 경쟁력"이라고 강조했다. 이 같은 시스템을 바탕으로 델은 국내 서버 시장에서도 1위 자리를 굳건히 지키고 있다. 특히 서버 자체 기술력, 공급망 관리 능력, 영업 능력, 기술 지원 능력 등을 인정 받아 삼성SDS와 NHN클라우드, 엘리스 등 많은 기업들이 델의 서버를 앞 다퉈 도입하고 있다. 해외에서도 마찬가지다. 델 테크놀로지스에 따르면 현재 기업들은 ▲비용 통제 ▲데이터 관리 ▲기존 시스템과의 통합 ▲전문 인력 부족을 주요 도전 과제로 삼고 있다. 이에 전체 중 77%의 기업이 AI 인프라 구축을 위해 '단일 벤더'를 선호하고 있는데 델 테크놀로지스는 다양한 제품 및 시스템 덕에 기업들의 상당한 신뢰를 얻고 있는 것으로 나타났다. 양 전무는 "우리는 업계 최신 기술과 오픈·모듈러 아키텍처를 빠르고 적극적으로 수용해 고객들이 이미 투자한 자산을 보호할 수 있도록 지원하고 있다"며 "새로운 기술이 나왔을 때 기존의 장비·설비에서 손쉽게 업그레이드할 수 있도록 함으로써 기업들이 효율적으로 자사 제품을 활용할 수 있게 도울 것"이라고 밝혔다. 그러면서 "특히 곧 출시될 '델 파워엣지 XE8712' 서버는 고객들이 가장 기대해도 좋을 제품"이라며 "2개의 그레이스 CPU와 4개의 블랙웰 GPU를 통합한 엔비디아 GB200 그레이스 블랙웰 슈퍼칩을 탑재해 데이터센터 내 AI 성능을 극대화 함으로써 현존하는 AI 서버 중 가장 빠른 속도로 이용할 수 있을 것"이라고 설명했다. 또 델 테크놀로지스가 AI 데이터 관리 측면에서도 상당한 기술 발전을 이끌어 낼 것이라고 자신했다. 특히 기업들이 AI 데이터를 더 빠르게 처리하고 보다 안전하게 보호할 수 있도록 설계된 '델 AI 데이터 팩토리 위드 엔비디아'가 중추적 역할을 할 것으로 봤다. 이 플랫폼은 대량의 데이터를 실시간으로 받아들이는 데이터 인제스천 기능을 지원하며 GPU 가속 기반 '스파크 쿼리'를 활용해 기존 대비 최대 220% 향상된 속도로 데이터를 분석하고 처리할 수 있다. 더불어 델이 AI 소프트웨어 분야에서도 엔비디아와의 협력을 통해 기술 발전을 이끌어 냈다고 강조했다. 특히 '에이전트 AI' 시스템 개발을 지원하는 엔비디아의 AI 개발 프레임워크인 '에이전틱 AI'와 이를 위한 AI 최적화 도구를 AI 팩토리에 통합함으로써 AI를 통해 기업들이 의사 결정을 쉽게 내릴 수 있도록 지원에 나선 점을 피력했다. 양 전무는 "그동안에는 마이크로소프트 등 하이퍼스케일러들이 수십만 장의 GPU를 구매해 파운데이션 모델을 만드는 것이 대세였다면, 작년 말부턴 AI를 어떻게 잘 활용할 수 있을지에 대해 고민을 하는 기업들이 더 많아진 듯 하다"며 "점차 일반 기업들이 실제 비즈니스 도움이 될 수 있도록 AI를 사용하는 사례가 많아지고 있는 만큼, AI 인프라에 대한 시장의 관심도 더 커질 듯 하다"고 말했다. 그러면서 "AI 기술 발전으로 서버 신제품 발표 주기도 2년에 한 번 정도에서 최근에는 엔비디아의 움직임에 맞춰 6개월에 한 번으로 짧아질 정도로 빨라진 상황"이라며 "이에 따른 전력 소비, 냉각 등과 관련된 시스템을 잘 갖춰나가기 위해 노력 중인 만큼 많은 기업들이 우리 제품을 선택할 것으로 기대하고 있다"고 덧붙였다. 또 그는 "특히 국내에선 정부에서 국가 AI 컴퓨팅 센터를 추진하고 있는 만큼 실제 구체적인 사업을 진행할 때 우리 제품을 외면하지는 않을 것으로 보인다"며 "엔비디아뿐 아니라 AMD, 인텔 등 다양한 기업들의 GPU를 제공하며 고객들의 선택지를 많이 넓힌 만큼 '델 AI 팩토리'를 통해 시장 변화에 맞춰 탄력적으로 대응함으로써 시장 주도권을 유지하기 위해 더 노력할 것"이라고 강조했다.

2025.04.07 16:48장유미

한화비전, 美 보안 전시회서 차세대 칩셋 등 공개…AI·클라우드 시장 공략

한화비전은 미국 최대 보안 전시회 'ISC WEST'에서 인공지능(AI) 및 클라우드 기반 솔루션을 대거 선보였다고 6일 밝혔다. 한화비전은 4월 2일부터 미국 라스베이거스에서 열린 보안 전시회 'ISC WEST 2025'에 참가해 '이노베이션 비욘드 익스펙테이션(Innovation Beyond Expectations)'이란 주제로 다양한 첨단 솔루션을 내놓았다. ISC WEST는 세계 3대 물리 보안 전문 전시회로, 매년 전 세계 700여개 기업이 참가한다. 이번 전시에서는 AI 및 클라우드 기술을 적용한 차세대 영상보안 솔루션이 큰 주목을 받았다. ▲ 자체 개발 AI 칩셋 '와이즈넷9(Wisenet9)'을 탑재한 카메라 라인업 ▲ 서비스형 영상관제 솔루션(VSaaS) '온클라우드(OnCloud)' ▲ 엔비디아(NVIDIA) 플랫폼 기반 카메라 등을 중점적으로 소개했다. 올해 처음 공개한 한화비전의 시스템온칩(SoC) 와이즈넷9는 영상 화질 개선을 위한 신경망처리장치(NPU)와 AI 애플리케이션을 위한 NPU가 분리된 '듀얼 NPU' 기술이 적용됐다. 이를 통해 작동 과정에서 각 기능이 서로 영향을 끼치지 않도록 했다. 와이즈넷9가 탑재된 한화비전의 카메라는 저조도나 역광 등 열악한 환경에서도 또렷한 화질을 제공하며, 향상된 AI 영상 분석 기능을 구현한다 올해 공식 출시를 앞둔 '온클라우드'는 전용 서버나 하드웨어를 구매하지 않고 클라우드 상에서 영상을 관리할 수 있는 솔루션이다. 이외에도 ▲ 보안 장비 상태를 실시간 모니터링하는 '헬스프로(HealthPro)' ▲ 영상 분석으로 비즈니스 인사이트를 전달하는 '사이트마인드(SightMind)' 등 클라우드 기반 솔루션을 선보였다. 이번에 처음 공개된 '디자인프로(DesignPro)'는 설치 업체가 직접 솔루션을 설계하고 견적을 낼 수 있도록 해 고객 맞춤형 서비스 제공을 돕는다. 첨단 AI 시장을 주도하고 있는 엔비디아와의 협업도 주목받았다. 한화비전은 이번 전시회에서 엔비디아 젯슨(Jetson) 플랫폼을 활용한 멀티 센서 카메라를 선보였다. 이 카메라는 고성능 그래픽처리장치(GPU)를 탑재한 첫 멀티센서 카메라로, 시장에서 좋은 반응을 얻고 있다. 특히 이번 전시에서는 한화비전 카메라가 '엔비디아 생태계'에 진입하면서 다양한 AI 애플리케이션들을 사용할 수 있게 됐다는 점이 관람객들의 이목을 끌었다. 한화비전 관계자는 “글로벌 영상보안 시장의 최대 화두로 떠오른 AI와 클라우드를 적극 공략해 미국 시장에서의 입지를 지속해서 확대해 나갈 것”이라며 “차별화된 기술 리더십으로 보안 환경 개선을 넘어 비즈니스 혁신을 이끄는 솔루션을 제공하겠다”고 말했다.

2025.04.06 10:14장경윤

"AI 인프라 대안 나올까"…망고부스트, 엔비디아 넘은 추론 성과 공개

망고부스트가 업계 표준 성능 테스트에서 인공지능(AI) 추론(inference) 분야의 신기록을 세우며 거대언어모델(LLM) 시대에 대응할 수 있는 새로운 기술적 대안을 제시했다. AI 데이터센터의 성능, 비용 효율성, 개방형 아키텍처를 두루 갖춘 조합으로 가능성을 입증하며 시장의 주목을 받고 있다. 망고부스트는 지난 2일 미국 워싱턴주 벨뷰에서 실시된 ML퍼프 인퍼런스(MLPerf Inference) v5.0 테스트에서 자사의 AI 추론 소프트웨어 '망고 LLM부스트'와 AMD 'MI300X' 그래픽처리장치(GPU) 조합으로 라마2-70B(Llama2-70B) 모델 오프라인 추론 부문에서 가장 높은 성능을 기록했다고 5일 밝혔다. 이번 테스트는 총 32개의 'MI300X' GPU를 4개 서버 노드에 분산한 다중 노드 구성에서 이뤄졌으며 'MI300X' 기반 시스템의 첫 ML퍼프 멀티노드 제출 사례로도 주목된다. 망고부스트는 '라마2-70B' 오프라인 추론 시나리오에서 초당 10만3천182 토큰(TPS)을 처리해 이전 최고였던 8만2천749 TPS 기록을 넘어섰다. 서버 시나리오에서도 9만3천39 TPS를 기록해 엔비디아 'H100' 기반 시스템 성능을 뛰어넘는 성과를 입증했다. 비용 구조 개선 효과도 눈에 띈다. 'MI300X' GPU는 H100 대비 최대 62% 저렴한 가격에 공급되며 '망고 LLM부스트'와의 조합으로 동일 GPU 수 기준 2.8배 더 높은 가격 대비 성능을 기록했다. 일각에서는 이를 고성능 AI 인프라의 비용 구조를 재편할 수 있는 가능성으로 보고 있다. 이 같은 성과는 AMD와의 긴밀한 협업을 통해 라데온 오픈 컴퓨트(ROCm) 소프트웨어 스택을 최적화한 결과다. 망고부스트는 'MI300X'의 성능을 극대화하는 동시에 단일 노드부터 멀티 노드 클러스터까지 유연하게 확장 가능한 AI 추론 솔루션을 구현했다. 클라우드 환경에서도 경쟁 우위가 확인됐다. 망고부스트는 AWS의 'A100' 기반 환경에서 오픈소스 프레임워크 '오라마(Ollama)' 대비 최대 138배 빠른 AI 추론 성능을 보였으며 허깅페이스의 '텍스트 생성 추론(TGI)'와 vLLM을 포함한 주요 프레임워크와 비교해 성능 및 비용 측면에서 모두 우위를 입증했다. 특히 라마3.1-70B, 큐원-32B, 딥시크-R1-디스틸 등 최신 LLM 모델을 대상으로도 성능 저하 없이 일관된 결과를 유지했다. 이는 다양한 워크로드에 대응 가능한 범용 추론 솔루션으로서의 강점을 보여준다. '망고LLM부스트'는 50개 이상의 오픈 거대언어모델(LLM)을 지원하며 도커 기반의 원라인(one-line) 배포 방식, 오픈AI 애플리케이션 프로그램 인터페이스(API) 호환성 등을 제공해 기존 시스템을 유지하면서도 손쉽게 도입 가능하다. 아마존웹서비스(AWS), 애저(Azure), 구글클라우드플랫폼(GCP) 등 주요 퍼블릭 클라우드뿐 아니라 보안 요구가 높은 온프레미스 환경에서도 통합 운용이 용이하다. 기술적 차별성은 자체 개발한 하드웨어 IP에 기반한다. 이 회사의 데이터처리장치(DPU)는 GPU, 스토리지, 네트워크 가속기 간 데이터 흐름을 최적화해 AI 인프라의 성능과 비용 효율을 동시에 높이는 역할을 한다. 관련 기술은 30건 이상의 특허로 보호받고 있으며 국제 컴퓨터 아키텍처 학술대회(ISCA) 등에서 발표된 10여 년간의 연구 성과를 바탕으로 개발됐다. 망고부스트는 현재 미국, 캐나다, 한국 등을 거점으로 빠르게 사업을 확장하고 있으며 6천만 달러(한화 약 810억원) 이상의 투자를 유치한 상태다. 당초에는 고성능 DPU 반도체로 주목받았지만 창업 초기부터 AI 인프라 전반을 아우르는 풀스택 시스템 솔루션 기업으로의 전환을 준비해왔다. 이번 '망고LLM부스트'는 이러한 소프트웨어 역량의 대표적인 결과물이다. 김장우 망고부스트 대표는 "이번 ML퍼프 결과는 글로벌 AI 인프라 시장에서 망고부스트의 기술력이 공식적으로 인정받았다는 의미"라며 "DPU 기반 하드웨어와 LLM 추론 최적화 소프트웨어가 결합된 풀스택 솔루션으로 AI 데이터센터의 성능과 비용 문제를 동시에 해결해 나가겠다"고 말했다.

2025.04.05 13:52조이환

엔비디아, 아프리카 최초 AI 데이터센터 건립…"디지털 독립성 강화"

엔비디아와 짐바브웨 기업이 아프리카 지역 개발자들의 GPU 접근성 향상과 디지털 독립성 강화를 위해 아프리카 대륙 최초의 인공지능(AI) 데이터센터 건립을 추진한다. 4일 CNN에 따르면 짐바브웨의 기업 카사바 테크놀로지스를 이끄는 스트라이브 마시위아 회장은 최근 엔비디아와 협력해 아프리카 대륙에 AI 팩토리를 구축한다고 발표했다. 양사 협력으로 오는 6월부터 엔비디아 GPU 기반 슈퍼컴퓨터 시스템이 남아프리카공화국에 위치한 카사바 테크놀로지스의 데이터센터에 배치된 후 이집트·케냐·모로코·나이지리아 등 다른 아프리카 국가 내 시설로도 배포될 예정이다. 현재 아프리카는 컴퓨팅파워 부족으로 전 세계 AI 시장에서 상대적으로 뒤처져 있다는 평가를 받는다. 아프리카 대륙 AI 개발자 커뮤니티인 진디(Zindi)에 따르면 아프리카 AI 실무자 중 5%만이 연구개발을 위한 충분한 컴퓨팅 리소스를 이용할 수 있는 것으로 조사됐다. 또 아프리카의 소득 수준에 비해 하드웨어(HW) 비용이 높다는 점도 AI 도입의 주요 장애물 중 하나다. 이 때문에 아프리카 지역 개발자들은 아마존웹서비스(AWS), 구글 클라우드, 마이크로소프트(MS) 애저와 같은 해외 클라우드 서비스에 대한 의존도가 높았다. 문제는 클라우드를 통한 지리적 지역 간 데이터 전송에도 많은 비용이 들고 시간도 오래 걸린다는 점이었다. 또 이같은 기술적 장애물 때문에 아프리카 언어와 방언 등 아프리카를 대표하는 AI 훈련 데이터셋이 부족하거나 편향성을 갖는 경우도 많았다. 이에 카사바 테크놀로지스는 엔비디아 GPU 기반 AI 데이터센터를 중심으로 아프리카 대륙 내 기업과 연구자가 안전한 환경에서 AI를 구축·훈련·확장·배포하는 데 필요한 컴퓨팅 성능에 액세스할 수 있도록 보장한다는 방침이다. 이번 엔비디아와 아프리카 기업 간 협력에 대해 비영리 단체 얼라이언스4AI의 알렉스 차도 이사는 "아프리카에는 대규모 GPU 클러스터가 없어 혁신가들의 발목을 잡고 있다"며 "엔비디아의 이번 발표는 GPU에 대한 접근성을 높여 대륙 전역에서 AI 혁명을 주도하는 데 도움이 될 것"이라고 기대했다. 이어 "이제 아프리카 개발자들은 대륙 내에서 데이터를 수집·처리할 수 있게 됐다"며 "아프리카의 빅테크가 AI 커뮤니티에 합류하고 투자함으로써 인재 양성에도 적극 나설 수 있게 되는 등 생태계 전반의 혁신을 가속화할 것"이라고 덧붙였다. 스트라이브 마시위아 회장은 "자사의 AI 팩토리는 혁신이 확장될 수 있는 인프라를 제공해 아프리카 기업, 스타트업 및 연구원들이 최첨단 AI 인프라에 접근할 수 있도록 지원할 것"이라고 밝혔다.

2025.04.04 15:32한정호

HP, 업무 효율 향상 위한 AI PC 신제품 4종 공개

"HP가 매년 시행하는 '업무 관계 지수' 조사 작년 결과에서 응답자 중 68%는 AI가 새로운 기회를 창출할 것이라고 답했다. AI와 클라우드를 활용한 자동화 시스템이 생산성을 향상할 것이며 HP는 고객들이 실질적으로 변화를 체감할 수 있도록 도울 것이다." 3일 오전 서울 여의도 콘래드호텔에서 진행된 신제품 기자간담회에서 김대환 HP코리아 대표가 이렇게 설명했다. 이날 HP는 인텔 코어 울트라 시리즈2 기반 업무용 노트북인 '엘리트북 울트라 G1i', '엘리트북 X 플립 G1i', AMD 라이젠 AI 기반 고성능 미니PC 'Z2 미니 G1a' 등 신제품 4종을 출시했다. 김대환 대표는 "다양한 AI PC를 출시해 일선 근로자와 의사결정권자의 간극을 메우고 실제 업무 현장에서 AI 기반 솔루션의 도움을 체감할 수 있도록 하는 것이 HP의 궁극적인 목표"라고 밝혔다. "2년 뒤 AI PC 비중 60%까지 상승 전망" 이날 소병홍 HP코리아 퍼스널 시스템 카테고리 전무는 "시장조사업체 IDC는 2027년 전체 PC 출하량 중 50% 이상이 AI PC가 될 것으로 예상했지만 올해 HP 자체 예상에 따르면 이 비율은 60%까지 높아질 것으로 본다"고 설명했다. 이어 "HP는 인텔과 AMD, 퀄컴과 엔비디아 등 다양한 실리콘 업체, 마이크로소프트와 어도비 등 개별소프트웨어업체(ISV)와 협업해 AI 경험을 극대화할 수 있는 솔루션을 준비중"이라고 설명했다. HP는 전체 제품군을 40 TOPS(1초당 1조번 연산) 이상 성능을 갖춘 신경망처리장치(NPU)를 내장한 PC를 '차세대 AI PC', 그 이하의 NPU를 내장한 PC를 'AI PC', NPU를 내장하지 않은 기존 PC로 분류하고 있다. 소병홍 전무는 "HP는 모든 PC 제품군을 AI PC로 전환하고 있으며 오늘 공개하는 '엘리트북 울트라 G1i', '엘리트북 X 플립 G1i' 등을 포함해 보급형 업무용 노트북 '프로북4'에도 AI 처리 역량을 갖췄다"고 설명했다. 40 TOPS 이상 NPU 내장 신제품 4종 출시 엘리트북 울트라 G1i는 인텔 코어 울트라 200V(루나레이크) 기반으로 내구성과 AI를 활용한 협업, 보안을 중시한 초경량 제품이다. 900만 화소 AI ISP 카메라와 폴리 솔루션을 이용해 카메라 화질과 음향 등을 보완했다. 엘리트북 X 플립 G1i는 이동이 잦은 컨설턴트를 겨냥한 투인원 제품이다. 화면을 180도 돌려 상대방과 공유할 수 있고 이동시 인터넷 연결을 위한 5G/LTE 옵션도 지원한다. Z북 울트라 G1a는 AMD 라이젠 AI 맥스 APU와 최대 128GB 대용량 메모리로 콘텐츠 제작과 대형언어모델(LLM) 처리가 가능하다. 통합 메모리 중 최대 96GB를 통합 GPU로 돌려 메타 라마3.1 700억개 패러미터 모델을 실시간 구동한다. Z2 미니 G1a는 120W급 AMD APU와 최대 128GB 메모리를 내장한 미니 PC다. 전원공급장치를 본체 내 통합하고 부피를 줄여 책상 위나 모니터 뒤, 고밀도 배치를 위한 랙 마운트 솔루션에 설치할 수 있다. GPT4 기반 AI 소프트웨어 'AI 컴패니언' 탑재 신제품 4종은 오픈AI GPT4 기반으로 지식 검색, 검색증강생성(RAG) 등을 지원하는 HP 소프트웨어 'AI 컴패니언'을 기본 탑재한다. 대화형 AI 기능을 인터넷 접속 없이 이용할 수 있고 각종 센서를 활용해 PC를 최적화하는 기능도 내장했다. 기업이나 조직 안에서 생성한 각종 문서 파일을 라이브러리로 포함한 다음 이를 학습해 문서 요약이나 질문 등을 처리하며 모든 작업은 외부 데이터 전송 없이 작동한다. 올해 출시된 버전에는 문서 뿐만 아니라 그림·사진 파일을 처리하는 기능도 추가됐다. HP코리아 관계자는 "GPT 4.5 등 최신 AI 모델이 출시되면 이에 맞춰 지속 업데이트가 가능하다"고 설명했다. "국내 ISV와도 협업 준비... 다양한 포트폴리오가 강점" 2023년 말부터 AI PC 출시가 이어지며 AI 역량을 활용할 수 있는 소프트웨어에 대한 관심도 커지고 있다. 소병홍 전무는 "해외 ISV 뿐만 아니라 국내 ISV와도 협업을 준비중"이라고 설명했다. 이어 "AI PC에 대한 시장 요구가 커지면 프리미엄화가 진행되며 HP 역시 많은 투자를 하고 있다. 우수한 하드웨어 기반으로 이를 활용할 수 있는 솔루션을 제공해 경쟁사와 차별화할 것"이라고 설명했다. 김대환 대표이사는 "HP는 인텔과 AMD, 퀄컴 등 다양한 제조사 프로세서 기반으로 보급형부터 고급형까지 다양한 AI 제품 포트폴리오를 갖췄으며 선택의 폭을 넓혀 AI PC 시장을 확대할 것"이라고 밝혔다.

2025.04.03 14:53권봉석

"GPU 72장 돌려야 답 나온다"…엔비디아, AI 추론 '끝판왕' 내놔

엔비디아가 복잡한 사고력 기반 AI 모델 확대에 맞춰 새로운 추론 성능 전략을 공개한다. 점점 더 많은 연산을 요구하는 AI 모델 등장에 따른 글로벌 평가 기준 변화에 선제 대응하려는 조치다. 3일 업계에 따르면 엔비디아는 지난 1일 정오 온라인으로 진행한 프리브리핑에서 AI 성능 벤치마크인 '엠엘퍼프(MLPerf)' 추론 AI 부문의 변화에 대응하기 위한 기술 전략을 공개했다. 이번 행사는 국제 컨소시엄 엠엘커먼스(MLCommons)가 '사고 기반 AI'인 추론 모델을 평가 항목에 포함하려는 움직임에 초점을 맞췄다. 엠엘퍼프는 AI 모델의 훈련(training)과 추론(inference) 성능을 하드웨어·소프트웨어 통합 기준으로 측정하는 글로벌 표준 벤치마크다. 엠엘커먼스가 주도하는 이 평가 항목은 업계 기술 흐름에 따라 주기적으로 갱신된다. 최근에는 단순 예측을 넘어 복잡한 추론과 의사결정을 요구하는 리즈닝 모델이 AI 기술의 중심으로 떠오르면서 해당 항목의 공식 도입 논의가 본격화되고 있다. 엔비디아는 아직 리즈닝 모델 항목이 공식 도입되지는 않았지만 차기 엠엘퍼프 버전에서는 채택 가능성이 높다고 판단하고 있다. 이를 선제적으로 대비하기 위해 회사는 중국의 AI 스타트업인 딥시크가 개발한 생성형 AI 모델을 활용해 복잡한 사고 기반 작업에서의 추론 성능을 시연했다. 이처럼 복잡한 추론 모델이 확산되면서 AI 추론 환경 전반에도 근본적인 변화가 일고 있다. 추론 연산량이 전례 없이 폭증하고 있는 상황에서 과거에는 단일 그래픽처리장치(GPU)나 단일 노드에서 충분했던 작업들이 이제는 다수 GPU를 동시 투입하는 복잡한 병렬 연산 없이는 처리할 수 없다는 것이 엔비디아의 분석이다. 이에 더해 추론 모델의 확산은 AI 개발의 모든 단계에서 연산 자원의 수요를 급격히 증가시키고 있다. 엔비디아는 모델 재학습(retraining), 도메인 맞춤화(post-training), 테스트 시점 확장(test-time scaling) 등에서 연산량이 기하급수적으로 늘고 있다고 분석했다. 특히 테스트 단계에서도 추론 정확도를 높이기 위한 병렬 연산 수요가 계속해서 증가하고 있다는 점을 강조했다. 이에 이날 엔비디아는 고성능 시스템 예시로 'GB200 MBL'을 제시했다. 해당 시스템은 총 72개의 GPU를 동시 연동하며 복잡한 추론을 빠르게 처리할 수 있도록 설계됐다. 회사는 이러한 대규모 병렬 환경이 향후 추론 표준이 될 것으로 보고 있다. 엠엘커먼스 역시 추론 모델을 엠엘퍼프의 공식 평가 항목에 포함하기 위한 논의를 본격적으로 시작한 상황이다. 현재 다양한 기술 커뮤니티와 협업을 통해 평가 기준과 워크로드 확장을 준비하고 있다. 공식 도입 시점은 아직 정해지지 않았으나 실증 사례와 모델 테스트가 계속 이어지고 있어 연내 도입이 확정될 가능성도 있다. 엔비디아 관계자는 "모델의 크기와 지능이 커짐에 따라 연산량이 모든 단계에서 폭증하고 있다"며 "재학습, 도메인 최적화, 테스트 시점 스케일링 모두 고성능 GPU를 요구한다"고 설명했다. 이어 "72개의 GPU처럼 다수의 칩을 동시에 작동시켜야 하는 이유가 바로 이 때문"이라고 덧붙였다.

2025.04.03 01:00조이환

SK하이닉스 "차세대 HBM 성패, 세 가지 과제가 중요"

SK하이닉스가 차세대 HBM(고대역폭메모리) 상용화를 위해 다방면의 기술 고도화가 필요하다고 강조했다. 특히 전력 효율성의 경우, 주요 파운드리 기업과의 협력이 보다 긴밀해질 것으로 관측된다. 이규제 SK하이닉스 부사장은 2일 인천 송도 컨벤시아에서 열린 'KMEPS 2025년 정기학술대회'에서 HBM의 개발 방향에 대해 발표했다. 이 부사장은 이날 SK하이닉스의 차세대 HBM 개발을 위한 과제로 ▲대역폭(Bandwith) ▲전력소모(Power) ▲용량(Capacity) 세 가지를 강조했다. 대역폭은 데이터를 얼마나 빨리 전송할 수 있는지 나타내는 척도다. 대역폭이 높을수록 성능이 좋다. 대역폭을 늘리기 위해선 일반적으로 I/O(입출력단자) 수를 증대시켜야 한다. 실제로 HBM4(6세대)의 경우, HBM3E(5세대) 대비 I/O 수가 2배 늘어난 2천48개가 된다. 이 부사장은 "고객사들은 SK하이닉스가 만들 수 있는 것보다 높은 대역폭을 원하고 있고, 일각에서는 I/O수를 4천개까지 얘기하기도 한다"며 "그러나 I/O 수를 무작정 늘린다고 좋은 건 아니기 때문에, 기존 더미 범프를 실제 작동하는 범프로 바꾸는 등의 작업이 필요할 것"이라고 설명했다. 결과적으로 차세대 HBM은 전력소모와 용량 면에서 진보를 이뤄야 할 것으로 관측된다. 특히 전력소모의 경우, 로직 공정과의 연관성이 깊다. HBM은 D램을 적층한 코어다이의 컨트롤러 기능을 담당하는 로직다이가 탑재된다. 기존에는 이를 SK하이닉스가 자체 생산했으나, HBM4부터는 이를 파운드리에서 생산해야 한다. 이 부사장은 "HBM의 로직 공정은 주요 파운드리 협력사와의 협업이 굉장히 중요한데, 이런 부분에서 긴밀한 설계적인 협업이 있다"며 "SK하이닉스도 패키지 관점에서 여러 아이디어를 내고 있다"고 설명했다. HBM의 용량은 D램의 적층 수와 직결된다. 현재 상용화된 HBM은 D램을 최대 12개 적층하나, 향후에는 16단, 20단 등으로 확대될 예정이다. 다만 차세대 HBM을 제한된 규격(높이 775마이크로미터) 내에서 더 많이 쌓기 위해서는 각 D램의 간격을 줄여야 하는 난점이 있다. 예를 들어, HBM이 12단에서 16단으로 줄어들게 되면 각 D램간의 간격은 절반으로 감소된다. 때문에 SK하이닉스는 기존 어드밴스드 MR-MUF와 더불어 하이브리드 본딩 기술을 고도화하고 있다. 하이브리드 본딩은 범프를 쓰지 않고 각 D램을 직접 연결하는 방식으로, 칩 두께를 줄이고 전력 효율성을 높이는 데 유리하다. 다만 하이브리드 본딩도 현재로선 상용화에 무리가 있다. 기술적 난이도가 높아, 양산성 및 신뢰성을 충분히 확보해야 한다는 문제가 남아있기 때문이다. 이 부사장은 "차세대 HBM 개발과 관련해 위와 같은 세가지 요소가 굉장히 복잡하게 얽혀있는 상황"이라며 "이외에도 차세대 HBM 시장에서는 메모리 기업들이 제조원가를 어떻게 줄이느냐가 가장 중요한 과제가 될 것으로 생각한다"고 설명했다.

2025.04.02 17:30장경윤

"피지컬 AI도 똑똑한 뇌 필수"…특화 모델·시뮬레이션 주목

인공지능(AI)이 컴퓨터 속 소프트웨어(SW)에서 현실 세계에서 활동하기 시작했습니다. AI가 현실과 상호작용하며 스스로 세계를 이해하는 '피지컬 AI' 시대가 열렸습니다. 피지컬 AI 개념과 빅테크 전략, 산업 전반에 미칠 변화를 조망해 보겠습니다. [편집자주] '피지컬 인공지능(AI)'이 성공적으로 구축되려면 이에 특화된 모델 개발과 시뮬레이션 환경이 필수적이라는 의견이 이어지고 있다. 기계가 사람 명령어뿐 아니라 세상을 스스로 이해·추론할 수 있는 인지력과 이를 테스트하기 위한 인프라 조성이 필요해서다. 31일 IT 업계에 따르면 피지컬 AI 인지력 향상을 위한 소프트웨어(SW)와 시뮬레이션 이 필수인 것으로 전해졌다. 특화 모델과 전용 SW, 시뮬레이션 중요성이 높아졌다. 다쏘시스템 지앙 파울로 바씨 고객 경험 부문 수석 부사장은 지난달 미국 텍사스주 휴스턴에서 열린 '3D익스피리언스 월드 2025' 기자간담회에서 "피지컬 AI 구현을 위해선 하드웨어뿐 아니라 인지 능력을 동시개발할 필요가 있다"고 재차 강조했다. 이어 "현재 최신 AI 로봇도 특정 업무 수행에 그친다"며 "사람 지시 없이 스스로 작업할 수 없기 때문"이라고 말했다. 예를 들어 보스턴다이내믹스의 4족 보행 로봇 '스팟'은 지형 탐색과 계단 오르내리기 등 특정 작업 수행을 할 수 있다. 다만 이를 사람이 직접 프로그래밍해야 가능하다. 스스로 주변 환경을 살피며 새로운 움직임을 보이거나 사람이 명령하지 않은 임무 수행은 불가다. 바씨 부사장은 "피지컬 AI로 구현된 스팟은 위험한 냄새를 스스로 감지하거나 열을 느끼고, 다른 로봇에 실시간으로 현 상태를 공유할 수 있는 능력을 갖출 것"이라고 강조했다. 그러면서 "로봇도 인간처럼 오감 느끼는 '센스 컴퓨팅'이 필요한 시점"이라고 주장했다. 엔비디아·오픈AI, 피지컬 AI 인지 능력 기르기 나서 엔비디아와 오픈AI도 피지컬 AI 구현에 속도를 내고 있다. 특히 피지컬 AI의 '뇌'에 해당하는 특화 모델 연구에 한창이다. 엔비디아는 최근 열린 'GTC 2025'에서 피지컬 AI 모델 '코스모스'를 공개했다. 이 모델은 현실 세계 움직임을 학습·예측할 수 있는 멀티모달 형태다. 현실 세계와 유사한 가상 환경을 자동 생성할 수 있다. 개발자는 이 안에서 로봇과 자율주행 시스템을 학습시키거나 시뮬레이션할 수 있다. 이 모델은 엔비디아 옴니버스와 연동돼 대규모 합성 데이터도 자동 생성할 수 있다. 이를 통해 고품질 훈련 데이터를 확보가 가능하다. '코스모스리즌 모델'로 AI의 시공간 추론과 연쇄적 사고도 가능하다. 비디오 데이터 이해와 자연어 예측을 지원한다. 젠슨 황 엔비디아 최고경영자(CEO)는 "코스모스 모델은 단순히 로봇을 제어하는 AI가 아니라, 물리 세계 전체를 이해하고 계획할 수 있는 AI 인프라"라며 "AI가 현실을 학습하고 예측하는 시대를 여는 신호탄"이라고 기조연설서 밝혔다. 오픈AI도 피지컬 AI 구축을 위해 기초 모델 연구에 착수한 것으로 전해졌다. 단순 AI 로봇뿐 아니라 모든 물리적 현상을 분석·추론할 수 있는 것을 목표로 뒀다. 외신에 따르면 오픈AI는 모델의 고품질 학습 데이터를 위해 전문 연구자를 라벨링 작업에 투입한 것으로 알려졌다. 물리학자가 가공한 정제된 데이터를 활용해 물리학 분야 성능을 극대화할 방침이다. 피지컬 AI 인지력, 가상 세계서 엿볼 수 있다 업계 관계자들은 피지컬 AI로 구성된 제품·서비스가 현실서 제대로 구현되려면 이를 가상 세계에서 테스트해야 한다고 입을 모았다. AI 인지력을 체크하면서 기능을 수정·보완할 수 있기 때문이다. 이를 통해 제품 안전성을 높일 수 있다. 다쏘시스템은 이미 가상·현실을 넘나드는 시뮬레이션 환경을 구축한 상태다. 3D CAD 제품인 '솔리드웍스'로 버추얼 트윈 간 상호작용이 가능하게 서비스를 제공하고 있다. 작업자는 통합된 버추얼 트윈에서 제품 설계부터 기능 테스트까지 한 번에 수행할 수 있다. 또 솔리드웍스는 올해 7월 설계용 AI 도구 '아우라' 추가를 앞뒀다. 아우라는 사용자 설계 데이터·패턴을 학습해 맞춤형 명령어와 설계법을 추천할 수 있다. 설계 과정에서 부품 배치도 돕는다. 이 도구는 사용자 명령어를 통해 시뮬레이션을 실행할 수 있다. 예를 들어 사용자가 "이 제품 내구성을 테스트해 줘. 이를 2미터 높이에서 떨어뜨려 봐"라고 명령하면 AI가 해당 시뮬레이션 환경을 자동 구축해 테스트를 명령어에 맞게 수행한다. 다쏘시스템은 3D 설계용 AI 모델을 솔리드웍스와 3D익스피리언스에 탑재한 상태다. 해당 모델은 제품 스케치부터 설계, 조립, 시뮬레이션 등을 기존보다 더 신속·정확히 돕는다. 현실과 동일한 환경에서 제품 성능을 시뮬레이션할 수 있게 도울 수도 있다. 마니쉬 쿠마 솔리드웍스 CEO는 "버추얼 트윈 기술을 활용하면 로봇의 인지 기능을 사전에 시뮬레이션해 안전성과 효율성을 더욱 강화할 수 있다"며 "버추얼 트윈은 인간과 기계가 공존하는 새로운 패러다임을 만들기 위한 필수 인프라"라고 강조했다. 다쏘시스템은 버추얼트윈을 통한 피지컬 AI 실현은 안전성뿐 아니라 개발 비용까지 줄일 수 있다고 강조했다. 보통 기업은 제품 개발에 필요한 부품을 구입·소비 후 바로 폐기한다. 이때 자원 낭비가 발생한다. 반면 버추얼 트윈 상에서 제품을 개발할 때 이 과정이 생략된다. 생산 전 과정을 가상 세계에서 시뮬레이션할 수 있기 때문이다. 사용 기업은 안전성뿐 아니라 경제성까지 챙길 수 있다. 파스칼 달로즈 다쏘시스템 CEO는 "버추얼 트윈이 확산하면 제품 개발을 위해 부품을 한번 사용하고 폐기하는 전통적 소비 개념은 저물 것"이라며 "생산 전 과정을 시뮬레이션하는 순환 경제 시스템이 활성화할 것"이라고 주장했다.

2025.03.31 16:53김미정

美 빅테크, '피지컬 AI' 가동…세상 이해하는 AI 만든다

인공지능(AI)이 컴퓨터 속 소프트웨어(SW)에서 현실 세계에서 활동하기 시작했습니다. AI가 현실과 상호작용하며 스스로 세계를 이해하는 '피지컬 AI' 시대가 열렸습니다. 피지컬 AI 개념과 빅테크 전략, 산업 전반에 미칠 변화를 조망해 보겠습니다. [편집자주] 미국 빅테크가 현실 세계를 이해할 수 있는 '피지컬 인공지능(AI)' 가동을 본격화했다. AI가 현실에서 하드웨어(HW) 제어하는 수준을 넘어 세상 형태와 움직임을 이해·추론하는 지능형 시스템으로 진화하기 시작했다. 30일 IT 업계에 따르면 엔비디아와 구글 등 미국 빅테크는 이같은 AI 서비스·기술 확장에 나선 것으로 전해졌다. 이를 구현하기 위해 기업 간 협업과 파트너십도 진행되고 있는 추세다. 피지컬 AI는 AI가 현실 세계와 상호작용하며 이를 스스로 인식·행동하는 개념이다. 단순 AI를 탑재한 HW를 넘어 세상을 이해하는 AI로 진화하는 식이다. 적용 범위는 스마트홈을 비롯한 자율주행차, 제조, 신약 개발, 에너지 등이다. 이는 기계에 AI를 탑재한 로보틱스보다 상위 개념이다. 엔비디아, 피지컬 AI '옴니버스 생태계' 가동 엔비디아는 이달 미국 내서제이에서 열린 'GTC 2025'에서 피지컬 AI 구현을 핵심 과제로 제시했다. 자사 플랫폼 '옴니버스' 중심으로 물리 세계를 시뮬레이션하고 제어하는 기술을 공개했다. 옴니버스는 물리 데이터를 예측하고 조작할 수 있는 피지컬 AI 전용 운영체제다. 개방형 USD 프레임워크(OpenUSD) 기반으로 설계돼 다양한 로봇, 센서, 제조 설비 데이터를 하나의 환경에 통합할 수 있다. 옴니버스를 통한 피지컬 AI 구현 사례도 소개됐다. 현대차그룹은 옴니버스로 보스턴다이내믹스 로봇을 가상 조립 라인에서 학습시키고 있다고 발표했다. 폭스콘은 사람형 로봇 작업 환경을 시뮬레이션하고 있다. SAP와 지멘스, 슈나이더일렉트릭 등도 이 플랫폼과 연동해 창고 관리, 전력 인프라, 냉각 시스템 환경을 시뮬레이션하고 있다. 단순 로봇 제어를 넘어 물리 환경 전체를 AI가 이해하고 최적화하는 인프라가 구축되고 있다는 설명이다. 젠슨 황 엔비디아 최고경영자(CEO)는 "옴니버스를 앞세워 제조를 비롯한 물류, 전력, 콘텐츠 제작 등 산업 전반을 피지컬 AI 기반으로 재구성할 것"이라고 밝혔다. 구글, '제미나이'로 피지컬 AI 만든다 구글도 자사 모델 '제미나이'로 피지컬 AI 산업까지 적용 범위를 확장할 방침이다. 구글 딥마인드는 이달 제미나이 2.0 기반으로 한 로봇 제어 모델 '제미나이 로보틱스'와 '제미나이 로보틱스-EX'을 공개했다. 두 모델 제미나이 로보틱스는 사용자 음성 지시에 따라 물건을 조작하거나, 환경 변화에 실시간 반응할 수 있도록 설계됐다. 특히 제미나이 로보틱스-EX는 멀티모달 이해와 고차원 추론 능력을 갖춘 것으로 전해졌다. 복잡한 작업 흐름을 스스로 계획하고 실행할 수 있다는 이유에서다. 현실 세계에서 유연하게 작동하기 위한 범용성과 상호작용성을 모두 고려한 피지컬 AI 모델로 평가받고 있다. 업계는 구글의 장기 목표도 단순 로보틱스를 넘어선 피지컬 AI에 있다는 분위기다. 순다 피차이 구글 CEO도 "로보틱스는 물리 AI의 실험장일 것"이라고 강조했다. 엔비디아-알파벳, 피지컬 AI 손잡다 엔비디아는 피지컬 AI 적용 산업 확대를 위해 기업 협력에도 나섰다. 두 기업은 이번 GTC 2025에서 피지컬 AI 혁신을 위한 파트너십을 확대했다. 의료를 비롯한 제조, 에너지, 스포츠 등 물리 환경 전반을 아우르는 피지컬 AI 생태계를 구축하겠다는 목표를 제시했다. 알파벳 산하 로봇기업 인트린직은 엔비디아의 파운데이션 모델을 도입해 범용 로봇 파지 기술을 개발할 방침이다. 복잡하고 비효율적인 프로그래밍 한계를 극복하기 위한 전략이다. 인트린직은 옴니버스 플랫폼과의 실시간 연결을 위해 오픈USD 기반 스트리밍 기능도 공개했다. 이를 통해 로봇 작업 셀을 가상 환경에서 시각화하고 직관적으로 실험할 수 있는 워크플로를 구현했다. 구글클라우드는 이번 GTC에서 엔비디아의 차세대 블랙웰 그래픽처리장치(GPU)를 가장 먼저 도입한다고 발표했다. GB300 NVL72와 RTX 프로 6000 블랙웰은 의료, 제조, 콘텐츠 등 산업별 AI 워크로드를 동시에 처리할 수 있도록 설계됐다. 알파벳은 이 외에도 딥마인드, 아이소모픽랩스, X 산하 태피스트리 팀 등 계열사와 피지컬 AI의 실험을 병행하고 있다. 신약 개발, 에너지망 최적화 등 고난도 분야에서도 협력의 범위를 확장하고 있다. 젠슨 황 CEO는 "AI 인프라부터 대규모 산업 적용까지 양사 협력은 기술 혁신을 가속화하고 있다"고 말했다.

2025.03.30 11:03김미정

AI 전환 가속하는 크래프톤·위메이드…엔비디아와 손잡았다

AI가 게임업계 최대 화두로 떠오른 가운데, 크래프톤과 위메이드가 엔비디아와 손잡고 기술 혁신에 집중하고 있다. 생성형 AI와 실시간 데이터 분석 기술을 게임 콘텐츠에 접목해 몰입도와 완성도를 끌어올린다는 전략이다. 28일 위메이드에 따르면 이 회사는 엔비디아와 손잡고 AI 기술을 활용한 게임 혁신에 나섰다. 최근 양사는 '미르5'와 '블랙 벌처스: 프레이 오브 그리드'에서 AI 기반 콘텐츠를 선보일 것을 예고했다. 기존의 정형화된 플레이 방식에서 벗어나 이용자의 행동에 따라 변화하는 적응형 게임 세계를 구축해 더 높은 몰입감을 제공한다는 방침이다. 위메이드는 현재 '미르5'의 AI 보스 '아스테리온' 제작에 엔비디아의 AI 가상 캐릭터 개발 기술 '엔비디아 에이스(NVIDIA ACE)'를 활용하고 있다. '미르5'는 위메이드의 글로벌 흥행작 '미르4'를 계승한 후속작으로, 차원을 넘나드는 배 '신기선'을 타고 낯선 세계로 건너간 원정대의 이야기를 담은 오픈월드 PC MMORPG다. 위메이드넥스트에서 연내 출시를 목표로 개발 중이다. '아스테리온'은 이용자와의 전투에서 실시간으로 행동 패턴을 학습해 전술을 발전시키는 AI 보스다. 이용자의 위치, HP, MP, 사용 가능 스킬, 공격 및 방어 능력치, 버프 효과 등 다양한 데이터를 통합해 전략을 끊임없이 변화시킨다. '아스테리온'과의 전투는 고정된 패턴이 아닌 실시간 대응 방식으로 진행되기 때문에 이용자는 매번 새로운 전략을 준비해야 하며, 보스 격파 시 더 큰 성취감과 몰입감을 느낄 수 있다. 자회사 디스민즈워에서 개발 중인 '블랙 벌처스: 프레이 오브 더 그리드'는 AI 기반 전투 분석 장비를 통해 한층 진화한 전장 경험을 선보인다. 위메이드의 첫 번째 FPS 게임인 '블랙 벌처스: 프레이 오브 더 그리드'는 현대전이 장기화된 세계를 배경으로, 군인들이 생존과 부를 위해 싸우는 이야기를 담았다. 언리얼엔진5를 활용한 초현실적인 그래픽, 3개 진영 간 심리전, 팀 기반 파밍 시스템 등이 특징이다. 이 게임에서 핵심적인 역할을 하는 AI 전투 분석 장비 '바이퍼'는 엔비디아의 자동 음성 인식 기술 '리바(Riva)'를 기반으로 개발되고 있다. '바이퍼'는 전술 카메라, 헤드셋, 드론 등을 통해 데이터를 수집하고 실시간으로 정보를 분석한다. 이를 통해 이용자는 전장의 상황을 정확히 파악하고 보다 전략적인 플레이를 펼칠 수 있다. '바이퍼'는 단순한 보조 장비 그 이상의 기능을 한다. 이용자는 '바이퍼'가 제공하는 정보를 활용해 실력 격차를 극복하고 전략적 우위를 점할 수 있다. 정보를 기반으로 한 전략적 플레이가 핵심인 '블랙 벌처스: 프레이 오브 더 그리드'는 기존 FPS와 차별화된 새로운 경험을 선사한다. 크래프톤 역시 엔비디아와의 적극적인 협력 의사를 밝혔다. 크래프톤은 지난 1월 열린 CES 2025에서 CPC(Co-Playable Character)라는 새로운 개념의 AI 캐릭터를 공개했다. CPC는 기존 NPC(Non-Playable Character)의 한계를 넘어, 플레이어와 실시간으로 상호작용하며 게임 속 팀메이트 역할을 수행하는 것이 특징이다. 이강욱 크래프톤 딥러닝본부장은 CES 2025 현장에서 “크래프톤은 P배틀그라운드 IP 프랜차이즈와 인조이(inZOI)를 포함한 다양한 게임에 CPC를 확대 적용해 이용자 경험 혁신을 이어가겠다”며 “CPC가 게임 업계의 새로운 기준점이 될 수 있도록 최적화와 표준화 작업에 더욱 박차를 가할 계획”이라고 밝혔다. 또한 “AI 기술이 게임 산업에 가져올 큰 변화를 믿고 엔비디아와의 장기적인 파트너십을 지속할 것”이라고 덧붙였다. 배틀그라운드에 적용된 AI 팀메이트 'PUBG Ally'는 플레이어와 게임 내 소통하며 전리품을 탐색하고, 전략을 제안하며, 전투를 돕는다. 또한, 신규 게임 인조이에서는 CPC가 더욱 현실적인 사회적 상호작용을 구현해 플레이어가 창의적으로 게임 세계를 탐험하고 스토리를 만들어갈 수 있도록 돕는다. 크래프톤 성준식 AI센터장은 “엔비디아 및 OpenAI와 협업을 진행하고 있고, 게임 제작을 가속화하거나 게임에 새로운 가치를 부여하는 부분에서 AI의 활용이 잘 이루어질 것으로 기대하고 있다”고 밝혔다.

2025.03.28 11:00강한결

日 소프트뱅크, 오픈AI '400억 달러' 펀딩 마무리 단계…자금 상태 '우려'

일본 소프트뱅크가 '스타게이트' 프로젝트를 함께 추진 중인 오픈AI에게 역대 최대 규모의 자금 지원에 나선다. 최근 재무 상황에 대한 우려 속에서도 오픈AI에 대한 투자를 강행하며 인공지능(AI) 시장에서 주도권 잡기에 나선 모양새다. 28일 블룸버그통신에 따르면 소프트뱅크는 400억 달러(약 58조원) 펀딩 라운드에 마그네타 캐피털, 코투 매니지먼트, 파운더스 펀드, 알터미터 캐피털 매니지먼트 등을 포함한 투자자들과 참여 방안에 대해 협상 중인 것으로 알려졌다. 이번 펀딩은 최종 마무리 단계로, 일리노이주에 본사를 둔 헤지펀드 마그네타 캐피털의 투자 금액이 최대 10억 달러(약 1조5천억원)에 달할 것으로 예상돼 눈길을 끈다. 시장조사업체 피치북에 따르면 오픈AI의 이번 펀딩 규모는 역대 최대가 될 것으로 관측됐다. 오픈AI의 기업가치는 이번 펀딩에서 모은 자금을 포함해 현재 3천억 달러(약 439조원)로 평가되고 있다. 이는 지난 해 10월 펀딩 때 평가된 1천570억 달러(약 230조원)의 거의 두 배로, 한국 시가총액 1위 기업인 삼성전자(약 365조원)보다 훨씬 높다. 이번 펀딩에서 소프트뱅크는 투자자 신디케이트로부터 25억 달러와 함께 초기에 75억 달러를 투자할 것으로 알려졌다. 이어 연말에는 소프트뱅크가 225억 달러, 신디케이트를 통해 75억 달러를 더 투자해 총 300억 달러의 추가 투자를 진행할 것으로 전해졌다. 앞서 소프트뱅크그룹은 지난 1월 오픈AI에 15억 달러를 추가 출자한 것으로도 알려진 바 있다. 이에 따른 오픈AI 출자액은 당시 총 20억 달러인 것으로 집계됐다. 또 소프트뱅크그룹은 오픈AI와 다양한 사업을 두고 협업에 적극 나서고 있다. 일본에선 합작사를 만들어 기업용 생성형 AI를 개발해 판매할 계획이며 미국에선 소프트웨어 기업 오라클과 함께 최소 5천억 달러를 투자해 새로운 AI 기업인 '스타게이트'를 설립할 계획이다. 소프트뱅크는 이번 투자 움직임과 관련해 뚜렷한 입장을 밝히지 않았다. 그러나 소식이 전해진 후 도쿄 증시에서 소프트뱅크 주가는 4.7% 하락세를 보였다. 블룸버그통신은 "소프트뱅크의 신용부도스와프(CDS)도 확대된 상황"이라며 "이는 부분적으로 이러한 대규모 지출이 기업의 재무 상태에 미칠 영향에 대한 우려 때문"이라고 분석했다.

2025.03.28 10:06장유미

오라클, OCI에 엔비디아 AI 통합…"AI 개발·배포 가속"

오라클이 자사 클라우드 인프라스트럭처에 엔비디아 인공지능(AI) 플랫폼을 통합해 기업의 AI 개발·배포를 가속화한다. 오라클은 '오라클 클라우드 인프라스트럭처(OCI)'에서 엔비디아 AI 엔터프라이즈를 제공한다고 27일 밝혔다. OCI에서 제공되는 엔비디아 AI 엔터프라이즈는 기존 마켓플레이스 방식이 아닌 OCI 콘솔을 통해 네이티브로 배포된다. 이에 서비스 구동 시간과 관리 복잡도를 줄였다. 고객은 엔비디아의 NIM 마이크로서비스를 비롯한 160개 이상의 AI 도구를 OCI에서 이용할 수 있으며 오라클 유니버설 크레딧을 통해서도 사용 가능하다. 고객은 이 플랫폼을 OCI 퍼블릭 리전뿐 아니라 정부 클라우드, 전용 리전, 알로이, 컴퓨트 클라우드앳커스터머, 로빙 엣지 디바이스 등 다양한 OCI 환경에 배포할 수 있다. 분산형 클라우드 전반에서 보안, 주권, 규정 준수 요건을 충족하며 AI 스택을 운영할 수 있다. 해당 플랫폼은 OCI 쿠버네티스 엔진을 활용한 그래픽처리장치(GPU) 인스턴스 기반으로 제공된다. OCI AI 블루프린트를 통해 GPU 온보딩 시간을 단축하고 노코드 기반 AI 워크로드 배포를 지원한다. 고객은 AI 인프라에 대한 직접 설정 없이도 필요한 스택과 리소스를 빠르게 구성할 수 있다. 오라클 카란 바타 OCI 담당 수석 부사장은 "OCI에서 엔비디아 AI 엔터프라이즈를 활용하면 분산형 클라우드의 유연성과 최신 AI 인프라의 장점을 모두 누릴 수 있다"며 "고객은 소버린 AI를 구현하며 운영·보안 통제력을 강화할 수 있다"고 말했다. 엔비디아 저스틴 보이타노 부사장은 "이번 협력은 다양한 리전에서 생성형, 에이전틱, 물리적 AI 개발과 배포를 가속화할 수 있는 환경을 제공한다"고 밝혔다.

2025.03.27 15:29김미정

알테어, '알테어원'에 엔비디아 옴니버스 통합…"실시간 3D 설계 구현"

알테어가 자사 클라우드 플랫폼에 엔비디아의 디지털 트윈 기술을 통합해 인공지능(AI) 시뮬레이션 성능을 확장했다. 알테어는 엔비디아의 옴니버스 블루프린트를 '알테어원'에 통합했다고 27일 밝혔다. 옴니버스 블루프린트는 엔비디아가 개발한 실시간 디지털 트윈 구축을 위한 참조 워크플로다. 이번 통합으로 사용자는 복잡한 시뮬레이션과 디지털 트윈을 실시간 시각화·구축할 수 있다. 별도의 설정 없이 다양한 사용자와 협업할 수도 있다. 사용자는 알테어원 내에서 옴니버스 블루프린트를 즉시 활용할 수 있다. 구축한 디지털 트윈은 클라우드와 온프레미스 환경서 배포할 수 있다. 알테어원은 메타데이터, 설계 데이터 등을 관리하는 솔루션이다. 알테어의 AI 해석 솔루션인 '알테어 피직스AI'를 함께 활용하면 며칠씩 걸리던 물리 해석 작업을 수초 내지는 수분 내로 단축할 수 있다. 또 사용자는 디지털 트윈 환경에서 여러 사용자와 동시에 설계를 진행하고 가상 환경에서 실시간으로 시뮬레이션을 수행할 수 있다. 특히 3D 설계, AI, 레이 트레이싱 기술이 결합된 몰입형 업무 환경을 경험할 수 있다. 클라우드 기반 고품질 렌더링과 스트리밍 기능을 통해 복잡한 시스템 통합도 간소화된다. 이번 통합은 충돌·낙하 테스트 등 고난도 해석 작업에서도 시뮬레이션 속도와 협업 효율을 높일 수 있다. 이번 협업은 엔비디아의 그래픽처리장치(GPU) 가속, NIM 마이크로서비스, 옴니버스 플랫폼 등 최신 기술 기반으로 추진됐다. 이를 통해 알테어는 시뮬레이션, AI, 데이터 분석, 고성능 컴퓨팅(HPC) 등 자사의 핵심 역량을 단일 플랫폼에 집약해 디지털 엔지니어링의 새로운 표준을 제시할 계획이다. 엔비디아 티모시 코스타 컴퓨터 지원 엔지니어링(CAE) 및 쿠다-X 부문 수석 디렉터는 "디지털 트윈 기술은 산업을 재편하고 있다"며 "엔비디아의 첨단 기술 기반으로 더욱 효율적이고 실질적인 디지털 엔지니어링을 구현할 수 있을 것"이라고 말했다. 알테어 샘 마할링엄 최고기술책임자(CTO)는 "엔비디아의 블랙웰 가속기, AI, 옴니버스 기술을 솔루션에 통합함으로써 고객은 디지털 트윈과 시뮬레이션을 보다 빠르고 직관적으로 운영할 수 있게 됐다"며 "이번 통합은 데이터, AI, 시뮬레이션을 하나의 워크플로로 연결해 디지털 엔지니어링 혁신을 실현하는 중요한 전환점이 될 것"이라고 강조했다.

2025.03.27 15:27김미정

"AI 연산 획기적 향상"…슈퍼마이크로, 엔비디아 블랙웰 울트라 플랫폼 기반 솔루션 공개

슈퍼마이크로가 인공지능(AI) 연산 성능을 향상할 수 있는 차세대 AI 솔루션을 선보인다. 슈퍼마이크로는 엔비디아 블랙웰 울트라 플랫폼을 탑재한 새로운 서버·랙제품군을 공개했다고 27일 밝혔다. 슈퍼마이크로의 새로운 AI 제품군은 엔비디아 'HGX B300 NVL16'와 'GB300 NVL72' 플랫폼을 탑재해 AI 추론, 에이전틱 AI, 비디오 추론 등 고성능 연산 AI 워크로드에서 높은 성능을 제공한다. 엔비디아 블랙웰 울트라 플랫폼은 GPU 메모리 용량과 네트워크 대역폭 제약으로 발생하는 병목현상을 해소하고 대규모 클러스터 환경에서 요구되는 AI 워크로드를 안정적으로 처리할 수 있도록 설계됐다. GPU당 288GB의 HBM3e 고대역폭 메모리가 탑재돼 초대규모 AI 모델의 학습·추론에서 향상된 AI 플롭스(FLOPS)를 구현한다. 또 네트워킹 플랫폼에 엔비디아 퀀텀-X800 인피니밴드와 스펙트럼-X 이더넷을 통합해 최대 800Gb/s의 컴퓨팅 패브릭 대역폭을 제공한다. 슈퍼마이크로와 엔비디아는 이번 공개한 차세대 AI 솔루션을 통해 AI 분야에서의 리더십을 더욱 공고히 한다는 목표다. 찰스 리앙 슈퍼마이크로 최고경영자(CEO)는 "자사의 데이터센터 빌딩 블록 솔루션을 활용해 엔비디아 HGX B300 NVL16 GB300 NVL72의 열 관리 및 내부 토폴로지(topology)에 최적화된 새로운 공냉식·수냉식 냉각 시스템을 구현했다"며 "이 시스템은 수자원을 절약하면서 전력 소비도 최대 40%까지 줄여 엔터프라이즈 데이터센터의 환경적·운영적 측면에서 상당한 이점을 제공한다"고 설명했다. 이어 "자사는 엔비디아와 오랜 파트너십을 지속하며 엔비디아 블랙웰 울트라 플랫폼을 기반으로 한 최신 AI 기술을공개하게 돼 기쁘다"고 덧붙였다.

2025.03.27 12:05한정호

엔비디아 빠질 때 아이온큐 올랐다…양자컴퓨팅 실효성 입증

아이온큐(IONQ)가 앤시스(Ansys)와의 협업을 통해 양자컴퓨팅의 실효성을 입증하며, 기술주 하락세 속에서도 주가 상승을 이끌고 있다. 27일 심플리월스트리트 등 외신에 따르면 아이온큐의 주가가 일주일 만에 13% 상승했다. 엔비디아는 이 기간 5% 하락했다. 아이온큐는 지난주 엔비디아 GTC 2025 퀀텀 데이에서 앤시스 등 파트너사와 협업해 달성한 양자컴퓨팅의 성과를 소개했다. 앤시스의 시뮬레이션 소프트웨어인 LS-DYNA를 아이온큐의 양자컴퓨터 '포르테'에 연결해 실행한 결과 고전적 컴퓨팅 방식보다 최대 12% 빠른 처리 성능을 기록한 것으로 나타났다. 포르테에서 실행한 시뮬레이션은 혈류와 같은 복잡한 유체 상호작용을 분석하는 고난도의 계산이 필요한 작업이었다. 특히 수천만개의 요소를 포함한 대규모 모델을 처리하는 데 성공하며 양자 컴퓨팅이 현실 산업 문제를 해결하는 데 실질적으로 기여할 수 있음을 보여준 사례로 평가받고 있다. 앤시스와의 협업을 통해 양자 컴퓨팅이 의료기기 설계 분야에서도 실질적인 성과를 낼 수 있음을 입증한 아이온큐는 향후 자동차 안전성 설계, 물류 및 공급망 최적화, 생산 스케줄링, 포트폴리오 최적화 등 다양한 산업 분야로의 적용을 본격화할 방침이다. 지난 2월에는 미국 국방 IT 전문기업 제너럴 다이나믹 인포메이션 테크놀로지(GDIT)와 협약을 맺고 양자 컴퓨팅을 활용한 국방 및 정부용 응용 기술을 공동 개발하기로 했다. 이와 함께 미국 공군 연구소에 양자 네트워킹 시스템을 납품하고, 아부다비의 양자연구센터)와 기존 협약을 갱신하는 등 글로벌 차원에서의 고객 신뢰도와 기술적 신뢰성을 동시에 확보하고 있다. 또한 지난해 12월에는 기업 고객을 위한 양자 운영체제인 '아이온 퀀텀 OS' 출시하며 제품 포트폴리오를 확장했다. 이 플랫폼은 양자 컴퓨팅의 실제 활용성을 높이고, 엔터프라이즈 시장을 겨냥한 기술적 기반을 강화에 나섰다. 니콜로 드 마시 아이온큐 최고경영자(CEO)는 "이번 실증은 양자 컴퓨팅이 실제 산업 문제에서 고전적 접근 방식을 능가하는 첫 사례 중 하나"라며 "앞으로 하드웨어가 발전함에 따라 이 기술의 파급력은 더욱 확대될 것"이라며 이번 성과의 상징성을 강조했다.

2025.03.27 10:48남혁우

  Prev 1 2 3 4 5 6 7 8 9 10 Next  

지금 뜨는 기사

이시각 헤드라인

LG전자, 2분기 영업이익 반토막...美 트럼프 관세 영향

"韓 판매자 수수료 4%"...알리바바닷컴, 중소기업 수출 더 세게 돕는다

정부 요청에…유통업계, 라면·빵·커피 등 ‘최대 반값 할인’

LG엔솔, IRA 세액공제 없이 흑자 달성…저점 통과 기대↑

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.