• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
스테이블코인
배터리
AI의 눈
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'DPU'통합검색 결과 입니다. (5건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

엔비디아, AI 추론 병목현상 줄이는 스토리지 플랫폼 공개

[라스베이거스(미국)=권봉석 기자] 엔비디아가 5일(이하 현지시간) 오후 라스베이거스 퐁텐블로 시어터에서 진행한 기조연설에서 AI 추론 병목현상을 줄일 수 있는 새로운 스토리지 플랫폼을 공개했다. AI 모델이 다루는 매개변수(패러미터)는 수십 억 개 수준에서 수 조개까지 확장되고 다단계 추론을 통해 정밀도를 높이고 있다. 또 추론 과정에서 오류를 줄이기 위한 컨텍스트 데이터가 성능과 효율을 좌우하는 핵심 요소로 꼽힌다. 기존에는 추론을 실행하는 GPU와 연결된 메모리에 컨텍스트 데이터를 키밸류(KV, 핵심값) 캐시 형태로 담아 활용했다. 그러나 컨텍스트 데이터 용량이 커지면서 이를 GPU 메모리에 담아 두는 것은 비용과 확장성, 효율성 면에서 문제가 있었다. 엔비디아는 이날 데이터센터 내 GPU 사이의 데이터 이동을 효율적으로 관리하는 블루필드4 데이터처리장치(DPU)를 활용한 '추론 컨텍스트 메모리 스토리지 플랫폼'을 제안했다. 이 플랫폼은 GPU 메모리 대신 키밸류 캐시를 담아 둘 수 있는 전용 인프라를 제공해 랙 스케일 AI 시스템 전반에서 컨텍스트 데이터를 효율적으로 활용할 수 있도록 설계됐다. 이를 통해 초당 토큰 처리량을 최대 5배까지 끌어올리고, 기존 스토리지 대비 전력 효율 역시 최대 5배 높아진다는 것이 엔비디아 설명이다. 블루필드4는 엔비디아 DOCA 프레임워크를 기반으로 NIXL 라이브러리, 다이나모(Dynamo) 소프트웨어와 긴밀히 통합돼 하드웨어 가속 키밸류 캐시 공유를 구현한다. DPU가 KV 캐시의 배치와 접근을 직접 관리함으로써 메타데이터 오버헤드를 제거하고, 데이터 이동을 최소화하며, GPU 노드와 분리된 보안 접근을 보장한다. 여기에 스펙트럼-X 이더넷을 활용한 RDMA 기반 네트워크 패브릭을 결합해 AI 노드 간 고대역폭 컨텍스트 공유를 지원한다. 이를 통해 AI 에이전트 반응성 개선, AI 팩토리 처리량(스루풋) 증가, 추론 효율 향상 등을 거둘 수 있다. 엔비디아는 DPU를 중심으로 AI 인프라 전반을 통합하며, 데이터센터 아키텍처의 주도권 강화에 나설 예정이다. 이날 젠슨 황 엔비디아 CEO는 "AI는 이제 컴퓨팅과 네트워크를 넘어 스토리지까지 재정의하고 있다"며 "블루필드4를 중심으로 한 스토리지 스택은 차세대 지능형 AI를 구현하기 위한 핵심 인프라가 될 것"이라고 말했다. 델테크놀로지스, HPE, IBM, 퓨어스토리지 등 엔비디아 주요 파트너사는 블루필드4 기반 AI 스토리지 플랫폼을 구현해 올 하반기 출시 예정이다.

2026.01.06 12:37권봉석

하이퍼엑셀-망고부스트, 차세대 AI 인프라 고도화 MOU

AI반도체 스타트업 하이퍼엑셀(HyperAccel)은 망고부스트(MangoBoost)와 차세대 AI 인프라 고도화를 위한 기술 및·사업 협력을 목적으로 업무협약(MOU)을 체결했다고 23일 밝혔다. 이번 협약은 AI 워크로드 증가로 복잡해지는 데이터센터 환경에 대응하기 위한 것으로, 양사는 지속가능한 데이터센터 구현과 AI 인프라 성능 및 운영 효율 개선을 공동 목표로 설정하고 기술 교류와 공동 검증을 중심으로 단계적인 협력 체계를 구축할 계획이다. 하이퍼엑셀은 LLM(거대언어모델) 추론에 특화된 고효율 AI 반도체 LPU(LLM Processing Unit)와 소프트웨어 스택을 기반으로 차세대 AI 가속 인프라를 개발하고 있으며, 망고부스트는 DPU 기반 네트워크 및 시스템 최적화 기술을 통해 AI 인프라의 효율을 높이는 솔루션을 보유하고 있다. 양사의 기술 역량을 결합해 AI 인프라 전반에서 실질적인 운영 개선 효과를 제공하는 것을 목표로 한다. 하이퍼엑셀 김주영 대표이사는 “AI 인프라의 확산과 함께 데이터센터의 성능, 효율, 지속가능성은 더 이상 선택이 아닌 필수 과제가 됐다”며 “망고부스트와의 협력을 통해 AI 반도체부터 데이터센터 운영까지 아우르는 실질적인 기술·사업 성과를 만들어갈 것”이라고 밝혔다. 망고부스트 김장우 대표이사는 “이번 협약은 AI에 최적화된 차세대 데이터센터 인프라를 구현하기 위한 중요한 출발점”이라며 “양사의 기술 역량을 결합해 고객에게 더 높은 성능과 효율, 그리고 지속가능한 데이터센터 환경을 제공하겠다”고 말했다. 양사는 향후 국내외 AI 및 데이터센터 시장을 대상으로 협력을 단계적으로 확대할 계획이다.

2025.12.23 14:09전화평

[AI는 지금] 초거대 AI 네트워크 전쟁…GPU 넘어 '연결'에 답 있다

거대 인공지능(AI) 모델의 발전이 데이터센터의 숨은 약점인 '네트워크'의 한계를 드러내고 있다. 그래픽처리장치(GPU) 성능 경쟁을 넘어 방대한 데이터를 효율적으로 처리하고 연결하는 기술이 AI 시대의 새로운 승부처로 떠올랐다. 19일 업계에 따르면 지난 20년간 GPU 등 AI 연산 장치의 성능은 6만 배 이상 향상됐지만 이들을 잇는 네트워크 기술 발전은 30배 수준에 그쳤다. AI 모델의 파라미터가 조 단위로 커지면서 소프트웨어의 요구 수준은 급격히 높아졌지만 이를 뒷받침할 하드웨어 인프라가 따라가지 못하는 '성능 불균형'이 심화된 탓이다. 이러한 병목 현상은 AI 시스템 전체의 효율 저하로 이어진다. 과거 데이터센터는 중앙처리장치(CPU)가 애플리케이션 구동 외에 가상화, 네트워킹, 스토리지, 보안 등 온갖 부가 작업을 떠안아왔다. 특정 연산에 특화되지 않은 CPU에 과부하가 걸리면서 데이터 처리의 비효율이 발생했다. AI 병목 해결사 'DPU'…엔비디아 독주 속 경쟁 본격화 이 문제를 해결할 대안으로 데이터처리장치(DPU)가 주목받고 있다. DPU는 CPU를 대신해 데이터센터 운영에 필요한 각종 입출력(I/O) 작업을 오프로드(Offload)하고 가속하는 특화 반도체다. 이를 통해 CPU는 본연의 연산에 집중하고 데이터센터는 ▲성능 향상 ▲운영 비용 절감 ▲비용 효율적 확장이라는 세 마리 토끼를 잡을 수 있다. 다만 DPU 시장은 현재 특정 기업의 기술 종속이라는 그림자에 갇혀 있다. AI 인프라 시장의 절대 강자인 엔비디아가 자사의 독자 규격 '인피니밴드(InfiniBand)'를 기반으로 GPU와 DPU를 함께 공급하며 폐쇄적인 생태계를 구축했기 때문이다. 이로 인해 고객사들은 다른 업체의 장비를 쓸 때 호환성 문제에 부딪혀 결국 엔비디아에 락인 된 상태다. 엔비디아의 독주 체제에 균열을 내려는 시도는 세계 곳곳에서 일어나고 있는 상황이다. AMD는 지난 2022년 DPU 스타트업 '펜산도'를 약 인수하며 추격에 나섰고 인텔 역시 '마운트 에반스'와 같은 인프라처리장치(IPU)로 경쟁에 뛰어들었다. 최근에는 중국이 정부와 빅테크의 지원에 힘입어 DPU 스타트업의 새로운 산실로 떠오르는 추세다. 중커위수(Yusur Tech), 윈바오즈넝(Jaguar Microsystems) 등 수많은 현지 기업들이 엔비디아의 아성에 도전하고 있다. 이러한 글로벌 격전지 속에서 국내에서는 망고부스트가 사실상 유일하게 이들과 어깨를 나란히 하는 플레이어로 평가받는다. 망고부스트, SW·HW '풀스택' 역량…'엠엘퍼프 1위'로 기술력 입증 지난 2022년 김장우 서울대 교수가 10년간의 연구 결과를 바탕으로 창업한 망고부스트는 개방형 표준 기술인 '이더넷' 기반의 DPU 솔루션으로 시장을 공략한다. 엔비디아의 폐쇄 생태계와 달리 망고부스트의 DPU는 이더넷을 지원하는 모든 장비와 호환돼 다양한 업체의 GPU나 신경망 처리장치(NPU)를 자유롭게 활용할 수 있는 점이 특징이다. 이 회사는 하드웨어와 소프트웨어를 모두 아우르는 '풀스택' 역량을 강점으로 내세운다. 주요 제품으로는 ▲DPU 카드인 'GPU부스트'와 '스토리지부스트' ▲DPU 칩렛·IP ▲AI 시스템 소프트웨어 'LLM부스트' 등이 있다. 망고부스트의 기술력은 객관적인 성능 지표로도 입증됐다. AI 추론 성능을 측정하는 '엠엘퍼프(MLPerf) 인퍼런스 5.0' 벤치마크에서 AMD 인스팅트 '엠아이300엑스(MI300X)' GPU 4개 노드를 활용해 '라마2 70B' 모델 기준 역대 최고 처리량을 기록했다. 이는 망고부스트의 소프트웨어가 멀티노드 환경에서 선형적인 성능 확장을 이끌어낸 결과다. 스토리지 성능을 비교하는 '엠엘퍼프 스토리지 1.0'에서도 경쟁사인 뉴타닉스, 해머스페이스 등을 압도하며 1위를 차지했다. 망고부스트는 더 적은 수의 스토리지 노드를 사용하고도 더 많은 GPU를 효율적으로 지원하며 높은 성능을 보였다. 창업 2년 만에 4천억원의 기업가치를 인정받은 망고부스트는 글로벌 빅테크와의 협력도 가속하고 있다. 칩 단에서는 프로그래머블 반도체(FPGA) 제조사인 AMD, 인텔과 협력하고 서버 단에서는 삼성전자, 슈퍼마이크로 등과 공동 마케팅을 진행 중이다. 미국 경제 전문지 포브스는 망고부스트의 성과를 두고 "엔비디아가 AI 분야에서 모든 주목을 받는 동안 AMD는 파트너인 망고부스트가 엠엘퍼프에 최초로 멀티노드 제출을 하는 등 업계 지원을 유치하며 진전을 이루고 있다"고 평가했다.

2025.07.20 09:59조이환

망고부스트-AIC, 차세대 컴퓨팅 기술 '맞손'…"스토리지 판 바뀐다"

망고부스트와 AIC가 고성능 컴퓨팅 기술 개발을 위해 손잡고 데이터 처리 장치(DPU) 시스템 경쟁력 강화에 나선다. AIC는 지난 9일 대만 타이베이에서 열린 '컴퓨텍스 2025' 현장에서 망고부스트와 MOU를 맺고 DPU 기반 시스템 공동 개발에 협력하기로 했다고 15일 밝혔다. 이번 계약은 양사의 기술적 시너지를 극대화하는 데 초점이 맞춰졌다. AIC는 고밀도 서버와 스토리지 설계·제조 역량을 갖춘 글로벌 하드웨어 기업이다. 이번 협력에서는 AIC가 가진 하드웨어 아키텍처 및 시장 채널이 활용된다. 여기에 망고부스트가 보유한 DPU 기반 풀스택 솔루션이 결합돼 새로운 형태의 엔터프라이즈 인프라를 구축할 수 있는 기반이 마련됐다. DPU는 기존 CPU·GPU 기반 인프라가 처리하지 못했던 데이터 병목 문제를 해결할 수 있는 대안으로 주목받고 있다. 데이터 이동과 처리, 보안 기능을 하드웨어 수준에서 분리해 처리함으로써 전체 시스템의 효율성과 확장성을 동시에 높일 수 있는 구조다. 망고부스트는 범용 그래픽 처리장치(GPU)와 다양한 가속기·스토리지 장치와의 호환성을 전제로 한 DPU 시스템을 개발해 온 국내 스타트업이다. DPU를 단순 부속이 아닌 시스템 중심 기술로 확장하려는 시도를 지속해왔다. 이 회사는 지난 2022년 설립 이후 미국, 캐나다, 한국을 중심으로 빠르게 사업을 확장해왔다. 약 10년에 걸친 선행연구를 바탕으로 DPU 아키텍처 내재화를 진행해 왔다. 이번 AIC와의 협력은 기술력을 외부 생태계와 본격 연결하는 첫 단계로 해석된다. 이번 계약은 단순 기술 통합에 그치지 않고 공동 기술 개발 이후의 시장 확장까지 염두에 두고 있다. AIC의 글로벌 지사망을 통해 망고부스트는 미국·한국·유럽 시장을 비롯한 신규 파트너십 기회를 확보할 수 있을 것으로 전망된다. 망고부스트 김장우 대표는 "이번 협력은 더 지능적이고 효율적인 컴퓨팅 플랫폼을 시장에 제공하고자 하는 우리의 미션을 실현하는 중요한 계기가 될 것"이라며 "DPU 기술의 가능성을 AIC와 함께 글로벌 시장에서 확대해 나갈 수 있기를 기대한다"고 밝혔다. 데이비드 황 AIC 세일즈 및 마케팅 부사장은 "망고부스트와의 협력을 통해 서버 및 스토리지 기술의 한계를 넘어 새로운 고성능 솔루션을 창출할 수 있을 것"이라며 "급변하는 시장의 요구에 부응하는 혁신적 제품을 함께 선보이겠다"고 말했다.

2025.06.15 09:57조이환

망고부스트, AMD 기반 멀티노드 AI 학습 첫 성공…'라마2 70B' 11분 만에 완료

망고부스트가 AMD의 고성능 GPU 32개를 활용해 초대형 AI 모델을 약 11분 만에 학습하는 데 성공했다. 복잡한 하드웨어와 소프트웨어를 하나로 최적화해, 특정 장비에 의존하지 않고도 빠르고 효율적인 AI 학습이 가능하다는 점을 입증했다. 망고부스트는 메타 '라마2 70B 로라' 모델을 10.91분 만에 학습하는 데 성공했다고 5일 밝혔다. 이번 결과는 ML퍼프 기준으로 최초의 AMD 그래픽처리장치(GPU) 기반 멀티노드 학습 성과다. GPU 간 통신 병목을 제거하면서도 성능 저하 없이 학습 시간을 대폭 단축한 사례다. 측정은 국제 AI 벤치마크인 'ML퍼프 트레이닝 5.0(MLPerf Training v5.0)'에서 AMD '인스팅트 MI300X' 그래픽처리장치 32개를 활용했다. 특히 이번 학습에는 일부 파라미터만 미세조정하는 로라 방식이 적용돼 거대 모델에 대해 짧은 시간 안에 고효율 파인튜닝이 가능함을 입증했다. 망고부스트는 온프레미스와 클라우드 환경을 모두 지원하는 유연한 구조를 갖춰 특정 벤더나 하드웨어 환경에 얽매이지 않고 확장 가능한 학습 인프라를 구현하고 있다. 망고부스트는 자체 개발한 '망고 LLM부스트' 소프트웨어와 '망고 GPU부스트 RDMA' 통신 솔루션을 통해 모델 병렬화와 자동 튜닝, 배치 최적화, 메모리 조정 등을 통합 제공하는 시스템을 구현했다. 'LLM부스트'는 다양한 대규모 언어모델을 안정적으로 운영할 수 있도록 설계됐다. 'GPU부스트 RDMA'는 수천 개 큐피 환경에서도 성능 저하 없이 통신을 유지할 수 있도록 설계돼 있다. ML퍼프 제출 기준으로는 노드 1개에서 2개, 4개로 구성된 멀티노드 환경 모두에서 95~100% 수준의 선형적 성능 확장성을 달성했다. 통신 병목을 해소한 원격 직접 메모리 접근(RDMA) 기반 구조와 GPU 최적화 소프트웨어가 병렬 학습 효율을 실질적으로 끌어올린 것으로 해석된다. 이번 학습 결과는 AMD 라데온 오픈 컴퓨트(ROCm) 소프트웨어 스택과의 통합을 기반으로 한다. 망고부스트는 이 환경에 맞춰 'LLM부스트'의 연산, 메모리, 네트워크 제어 구조를 최적화했고 'MI300X'의 메모리 대역폭과 성능을 극대화하는 데 초점을 맞췄다. 망고부스트는 이번 벤치마크 외에도 '라마2 7B', '라마3.1 8B' 모델에 대한 내부 학습 벤치마크를 통해 유사한 성능을 확보해온 것으로 알려졌다. 이 성능은 실제 온프레미스나 클라우드 환경 모두에서 재현 가능하며 일반화된 학습 효율을 보장한다는 점에서 상용화 가능성도 입증된 상태다. ML퍼프와 ML커먼스의 창립자인 데이비드 캔터는 "망고부스트의 첫 ML퍼프 트레이닝 결과는 매우 인상적"이라며 "'MI300X' 단일 노드부터 4노드까지의 확장된 학습 성능은 현대 AI 가속기의 성능을 온전히 활용하려면 소프트웨어 스택의 최적화가 얼마나 중요한지를 다시 입증한 사례"라고 밝혔다. 김장우 망고부스트 대표는 "이번 ML퍼프 벤치마크에서 우리는 소프트웨어와 하드웨어의 통합 최적화를 통해 벤더 종속 없이도 대규모 LLM 학습을 효율적으로 수행할 수 있는 해답을 제시했다"며 "이번 결과는 우리 기술이 실제 데이터센터 운영 환경에서 충분히 확장 가능하다는 점을 보여주는 이정표"라고 밝혔다.

2025.06.05 16:40조이환

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

"규제 사정권 밖이라지만"…AI 기본법 첫날, 책임 경계에 업계 '촉각'

'어쩔수가 없는' 자동화…사람 사라진 풀무원 공장 가보니

BTS 컴백 공연 광화문서 열린다...서울시, 조건부 허가

'AI기본법' 세계 첫 시행…KOSA, 정책 역할 확대로 존재감 ↑

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.