• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
CES2026
스테이블코인
배터리
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'윈도폰 7.1 망고 SDK'통합검색 결과 입니다. (24건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

"AI 인프라 대안 나올까"…망고부스트, 엔비디아 넘은 추론 성과 공개

망고부스트가 업계 표준 성능 테스트에서 인공지능(AI) 추론(inference) 분야의 신기록을 세우며 거대언어모델(LLM) 시대에 대응할 수 있는 새로운 기술적 대안을 제시했다. AI 데이터센터의 성능, 비용 효율성, 개방형 아키텍처를 두루 갖춘 조합으로 가능성을 입증하며 시장의 주목을 받고 있다. 망고부스트는 지난 2일 미국 워싱턴주 벨뷰에서 실시된 ML퍼프 인퍼런스(MLPerf Inference) v5.0 테스트에서 자사의 AI 추론 소프트웨어 '망고 LLM부스트'와 AMD 'MI300X' 그래픽처리장치(GPU) 조합으로 라마2-70B(Llama2-70B) 모델 오프라인 추론 부문에서 가장 높은 성능을 기록했다고 5일 밝혔다. 이번 테스트는 총 32개의 'MI300X' GPU를 4개 서버 노드에 분산한 다중 노드 구성에서 이뤄졌으며 'MI300X' 기반 시스템의 첫 ML퍼프 멀티노드 제출 사례로도 주목된다. 망고부스트는 '라마2-70B' 오프라인 추론 시나리오에서 초당 10만3천182 토큰(TPS)을 처리해 이전 최고였던 8만2천749 TPS 기록을 넘어섰다. 서버 시나리오에서도 9만3천39 TPS를 기록해 엔비디아 'H100' 기반 시스템 성능을 뛰어넘는 성과를 입증했다. 비용 구조 개선 효과도 눈에 띈다. 'MI300X' GPU는 H100 대비 최대 62% 저렴한 가격에 공급되며 '망고 LLM부스트'와의 조합으로 동일 GPU 수 기준 2.8배 더 높은 가격 대비 성능을 기록했다. 일각에서는 이를 고성능 AI 인프라의 비용 구조를 재편할 수 있는 가능성으로 보고 있다. 이 같은 성과는 AMD와의 긴밀한 협업을 통해 라데온 오픈 컴퓨트(ROCm) 소프트웨어 스택을 최적화한 결과다. 망고부스트는 'MI300X'의 성능을 극대화하는 동시에 단일 노드부터 멀티 노드 클러스터까지 유연하게 확장 가능한 AI 추론 솔루션을 구현했다. 클라우드 환경에서도 경쟁 우위가 확인됐다. 망고부스트는 AWS의 'A100' 기반 환경에서 오픈소스 프레임워크 '오라마(Ollama)' 대비 최대 138배 빠른 AI 추론 성능을 보였으며 허깅페이스의 '텍스트 생성 추론(TGI)'와 vLLM을 포함한 주요 프레임워크와 비교해 성능 및 비용 측면에서 모두 우위를 입증했다. 특히 라마3.1-70B, 큐원-32B, 딥시크-R1-디스틸 등 최신 LLM 모델을 대상으로도 성능 저하 없이 일관된 결과를 유지했다. 이는 다양한 워크로드에 대응 가능한 범용 추론 솔루션으로서의 강점을 보여준다. '망고LLM부스트'는 50개 이상의 오픈 거대언어모델(LLM)을 지원하며 도커 기반의 원라인(one-line) 배포 방식, 오픈AI 애플리케이션 프로그램 인터페이스(API) 호환성 등을 제공해 기존 시스템을 유지하면서도 손쉽게 도입 가능하다. 아마존웹서비스(AWS), 애저(Azure), 구글클라우드플랫폼(GCP) 등 주요 퍼블릭 클라우드뿐 아니라 보안 요구가 높은 온프레미스 환경에서도 통합 운용이 용이하다. 기술적 차별성은 자체 개발한 하드웨어 IP에 기반한다. 이 회사의 데이터처리장치(DPU)는 GPU, 스토리지, 네트워크 가속기 간 데이터 흐름을 최적화해 AI 인프라의 성능과 비용 효율을 동시에 높이는 역할을 한다. 관련 기술은 30건 이상의 특허로 보호받고 있으며 국제 컴퓨터 아키텍처 학술대회(ISCA) 등에서 발표된 10여 년간의 연구 성과를 바탕으로 개발됐다. 망고부스트는 현재 미국, 캐나다, 한국 등을 거점으로 빠르게 사업을 확장하고 있으며 6천만 달러(한화 약 810억원) 이상의 투자를 유치한 상태다. 당초에는 고성능 DPU 반도체로 주목받았지만 창업 초기부터 AI 인프라 전반을 아우르는 풀스택 시스템 솔루션 기업으로의 전환을 준비해왔다. 이번 '망고LLM부스트'는 이러한 소프트웨어 역량의 대표적인 결과물이다. 김장우 망고부스트 대표는 "이번 ML퍼프 결과는 글로벌 AI 인프라 시장에서 망고부스트의 기술력이 공식적으로 인정받았다는 의미"라며 "DPU 기반 하드웨어와 LLM 추론 최적화 소프트웨어가 결합된 풀스택 솔루션으로 AI 데이터센터의 성능과 비용 문제를 동시에 해결해 나가겠다"고 말했다.

2025.04.05 13:52조이환

아이폰SE3, 10년 전 노키아폰으로 깜짝 변신

지금으로부터 약 10년 전에 인기를 끌었던 대표적인 윈도폰 '노키아 루미아 1020'이 다시 탄생했다. IT매체 엔가젯은 한 사용자가 애플의 보급형 '아이폰SE 3'를 루미아 1020 케이스에 넣어 '노키애플 루미폰 1020SE'라는 제품을 탄생시켰다고 18일(현지시간) 보도했다. 레딧 사용자 @OceanDepth95028은 둥근 모서리와 홈 버튼이 장착된 아이폰SE 3를 루미아 1020에 넣었다. 그는 아이폰의 LCD 화면을 루미아의 전면 유리에 다시 붙이고 하단의 정전식 버튼을 없앴다. 이후 아이폰 카메라를 루미아폰 뒷면의 카메라 범프 안에 다시 넣었고, 여분의 공간에 안드로이드 스타일로 작동하는 터치ID 센서와 홈 버튼을 넣었다. 또 루미아에 있던 전용 카메라 버튼을 아이폰의 볼륨 키로 매핑해 카메라가 열려 있는 동안 셔터 버튼으로 기능할 수 있도록 바꿨다. 이 기기에서 루미아 1020의 흔적은 외부 셸과 전면 디스플레이 유리 뿐이다. 아이폰SE 3는 A15 바이오닉 칩을 탑재해 최신 앱을 실행할 수 있으며 일상적인 스마트폰 사용에도 문제가 없다. 유일한 단점은 애플페이나 무선 충전 기능을 작동할 수 없다는 점이나 독특한 루미아 1020 디자인 덕분에 눈에 띈다. 2013년 후반 출시된 루미아 1020은 윈도8 스타일의 UI에 카메라 기능이 강화돼 대표적인 윈도폰으로 주목을 받았으나 2014년 단종됐다.

2025.02.19 10:17이정현

마우저, 노르딕 세미컨덕터 'nRF54L15-DK' 개발 키트 공급

마우저 일렉트로닉스는 노르딕 세미컨덕터의 'nRF54L15-DK' 개발 키트를 공급한다고 14일 밝혔다. nRF54L15-DK는 노르딕의 새로운 nRF54L 블루투스 LE 시스템온칩(SoC)을 기반으로 사전 인증을 획득한 단일 보드 평가 및 프로토타이핑 플랫폼이다. 블루투스 LE의 모든 기능과 주요 통신 프로토콜을 지원하는 nRF54L15-DK는 산업용 사물인터넷(IIoT)과 가상현실 및 증강현실(AR/VR), 자산추적, 스마트 홈 제품 및 의료 애플리케이션 등을 비롯해 다양한 무선 애플리케이션에 이상적인 솔루션이다. nRF54L SoC를 탑재한 nRF54L15-DK는 블루투스 LE를 비롯해 블루투스 메시, 스레드, 지그비, 2.4GHz 독자적 프로토콜(최대 4Mbps) 및 매터(Matter)를 지원한다. 매터는 산업 자동화, 소비자 가전, 스마트 농업 등을 위한 다양한 에코시스템의 원활한 통합을 가능하게 하면서, IoT 애플리케이션 개발을 간소화할 수 있도록 상호운용성을 지원하는 IP 기반 연결 프로토콜이다. nRF54L15-DK는 포괄적인 nRF 커넥트 툴 세트와 nRF 커넥트 소프트웨어 개발 키트(SDK)를 통해 지원된다. 개발자는 nRF 커넥트 SDK가 제공하는 다양한 소프트웨어 샘플과 모듈 및 라이브러리를 활용하여 nRF54L15 SoC의 모든 기능을 탐색하고 최적화할 수 있다. 또한 nRF54L15-DK는 8MB의 외부 메모리와 nPM1300 전력 관리 IC(PMIC)를 탑재하고 있으며, 2.4GHz 및 NFC 안테나와 세거(SEGGER)의 J-Link OB 프로그래머·디버거를 비롯해 디버깅, 프로그래밍 및 전원 공급을 위한 USB 연결 등을 지원한다. 이외에도, 전력소모를 측정할 수 있는 핀과 다이렉트 RF 측정을 위한 SWF RF 커넥터도 제공한다.

2025.02.14 14:34장경윤

망고부스트, AI 추론 최적화 소프트웨어 '망고 LLM부스트' 출시

망고부스트는 AI 추론 성능을 향상시키는 시스템 최적화 소프트웨어 '망고 LLM부스트(Mango LLMBoost)'를 공식 출시했다고 16일 밝혔다. 망고 LLM부스트는 시스템 스케줄 조정, 커널 최적화, 독자적인 데이터 프리패칭 기술, 최신 GPU를 최대한 활용한 모델 양자화(Quantization) 기술을 활용한다. 이를 통해 경쟁사 LLM 추론 엔진 대비 최대 12.6배 성능 향상과 92%의 비용 절감을 달성했다. 망고 LLM부스트은 GPU 호환성, 다중 모델 배포 및 관리 기능, 간편한 배포, 오픈 API 호환성이 강점이다. 엔비디아와 AMD의 주요 GPU와 모두 호환되고, Llama, Mixtral, Gemma, Qwen2, Llava, Phi3, Chameleon, MiniCPM, GLM-v4 등 다양한 채팅 및 멀티모달 모델에서 검증됐다. 또 단일 추론 서버에서 자동 리소스 할당을 통한 효율적 배포와 관리를 가능하게 한다. 망고부스트의 웹 서빙 및 스트리밍 API를 포함한 종단 간(End-to-End) 배포 옵션을 제공하며, GPU 및 실행 모델에 따라 최적의 구성을 자동으로 선택한다. OpenAI API를 사용하는 기존 AI 애플리케이션에 손쉽게 통합할 수 있어서 편리하다. 망고부스트 관계자는 "망고 LLM부스트는 경쟁 솔루션 대비 압도적인 성능 향상과 비용 절감 효과를 증명하며, 정식 출시 전부터 강력한 도입 의향을 보인 빅테크 해외 지사에서 도입을 앞두고 있다"고 밝혔다. 김장우 망고부스트 CEO는 "망고 LLM부스트의 출시는 시스템 레벨의 성능과 효율성을 향상시키기 위한 망고부스트의 지속적인 노력을 보여주는 중요한 이정표이다"라며 "당사의 DPU 전문성은 데이터 센터 효율성 개선이라는 사명에 중심 역할을 해왔으며, 망고 LLM부스트는 하드웨어 및 소프트웨어 레이어를 모두 최적화함으로써, AI 추론 워크로드 수행의 성능과 효율성이라는 핵심 과제를 해결한다"고 전했다.

2025.01.16 14:30이나리

  Prev 1 2 Next  

지금 뜨는 기사

이시각 헤드라인

눈앞으로 다가온 '피지컬 AI'…CES 2026이 증명했다

[ZD브리핑] 국가대표 AI 1차 탈락팀 발표 예정...새해 행사·정책 일정 잇따라

[르포] 폭설에 얼어붙는 도시…전기차 보기 힘든 홋카이도 가다

이더리움 창립자 "탈중앙화 스테이블코인, 달러 의존 취약점"

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.