• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
  • AI의 눈
AI의 눈
HR컨퍼런스
디지털트러스트
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'화웨이 어센드'통합검색 결과 입니다. (3건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

[AI는 지금] 엔비디아, GPU 시장서 86% 독주 가능한 까닭은

인공지능(AI) 인프라 경쟁의 승패가 반도체 성능보다 이를 뒷받침하는 소프트웨어(SW) 생태계에서 갈리고 있는 것으로 나타났다. 엔비디아의 독주 역시 그래픽처리장치(GPU) 하드웨어 우위만이 아니라 20년 가까이 축적한 쿠다(CUDA) 중심 SW 스택이 만든 구조적 진입장벽의 결과라는 분석이 나왔다. 11일 소프트웨어정책연구소(SPRi)가 발간한 'AI 인프라 경쟁에서 소프트웨어의 구조적 역할' 보고서에 따르면 올해 전 세계 AI 지출은 2조5000억 달러에 이를 전망이다. 이 가운데 절반 이상은 서버·가속기·데이터센터 등 인프라에 집중될 것으로 예상된다. 특히 데이터센터 GPU 시장에서 엔비디아는 약 86%의 매출 점유율을 확보하며 압도적 우위를 유지하고 있다. 보고서는 이 같은 지배력이 단순한 칩 성능만으로 설명되지 않는다고 짚었다. 동일한 H100 GPU를 사용하더라도 컴파일러, 가속 라이브러리, 드라이버 최적화 수준에 따라 실제 처리량이 3배 이상 벌어질 수 있어서다. AI 인프라의 본질적 경쟁력은 '칩 위에서 얼마나 효율적으로 연산을 구현하느냐'에 달려 있다는 의미다. 연구진은 AI 인프라를 개발 프레임워크, 컴파일러, 가속 라이브러리, 드라이버·런타임, 하드웨어의 5계층으로 구분했다. ▲개발자가 AI 모델을 설계할 때 사용하는 '파이토치'나 '잭스(JAX)' 같은 개발 도구부터 ▲이를 각 반도체에 맞는 실행 코드로 바꿔주는 '엑스엘에이(XLA)', '티브이엠(TVM)', '텐서알티(TensorRT)' 기반 컴파일러 ▲연산 속도를 끌어올리는 '쿠디엔엔(cuDNN)', '큐블라스(cuBLAS)' 등 가속 소프트웨어 ▲최하단 드라이버에 이르기까지 전 계층이 특정 하드웨어에 맞춰 최적화되며 락인(lock-in) 구조를 형성한다고 분석했다. 특히 보고서는 ▲최적화 비대칭으로 특정 칩으로 수렴하는 '성능 종속' ▲소프트웨어 선택이 곧 하드웨어 경로를 결정하는 '설계 종속' ▲폐쇄형 드라이버 구조가 물리적 대체를 막는 '구조적 종속'의 세 가지 메커니즘을 제시했다. 이미 특정 라이브러리와 '쿠다' 경로에 맞춰 최적화된 대규모 AI 모델 코드를 다른 칩용으로 재작성·검증하는 데 막대한 인력과 시간이 들어 하드웨어 교체 자체가 사실상 시스템 재구축에 가깝다고 봤다. 또 이 세 요소가 중첩될수록 전환 비용은 기하급수적으로 커진다고 설명했다. 주요국 전략도 뚜렷하게 대비됐다. 미국에서 엔비디아는 '쿠다' 생태계를 통해 성능·구조적 종속을 동시에 구축했고, 구글은 TPU(텐서 처리장치·대규모 AI 학습에 특화한 자체 반도체), 엑스엘에이(XLA), 잭스를 수직 통합해 별도의 설계 종속 경로를 구축했다. 중국 화웨이 역시 자사 AI 칩 '어센드(Ascend)'와 전용 소프트웨어 플랫폼 '칸(CANN)', AI 개발 프레임워크 '마인드스포어(MindSpore)'를 하나로 묶은 체계를 통해 자국 내 유사 생태계를 내재화하고 있는 것으로 평가됐다. 국내 신경망처리장치(NPU) 업계에는 기회와 과제가 동시에 제시됐다. 보고서는 한국 NPU 생태계가 파이토치 네이티브 지원과 가상거대언어모델(vLLM) 연동을 통해 프레임워크 진입에는 성공했지만, 컴파일러·라이브러리 계층의 성능 격차와 운영 레퍼런스 부족이 시장 확산의 걸림돌이라고 진단했다. 국내 AI 반도체 기업들 역시 전용 컴파일러 고도화와 거대언어모델(LLM) 추론 소프트웨어 최적화에 역량을 집중하며 쿠다 의존도를 낮추는 데 공을 들이고 있다. 업계에선 단순 칩 가격 경쟁력보다 전력 효율, 소프트웨어 유지보수, 개발 인력 재교육 비용을 모두 합친 총소유비용(TCO) 관점에서 엔비디아 대비 우위를 입증해야 실제 클라우드 사업자와 대기업 도입으로 이어질 수 있다고 보고 있다. 보고서 역시 TCO 기반 평가체계 도입을 핵심 정책 과제로 제시했다. 이에 연구진은 칩 설계 중심 지원에서 벗어나 컴파일러·런타임·소프트웨어개발키트(SDK)를 포함한 풀스택 SW 육성으로 정책 패러다임을 전환해야 한다고 제언했다. 특히 쿠다 의존도를 낮추기 위한 오픈엑스엘에이(OpenXLA)·엠엘아이알(MLIR) 등 글로벌 오픈소스 표준 프로젝트 참여 확대와 공공 AI 데이터센터 기반 실증 환경 조성이 시급한 과제로 제시됐다. 최근 유엑스엘 재단(UXL Foundation)처럼 특정 가속기 벤더에 종속되지 않는 멀티벤더 표준 생태계가 확산하는 만큼, 국내 기업들도 글로벌 소프트웨어 표준 경쟁에 선제적으로 합류해야 한다고 분석했다. 보고서는 "K-NPU 확산의 병목은 칩 자체보다 소프트웨어 최적화와 운영 생태계 규모에 있다"며 "공공 AI 데이터센터를 활용한 대규모 실증과 글로벌 오픈소스 표준 참여를 통해 성능 격차와 레퍼런스 부족의 악순환을 끊어야 한다"고 말했다.

2026.04.11 13:11장유미 기자

화웨이코리아 "어센드 950 내년 한국 출시 희망"

중국 빅테크 기업 화웨이가 내년 한국에 최신 인공지능(AI) 반도체 '어센드(Ascend) 950'을 출시할 것으로 관측된다. 해당 칩에는 화웨이가 자체 개발한 고대역폭 메모리(HBM)가 탑재될 가능성이 제기되며, 국내 AI 반도체 시장의 경쟁 구도에도 변화가 예상된다. 빌리안 왕 한국화웨이 대표는 26일 서울 중구 더플라자호텔에서 열린 '화웨이 데이 2025' 기자간담회에서 “내년 AI 컴퓨팅 카드와 AI 데이터센터 관련 솔루션을 공식 출시를 희망한다”며 “한국 기업에 엔비디아 외 제2의 선택지를 제공할 것”이라고 말했다. 데이터센터·대규모 AI 학습·추론 겨냥 해당 칩은 '어센드 950'이다. 해당 제품은 데이터센터와 대규모 AI 학습·추론을 겨냥한 차세대 AI 가속기로, 저정밀도 연산과 메모리 대역폭을 대폭 강화한 것이 특징이다. 어센드 950에는 화웨이가 자체 개발한 HBM이 탑재될 것으로 관측된다. 앞서 화웨이는 9월 상하이 엑스포센터에서 열린 '화웨이 커넥트' 포럼에서 어센드 950PR과 950DT를 각각 내년 1분기와 4분기에 출시하겠다고 밝힌 바 있다. 이 가운데 950PR은 자체 개발 HBM을 적용한 모델로 알려졌다. 한국에 공급되는 제품 역시 자체 HBM이 탑재될 가능성이 점쳐지는 이유다. AI 연산 단계별로 다른 HBM 적용 화웨이가 공개한 HBM은 기존 메모리 시장에 공급돼온 제품과는 다른 방식일 것으로 추정된다. 커넥트 행사 자료에 따르면 어센드 950PR에는 'HiBL 1.0', 950DT에는 'HiZQ 2.0'이 각각 탑재된다. HiBL 1.0은 AI 추론 과정 중 입력 데이터를 한꺼번에 처리하는 프리필(prefill) 단계에 최적화된 제품으로, 비용 효율을 중시한 것이 특징이다. 반면 HiZQ 2.0은 추론 결과를 생성하는 단계에 적합한 고대역폭 메모리로 설계됐다. 기존 HBM이 학습과 추론 전 과정을 하나의 고성능 메모리로 처리하는 범용 전략이라면, 화웨이는 AI 연산 단계를 세분화해 용도별로 서로 다른 HBM을 적용하는 방식을 택한 셈이다. 단일 칩 아닌 '클러스터'로 판매 화웨이는 어센드 950을 단일 칩이 아닌 클러스터 단위로 판매할 계획이다. 클러스터는 여러 대의 서버를 하나로 묶어 운용하는 방식으로, 사실상 시스템 전반을 패키지로 공급하는 형태다. 왕 대표는 “칩을 클러스터 단위로 판매할 계획”이라며 “화웨이의 전략은 단순히 AI 카드나 AI 서버를 제공하는 데 그치지 않고 산업 전반의 AI 응용을 가속화하는 데 있다”고 강조했다. 이를 위해 네트워크와 스토리지 등 인프라 하드웨어는 물론 소프트웨어까지 아우르는 '엔드투엔드(E2E)' 솔루션을 제공해 경쟁력을 확보한다는 구상이다. 왕 대표는 “이 경우 공급·판매를 위한 파트너사가 필요 없을 수도 있다”며 “화웨이가 직접 집적하고 서비스할 수 있도록 전략을 수립하고 있다”고 덧붙였다. 한국화웨이는 현재 잠재적 공급 협력사들과 협의를 진행 중인 것으로 전해졌다. 이와 함께 한국화웨이는 내년 자체 개발 오픈소스 운영체제(OS) '하모니'를 국내 기업에 공급해 생태계 조성에도 나설 계획이다. 왕 대표는 “하모니의 소유권은 더 이상 화웨이에 있지 않고 오픈소스 관련 기관이 운영과 업그레이드를 맡고 있다”며 “스마트폰뿐 아니라 다양한 스마트홈 기기에서도 활용할 수 있다”고 설명했다. 다만 내년 한국 시장에 스마트폰을 출시할 계획은 없다고 선을 그었다.

2025.12.26 13:50전화평 기자

美·中 무역전쟁에 발 묶인 엔비디아 'H20' GPU

미국 도널드 트럼프 2기 행정부가 대 중국 GPU 수출 규제를 한층 강화했다. 전임자인 조 바이든 행정부는 연산 성능이나 대역폭 등 성능을 낮추는 선에서 수출을 허용했지만 트럼프 2기 행정부는 이마저도 무기한 허가하지 않을 방침이다. 엔비디아는 15일(이하 현지시각) 중국 시장용으로 설계된 H20 GPU 수출 제한 조치를 공시하며 "H20의 재고와 구매 약정, 관련 충당금 등으로 최대 55억 달러(약 7조 8천556억원) 추가 비용이 들 것"이라고 밝혔다. 엔비디아 뿐만 아니라 지난 해부터 성능을 제한한 중국 시장용 GPU를 생산하는 AMD에도 유사한 규제가 주어질 가능성이 크다. 한편 이런 규제가 엔비디아의 가장 큰 경쟁자로 꼽히는 중국 화웨이를 키워주는 결과를 낳을 것이라는 관측도 나온다. 엔비디아, 美 정부 규제에 따라 두 차례 GPU 성능 낮춰 미국 정부가 중국 대상으로 AI 가속과 머신러닝, 딥러닝용 GPU 수출 규제에 나선 것은 2022년 10월부터다. 당시 미국 정부는 엔비디아 A100, H100 등 GPU를 포함해 AMD 제품까지 수출 규제 대상에 포함시켰다. 엔비디아는 이들 제품에서 최대 대역폭을 절반인 400GB/s까지 낮춘 A800, H800 GPU를 생산해 공급했다. 그러나 미국 정부가 2023년 10월 규제 범위를 확대하자 성능을 더 낮춘 H20, L20, L2 등 3종을 추가 개발해 이를 작년부터 중국 시장에 공급했다. 이번에 미국 정부가 제동을 건 H20 GPU는 HBM3 메모리 용량을 96GB로 제한하고 메모리 대역폭은 4TB/s, AI 연산 성능은 FP16(부동소수점 16비트) 기준 148 테라플롭스, FP32(부동소수점 32비트) 기준 44 테라플롭스로 제한됐다. H800으로 구현한 LLM '딥시크 R1'이 역린 건드렸나 미국 정부가 H20 GPU의 중국 수출 규제를 강화한 이유는 아직 명확하지 않다. 그러나 지난 1월 중국 AI 스타트업 딥시크(DeepSeek)가 하순 공개한 추론 특화 AI 모델 'R1'이 영향을 미쳤을 것으로 추정된다. 딥시크 R1은 AI 모델 훈련을 위해 메타가 라마(LLaMa) 등 AI 모델 개발에 투입한 비용의 10% 수준인 557만6천달러(약 80억원)를 지출한 것으로 알려져 있다. 또 미국 상무부 수출 통제 기준을 준수하는 H800 GPU를 이용했다. 당시 엔비디아는 "딥시크가 활용한 GPU는 미국 수출 규정을 준수했으며 추론은 상당히 많은 엔비디아 GPU와 고성능 네트워킹이 필요하다. 이와 같은 딥시크의 혁신이 GPU 수요를 더욱 증가시킬 것"이라고 밝혔다. 실제로 미국 CNBC와 대만 공상시보 등 경제 매체에 따르면 딥시크 R1 공개 이후 텐센트, 알리바바, 바이트댄스 등 중국 주요 IT 기업들이 H20 GPU 발주량을 크게 늘렸다. 엔비디아, 중국 내 최대 경쟁사로 화웨이 꼽아 미국 정부는 거대언어모델(LLM) 등에서 중국의 성장 속도를 지연시키기 위해 GPU 수출 규제를 활용하고 있다. 그러나 이런 규제는 오히려 중국 내 엔비디아 최대 경쟁자로 꼽히는 화웨이 성장을 돕는 결과를 낳을 수 있다. 화웨이가 개발한 어센드(Ascend) 910B는 FP16 기준 320 테라플롭스, INT8(정수 8비트) 기준 640 TOPS(1초당 1조 번 연산)급 성능을 갖춰 엔비디아 A100과 비슷한 수준으로 평가된다. 지난 해 공개된 후속 제품인 어센드 910C는 지난 2월 딥시크가 수행한 추론 벤치마크에서 엔비디아 H100의 60%에 달하는 성능을 냈다. 엔비디아도 지난 2월 말 미국 증권거래위원회에 제출한 연간 보고서에서 주요 경쟁자 중 하나로 2년 연속 화웨이를 꼽았다. 칩과 클라우드 서비스, Arm IP 기반 컴퓨터 프로세서와 네트워킹 제품 등 4개 분야에서 화웨이를 주요 경쟁사로 분류했다. 엔비디아 이어 AMD GPU 사업에도 영향 불가피 미국 정부의 수출 규제 확대는 엔비디아 뿐만 아니라 AMD에도 영향을 미칠 가능성이 크다. AMD는 작년 중국 시장을 겨냥해 성능을 제한한 AI GPU 가속기인 인스팅트 MI309를 설계했지만 미국 상무부는 '여전히 성능이 강력하다'는 이유로 수출을 불허했다. 2023년 11월 중국 시장에서는 데스크톱PC용 지포스 RTX 4090 그래픽카드를 분해해 서버용으로 개조하기도 했지만 올해는 이런 시도가 일어나기 힘들다. 엔비디아가 2월부터 중국 시장에 공급중인 지포스 RTX 5090D 그래픽카드에 이미 여러 제약이 가해졌기 때문이다. 지포스 RTX 5090D 그래픽카드는 미국 정부의 규제를 충족하기 위해 AI 연산 성능을 RTX 5090(3,352 TOPS) 대비 29% 가량 줄인 2,375 TOPS 수준으로 낮췄다. 한 PC나 서버에 GPU를 여러 개 꽂아 성능을 높이는 '멀티 GPU' 구성도 불가능하다. 다만 국내 주요 메모리 기업들에게 미칠 악영향은 제한적일 것으로 분석된다. 현재 SK하이닉스는 엔비디아의 AI 가속기에 필요한 HBM(고대역폭메모리)을 대거 공급하고 있으며, 삼성전자 역시 지속적으로 공급망 진입을 시도 중이다.

2025.04.16 14:37권봉석 기자

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

26.2조 전쟁추경 국회 통과...국민 70%에 10만~60만원 지원

메모리 품귀 '장기화' 진입… 韓 팹리스 수급난 고조

이연수 NC AI 대표 "모두가 크리에이터…다른 기업과 협력 원해"

닻 올린 방미통위, 방송 3법 시행령 개정 착수..."현장 안착 추진"

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.