검색 - IT세상을 바꾸는 힘 지디넷코리아

ZDNet 검색 페이지

'화웨이 어센드'통합검색 결과 입니다. (4건)

태그
기간
- 3개월
- 1년
- 1년 이전

재검색

[AI는 지금] 11조 실탄 쥔 中 딥시크, 조직 2배로 키운다

중국 인공지능(AI) 기업 딥시크가 대규모 자금조달을 계기로 조직 확대에 나섰다. 저비용 고성능 모델로 글로벌 AI 시장에 충격을 준 데 이어 자본, 인재, 컴퓨팅 인프라를 묶어 오픈AI·앤트로픽 등 미국 프런티어 AI 기업과의 경쟁 속도를 높이려는 분위기다. 26일 사우스차이나모닝포스트(SCMP), 블룸버그 등 주요 외신에 따르면 딥시크는 최근 위챗 공식 계정을 통해 모든 부서 규모를 최소 2배로 늘리겠다는 채용 계획을 공개했다. 채용 분야는 풀스택 개발과 알고리즘, AI 핵심 시스템 연구개발, 딥러닝 연구, 모델 데이터 전략, 제품 관리, 엔지니어링 등 7개 영역 33개 직무다. 이번 채용에는 서버사이드 개발 엔지니어, 사전학습 데이터 엔지니어, 슈퍼컴퓨팅 클러스터 연구개발 엔지니어 등이 포함됐다. 비영어권 외국어, 의료, 법률 등 전문 영역 데이터 제품 관리자도 채용 대상에 들어갔다. 이번 딥시크의 인력 확대는 대규모 자금조달과 맞물려 있다. 딥시크는 현재 500억 위안(약 11조원) 규모 투자 유치를 추진 중이다. 기업가치는 3500억~4000억 위안 수준으로 거론된다. 투자 구조도 주목된다. 량원펑 딥시크 창업자 겸 최고경영자(CEO)가 약 200억 위안을 직접 투입하고, 텐센트와 CATL, 넷이즈, JD닷컴, 국가 AI산업 투자기금 등이 참여한 것으로 알려졌다. 다만 외부 투자자는 딥시크 본체가 아니라 량 CEO가 관리하는 유한합자회사에 투자하는 방식이며 의결권도 행사하지 못한다. 자금은 확보하되 창업자 중심 의사결정 구조는 유지하려는 설계로 풀이된다. 업계는 딥시크의 채용 확대를 단순한 인력 충원보다 체급 전환 신호로 보고 있다. 지난해까지 직원 수 200명 미만으로 알려졌던 딥시크가 대규모 자본을 바탕으로 데이터, 모델, 클러스터, 제품화 조직을 동시에 키우고 있어서다. 이는 모델 성능 경쟁을 넘어 AI 인프라 전반을 내부화하려는 전략과도 연결된다. 딥시크는 지난해 저비용 추론 모델을 선보이며 미국 빅테크 중심 AI 경쟁 구도에 균열을 냈다. 이후 중국에선 알리바바, 미니맥스, 지푸AI 등이 잇달아 AI 모델과 서비스를 고도화하고 있다. 글로벌 시장에선 오픈AI와 앤트로픽, 구글 등 프런티어 모델 진영과 중국 오픈웨이트 모델 간 경쟁이 확대되는 추세다. 이 가운데 딥시크의 시장 파급력은 커지고 있다. 딥시크를 비롯한 중국 저비용 AI 모델 확산은 고가 AI 가속기 수요 전망에 대한 논쟁을 키웠다. AI 모델 라우팅 플랫폼 오픈라우터 기준으로 구글, 오픈AI, 앤트로픽 모델에 요청된 토큰 비중은 올해 6월 33%로 낮아진 것으로 전해졌다. 1년 전 72%에서 크게 줄어든 수치다. 딥시크가 화웨이 어센드 칩에 최적화한 모델을 선보인 점도 중국 AI 생태계 내 상징성이 크다. 미국의 첨단 AI 반도체 수출 규제가 이어지는 상황에서 중국 기업들은 자체 칩, 모델, 데이터, 클러스터 운용 역량을 결합하는 방향으로 AI 경쟁력을 키우고 있다. 딥시크의 조직 확대는 이 같은 흐름을 인재 확보전으로 끌어올리는 계기가 될 전망이다. 대규모 자금을 확보한 딥시크가 창업자 지배권을 유지한 채 기술·엔지니어링 인력을 끌어모으면서 중국 AI 경쟁축은 모델 개발에서 자본, 인프라, 데이터, 제품화를 결합한 생태계 경쟁으로 이동하고 있다. 블룸버그는 "딥시크의 이번 채용 발표는 중국 스타트업 사상 최대 규모 중 하나로 꼽히는 자금조달이 막바지에 이른 가운데 나왔다"며 "이번 자금조달은 딥시크가 글로벌 시장에서 AI 서비스를 더 공격적으로 마케팅할 수 있는 기반이 될 것"이라고 밝혔다.

2026.06.26 12:11장유미 기자

[AI는 지금] 엔비디아, GPU 시장서 86% 독주 가능한 까닭은

인공지능(AI) 인프라 경쟁의 승패가 반도체 성능보다 이를 뒷받침하는 소프트웨어(SW) 생태계에서 갈리고 있는 것으로 나타났다. 엔비디아의 독주 역시 그래픽처리장치(GPU) 하드웨어 우위만이 아니라 20년 가까이 축적한 쿠다(CUDA) 중심 SW 스택이 만든 구조적 진입장벽의 결과라는 분석이 나왔다. 11일 소프트웨어정책연구소(SPRi)가 발간한 'AI 인프라 경쟁에서 소프트웨어의 구조적 역할' 보고서에 따르면 올해 전 세계 AI 지출은 2조5000억 달러에 이를 전망이다. 이 가운데 절반 이상은 서버·가속기·데이터센터 등 인프라에 집중될 것으로 예상된다. 특히 데이터센터 GPU 시장에서 엔비디아는 약 86%의 매출 점유율을 확보하며 압도적 우위를 유지하고 있다. 보고서는 이 같은 지배력이 단순한 칩 성능만으로 설명되지 않는다고 짚었다. 동일한 H100 GPU를 사용하더라도 컴파일러, 가속 라이브러리, 드라이버 최적화 수준에 따라 실제 처리량이 3배 이상 벌어질 수 있어서다. AI 인프라의 본질적 경쟁력은 '칩 위에서 얼마나 효율적으로 연산을 구현하느냐'에 달려 있다는 의미다. 연구진은 AI 인프라를 개발 프레임워크, 컴파일러, 가속 라이브러리, 드라이버·런타임, 하드웨어의 5계층으로 구분했다. ▲개발자가 AI 모델을 설계할 때 사용하는 '파이토치'나 '잭스(JAX)' 같은 개발 도구부터 ▲이를 각 반도체에 맞는 실행 코드로 바꿔주는 '엑스엘에이(XLA)', '티브이엠(TVM)', '텐서알티(TensorRT)' 기반 컴파일러 ▲연산 속도를 끌어올리는 '쿠디엔엔(cuDNN)', '큐블라스(cuBLAS)' 등 가속 소프트웨어 ▲최하단 드라이버에 이르기까지 전 계층이 특정 하드웨어에 맞춰 최적화되며 락인(lock-in) 구조를 형성한다고 분석했다. 특히 보고서는 ▲최적화 비대칭으로 특정 칩으로 수렴하는 '성능 종속' ▲소프트웨어 선택이 곧 하드웨어 경로를 결정하는 '설계 종속' ▲폐쇄형 드라이버 구조가 물리적 대체를 막는 '구조적 종속'의 세 가지 메커니즘을 제시했다. 이미 특정 라이브러리와 '쿠다' 경로에 맞춰 최적화된 대규모 AI 모델 코드를 다른 칩용으로 재작성·검증하는 데 막대한 인력과 시간이 들어 하드웨어 교체 자체가 사실상 시스템 재구축에 가깝다고 봤다. 또 이 세 요소가 중첩될수록 전환 비용은 기하급수적으로 커진다고 설명했다. 주요국 전략도 뚜렷하게 대비됐다. 미국에서 엔비디아는 '쿠다' 생태계를 통해 성능·구조적 종속을 동시에 구축했고, 구글은 TPU(텐서 처리장치·대규모 AI 학습에 특화한 자체 반도체), 엑스엘에이(XLA), 잭스를 수직 통합해 별도의 설계 종속 경로를 구축했다. 중국 화웨이 역시 자사 AI 칩 '어센드(Ascend)'와 전용 소프트웨어 플랫폼 '칸(CANN)', AI 개발 프레임워크 '마인드스포어(MindSpore)'를 하나로 묶은 체계를 통해 자국 내 유사 생태계를 내재화하고 있는 것으로 평가됐다. 국내 신경망처리장치(NPU) 업계에는 기회와 과제가 동시에 제시됐다. 보고서는 한국 NPU 생태계가 파이토치 네이티브 지원과 가상거대언어모델(vLLM) 연동을 통해 프레임워크 진입에는 성공했지만, 컴파일러·라이브러리 계층의 성능 격차와 운영 레퍼런스 부족이 시장 확산의 걸림돌이라고 진단했다. 국내 AI 반도체 기업들 역시 전용 컴파일러 고도화와 거대언어모델(LLM) 추론 소프트웨어 최적화에 역량을 집중하며 쿠다 의존도를 낮추는 데 공을 들이고 있다. 업계에선 단순 칩 가격 경쟁력보다 전력 효율, 소프트웨어 유지보수, 개발 인력 재교육 비용을 모두 합친 총소유비용(TCO) 관점에서 엔비디아 대비 우위를 입증해야 실제 클라우드 사업자와 대기업 도입으로 이어질 수 있다고 보고 있다. 보고서 역시 TCO 기반 평가체계 도입을 핵심 정책 과제로 제시했다. 이에 연구진은 칩 설계 중심 지원에서 벗어나 컴파일러·런타임·소프트웨어개발키트(SDK)를 포함한 풀스택 SW 육성으로 정책 패러다임을 전환해야 한다고 제언했다. 특히 쿠다 의존도를 낮추기 위한 오픈엑스엘에이(OpenXLA)·엠엘아이알(MLIR) 등 글로벌 오픈소스 표준 프로젝트 참여 확대와 공공 AI 데이터센터 기반 실증 환경 조성이 시급한 과제로 제시됐다. 최근 유엑스엘 재단(UXL Foundation)처럼 특정 가속기 벤더에 종속되지 않는 멀티벤더 표준 생태계가 확산하는 만큼, 국내 기업들도 글로벌 소프트웨어 표준 경쟁에 선제적으로 합류해야 한다고 분석했다. 보고서는 "K-NPU 확산의 병목은 칩 자체보다 소프트웨어 최적화와 운영 생태계 규모에 있다"며 "공공 AI 데이터센터를 활용한 대규모 실증과 글로벌 오픈소스 표준 참여를 통해 성능 격차와 레퍼런스 부족의 악순환을 끊어야 한다"고 말했다.

2026.04.11 13:11장유미 기자

화웨이코리아 "어센드 950 내년 한국 출시 희망"

중국 빅테크 기업 화웨이가 내년 한국에 최신 인공지능(AI) 반도체 '어센드(Ascend) 950'을 출시할 것으로 관측된다. 해당 칩에는 화웨이가 자체 개발한 고대역폭 메모리(HBM)가 탑재될 가능성이 제기되며, 국내 AI 반도체 시장의 경쟁 구도에도 변화가 예상된다. 빌리안 왕 한국화웨이 대표는 26일 서울 중구 더플라자호텔에서 열린 '화웨이 데이 2025' 기자간담회에서 “내년 AI 컴퓨팅 카드와 AI 데이터센터 관련 솔루션을 공식 출시를 희망한다”며 “한국 기업에 엔비디아 외 제2의 선택지를 제공할 것”이라고 말했다. 데이터센터·대규모 AI 학습·추론 겨냥 해당 칩은 '어센드 950'이다. 해당 제품은 데이터센터와 대규모 AI 학습·추론을 겨냥한 차세대 AI 가속기로, 저정밀도 연산과 메모리 대역폭을 대폭 강화한 것이 특징이다. 어센드 950에는 화웨이가 자체 개발한 HBM이 탑재될 것으로 관측된다. 앞서 화웨이는 9월 상하이 엑스포센터에서 열린 '화웨이 커넥트' 포럼에서 어센드 950PR과 950DT를 각각 내년 1분기와 4분기에 출시하겠다고 밝힌 바 있다. 이 가운데 950PR은 자체 개발 HBM을 적용한 모델로 알려졌다. 한국에 공급되는 제품 역시 자체 HBM이 탑재될 가능성이 점쳐지는 이유다. AI 연산 단계별로 다른 HBM 적용 화웨이가 공개한 HBM은 기존 메모리 시장에 공급돼온 제품과는 다른 방식일 것으로 추정된다. 커넥트 행사 자료에 따르면 어센드 950PR에는 'HiBL 1.0', 950DT에는 'HiZQ 2.0'이 각각 탑재된다. HiBL 1.0은 AI 추론 과정 중 입력 데이터를 한꺼번에 처리하는 프리필(prefill) 단계에 최적화된 제품으로, 비용 효율을 중시한 것이 특징이다. 반면 HiZQ 2.0은 추론 결과를 생성하는 단계에 적합한 고대역폭 메모리로 설계됐다. 기존 HBM이 학습과 추론 전 과정을 하나의 고성능 메모리로 처리하는 범용 전략이라면, 화웨이는 AI 연산 단계를 세분화해 용도별로 서로 다른 HBM을 적용하는 방식을 택한 셈이다. 단일 칩 아닌 '클러스터'로 판매 화웨이는 어센드 950을 단일 칩이 아닌 클러스터 단위로 판매할 계획이다. 클러스터는 여러 대의 서버를 하나로 묶어 운용하는 방식으로, 사실상 시스템 전반을 패키지로 공급하는 형태다. 왕 대표는 “칩을 클러스터 단위로 판매할 계획”이라며 “화웨이의 전략은 단순히 AI 카드나 AI 서버를 제공하는 데 그치지 않고 산업 전반의 AI 응용을 가속화하는 데 있다”고 강조했다. 이를 위해 네트워크와 스토리지 등 인프라 하드웨어는 물론 소프트웨어까지 아우르는 '엔드투엔드(E2E)' 솔루션을 제공해 경쟁력을 확보한다는 구상이다. 왕 대표는 “이 경우 공급·판매를 위한 파트너사가 필요 없을 수도 있다”며 “화웨이가 직접 집적하고 서비스할 수 있도록 전략을 수립하고 있다”고 덧붙였다. 한국화웨이는 현재 잠재적 공급 협력사들과 협의를 진행 중인 것으로 전해졌다. 이와 함께 한국화웨이는 내년 자체 개발 오픈소스 운영체제(OS) '하모니'를 국내 기업에 공급해 생태계 조성에도 나설 계획이다. 왕 대표는 “하모니의 소유권은 더 이상 화웨이에 있지 않고 오픈소스 관련 기관이 운영과 업그레이드를 맡고 있다”며 “스마트폰뿐 아니라 다양한 스마트홈 기기에서도 활용할 수 있다”고 설명했다. 다만 내년 한국 시장에 스마트폰을 출시할 계획은 없다고 선을 그었다.

2025.12.26 13:50전화평 기자

美·中 무역전쟁에 발 묶인 엔비디아 'H20' GPU

미국 도널드 트럼프 2기 행정부가 대 중국 GPU 수출 규제를 한층 강화했다. 전임자인 조 바이든 행정부는 연산 성능이나 대역폭 등 성능을 낮추는 선에서 수출을 허용했지만 트럼프 2기 행정부는 이마저도 무기한 허가하지 않을 방침이다. 엔비디아는 15일(이하 현지시각) 중국 시장용으로 설계된 H20 GPU 수출 제한 조치를 공시하며 "H20의 재고와 구매 약정, 관련 충당금 등으로 최대 55억 달러(약 7조 8천556억원) 추가 비용이 들 것"이라고 밝혔다. 엔비디아 뿐만 아니라 지난 해부터 성능을 제한한 중국 시장용 GPU를 생산하는 AMD에도 유사한 규제가 주어질 가능성이 크다. 한편 이런 규제가 엔비디아의 가장 큰 경쟁자로 꼽히는 중국 화웨이를 키워주는 결과를 낳을 것이라는 관측도 나온다. 엔비디아, 美 정부 규제에 따라 두 차례 GPU 성능 낮춰 미국 정부가 중국 대상으로 AI 가속과 머신러닝, 딥러닝용 GPU 수출 규제에 나선 것은 2022년 10월부터다. 당시 미국 정부는 엔비디아 A100, H100 등 GPU를 포함해 AMD 제품까지 수출 규제 대상에 포함시켰다. 엔비디아는 이들 제품에서 최대 대역폭을 절반인 400GB/s까지 낮춘 A800, H800 GPU를 생산해 공급했다. 그러나 미국 정부가 2023년 10월 규제 범위를 확대하자 성능을 더 낮춘 H20, L20, L2 등 3종을 추가 개발해 이를 작년부터 중국 시장에 공급했다. 이번에 미국 정부가 제동을 건 H20 GPU는 HBM3 메모리 용량을 96GB로 제한하고 메모리 대역폭은 4TB/s, AI 연산 성능은 FP16(부동소수점 16비트) 기준 148 테라플롭스, FP32(부동소수점 32비트) 기준 44 테라플롭스로 제한됐다. H800으로 구현한 LLM '딥시크 R1'이 역린 건드렸나 미국 정부가 H20 GPU의 중국 수출 규제를 강화한 이유는 아직 명확하지 않다. 그러나 지난 1월 중국 AI 스타트업 딥시크(DeepSeek)가 하순 공개한 추론 특화 AI 모델 'R1'이 영향을 미쳤을 것으로 추정된다. 딥시크 R1은 AI 모델 훈련을 위해 메타가 라마(LLaMa) 등 AI 모델 개발에 투입한 비용의 10% 수준인 557만6천달러(약 80억원)를 지출한 것으로 알려져 있다. 또 미국 상무부 수출 통제 기준을 준수하는 H800 GPU를 이용했다. 당시 엔비디아는 "딥시크가 활용한 GPU는 미국 수출 규정을 준수했으며 추론은 상당히 많은 엔비디아 GPU와 고성능 네트워킹이 필요하다. 이와 같은 딥시크의 혁신이 GPU 수요를 더욱 증가시킬 것"이라고 밝혔다. 실제로 미국 CNBC와 대만 공상시보 등 경제 매체에 따르면 딥시크 R1 공개 이후 텐센트, 알리바바, 바이트댄스 등 중국 주요 IT 기업들이 H20 GPU 발주량을 크게 늘렸다. 엔비디아, 중국 내 최대 경쟁사로 화웨이 꼽아 미국 정부는 거대언어모델(LLM) 등에서 중국의 성장 속도를 지연시키기 위해 GPU 수출 규제를 활용하고 있다. 그러나 이런 규제는 오히려 중국 내 엔비디아 최대 경쟁자로 꼽히는 화웨이 성장을 돕는 결과를 낳을 수 있다. 화웨이가 개발한 어센드(Ascend) 910B는 FP16 기준 320 테라플롭스, INT8(정수 8비트) 기준 640 TOPS(1초당 1조 번 연산)급 성능을 갖춰 엔비디아 A100과 비슷한 수준으로 평가된다. 지난 해 공개된 후속 제품인 어센드 910C는 지난 2월 딥시크가 수행한 추론 벤치마크에서 엔비디아 H100의 60%에 달하는 성능을 냈다. 엔비디아도 지난 2월 말 미국 증권거래위원회에 제출한 연간 보고서에서 주요 경쟁자 중 하나로 2년 연속 화웨이를 꼽았다. 칩과 클라우드 서비스, Arm IP 기반 컴퓨터 프로세서와 네트워킹 제품 등 4개 분야에서 화웨이를 주요 경쟁사로 분류했다. 엔비디아 이어 AMD GPU 사업에도 영향 불가피 미국 정부의 수출 규제 확대는 엔비디아 뿐만 아니라 AMD에도 영향을 미칠 가능성이 크다. AMD는 작년 중국 시장을 겨냥해 성능을 제한한 AI GPU 가속기인 인스팅트 MI309를 설계했지만 미국 상무부는 '여전히 성능이 강력하다'는 이유로 수출을 불허했다. 2023년 11월 중국 시장에서는 데스크톱PC용 지포스 RTX 4090 그래픽카드를 분해해 서버용으로 개조하기도 했지만 올해는 이런 시도가 일어나기 힘들다. 엔비디아가 2월부터 중국 시장에 공급중인 지포스 RTX 5090D 그래픽카드에 이미 여러 제약이 가해졌기 때문이다. 지포스 RTX 5090D 그래픽카드는 미국 정부의 규제를 충족하기 위해 AI 연산 성능을 RTX 5090(3,352 TOPS) 대비 29% 가량 줄인 2,375 TOPS 수준으로 낮췄다. 한 PC나 서버에 GPU를 여러 개 꽂아 성능을 높이는 '멀티 GPU' 구성도 불가능하다. 다만 국내 주요 메모리 기업들에게 미칠 악영향은 제한적일 것으로 분석된다. 현재 SK하이닉스는 엔비디아의 AI 가속기에 필요한 HBM(고대역폭메모리)을 대거 공급하고 있으며, 삼성전자 역시 지속적으로 공급망 진입을 시도 중이다.

2025.04.16 14:37권봉석 기자