• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
창간특집
인공지능
배터리
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'DGX-A100 GPU'통합검색 결과 입니다. (189건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

AI 분야 1조8천억원 추경...연내 GPU 1만장 신규 도입

정부가 1조8천억원 규모의 인공지능(AI) 분야 추가경정예산으로 연내 1만장의 GPU를 새롭게 확보하고, 민간이 보유한 GPU 2천600장을 임차 활용키로 했다. 과학기술정보통신부는 18일 국무회의에서 추경안을 바탕으로 지난 15일 경제관계장관회의 겸 산업경쟁력강화 관계장관회의에서 논의된 '국가AI역량 강화방안 후속조치'를 추진한다고 밝혔다. 연내 GPU 1만장 확보에 1조4천600억원을 투입한다. 또한 시급한 국내 AI컴퓨팅 수요에 대응하기 위해 민간이 보유한 첨단 GPU 2천600장분의 추가 임차 활용에 1천723억원을 할당했다. 국산 AI반도체의 조기 상용화를 지원하는 실증사업도 기존 298억원에서 752억원으로 확대한다. 이를 위해 대규모 AI컴퓨팅 상용서비스에 최적화된 국산 NPU 실증 인프라를 구축하고, 온디바이스 AI, 해외 실증 등 신시장 개척을 위한 실증 지원도 확대한다. 또한 국가AI컴퓨팅 센터(SPC)가 선정되면 올해부터 국산 AI반도체가 센터에 본격적으로 도입될 수 있도록 적극 추진한다. 민간 AI컴퓨팅 인프라 투자 촉진을 위한 제도적 지원도 강화한다. 첨단 AI R&D, AI 인프라 투자에 대해 세제지원을 강화하기 위해 올해 3월 조세특례제한법을 개정해 AI를 국가전략기술로 지정했다. 아울러 AI 데이터센터 민간투자 촉진을 위한 입지, 시설, 전력 관련 제도적 지원도 지속해나갈 계획이다. 글로벌 수준의 AI모델 개발을 위해 AI 정예팀을 선정해 지원하는 가칭 월드베스트 LLM 프로젝트를 추진한다. 세계 최고 수준의 AI인재 확보 양성도 지원한다. 혁신 AI 인재들이 겨루는 글로벌 AI챌린지를 하반기에 개최한다. 해외 최고급 AI 연구자를 국내에 유치할 경우 3년간 최대 연 20억원을 지원하는 가칭 AI 패스파인더 프로젝트를 올해 신규로 추진한다. AI융합 분야 글로벌 최상위 연구자를 양성하기 위해, 국내외 우수 박사후연구원 400명에 최고 수준의 처우 및 집단·융합연구 등을 집중 투자한다. AI 스타트업 성장을 지원하기 위해 올해 민관이 합동으로 조성 예정인 900억원 규모의 'AI 혁신펀드'를 2천억원 규모로 확대한다. 유상임 과기정통부 장관은 “AI 주도권을 놓고 촌각을 다투는 글로벌 경쟁속에서 이번 추경은 매우 시의적절하며 중대한 결정”이라며 “과기정통부는 '1년이 늦어지면 경쟁력은 3년 뒤처진다'라는 절박한 각오로 추진과제를 철저히 준비해 AI G3 도약을 위한 기반을 마련해나가겠다”고 말했다.

2025.04.18 11:00박수형

美 의회 "엔비디아 GPU 중국 유출 여부 조사 착수"

미국 의회는 17일(현지시간) 중국 수출이 제한된 고성능 엔비디아 GPU가 우회 공급됐다는 의혹에 대해 공식 조사에 착수한다고 밝혔다. 17일 미국 하원 중국공산당특별위원회는 중국 AI 기업 딥시크(DeepSeek)가 수출 통제 대상인 엔비디아 GPU 약 6만 개로 거대언어모델(LLM)을 훈련했다는 정보를 바탕으로 엔비디아에 관련 기록 제출을 요구했다고 밝혔다. 지난 1월 딥시크 R1 공개시 엔비디아는 "딥시크가 활용한 GPU는 미국 수출 규정을 준수했다"고 밝혔다. 그러나 위원회는 "딥시크가 H100, A100 등 고성능 GPU를 싱가포르 등 제3국에서 우회 확보했을 가능성이 있다"고 지적했다. 위원회는 2020년 이후 중국이나 아세안 국가에서 499대 이상의 AI GPU를 구매한 모든 고객 목록과 최종 사용자, 거래 날짜, 최종 목적지 등 상세 정보 제출을 요구하고 있다. 싱가포르 이외에 말레이시아로 GPU 수출이 3.6배 이상 늘어나면서 중국으로의 우회 수출지로 말레이시아가 활용되고 있다는 의혹도 제기되고 있다. 엔비디아는 "미국 정부의 수출 규제를 준수하고 있으며 싱가포르 매출 증가는 단순히 결제가 일어난 장소이며 관련 제품은 미국과 대만 등 다른 지역으로 배송되고 중국에 공급되지 않았다"고 반론했다.

2025.04.18 09:37권봉석

美·中 무역전쟁에 발 묶인 엔비디아 'H20' GPU

미국 도널드 트럼프 2기 행정부가 대 중국 GPU 수출 규제를 한층 강화했다. 전임자인 조 바이든 행정부는 연산 성능이나 대역폭 등 성능을 낮추는 선에서 수출을 허용했지만 트럼프 2기 행정부는 이마저도 무기한 허가하지 않을 방침이다. 엔비디아는 15일(이하 현지시각) 중국 시장용으로 설계된 H20 GPU 수출 제한 조치를 공시하며 "H20의 재고와 구매 약정, 관련 충당금 등으로 최대 55억 달러(약 7조 8천556억원) 추가 비용이 들 것"이라고 밝혔다. 엔비디아 뿐만 아니라 지난 해부터 성능을 제한한 중국 시장용 GPU를 생산하는 AMD에도 유사한 규제가 주어질 가능성이 크다. 한편 이런 규제가 엔비디아의 가장 큰 경쟁자로 꼽히는 중국 화웨이를 키워주는 결과를 낳을 것이라는 관측도 나온다. 엔비디아, 美 정부 규제에 따라 두 차례 GPU 성능 낮춰 미국 정부가 중국 대상으로 AI 가속과 머신러닝, 딥러닝용 GPU 수출 규제에 나선 것은 2022년 10월부터다. 당시 미국 정부는 엔비디아 A100, H100 등 GPU를 포함해 AMD 제품까지 수출 규제 대상에 포함시켰다. 엔비디아는 이들 제품에서 최대 대역폭을 절반인 400GB/s까지 낮춘 A800, H800 GPU를 생산해 공급했다. 그러나 미국 정부가 2023년 10월 규제 범위를 확대하자 성능을 더 낮춘 H20, L20, L2 등 3종을 추가 개발해 이를 작년부터 중국 시장에 공급했다. 이번에 미국 정부가 제동을 건 H20 GPU는 HBM3 메모리 용량을 96GB로 제한하고 메모리 대역폭은 4TB/s, AI 연산 성능은 FP16(부동소수점 16비트) 기준 148 테라플롭스, FP32(부동소수점 32비트) 기준 44 테라플롭스로 제한됐다. H800으로 구현한 LLM '딥시크 R1'이 역린 건드렸나 미국 정부가 H20 GPU의 중국 수출 규제를 강화한 이유는 아직 명확하지 않다. 그러나 지난 1월 중국 AI 스타트업 딥시크(DeepSeek)가 하순 공개한 추론 특화 AI 모델 'R1'이 영향을 미쳤을 것으로 추정된다. 딥시크 R1은 AI 모델 훈련을 위해 메타가 라마(LLaMa) 등 AI 모델 개발에 투입한 비용의 10% 수준인 557만6천달러(약 80억원)를 지출한 것으로 알려져 있다. 또 미국 상무부 수출 통제 기준을 준수하는 H800 GPU를 이용했다. 당시 엔비디아는 "딥시크가 활용한 GPU는 미국 수출 규정을 준수했으며 추론은 상당히 많은 엔비디아 GPU와 고성능 네트워킹이 필요하다. 이와 같은 딥시크의 혁신이 GPU 수요를 더욱 증가시킬 것"이라고 밝혔다. 실제로 미국 CNBC와 대만 공상시보 등 경제 매체에 따르면 딥시크 R1 공개 이후 텐센트, 알리바바, 바이트댄스 등 중국 주요 IT 기업들이 H20 GPU 발주량을 크게 늘렸다. 엔비디아, 중국 내 최대 경쟁사로 화웨이 꼽아 미국 정부는 거대언어모델(LLM) 등에서 중국의 성장 속도를 지연시키기 위해 GPU 수출 규제를 활용하고 있다. 그러나 이런 규제는 오히려 중국 내 엔비디아 최대 경쟁자로 꼽히는 화웨이 성장을 돕는 결과를 낳을 수 있다. 화웨이가 개발한 어센드(Ascend) 910B는 FP16 기준 320 테라플롭스, INT8(정수 8비트) 기준 640 TOPS(1초당 1조 번 연산)급 성능을 갖춰 엔비디아 A100과 비슷한 수준으로 평가된다. 지난 해 공개된 후속 제품인 어센드 910C는 지난 2월 딥시크가 수행한 추론 벤치마크에서 엔비디아 H100의 60%에 달하는 성능을 냈다. 엔비디아도 지난 2월 말 미국 증권거래위원회에 제출한 연간 보고서에서 주요 경쟁자 중 하나로 2년 연속 화웨이를 꼽았다. 칩과 클라우드 서비스, Arm IP 기반 컴퓨터 프로세서와 네트워킹 제품 등 4개 분야에서 화웨이를 주요 경쟁사로 분류했다. 엔비디아 이어 AMD GPU 사업에도 영향 불가피 미국 정부의 수출 규제 확대는 엔비디아 뿐만 아니라 AMD에도 영향을 미칠 가능성이 크다. AMD는 작년 중국 시장을 겨냥해 성능을 제한한 AI GPU 가속기인 인스팅트 MI309를 설계했지만 미국 상무부는 '여전히 성능이 강력하다'는 이유로 수출을 불허했다. 2023년 11월 중국 시장에서는 데스크톱PC용 지포스 RTX 4090 그래픽카드를 분해해 서버용으로 개조하기도 했지만 올해는 이런 시도가 일어나기 힘들다. 엔비디아가 2월부터 중국 시장에 공급중인 지포스 RTX 5090D 그래픽카드에 이미 여러 제약이 가해졌기 때문이다. 지포스 RTX 5090D 그래픽카드는 미국 정부의 규제를 충족하기 위해 AI 연산 성능을 RTX 5090(3,352 TOPS) 대비 29% 가량 줄인 2,375 TOPS 수준으로 낮췄다. 한 PC나 서버에 GPU를 여러 개 꽂아 성능을 높이는 '멀티 GPU' 구성도 불가능하다. 다만 국내 주요 메모리 기업들에게 미칠 악영향은 제한적일 것으로 분석된다. 현재 SK하이닉스는 엔비디아의 AI 가속기에 필요한 HBM(고대역폭메모리)을 대거 공급하고 있으며, 삼성전자 역시 지속적으로 공급망 진입을 시도 중이다.

2025.04.16 14:37권봉석

지코어, 렛츠AI에 AI 인프라 제공…"이미지 생성 속도·유연성↑"

지코어가 렛츠AI의 기술 고도화를 도와 맞춤형 이미지 생성 속도와 서비스 확장 가능성을 높였다. 지코어는 렛츠AI에 AI 인프라와 AI 추론 솔루션 '에브리웨어 인퍼런스'를 제공했다고 15일 밝혔다. 렛츠AI는 사용자가 업로드한 이미지나 제품 기반으로 AI가 맞춤형 이미지를 실시간 생성하는 플랫폼이다. 지코어의 엔비디아 H100 그래픽처리장치(GPU) 기반 클라우드 인프라와 에브리웨어 인퍼런스를 적용해 이미지 생성 속도를 높이고 지연 시간을 줄였다. 또 GPU 단위 자원 제공 방식으로 인프라 구축 부담을 최소화하고, 비용 효율성을 이뤘다고 밝혔다. 현재 렛츠AI는 지코어 인프라로 다양한 브랜드와 협업 프로젝트를 진행 중이다. 한 레스토랑 브랜드는 피자 이미지 생성 이벤트에, 스포츠 브랜드 퓨마는 가상 인플루언서의 유니폼 이미지 생성에, 속옷 브랜드 슬로기는 마케팅 이미지 실험에 해당 플랫폼을 활용했다. 지코어는 AI 애플리케이션의 실시간 서비스를 위해 엣지 네트워크 기반 초저지연 환경도 제공하고 있다. 추론 요청을 전 세계 180여 개 엣지 지점 중 사용자와 가장 가까운 위치로 자동 라우팅해 속도를 최적화했다. 미쉬 스트로츠 렛츠AI 대표는 "지코어 덕분에 클릭 몇 번으로 글로벌 배포가 가능해졌고, GPU도 수 시간 내에 온보딩돼 안정적이고 유연한 운영이 가능했다"며 "개발과 인프라팀 작업 효율을 크게 높아졌다"고 말했다. 지코어 세바 베이너 디렉터는 "렛츠AI는 AI 인프라 기반으로 대규모 학습과 추론을 동시 운영하고 있다"며 "향후 영상 생성 등 기능 확장에도 우리 제품이 중심이 될 것"이라고 강조했다.

2025.04.15 11:00김미정

[현장] 한국인공지능산업협회 "AI 전환은 생존 문제"…산업 현안 집중 조명

한국인공지능산업협회(AIIA)가 국내 인공지능(AI) 산업계의 현안을 짚고 기술 대응 방향을 모색하는 만남의 장을 열었다. AI 인프라와 소프트웨어(SW) 테스트 분야의 현안을 조명해 업계의 변화 속도를 조명하기 위함이다. AIIA는 15일 서울 양재동 엘타워에서 'AI는 어디에나 있다'를 주제로 '제49회 AIIA 조찬포럼'을 개최했다. 이날 행사에서는 이동기 SK텔레콤 랩장이 AI 인프라 구축과 서비스로서의 그래픽처리장치(GPUaaS)를, 이혜진 티벨 이사가 소프트웨어(SW) 테스트에서의 AI 활용 사례를 주제로 각각 발표했다. 양승현 AIIA 협회장은 "최근 모델 컨텍스트 프로토콜(MCP)과 화웨이 AI 칩의 등장 등 가파른 기술의 발전으로 시장의 방향성이 바뀌고 있다"며 "AI 인프라 전환은 더 이상 선택이 아닌 생존의 문제"라고 말했다. "AI 데이터센터는 새로운 제조업"…SKT 랩장의 경고와 해법은 이날 첫 발표를 맡은 이동기 SK텔레콤 AI 데이터센터랩장은 AI 인프라 구축 프로젝트와 GPU 서비스 전환 흐름을 집중 조명했다. 그는 AI 데이터센터가 전통적인 서버룸 중심의 데이터센터 개념에서 탈피한 근본적 전환이 이뤄지고 있다고 진단했다. 발표에 따르면 AI 데이터센터는 네 가지 축을 중심으로 구체화된다. ▲GPU 서버로 구성된 고성능 컴퓨팅 인프라 ▲액체 냉각 기반의 첨단 쿨링 시스템 ▲분산형 친환경 에너지 설비 ▲자원·비용·성능을 통합 관리하는 최적화 소프트웨어가 핵심이다. 이 랩장은 AI 데이터센터의 등장을 '토큰 공장' 개념으로 비유했다. 단순한 컴퓨팅 자원이 아닌 AI 추론과 학습을 통해 대규모 토큰을 실시간 생산해내는 AI 팩토리로 진화하고 있다는 설명이다. 실제로 젠슨 황 엔비디아 CEO도 "AI 데이터센터는 새로운 종류의 제조업이 되고 있다"고 강조한 바 있다. 이 과정에서 가장 큰 변화를 맞는 영역은 냉각과 전력 인프라다. 기존 공랭 방식은 고집적 GPU 서버를 감당할 수 없기 때문이다. 냉각 방식도 지속적으로 진화하고 있다. 단순히 직접 냉각 뿐만 아니라 서버 자체를 냉각장치 안에 넣는 '침수형'과 '정밀 액체분사형' 냉각 기술도 함께 발전 중이다. 다만 침수 방식은 물의 무게 탓에 상면당 하중이 기존 대비 최대 4배까지 증가할 수 있어 구조 설계부터 다시 짜야 한다는 부담이 뒤따른다. 이러한 흐름은 글로벌 무대에서도 극단적으로 전개되고 있다. 일론 머스크는 xAI의 파운데이션 모델인 '그록3' 개발을 위해 폐공장을 매입해 10만 장 규모의 GPU 팩토리를 구축하려다 전력과 냉각 시스템 병목에 부딪힌 바 있다. 결국 전국에서 발전기를 조달하고 미국 내 이동식 냉각 장비의 4분의 1을 임대해 대응하는 방식으로 급조된 데이터센터를 운영한 바 있다. GPU 장비의 고가·단명화 추세에 대한 우려도 제기됐다. 이동기 랩장은 "직접 센터를 지어도 몇 달 만에 장비가 구형이 될 수 있다"며 "GPU 인프라의 진화 속도를 감안할 때 이를 보유하는 것보다 서비스 형태로 이용하는 쪽이 현실적인 선택이 되고 있다"고 말했다. SK텔레콤은 이를 해결하기 위해 GPUaaS 모델을 도입하고 있다. 미국 람다랩스와의 협력을 통해 최신 GPU 클러스터를 국내 기업들에게 제공 중이며 연내 온디맨드 상품도 출시할 계획이다. 람다는 '인피니밴드' 기반의 대형 클러스터를 동적으로 나눠 쓰는 '원클릭 클러스터' 기술을 강점으로 내세우고 있다. 이 랩장은 "AI 데이터센터 구축에 필요한 총비용의 약 70%가 GPU 인프라에 투입된다"며 "GPUaaS는 전력, 공간, 업그레이드 리스크를 모두 분산시킬 수 있는 해법"이라고 강조했다. "AI가 SW 테스트하는 시대"…티벨, 자동화 넘어 '테스트옵스'로 간다 이날 두 번째 발표자로 나선 이혜진 티벨 이사는 SW 테스트 분야에서 AI 기술이 어떻게 활용되고 있는지를 소개했다. 그는 "테스트는 기술이 아니라 신뢰"라는 격언을 강조하며 자동화와 AI 기반 도구들이 궁극적으로 확보해야 할 목표는 '품질에 대한 신뢰'라고 밝혔다. 티벨은 금융, 교육, 전자상거래 등 다양한 분야의 품질 보증 서비스를 제공하는 테스트 전문 기업이다. 이 회사는 기존 수작업 기반의 테스트를 넘어 자동화 테스트, AI 기반 검증 기술, 테스트 운영 환경 설계까지 사업 영역을 확대하고 있다. 특히 음성 기반 테스트 자동화, 대규모 고객민원(VOC) 처리 시스템, 거대언어모델(LLM) 결과 신뢰성 검증 등 다양한 R&D 성과도 함께 공개했다. 이 이사는 먼저 테스트의 부재가 초래한 사고들을 사례로 제시하며 테스트의 중요성을 강조했다. 그는 나사의 화성 기후 탐사선 폭발 사고, 아마존웹서비스(AWS)의 대규모 장애, 영국 은행 시스템 마비 등의 사례를 언급하며 테스트 실패는 곧 신뢰 손실로 직결된다는 점을 보였다. 이러한 상황에 대응해 티벨이 제시한 테스트 기술의 진화는 다음과 같다. ▲사람이 직접 케이스를 설계하는 매뉴얼 테스트 ▲반복 작업과 지속적 통합(CICD) 연동 중심의 자동화 테스트 ▲AI 기반의 시나리오 생성, 이상 탐지, 유저 인터페이스(UI) 변경 인식이 가능한 지능형 테스트 ▲자율주행처럼 스스로 복구하고 실행하는 '자율 테스트'가 그것이다. 특히 음성 기반 서비스 검증을 위한 자동화 기술도 소개됐다. 텍스트투사운드(TTS)·사운드투텍스트(STT)·자연어처리(NLP) 기술을 결합해 발화된 음성과 AI의 응답을 비교·분석해 유사도를 측정하고 결과를 자동으로 아틀라시안의 이슈 트래킹 툴인 '지라(JIRA)'에 업데이트하는 구조다. AI 기술을 테스트에 접목한 주요 활용 사례도 다양했다. 머신러닝을 통한 오류 패턴 분석, 테스트 로그 기반의 신규 케이스 추출, NLP 기반 요구사항 문서 분석, UI 탐색 자동화, 테스트 코드 자동 생성 등이다. 이 이사는 테스트 운영 환경을 자동화하는 '테스트옵스'의 중요성도 함께 강조했다. 그는 "단순 자동화 기술이 아니라 테스트 설계부터 실행·결과 관리까지 전체 프로세스를 자동화하는 게 진정한 진화"라며 "이를 위해 우리는 오픈소스 기반 기술을 적극 채택하고 고객사 인프라에 맞춰 유연한 환경을 구현하고 있다"고 밝혔다. 이혜진 티벨 이사는 발표를 마치며 "AI 도구가 아무리 고도화돼도 테스트의 본질은 신뢰이며 그 신뢰는 사람이 만든다"며 "자동화는 도구로, 품질에 대한 맥락 이해와 판단은 여전히 사람의 몫"이라고 강조했다.

2025.04.15 10:06조이환

[인터뷰] "엔비디아 사로 잡은 비결, '델 AI 팩토리' 덕분"

"바이 델(Buy Dell·델 제품을 사세요), 바이 델, 바이 델!" 지난 달 18일. 미국 새너제이에서 열린 엔비디아 연례 개발자 회의 GTC 행사에 마련된 델 테크놀로지스 부스에선 '인공지능(AI) 대부'로 불리는 젠슨 황 엔비디아 최고경영자(CEO)가 목청을 높여 이처럼 외쳤다. 컴퓨터를 필요로 하는 이들이라면 누구나 알고 있는 '델'의 PC뿐 아니라 AI 인프라 경쟁력을 인정하며 엔비디아의 가장 최고 파트너라는 점을 치켜 세워준 것이다. AI 열풍이 한창이던 1년 전 엔비디아 GTC 행사에서도 황 CEO는 델 테크놀로지스를 공개 석상에서 언급하며 끈끈한 관계를 과시했다. 당시 황 CEO는 "정보기술(IT)과 관련해 무엇이든 필요한 것이 있다면 델에 전화하면 된다"고 밝혔다. 이는 델 테크놀로지스 주가에도 영향을 줘 지난해 5월 시가총액이 1천억 달러를 넘기도 했다. 이처럼 엔비디아의 두터운 신임을 받고 있는 델 테크놀로지스가 올해 AI 인프라를 전면 업그레이드하며 시장 강자의 면모를 다시 한 번 드러내고 있다. 엔비디아 기반 델 AI 팩토리의 최신 포트폴리오를 앞세워 최근 달궈지고 있는 글로벌 AI 인프라 시장에서 주도권 굳히기에 본격 나선 모습이다. 최근 지디넷코리아와 만난 양원석 델 테크놀로지스 인프라스트럭처 솔루션 사업부 전무는 "우리는 AI PC부터 엣지, 코어 데이터센터, 클라우드까지 엔드 투 엔드(end-to-end) AI 솔루션 포트폴리오를 가지고 있다는 것이 강점"이라며 "서버 자체 기술력, 공급망 관리 능력, 영업 능력, 기술 지원 능력 등을 갖추고 있는 덕분에 글로벌뿐 아니라 한국에서도 서버 부문 1위 업체로 인정 받고 있다"고 운을 뗐다. 그러면서 "글로벌뿐 아니라 한국 스토리지 하드웨어(HW) 및 소프트웨어(SW) 부문 1위 업체로서의 저력을 갖고 있는 만큼, 데이터 및 데이터관리에 대해 전 세계에서 제일 잘 알고 있는 기업이라고 자부할 수 있다"며 "젠슨 황 CEO가 엔비디아 GTC 현장에서 '델'을 언급한 것도 이런 점을 인정한 것이라고 볼 수 있다"고 덧붙였다. 실제로 델 테크놀로지스는 글로벌 AI 인프라 시장에서 경쟁력을 입증 받아 독보적인 점유율을 유지하며 꾸준한 성장세를 보이고 있다. 특히 슈퍼마이크로, HPE 등과 경쟁하고 있는 AI 서버 시장에선 다양한 포트폴리오를 앞세워 압도적인 우위에 올라서 있다는 평가를 받고 있다. 7일 시장조사업체 IDC에 따르면 델 테크놀로지스는 지난해 3분기 전 세계 X86 서버 시장 판매대수 기준으로 11.4%의 점유율을 차지하며 1위를 유지했다. 매출 기준 점유율도 12.4%로 1위를 차지했다. 델 테크놀로지스와 경쟁하고 있는 슈퍼마이크로와 HPE, IEIT 시스템즈, 레노버는 그 뒤를 이었다. 이처럼 델 테크놀로지스가 시장 우위를 견고히 하고 있는 상황에서 전체 서버 시장의 성장세가 높다는 점은 호재로 작용하고 있다. 지난해 4분기 서버 시장 매출은 전년 동기 대비 91% 증가한 733억 달러를 기록, 2019년 이후 두 번째로 높은 성장률을 보였다. 특히 GPU가 내장된 서버 매출은 전년 동기보다 192.6%나 성장해 전체 서버 시장 매출의 절반 이상을 차지할 정도로 급성장한 모습을 보였다. 엔비디아는 전체 출하량의 90% 이상을 차지하며 서버 GPU 분야에서 독주를 이어갔다. 지난해 전체 서버 시장 규모는 2020년 이후 두 배 이상 성장한 2천357억 달러에 달했다. 엔비디아와 밀접한 관계를 맺고 있는 델 테크놀로지스도 지난해 호실적을 기록했다. 특히 AI 서버 출하액은 98억 달러로, 사업을 시작한 지 2년도 채 안되는 기간에 급속도로 성장한 모습을 보였다. AI 관련 기업 고객 역시 2천 곳 이상을 확보한 상태로, 올해 고객사 수가 더 늘어나 AI 매출이 50% 성장할 것으로 예상됐다. 올해 AI 서버 출하액은 약 150억 달러에 달할 것으로 전망했다. 양 전무는 "지난해 엔비디아 GTC에서 처음 선보인 '델 AI 팩토리 위드 엔비디아(Dell AI Factory with NVIDIA)'를 통해 다양한 솔루션과 제품을 선보이며 엄청난 컴퓨팅 파워를 시장에 공급했다고 자부하고 있다"며 "해외뿐 아니라 국내에서도 AI 시장 수요가 점차 '엔터프라이즈 AI'로 이동하고 있는 만큼 올해도 수요는 더 많아질 것으로 보인다"고 설명했다. 이어 "지난해까진 클라우드 서비스 제공자(CSP), 특히 하이퍼스케일러 또는 코어위브 같은 NCP(NVIDIA Cloud Partner) 업체들이 주축이 돼 시장 성장을 주도했지만, 올해는 더 많은 대기업, 대학, 연구기관 등 다양한 분야에서 수요가 많을 듯 하다"며 "10대 미만~수십대 등 작은 규모에서부터 거대 규모에 이르기까지 서버 규모 면에서도 더 다양해질 듯 하다"고 덧붙였다. 양 전무는 최근 국내에서 sLM(small Language Model), 온프레미스에 AI 서버를 두고 API를 사용해 클라우드 업체가 제공하는 AI 서비스와 연결해 사용하는 활용 사례(Use Case)가 늘어나고 있다는 점도 주목했다. 또 엔비디아 'H100' 위주로 형성된 GPU 시장이 향후 블랙웰, 그레이스블랙웰, AMD, 인텔 등 다양한 실리콘으로 확대될 것으로 봤다. 하지만 국내 고객들이 생성형 AI를 도입, 활용할 때 걸림돌이 많아 아직 시장이 활성화 되지 못했다는 점에 대해선 아쉬워 했다. 양 전무는 "국내에선 생성형 AI 활용 시 거버넌스와 개인정보 보호, 법적 규제 등을 고려해야 해 적절한 데이터를 수집·준비하는 과정에 있어 많은 어려움이 있을 수 있다"며 "생성형 AI를 위한 인프라는 기존 데이터센터 인프라 기술과는 달라 이를 위해 내부 역량을 확보하거나, 외부 전문 인력 채용 등을 함께 추진해야 하는 데 쉽지 않은 것이 현실"이라고 분석했다. 이어 "이에 따라 AI와 관련해 데이터 준비, 전략 수립을 위한 컨설팅, 활용 사례 생성 및 구축 등에 있어 전문 서비스를 활용하는 것이 좀 더 안전하고 체계적일 수 있다"며 "비용 측면에서 고가의 GPU에 투자하거나 퍼블릭 클라우드 서비스 사용 시 높은 운영 비용을 감당하는 데 기업들이 부담을 느끼는 경우가 많다"고 덧붙였다. 이 같은 상황에서 양 전무는 델 테크놀로지스가 좋은 대안이 될 것이라고 강조했다. 또 엔터프라이즈 기업의 경우 생성형 AI를 위해 안정적이며 보안 측면에서 신뢰할 수 있고 관리하기 쉬운 데다 데이터와 가까운 곳에 위치한 고성능의 데이터센터 인프라를 구축해야 한다고 조언했다. 양 전무는 "자사 서버 제품들은 효율화 및 생산성 향상을 위한 라이프사이클 관리의 지능적 설계 및 제어가 가능하다"며 "클라우드 인프라의 대부분의 이점도 온프레미스에서 서비스 형태(As a Service)로 제공할 수 있다"고 설명했다. 그러면서 "'델 AI 솔루션'은 경쟁사들에 비해 AI PC부터 엣지, 코어 데이터센터, 클라우드까지 엔드 투 엔드(End-to-end) AI 솔루션 포트폴리오를 갖추고 있는 데다 자사가 국내외서 스토리지 HW 및 SW 부문 1위 업체로서 데이터 및 데이터 관리에 대해 전 세계에서 가장 잘 알고 있다는 것이 강점"이라며 "코로케이션 및 호스팅 공급업체부터 AI 모델의 기반이 되는 반도체 공급업체에 이르기까지 포괄적인 파트너 생태계 스택을 제공하고 있다는 것도 매력적인 요소"라고 덧붙였다. 또 그는 "엔비디아, 마이크로소프트, 퀄컴, AMD, 허깅페이스, 인텔, 메타, 레드햇 등 광범위한 에코시스템을 통해 협력 관계를 탄탄히 구축하고 있는 것도 장점"이라며 "공장 팩토리 레벨에서 준비된 솔루션을 공급할 수 있도록 엔지니어링 단계에서부터 엔비디아와 협력하고 있다는 것도 우리만의 경쟁력"이라고 강조했다. 이 같은 시스템을 바탕으로 델은 국내 서버 시장에서도 1위 자리를 굳건히 지키고 있다. 특히 서버 자체 기술력, 공급망 관리 능력, 영업 능력, 기술 지원 능력 등을 인정 받아 삼성SDS와 NHN클라우드, 엘리스 등 많은 기업들이 델의 서버를 앞 다퉈 도입하고 있다. 해외에서도 마찬가지다. 델 테크놀로지스에 따르면 현재 기업들은 ▲비용 통제 ▲데이터 관리 ▲기존 시스템과의 통합 ▲전문 인력 부족을 주요 도전 과제로 삼고 있다. 이에 전체 중 77%의 기업이 AI 인프라 구축을 위해 '단일 벤더'를 선호하고 있는데 델 테크놀로지스는 다양한 제품 및 시스템 덕에 기업들의 상당한 신뢰를 얻고 있는 것으로 나타났다. 양 전무는 "우리는 업계 최신 기술과 오픈·모듈러 아키텍처를 빠르고 적극적으로 수용해 고객들이 이미 투자한 자산을 보호할 수 있도록 지원하고 있다"며 "새로운 기술이 나왔을 때 기존의 장비·설비에서 손쉽게 업그레이드할 수 있도록 함으로써 기업들이 효율적으로 자사 제품을 활용할 수 있게 도울 것"이라고 밝혔다. 그러면서 "특히 곧 출시될 '델 파워엣지 XE8712' 서버는 고객들이 가장 기대해도 좋을 제품"이라며 "2개의 그레이스 CPU와 4개의 블랙웰 GPU를 통합한 엔비디아 GB200 그레이스 블랙웰 슈퍼칩을 탑재해 데이터센터 내 AI 성능을 극대화 함으로써 현존하는 AI 서버 중 가장 빠른 속도로 이용할 수 있을 것"이라고 설명했다. 또 델 테크놀로지스가 AI 데이터 관리 측면에서도 상당한 기술 발전을 이끌어 낼 것이라고 자신했다. 특히 기업들이 AI 데이터를 더 빠르게 처리하고 보다 안전하게 보호할 수 있도록 설계된 '델 AI 데이터 팩토리 위드 엔비디아'가 중추적 역할을 할 것으로 봤다. 이 플랫폼은 대량의 데이터를 실시간으로 받아들이는 데이터 인제스천 기능을 지원하며 GPU 가속 기반 '스파크 쿼리'를 활용해 기존 대비 최대 220% 향상된 속도로 데이터를 분석하고 처리할 수 있다. 더불어 델이 AI 소프트웨어 분야에서도 엔비디아와의 협력을 통해 기술 발전을 이끌어 냈다고 강조했다. 특히 '에이전트 AI' 시스템 개발을 지원하는 엔비디아의 AI 개발 프레임워크인 '에이전틱 AI'와 이를 위한 AI 최적화 도구를 AI 팩토리에 통합함으로써 AI를 통해 기업들이 의사 결정을 쉽게 내릴 수 있도록 지원에 나선 점을 피력했다. 양 전무는 "그동안에는 마이크로소프트 등 하이퍼스케일러들이 수십만 장의 GPU를 구매해 파운데이션 모델을 만드는 것이 대세였다면, 작년 말부턴 AI를 어떻게 잘 활용할 수 있을지에 대해 고민을 하는 기업들이 더 많아진 듯 하다"며 "점차 일반 기업들이 실제 비즈니스 도움이 될 수 있도록 AI를 사용하는 사례가 많아지고 있는 만큼, AI 인프라에 대한 시장의 관심도 더 커질 듯 하다"고 말했다. 그러면서 "AI 기술 발전으로 서버 신제품 발표 주기도 2년에 한 번 정도에서 최근에는 엔비디아의 움직임에 맞춰 6개월에 한 번으로 짧아질 정도로 빨라진 상황"이라며 "이에 따른 전력 소비, 냉각 등과 관련된 시스템을 잘 갖춰나가기 위해 노력 중인 만큼 많은 기업들이 우리 제품을 선택할 것으로 기대하고 있다"고 덧붙였다. 또 그는 "특히 국내에선 정부에서 국가 AI 컴퓨팅 센터를 추진하고 있는 만큼 실제 구체적인 사업을 진행할 때 우리 제품을 외면하지는 않을 것으로 보인다"며 "엔비디아뿐 아니라 AMD, 인텔 등 다양한 기업들의 GPU를 제공하며 고객들의 선택지를 많이 넓힌 만큼 '델 AI 팩토리'를 통해 시장 변화에 맞춰 탄력적으로 대응함으로써 시장 주도권을 유지하기 위해 더 노력할 것"이라고 강조했다.

2025.04.07 16:48장유미

엔비디아, 아프리카 최초 AI 데이터센터 건립…"디지털 독립성 강화"

엔비디아와 짐바브웨 기업이 아프리카 지역 개발자들의 GPU 접근성 향상과 디지털 독립성 강화를 위해 아프리카 대륙 최초의 인공지능(AI) 데이터센터 건립을 추진한다. 4일 CNN에 따르면 짐바브웨의 기업 카사바 테크놀로지스를 이끄는 스트라이브 마시위아 회장은 최근 엔비디아와 협력해 아프리카 대륙에 AI 팩토리를 구축한다고 발표했다. 양사 협력으로 오는 6월부터 엔비디아 GPU 기반 슈퍼컴퓨터 시스템이 남아프리카공화국에 위치한 카사바 테크놀로지스의 데이터센터에 배치된 후 이집트·케냐·모로코·나이지리아 등 다른 아프리카 국가 내 시설로도 배포될 예정이다. 현재 아프리카는 컴퓨팅파워 부족으로 전 세계 AI 시장에서 상대적으로 뒤처져 있다는 평가를 받는다. 아프리카 대륙 AI 개발자 커뮤니티인 진디(Zindi)에 따르면 아프리카 AI 실무자 중 5%만이 연구개발을 위한 충분한 컴퓨팅 리소스를 이용할 수 있는 것으로 조사됐다. 또 아프리카의 소득 수준에 비해 하드웨어(HW) 비용이 높다는 점도 AI 도입의 주요 장애물 중 하나다. 이 때문에 아프리카 지역 개발자들은 아마존웹서비스(AWS), 구글 클라우드, 마이크로소프트(MS) 애저와 같은 해외 클라우드 서비스에 대한 의존도가 높았다. 문제는 클라우드를 통한 지리적 지역 간 데이터 전송에도 많은 비용이 들고 시간도 오래 걸린다는 점이었다. 또 이같은 기술적 장애물 때문에 아프리카 언어와 방언 등 아프리카를 대표하는 AI 훈련 데이터셋이 부족하거나 편향성을 갖는 경우도 많았다. 이에 카사바 테크놀로지스는 엔비디아 GPU 기반 AI 데이터센터를 중심으로 아프리카 대륙 내 기업과 연구자가 안전한 환경에서 AI를 구축·훈련·확장·배포하는 데 필요한 컴퓨팅 성능에 액세스할 수 있도록 보장한다는 방침이다. 이번 엔비디아와 아프리카 기업 간 협력에 대해 비영리 단체 얼라이언스4AI의 알렉스 차도 이사는 "아프리카에는 대규모 GPU 클러스터가 없어 혁신가들의 발목을 잡고 있다"며 "엔비디아의 이번 발표는 GPU에 대한 접근성을 높여 대륙 전역에서 AI 혁명을 주도하는 데 도움이 될 것"이라고 기대했다. 이어 "이제 아프리카 개발자들은 대륙 내에서 데이터를 수집·처리할 수 있게 됐다"며 "아프리카의 빅테크가 AI 커뮤니티에 합류하고 투자함으로써 인재 양성에도 적극 나설 수 있게 되는 등 생태계 전반의 혁신을 가속화할 것"이라고 덧붙였다. 스트라이브 마시위아 회장은 "자사의 AI 팩토리는 혁신이 확장될 수 있는 인프라를 제공해 아프리카 기업, 스타트업 및 연구원들이 최첨단 AI 인프라에 접근할 수 있도록 지원할 것"이라고 밝혔다.

2025.04.04 15:32한정호

트럼프 관세폭탄에 HP·애플 등 美 PC 제조사 '직격탄'

매년 전 세계 완제 PC 출하량(2억 6천만 대) 중 25% 가량인 7천만 대 가량(시장조사업체 IDC 기준)을 소화하는 미국 PC 시장에 적신호가 켜졌다. 2일(이하 현지시각) 도널드 트럼프 2기 행정부가 중국과 베트남, 한국 등 주요 PC 완제품·부품 생산 국가에 오는 9일부터 각각 54%, 46%, 25%의 상호관세 부과를 예고했기 때문이다. 이는 타 시장 대비 미국에서 판매되는 PC 제품 가격만 높이는 결과를 낳을 것이란 지적이다. 2020년 코로나19 범유행 당시 도입된 기기 교체 수요, 오는 10월 윈도10 지원종료를 앞둔 교체 수요를 기대했던 PC 업계에도 큰 악재다. 세계 3위 PC 제조사인 HP는 오는 10월까지 북미 지역에 공급할 PC 생산 거점을 중국 밖으로 이전해 관세 부담을 줄일 예정이다. 대부분의 PC 제품을 중국에서 생산하는 애플이 공급망 대상 단가 인하 압박에 나설 것이라는 관측도 나온다. PC 최종 생산 국가 따라 관세 달라져 현재 PC 산업은 디스플레이 패널(한국·중국·대만산), 메모리·SSD(한국·대만·중국산), 프로세서(대만·베트남·말레이시아산) 등 다양한 나라에서 생산한 부품을 공급받아 한 곳에서 조립한 후 완성하는 구조다. 미국 연방통계청에 따르면 미국은 지난 해 데스크톱·노트북 컴퓨터 완제품과 각종 부품을 포함해 1천385억 달러(약 201조 6천837억원) 상당을 수입했다. 관세가 없는 미국에서 최종 제품을 생산한다 해도 각 부품의 생산 국가별 관세까지 피할 수 없다. 북미 지역에서 여러 부품을 모아 고성능 PC를 판매하는 업체인 퓨젯시스템은 지난 달 말 "대부분이 중국에서 생산되는 네트워크와 스토리지 컨트롤러, 프로세서 냉각장치와 냉각팬 등 부품은 최대 20% 오를 것"이라고 밝혔다. PC용 프로세서·반도체는 상호관세 유예? 도널드 트럼프 행정부는 3일 상호관세 유예 대상으로 PC용 반도체와 의약품, 광물 등 일부 폼목을 꼽았다. 미국 내 PC 제조사들은 프로세서와 GPU 등 핵심 제품 물량 중 거의 대부분을 대만에서 생산하는 엔비디아와 AMD, 퀄컴과 SK하이닉스, 삼성전자가 생산한 한국산 메모리·SSD 구매시 당장은 관세를 적용받지 않는다. 로이터통신은 백악관 고위 관리를 인용해 "이들 제품은 오는 9일부터 발효되는 상호관세 대상 품목에서는 제외되지만 대신 별도 관세 체계를 적용받을 것"이라고 보도했다. 트럼프 대통령은 3일 마이애미로 이동하는 기내에서 기자들과 만나 "반도체 관세가 곧 부과될 것. 의약품 관세는 별도의 범주"라며 "가까운 시일 내에 발표할 것이고, 현재 검토하는 과정에 있다"고 말했다. HP "북미 공급 제품 생산 거점 중국 밖으로" 글로벌 PC 제조사는 트럼프 2기 행정부가 가장 비싼 관세를 매기는 중국 대신 다른 국가로 생산 거점을 옮길 전망이다. 엔리케 로레스 HP CEO는 지난 1일 해외 생산 공장에서 중국이 차지하는 비중을 줄일 것이라고 설명했다. 그는 "회계연도가 끝나는 10월 경에는 북미 지역에서 판매하는 HP 제품의 90% 이상이 중국 이외 지역에서 생산될 것으로 기대한다"고 밝혔다. 그는 "중국은 북미 지역을 제외한 나머지 지역을 위한 중요한 제조 허브 국가로 남을 것이며 미국 정부의 대 중국 관세 역시 전망에 포함하고 있다"고 밝혔다. 궈밍치 "애플 생산 거점, 脫 중국 가속" 전망 애플은 맥북에어·맥북프로와 맥미니 생산량 중 90% 이상을 폭스콘 등 ODM 업체 중국 공장에서 조립생산한다. 중국은 54%, 인도는 26%, 베트남은 46%의 관세를 적용받는다. 애플 공급망에 정통한 궈밍치 홍콩 텐펑증권 애널리스트는 3일 "인도와 베트남은 미국의 관세 예외 조치에 해당할 확률이 더 크며 이는 애플이 생산 거점을 중국 밖으로 옮기는 작업을 가속할 것"이라고 전망했다. 그는 또 "애플이 공급망 관련 업체들을 압박해 관세로 인한 가격인상 부담을 줄이는 방법을 택할 수도 있으며 이는 주요 공급업체의 공급 단가 인하 압박으로 작용할 것"이라고 전망했다.

2025.04.04 09:42권봉석

"GPU 72장 돌려야 답 나온다"…엔비디아, AI 추론 '끝판왕' 내놔

엔비디아가 복잡한 사고력 기반 AI 모델 확대에 맞춰 새로운 추론 성능 전략을 공개한다. 점점 더 많은 연산을 요구하는 AI 모델 등장에 따른 글로벌 평가 기준 변화에 선제 대응하려는 조치다. 3일 업계에 따르면 엔비디아는 지난 1일 정오 온라인으로 진행한 프리브리핑에서 AI 성능 벤치마크인 '엠엘퍼프(MLPerf)' 추론 AI 부문의 변화에 대응하기 위한 기술 전략을 공개했다. 이번 행사는 국제 컨소시엄 엠엘커먼스(MLCommons)가 '사고 기반 AI'인 추론 모델을 평가 항목에 포함하려는 움직임에 초점을 맞췄다. 엠엘퍼프는 AI 모델의 훈련(training)과 추론(inference) 성능을 하드웨어·소프트웨어 통합 기준으로 측정하는 글로벌 표준 벤치마크다. 엠엘커먼스가 주도하는 이 평가 항목은 업계 기술 흐름에 따라 주기적으로 갱신된다. 최근에는 단순 예측을 넘어 복잡한 추론과 의사결정을 요구하는 리즈닝 모델이 AI 기술의 중심으로 떠오르면서 해당 항목의 공식 도입 논의가 본격화되고 있다. 엔비디아는 아직 리즈닝 모델 항목이 공식 도입되지는 않았지만 차기 엠엘퍼프 버전에서는 채택 가능성이 높다고 판단하고 있다. 이를 선제적으로 대비하기 위해 회사는 중국의 AI 스타트업인 딥시크가 개발한 생성형 AI 모델을 활용해 복잡한 사고 기반 작업에서의 추론 성능을 시연했다. 이처럼 복잡한 추론 모델이 확산되면서 AI 추론 환경 전반에도 근본적인 변화가 일고 있다. 추론 연산량이 전례 없이 폭증하고 있는 상황에서 과거에는 단일 그래픽처리장치(GPU)나 단일 노드에서 충분했던 작업들이 이제는 다수 GPU를 동시 투입하는 복잡한 병렬 연산 없이는 처리할 수 없다는 것이 엔비디아의 분석이다. 이에 더해 추론 모델의 확산은 AI 개발의 모든 단계에서 연산 자원의 수요를 급격히 증가시키고 있다. 엔비디아는 모델 재학습(retraining), 도메인 맞춤화(post-training), 테스트 시점 확장(test-time scaling) 등에서 연산량이 기하급수적으로 늘고 있다고 분석했다. 특히 테스트 단계에서도 추론 정확도를 높이기 위한 병렬 연산 수요가 계속해서 증가하고 있다는 점을 강조했다. 이에 이날 엔비디아는 고성능 시스템 예시로 'GB200 MBL'을 제시했다. 해당 시스템은 총 72개의 GPU를 동시 연동하며 복잡한 추론을 빠르게 처리할 수 있도록 설계됐다. 회사는 이러한 대규모 병렬 환경이 향후 추론 표준이 될 것으로 보고 있다. 엠엘커먼스 역시 추론 모델을 엠엘퍼프의 공식 평가 항목에 포함하기 위한 논의를 본격적으로 시작한 상황이다. 현재 다양한 기술 커뮤니티와 협업을 통해 평가 기준과 워크로드 확장을 준비하고 있다. 공식 도입 시점은 아직 정해지지 않았으나 실증 사례와 모델 테스트가 계속 이어지고 있어 연내 도입이 확정될 가능성도 있다. 엔비디아 관계자는 "모델의 크기와 지능이 커짐에 따라 연산량이 모든 단계에서 폭증하고 있다"며 "재학습, 도메인 최적화, 테스트 시점 스케일링 모두 고성능 GPU를 요구한다"고 설명했다. 이어 "72개의 GPU처럼 다수의 칩을 동시에 작동시켜야 하는 이유가 바로 이 때문"이라고 덧붙였다.

2025.04.03 01:00조이환

구독형 GPU 사업에 사활 건 SKT, '이 기업' 손잡고 AI 인프라 시장 입지 강화 모색

아이티센과 SK텔레콤이 서비스형 GPU(GPU as a Service, GPUaaS) 사업 확대를 위해 손을 맞잡고 기업과 공공기관이 인공지능(AI) 기술을 보다 효율적으로 도입하고 활용할 수 있도록 지원에 나선다. 아이티센은 SK텔레콤과 인공지능(AI) 사업 협력을 위한 양해각서(MOU)를 체결했다고 27일 밝혔다. 이번 협약을 통해 양사는 GPUaaS 및 AI 클라우드 매니저(AI Cloud Manager) 사업을 공동 추진한다는 방침이다. 또 차별화된 클라우드 기반 AI 서비스를 통해 AI 인프라 시장에서 입지를 확장하고, 데이터 주권을 강화한 생성형 AI 생태계를 조성하는 것을 목표로 내세웠다. GPUaaS는 AI 및 머신러닝(ML) 워크로드를 위한 고성능 GPU 인프라를 클라우드 기반으로 제공하는 서비스로, 기업들이 필요에 따라 GPU 자원을 유연하게 활용할 수 있도록 지원한다. 아이티센은 SK텔레콤이 추진 중인 최신 GPU 기반 GPUaaS 사업에 협력한다. 다양한 고객 경험을 바탕으로 기업의 서비스 요건과 AI 워크로드에 맞춘 비용 효율적인 생성형 AI 인프라 구축을 도울 예정이다. 이를 통해 기업들은 AI 인프라를 신속하게 도입하고 AI 모델 학습·운영 속도 및 추론 비용 효율을 개선할 수 있다. 또 초기 투자 비용을 절감하면서도 고성능 GPU 연산을 유연하게 활용할 수 있는 클라우드 서비스를 제공받을 수 있다. 강진모 아이티센 회장은 "SK텔레콤이 보유한 선도적인 AI 인프라 및 솔루션의 판매를 강화하기 위해 자사의 파트너 에코시스템을 적극 활용할 것"이라며 "클라우드 네이티브 아키텍처 기반 AI 인프라 구축 및 운영 노하우, 다양한 고객 니즈에 맞춘 맞춤형 솔루션 제공 역량을 활용해 AI 사업 협력을 지속적으로 확대할 계획"이라고 밝혔다. 아이티센과 SK텔레콤은 향후 GPU 기반 AI 인프라 확장과 시장 활성화를 위한 공동 프로젝트를 추진할 예정이다. 또 다양한 산업 분야에서 고객의 업무를 지원하고 AI 기반 인프라 및 서비스 생태계를 공동 구축하는 등 AI 사업 협력을 지속 확대할 계획이다. 하민용 SK텔레콤 부사장은 "자사는 고성능 GPU를 기반으로 한 GPUaaS 사업을 확장하고자 한다"며 "이번 아이티센과의 협력이 공공과 금융, 클라우드 분야에 있어 AI 인프라 영향력을 확대할 수 있는 기회가 될 것"이라고 강조했다.

2025.03.27 11:17장유미

슈퍼마이크로, 엔비디아 GPU 지원 서버 제품군 확대…"AI 모델 추론 극대화"

슈퍼마이크로가 인공지능(AI) 워크로드 처리 성능을 극대화할 수 있는 엔비디아 GPU 지원 제품군을 선보인다. 슈퍼마이크로는 새로운 엔비디아 'RTX 프로 6000 블랙웰 서버 에디션' GPU 지원과 워크로드 최적화 GPU 서버·워크스테이션 제품군을 확장했다고 26일 밝혔다. 슈퍼마이크로의 새로운 제품군은 엔비디아 블랙웰 세대 PCIe GPU에 최적화돼 더 많은 기업이 ▲거대언어모델(LLM) 추론 ▲미세조정 ▲에이전틱 AI ▲시각화 ▲그래픽·렌더링 ▲가상화 등에 가속 컴퓨팅을 활용할 수 있도록 지원한다. 슈퍼마이크로의 많은 GPU 최적화 시스템은 엔비디아 인증을 획득했으며 AI 개발과 프로세스 단순화를 위해 엔비디아 AI 엔터프라이즈에 대한 호환성과 지원을 보장한다. 찰스리앙(Charles Liang) 슈퍼마이크로 최고경영자(CEO)는 "자사는 다양한 엔터프라이즈 환경에서 구축할 수 있는 광범위한 애플리케이션 최적화 GPU 서버 제품군을 매우 짧은 리드타임으로 제공한다"며 "엔비디아 RTX 프로 6000 블랙웰 서버 에디션 GPU를 지원함으로써 데이터센터부터 지능형 엣지까지 최신 가속 컴퓨팅 기능을 구현하려는 고객에게 새로운 차원의 성능과 유연성을 제공한다"고 말했다. 이어 "자사의 광범위한 PCIe GPU 최적화 서버는 엔비디아 2-웨이(way) 및 4-웨이 NV링크 환경에서 엔비디아 H200 NVL을 지원한다"며 "최첨단 AI 모델의 추론 성능을 극대화하고 고성능 컴퓨팅(HPC) 워크로드를 가속할 것"이라고 설명했다. 엔비디아 RTX 프로 6000 블랙웰 서버 에디션은 AI와 그래픽 워크로드 모두에 최적화된 범용 GPU다. 기존 엔비디아 L40S 대비 GDDR7 메모리 속도가 빨라지고 메모리 용량이 두배로 늘어나는 등 성능이 크게 향상됐다. 또 PCIe 5.0 인터페이스를 지원해 GPU와 CPU 사이의 통신 속도도 빨라졌다. 새로운 멀티 인스턴스 GPU 기능을 통해 GPU 하나를 공유할 수 있는 완전 분리된 인스턴스 수도 최대 4개까지 확장됐다. 슈퍼마이크로 GPU 최적화 서버는 블루필드-3와 커넥트X-8과 같은 엔비디아 슈퍼NIC을 지원하도록 설계됐으며 엔비디아의 퀀텀 인피니밴드와 스펙트럼 이더넷을 활용해 인프라 확장과 GPU 클러스터링을 제공한다. 밥 피트(Bob Pette) 엔비디아 엔터프라이즈 플랫폼 담당 부사장은 "RTX 프로 6000 블랙웰 서버 에디션은 AI와 비주얼 컴퓨팅을 위한 최고의 데이터센터 GPU"라며 "가장 까다로운 워크로드에서도 전례 없는 가속 성능을 제공한다"고 말했다. 이어 "슈퍼마이크로의 광범위한 엔비디아 가속 시스템에 RTX 프로 6000 블랙웰 서버 에디션이 추가됨으로써 AI 개발·추론을 포함한 대부분의 워크로드 속도를 높일 수 있게 됐다"고 덧붙였다.

2025.03.26 17:19한정호

HP, 고성능·AI 결합 게임용 노트북 '오멘 맥스 16' 출시

"지난 해 국내 PC 시장에서 2년 전 대비 게임용 PC 비율은 10% 늘어났고 완제 PC 출하량 역시 25% 상승했다. HP는 2021년부터 국내 게이밍 시장에 투자해 왔고 이번에 출시할 '오멘 맥스 16'은 그간 미비했던 하드코어 게이머를 겨냥한 제품이다." 25일 오전 서울 여의도 HP코리아 사무실에서 진행된 간담회에서 소병홍 HP코리아 퍼스널 시스템 카테고리 전무가 이렇게 설명했다. HP코리아가 이날 국내 출시한 오멘 맥스 16은 국내를 포함해 전세계 하드코어 게이머를 겨냥해 인텔 코어 울트라 200HX(애로우레이크) 프로세서와 엔비디아 지포스 RTX 50 시리즈 GPU, 고효율 냉각 구조 등을 적용했다. 코어 울트라 200HX+엔비디아 새 GPU 결합 오멘 맥스 16은 인텔이 지난 1월 공개한 노트북용 프로세서인 코어 울트라 200HX(애로우레이크)를 탑재했다. 최대 24코어 CPU 타일을 기반으로 전세대(14세대 코어 프로세서) 대비 소모 전력을 줄이면서 1코어(싱글스레드) 성능은 최대 5%, 다중작업(멀티스레드) 성능은 최대 20% 높였다. 이달 초 진행된 국내 행사에서 박승재 인텔코리아 상무는 "더 높은 외장 그래픽 성능을 원하는 전문가를 위해 고성능 외장 GPU를 탑재한 제품도 이달 말 출시 예정"이라고 설명한 바 있다. 오멘 맥스 16은 인텔 예고대로 엔비디아 지포스 RTX 5080 GPU를 내장했다. 엔비디아 옵티머스 기술로 배터리 작동과 게임·그래픽 성능 등 필요에 따라 프로세서 내장 GPU와 RTX 5080을 번갈아 쓸 수 있다. 액체 금속으로 냉각 성능 강화... 냉각팬 먼지도 자동 청소 게임용 PC, 특히 노트북에 가장 큰 영향을 미치는 것은 프로세서와 GPU 등이 장시간 작동시 내부에서 발생하는 열이다. 이를 식히기 위해 냉각팬이 작동하지만 시간이 지나며 내부에 먼지가 쌓이고 냉각 성능이 저하된다. 오멘 맥스 16은 메인보드의 60%에 가까운 영역을 덮는 증기 챔버를 적용하고 프로세서와 GPU 표면을 덮는 부분에 액체 금속을 적용해 장시간 고성능 작동 시 발생하는 발열 문제를 완화했다. 냉각팬에 먼지가 쌓이는 문제는 인텔과 함께 개발한 팬클리너 시스템으로 해결했다. 냉각팬 회전 방향을 4시간마다 반대로 돌려서 자동으로 먼지를 떨어내고 냉각팬 수명을 연장한다. 게임 설정 자동 최적화 '오멘 AI' 탑재 오멘 맥스 16은 게임 관련 설정을 통합 관리하는 소프트웨어 '오멘 게이밍 허브'에 AI 기반 최적화 기능 '오멘 AI'를 내장했다. 이 기능은 머신러닝 기반으로 각종 설정값을 학습했다 초당 프레임 수(fps)를 최적화할 수 있는 방향으로 그래픽 품질과 수준, 해상도를 자동 조절한다. 여러가지 복잡한 설정을 소비자가 직접 조절하며 시행착오를 겪을 필요가 없다는 것이 가장 큰 장점이다. HP코리아 관계자는 "현재 오멘 AI는 베타버전이며 카운터스트라이크2(CS2)만 지원한다. 지원 게임을 발로란트 등 다른 게임으로 차차 확대할 것"이라고 설명했다. "게임용 PC 판매, 외부 요인 영향 적을 것" HP코리아는 2023년경부터 2년 이상 국내 게이밍 완제PC 분야에서 30% 이상의 시장점유율을 차지하고 있다(한국IDC, 수량 기준). 그러나 지난 해 12.3 비상계엄 사태 이후 소비 심리 위축이 뚜렷한데다 노트북 성수기 이후 제품이 출시돼 올해 상황은 여의치 않다. 소병홍 HP코리아 전무는 "올해 시장이 쉽지 않을 것이지만 게임용 고성능 PC 시장은 엔비디아 RTX 50 시리즈 GPU 출시에 따른 업그레이드 수요 등으로 일반 PC 대비 시장의 영향을 조금 덜 받을 것"이라고 전망했다. 오멘 맥스 16 출고가는 429만원부터 시작한다. 게임용 고성능 PC 가격 상승세가 가파르다는 지적에 소병홍 전무는 "메모리와 SSD 가격은 하락한 반면 새 프로세서와 GPU로 가격이 상승하는 경향이 있지만 경쟁사 동급 제품 대비 큰 차이는 없다고 본다"고 답했다.

2025.03.25 14:05권봉석

720兆 '스타게이트' 이끄는 오픈AI, 첫 데이터센터에 엔비디아 AI 칩 40만개 투입하나

일본 소프트뱅크, 오라클과 손잡고 '스타게이트' 프로젝트를 추진 중인 오픈AI가 첫 번째 데이터센터 단지에 엔비디아의 인공지능(AI) 칩을 최대 40만 개까지 수용할 수 있는 공간을 마련한다. AI 칩 구입에만 대규모 자금이 투입될 예정으로, 엔비디아에 호재가 될 전망이다. 19일 블룸버그통신에 따르면 오픈AI는 미국 텍사스주 애빌린에 오는 2026년 중반께 지어질 첫 번째 데이터센터에 1천억 달러 규모를 투입할 예정이다. 크루소라는 개발사가 맡게 된 이 시설은 1.2기가와트 용량의 전력을 사용할 것으로 알려졌다. 이와 관련된 구체적인 개발 계획은 오는 25일 발표될 것으로 전해졌다. 이 시설은 수십만 개의 고급 AI 칩을 지원할 수 있을 만큼 규모가 크지만, 얼마나 많은 칩이 투입될 지는 정확하게 알려지지 않았다. 다만 블룸버그통신은 지난 6일 오픈AI가 '스타게이트' 프로젝트에 따라 건설 중인 첫 번째 데이터센터에 엔비디아의 GB200 반도체 6만4천 개가 탑재될 것이라고 보도해 주목 받은 바 있다. GB200은 엔비디아의 최신 AI 칩 '블랙웰' 그래픽처리장치(GPU) 2개와 중앙처리장치(CPU) 그레이스 1개를 탑재한 AI 가속기다. 엔비디아가 GB200의 공식 가격을 밝히지는 않았지만, 직전 모델의 가격은 개당 3만~4만 달러에 판매됐다는 점에서 수십억 달러 상당이 AI 칩 구매 비용으로 투입될 것으로 예상됐다. 오픈AI와 오라클은 올해 여름까지 전체의 4분의 1인 1만6천 개의 GB200을 탑재한다는 계획을 세운 것으로 전해졌다. 단일 데이터센터에 이 정도 규모의 AI 가속기를 탑재하는 건 매우 이례적인 것으로 평가됐다. 앞서 오픈AI는 오라클, 소프트뱅크와 함께 스타게이트 프로젝트를 발표하고 향후 4년간 최대 5천억 달러(약 720조원)를 투자한다고 발표했다. 이에 따라 현재 텍사스주 애빌린에 건설 중인 첫 번째 데이터센터 외에도 펜실베니아주, 위스콘신주, 오리건주 등에서 부지를 검토하고 있다. 개발사인 크루소는 "현재 약 2천 명이 이 프로젝트 건설에 참여하고 있고 향후 5천 명까지 늘릴 계획"이라며 "8개의 데이터센터 건물이 건설될 예정으로, 각 건물에는 최대 5만 개의 엔비디아 GB200 반도체를 수용할 수 있도록 설계될 것"이라고 밝혔다. 이처럼 오픈AI가 첫 번째 데이터센터에 엔비디아 AI 칩을 최대 40만 개까지 수용할 경우 전 세계에서 가장 큰 규모의 AI 컴퓨팅 파워 클러스터를 갖게 될 것으로 보인다. 오픈AI는 '스타게이트' 프로젝트를 통해 '챗GPT' 고급 AI 모델에 필요한 물리적 인프라를 제공 받을 예정이다. 또 오라클은 '스타게이트' 프로젝트를 위해 자사 애빌린 지사의 전체 빌드를 활용하는 데 동의한 것으로 알려졌다. 오픈AI는 현재 이 시설에서 약 1기가와트 용량의 전력을 사용할 계획인 것으로 전해졌다. 이와 관련해 개발사인 크루소와 오픈AI, 오라클은 별도의 언급을 하지 않고 있다. 이에 맞서 오픈AI를 가장 많이 견제하고 있는 일론 머스크 테슬라 최고경영자(CEO)는 자신이 설립한 xAI의 역량 강화를 위해 최근 멤피스에 있는 슈퍼컴퓨터용 AI 서버 확보를 위해 델 테크놀로지스와 50억 달러 규모의 계약을 체결했다. 이를 통해 엔비디아 H100 60만 개에 해당하는 컴퓨팅 성능을 갖출 계획이다. 또 AI 클라우드 제공업체인 코어위브도 이달 초 32개 데이터센터에 25만 개 이상의 엔비디아 GPU를 보유하고 있다고 밝혀 눈길을 끌었다. 블룸버그통신은 "스타게이트는 엔비디아의 최신 칩 역량을 강화하기 위한 빅테크 기업들의 경쟁에 합류했다"고 평가했다. 업계 관계자는 "스타게이트 프로젝트 외에 최근 테크 업체들이 잇따라 대규모 데이터센터를 건설함에 따라 중국 AI 기업 딥시크로 인해 발생된 충격으로 일각에서 제기됐던 고성능 AI 칩 수요 감소에 대한 우려도 해소되는 분위기"라며 "엔비디아의 고성능 칩 수요 품귀 현상은 당분간 지속될 전망"이라고 밝혔다.

2025.03.19 09:58장유미

엔비디아, 루빈 울트라·파인만 AI칩 공개…"차세대 HBM 탑재"

엔비디아가 인공지능(AI) 반도체 산업의 주도권을 유지하기 위한 차세대 GPU를 추가로 공개했다. 오는 2027년 HBM4E(7세대 고대역폭메모리)를 탑재한 '루빈 울트라'를, 2028년에는 이를 뛰어넘을 '파인만(Feynman)' GPU를 출시할 예정이다. 파인만에 대한 구체적인 정보는 아직 공개되지 않았지만, '차세대 HBM(Next HBM)'을 비롯해 다양한 혁신 기술이 적용될 것으로 전망된다. 18일(현지시간) 젠슨 황 엔비디아 최고경영자(CEO)는 미국 실리콘밸리 새너제이 컨벤션 센터에서 열린 연례행사인 'GTC 2025' 무대에 올라 AI 데이터센터용 GPU 로드맵을 발표했다. 이날 발표에 따르면, 엔비디아는 최신형 AI 가속기인 '블랙웰' 시리즈의 최고성능 제품인 '블랙웰 울트라'를 올해 하반기 출시한다. 해당 칩은 12단 HBM3E(5세대 HBM)를 탑재했으며, AI 성능을 이전 세대 대비 1.5배 높인 것이 특징이다. 이어 엔비디아는 HBM4를 탑재한 '루빈' 시리즈를 내년 하반기 출시한다. 루빈부터는 기존 '그레이스' CPU가 아닌 '베라' CPU가 채용된다. 루빈의 최고성능 제품인 루빈 울트라는 내후년인 2027년 하반기께 출시가 목표다. 루빈 울트라에는 HBM4E가 채용돼, 메모리 성능이 블랙웰 울트라 대비 8배나 늘어난다. 그동안 드러나지 않았던 차차세대 AI 가속기에 대한 정보도 공개됐다. 엔비디아는 루빈 이후의 제품명을 파인만으로 확정했다. 미국의 저명한 이론 물리학자인 리처드 파인만에서 이름을 따왔다. 엔비디아는 파인만에 대해 차세대 HBM(Next HBM)을 탑재한다고 기술했다. 다만 구체적인 세대명은 공개하지 않았다. 파인만은 오는 2028년 출시될 예정이다.

2025.03.19 08:43장경윤

"삼성SDS도 신뢰한 AI 팩토리"…델-엔비디아, 기업용 AI 시장 공략 '박차'

델 테크놀로지스가 엔비디아와 손잡고 인공지능(AI) 인프라를 전면 업그레이드한다. 기업들의 AI 도입 장벽을 낮추고 혁신 속도를 끌어올려 시장 경쟁력을 강화하려는 행보다. 델 테크놀로지스는 18일 온라인 미디어 브리핑에서 '엔비디아 기반 델 AI 팩토리'의 최신 포트폴리오를 공개했다. 엔비디아의 'GTC 2025'와 동시에 열린 이번 간담회에서는 엔비디아와 델의 협력 성과가 집중 조명됐다. 델은 AI PC, 서버, 스토리지, 네트워킹 등 AI 인프라 전반을 아우르는 신제품을 대거 선보였다. 이날 발표를 진행한 바룬 차브라 델 인프라 및 텔레콤 마케팅 수석 부사장은 AI의 본격적인 산업 적용이 시작되면서 기업들은 AI 도입에 있어 여러 장애물을 마주하고 있는 점을 지적했다. 차브라 부사장에 따르면 현재 기업들은 ▲비용 통제 ▲데이터 관리 ▲기존 시스템과의 통합 ▲전문 인력 부족을 주요 도전 과제로 직면해 전체 중 77%의 기업이 AI 인프라 구축을 위해 '단일 벤더'를 선호하고 있다. 이에 따라 델은 엔비디아와의 협력을 통해 이 같은 시장 수요를 적극 공략할 계획이다. 실제로 델은 이번 브리핑에서 AI PC 시장 공략을 위한 신제품을 대거 선보였다. '델 프로 맥스 AI PC' 라인업에는 엔비디아의 최신 '그레이스 블랙웰' 아키텍처가 적용됐다. 기존 데이터센터에서만 활용되던 AI 개발용 그래픽처리장치(GPU) 성능을 데스크톱에서도 구현한 것이 특징이다. 연구자와 개발자를 위한 소형 워크스테이션뿐 아니라 784기가바이트(GB) 메모리와 20페타플롭스(PFLOPS) 성능을 갖춘 고성능 AI 개발용 PC도 함께 공개됐다. 데이터센터 부문에서도 델과 엔비디아의 협력은 강화된다. 차브라 부사장에 따르면 델은 엔비디아의 최신 블랙웰 GPU와 커넥트X8 슈퍼닉스를 지원한다. 특히 곧 출시될 '델 파워엣지 XE 8712(PowerEdge XE8712)' 서버는 노드당 2개의 그레이스 CPU와 4개의 블랙웰 GPU를 탑재해 데이터센터 내 AI 성능을 극대화할 것으로 예상된다. 한 랙에 144개의 GPU를 수용할 수 있어 초고밀도 AI 연산 환경을 구축할 수 있다. AI 데이터 관리 역시 델의 핵심 혁신 분야 중 하나다. 이를 위해 '델 AI 데이터 팩토리 위드 엔비디아(Dell AI Factory with NVIDIA)'는 기업들이 AI 데이터를 더 빠르게 처리하고 보다 안전하게 보호할 수 있도록 설계됐다. 이 플랫폼은 대량의 데이터를 실시간으로 받아들이는 데이터 인제스천 기능을 지원하며 GPU 가속 기반 '스파크 쿼리'를 활용해 기존 대비 최대 220% 향상된 속도로 데이터를 분석하고 처리할 수 있다. 차브라 부사장은 "AI의 성능을 극대화하려면 데이터를 빠르게 처리하고 안전하게 보관하는 것이 필수"라며 "우리 AI 데이터 팩토리는 대규모 AI 워크로드를 보다 효율적으로 운영할 수 있도록 설계돼 기업들의 AI 도입 속도를 한층 끌어올릴 것"이라고 설명했다. AI 소프트웨어 분야에서도 델과 엔비디아의 협력은 이어지고 있다. 델은 '에이전트 AI' 시스템 개발을 지원하는 엔비디아의 AI 개발 프레임워크인 '에이전틱 AI'와 이를 위한 AI 최적화 도구를 AI 팩토리에 통합했다. 이에 따라 기업들은 AI가 단순한 질의응답을 넘어 스스로 의사 결정을 내릴 수 있는 시스템을 구축할 수 있게 됐다. 회사는 AI 인프라 구축뿐만 아니라 AI 네트워킹 및 배포 서비스도 강화하고 있다. 네트워크 최적화, GPU 서버 구축, 다중 벤더 환경 통합 등 다양한 AI 전문 서비스를 제공하며 AI 프로젝트의 초기 단계부터 운영까지 전 과정을 지원한다. 이같이 AI 도입이 빠르게 확산되면서 델과 엔비디아의 협력도 지속적인 탄력을 받고 있다. 양사는 지난해 GTC에서 '델 AI 팩토리 위드 엔비디아'를 공개한 이후 지난 1년간 100개 이상의 신규 AI 제품을 출시하고 2천 개 이상의 고객을 확보했다. 특히 삼성SDS는 델과 협력해 AI 팩토리를 구축했으며 이를 통해 모델 정확도를 98%까지 향상시키고 업무 생산성을 70% 이상 개선한 것으로 알려졌다. 스콧 구 삼성SDS 클라우드 서비스 사업부문 부사장은 델-엔비디아 협력을 두고 "우리는 모든 고객을 위한 AI 팩토리를 구축하고 있다"며 "이를 서비스 형태로 안전하게 제공하거나 고객의 자체 환경에 배포할 수 있도록 하고 있다"고 말했다. 향후에도 델은 엔비디아와 협력해 AI 시장에서의 입지를 더욱 강화할 계획이다. 바룬 초프라 델 수석 부사장은 "우리는 엔비디아와 AI 도입을 가속화할 수 있는 완벽한 파트너"라며 "AI 생태계 전반에서 기업들이 혁신을 실현할 수 있도록 지원할 것"이라고 강조했다.

2025.03.19 08:32조이환

엔비디아 'GTC 2025' 개막...젠슨 황 입 주목

엔비디아가 생성형 인공지능(AI)과 고성능 컴퓨팅 미래 비전을 제시한다. 엔비디아는 17일부터 21일(현지시간)까지 미국 캘리포니아 산호세에서 'GPU 테크놀로지 컨퍼런스(GTC) 2025'를 개최해 AI 시대 필요한 차세대 그래픽처리장치(GPU)를 비롯한 AI 칩, 소프트웨어(SW) 플랫폼을 발표한다. 이번 행사는 세션 약 1천개, 연사 2천명, 전시 400개로 구성됐다. 젠슨 황 엔비디아 최고경영자(CEO)는 18일 오전 10시 SAP 센터에서 기조연설을 진행한다. 매년 글로벌 기술 업계는 황 CEO 발표 내용에 주목했다. 엔비디아는 이번 황 CEO 연설이 AI와 고성능 컴퓨팅 기술에 초점을 맞출 예정이라고 밝혔다. 로보틱스, 소버린 AI, AI 에이전트, 자동차 분야 관련 발표도 진행된다. 다수 외신은 이번 행사에서 블랙웰 칩 라인업 업그레이드 버전이 공개될 가능성이 크다고 봤다. 앞서 황 CEO는 최근 실적 발표에서 차세대 블랙웰 B300 시리즈 '블랙웰 울트라'가 올해 하반기 출시될 예정이라고 밝힌 바 있다. 블랙웰 울트라는 기존보다 더 높은 컴퓨팅 성능을 제공하며, 288GB 메모리를 탑재했다. 메모리 집약적인 AI 모델을 실행하고 학습하는 데 적합할 것이라는 평가를 받고 있다. 차세대 GPU 시리즈인 '루빈'도 이번 GTC에서 언급될 것이란 분석도 이어지고 있다. 루빈은 2026년 출시 예정이다. 테크크런치는 "이번 행사에 루빈 이후 제품에 대한 내용도 일부 공개될 전망"이라며 "루빈 울트라 GPU 혹은 루빈 다음 세대의 GPU 아키텍처일 수도 있다"고 봤다. 엔비디아는 '퀀덤 데이'를 통해 양자 컴퓨팅 전략도 제시한다. 양자 컴퓨팅 분야 주요 인사들과 양자 애플리케이션 개발을 위한 로드맵을 논의할 예정이다. 외신은 엔비디아가 올해 행사 성과가 비즈니스에 영향 미칠 것이라고 봤다. 초기 블랙웰 GPU 과열 문제와 미국 수출 통제로 인한 관세 우려가 엔비디아 주가 하락으로 이어진 바 있다. 여기에 중국 AI 스타트업 딥시크가 딥시크-R1 모델을 출시하면서 투자자들은 고성능 GPU 수요에 대한 우려를 표하고 있다. 이 외에도 엔비디아는 이번 GTC에서 글로벌 기업과 연구 기관, 정부와 맺은 전략적 협업 사례와 성과도 소개한다고 밝혔다. 개발자와 기술 전문가를 위한 교육 세션을 전년보다 확대했다. 또 데이터 보안 등 AI 윤리적 측면을 다룬 토론회도 진행될 예정이다. 엔비디아는 "이번 GTC는 AI와 가속 컴퓨팅 미래를 결정짓는 중요한 자리가 될 것"이라며 "기술 혁신을 선도하고 글로벌 산업의 발전을 이끄는 계기가 될 것"이라고 공식 홈페이지를 통해 밝혔다.

2025.03.16 09:21김미정

"AI 강국 위해 컴퓨팅 인프라 확충...GPU 조기 확보 절실"

한국이 AI 강국 G3로 도약하기 위해서는 컴퓨팅 인프라, 특히 GPU 확보가 '생존의 문제'라는 진단이 나왔다. 이에 정부와 산업계는 한목소리로 GPU 인프라 확충의 시급성을 강조하며 국회의 빠른 대응을 촉구했다. 송상훈 과학기술정보통신부 정보통신정책실장은 12일 국회 의원회관에서 정동영, 최형두 의원과 정보통신산업진흥원(NIPA) 주최로 열린 'AI G3 강국을 위한 신기술 전략 조찬 포럼'에서 "AI G3 강국으로 가기위해 여러가지 계획들을 신속하고 계획대로 집행해야 한다"며 "여야 국정협의체에서 진행되고 있는 추경이 신속하게 합의가 돼 예산이 계획대로 집행될 수 있도록 뜻을 모아달라"고 촉구했다. 최근 정부는 AI 강국 도약을 위한 대규모 컴퓨팅 인프라 확충 계획을 발표했다. 특히 AI 모델 개발에 필수적인 GPU(그래픽처리장치) 확보에 총력을 기울이겠다는 방침이다. 송 실장은 "최근 글로벌 AI 패권 경쟁은 딥시크 돌풍으로 새로운 국면에 진입하고 있다"며 "중국 스타트업 딥시크의 혁신을 새로운 기회로 삼아 우리나라 가용 자원을 총 결집하여 국가 AI 역량을 한 단계 도약시켜야 한다"고 강조했다. 현재 한국은 AI 인프라가 부족한 상황이다. 송 실장은 "천문학적 자본을 앞세운 빅테크들의 AI 인프라 확충 전쟁 속에서 우리 연구자와 기업들은 인프라 부족을 호소하고 있다"며 "선도국 대비 1년 이상의 기술 격차가 있다"고 진단했다. 정부, AI 3대 전략 발표...인프라·모델·전환 가속화 추진 정부는 ▲AI 컴퓨팅 인프라 확충 ▲차세대 AI 모델 개발 ▲AI 전환 가속화라는 3대 전략을 수립했다. 송 실장은 "이 전략들을 바탕으로 글로벌 탑 수준의 AI 모델을 세계 최고 수준의 인재가 개발할 수 있도록 정부는 적극 지원하겠다"며 "개발된 우리의 AI 모델로 신성장과 신시장을 발굴하고 산업·공공 분야 적용을 통해 국가 AI 전환을 가속화하겠다"고 밝혔다. 정부는 2026년 상반기까지 총 1.8만 장의 첨단 GPU를 확보할 계획이며, 이 중 1만 장은 민관 협력을 통해 연내에 확보해 국가 AI 컴퓨팅 센터를 조기에 가동한다는 방침이다. 송 실장은 "당장 현장의 시급한 AI 컴퓨팅 수요에 대응하기 위해 광주 AI 데이터센터, 민간 클라우드 등 국내에서 보유하고 있는 GPU 자원의 AI 기업 활용을 우선 지원하겠다"고 밝혔다. 또한 2030년까지 국가 AI 컴퓨팅 센터 내 국산 AI 반도체 비중을 50%까지 끌어올릴 예정이다. 민간 투자 촉진을 위해 AI를 국가 전략 기술로 지정해 세제 지원을 강화하고, 비수도권 AI 데이터센터 설치 시 전력 개통 기간 단축, 입지 다변화, 시설 설치 기준 최소화 등 제도 개선도 추진한다. 송 실장은 "지난 6월 조세특례제한법 개정으로 AI 인프라 투자에 대한 세제 지원이 강화됐다"며 "앞으로도 전력과 입지·시설 관련 제도 개선을 지속적으로 추진하겠다"고 설명했다. 이와 함께 '월드 베스트 AI팀' 프로젝트를 통해 정예팀을 선발하고 단기간에 글로벌 탑 수준의 LLM을 개발할 수 있도록 지원하며, '글로벌 AI 챌린지' 개최로 최고 인재를 발굴하고 1조 원 규모의 범용 인공지능 R&D도 추진한다. 아울러 교육, 법률, 의료 등 분야별 특화 생성형 AI 개발과 국산 AI 모델의 초기 시장 창출을 위한 부처 협력형 선도 프로젝트도 진행할 계획이다. 송 실장은 "AI 컴퓨팅 인프라 확충을 시작으로 국가 AI 역량을 강화하여 AI G3 도약을 실현해 나가겠다"며 "국회를 비롯한 학계, 산업계의 많은 협력과 지원이 필요하다"고 강조했다. "GPU 확보 시급"...산업계 목소리 쏟아져 이날 포럼에 참석한 기업 대표들은 한목소리로 AI 인프라를 구축해야 한다며, 특히 GPU 확보의 시급성을 강조했다. SK텔레콤 이영탁 부사장은 "AI 강국이 되기 위해서는 생태계가 중요하다. AI 컴퓨팅 인프라 확충이 정말 중요한데, 특히 GPU가 당장 시급하다"며 "민간과 잘 협의해서 AI 컴퓨팅 인프라 생태계가 함께 발전할 수 있도록 해야 한다"고 밝혔다. 모빌린트 신동주 대표도 "당장 AI 반도체와 GPU 확충에 부족한 부분이 있어 중요하다"며 "국산 반도체 비중을 늘려야 한다"고 주장했다. 퓨리오사 백준호 대표는 "AI 컴퓨팅 인프라 확충이 필요하다"며 "최근 AI 모델에서 혁신을 이룬 기업들, 예를 들어 딥시크나 오픈AI 등은 대부분 스타트업"이라고 강조했다. 이어 그는 "혁신기업들이 등장할 수 있는 토대를 위해 스타트업에 컴퓨팅 인프라를 지원해 생태계를 만들어주면 좋겠다"고 제안했다. 리벨리온 신성규 CFO는 "딥시크의 사례를 살펴보면 컴퓨팅 인프라를 훈련과 추론으로 나눠 준비했다"며 "정부의 2030년까지 국산 반도체 비중을 높이는 계획은 감사하지만, 처음 인프라 도입 단계인 올해부터 5%라도 국산 AI 반도체가 함께 구축되는 것이 중요하다"고 말했다. 한편 'AI G3 강국을 위한 신기술 전략 조찬 포럼'은 지난해 진행된 AI·모빌리티 신기술전략의 시즌2로 기획됐다. 현장에는 국회, 정부, 산학연 전문가 20여명 참석해 AI 산업 발전을 위한 신기술, 트렌드, 정책, R&D 등을 논의했다.

2025.03.12 11:01최지연

유상임 장관 "AI 분야 9개월 지체하면 3년 기술 격차 벌어져"

유상임 과학기술정보통신부 장관은 "인공지능(AI) 분야에서 9개월 정도 지체하면 경쟁국과 3년 정도 기술 격차가 발생하는 문제를 감당할 수밖에 없다"고 밝혔다. 유 장관은 11일 정부서울청사에서 열린 부처 핵심과제 브리핑에서 "(국가 AI 경쟁력) 간극은 따라가기 쉽지 않다"며 이같이 말했다. 국가 AI 경쟁력 강화를 위한 컴퓨팅 인프라 확충의 시급성을 강조한 과기정통부가 우려하는 부분은 GPU 수급을 위한 예산 마련이다. 추가경정예산을 통해 GPU를 사들여야 하는데 쉽지 않다는 뜻이다. 유 장관은 "올해 GPU를 도입하기 어려운 상황이 주무부처 장관으로서 우려스럽다"고 토로했다. 앞서 지난달 정부는 2030년까지 GPU를 3만장 확보한다는 기존 계획을 2027년까지 앞당기고, 연내 AI 컴퓨팅센터를 열어 GPU 1만장 확보를 추진해야 한다고 밝혔다. 국제 협력의 중요성도 강조했다. 유 장관은 "과학기술 분야에서 미국과의 글로벌 R&D가 중요하다"며 "특히 해외에 있는 우수 인재들을 한국으로 유치하는 것이 시급하다"고 말했다. 최근 한-스페인 과기공동위원회, 한-EU 연구혁신의 날, 한-EU 공동위 등을 개최하며 국제 과학기술 협력의 네트워크를 확대하고 있다. AI 기본법과 관련해서는 "EU에 이어 두 번째로 제정된 기본법으로, 19개 개정안을 담아 지능 위주로 설계했다"며 "규제를 최소화하고 AI 발전에 따라 유연하게 대응하겠다"고 밝혔다. 과기정통부는 과학기술 인재 육성에도 박차를 가하고 있다. 올해 30여개 대학의 약 5만 명 석박사급 학생들에게 연구생활 장려금을 지원할 계획이다. 지난 2월27일에는 '미래 과학자와의 대화' 행사를 개최해 대통령, 과학 장학생, 국제 과학 올림픽 수상자들을 초청하는 등 차세대 과학기술 인재 육성에 힘을 쏟고 있다. 또한 연구 성과를 산업으로 연결시켜 국가 경쟁력에 기여할 수 있는 건강한 기술 생태계를 만들 계획이다. 출연기관의 거점 역할과 기술 사업화, 전문 회사 육성, 기술의 스케일업, 기술 창업과 성장 지원 등을 ICT, 소재 분야 등에서 맞춤형으로 설계할 예정이다. 이와 함께 과기정통부는 3월 중 주요 추진 계획을 발표했다. 양자전략위원회 출범, 차세대 원자력 확보 로드맵 마련, 중고폰 안심거래 인증제도 도입 등이 그 내용이다. 특히 차세대 원자력 확보 로드맵은 AI 확산에 따른 급증하는 전력 수요에 대비하기 위한 방안이다. 또한 과기정통부는 지난 2월 알뜰폰 도매대가 고시 개정을 통해 출시된 '1만 원대 5G 20기가 데이터 요금제'가 좋은 반응을 얻고 있다고 밝혔다. 이에 대해 류제명 네트워크정책실장은 "현재 3개 사업자가 해당 요금제를 출시했으며, 약 10개 사업자가 준비 중"이라며 "가입 추세가 기존 요금제 대비 2배에 달할 정도로 인기가 높다"고 설명했다. 유 장관은 "국가적 위기 상황에서 정치적 상황 때문에 대응이 미뤄져서는 안 된다"며 "여야를 막론하고 함께 대응해야 한다"고 강조했다.

2025.03.11 16:48최지연

KISTI, 아세안 국가에 HPC·AI 인프라 "이식"

한국과학기술정보연구원(원장 이식, 이하 KISTI)이 아세안 10개 회원국을 대상으로 인공지능(AI)을 활용한 디지털 역량 강화에 나섰다. KISTI는 아세안 회원국의 데이터 및 AI 활용을 위한 HPC 인프라 구축 기념행사를 인도네시아 자카르타에 위치한 인니연구혁신청(BRIN)에서 개최했다고 11일 밝혔다. 한-아세안 디지털 혁신 플래그십 프로젝트(KADIF) 일환으로 추진 중인 HPC 인프라 및 역량 강화 사업은 한국 정부가 공여하는 한-아세안 협력기금(AKCF) 지원을 받아 2024년 9월부터 2028년까지 수행한다. 4년 동안 1천만 달러(한화 약 147억 원) 규모의 예산으로 아세안 회원국에 고성능컴퓨터(HPC)기반 활용 환경을 제공한다. 아세안 회원국은 브루나이, 인도네시아, 말레이시아, 미얀마, 필리핀, 싱가포르, 태국, 베트남, 라오스, 캄포디아 등 10개국이다 사업 목표는 데이터, 인공지능을 활용한 디지털 역량 강화다. 주요 사업 내용은 ▲초고성능컴퓨터 인프라구축 ▲과학기술 지식 정보서비스(NTIS) 플랫폼 구축 ▲HPC·AI 활용 등 연수 교육이다. 4년간 160명을 교육시킬 계획이다. 현재 태국과 싱가포르를 제외한 아세안 회원 8개국은 초고성능컴퓨팅인프라가 없는 실정이다. 특히 데이터, AI 등의 역량의 핵심인 GPU나 신경망처리장치(NPU) 기반의 초고성능 컴퓨팅 환경이 열악하다. 이식 원장은 "HPC 운영, 인공지능 기술 등 KISTI의 내부 역량을 활용해 아세안 국가들의 디지털 기술 경쟁력 확보에 이바지할 것"이라고 말했다. 까으 끔 후은(Kao Kim Hourn) 아세안 사무총장은 “이번 한국과 아세안과의 핵심 연구인프라인 HPC 구축 사업으로 아세안 국가의 디지털 및 과학기술 경쟁력 제고에 크게 기여할 것"으로 기대하며 "더 나아가 한-아세안 간 지속적인 디지털 협력체계 구축을 적극적으로 지원할 것”이라고 언급했다.

2025.03.11 10:31박희범

"국내 30개 병원에 H100 GPU 총 3,840장 필요"

의료분야 데이터센터 구축과 생성형 AI를 개발하기 위해 최소 30개 병원에 각가 H100 GPU 128장(랙2개)씩 총 3천840장을 확보해야 한다는 주장이 제기됐다. 아주대학교 박래웅 의료정보연구센터장은 10일 국회의원회관에서 열린 바이오헬스디지털혁신포럼 창립총회 및 세미나에서 이같이 주장했다. 이 창립총회는 바이오헬스디지털혁신포럼(공동의장 최수진, 노연홍)과 대한의료데이터협회(회장 정명예) 등이 주최했다. 박 센터장은 세미나에서 "중앙식 대규모 데이터센터 구축 대신 30개 병원에 일정 수준 이상 GPU를 구축해야 한다"며 "소요 비용으로 총 2천억 원 정도 들 것"으로 예상했다. 박 센터장은 네트워크로 과기정통부 코렌(KOREN, 차세대 네트워크 선도 연구시험망' 이용을 제안했다. 또 AI 학습 방법은 '연합학습'기법이 적합할 것이라고 지적했다. "이 시스템은 병원 데이터가 외부로 반출되지 않기 때문에 병원이 보유한 거의 모든 의료 데이터를 AI학습에 활용할 수 있을 것입니다." 이에 앞서 을지대학교 강민수 스마트의료정보학부 교수(의료원 전산처 통합전산센터장)은 '우리나라의 의료데이터 혀황과 나아갈 길'에 대해 주제발표했다. 강 교수는 AI 기반 의료 데이터 산업의 중요성을 강조하며 고품질 의료 데이터의 필요성에 대해 목소리를 높였다. 강 교수는 또 의료 데이터 산업 활성화가 "신약개발 속도, 특히 초기 연구단계를 획기적으로 앞당길 것"이라며 "의료 비용 절감 및 경제적 가치 창출 등도 장점"이라고 언급했다. 강 교수는 의료데이터 산업 조성 주요 과제로 데이터 표준화 및 상호 운용성 확보 법적 윤리적 문제와 데이터 보안 및 개인정보 보호 강화 기술인프라 구축 전문인력 양성 등을 곱았다. 전상표 대한의료데이터협회 부회장이 좌장을 맡아 진행한 패널 토론에서는 보건복지부 백영하 보건의료데이터진흥과장, 과기정통부 김수정 데이터진흥과장, 산업통상자원부 김정대 바이오융합산업과장, 양희철 법무법인 명륜 변호사, 한국과학기술정보연구원 소대섭 책임연구원, 이주철 특허법인 해안 대표, 강민수 교수 등이 참석했다. 김수정 데이터진흥과장은 "최근 AI에서 핵심은 컴퓨팅 파워와 인재, 데이터"라며 "바이오 중요성 잘 인식하고 있고, 의료를 최우선으로 지원하고 싶다"고 언급했다. 소대섭 책임연구원은 이날 토론 시사점으로 차별화된 국가 전략 추진의 필요성 범정부 차원의 전주기적 거버넌스 확립 국가적 투자 확대 한국형 혁신사례 발굴 등의 필요성을 강조해 관심을 끌었다. 한편 이날 창립총회에는 국민의힘 국회의원들이 대거 참석했다. 권영세 비상대책위원장과 권성동 원내대표, 김상훈 정책위의장를 비롯한 추경우, 김장겸 의원 등이 창립총회를 찾았다.

2025.03.10 16:05박희범

  Prev 1 2 3 4 5 6 7 8 9 10 Next  

지금 뜨는 기사

이시각 헤드라인

윤곽 잡힌 K-로봇 청사진…자원 효율적 안배 집중해야

"갤S25 엣지, 더 싸게 사자"...자급제폰 온라인몰서 인기

닛산 몰락·혼다 후퇴 '후진하는 일본차'..."남일 아냐"

"기술이 뚫려도 제도가 막았어야"...유심 해킹 민낯

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현