검색 - IT세상을 바꾸는 힘 지디넷코리아

ZDNet 검색 페이지

'엔비디아 GPU'통합검색 결과 입니다. (110건)

태그
기간
- 3개월
- 1년
- 1년 이전

재검색

한 달 앞으로 다가온 컴퓨텍스 2025, 올해 테마 '넥스트 AI'

타이트라(TAITRA, 대만대외무역발전협회)와 타이베이컴퓨터협회(TCA) 주최로 열리는 동북아시아 최대 규모 IT 전시회, '컴퓨텍스 타이베이 2025'가 다음 달 20일부터 4일간 개최된다. 전통적으로 PC 생태계 중심 행사였던 컴퓨텍스는 2020년 이후 생성 AI, 챗GPT와 클로드, 퍼플렉시티 등을 위시한 LLM(거대언어모델), 온디바이스·엣지 AI, AI PC 등 바람을 타고 AI를 중심에 둔 전시회로 옷을 갈아 입었다. 6월 4일부터 7일까지 4일간 진행된 지난 해 행사에는 2023년(4만 5천명) 대비 두 배 늘어난 8만 5천179명이 방문했다. 올해도 엔비디아를 시작으로 퀄컴, 미디어텍 등 주요 AI 관련 기업들이 기조연설을 진행할 예정이다. 엔비디아, 개막 하루 전날 기조연설 진행 젠슨 황 엔비디아 CEO는 매년 컴퓨텍스 기간마다 타이베이를 찾아 기조연설이나 브리핑을 진행했다. 지난 해에는 난강전람관에 등장해 주요 그래픽카드·서버 제조사 부스를 방문하며 친필 사인을 남겨 대만 현지 언론의 주목을 한 눈에 받았다. 지난 해 엔비디아는 컴퓨텍스 공식 개막일보다 이틀 이른 일요일 저녁에 별도로 기조연설을 진행했다. 올해는 19일 오전 11시부터 난강전람관에서 1km 떨어진 '타이베이 뮤직 센터'로 청중을 모을 예정이다. 최근 2년간 엔비디아가 GPU를 이용한 AI 분야에서 두각을 나타내며 많은 이들의 관심이 집중되고 있는 상황이다. 타이트라와 엔비디아는 현장 참가를 원하는 각국 취재진을 대상으로 별도 코드까지 발급하며 이를 통제하기 위해 안간힘을 쓰고 있다. 퀄컴, 엔비디아와 같은 날 기조연설 예정 퀄컴은 지난 해 크리스티아노 아몬 CEO가 직접 AI PC를 주제로 한 기조연설을 진행하고 삼성전자 등 주요 PC 제조사와 함께 당시 출시를 앞뒀던 스냅드래곤 X 엘리트 탑재 노트북을 공개했다. 올해 기조연설도 크리스티아노 아몬 CEO가 연사로 나서 19일 오후 난강전람관에서 기조연설을 진행한다. 차세대 제품인 스냅드래곤 X 엘리트 2세대(가칭) 관련 성능이나 출시 일정 등 정보가 일부 공개될 가능성이 있다. 퀄컴은 기조연설과 함께 타이베이 시내 별도 행사장에서 AI PC 관련 쇼케이스도 진행할 것으로 보인다. AI PC 보급에 가장 중요한 영향을 미칠 각종 소프트웨어 위주의 전시가 예상된다. AMD·인텔, 아직까지 '무소식' AMD와 인텔은 컴퓨텍스 개막이 한 달 앞으로 다가온 현재까지 구체적인 일정을 공개하지 않은 상황이다. AMD는 공식 기조연설 대신 제품 담당 임원이 진행하는 별도 인터뷰나 브리핑 세션, 각종 쇼케이스 등을 진행할 것으로 보인다. 인텔은 지난 해 팻 겔싱어 전 CEO가 타이베이를 찾아 기조연설과 파트너 미팅 등을 진행했지만 올해 일정은 불투명하다. 난강전람관 안에는 이미 부스를 마련했지만 구체적인 공지는 나오지 않았다. 21일 취재에 응한 PC 업계 관계자들은 "인텔이 올해 컴퓨텍스에서는 PC와 AI, GPU 등 어떤 면에서도 이렇다 할 메시지를 내놓지 못할 것"이라고 예상했다.

2025.04.21 16:15권봉석

"엔비디아, 중국에 RTX 5090D 그래픽카드 출고 중단"

미국 정부가 중국 시장용으로 설계된 H20 GPU 수출을 규제한 여파가 일반 소비자용 그래픽카드까지 확대될 조짐을 보이고 있다. 중국 내 IT 커뮤니티를 중심으로 "엔비디아가 지포스 RTX 5090D 출하를 중단했다"는 전언이 등장했다. 20일 업계에 따르면 엔비디아는 지난 주 중국 시장용으로 설계된 H20 GPU 수출 제한 조치를 공시하며 "H20의 재고와 구매 약정, 관련 충당금 등으로 최대 55억 달러(약 7조 8천556억원) 추가 비용이 들 것"이라고 밝혔다. 중국 IT 커뮤니티 '칩헬'(Chiphell)에 18일 저녁 글을 올린 한 이용자는 그래픽카드 제조사 관계자를 인용해 "엔비디아가 18일 모든 그래픽카드 제조사를 대상으로 지포스 RTX 5090D의 공급을 잠정 중단하라는 공지를 보냈다"고 설명했다. 지포스 RTX 5090D는 미국 정부의 규제를 충족하기 위해 AI 연산 성능을 일반 RTX 5090(3천352 TOPS) 대비 29% 가량 줄인 2천375 TOPS 수준으로 낮췄다. 또 한 PC나 서버에 GPU를 여러 개 설치하는 '멀티 GPU' 구성도 불가능하게 설계됐다. 미국 전임 조 바이든 행정부는 GPU의 연산 성능이나 대역폭 등 성능을 낮추는 조건으로 중국 수출을 허용했으나, 도널드 트럼프 2기 행정부는 이마저도 허용하지 않으며 오히려 더 강화하는 방향으로 나아가고 있다. AMD 역시 지난 2월 중국 시장을 겨냥해 연산 성능을 낮춘 라데온 RX 7650 GRE 그래픽카드를 출시한 데 이어 RDNA 4 아키텍처를 적용한 중국용 제품도 출시할 것으로 예상된다. 그러나 미국 정부의 규제가 강화될 경우 신제품 출시는 지연이나 취소를 겪을 수 있다.

2025.04.20 11:00권봉석

美 의회 "엔비디아 GPU 중국 유출 여부 조사 착수"

미국 의회는 17일(현지시간) 중국 수출이 제한된 고성능 엔비디아 GPU가 우회 공급됐다는 의혹에 대해 공식 조사에 착수한다고 밝혔다. 17일 미국 하원 중국공산당특별위원회는 중국 AI 기업 딥시크(DeepSeek)가 수출 통제 대상인 엔비디아 GPU 약 6만 개로 거대언어모델(LLM)을 훈련했다는 정보를 바탕으로 엔비디아에 관련 기록 제출을 요구했다고 밝혔다. 지난 1월 딥시크 R1 공개시 엔비디아는 "딥시크가 활용한 GPU는 미국 수출 규정을 준수했다"고 밝혔다. 그러나 위원회는 "딥시크가 H100, A100 등 고성능 GPU를 싱가포르 등 제3국에서 우회 확보했을 가능성이 있다"고 지적했다. 위원회는 2020년 이후 중국이나 아세안 국가에서 499대 이상의 AI GPU를 구매한 모든 고객 목록과 최종 사용자, 거래 날짜, 최종 목적지 등 상세 정보 제출을 요구하고 있다. 싱가포르 이외에 말레이시아로 GPU 수출이 3.6배 이상 늘어나면서 중국으로의 우회 수출지로 말레이시아가 활용되고 있다는 의혹도 제기되고 있다. 엔비디아는 "미국 정부의 수출 규제를 준수하고 있으며 싱가포르 매출 증가는 단순히 결제가 일어난 장소이며 관련 제품은 미국과 대만 등 다른 지역으로 배송되고 중국에 공급되지 않았다"고 반론했다.

2025.04.18 09:37권봉석

美·中 무역전쟁에 발 묶인 엔비디아 'H20' GPU

미국 도널드 트럼프 2기 행정부가 대 중국 GPU 수출 규제를 한층 강화했다. 전임자인 조 바이든 행정부는 연산 성능이나 대역폭 등 성능을 낮추는 선에서 수출을 허용했지만 트럼프 2기 행정부는 이마저도 무기한 허가하지 않을 방침이다. 엔비디아는 15일(이하 현지시각) 중국 시장용으로 설계된 H20 GPU 수출 제한 조치를 공시하며 "H20의 재고와 구매 약정, 관련 충당금 등으로 최대 55억 달러(약 7조 8천556억원) 추가 비용이 들 것"이라고 밝혔다. 엔비디아 뿐만 아니라 지난 해부터 성능을 제한한 중국 시장용 GPU를 생산하는 AMD에도 유사한 규제가 주어질 가능성이 크다. 한편 이런 규제가 엔비디아의 가장 큰 경쟁자로 꼽히는 중국 화웨이를 키워주는 결과를 낳을 것이라는 관측도 나온다. 엔비디아, 美 정부 규제에 따라 두 차례 GPU 성능 낮춰 미국 정부가 중국 대상으로 AI 가속과 머신러닝, 딥러닝용 GPU 수출 규제에 나선 것은 2022년 10월부터다. 당시 미국 정부는 엔비디아 A100, H100 등 GPU를 포함해 AMD 제품까지 수출 규제 대상에 포함시켰다. 엔비디아는 이들 제품에서 최대 대역폭을 절반인 400GB/s까지 낮춘 A800, H800 GPU를 생산해 공급했다. 그러나 미국 정부가 2023년 10월 규제 범위를 확대하자 성능을 더 낮춘 H20, L20, L2 등 3종을 추가 개발해 이를 작년부터 중국 시장에 공급했다. 이번에 미국 정부가 제동을 건 H20 GPU는 HBM3 메모리 용량을 96GB로 제한하고 메모리 대역폭은 4TB/s, AI 연산 성능은 FP16(부동소수점 16비트) 기준 148 테라플롭스, FP32(부동소수점 32비트) 기준 44 테라플롭스로 제한됐다. H800으로 구현한 LLM '딥시크 R1'이 역린 건드렸나 미국 정부가 H20 GPU의 중국 수출 규제를 강화한 이유는 아직 명확하지 않다. 그러나 지난 1월 중국 AI 스타트업 딥시크(DeepSeek)가 하순 공개한 추론 특화 AI 모델 'R1'이 영향을 미쳤을 것으로 추정된다. 딥시크 R1은 AI 모델 훈련을 위해 메타가 라마(LLaMa) 등 AI 모델 개발에 투입한 비용의 10% 수준인 557만6천달러(약 80억원)를 지출한 것으로 알려져 있다. 또 미국 상무부 수출 통제 기준을 준수하는 H800 GPU를 이용했다. 당시 엔비디아는 "딥시크가 활용한 GPU는 미국 수출 규정을 준수했으며 추론은 상당히 많은 엔비디아 GPU와 고성능 네트워킹이 필요하다. 이와 같은 딥시크의 혁신이 GPU 수요를 더욱 증가시킬 것"이라고 밝혔다. 실제로 미국 CNBC와 대만 공상시보 등 경제 매체에 따르면 딥시크 R1 공개 이후 텐센트, 알리바바, 바이트댄스 등 중국 주요 IT 기업들이 H20 GPU 발주량을 크게 늘렸다. 엔비디아, 중국 내 최대 경쟁사로 화웨이 꼽아 미국 정부는 거대언어모델(LLM) 등에서 중국의 성장 속도를 지연시키기 위해 GPU 수출 규제를 활용하고 있다. 그러나 이런 규제는 오히려 중국 내 엔비디아 최대 경쟁자로 꼽히는 화웨이 성장을 돕는 결과를 낳을 수 있다. 화웨이가 개발한 어센드(Ascend) 910B는 FP16 기준 320 테라플롭스, INT8(정수 8비트) 기준 640 TOPS(1초당 1조 번 연산)급 성능을 갖춰 엔비디아 A100과 비슷한 수준으로 평가된다. 지난 해 공개된 후속 제품인 어센드 910C는 지난 2월 딥시크가 수행한 추론 벤치마크에서 엔비디아 H100의 60%에 달하는 성능을 냈다. 엔비디아도 지난 2월 말 미국 증권거래위원회에 제출한 연간 보고서에서 주요 경쟁자 중 하나로 2년 연속 화웨이를 꼽았다. 칩과 클라우드 서비스, Arm IP 기반 컴퓨터 프로세서와 네트워킹 제품 등 4개 분야에서 화웨이를 주요 경쟁사로 분류했다. 엔비디아 이어 AMD GPU 사업에도 영향 불가피 미국 정부의 수출 규제 확대는 엔비디아 뿐만 아니라 AMD에도 영향을 미칠 가능성이 크다. AMD는 작년 중국 시장을 겨냥해 성능을 제한한 AI GPU 가속기인 인스팅트 MI309를 설계했지만 미국 상무부는 '여전히 성능이 강력하다'는 이유로 수출을 불허했다. 2023년 11월 중국 시장에서는 데스크톱PC용 지포스 RTX 4090 그래픽카드를 분해해 서버용으로 개조하기도 했지만 올해는 이런 시도가 일어나기 힘들다. 엔비디아가 2월부터 중국 시장에 공급중인 지포스 RTX 5090D 그래픽카드에 이미 여러 제약이 가해졌기 때문이다. 지포스 RTX 5090D 그래픽카드는 미국 정부의 규제를 충족하기 위해 AI 연산 성능을 RTX 5090(3,352 TOPS) 대비 29% 가량 줄인 2,375 TOPS 수준으로 낮췄다. 한 PC나 서버에 GPU를 여러 개 꽂아 성능을 높이는 '멀티 GPU' 구성도 불가능하다. 다만 국내 주요 메모리 기업들에게 미칠 악영향은 제한적일 것으로 분석된다. 현재 SK하이닉스는 엔비디아의 AI 가속기에 필요한 HBM(고대역폭메모리)을 대거 공급하고 있으며, 삼성전자 역시 지속적으로 공급망 진입을 시도 중이다.

2025.04.16 14:37권봉석

[인터뷰] "엔비디아 사로 잡은 비결, '델 AI 팩토리' 덕분"

"바이 델(Buy Dell·델 제품을 사세요), 바이 델, 바이 델!" 지난 달 18일. 미국 새너제이에서 열린 엔비디아 연례 개발자 회의 GTC 행사에 마련된 델 테크놀로지스 부스에선 '인공지능(AI) 대부'로 불리는 젠슨 황 엔비디아 최고경영자(CEO)가 목청을 높여 이처럼 외쳤다. 컴퓨터를 필요로 하는 이들이라면 누구나 알고 있는 '델'의 PC뿐 아니라 AI 인프라 경쟁력을 인정하며 엔비디아의 가장 최고 파트너라는 점을 치켜 세워준 것이다. AI 열풍이 한창이던 1년 전 엔비디아 GTC 행사에서도 황 CEO는 델 테크놀로지스를 공개 석상에서 언급하며 끈끈한 관계를 과시했다. 당시 황 CEO는 "정보기술(IT)과 관련해 무엇이든 필요한 것이 있다면 델에 전화하면 된다"고 밝혔다. 이는 델 테크놀로지스 주가에도 영향을 줘 지난해 5월 시가총액이 1천억 달러를 넘기도 했다. 이처럼 엔비디아의 두터운 신임을 받고 있는 델 테크놀로지스가 올해 AI 인프라를 전면 업그레이드하며 시장 강자의 면모를 다시 한 번 드러내고 있다. 엔비디아 기반 델 AI 팩토리의 최신 포트폴리오를 앞세워 최근 달궈지고 있는 글로벌 AI 인프라 시장에서 주도권 굳히기에 본격 나선 모습이다. 최근 지디넷코리아와 만난 양원석 델 테크놀로지스 인프라스트럭처 솔루션 사업부 전무는 "우리는 AI PC부터 엣지, 코어 데이터센터, 클라우드까지 엔드 투 엔드(end-to-end) AI 솔루션 포트폴리오를 가지고 있다는 것이 강점"이라며 "서버 자체 기술력, 공급망 관리 능력, 영업 능력, 기술 지원 능력 등을 갖추고 있는 덕분에 글로벌뿐 아니라 한국에서도 서버 부문 1위 업체로 인정 받고 있다"고 운을 뗐다. 그러면서 "글로벌뿐 아니라 한국 스토리지 하드웨어(HW) 및 소프트웨어(SW) 부문 1위 업체로서의 저력을 갖고 있는 만큼, 데이터 및 데이터관리에 대해 전 세계에서 제일 잘 알고 있는 기업이라고 자부할 수 있다"며 "젠슨 황 CEO가 엔비디아 GTC 현장에서 '델'을 언급한 것도 이런 점을 인정한 것이라고 볼 수 있다"고 덧붙였다. 실제로 델 테크놀로지스는 글로벌 AI 인프라 시장에서 경쟁력을 입증 받아 독보적인 점유율을 유지하며 꾸준한 성장세를 보이고 있다. 특히 슈퍼마이크로, HPE 등과 경쟁하고 있는 AI 서버 시장에선 다양한 포트폴리오를 앞세워 압도적인 우위에 올라서 있다는 평가를 받고 있다. 7일 시장조사업체 IDC에 따르면 델 테크놀로지스는 지난해 3분기 전 세계 X86 서버 시장 판매대수 기준으로 11.4%의 점유율을 차지하며 1위를 유지했다. 매출 기준 점유율도 12.4%로 1위를 차지했다. 델 테크놀로지스와 경쟁하고 있는 슈퍼마이크로와 HPE, IEIT 시스템즈, 레노버는 그 뒤를 이었다. 이처럼 델 테크놀로지스가 시장 우위를 견고히 하고 있는 상황에서 전체 서버 시장의 성장세가 높다는 점은 호재로 작용하고 있다. 지난해 4분기 서버 시장 매출은 전년 동기 대비 91% 증가한 733억 달러를 기록, 2019년 이후 두 번째로 높은 성장률을 보였다. 특히 GPU가 내장된 서버 매출은 전년 동기보다 192.6%나 성장해 전체 서버 시장 매출의 절반 이상을 차지할 정도로 급성장한 모습을 보였다. 엔비디아는 전체 출하량의 90% 이상을 차지하며 서버 GPU 분야에서 독주를 이어갔다. 지난해 전체 서버 시장 규모는 2020년 이후 두 배 이상 성장한 2천357억 달러에 달했다. 엔비디아와 밀접한 관계를 맺고 있는 델 테크놀로지스도 지난해 호실적을 기록했다. 특히 AI 서버 출하액은 98억 달러로, 사업을 시작한 지 2년도 채 안되는 기간에 급속도로 성장한 모습을 보였다. AI 관련 기업 고객 역시 2천 곳 이상을 확보한 상태로, 올해 고객사 수가 더 늘어나 AI 매출이 50% 성장할 것으로 예상됐다. 올해 AI 서버 출하액은 약 150억 달러에 달할 것으로 전망했다. 양 전무는 "지난해 엔비디아 GTC에서 처음 선보인 '델 AI 팩토리 위드 엔비디아(Dell AI Factory with NVIDIA)'를 통해 다양한 솔루션과 제품을 선보이며 엄청난 컴퓨팅 파워를 시장에 공급했다고 자부하고 있다"며 "해외뿐 아니라 국내에서도 AI 시장 수요가 점차 '엔터프라이즈 AI'로 이동하고 있는 만큼 올해도 수요는 더 많아질 것으로 보인다"고 설명했다. 이어 "지난해까진 클라우드 서비스 제공자(CSP), 특히 하이퍼스케일러 또는 코어위브 같은 NCP(NVIDIA Cloud Partner) 업체들이 주축이 돼 시장 성장을 주도했지만, 올해는 더 많은 대기업, 대학, 연구기관 등 다양한 분야에서 수요가 많을 듯 하다"며 "10대 미만~수십대 등 작은 규모에서부터 거대 규모에 이르기까지 서버 규모 면에서도 더 다양해질 듯 하다"고 덧붙였다. 양 전무는 최근 국내에서 sLM(small Language Model), 온프레미스에 AI 서버를 두고 API를 사용해 클라우드 업체가 제공하는 AI 서비스와 연결해 사용하는 활용 사례(Use Case)가 늘어나고 있다는 점도 주목했다. 또 엔비디아 'H100' 위주로 형성된 GPU 시장이 향후 블랙웰, 그레이스블랙웰, AMD, 인텔 등 다양한 실리콘으로 확대될 것으로 봤다. 하지만 국내 고객들이 생성형 AI를 도입, 활용할 때 걸림돌이 많아 아직 시장이 활성화 되지 못했다는 점에 대해선 아쉬워 했다. 양 전무는 "국내에선 생성형 AI 활용 시 거버넌스와 개인정보 보호, 법적 규제 등을 고려해야 해 적절한 데이터를 수집·준비하는 과정에 있어 많은 어려움이 있을 수 있다"며 "생성형 AI를 위한 인프라는 기존 데이터센터 인프라 기술과는 달라 이를 위해 내부 역량을 확보하거나, 외부 전문 인력 채용 등을 함께 추진해야 하는 데 쉽지 않은 것이 현실"이라고 분석했다. 이어 "이에 따라 AI와 관련해 데이터 준비, 전략 수립을 위한 컨설팅, 활용 사례 생성 및 구축 등에 있어 전문 서비스를 활용하는 것이 좀 더 안전하고 체계적일 수 있다"며 "비용 측면에서 고가의 GPU에 투자하거나 퍼블릭 클라우드 서비스 사용 시 높은 운영 비용을 감당하는 데 기업들이 부담을 느끼는 경우가 많다"고 덧붙였다. 이 같은 상황에서 양 전무는 델 테크놀로지스가 좋은 대안이 될 것이라고 강조했다. 또 엔터프라이즈 기업의 경우 생성형 AI를 위해 안정적이며 보안 측면에서 신뢰할 수 있고 관리하기 쉬운 데다 데이터와 가까운 곳에 위치한 고성능의 데이터센터 인프라를 구축해야 한다고 조언했다. 양 전무는 "자사 서버 제품들은 효율화 및 생산성 향상을 위한 라이프사이클 관리의 지능적 설계 및 제어가 가능하다"며 "클라우드 인프라의 대부분의 이점도 온프레미스에서 서비스 형태(As a Service)로 제공할 수 있다"고 설명했다. 그러면서 "'델 AI 솔루션'은 경쟁사들에 비해 AI PC부터 엣지, 코어 데이터센터, 클라우드까지 엔드 투 엔드(End-to-end) AI 솔루션 포트폴리오를 갖추고 있는 데다 자사가 국내외서 스토리지 HW 및 SW 부문 1위 업체로서 데이터 및 데이터 관리에 대해 전 세계에서 가장 잘 알고 있다는 것이 강점"이라며 "코로케이션 및 호스팅 공급업체부터 AI 모델의 기반이 되는 반도체 공급업체에 이르기까지 포괄적인 파트너 생태계 스택을 제공하고 있다는 것도 매력적인 요소"라고 덧붙였다. 또 그는 "엔비디아, 마이크로소프트, 퀄컴, AMD, 허깅페이스, 인텔, 메타, 레드햇 등 광범위한 에코시스템을 통해 협력 관계를 탄탄히 구축하고 있는 것도 장점"이라며 "공장 팩토리 레벨에서 준비된 솔루션을 공급할 수 있도록 엔지니어링 단계에서부터 엔비디아와 협력하고 있다는 것도 우리만의 경쟁력"이라고 강조했다. 이 같은 시스템을 바탕으로 델은 국내 서버 시장에서도 1위 자리를 굳건히 지키고 있다. 특히 서버 자체 기술력, 공급망 관리 능력, 영업 능력, 기술 지원 능력 등을 인정 받아 삼성SDS와 NHN클라우드, 엘리스 등 많은 기업들이 델의 서버를 앞 다퉈 도입하고 있다. 해외에서도 마찬가지다. 델 테크놀로지스에 따르면 현재 기업들은 ▲비용 통제 ▲데이터 관리 ▲기존 시스템과의 통합 ▲전문 인력 부족을 주요 도전 과제로 삼고 있다. 이에 전체 중 77%의 기업이 AI 인프라 구축을 위해 '단일 벤더'를 선호하고 있는데 델 테크놀로지스는 다양한 제품 및 시스템 덕에 기업들의 상당한 신뢰를 얻고 있는 것으로 나타났다. 양 전무는 "우리는 업계 최신 기술과 오픈·모듈러 아키텍처를 빠르고 적극적으로 수용해 고객들이 이미 투자한 자산을 보호할 수 있도록 지원하고 있다"며 "새로운 기술이 나왔을 때 기존의 장비·설비에서 손쉽게 업그레이드할 수 있도록 함으로써 기업들이 효율적으로 자사 제품을 활용할 수 있게 도울 것"이라고 밝혔다. 그러면서 "특히 곧 출시될 '델 파워엣지 XE8712' 서버는 고객들이 가장 기대해도 좋을 제품"이라며 "2개의 그레이스 CPU와 4개의 블랙웰 GPU를 통합한 엔비디아 GB200 그레이스 블랙웰 슈퍼칩을 탑재해 데이터센터 내 AI 성능을 극대화 함으로써 현존하는 AI 서버 중 가장 빠른 속도로 이용할 수 있을 것"이라고 설명했다. 또 델 테크놀로지스가 AI 데이터 관리 측면에서도 상당한 기술 발전을 이끌어 낼 것이라고 자신했다. 특히 기업들이 AI 데이터를 더 빠르게 처리하고 보다 안전하게 보호할 수 있도록 설계된 '델 AI 데이터 팩토리 위드 엔비디아'가 중추적 역할을 할 것으로 봤다. 이 플랫폼은 대량의 데이터를 실시간으로 받아들이는 데이터 인제스천 기능을 지원하며 GPU 가속 기반 '스파크 쿼리'를 활용해 기존 대비 최대 220% 향상된 속도로 데이터를 분석하고 처리할 수 있다. 더불어 델이 AI 소프트웨어 분야에서도 엔비디아와의 협력을 통해 기술 발전을 이끌어 냈다고 강조했다. 특히 '에이전트 AI' 시스템 개발을 지원하는 엔비디아의 AI 개발 프레임워크인 '에이전틱 AI'와 이를 위한 AI 최적화 도구를 AI 팩토리에 통합함으로써 AI를 통해 기업들이 의사 결정을 쉽게 내릴 수 있도록 지원에 나선 점을 피력했다. 양 전무는 "그동안에는 마이크로소프트 등 하이퍼스케일러들이 수십만 장의 GPU를 구매해 파운데이션 모델을 만드는 것이 대세였다면, 작년 말부턴 AI를 어떻게 잘 활용할 수 있을지에 대해 고민을 하는 기업들이 더 많아진 듯 하다"며 "점차 일반 기업들이 실제 비즈니스 도움이 될 수 있도록 AI를 사용하는 사례가 많아지고 있는 만큼, AI 인프라에 대한 시장의 관심도 더 커질 듯 하다"고 말했다. 그러면서 "AI 기술 발전으로 서버 신제품 발표 주기도 2년에 한 번 정도에서 최근에는 엔비디아의 움직임에 맞춰 6개월에 한 번으로 짧아질 정도로 빨라진 상황"이라며 "이에 따른 전력 소비, 냉각 등과 관련된 시스템을 잘 갖춰나가기 위해 노력 중인 만큼 많은 기업들이 우리 제품을 선택할 것으로 기대하고 있다"고 덧붙였다. 또 그는 "특히 국내에선 정부에서 국가 AI 컴퓨팅 센터를 추진하고 있는 만큼 실제 구체적인 사업을 진행할 때 우리 제품을 외면하지는 않을 것으로 보인다"며 "엔비디아뿐 아니라 AMD, 인텔 등 다양한 기업들의 GPU를 제공하며 고객들의 선택지를 많이 넓힌 만큼 '델 AI 팩토리'를 통해 시장 변화에 맞춰 탄력적으로 대응함으로써 시장 주도권을 유지하기 위해 더 노력할 것"이라고 강조했다.

2025.04.07 16:48장유미

엔비디아, 아프리카 최초 AI 데이터센터 건립…"디지털 독립성 강화"

엔비디아와 짐바브웨 기업이 아프리카 지역 개발자들의 GPU 접근성 향상과 디지털 독립성 강화를 위해 아프리카 대륙 최초의 인공지능(AI) 데이터센터 건립을 추진한다. 4일 CNN에 따르면 짐바브웨의 기업 카사바 테크놀로지스를 이끄는 스트라이브 마시위아 회장은 최근 엔비디아와 협력해 아프리카 대륙에 AI 팩토리를 구축한다고 발표했다. 양사 협력으로 오는 6월부터 엔비디아 GPU 기반 슈퍼컴퓨터 시스템이 남아프리카공화국에 위치한 카사바 테크놀로지스의 데이터센터에 배치된 후 이집트·케냐·모로코·나이지리아 등 다른 아프리카 국가 내 시설로도 배포될 예정이다. 현재 아프리카는 컴퓨팅파워 부족으로 전 세계 AI 시장에서 상대적으로 뒤처져 있다는 평가를 받는다. 아프리카 대륙 AI 개발자 커뮤니티인 진디(Zindi)에 따르면 아프리카 AI 실무자 중 5%만이 연구개발을 위한 충분한 컴퓨팅 리소스를 이용할 수 있는 것으로 조사됐다. 또 아프리카의 소득 수준에 비해 하드웨어(HW) 비용이 높다는 점도 AI 도입의 주요 장애물 중 하나다. 이 때문에 아프리카 지역 개발자들은 아마존웹서비스(AWS), 구글 클라우드, 마이크로소프트(MS) 애저와 같은 해외 클라우드 서비스에 대한 의존도가 높았다. 문제는 클라우드를 통한 지리적 지역 간 데이터 전송에도 많은 비용이 들고 시간도 오래 걸린다는 점이었다. 또 이같은 기술적 장애물 때문에 아프리카 언어와 방언 등 아프리카를 대표하는 AI 훈련 데이터셋이 부족하거나 편향성을 갖는 경우도 많았다. 이에 카사바 테크놀로지스는 엔비디아 GPU 기반 AI 데이터센터를 중심으로 아프리카 대륙 내 기업과 연구자가 안전한 환경에서 AI를 구축·훈련·확장·배포하는 데 필요한 컴퓨팅 성능에 액세스할 수 있도록 보장한다는 방침이다. 이번 엔비디아와 아프리카 기업 간 협력에 대해 비영리 단체 얼라이언스4AI의 알렉스 차도 이사는 "아프리카에는 대규모 GPU 클러스터가 없어 혁신가들의 발목을 잡고 있다"며 "엔비디아의 이번 발표는 GPU에 대한 접근성을 높여 대륙 전역에서 AI 혁명을 주도하는 데 도움이 될 것"이라고 기대했다. 이어 "이제 아프리카 개발자들은 대륙 내에서 데이터를 수집·처리할 수 있게 됐다"며 "아프리카의 빅테크가 AI 커뮤니티에 합류하고 투자함으로써 인재 양성에도 적극 나설 수 있게 되는 등 생태계 전반의 혁신을 가속화할 것"이라고 덧붙였다. 스트라이브 마시위아 회장은 "자사의 AI 팩토리는 혁신이 확장될 수 있는 인프라를 제공해 아프리카 기업, 스타트업 및 연구원들이 최첨단 AI 인프라에 접근할 수 있도록 지원할 것"이라고 밝혔다.

2025.04.04 15:32한정호

"GPU 72장 돌려야 답 나온다"…엔비디아, AI 추론 '끝판왕' 내놔

엔비디아가 복잡한 사고력 기반 AI 모델 확대에 맞춰 새로운 추론 성능 전략을 공개한다. 점점 더 많은 연산을 요구하는 AI 모델 등장에 따른 글로벌 평가 기준 변화에 선제 대응하려는 조치다. 3일 업계에 따르면 엔비디아는 지난 1일 정오 온라인으로 진행한 프리브리핑에서 AI 성능 벤치마크인 '엠엘퍼프(MLPerf)' 추론 AI 부문의 변화에 대응하기 위한 기술 전략을 공개했다. 이번 행사는 국제 컨소시엄 엠엘커먼스(MLCommons)가 '사고 기반 AI'인 추론 모델을 평가 항목에 포함하려는 움직임에 초점을 맞췄다. 엠엘퍼프는 AI 모델의 훈련(training)과 추론(inference) 성능을 하드웨어·소프트웨어 통합 기준으로 측정하는 글로벌 표준 벤치마크다. 엠엘커먼스가 주도하는 이 평가 항목은 업계 기술 흐름에 따라 주기적으로 갱신된다. 최근에는 단순 예측을 넘어 복잡한 추론과 의사결정을 요구하는 리즈닝 모델이 AI 기술의 중심으로 떠오르면서 해당 항목의 공식 도입 논의가 본격화되고 있다. 엔비디아는 아직 리즈닝 모델 항목이 공식 도입되지는 않았지만 차기 엠엘퍼프 버전에서는 채택 가능성이 높다고 판단하고 있다. 이를 선제적으로 대비하기 위해 회사는 중국의 AI 스타트업인 딥시크가 개발한 생성형 AI 모델을 활용해 복잡한 사고 기반 작업에서의 추론 성능을 시연했다. 이처럼 복잡한 추론 모델이 확산되면서 AI 추론 환경 전반에도 근본적인 변화가 일고 있다. 추론 연산량이 전례 없이 폭증하고 있는 상황에서 과거에는 단일 그래픽처리장치(GPU)나 단일 노드에서 충분했던 작업들이 이제는 다수 GPU를 동시 투입하는 복잡한 병렬 연산 없이는 처리할 수 없다는 것이 엔비디아의 분석이다. 이에 더해 추론 모델의 확산은 AI 개발의 모든 단계에서 연산 자원의 수요를 급격히 증가시키고 있다. 엔비디아는 모델 재학습(retraining), 도메인 맞춤화(post-training), 테스트 시점 확장(test-time scaling) 등에서 연산량이 기하급수적으로 늘고 있다고 분석했다. 특히 테스트 단계에서도 추론 정확도를 높이기 위한 병렬 연산 수요가 계속해서 증가하고 있다는 점을 강조했다. 이에 이날 엔비디아는 고성능 시스템 예시로 'GB200 MBL'을 제시했다. 해당 시스템은 총 72개의 GPU를 동시 연동하며 복잡한 추론을 빠르게 처리할 수 있도록 설계됐다. 회사는 이러한 대규모 병렬 환경이 향후 추론 표준이 될 것으로 보고 있다. 엠엘커먼스 역시 추론 모델을 엠엘퍼프의 공식 평가 항목에 포함하기 위한 논의를 본격적으로 시작한 상황이다. 현재 다양한 기술 커뮤니티와 협업을 통해 평가 기준과 워크로드 확장을 준비하고 있다. 공식 도입 시점은 아직 정해지지 않았으나 실증 사례와 모델 테스트가 계속 이어지고 있어 연내 도입이 확정될 가능성도 있다. 엔비디아 관계자는 "모델의 크기와 지능이 커짐에 따라 연산량이 모든 단계에서 폭증하고 있다"며 "재학습, 도메인 최적화, 테스트 시점 스케일링 모두 고성능 GPU를 요구한다"고 설명했다. 이어 "72개의 GPU처럼 다수의 칩을 동시에 작동시켜야 하는 이유가 바로 이 때문"이라고 덧붙였다.

2025.04.03 01:00조이환

슈퍼마이크로, 엔비디아 GPU 지원 서버 제품군 확대…"AI 모델 추론 극대화"

슈퍼마이크로가 인공지능(AI) 워크로드 처리 성능을 극대화할 수 있는 엔비디아 GPU 지원 제품군을 선보인다. 슈퍼마이크로는 새로운 엔비디아 'RTX 프로 6000 블랙웰 서버 에디션' GPU 지원과 워크로드 최적화 GPU 서버·워크스테이션 제품군을 확장했다고 26일 밝혔다. 슈퍼마이크로의 새로운 제품군은 엔비디아 블랙웰 세대 PCIe GPU에 최적화돼 더 많은 기업이 ▲거대언어모델(LLM) 추론 ▲미세조정 ▲에이전틱 AI ▲시각화 ▲그래픽·렌더링 ▲가상화 등에 가속 컴퓨팅을 활용할 수 있도록 지원한다. 슈퍼마이크로의 많은 GPU 최적화 시스템은 엔비디아 인증을 획득했으며 AI 개발과 프로세스 단순화를 위해 엔비디아 AI 엔터프라이즈에 대한 호환성과 지원을 보장한다. 찰스리앙(Charles Liang) 슈퍼마이크로 최고경영자(CEO)는 "자사는 다양한 엔터프라이즈 환경에서 구축할 수 있는 광범위한 애플리케이션 최적화 GPU 서버 제품군을 매우 짧은 리드타임으로 제공한다"며 "엔비디아 RTX 프로 6000 블랙웰 서버 에디션 GPU를 지원함으로써 데이터센터부터 지능형 엣지까지 최신 가속 컴퓨팅 기능을 구현하려는 고객에게 새로운 차원의 성능과 유연성을 제공한다"고 말했다. 이어 "자사의 광범위한 PCIe GPU 최적화 서버는 엔비디아 2-웨이(way) 및 4-웨이 NV링크 환경에서 엔비디아 H200 NVL을 지원한다"며 "최첨단 AI 모델의 추론 성능을 극대화하고 고성능 컴퓨팅(HPC) 워크로드를 가속할 것"이라고 설명했다. 엔비디아 RTX 프로 6000 블랙웰 서버 에디션은 AI와 그래픽 워크로드 모두에 최적화된 범용 GPU다. 기존 엔비디아 L40S 대비 GDDR7 메모리 속도가 빨라지고 메모리 용량이 두배로 늘어나는 등 성능이 크게 향상됐다. 또 PCIe 5.0 인터페이스를 지원해 GPU와 CPU 사이의 통신 속도도 빨라졌다. 새로운 멀티 인스턴스 GPU 기능을 통해 GPU 하나를 공유할 수 있는 완전 분리된 인스턴스 수도 최대 4개까지 확장됐다. 슈퍼마이크로 GPU 최적화 서버는 블루필드-3와 커넥트X-8과 같은 엔비디아 슈퍼NIC을 지원하도록 설계됐으며 엔비디아의 퀀텀 인피니밴드와 스펙트럼 이더넷을 활용해 인프라 확장과 GPU 클러스터링을 제공한다. 밥 피트(Bob Pette) 엔비디아 엔터프라이즈 플랫폼 담당 부사장은 "RTX 프로 6000 블랙웰 서버 에디션은 AI와 비주얼 컴퓨팅을 위한 최고의 데이터센터 GPU"라며 "가장 까다로운 워크로드에서도 전례 없는 가속 성능을 제공한다"고 말했다. 이어 "슈퍼마이크로의 광범위한 엔비디아 가속 시스템에 RTX 프로 6000 블랙웰 서버 에디션이 추가됨으로써 AI 개발·추론을 포함한 대부분의 워크로드 속도를 높일 수 있게 됐다"고 덧붙였다.

2025.03.26 17:19한정호

HP, 고성능·AI 결합 게임용 노트북 '오멘 맥스 16' 출시

"지난 해 국내 PC 시장에서 2년 전 대비 게임용 PC 비율은 10% 늘어났고 완제 PC 출하량 역시 25% 상승했다. HP는 2021년부터 국내 게이밍 시장에 투자해 왔고 이번에 출시할 '오멘 맥스 16'은 그간 미비했던 하드코어 게이머를 겨냥한 제품이다." 25일 오전 서울 여의도 HP코리아 사무실에서 진행된 간담회에서 소병홍 HP코리아 퍼스널 시스템 카테고리 전무가 이렇게 설명했다. HP코리아가 이날 국내 출시한 오멘 맥스 16은 국내를 포함해 전세계 하드코어 게이머를 겨냥해 인텔 코어 울트라 200HX(애로우레이크) 프로세서와 엔비디아 지포스 RTX 50 시리즈 GPU, 고효율 냉각 구조 등을 적용했다. 코어 울트라 200HX+엔비디아 새 GPU 결합 오멘 맥스 16은 인텔이 지난 1월 공개한 노트북용 프로세서인 코어 울트라 200HX(애로우레이크)를 탑재했다. 최대 24코어 CPU 타일을 기반으로 전세대(14세대 코어 프로세서) 대비 소모 전력을 줄이면서 1코어(싱글스레드) 성능은 최대 5%, 다중작업(멀티스레드) 성능은 최대 20% 높였다. 이달 초 진행된 국내 행사에서 박승재 인텔코리아 상무는 "더 높은 외장 그래픽 성능을 원하는 전문가를 위해 고성능 외장 GPU를 탑재한 제품도 이달 말 출시 예정"이라고 설명한 바 있다. 오멘 맥스 16은 인텔 예고대로 엔비디아 지포스 RTX 5080 GPU를 내장했다. 엔비디아 옵티머스 기술로 배터리 작동과 게임·그래픽 성능 등 필요에 따라 프로세서 내장 GPU와 RTX 5080을 번갈아 쓸 수 있다. 액체 금속으로 냉각 성능 강화... 냉각팬 먼지도 자동 청소 게임용 PC, 특히 노트북에 가장 큰 영향을 미치는 것은 프로세서와 GPU 등이 장시간 작동시 내부에서 발생하는 열이다. 이를 식히기 위해 냉각팬이 작동하지만 시간이 지나며 내부에 먼지가 쌓이고 냉각 성능이 저하된다. 오멘 맥스 16은 메인보드의 60%에 가까운 영역을 덮는 증기 챔버를 적용하고 프로세서와 GPU 표면을 덮는 부분에 액체 금속을 적용해 장시간 고성능 작동 시 발생하는 발열 문제를 완화했다. 냉각팬에 먼지가 쌓이는 문제는 인텔과 함께 개발한 팬클리너 시스템으로 해결했다. 냉각팬 회전 방향을 4시간마다 반대로 돌려서 자동으로 먼지를 떨어내고 냉각팬 수명을 연장한다. 게임 설정 자동 최적화 '오멘 AI' 탑재 오멘 맥스 16은 게임 관련 설정을 통합 관리하는 소프트웨어 '오멘 게이밍 허브'에 AI 기반 최적화 기능 '오멘 AI'를 내장했다. 이 기능은 머신러닝 기반으로 각종 설정값을 학습했다 초당 프레임 수(fps)를 최적화할 수 있는 방향으로 그래픽 품질과 수준, 해상도를 자동 조절한다. 여러가지 복잡한 설정을 소비자가 직접 조절하며 시행착오를 겪을 필요가 없다는 것이 가장 큰 장점이다. HP코리아 관계자는 "현재 오멘 AI는 베타버전이며 카운터스트라이크2(CS2)만 지원한다. 지원 게임을 발로란트 등 다른 게임으로 차차 확대할 것"이라고 설명했다. "게임용 PC 판매, 외부 요인 영향 적을 것" HP코리아는 2023년경부터 2년 이상 국내 게이밍 완제PC 분야에서 30% 이상의 시장점유율을 차지하고 있다(한국IDC, 수량 기준). 그러나 지난 해 12.3 비상계엄 사태 이후 소비 심리 위축이 뚜렷한데다 노트북 성수기 이후 제품이 출시돼 올해 상황은 여의치 않다. 소병홍 HP코리아 전무는 "올해 시장이 쉽지 않을 것이지만 게임용 고성능 PC 시장은 엔비디아 RTX 50 시리즈 GPU 출시에 따른 업그레이드 수요 등으로 일반 PC 대비 시장의 영향을 조금 덜 받을 것"이라고 전망했다. 오멘 맥스 16 출고가는 429만원부터 시작한다. 게임용 고성능 PC 가격 상승세가 가파르다는 지적에 소병홍 전무는 "메모리와 SSD 가격은 하락한 반면 새 프로세서와 GPU로 가격이 상승하는 경향이 있지만 경쟁사 동급 제품 대비 큰 차이는 없다고 본다"고 답했다.

2025.03.25 14:05권봉석

720兆 '스타게이트' 이끄는 오픈AI, 첫 데이터센터에 엔비디아 AI 칩 40만개 투입하나

일본 소프트뱅크, 오라클과 손잡고 '스타게이트' 프로젝트를 추진 중인 오픈AI가 첫 번째 데이터센터 단지에 엔비디아의 인공지능(AI) 칩을 최대 40만 개까지 수용할 수 있는 공간을 마련한다. AI 칩 구입에만 대규모 자금이 투입될 예정으로, 엔비디아에 호재가 될 전망이다. 19일 블룸버그통신에 따르면 오픈AI는 미국 텍사스주 애빌린에 오는 2026년 중반께 지어질 첫 번째 데이터센터에 1천억 달러 규모를 투입할 예정이다. 크루소라는 개발사가 맡게 된 이 시설은 1.2기가와트 용량의 전력을 사용할 것으로 알려졌다. 이와 관련된 구체적인 개발 계획은 오는 25일 발표될 것으로 전해졌다. 이 시설은 수십만 개의 고급 AI 칩을 지원할 수 있을 만큼 규모가 크지만, 얼마나 많은 칩이 투입될 지는 정확하게 알려지지 않았다. 다만 블룸버그통신은 지난 6일 오픈AI가 '스타게이트' 프로젝트에 따라 건설 중인 첫 번째 데이터센터에 엔비디아의 GB200 반도체 6만4천 개가 탑재될 것이라고 보도해 주목 받은 바 있다. GB200은 엔비디아의 최신 AI 칩 '블랙웰' 그래픽처리장치(GPU) 2개와 중앙처리장치(CPU) 그레이스 1개를 탑재한 AI 가속기다. 엔비디아가 GB200의 공식 가격을 밝히지는 않았지만, 직전 모델의 가격은 개당 3만~4만 달러에 판매됐다는 점에서 수십억 달러 상당이 AI 칩 구매 비용으로 투입될 것으로 예상됐다. 오픈AI와 오라클은 올해 여름까지 전체의 4분의 1인 1만6천 개의 GB200을 탑재한다는 계획을 세운 것으로 전해졌다. 단일 데이터센터에 이 정도 규모의 AI 가속기를 탑재하는 건 매우 이례적인 것으로 평가됐다. 앞서 오픈AI는 오라클, 소프트뱅크와 함께 스타게이트 프로젝트를 발표하고 향후 4년간 최대 5천억 달러(약 720조원)를 투자한다고 발표했다. 이에 따라 현재 텍사스주 애빌린에 건설 중인 첫 번째 데이터센터 외에도 펜실베니아주, 위스콘신주, 오리건주 등에서 부지를 검토하고 있다. 개발사인 크루소는 "현재 약 2천 명이 이 프로젝트 건설에 참여하고 있고 향후 5천 명까지 늘릴 계획"이라며 "8개의 데이터센터 건물이 건설될 예정으로, 각 건물에는 최대 5만 개의 엔비디아 GB200 반도체를 수용할 수 있도록 설계될 것"이라고 밝혔다. 이처럼 오픈AI가 첫 번째 데이터센터에 엔비디아 AI 칩을 최대 40만 개까지 수용할 경우 전 세계에서 가장 큰 규모의 AI 컴퓨팅 파워 클러스터를 갖게 될 것으로 보인다. 오픈AI는 '스타게이트' 프로젝트를 통해 '챗GPT' 고급 AI 모델에 필요한 물리적 인프라를 제공 받을 예정이다. 또 오라클은 '스타게이트' 프로젝트를 위해 자사 애빌린 지사의 전체 빌드를 활용하는 데 동의한 것으로 알려졌다. 오픈AI는 현재 이 시설에서 약 1기가와트 용량의 전력을 사용할 계획인 것으로 전해졌다. 이와 관련해 개발사인 크루소와 오픈AI, 오라클은 별도의 언급을 하지 않고 있다. 이에 맞서 오픈AI를 가장 많이 견제하고 있는 일론 머스크 테슬라 최고경영자(CEO)는 자신이 설립한 xAI의 역량 강화를 위해 최근 멤피스에 있는 슈퍼컴퓨터용 AI 서버 확보를 위해 델 테크놀로지스와 50억 달러 규모의 계약을 체결했다. 이를 통해 엔비디아 H100 60만 개에 해당하는 컴퓨팅 성능을 갖출 계획이다. 또 AI 클라우드 제공업체인 코어위브도 이달 초 32개 데이터센터에 25만 개 이상의 엔비디아 GPU를 보유하고 있다고 밝혀 눈길을 끌었다. 블룸버그통신은 "스타게이트는 엔비디아의 최신 칩 역량을 강화하기 위한 빅테크 기업들의 경쟁에 합류했다"고 평가했다. 업계 관계자는 "스타게이트 프로젝트 외에 최근 테크 업체들이 잇따라 대규모 데이터센터를 건설함에 따라 중국 AI 기업 딥시크로 인해 발생된 충격으로 일각에서 제기됐던 고성능 AI 칩 수요 감소에 대한 우려도 해소되는 분위기"라며 "엔비디아의 고성능 칩 수요 품귀 현상은 당분간 지속될 전망"이라고 밝혔다.

2025.03.19 09:58장유미

엔비디아, 루빈 울트라·파인만 AI칩 공개…"차세대 HBM 탑재"

엔비디아가 인공지능(AI) 반도체 산업의 주도권을 유지하기 위한 차세대 GPU를 추가로 공개했다. 오는 2027년 HBM4E(7세대 고대역폭메모리)를 탑재한 '루빈 울트라'를, 2028년에는 이를 뛰어넘을 '파인만(Feynman)' GPU를 출시할 예정이다. 파인만에 대한 구체적인 정보는 아직 공개되지 않았지만, '차세대 HBM(Next HBM)'을 비롯해 다양한 혁신 기술이 적용될 것으로 전망된다. 18일(현지시간) 젠슨 황 엔비디아 최고경영자(CEO)는 미국 실리콘밸리 새너제이 컨벤션 센터에서 열린 연례행사인 'GTC 2025' 무대에 올라 AI 데이터센터용 GPU 로드맵을 발표했다. 이날 발표에 따르면, 엔비디아는 최신형 AI 가속기인 '블랙웰' 시리즈의 최고성능 제품인 '블랙웰 울트라'를 올해 하반기 출시한다. 해당 칩은 12단 HBM3E(5세대 HBM)를 탑재했으며, AI 성능을 이전 세대 대비 1.5배 높인 것이 특징이다. 이어 엔비디아는 HBM4를 탑재한 '루빈' 시리즈를 내년 하반기 출시한다. 루빈부터는 기존 '그레이스' CPU가 아닌 '베라' CPU가 채용된다. 루빈의 최고성능 제품인 루빈 울트라는 내후년인 2027년 하반기께 출시가 목표다. 루빈 울트라에는 HBM4E가 채용돼, 메모리 성능이 블랙웰 울트라 대비 8배나 늘어난다. 그동안 드러나지 않았던 차차세대 AI 가속기에 대한 정보도 공개됐다. 엔비디아는 루빈 이후의 제품명을 파인만으로 확정했다. 미국의 저명한 이론 물리학자인 리처드 파인만에서 이름을 따왔다. 엔비디아는 파인만에 대해 차세대 HBM(Next HBM)을 탑재한다고 기술했다. 다만 구체적인 세대명은 공개하지 않았다. 파인만은 오는 2028년 출시될 예정이다.

2025.03.19 08:43장경윤

"삼성SDS도 신뢰한 AI 팩토리"…델-엔비디아, 기업용 AI 시장 공략 '박차'

델 테크놀로지스가 엔비디아와 손잡고 인공지능(AI) 인프라를 전면 업그레이드한다. 기업들의 AI 도입 장벽을 낮추고 혁신 속도를 끌어올려 시장 경쟁력을 강화하려는 행보다. 델 테크놀로지스는 18일 온라인 미디어 브리핑에서 '엔비디아 기반 델 AI 팩토리'의 최신 포트폴리오를 공개했다. 엔비디아의 'GTC 2025'와 동시에 열린 이번 간담회에서는 엔비디아와 델의 협력 성과가 집중 조명됐다. 델은 AI PC, 서버, 스토리지, 네트워킹 등 AI 인프라 전반을 아우르는 신제품을 대거 선보였다. 이날 발표를 진행한 바룬 차브라 델 인프라 및 텔레콤 마케팅 수석 부사장은 AI의 본격적인 산업 적용이 시작되면서 기업들은 AI 도입에 있어 여러 장애물을 마주하고 있는 점을 지적했다. 차브라 부사장에 따르면 현재 기업들은 ▲비용 통제 ▲데이터 관리 ▲기존 시스템과의 통합 ▲전문 인력 부족을 주요 도전 과제로 직면해 전체 중 77%의 기업이 AI 인프라 구축을 위해 '단일 벤더'를 선호하고 있다. 이에 따라 델은 엔비디아와의 협력을 통해 이 같은 시장 수요를 적극 공략할 계획이다. 실제로 델은 이번 브리핑에서 AI PC 시장 공략을 위한 신제품을 대거 선보였다. '델 프로 맥스 AI PC' 라인업에는 엔비디아의 최신 '그레이스 블랙웰' 아키텍처가 적용됐다. 기존 데이터센터에서만 활용되던 AI 개발용 그래픽처리장치(GPU) 성능을 데스크톱에서도 구현한 것이 특징이다. 연구자와 개발자를 위한 소형 워크스테이션뿐 아니라 784기가바이트(GB) 메모리와 20페타플롭스(PFLOPS) 성능을 갖춘 고성능 AI 개발용 PC도 함께 공개됐다. 데이터센터 부문에서도 델과 엔비디아의 협력은 강화된다. 차브라 부사장에 따르면 델은 엔비디아의 최신 블랙웰 GPU와 커넥트X8 슈퍼닉스를 지원한다. 특히 곧 출시될 '델 파워엣지 XE 8712(PowerEdge XE8712)' 서버는 노드당 2개의 그레이스 CPU와 4개의 블랙웰 GPU를 탑재해 데이터센터 내 AI 성능을 극대화할 것으로 예상된다. 한 랙에 144개의 GPU를 수용할 수 있어 초고밀도 AI 연산 환경을 구축할 수 있다. AI 데이터 관리 역시 델의 핵심 혁신 분야 중 하나다. 이를 위해 '델 AI 데이터 팩토리 위드 엔비디아(Dell AI Factory with NVIDIA)'는 기업들이 AI 데이터를 더 빠르게 처리하고 보다 안전하게 보호할 수 있도록 설계됐다. 이 플랫폼은 대량의 데이터를 실시간으로 받아들이는 데이터 인제스천 기능을 지원하며 GPU 가속 기반 '스파크 쿼리'를 활용해 기존 대비 최대 220% 향상된 속도로 데이터를 분석하고 처리할 수 있다. 차브라 부사장은 "AI의 성능을 극대화하려면 데이터를 빠르게 처리하고 안전하게 보관하는 것이 필수"라며 "우리 AI 데이터 팩토리는 대규모 AI 워크로드를 보다 효율적으로 운영할 수 있도록 설계돼 기업들의 AI 도입 속도를 한층 끌어올릴 것"이라고 설명했다. AI 소프트웨어 분야에서도 델과 엔비디아의 협력은 이어지고 있다. 델은 '에이전트 AI' 시스템 개발을 지원하는 엔비디아의 AI 개발 프레임워크인 '에이전틱 AI'와 이를 위한 AI 최적화 도구를 AI 팩토리에 통합했다. 이에 따라 기업들은 AI가 단순한 질의응답을 넘어 스스로 의사 결정을 내릴 수 있는 시스템을 구축할 수 있게 됐다. 회사는 AI 인프라 구축뿐만 아니라 AI 네트워킹 및 배포 서비스도 강화하고 있다. 네트워크 최적화, GPU 서버 구축, 다중 벤더 환경 통합 등 다양한 AI 전문 서비스를 제공하며 AI 프로젝트의 초기 단계부터 운영까지 전 과정을 지원한다. 이같이 AI 도입이 빠르게 확산되면서 델과 엔비디아의 협력도 지속적인 탄력을 받고 있다. 양사는 지난해 GTC에서 '델 AI 팩토리 위드 엔비디아'를 공개한 이후 지난 1년간 100개 이상의 신규 AI 제품을 출시하고 2천 개 이상의 고객을 확보했다. 특히 삼성SDS는 델과 협력해 AI 팩토리를 구축했으며 이를 통해 모델 정확도를 98%까지 향상시키고 업무 생산성을 70% 이상 개선한 것으로 알려졌다. 스콧 구 삼성SDS 클라우드 서비스 사업부문 부사장은 델-엔비디아 협력을 두고 "우리는 모든 고객을 위한 AI 팩토리를 구축하고 있다"며 "이를 서비스 형태로 안전하게 제공하거나 고객의 자체 환경에 배포할 수 있도록 하고 있다"고 말했다. 향후에도 델은 엔비디아와 협력해 AI 시장에서의 입지를 더욱 강화할 계획이다. 바룬 초프라 델 수석 부사장은 "우리는 엔비디아와 AI 도입을 가속화할 수 있는 완벽한 파트너"라며 "AI 생태계 전반에서 기업들이 혁신을 실현할 수 있도록 지원할 것"이라고 강조했다.

2025.03.19 08:32조이환

엔비디아 'GTC 2025' 개막...젠슨 황 입 주목

엔비디아가 생성형 인공지능(AI)과 고성능 컴퓨팅 미래 비전을 제시한다. 엔비디아는 17일부터 21일(현지시간)까지 미국 캘리포니아 산호세에서 'GPU 테크놀로지 컨퍼런스(GTC) 2025'를 개최해 AI 시대 필요한 차세대 그래픽처리장치(GPU)를 비롯한 AI 칩, 소프트웨어(SW) 플랫폼을 발표한다. 이번 행사는 세션 약 1천개, 연사 2천명, 전시 400개로 구성됐다. 젠슨 황 엔비디아 최고경영자(CEO)는 18일 오전 10시 SAP 센터에서 기조연설을 진행한다. 매년 글로벌 기술 업계는 황 CEO 발표 내용에 주목했다. 엔비디아는 이번 황 CEO 연설이 AI와 고성능 컴퓨팅 기술에 초점을 맞출 예정이라고 밝혔다. 로보틱스, 소버린 AI, AI 에이전트, 자동차 분야 관련 발표도 진행된다. 다수 외신은 이번 행사에서 블랙웰 칩 라인업 업그레이드 버전이 공개될 가능성이 크다고 봤다. 앞서 황 CEO는 최근 실적 발표에서 차세대 블랙웰 B300 시리즈 '블랙웰 울트라'가 올해 하반기 출시될 예정이라고 밝힌 바 있다. 블랙웰 울트라는 기존보다 더 높은 컴퓨팅 성능을 제공하며, 288GB 메모리를 탑재했다. 메모리 집약적인 AI 모델을 실행하고 학습하는 데 적합할 것이라는 평가를 받고 있다. 차세대 GPU 시리즈인 '루빈'도 이번 GTC에서 언급될 것이란 분석도 이어지고 있다. 루빈은 2026년 출시 예정이다. 테크크런치는 "이번 행사에 루빈 이후 제품에 대한 내용도 일부 공개될 전망"이라며 "루빈 울트라 GPU 혹은 루빈 다음 세대의 GPU 아키텍처일 수도 있다"고 봤다. 엔비디아는 '퀀덤 데이'를 통해 양자 컴퓨팅 전략도 제시한다. 양자 컴퓨팅 분야 주요 인사들과 양자 애플리케이션 개발을 위한 로드맵을 논의할 예정이다. 외신은 엔비디아가 올해 행사 성과가 비즈니스에 영향 미칠 것이라고 봤다. 초기 블랙웰 GPU 과열 문제와 미국 수출 통제로 인한 관세 우려가 엔비디아 주가 하락으로 이어진 바 있다. 여기에 중국 AI 스타트업 딥시크가 딥시크-R1 모델을 출시하면서 투자자들은 고성능 GPU 수요에 대한 우려를 표하고 있다. 이 외에도 엔비디아는 이번 GTC에서 글로벌 기업과 연구 기관, 정부와 맺은 전략적 협업 사례와 성과도 소개한다고 밝혔다. 개발자와 기술 전문가를 위한 교육 세션을 전년보다 확대했다. 또 데이터 보안 등 AI 윤리적 측면을 다룬 토론회도 진행될 예정이다. 엔비디아는 "이번 GTC는 AI와 가속 컴퓨팅 미래를 결정짓는 중요한 자리가 될 것"이라며 "기술 혁신을 선도하고 글로벌 산업의 발전을 이끄는 계기가 될 것"이라고 공식 홈페이지를 통해 밝혔다.

2025.03.16 09:21김미정

[유미's 픽] "엔비디아 H100 특별 할인"...삼성SDS가 광고 나선 이유는

"구독형 그래픽처리장치(GPUaaS) 고민, 삼성SDS가 모두 해결해드립니다." 삼성SDS는 지난 7일 고객사들을 대상으로 '엔비디아 H100 특별 할인'이라는 제목으로 광고 메일을 발송했다. 해당 메일에는 삼성SDS GPUaaS가 좋은 이유 3가지와 함께 ▲최초 사용 후 6개월 간 특별 할인 혜택 제공 ▲최적의 상품 구성 및 견적 제안 등 프로모션 정보가 함께 기재돼 눈길을 끌었다. 삼성SDS가 이처럼 GPUaaS 프로모션 안내 메일을 발송한 것은 최근 관련 시장이 빠르게 성장하며 경쟁이 치열해졌기 때문이다. 인공지능(AI) 기술 개발에 필수인 엔비디아의 그래픽처리장치(GPU)가 고가인 탓에 부담을 느낀 기업들이 자체 구축을 하지 않고 빌려 쓰는 것으로 방향을 틀면서 수요도 폭발적으로 증가하는 분위기다. 9일 시장조사기관 포춘 비즈니스 인사이트에 따르면 글로벌 GPUaaS 시장 규모는 2023년 32억3천만 달러(약 4조7천억원), 지난해 43억1천만 달러(약 5조7천400억원)에서 매년 35.8%씩 성장해 2032년에 498억4천만 달러(약 72조936억원) 규모로 성장할 전망이다. GPUaaS는 AI 인프라를 갖춘 기업들이 클라우드를 통해 가상 환경에서 GPU를 사용자의 주문에 맞춰 할당하고 빌려주는 서비스다. 저렴한 가격으로 인터넷 연결을 통해 필요한 만큼 고성능 GPU에 접근이 가능하다는 점에서 비용 부담을 줄이려는 중견·중소기업들에게 대안으로 떠오르고 있다. 업계 관계자는 "GPUaaS는 AI 모델 학습과 추론 과정에서 GPU를 필요한 시간에만 사용할 수 있어서 기업들이 GPU를 구매하거나 고정적으로 할당받아야 하는 비용 부담을 크게 줄일 수 있다는 것이 장점"이라며 "필요할 때만 유연하게 사용할 수 있도록 해 GPUaaS를 제공하는 기업들은 AI 스타트업 등 타겟 고객들에게 AI 개발의 경제성과 효율성을 부여할 수 있다"고 설명했다. 현재 국내에서 GPUaaS 사업을 전개하는 곳은 아직까지 많지 않다. 최신 GPU를 확보한 데이터센터를 구축하고 있어야 가능한 사업인 만큼, 투자 비용이 많이 들어서다. 업계 관계자는 "GPUaaS 사업은 일종의 AI 인프라 사업으로, 시설이 갖춰져야 서비스를 만들어 운영할 수 있는 것"이라며 "초반에 엄청 투자해놓고 장기적으로 고객을 확보해 수익을 쌓아가는 장치성 산업인 만큼 일반 IT 서비스 기업들이 접근하기는 쉽지 않다"고 말했다. 이에 국내에선 데이터센터를 갖추고 있는 일부 클라우드 기업들과 AI 사업에 투자 속도를 높이고 있는 통신사들을 중심으로 GPUaaS 시장 경쟁에 불을 지피고 있다. 국내에서 서울 상암·수원·구미·춘천·동탄 등 5곳에 데이터센터를 운영 중인 삼성SDS는 지난해부터 GPUaaS 사업을 시작해 생성형 AI를 활용하고자 하는 행정·공공기관에 최적화된 클라우드 서비스를 제공하고 있다. 이곳은 삼성 클라우드 플랫폼(SCP)을 기반으로 GPUaaS 사업을 펼치고 있는 상태로, 엔비디아 호퍼 아키텍처 기반 GPU인 'H100'을 약 1천 장가량 확보하고 있는 것으로 알려졌다. 공식적으로 'H100' 약 1천 장을 확보했다고 밝힌 NHN클라우드도 지난해 오픈한 광주 AI 데이터센터를 기반으로 GPUaaS 사업 확대에 나섰다. 광주 AI데이터센터는 연산량 기준 88.5PF(페타플롭스), 저장 용량 107PB(페타바이트) 등 최고사양 GPU 인프라를 갖춘 AI 데이터센터다. NHN클라우드 측은 정부의 AI 투자 확대 기조 움직임에 따라 광주 AI 데이터센터의 활용도가 더욱 높아질 것으로 예상하고 있다. 업계에선 향후 수년간 시장에 공급 가능한 'PPP 형태'의 AI 데이터센터로서 공공부문 AI 대전환을 위한 정부향 GPU 공급 시 대응에 가장 적합하다는 평가를 내놓기도 했다. NHN클라우드 관계자는 "이에 기반해 올해부터 광주 AICA(인공지능산업융합사업단)와의 GPU 공급 계약 매출 인식을 본격화하고 오는 2029년까지 안정적 매출로 이어갈 계획"이라며 "광주 AI 데이터센터를 기반으로 AI 강국 도약을 위한 '마중물' 역할을 수행할 것"이라고 포부를 밝혔다. KT클라우드는 양보다 질로 승부하는 전략을 택했다. 'H100'을 앞세운 경쟁사들과 달리 연산 처리 능력과 전력 효율성이 더 개선된 엔비디아 호퍼 아키텍처 기반의 'H200'을 AI 인프라에 적용하며 GPUaaS 사업 경쟁력을 끌어올렸다. KT클라우드는 GPU뿐만 아니라 신경망 처리 장치(NPU) 기반 AI 인프라도 확장하고 있다. 리벨리온과 협력해 'AI 서브 NPU' 서비스를 운영 중이며 오는 5월 출시될 리벨리온의 '아톰 맥스'를 적용해 소형언어모델(sLM) 성능을 검증할 계획이다. 또 미국 반도체 설계업체 암페어와도 AI 반도체 협력을 논의하며 기술 역량을 강화하고 있다. KT클라우드 관계자는 "현재 AI 인프라가 필요한 국내 다수의 공공기관과 AI 스타트업을 대상으로 사용량 기반의 탄력적인 GPU 자원 이용이 가능한 GPUaaS를 제공 중"이라며 "앞으로 AI 인프라뿐만 아니라 AI운영(AIOps) 등 포트폴리오를 확대해 AI 기술 경쟁력을 강화하고 고객의 다양한 니즈에 대응해 나가겠다"고 밝혔다. 카카오클라우드도 올해 전사 매출을 견인할 핵심 사업으로 GPUaaS를 점찍고 관련 기술 고도화 및 가격 경쟁력 확보에 나섰다. 이곳은 현재 엔비디아 A100, V100, T4 등 다양한 고성능 GPU 인스턴스를 지원하고 있는 상태로, 엔지니어링 최적화를 통해 GPU의 성능을 극대화했다는 점을 차별화 포인트로 내세우고 있다. 특히 가상머신(VM)과 GPU를 같은 가상 네트워크 환경에 위치시켜 데이터 전송 속도를 기존 대비 50배 더 높였다. 여러 개의 GPU를 연결한 'GPU 클러스터'의 데이터 전송 속도를 높이기 위해 설계된 네트워크 기술인 전용 인피니밴드 구성으로 최대 4배 확장된 대역폭과 저지연 환경도 지원 중이다. 카카오엔터프라이즈는 올해 AI, 금융, 모빌리티 등 분야의 다양한 고객사례 확보를 지속하며 AI 모델 개발 및 학습, 서비스 제공을 위한 핵심 인프라로 GPUaaS 사업 가속화할 계획이다. 또 LG CNS, 베스핀글로벌 등 대형 클라우드 관리(MSP) 업체들과의 전략적 파트너십을 강화해 중소·중견기업(SMB) 및 스타트업 지원, 지역 거점 중심 공공 클라우드 확산 등에 집중할 방침이다. 네이버클라우드는 지난해 데이터 관리 업체 데이터얼라이언스와 손잡고 GPUaaS 사업을 진행 중이다. 데이터얼라이언스가 선보인 GPU 공유 플랫폼인 '지큐브'를 통해 유휴 GPU를 공급하는 식이다. 통신사 중에선 SK텔레콤이 가장 적극적이다. 지난해부터 GPUaaS 사업에 뛰어든 이곳은 자회사 SK브로드밴드의 가산 데이터센터에 GPU를 탑재한 후 'SKT GPUaaS'를 출시하며 고객 확보에 집중하고 있다. 이를 위해 엔비디아로부터 GPU를 직접 공급받는 GPU 구독 서비스 기업 람다와 협력 체계를 구축한 상태로, 3년 안에 최소 1천 대 이상의 GPU를 확보한다는 계획이다. 현재 엔비디아 'H100'을 배치했으며 'H200'도 올해 1분기 안에 도입할 예정이다. 업계 관계자는 "GPUaaS 공급 기업들은 기존에 제공하고 있던 구독형 인프라 서비스(IaaS)에 GPU를 추가한 형태로 보다 더 높은 부가가치를 창출할 수 있다는 점에서 해당 사업에 매력을 느끼고 있다"며 "AI 기업들은 고성능 컴퓨팅 자원이 필요하지만 자체적으로 해결하기에 비용 부담이 크다는 점에서 GPUaaS에 많은 관심을 보이고 있다"고 밝혔다. 이어 "GPUaaS 공급 기업들은 사업 경쟁력을 높이고자 최신 GPU 확보를 위해 점차 글로벌 기업들과의 협업에도 적극 나서는 분위기"라고 덧붙였다.

2025.03.09 08:59장유미

인텔 "보안은 끝없는 여정...제품 개발부터 출시 이후까지 지속 관리"

"보안 보증은 목적지가 없는 여정입니다. 인텔에서는 세계적 수준의 표준에 맞춰 프로그램과 프로세스를 지속적으로 평가하고 진화하며, 개선 및 적응을 추구합니다. 이것이 보안 우선 서약의 본질입니다." 4일 오전 원격으로 진행된 인터뷰에서 제리 브라이언트(Jerry Bryant) 인텔 보안 커뮤니케이션·사고 대응 담당 시니어 디렉터가 이렇게 설명했다. 인텔은 지난 2월 중순 보안관련 시장조사업체인 ABI리서치에 의뢰해 발간한 '2024 인텔 제품 보안 보고서'를 공개하고 지난 1년간 각종 제품과 서비스에서 발견된 보안 취약점과 대응 상황을 소개했다. 보고서에 따르면 인텔은 지난 한 해 동안 총 374개의 취약점을 해결했으며, 그중 96%가 선제적 조치로 발견됐다. 특히 하드웨어 취약점 21개는 모두 인텔 내부 인력이 발견한 것이다. 보안 관련 지속 투자로 경쟁사 대비 높은 수준 유지 ABI리서치가 평가한 보안 대비 태세 평가에서 인텔은 82.2점으로 업계 1위를 차지했다. 이는 2위 퀄컴(68.5점)과 상당한 격차를 보이는 수치다. 제리 브라이언트 시니어 디렉터는 "인텔은 보안 개발 라이프사이클(SDL) 프로그램, PSIRT, 혁신적인 버그 바운티 프로그램, 적극적인 보안 연구 역량, 장기 보존 및 지원 랩, 예측 가능한 인텔 플랫폼 업데이트 프로세스로 보안에 지속적 투자중"이라고 설명했다. 보고서에 따르면 지난 해 인텔 제품에서 발견된 하드웨어 신뢰 기반(root-of-trust) 취약점은 경쟁사인 AMD의 33% 수준으로 적었다. 이러한 격차에 대해 브라이언트 디렉터는 인텔의 체계적 접근법을 강조했다. "인텔 내 하드웨어 신뢰 보안을 담당하는 팀은 보안 우선 사고방식으로 체계적인 접근 방식을 이용해 제품을 개발하도록 돕고 있다. 보안은 인텔 문화에 깊이 뿌리 박혀 있고, 직원들은 이를 달성하기 위해 최선을 다하고 있다." 지난 해 하드웨어 취약점 전부 내부에서 발견 인텔은 지난 해 하드웨어 관련 보안 취약점 중 전체 21개를 모두 내부 연구와 검토 과정에서 해결하고 이에 대한 해결책을 내놨다. 제리 브라이언트 시니어 디렉터는 이것이 인텔의 보안 연구 역량을 잘 보여준다고 설명했다. "외부 위협과 공격 방법이 끊임없이 진화하고 있으며, 아무도 완벽한 보안을 보장할 수 없다는 것은 누구나 아는 사실이다. 그러나 인텔은 이런 문제를 해결하기 위한 인적 자원을 보유하고 있다." 그는 이어 "최종 제품이 실리콘으로 생산되기 전에 특정 분야에서 발생할 수 있는 문제를 미리 찾아내고 제거하고 있으며 '장기 보존 및 지원 연구실' 역량을 활용해 현재 발견된 문제가 이미 출시된 다른 제품에도 존재하는지 파악하고 있다"고 설명했다. 전체 취약점 중 53% 버그 바운티로 발견... 보안 업계와 협력 주요 소프트웨어·하드웨어 업체들은 보안 취약점을 발견하는 개인이나 보안 회사에 보상금 등을 지급하는 '버그 바운티' 프로그램을 진행한다. 인텔 버그 바운티 프로그램은 지난 해 전체 취약점의 53%를 발견하는 성과를 거뒀다. 제리 브라이언트 시니어 디렉터는 "버그 바운티 프로그램의 이런 성과는 단시일 안에 만들어지지 않았다"며 "2018년부터 시작해 보안 전문가/학계와 적극적으로 협력해 얻은 성과"라고 설명했다. 그는 "인텔은 단순한 버그 바운티 프로그램에서 한 단계 더 나아가 2022년부터 '서킷 브레이커 프로젝트'를 시작했다. 인텔 엔지니어가 보안 관련 연구진이 하드웨어나 펌웨어에도 집중할 수 있도록 일정 기간동안 이를 지원하고 있다"고 설명했다. 이어 "현재까지 다른 실리콘 공급업체는 인텔 '서킷 브레이커 프로젝트'와 비슷한 프로그램을 운영하지 않는 것으로 안다"고 덧붙였다. 일정한 업데이트 주기로 사전 검증 효율 향상 인텔은 현재 매 분기별로 제품이나 소프트웨어 관련 보안 취약점을 공개하고 패치와 업데이트를 적용하는 '인텔 플랫폼 업데이트'(IPU) 프로세스를 운영중이다. 제리 브라이언트 시니어 디렉터는 "하드웨어와 펌웨어 업데이트 주기를 일정하게 유지하면서 전체 생태계가 일정한 날짜에 최종 업데이트를 제공할 수 있다는 것이 가장 큰 장점"이라고 설명했다. 그는 대규모 PC 제조사를 예로 들어 "이들 업체는 수백 개의 제품에 업데이트를 적용하고 검증해야 한다. 예측 가능한 업데이트 주기는 사전 검증과 리소스 투입 효율성을 높인다"고 설명했다. 제리 브라이언트 시니어 디렉터는 "인텔은 문제를 찾아 완화하는 인력의 역량과 절차에 대해 자신감을 가지고 있다. 문제가 발생한다면 인텔 플랫폼 업데이트 등 관련 절차를 통해 생태계에 해결 방법을 신속하게 제공하는 충분한 능력을 가지고 있다"고 강조했다.

2025.03.04 16:24권봉석

엔비디아, AI 네트워크 칩으로 시스코 실리콘 원 선정

시스코(Cisco)와 엔비디아(NVIDIA)가 기업의 인공지능(AI) 도입을 가속화하기 위해 파트너십을 확대한다. 26일 시스코와 엔비디아는 AI 지원 데이터 센터 네트워크 구축을 단순화하기 위해 포트폴리오 간 통합 아키텍처를 구축할 것이라고 밝혔다. 이번 파트너십의 핵심은 시스코의 실리콘 원(Silicon One)과 엔비디아의 스펙트럼-X(Spectrum-X) 이더넷 네트워킹 플랫폼의 결합이다. 엔비디아는 고성능 AI 데이터센터 구축을 위한 네트워킹 플랫폼인 '스펙트럼-X'에 사용할 핵심 네트워크 칩으로 시스코의 실리콘을 선정했다. 이를 통해 시스코가 유일한 네트워크 칩셋 공급업체가 된다는 설명이다. 또한, 시스코는 엔비디아의 스펙트럼 실리콘과 운영체제 소프트웨어를 결합한 시스템을 구축해 고객들이 데이터센터에서 시스코 네트워킹과 엔비디아 기술을 동시에 표준화할 수 있도록 지원할 계획이다. 이번 협력을 통해 두 회사는 AI 워크로드를 위한 고성능, 저지연, 에너지 효율적인 연결을 제공해 데이터센터, 클라우드, 사용자 간의 원활한 통합을 지원한다는 방침이다. 또한, 고객들은 기존 관리 도구와 프로세스를 활용하여 프론트엔드와 백엔드 네트워크를 아우르는 공통 아키텍처로 AI 인프라 투자 최적화에 나선다. 시스코는 2025년 중반까지 실리콘 스위치를 스펙트럼-X 및 엔비디아의 참조 아키텍처와 호환되도록 업데이트할 계획이다. 여기에는 기존 및 향후 출시될 시스코 넥서스, 시스코 하이퍼패브릭, 시스코 UCS 제품이 포함된다. 시스코의 척 로빈스 회장 겸 CEO는 "기업들은 AI를 신속하고 효과적으로 배포해야 하는 압박을 받고 있으며, 많은 리더들이 투자와 위험 간의 균형을 맞추는 데 어려움을 겪고 있다"며 "시스코와 엔비디아는 고객들의 이러한 장벽을 제거하고, 인프라 투자를 최적화하여 AI의 잠재력을 활용할 수 있도록 협력하고 있다"라고 말했다. 엔비디아의 젠슨 황 창립자 겸 CEO는 "AI는 빛의 속도로 발전하며 모든 산업을 혁신할 것"이라며 "엔비디아 스펙트럼-X는 이러한 AI를 위해 강화되고 초고속화된 이더넷"이라고 설명했다. 이어 "시스코의 기업 플랫폼과 글로벌 도달 범위와 함께 우리는 전 세계 기업들이 AI로의 전환을 위해 최첨단 엔비디아 인프라를 구축하도록 도울 것"이라고 말했다.

2025.02.26 16:44남혁우

KT클라우드, 구독형 GPU에 엔비디아 'H200' 적용…고성능 AI 인프라로 고객 확보 가속

KT클라우드가 엔비디아의 최신 그래픽처리장치(GPU)를 인공지능(AI) 인프라에 적용하며 GPU 서비스를 한층 강화한다. AI 학습과 추론 워크로드 최적화를 앞세워 공공기관·스타트업 고객 확보에 나서기 위함이다. KT클라우드는 자사의 AI 훈련 서비스에 엔비디아 'H200'을 도입해 AI 인프라 성능을 개선한다고 24일 밝혔다. 기존 'H100' 기반의 AI 훈련 서비스에 최신 GPU를 추가해 연산 처리 성능과 전력 효율을 향상시키는 것이 이 프로젝트의 핵심이다. KT클라우드는 사용량 기반의 '서비스로의 GPU(GPUaaS)'를 제공하며 AI 학습과 추론 영역에 최적화된 인프라를 구축해왔다. 특히 AI 훈련 서비스는 대규모 GPU 노드 클러스터링과 동적할당 제어 기능을 통해 대량의 연산 작업을 효율적으로 처리할 수 있도록 설계됐다. GPU 노드 클러스터링은 여러 GPU 서버를 하나의 클러스터로 묶어 연산 성능을 극대화하는 기술로, 대규모 AI 학습에서 병렬 연산을 최적화하는 데 핵심적인 역할을 한다. 또 동적할당 제어 기능은 사용자의 작업량에 맞춰 자원을 실시간으로 배분하고 불필요한 자원 낭비를 줄여 최적의 GPU 성능을 유지한다. 이번 'H200' 도입은 이러한 기능을 보다 강화해 고성능 AI 학습 환경을 지원할 것으로 기대된다. 'H200'은 엔비디아 '호퍼(Hopper)' 아키텍처 기반의 최신 GPU로, 이전 모델인 'H100' 대비 연산 처리 능력과 전력 효율성이 개선됐다. 특히 메모리 대역폭이 확대돼 대규모 AI 모델 학습과 추론 성능을 극대화할 수 있는 것이 특징이다. KT클라우드는 GPU뿐만 아니라 신경망 처리 장치(NPU) 기반 AI 인프라도 확장하고 있다. 리벨리온과 협력해 'AI 서브 NPU' 서비스를 운영 중이며 오는 5월 출시될 리벨리온의 '아톰 맥스'를 적용해 소형언어모델(sLM) 성능을 검증할 계획이다. 또 미국 반도체 설계업체 암페어와도 AI 반도체 협력을 논의하며 기술 역량을 강화하고 있다. 공공 분야 대응도 강화한다. 회사는 올해 하반기 공공기관을 대상으로 AI 추론 전용 상품의 클라우드 서비스 보안 인증(CSAP) 절차를 진행할 계획으로 이로써 공공기관에서도 안전하게 AI 추론 서비스를 이용할 수 있도록 지원할 예정이다. 공용준 KT클라우드 클라우드본부장은 "이번 엔비디아 'H200' 도입으로 글로벌 수준의 AI 인프라를 확보하게 됐다"며 "앞으로 AI 인프라뿐만 아니라 AI운영(AIOps) 등 포트폴리오를 확대해 AI 기술 경쟁력을 강화하고 고객의 다양한 니즈에 대응해 나가겠다"고 말했다.

2025.02.24 11:21조이환

'AI 3대 강국' 목표 세운 韓, 대규모 투자 시동…조준희 "산업용 LLM에 주목해야"

최근 우리나라 정부가 인공지능(AI) 분야를 국가 전략 기술로 지정하고 집중 지원에 나선 가운데 국내 기업들이 산업용 거대언어모델(LLM) 개발에 적극 나서야 한다는 주장이 나왔다. 23일 업계에 따르면 조준희 한국소프트웨어협회장은 최근 자신의 소셜미디어(SNS) 페이스북 계정을 통해 "AI는 국가적으로 전략물자 수준 이상으로 생각해야 되고, 일종의 '핵무기'와 같다고 봐야 된다"며 "앞으로는 우리를 보호하는 무기로서의 AI를 가질 것이냐, AI 핵우산에 기댈 것이냐의 선택일 것"이라고 강조했다. 그러면서 "산업 보국을 위해서는 기업 수와 고용이 동반해서 늘어야 되는데 그런 면에서 우리가 소홀히 보고 있는 산업용 LLM 시장에 큰 기대감을 가지고 있다"며 "특히 제조 강국으로서의 산업 특화 LLM 개발 부분은 수출 측면에서도 선전 할 수 있다고 생각한다"고 덧붙였다. 조 회장이 이처럼 주장하고 나선 것은 최근 우리나라에서 AI 산업 발전을 위해 정부와 기업이 다각도로 방안을 모색하고 있는 상황에서 방향성을 제시하기 위한 것으로 분석된다. 앞서 정부는 지난 20일 제3차 국가AI위원회 회의를 진행해 '국가대표 정예팀'을 선발하는 한편, 빠른 시간 안에 세계 최고 수준의 LLM을 개발할 수 있도록 데이터와 그래픽처리장치(GPU) 등을 전폭 지원하겠다는 계획을 내놓은 바 있다. 특히 AI 컴퓨팅 인프라 확충을 위해 단기적으로는 내년 상반기까지 1만8천 장 규모의 첨단 GPU를 확충하기로 했다. 1만 장은 국가AI컴퓨팅센터를 중심으로 올해 안에 마련하고 나머지 8천여 장은 슈퍼컴퓨터 6호기 구축을 통해 확보한다. 장기적으로 2030년까지 국가AI컴퓨팅센터 내 국산 AI 반도체 비중을 50%로 끌어올려 저전력·고성능의 국산 AI 반도체 경쟁력을 높인다는 계획이다. 초기에는 엔비디아 등의 GPU를 쓰되 국산 AI 반도체의 성능을 검증해 점차 비율을 늘린다는 방침이다. 범용인공지능(AGI) 구현에 필요한 핵심 원천기술 확보도 추진하고 있다. 약 1조원을 투입할 계획으로, 현재 예비타당성 조사가 진행 중이다. 이에 대해 조 회장은 "국가 AI 역랑 강화 방안들은 어려운 환경에서 시기 적절하고 정교하게 잘 만들어졌다"며 "실행에 만전을 기하면 승산이 있다고 본다"고 말했다. 정부가 이처럼 나선 것은 AI 주도권을 둘러싼 글로벌 시장 경쟁이 갈수록 격화되고 있어서다. 미국은 지난 달 오픈AI, 오라클을 중심으로 AI 데이터센터에 약 730조원을 투자하는 '스타게이트 프로젝트'를 발표했다. 이에 질세라 유럽연합(EU)은 'AI기가팩토리 프로젝트'를 포함해 300조원가량을 투자키로 했다. 프랑스도 AI데이터센터에 약 163조원을 투자할 것이란 계획을 최근 공개했다. 하지만 우리나라는 미국, 중국에 이어 'AI 3대 강국'을 목표로 하고 있지만 '쩐의 전쟁'에선 다소 밀리는 모양새다. 한국은 일단 글로벌 AI 생태계에서 싱가포르·영국·프랑스와 함께 3위권으로 평가 되고 있지만, 고성능 AI 모델을 개발하기에는 국내 인프라가 부족하다는 지적을 받고 있다. 실제 지난해 기준 우리나라가 보유한 엔비디아의 AI 반도체 'H100'은 약 2천 개로, 미국 빅테크 메타의 15만 개, 마이크로소프트(MS)의 15만 개에 비해 상당히 낮은 수치다. 기술격차도 갈수록 커지고 있다. 미국과는 지난해 3월 기준 1.3년에 달했고 유럽과는 1년, 중국과는 0.9년의 차이가 났다. AI 고급 인재의 해외 이탈도 많아지면서 기술 개발에도 상당히 어려움을 겪고 있다. 이에 카카오는 자체 LLM 개발 중심 전략에서 선회해 오픈AI와 손을 잡았다. LLM 개발에 수천억원이 든다는 점에서 부담이 컸기 때문이다. 하지만 업계에선 카카오의 이 같은 전략에 대해 상당한 아쉬움을 드러냈다. 카카오가 파운데이션 AI 모델 개발에 소요되는 대규모 투자 비용을 절감하는 효과가 있겠지만, 자체적인 AI 역량 확보가 어려워져 향후 해외 진출에 어려움을 겪을 수도 있다고 판단해서다. 조 회장은 "국내 국민 메신저를 운영하는 대기업의 미국 LLM기업과의 제휴는 AI가 국가 기간산업이라는 철학이 부재한 보여주기식의 쉬운 접근"이라며 "(이 같은 전략은) 성공하기 어려울 것"이라고 주장했다. 이어 "AI는 LLM, GPU, 고대역폭메모리(HBM), 프로세싱-인-메모리(PIM), 클라우드, 양자 등 대규모 융합 산업으로, 어느 하나도 포기할 수 없는 주요 테크산업인 만큼 협업과 종합적인 접근이 중요하다"며 "올해 (우리나라가 AI기본법과 관련해) 세부 규정과 시행령을 더 정교하게 만들어서 미국 빅테크 기업을 적절히 견제하고 국내 산업을 증진시킬 수 있도록 (모두의) 균형있는 노력이 필요할 것"이라고 덧붙였다.

2025.02.23 15:37장유미

엔비디아 "딥시크 AI 혁신, GPU 수요 더 증가시킬 것"

엔비디아가 27일(미국 현지시간) 중국 AI 스타트업 딥시크(DeepSeek)가 공개한 새 AI 모델 'R1'에 대해 긍정적인 평가를 내왔다. 딥시크 R1은 20일 공개된 추론 특화 AI 모델이다. 자체 테스트 결과에 따르면 딥시크 R1은 일부 테스트에서 오픈AI의 추론 특화 모델 'o1'보다 나은 성능을 보였다. 또 2022년 미국 상무부의 수출 통제 조치를 우회하기 위해 엔비디아가 성능을 낮춘 H800 GPU를 이용했다. 모델 훈련에 든 순수 비용은 557만6천달러(약 80억원)이며 메타가 라마(LLaMa) 등 AI 모델 개발에 투입한 비용의 10% 수준이다. 지난 주 알렉산더 왕 스케일AI CEO는 미국 CNBC와 인터뷰에서 "딥시크가 미국 정부의 수출 규제를 우회해 고성능 GPU를 썼을 것"이라고 주장했다. 그러나 엔비디아는 "시크가 사용한 GPU가 미국의 수출 규정을 완전히 준수했다"고 확인했다. 27일 미국 증권 시장에서는 딥시크 R1 이후 비교적 성능이 낮은 GPU로 고성능 AI 모델 개발이 활발해질 것이라는 전망에 따라 엔비디아 주가가 크게 하락했다. 1주당 가격은 지난 주 대비 16.86% 하락한 118.58달러(약 17만 2천원)로 마감했고 시가총액은 6천억 달러(약 868조원) 가까이 줄었다. 미국 CNBC에 따르면 엔비디아는 "딥시크는 탁월한 AI 발전의 사례이며, 사용 가능한 모델과 완전한 수출 통제 준수 하에 구축된 컴퓨팅을 활용하여 새로운 모델을 생성하는 방법을 잘 보여준다"고 밝혔다. 엔비디아 관계자는 이어 "추론은 상당히 많은 엔비디아 GPU와 고성능 네트워킹이 필요하다. 이와 같은 딥시크의 혁신이 GPU 수요를 더욱 증가시킬 것"이라고 전망했다.

2025.01.28 16:22권봉석

엔비디아 '지포스 RTX 5090' 성능 공개... 전작比 최대 40% ↑

엔비디아가 올 초 CES 2025 기조연설에서 공개한 지포스 RTX 5090의 테스트 결과가 국내외 IT 매체를 통해 24일 오전 0시경 일제히 공개됐다. 지포스 RTX 5090은 블랙웰(Blackwell) 아키텍처 기반 PC용 GPU이며 5세대 텐서 코어, 4세대 레이트레이싱(RT) 코어, 최대 GDDR7 32GB 메모리를 활용해 게임 등 3D 성능과 AI 처리 성능을 강화했다. 미국과 일본 등 주요 IT 매체 테스트 결과에 따르면 지포스 RTX 5090은 전세대(RTX 4090) 대비 벤치마크 프로그램에서는 최대 40% 성능 향상을 보였다. 4K(3840×2160 화소) 해상도에서도 전작 대비 30% 성능이 향상됐다. 3D마크 '스틸노매드' 벤치마크에서 51% 점수 향상 일본 PC워치는 24일 "지포스 RTX 5090 파운더스 에디션 그래픽카드와 전세대 제품(RTX 4090 파운더스 에디션) 성능을 비교한 결과 3D마크 등 벤치마크에서 성능 향상이 눈에 띈다"고 밝혔다. 이 매체는 "3D마크에 추가된 다이렉트X 12 기반 '스틸노매드' 실행시 RTX 5090은 14,060점, RTX 4090은 9,301점으로 51% 점수가 높아졌다. 레이트레이싱 성능 테스트인 '포트로얄' 점수 역시 RTX 4090(26,193점) 대비 39% 더 높다"고 밝혔다. 미국 PC 전문매체 톰스하드웨어는 "3D마크 다이렉트X 레이트레이싱 기능 테스트에서 RTX 4090이 초당 137.91 프레임, RTX 5090이 108.64 프레임이 나왔으며 드라이버 튜닝이나 업데이트가 필요한 상황"이라고 설명했다. 4K 해상도 게임에서 평균 30% 가량 성능 향상 톰스하드웨어는 4K 해상도, 그래픽 수준 '울트라'로 설정한 상태에서 16개 게임의 초당 프레임 수 평균을 낸 결과도 공개했다. RTX 5090은 초당 105.6프레임, RTX 4090은 초당 84.4 프레임이었다. 이 매체는 "4K 해상도, 그래픽 수준 '높음'이 RTX 5090의 명확한 소비층이며 적절한 디스플레이가 있다면 더 높은 해상도로 구동하는 것도 가능할 것"이라고 밝혔다. PC워치 역시 4K 해상도의 성능 향상에 주목했다. 이 매체는 "RTX 5090은 마이크로소프트 플라이트 시뮬레이터 2024에서 RTX 4090 대비 48% 성능 향상, F1 24에서는 24-26%, 사이버펑크 2077에서 28-32% 성능 향상이 있었다"고 밝혔다. "4K 해상도서 최대 성능 발휘... 추가 최적화 필요" 톰스하드웨어는 "지포스 RTX 5090은 4K 해상도와 최대 그래픽 설정으로 게임을 즐기려는 소비자에게 가장 적합한 선택이며 모든 게이머가 갖고 싶어하지만 극소수만 살 수 있는 제품"이라고 평가했다. 이어 "이 GPU의 드라이버와 소프트웨어가 아직 완전히 성숙하지 않았으며, 일부 게임과 애플리케이션에서 추가 최적화가 필요한 상황"이라고 덧붙였다. PC워치는 "RTX 5090의 성능은 전작인 RTX 4090을 뛰어넘고 DLSS 4의 멀티프레임 생성 기능은 유용하지만 실제 게임에서 더 폭넓은 검증이 필요하다"고 언급했다. 국내 시장에 2월 초부터 본격 공급 예정 지포스 RTX 5090 탑재 그래픽카드는 오는 1월 말 출시 예정이다. 시장 수요에 비해 적은 초기 물량 탓에 당분간 시장에서 쉽게 구하기 힘들 것으로 보인다. 영국 IT 온라인 유통업체 OCUK는 "지포스 RTX 5090 그래픽카드 재고가 10대 미만이며 출시 시 물량은 두 자릿수에 그칠 것으로 예상된다. 한 단계 아래 제품인 지포스 RTX 5080 재고도 수백 개에 그칠 전망"이라고 밝혔다. 지포스 RTX 5090 그래픽카드는 국내 시장에 2월 초부터 본격 공급 예정이다. 24일 한 제조사 관계자는 "RTX 5090 탑재 그래픽카드 샘플이 23일에야 국내에 들어왔고 제조 시설이 있는 중국도 연휴 기간이 겹쳐 초기 물량은 적을 것"이라고 말했다. 주요 제조사들은 국내 가격에 가장 큰 영향을 미치는 기준 환율 책정에도 고심중이다. 또다른 제조사 관계자는 "현재 원-달러 환율이 1천450원 아래로 떨어졌지만 설 연휴 중 추이를 봐야 하는 상황"이라고 설명했다.

2025.01.24 13:41권봉석

Prev 1 2 3 4 5 6 Next