검색 - IT세상을 바꾸는 힘 지디넷코리아

ZDNet 검색 페이지

'엔비디아 GPU'통합검색 결과 입니다. (162건)

태그
기간
- 3개월
- 1년
- 1년 이전

재검색

엔비디아 '블랙웰' 칩 수요 쾌청…삼성·SK HBM 성장 기회

엔비디아가 AI 반도체 산업의 성장세를 자신했다. 미국의 대중 수출 규제 여파에도 최첨단 AI 반도체인 '블랙웰'의 수요가 강력하고, 전 세계 AI 인프라 투자가 활발히 진행되고 있기 때문이다. 초고성능 AI 반도체인 'GB300' 역시 올 3분기 초 차질없이 양산이 시작될 것으로 전망된다. 이에 따라 국내 주요 메모리 업체인 삼성전자, SK하이닉스의 HBM(고대역폭메모리) 사업도 지속적인 성장의 기회를 잡을 수 있을 것으로 기대된다. 中 수출 규제, AI 산업 성장세 등 불확실성 '해소' 이날 엔비디아는 2026년 회계연도 1분기(올해 2~4월) 매출액 440억6천만 달러를 기록했다고 밝혔다. 전년동기 대비 69%, 전분기 대비 12% 증가한 수치다. 영업이익도 232억7천만 달러(Non-GAAP 기준)로 전년동기 대비 43%, 전분기 대비 6% 증가했다. 다만 데이터센터 매출액은 391억1천만 달러로 증권가 컨센서스(약 393억 달러)를 소폭 하회했다. 미국 트럼프 2기 행정부의 수출 규제 강화로 중국향 AI 반도체 'H20'의 판매가 전면 금지된 데 따른 영향이다. 엔비디아는 해당 규제로 1분기 45억 달러의 손실이 발생했으며, 2분기에도 80억 달러의 추가 손실이 있을 것으로 추산했다. 그럼에도 엔비디아는 2분기(5~7월) 매출 가이던스를 약 450억 달러로, 기존 증권가 컨센서스인 455억에 근접한 수준을 제시했다. H20의 수출 금지에도 최신형 AI 반도체인 블랙웰 시리즈의 수요가 견조한 덕분이다. 문준호 삼성증권 연구원은 "엔비디아의 2분기 매출 전망치는 전분기 대비 2% 증가에 그치나, H20의 손실 반영을 제외하면 14%의 성장세"라며 "그만큼 블랙웰의 수요는 같은 기간 더 좋아졌고, 이번 실적 발표에서 불확실성 요인이 다수 해소된 것도 중요한 대목"이라고 설명했다. GB300 양산 임박…SK하이닉스 HBM 훈풍 나아가 엔비디아는 올 하반기에도 전 세계 AI 인프라 투자로 인한 지속적인 성장을 자신했다. 젠슨 황 엔비디아 CEO는 ▲ 추론형 AI의 수요 증가 ▲ AI 확산 규정의 철폐 ▲ 엔터프라이즈 AI 시장의 본격적인 성장 ▲ 리쇼어리 정책 대두로 인한 '옴니버스' 등 산업용 AI 수요 증가 등 네 가지를 주요 배경으로 꼽았다. 견조한 AI 산업의 성장세는 국내 메모리 제조업체인 삼성전자, SK하이닉스에게도 긍정적이다. 특히, AI 반도체의 핵심인 HBM(고대역폭메모리)를 엔비디아 주력으로 공급하는 SK하이닉스의 매출 확대가 두드러질 전망이다. 엔비디아는 올 하반기 12단 HBM3E(5세대 HBM)를 탑재한 최신형 AI 반도체 'GB300'를 출시할 예정이다. GB300은 이달 초 주요 CSP(클라우드서비스제공자)에게 샘플이 공급됐으며, 오는 7월께 양산이 시작될 것으로 예상된다. 엔비디아 역시 GB300에 당초 적용하기로 했던 신규 보드 플랫폼의 채용을 미루는 등 제품 안정성 강화에 만전을 기하는 분위기다. SK하이닉스와 엔비디아간 내년 HBM 공급량 협의도 마무리 단계에 접어들었다. 이르면 다음달 최종 결정이 내려질 것으로 알려졌다. 특히, 엔비디아의 차세대 AI 반도체인 '루빈'에 탑재되는 HBM4(6세대 HBM)의 가격 및 물량이 주요 변수로 작용하고 있다.

2025.05.29 14:07장경윤

엔비디아, 1분기 영업이익 25.7조... 전년比 26% ↑

엔비디아가 28일(현지시간) 올 1분기(2~4월, 회계연도 기준 2026년 1분기) 실적을 발표했다. 중국 AI 칩 수출 제한이라는 악재 속에서도 인공지능(AI) 인프라에 대한 강력한 글로벌 수요에 힘입어 시장 예상을 뛰어넘는 실적을 달성했다. 엔비디아가 밝힌 1분기 매출은 441억 달러(약 60조 6375억원)로 전년 동기 대비 69% 늘어났다. 이는 시장조사업체 LSEG가 집계한 월가 예상치 433억 1천만 달러(약 59조 5513억원)를 1.8% 넘어서는 수치다. 영업이익은 187억 달러(약 25조 7천218억원)로 전년 대비 26% 늘어났다. AI 칩과 관련 부품을 포함하는 데이터센터 부문 매출은 391억 달러(약 53조 7625억원)로 전년 동기 대비 73% 증가했다. 이는 전체 매출의 88%를 차지하는 규모이며 시장 예상치 392억 2000만 달러(약 53조 9275억원)에 근접한 수준을 기록했다. 게이밍 부문은 38억 달러(약 5조 2250억원) 매출을 기록해 역대 분기 최대치를 달성했다. 일반 소비자용 새로운 GPU인 지포스 RTX 5070/5060 출시, 최대 4K 해상도 게임 구동을 지원하는 닌텐도 스위치2 프로세서 공급 증가 등이 영향을 미쳤다. 자동차와 로보틱스 부문 매출은 5억 6700만 달러(약 7796억원)로 전년 동기 대비 72% 증가했다. 엔비디아는 제너럴모터스(GM)와 차세대 차량, 공장, 로봇 분야에서 엔비디아 옴니버스, 코스모스, 드라이브 AGX 등을 활용한 협력을 발표하기도 했다. 이번 분기 실적에는 미국 정부의 대중국 수출 규제가 상당한 영향을 미쳤다. 지난 4월 초 미국 정부가 중국 시장을 겨냥한 H20 GPU의 수출 허가를 요구하면서 엔비디아는 H20 초과 재고 및 구매 의무와 관련해 45억 달러(약 6조 1875억원)의 손실을 기록했다. 엔비디아는 2분기(5~7월) 매출을 450억 달러(약 61조 8750억원)로 전망하고 "이는 H20 수출 제한으로 인한 80억 달러(약 11조원)의 매출 손실을 반영한 결과"라고 설명했다.

2025.05.29 09:04권봉석

"엔비디아, 中 겨냥해 저가형 블랙웰 AI칩 출시 예정"

엔비디아가 이르면 6월부터 '블랙웰' 기반의 신규 저성능 AI 반도체를 양산할 계획이라고 로이터통신이 25일 보도했다. 블랙웰은 엔비디아가 출시한 AI 가속기 중 가장 최신 세대의 아키텍처다. 당초 엔비디아는 중국 시장을 겨냥해 '호퍼' 아키텍처 기반의 'H20'을 공급해 왔으나, 최근 미국의 대중(對中) 반도체 수출 규제 수위 강화로 공급이 어려워졌다. 이에 엔비디아는 신규 AI 가속기로 중국 시장을 지속 공략하려는 것으로 풀이된다. 해당 칩은 엔비디아의 'RTX 프로 6000D' GPU를 기반으로 하며, HBM(고대역폭메모리) 대신 최신형 그래픽 D램인 GDDR7를 채용했다. 가격은 6천500~8천 달러 사이로, H20의 가격인 1만~1만2천 달러 대비 크게 낮은 수준이다. 또한 TSMC의 첨단 패키징 기술인 CoWoS(Chip-on-Wafer-on-Substrate)도 활용되지 않는다. CoWoS는 칩과 기판 사이에 넓다란 실리콘 인터포저 위에 반도체 다이(Die)를 수평 배치하는 2.5D 패키징의 일종이다. 지난해 회계연도 기준으로, 중국은 엔비디아의 전체 매출에서 13%를 차지하는 주요한 시장이다. 엔비디아가 미국의 규제를 피해 새롭게 칩을 설계하는 것은 이번이 세 번째다. 한편 신규 칩의 구체적인 이름은 아직 밝혀지지 않았다. 중국 증권사 GF증권은 '6000D', 또는 'B40'으로 명명될 가능성이 높다고 밝힌 바 있다.

2025.05.25 09:05장경윤

SK하이닉스 부스 찾은 젠슨 황 "GO SK! 넘버원" 찬사 연발

[타이베이(대만)=권봉석 기자] 젠슨 황 엔비디아 CEO가 20일(이하 현지시간) 오후 5시 20분경 대만 타이베이 소재 난강전람관 1관에 차려진 SK하이닉스 부스를 깜짝 방문해 최신형 HBM 제품에 대한 찬사를 아끼지 않았다. 이날 젠슨 황 엔비디아 CEO는 대만 내 주요 협력사를 둘러본 후 거의 마지막 순서로 난강전람관 1관 4층에 위치한 SK하이닉스 부스를 방문했다. 젠슨 황 CEO는 오후 5시 20분경 SK하이닉스 부스에 도착해 현장에서 기다리던 김주선 SK하이닉스 사장 이하 관계자들과 인사했다. 데스크톱PC용 고성능 DDR5 메모리 모듈, 엔비디아 GPU에 탑재된 고대역폭메모리(HBM)를 둘러본 그는 각종 전시물에 직접 서명을 남기기도 했다. 이어 "정말 좋습니다. SK 넘버 원. 정말 뛰어난 일을 했습니다"며 현장의 SK하이닉스 임직원을 격려하기도 했다. 젠슨 황 엔비디아 CEO는 마지막으로 현장의 SK하이닉스 임직원들과 "GO SK!" 구호와 함께 기념촬영을 마친 후 우리말로 "감사합니다" 인사를 남겼다. 이후 다음 목적지인 대만 대형 ODM 폭스콘 부스로 이동했다.

2025.05.20 21:43권봉석

유상임 장관, 엔비디아 찾아 GPU 확보 논의...NIPA 협약 체결

유상임 과학기술정보통신부 장관이 지난 14일부터 미국을 찾아 엔비디아와 AI 인프라 구축을 위한 업무협약을 이끌어냈다. 엔비디아 초청을 받아 미국 본사를 방문한 유상임 장관은 제이 퓨리 총괄 부사장, 칼리스타 레드몬드 부사장 등 엔비디아 주요 임원들과 대한민국 AI 인프라 역량 확충을 비롯해 AI 생태계 역량 강화를 위한 협력방안을 논의했다. 정보통신산업진흥원(NIPA)은 엔비디아와 업무협약을 체결, 연내 원활한 첨단 엔비디아 GPU 확보 등 AI 인프라 구축을 위해 협력하기로 했다. 유 장관은 방미 첫날 브랜던 카 연방통신위원회(FCC) 위원장과 면담을 갖고, 전 세계적인 위협이 되고 있는 통신 해킹에 대한 협력 방안을 찾았다. 이 자리에서 한국의 'IoT 보안인증제도'와 FCC의 '사이버 트러스트 마크'의 추진 현황을 공유하며, 양국의 IoT 기업들이 상대국에서 중복 인증을 받는 부담을 줄이고 국민들도 IoT 기기를 안심하고 사용할 수 있도록 한미 양국이 IoT 보안 기준 등에 대해 공유할 필요성을 공감했다. 아울러 양측의 6G 개발과 표준활동에 대해 공유했다. 또 해저 케이블 보안에 대해 지속적인 협력관계를 이어나가기로 뜻을 모았다. 유 장관은 15일 美 백악관 과학기술정책실(OSTP) 린 파커 부실장을 만나 한미 과학기술 협력에 차질없는 추진 방안에 대해 논의하였다. 유 장관은 먼저 한국의 글로벌 R&D 현황을 공유하며 미국과의 협력 내용을 설명하였다. 아울러 R&D 환경 변화에도 한미 간 차질없는 협력을 강조하였다. OSTP측에서는 한국에서 참고할 수 있도록 이번 트럼프 2기 행정부의 투자 우선순위를 공유하고, 이를 바탕으로 R&D 정책 변화를 강구하고 있음을 밝혔다. 특히 유 장관은 민감국가 지정 등의 상황으로 연구보안의 중요성이 증대되고 있는 상황을 설명하였고, 양측은 현재 연구보안 정책을 공유하고, 상호 긴밀히 협력해나가기로 했다. 미측은 트럼프 행정부 1기 때 발표된 연구보안 관련 대통령 각서를 기반으로 이행을 강화해나갈 것이라는 점을 강조했다. 이밖에 미국 국립과학재단, 에너지부(DOE) 산하 페르미 국립가속기연구소, 미국과학진흥협회(AAAS) 등과 의견을 나눴다. 유 장관은 “한국의 글로벌 공동연구 투자 규모 중 미국과의 협력 비중이 가장 큰 현실에서 트럼프 2기 행정부의 변화된 R&D 정책방향과 연구보안 강화 정책이 우리 R&D에 미치는 영향을 빨리 파악하고 대응하는 것이 중요하다”며 “방미를 계기로 미측과 차질없는 협력을 이어가기로 하였고, 이번에 논의한 내용을 한미 R&D 정책에 반영할 계획”이라고 밝혔다. 그는 또 “엔비디아와의 GPU 협력 모색에 착수한 바, 국내 AI 연구환경이 대폭 개선되기를 기대한다”고 강조했다.

2025.05.18 13:17박수형

정부 "다음주 GPU 1만장 확보 사업 공모…복수 CSP 선정 가능성"

정부가 인공지능(AI) 인프라 필수 요소인 그래픽처리장치(GPU) 확보를 위해 민관 협력을 본격화한다. 국내 클라우드 기업을 선정해 데이터센터에 GPU 1만 장을 설치·운영하게 하고, 이를 산학연이 활용하는 방식으로 추진할 방침이다. 과학기술정보통신부는 16일 서울 LW컨벤션센터에서 '최첨단 GPU 확보추진방안' 브리핑을 열고 연내 GPU 확보 청사진을 제시했다. 과기정통부는 정보통신산업진흥원(NIPA) 주관으로 연내 1만장 규모의 GPU 확보 사업을 추진한다. 국내 클라우드 서비스 제공업체(CSP) 간 경쟁을 통해 대상 기업을 선정할 방침이다. 선정된 CSP는 기존 데이터센터 인프라를 활용해 전력, 냉각, 네트워크 등 정비를 마친 뒤 순차적으로 GPU를 구축하고 실서비스로 전환한다. 사업 기간은 5년이다. 앞서 정부는 GPU 확보를 위해 1조4천600억원 추경 예산을 편성했다. 구매 대상은 엔비디아의 H200, B200, 블랙웰 등 고성능 GPU다. 확보된 GPU는 NIPA가 소유하되 국가 컴퓨팅AI센터(SPC)가 사용권을 갖는다. 공모 신청은 다음 주부터다. NIPA가 7월까지 CSP 심사·선정을 진행한다. 심사는 서면평가와 발표, 현장실사를 포함한 절차로 진행된다. 이후 올해 10월까지 GPU 전량을 확보해 선정 CSP에 공급한다. 과기정통부 장기철 인터넷진흥과 과장은 평가 기준이 효율성과 신속성이라고 밝혔다. 정부 재정 투입 대비 얼마나 높은 성능·효율을 확보할 수 있는지, 데이터센터에 GPU를 얼마나 빨리 구축할 수 있는지, GPU 서비스를 신속히 구동할수 있는지가 핵심이라는 설명이다. 정부는 이번 사업에서 복수 CSP가 선정될 수 있다고 밝혔다. 다만 단독으로 가격, 상면, 구축 속도, 활용 계획 등에서 타사 대비 경쟁력 뚜렷한 기업이 있으면 단일 선정될 가능성도 있다. 장기철 과장은 "평가 기준은 기존 SPC 참여 여부, 비용 대비 효율성, 인프라 구축 역량 등"이라고 설명했다. 그러면서 "GPU의 자사 활용 비중 하한선은 명시하지 않기로 했다"며 "다만 공공성과 산업계 파급력 중심으로 평가 기준이 마련될 것"이라고 덧붙였다. 이어 그는 "구체적 평가 항목과 선정 기준 등이 구체적으로 정해지지 않았다"며 "이달 중 공모 신청 브리핑을 추가로 열겠다"고 말했다. 과기정통부 엄열 정보통신정책관은 "이번 사업은 민관이 함께 AI 패권 경쟁에 대응하는 중요한 계기가 될 것"이라며 "국가 전체 경쟁력 강화에 기여하는 방향으로 사업을 추진하겠다"고 밝혔다.

2025.05.16 13:21김미정

[현장] 마음AI "GPT 다음은 피지컬AI…자율주행 농기계 등서 성과"

국내 인공지능(AI) 기업 마음AI는 생성형 AI 다음으로 피지컬 AI(Physical AI) 시대가 올 것이라고 내다봤다. 최홍섭 마음AI 기술 부문 대표는 15일 서울 삼성동 코엑스에서 열린 국제인공지능대전(AI엑스포)에서 'GPT 이후 우리는 어떤 AI를 만들어야 하는가'를 주제로 발표했다. 최 대표는 “오픈AI가 만든 생성형 AI 'GPT' 사용자는 한 달에 5억명”이라며 “경쟁 제품 '제미나이'와 '클로드'가 1억명 안 되는 점을 감안하면 대단한 수준”이라고 평가했다. 그러면서 “올해 초 젠슨 황 엔비디아 최고경영자(CEO)가 'GPT 이후 세상을 바꿀 AI는 피지컬 AI'라고 했다”며 “피지컬 AI는 몸통이 있는 AI로 쉽게 말해 로봇인데, 휴머노이드(인간 형태 로봇)와 자율주행 자동차가 대표”라고 전했다. 최 대표는 “마음AI는 2023년부터 'AI로 로봇을 제어하는 기술 만들어야겠다'고 생각했다”며 “자율주행부터 시작해 상용화까지 성공했다”고 말했다. 주력 제품으로 자율주행 농기계를 소개했다. 이는 과수원에서 나무 사이를 비집고 다니며 농약을 뿌린다. 최 대표는 “넓은 과수원에서 사람이 직접 농약 뿌리려면 시간이 오래 걸리는데다 인건비도 부담”이라며 “인체에 해롭기까지 하다”고 지적했다. 그는 “마음AI 자율주행 농기계는 퀄컴 개발 엔진보다 뛰어난 자체 개발 엔진을 가졌다”며 “건설·국방 로봇으로 영역을 넓힐 것”이라고 강조했다.

2025.05.15 17:03유혜진

정부, 엔비디아 H200·B200 구입...10월부터 GPU 서비스

정부가 연내 엔비디아의 H200, B200 GPU 1만장을 도입해 국내 클라우드 기업이 AI 연구 개발에 쓰이도록 한다. GPU 구매 발주는 7월에 이뤄질 예정이다. 과학기술정보통신부는 14일 열린 경제관계장관회의에서 이같은 내용이 담긴 첨단 GPU 확보 추진 방안을 발표했다. 추경 예산으로 확보하게 되는 GPU 1만장은 H200 6천400장, B200 3천600장 규모로 수급 계획을 세웠으며 모델 비중은 상황에 따라 조정할 예정이다. GPU 구입에 8천600억원, 클러스터 통합 운영환경에 6천억원의 예산을 분배한다. 정부 예산으로 구입한 GPU를 운용할 클라우드 기업(CSP)에 대한 공모는 내주 예정됐으며 GPU 구매 절차는 7월에 진행, 이르면 오는 10월부터 신규 GPU 클러스터를 통한 국내 기업과 학계의 R&D를 진행키로 했다. 국가AI컴퓨팅센터 주체의 컨소시엄 형태 특수목적법인(SPC)에 참여하는 CSP 선정에는 별도 전문가 위원회가 맡는다. 선정 평가는 ▲재정 투입 대비 컴퓨팅 성능을 포함한 GPU 확보 구축 역량 ▲신속한 GPU 서비스 실행력 ▲GPU 자원 자체 활용 비중과 계획(CSP 운영비 성격 고려) 등을 중점에 뒀다. 선정된 CSP와 추후 권리 등에 관한 5년 단위 협약을 체결하게 된다. 협약에는 정보통신산업진흥원(NIPA)의 GPU 소유권 확보, SPC의 GPU 사용, CSP의 일부 GPU 자원 자체활용 허용 등의 내용이 포함된다. 정부는 특히 월드베스트LLM(WBL)에 선정된 기업에 GPU 자원 이용을 우선 제공한다는 방침이다. WBL은 국가대표 생성형AI 모델을 만들겠다는 취지로, 추경 예산을 통해 이뤄지는 프로젝트다. 과기정통부는 “SPC는 공공지분이 51%로 공공기관운영법에 따른 공공기관 지정 가능 요건에 해당한다”며 “내년 1월로 예상되는 공공기관운영위 심의에서 최종 결정될 사항이나 민간의 자율성을 최대한 보장하는 방향으로 부처 협의 중”이라고 밝혔다.

2025.05.14 11:35박수형

美 상원, 고성능 GPU에 위치 추적 기능 의무화 추진

미국 국회가 AI 처리를 위한 고성능 GPU와 프로세서, 서버 등 제품의 작동 위치를 추적할 수 있는 기술을 도입하기 위한 법안을 추진중이다. 톰 코튼(Tom Cotton) 아칸소 주 상원의원이 제출한 '칩 보안법'(Chip Security Act)은 고성능 반도체 수출이 제한된 중국, 테러 지원 국가인 북한이나 이란 등에 제품이 우회 수출되지 않도록 차단하는 것을 목적으로 했다. AI 처리를 위한 고성능 프로세서와 GPU, 이를 탑재한 서버가 대상이며 군사 목적으로 쓰일 수 있는 일반 전자제품도 대상으로 했다. 엔비디아 지포스 RTX 4090 등 PC용 그래픽카드 역시 규제 대상이다. 이 법안에 따르면 미국 상무부가 수출을 제한하는 고성능 프로세서나 그래픽카드, GPU에 실시간으로 작동하는 위치를 추적할 수 있는 기술을 내장해야 한다. 제품을 수출한 업체는 작동 위치를 추적할 의무를 지며 상무부 장관은 이를 추적할 권한을 지닌다. 법안이 통과되면 미국 상무부와 국방부가 공동으로 1년간 연구를 수행해 필요한 기술을 제품에 탑재하게 된다. 또 법 시행 후 3년간 매년 평가를 실시해 위치 추적에 필요한 최신 보안 기술을 검토해야 한다. 이 법이 시행되면 엔비디아와 AMD, 인텔 등 각종 기업에 추가 부담이 필요하다. 또 작동 위치 추적에 필요한 정보를 전송하는 과정에서 사생활 관련 논란이 있을 것으로 예상된다.

2025.05.13 10:07권봉석

"지포스 RTX와 쿠다로 무장"…엔비디아 'LM 스튜디오' 성능 폭발

엔비디아가 지포스 그래픽처리장치(GPU)와 쿠다를 기반으로 자체 로컬 거대언어모델(LLM) 실행 도구의 성능을 대폭 강화했다. 로딩·응답 속도 향상과 더불어 개발자 제어 기능을 확장해 로컬 AI 활용 생태계를 본격적으로 견인하는 전략이다. 엔비디아는 최근 'LM 스튜디오' 0.3.15 버전을 발표했다고 12일 밝혔다. 이번 버전은 지포스 '레이 트레이싱 익스피리언스(RTX)' GPU 환경에서 성능을 최대 27%까지 끌어올릴 수 있게 '쿠다' 그래프와 플래시 어텐션 최적화를 적용했다. 지포스 'RTX 20' 시리즈부터 최신 블랙웰 GPU까지 폭넓은 하드웨어 호환성도 확보했다. 'LM 스튜디오'는 고성능 추론과 데이터 보안을 동시에 확보할 수 있는 로컬 LLM 실행 도구다. '라마.cpp(llama.cpp)' 기반 런타임을 바탕으로 오프라인에서도 모델 실행이 가능하고 오픈AI 응용 프로그램 인터페이스(API) 호환 엔드포인트로도 작동해 맞춤형 워크플로우에 쉽게 통합된다. 새 버전은 '툴_초이스(tool_choice)' 패러미터를 도입해 도구 호출 방식에 대한 세밀한 제어를 제공한다. 외부 도구 연동 여부를 개발자가 지정하거나 모델이 동적으로 결정하게 할 수 있어 검색 증강 생성(RAG), 에이전트 파이프라인 등에 최적화된 구조를 제공한다. 시스템 프롬프트 편집기도 새롭게 설계돼 복잡하거나 장문 프롬프트에 대한 대응력이 향상됐다. 프리셋 기반의 다양한 모델과 양자화 방식도 지원되며 '젬마', '라마3', '미스트랄', '오르카' 등 주요 오픈소스 모델이 모두 포함됐다. 이같은 구조는 '옵시디언'과 같은 노트 기반 앱에 플러그인 형태로 연결돼 텍스트 생성, 연구 요약, 노트 검색을 클라우드 없이 수행할 수 있게 한다. 이 모든 과정은 'LM 스튜디오' 내의 로컬 서버를 통해 이뤄져 빠르고 프라이버시 중심의 상호작용이 가능하다. 성능 개선의 핵심은 '라마.cpp' 백엔드에 적용된 쿠다 그래프와 플래시 어텐션이다. 쿠다 그래프는 컴퓨팅처리장치(CPU) 호출 횟수를 줄여 모델 처리량을 최대 35%까지 높였다. 플래시 어텐션은 메모리 부담 없이 긴 컨텍스트 대응 능력을 강화하며 최대 15% 속도 향상을 이끌었다. RTX GPU 사용자라면 별도 설정 없이도 '쿠다 12.8' 기반의 성능 향상을 경험할 수 있다. 드라이버 호환 시 자동 업그레이드가 적용되며 얇은 노트북부터 고성능 워크스테이션까지 전 범위 RTX 인공지능(AI) PC에서 효율적인 추론이 가능하다. 'LM 스튜디오'는 윈도우, 맥OS, 리눅스에서 모두 실행 가능하며 무료로 다운로드해 사용할 수 있다. 데스크톱 채팅, 오픈AI API 개발자 모드 등 다양한 인터페이스도 제공된다. 엔비디아 측은 "'LM 스튜디오' 최신 업데이트는 RTX AI PC에서 최고의 성능과 유연성을 제공한다"며 "로컬 LLM 도입 장벽을 낮추고 사용자의 AI 실험과 배포를 적극 지원할 것"이라고 밝혔다.

2025.05.12 15:33조이환

"화웨이만 키워줄 것"…젠슨 황, 美 수출통제 '직격 비판'

엔비디아 젠슨 황 최고경영자(CEO)가 미국 정부의 대중국 반도체 수출 통제가 자국 기업에 심각한 타격을 줄 수 있다고 경고했다. 중국 인공지능(AI) 칩 시장이 향후 수년 내 수백억 달러 규모로 성장할 것으로 전망되는 가운데 미국 기업이 이 기회를 놓치면 산업 경쟁력 전반에 부정적 영향을 줄 수 있다는 판단이다. 8일 CNBC 등 외신에 따르면 황 CEO는 지난달 30일 중국이 AI 칩 수요 측면에서 거대한 시장이라며 미국 기업이 접근하지 못할 경우 "막대한 손실"이 예상된다고 밝혔다. 인터뷰는 이날 워싱턴 D.C.에서 열린 '힐 앤 밸리 포럼' 직후 진행됐다. 엔비디아는 앞서 미국 정부의 수출 규제로 인해 55억 달러(한화 약 7조7천억원) 규모의 매출 손실을 입었다고 밝힌 바 있다. 이번 제재는 엔비디아가 중국용으로 설계한 'H20' 칩에도 적용돼 판매에 필요한 별도 허가를 요구하고 있다. 황 CEO는 중국 시장을 '핵심'으로 규정하며 AI 칩 접근 제한이 미국 내 일자리 창출 기회까지 제한할 수 있다고 우려했다. 그는 중국과의 기술 경쟁에서 화웨이와 같은 토종 기업들이 부상할 가능성도 경고했다. 중국 정부는 최근 수년간 반도체 자립을 위해 수십억 달러를 투입해 왔다. 화웨이는 AI 칩 공급망을 자체 구축하는 전략의 일환으로 최신 '어센드' 시리즈 칩을 개발 중이다. 이는 미국산 그래픽처리장치(GPU)에 대한 의존도를 낮추기 위한 행보다. 또 미국의 제재가 지속되면 화웨이를 비롯한 로컬 경쟁자들이 오히려 유리해질 수 있다는 분석도 제기된다. 이는 장기적으로 미국 반도체 기업의 글로벌 입지에 악영향을 줄 수 있다. 이 같은 상황에서 AMD 역시 15억 달러(한화 약 2조1천억원) 매출 감소를 발표하며 대중국 수출 통제가 업계 전반에 미치는 영향이 확산되고 있다. 특히 AI 응용에 필수적인 GPU를 생산하는 기업들이 직접적인 타격을 입는 중이다. 미국 워싱턴의 정부 산하 씽크탱크인 전략국제문제연구소(CSIS)는 지난 3월 보고서를 통해 "중국이 AI 기술 격차를 상당 부분 좁혔다"며 "미국이 기술 우위를 2년 이상 유지하는 것이 비현실적으로 보이는 상황"이라고 평가했다.

2025.05.08 15:02조이환

일론 머스크, xAI-테슬라 운영 시너지 극대화…슈퍼컴 전력 안정화에 '이것' 활용

일론 머스크 테슬라 최고경영자(CEO)가 이끄는 인공지능(AI) 스타트업 xAI가 슈퍼컴퓨터 '콜로서스(Colossus)'의 전력 공급 안정화를 위해 본격 나선다. 8일 블룸버그통신에 따르면 xAI는 미국 멤피스에 건설 중인 '콜로서스' 프로젝트에 테슬라의 메가팩(Megapack) 배터리를 도입한 것으로 알려졌다. '콜로서스'는 xAI의 거대언어모델(LLM) 학습과 운용을 위해 만들어진 것으로, xAI는 전 세계 최대 규모의 AI 훈련 인프라 중 하나로 이를 키우려고 하고 있다. 초반에는 엔비디아 그래픽처리장치(GPU) 10만 개가 연결된 클러스터로 운영됐으나, 향후에는 100만 개로 늘릴 계획이다. 이에 따라 '콜로서스' 운영에 상당한 전력이 필요할 것으로 예상되면서 xAI는 테슬라 '메가팩'을 대안으로 삼은 것으로 보인다. '메가팩'은 태양광, 풍력 등 재생에너지로 생산된 전력을 저장했다가 필요할 때 사용할 수 있도록 하는 대용량 배터리 시스템이다. 이는 재생에너지의 간헐적인 발전 문제를 해결하고 안정적인 전력 공급을 가능하게 하는 핵심 기술이다. 테슬라의 최근 공시 자료에 따르면 xAI는 지난 2024년 1월부터 올해 2월까지 약 2억3천만 달러(한화 약 3조1천억원)를 메가팩 구매에 투자했다. xAI는 해당 슈퍼컴퓨터 시설을 두 단계에 걸쳐 빠르게 건설하고 있다. 1단계가 완료된 현재 일부 천연가스 터빈은 철거될 예정이다. 이 터빈 사용으로 인해 환경 단체들로부터 비판을 받았던 탓이다. 멤피스 상공회의소는 "xAI가 최근 새롭게 구축된 전력 변전소를 통해 150메가와트(MW)의 전력을 공급 받고 있다"며 "테슬라의 메가팩 배터리도 추가돼 전력 수요 급증이나 정전 사태에 대비할 수 있게 됐다"고 말했다. 테슬라는 전기차 기업으로 잘 알려져 있지만 사명을 '세계를 지속가능한 에너지로 전환시키는 것'으로 내세우며 에너지 사업을 강화하고 있다. 특히 '메가팩'은 전력 수요가 낮고 가격이 저렴할 때 전기를 저장한 후 수요와 가격이 높은 시기에 판매함으로써 수익을 창출하는 새로운 사업 모델로도 주목받고 있다. 블룸버그통신은 "테슬라와 xAI는 이번 일에 대해 공식 입장을 내놓지 않았다"며 "이번 메가팩 도입은 머스크 CEO가 운영하는 5개 기업들 간 시너지를 보여주는 대표적 사례로, 각 기업들의 이해관계가 본격적으로 맞물리기 시작했다는 점에서 주목된다"고 말했다.

2025.05.08 10:06장유미

한 달 앞으로 다가온 컴퓨텍스 2025, 올해 테마 '넥스트 AI'

타이트라(TAITRA, 대만대외무역발전협회)와 타이베이컴퓨터협회(TCA) 주최로 열리는 동북아시아 최대 규모 IT 전시회, '컴퓨텍스 타이베이 2025'가 다음 달 20일부터 4일간 개최된다. 전통적으로 PC 생태계 중심 행사였던 컴퓨텍스는 2020년 이후 생성 AI, 챗GPT와 클로드, 퍼플렉시티 등을 위시한 LLM(거대언어모델), 온디바이스·엣지 AI, AI PC 등 바람을 타고 AI를 중심에 둔 전시회로 옷을 갈아 입었다. 6월 4일부터 7일까지 4일간 진행된 지난 해 행사에는 2023년(4만 5천명) 대비 두 배 늘어난 8만 5천179명이 방문했다. 올해도 엔비디아를 시작으로 퀄컴, 미디어텍 등 주요 AI 관련 기업들이 기조연설을 진행할 예정이다. 엔비디아, 개막 하루 전날 기조연설 진행 젠슨 황 엔비디아 CEO는 매년 컴퓨텍스 기간마다 타이베이를 찾아 기조연설이나 브리핑을 진행했다. 지난 해에는 난강전람관에 등장해 주요 그래픽카드·서버 제조사 부스를 방문하며 친필 사인을 남겨 대만 현지 언론의 주목을 한 눈에 받았다. 지난 해 엔비디아는 컴퓨텍스 공식 개막일보다 이틀 이른 일요일 저녁에 별도로 기조연설을 진행했다. 올해는 19일 오전 11시부터 난강전람관에서 1km 떨어진 '타이베이 뮤직 센터'로 청중을 모을 예정이다. 최근 2년간 엔비디아가 GPU를 이용한 AI 분야에서 두각을 나타내며 많은 이들의 관심이 집중되고 있는 상황이다. 타이트라와 엔비디아는 현장 참가를 원하는 각국 취재진을 대상으로 별도 코드까지 발급하며 이를 통제하기 위해 안간힘을 쓰고 있다. 퀄컴, 엔비디아와 같은 날 기조연설 예정 퀄컴은 지난 해 크리스티아노 아몬 CEO가 직접 AI PC를 주제로 한 기조연설을 진행하고 삼성전자 등 주요 PC 제조사와 함께 당시 출시를 앞뒀던 스냅드래곤 X 엘리트 탑재 노트북을 공개했다. 올해 기조연설도 크리스티아노 아몬 CEO가 연사로 나서 19일 오후 난강전람관에서 기조연설을 진행한다. 차세대 제품인 스냅드래곤 X 엘리트 2세대(가칭) 관련 성능이나 출시 일정 등 정보가 일부 공개될 가능성이 있다. 퀄컴은 기조연설과 함께 타이베이 시내 별도 행사장에서 AI PC 관련 쇼케이스도 진행할 것으로 보인다. AI PC 보급에 가장 중요한 영향을 미칠 각종 소프트웨어 위주의 전시가 예상된다. AMD·인텔, 아직까지 '무소식' AMD와 인텔은 컴퓨텍스 개막이 한 달 앞으로 다가온 현재까지 구체적인 일정을 공개하지 않은 상황이다. AMD는 공식 기조연설 대신 제품 담당 임원이 진행하는 별도 인터뷰나 브리핑 세션, 각종 쇼케이스 등을 진행할 것으로 보인다. 인텔은 지난 해 팻 겔싱어 전 CEO가 타이베이를 찾아 기조연설과 파트너 미팅 등을 진행했지만 올해 일정은 불투명하다. 난강전람관 안에는 이미 부스를 마련했지만 구체적인 공지는 나오지 않았다. 21일 취재에 응한 PC 업계 관계자들은 "인텔이 올해 컴퓨텍스에서는 PC와 AI, GPU 등 어떤 면에서도 이렇다 할 메시지를 내놓지 못할 것"이라고 예상했다.

2025.04.21 16:15권봉석

"엔비디아, 중국에 RTX 5090D 그래픽카드 출고 중단"

미국 정부가 중국 시장용으로 설계된 H20 GPU 수출을 규제한 여파가 일반 소비자용 그래픽카드까지 확대될 조짐을 보이고 있다. 중국 내 IT 커뮤니티를 중심으로 "엔비디아가 지포스 RTX 5090D 출하를 중단했다"는 전언이 등장했다. 20일 업계에 따르면 엔비디아는 지난 주 중국 시장용으로 설계된 H20 GPU 수출 제한 조치를 공시하며 "H20의 재고와 구매 약정, 관련 충당금 등으로 최대 55억 달러(약 7조 8천556억원) 추가 비용이 들 것"이라고 밝혔다. 중국 IT 커뮤니티 '칩헬'(Chiphell)에 18일 저녁 글을 올린 한 이용자는 그래픽카드 제조사 관계자를 인용해 "엔비디아가 18일 모든 그래픽카드 제조사를 대상으로 지포스 RTX 5090D의 공급을 잠정 중단하라는 공지를 보냈다"고 설명했다. 지포스 RTX 5090D는 미국 정부의 규제를 충족하기 위해 AI 연산 성능을 일반 RTX 5090(3천352 TOPS) 대비 29% 가량 줄인 2천375 TOPS 수준으로 낮췄다. 또 한 PC나 서버에 GPU를 여러 개 설치하는 '멀티 GPU' 구성도 불가능하게 설계됐다. 미국 전임 조 바이든 행정부는 GPU의 연산 성능이나 대역폭 등 성능을 낮추는 조건으로 중국 수출을 허용했으나, 도널드 트럼프 2기 행정부는 이마저도 허용하지 않으며 오히려 더 강화하는 방향으로 나아가고 있다. AMD 역시 지난 2월 중국 시장을 겨냥해 연산 성능을 낮춘 라데온 RX 7650 GRE 그래픽카드를 출시한 데 이어 RDNA 4 아키텍처를 적용한 중국용 제품도 출시할 것으로 예상된다. 그러나 미국 정부의 규제가 강화될 경우 신제품 출시는 지연이나 취소를 겪을 수 있다.

2025.04.20 11:00권봉석

美 의회 "엔비디아 GPU 중국 유출 여부 조사 착수"

미국 의회는 17일(현지시간) 중국 수출이 제한된 고성능 엔비디아 GPU가 우회 공급됐다는 의혹에 대해 공식 조사에 착수한다고 밝혔다. 17일 미국 하원 중국공산당특별위원회는 중국 AI 기업 딥시크(DeepSeek)가 수출 통제 대상인 엔비디아 GPU 약 6만 개로 거대언어모델(LLM)을 훈련했다는 정보를 바탕으로 엔비디아에 관련 기록 제출을 요구했다고 밝혔다. 지난 1월 딥시크 R1 공개시 엔비디아는 "딥시크가 활용한 GPU는 미국 수출 규정을 준수했다"고 밝혔다. 그러나 위원회는 "딥시크가 H100, A100 등 고성능 GPU를 싱가포르 등 제3국에서 우회 확보했을 가능성이 있다"고 지적했다. 위원회는 2020년 이후 중국이나 아세안 국가에서 499대 이상의 AI GPU를 구매한 모든 고객 목록과 최종 사용자, 거래 날짜, 최종 목적지 등 상세 정보 제출을 요구하고 있다. 싱가포르 이외에 말레이시아로 GPU 수출이 3.6배 이상 늘어나면서 중국으로의 우회 수출지로 말레이시아가 활용되고 있다는 의혹도 제기되고 있다. 엔비디아는 "미국 정부의 수출 규제를 준수하고 있으며 싱가포르 매출 증가는 단순히 결제가 일어난 장소이며 관련 제품은 미국과 대만 등 다른 지역으로 배송되고 중국에 공급되지 않았다"고 반론했다.

2025.04.18 09:37권봉석

美·中 무역전쟁에 발 묶인 엔비디아 'H20' GPU

미국 도널드 트럼프 2기 행정부가 대 중국 GPU 수출 규제를 한층 강화했다. 전임자인 조 바이든 행정부는 연산 성능이나 대역폭 등 성능을 낮추는 선에서 수출을 허용했지만 트럼프 2기 행정부는 이마저도 무기한 허가하지 않을 방침이다. 엔비디아는 15일(이하 현지시각) 중국 시장용으로 설계된 H20 GPU 수출 제한 조치를 공시하며 "H20의 재고와 구매 약정, 관련 충당금 등으로 최대 55억 달러(약 7조 8천556억원) 추가 비용이 들 것"이라고 밝혔다. 엔비디아 뿐만 아니라 지난 해부터 성능을 제한한 중국 시장용 GPU를 생산하는 AMD에도 유사한 규제가 주어질 가능성이 크다. 한편 이런 규제가 엔비디아의 가장 큰 경쟁자로 꼽히는 중국 화웨이를 키워주는 결과를 낳을 것이라는 관측도 나온다. 엔비디아, 美 정부 규제에 따라 두 차례 GPU 성능 낮춰 미국 정부가 중국 대상으로 AI 가속과 머신러닝, 딥러닝용 GPU 수출 규제에 나선 것은 2022년 10월부터다. 당시 미국 정부는 엔비디아 A100, H100 등 GPU를 포함해 AMD 제품까지 수출 규제 대상에 포함시켰다. 엔비디아는 이들 제품에서 최대 대역폭을 절반인 400GB/s까지 낮춘 A800, H800 GPU를 생산해 공급했다. 그러나 미국 정부가 2023년 10월 규제 범위를 확대하자 성능을 더 낮춘 H20, L20, L2 등 3종을 추가 개발해 이를 작년부터 중국 시장에 공급했다. 이번에 미국 정부가 제동을 건 H20 GPU는 HBM3 메모리 용량을 96GB로 제한하고 메모리 대역폭은 4TB/s, AI 연산 성능은 FP16(부동소수점 16비트) 기준 148 테라플롭스, FP32(부동소수점 32비트) 기준 44 테라플롭스로 제한됐다. H800으로 구현한 LLM '딥시크 R1'이 역린 건드렸나 미국 정부가 H20 GPU의 중국 수출 규제를 강화한 이유는 아직 명확하지 않다. 그러나 지난 1월 중국 AI 스타트업 딥시크(DeepSeek)가 하순 공개한 추론 특화 AI 모델 'R1'이 영향을 미쳤을 것으로 추정된다. 딥시크 R1은 AI 모델 훈련을 위해 메타가 라마(LLaMa) 등 AI 모델 개발에 투입한 비용의 10% 수준인 557만6천달러(약 80억원)를 지출한 것으로 알려져 있다. 또 미국 상무부 수출 통제 기준을 준수하는 H800 GPU를 이용했다. 당시 엔비디아는 "딥시크가 활용한 GPU는 미국 수출 규정을 준수했으며 추론은 상당히 많은 엔비디아 GPU와 고성능 네트워킹이 필요하다. 이와 같은 딥시크의 혁신이 GPU 수요를 더욱 증가시킬 것"이라고 밝혔다. 실제로 미국 CNBC와 대만 공상시보 등 경제 매체에 따르면 딥시크 R1 공개 이후 텐센트, 알리바바, 바이트댄스 등 중국 주요 IT 기업들이 H20 GPU 발주량을 크게 늘렸다. 엔비디아, 중국 내 최대 경쟁사로 화웨이 꼽아 미국 정부는 거대언어모델(LLM) 등에서 중국의 성장 속도를 지연시키기 위해 GPU 수출 규제를 활용하고 있다. 그러나 이런 규제는 오히려 중국 내 엔비디아 최대 경쟁자로 꼽히는 화웨이 성장을 돕는 결과를 낳을 수 있다. 화웨이가 개발한 어센드(Ascend) 910B는 FP16 기준 320 테라플롭스, INT8(정수 8비트) 기준 640 TOPS(1초당 1조 번 연산)급 성능을 갖춰 엔비디아 A100과 비슷한 수준으로 평가된다. 지난 해 공개된 후속 제품인 어센드 910C는 지난 2월 딥시크가 수행한 추론 벤치마크에서 엔비디아 H100의 60%에 달하는 성능을 냈다. 엔비디아도 지난 2월 말 미국 증권거래위원회에 제출한 연간 보고서에서 주요 경쟁자 중 하나로 2년 연속 화웨이를 꼽았다. 칩과 클라우드 서비스, Arm IP 기반 컴퓨터 프로세서와 네트워킹 제품 등 4개 분야에서 화웨이를 주요 경쟁사로 분류했다. 엔비디아 이어 AMD GPU 사업에도 영향 불가피 미국 정부의 수출 규제 확대는 엔비디아 뿐만 아니라 AMD에도 영향을 미칠 가능성이 크다. AMD는 작년 중국 시장을 겨냥해 성능을 제한한 AI GPU 가속기인 인스팅트 MI309를 설계했지만 미국 상무부는 '여전히 성능이 강력하다'는 이유로 수출을 불허했다. 2023년 11월 중국 시장에서는 데스크톱PC용 지포스 RTX 4090 그래픽카드를 분해해 서버용으로 개조하기도 했지만 올해는 이런 시도가 일어나기 힘들다. 엔비디아가 2월부터 중국 시장에 공급중인 지포스 RTX 5090D 그래픽카드에 이미 여러 제약이 가해졌기 때문이다. 지포스 RTX 5090D 그래픽카드는 미국 정부의 규제를 충족하기 위해 AI 연산 성능을 RTX 5090(3,352 TOPS) 대비 29% 가량 줄인 2,375 TOPS 수준으로 낮췄다. 한 PC나 서버에 GPU를 여러 개 꽂아 성능을 높이는 '멀티 GPU' 구성도 불가능하다. 다만 국내 주요 메모리 기업들에게 미칠 악영향은 제한적일 것으로 분석된다. 현재 SK하이닉스는 엔비디아의 AI 가속기에 필요한 HBM(고대역폭메모리)을 대거 공급하고 있으며, 삼성전자 역시 지속적으로 공급망 진입을 시도 중이다.

2025.04.16 14:37권봉석

[인터뷰] "엔비디아 사로 잡은 비결, '델 AI 팩토리' 덕분"

"바이 델(Buy Dell·델 제품을 사세요), 바이 델, 바이 델!" 지난 달 18일. 미국 새너제이에서 열린 엔비디아 연례 개발자 회의 GTC 행사에 마련된 델 테크놀로지스 부스에선 '인공지능(AI) 대부'로 불리는 젠슨 황 엔비디아 최고경영자(CEO)가 목청을 높여 이처럼 외쳤다. 컴퓨터를 필요로 하는 이들이라면 누구나 알고 있는 '델'의 PC뿐 아니라 AI 인프라 경쟁력을 인정하며 엔비디아의 가장 최고 파트너라는 점을 치켜 세워준 것이다. AI 열풍이 한창이던 1년 전 엔비디아 GTC 행사에서도 황 CEO는 델 테크놀로지스를 공개 석상에서 언급하며 끈끈한 관계를 과시했다. 당시 황 CEO는 "정보기술(IT)과 관련해 무엇이든 필요한 것이 있다면 델에 전화하면 된다"고 밝혔다. 이는 델 테크놀로지스 주가에도 영향을 줘 지난해 5월 시가총액이 1천억 달러를 넘기도 했다. 이처럼 엔비디아의 두터운 신임을 받고 있는 델 테크놀로지스가 올해 AI 인프라를 전면 업그레이드하며 시장 강자의 면모를 다시 한 번 드러내고 있다. 엔비디아 기반 델 AI 팩토리의 최신 포트폴리오를 앞세워 최근 달궈지고 있는 글로벌 AI 인프라 시장에서 주도권 굳히기에 본격 나선 모습이다. 최근 지디넷코리아와 만난 양원석 델 테크놀로지스 인프라스트럭처 솔루션 사업부 전무는 "우리는 AI PC부터 엣지, 코어 데이터센터, 클라우드까지 엔드 투 엔드(end-to-end) AI 솔루션 포트폴리오를 가지고 있다는 것이 강점"이라며 "서버 자체 기술력, 공급망 관리 능력, 영업 능력, 기술 지원 능력 등을 갖추고 있는 덕분에 글로벌뿐 아니라 한국에서도 서버 부문 1위 업체로 인정 받고 있다"고 운을 뗐다. 그러면서 "글로벌뿐 아니라 한국 스토리지 하드웨어(HW) 및 소프트웨어(SW) 부문 1위 업체로서의 저력을 갖고 있는 만큼, 데이터 및 데이터관리에 대해 전 세계에서 제일 잘 알고 있는 기업이라고 자부할 수 있다"며 "젠슨 황 CEO가 엔비디아 GTC 현장에서 '델'을 언급한 것도 이런 점을 인정한 것이라고 볼 수 있다"고 덧붙였다. 실제로 델 테크놀로지스는 글로벌 AI 인프라 시장에서 경쟁력을 입증 받아 독보적인 점유율을 유지하며 꾸준한 성장세를 보이고 있다. 특히 슈퍼마이크로, HPE 등과 경쟁하고 있는 AI 서버 시장에선 다양한 포트폴리오를 앞세워 압도적인 우위에 올라서 있다는 평가를 받고 있다. 7일 시장조사업체 IDC에 따르면 델 테크놀로지스는 지난해 3분기 전 세계 X86 서버 시장 판매대수 기준으로 11.4%의 점유율을 차지하며 1위를 유지했다. 매출 기준 점유율도 12.4%로 1위를 차지했다. 델 테크놀로지스와 경쟁하고 있는 슈퍼마이크로와 HPE, IEIT 시스템즈, 레노버는 그 뒤를 이었다. 이처럼 델 테크놀로지스가 시장 우위를 견고히 하고 있는 상황에서 전체 서버 시장의 성장세가 높다는 점은 호재로 작용하고 있다. 지난해 4분기 서버 시장 매출은 전년 동기 대비 91% 증가한 733억 달러를 기록, 2019년 이후 두 번째로 높은 성장률을 보였다. 특히 GPU가 내장된 서버 매출은 전년 동기보다 192.6%나 성장해 전체 서버 시장 매출의 절반 이상을 차지할 정도로 급성장한 모습을 보였다. 엔비디아는 전체 출하량의 90% 이상을 차지하며 서버 GPU 분야에서 독주를 이어갔다. 지난해 전체 서버 시장 규모는 2020년 이후 두 배 이상 성장한 2천357억 달러에 달했다. 엔비디아와 밀접한 관계를 맺고 있는 델 테크놀로지스도 지난해 호실적을 기록했다. 특히 AI 서버 출하액은 98억 달러로, 사업을 시작한 지 2년도 채 안되는 기간에 급속도로 성장한 모습을 보였다. AI 관련 기업 고객 역시 2천 곳 이상을 확보한 상태로, 올해 고객사 수가 더 늘어나 AI 매출이 50% 성장할 것으로 예상됐다. 올해 AI 서버 출하액은 약 150억 달러에 달할 것으로 전망했다. 양 전무는 "지난해 엔비디아 GTC에서 처음 선보인 '델 AI 팩토리 위드 엔비디아(Dell AI Factory with NVIDIA)'를 통해 다양한 솔루션과 제품을 선보이며 엄청난 컴퓨팅 파워를 시장에 공급했다고 자부하고 있다"며 "해외뿐 아니라 국내에서도 AI 시장 수요가 점차 '엔터프라이즈 AI'로 이동하고 있는 만큼 올해도 수요는 더 많아질 것으로 보인다"고 설명했다. 이어 "지난해까진 클라우드 서비스 제공자(CSP), 특히 하이퍼스케일러 또는 코어위브 같은 NCP(NVIDIA Cloud Partner) 업체들이 주축이 돼 시장 성장을 주도했지만, 올해는 더 많은 대기업, 대학, 연구기관 등 다양한 분야에서 수요가 많을 듯 하다"며 "10대 미만~수십대 등 작은 규모에서부터 거대 규모에 이르기까지 서버 규모 면에서도 더 다양해질 듯 하다"고 덧붙였다. 양 전무는 최근 국내에서 sLM(small Language Model), 온프레미스에 AI 서버를 두고 API를 사용해 클라우드 업체가 제공하는 AI 서비스와 연결해 사용하는 활용 사례(Use Case)가 늘어나고 있다는 점도 주목했다. 또 엔비디아 'H100' 위주로 형성된 GPU 시장이 향후 블랙웰, 그레이스블랙웰, AMD, 인텔 등 다양한 실리콘으로 확대될 것으로 봤다. 하지만 국내 고객들이 생성형 AI를 도입, 활용할 때 걸림돌이 많아 아직 시장이 활성화 되지 못했다는 점에 대해선 아쉬워 했다. 양 전무는 "국내에선 생성형 AI 활용 시 거버넌스와 개인정보 보호, 법적 규제 등을 고려해야 해 적절한 데이터를 수집·준비하는 과정에 있어 많은 어려움이 있을 수 있다"며 "생성형 AI를 위한 인프라는 기존 데이터센터 인프라 기술과는 달라 이를 위해 내부 역량을 확보하거나, 외부 전문 인력 채용 등을 함께 추진해야 하는 데 쉽지 않은 것이 현실"이라고 분석했다. 이어 "이에 따라 AI와 관련해 데이터 준비, 전략 수립을 위한 컨설팅, 활용 사례 생성 및 구축 등에 있어 전문 서비스를 활용하는 것이 좀 더 안전하고 체계적일 수 있다"며 "비용 측면에서 고가의 GPU에 투자하거나 퍼블릭 클라우드 서비스 사용 시 높은 운영 비용을 감당하는 데 기업들이 부담을 느끼는 경우가 많다"고 덧붙였다. 이 같은 상황에서 양 전무는 델 테크놀로지스가 좋은 대안이 될 것이라고 강조했다. 또 엔터프라이즈 기업의 경우 생성형 AI를 위해 안정적이며 보안 측면에서 신뢰할 수 있고 관리하기 쉬운 데다 데이터와 가까운 곳에 위치한 고성능의 데이터센터 인프라를 구축해야 한다고 조언했다. 양 전무는 "자사 서버 제품들은 효율화 및 생산성 향상을 위한 라이프사이클 관리의 지능적 설계 및 제어가 가능하다"며 "클라우드 인프라의 대부분의 이점도 온프레미스에서 서비스 형태(As a Service)로 제공할 수 있다"고 설명했다. 그러면서 "'델 AI 솔루션'은 경쟁사들에 비해 AI PC부터 엣지, 코어 데이터센터, 클라우드까지 엔드 투 엔드(End-to-end) AI 솔루션 포트폴리오를 갖추고 있는 데다 자사가 국내외서 스토리지 HW 및 SW 부문 1위 업체로서 데이터 및 데이터 관리에 대해 전 세계에서 가장 잘 알고 있다는 것이 강점"이라며 "코로케이션 및 호스팅 공급업체부터 AI 모델의 기반이 되는 반도체 공급업체에 이르기까지 포괄적인 파트너 생태계 스택을 제공하고 있다는 것도 매력적인 요소"라고 덧붙였다. 또 그는 "엔비디아, 마이크로소프트, 퀄컴, AMD, 허깅페이스, 인텔, 메타, 레드햇 등 광범위한 에코시스템을 통해 협력 관계를 탄탄히 구축하고 있는 것도 장점"이라며 "공장 팩토리 레벨에서 준비된 솔루션을 공급할 수 있도록 엔지니어링 단계에서부터 엔비디아와 협력하고 있다는 것도 우리만의 경쟁력"이라고 강조했다. 이 같은 시스템을 바탕으로 델은 국내 서버 시장에서도 1위 자리를 굳건히 지키고 있다. 특히 서버 자체 기술력, 공급망 관리 능력, 영업 능력, 기술 지원 능력 등을 인정 받아 삼성SDS와 NHN클라우드, 엘리스 등 많은 기업들이 델의 서버를 앞 다퉈 도입하고 있다. 해외에서도 마찬가지다. 델 테크놀로지스에 따르면 현재 기업들은 ▲비용 통제 ▲데이터 관리 ▲기존 시스템과의 통합 ▲전문 인력 부족을 주요 도전 과제로 삼고 있다. 이에 전체 중 77%의 기업이 AI 인프라 구축을 위해 '단일 벤더'를 선호하고 있는데 델 테크놀로지스는 다양한 제품 및 시스템 덕에 기업들의 상당한 신뢰를 얻고 있는 것으로 나타났다. 양 전무는 "우리는 업계 최신 기술과 오픈·모듈러 아키텍처를 빠르고 적극적으로 수용해 고객들이 이미 투자한 자산을 보호할 수 있도록 지원하고 있다"며 "새로운 기술이 나왔을 때 기존의 장비·설비에서 손쉽게 업그레이드할 수 있도록 함으로써 기업들이 효율적으로 자사 제품을 활용할 수 있게 도울 것"이라고 밝혔다. 그러면서 "특히 곧 출시될 '델 파워엣지 XE8712' 서버는 고객들이 가장 기대해도 좋을 제품"이라며 "2개의 그레이스 CPU와 4개의 블랙웰 GPU를 통합한 엔비디아 GB200 그레이스 블랙웰 슈퍼칩을 탑재해 데이터센터 내 AI 성능을 극대화 함으로써 현존하는 AI 서버 중 가장 빠른 속도로 이용할 수 있을 것"이라고 설명했다. 또 델 테크놀로지스가 AI 데이터 관리 측면에서도 상당한 기술 발전을 이끌어 낼 것이라고 자신했다. 특히 기업들이 AI 데이터를 더 빠르게 처리하고 보다 안전하게 보호할 수 있도록 설계된 '델 AI 데이터 팩토리 위드 엔비디아'가 중추적 역할을 할 것으로 봤다. 이 플랫폼은 대량의 데이터를 실시간으로 받아들이는 데이터 인제스천 기능을 지원하며 GPU 가속 기반 '스파크 쿼리'를 활용해 기존 대비 최대 220% 향상된 속도로 데이터를 분석하고 처리할 수 있다. 더불어 델이 AI 소프트웨어 분야에서도 엔비디아와의 협력을 통해 기술 발전을 이끌어 냈다고 강조했다. 특히 '에이전트 AI' 시스템 개발을 지원하는 엔비디아의 AI 개발 프레임워크인 '에이전틱 AI'와 이를 위한 AI 최적화 도구를 AI 팩토리에 통합함으로써 AI를 통해 기업들이 의사 결정을 쉽게 내릴 수 있도록 지원에 나선 점을 피력했다. 양 전무는 "그동안에는 마이크로소프트 등 하이퍼스케일러들이 수십만 장의 GPU를 구매해 파운데이션 모델을 만드는 것이 대세였다면, 작년 말부턴 AI를 어떻게 잘 활용할 수 있을지에 대해 고민을 하는 기업들이 더 많아진 듯 하다"며 "점차 일반 기업들이 실제 비즈니스 도움이 될 수 있도록 AI를 사용하는 사례가 많아지고 있는 만큼, AI 인프라에 대한 시장의 관심도 더 커질 듯 하다"고 말했다. 그러면서 "AI 기술 발전으로 서버 신제품 발표 주기도 2년에 한 번 정도에서 최근에는 엔비디아의 움직임에 맞춰 6개월에 한 번으로 짧아질 정도로 빨라진 상황"이라며 "이에 따른 전력 소비, 냉각 등과 관련된 시스템을 잘 갖춰나가기 위해 노력 중인 만큼 많은 기업들이 우리 제품을 선택할 것으로 기대하고 있다"고 덧붙였다. 또 그는 "특히 국내에선 정부에서 국가 AI 컴퓨팅 센터를 추진하고 있는 만큼 실제 구체적인 사업을 진행할 때 우리 제품을 외면하지는 않을 것으로 보인다"며 "엔비디아뿐 아니라 AMD, 인텔 등 다양한 기업들의 GPU를 제공하며 고객들의 선택지를 많이 넓힌 만큼 '델 AI 팩토리'를 통해 시장 변화에 맞춰 탄력적으로 대응함으로써 시장 주도권을 유지하기 위해 더 노력할 것"이라고 강조했다.

2025.04.07 16:48장유미

엔비디아, 아프리카 최초 AI 데이터센터 건립…"디지털 독립성 강화"

엔비디아와 짐바브웨 기업이 아프리카 지역 개발자들의 GPU 접근성 향상과 디지털 독립성 강화를 위해 아프리카 대륙 최초의 인공지능(AI) 데이터센터 건립을 추진한다. 4일 CNN에 따르면 짐바브웨의 기업 카사바 테크놀로지스를 이끄는 스트라이브 마시위아 회장은 최근 엔비디아와 협력해 아프리카 대륙에 AI 팩토리를 구축한다고 발표했다. 양사 협력으로 오는 6월부터 엔비디아 GPU 기반 슈퍼컴퓨터 시스템이 남아프리카공화국에 위치한 카사바 테크놀로지스의 데이터센터에 배치된 후 이집트·케냐·모로코·나이지리아 등 다른 아프리카 국가 내 시설로도 배포될 예정이다. 현재 아프리카는 컴퓨팅파워 부족으로 전 세계 AI 시장에서 상대적으로 뒤처져 있다는 평가를 받는다. 아프리카 대륙 AI 개발자 커뮤니티인 진디(Zindi)에 따르면 아프리카 AI 실무자 중 5%만이 연구개발을 위한 충분한 컴퓨팅 리소스를 이용할 수 있는 것으로 조사됐다. 또 아프리카의 소득 수준에 비해 하드웨어(HW) 비용이 높다는 점도 AI 도입의 주요 장애물 중 하나다. 이 때문에 아프리카 지역 개발자들은 아마존웹서비스(AWS), 구글 클라우드, 마이크로소프트(MS) 애저와 같은 해외 클라우드 서비스에 대한 의존도가 높았다. 문제는 클라우드를 통한 지리적 지역 간 데이터 전송에도 많은 비용이 들고 시간도 오래 걸린다는 점이었다. 또 이같은 기술적 장애물 때문에 아프리카 언어와 방언 등 아프리카를 대표하는 AI 훈련 데이터셋이 부족하거나 편향성을 갖는 경우도 많았다. 이에 카사바 테크놀로지스는 엔비디아 GPU 기반 AI 데이터센터를 중심으로 아프리카 대륙 내 기업과 연구자가 안전한 환경에서 AI를 구축·훈련·확장·배포하는 데 필요한 컴퓨팅 성능에 액세스할 수 있도록 보장한다는 방침이다. 이번 엔비디아와 아프리카 기업 간 협력에 대해 비영리 단체 얼라이언스4AI의 알렉스 차도 이사는 "아프리카에는 대규모 GPU 클러스터가 없어 혁신가들의 발목을 잡고 있다"며 "엔비디아의 이번 발표는 GPU에 대한 접근성을 높여 대륙 전역에서 AI 혁명을 주도하는 데 도움이 될 것"이라고 기대했다. 이어 "이제 아프리카 개발자들은 대륙 내에서 데이터를 수집·처리할 수 있게 됐다"며 "아프리카의 빅테크가 AI 커뮤니티에 합류하고 투자함으로써 인재 양성에도 적극 나설 수 있게 되는 등 생태계 전반의 혁신을 가속화할 것"이라고 덧붙였다. 스트라이브 마시위아 회장은 "자사의 AI 팩토리는 혁신이 확장될 수 있는 인프라를 제공해 아프리카 기업, 스타트업 및 연구원들이 최첨단 AI 인프라에 접근할 수 있도록 지원할 것"이라고 밝혔다.

2025.04.04 15:32한정호

"GPU 72장 돌려야 답 나온다"…엔비디아, AI 추론 '끝판왕' 내놔

엔비디아가 복잡한 사고력 기반 AI 모델 확대에 맞춰 새로운 추론 성능 전략을 공개한다. 점점 더 많은 연산을 요구하는 AI 모델 등장에 따른 글로벌 평가 기준 변화에 선제 대응하려는 조치다. 3일 업계에 따르면 엔비디아는 지난 1일 정오 온라인으로 진행한 프리브리핑에서 AI 성능 벤치마크인 '엠엘퍼프(MLPerf)' 추론 AI 부문의 변화에 대응하기 위한 기술 전략을 공개했다. 이번 행사는 국제 컨소시엄 엠엘커먼스(MLCommons)가 '사고 기반 AI'인 추론 모델을 평가 항목에 포함하려는 움직임에 초점을 맞췄다. 엠엘퍼프는 AI 모델의 훈련(training)과 추론(inference) 성능을 하드웨어·소프트웨어 통합 기준으로 측정하는 글로벌 표준 벤치마크다. 엠엘커먼스가 주도하는 이 평가 항목은 업계 기술 흐름에 따라 주기적으로 갱신된다. 최근에는 단순 예측을 넘어 복잡한 추론과 의사결정을 요구하는 리즈닝 모델이 AI 기술의 중심으로 떠오르면서 해당 항목의 공식 도입 논의가 본격화되고 있다. 엔비디아는 아직 리즈닝 모델 항목이 공식 도입되지는 않았지만 차기 엠엘퍼프 버전에서는 채택 가능성이 높다고 판단하고 있다. 이를 선제적으로 대비하기 위해 회사는 중국의 AI 스타트업인 딥시크가 개발한 생성형 AI 모델을 활용해 복잡한 사고 기반 작업에서의 추론 성능을 시연했다. 이처럼 복잡한 추론 모델이 확산되면서 AI 추론 환경 전반에도 근본적인 변화가 일고 있다. 추론 연산량이 전례 없이 폭증하고 있는 상황에서 과거에는 단일 그래픽처리장치(GPU)나 단일 노드에서 충분했던 작업들이 이제는 다수 GPU를 동시 투입하는 복잡한 병렬 연산 없이는 처리할 수 없다는 것이 엔비디아의 분석이다. 이에 더해 추론 모델의 확산은 AI 개발의 모든 단계에서 연산 자원의 수요를 급격히 증가시키고 있다. 엔비디아는 모델 재학습(retraining), 도메인 맞춤화(post-training), 테스트 시점 확장(test-time scaling) 등에서 연산량이 기하급수적으로 늘고 있다고 분석했다. 특히 테스트 단계에서도 추론 정확도를 높이기 위한 병렬 연산 수요가 계속해서 증가하고 있다는 점을 강조했다. 이에 이날 엔비디아는 고성능 시스템 예시로 'GB200 MBL'을 제시했다. 해당 시스템은 총 72개의 GPU를 동시 연동하며 복잡한 추론을 빠르게 처리할 수 있도록 설계됐다. 회사는 이러한 대규모 병렬 환경이 향후 추론 표준이 될 것으로 보고 있다. 엠엘커먼스 역시 추론 모델을 엠엘퍼프의 공식 평가 항목에 포함하기 위한 논의를 본격적으로 시작한 상황이다. 현재 다양한 기술 커뮤니티와 협업을 통해 평가 기준과 워크로드 확장을 준비하고 있다. 공식 도입 시점은 아직 정해지지 않았으나 실증 사례와 모델 테스트가 계속 이어지고 있어 연내 도입이 확정될 가능성도 있다. 엔비디아 관계자는 "모델의 크기와 지능이 커짐에 따라 연산량이 모든 단계에서 폭증하고 있다"며 "재학습, 도메인 최적화, 테스트 시점 스케일링 모두 고성능 GPU를 요구한다"고 설명했다. 이어 "72개의 GPU처럼 다수의 칩을 동시에 작동시켜야 하는 이유가 바로 이 때문"이라고 덧붙였다.

2025.04.03 01:00조이환

슈퍼마이크로, 엔비디아 GPU 지원 서버 제품군 확대…"AI 모델 추론 극대화"

슈퍼마이크로가 인공지능(AI) 워크로드 처리 성능을 극대화할 수 있는 엔비디아 GPU 지원 제품군을 선보인다. 슈퍼마이크로는 새로운 엔비디아 'RTX 프로 6000 블랙웰 서버 에디션' GPU 지원과 워크로드 최적화 GPU 서버·워크스테이션 제품군을 확장했다고 26일 밝혔다. 슈퍼마이크로의 새로운 제품군은 엔비디아 블랙웰 세대 PCIe GPU에 최적화돼 더 많은 기업이 ▲거대언어모델(LLM) 추론 ▲미세조정 ▲에이전틱 AI ▲시각화 ▲그래픽·렌더링 ▲가상화 등에 가속 컴퓨팅을 활용할 수 있도록 지원한다. 슈퍼마이크로의 많은 GPU 최적화 시스템은 엔비디아 인증을 획득했으며 AI 개발과 프로세스 단순화를 위해 엔비디아 AI 엔터프라이즈에 대한 호환성과 지원을 보장한다. 찰스리앙(Charles Liang) 슈퍼마이크로 최고경영자(CEO)는 "자사는 다양한 엔터프라이즈 환경에서 구축할 수 있는 광범위한 애플리케이션 최적화 GPU 서버 제품군을 매우 짧은 리드타임으로 제공한다"며 "엔비디아 RTX 프로 6000 블랙웰 서버 에디션 GPU를 지원함으로써 데이터센터부터 지능형 엣지까지 최신 가속 컴퓨팅 기능을 구현하려는 고객에게 새로운 차원의 성능과 유연성을 제공한다"고 말했다. 이어 "자사의 광범위한 PCIe GPU 최적화 서버는 엔비디아 2-웨이(way) 및 4-웨이 NV링크 환경에서 엔비디아 H200 NVL을 지원한다"며 "최첨단 AI 모델의 추론 성능을 극대화하고 고성능 컴퓨팅(HPC) 워크로드를 가속할 것"이라고 설명했다. 엔비디아 RTX 프로 6000 블랙웰 서버 에디션은 AI와 그래픽 워크로드 모두에 최적화된 범용 GPU다. 기존 엔비디아 L40S 대비 GDDR7 메모리 속도가 빨라지고 메모리 용량이 두배로 늘어나는 등 성능이 크게 향상됐다. 또 PCIe 5.0 인터페이스를 지원해 GPU와 CPU 사이의 통신 속도도 빨라졌다. 새로운 멀티 인스턴스 GPU 기능을 통해 GPU 하나를 공유할 수 있는 완전 분리된 인스턴스 수도 최대 4개까지 확장됐다. 슈퍼마이크로 GPU 최적화 서버는 블루필드-3와 커넥트X-8과 같은 엔비디아 슈퍼NIC을 지원하도록 설계됐으며 엔비디아의 퀀텀 인피니밴드와 스펙트럼 이더넷을 활용해 인프라 확장과 GPU 클러스터링을 제공한다. 밥 피트(Bob Pette) 엔비디아 엔터프라이즈 플랫폼 담당 부사장은 "RTX 프로 6000 블랙웰 서버 에디션은 AI와 비주얼 컴퓨팅을 위한 최고의 데이터센터 GPU"라며 "가장 까다로운 워크로드에서도 전례 없는 가속 성능을 제공한다"고 말했다. 이어 "슈퍼마이크로의 광범위한 엔비디아 가속 시스템에 RTX 프로 6000 블랙웰 서버 에디션이 추가됨으로써 AI 개발·추론을 포함한 대부분의 워크로드 속도를 높일 수 있게 됐다"고 덧붙였다.

2025.03.26 17:19한정호

Prev 1 2 3 4 5 6 7 8 9 Next