• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
인공지능
배터리
양자컴퓨팅
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'gpu'통합검색 결과 입니다. (216건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

정부, '1.6조원' 규모 GPU 대전 시작…"WBL 훈련용 반도체, 민간과 함께 확보"

과학기술정보통신부가 민간 클라우드 기업들과 손잡고 총 1조6천300억원 규모의 그래픽처리장치(GPU) 확보·임차 사업을 추진한다. 세계 최고 수준의 초거대 언어모델 개발과 국내 산학연의 인공지능(AI) 인프라 확충을 위한 행보다. 과기정통부와 정보통신산업진흥원은 29일 서울 강남 코엑스에서 클라우드 기업을 대상으로 GPU 확보·임차 사업 통합설명회를 개최했다. 이달 1차 추가경정예산을 통해 관련 예산을 확정한 이후 다음달 4주차까지 협력 기업 공모에 본격 착수한 상태다. 이번 사업은 ▲총 1조4천600억원 규모의 GPU 확보 사업과 ▲1천723억원 규모의 GPU 임차 사업으로 구성된다. 확보 사업은 정부와 민간이 협력해 첨단 GPU를 직접 구매·구축하는 방식이고 임차 사업은 클라우드 기업이 보유한 GPU를 임차해 활용하는 구조다. 임차된 GPU는 가칭 '월드 베스트 LLM(WBL)' 프로젝트와 국내 산학연 등에 지원될 예정이다. 정부는 국내 고성능 연산 자원 부족 문제를 해소하고 AI 기술의 자립 기반을 확보하는 데 사업의 목적이 있다고 설명했다. 설명회 현장에선 사업 개요와 정책 방향 외에도 공모 절차, 평가 기준, 지원 조건 등의 세부 사항이 구체적으로 안내됐다. 참석자들은 질의응답을 통해 공모 준비에 필요한 사항들을 직접 확인할 수 있었다. 과기정통부와 정보통신산업진흥원(NIPA)은 다음달 4주차까지 공모 접수를 마감하고 오는 7월 중 평가와 협약 체결을 마무리할 계획이다. 이후 GPU 인프라 확보 및 배포를 신속히 추진하겠다는 입장이다. 과기정통부는 "보다 구체적인 공모 내용과 사업 안내는 과기정통부 및 NIPA 홈페이지를 통해 확인할 수 있다"고 밝혔다.

2025.05.29 17:18조이환

엔비디아 '블랙웰' 칩 수요 쾌청…삼성·SK HBM 성장 기회

엔비디아가 AI 반도체 산업의 성장세를 자신했다. 미국의 대중 수출 규제 여파에도 최첨단 AI 반도체인 '블랙웰'의 수요가 강력하고, 전 세계 AI 인프라 투자가 활발히 진행되고 있기 때문이다. 초고성능 AI 반도체인 'GB300' 역시 올 3분기 초 차질없이 양산이 시작될 것으로 전망된다. 이에 따라 국내 주요 메모리 업체인 삼성전자, SK하이닉스의 HBM(고대역폭메모리) 사업도 지속적인 성장의 기회를 잡을 수 있을 것으로 기대된다. 中 수출 규제, AI 산업 성장세 등 불확실성 '해소' 이날 엔비디아는 2026년 회계연도 1분기(올해 2~4월) 매출액 440억6천만 달러를 기록했다고 밝혔다. 전년동기 대비 69%, 전분기 대비 12% 증가한 수치다. 영업이익도 232억7천만 달러(Non-GAAP 기준)로 전년동기 대비 43%, 전분기 대비 6% 증가했다. 다만 데이터센터 매출액은 391억1천만 달러로 증권가 컨센서스(약 393억 달러)를 소폭 하회했다. 미국 트럼프 2기 행정부의 수출 규제 강화로 중국향 AI 반도체 'H20'의 판매가 전면 금지된 데 따른 영향이다. 엔비디아는 해당 규제로 1분기 45억 달러의 손실이 발생했으며, 2분기에도 80억 달러의 추가 손실이 있을 것으로 추산했다. 그럼에도 엔비디아는 2분기(5~7월) 매출 가이던스를 약 450억 달러로, 기존 증권가 컨센서스인 455억에 근접한 수준을 제시했다. H20의 수출 금지에도 최신형 AI 반도체인 블랙웰 시리즈의 수요가 견조한 덕분이다. 문준호 삼성증권 연구원은 "엔비디아의 2분기 매출 전망치는 전분기 대비 2% 증가에 그치나, H20의 손실 반영을 제외하면 14%의 성장세"라며 "그만큼 블랙웰의 수요는 같은 기간 더 좋아졌고, 이번 실적 발표에서 불확실성 요인이 다수 해소된 것도 중요한 대목"이라고 설명했다. GB300 양산 임박…SK하이닉스 HBM 훈풍 나아가 엔비디아는 올 하반기에도 전 세계 AI 인프라 투자로 인한 지속적인 성장을 자신했다. 젠슨 황 엔비디아 CEO는 ▲ 추론형 AI의 수요 증가 ▲ AI 확산 규정의 철폐 ▲ 엔터프라이즈 AI 시장의 본격적인 성장 ▲ 리쇼어리 정책 대두로 인한 '옴니버스' 등 산업용 AI 수요 증가 등 네 가지를 주요 배경으로 꼽았다. 견조한 AI 산업의 성장세는 국내 메모리 제조업체인 삼성전자, SK하이닉스에게도 긍정적이다. 특히, AI 반도체의 핵심인 HBM(고대역폭메모리)를 엔비디아 주력으로 공급하는 SK하이닉스의 매출 확대가 두드러질 전망이다. 엔비디아는 올 하반기 12단 HBM3E(5세대 HBM)를 탑재한 최신형 AI 반도체 'GB300'를 출시할 예정이다. GB300은 이달 초 주요 CSP(클라우드서비스제공자)에게 샘플이 공급됐으며, 오는 7월께 양산이 시작될 것으로 예상된다. 엔비디아 역시 GB300에 당초 적용하기로 했던 신규 보드 플랫폼의 채용을 미루는 등 제품 안정성 강화에 만전을 기하는 분위기다. SK하이닉스와 엔비디아간 내년 HBM 공급량 협의도 마무리 단계에 접어들었다. 이르면 다음달 최종 결정이 내려질 것으로 알려졌다. 특히, 엔비디아의 차세대 AI 반도체인 '루빈'에 탑재되는 HBM4(6세대 HBM)의 가격 및 물량이 주요 변수로 작용하고 있다.

2025.05.29 14:07장경윤

엔비디아, 1분기 영업이익 25.7조... 전년比 26% ↑

엔비디아가 28일(현지시간) 올 1분기(2~4월, 회계연도 기준 2026년 1분기) 실적을 발표했다. 중국 AI 칩 수출 제한이라는 악재 속에서도 인공지능(AI) 인프라에 대한 강력한 글로벌 수요에 힘입어 시장 예상을 뛰어넘는 실적을 달성했다. 엔비디아가 밝힌 1분기 매출은 441억 달러(약 60조 6375억원)로 전년 동기 대비 69% 늘어났다. 이는 시장조사업체 LSEG가 집계한 월가 예상치 433억 1천만 달러(약 59조 5513억원)를 1.8% 넘어서는 수치다. 영업이익은 187억 달러(약 25조 7천218억원)로 전년 대비 26% 늘어났다. AI 칩과 관련 부품을 포함하는 데이터센터 부문 매출은 391억 달러(약 53조 7625억원)로 전년 동기 대비 73% 증가했다. 이는 전체 매출의 88%를 차지하는 규모이며 시장 예상치 392억 2000만 달러(약 53조 9275억원)에 근접한 수준을 기록했다. 게이밍 부문은 38억 달러(약 5조 2250억원) 매출을 기록해 역대 분기 최대치를 달성했다. 일반 소비자용 새로운 GPU인 지포스 RTX 5070/5060 출시, 최대 4K 해상도 게임 구동을 지원하는 닌텐도 스위치2 프로세서 공급 증가 등이 영향을 미쳤다. 자동차와 로보틱스 부문 매출은 5억 6700만 달러(약 7796억원)로 전년 동기 대비 72% 증가했다. 엔비디아는 제너럴모터스(GM)와 차세대 차량, 공장, 로봇 분야에서 엔비디아 옴니버스, 코스모스, 드라이브 AGX 등을 활용한 협력을 발표하기도 했다. 이번 분기 실적에는 미국 정부의 대중국 수출 규제가 상당한 영향을 미쳤다. 지난 4월 초 미국 정부가 중국 시장을 겨냥한 H20 GPU의 수출 허가를 요구하면서 엔비디아는 H20 초과 재고 및 구매 의무와 관련해 45억 달러(약 6조 1875억원)의 손실을 기록했다. 엔비디아는 2분기(5~7월) 매출을 450억 달러(약 61조 8750억원)로 전망하고 "이는 H20 수출 제한으로 인한 80억 달러(약 11조원)의 매출 손실을 반영한 결과"라고 설명했다.

2025.05.29 09:04권봉석

"엔비디아, 中 겨냥해 저가형 블랙웰 AI칩 출시 예정"

엔비디아가 이르면 6월부터 '블랙웰' 기반의 신규 저성능 AI 반도체를 양산할 계획이라고 로이터통신이 25일 보도했다. 블랙웰은 엔비디아가 출시한 AI 가속기 중 가장 최신 세대의 아키텍처다. 당초 엔비디아는 중국 시장을 겨냥해 '호퍼' 아키텍처 기반의 'H20'을 공급해 왔으나, 최근 미국의 대중(對中) 반도체 수출 규제 수위 강화로 공급이 어려워졌다. 이에 엔비디아는 신규 AI 가속기로 중국 시장을 지속 공략하려는 것으로 풀이된다. 해당 칩은 엔비디아의 'RTX 프로 6000D' GPU를 기반으로 하며, HBM(고대역폭메모리) 대신 최신형 그래픽 D램인 GDDR7를 채용했다. 가격은 6천500~8천 달러 사이로, H20의 가격인 1만~1만2천 달러 대비 크게 낮은 수준이다. 또한 TSMC의 첨단 패키징 기술인 CoWoS(Chip-on-Wafer-on-Substrate)도 활용되지 않는다. CoWoS는 칩과 기판 사이에 넓다란 실리콘 인터포저 위에 반도체 다이(Die)를 수평 배치하는 2.5D 패키징의 일종이다. 지난해 회계연도 기준으로, 중국은 엔비디아의 전체 매출에서 13%를 차지하는 주요한 시장이다. 엔비디아가 미국의 규제를 피해 새롭게 칩을 설계하는 것은 이번이 세 번째다. 한편 신규 칩의 구체적인 이름은 아직 밝혀지지 않았다. 중국 증권사 GF증권은 '6000D', 또는 'B40'으로 명명될 가능성이 높다고 밝힌 바 있다.

2025.05.25 09:05장경윤

인텔, 컴퓨텍스 2025서 AI 경쟁력 강화 신기술 공개

[타이베이(대만)=권봉석 기자] 인텔은 올해 컴퓨텍스에서 기존 제품의 경쟁력을 강화할 수 있는 소프트웨어와 기술을 주로 소개했다. 22일 타이베이 난강전람관의 인텔 부스에서도 코어 울트라 시리즈2 프로세서 내장 CPU와 GPU, NPU를 활용한 소프트웨어 등을 소개했다. 코어 울트라 200H 프로세서의 NPU와 GPU를 활용한 AI 가속, 생성 AI와 클라우드/하이브리드 모델을 활용한 영상 분석, 제온6 SoC를 이용한 네트워크 처리 등 주요 사례들이 소개됐다. 인텔은 올 연말 출시할 차세대 코어 프로세서 '팬서레이크'를 처음으로 일반 관람객과 업계 관계자들에게 공개하기도 했다. 내장 GPU 성능 향상으로 처리 시간 단축 가능 노트북용 인텔 코어 울트라 200H 프로세서는 전 세대 대비 XMX 처리 기능 등을 추가해 성능을 두 배 이상 향상시킨 것이 특징이다. 인텔은 이 GPU 성능을 활용해 AI 기반 작업을 실행하는 시연을 진행했다. 시연 코너에는 코어 울트라9 285H 프로세서(아크 140T 내장) 탑재 모바일 워크스테이션이 놓여 있다. 어도비 서브스탠스 3D 샘플러로 직물 디자인이 그려진 그림 파일을 선택하자 잠시 처리 과정을 거쳐 바로 결과물이 나타났다. 인텔 관계자는 "소파에 직물 소재를 입히는 디자인을 진행할 때 서로 다른 소재를 바꿔가며 설정하려면 예전에는 수 분, 길게는 한 시간 이상이 걸렸다. 그러나 현재는 최대 10초 안에 결과물을 처리할 수 있을 정도로 향상됐다"고 설명했다. 메모리 오버클록으로 성능 향상 인텔이 최근 적용에 나선 '200S 부스트' 기능은 코어 울트라 200S-K 프로세서에 내장된 4개 타일 중 메모리를 관리하는 SOC 타일의 작동 속도는 최대 600MHz까지, 메모리 작동 클록은 최대 800MHz까지 높인다. Z890 칩셋 기반 메인보드에 최근 제조사가 배포한 UEFI 펌웨어를 적용하면 이용할 수 있다. 이 기능을 활용해 오버클록시에도 프로세서 보증기간(3년)은 그대로 유지된다. 현장의 인텔 관계자는 "대만 소재 주요 고성능 메모리 제조사와 메인보드 제조사가 200S 부스트 기능 구현에 협력했다"며 "DDR5-8000MHz 이상 고성능 메모리를 이용하면 게임 내 설정을 바꾸지 않아도 5-10% 가량 추가 성능 향상 효과를 볼 수 있다"고 설명했다. "감시 영상 분석, 하이브리드 환경이 더 경제적" 도난이나 상해 사건이 일어날 경우 예전에는 사람이 일일이 감시 영상을 프레임 단위로 살펴본 다음 이를 바탕으로 보고서를 작성해야 했다. AI를 이용하면 이런 작업을 크게 단축할 수 있다. 인텔 관계자는 "4개 카메라가 작동하는 환경에서 AI를 이용한 영상 분석을 수행할 때 클라우드와 인텔 CPU/GPU 기반 로컬 AI를 동시에 활용하면 처리 비용은 1/5 수준으로 줄어들고 지연 시간 역시 줄일 수 있다"고 설명했다. 이어 "인텔 산업용 프로세서 '배럿레이크'와 아크 2세대(배틀메이지) GPU를 활용해 영상을 분석할 수 있는 오픈소스 프로젝트가 이미 깃헙에 올라와 있어 각 기업 환경에서 평가가 가능하다"고 설명했다. 제온 프로세서 내장 가속기로 TCO 절감 대만 시나오 네트웍스는 인텔 프로세서를 내장한 네트워크 장비인 '넷셋 가속기 카드' 시연을 진행했다. 10코어 아이스레이크 탑재 SX904, 제온 6 SoC를 내장한 SX906 등 두 개 제품이 전시됐다. 이 업체 관계자는 "기존 스마트 네트워크 카드는 Arm 기반 FPGA나 SoC를 탑재하지만 이 가속기는 x86 기반으로 작동한다"며 "필요한 운영체제와 응용프로그램을 가속기 카드에서 미니 서버처럼 직접 실행한다"고 설명했다. 이어 "방화벽이나 보안 기능은 과거에는 별도 장비나 서버가 필요했지만 이제는 이런 기능을 한 카드에서 모두 처리할 수 있다. 보안 장비 없이 가상 네트워크 기능을 구현할 수 있어 총소유비용(TCO) 절감 효과도 얻을 수 있다"고 설명했다. 차세대 코어 프로세서 '팬서레이크' 시제품도 전시 부스 한 켠에는 인텔이 올 연말 출시할 차세대 코어 프로세서 '팬서레이크'(Panther Lake) 시제품이 전시됐다. 단 도난이나 손상 등을 우려해 투명 아크릴 안에 보호된 채로 전시됐다. 팬서레이크는 1.8나노급 인텔 18A(Intel 18A) 공정에서 생산돼 올해부터 투입될 예정이다. 새 트랜지스터 구조 '리본펫'(RibbonFET), 반도체 후면 전력 전달 기술 '파워비아'(PowerVIA) 등이 적용됐다. 현장 인텔 관계자는 "팬서레이크는 코어 울트라 200V의 전력 효율성, 코어 울트라 200H/HX/S의 고성능 등 장점을 한데 모은 프로세서로 차세대 GPU를 탑재해 AI와 3D 성능을 동시에 강화할 것"이라고 설명했다.

2025.05.23 17:37권봉석

[현장] "AI가 바꾼 냉각 시스템…공랭은 한계, '액침 냉각'이 해답"

"미래의 인공지능(AI) 데이터센터를 운용하려면 현재 활용되는 공랭식으로는 불가능하고 액침 냉각 방식만이 가능할 것입니다." 한국데이터센터에너지효율협회(KDCEA) 송준화 사무국장은 23일 서울 여의도 FKI타워에서 열린 '데이터센터 냉각시스템 개발 및 구축 사례와 효율적 운영방안' 세미나에서 AI 시대의 데이터센터 냉각 방식에 대해 이같이 강조했다. 이날 세미나는 업계 종사자들을 대상으로 공조·냉각 시스템, 액침냉각·액침냉각유, 무정전전원장치(UPS), 히트펌프, 액화가스(LNG) 냉열·지열 등 데이터센터 관련 내용들을 폭넓게 알리기 위해 마련됐다. 최근 AI 시대를 맞아 데이터가 급격히 증가하고 IT 인프라의 가동률이 높아지고 있다. 이에 데이터센터의 안정적인 운영을 위한 서버·스토리지 및 네트워킹 장비의 과열을 방지하는 냉각 기술의 필요성이 커지고 있다. 데이터센터의 안정적 운영뿐 아니라 탄소 배출 저감 등 환경적 지속 가능성을 높이기 위한 차원에서도 효율적인 냉각 방식은 전 세계적으로 주목받는 상황이다. 현재 우리나라에서 주로 상용화된 냉각 방식은 수전을 활용한 차가운 공기를 이용해 IT 장비의 발열을 제어하는 공랭식이다. 해외에서는 액체로 장비를 직접 냉각하는 '다이렉트 리퀴드 쿨링(DLC)'과 '다이렉트 투 칩(D2C)', 액침 냉각 방식 등 더욱 고도화된 시스템이 활발히 개발·도입되고 있다. 송 사무국장은 "현재 우리나라에서 이용되는 공랭식으로는 데이터센터의 '전력사용효율지수(PUE)'가 높아지는 데 한계가 있다"며 "공랭식은 전기를 많이 사용할 수밖에 없어 외부 공기를 간접적으로 활용하는 방식도 통용되고 있다"고 설명했다. 이어 "아직까지 국내에는 직접 냉각 방식과 액침 냉각이 구현된 데이터센터 환경은 없으며 테스트베드 정도만 존재하는 상황"이라고 덧붙였다. 데이터센터의 냉각 방식이 고도화돼야 하는 이유는 AI의 발전과 맞닿아 있다. 현재 데이터센터 내 대부분의 랙당 전력 집적도는 6~10키로와트(kW) 수준인 데 반해, AI 서비스 운용을 위한 최신 그래픽처리장치(GPU)가 탑재된 랙의 집적도는 40~100kW에 달한다. 나아가 엔비디아의 블랙웰 GPU를 탑재한 서버의 집적도는 130kW에 달할 것으로 알려졌다. 이에 대해 송 사무국장은 "랙 당 전력 집적도가 큰 폭으로 상승하면서 전력 공급 설비의 구조가 변화하고 있다"며 "집적도가 오르다 보니 발열량도 증가하는데, 이러한 발열량을 더 이상 공랭식으로는 해결할 수 없어 수냉식 시스템이 주목받는 것"이라고 말했다. 앞으로 다량의 GPU를 구동하기 위해선 전력량과 이에 따른 발열을 통제할 수 있는 액침 냉각 방식을 도입하는 것이 필수적이라는 설명이다. 송 사무국장은 냉각 방식의 더딘 발전 외에도 전문인력 부족과 낮은 지역 수용성이 국내 데이터센터 산업 발전을 저해하는 요소로 꼽았다. 송 사무국장은 "한 개 데이터센터에 적어도 20명의 전문인력이 배치돼야 하지만 신규 인력 공급이 매우 부족한 상황"이라며 "열섬 현상, 소음, 전자파 등을 우려하는 지역 주민들의 반발에 부딪혀 데이터센터 관련 사업이 중단되거나 취소되는 일도 늘어나고 있다"고 설명했다. 산업부의 데이터센터 지역 분산 정책과 전력계통영향평가, 국토부의 제로에너지빌딩 인증 등의 규제도 국내 데이터센터 산업에 장애요인으로 영향을 미치고 있다. 송 사무국장은 "제로에너지빌딩 인증은 친환경·신재생 에너지를 활용한 에너지 자립률을 20%까지 올려야 하는 것"이라며 "데이터센터에서는 현실적으로 달성하기 불가능한 조건"이라고 밝혔다. 그러면서 "정부에서는 데이터센터의 지역 분산 정책을 적극 추진하고 있다"며 "AI는 클라우드에 비해 네트워크 의존도가 상대적으로 높지 않아 지방에서 상업용 AI 데이터센터를 운용하는 것이 가능할 것"이라고 전망했다.

2025.05.23 13:07한정호

엘리스클라우드 "최신 GPU·국산 NPU 이용 기관 수 반년 만에 9배↑"

AI 교육 솔루션 기업 엘리스그룹(대표 김재원)의 AI 특화 클라우드 솔루션 '엘리스클라우드' 이용 기관 수가 9배 이상 급성장했다고 22일 밝혔다. 지난해 11월부터 올해 5월까지 6개월 만의 성과다. 엘리스클라우드는 고성능 GPU와 NPU를 모두 제공하는 AI 특화 클라우드다. 다수의 스타트업, AI 연구실 등에서 활발히 활용되어 왔으며, 지난해 하반기부터 기업, 대학 고객이 크게 늘어나고 있는 추세다. 특히 신규 프로젝트, 학기 등이 시작되는 3월부터 엘리스클라우드 도입 문의가 늘어나고 있으며, 이용 기관 수 역시 이에 발맞춰 상승하고 있다. 올해 3월부터 5월까지 월 평균 성장세는 50% 이상으로 나타났다. AI 데이터 관리부터 프로젝트, AI 모델 개발 및 배포까지 가능한 원스톱 AI 클라우드 솔루션을 구축한 결과다. 또 올해 3월 클라우드 보안인증인 CSAP IaaS를 획득함으로써 보안역량을 입증 받아 CSAP를 필수로 하는 공공 기관은 물론, 데이터 보안을 중요시하는 기업의 관심도 높아지고 있다고 회사는 설명했다. 엘리스클라우드 이용자 수 역시 서비스 도입 초기인 2023년 6월 대비 2025년 3월, 21개월 만에 약 74배 증가하는 성과를 거뒀다. AI 도입을 원하지만 AI 모델 활용에 어려움을 느끼던 고객들을 고려해 편의성을 높인 다양한 AI 특화 서비스를 선보인 덕이다. 엘리스는 AI 모델에 대한 높아진 관심을 반영해 지난 2월 오픈소스를 포함한 다양한 범용 AI 모델을 별다른 설치 없이 편리하게 사용할 수 있는 최적화된 'ML API 라이브러리' 기능을 선보였다. 고객이 체감하는 가장 큰 혜택인 합리적인 가격은 엘리스클라우드만의 경쟁력이다. 회사에 따르면 이용자는 글로벌 클라우드와 동일한 조건으로 엘리스클라우드를 사용할 경우 77% 이상 비용을 절감할 수 있다. 이는 엘리스가 자체 기술로 개발한 클라우드 인프라를 활용해 AI에만 특화한 클라우드 솔루션을 제공해 가능하다. AI 모델을 효율적으로 운영할 수 있도록 NPU에 최적화된 솔루션도 제공한다. 엘리스는 AI에 특화한 고성능의 GPU와 NPU를 모두 제공 가능한 CSP로서 국산화한 GPU, NPU 클라우드 기술을 확보하고 있다. 김재원 엘리스그룹 대표는 "엘리스클라우드는 AI PMDC 기반으로는 국내에서 가장 많은 GPU 이용 기관을 보유하고 있다. 지속적인 성장세를 기록하고 있다"며 "특히 지난해부터 엔비디아 H100을 인피니밴드 기반 클러스터로 제공해 큰 성장을 기록했다. 이를 발판 삼아 올해 공공 부문과 해외까지 시장을 확대하고 다양한 고객 레퍼런스를 확보할 수 있도록 더욱 도약할 것"이라고 말했다.

2025.05.22 17:27백봉삼

AMD, 워크스테이션용 GPU '라데온 AI 프로 R9700' 공개

[타이베이(대만)=권봉석 기자] AMD가 21일 오전(이하 현지시간) 타이베이 그랜드 하얏트 호텔에서 글로벌 기자간담회를 진행하고 워크스테이션용 라데온 GPU와 스레드리퍼 프로세서, 일반 소비자용 라데온 그래픽카드를 공개했다. 라데온 AI 프로 R9700은 8K 고해상도 동영상 편집과 VFX(특수효과), 고성능 AI 추론을 위해 새로 설계된 워크스테이션용 GPU다. 2세대 AI 가속기를 탑재해 전 세대 대비 처리 성능을 최대 2배로 높이고 32GB 메모리로 대용량 AI 모델 실행에 최적화됐다. 라이젠 스레드리퍼 9000 시리즈는 워크스테이션과 하이엔드 데스크톱을 위한 프로세서다. 최상위 모델인 라이젠 스레드리퍼 프로 9995WX는 96코어 192스레드로 작동한다. 경쟁사인 인텔 동급 제온 프로세서 대비 80% 이상 높은 성능을 낸다. 루카 로시 레노버 인텔리전트 디바이스 그룹 총괄은 이날 "스레드리퍼 9000 시리즈를 탑재한 새로운 워크스테이션인 '씽크스테이션 P8'을 출시할 예정"이라고 설명했다. 라데온 RX 9060 XT는 1440p 해상도에서 부드러운 게이밍 경험을 제공하는 것을 목표로 개발됐다. 머신러닝 기반 업스케일 기술인 FSR 4를 지원하며 전 세대 대비 레이트레이싱 처리량이 두 배 향상됐다. INT4(정수, 4비트) 정밀도 기준 연산 성능은 821 TOPS(1초 당 1조 번 연산)다. AMD는 올 하반기 출시할 차세대 FSR 기술인 '레드스톤'(Redstone)도 함께 공개했다. 전후 프레임과 인근 픽셀을 활용해 노이즈는 줄이고 성능을 높일 수 있는 것이 핵심이다. 잭 후인 AMD 컴퓨팅 및 그래픽 그룹 수석 부사장은 "이번 제품들은 크리에이터, 게이머, 전문가에게 성능과 효율성을 제공하여 한계를 뛰어넘고 창의성을 높일 수 있도록 지원하는 AMD의 비전이 담겨있다"고 밝혔다. 스레드리퍼 9000 시리즈와 라데온 AI 프로 R9700은 오는 7월부터 시장에 공급된다. 라데온 RX 9060 XT는 8GB/16GB 등 두 개 모델로 공급되며 권장가는 각각 299달러(약 42만원), 349달러(약 49만원)로 책정됐다. 글로벌 출시는 6월 5일(미국 기준)이나 국내는 현충일 등 연휴를 감안해 다음 주인 6월 9일부터 시장 공급 예정이다.

2025.05.21 17:43권봉석

SK하이닉스 부스 찾은 젠슨 황 "GO SK! 넘버원" 찬사 연발

[타이베이(대만)=권봉석 기자] 젠슨 황 엔비디아 CEO가 20일(이하 현지시간) 오후 5시 20분경 대만 타이베이 소재 난강전람관 1관에 차려진 SK하이닉스 부스를 깜짝 방문해 최신형 HBM 제품에 대한 찬사를 아끼지 않았다. 이날 젠슨 황 엔비디아 CEO는 대만 내 주요 협력사를 둘러본 후 거의 마지막 순서로 난강전람관 1관 4층에 위치한 SK하이닉스 부스를 방문했다. 젠슨 황 CEO는 오후 5시 20분경 SK하이닉스 부스에 도착해 현장에서 기다리던 김주선 SK하이닉스 사장 이하 관계자들과 인사했다. 데스크톱PC용 고성능 DDR5 메모리 모듈, 엔비디아 GPU에 탑재된 고대역폭메모리(HBM)를 둘러본 그는 각종 전시물에 직접 서명을 남기기도 했다. 이어 "정말 좋습니다. SK 넘버 원. 정말 뛰어난 일을 했습니다"며 현장의 SK하이닉스 임직원을 격려하기도 했다. 젠슨 황 엔비디아 CEO는 마지막으로 현장의 SK하이닉스 임직원들과 "GO SK!" 구호와 함께 기념촬영을 마친 후 우리말로 "감사합니다" 인사를 남겼다. 이후 다음 목적지인 대만 대형 ODM 폭스콘 부스로 이동했다.

2025.05.20 21:43권봉석

인텔, 전문가용 아크 프로 GPU 2종 출시

[타이베이(대만)=권봉석 기자] 인텔이 컴퓨텍스 2025 기간 중 크리에이터, 개발자, 엔지니어를 겨냥한 아크 프로 GPU 2종을 공개했다. 신제품은 Xe2 코어를 20개 내장한 '아크 프로 B60', 16개 내장한 '아크 프로 B50' 등 2종이다. 아크 프로 B60은 메모리를 최대 24GB, 아크 프로 B50은 메모리를 최대 16GB 이용할 수 있다. 인텔은 "아크 프로 B60은 추론 작업을 수행하기 위한 워크스테이션에, 아크 프로 B50은 그래픽 작업을 수행하기 위한 워크스테이션에 적합한 제품"이라고 설명했다. 두 제품 모두 PCI 익스프레스 5.0 인터페이스 기반으로 작동하며 윈도 운영체제와 리눅스 상에서 작동한다. 독립소프트웨어업체(ISV) 인증을 통해 주요 산업 소프트웨어와 호환된다. 인텔은 윈도 운영체제용으로 성능을 중시한 일반 드라이버, 안정성과 호환성을 중시한 전문가용 드라이버를 모두 제공한다. 리눅스에서는 컨테이너 기반 소프트웨어 스택을 지원한다. 인텔은 AI 개발 과정을 가속할 수 있는 인텔 제온 프로세서 기반 GPU 플랫폼 '프로젝트 배틀매트릭스'도 함께 공개했다. 프로젝트 배틀매트릭스는 아크 프로 B60 24GB GPU를 최대 8개 탑재해 192GB 메모리를 활용 가능하며 최대 1천500억 개 매개변수로 구성된 대용량 AI 모델을 구동할 수 있다. 비비안 리엔(Vivian Lien) 인텔 클라이언트 그래픽 부문 총괄은 "아크 프로 B시리즈는 Xe2 아키텍처 고급 기능과 소프트웨어 생태계를 기반으로 중소기업이나 개인, 초급 개발자 등에 더 높은 접근성을 제공할 것"이라고 설명했다. 애즈락, 니르, 래너, 맥선, 오닉스 등 그래픽카드 제조사는 아크 프로 B60 그래픽카드를 추론 성능을 강조한 워크스테이션에 선탑재 형태로 주로 공급할 예정이다. GPU 하나당 단가는 500달러(약 70만원) 선으로 책정됐다. 아크 프로 B50 공급가는 299달러(약 42만원)로 책정됐고 오는 7월부터 시장 공급 예정이다.

2025.05.20 07:00권봉석

유상임 장관, 엔비디아 찾아 GPU 확보 논의...NIPA 협약 체결

유상임 과학기술정보통신부 장관이 지난 14일부터 미국을 찾아 엔비디아와 AI 인프라 구축을 위한 업무협약을 이끌어냈다. 엔비디아 초청을 받아 미국 본사를 방문한 유상임 장관은 제이 퓨리 총괄 부사장, 칼리스타 레드몬드 부사장 등 엔비디아 주요 임원들과 대한민국 AI 인프라 역량 확충을 비롯해 AI 생태계 역량 강화를 위한 협력방안을 논의했다. 정보통신산업진흥원(NIPA)은 엔비디아와 업무협약을 체결, 연내 원활한 첨단 엔비디아 GPU 확보 등 AI 인프라 구축을 위해 협력하기로 했다. 유 장관은 방미 첫날 브랜던 카 연방통신위원회(FCC) 위원장과 면담을 갖고, 전 세계적인 위협이 되고 있는 통신 해킹에 대한 협력 방안을 찾았다. 이 자리에서 한국의 'IoT 보안인증제도'와 FCC의 '사이버 트러스트 마크'의 추진 현황을 공유하며, 양국의 IoT 기업들이 상대국에서 중복 인증을 받는 부담을 줄이고 국민들도 IoT 기기를 안심하고 사용할 수 있도록 한미 양국이 IoT 보안 기준 등에 대해 공유할 필요성을 공감했다. 아울러 양측의 6G 개발과 표준활동에 대해 공유했다. 또 해저 케이블 보안에 대해 지속적인 협력관계를 이어나가기로 뜻을 모았다. 유 장관은 15일 美 백악관 과학기술정책실(OSTP) 린 파커 부실장을 만나 한미 과학기술 협력에 차질없는 추진 방안에 대해 논의하였다. 유 장관은 먼저 한국의 글로벌 R&D 현황을 공유하며 미국과의 협력 내용을 설명하였다. 아울러 R&D 환경 변화에도 한미 간 차질없는 협력을 강조하였다. OSTP측에서는 한국에서 참고할 수 있도록 이번 트럼프 2기 행정부의 투자 우선순위를 공유하고, 이를 바탕으로 R&D 정책 변화를 강구하고 있음을 밝혔다. 특히 유 장관은 민감국가 지정 등의 상황으로 연구보안의 중요성이 증대되고 있는 상황을 설명하였고, 양측은 현재 연구보안 정책을 공유하고, 상호 긴밀히 협력해나가기로 했다. 미측은 트럼프 행정부 1기 때 발표된 연구보안 관련 대통령 각서를 기반으로 이행을 강화해나갈 것이라는 점을 강조했다. 이밖에 미국 국립과학재단, 에너지부(DOE) 산하 페르미 국립가속기연구소, 미국과학진흥협회(AAAS) 등과 의견을 나눴다. 유 장관은 “한국의 글로벌 공동연구 투자 규모 중 미국과의 협력 비중이 가장 큰 현실에서 트럼프 2기 행정부의 변화된 R&D 정책방향과 연구보안 강화 정책이 우리 R&D에 미치는 영향을 빨리 파악하고 대응하는 것이 중요하다”며 “방미를 계기로 미측과 차질없는 협력을 이어가기로 하였고, 이번에 논의한 내용을 한미 R&D 정책에 반영할 계획”이라고 밝혔다. 그는 또 “엔비디아와의 GPU 협력 모색에 착수한 바, 국내 AI 연구환경이 대폭 개선되기를 기대한다”고 강조했다.

2025.05.18 13:17박수형

정부 "다음주 GPU 1만장 확보 사업 공모…복수 CSP 선정 가능성"

정부가 인공지능(AI) 인프라 필수 요소인 그래픽처리장치(GPU) 확보를 위해 민관 협력을 본격화한다. 국내 클라우드 기업을 선정해 데이터센터에 GPU 1만 장을 설치·운영하게 하고, 이를 산학연이 활용하는 방식으로 추진할 방침이다. 과학기술정보통신부는 16일 서울 LW컨벤션센터에서 '최첨단 GPU 확보추진방안' 브리핑을 열고 연내 GPU 확보 청사진을 제시했다. 과기정통부는 정보통신산업진흥원(NIPA) 주관으로 연내 1만장 규모의 GPU 확보 사업을 추진한다. 국내 클라우드 서비스 제공업체(CSP) 간 경쟁을 통해 대상 기업을 선정할 방침이다. 선정된 CSP는 기존 데이터센터 인프라를 활용해 전력, 냉각, 네트워크 등 정비를 마친 뒤 순차적으로 GPU를 구축하고 실서비스로 전환한다. 사업 기간은 5년이다. 앞서 정부는 GPU 확보를 위해 1조4천600억원 추경 예산을 편성했다. 구매 대상은 엔비디아의 H200, B200, 블랙웰 등 고성능 GPU다. 확보된 GPU는 NIPA가 소유하되 국가 컴퓨팅AI센터(SPC)가 사용권을 갖는다. 공모 신청은 다음 주부터다. NIPA가 7월까지 CSP 심사·선정을 진행한다. 심사는 서면평가와 발표, 현장실사를 포함한 절차로 진행된다. 이후 올해 10월까지 GPU 전량을 확보해 선정 CSP에 공급한다. 과기정통부 장기철 인터넷진흥과 과장은 평가 기준이 효율성과 신속성이라고 밝혔다. 정부 재정 투입 대비 얼마나 높은 성능·효율을 확보할 수 있는지, 데이터센터에 GPU를 얼마나 빨리 구축할 수 있는지, GPU 서비스를 신속히 구동할수 있는지가 핵심이라는 설명이다. 정부는 이번 사업에서 복수 CSP가 선정될 수 있다고 밝혔다. 다만 단독으로 가격, 상면, 구축 속도, 활용 계획 등에서 타사 대비 경쟁력 뚜렷한 기업이 있으면 단일 선정될 가능성도 있다. 장기철 과장은 "평가 기준은 기존 SPC 참여 여부, 비용 대비 효율성, 인프라 구축 역량 등"이라고 설명했다. 그러면서 "GPU의 자사 활용 비중 하한선은 명시하지 않기로 했다"며 "다만 공공성과 산업계 파급력 중심으로 평가 기준이 마련될 것"이라고 덧붙였다. 이어 그는 "구체적 평가 항목과 선정 기준 등이 구체적으로 정해지지 않았다"며 "이달 중 공모 신청 브리핑을 추가로 열겠다"고 말했다. 과기정통부 엄열 정보통신정책관은 "이번 사업은 민관이 함께 AI 패권 경쟁에 대응하는 중요한 계기가 될 것"이라며 "국가 전체 경쟁력 강화에 기여하는 방향으로 사업을 추진하겠다"고 밝혔다.

2025.05.16 13:21김미정

"AI가 만든 코드, 기술 발전 가속"…구글 딥마인드, 진화형 알고리즘 '알파이볼브' 개발

구글 딥마인드가 알고리즘을 설계하고 성능까지 개선하는 인공지능(AI)을 선보였다. 언어모델 기반의 코드 생성 능력에 진화적 평가 구조를 결합해 대규모 컴퓨팅 인프라부터 수학적 난제까지 범용 최적화가 가능해진 것이다. 16일 구글 공식 블로그에 따르면 딥마인드는 지난 14일 코드 기반의 알고리즘을 진화시키는 AI 시스템 '알파이볼브'를 발표했다. 이 시스템은 구글의 최신 언어모델 '제미나이' 시리즈에 자동 평가 알고리즘을 접목한 구조로, 구글의 데이터센터·칩 설계·AI 모델 학습 등 실제 운영 환경에 투입돼 성능을 입증했다. '알파이볼브'는 기존의 함수 단위 코드 생성과 달리 수백 줄 규모의 복잡한 알고리즘 전체를 설계할 수 있는 구조다. 속도 중심의 '제미나이 플래시'와 논리 구조를 강화하는 '제미나이 프로'를 병행 활용해 코드 제안을 생성한다. 이렇게 생성된 코드는 자동 평가 시스템이 정확성, 속도, 자원 활용도 등을 따져서 평가하고 성능이 좋은 코드만 다음 세대에 반영된다. 처음 성과를 낸 분야는 구글의 데이터센터 스케줄링이다. 이 시스템은 내부 클러스터 관리 도구인 보그(Borg)에 적용돼 일부 자원만 남은 서버를 더 잘 활용할 수 있도록 새로운 방식의 스케줄링 규칙을 만들어냈다. 사람이 읽고 관리하기 쉬운 단순한 코드 형태로 제공돼 전체 컴퓨팅 자원의 0.7%를 꾸준히 절약할 수 있게 됐다. 칩 설계 영역에서도 적용 사례가 나왔다. '알파이볼브'는 구글 텐서플로우 처리장치(TPU) 내 고성능 산술 연산 회로에서 불필요한 비트를 제거하는 베릴로그(Verilog) 코드를 제안했다. 이는 기능 검증을 거쳐 차세대 설계에 반영된 상태로, AI가 하드웨어 설계 언어 수준에서 의미 있는 구조 개선을 제안할 수 있음을 입증하는 계기가 됐다. 특히 구글 '제미나이' 모델 학습에 쓰이는 행렬 곱셈 연산을 최적화해 속도를 23% 끌어올렸다. 전체 학습 시간도 1% 줄었으며 기존에는 수주가 걸리던 커널 최적화 작업이 수일 내 자동 실험으로 가능해졌다. 반복 작업 부담이 줄어들면서 연구 효율도 함께 높아졌다. 사람이 직접 손대지 않던 그래픽처리장치(GPU) 저수준 명령어 영역에서도 성과가 나왔다. '플래시어텐션' 커널에서 최대 32.5%의 속도 향상을 기록했으며 기존 컴파일러 최적화를 넘어선 성능이라는 평가를 받는다. AI가 병목 지점을 스스로 찾아내고 개선 방향까지 제시한 사례로, 실제 코드 개선 작업의 효율성을 높이는 데 기여하고 있다. 수학 난제를 해결하는데도 기존 한계를 뛰어넘는 성과를 냈다. 일례로 복소수 4×4 행렬 곱셈 문제에서 기존보다 곱셈 횟수를 더 줄인 새로운 알고리즘을 찾아냈는데 이는 지난 1969년 수학자 스트라센이 세운 기록을 처음으로 넘어선 사례다. 수십 년간 누구도 개선하지 못한 수학적 구조 자체를 AI가 새롭게 설계해낸 것이다. 이외에도 이 시스템은 수학 분석, 기하학, 조합론, 수론 등 다양한 미해결 문제 50여 개에 적용됐다. 전체의 약 75%에서 기존 최고 해법을 재현했고 심지어 20%의 경우에는 보다 나은 해법을 제시했다. 구글 딥마인드는 현재 '피플+AI 리서치' 팀과 함께 '알파이볼브'의 사용자 인터페이스를 개발 중으로, 학술 연구자 대상 얼리 액세스 프로그램을 준비하고 있다. 일반 공개 여부는 추후 검토할 예정이나 명확한 평가 구조를 갖는 알고리즘 문제라면 어떤 분야에도 적용 가능한 구조라는 점에서 범용 기술로의 확장 가능성이 거론된다. 소재 개발, 신약 설계, 에너지 최적화, 공정 자동화 등 연산 기반 과학 영역 전반에 대한 활용이 논의되고 있다. 알렉산더 노비코프 딥마인드 연구원은 "우리는 평가자가 명확한 문제에 집중하고 있다"며 "자동화된 피드백 루프를 통해 성능을 지속적으로 개선할 수 있다"고 설명했다. 마테이 벌로그 딥마인드 연구원은 "'알파이볼브'는 일반적 AI 시스템임에도 불구하고 알파텐서보다 더 나은 성과를 냈다"며 "실제 문제에 곧바로 적용 가능한 과학 도구는 연구 현장에서도 드문 경험"이라고 말했다.

2025.05.16 09:58조이환

[현장] 마음AI "GPT 다음은 피지컬AI…자율주행 농기계 등서 성과"

국내 인공지능(AI) 기업 마음AI는 생성형 AI 다음으로 피지컬 AI(Physical AI) 시대가 올 것이라고 내다봤다. 최홍섭 마음AI 기술 부문 대표는 15일 서울 삼성동 코엑스에서 열린 국제인공지능대전(AI엑스포)에서 'GPT 이후 우리는 어떤 AI를 만들어야 하는가'를 주제로 발표했다. 최 대표는 “오픈AI가 만든 생성형 AI 'GPT' 사용자는 한 달에 5억명”이라며 “경쟁 제품 '제미나이'와 '클로드'가 1억명 안 되는 점을 감안하면 대단한 수준”이라고 평가했다. 그러면서 “올해 초 젠슨 황 엔비디아 최고경영자(CEO)가 'GPT 이후 세상을 바꿀 AI는 피지컬 AI'라고 했다”며 “피지컬 AI는 몸통이 있는 AI로 쉽게 말해 로봇인데, 휴머노이드(인간 형태 로봇)와 자율주행 자동차가 대표”라고 전했다. 최 대표는 “마음AI는 2023년부터 'AI로 로봇을 제어하는 기술 만들어야겠다'고 생각했다”며 “자율주행부터 시작해 상용화까지 성공했다”고 말했다. 주력 제품으로 자율주행 농기계를 소개했다. 이는 과수원에서 나무 사이를 비집고 다니며 농약을 뿌린다. 최 대표는 “넓은 과수원에서 사람이 직접 농약 뿌리려면 시간이 오래 걸리는데다 인건비도 부담”이라며 “인체에 해롭기까지 하다”고 지적했다. 그는 “마음AI 자율주행 농기계는 퀄컴 개발 엔진보다 뛰어난 자체 개발 엔진을 가졌다”며 “건설·국방 로봇으로 영역을 넓힐 것”이라고 강조했다.

2025.05.15 17:03유혜진

정부, 엔비디아 H200·B200 구입...10월부터 GPU 서비스

정부가 연내 엔비디아의 H200, B200 GPU 1만장을 도입해 국내 클라우드 기업이 AI 연구 개발에 쓰이도록 한다. GPU 구매 발주는 7월에 이뤄질 예정이다. 과학기술정보통신부는 14일 열린 경제관계장관회의에서 이같은 내용이 담긴 첨단 GPU 확보 추진 방안을 발표했다. 추경 예산으로 확보하게 되는 GPU 1만장은 H200 6천400장, B200 3천600장 규모로 수급 계획을 세웠으며 모델 비중은 상황에 따라 조정할 예정이다. GPU 구입에 8천600억원, 클러스터 통합 운영환경에 6천억원의 예산을 분배한다. 정부 예산으로 구입한 GPU를 운용할 클라우드 기업(CSP)에 대한 공모는 내주 예정됐으며 GPU 구매 절차는 7월에 진행, 이르면 오는 10월부터 신규 GPU 클러스터를 통한 국내 기업과 학계의 R&D를 진행키로 했다. 국가AI컴퓨팅센터 주체의 컨소시엄 형태 특수목적법인(SPC)에 참여하는 CSP 선정에는 별도 전문가 위원회가 맡는다. 선정 평가는 ▲재정 투입 대비 컴퓨팅 성능을 포함한 GPU 확보 구축 역량 ▲신속한 GPU 서비스 실행력 ▲GPU 자원 자체 활용 비중과 계획(CSP 운영비 성격 고려) 등을 중점에 뒀다. 선정된 CSP와 추후 권리 등에 관한 5년 단위 협약을 체결하게 된다. 협약에는 정보통신산업진흥원(NIPA)의 GPU 소유권 확보, SPC의 GPU 사용, CSP의 일부 GPU 자원 자체활용 허용 등의 내용이 포함된다. 정부는 특히 월드베스트LLM(WBL)에 선정된 기업에 GPU 자원 이용을 우선 제공한다는 방침이다. WBL은 국가대표 생성형AI 모델을 만들겠다는 취지로, 추경 예산을 통해 이뤄지는 프로젝트다. 과기정통부는 “SPC는 공공지분이 51%로 공공기관운영법에 따른 공공기관 지정 가능 요건에 해당한다”며 “내년 1월로 예상되는 공공기관운영위 심의에서 최종 결정될 사항이나 민간의 자율성을 최대한 보장하는 방향으로 부처 협의 중”이라고 밝혔다.

2025.05.14 11:35박수형

유상임 장관, GPU 확보 위해 방미...엔비디아와 직접 논의

유상임 과학기술정보통신부 장관이 추경으로 마련된 인공지능(AI) 인프라 구축 사업 확대를 위해 이번 주 미국을 찾아 엔비디아를 만난다. 13일 유상임 장관 주재로 열린 4차 AI 컴퓨팅 인프라 특별위원회에서는 첨단 GPU 확보 방안이 논의됐다. 정부는 연내 GPU 1만장 확보를 위해 1조4천600억원의 추경 예산을 편성, 최근 국회 본회의를 통화했다. 이날 특위는 GPU 구매, 구축, 사용에 이르는 전주기 절차를 거쳐 속도감 있게 추진하는 것이 중요하다는 데 뜻을 모았다. 정부는 우선 첨단 대규모 GPU를 신속히 확보, 구축, 운용할 수 있는 클라우드 기업(CSP)을 선정애 GPU 구매를 추진한다. 공모로 선정된 CSP의 기존 데이터센터 상면 내에 확보된 GPU를 순차적으로 구축하게 된다. 이후 국가 AI컴퓨팅 센터 중심으로 순차 구축된 GPU를 활용하며, 국내 산학연과 국가적 프로젝트 지원 등에 전략적으로 배분할 방침이다. 유 장관은 “첨단 GPU 확보는 우리나라 AI 생태계 혁신의 시작”이라며 “민관이 협력해 연내 GPU 확보, 국내 AI 생태계 대상 GPU 지원에 총력을 기울이고 신속한 AI컴퓨팅 인프라 확충이 대한민국 AI 경쟁력 강화로 이어질 수 있도록 만전을 기하겠다”고 말다. 한편 정부는 GPU 구매와 구축에 협력할 CSP 공모에 나설 예정이다.

2025.05.13 15:38박수형

美 상원, 고성능 GPU에 위치 추적 기능 의무화 추진

미국 국회가 AI 처리를 위한 고성능 GPU와 프로세서, 서버 등 제품의 작동 위치를 추적할 수 있는 기술을 도입하기 위한 법안을 추진중이다. 톰 코튼(Tom Cotton) 아칸소 주 상원의원이 제출한 '칩 보안법'(Chip Security Act)은 고성능 반도체 수출이 제한된 중국, 테러 지원 국가인 북한이나 이란 등에 제품이 우회 수출되지 않도록 차단하는 것을 목적으로 했다. AI 처리를 위한 고성능 프로세서와 GPU, 이를 탑재한 서버가 대상이며 군사 목적으로 쓰일 수 있는 일반 전자제품도 대상으로 했다. 엔비디아 지포스 RTX 4090 등 PC용 그래픽카드 역시 규제 대상이다. 이 법안에 따르면 미국 상무부가 수출을 제한하는 고성능 프로세서나 그래픽카드, GPU에 실시간으로 작동하는 위치를 추적할 수 있는 기술을 내장해야 한다. 제품을 수출한 업체는 작동 위치를 추적할 의무를 지며 상무부 장관은 이를 추적할 권한을 지닌다. 법안이 통과되면 미국 상무부와 국방부가 공동으로 1년간 연구를 수행해 필요한 기술을 제품에 탑재하게 된다. 또 법 시행 후 3년간 매년 평가를 실시해 위치 추적에 필요한 최신 보안 기술을 검토해야 한다. 이 법이 시행되면 엔비디아와 AMD, 인텔 등 각종 기업에 추가 부담이 필요하다. 또 작동 위치 추적에 필요한 정보를 전송하는 과정에서 사생활 관련 논란이 있을 것으로 예상된다.

2025.05.13 10:07권봉석

"지포스 RTX와 쿠다로 무장"…엔비디아 'LM 스튜디오' 성능 폭발

엔비디아가 지포스 그래픽처리장치(GPU)와 쿠다를 기반으로 자체 로컬 거대언어모델(LLM) 실행 도구의 성능을 대폭 강화했다. 로딩·응답 속도 향상과 더불어 개발자 제어 기능을 확장해 로컬 AI 활용 생태계를 본격적으로 견인하는 전략이다. 엔비디아는 최근 'LM 스튜디오' 0.3.15 버전을 발표했다고 12일 밝혔다. 이번 버전은 지포스 '레이 트레이싱 익스피리언스(RTX)' GPU 환경에서 성능을 최대 27%까지 끌어올릴 수 있게 '쿠다' 그래프와 플래시 어텐션 최적화를 적용했다. 지포스 'RTX 20' 시리즈부터 최신 블랙웰 GPU까지 폭넓은 하드웨어 호환성도 확보했다. 'LM 스튜디오'는 고성능 추론과 데이터 보안을 동시에 확보할 수 있는 로컬 LLM 실행 도구다. '라마.cpp(llama.cpp)' 기반 런타임을 바탕으로 오프라인에서도 모델 실행이 가능하고 오픈AI 응용 프로그램 인터페이스(API) 호환 엔드포인트로도 작동해 맞춤형 워크플로우에 쉽게 통합된다. 새 버전은 '툴_초이스(tool_choice)' 패러미터를 도입해 도구 호출 방식에 대한 세밀한 제어를 제공한다. 외부 도구 연동 여부를 개발자가 지정하거나 모델이 동적으로 결정하게 할 수 있어 검색 증강 생성(RAG), 에이전트 파이프라인 등에 최적화된 구조를 제공한다. 시스템 프롬프트 편집기도 새롭게 설계돼 복잡하거나 장문 프롬프트에 대한 대응력이 향상됐다. 프리셋 기반의 다양한 모델과 양자화 방식도 지원되며 '젬마', '라마3', '미스트랄', '오르카' 등 주요 오픈소스 모델이 모두 포함됐다. 이같은 구조는 '옵시디언'과 같은 노트 기반 앱에 플러그인 형태로 연결돼 텍스트 생성, 연구 요약, 노트 검색을 클라우드 없이 수행할 수 있게 한다. 이 모든 과정은 'LM 스튜디오' 내의 로컬 서버를 통해 이뤄져 빠르고 프라이버시 중심의 상호작용이 가능하다. 성능 개선의 핵심은 '라마.cpp' 백엔드에 적용된 쿠다 그래프와 플래시 어텐션이다. 쿠다 그래프는 컴퓨팅처리장치(CPU) 호출 횟수를 줄여 모델 처리량을 최대 35%까지 높였다. 플래시 어텐션은 메모리 부담 없이 긴 컨텍스트 대응 능력을 강화하며 최대 15% 속도 향상을 이끌었다. RTX GPU 사용자라면 별도 설정 없이도 '쿠다 12.8' 기반의 성능 향상을 경험할 수 있다. 드라이버 호환 시 자동 업그레이드가 적용되며 얇은 노트북부터 고성능 워크스테이션까지 전 범위 RTX 인공지능(AI) PC에서 효율적인 추론이 가능하다. 'LM 스튜디오'는 윈도우, 맥OS, 리눅스에서 모두 실행 가능하며 무료로 다운로드해 사용할 수 있다. 데스크톱 채팅, 오픈AI API 개발자 모드 등 다양한 인터페이스도 제공된다. 엔비디아 측은 "'LM 스튜디오' 최신 업데이트는 RTX AI PC에서 최고의 성능과 유연성을 제공한다"며 "로컬 LLM 도입 장벽을 낮추고 사용자의 AI 실험과 배포를 적극 지원할 것"이라고 밝혔다.

2025.05.12 15:33조이환

인텔, 워크스테이션용 '아크 프로' 2세대 GPU 공개 임박

인텔이 워크스테이션용 '아크 프로' 2세대 GPU를 이르면 이달 하순 진행되는 '컴퓨텍스 타이베이 2025' 기간 중 공개 예정이다. 2023년 '아크 프로 A60' 출시 이후 약 2년만이다. 인텔은 연산 성능과 전력 효율, AI 처리를 최적화한 Xe2 아키텍처 기반 아크 2세대 GPU(배틀메이지)를 지금까지 데스크톱PC용 B570/B580 그래픽카드와 노트북용 코어 울트라 200V(루나레이크) 내 GPU 타일에만 공급했다. 아크 프로 2세대 GPU는 기존 데스크톱PC용으로 출시된 아크 B580(BMG-G21)을 기반으로 최대 24GB 메모리를 탑재해 AI 처리를 강화할 것으로 보인다. 초급 AI 개발자나 보급형 워크스테이션 탑재가 예상된다. 지난 해 9월부터 노트북·데스크톱용 제품 출시 인텔 아크 2세대 GPU는 연산 성능을 개선한 Xe2 코어로 구성됐다. 전세대 Xe 코어 대비 전력 효율과 AI 처리 성능 향상에 중점을 뒀다. AI 연산에 필요한 XMX(Xe 행렬 확장) 엔진이 추가됐고 INT2, INT4, INT8, FP16, BF16 등 AI 연산이 요구하는 자료형을 폭넓게 지원한다. Xe2 코어를 적용한 GPU는 코어 울트라 200V(루나레이크) 프로세서에 내장된 아크 130V/140V GPU, 데스크톱PC용으로 출시된 아크 B570/B580 등이 전부다. 노트북용 코어 울트라 200H(애로우레이크)에는 아크 1세대 GPU에 XMX를 더한 제품이 탑재됐다. 반면 일반 소비자용 제품과 달리 Xe2 아키텍처를 적용한 워크스테이션용 GPU는 현재까지 출시되지 않았다. 티저 이미지로 아크 프로 2세대 GPU 공개 예고 인텔은 2022년 8월 모바일(노트북) 워크스테이션용 '아크 프로 A30M', 데스크톱PC용 '아크 프로 A40·A50'을 시작으로 2023년 '아크 프로 A60·A60M'까지 총 5종의 전문가·워크스테이션용 GPU를 출시했다. 그러나 인텔은 8일 공식 X(구 트위터) 계정에 '새 인텔 아크 프로 GPU가 기다리고 있다. 타이베이에서 만나자'며 아크 프로 GPU 탑재 그래픽카드로 추정되는 티저 이미지를 노출했다. AI·LLM 처리 위해 최대 24GB 메모리 탑재 전망 아크 프로 2세대 제품 관련 정보는 이미 지난 3월 말부터 포착되기 시작했다. 아크 B580의 다이(Die)에 부여된 모델명인 'BMG-G21' 관련 부품이 베트남으로 선적됐다는 사실이 드러난 바 있다. 전 세대 제품인 아크 프로 A60이 탑재 가능한 메모리는 최대 12GB다. 그러나 매개변수(패러미터)가 100억 개 이상인 거대언어모델(LLM) 용량은 8GB에서 10GB를 가볍게 넘어서며 이를 원활히 처리하려면 최소 16GB 이상이 필요하다. BMG-G21(B580)은 Xe2 코어 20개로 구성됐고 최대 24GB 메모리를 탑재할 수 있다. 곧 공개될 아크 프로 그래픽카드도 최대 24GB 메모리를 탑재해 의료 영상 분석, 8K 영상 편집 등 대용량 데이터 처리 최적화를 꾀할 것으로 보인다. 인텔, 이달 하순 타이베이서 브리핑 진행 단 아크 B580 GPU의 성능은 엔비디아 지포스 RTX 4060과 비슷하거나 조금 아래 수준인 것으로 평가된다. 이에 따라 고성능보다는 가격 대비 성능을 앞세워 보급형 워크스테이션이나 AI 개발자를 겨냥할 것으로 보인다. 관련 업계에 따르면 인텔은 이달 하순 컴퓨텍스 타이베이 2025 기간 중 각국 기자단을 대상으로 아크 프로 GPU 관련 브리핑을 진행할 예정이다. 구체적인 제품군(SKU)과 출시 일정도 해당 시점에 공개될 전망이다.

2025.05.09 16:22권봉석

"화웨이만 키워줄 것"…젠슨 황, 美 수출통제 '직격 비판'

엔비디아 젠슨 황 최고경영자(CEO)가 미국 정부의 대중국 반도체 수출 통제가 자국 기업에 심각한 타격을 줄 수 있다고 경고했다. 중국 인공지능(AI) 칩 시장이 향후 수년 내 수백억 달러 규모로 성장할 것으로 전망되는 가운데 미국 기업이 이 기회를 놓치면 산업 경쟁력 전반에 부정적 영향을 줄 수 있다는 판단이다. 8일 CNBC 등 외신에 따르면 황 CEO는 지난달 30일 중국이 AI 칩 수요 측면에서 거대한 시장이라며 미국 기업이 접근하지 못할 경우 "막대한 손실"이 예상된다고 밝혔다. 인터뷰는 이날 워싱턴 D.C.에서 열린 '힐 앤 밸리 포럼' 직후 진행됐다. 엔비디아는 앞서 미국 정부의 수출 규제로 인해 55억 달러(한화 약 7조7천억원) 규모의 매출 손실을 입었다고 밝힌 바 있다. 이번 제재는 엔비디아가 중국용으로 설계한 'H20' 칩에도 적용돼 판매에 필요한 별도 허가를 요구하고 있다. 황 CEO는 중국 시장을 '핵심'으로 규정하며 AI 칩 접근 제한이 미국 내 일자리 창출 기회까지 제한할 수 있다고 우려했다. 그는 중국과의 기술 경쟁에서 화웨이와 같은 토종 기업들이 부상할 가능성도 경고했다. 중국 정부는 최근 수년간 반도체 자립을 위해 수십억 달러를 투입해 왔다. 화웨이는 AI 칩 공급망을 자체 구축하는 전략의 일환으로 최신 '어센드' 시리즈 칩을 개발 중이다. 이는 미국산 그래픽처리장치(GPU)에 대한 의존도를 낮추기 위한 행보다. 또 미국의 제재가 지속되면 화웨이를 비롯한 로컬 경쟁자들이 오히려 유리해질 수 있다는 분석도 제기된다. 이는 장기적으로 미국 반도체 기업의 글로벌 입지에 악영향을 줄 수 있다. 이 같은 상황에서 AMD 역시 15억 달러(한화 약 2조1천억원) 매출 감소를 발표하며 대중국 수출 통제가 업계 전반에 미치는 영향이 확산되고 있다. 특히 AI 응용에 필수적인 GPU를 생산하는 기업들이 직접적인 타격을 입는 중이다. 미국 워싱턴의 정부 산하 씽크탱크인 전략국제문제연구소(CSIS)는 지난 3월 보고서를 통해 "중국이 AI 기술 격차를 상당 부분 좁혔다"며 "미국이 기술 우위를 2년 이상 유지하는 것이 비현실적으로 보이는 상황"이라고 평가했다.

2025.05.08 15:02조이환

  Prev 1 2 3 4 5 6 7 8 9 10 Next  

지금 뜨는 기사

이시각 헤드라인

트럼프 "캐나다와 무역협상 중단"…디지털세 문제 삼아

삼성 파운드리 '2세대 2나노' 공정 본격화...외부 고객사 확보 첫 발

우주에서 신발 만든다…어떤 깜짝 혁신 나올까

내란 특검, 윤석열 대면조사 시작...체포 방해, 비화폰 삭제 지시 대상

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.