검색 - IT세상을 바꾸는 힘 지디넷코리아

ZDNet 검색 페이지

'쿠다'통합검색 결과 입니다. (8건)

태그
기간
- 3개월
- 1년
- 1년 이전

재검색

엔비디아 "한국 반도체 업체와 피지컬 AI 협력 지속"

"한국은 삼성전자, SK하이닉스, 현대차그룹, LG전자 등 세계적 제조기업을 보유한 전략적 거점이다. 엔비디아가 추진하는 디지털 트윈과 피지컬 AI 기반 협력을 주도하는 전초기지 역햘을 수행하고 있다." 11일 서울 코엑스에서 열린 '세미콘 코리아 2026' 기조연설에서 정소영 엔비디아코리아 대표가 이렇게 설명했다. 이날 엔비디아는 반도체 설계부터 제조까지 산업 전반에 걸친 단계에서 생산성과 효율을 강화할 수 있는 AI 모델과 디지털 트윈 기술을 소개했다. 또 반도체 생태계를 넘어 산업 전반의 혁신 기업으로 역할을 확대해 나가겠다는 비전을 제시했다. 제품 대신 지능 생산하는 'AI 팩토리' 대두 이날 정소영 대표는 AI 시대 산업 패러다임의 전환이 'AI 팩토리'와 '피지컬 AI' 등 두 축을 중심으로 일어나고 있다고 설명했다. 정 대표는 "전통적인 공장은 사람과 자원을 투입해 제품을 생산한 반면 AI 시대의 공장은 데이터와 전기를 투입해 지능(인텔리전스)를 생산하는 공간"이라고 정의했다. 이어 "AI 팩토리에서 생성된 인텔리전스가 반도체·제조·자동차·통신 등 다양한 산업에 접목되며 실질적인 변화를 만들어내고 있다. 이미 글로벌 주요 산업 현장에서 AI 기반 혁신이 가속화되고 있다"고 덧붙였다. 그는 피지컬 AI에 대해 "이는 단순히 로봇을 움직이는 것이 아니라 현실 세계에 존재하는 다양한 물리적 개체(entity)에 지능을 결합해 우리 삶과 생산 현장 전반에 AI의 영향을 확장시키는 단계"라고 밝혔다. "엔비디아, AI 팩토리 구성 인프라 제공" 엔비디아는 2020년대 이후 AI 연산을 수행하는 GPU에 머무르던 것에서 벗어나 AI 처리 인프라를 제공하는 기업으로 포지션 변화를 시도하고 있다. 정소영 대표는 "AI 팩토리는 GPU를 시작으로 클라우드와 온프레미스 데이터센터, 그 위에서 구동되는 AI 모델과 고부가가치 소프트웨어·서비스로 구성된다. 엔비디아는 이런 가속 컴퓨팅 기반을 산업 전반에 제공하는 인프라 기업"이라고 말했다. 이어 "올 하반기 출시할 차세대 GPU 플랫폼 '베라 루빈'은 베라 CPU, 루빈 GPU와 네트워킹 칩, 스위치 등 6개 요소를 동시 개발하고 최적화하며 AI 플랫폼을 구현중"이라고 덧붙였다. "CPU 대신 GPU 활용해 소요시간 단축" 엔비디아는 CPU 대신 GPU를 활용하는 쿠다(CUDA)-X 라이브러리로 고성능·장시간 연산이 필요한 산업계 과제의 소요 시간 단축을 제공하고 있다. 2023년 엔비디아가 개발한 소프트웨어 라이브러리인 cu리소(cuLitho)는 반도체 식각 공정에 쓰이는 포토마스크 설계 시간을 크게 단축한다. 기존 CPU로 2주 이상 걸리던 연산 시간을 하루 내외로 줄였다. 정소영 대표는 "주요 반도체 소자를 시뮬레이션하는 TCAD, 리소그래피, 전자설계자동화(EDA) 등 반도체 전 분야에 AI 기반 모델이 적용된다. 삼성전자·SK하이닉스 등 국내 주요 업체도 설계 시간 단축, 시뮬레이션 고도화 등을 추진중"이라고 밝혔다. 시뮬레이션 플랫폼 '옴니버스', 반도체 생산 자동화 가속 엔비디아는 현실 세계 물리 법칙과 환경을 시뮬레이션 할 수 있는 플랫폼 '옴니버스'를 피지컬 AI 구현에 활용하고 있다. 자율주행차와 휴머노이드 로봇, 자율이동로봇(AMR) 등 다양한 장비 개발 소요 시간을 단축하고 정밀도를 높일 수 있다. 정소영 대표는 옴니버스 활용 사례로 "어플라이드 머티어리얼즈(AMAT)와는 디지털 트윈 기반 생산 공정 제어에 협력하고 있고 램리서치 및 LG디스플레이 등과도 협업을 확대하고 있다"고 설명했다. 정 대표는 "반도체 산업은 축적된 방대한 부품·공정 데이터를 보유하고 있어 AI 에이전트를 통한 자동화와 EDA 가속화에 유리하다. 실제로 아드반테스트와 AI 에이전트를 활용한 제품 테스트 자동화도 공동 개발 중"이라고 밝혔다.

2026.02.11 15:41권봉석 기자

[유미's 픽] '넥스트 쿠다' 신호탄 쏜 엔비디아, CES서 꺼낸 新무기 뭐길래

글로벌 빅테크들이 자체 칩과 플랫폼을 중심으로 독자 생태계 구축에 본격 나선 가운데 엔비디아가 이에 대응해 새로운 카드를 꺼내 들었다. 그래픽처리장치(GPU) 연산 표준을 '쿠다(CUDA)'로 장악해 왔던 기존 폐쇄형 생태계에서 일부 협력 중심 구조로 전략을 조정하며 AI 시장 주도권을 유지하려는 분위기다.젠슨 황 엔비디아 최고경영자(CEO)는 5일(현지시간) 미국 네바다주 라스베이거스에서 열린 세계 최대 가전·IT 전시회 'CES 2026'에 참석해 '알파마요'를 공개했다. 알파마요는 엔비디아가 공개한 차세대 자율주행 AI 제품군으로, 카메라·센서의 입력을 받아 사람처럼 전체 상황을 이해하고 운전 결정을 내린다. 이른바 AI가 직접 판단해 주행하는 '자율주행 두뇌'인 셈이다.엔비디아가 '알파마요'를 선보인 것은 자율주행 기술 고도화와 동시에 엔비디아 생태계의 외연을 확장하려는 시도로 풀이된다. 단순한 성능 경쟁을 넘어 자율주행 AI의 구조 자체를 재정의함으로써 산업 전반에 영향력을 유지하려는 의도가 깔려있다는 분석도 나온다.이처럼 엔비디아가 전략 변화 모색에 나선 것은 자율주행 기술이 직면한 구조적 한계가 자리하고 있다는 분석이 나온다. 최근 센서 성능 향상이나 데이터 축적만으로는 안전성을 충분히 담보하기 어렵다는 인식이 확산되면서 자율주행 AI의 판단 방식 자체를 바꿔야 한다는 요구도 커지고 있다.특히 '롱테일(long-tail)'은 자율주행 기술의 가장 큰 난제로 꼽힌다. 실제 도로 환경에서 발생 빈도는 낮지만 사고 위험이 큰 복잡한 상황이 반복적으로 나타났는데, 이는 자율주행 시스템이 안전하게 대응하기 가장 어려운 영역으로 꼽혀 왔다.기존 자율주행 아키텍처는 인식(perception)과 계획(planning)을 분리해 처리했다. 최근에는 엔드투엔드 학습 방식을 도입해 왔지만, 훈련 범위를 벗어난 상황에서 원인과 결과를 안정적으로 판단하는 데에는 한계가 있다는 지적이 이어졌다.엔비디아는 이러한 한계를 해결하기 위한 해법으로 '추론 기반(reasoning-based)' 아키텍처를 전면에 내세웠다. 알파마요는 자율주행 AI가 도로 상황을 단순히 인식하는 수준을 넘어 인간처럼 상황을 해석하고 단계적으로 사고한 뒤 행동을 결정하도록 설계됐다. 시각 정보와 언어, 행동을 하나의 흐름으로 통합한 비전·언어·행동(Vision Language Action, VLA) 구조를 적용해 새로운 상황이나 매우 드문 상황에서도 판단 과정을 단계별로 추론하고 그 근거를 설명할 수 있도록 했다.다만 엔비디아는 알파마요를 차량에 직접 탑재되는 완성형 소프트웨어로 제시하지 않았다는 점에서 주목된다. 대신 완전 자율주행 스택을 개발하는 과정에서 활용할 수 있는 기반 모델로 공개하고, 각 기업과 연구기관이 이를 파인튜닝하고 경량화해 자체 시스템에 통합하도록 유도했다. 이는 엔비디아가 자율주행 소프트웨어를 직접 통제하기보다 AI의 사고·판단 구조에 대한 기준을 제시하는 역할에 무게를 두고 있음을 보여준다. 이러한 전략은 실제 양산 차량 사례로도 이어졌다. 황 CEO는 CES 2026 기조연설에서 메르세데스 벤츠 CLA에 엔비디아의 자율주행 스택을 적용한 차량을 공개하며 올해부터 주요 지역에서 순차 출시될 예정이라고 밝혔다. 차량의 하드웨어와 완성차 개발은 메르세데스 벤츠가 맡고, 자율주행 AI와 컴퓨팅 플랫폼은 엔비디아가 담당하는 역할 분담 구조다. 이 차량에는 알파마요 계열의 추론 기술이 포함된 엔비디아 자율주행 스택과 규제·안전 검증을 위한 '클래식 AV 스택'이 함께 적용됐다. 두 스택은 각각 독립적으로 작동하면서 상호 감시하는 이중 안전 구조를 이룬다. 이는 엔비디아가 알파마요를 단독 완성형 제품으로 판매하기보다, 파트너와 결합해 확장 가능한 자율주행 플랫폼으로 발전시키고 있음을 보여주는 사례로 평가된다. 이 같은 접근은 엔비디아를 둘러싼 경쟁 환경 변화와도 맞물려 있다. 구글은 자체 개발한 주문형 반도체(ASIC)인 'TPU'를 통해 엔비디아 GPU 의존도를 낮추려 하고 있다. 아마존웹서비스(AWS) 역시 차세대 AI 가속기 '트레이니움(Trainium)'을 앞세워 독자 생태계 구축에 속도를 내고 있다. 이처럼 주요 고객사들이 자체 칩과 플랫폼으로 독립을 시도하는 상황에서 엔비디아 역시 기존의 강한 하드웨어 중심 락인 전략에서 벗어나 협력과 개방을 병행하는 방향으로 전략을 조정하고 있다는 평가가 나온다. 업계에선 이러한 맥락에서 알파마요를 쿠다를 대체하는 또 하나의 플랫폼으로 보기보다 쿠다 위에서 작동하는 AI 사고·판단 계층을 확장하려는 '포스트 쿠다 전략'의 일환으로 해석하고 있다. 하드웨어 연산 표준에 더해 AI가 현실 세계를 어떻게 이해하고 판단해야 하는지에 대한 기준을 제시함으로써 장기적인 영향력을 유지하려는 접근이라는 분석이다. 나아가 이러한 추론 기반 아키텍처는 자율주행을 넘어 로보틱스와 산업 자동화 등 다른 피지컬 AI 영역으로 확장될 가능성도 거론된다. 국내에서도 비슷한 평가가 나온다. 박태웅 국가AI전략위원회 공공 AX 분과장은 알파마요 공개와 관련해 자율주행의 롱테일 문제를 해결하려는 시도가 단순한 기술 개선을 넘어 AI가 현실 세계를 이해하고 이유를 설명하며 행동하는 '피지컬 AI'로 진입하는 전환점이라는 취지로 평가했다. 이는 알파마요가 자율주행 기술을 넘어 물리적 환경에서 작동하는 AI 전반으로 확장될 수 있다는 업계의 시각과 맞닿아 있다.업계 관계자는 "알파마요는 엔비디아가 모델 성능 경쟁이나 API 판매에 직접 뛰어들기보다 AI가 어떻게 사고하고 판단해야 하는지에 대한 레퍼런스를 제시하는 위치를 선택했음을 보여준 것"이라며 "쿠다가 '어떻게 계산할 것인가'의 표준이었다면 알파마요는 '어떻게 판단할 것인가'의 기준을 겨냥한 시도로, 엔비디아가 AI 주도권 경쟁의 다음 국면을 준비하고 있다는 신호"라고 말했다. 또 다른 관계자는 "알파마요는 엔비디아가 단기적인 모델 경쟁보다 AI 아키텍처와 사고 구조를 둘러싼 장기 전략에 무게를 두고 있음을 보여준다"며 "하드웨어 중심 생태계에 더해 소프트웨어와 판단 구조까지 영향력을 확장하려는 시도로 볼 수 있다"고 분석했다.

2026.01.06 18:04장유미 기자

[SW키트] 구글, '파이토치·TPU' 길 연다…엔비디아 '쿠다' 장벽 깨지나

밀키트는 손질된 식재료와 양념을 알맞게 담은 간편식입니다. 누구나 밀키트만 있으면 별도 과정 없이 편리하게 맛있는 식사를 할 수 있습니다. [SW키트]도 마찬가지입니다. 누구나 매일 쏟아지는 소프트웨어(SW) 기사를 [SW키트]로 한눈에 볼 수 있습니다. SW 분야에서 가장 주목받는 인공지능(AI), 보안, 클라우드 관련 이야기를 이해하기 쉽고 맛있게 보도하겠습니다. [편집자주] 구글·메타가 인공지능(AI) 개발자 표준 도구인 '파이토치'를 구글클라우드의 텐서처리장치(TPU)에서도 원활히 구동할 수 있도록 만드는 전략을 추진하면서, 엔비디아의 그래픽처리장치(GPU)·쿠다(CUDA) 중심 구조가 흔들릴 수 있다는 전망이 나오고 있다. 18일 외신에 따르면 구글클라우드는 메타와 협력해 파이토치를 구글 TPU에서 실행할 수 있는 기술 개발에 착수한 것으로 전해졌다. 업계는 엔비디아 GPU 인프라에 묶여 있던 AI 개발 생태계를 보다 개방형으로 전환하고, 동시에 구글클라우드의 자체 칩 활용도를 높이기 위한 전략적 행보로 해석하고 있다. 파이토치는 AI 모델 개발과 학습에 사용되는 소프트웨어(SW) 도구다. 전 세계 AI 개발자들 사이에서 사실상 표준 도구로 자리 잡았으며, AI 연구와 서비스 개발 현장에서 가장 널리 활용되는 프레임워크로 평가받고 있다. 그동안 파이토치는 GPU 환경에서 최고 성능을 내도록 최적화됐다. 특히 GPU 연산 과정에서 엔비디아의 병렬 컴퓨팅 플랫폼인 '쿠다'를 거치는 구조가 고착되면서, 업계에서는 자연스럽게 '파이토치·엔비디아'라는 공식이 형성됐다. 개발자 입장에서도 파이토치와 쿠다를 함께 사용하는 것이 가장 쉽고 빠른 선택지였기 때문이다. 이 과정에서 엔비디아는 GPU 하드웨어(HW)와 쿠다 소프트웨어(SW)를 결합한 강력한 생태계를 구축할 수 있었다. 쿠다는 GPU의 성능을 AI 연산에 활용할 수 있도록 돕는 SW로, AI 모델과 GPU를 연결해주는 일종의 다리 역할을 한다. 개발자가 파이토치로 만든 AI 모델을 GPU에서 실행하려면 쿠다를 반드시 거쳐야 하는 구조라서다. GPU가 AI 연산 시장에서 사실상 독점적 지위를 차지해온 만큼, 쿠다 생태계 역시 강한 락인(lock-in) 효과를 만들어 왔다. 반면 구글의 TPU는 파이토치와의 연결성이 상대적으로 떨어졌다. 파이토치 사용자가 TPU를 이용하려면 별도의 개발 도구를 익히거나 추가 설정과 작업을 거쳐야 했고, 이는 TPU 선택의 진입 장벽으로 작용해 왔다. 이번 구글·메타 협력은 단순히 TPU 활용 범위 확장보다는 파이토치 사용자가 TPU를 보다 쉽게 선택할 수 있는 환경을 만드는 데 초점이 맞춰졌다. 파이토치가 TPU에서도 자연스럽게 작동할 경우, 개발자들은 특정 GPU 생태계에 얽매이지 않고 비용, 전력 효율, 칩 공급 상황 등에 따라 인프라를 선택할 수 있다. 이에 엔비디아의 쿠다 중심 락인 효과도 점차 약화될 수 있다는 관측이 나온다. 업계에서는 단기간 내 엔비디아의 AI 인프라 지배력이 흔들리기는 어렵다는 시각이 우세하다. 국내 한 개발자는 "쿠다 중심으로 축적된 개발자 경험과 SW 자산, 방대한 라이브러리 생태계는 여전히 강력하다"며 "실질적인 변화가 나타나기까지는 앞으로 5~6년 이상의 시간이 필요할 것"이라고 내다봤다.

2025.12.19 13:46김미정 기자

"엔비디아 종속 벗어나자"…구글-메타, TPU 활용 범위 확장

구글이 인공지능(AI) 인프라 시장을 장악한 엔비디아에 대응하기 위해 메타와 협력한다. 18일 로이터통신에 따르면 구글클라우드는 메타 손잡고 AI 개발 도구 '파이토치'를 텐서처리장치(TPU)에서 구동할 수 있는 기술 개발에 착수한 것으로 전해졌다. 그동안 엔비디아 인프라에 묶인 생태계를 개방형으로 전환해 구글클라우드 독자 칩인 TPU 활용도를 끌어올리기 위한 전략이다. 파이토치는 AI 모델 구축에 필수적인 프로그래밍 도구다. 전 세계 개발자들 사이에서 사실상 표준으로 자리 잡았으나 그간 엔비디아 인프라에서만 가장 높은 성능을 발휘해 왔다. 이로 인해 개발자들이 구글클라우드의 TPU를 사용하려면 새로운 도구 습득에 따른 비용과 시간을 감수해야 했고 이는 구글클라우드 칩 생태계 확장의 고질적인 걸림돌로 작용했다. 구글클라우드는 이런 기술적 장벽을 허물기 위해 내부 프로젝트인 '토치TPU'를 가동하고 파이토치와 인프라 연동성을 올리는 데 집중하고 있다. 프로젝트가 성과를 거두면 개발자들은 기존 SW 환경을 유지하면서 HW만 엔비디아에서 구글클라우드의 TPU로 손쉽게 교체할 수 있는 유연성을 확보하게 된다. 특히 이번 프로젝트에는 파이토치의 종가인 메타가 직접 참여해 구글클라우드와 공조 체계를 이룬 것으로 알려졌다. 양측은 최근 수십억 달러 규모의 TPU 공급 방안을 논의 중이며 메타는 이를 통해 초지능 AI 개발에 필요한 막대한 인프라 구축 비용을 절감할 수 있을 것으로 기대된다. 구글클라우드 대변인은 "개발자가 선택한 HW에 관계없이 필요한 유연성과 확장성을 제공하는 데 주력하고 있다"고 밝혔다.

2025.12.18 18:14김미정 기자

한국레노버, 엔비디아 GB10 탑재 '씽크스테이션 PGX' 출시

한국레노버가 27일 엔비디아 GB10 기반 워크스테이션 '씽크스테이션 PGX'를 출시했다. 씽크스테이션 PGX는 블랙웰 아키텍처 기반 GPU 'GB10'과 Arm IP 기반 20코어 그레이스(Grace) CPU를 결합한 SoC, 128GB LPDDR5X 통합메모리를 탑재해 클라우드 서버 없이 각종 AI 작업을 수행할 수 있다. AI 연산 성능은 최대 1천 TOPS(1초당 1조 번 연산)이며 FP4(부동소수점 4비트) 기준 1페타플롭스 가량이다. 최대 2천억 개 매개변수(패러미터)로 구성된 AI 모델을 구동 가능하며 시스템 두 대를 연결해 성능을 높일 수 있다. 우분투 리눅스 기반 엔비디아 DGX OS 및 AI 소프트웨어 스택을 탑재해 AI 개발자가 데스크톱과 데이터센터 환경을 자유롭게 넘나들며 워크로드를 구현할 수 있다. NVMe SSD 용량은 1TB와 4TB 중 선택할 수 있다. 가격은 1TB 제품이 810만원, 4TB 제품이 890만원(레노버 직판가 기준).

2025.10.27 09:21권봉석 기자

"GPU는 많은데 쿠다는 하나"...AI 주권 위협하는 시스템 SW 종속

인공지능(AI) 시대 그래픽처리장치(GPU) 확보가 필수 요소로 떠오르면서 이를 실제 작동하게 하는 소프트웨어(SW) 생태계 구축이 핵심 경쟁력으로 부각되고 있다. 다만 국내를 비롯한 글로벌 AI 산업은 엔비디아의 병렬 컴퓨팅 플랫폼 '쿠다(CUDA)' 의존도가 높아 새로운 AI 가속기가 실효성을 갖기 어려운 구조라는 우려도 나온다. 1일 업계에 따르면 국내 주요 AI·클라우드 기업은 대부분 엔비디아 GPU 기반의 연산 인프라를 도입하고 있으며 모델 학습과 추론도 쿠다 기반 SW 스택 위에서 수행 중이다. 일부 기업이 AMD의 'ROCm'이나 국산 AI 반도체를 실증하고 있지만 생태계 호환성과 개발자 도구 부족으로 인해 상용 환경에서의 확장은 제한적인 것으로 알려졌다. 엔비디아는 자사 GPU용 병렬 컴퓨팅 플랫폼 쿠다를 통해 사실상 GPU 업계의 운영체제(OS) 역할을 수행하고 있다. AI 프레임워크 대부분이 쿠다 기반으로 최적화돼 있으며 '파이토치'나 '텐서플로우'와 같은 주요 AI 개발 도구도 쿠다 없이는 성능 구현이 어렵다. 이에 전 세계 개발자 생태계가 자연스럽게 쿠다에 락인된 상태다. 클라우드 업계 관계자는 "GPU는 많지만 쿠다는 하나라는 말이 괜히 나온 게 아니다"라며 "AI 개발자에게 쿠다는 선택이 아닌 전제 조건"이라고 말했다. 국내 기업이 설계한 AI 반도체 역시 같은 문제에 봉착해 있다. 자체 하드웨어(HW)를 개발해도 아직 파이토치나 허깅페이스 등 주요 AI 프레임워크와 바로 연결되지 않아 코드가 없는 반도체라는 현실적 벽에 직면했다는 게 업계의 시각이다. ONNX 변환, 트라이톤 서버 호환 등을 통해 다양한 호환 경로를 모색 중이지만 쿠다 기반 환경 대비 모델 구동 속도나 디버깅 편의성이 크게 떨어진다는 지적이 나온다. 공공 AI 개발 사업도 비슷한 양상이다. 대부분의 사업 제안요청서(RFP)에서 쿠다 기반 모델 구현을 전제로 하고 있어 대체 생태계가 실질적으로 배제되고 있다는 목소리가 나온다. 이같은 종속 구조 속에서 글로벌 오픈소스 진영은 '탈(脫) 쿠다'를 위한 기술적 시도를 이어가고 있다. 인텔은 CPU·GPU·FPGA를 아우르는 병렬 컴퓨팅 플랫폼 '원API'를 통해 쿠다 대항마 생태계 구축에 나섰다. C++ 기반 병렬 언어인 SYCL도 산업계에서 점차 채택이 늘고 있다. 구글이 주도하는 MLIR, 오픈AI의 트라이톤도 쿠다 없이 GPU 커널을 작성할 수 있는 대안 기술로 주목받고 있다. 다만 이들 기술은 아직 파이토치나 텐서플로우와의 완전한 통합, 성능 최적화, 디버깅 기능에서 초기 단계에 머무르고 있어, 대규모 AI 모델을 효율적으로 돌리는 데에는 부족하다는 평가가 많다. 이 가운데 정부는 독자적인 AI 모델과 인프라 구축을 담은 '소버린 AI' 핵심 국가 전략으로 추진 중이다. 그러나 대규모 GPU 투자 대비 이를 운용·활용할 수 있는 범용 SW 스택에 대한 전략은 아직 미비하다는 평가다. 이에 정부는 최근 산학연과 함께 국산 시스템 SW 경쟁력 강화와 생태계 조성을 위한 인재 양성에 힘쓰고 있다. AI 업계 관계자는 "진정한 소버린 AI란 단순히 GPU를 국산화하거나 반도체만 확보하는 것이 아니라 그 위에서 AI를 개발하고 서비스로 연결할 수 있는 생태계 전체의 자립"이라며 "장기적으로 정부와 민간이 함께 쿠다에 대응할 수 있는 오픈소스 기반 범용 SW 생태계 육성 전략을 세워야 한다"고 강조했다.

2025.08.01 13:35한정호 기자

"지포스 RTX와 쿠다로 무장"…엔비디아 'LM 스튜디오' 성능 폭발

엔비디아가 지포스 그래픽처리장치(GPU)와 쿠다를 기반으로 자체 로컬 거대언어모델(LLM) 실행 도구의 성능을 대폭 강화했다. 로딩·응답 속도 향상과 더불어 개발자 제어 기능을 확장해 로컬 AI 활용 생태계를 본격적으로 견인하는 전략이다. 엔비디아는 최근 'LM 스튜디오' 0.3.15 버전을 발표했다고 12일 밝혔다. 이번 버전은 지포스 '레이 트레이싱 익스피리언스(RTX)' GPU 환경에서 성능을 최대 27%까지 끌어올릴 수 있게 '쿠다' 그래프와 플래시 어텐션 최적화를 적용했다. 지포스 'RTX 20' 시리즈부터 최신 블랙웰 GPU까지 폭넓은 하드웨어 호환성도 확보했다. 'LM 스튜디오'는 고성능 추론과 데이터 보안을 동시에 확보할 수 있는 로컬 LLM 실행 도구다. '라마.cpp(llama.cpp)' 기반 런타임을 바탕으로 오프라인에서도 모델 실행이 가능하고 오픈AI 응용 프로그램 인터페이스(API) 호환 엔드포인트로도 작동해 맞춤형 워크플로우에 쉽게 통합된다. 새 버전은 '툴_초이스(tool_choice)' 패러미터를 도입해 도구 호출 방식에 대한 세밀한 제어를 제공한다. 외부 도구 연동 여부를 개발자가 지정하거나 모델이 동적으로 결정하게 할 수 있어 검색 증강 생성(RAG), 에이전트 파이프라인 등에 최적화된 구조를 제공한다. 시스템 프롬프트 편집기도 새롭게 설계돼 복잡하거나 장문 프롬프트에 대한 대응력이 향상됐다. 프리셋 기반의 다양한 모델과 양자화 방식도 지원되며 '젬마', '라마3', '미스트랄', '오르카' 등 주요 오픈소스 모델이 모두 포함됐다. 이같은 구조는 '옵시디언'과 같은 노트 기반 앱에 플러그인 형태로 연결돼 텍스트 생성, 연구 요약, 노트 검색을 클라우드 없이 수행할 수 있게 한다. 이 모든 과정은 'LM 스튜디오' 내의 로컬 서버를 통해 이뤄져 빠르고 프라이버시 중심의 상호작용이 가능하다. 성능 개선의 핵심은 '라마.cpp' 백엔드에 적용된 쿠다 그래프와 플래시 어텐션이다. 쿠다 그래프는 컴퓨팅처리장치(CPU) 호출 횟수를 줄여 모델 처리량을 최대 35%까지 높였다. 플래시 어텐션은 메모리 부담 없이 긴 컨텍스트 대응 능력을 강화하며 최대 15% 속도 향상을 이끌었다. RTX GPU 사용자라면 별도 설정 없이도 '쿠다 12.8' 기반의 성능 향상을 경험할 수 있다. 드라이버 호환 시 자동 업그레이드가 적용되며 얇은 노트북부터 고성능 워크스테이션까지 전 범위 RTX 인공지능(AI) PC에서 효율적인 추론이 가능하다. 'LM 스튜디오'는 윈도우, 맥OS, 리눅스에서 모두 실행 가능하며 무료로 다운로드해 사용할 수 있다. 데스크톱 채팅, 오픈AI API 개발자 모드 등 다양한 인터페이스도 제공된다. 엔비디아 측은 "'LM 스튜디오' 최신 업데이트는 RTX AI PC에서 최고의 성능과 유연성을 제공한다"며 "로컬 LLM 도입 장벽을 낮추고 사용자의 AI 실험과 배포를 적극 지원할 것"이라고 밝혔다.

2025.05.12 15:33조이환 기자

한국판 엔비디아 '쿠다' 마련한다…과기정통부, 시스템 SW 생태계 활성화 '박차'

과학기술정보통신부가 인공지능(AI)·반도체 등 첨단 산업의 핵심 기반인 시스템 소프트웨어(SW) 경쟁력을 강화하기 위해 앞장선다. 과기정통부는 25일 국내 시스템 SW의 경쟁력 강화와 생태계 활성화를 위한 정책 방향을 모색하고자 '시스템 SW 경쟁력 강화를 위한 전문가 간담회'를 개최했다. 이번 간담회는 유상임 과기정통부 장관을 비롯한 국내 주력 산업 분야 기업, 시스템 SW 전문 기업과 학계·연구기관 관계자들이 참석해 산업 현장의 목소리를 공유하고 실효성 있는 정책 지원 방안을 논의했다. 먼저 건국대 김두현 교수가 시스템 SW 중요성 및 우수사례에 대해 발제하고 정보통신기획평가원 오윤제 PM이 K-클라우드 사업 추진 계획에 따른 AI 반도체 시스템 SW 추진 전략을 발표했다. 이어진 자유토론에서는 ▲시스템 SW 인력 양성 관련 지원 확대 ▲국산 고신뢰 시스템 SW 중요성 ▲SW 정의(SDx)를 통한 주력 산업의 혁신을 위한 지원 강화 ▲국산 시스템 SW 생태계 조성을 위한 중장기적 지원 등 국내 시스템 SW 경쟁력 강화를 위한 심도 있는 논의가 진행됐다. 참석자들은 산업과 교육 현장의 직접 겪은 경험을 바탕으로 시스템 SW 기업이 겪고 있는 전문 인재 확보의 어려움과 산·학 공동연구 및 중‧장기적 지원을 통한 생태계 조성 추진 필요성 등을 제시했다. 과기정통부는 이번 간담회에서 제기된 산·학·연의 건의사항과 제안을 검토해 향후 정책 수립에 반영할 계획이다. 특히 새롭게 성장하는 분야의 튼튼한 기반 조성 및 주력 산업과 연계한 시스템 SW 육성을 위한 장기적 관점의 정책을 적극 추진해 나간다는 방침이다. 유상임 장관은 "시스템 SW는 반도체·AI·로봇 등 첨단 기술의 핵심 기반으로, 국가 디지털 경쟁력 확보를 위한 전략 산업"이라며, "엔비디아는 '쿠다(Cuda)'라는 시스템 SW 플랫폼을 통해 글로벌 시장을 장악했다"고 강조했다. 또 그는 "우리도 국내 SW 분야의 '어벤져스'를 만들어 글로벌 경쟁력을 확보하고 국내·외 시스템 SW 관련 인재를 양성하고 확보할 수 있도록 노력할 것"이라며 "민·관이 함께 힘을 모아 핵심 기술 자립과 글로벌 경쟁력 확보를 이뤄내야 한다"고 말했다.

2025.04.25 14:16한정호 기자

Prev 1 Next

ZDNet 검색 페이지

'쿠다'통합검색 결과 입니다. (8건)

엔비디아 "한국 반도체 업체와 피지컬 AI 협력 지속"

[유미's 픽] '넥스트 쿠다' 신호탄 쏜 엔비디아, CES서 꺼낸 新무기 뭐길래

[SW키트] 구글, '파이토치·TPU' 길 연다…엔비디아 '쿠다' 장벽 깨지나

"엔비디아 종속 벗어나자"…구글-메타, TPU 활용 범위 확장

한국레노버, 엔비디아 GB10 탑재 '씽크스테이션 PGX' 출시

"GPU는 많은데 쿠다는 하나"...AI 주권 위협하는 시스템 SW 종속

"지포스 RTX와 쿠다로 무장"…엔비디아 'LM 스튜디오' 성능 폭발

한국판 엔비디아 '쿠다' 마련한다…과기정통부, 시스템 SW 생태계 활성화 '박차'

지금 뜨는 기사

이시각 헤드라인

[AI는 지금] "인류 통제 벗어날 수도"…세계 석학들이 보낸 적색 경보

"또 실패는 없다"…구글이 AI 글래스 '킬러앱'에 카톡 찜한 이유

"피지컬 GPT, 한국이 선도할 수 있다"

저평가주 외인 매수세에...SK텔레콤 주가 고공행진

ZDNet Power Center