검색 - IT세상을 바꾸는 힘 지디넷코리아

ZDNet 검색 페이지

'반도체 SW'통합검색 결과 입니다. (6건)

태그
기간
- 3개월
- 1년
- 1년 이전

재검색

[유미's 픽] "엔비디아 쿠다 장벽 넘자"…AI 반도체, SW 경쟁 불붙었다

인공지능(AI) 반도체 기업들이 잇따라 모델 최적화 소프트웨어 역량 확보에 나서고 있다. 칩 설계만으로는 AI 인프라 경쟁에서 우위를 점하기 어려워지면서 한정된 컴퓨팅·메모리 자원으로 더 많은 연산을 처리하는 소프트웨어 기술의 가치가 부각되는 분위기다. 퀄컴은 지난달 24일 AI 소프트웨어 기업 모듈러를 약 40억 달러 규모 주식 거래로 인수하겠다고 발표했다. 모듈러는 AI 모델을 다양한 칩에서 실행할 수 있도록 돕는 소프트웨어 기업이다. 로이터는 이번 인수가 퀄컴을 엔비디아 '쿠다(CUDA)'와 경쟁하는 소프트웨어 플랫폼 경쟁에 올려놓는 움직임이라고 평가했다. 국내에서도 비슷한 흐름이 나타났다. AI 반도체 기업 리벨리온은 지난달 30일 AI 추론 최적화 기업 스퀴즈비츠 인수를 발표했다. 스퀴즈비츠는 대형 AI 모델을 더 적은 연산·메모리 자원으로 구동하기 위한 모델 압축과 양자화, 추론 최적화 기술을 보유한 기업이다. 리벨리온은 이번 인수를 통해 신경망처리장치(NPU) 하드웨어와 소프트웨어 최적화, 추론 서빙을 함께 제공하는 통합 AI 인프라 기업으로 사업 범위를 넓힌다는 계획이다. 업계 관계자는 "AI 반도체 기업 입장에선 자체 칩 위에서 고객 모델을 빠르고 안정적으로 실행시키는 역량이 영업 경쟁력과 직결된다"며 "칩을 공급하는 데 그치지 않고 실제 워크로드 성능까지 입증해야 하는 수요가 커진 셈"이라고 설명했다.AI 모델 최적화 기업 노타도 같은 날 퓨리오사AI의 데이터센터용 NPU 환경에서 LG AI연구원의 엑사원 236B 최적화 결과를 공개해 주목받았다. 엑사원 236B는 약 2360억 개 파라미터 규모의 대형 AI 모델로, 노타는 모델 크기를 약 71% 줄이면서도 주요 평가 항목에서 원본과 유사한 수준의 정확도를 유지했다. 데이터센터 인프라 최적화 기업 망고부스트도 AI 실행 효율 경쟁의 한 축으로 꼽힌다. 망고부스트는 데이터처리장치(DPU)를 앞세워 네트워킹·스토리지·보안 등 데이터센터 인프라 작업을 중앙처리장치(CPU)에서 분리하는 기술을 개발해왔다. AI 모델 자체를 줄이는 방식은 아니지만 GPU와 서버 자원을 AI 연산에 더 집중시키는 구조라는 점에서 모델 최적화 기업들과 같은 수요를 겨냥하고 있다는 평가를 받는다. 이처럼 AI 반도체 시장에서 성능 최적화 소프트웨어 기업들이 주목받게 된 것은 생성형 AI 활용 방식이 달라지면서 모델 실행 능력이 더욱 중요해지고 있어서다. 대형언어모델(LLM)이 단순 실험 단계를 넘어 서비스와 업무 시스템에 적용되면서, 기업들은 칩의 이론 성능보다 실제 운영 환경에서 응답 속도와 처리량을 유지하면서 비용을 낮추는 역량을 더 중시하고 있다. 하지만 모델 규모가 커질수록 기업들의 비용 부담은 갈수록 늘어나는 추세다. 특히 LLM은 파라미터 규모가 클수록 추론 과정에서 많은 메모리와 연산 자원을 필요로 한다. 여기에 긴 문맥 처리, 검색증강생성(RAG), AI 에이전트처럼 반복 호출이 많은 서비스가 늘면서 데이터 이동량과 지연시간 관리 부담도 함께 증가하고 있다. 이로 인해 메모리 효율도 AI 인프라 경쟁의 핵심 변수로 떠오르고 있다. 고성능 메모리 확보 경쟁이 이어지고 있지만 모든 기업이 충분한 GPU와 메모리를 확보하기는 어렵다. 같은 하드웨어라도 모델 압축, 양자화, 컴파일러, 런타임, 추론 서빙 구조에 따라 필요한 서버 수와 운영비가 달라질 수 있어 최적화 소프트웨어의 중요성이 커지고 있다.엔비디아가 GPU 시장에서 구축한 소프트웨어 생태계도 반도체 기업들의 움직임을 자극하고 있다. 엔비디아는 GPU 성능뿐 아니라 쿠다를 중심으로 한 개발자 생태계와 소프트웨어 도구를 앞세워 AI 인프라 시장에서 우위를 확보했다. 이에 후발 AI 반도체 기업들은 하드웨어 성능만으로 고객을 설득하기 어려워졌고, 모델 실행과 개발 편의성을 함께 제시해야 하는 압박을 받고 있다. 국내 기업들도 이 같은 구도 변화에 맞춰 전략을 조정하고 있다. 리벨리온은 스퀴즈비츠 인수로 NPU와 최적화 소프트웨어 결합에 나섰고, 퓨리오사AI는 노타와 협력해 대형 모델의 NPU 구동 가능성을 넓히고 있다. 망고부스트는 DPU 기반 인프라 오프로딩으로 데이터센터 내부 병목을 줄이는 방식으로 AI 실행 효율 경쟁에 참여하고 있다. 업계에선 AI가 데이터센터를 넘어 산업 현장으로 확산될수록 최적화 수요가 더 커질 것으로 예상했다. 자동차, 로봇, 제조 설비 등은 전력과 지연시간, 보안 요건이 데이터센터와 다른 만큼, 범용 모델을 그대로 배포하기보다 각 산업과 칩 환경에 맞게 조정하는 역량이 AI 인프라 기업의 경쟁력이 될 것으로 보인다. 이 같은 분위기 속에 AI 반도체 시장이 하드웨어 공급 경쟁을 넘어 소프트웨어 스택 경쟁으로 재편될 가능성도 높아지고 있다. 특히 칩 설계, 모델 최적화, 런타임, 추론 서빙, 인프라 오프로딩을 촘촘하게 묶어 제공하는 기업이 고객 확보에서 유리한 위치를 차지할 것으로 전망된다. 업계 관계자는 "AI 반도체 기업이 고객을 설득하려면 벤치마크 수치뿐 아니라 실제 모델을 자사 칩에서 얼마나 효율적으로 돌릴 수 있는지를 제시해야 한다"며 "소프트웨어 최적화 역량이 없는 칩은 데이터센터와 산업 현장에서 채택 속도가 느릴 수밖에 없다"고 말했다. 그러면서 "AI 인프라 비용 부담이 커질수록 기업들은 같은 서버 자원으로 더 많은 추론을 처리할 수 있는 기술을 찾게 된다"며 "앞으로 AI 반도체 경쟁력은 칩 성능과 함께 모델 최적화, 메모리 효율, 데이터센터 운영 효율을 함께 제공할 수 있느냐에 따라 갈릴 것"이라고 덧붙였다.

2026.07.01 10:53장유미 기자

GIST, 55억원 상당 에머슨 'NI SW' 기증받아

광주과학기술원(GIST)은 글로벌 산업 자동화 기술 선도 기업 에머슨의 테스트 및 측정 사업부 NI(National Instruments)로부터 55억원 상당의 'NI 소프트웨어'를 기증받았다고 1일 밝혔다. 이 SW는 NI 아카데믹 볼륨 라이선스(AVL)로, 향후 2년간 무상으로 쓸 수 있다. AVL은 최대 1,000명이 동시에 사용할 수 있는 대규모 교육·연구용 소프트웨어 라이선스다. 반도체와 전자장비 성능을 측정·분석하고 자동화 테스트 시스템을 설계하는 등의 실습이 가능하다. 이 SW에는 ▲계측 제어와 데이터 수집을 위한 그래픽 개발 환경인 랩뷰 ▲자동화 테스트 관리 솔루션인 테스트스탠드 ▲테스트 데이터 운영 플랫폼인 시스템링크 등이 포함돼 있다. GIST는 이번에 확보한 SW를 바탕으로 AI 반도체 테스트·검증 분야 실무 교육을 강화할 계획이다. 또 산업 현장에서 활용되는 테스트 환경을 캠퍼스 내에 구현한다는 복안이다. 임기철 총장은 "차세대 AI 반도체 테스트 전문 인력 양성 체계 고도화에 가속이 붙을 것"이라며 "AI 반도체 설계 교육을 담당하는 'GIST-Arm 스쿨'과 함께 테스트·검증 교육을 수행하는 'GIST-NI 스쿨' 운영 기반이 될 것"으로 기대했다.

2026.06.01 18:18박희범 기자

오케스트로, 국산 AI 반도체 생태계 키운다…112억원 R&D 사업 수행

오케스트로가 국산 인공지능(AI) 반도체 기반 클라우드 소프트웨어(SW) 시장 확대에 나선다. 그래픽처리장치(GPU) 중심 AI 인프라 구조를 넘어 국산 신경망처리장치(NPU)·지능형 메모리 반도체(PIM) 생태계를 확대해 AI 인프라 자립도를 높인다는 목표다. 오케스트로는 과학기술정보통신부와 정보통신기획평가원(IITP)이 추진하는 'AI 반도체 특화 클라우드 네이티브 SW 스택 및 모델 허브 기술 개발' 과제 주관기관으로 선정됐다고 8일 밝혔다. 이번 사업은 총 112억 5000만원 규모 연구개발(R&D) 과제로, 오는 2029년까지 4년간 진행된다. 국산 NPU와 PIM 등 차세대 AI 가속기가 범용 클라우드 환경에서도 안정적으로 활용될 수 있도록 클라우드 기반 운영 체계를 구축하는 것이 핵심이다. 오케스트로는 이번 과제를 통해 AI 반도체 전용 클라우드 네이티브 SW 스택을 고도화할 계획이다. 주요 개발 항목은 ▲컨테이너 런타임 인터페이스(CRI) 호환 기술 ▲가속기 자원 직접 접근을 지원하는 패스스루 기술 ▲마이크로서비스 아키텍처(MSA) 프레임워크 등이다. 회사는 이를 통해 기존 GPU 중심 클라우드 인프라 한계를 극복하고 국산 NPU 기반 AI 가속기를 보다 유연하게 할당·운영할 수 있는 표준 운영 체계를 마련한다는 목표다. AI 모델 생태계 확장도 함께 추진한다. 오케스트로는 국산 AI 반도체 기반 학습·추론 모델을 손쉽게 등록·배포할 수 있는 'AI 모델 허브' 플랫폼도 구축할 예정이다. 모델 컨테이너화 자동화 기술과 메타데이터 관리 체계를 기반으로 운영되며 과제 종료 시점까지 1000개 이상의 최적화 모델 확보를 목표로 한다. 초거대언어모델(LLM) 실증 사례 확보에도 나선다. 국산 AI 반도체 기반 서비스 상용화 가능성을 검증해 국내 중소·벤처기업이 고가 외산 GPU 의존도를 낮추고 AI 서비스를 보다 빠르게 개발·출시할 수 있도록 지원한다는 계획이다. 이번 연구 성과는 정부가 추진 중인 'K-클라우드 프로젝트'와 국가 AI 컴퓨팅 인프라 구축 사업에도 연계 적용될 예정이다. 오케스트로는 커널 레벨 정밀 모니터링과 분산 추적 기술을 결합해 AI 워크로드 예측 정확도를 99% 수준까지 높이고 대규모 AI 서비스 운영 안정성을 검증할 방침이다. 김범재 오케스트로 대표는 "이번 과제는 국산 AI 반도체가 글로벌 시장에서 경쟁력을 확보하는 데 필요한 핵심 SW 기반을 마련하는 것"이라며 "하드웨어(HW)와 SW가 유기적으로 결합되는 AI 컴퓨팅 환경을 구현해 국내 AI 인프라 자립도를 높이고 국산 AI 반도체 생태계 확산에 기여하겠다"고 밝혔다.

2026.05.08 17:48한정호 기자

韓 NPU·코드 어시스턴트 결합…유라클-퓨리오사AI, AX 혁신 생태계 '시동'

유라클이 국내 AI 반도체 선도 기업이자 이재명 정부 첫 유니콘인 퓨리오사AI와 손잡고 국산 신경망처리장치(NPU)와 코드 어시스턴트 융합 생태계 활성화에 나선다. 개발 생산성 혁신과 산업 전반의 인공지능 전환(AX)을 함께 이끈다는 목표다. 유라클은 퓨리오사AI와 전략적 업무협약(MOU)을 체결하고 AI 기반 개발 생산성 혁신에 나선다고 3일 밝혔다. 양사는 이번 협약을 통해 퓨리오사AI의 고성능 NPU에 유라클이 개발한 아테나 코드 어시스턴트 솔루션을 탑재해 국내외 엔터프라이즈 시장을 공략할 계획이다. 구체적으로 퓨리오사AI의 2세대 NPU '레니게이드(RNGD)'로 아테나 코드 어시스턴트의 처리 속도와 에너지 효율을 획기적으로 개선할 계획이다. 이를 통해 전문 개발자가 아니더라도 일정 수준의 요구사항만으로 고품질 코드를 자동 생성할 수 있어 개발자 확보가 어려운 기업에서도 효율적인 소프트웨어(SW) 개발 및 유지보수가 가능할 전망이다. 또 어플라이언스 기반으로 제공되기에 민감한 데이터를 외부에 노출하지 않고도 안전하게 AI 코딩 기능을 활용할 수 있어 공공기관이나 보안이 중요한 금융·제조 분야에서도 안심하고 도입할 수 있도록 지원한다. 이번 협력은 국산 AI 반도체와 AI SW 기술을 결합해 AI 개발 생태계 자립 기반을 강화하는 행보로 평가된다. 단순 서비스 연계를 넘어 반도체와 코드 생성 기술의 통합형 모델을 제시하는 시도다. 양사의 AI 코드 어시스턴트 어플라이언스는 내년 초 출시를 목표로, 개발 현장의 생산성을 증대하는 솔루션을 제공한다는 목표다. 특히 기존에 AI 도입이 활발했던 금융·공공 분야 외에도 제조, IT 개발 조직, 게임 산업, SW 개발 기업 등 전 산업 영역으로 AI 코드 어시스턴트의 적용 범위를 대폭 확장할 방침이다. 아울러 국내뿐 아니라 중동·아시아 등 해외 시장 발굴·개척을 위한 사업 협력을 통해 양사 기술력을 글로벌 시장에 공동으로 전파하며 AX를 촉진할 계획이다. 백준호 퓨리오사AI 대표는 "코드 어시스턴트는 모든 산업군에서 생산성 향상을 위한 필수 솔루션으로 자리 잡고 있다"며 "큰 시장 기회가 있는 분야에서 유라클과의 협력을 통해 AX 이끌 것"이라고 밝혔다. 권태일 유라클 대표는 "퓨리오사AI와의 긴밀한 협력은 NPU 환경에 최적화된 코드 어시스턴트 어플라이언스를 제공해 개발 생산성 시장을 선도할 중요한 기반이 될 것"이라며 "양사의 혁신적인 기술 결합을 통해 국내외 기업의 디지털 전환을 가속화하고 AI 산업을 선도해 나가겠다"고 강조했다.

2025.11.03 15:51한정호 기자

"GPU는 많은데 쿠다는 하나"...AI 주권 위협하는 시스템 SW 종속

인공지능(AI) 시대 그래픽처리장치(GPU) 확보가 필수 요소로 떠오르면서 이를 실제 작동하게 하는 소프트웨어(SW) 생태계 구축이 핵심 경쟁력으로 부각되고 있다. 다만 국내를 비롯한 글로벌 AI 산업은 엔비디아의 병렬 컴퓨팅 플랫폼 '쿠다(CUDA)' 의존도가 높아 새로운 AI 가속기가 실효성을 갖기 어려운 구조라는 우려도 나온다. 1일 업계에 따르면 국내 주요 AI·클라우드 기업은 대부분 엔비디아 GPU 기반의 연산 인프라를 도입하고 있으며 모델 학습과 추론도 쿠다 기반 SW 스택 위에서 수행 중이다. 일부 기업이 AMD의 'ROCm'이나 국산 AI 반도체를 실증하고 있지만 생태계 호환성과 개발자 도구 부족으로 인해 상용 환경에서의 확장은 제한적인 것으로 알려졌다. 엔비디아는 자사 GPU용 병렬 컴퓨팅 플랫폼 쿠다를 통해 사실상 GPU 업계의 운영체제(OS) 역할을 수행하고 있다. AI 프레임워크 대부분이 쿠다 기반으로 최적화돼 있으며 '파이토치'나 '텐서플로우'와 같은 주요 AI 개발 도구도 쿠다 없이는 성능 구현이 어렵다. 이에 전 세계 개발자 생태계가 자연스럽게 쿠다에 락인된 상태다. 클라우드 업계 관계자는 "GPU는 많지만 쿠다는 하나라는 말이 괜히 나온 게 아니다"라며 "AI 개발자에게 쿠다는 선택이 아닌 전제 조건"이라고 말했다. 국내 기업이 설계한 AI 반도체 역시 같은 문제에 봉착해 있다. 자체 하드웨어(HW)를 개발해도 아직 파이토치나 허깅페이스 등 주요 AI 프레임워크와 바로 연결되지 않아 코드가 없는 반도체라는 현실적 벽에 직면했다는 게 업계의 시각이다. ONNX 변환, 트라이톤 서버 호환 등을 통해 다양한 호환 경로를 모색 중이지만 쿠다 기반 환경 대비 모델 구동 속도나 디버깅 편의성이 크게 떨어진다는 지적이 나온다. 공공 AI 개발 사업도 비슷한 양상이다. 대부분의 사업 제안요청서(RFP)에서 쿠다 기반 모델 구현을 전제로 하고 있어 대체 생태계가 실질적으로 배제되고 있다는 목소리가 나온다. 이같은 종속 구조 속에서 글로벌 오픈소스 진영은 '탈(脫) 쿠다'를 위한 기술적 시도를 이어가고 있다. 인텔은 CPU·GPU·FPGA를 아우르는 병렬 컴퓨팅 플랫폼 '원API'를 통해 쿠다 대항마 생태계 구축에 나섰다. C++ 기반 병렬 언어인 SYCL도 산업계에서 점차 채택이 늘고 있다. 구글이 주도하는 MLIR, 오픈AI의 트라이톤도 쿠다 없이 GPU 커널을 작성할 수 있는 대안 기술로 주목받고 있다. 다만 이들 기술은 아직 파이토치나 텐서플로우와의 완전한 통합, 성능 최적화, 디버깅 기능에서 초기 단계에 머무르고 있어, 대규모 AI 모델을 효율적으로 돌리는 데에는 부족하다는 평가가 많다. 이 가운데 정부는 독자적인 AI 모델과 인프라 구축을 담은 '소버린 AI' 핵심 국가 전략으로 추진 중이다. 그러나 대규모 GPU 투자 대비 이를 운용·활용할 수 있는 범용 SW 스택에 대한 전략은 아직 미비하다는 평가다. 이에 정부는 최근 산학연과 함께 국산 시스템 SW 경쟁력 강화와 생태계 조성을 위한 인재 양성에 힘쓰고 있다. AI 업계 관계자는 "진정한 소버린 AI란 단순히 GPU를 국산화하거나 반도체만 확보하는 것이 아니라 그 위에서 AI를 개발하고 서비스로 연결할 수 있는 생태계 전체의 자립"이라며 "장기적으로 정부와 민간이 함께 쿠다에 대응할 수 있는 오픈소스 기반 범용 SW 생태계 육성 전략을 세워야 한다"고 강조했다.

2025.08.01 13:35한정호 기자

트럼프, 이번엔 '반도체 설계 SW' 정조준…中 AI 반도체 숨통 죈다

미국 도널드 트럼프 행정부가 중국 인공지능(AI) 산업을 견제하기 위한 직접적인 엔비디아 반도체 공급 규제에 이어 칩 설계 지원 소프트웨어(SW) 공급 제한에도 나선다. 2일 파이낸셜타임스 등 외신에 따르면 미국 상무부 산하 수출통제국인 산업안보국(BIS)은 케이던스, 시놉시스, 지멘스 EDA 등 반도체 설계 자동화 기업에 중국 대상 서비스 판매를 중단하라고 지시했다. 엔비디아 칩 공급뿐만 아니라 중국 내부에서의 첨단 AI 반도체 개발도 저해한다는 전략이다. 앞서 트럼프 1기 행정부 때부터 미국은 중국의 화웨이를 대상으로 미국산 칩 설계 SW 장비 사용을 금지해 온 바 있다. 칩 개발 SW는 전체 반도체 산업에서 차지하는 비중은 비교적 작지만, 칩 설계자와 제조업체가 차세대 칩을 개발하고 테스트할 수 있도록 해 공급망에서 중요한 부분을 차지한다. 특히 시놉시스, 케이던스, 지멘스 EDA 등은 중국 시장에서 관련 점유율을 약 80%를 차지하고 있는 것으로 알려졌다. 시놉시스의 1분기 실적 발표에 따르면 시놉시스는 전체 매출의 약 16%가 중국 시장에서의 매출인 것으로 조사돼, 이번 판매 중단 지침으로 큰 타격을 입을 것으로 예상된다. 미 상무부 관계자는 "중국에 대한 전략적인 수출 통제를 검토하고 있다"며 "검토가 진행되는 동안 기존의 수출 허가 서비스를 정지하거나 추가 허가 요건 등을 부과했다"고 밝혔다. 최근 미국과 중국은 스위스 제네바 통상 회담을 통해 90일간 보복 관세를 중단하기로 합의한 바 있다. 그러나 트럼프 행정부의 이번 서비스 공급 중단 지침으로 양국의 갈등이 더욱 격화될 것이라는 전망이 나온다. 전 CIA 크리스토퍼 존슨 중국 분석가는 "반도체 설계 SW 수출 통제 조치는 "제네바에서 타결된 관세 휴전의 본질적인 취약성을 드러냈다"며 "90일 휴전 기간 내에도 휴전이 파기될 위험이 만연하다"고 지적했다. 지멘스 측은 "대중국 수출 통제 제도를 준수하면서 이 영향을 완화하기 위해 전 세계 고객들과 계속 협력할 것"이라고 밝혔다.

2025.06.02 13:46한정호 기자