• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
  • AI의 눈
반도체
인공지능
AI의 눈
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'NPU'통합검색 결과 입니다. (166건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

"GPU 대체할까"…와이즈넛, NPU 기반 AI 어플라이언스 공개

와이즈넛이 국산 인공지능(AI) 반도체 기반 시스템으로 공공·기업 고객 확장에 나섰다. 와이즈넛은 지난 2일 서울 강남구에서 열린 퓨리오사AI '레니게이드 2026 서밋'에 참가해 국산 신경처리장치(NPU) 기반 AI 어플라이언스를 시연했다. 이번 장비는 퓨리오사AI의 2세대 NPU '레니게이드' 기반으로 개발됐으며 현장에서 실제 구동 형태로 공개됐다. 해당 장비는 그래픽처리(RAG) 기반 AI 에이전트 '와이즈 아이랙'과 도메인 특화 거대언어모델(LLM) '와이즈 엘로아'를 통합한 일체형 구조다. 별도 서버 구축이나 모델 설치 없이 전원과 네트워크 연결 후 초기 설정만으로 AI 업무를 바로 수행할 수 있는 점이 핵심이다. 와이즈넛은 해당 장비 특장점으로 공공기관을 겨냥한 폐쇄망 온프레미스 설계를 꼽았다. 데이터가 외부 클라우드로 이동하지 않고 내부에서 처리돼 보안 우려를 낮춘 구조라서다. 하드웨어 측면에서는 전력 효율성이 핵심인 것으로 알려졌다. 레니게이드 NPU는 칩당 180W 수준으로 기존 GPU 대비 낮은 전력 소비를 구현해 비용과 운영 부담을 줄일 수 있는 구조다. 두 기업은 지난해 6월 협력 후 단계적으로 기술 통합을 진행해 왔다. 이번 시연은 양산 단계 NPU에서 실제 AI 에이전트 워크로드를 구동했다는 점에서 상용화 가능성을 입증한 사례로 평가된다. 행사는 퓨리오사AI NPU 생태계 확산과 고객 도입 성과를 공유하기 위해 마련됐다. 퓨리오사AI는 올해 초 레니게이드 1차 양산 물량 4000장을 확보하며 본격적인 시장 공급에 돌입한 상태다. 강용성 와이즈넛 대표는 "26년간 축적한 언어처리 기술력과 AI 에이전트 역량을 퓨리오사AI의 고성능 국산 NPU 위에서 완제품으로 구현했다는 점에서 뜻깊다"고 강조했다.

2026.04.07 14:20김미정 기자

[유미's 픽] "GPU 넘는다"…삼성·LG·롯데·포스코 가세로 국산 NPU 확산 본격화

국산 신경망처리장치(NPU)를 중심으로 한 국내 인공지능(AI) 산업 재편이 본격화되고 있다. 정부가 50조원 규모의 'K-엔비디아' 육성 프로젝트를 추진하며 정책 드라이브를 강화하는 가운데 민간 기업들도 공공·제조·클라우드·서비스 등 각 영역에서 NPU 도입과 사업화를 서두르는 모습이다. 3일 업계에 따르면 최근 국내 주요 IT·산업 기업들은 그래픽처리장치(GPU) 중심 AI 인프라에서 벗어나 NPU를 기반으로 한 구조 전환을 추진하며 비용 효율과 전력 절감, 데이터 주권 확보를 동시에 노리고 있다. 기술 검증 단계를 넘어 실제 서비스와 인프라로 확산되고 있는 상황을 고려한 것으로, AI 서비스 확산에 따라 추론 수요가 급증하면서 전력 소비와 운영 비용 부담이 커진 점도 한 몫 했다. 정부도 이 같은 변화에 맞춰 정책 지원을 강화하고 있다. 실제 과학기술정보통신부와 금융위원회는 지난달 민관 합동 간담회를 통해 AI 반도체 시장이 범용 GPU 중심에서 저전력·고효율 중심 구조로 전환되고 있다고 진단하고 국산 NPU 산업 육성에 정책 역량을 집중하겠다고 밝혔다. 국민성장펀드를 통해 향후 5년간 50조원을 투입하는 'K-엔비디아' 프로젝트도 추진 중이다. 이에 따라 클라우드 인프라 영역에서도 국산 NPU 적용이 구체화되고 있다. 삼성SDS가 국산 NPU 기반 '서비스형 NPU(NPUaaS)'를 오는 7월 출시하는 것이 대표적 사례다. 삼성SDS는 기존 '서비스형 GPU(GPUaaS)' 중심 구조에서 벗어나 NPU를 포함한 하이브리드 인프라를 구축함으로써 기업들이 AI 워크로드 특성에 따라 연산 자원을 선택할 수 있도록 하겠다는 전략을 내세웠다. 클라우드에서 구독형으로 NPU를 제공함으로써 초기 투자 부담을 낮추고 도입 장벽을 줄인 점도 특징이다. NPU 도입은 공공과 산업 현장을 중심으로도 확대되는 흐름을 보이고 있다. 비용과 전력 효율이 중요한 공공 인프라를 중심으로 적용 검토가 이뤄지면서 초기 수요도 형성되는 분위기다. 특히 공공 및 유통 인프라 분야에서는 비용 경쟁력 확보를 중심으로 NPU 도입이 이뤄지고 있다. 롯데이노베이트는 딥엑스와 협력해 지능형 CCTV와 ITS에 NPU를 적용하며 GPU 대비 총소유비용(TCO) 절감을 추진 중이다. 업계에선 정책 인센티브가 구체화되기 전부터 국산 반도체 적용을 검토하는 등 선제 대응 성격이 강한 사례라고 봤다. 제조 분야에서는 포스코DX가 모빌린트 NPU를 산업용 제어 시스템에 탑재해 설비 단계에서 실시간 AI 분석과 제어가 가능한 구조를 구축하고 있다. 이는 클라우드 중심 AI에서 벗어나 현장 중심의 엣지 AI로 전환하는 흐름을 반영한 것으로, 보안성과 즉시성을 동시에 확보하려는 전략으로 풀이된다. 클라우드와 플랫폼 영역에서도 대응이 이어지고 있다. LG CNS는 NPU 기반 AI 인프라 구축을 확대하고 있으며, LG유플러스는 NPU와 대규모 언어모델(LLM), 인프라를 결합한 'AI 어플라이언스'를 통해 공공·금융 등 폐쇄망 시장을 겨냥하고 있다. 클라우드 의존 없이 자체 환경에서 AI를 구동할 수 있도록 한 점이 특징이다. AI 모델 영역에서는 LG AI연구원과 업스테이지가 중심 역할을 하고 있다. LG AI연구원은 '엑사원(EXAONE)'을 기반으로 국산 NPU와의 최적화를 추진하며 추론 중심 AI 환경에 대응하고 있으며, 업스테이지 역시 퓨리오사AI와 협력해 NPU 기반 생성형 AI 서비스 상용화를 추진 중이다. 이는 모델 단계에서도 GPU 의존도를 낮추려는 시도로 해석된다. 기업용 소프트웨어 분야에서도 변화가 나타나고 있다. 더존비즈온은 퓨리오사AI와 협력해 전사적자원관리(ERP) 등 핵심 업무 시스템에 NPU 기반 AI를 적용하며 공공·금융 시장 확대를 추진하고 있다. 기존 분석 중심 AI에서 벗어나 실제 업무 프로세스에 AI를 접목하려는 움직임이다. 유통 및 시스템통합(SI) 영역에서는 코오롱베니트가 리벨리온과 협력해 NPU 기반 'AI 엑셀러레이션 서비스'를 추진하며 기업 고객 접점을 확대하고 있다. 반도체 기술을 실제 비즈니스 환경에 적용하는 역할로, 시장 확산을 위한 유통 채널로 기능하고 있다. 클라우드 사업자들의 선행 움직임도 영향을 미쳤다. 네이버클라우드는 'AI반도체 팜' 사업을 통해 국산 NPU의 성능과 안정성을 산업 현장에서 검증하며 상용화 기반을 마련했다. 이후 기업들의 사업화 움직임도 이어지고 있다. 업계에선 현재 국산 NPU 사업을 두고 기술 검증 단계를 넘어 상용화 초기 단계로 보고 있다. 동시에 벤더 간 경쟁도 본격화되면서 기업들은 국산 NPU 도입을 전제로 협력 구조도 구축하는 모습이다. 업계 관계자는 "지금은 NPU 도입 여부를 논의하는 단계가 아니라 어떤 기술을 선택할지 경쟁이 시작된 단계"라며 "정부 정책과 민간 인프라가 맞물리면서 AI 반도체 생태계가 빠르게 확산될 것으로 기대된다"고 말했다.

2026.04.03 08:48장유미 기자

퓨리오사AI "올해 2세대 NPU 2만장 양산 목표...제품 공급 시작"

국내 AI 반도체 스타트업 퓨리오사AI가 2세대 AI칩 '레니게이드(RNGD)'의 상용화 성과를 알리며 본격적인 신경망처리장치(NPU) 생태계 확장에 나섰다. 퓨리오사AI는 2일 서울 강남구 에스제이쿤스트할레에서 '레니게이드 2026 서밋'을 개최했다. 이날 행사에는 레니게이드를 직접 도입하는 주요 AI 모델 기업, 통신사, 클라우드 사업자 등 200여명의 관계자가 참석해 AI 반도체 도입 현황과 확산 방안을 공유했다. "올해 2만장 규모 양산"…HBM 탑재 NPU로 글로벌 시장 정조준 퓨리오사AI는 앞선 지난 1월 1차 양산 물량 4000장을 인도받으며 레니게이드의 양산을 개시했다. 고대역폭메모리(HBM)를 탑재한 NPU가 개발을 넘어 양산 단계까지 이른 것은 세계적으로도 드문 사례다. 특히 백준호 대표는 올해 공격적인 공급 계획을 밝혔다. 백 대표는 "올해 레니게이드 카드를 약 2만장 규모로 양산할 수 있도록 모든 준비를 마쳤으며, 현재 양산이 순조롭게 진행 중"이라며 "이미 다양한 고객사들에게 제품 공급을 시작했다"고 강조했다. 2세대 레니게이드는 극강의 전력 효율을 꾀한 추론용 칩이다. 칩당 열 설계 전력(TDP)을 180W 이하로 획기적으로 낮추면서도 고성능을 달성했다. 부동소수점 연산 기준으로 초당 512테라플롭스(TFLOPS), 정수형(INT4) 기준 1페타플롭스(PFLOPS)의 성능을 제공하며, 4세대 HBM3를 탑재해 메모리 병목 현상을 해소했다. 퓨리오사AI가 공개한 최신 벤치마킹 결과에 따르면 레니게이드는 엔비디아 RTX PRO 6000과 비교해 동일한 전력으로 최대 7.4배 규모의 사용자를 처리할 수 있다. 이를 통해 기존 GPU 대비 인프라 총소유비용(TCO)을 약 40% 절감할 수 있다는 것이 회사 측의 설명이다. "실전 투입 채비 마쳤다"…주요 파트너사 협력 릴레이 이날 행사의 가장 큰 화두는 레니게이드를 실제 인프라와 서비스에 도입하는 주요 파트너사들의 생생한 현장 목소리였다. 파트너사들은 단순한 개념 검증을 넘어 구체적인 상용화 계획을 잇달아 발표했다. 먼저 LG AI연구원은 2022년부터 퓨리오사AI와 교감하며 자사의 LLM(거대언어모델) '엑사원(EXAONE)'을 레니게이드 환경에서 구동하는 작업을 진행해 왔다. 임우형 LG AI연구원 원장은 "단순 모델 서빙을 넘어 다양한 서비스 시나리오에 대해 벤치마크 테스트를 진행했고, 퓨리오사AI의 신속한 소프트웨어 개선 등 우수한 엔지니어링 역량을 확인했다"고 평가했다. LG유플러스는 엑사원 모델과 레니게이드를 결합해 보안과 제어가 가능한 '소버린 AI' 어플라이언스 솔루션을 구축 중이다. 이상엽 LG유플러스 CTO는 "향후 보이스 기반 AI 서비스가 상용화되면 텍스트 대비 토큰 비용이 30배 이상 급증할 수 있다"며 "이를 해결하기 위해 엣지 및 온디바이스가 결합된 하이브리드 AI 인프라 구축에 레니게이드가 효과적"이라고 말했다. 삼성SDS는 올해 7월 삼성 클라우드 플랫폼(SCP)을 통해 국내 CSP(클라우드 서비스 제공사업자) 최초로 NPU 기반 구독형 서비스인 'NPUaaS'를 론칭할 계획이다. 이주평 삼성SDS 상무는 "고객이 1장, 2장, 4장, 8장 단위로 필요한 만큼 구독해 사용할 수 있도록 클라우드 가상화 통합 작업을 성공적으로 진행해 왔다"고 밝혔다. 업스테이지는 약 200만명의 사용자를 보유한 챗봇 서비스와 주력 LLM인 '솔라(Solar)'를 서빙하는 과정에서 발생하는 막대한 GPU 운용 비용 문제를 해결하고자 퓨리오사AI와 손을 잡았다. 김성훈 업스테이지 대표는 "척박한 서비스 생존 경쟁 속에서 경제적인 추론 칩이 절실했다"며 "퓨리오사AI의 지원으로 실질적인 상용 테스트를 속도감 있게 진행하고 있다"고 말했다. 메가존클라우드는 퓨리오사AI 등과 컨소시엄을 구성해 사우디아라비아 아람코 등 중동 진출을 위한 개념검증(PoC)을 주도하고 있다. 이주완 메가존클라우드 회장은 "경남, 전북, 구미 등 주요 지방 산단에 엣지 클라우드 인프라를 구축해 중소·중견 제조사들의 AI 도입을 직접적으로 지원할 것"이라며 "향후 3년 내 500억원, 5년 내 3000억원 규모의 퓨리오사AI 칩 공급을 추진하겠다"는 구체적인 목표도 제시했다. PC용 경량화 모델부터 3세대 칩까지…차세대 로드맵 가속 퓨리오사AI는 시장의 빠른 변화에 대응하기 위해 레니게이드 라인업을 다각화하는 구체적인 로드맵도 제시했다. 백 대표는 단기적으로 "레니게이드의 메모리를 기존 HBM3에서 차세대 메모리로 업그레이드하고, 현재 출시된 서버 어플라이언스 제품군 역시 지속해서 고도화해 신제품을 선보일 것"이라고 말했다. 또한 제품군의 외연 확장도 예고했다. PC나 워크스테이션 환경에 맞춰 칩을 경량화한 '레니게이드 S'의 모든 준비를 마쳐 올해 말에서 내년 초 사이 출시할 예정이다. 나아가 2028년에는 레니게이의 핵심 엔진 아키텍처를 기반으로 메모리와 연산 규모 등 이른바 '배기량'을 대폭 확대한 3세대 AI 칩을 선보이며 글로벌 경쟁력을 이어갈 계획이다. 백 대표는 "오늘 행사는 레니게이드 기반 NPU 생태계 확산을 이끌어갈 국내외 주요 파트너사들과 함께 하는 뜻깊은 자리"라며 "레니게이드 기반의 생태계 확산을 통해 글로벌 AI 인프라 시장에서 한국 반도체의 저력을 직접 증명하겠다"고 포부를 밝혔다.

2026.04.02 16:08전화평 기자

[단독] 삼성SDS, 국내 첫 국산 NPUaaS 7월 출격…정부 'AI 주권' 정책 추진 앞장

삼성SDS가 국내 클라우드 서비스 제공업체(CSP) 가운데 처음으로 국산 신경망처리장치(NPU) 기반 서비스형 인프라(NPUaaS)를 출시한다. 정부가 국산 AI 반도체 활용 확대와 'AI 주권' 확보를 강조하는 가운데 민간에서 이를 실제 서비스로 구현하는 첫 사례란 점에서 주목된다. 2일 업계에 따르면 삼성SDS는 오는 7월 퓨리오사AI의 2세대 NPU '레니게이드(RNGD)'를 기반으로 한 NPUaaS를 삼성 클라우드 플랫폼(SCP)에 출시할 예정이다. 국내 CSP 중 국산 NPU를 클라우드 서비스 형태로 제공하는 첫 사례로, 국산 AI 반도체의 상용화 채널을 본격적으로 여는 계기로 평가된다. 삼성SDS는 지난해 9월부터 퓨리오사AI와 협력해 레니게이드를 SCP 환경에 최적화하고 서비스형 모델로 상품화하는 작업을 진행해왔다. 양사는 별도의 MOU 체결 없이 기술 협력을 중심으로 사업화를 추진해온 것으로 알려졌다. 특히 레니게이드는 AI 추론(inference)에 특화된 반도체로, GPU 대비 전력 효율과 비용 측면에서 경쟁력을 갖춘 것으로 평가된다. 글로벌 AI 인프라 시장이 GPU 중심으로 형성된 가운데 비용 부담과 공급 제약이 지속되면서 대안으로서 NPU 수요가 확대되는 흐름과도 맞물린다. 이번 NPUaaS 도입은 삼성SDS의 AI 인프라 포트폴리오를 다변화하는 의미도 갖는다. 기존 GPUaaS 중심에서 벗어나 NPU 기반 연산 자원을 추가함으로써 고객이 AI 워크로드 특성에 따라 인프라를 선택할 수 있는 구조를 갖추게 됐다는 점에서다. 삼성SDS의 NPUaaS 고객은 삼성클라우드플랫폼(SCP)를 통해 레니게이드를 구독형으로 사용할 수 있으며 1장부터 8장까지 단위별 확장이 가능하다. 또 스타트업부터 대기업까지 다양한 규모의 AI 서비스에 맞춰 유연하게 활용할 수 있다는 점에서 시장성이 높다고 평가된다. 해당 NPU는 SCP의 스토리지, 네트워크, 컴퓨트 등 기존 클라우드 서비스와 연계해 사용할 수 있도록 설계됐다는 점도 강점이다. 이는 단순 연산 자원 제공을 넘어 데이터 처리와 모델 운영까지 포함하는 통합 AI 인프라로 확장하려는 전략이 반영된 것으로 풀이된다. 이를 위해 삼성SDS는 레니게이드 서버를 가상화하고 SCP의 가상화 계층과 통합하는 작업을 진행 중이다. 물리적 NPU 자원을 클라우드 환경에 맞게 추상화해 자원 활용 효율을 높이고 사용자 접근성을 개선하겠다는 구상이다. 이번 서비스는 정부의 AI 반도체 육성 정책과도 맞닿아 있다. 정부는 AI 추론 시장 확대에 대응해 저전력·고효율 NPU를 중심으로 산업 경쟁력을 강화하기 위해 적극 나섰다. 특히 과학기술정보통신부는 지난달 금융위원회와 국민성장펀드 K-엔비디아 육성 프로젝트 추진을 위한 민관 합동 간담회를 개최하며 AI 반도체 시장의 패러다임이 범용 GPU 중심에서 효율 중심 구조로 전환되고 있다고 진단하며 국산 NPU 기술 확보를 위한 대규모 투자 필요성을 강조했다. 또 국민성장펀드를 통해 향후 5년간 50조원을 투입하는 'K-엔비디아' 육성 프로젝트를 추진하며 AI 컴퓨팅 인프라와 생태계 전반에 대한 지원 확대에 대한 의지를 드러냈다. 업계에선 삼성SDS의 NPUaaS가 정부의 이 같은 정책 기조 속에서 국산 AI 반도체의 실제 활용을 확대하는 계기가 될 것으로 보고 있다. 클라우드 기반 서비스는 초기 투자 부담 없이 기업들이 NPU를 도입할 수 있는 환경을 제공한다는 점에서 정책 효과를 시장으로 연결하는 역할을 할 수 있기 때문이다. 업계 관계자는 "국산 NPU가 실제 클라우드 서비스로 제공되는 것은 기술 개발 단계를 넘어 시장 적용 단계로 진입했다는 의미"라며 "정부 정책과 민간 인프라가 맞물리면서 AI 반도체 생태계가 본격적으로 확대될 것"이라고 말했다.

2026.04.02 14:46장유미 기자

제조 AI, 국산 반도체로 실현한다…포스코DX-모빌린트 '맞손'

포스코DX가 국산 인공지능(AI) 반도체를 활용해 제조 현장 AI 전환(AX) 전략 강화에 나섰다. 외산 그래픽처리장치(GPU) 중심 구조에서 벗어나 엣지 AI 기반 인텔리전트 팩토리를 중심으로 비용 효율성과 보안, 실시간 대응 역량을 동시에 확보하겠다는 구상이다. 포스코DX는 모빌린트와 국산 신경망처리장치(NPU) 기반 AX 구현을 위한 업무협약(MOU)을 체결했다고 2일 밝혔다. 이번 협력은 단순 기술 도입을 넘어 투자와 사업 연계를 포함한 전략적 파트너십 성격을 띤다. 포스코DX는 지난 2월 포스코기술투자와 함께 조성한 기업형 벤처캐피탈(CVC)을 통해 모빌린트에 총 30억원을 투자하며 협력 기반을 마련한 바 있다. AI 인프라 기술을 외부에서 조달하는 방식에서 나아가 유망 스타트업과의 공동 성장 구조를 구축하려는 움직임으로 풀이된다. 핵심은 GPU 중심 AI 인프라를 국산 NPU로 대체하는 데 있다. NPU는 딥러닝·머신러닝 연산에 특화된 반도체로, 특히 추론 단계에서 높은 효율을 보이며 전력 소비와 비용 측면에서 강점을 갖는다. 이는 생산 설비와 가까운 현장에서 직접 데이터를 처리하는 엣지 AI 구현에 적합해 제조 현장의 실시간 의사결정과 보안 요구를 동시에 충족할 수 있다는 점이 주목받고 있다. 우선 포스코DX는 자체 산업용 제어시스템 '포스마스터'에 모빌린트의 NPU를 적용해 설비 제어 단계에서 AI 분석과 대응이 즉각 이뤄지는 인텔리전트 팩토리를 구현할 계획이다. 양사는 NPU 환경에서 AI 모델 성능을 최적화하기 위한 공동 기술 개발도 병행한다. 특히 모빌린트는 엣지 환경에서 대규모언어모델(LLM)을 구동할 수 있는 NPU 기술을 확보한 국내 기업으로, 현장 데이터 기반 실시간 판단과 제어를 지원한다. 철강과 이차전지 소재 생산 등 고도의 정밀성과 안정성이 요구되는 산업에서 활용도가 클 것으로 전망된다. 이번 협력은 제조 AI 인프라의 구조 전환을 가속화하는 계기가 될 것이라는 관측도 나온다. 기존에는 중앙 데이터센터 기반 GPU 인프라에 의존해 왔지만, 최근에는 현장에서 직접 데이터를 처리하는 엣지 AI 수요가 빠르게 증가하고 있어서다. 특히 데이터 외부 반출이 어려운 제조 환경에선 보안성과 지연 최소화가 핵심 경쟁 요소로 떠오르고 있다. 포스코DX는 향후 엣지 AI 기술을 철강, 이차전지소재 생산 현장뿐 아니라 물류 등 다양한 산업 영역으로 확장해 나갈 방침이다. 이는 포스코그룹이 추진 중인 인텔리전트 팩토리 전략과도 맞닿아 있다. 그룹은 제조 현장 전반에 AI 기반 자동화와 최적화 기술을 적용해 안전성과 생산성을 동시에 높이는 방향으로 AX를 확대 중이다. 조석주 포스코DX AX융합연구소장은 "이번 협력으로 인텔리전트 팩토리 구현에 필수적인 LLM 기반의 엣지 AI 기술을 확보할 수 있게 됐다"며 "단순 NPU 공급 관계가 아닌 국내 스타트업과의 성공적인 협업·상생 사례로 발전시킬 것"이라고 강조했다. 이어 "포스코그룹이 제조 AI의 패러다임 전환을 리딩하는 기업으로 자리매김할 수 있도록 하겠다"고 덧붙였다.

2026.04.02 14:44한정호 기자

"TCO 낮추고 국산 반도체 얹는다"…롯데이노베이트, NPU로 공공시장 승부수

롯데이노베이트가 인공지능(AI) 반도체 기업 딥엑스와 손잡고 온디바이스 AI 시장 공략에 본격 나선다. 단순 기술 협력을 넘어 공공 인프라 중심의 비전 AI 시장에서 비용 구조 혁신과 국산 반도체 생태계 구축을 동시에 겨냥한 전략적 행보로 풀이된다. 롯데이노베이트는 지난 1일 딥엑스와 '그래픽처리장치(GPU) 대체 가능한 신경망처리장치(NPU) 적용 및 실증을 통한 상호 기술 개선'을 골자로 한 양산 협력 개발 업무협약(MOU)을 체결했다고 2일 밝혔다. 양사는 국산 AI 반도체 기반 기술 협력과 현장 실증을 통해 올해 하반기 양산화를 목표로 하고 있으며 지능형 CCTV 실시간 AI 추론을 위한 전용 NPU 적용에도 나선다. 이번 협력의 핵심은 GPU 중심 구조에서 벗어나 초저전력 NPU 기반으로 전환하는 데 있다. 지능형 CCTV와 ITS(지능형 교통 시스템) 등 공공 인프라 사업은 대규모 설치와 24시간 운영 특성상 전력 비용과 유지비 부담이 크다. 이에 따라 단순 장비 가격을 넘어 전력·운영 비용까지 포함한 총소유비용(TCO) 절감이 사업 경쟁력의 핵심 변수로 작용해왔다. NPU는 이러한 구조적 한계를 보완할 수 있는 대안으로 주목된다. 저전력 설계를 기반으로 장시간 구동 환경에 적합하고, 엣지 단에서 실시간 추론이 가능해 네트워크 비용까지 줄일 수 있기 때문이다. 결과적으로 GPU 대비 가격 경쟁력뿐 아니라 운영 효율성 측면에서도 공공 사업에 적합한 기술로 평가된다. 이번 일은 공공시장 진입 전략 측면에서도 의미가 크다. 롯데이노베이트는 이미 침입·배회·쓰러짐·방화·마케팅 등 5개 항목에 대해 KISA 지능형 CCTV 성능 인증을 확보한 상태다. 여기에 국산 NPU를 결합할 경우 정부의 K-반도체 활성화 정책과 맞물리며 공공 조달 시장에서 경쟁 우위를 확보할 수 있다. 특히 이번 협력은 기술 검증 단계를 넘어 양산 전환을 공식화했다는 점에서 주목된다. 양사는 2023년부터 교통 및 CCTV 분야에서 기술검증(PoC)을 진행해왔으며 이번 MOU는 이를 기반으로 실제 제품화 단계에 진입했음을 의미한다. 롯데그룹 계열사를 활용한 실증 환경도 중요한 경쟁력이다. 유통·물류·인프라 등 다양한 현장을 보유한 그룹 구조는 대규모 엣지 AI 적용 테스트베드로 기능할 수 있다. 이는 외부 시장 확대 이전에 안정적인 레퍼런스를 확보할 수 있는 기반으로 작용한다. 딥엑스 역시 실제 산업 환경에서 자사 NPU 성능을 검증할 수 있는 기회를 확보하게 된다. 산업적으로는 이번 협력이 단순 하드웨어 전환을 넘어 AI 처리 구조의 변화를 의미한다는 점에서 주목할 필요가 있다. 클라우드 중심 영상 분석에서 벗어나 데이터 발생 지점에서 실시간 처리하는 온디바이스 AI로의 전환이 가속화되는 흐름과 맞닿아 있기 때문이다. 이는 개인정보 보호 요구 강화와 네트워크 비용 절감이라는 공공 인프라 시장의 요구와도 맞물린다. 이에 이번 협력은 '저원가 구조'와 '국산 반도체', '인증 기반 시장 진입'이라는 세 축을 결합해 공공 비전 AI 시장에서 표준 선점에 나선 전략으로 해석된다. 롯데이노베이트 관계자는 "이번 협력을 계기로 ITS, 공공 인프라, 스마트 리테일 등 다양한 비전 AI 응용 분야에서 실제 산업 적용 사례를 확보하고, 향후 롯데그룹 내 유통·물류·인프라 등 다양한 사업 영역으로 온디바이스 AI 기반 비전 AI 시스템 적용을 단계적으로 확대해 나갈 예정"이라며 "NPU 기반 엣지 AI 생태계를 강화하고 다양한 산업 현장에 최적화된 AI 서비스 확산에 박차를 가할 계획"이라고 말했다.

2026.04.02 10:44장유미 기자

모빌린트, 포스코DX와 산업 AI 시장 공략 변격화

AI 반도체 기업 모빌린트가 포스코DX와 함께 AI 반도체 기반 산업 AI 시장 공략을 위한 전략적 업무협약(MOU)을 체결했다고 2일 밝혔다. 이번 협약은 양사가 보유한 AI 반도체 기술과 산업 현장 운영 역량을 결합해 제조·로봇·물류·안전 분야 전반에서 실제 적용 가능한 AI 솔루션을 공동 개발하고, 이를 상용화까지 빠르게 연결하기 위한 전략적 협력이다. 특히 이번 협력은 단순한 기술 협력을 넘어, 포스코DX가 포스코기술투자와 함께 출자한 기업형 벤처캐피탈(CVC)을 통해 모빌린트에 약 30억원 규모의 전략적 투자를 단행한 이후 본격화된 것이다. 양사는 ▲AI 하드웨어 시스템 공동 개발 ▲현장 적용을 위한 PoC 및 기술 검증 ▲신규 협력 과제 발굴 및 사업화 ▲실무 협의체 기반 협력 체계 구축 등을 중심으로 협력을 추진한다. 포스코DX는 AI 추론 코드, 개발 환경, 데이터셋 등 핵심 자산과 산업 자동화 플랫폼을 기반으로 현장 적용을 지원하고, 모빌린트는 고성능·저전력 NPU 기반으로 AI 알고리즘 최적화 및 온디바이스 AI 시스템 구현을 담당한다. 이를 통해 기존 GPU 중심의 AI 인프라를 NPU 기반으로 전환함으로써 인프라 비용 절감과 전력 효율 개선을 동시에 추진하고, 데이터센터를 거치지 않는 엣지 AI 구조를 적용해 산업 현장에서 요구되는 보안성과 실시간성을 확보할 계획이다. 모빌린트는 국내에서 유일하게 엣지 환경에서 LLM(대규모 언어모델) 구동이 가능한 고성능 NPU 기술력을 바탕으로, 산업 현장에서 요구되는 실시간 AI 처리 역량을 구현하고 있다. 특히 센서·설비 등에서 발생하는 방대한 데이터를 현장에서 직접 분석·판단·제어할 수 있어, 데이터센터 의존도를 낮추고 제조 현장의 지능화를 실질적으로 가속화할 수 있는 것이 강점이다. 이번 협력을 통해 모빌린트는 자사의 NPU 기반 온디바이스 AI 기술을 포스코DX의 산업 AI 환경에 최적화하고, PoC를 통해 기술 완성도를 빠르게 검증해 실제 사업화로 연결할 계획이다. 이를 통해 생산성과 운영 효율을 동시에 향상시키는 산업 AI 레퍼런스를 확보한다는 전략이다. 포스코DX는 엣지 AI 기술을 확대 적용해 기존 GPU 기반 AI 시스템을 NPU 중심으로 전환하고, 철강 및 이차전지소재 생산 현장은 물론 물류 등 다양한 산업 영역으로 적용 범위를 넓혀 나갈 예정이다. 모빌린트 관계자는 “포스코DX의 전략적 투자와 협력을 통해 자사의 AI 반도체 기술을 제조 및 산업 현장에 본격적으로 적용할 수 있는 기반을 마련하게 됐다”며 “AI 인프라를 혁신하고, 엣지 환경에서 실행 가능한 AI를 통해 산업 전반의 지능화를 가속화하는 성과를 만들어 나가겠다”고 말했다. 포스코DX 관계자는 “이번 협력으로 인텔리전트 팩토리 구현에 필수적인 LLM 기반의 엣지 AI 기술을 확보할 수 있게 됐다”며 “단순 NPU 공급 관계가 아닌 국내 스타트업과의 성공적인 협업·상생 사례로 발전시켜, 포스코그룹이 제조 AI의 패러다임 전환을 리딩하는 기업으로 자리매김할 수 있도록 하겠다”고 강조했다.

2026.04.02 10:00전화평 기자

모빌린트, 700억원 규모 시리즈 C 투자 유치 완료

국내 AI 반도체 스타트업 모빌린트가 700억원 규모의 시리즈 C 투자 유치를 마무리했다고 1일 밝혔다. 이번 투자에는 프랙시스캐피탈파트너스, 포스코기술투자, 컴퍼니케이파트너스 등 주요 투자자가 참여했다. 이번 투자는 고성능 대비 압도적인 전력 효율을 구현한 NPU 설계 기술과 산업 현장에서 빠르게 검증되고 있는 사업화 성과를 동시에 인정받은 결과다. 특히 데이터센터 의존도를 낮추고 엣지 환경에서 AI를 직접 실행하는 온디바이스 구조에 대한 수요가 확대되면서, 고성능·저전력 기반 AI 반도체 기술력과 실제 적용 가능성이 투자 판단의 핵심 요인으로 작용한 것으로 분석된다. 관련 시장이 빠르게 성장하는 가운데, 모빌린트의 기술 경쟁력 역시 주목받고 있다. 모빌린트는 국내에서 유일하게 엣지 환경에서 LLM(대규모 언어모델) 구동이 가능한 고성능 NPU 기술을 보유하고 있다. 이를 통해 산업 현장에서 요구되는 실시간 AI 처리 역량을 구현하고, 센서·설비 등에서 발생하는 방대한 데이터를 현장에서 즉각 분석·판단·제어할 수 있어 제조 현장의 지능화를 가속화할 수 있다는 평가다. 현재 모빌린트는 자체 설계한 AI 가속기 칩 'ARIES(에리스)'와 AI SoC 'REGULUS(레귤러스)'를 기반으로 엣지 AI 시장을 공략하고 있다. 또한 MLX-A1(Edge AI Box) 등 하드웨어와 소프트웨어를 통합한 풀스택 AI 솔루션을 통해, 제조·리테일·보안 등 다양한 산업에서 별도의 복잡한 구축 과정 없이 즉시 적용 가능한 AI 인프라를 제공하고 있다는 점이 강점이다. 최근에는 글로벌 IT 제조 기업 인탑스와 협력해 AI 반도체 기반 솔루션의 공동 개발 및 양산을 추진하고 있으며, 이를 실제 제조 공정에 적용하는 스마트팩토리 프로젝트도 본격화했다. 일부 프로젝트는 이미 양산 및 사업화 단계에 진입하며, 산업 현장에서의 적용 성과를 구체화하고 있다. 모빌린트는 이번 투자금을 바탕으로 ▲차세대 NPU 아키텍처 고도화 ▲양산 및 공급 체계 확대 ▲글로벌 시장 진출 가속 ▲자사 NPU 중심 생태계 확장에 집중할 계획이다. 이를 통해 AI 반도체 설계부터 소프트웨어, 솔루션까지 아우르는 풀스택 경쟁력을 강화하고 글로벌 시장 내 입지를 빠르게 확대한다는 전략이다.

2026.04.01 17:23전화평 기자

리벨리온, 6400억 투자 유치...기업가치 3.4조

국내 AI 반도체 스타트업 리벨리온이 국민성장펀드 1호로 선정되면서 6400억원 규모의 프리IPO 라운드 투자를 유치했다고 31일 밝혔다. 이번 투자로 리벨리온은 3조4000억원의 기업가치를 달성했다. 이번 프리IPO 라운드는 정부 주도의 정책자금과 미래에셋그룹이 리드한 민간 자본이 결집된 '민관 합동 투자'의 결과다. 정책자금의 경우 국민성장펀드에서 2500억원, 산업은행이 500억원을 각각 투자해 총 3000억원의 재원을 조성했다. 특히 미래에셋그룹은 그룹 차원에서 앵커 투자자로 나서며, 3000억원의 투자를 리드했다. 이러한 시장의 신뢰를 바탕으로 기존 투자자들도 신주인수권을 행사하며 총 6400억원 규모로 이번 투자가 마무리될 예정이다. 이번 투자는 정부가 대한민국 AI 3대 강국 달성을 목표로 추진 중인 '국민성장펀드 1차 메가프로젝트'의 핵심 과제인 'K-엔비디아 육성 프로젝트'의 실질적인 첫 행보다. 정부는 AI 반도체 분야에 필요한 다양한 투자와 지원을 바탕으로 기존 GPU의 전력·비용 한계를 극복할 국산 NPU 생태계를 구축할 계획이다. 그 일환으로 5년간 150조원 규모의 국민성장펀드 중 15조원을 혁신 기업에 대한 지분 투자 방식으로 집행, 리벨리온이 그 첫 사례로 이름을 올리며 국산 NPU 생태계 전반을 견인할 대표주자로 나서게 됐다. 회사는 이번 자금 조달을 바탕으로 인재 채용에 박차를 가할 계획이다. 현재 리벨리온은 300여명의 인력 규모를 갖추고 있다. 박성현 리벨리온 대표는 “지난 5년간 국내 반도체 생태계와 정부의 전폭적인 지지가 있었기에 리벨리온이 여기까지 성장할 수 있었다"며 "AI 추론 시장이 개화하는 '골든타임'을 놓치지 않기 위해 국가와 민간의 모험자본이 적시에 힘을 모아주신 것은 대한민국 반도체 생태계의 역사에 있어 상징적인, 매우 가슴 뛰는 순간”이라고 말했다. 그러면서 “이제는 경쟁력 있는 인재들과 함께 지금보다 2배 이상으로 팀을 키워 한층 더 높은 수준의 인재밀도를 갖추고, 글로벌 AI 인프라 시장의 중심에서 한국 AI 및 반도체 생태계와 함께 그 경쟁력을 직접 증명해보일 것”이라고 강조했다.

2026.03.31 09:25전화평 기자

리벨리온, 차세대 AI칩 '리벨 100'으로 명칭 변경...왜?

국내 대표 AI 반도체 스타트업 리벨리온이 자사의 차세대 신경망처리장치(NPU) 명칭을 기존 '리벨 쿼드(REBEL-Quad)'에서 '리벨 100(REBEL 100)'으로 공식 변경하기로 했다. 칩 이름 하나로 전체 제품 라인업을 부르던 기존 방식에서 벗어나, 고객 편의성을 극대화하기 위한 직관적인 네이밍 개편이다. 30일 반도체 업계에 따르면 리벨리온은 올해 하반기 양산을 시작하는 차세대 칩을 '리벨 100'으로 명칭을 바꿨다. 이러한 명칭 개편의 배경에는 1세대 칩인 '아톰(ATOM)' 출시 당시의 경험이 있다. 전세대 칩인 아톰은 개별 칩과 카드, 서버 등 여러 제품을 하나의 이름으로 묶어 불렀다. 그러다 보니 고객 입장에서 헷갈린다는 피드백이 이어진 것이다. 이에 따라 칩 자체는 '리벨 100'으로 부르며, 이를 탑재한 카드는 '리벨 카드', 서버는 '리벨 서버'로 직관적인 세분화를 단행했다. 신제품 실물이 본격적으로 고객에게 가기 전에 선제적으로 이름 체계를 확립하려는 목적으로 풀이된다. 리벨리온 관계자는 이에 대해 “명칭을 변경하는 것은 맞다”며 “31일 홈페이지에 새로운 명칭이 업데이트될 예정”이라고 말했다. 엔비디아 'H200' 넘었다…실전 연산 성능 우위·3GB 더 큰 메모리 확보 새로운 이름을 단 '리벨 100'은 최근 내부 벤치마크 테스트 결과, 시장의 기준점인 엔비디아의 최신 AI 칩 'H200'과 대등하거나 이를 소폭 상회하는 성능을 기록했다. 세부 성능 비교 지표를 살펴보면 그 차이가 더욱 명확히 드러난다. 세계 최고 권위 반도체 설계 학회인 ISSCC 2026 발표 자료에 따르면 리벨 100의 FP16(16비트 부동소수점) 연산 성능은 1 페타플롭스(PFLOPS)로 H200(0.99 PFLOPS)과 대등한 수준을 기록했다. 나아가 최근 리벨리온 내부에서 대형언어모델(LLM)을 구동해 진행한 실제 추론 벤치마크 테스트에서는 리벨 100이 H200을 핵심 연산 속도 면에서 앞섰다. H200과 같은 속도를 낼 때 전력 효율이 최대 1.7배 더 높았다. 특히 눈에 띄는 것은 메모리 사양이다. 두 칩의 메모리 대역폭은 동일하지만, 가용 메모리 용량에서 리벨 100은 144GB를 확보해 엔비디아 H200(141GB)보다 3GB 더 높은 수치를 보였다. 업계에 따르면 엔비디아 H200은 144GB의 용량 중 3GB를 에러 정정 코드(ECC) 등 보조 오버헤드 영역으로 할당한다. 실제 가용 용량은 141GB인 셈이다. 반면 리벨 100은 144GB를 온전히 사용자에게 제공한다. 독자적인 칩렛(Chiplet) 아키텍처가 이를 가능하게 한 것으로 보인다. 리벨 100은 삼성전자 4나노 파운드리 공정으로 양산되며, 차세대 메모리인 HBM3E를 탑재했다. 세계 최초로 UCIe 다이-투-다이(Die-to-Die) 인터페이스를 적용해 4개의 칩렛을 하나의 칩처럼 구동시키는 아키텍처를 구현해 냈다. 이를 통해 설계 전력(TDP)을 최대 600W로 억제, 동일한 성능을 내는 엔비디아 H200(700W) 대비 전력 소모를 약 15% 이상 줄이는 전력 효율을 달성했다. 리벨리온은 이러한 하드웨어 경쟁력을 바탕으로 올해 시장 안착에 속도를 낼 계획이다. 현재 리벨리온은 xAI, 오픈AI 등 글로벌 빅테크 기업들과 협력을 진행하고 있다.

2026.03.30 16:00전화평 기자

Arm, AGI CPU 시연 "저전력·고성능으로 효율 극대화"

[샌프란시스코(미국)=권봉석 기자] Arm은 24일(현지시간) 미국 캘리포니아 주 샌프란시스코 포트 메이슨에서 진행된 'Arm 에브리웨어' 행사에서 데이터센터용 IP(지적재산권) '네오버스'를 활용한 자체 개발 제품 'AGI CPU'를 공개했다. AGI CPU는 기존 클라우드서비스제공자와 하이퍼스케일러에 제공하던 데이터센터용 CPU IP(지적재산권)인 '네오버스 v3'를 활용해 설계된 첫 완제품이다. AGI CPU는 68개 코어로 구성된 다이 2개를 연결해 최대 136개 코어로 작동하며 코어당 2MB 용량 L2 캐시를 더했다. 공랭식 36kW(킬로와트)급 랙에는 최대 8160개 코어 구성이 가능하며 수랭식 200kW급 랙에는 최대 4만 5696 코어 탑재가 가능하다. 오후에 아태지역 기자단 대상으로 진행된 시연에서는 AGI CPU를 AI 워크로드 전반을 조율하는 장치로 활용하고 NPU·GPU 등 가속기와 결합하는 하이브리드 AI 아키텍처를 제시했다. 이날 Arm 관계자는 영상 변환과 추론을 동시에 수행하는 시나리오를 전제로 "기존 x86 프로세서는 최대 성능으로 작동시 성능 저하가 발생해 영상 처리시 버퍼링이 발생한다. 반면 Arm AGI CPU는 초당 30프레임으로 영상을 변환해 버퍼링 없는 영상 처리를 수행할 수 있다."고 설명했다. 이어 "기존 CPU는 전력 소모가 커서 냉각을 위해 2U 단위 큰 부피를 차지하며 한 랙에 넣을 수 있는 서버 수도 제한된다. 반면 AGI CPU는 1U 서버에서도 공랭이 가능하기 때문에 더 작은 폼팩터로 더 많은 서버를 랙에 배치할 수 있다"고 설명했다. SAP AI 모델 기반 시연에서는 CPU의 역할 변화가 구체적으로 제시됐다. 시연을 진행한 Arm 관계자는 "라우터, 링커, 검증기, 스코어러 등 다수의 에이전트가 협업해 리스크를 평가하는 작업은 기존에 많은 시간이 걸렸지만 AGI CPU는 이를 수 시간으로 단축할 수 있다"고 밝혔다. 고객 서비스 자동화 시연은 이메일을 자동으로 분류하고 고객에게 직접 전화를 거는 8개 에이전틱 AI가 동시 실행되는 환경을 보여줬다. 대부분의 에이전트는 AGI CPU에서 실행되며 복잡한 추론은 국내 AI 스타트업인 리벨리온 NPU 가속기를 활용했다. Arm 관계자는 "AGI CPU를 기반으로 필요할 경우 외부 가속기를 유연하게 통합 가능하며 이를 활용해 각종 이메일을 기존 대비 두 배 이상의 속도로 처리할 수 있다"고 설명했다. Arm은 기존 x86 서버 기반으로 작성된 코드를 Arm 기반으로 변환하기 위한 도구도 함께 시연했다. AI 에이전트가 기존 코드와 컨테이너를 분석해 자동으로 수정하는 한편 성능이 저하되는 병목구간에서 Arm AI 가속 명령어인 SVE를 적용해 추가 최적화를 지원한다. 전자설계자동화(EDA) 워크로드 시연에서는 실제 반도체 설계 환경 활용 사례를 보였다. AGI CPU에 내장된 최대 136개 코어를 활용해 더 많은 작업을 짧은 시간에 소화해 개발 단계를 단축할 수 있다. Arm 관계자는 "기존에는 지멘스나 시높시스 솔루션을 클라우드에서 활용해야 했지만 AGI CPU를 활용하면 시뮬레이션과 전력 분석 등 메모리 집약적 작업을 온프레미스 환경에서수행할 수 있다"고 밝혔다.

2026.03.25 16:18권봉석 기자

모빌린트, 스피어에이엑스와 엣지 AI 기반 영상 분석 협력

AI 반도체 기업 모빌린트가 AI 영상 분석 솔루션 기업 스피어에이엑스(SPHERE AX)와 AI 기반 안전·보안 및 스마트 인프라 사업 협력을 위한 전략적 업무협약(MOU)을 체결했다고 24일 밝혔다. 양사는 이번 협약을 통해 각 사가 보유한 기술력과 인프라를 결합해 엣지 AI 기반 영상 분석 솔루션을 공동 개발하고, 산업 현장의 안전 관리와 스마트 인프라 구축을 위한 사업 협력을 추진할 예정이다. 주요 협력 내용은 ▲엣지 AI 기반 지능형 영상 분석 솔루션 공동 개발 ▲산업 안전 및 보안 분야 사업 기회 공동 발굴 ▲기술 검토 및 실증(PoC) 수행 ▲공동 마케팅 및 생태계 연계 협력 등이다. 모빌린트는 자사의 고성능 NPU(신경망처리장치)를 기반으로 엣지 환경에서 고효율 AI 연산이 가능한 하드웨어 플랫폼을 제공하고, 스피어에이엑스는 AI 영상 분석 알고리즘 기술을 접목해 지능형 영상 분석 솔루션을 구현할 예정이다. 이를 통해 제조 현장, 건설 현장, 공공시설 등 다양한 산업 환경에서 실시간 안전 모니터링과 지능형 보안 시스템 구축을 추진한다는 계획이다. 특히 양사는 엣지 AI 기반 영상 분석 기술을 활용해 산업 안전 관리 및 스마트 인프라 분야에서 새로운 사업 기회를 공동 발굴하고, 실제 운영 환경에서의 성능 검증(PoC)을 통해 상용화를 추진할 예정이다. 신동주 모빌린트 대표는 “스피어에이엑스의 AI 영상 분석 기술과 모빌린트의 고성능 NPU 기술이 결합되면 산업 현장에서 요구되는 실시간 AI 분석과 안정적인 시스템 구축이 가능해질 것”이라며 “양사의 협력을 통해 지능형 안전 관리 및 스마트 인프라 분야에서 새로운 AI 솔루션 모델을 만들어 나가겠다”고 말했다. 박윤하 스피어에이엑스 대표는 “스피어에이엑스가 보유한 영상 기반 AI 추론 기술과 모빌린트의 NPU 기반 엣지 AI 하드웨어플랫폼이 결합되면 향후 피지컬 AI 분야에서 큰 시너지를 창출할 수 있을 것으로 기대한다”며 “특히 모빌리티, 드론, 로봇 등 다양한 산업 영역에서 영상 기반 AI 인지 및 판단 기술이 중요한 역할을 하게 될 것으로 보고 있으며, 양사의 기술 협력을 통해 이러한 분야에서 새로운 AI 응용 시장을 개척하고 글로벌 시장을 선도해 나가겠다”고 밝혔다.

2026.03.24 14:59전화평 기자

AI 추론칩 꺼낸 엔비디아...韓 NPU, 위기인가 기회인가

인공지능(AI) 가속기 시장의 절대 강자인 엔비디아(NVIDA)가 연례 개발자 컨퍼런스 행사인 'GTC 2026'에서 추론 전용 가속기 LPU '그록3(Groq 3)'를 전격 공개하며 AI 반도체 시장의 판도 변화를 예고했다. 학습용 칩 시장의 절대 강자가 추론 시장 진입을 본격 선언한 것이다. 이에 그동안 경쟁이 덜한 추론 시장을 공략해온 리벨리온, 퓨리오사AI 등 국내 NPU(신경망처리장치) 기업들은 글로벌 리더와의 정면 승부라는 중대한 분수령을 맞이하게 됐다. 19일 반도체 업계에 따르면 엔비디아의 이번 행보는 국내 AI 반도체 기업들에 도전과 기회가 공존하는 중대한 시험대가 될 전망이다. 엔비디아가 추론 전용 가속기 라인업을 강화한 것은 추론 시장에서 가능성을 봤다는 의미와 함께, 국내 업체들이 공략해온 영역이 잠식될 수 있기 때문이다. 엔비디아의 '추론 칩' 양산 선언… 국내 업계엔 직접적 위협 가장 큰 위기는 시장 리더인 엔비디아가 본격적으로 추론용 칩 시장에 진입했다는 사실 자체다. 그간 국내 NPU 기업들은 엔비디아가 거대 AI 모델의 '학습' 시장에 주력하는 동안, 상대적으로 소홀했던 '추론' 영역을 틈새시장으로 보고 차별화를 꾀해왔으나 이제는 그마저 위협받게 됐다. 특히 엔비디아가 학습용 GPU의 약점으로 지목되던 전력 효율과 지연 시간까지 개선한 추론 전용 칩을 내놓으면서, 국내 업체들이 공들여온 '고효율 추론'이라는 방어벽이 흔들릴 수 있다는 우려가 나온다. 특히 국내 기업들이 공을 들여온 중동 시장의 판도 변화가 우려된다. 지난해 11월 미국 정부가 엔비디아 칩의 중동 수출을 허가하면서 리벨리온과 퓨리오사AI 등 국내 기업들이 선점하려던 신시장에 거대 공룡이 직접 진입하게 됐다. 신동주 모빌린트 대표는 “엔비디아가 추론 쪽에 본격적으로 뛰어들면서 올해부터 데이터센터 시장은 상당한 '레드오션'이 될 것”이라며 “결국 글로벌 빅테크들과 기술 및 영업 모든 면에서 직접 경쟁해야 하는 가혹한 상황”이라고 진단했다. “시장의 실재성 증명했다”... 역발상의 기회 반면 업계 일각에서는 엔비디아의 행보가 오히려 국내 NPU 기업들에 기회가 될 수 있다는 분석도 나온다. 시장 리더가 막대한 자금을 투입해 추론 전용 가속기를 내놓은 것은, 추론 시장의 폭발적인 성장 가능성을 전 세계에 공식적으로 확인해준 신호기 때문이다. AI 반도체 업계 관계자는 “엔비디아가 그록을 3배가 넘는 웃돈을 주고 인수한 것은 그만큼 추론 시장의 기회가 크다는 것을 방증한다”며 “이는 국내 업체들이 오랜 기간 준비해온 독자 아키텍처의 방향성이 틀리지 않았음을 증명하는 지표”라고 평가했다. 그러면서 “그록은 기존에도 경쟁 관계에 있던 반도체 업체인 만큼, 이번 발표가 새로운 위협이라기보다 기존 경쟁 구도의 연장선에 가깝다”고 분석했다. 김종기 세미파이브 전무는 “그간 추론 시장이 올 것이라는 말에 시장은 반신반의해왔으나, 엔비디아조차 트레이닝은 GPU로 하되 추론은 에이직이 필요하다고 선언하며 시장의 실재성이 완전히 입증됐다”며 “이러한 패러다임 전환은 기술력을 갖춘 국내 업체들에게는 오히려 플러스 요인이 될 것”이라고 내다봤다. '테스트베드' 부족이 최대 걸림돌… 포트폴리오 부재 우려 현 상황에서 국내 업계가 직면한 가장 심각한 문제점은 개별 기업의 기술력이 아닌 '테스트베드'의 부재다. 엔비디아의 그록3는 막강한 브랜드 파워와 기존 생태계를 바탕으로 실전 레퍼런스를 빠르게 확보하고 있는 반면, 국내 업체들은 제품을 대규모 환경에서 검증해볼 기회가 극히 제한적이다. 글로벌 대기업들은 특정 칩을 도입할 때 이미 시장에서 검증된 제품을 선호한다. 리스크를 짊어지지 않으려는 것이다. 국내 NPU 기업들이 아무리 뛰어난 효율성을 수치로 제시하더라도, 실제 서비스 환경에서 운영된 데이터가 부족해 글로벌 수주 경쟁에서 신뢰를 얻기 힘든 실정이다. 김 전무는 “국내 업체들도 특색 있는 기술력을 갖추고 있지만, 엔비디아나 그록에 비해 테스트베드가 부족한 것이 현실적인 불리함”이라며 “단순히 정부 권고로 쓰는 단계를 넘어 자발적인 수요가 발생할 수 있도록 검증 인프라를 대폭 확충해야 한다”고 강조했다. 다른 AI 반도체 관계자는 "(엔비디아는) 아마존, 마이크로소프트 등 하이퍼스케일러들에 대한 경험을 갖고 있는 점도 국내 업체들과 격차를 벌린다"며 "국내에서 레퍼런스를 쌓고, 해외에서 판매한다는 국내 AI반도체 업체들의 전략이 시장에서 통하려면 국가 전체가 AI 원팀이 돼야만 할 것"이라고 말했다.

2026.03.19 16:13전화평 기자

국방 AI 경쟁력, 반도체 주권에 달렸다…국산 NPU·생태계 구축 시급

국방 AI 반도체 경쟁력 확보를 위해 소버린 반도체 구축과 공급망 안정화가 핵심 과제로 제시됐다. 한국국방연구원(KIDA) 국방인공지능정책연구실과 과실연 AI미래포럼은 2026년 3월 18일 서울 강남구 모두의연구소 강남캠퍼스에서 산·학·연·군 관계자들이 참석한 가운데 '제26-3차 국방 인공지능 혁신 네트워크' 포럼을 공동 개최했다. '국방 AI 반도체'를 주제로 열린 이번 세미나에서는 무기체계 고도화와 국방 데이터센터 구축에 필수적인 AI 반도체 기술 동향을 점검하고, 군의 AI 도입 전략과 국내 반도체 생태계 협력 방안이 집중 논의됐다. 발제자로 나선 백준호 퓨리오사AI 대표는 '국방 AI 반도체: 현재와 미래'를 주제로 발표했다. 그는 "국방 AI의 핵심은 무기체계에 들어가는 엣지 디바이스뿐 아니라, 강력한 모델을 학습하고 전체 상황을 통제하는 데이터센터 인프라에 있다"고 강조했다. 이어 "AI 사용 확대로 추론 수요가 학습을 넘어서는 구조로 바뀌고 있다"고 진단했다. 국방 AI 역시 개별 무기체계보다 데이터센터 중심 구조가 중요하며, 이를 위한 인프라 투자가 필수라는 설명이다. 발제 이후에는 심승배 KIDA 책임연구위원의 사회로 패널 토의가 이어졌다. 토론에는 이형진 방위사업청 서기관, 신성규 리벨리온 부사장, 서영우 한화에어로스페이스 전무, 신동주 모빌린트 대표, 이승영 LIG넥스원 CTO, 이진원 하이퍼엑셀 CTO, 김중훈 네이버클라우드 리더가 참여했다. 이형진 방위사업청 서기관은 국방 반도체 정책 추진 상황을 소개하며 "2025년부터 국방 반도체 R&D를 본격 시작했고 전담 조직을 신설해 AI와 반도체를 통합적으로 추진하고 있다"고 밝혔다. 이어 "향후 예산 확대를 통해 AI 반도체 과제를 늘리고 관계 부처 협력을 통해 대형 과제도 추진할 계획"이라며 "수출 통제 환경을 고려하면 자체 반도체 확보는 필수"라고 강조했다. 신성규 리벨리온 부사장은 국방 AI 반도체의 핵심 과제로 공급망과 규제를 지목했다. 그는 "저지연 성능은 기본 전제"라며 "실제 사업에서는 전략물자 규제와 수출 통제 대응이 더 큰 장벽이 될 수 있다"고 말했다. 이어 "국내에서 설계, 제조, 패키징까지 이어지는 반도체 생태계를 구축하는 것이 공급망 관점에서 중요하다"고 밝혔다. 서영우 한화에어로스페이스 전무는 국산화 필요성을 강조했다. 그는 "국방은 국가 생존과 직결된 영역으로 외산 반도체와 AI에 의존하는 것은 리스크"라며 "국산 반도체와 국산 AI 모델을 함께 활용하는 구조가 필요하다"고 말했다. 이어 "민간 기업만으로는 한계가 있는 만큼 정부 차원의 적극적인 투자와 지원이 필요하다"고 덧붙였다. 신동주 모빌린트 대표는 엣지 AI 환경에서의 반도체 중요성을 강조했다. 그는 "드론과 로봇 등 차세대 무기체계에서는 온디바이스 AI 반도체가 핵심 역할을 한다"며 "국내 기술력은 이미 글로벌 수준에 올라와 있다"고 평가했다. 이어 "향후 2~3년이 산업 경쟁력을 좌우할 골든타임으로, 이 기간 내 협력을 통해 실질적인 성과를 만들어야 한다"고 말했다. 이승영 LIG넥스원 CTO는 실무 도입 관점에서의 과제를 짚었다. 그는 "무기체계는 높은 신뢰성과 검증이 요구된다"며 "NPU가 바뀌어도 기존 알고리즘이 동일하게 동작할 수 있는 소프트웨어 표준이 필요하다"고 설명했다. 이어 "시험·검증 인프라와 공통 소프트웨어 스택이 구축돼야 산업 확산이 가능하다"고 강조했다. 이진원 하이퍼엑셀 CTO는 AI 반도체의 방향성을 특화로 제시했다. 그는 "범용 칩보다는 사용 시나리오에 맞춘 특화 반도체가 중요해지고 있다"며 "국방도 요구사항을 명확히 제시하면 최적화된 칩을 빠르게 개발할 수 있다"고 밝혔다. 이어 "사용자 피드백 기반 생태계가 기술 발전을 가속화할 것"이라고 덧붙였다. 김중훈 네이버클라우드 리더는 실제 서비스 관점에서 접근해야 한다고 강조했다. 그는 "AI 반도체 평가는 결국 사용자 시나리오가 기준"이라며 "지연시간, 처리량, 동시 접속자 수 등 실제 운영 환경을 고려해야 한다"고 설명했다. 이어 "데이터센터와 엣지 사이 중간 영역까지 고려한 아키텍처 설계도 필요하다"고 말했다.

2026.03.18 13:06남혁우 기자

K-엔비디아 육성에 50조 투자...배경훈 "GPU 독점 깬다"

정부가 엔비디아 중심의 글로벌 AI 반도체 독점 구조를 타파하기 위해 향후 5년간 총 50조원 규모의 금융 지원에 나선다. 국내 토종 AI 반도체 5개사를 대상으로 대규모 정책 자금을 투입, '장기 인내 자금'을 통해 글로벌 시장 안착을 전폭 지원한다는 전략이다. 과학기술정보통신부와 금융위원회는 17일 오후 서울 프레스센터에서 '국민성장펀드 K-엔비디아 프로젝트 민관 합동 간담회'를 열고 이 같은 내용의 AI 반도체 산업 도약 지원 방안을 발표했다. 배경훈 부총리 겸 과학기술정보통신부 장관은 이날 인사말에서 “현재 글로벌 AI 시장은 엔비디아의 GPU가 사실상 독점하고 있지만, 고비용과 막대한 전력 소모라는 치명적인 한계에 직면해 있다”고 진단하며, “우리가 가진 저전력·고효율 NPU 기술에 금융권의 전폭적인 지원이 더해진다면 충분히 글로벌 시장의 판도를 바꿀 수 있다”고 강조했다. 이어 “이번 프로젝트는 단순한 자금 공급을 넘어 금융과 산업이 원팀으로 움직이는 메가 프로젝트의 시작”이라며 “국내 AI 반도체 기업들이 엔비디아를 넘어선 'K-엔비디아'로 거듭날 수 있도록 정부가 든든한 버팀목이 되겠다”고 덧붙였다. 국내 NPU 5개사 대표 한자리… 'K-엔비디아' 주역으로 육성 이날 행사에는 국내 AI 반도체 시장을 이끄는 주요 팹리스 기업인 리벨리온, 퓨리오사AI, 딥엑스, 하이퍼엑셀, 모빌린트 등 5개사 대표 및 관계자들이 참석해 정부의 지원 방안을 경청하고 현장의 애로사항을 전달했다. 정부는 이들 5개사를 필두로 한 국내 팹리스 생태계가 글로벌 수준의 유니콘으로 성장할 수 있도록 맞춤형 금융 솔루션을 제공할 계획이다. 특히 기술 발전 속도가 빠른 AI 산업 특성을 고려해, 단순 대출 위주의 지원에서 벗어나 지분 투자와 정책 펀드를 결합한 다각도 지원책을 마련한다. 올해 10조원 집중 투입… '장기 인내 자금'으로 팹리스 뒷받침 금융위원회는 올 한 해에만 약 10조원 규모를 AI와 반도체 분야에 집중 투자하고, 향후 5년간 총 50조원 규모의 대규모 장기 투자를 추진할 계획이다. 특히 초기 개발 비용이 높고 운영 과정에서 전력 비용 부담이 큰 AI 산업의 특성을 반영해, 기업들이 흑자 전환까지 버틸 수 있는 '장기 인내 자금' 공급에 주력한다. 이억원 금융위원장은 “AI 산업은 반도체부터 서버, 클라우드 구축까지 전 주기에 걸친 대규모 투자가 필수적”이라며 “기술력이 있는 기업이 자금난으로 고사하지 않도록 기업의 성장 단계에 맞는 자금을 맞춤형으로 공급하겠다”고 말했다. AI 3대 강국 도약을 위해서는 1차 메가프로젝트에 포함된 'K-엔비디아 육성', '국가 AI컴퓨팅센터'뿐 아니라 '피지컬 AI 생태계 구축', '공공·산업 AI전환(AX) 가속' 등을 적극 지원하는 한편 후속 메가 프로젝트를 지속적으로 발굴해나가야 한다고도 밝혔다. 박태완 정보통신산업정책관은 "AI 반도체 시장의 패러다임이 범용성에서 효율성으로 옮겨가고 있다"며 "국내 기술 혁신이 성과로 연결되려면 대규모 자본 투입이 필수적이며 이를 위해 국민성장펀드와의 연계를 통한 집중 투자가 뒷받침돼야 한다"고 말했다. 정부는 이날 도출된 제안들을 향후 펀드 운용 계획에 적극 반영하고, 상반기 중 7대 메가 프로젝트에 대한 승인 절차를 마무리할 예정이다.

2026.03.17 16:50전화평 기자

세미파이브, 180억원 규모 4나노 NPU 수주

인공지능(AI) 맞춤형 반도체(ASIC) 기업 세미파이브가 AI 반도체 개발 프로젝트를 잇따라 수주했다. 세미파이브는 4nm(나노미터, 10억분의 1m) AI 신경망처리장치(NPU)를 개발하는 약 180억원 규모 턴키 설계 계약을 체결했다고 13일 밝혔다. 세미파이브는 이전부터 4나노에서 레퍼런스를 쌓아왔다. ▲엑시나의 CXL 기반 4나노 개발 사업 ▲하이퍼엑셀의 LPU 4나노 개발 사업 등에 이은 연속 수주다. 이번에 수주한 사업은 네트워크 연결없이 기기 자체에서 AI 연산을 수행하는 '온프레미스' 환경에 최적화된 차세대 AI NPU 상용화를 목표로 한다. 해당 제품은 고해상도 비전 AI와 거대언어모델(LLM) 추론 등 대규모 데이터의 실시간 처리가 필수적인 환경에 맞춰 설계되며, 차세대 메모리 인터페이스를 선제 적용해 데이터 병목 현상을 구조적으로 개선하는 것이 핵심이라고 회사 측은 설명했다. 이를 통해 반도체 핵심 지표인 PPA(전력·성능·면적) 효율을 극대화함으로써, 고성능과 저전력을 동시에 구현한 AI 가속기를 선보일 전망이다.' 조명현 세미파이브 대표는 “이번 수주는 세미파이브가 축적해 온 압도적인 기술 레퍼런스와 맞춤형 반도체 설계 역량이 시장에서 가장 강력한 경쟁 우위에 있음을 다시 한번 증명한 사례”라며, “혁신적인 AI 아키텍처를 가진 고객사들과의 협력을 통해 고성능 AI 반도체 개발 분야에서 시너지를 극대화하고, AI ASIC 전문 기업으로서 맞춤형 반도체 시장의 주도권을 확실히 선점해 나가겠다”고 강조했다.

2026.03.15 09:06전화평 기자

남부발전, 퓨리오사AI와 국산 AI 반도체 생태계 조성 협력

남부발전이 인공지능(AI) 대전환 가속화 흐름에 발맞춰 국산 반도체 기술을 활용한 에너지 생태계 육성에 나선다. 한국남부발전(대표 김준동)은 퓨리오사AI와 '에너지 효율 중심의 국산 AI 인프라 생태계 구축'을 위한 업무협약(MOU)을 체결했다고 밝혔다. 이번 협약은 기존 외산 고가 그래픽처리장치(GPU) 의존도를 낮추고, 전력 효율이 뛰어난 국산 신경망처리장치(NPU) 기반 AI 인프라를 구축하기 위해 마련됐다. 이를 통해 남부발전은 발전설비 운영 비용을 절감하고, 퓨리오사AI는 국산 AI 반도체의 실제 산업 현장 적용 사례를 확보해 기술 자립도를 높인다는 방침이다. 두 회사는 국산 기술 기반 저전력·고성능 AI 인프라 구축을 목표로 ▲NPU 기반 AI 서버 도입·실증 ▲국산 AI 인프라 최적화를 위한 시스템 성능 개선 ▲GPU와 NPU 간 분산 처리를 위한 하이브리드 운영 방안 모색 ▲최신 AI 기술 관련 교류 및 공동 연구 등을 추진할 예정이다. 특히 이번 협력에는 퓨리오사AI의 2세대 NPU인 '레니게이드(RNGD)'가 활용된다. 이 모델은 높은 전력 효율성이 검증된 만큼, 남부발전은 이를 통해 핵심 AI 기술의 성능을 검증하고 대상 시스템을 단계적으로 확대해 차세대 AI 반도체 기술력 선점의 전초기지 역할을 수행할 예정이다. 김준동 남부발전 사장은 “이번 협약은 국산 기술로 안정적이고 효율적인 AI 기반 환경을 조성하는 의미 있는 첫걸음”이라며 “국산 AI 반도체 기술이 실제 산업 현장의 실효성을 입증하고, 향후 다른 공공기관과 산업계로 확산되는 계기가 되길 바란다”고 밝혔다.

2026.03.13 02:00주문정 기자

베슬AI-리벨리온, 국산 NPU 클라우드 기술력 입증한다…피지컬 AI 공략

베슬AI가 국산 인공지능(AI) 반도체와 소프트웨어(SW) 플랫폼을 결합한 'K-AI 풀스택' 기반 인프라를 구축해 공공·지자체 피지컬 AI 시장과 글로벌 실증 확대에 나선다. 베슬AI는 리벨리온과 국산 신경망처리장치(NPU) 기반 클라우드 인프라 구축을 위한 업무협약(MOU)을 체결했다고 12일 밝혔다. 이번 협약은 양사의 인적·물적 자원과 기술 정보를 교류해 국산 NPU 하드웨어(HW)와 AI SW 플랫폼을 결합한 경쟁력 있는 AI 인프라 모델을 구축하기 위해 추진됐다. 양사는 로보틱스와 스마트 제조 등 실제 물리적 환경에서 대규모 연산이 필요한 피지컬 AI 수요에 공동 대응할 계획이다. 주요 협력 분야는 ▲국산 NPU와 베슬 SW를 결합한 패키지 솔루션 공동 기획·개발 및 고도화 ▲상호 기술 통합 검토 및 성능검증(PoC)을 위한 테스트 환경 협력 ▲국내 공공·지자체 및 해외 시장 대상 공동 사업 기회 발굴 등이다. 양사는 국내 시장에서 전북 등 지역 거점을 중심으로 추진되는 피지컬 AI 클러스터 조성 사업과 지자체 AI 전환(AX) 프로젝트 기회를 선제적으로 확보하는 데 집중할 방침이다. 이를 통해 기존 외산 솔루션 중심의 인프라 환경을 국산 AI 기술 스택으로 전환하고 공공 시장에서의 도입 효과를 검증해 나갈 계획이다. 글로벌 시장 공략도 병행한다. 양사는 중동과 동남아시아 지역을 중심으로 국산 NPU 기반 인프라 PoC 기회를 공동 발굴해 현지 산업 현장에 적용 가능한 피지컬 AI 인프라 구축 사례를 확보한다는 목표다. 외산 반도체 의존도를 낮추고 가격 대비 성능이 높은 K-AI 풀스택의 글로벌 경쟁력을 입증한다는 전략이다. 이번 협력에서 베슬AI는 국산 NPU 기반 인프라 위에서 AI 모델이 안정적으로 실행·운영될 수 있도록 오케스트레이션 플랫폼을 제공한다. NPU 특성에 맞는 워크로드 배치와 실행 구조를 설계해 연산 효율과 운영 안정성을 확보한다. 또 국산 거대언어모델(LLM)이 산업 현장에 적용될 수 있도록 LLM 운영관리(LLMOps) 체계를 구축할 예정이다. 리벨리온은 데이터센터와 클라우드 환경에 최적화된 국산 NPU와 전용 SW 스택(SDK)을 공급한다. 양사는 대규모 다중 사용자 환경에서의 인프라 안정성과 성능을 검증하고 NPU 전용 인프라 아키텍처를 공동 설계해 국내 NPU 데이터센터 구축을 위한 기술 검증을 진행한다. 안재만 베슬AI 대표는 "이번 협약은 단순한 기술 교류를 넘어 지역 클러스터와 글로벌 시장에서 실제 작동하는 AI 인프라 사례를 확보하기 위한 기반을 마련하는 것"이라며 "이번 협업을 계기로 국산 NPU 기반 인프라 적용 범위를 확장하며 피지컬 AI 시장 대응 역량을 강화할 예정"이라고 말했다. 박성현 리벨리온 대표는 "비용 효율성이 핵심인 AI 인프라 시장에서 이번 협력은 NPU 기반의 대규모 클라우드를 구축하는 독보적인 사례가 될 것"이라며 "NPU HW부터 클라우드 인프라까지 K-AI 풀스택을 국산 기술로 완성하는 이번 시도를 통해 소버린 AI의 실질적인 경쟁력을 증명하겠다"고 밝혔다.

2026.03.12 15:22한정호 기자

AMD "AI PC, CPU·GPU·NPU 모두 활용 필요"

"마이크로소프트는 2024년 이후 신경망처리장치(NPU)를 활용한 스튜디오 효과, 이미지 편집, 카메라 영상 처리 등을 꾸준히 투입하고 있다. 40 TOPS(1초당 1조번 연산) 이상의 NPU가 없다면 이런 기능 활용은 불가능하다." 11일 오전 서울 삼성동에서 진행된 'AI PC 부트 캠프' 행사에서 김홍필 AMD 시니어 솔루션 아키텍트(이사)가 이렇게 설명했다. NPU는 AI 추론 연산에 특화된 프로세서로, GPU보다 전력 소모가 낮고 INT8 등 저정밀 연산에 효율적이다. AMD는 이날 AI PC용으로 설계된 라이젠 AI 300/400 시리즈 프로세서와 NPU의 활용 상황, GPU 대비 NPU가 가진 전력소모 등 이점과 향후 전망 등을 소개했다. 이날 김홍필 이사는 "시장조사업체 IDC 통계에 따르면 올해를 기점으로 전체 PC 출하량 중 NPU 탑재 제품 비율이 크게 늘어나고 있다. 특히 소형·경량 노트북에는 앞으로 NPU가 반드시 탑재되는 방향으로 갈 것"이라고 설명했다. AMD, 2024년부터 NPU 강화 나서 AMD가 2024년 10월부터 공급중인 노트북용 프로세서인 라이젠 AI 프로 300은 젠5(Zen 5) 기반 CPU, RDNA 3.5 기반 GPU와 XDNA 2 NPU(신경망처리장치)를 결합했다. 김홍필 이사는 "AI 초창기부터 현재까지 많은 AI 모델이 주로 GPU를 활용한다. GPU는 주로 FP32(부동소수점 32비트) 등 연산에 최적화된 반면, NPU는 INT8(정수 8비트) 처리에 최적화됐다. 특히 추론에서는 속도나 메모리 용량에 유리하다"고 설명했다. 올해부터 공급되는 라이젠 AI 400 시리즈는 전작 대비 작동 클록과 메모리 작동 속도 향상으로 CPU와 GPU, NPU 성능을 모두 강화했다. NPU 성능은 전작(50 TOPS) 대비 20% 향상된 60 TOPS까지 올라갔다. "코파일럿+ 시작으로 NPU 활용 S/W 증가 추세" 마이크로소프트 윈도11 코파일럿+ 기능은 2024년 6월 출시된 퀄컴 스냅드래곤 X 엘리트를 시작으로 같은 해 11월부터 인텔·AMD 등 x86 계열 프로세서까지 확장됐다. 주변 대화나 소리를 실시간으로 감지해 자막으로 띄우는 '라이브 캡션', PC 작동 내역을 실시간으로 추적했다 필요한 시점으로 돌아가 확인하는 '리콜' 등이 지원된다. 코파일럿+ 기능 이외에도 마이크로소프트 오피스, 어도비·블랙매직·사이버링크 등 콘텐츠 제작용 솔루션, 피싱이나 악성 코드를 실시간으로 감지하는 보안 솔루션까지 NPU 활용이 확장되는 상황이다. 김홍필 이사는 "현재는 각종 콘텐츠 제작에 AI가 가장 많이 쓰이지만 앞으로는 CPU와 GPU, NPU 3개를 모두 활용해 효율적으로 로컬 AI를 구동하는 것이 중요하다. AMD는 여러 회사와 함께 더 많은 활용 사례를 만들기 위해 노력하고 있다"고 설명했다. NPU 구동해 LLM 실행시 토큰 속도 향상 이날 AMD는 라이젠 AI 7 350 프로세서와 24GB 메모리를 탑재한 HP 엘리트북6 G1a를 이용해 NPU 활용시 전력 소모와 처리 시간을 비교했다. 첫 번째 시연에서는 클라우드 없이 PC에서 직접 거대언어모델(LLM)을 구동하는 오픈소스 소프트웨어 '레모네이드'를 활용했다. AMD CPU와 NPU에 최적화된 딥시크 R1 80억 매개변수 모델을 이용해 첫 토큰(단어) 소요 시간과 초당 토큰 출력 시간을 확인했다. CPU만 구동할 때 첫 토큰 출력까지 1.4초, 초당 토큰은 3.8토큰인 반면 NPU만 활용할 때는 첫 토큰 출력에 2.27초, 초당 토큰은 6.7토큰으로 향상됐다. 프로세서 전력 소모도 CPU만 활용시는 33.20W, NPU 활용시는 절반 가량인 16.59W로 전력 소모 면에서도 일정 부분 이점이 있었다. "NPU 최적화 일부 모델은 GPU 대비 더 빨라" 두 번째 시연은 사진과 영상 콘텐츠를 생성하는 AI 모델을 구동할 수 있는 '어뮤즈'를 활용했다. 스테이블 디퓨전 3.0을 AMD 실리콘에 최적화한 모델로 2048×2048 화소 이미지 생성시 소요 시간을 비교했다. '상자 안의 고양이(A cat in a box)'를 프롬프트로 주고 실행할 때 NPU를 활용하면 총 소요 시간은 127.5초 걸렸다. 반면 GPU만 활용시 소요시간은 296.8초로 2.5배 더 길어졌다. 프로세서 작동 온도에도 일부 차이가 있다. NPU 활용시 온도는 50도로 측정됐지만 GPU만 활용하면 전체 온도는 60도까지 상승한다. 또 과열을 막기 위해 일시적으로 성능을 끌어내리는 스로틀링이 작동해 오히려 더 처리 시간이 길어졌다. 김홍필 이사는 "NPU와 GPU의 연산 정밀도에는 차이가 있고 정밀도를 내릴 수록 처리 시간은 줄어든다. 아직 NPU에 특화된 모델이 드물지만 메모리 용량이나 성능에 일정한 제약이 있는 상황에서 NPU가 더 효율적인 선택지를 줄 수 있다는 의미"라고 설명했다. "NPU 수치보다는 AI 모델 최적화 여부가 관건" 현재 인텔, AMD, 퀄컴 등 주요 AI PC용 프로세서 제조사는 NPU 성능을 차별화 포인트 중 하나로 내세운다. 45 TOPS(퀄컴 헥사곤)로 시작해 50 TOPS(인텔 NPU5), 60 TOPS(AMD) 등 수치상으로는 계속 향상되고 있다. 김홍필 이사는 "실리콘 제조사가 이야기하는 TOPS는 행렬로 구성된 숫자를 서로 곱한 다음 더하는 MAC(곱셈 가산) 수치를 기준으로 한 것이다. 이를 측정하는 벤치마크 도구들이 있지만 정확한 값을 드러낸다고 볼 수 없다"고 설명했다. 이어 "마이크로소프트가 코파일럿+ 기준으로 제시한 40 TOPS는 하한선이다. TOPS 수치가 일종의 마케팅 수단이 됐지만 결국 전반적으로 NPU가 여러 AI 모델에 얼마나 최적화되고 많이 활용되느냐가 더 중요한 사안"이라고 덧붙였다.

2026.03.11 15:49권봉석 기자

TI, MCU 제품군 확장…"모든 기기에 엣지 AI 구현 지원"

텍사스인스트루먼트(TI)가 엣지 인공지능(AI) 기능을 갖춘 두 개의 새로운 마이크로컨트롤러(MCU) 제품군을 11일 공개했다. 새롭게 공개한 MSPM0G5187 및 AM13Ex MCU 제품군은 TI가 전체 임베디드 프로세싱 포트폴리오 전반에 엣지 AI를 구현하겠다는 전략을 뒷받침하는 제품이다. 두 제품군 모두 TI 타이니엔진(TinyEngine) 신경망처리장치(NPU)를 통합했다. 타이니엔진 NPU는 딥러닝 추론 작업을 최적화하도록 설계한 MCU 전용 하드웨어 가속기다. 엣지 환경에서 처리 지연을 줄이고 에너지 효율을 높인다. TI의 임베디드 프로세싱 포트폴리오는 CC스튜디오(CCStudio) 통합개발환경(IDE)을 포함한 포괄적 개발 생태계를 기반으로 한다. 엔지니어들은 IDE가 제공하는 생성형 AI 기능을 활용해 간단한 자연어 입력만으로 코드 개발, 시스템 구성, 디버깅을 빠르게 수행할 수 있다. 이는 TI 데이터와 결합된 업계 표준 에이전트 및 모델로 구현된다. TI는 웨어러블 헬스 모니터, 가정용 회로 차단기의 실시간 모니터링, 휴머노이드 로봇의 피지컬 AI 등 다양한 전자 디바이스에서 엣지 AI 도입을 가속하고 있다. 아미카이 론 TI 임베디드 프로세싱 및 DLP 부문 수석부사장은 "TI는 약 50년 전 디지털 신호 프로세서를 발명하며 오늘날 엣지 AI 처리 기반을 마련했다"며 "범용 MCU와 고성능 실시간 MCU를 포함한 전체 MCU 포트폴리오에 타이니엔진 NPU를 통합함으로써 차세대 혁신을 이끌고 있다"고 말했다. 밥 오도넬 테크날리시스 리서치 사장 겸 수석 연구원은 "현재 업계 관심은 대형 시스템온칩(SoC0을 위한 AI 가속과 NPU에 집중되고 있지만, 실제로 더 흥미롭고 파급력 있는 일부 AI 애플리케이션은 MCU 같은 소형 칩에서도 구현될 수 있다"며 "엣지 기반 AI 가속 애플리케이션은 소비자 전자제품을 더욱 지능적으로 만들고 산업용 디바이스의 효율성을 높일 수 있다"고 말했다.

2026.03.11 14:34장경윤 기자

  Prev 1 2 3 4 5 6 7 8 9 Next  

지금 뜨는 기사

이시각 헤드라인

삼성·SK, 서남권 반도체 등에 895조원 투자…정부 "파격 지원" 약속

홈플러스 회생 막판 총력전…범여권, MBK·메리츠 압박

AI는 북중미 월드컵을 어떻게 바꿨나

李대통령 "용인·서남권 팹 동시 구축, 삼성·SK 회장 약속 받아"

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.