• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
  • AI의 눈
AI의 눈
HR컨퍼런스
디지털트러스트
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'NPU'통합검색 결과 입니다. (136건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

'갤S26' 오래 쓸수록 안다…스냅드래곤 8 엘리트 5세대의 진가

올해 초 출시된 삼성전자 '갤럭시 S26' 시리즈가 흥행가도를 달리고 있다. 특히 최상위 모델인 울트라 모델의 경우, 국내 사전 판매량에서 70%의 비중을 차지할 정도로 압도적인 선호도를 자랑한다. 갤럭시S26 울트라의 성공을 이끈 주역은 단연 퀄컴 '스냅드래곤8 엘리트 5세대'다. 해당 칩셋은 스마트폰의 두뇌 역할을 담당하는 모바일 AP(애플리케이션 프로세서)다. 갤럭시 S26 일반·플러스 모델은 삼성전자의 자체 칩셋인 '엑시노스'를 일부 탑재했으나, 울트라 모델 만큼은 스냅드래곤이 공고한 입지를 다지고 있다. 장시간 게이밍·AI 작업도 거뜬…스냅드래곤 8 엘리트 5세대의 힘 스냅드래곤 8 엘리트 5세대의 실제 성능을 확인하기 위해 FPS 모바일 게임 '레인보우 식스 모바일'을 실행했다. 게임 내 그래픽은 '매우 높음', FPS는 최대 60으로 설정했다. 또한 갤럭시 기기 내 게임 부스터 기능을 통해 성능을 우선하도록 했다. 그 결과 갤럭시S26은 화면 녹화 기능을 동시에 실현 중임에도 매우 쾌적한 게이밍 환경을 지원했다. 시스템 모니터링 기능에 따르면 FPS는 대부분 60을 유지했고, CPU 부하는 30%대, GPU는 60~70%대를 나타냈다. 1시간 넘게 이어진 게임 및 화면 녹화에도 기기의 발열은 적절한 수준을 유지했다. 게임의 요구 사양 및 최적화 여부에 따라 차이는 있겠으나, 최신 게임을 즐기는 데 전반적으로 무리가 없을 것으로 보인다. 이는 상시 일정한 성능을 유지하도록 설계된 스냅드래곤 8 엘리트 5세대의 힘이다. 해당 칩셋은 퀄컴 오라이온 CPU를 기반으로 한 2+6 옥타코어 구조를 채택했다. 최대 4.74GHz 프라임 코어 2개와 최대 3.62GHz 퍼포먼스 코어 6개로 구성되며, 이전 세대 대비 약 19% 성능이 향상됐다. 슬라이스드 아키텍처 기반 아드레노(Adreno) 840으로 재설계된 GPU는 작업 부하에 따라 연산 유닛을 병렬로 활용하는 구조를 갖추고 있다. 그래픽 성능은 24% 향상되고, 전력 효율은 20% 개선됐다. 또한 최첨단 파운드리 공정인 3나노미터(nm)을 적용해, 매우 강력한 성능을 뒷받침한다. 이를 통해 장시간 사용이나 멀티태스킹 환경에서도 고성능 어플리케이션을 안정적으로 구동할 수 있다는 게 퀄컴의 설명이다. 칩셋의 성능을 가늠해볼 수 있는 긱벤치6 테스트 결과는 싱글코어 3632점, 멀티코어 1만1067점으로 나타났다. GPU는 2만2604점이다. 갤럭시S25 울트라(싱글코어는 2852점, 멀티코어 9433점) 대비 큰 폭의 향상이 있던 것으로 분석된다. 그래픽 성능을 검증하는 3D마크 와일드 라이프 익스트림의 경우 7345점을 기록했다. 평균 FPS는 43.99다. 해당 벤치마크 테스트가 집계한 전체 결과 중 상위 2%에 해당하는 수치다. 갤럭시S26 시리즈의 핵심 무기인 에이전트 AI 기능도 완벽히 지원한다. 스냅드래곤 8 엘리트 5세대는 최신 퀄컴 AI 엔진으로 이전 대비 39% 향상된 헥사곤 (Hexagon) NPU를 갖췄다. 동시에 CPU 내에서 AI 연산을 보조하는 QMX(Qualcomm Matrix Extensions) 엔진은 소규모 AI 연산까지 빠르게 처리한다. 대형 모델은 NPU가, 경량 추론은 NPU와 QMX 엔진이 담당하는 이기종(Heterogeneous) 컴퓨팅 구조로 다양한 에이전트 AI 기능을 효율적으로 처리할 수 있다. APV 코덱 지원…전문가 수준 영상 촬영 가능케 해 스냅드래곤 8 엘리트 5세대는 모바일 플랫폼 최초로 APV(Advanced Professional Video) 코덱 기반의 영상 촬영을 제공하는 칩셋이기도 하다. APV는 전문 영상 제작을 위해 설계된 코덱으로, 고비트레이트 레코딩과 손실이 거의 없는 화질을 제공한다. 전용 하드웨어 인코딩·디코딩을 통해 스마트폰에서도 시네마급 영상 처리가 가능하다. 육안상 RAW에 가까운 화질을 유지하며 컬러 그레이딩이나 노출 보정과 같은 후반 작업에서도 디테일 손실이 거의 없다. 실제로 APV 코덱을 활성화해 서울 여의도 일대의 야경을 촬영해보니, 별도의 기기나 어플이 없이도 매우 선명한 영상을 찍을 수 있었다. 빠르게 달리는 차량도 빛 번짐없이 포착했다. 영상 촬영의 최대 화질은 8K에 달하며, UHD 화질에서는 최대 60FPS의 프레임을 지원한다.

2026.04.24 13:19장경윤 기자

[리뷰] Arm PC 완성형에 근접한 스냅드래곤 X2 엘리트 익스트림

퀄컴이 Arm 기반 윈도 AI PC를 위해 개발한 스냅드래곤 X2 엘리트·엘리트 익스트림 시스템반도체(SoC) 탑재 PC가 이달 중순부터 국내외 시장에 공급되기 시작했다. 스냅드래곤 X2 시리즈 중 최상위 제품인 스냅드래곤 X2 엘리트 익스트림은 자체 개발한 Arm 호환 3세대 오라이언 CPU와 아드레노 X2 GPU, 80 TOPS(1초당 1조 번 연산)급 헥사곤 NPU를 조합해 AI 성능을 강화했다. 여기에 LPDDR5X-9523 메모리 48GB를 프로세서와 통합해 초당 200GB 이상 메모리 대역폭과 지연시간 단축, 전력 소모 절감을 노렸다. 23일 현재 국내 시장에는 스냅드래곤 X2 엘리트를 탑재한 에이수스 젠북 A14, 스냅드래곤 X2 엘리트 익스트림을 탑재한 젠북 A16이 출시됐다. 이중 젠북 A16 모델(UX3607OA-SQ012W)로 스냅드래곤 X2 엘리트 익스트림의 실제 성능을 확인해 봤다. 1.2kg 무게에 16인치 OLED 탑재 '젠북 A16' 평가를 위해 대여한 제품은 18코어 CPU(4.7GHz/5.0GHz)와 LPDDR5X-9523 48GB 메모리, PCI 익스프레스 4.0 1TB SSD와 2880×1800 화소, 120Hz OLED 디스플레이를 탑재했다. 배터리 용량은 70Whr이다. 입출력 단자는 HDMI 2.1 영상출력과 USB-C 2개, USB-A 1개와 이어폰/마이크용 3.5mm 단자, SDXC 메모리카드 리더로 구성됐다. 무선 연결은 와이파이7(802.11be)과 블루투스 6.0을 지원한다. 본체 재질은 에이수스가 개발한 고내구성 합금인 세랄루미늄을 적용했다. 무게는 1.20kg, 두께는 13.8~16.5mm로 휴대성을 강화했다. OLED 번인을 방지하는 'OLED 케어' 기술이 적용됐다. 정가는 359만 9000원으로 책정됐다. 전 세대比 CPU 기본 성능 20% 향상 UL 프로시온(Procyon) 내 오피스 벤치마크는 실제로 마이크로소프트 오피스로 각종 문서를 제작하는 과정을 거치며 반응 속도와 성능을 측정하고 이를 바탕으로 점수를 매긴다. 스냅드래곤 X2 엘리트 익스트림의 CPU는 전 세대 제품인 스냅드래곤 X 엘리트 대비 최대 20% 성능이 향상됐다. 배터리 작동 시 성능도 전 세대 최대 성능에 근접한다. 어도비 프리미어 프로와 라이트룸 클래식 등 호환성 개선으로 UL 프로시온의 3대 벤치마크를 모두 수행 가능했다. 배터리로 작동할 때 성능은 어댑터 최고 성능 작동시 대비 25% 가량 줄어드는 수준이다. 웹브라우저 내에서 그래프 작성, 문서 작성, AI 추론을 실행하는 웹엑스퍼트4(WebXPRT 4) 테스트 점수는 385점으로 전 세대 대비 25% 가량 향상됐다. 배터리 작동시 성능 하락 폭이 큰 데 제조사인 에이수스의 전력 관리 정책(제조사 설정)에 따른 영향으로 추정된다. GPU 성능과 게임 호환성 동시 개선 퀄컴은 작년 11월 스냅드래곤 X2 엘리트 익스트림 내장 아드레노 X2 GPU를 가리켜 "퀄컴이 지금까지 만든 GPU 중 가장 크고 빠른 제품"이라고 설명했다. 성능이 전 세대 대비 평균 2.3배 이상 향상됐다는 것이 퀄컴 설명이다. 그래픽 성능 측정 프로그램인 3D마크에 내장된 시나리오 '타임스파이(Timespy)'는 윈도 운영체제의 다이렉트X 12 얼티밋 기반 게임 구동 성능을 측정한다. 점수는 전 세대 대비 2배 이상 향상됐고 경쟁사인 인텔 코어 울트라 200V 내장 '아크 140V'와 동등한 수준이다. GPU 성능 향상은 실제 게임에서도 크게 드러난다. 게임 5종 대상으로 1920×1200 화소, 그래픽 수준 '높음'에서 실행한 벤치마크에서는 초당 최저 프레임이 50프레임을 넘겼다. 전 세대(서피스 프로 11)에서 1920×1080 해상도, 화면 해상도 '높음' 실행시 초당 30프레임 미만에 머물렀던 것을 감안하면 2배 가까운 성능 향상 효과로 볼 수 있다. 세로 해상도가 다소 늘어났음에도 성능 향상 폭은 큰 편이다. 게임 호환성 면에서도 진전이 있다. 에픽게임스와 협업해 안티치트 프로그램 호환성을 확보한 결과로 '포트나이트'가 오류 없이 실행됐다. 최근 출시된 '몬길: STAR DIVE'는 초기 실행시 비정상 종료만 피하면 이후 문제 없이 구동됐다. INT8 AI 처리 성능 평균 두 배 향상 스냅드래곤 X2는 플러스/엘리트/엘리트 익스트림 모두 전 세대(45 TOPS) 대비 1.6배 가량 연산 성능을 높인 80 TOPS급 헥사곤 NPU를 내장한다. UL 프로시온의 컴퓨터 비전 AI 벤치마크와 긱벤치 AI를 이용해 세대 간 AI 연산 성능 향상 폭을 비교했다. 영상 처리 관련 알고리듬 6개 수행 성능을 측정하는 UL 프로시온 컴퓨터비전 실행 후 각 연산당 평균 처리시간이 전 세대 대비 50% 이상 단축됐다. 로컬 LLM 구동, 영상 업스케일링, 실시간 번역 등에서 체감 성능 향상이 기대된다. 영상과 문자 관련 알고리듬 10개 수행 성능을 측정하는 긱벤치 AI를 실행해 보면 단정도(FP32)의 성능 향상 폭은 평균 13% 가량이다. 그러나 양자화를 거쳐 INT8로 실행한 결과를 보면 초당 연산 수가 최소 두 배, 최대 네 배 가량 향상된다. 헥사곤 NPU가 INT8 연산에 최적화된 것이 원인이다. LM 스튜디오에서는 48GB 가량 넉넉한 메모리를 활용해 최근 공개된 구글 젬마4(gemma-4-26b-a4b, 17GB) 등 대용량 LLM 모델도 구동할 수 있다. 단 CPU에 연산이 집중되고 최신 NPU 미지원으로 실제 활용 속도에는 제약이 있다. 애니싱LLM으로는 퀄컴이 제공하는 일부 최적화 모델을 쓸 수 있고 NPU까지 활용해 원활하게 실행된다. 다만 매개 변수가 40억 개 수준으로 적고 모델 훈련에 쓰인 데이터도 2~3년 전 시점에 멈춰 있다. 유튜브 연속 재생시 최대 17시간 구동 젠북 A16은 70Whr 대용량 배터리를 내장했다. 에이수스에 따르면 오프라인 동영상은 최대 21시간, 웹브라우징은 최대 12시간 사용이 가능하다. 작동 성능 '균형', 화면 밝기 40% 상태로 설정 후 실제 작동 시간을 측정했다. 워드, 엑셀, 파워포인트, 엣지를 일정 간격으로 계속 자동 실행하는 '오피스 테스트'에서는 15시간 41분을 버틴다. 구글 크롬으로 유튜브 1080p 영상을 전체화면 연속 재생시 17시간 26분, PC 내 저장된 단일 동영상을 계속 재생하는 테스트에서는 19시간 33분을 기록했다. 하루 8시간 노트북을 쓸 경우 별도 충전 없이 이틀 가량은 버틸 것으로 보인다. 기본 제공되는 130W(20V×6.5A) 어댑터로 충전시 30분만에 50%, 1시간만에 80%를 채운다. 완전 충전까지는 1시간 40분이 걸렸다. 시중에서 흔히 구할 수 있는 65W급 GaN 충전기 등도 활용할 수 있지만 충전 시간은 더 길어질 수 있다. 메모리 직접 탑재로 높아진 가격이 걸림돌 스냅드래곤 X2 엘리트 익스트림은 CPU와 NPU, GPU 등 SoC를 구성하는 모든 요소를 균형있게 개선했다. 특히 게임과 콘텐츠 제작 성능의 걸림돌이 됐던 GPU 성능과 게임 호환성이 눈에 띄게 개선됐다. 퀄컴이 최소 분기별 한 번 이상 아드레노 GPU 업데이트를 약속했기 때문에 이는 앞으로 시간이 지날 수록 더 나아질 것이다. 전 세대 제품이 Arm 기반 윈도 AI PC의 새로운 가능성을 보여줬다면 2세대부터는 본격적으로 x86 프로세서의 대안이 될 수 있는 수준까지 성장했다. 다만 높은 성능 달성을 위해 선택한 고성능 LPDDR5X-9523 메모리, 그리고 이를 SoC에 직접 통합하는 방식 탓에 이를 탑재한 제품 가격도 크게 올랐다. 특히 메모리 반도체 수급난이 심한 현재는 최소 300만원 이상을 감수해야 한다. GPU에도 작지만 중요한 보완이 필요하다. 아드레노 GPU에는 DLSS, XeSS, FSR 등 경쟁사가 제공하는 AI 기반 업스케일링 및 프레임 생성 기술이 없다. 이러한 기술을 활용하면 한정된 SoC 환경에서도 GPU 면적을 크게 늘리지 않고 게임 성능을 끌어올릴 수 있다. 또 이러한 AI 연산 자원은 게임 뿐만 아니라 다양한 AI 응용프로그램 가속에도 활용될 수 있다. ※ 테스트 시스템 제원 운영체제 : 윈도11 홈 26H1 (10.0.28000.1836, VBS 활성화) 테스트 조건 : 배터리 작동시 성능/냉각팬 '균형', 어댑터 작동시 성능 '최상'/냉각팬 '고성능'. 긱벤치 AI 1.7.0 구동시 모드는 퀄컴 최적화 'QNN'. UL 프로시온 컴퓨터비전 벤치마크시 모드는 '퀄컴 SNPE'. 각 테스트 별 3회 시행 후 평균값 활용.

2026.04.23 09:53권봉석 기자

하이퍼엑셀 김주영 대표, 정보통신 유공 포장 수상

AI 반도체 스타트업 하이퍼엑셀은 김주영 대표가 '2026년 정보통신의 날' 기념 정보통신 유공 정부포상에서 포장을 수상했다고 22일 밝혔다. 김주영 대표는 KAIST 교수이자 AI 반도체·시스템 아키텍처 분야 연구자로, 마이크로소프트(MS)에서 데이터센터용 가속기 설계를 주도한 경험이 있다. 이후 2023년 1월 하이퍼엑셀을 창업했으며, LLM 추론에 특화된 AI 반도체 'LPU(LLM Processing Unit)'를 개발했다. LPU는 메모리 대역폭 활용 효율을 극대화한 것이 특징이다. 여기에 LPDDR5X 기반 저전력 메모리를 적용해 데이터센터 전력 소모와 총소유비용(TCO)을 동시에 절감할 수 있도록 했다. 특히 삼성 파운드리 4nm(나노미터, 10억분의 1m) 공정을 적용한 반도체 개발을 2025년에 완료했으며, GPU 대비 약 3배 이상의 전력 효율과 10배 이상의 비용 효율 개선을 목표로 하고 있다. 정보통신 유공 포상은 과학기술정보통신부가 주관하는 ICT 분야 최고 권위의 포상으로, 인공지능(AI) 및 정보통신 기술 발전과 산업 생태계 조성에 기여한 개인 및 단체에 수여된다. 이번 수상에서는 ▲혁신적인 AI 반도체 개발을 통한 국산 AI 반도체 기술 자립 기여 ▲고효율 AI 서버 구현을 통한 지속 가능한 AI 인프라 실현 ▲과학기술정보통신부 'K-클라우드 기술개발사업'(총 450억원 규모) 주관을 통한 국내 AI 반도체 생태계 조성 ▲이버클라우드와의 JDA(공동개발협약) 기반 수요 연계형 R&D 모델 확산 ▲반도체 설계 및 시스템 소프트웨어 분야 고급 인재 양성 등의 공로가 주요하게 인정됐다. 김주영 대표는 “이번 수상은 하이퍼엑셀의 기술력뿐 아니라 국내 AI 반도체 산업의 성장 가능성을 함께 인정받은 결과라고 생각한다”며 “GPU 중심의 기존 AI 인프라 구조를 넘어, LLM 추론에 최적화된 새로운 표준을 제시하고 대한민국 기술이 글로벌로 확산될 수 있도록 최선을 다하겠다”고 말했다.

2026.04.22 16:29전화평 기자

인텔, 보급형 노트북 겨냥 '코어 시리즈3' CPU 출시

인텔이 17일 교육기관과 중소기업 등 B2B 시장과 가격 대비 성능을 중시하는 소비자를 겨냥한 코어 시리즈3(와일드캣 레이크) 프로세서를 출시했다. 인텔은 고성능 AI PC 시장에서는 1월 출시한 코어 울트라 시리즈3(팬서레이크)를 공급하는 한편 보급형 시장에서는 코어 시리즈3 프로세서로 대응할 예정이다. 코어 시리즈3는 11세대 코어 i7-1185G7 프로세서 등 5년 전 출시된 업무용 PC 등 교체 수요를 겨냥했다. 또 CPU와 GPU, NPU를 담은 타일(반도체 조각)을 1.8나노급 인텔 18A 공정에서 생산해 공급 단가 상승 요인을 줄였다. D램과 SSD 등 메모리 반도체 가격 상승으로 PC 수요가 줄어든 가운데 추가 수요를 이끌어 낼지 주목된다. 1월 고성능 AI PC 겨냥 '코어 울트라 시리즈3' 출시 인텔은 올 1월 CES 2026에서 코어 울트라 시리즈3(팬서레이크)를 출시했다. 인텔 자체 미세 공정인 1.8나노급 '인텔 18A' 공정에서 생산된 CPU 타일(반도체 조각)과 TSMC에서 생산한 고성능 Xe3 GPU, 50 TOPS 급 NPU 등을 결합했다. AI 연산 성능은 120 TOPS(1초 당 1조번 연산)급 GPU, 50 TOPS급 NPU와 10 TOPS 급 CPU를 합쳐 최대 180 TOPS 수준이다. PC 제조사에는 최상위 제품인 코어 울트라 X9 388H 프로세서를 시작으로 CPU 코어와 GPU 성능을 달리한 제품이 공급된다. 국내에서는 삼성전자와 LG전자가 1월 말 각각 '갤럭시북6 프로/울트라', 'LG 그램 프로 AI' 등 코어 울트라 시리즈3 탑재 제품을 출시했다. 레노버, HP, 델테크놀로지스 등도 관련 제품을 출시한 바 있다. CPU·GPU 코어 수 줄여...타일 2개로 생산 단가 절감 코어 울트라 시리즈3는 CPU/GPU/NPU 성능이나 AI 성능 면에서 전 세대 대비 확실히 개선됐지만 보급형 PC에 넣기는 과도한 성능을 지녔다. 코어 시리즈3 프로세서는 CPU 코어 수를 절반 가량으로 줄이고 GPU와 NPU 성능을 낮췄다. CPU와 NPU, GPU 등을 한 타일에 집약해 인텔 18A 공정에서 자체 생산하고 타일 2개 구조로 생산 원가도 낮췄다. CPU는 고성능 P(퍼포먼스) 코어 2개, 저전력·고효율 E(에피션트) 코어 4개를 조합한 하이브리드 구조다. Xe3 GPU 코어는 최대 2개다. AI 성능은 CPU를 합해 약 40 TOPS로 NPU 단일 40 TOPS를 요구하는 윈도11 코파일럿+ 기준에는 못미친다. 메모리는 PC 메인보드에 직접 장착하는 LPDDR5X-7467MHz, 메모리 슬롯에 장착하는 DDR5-6400MHz 등 두 종류를 지원한다. "5년 전 PC 대비 연산 성능 40% 향상" 코어 시리즈3는 코어 울트라 시리즈3와 비슷한 수준의 확장성을 확보했다. 4K 60Hz 모니터는 최대 3개까지 연결할 수 있고 와이파이7(802.11be)과 블루투스 6.0 등 무선 기능을 지원한다. 인텔은 자체 성능 측정 결과를 토대로 "코어7 360 프로세서는 5년 전 출시된 11세대 코어 i7-1185G7(타이거레이크) 프로세서 대비 1코어 성능은 최대 47%, 다중작업 성능은 최대 41% 향상됐다"고 설명했다. 최상위 제품인 코어7 350 프로세서 기준 배터리 작동 시간은 줌 화상통화 연속 9.6시간, 워드/엑셀 등 오피스 연속 작업시 최대 12시간 30분, 넷플릭스 연속 재생시 최대 18시간 30분이다. 주요 PC 제조사, 탑재 제품 70종 이상 출시 예정 코어 시리즈3 프로세서는 총 7종으로 구성됐다. 이 중 Xe3 GPU 코어를 1개로 줄이고 NPU를 뺀 코어5 305 프로세서는 POS 시스템과 산업용 기기 등 엣지 시스템에만 공급된다. 삼성전자 갤럭시북6을 시작으로 레노버, HP, 델테크놀로지스 등 주요 PC 제조사가 코어 시리즈3 탑재 노트북 70종 이상을 국내외 시장에 출시 예정이다. 인텔은 엣지 시스템을 위해 설계한 코어 시리즈3 프로세서도 2분기부터 산업용 PC 제조사 등에 공급 예정이다.

2026.04.17 08:35권봉석 기자

상용화 원년 맞은 K-AI 반도체, 지난해 매출 '껑충'

국내 AI 반도체 스타트업 기업들이 연구개발(R&D) 시기를 지나 본격적인 상용화 궤도에 안착했다. 리벨리온, 퓨리오사AI, 딥엑스, 하이퍼엑셀 등 국내 대표 AI 반도체 4개사의 지난해 매출이 전년 대비 최소 2배에서 최대 9배까지 폭발적으로 증가한 것으로 나타났기 때문이다. 업계에서는 기술 실증을 넘어 실제 산업 현장에서 가시적인 실적을 창출하기 시작한 것으로 보고 있다. 15일 금융감독원 전자공시시스템에 공개된 리벨리온, 퓨리오사AI, 딥엑스, 하이퍼엑셀 등 4개사 2025년도 감사보고서 분석 결과, 이들 모두 전년 대비 괄목할 만한 외형 성장을 기록했다. 리벨리온, 작년 매출 320억원 달성…보수적 회계 뚫고 매출 선두 IPO(기업공개) 예비 심사를 앞둔 리벨리온은 지난해 연결 기준 매출 320억원을 기록했다. 이는 2024년 103억원 대비 약 3.1배 증가한 수치로, 국내 AI반도체 업체 중 가장 높은 실적이다. 회사의 이 같은 실적은 당초 예상보다 낮은 수준이다. 리벨리온이 주주간담회에서 밝힌 지난해 예상 매출은 350억~400억원이었다. 최소치인 350억원보다도 30억원 적다. 이는 상장을 위한 지정 감사 과정에서 수익 인식 기준을 엄격하게 적용한 결과로 보인다. 보수적인 회계 처리를 통해 올해와 내년에 걸쳐 있는 매출을 2026년으로 이월하며 상장 리스크를 선제적으로 관리했다는 평가다. AI 반도체 업계 관계자는 “IPO를 앞둔 리벨리온 입장에선 보수적인 회계 처리를 하는 게 더 깔끔했을 것”이라며 “상장 리스크를 줄이는 선택”이라고 평했다. 매출 구성을 살펴보면 단일 고객인 A사와 D사에 대한 매출 의존도가 약 69%로 높게 나타났다. 감사보고서상 익명으로 기재된 해당 고객사들은 통신사 등 최종 수요처가 아닌 유통 대리점인 것으로 파악된다. 리벨리온은 주로 유통망을 통해 제품을 공급하고 있으며, 기존 2대 고객이었던 KT클라우드 비중은 25.8%에서 2.3%로 크게 감소했다. 퓨리오사AI, 2세대 양산품 4000장 선점…'속도전' 승부수 퓨리오사AI의 지난해 연결 기준 매출액은 57억4000만원으로, 2024년(29억6000만원) 대비 약 93.4% 급증했다. 전체 매출 중 AI 반도체 칩 판매를 통한 제품 매출이 35억1000만원, 기술 지원 및 솔루션 제공을 통한 서비스 매출이 22억2000만원을 기록했다. 단순 외형 성장을 넘어 퓨리오사AI가 내세우는 가장 큰 경쟁력은 차세대 칩 상용화 속도다. 퓨리오사AI는 매스 프로덕트인 레니게이드 4000장을 올해 초 수령했다. 국내 주요 NPU 팹리스들이 1세대 양산이나 2세대 시제품(샘플) 테스트 단계에 머물러 있는 반면, 가장 먼저 2세대 칩의 실질적인 양산 물량을 확보하며 시장 선점의 유리한 고지를 차지한 것이다. 퓨리오사AI 관계자는 "가장 먼저 레니게이드 MP(매스 프로덕트) 물량을 확보한 만큼, 현재 글로벌 고객사들과 실제 인프라에 칩을 적용하는 시스템 구축 작업을 활발하게 진행하고 있다"고 밝혔다. 딥엑스 1세대 양산 본격화…하이퍼엑셀 9배 폭풍 성장 엣지 AI 분야에 집중하고 있는 딥엑스 역시 지난해 약 33억2000만원의 연결 매출을 기록하며 전년(10억2000만원) 대비 3배(224%)가 넘는 뚜렷한 성장세를 보였다. 1세대 칩인 'DX-M1'의 양산이 본격화되면서 에브넷, WPG 등 글로벌 IT 유통망을 통한 초기 물량 공급이 실적에 반영되기 시작한 결과다. 김녹원 딥엑스 대표는 최근 기자간담회에서 “글로벌 유통망 확보와 바이두를 비롯한 핵심 파트너십을 기반으로, 올해 제품 매출 2500만 달러를 포함해 총 4000만 달러 규모의 매출 달성을 목표로 하고 있다”며 “글로벌 시장에서 확보한 실질적인 구매주문(PO) 성과를 바탕으로 본격적인 IPO 절차를 추진해 나갈 계획”이라고 말했다. 설립 초기 단계인 하이퍼엑셀의 성장세도 매섭다. 하이퍼엑셀의 2025년 매출액은 약 22억4000만원으로, 전년(약 2억4000만원) 대비 835% 급증했다. 이러한 퀀텀점프는 LLM(거대언어모델) 구동에 특화된 가속기라는 명확한 타깃 설정이 주효했던 것으로 분석된다. 생성형 AI 시장 개화 초기에 신속하게 맞춤형 칩셋 모델을 선보이며 시장 수요를 선점한 결과, 신생 팹리스임에도 불구하고 빠르게 수십억원대 매출 구간에 진입했다는 평가다. 김지훈 한양대학교 융합전자공학부 교수는 "국내 주요 AI 반도체 기업들이 이제는 단순한 칩이나 보드 수준의 개발을 넘어, 실제 시스템을 어떻게 구축하고 고객에게 '진짜 서비스'를 제공할 수 있느냐를 고민하는 단계로 넘어갔다"고 진단했다. 이어 "이를 위해 기업들은 하드웨어 설계 인력 못지않게 소프트웨어 스택을 최적화하고 서비스를 운영할 수 있는 인력을 대거 보강하며 체질 개선에 나서고 있다"며, 초기 시장 검증을 마친 팹리스들이 진정한 글로벌 플레이어로 도약하기 위해서는 소프트웨어 생태계 구축이 필수적임을 강조했다.

2026.04.16 09:03전화평 기자

[AI는 지금] 엔비디아, GPU 시장서 86% 독주 가능한 까닭은

인공지능(AI) 인프라 경쟁의 승패가 반도체 성능보다 이를 뒷받침하는 소프트웨어(SW) 생태계에서 갈리고 있는 것으로 나타났다. 엔비디아의 독주 역시 그래픽처리장치(GPU) 하드웨어 우위만이 아니라 20년 가까이 축적한 쿠다(CUDA) 중심 SW 스택이 만든 구조적 진입장벽의 결과라는 분석이 나왔다. 11일 소프트웨어정책연구소(SPRi)가 발간한 'AI 인프라 경쟁에서 소프트웨어의 구조적 역할' 보고서에 따르면 올해 전 세계 AI 지출은 2조5000억 달러에 이를 전망이다. 이 가운데 절반 이상은 서버·가속기·데이터센터 등 인프라에 집중될 것으로 예상된다. 특히 데이터센터 GPU 시장에서 엔비디아는 약 86%의 매출 점유율을 확보하며 압도적 우위를 유지하고 있다. 보고서는 이 같은 지배력이 단순한 칩 성능만으로 설명되지 않는다고 짚었다. 동일한 H100 GPU를 사용하더라도 컴파일러, 가속 라이브러리, 드라이버 최적화 수준에 따라 실제 처리량이 3배 이상 벌어질 수 있어서다. AI 인프라의 본질적 경쟁력은 '칩 위에서 얼마나 효율적으로 연산을 구현하느냐'에 달려 있다는 의미다. 연구진은 AI 인프라를 개발 프레임워크, 컴파일러, 가속 라이브러리, 드라이버·런타임, 하드웨어의 5계층으로 구분했다. ▲개발자가 AI 모델을 설계할 때 사용하는 '파이토치'나 '잭스(JAX)' 같은 개발 도구부터 ▲이를 각 반도체에 맞는 실행 코드로 바꿔주는 '엑스엘에이(XLA)', '티브이엠(TVM)', '텐서알티(TensorRT)' 기반 컴파일러 ▲연산 속도를 끌어올리는 '쿠디엔엔(cuDNN)', '큐블라스(cuBLAS)' 등 가속 소프트웨어 ▲최하단 드라이버에 이르기까지 전 계층이 특정 하드웨어에 맞춰 최적화되며 락인(lock-in) 구조를 형성한다고 분석했다. 특히 보고서는 ▲최적화 비대칭으로 특정 칩으로 수렴하는 '성능 종속' ▲소프트웨어 선택이 곧 하드웨어 경로를 결정하는 '설계 종속' ▲폐쇄형 드라이버 구조가 물리적 대체를 막는 '구조적 종속'의 세 가지 메커니즘을 제시했다. 이미 특정 라이브러리와 '쿠다' 경로에 맞춰 최적화된 대규모 AI 모델 코드를 다른 칩용으로 재작성·검증하는 데 막대한 인력과 시간이 들어 하드웨어 교체 자체가 사실상 시스템 재구축에 가깝다고 봤다. 또 이 세 요소가 중첩될수록 전환 비용은 기하급수적으로 커진다고 설명했다. 주요국 전략도 뚜렷하게 대비됐다. 미국에서 엔비디아는 '쿠다' 생태계를 통해 성능·구조적 종속을 동시에 구축했고, 구글은 TPU(텐서 처리장치·대규모 AI 학습에 특화한 자체 반도체), 엑스엘에이(XLA), 잭스를 수직 통합해 별도의 설계 종속 경로를 구축했다. 중국 화웨이 역시 자사 AI 칩 '어센드(Ascend)'와 전용 소프트웨어 플랫폼 '칸(CANN)', AI 개발 프레임워크 '마인드스포어(MindSpore)'를 하나로 묶은 체계를 통해 자국 내 유사 생태계를 내재화하고 있는 것으로 평가됐다. 국내 신경망처리장치(NPU) 업계에는 기회와 과제가 동시에 제시됐다. 보고서는 한국 NPU 생태계가 파이토치 네이티브 지원과 가상거대언어모델(vLLM) 연동을 통해 프레임워크 진입에는 성공했지만, 컴파일러·라이브러리 계층의 성능 격차와 운영 레퍼런스 부족이 시장 확산의 걸림돌이라고 진단했다. 국내 AI 반도체 기업들 역시 전용 컴파일러 고도화와 거대언어모델(LLM) 추론 소프트웨어 최적화에 역량을 집중하며 쿠다 의존도를 낮추는 데 공을 들이고 있다. 업계에선 단순 칩 가격 경쟁력보다 전력 효율, 소프트웨어 유지보수, 개발 인력 재교육 비용을 모두 합친 총소유비용(TCO) 관점에서 엔비디아 대비 우위를 입증해야 실제 클라우드 사업자와 대기업 도입으로 이어질 수 있다고 보고 있다. 보고서 역시 TCO 기반 평가체계 도입을 핵심 정책 과제로 제시했다. 이에 연구진은 칩 설계 중심 지원에서 벗어나 컴파일러·런타임·소프트웨어개발키트(SDK)를 포함한 풀스택 SW 육성으로 정책 패러다임을 전환해야 한다고 제언했다. 특히 쿠다 의존도를 낮추기 위한 오픈엑스엘에이(OpenXLA)·엠엘아이알(MLIR) 등 글로벌 오픈소스 표준 프로젝트 참여 확대와 공공 AI 데이터센터 기반 실증 환경 조성이 시급한 과제로 제시됐다. 최근 유엑스엘 재단(UXL Foundation)처럼 특정 가속기 벤더에 종속되지 않는 멀티벤더 표준 생태계가 확산하는 만큼, 국내 기업들도 글로벌 소프트웨어 표준 경쟁에 선제적으로 합류해야 한다고 분석했다. 보고서는 "K-NPU 확산의 병목은 칩 자체보다 소프트웨어 최적화와 운영 생태계 규모에 있다"며 "공공 AI 데이터센터를 활용한 대규모 실증과 글로벌 오픈소스 표준 참여를 통해 성능 격차와 레퍼런스 부족의 악순환을 끊어야 한다"고 말했다.

2026.04.11 13:11장유미 기자

SKT, CPU에 NPU 더해 AI 추론 서버 성능 검증

ARM의 AGI CPU와 리벨리온의 리벨카드로 AI 추론 성능을 높이는 솔루션을 개발하고 이를 SK텔레콤 AI 데이터센터에서 실증한다. SK텔레콤이 지난 9일 ARM, 리벨리온과 차세대 AI 인프라 혁신을 위한 전략적 업무협약을 체결했다. AI 산업이 AI 모델을 만드는 '학습'에서 실제 서비스를 제공하는 '추론'으로 패러다임 변화가 이뤄지면서 AI 인프라의 핵심과제도 학습을 위한 막대한 연산 능력보다는 얼마나 적은 전력으로 얼마나 빠르고 저렴하게 AI 서비스를 제공할 수 있느냐로 변하고 있다. 특히 추론은 365일 쉬지 않고 작동해야 되기 때문에 전력 효율이 곧 비용 경쟁력과 직결된다. AI 추론은 학습과 달리 상대적으로 가벼운 연산을 빠르고 반복적으로 처리하는 작업이다. GPU는 이런 추론 작업에도 사용할 수 있지만, 마치 대형 트럭으로 택배를 배달하는 것처럼 과도한 전력을 소모하고 비용이 높다. 이에 업계에서는 추론에 특화된 전용 칩, 즉 NPU가 대안으로 부상하고 있다. NPU에 CPU를 결합하는 이유도 명확하다. 실제 AI 서비스 운영에서는 AI 연산 외에도 데이터 입출력, 네트워크 통신, 메모리 관리, 작업 스케줄링 등 다양한 범용 처리가 동시에 필요하다. CPU가 시스템의 '관제탑' 역할을 하며 데이터 흐름과 시스템 운영을 총괄하고, NPU가 AI 추론 연산을 전담하는 이종 컴퓨팅 구조는 시스템의 성능과 효율을 높일 수 있다. 'Arm AGI CPU'는 ARM이 35년 역사상 처음으로 직접 생산에 나선 데이터센터용 프로세서로, AI 추론 서비스에 최적화된 것이 특징이다. 리벨리온의 리벨카드도 대규모 AI 추론에 특화된 NPU다. 두 칩을 한 서버 안에 탑재해 CPU가 데이터 처리와 시스템 운영 등 범용 연산을 담당하고, NPU가 AI 추론 연산을 전담하면 전력 효율을 높이고 운영 비용을 줄일 수 있다. SK텔레콤은 이러한 방식이 대규모 AI 서비스를 운영하는 데이터센터에서 효율적인 서버 아키텍처라고 설명했다. ARM과 리벨리온은 이미 지난 3월 진행된 'Arm 에브리웨어' 행사에서 각 사의 칩을 결합하여 오픈 AI의 언어모델인 GPT OSS 120B 기반의 에이전틱 AI 서비스를 실시간으로 시연하며, 대규모 데이터센터에서의 상용화 가능성을 보여줬다. SK텔레콤은 AI DC에서 CPU와 NPU를 결합한 AI 추론 컴퓨팅의 성능을 검증하고, 특히 독자 개발한 AI 파운데이션 모델 에이닷엑스 케이원(A.X K1)을 운영하는 방안도 검토하고 있다. 이재신 SK텔레콤 AI 사업개발 담당은 “추론에 최적화된 인프라와 독자 파운데이션 모델 A.X K1을 결합한 풀 패키지를 제공함으로써 AI 데이터센터 경쟁력을 더욱 강화해 나가겠다”고 말했다. 에디 라미레즈 ARM 클라우드 AI 사업부 GTM 부사장은 “AI 추론의 급속한 성장은 대규모 배포에 최적화된 새로운 데이터센터 인프라 수요를 촉진하고 있다”며, “SK텔레콤, 리벨리온과 같은 파트너는 Arm AGI CPU를 구축하고 AI 추론 인프라를 현대화하는 데 있어 중요한 역할을 하고 있다”고 전했다. 리벨리온의 오진욱 CTO는 “리벨리온은 압도적인 성능과 전력 효율을 갖춘 '리벨카드'와 풀스택 소프트웨어 경쟁력을 바탕으로 차세대 AI 데이터센터를 지탱하는 핵심 축을 담당하게 됐다”며, “AI 특화 인프라 구축을 위해 각 분야 전문가들이 원팀으로 뭉친 이번 협력은 업계에서도 매우 유의미한 선례가 될 것으로 기대한다”고 강조했다.

2026.04.11 03:42박수형 기자

가비아, 국산 NPU 탑재 클라우드 서비스 출시…AI 추론 시장 승부수

가비아가 국산 인공지능(AI) 반도체 기반 클라우드 서비스를 출시하며 AI 인프라 사업 다각화를 추진한다. 그래픽처리장치(GPU) 중심 구조에서 벗어나 비용 효율성과 공급 안정성을 확보한다는 전략이다. 가비아는 리벨리온의 신경망처리장치(NPU) '아톰-맥스'를 탑재한 클라우드 서비스형 NPU(NPUaaS)를 출시했다고 9일 밝혔다. 최근 생성형 AI와 AI 에이전트 확산으로 실시간 추론 인프라 수요가 급증하는 가운데, GPU 수급 불안과 비용 부담이 주요 과제로 떠오르고 있다. 가비아는 NPU 기반 클라우드 서비스를 통해 이러한 문제를 해결하고 AI 서비스 환경 효율성을 높인다는 목표다. NPUaaS는 NPU 인프라를 클라우드 형태로 구독해 사용하는 서비스다. 학습된 AI 모델을 실제 서비스에 적용하는 추론 작업에 특화된 NPU는 GPU 대비 전력 소모가 적고 비용 효율성이 높아 대안으로 주목받고 있다. 가비아 NPUaaS는 인스턴스(VM) 기반으로 제공되며 운영체제(OS) 커널 수준의 세밀한 환경 설정과 커스터마이징을 지원한다. 기업은 AI 워크로드 특성에 맞는 정밀한 인프라 구성을 구현하고 서비스 목적에 따라 유연하게 확장할 수 있다. 아톰-맥스는 1장 기준 128 테라플롭스(FP16)의 연산 성능과 64GB NPU 메모리, 16 v코어 CPU, 256GB 시스템 메모리를 제공한다. 대규모언어모델(LLM), 비전 AI, 멀티모달 AI, 피지컬 AI 등 다양한 워크로드를 지원하며 도입 규모에 따라 다중 구성도 가능하다. 가비아는 NPUaaS와 함께 AI 추론 프레임워크 최적화 컨설팅도 제공한다. 소프트웨어 개발 키트(SDK) 기반 환경 설정부터 성능 최적화까지 전문 인력이 지원한다. 또 파이토치와 텐서플로우 기반 환경은 물론 허깅페이스 허브 모델 연동도 돕는다. vLLM, 트라이톤 추론 서버, 토치서브 등 서빙 도구 활용도 제공한다. 또 고객사 워크로드에 맞춘 맞춤형 기술 지원도 병행한다. 라마 3, 젬마 등 오픈소스 LLM이 아톰-맥스 환경에서 최적의 성능을 낼 수 있도록 프로파일링과 커널 최적화, 파라미터 튜닝을 지원한다. 가비아는 이번 서비스를 통해 금융·의료·공공 등 보안과 성능 요구가 높은 산업을 중심으로 AI 인프라 시장 공략을 확대할 계획이다. 정대원 가비아 상무는 "AI 서비스의 경쟁력은 모델 성능만큼이나 추론 환경의 효율성에 달려 있다"며 "NPUaaS와 전문 컨설팅을 결합해 기업이 인프라 부담 없이 AI 비즈니스에 집중할 수 있는 환경을 만들겠다"고 말했다.

2026.04.09 10:55한정호 기자

롯데이노베이트, NPU 생태계 넓힌다…"피지컬 AI 인프라 최적화"

롯데이노베이트가 신경처리장치(NPU) 기반 스마트 인프라 경쟁력 강화에 나섰다. 롯데이노베이트는 인공지능(AI) 반도체 기업 모빌린트와 NPU 기술 적용과 실증을 위한 업무협약을 체결했다고 7일 밝혔다. 두 기업은 기술 협력과 사업 발굴을 공동으로 추진하기로 했다. 이번 협력은 롯데이노베이트의 NPU 생태계 구축 전략 일환이다. 기술 경쟁력을 갖춘 기업과 협력을 확대해 관련 사업 속도를 높이려는 움직임이다. 최근 기업들은 클라우드 의존도 줄이는 엣지 AI 핵심 인프라로 NPU를 활용하기 시작했다. 데이터 처리를 디바이스와 현장에서 직접 수행해 지연을 줄이고 보안성을 높이는 식이다. 전력 효율이 중요한 제조와 로보틱스 분야에서 NPU 활용도가 특히 높아진 것으로 나타났다. 두 기업은 피지컬 AI 분야에서 NPU 적용을 위한 기술 협업과 실증을 추진한다. 휴머노이드용 NPU 기반 솔루션을 제조와 유통, 물류 현장에 적용해 성능과 운영 효율을 검증할 계획이다. 롯데이노베이트는 비전언어액션(VLA) 기반 기술 등 휴머노이드 제어 핵심 AI 기술 내재화에도 속도를 내고 있다. 모빌린트는 온디바이스와 엣지 AI 반도체 기술로 산업 환경에 맞는 실행 구조를 구현하고 있다. 롯데이노베이트 오현식 AI혁신센터장은 "전반적인 AI 산업부터 미래 산업인 휴머노이드까지 온디바이스 AI 성패는 빠르고 가벼운 NPU 기술에 달렸다"며 "양사 역량을 결합해 현장에 최적화된 차세대 스마트 인프라 운영 품질을 입증하겠다"고 밝혔다.

2026.04.07 16:45김미정 기자

모빌린트, 롯데이노베이트와 NPU 스마트 인프라 최적화 협력

AI 반도체 기업 모빌린트가 롯데이노베이트와 전략적 업무협약(MOU)을 체결했다고 7일 밝혔다. 양사는 모빌리티·보안 분야의 영상지능 및 엣지 디바이스 통합 역량을 바탕으로 NPU기술 적용, 실증 및 상호 기술 개선을 위한 협력을 이어간다. 이번 협약은 모빌린트의 온디바이스 및 엣지 AI 반도체 기술을 산업 현장에 확산시키고, 롯데이노베이트가 추진 중인 NPU 생태계 구축 전략에 부응하기 위해 진행됐다. 특히 모빌린트는 현장 통합 역량이라는 강점을 활용해 롯데이노베이트의 상용화 환경에서 기술적 완성도를 높이는 데 주력할 계획이다. 양사는 이번 협약을 통해 다양한 AI 사업 발굴을 위한 기술 협력을 추진한다. 특히 피지컬 AI 분야에 모빌린트의 NPU를 적용하기 위한 기술 협업과 실증을 진행하여 독보적인 기술력을 입증할 예정이다. 또한, 모빌린트의 NPU 기반 솔루션은 휴머노이드 등에 적용되어 제조, 유통, 물류 등 롯데 계열사 현장에 투입되며, 이를 통해 성능과 효율을 검증받게 된다. 모빌린트는 롯데이노베이트의 AI 모델이 자사 NPU 환경에서 최적으로 동작하도록 개발을 전담하며, 다양한 산업 환경에 최적화된 AI 실행 구조를 구현할 계획이다. 또한 센서 및 디바이스 연계 구조 설계와 현장 데이터 기반 알고리즘 최적화를 통해 실제 산업 현장에서의 성능과 운영 효율을 극대화한다. 이와 동시에 롯데이노베이트는 피지컬 AI 분야에 집중하며 휴머노이드 제어의 핵심 기술인 VLA(시각-언어-행동) 등 관련 AI 기술 내재화에 박차를 가하고 있다. 김성모 모빌린트 사업개발본부장은 “롯데이노베이트와의 협력을 통해 모빌린트의 AI 반도체 기술을 제조·물류·보안 등 다양한 산업 영역으로 확장할 수 있는 기반을 마련했다”며 “실증을 통해 확보한 성과를 바탕으로 NPU 기반 AI 사업을 빠르게 확대해 나가겠다”고 말했다. 오현식 롯데이노베이트 AI혁신센터장은 “전반적인 AI 산업부터 미래 산업인 휴머노이드까지 온디바이스 AI의 성패는 빠르고 가벼운 NPU 기술에 달려있다"며 "양사의 역량을 결합해 현장에 최적화된 차세대 스마트 인프라 운영 품질을 입증하겠다"고 전했다.

2026.04.07 14:28전화평 기자

"GPU 대체할까"…와이즈넛, NPU 기반 AI 어플라이언스 공개

와이즈넛이 국산 인공지능(AI) 반도체 기반 시스템으로 공공·기업 고객 확장에 나섰다. 와이즈넛은 지난 2일 서울 강남구에서 열린 퓨리오사AI '레니게이드 2026 서밋'에 참가해 국산 신경처리장치(NPU) 기반 AI 어플라이언스를 시연했다. 이번 장비는 퓨리오사AI의 2세대 NPU '레니게이드' 기반으로 개발됐으며 현장에서 실제 구동 형태로 공개됐다. 해당 장비는 그래픽처리(RAG) 기반 AI 에이전트 '와이즈 아이랙'과 도메인 특화 거대언어모델(LLM) '와이즈 엘로아'를 통합한 일체형 구조다. 별도 서버 구축이나 모델 설치 없이 전원과 네트워크 연결 후 초기 설정만으로 AI 업무를 바로 수행할 수 있는 점이 핵심이다. 와이즈넛은 해당 장비 특장점으로 공공기관을 겨냥한 폐쇄망 온프레미스 설계를 꼽았다. 데이터가 외부 클라우드로 이동하지 않고 내부에서 처리돼 보안 우려를 낮춘 구조라서다. 하드웨어 측면에서는 전력 효율성이 핵심인 것으로 알려졌다. 레니게이드 NPU는 칩당 180W 수준으로 기존 GPU 대비 낮은 전력 소비를 구현해 비용과 운영 부담을 줄일 수 있는 구조다. 두 기업은 지난해 6월 협력 후 단계적으로 기술 통합을 진행해 왔다. 이번 시연은 양산 단계 NPU에서 실제 AI 에이전트 워크로드를 구동했다는 점에서 상용화 가능성을 입증한 사례로 평가된다. 행사는 퓨리오사AI NPU 생태계 확산과 고객 도입 성과를 공유하기 위해 마련됐다. 퓨리오사AI는 올해 초 레니게이드 1차 양산 물량 4000장을 확보하며 본격적인 시장 공급에 돌입한 상태다. 강용성 와이즈넛 대표는 "26년간 축적한 언어처리 기술력과 AI 에이전트 역량을 퓨리오사AI의 고성능 국산 NPU 위에서 완제품으로 구현했다는 점에서 뜻깊다"고 강조했다.

2026.04.07 14:20김미정 기자

[유미's 픽] "GPU 넘는다"…삼성·LG·롯데·포스코 가세로 국산 NPU 확산 본격화

국산 신경망처리장치(NPU)를 중심으로 한 국내 인공지능(AI) 산업 재편이 본격화되고 있다. 정부가 50조원 규모의 'K-엔비디아' 육성 프로젝트를 추진하며 정책 드라이브를 강화하는 가운데 민간 기업들도 공공·제조·클라우드·서비스 등 각 영역에서 NPU 도입과 사업화를 서두르는 모습이다. 3일 업계에 따르면 최근 국내 주요 IT·산업 기업들은 그래픽처리장치(GPU) 중심 AI 인프라에서 벗어나 NPU를 기반으로 한 구조 전환을 추진하며 비용 효율과 전력 절감, 데이터 주권 확보를 동시에 노리고 있다. 기술 검증 단계를 넘어 실제 서비스와 인프라로 확산되고 있는 상황을 고려한 것으로, AI 서비스 확산에 따라 추론 수요가 급증하면서 전력 소비와 운영 비용 부담이 커진 점도 한 몫 했다. 정부도 이 같은 변화에 맞춰 정책 지원을 강화하고 있다. 실제 과학기술정보통신부와 금융위원회는 지난달 민관 합동 간담회를 통해 AI 반도체 시장이 범용 GPU 중심에서 저전력·고효율 중심 구조로 전환되고 있다고 진단하고 국산 NPU 산업 육성에 정책 역량을 집중하겠다고 밝혔다. 국민성장펀드를 통해 향후 5년간 50조원을 투입하는 'K-엔비디아' 프로젝트도 추진 중이다. 이에 따라 클라우드 인프라 영역에서도 국산 NPU 적용이 구체화되고 있다. 삼성SDS가 국산 NPU 기반 '서비스형 NPU(NPUaaS)'를 오는 7월 출시하는 것이 대표적 사례다. 삼성SDS는 기존 '서비스형 GPU(GPUaaS)' 중심 구조에서 벗어나 NPU를 포함한 하이브리드 인프라를 구축함으로써 기업들이 AI 워크로드 특성에 따라 연산 자원을 선택할 수 있도록 하겠다는 전략을 내세웠다. 클라우드에서 구독형으로 NPU를 제공함으로써 초기 투자 부담을 낮추고 도입 장벽을 줄인 점도 특징이다. NPU 도입은 공공과 산업 현장을 중심으로도 확대되는 흐름을 보이고 있다. 비용과 전력 효율이 중요한 공공 인프라를 중심으로 적용 검토가 이뤄지면서 초기 수요도 형성되는 분위기다. 특히 공공 및 유통 인프라 분야에서는 비용 경쟁력 확보를 중심으로 NPU 도입이 이뤄지고 있다. 롯데이노베이트는 딥엑스와 협력해 지능형 CCTV와 ITS에 NPU를 적용하며 GPU 대비 총소유비용(TCO) 절감을 추진 중이다. 업계에선 정책 인센티브가 구체화되기 전부터 국산 반도체 적용을 검토하는 등 선제 대응 성격이 강한 사례라고 봤다. 제조 분야에서는 포스코DX가 모빌린트 NPU를 산업용 제어 시스템에 탑재해 설비 단계에서 실시간 AI 분석과 제어가 가능한 구조를 구축하고 있다. 이는 클라우드 중심 AI에서 벗어나 현장 중심의 엣지 AI로 전환하는 흐름을 반영한 것으로, 보안성과 즉시성을 동시에 확보하려는 전략으로 풀이된다. 클라우드와 플랫폼 영역에서도 대응이 이어지고 있다. LG CNS는 NPU 기반 AI 인프라 구축을 확대하고 있으며, LG유플러스는 NPU와 대규모 언어모델(LLM), 인프라를 결합한 'AI 어플라이언스'를 통해 공공·금융 등 폐쇄망 시장을 겨냥하고 있다. 클라우드 의존 없이 자체 환경에서 AI를 구동할 수 있도록 한 점이 특징이다. AI 모델 영역에서는 LG AI연구원과 업스테이지가 중심 역할을 하고 있다. LG AI연구원은 '엑사원(EXAONE)'을 기반으로 국산 NPU와의 최적화를 추진하며 추론 중심 AI 환경에 대응하고 있으며, 업스테이지 역시 퓨리오사AI와 협력해 NPU 기반 생성형 AI 서비스 상용화를 추진 중이다. 이는 모델 단계에서도 GPU 의존도를 낮추려는 시도로 해석된다. 기업용 소프트웨어 분야에서도 변화가 나타나고 있다. 더존비즈온은 퓨리오사AI와 협력해 전사적자원관리(ERP) 등 핵심 업무 시스템에 NPU 기반 AI를 적용하며 공공·금융 시장 확대를 추진하고 있다. 기존 분석 중심 AI에서 벗어나 실제 업무 프로세스에 AI를 접목하려는 움직임이다. 유통 및 시스템통합(SI) 영역에서는 코오롱베니트가 리벨리온과 협력해 NPU 기반 'AI 엑셀러레이션 서비스'를 추진하며 기업 고객 접점을 확대하고 있다. 반도체 기술을 실제 비즈니스 환경에 적용하는 역할로, 시장 확산을 위한 유통 채널로 기능하고 있다. 클라우드 사업자들의 선행 움직임도 영향을 미쳤다. 네이버클라우드는 'AI반도체 팜' 사업을 통해 국산 NPU의 성능과 안정성을 산업 현장에서 검증하며 상용화 기반을 마련했다. 이후 기업들의 사업화 움직임도 이어지고 있다. 업계에선 현재 국산 NPU 사업을 두고 기술 검증 단계를 넘어 상용화 초기 단계로 보고 있다. 동시에 벤더 간 경쟁도 본격화되면서 기업들은 국산 NPU 도입을 전제로 협력 구조도 구축하는 모습이다. 업계 관계자는 "지금은 NPU 도입 여부를 논의하는 단계가 아니라 어떤 기술을 선택할지 경쟁이 시작된 단계"라며 "정부 정책과 민간 인프라가 맞물리면서 AI 반도체 생태계가 빠르게 확산될 것으로 기대된다"고 말했다.

2026.04.03 08:48장유미 기자

퓨리오사AI "올해 2세대 NPU 2만장 양산 목표...제품 공급 시작"

국내 AI 반도체 스타트업 퓨리오사AI가 2세대 AI칩 '레니게이드(RNGD)'의 상용화 성과를 알리며 본격적인 신경망처리장치(NPU) 생태계 확장에 나섰다. 퓨리오사AI는 2일 서울 강남구 에스제이쿤스트할레에서 '레니게이드 2026 서밋'을 개최했다. 이날 행사에는 레니게이드를 직접 도입하는 주요 AI 모델 기업, 통신사, 클라우드 사업자 등 200여명의 관계자가 참석해 AI 반도체 도입 현황과 확산 방안을 공유했다. "올해 2만장 규모 양산"…HBM 탑재 NPU로 글로벌 시장 정조준 퓨리오사AI는 앞선 지난 1월 1차 양산 물량 4000장을 인도받으며 레니게이드의 양산을 개시했다. 고대역폭메모리(HBM)를 탑재한 NPU가 개발을 넘어 양산 단계까지 이른 것은 세계적으로도 드문 사례다. 특히 백준호 대표는 올해 공격적인 공급 계획을 밝혔다. 백 대표는 "올해 레니게이드 카드를 약 2만장 규모로 양산할 수 있도록 모든 준비를 마쳤으며, 현재 양산이 순조롭게 진행 중"이라며 "이미 다양한 고객사들에게 제품 공급을 시작했다"고 강조했다. 2세대 레니게이드는 극강의 전력 효율을 꾀한 추론용 칩이다. 칩당 열 설계 전력(TDP)을 180W 이하로 획기적으로 낮추면서도 고성능을 달성했다. 부동소수점 연산 기준으로 초당 512테라플롭스(TFLOPS), 정수형(INT4) 기준 1페타플롭스(PFLOPS)의 성능을 제공하며, 4세대 HBM3를 탑재해 메모리 병목 현상을 해소했다. 퓨리오사AI가 공개한 최신 벤치마킹 결과에 따르면 레니게이드는 엔비디아 RTX PRO 6000과 비교해 동일한 전력으로 최대 7.4배 규모의 사용자를 처리할 수 있다. 이를 통해 기존 GPU 대비 인프라 총소유비용(TCO)을 약 40% 절감할 수 있다는 것이 회사 측의 설명이다. "실전 투입 채비 마쳤다"…주요 파트너사 협력 릴레이 이날 행사의 가장 큰 화두는 레니게이드를 실제 인프라와 서비스에 도입하는 주요 파트너사들의 생생한 현장 목소리였다. 파트너사들은 단순한 개념 검증을 넘어 구체적인 상용화 계획을 잇달아 발표했다. 먼저 LG AI연구원은 2022년부터 퓨리오사AI와 교감하며 자사의 LLM(거대언어모델) '엑사원(EXAONE)'을 레니게이드 환경에서 구동하는 작업을 진행해 왔다. 임우형 LG AI연구원 원장은 "단순 모델 서빙을 넘어 다양한 서비스 시나리오에 대해 벤치마크 테스트를 진행했고, 퓨리오사AI의 신속한 소프트웨어 개선 등 우수한 엔지니어링 역량을 확인했다"고 평가했다. LG유플러스는 엑사원 모델과 레니게이드를 결합해 보안과 제어가 가능한 '소버린 AI' 어플라이언스 솔루션을 구축 중이다. 이상엽 LG유플러스 CTO는 "향후 보이스 기반 AI 서비스가 상용화되면 텍스트 대비 토큰 비용이 30배 이상 급증할 수 있다"며 "이를 해결하기 위해 엣지 및 온디바이스가 결합된 하이브리드 AI 인프라 구축에 레니게이드가 효과적"이라고 말했다. 삼성SDS는 올해 7월 삼성 클라우드 플랫폼(SCP)을 통해 국내 CSP(클라우드 서비스 제공사업자) 최초로 NPU 기반 구독형 서비스인 'NPUaaS'를 론칭할 계획이다. 이주평 삼성SDS 상무는 "고객이 1장, 2장, 4장, 8장 단위로 필요한 만큼 구독해 사용할 수 있도록 클라우드 가상화 통합 작업을 성공적으로 진행해 왔다"고 밝혔다. 업스테이지는 약 200만명의 사용자를 보유한 챗봇 서비스와 주력 LLM인 '솔라(Solar)'를 서빙하는 과정에서 발생하는 막대한 GPU 운용 비용 문제를 해결하고자 퓨리오사AI와 손을 잡았다. 김성훈 업스테이지 대표는 "척박한 서비스 생존 경쟁 속에서 경제적인 추론 칩이 절실했다"며 "퓨리오사AI의 지원으로 실질적인 상용 테스트를 속도감 있게 진행하고 있다"고 말했다. 메가존클라우드는 퓨리오사AI 등과 컨소시엄을 구성해 사우디아라비아 아람코 등 중동 진출을 위한 개념검증(PoC)을 주도하고 있다. 이주완 메가존클라우드 회장은 "경남, 전북, 구미 등 주요 지방 산단에 엣지 클라우드 인프라를 구축해 중소·중견 제조사들의 AI 도입을 직접적으로 지원할 것"이라며 "향후 3년 내 500억원, 5년 내 3000억원 규모의 퓨리오사AI 칩 공급을 추진하겠다"는 구체적인 목표도 제시했다. PC용 경량화 모델부터 3세대 칩까지…차세대 로드맵 가속 퓨리오사AI는 시장의 빠른 변화에 대응하기 위해 레니게이드 라인업을 다각화하는 구체적인 로드맵도 제시했다. 백 대표는 단기적으로 "레니게이드의 메모리를 기존 HBM3에서 차세대 메모리로 업그레이드하고, 현재 출시된 서버 어플라이언스 제품군 역시 지속해서 고도화해 신제품을 선보일 것"이라고 말했다. 또한 제품군의 외연 확장도 예고했다. PC나 워크스테이션 환경에 맞춰 칩을 경량화한 '레니게이드 S'의 모든 준비를 마쳐 올해 말에서 내년 초 사이 출시할 예정이다. 나아가 2028년에는 레니게이의 핵심 엔진 아키텍처를 기반으로 메모리와 연산 규모 등 이른바 '배기량'을 대폭 확대한 3세대 AI 칩을 선보이며 글로벌 경쟁력을 이어갈 계획이다. 백 대표는 "오늘 행사는 레니게이드 기반 NPU 생태계 확산을 이끌어갈 국내외 주요 파트너사들과 함께 하는 뜻깊은 자리"라며 "레니게이드 기반의 생태계 확산을 통해 글로벌 AI 인프라 시장에서 한국 반도체의 저력을 직접 증명하겠다"고 포부를 밝혔다.

2026.04.02 16:08전화평 기자

[단독] 삼성SDS, 국내 첫 국산 NPUaaS 7월 출격…정부 'AI 주권' 정책 추진 앞장

삼성SDS가 국내 클라우드 서비스 제공업체(CSP) 가운데 처음으로 국산 신경망처리장치(NPU) 기반 서비스형 인프라(NPUaaS)를 출시한다. 정부가 국산 AI 반도체 활용 확대와 'AI 주권' 확보를 강조하는 가운데 민간에서 이를 실제 서비스로 구현하는 첫 사례란 점에서 주목된다. 2일 업계에 따르면 삼성SDS는 오는 7월 퓨리오사AI의 2세대 NPU '레니게이드(RNGD)'를 기반으로 한 NPUaaS를 삼성 클라우드 플랫폼(SCP)에 출시할 예정이다. 국내 CSP 중 국산 NPU를 클라우드 서비스 형태로 제공하는 첫 사례로, 국산 AI 반도체의 상용화 채널을 본격적으로 여는 계기로 평가된다. 삼성SDS는 지난해 9월부터 퓨리오사AI와 협력해 레니게이드를 SCP 환경에 최적화하고 서비스형 모델로 상품화하는 작업을 진행해왔다. 양사는 별도의 MOU 체결 없이 기술 협력을 중심으로 사업화를 추진해온 것으로 알려졌다. 특히 레니게이드는 AI 추론(inference)에 특화된 반도체로, GPU 대비 전력 효율과 비용 측면에서 경쟁력을 갖춘 것으로 평가된다. 글로벌 AI 인프라 시장이 GPU 중심으로 형성된 가운데 비용 부담과 공급 제약이 지속되면서 대안으로서 NPU 수요가 확대되는 흐름과도 맞물린다. 이번 NPUaaS 도입은 삼성SDS의 AI 인프라 포트폴리오를 다변화하는 의미도 갖는다. 기존 GPUaaS 중심에서 벗어나 NPU 기반 연산 자원을 추가함으로써 고객이 AI 워크로드 특성에 따라 인프라를 선택할 수 있는 구조를 갖추게 됐다는 점에서다. 삼성SDS의 NPUaaS 고객은 삼성클라우드플랫폼(SCP)를 통해 레니게이드를 구독형으로 사용할 수 있으며 1장부터 8장까지 단위별 확장이 가능하다. 또 스타트업부터 대기업까지 다양한 규모의 AI 서비스에 맞춰 유연하게 활용할 수 있다는 점에서 시장성이 높다고 평가된다. 해당 NPU는 SCP의 스토리지, 네트워크, 컴퓨트 등 기존 클라우드 서비스와 연계해 사용할 수 있도록 설계됐다는 점도 강점이다. 이는 단순 연산 자원 제공을 넘어 데이터 처리와 모델 운영까지 포함하는 통합 AI 인프라로 확장하려는 전략이 반영된 것으로 풀이된다. 이를 위해 삼성SDS는 레니게이드 서버를 가상화하고 SCP의 가상화 계층과 통합하는 작업을 진행 중이다. 물리적 NPU 자원을 클라우드 환경에 맞게 추상화해 자원 활용 효율을 높이고 사용자 접근성을 개선하겠다는 구상이다. 이번 서비스는 정부의 AI 반도체 육성 정책과도 맞닿아 있다. 정부는 AI 추론 시장 확대에 대응해 저전력·고효율 NPU를 중심으로 산업 경쟁력을 강화하기 위해 적극 나섰다. 특히 과학기술정보통신부는 지난달 금융위원회와 국민성장펀드 K-엔비디아 육성 프로젝트 추진을 위한 민관 합동 간담회를 개최하며 AI 반도체 시장의 패러다임이 범용 GPU 중심에서 효율 중심 구조로 전환되고 있다고 진단하며 국산 NPU 기술 확보를 위한 대규모 투자 필요성을 강조했다. 또 국민성장펀드를 통해 향후 5년간 50조원을 투입하는 'K-엔비디아' 육성 프로젝트를 추진하며 AI 컴퓨팅 인프라와 생태계 전반에 대한 지원 확대에 대한 의지를 드러냈다. 업계에선 삼성SDS의 NPUaaS가 정부의 이 같은 정책 기조 속에서 국산 AI 반도체의 실제 활용을 확대하는 계기가 될 것으로 보고 있다. 클라우드 기반 서비스는 초기 투자 부담 없이 기업들이 NPU를 도입할 수 있는 환경을 제공한다는 점에서 정책 효과를 시장으로 연결하는 역할을 할 수 있기 때문이다. 업계 관계자는 "국산 NPU가 실제 클라우드 서비스로 제공되는 것은 기술 개발 단계를 넘어 시장 적용 단계로 진입했다는 의미"라며 "정부 정책과 민간 인프라가 맞물리면서 AI 반도체 생태계가 본격적으로 확대될 것"이라고 말했다.

2026.04.02 14:46장유미 기자

제조 AI, 국산 반도체로 실현한다…포스코DX-모빌린트 '맞손'

포스코DX가 국산 인공지능(AI) 반도체를 활용해 제조 현장 AI 전환(AX) 전략 강화에 나섰다. 외산 그래픽처리장치(GPU) 중심 구조에서 벗어나 엣지 AI 기반 인텔리전트 팩토리를 중심으로 비용 효율성과 보안, 실시간 대응 역량을 동시에 확보하겠다는 구상이다. 포스코DX는 모빌린트와 국산 신경망처리장치(NPU) 기반 AX 구현을 위한 업무협약(MOU)을 체결했다고 2일 밝혔다. 이번 협력은 단순 기술 도입을 넘어 투자와 사업 연계를 포함한 전략적 파트너십 성격을 띤다. 포스코DX는 지난 2월 포스코기술투자와 함께 조성한 기업형 벤처캐피탈(CVC)을 통해 모빌린트에 총 30억원을 투자하며 협력 기반을 마련한 바 있다. AI 인프라 기술을 외부에서 조달하는 방식에서 나아가 유망 스타트업과의 공동 성장 구조를 구축하려는 움직임으로 풀이된다. 핵심은 GPU 중심 AI 인프라를 국산 NPU로 대체하는 데 있다. NPU는 딥러닝·머신러닝 연산에 특화된 반도체로, 특히 추론 단계에서 높은 효율을 보이며 전력 소비와 비용 측면에서 강점을 갖는다. 이는 생산 설비와 가까운 현장에서 직접 데이터를 처리하는 엣지 AI 구현에 적합해 제조 현장의 실시간 의사결정과 보안 요구를 동시에 충족할 수 있다는 점이 주목받고 있다. 우선 포스코DX는 자체 산업용 제어시스템 '포스마스터'에 모빌린트의 NPU를 적용해 설비 제어 단계에서 AI 분석과 대응이 즉각 이뤄지는 인텔리전트 팩토리를 구현할 계획이다. 양사는 NPU 환경에서 AI 모델 성능을 최적화하기 위한 공동 기술 개발도 병행한다. 특히 모빌린트는 엣지 환경에서 대규모언어모델(LLM)을 구동할 수 있는 NPU 기술을 확보한 국내 기업으로, 현장 데이터 기반 실시간 판단과 제어를 지원한다. 철강과 이차전지 소재 생산 등 고도의 정밀성과 안정성이 요구되는 산업에서 활용도가 클 것으로 전망된다. 이번 협력은 제조 AI 인프라의 구조 전환을 가속화하는 계기가 될 것이라는 관측도 나온다. 기존에는 중앙 데이터센터 기반 GPU 인프라에 의존해 왔지만, 최근에는 현장에서 직접 데이터를 처리하는 엣지 AI 수요가 빠르게 증가하고 있어서다. 특히 데이터 외부 반출이 어려운 제조 환경에선 보안성과 지연 최소화가 핵심 경쟁 요소로 떠오르고 있다. 포스코DX는 향후 엣지 AI 기술을 철강, 이차전지소재 생산 현장뿐 아니라 물류 등 다양한 산업 영역으로 확장해 나갈 방침이다. 이는 포스코그룹이 추진 중인 인텔리전트 팩토리 전략과도 맞닿아 있다. 그룹은 제조 현장 전반에 AI 기반 자동화와 최적화 기술을 적용해 안전성과 생산성을 동시에 높이는 방향으로 AX를 확대 중이다. 조석주 포스코DX AX융합연구소장은 "이번 협력으로 인텔리전트 팩토리 구현에 필수적인 LLM 기반의 엣지 AI 기술을 확보할 수 있게 됐다"며 "단순 NPU 공급 관계가 아닌 국내 스타트업과의 성공적인 협업·상생 사례로 발전시킬 것"이라고 강조했다. 이어 "포스코그룹이 제조 AI의 패러다임 전환을 리딩하는 기업으로 자리매김할 수 있도록 하겠다"고 덧붙였다.

2026.04.02 14:44한정호 기자

"TCO 낮추고 국산 반도체 얹는다"…롯데이노베이트, NPU로 공공시장 승부수

롯데이노베이트가 인공지능(AI) 반도체 기업 딥엑스와 손잡고 온디바이스 AI 시장 공략에 본격 나선다. 단순 기술 협력을 넘어 공공 인프라 중심의 비전 AI 시장에서 비용 구조 혁신과 국산 반도체 생태계 구축을 동시에 겨냥한 전략적 행보로 풀이된다. 롯데이노베이트는 지난 1일 딥엑스와 '그래픽처리장치(GPU) 대체 가능한 신경망처리장치(NPU) 적용 및 실증을 통한 상호 기술 개선'을 골자로 한 양산 협력 개발 업무협약(MOU)을 체결했다고 2일 밝혔다. 양사는 국산 AI 반도체 기반 기술 협력과 현장 실증을 통해 올해 하반기 양산화를 목표로 하고 있으며 지능형 CCTV 실시간 AI 추론을 위한 전용 NPU 적용에도 나선다. 이번 협력의 핵심은 GPU 중심 구조에서 벗어나 초저전력 NPU 기반으로 전환하는 데 있다. 지능형 CCTV와 ITS(지능형 교통 시스템) 등 공공 인프라 사업은 대규모 설치와 24시간 운영 특성상 전력 비용과 유지비 부담이 크다. 이에 따라 단순 장비 가격을 넘어 전력·운영 비용까지 포함한 총소유비용(TCO) 절감이 사업 경쟁력의 핵심 변수로 작용해왔다. NPU는 이러한 구조적 한계를 보완할 수 있는 대안으로 주목된다. 저전력 설계를 기반으로 장시간 구동 환경에 적합하고, 엣지 단에서 실시간 추론이 가능해 네트워크 비용까지 줄일 수 있기 때문이다. 결과적으로 GPU 대비 가격 경쟁력뿐 아니라 운영 효율성 측면에서도 공공 사업에 적합한 기술로 평가된다. 이번 일은 공공시장 진입 전략 측면에서도 의미가 크다. 롯데이노베이트는 이미 침입·배회·쓰러짐·방화·마케팅 등 5개 항목에 대해 KISA 지능형 CCTV 성능 인증을 확보한 상태다. 여기에 국산 NPU를 결합할 경우 정부의 K-반도체 활성화 정책과 맞물리며 공공 조달 시장에서 경쟁 우위를 확보할 수 있다. 특히 이번 협력은 기술 검증 단계를 넘어 양산 전환을 공식화했다는 점에서 주목된다. 양사는 2023년부터 교통 및 CCTV 분야에서 기술검증(PoC)을 진행해왔으며 이번 MOU는 이를 기반으로 실제 제품화 단계에 진입했음을 의미한다. 롯데그룹 계열사를 활용한 실증 환경도 중요한 경쟁력이다. 유통·물류·인프라 등 다양한 현장을 보유한 그룹 구조는 대규모 엣지 AI 적용 테스트베드로 기능할 수 있다. 이는 외부 시장 확대 이전에 안정적인 레퍼런스를 확보할 수 있는 기반으로 작용한다. 딥엑스 역시 실제 산업 환경에서 자사 NPU 성능을 검증할 수 있는 기회를 확보하게 된다. 산업적으로는 이번 협력이 단순 하드웨어 전환을 넘어 AI 처리 구조의 변화를 의미한다는 점에서 주목할 필요가 있다. 클라우드 중심 영상 분석에서 벗어나 데이터 발생 지점에서 실시간 처리하는 온디바이스 AI로의 전환이 가속화되는 흐름과 맞닿아 있기 때문이다. 이는 개인정보 보호 요구 강화와 네트워크 비용 절감이라는 공공 인프라 시장의 요구와도 맞물린다. 이에 이번 협력은 '저원가 구조'와 '국산 반도체', '인증 기반 시장 진입'이라는 세 축을 결합해 공공 비전 AI 시장에서 표준 선점에 나선 전략으로 해석된다. 롯데이노베이트 관계자는 "이번 협력을 계기로 ITS, 공공 인프라, 스마트 리테일 등 다양한 비전 AI 응용 분야에서 실제 산업 적용 사례를 확보하고, 향후 롯데그룹 내 유통·물류·인프라 등 다양한 사업 영역으로 온디바이스 AI 기반 비전 AI 시스템 적용을 단계적으로 확대해 나갈 예정"이라며 "NPU 기반 엣지 AI 생태계를 강화하고 다양한 산업 현장에 최적화된 AI 서비스 확산에 박차를 가할 계획"이라고 말했다.

2026.04.02 10:44장유미 기자

모빌린트, 포스코DX와 산업 AI 시장 공략 변격화

AI 반도체 기업 모빌린트가 포스코DX와 함께 AI 반도체 기반 산업 AI 시장 공략을 위한 전략적 업무협약(MOU)을 체결했다고 2일 밝혔다. 이번 협약은 양사가 보유한 AI 반도체 기술과 산업 현장 운영 역량을 결합해 제조·로봇·물류·안전 분야 전반에서 실제 적용 가능한 AI 솔루션을 공동 개발하고, 이를 상용화까지 빠르게 연결하기 위한 전략적 협력이다. 특히 이번 협력은 단순한 기술 협력을 넘어, 포스코DX가 포스코기술투자와 함께 출자한 기업형 벤처캐피탈(CVC)을 통해 모빌린트에 약 30억원 규모의 전략적 투자를 단행한 이후 본격화된 것이다. 양사는 ▲AI 하드웨어 시스템 공동 개발 ▲현장 적용을 위한 PoC 및 기술 검증 ▲신규 협력 과제 발굴 및 사업화 ▲실무 협의체 기반 협력 체계 구축 등을 중심으로 협력을 추진한다. 포스코DX는 AI 추론 코드, 개발 환경, 데이터셋 등 핵심 자산과 산업 자동화 플랫폼을 기반으로 현장 적용을 지원하고, 모빌린트는 고성능·저전력 NPU 기반으로 AI 알고리즘 최적화 및 온디바이스 AI 시스템 구현을 담당한다. 이를 통해 기존 GPU 중심의 AI 인프라를 NPU 기반으로 전환함으로써 인프라 비용 절감과 전력 효율 개선을 동시에 추진하고, 데이터센터를 거치지 않는 엣지 AI 구조를 적용해 산업 현장에서 요구되는 보안성과 실시간성을 확보할 계획이다. 모빌린트는 국내에서 유일하게 엣지 환경에서 LLM(대규모 언어모델) 구동이 가능한 고성능 NPU 기술력을 바탕으로, 산업 현장에서 요구되는 실시간 AI 처리 역량을 구현하고 있다. 특히 센서·설비 등에서 발생하는 방대한 데이터를 현장에서 직접 분석·판단·제어할 수 있어, 데이터센터 의존도를 낮추고 제조 현장의 지능화를 실질적으로 가속화할 수 있는 것이 강점이다. 이번 협력을 통해 모빌린트는 자사의 NPU 기반 온디바이스 AI 기술을 포스코DX의 산업 AI 환경에 최적화하고, PoC를 통해 기술 완성도를 빠르게 검증해 실제 사업화로 연결할 계획이다. 이를 통해 생산성과 운영 효율을 동시에 향상시키는 산업 AI 레퍼런스를 확보한다는 전략이다. 포스코DX는 엣지 AI 기술을 확대 적용해 기존 GPU 기반 AI 시스템을 NPU 중심으로 전환하고, 철강 및 이차전지소재 생산 현장은 물론 물류 등 다양한 산업 영역으로 적용 범위를 넓혀 나갈 예정이다. 모빌린트 관계자는 “포스코DX의 전략적 투자와 협력을 통해 자사의 AI 반도체 기술을 제조 및 산업 현장에 본격적으로 적용할 수 있는 기반을 마련하게 됐다”며 “AI 인프라를 혁신하고, 엣지 환경에서 실행 가능한 AI를 통해 산업 전반의 지능화를 가속화하는 성과를 만들어 나가겠다”고 말했다. 포스코DX 관계자는 “이번 협력으로 인텔리전트 팩토리 구현에 필수적인 LLM 기반의 엣지 AI 기술을 확보할 수 있게 됐다”며 “단순 NPU 공급 관계가 아닌 국내 스타트업과의 성공적인 협업·상생 사례로 발전시켜, 포스코그룹이 제조 AI의 패러다임 전환을 리딩하는 기업으로 자리매김할 수 있도록 하겠다”고 강조했다.

2026.04.02 10:00전화평 기자

모빌린트, 700억원 규모 시리즈 C 투자 유치 완료

국내 AI 반도체 스타트업 모빌린트가 700억원 규모의 시리즈 C 투자 유치를 마무리했다고 1일 밝혔다. 이번 투자에는 프랙시스캐피탈파트너스, 포스코기술투자, 컴퍼니케이파트너스 등 주요 투자자가 참여했다. 이번 투자는 고성능 대비 압도적인 전력 효율을 구현한 NPU 설계 기술과 산업 현장에서 빠르게 검증되고 있는 사업화 성과를 동시에 인정받은 결과다. 특히 데이터센터 의존도를 낮추고 엣지 환경에서 AI를 직접 실행하는 온디바이스 구조에 대한 수요가 확대되면서, 고성능·저전력 기반 AI 반도체 기술력과 실제 적용 가능성이 투자 판단의 핵심 요인으로 작용한 것으로 분석된다. 관련 시장이 빠르게 성장하는 가운데, 모빌린트의 기술 경쟁력 역시 주목받고 있다. 모빌린트는 국내에서 유일하게 엣지 환경에서 LLM(대규모 언어모델) 구동이 가능한 고성능 NPU 기술을 보유하고 있다. 이를 통해 산업 현장에서 요구되는 실시간 AI 처리 역량을 구현하고, 센서·설비 등에서 발생하는 방대한 데이터를 현장에서 즉각 분석·판단·제어할 수 있어 제조 현장의 지능화를 가속화할 수 있다는 평가다. 현재 모빌린트는 자체 설계한 AI 가속기 칩 'ARIES(에리스)'와 AI SoC 'REGULUS(레귤러스)'를 기반으로 엣지 AI 시장을 공략하고 있다. 또한 MLX-A1(Edge AI Box) 등 하드웨어와 소프트웨어를 통합한 풀스택 AI 솔루션을 통해, 제조·리테일·보안 등 다양한 산업에서 별도의 복잡한 구축 과정 없이 즉시 적용 가능한 AI 인프라를 제공하고 있다는 점이 강점이다. 최근에는 글로벌 IT 제조 기업 인탑스와 협력해 AI 반도체 기반 솔루션의 공동 개발 및 양산을 추진하고 있으며, 이를 실제 제조 공정에 적용하는 스마트팩토리 프로젝트도 본격화했다. 일부 프로젝트는 이미 양산 및 사업화 단계에 진입하며, 산업 현장에서의 적용 성과를 구체화하고 있다. 모빌린트는 이번 투자금을 바탕으로 ▲차세대 NPU 아키텍처 고도화 ▲양산 및 공급 체계 확대 ▲글로벌 시장 진출 가속 ▲자사 NPU 중심 생태계 확장에 집중할 계획이다. 이를 통해 AI 반도체 설계부터 소프트웨어, 솔루션까지 아우르는 풀스택 경쟁력을 강화하고 글로벌 시장 내 입지를 빠르게 확대한다는 전략이다.

2026.04.01 17:23전화평 기자

리벨리온, 6400억 투자 유치...기업가치 3.4조

국내 AI 반도체 스타트업 리벨리온이 국민성장펀드 1호로 선정되면서 6400억원 규모의 프리IPO 라운드 투자를 유치했다고 31일 밝혔다. 이번 투자로 리벨리온은 3조4000억원의 기업가치를 달성했다. 이번 프리IPO 라운드는 정부 주도의 정책자금과 미래에셋그룹이 리드한 민간 자본이 결집된 '민관 합동 투자'의 결과다. 정책자금의 경우 국민성장펀드에서 2500억원, 산업은행이 500억원을 각각 투자해 총 3000억원의 재원을 조성했다. 특히 미래에셋그룹은 그룹 차원에서 앵커 투자자로 나서며, 3000억원의 투자를 리드했다. 이러한 시장의 신뢰를 바탕으로 기존 투자자들도 신주인수권을 행사하며 총 6400억원 규모로 이번 투자가 마무리될 예정이다. 이번 투자는 정부가 대한민국 AI 3대 강국 달성을 목표로 추진 중인 '국민성장펀드 1차 메가프로젝트'의 핵심 과제인 'K-엔비디아 육성 프로젝트'의 실질적인 첫 행보다. 정부는 AI 반도체 분야에 필요한 다양한 투자와 지원을 바탕으로 기존 GPU의 전력·비용 한계를 극복할 국산 NPU 생태계를 구축할 계획이다. 그 일환으로 5년간 150조원 규모의 국민성장펀드 중 15조원을 혁신 기업에 대한 지분 투자 방식으로 집행, 리벨리온이 그 첫 사례로 이름을 올리며 국산 NPU 생태계 전반을 견인할 대표주자로 나서게 됐다. 회사는 이번 자금 조달을 바탕으로 인재 채용에 박차를 가할 계획이다. 현재 리벨리온은 300여명의 인력 규모를 갖추고 있다. 박성현 리벨리온 대표는 “지난 5년간 국내 반도체 생태계와 정부의 전폭적인 지지가 있었기에 리벨리온이 여기까지 성장할 수 있었다"며 "AI 추론 시장이 개화하는 '골든타임'을 놓치지 않기 위해 국가와 민간의 모험자본이 적시에 힘을 모아주신 것은 대한민국 반도체 생태계의 역사에 있어 상징적인, 매우 가슴 뛰는 순간”이라고 말했다. 그러면서 “이제는 경쟁력 있는 인재들과 함께 지금보다 2배 이상으로 팀을 키워 한층 더 높은 수준의 인재밀도를 갖추고, 글로벌 AI 인프라 시장의 중심에서 한국 AI 및 반도체 생태계와 함께 그 경쟁력을 직접 증명해보일 것”이라고 강조했다.

2026.03.31 09:25전화평 기자

리벨리온, 차세대 AI칩 '리벨 100'으로 명칭 변경...왜?

국내 대표 AI 반도체 스타트업 리벨리온이 자사의 차세대 신경망처리장치(NPU) 명칭을 기존 '리벨 쿼드(REBEL-Quad)'에서 '리벨 100(REBEL 100)'으로 공식 변경하기로 했다. 칩 이름 하나로 전체 제품 라인업을 부르던 기존 방식에서 벗어나, 고객 편의성을 극대화하기 위한 직관적인 네이밍 개편이다. 30일 반도체 업계에 따르면 리벨리온은 올해 하반기 양산을 시작하는 차세대 칩을 '리벨 100'으로 명칭을 바꿨다. 이러한 명칭 개편의 배경에는 1세대 칩인 '아톰(ATOM)' 출시 당시의 경험이 있다. 전세대 칩인 아톰은 개별 칩과 카드, 서버 등 여러 제품을 하나의 이름으로 묶어 불렀다. 그러다 보니 고객 입장에서 헷갈린다는 피드백이 이어진 것이다. 이에 따라 칩 자체는 '리벨 100'으로 부르며, 이를 탑재한 카드는 '리벨 카드', 서버는 '리벨 서버'로 직관적인 세분화를 단행했다. 신제품 실물이 본격적으로 고객에게 가기 전에 선제적으로 이름 체계를 확립하려는 목적으로 풀이된다. 리벨리온 관계자는 이에 대해 “명칭을 변경하는 것은 맞다”며 “31일 홈페이지에 새로운 명칭이 업데이트될 예정”이라고 말했다. 엔비디아 'H200' 넘었다…실전 연산 성능 우위·3GB 더 큰 메모리 확보 새로운 이름을 단 '리벨 100'은 최근 내부 벤치마크 테스트 결과, 시장의 기준점인 엔비디아의 최신 AI 칩 'H200'과 대등하거나 이를 소폭 상회하는 성능을 기록했다. 세부 성능 비교 지표를 살펴보면 그 차이가 더욱 명확히 드러난다. 세계 최고 권위 반도체 설계 학회인 ISSCC 2026 발표 자료에 따르면 리벨 100의 FP16(16비트 부동소수점) 연산 성능은 1 페타플롭스(PFLOPS)로 H200(0.99 PFLOPS)과 대등한 수준을 기록했다. 나아가 최근 리벨리온 내부에서 대형언어모델(LLM)을 구동해 진행한 실제 추론 벤치마크 테스트에서는 리벨 100이 H200을 핵심 연산 속도 면에서 앞섰다. H200과 같은 속도를 낼 때 전력 효율이 최대 1.7배 더 높았다. 특히 눈에 띄는 것은 메모리 사양이다. 두 칩의 메모리 대역폭은 동일하지만, 가용 메모리 용량에서 리벨 100은 144GB를 확보해 엔비디아 H200(141GB)보다 3GB 더 높은 수치를 보였다. 업계에 따르면 엔비디아 H200은 144GB의 용량 중 3GB를 에러 정정 코드(ECC) 등 보조 오버헤드 영역으로 할당한다. 실제 가용 용량은 141GB인 셈이다. 반면 리벨 100은 144GB를 온전히 사용자에게 제공한다. 독자적인 칩렛(Chiplet) 아키텍처가 이를 가능하게 한 것으로 보인다. 리벨 100은 삼성전자 4나노 파운드리 공정으로 양산되며, 차세대 메모리인 HBM3E를 탑재했다. 세계 최초로 UCIe 다이-투-다이(Die-to-Die) 인터페이스를 적용해 4개의 칩렛을 하나의 칩처럼 구동시키는 아키텍처를 구현해 냈다. 이를 통해 설계 전력(TDP)을 최대 600W로 억제, 동일한 성능을 내는 엔비디아 H200(700W) 대비 전력 소모를 약 15% 이상 줄이는 전력 효율을 달성했다. 리벨리온은 이러한 하드웨어 경쟁력을 바탕으로 올해 시장 안착에 속도를 낼 계획이다. 현재 리벨리온은 xAI, 오픈AI 등 글로벌 빅테크 기업들과 협력을 진행하고 있다.

2026.03.30 16:00전화평 기자

  Prev 1 2 3 4 5 6 7 Next  

지금 뜨는 기사

이시각 헤드라인

싸기만 한 차는 옛말…AI·로봇 앞세운 中 전기차의 질주

로마인 미라에서 '일리아스' 나왔다…어떻게 이런 일이

한정판 에디션에 '오픈런' 행렬…'붕괴: 스타레일' 환락 팝업스토어 성황

"공개 미룬 앤트로픽 '미토스', 위험성 과장됐다"

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.