검색 - IT세상을 바꾸는 힘 지디넷코리아

ZDNet 검색 페이지

'NPU'통합검색 결과 입니다. (141건)

태그
기간
- 3개월
- 1년
- 1년 이전

재검색

레드햇-리벨리온, NPU 기반 '오픈시프트 AI' 출시…추론 환경 개선

레드햇이 리벨리온 손잡고 신경처리장치(NPU) 기반 플랫폼을 개발해 인공지능(AI) 추론 환경을 개선했다. 레드햇은 리벨리온과 '리벨리온 NPU 기반 레드햇 오픈시프트 AI'를 발표했다고 11일 밝혔다. 이 플랫폼은 레드햇 오픈시프트 AI, 리벨리온의 NPU, 가상거대언어모델(vLLM) 엔진을 결합해 엔터프라이즈급 풀스택 AI 추론 환경을 제공한다. 리벨리온 NPU는 AI 추론에 특화된 아키텍처다. 그래픽처리장치(GPU) 대비 에너지 효율을 높여 데이터센터 구축·운영 비용을 줄인다. 또 자체 소프트웨어(SW) 스택과 오픈소스 프레임워크 지원을 통해 GPU와 유사한 개발 환경을 제공한다. 새 솔루션은 하드웨어(HW)부터 모델 서빙까지 전 영역을 아우르는 풀스택 구조를 제공한다. 리벨리온 SW 스택은 레드햇 오픈시프트 AI에서 네이티브 실행돼 배포 속도를 높인다. 레드햇 오픈시프트 인증을 받은 NPU 오퍼레이터는 온프레미스·멀티클라우드 환경에서 모두 작동한다. 해당 플랫폼은 랙 스케일 NPU와 vLLM 기반으로 고처리량, 저지연, 전력 효율성을 제공한다. 이를 통해 고객은 LLM 등 다양한 추론 워크로드를 안정적으로 운영할 수 있다. 데이터 온프레미스 유지와 규제 준수 측면에서도 강화된 보안 환경을 제공한다. 코어에서 엣지까지 선형 확장을 지원해 배포 유연성도 확보했다. 브라이언 스티븐스 레드햇 AI 부문 수석부사장 겸 최고기술책임자(CTO)는 "우리 솔루션을 리벨리온의 NPU와 통합해 엔터프라이즈에 검증된 풀스택 대안을 제공할 것"이라며 "고객은 실제 운영 환경의 AI에 필수인 효율성과 저지연성, 수평 확장성을 갖추고 AI 추론 워크로드를 배포할 수 있다"고 밝혔다. 박성현 리벨리온 대표는 "이번 협력으로 기업들이 보다 효율적이고 안전하게 AI 서비스를 확장할 수 있도록 지원할 것"이라며 "GPU 중심 환경을 넘어 NPU 기반 추론 인프라의 새로운 대안을 제시하는 첫 사례가 될 것"이라고 밝혔다.

2025.12.11 11:48김미정 기자

리벨리온, 자사 NPU 기반 레드햇 오픈시프트 AI 공개

AI 반도체 스타트업 리벨리온은 글로벌 오픈소스 솔루션 선도기업 레드햇과 함께 '리벨리온 NPU 기반 레드햇 오픈시프트 AI'를 공개한다고 11일 밝혔다. 이 솔루션은 '레드햇 오픈시프트 AI'와 리벨리온의 NPU(신경망처리장치), 고효율 추론 엔진인 vLLM을 결합해 검증된 풀스택 엔터프라이즈 AI 플랫폼을 제공한다. 레드햇 오픈시프트 AI는 기업이 AI 모델의 라이프사이클을 규모에 맞게 관리할 수 있도록 지원하는 쿠버네티스 기반의 엔터프라이즈 AI/ML 플랫폼이다. '리벨리온 NPU 기반 레드햇 오픈시프트 AI'는 AI 추론 최적화를 위해 핵심 요소를 통합해, 하드웨어(NPU)는 물론 모델 서빙(vLLM)까지 추론에 필요한 모든 영역을 아우르는 검증된 풀스택 AI 추론 플랫폼이다. AI 도입이 확대되면서 기업은 인프라 비용, 배포 복잡성, 보안 등 다양한 과제를 동시에 해결해야 한다. 특히, AI 추론은 학습된 모델이 실제 환경에서 응답을 생성하는 단계로 사용 빈도가 가장 높고 비용·성능에 직접적인 영향을 미친다. 따라서, 기존 GPU 중심의 인프라만으로는 대규모 운영이 요구하는 효율성을 충족하기 어렵다. 이번 솔루션은 이러한 현실적 요구를 반영해 다양한 환경에서 안정적이고 효율적인 추론 인프라를 구축할 수 있는 대안이 될 전망이다. 이번에 출시된 플랫폼은 고객의 AI추론 최적화를 위한 핵심 요소를 통합했다. 먼저, 리벨리온의 NPU는 AI 추론에 최적화된 아키텍처로 설계되어 기존 GPU 대비 최대 3.2배 더 높은 에너지 효율성을 제공하며, 서버·랙 단위에서 데이터센터의 구축 및 운영 비용을 효과적으로 낮춰준다. 또한 풀스택 소프트웨어와 주요 오픈소스 AI 프레임워크 지원을 통해 GPU와 동일한 수준의 편리한 개발 환경을 제공한다. 이를 바탕으로 '리벨리온 NPU 기반 레드햇 오픈시프트 AI'는 하드웨어부터 모델 서빙까지 모든 영역을 아우르는 검증된 풀스택 AI 추론 플랫폼을 제공한다. 리벨리온의 소프트웨어 스택은 '레드햇 오픈시프트 AI'에서 최적화되어 실행되며 오버헤드(불필요한 작업)를 줄이고 배포를 가속화한다. 또한 레드햇 오픈시프트의 인증을 취득한 레벨리온 NPU 오퍼레이터는 온프레미스 및 멀티클라우드 환경에서 보다 원활한 통합과 신뢰할 수 있는 지원을 제공하여 기업의 데이터 주권 확보와 규제 준수를 지원한다. 해당 플랫폼은 주요 기능으로 ▲확장 가능한 엔터프라이즈급 AI 지원(vLLM 통합으로 고처리량·저지연·고효율 추론 운영) ▲보안 강화 및 규제 준수(온프레미스 기반 데이터 보호 및 요건 대응) ▲운영 단순화(NPU를 GPU처럼 쉽게 운영할 수 있는 통합 관리 환경) ▲유연한 확장성(코어부터 엣지까지 선형 확장이 가능한 인프라)을 제공한다. 양사는 코오롱베니트와 공동으로 세미나를 열어 솔루션을 소개하고, 기업의 생성형 AI 도입 과정에서 마주하는 주요 과제를 논의할 예정이다. 이후 참여 기업 대상 컨설팅과 실증을 통해 효율적인 AI 인프라 구축을 지원하고 시장 확장을 본격화할 계획이다. 박성현 리벨리온 대표는 “AI서빙과 추론이 본격화되며 기업들은 성능과 비용, 데이터 주권을 모두 만족시키는 실용적인 인프라를 필요로 하고 있다”며 “기업들이 보다 효율적이고 안전하게 AI서비스를 확장할 수 있도록 지원하는 한편, GPU 중심의 환경을 넘어 NPU 기반 추론 인프라의 새로운 대안을 제시하는 첫 사례가 될 것”이라고 말했다. 브라이언 스티븐스 레드햇 AI 부문 수석부사장 겸 CTO는 “레드햇은 레드햇 오픈시프트 AI의 개방적이고 확장 가능한 역량을 리벨리온의 효율적인 NPU와 통합함으로써, 엔터프라이즈에 검증된 풀스택 대안을 제공한다”며 “이를 통해 고객은 실제 운영 환경의 AI에 필수인 효율성과 저지연성, 수평 확장성을 갖추고 AI 추론 워크로드를 배포할 수 있다”라고 전했다.

2025.12.11 10:26전화평 기자

퀄컴, 아태 AI 스타트업 육성 시동…15개팀 성과 서울서 공개

퀄컴이 아시아·태평양(APAC) 지역 온디바이스 AI 생태계 확장을 위한 '퀄컴 AI 혁신 프로그램(QAIPI) 2025 APAC 데모데이' 행사를 5일 오후 서울 용산구 퀄컴코리아 사옥에서 진행했다. QAIPI는 퀄컴이 올해 APAC 대상으로 처음 진행한 프로그램이다. 한국과 일본, 싱가포르 등 3개 나라에서 총 15개 스타트업을 선정해 6개월 동안 퀄컴의 엣지 AI 플랫폼 기반 기술 멘토링 등을 제공했다. 또 올해 데모데이 행사 개최지를 서울로 선택했다. 5일 오전 퀄컴코리아에서 국내 기자단과 만난 이비 타이 퀄컴 타이완 사업개발 디렉터는 "한국은 세계 최고 수준 ICT 인프라와 스타트업 생태계, 기업·투자자 네트워크로 적합한 시장"이라고 설명했다. "선정 스타트업에 퀄컴 기술과 글로벌 진출 지원" 퀄컴은 올해 APAC 지역에서 '퀄컴 AI 혁신 프로그램 2025'를 시작하고 한국·일본·싱가포르에서 총 15개 유망 스타트업을 선정했다. 선정 팀들은 디바이스·제품 키트 지원, 5천 달러(약 736만원) 상당 특허 출원 인센티브도 지원받았다. 이비 타이 디렉터는 "선정된 스타트업의 요구사항을 파악해 모바일과 AI PC, IoT 등 다양한 퀄컴 엣지 AI 플랫폼을 활용한 솔루션 개발을 지원했다. 또 글로벌 시장 진출을 위한 디자인·지식재산권(IP) 교육, 특허 전략 컨설팅, 비즈니스 워크숍도 제공했다"고 설명했다. 이어 "오늘 오후 진행될 데모데이 행사에서는 한국을 포함해 총 15개 스타트업이 헬스케어, 로보틱스, 스마트시티, 산업용 AI 등 다양한 분야의 엣지 AI 솔루션을 발표하고 라이브 데모를 선보이며, 지난 6개월간의 협력 성과를 공유한다"고 덧붙였다. 반야에이아이 "퀄컴, 한국 특화 AI 모델 구현 적극 지원" QAPI에 선정된 국내 스타트업 중 한 곳인 '반야에이아이'는 올해 3월 설립됐다. 이 회사 김 안토니오 최고기술책임자(CTO)는 "어려움을 겪는 사회적 약자를 위해 '지혜'를 빌려주는 AI 기술을 개발하고 있다"고 설명했다. 이어 "온디바이스 AI는 개인 프라이버시나 민감 정보를 외부로 공개하지 않아도 챗GPT 수준의 사려 깊은 인공지능을 만들 수 있다. 오픈소스 기반으로 자체 개발한 AI 모델을 튜닝하고 훈련해 사용하고 있다"고 설명했다. 퀄컴은 반야에이아이와 협업 과정에서 스냅드래곤 X 엘리트 탑재 기기를 제공했다. 김 안토니오 CTO는 "내장 아드레노 GPU 성능이 강화돼 온디바이스 AI를 원활히 실행할 수 있다"고 평가했다. 반야에이아이는 한국어 기반 모델을 퀄컴 실리콘에 최적화하는 과정에서 퀄컴의 기술 지원을 받았다. 김 안토니오 CTO는 "2주에 한 번씩 퀄컴 기술진과 미팅을 하며 어려운 부분에 대해 도움을 받고, 매번 많은 자료를 제공받는 등 긴밀히 협업했다"고 설명했다. "아두이노 인수로 스타트업 지원 가속... 유니콘 탄생 희망" 이비 타이 퀄컴 타이완 사업개발 디렉터는 "올해 APAC 전역에서 수준 높은 지원자들이 몰렸다. 이 중 ▲AI 혁신성 ▲산업적·사회적 영향 ▲퀄컴 기술과의 시너지 ▲플랫폼 적합성을 따져 스타트업을 선정했다"고 설명했다. 이어 "특허 출원 인센티브 과정에서 모든 지적재산권은 해당 스타트업에 귀속되며 퀄컴은 관여하지 않는다. 또 기술적으로 뛰어난 곳은 내부 사업부나 고객사와 연결해 상용화 기회를 제공하는 등 장기 성장도 돕는다"고 말했다. 최근 인수한 아두이노 관련해 그는 "스타트업이 퀄컴 플랫폼 위에서 더 빠르게 AI 응용프로그램을 구현할 수 있도록 생태계를 강화하는 효과가 있다"고 설명했다. 이비 타이 디렉터는 "한국·일본·싱가포르 등 주요 국가 스타트업이 시장을 탐색하고 글로벌로 나아갈 수 있도록 지원하겠다는 입장을 밝히며, 향후 유니콘 기업이 탄생하는 데 기여할 수 있다면 큰 의미가 있을 것"이라고 덧붙였다.

2025.12.07 09:31권봉석 기자

제논, 한국중부발전·리벨리온과 발전소 특화 AI 업무 서비스 개발 협력

제논이 국산 신경망처리장치(NPU) 기반 인공지능(AI) 업무 서비스 개발에 나선다. 제논은 한국중부발전, 리벨리온과 발전소 업무 특화 AI 서비스 개발을 위한 3자 업무협약(MOU)을 체결했다고 2일 밝혔다. 이번 협약은 국산 NPU를 기반으로 한 실무형 AI 서비스를 공동 개발하기 위해 추진됐다. 특히 국산 기술을 중심으로 AI 인프라와 응용 서비스를 개발해 발전소 업무 환경에 맞춘 고성능 AI를 실증할 계획이다. 이를 통해 공공과 민간 협력 기반의 AI 상생 및 자립 생태계를 조성한다는 목표다. 협약에 따라 3자는 리벨리온의 고성능 NPU 하드웨어를 기반으로 한국중부발전의 업무 환경에 특화된 AI 서비스인 '하이코미' AI 서비스를 공동 개발한다. 이 과정에서 제논은 대규모언어모델(LLM) 추론 엔진을 리벨리온의 NPU에 최적화한다. 이를 바탕으로 발전소 현장에 최적화된 고성능의 하이코미 AI 응용 서비스 개발 및 다양한 신규 서비스의 창출을 지원한다. 하이코미는 지난해 12월 발전사 최초로 도입된 한국중부발전의 생성형 AI 서비스로, 제논이 1차 사업에 이어 현재 2차 사업까지 수행 중이다. 공동 개발 프로젝트는 이달부터 단계적으로 추진된다. 우선 기존 그래픽처리장치(GPU) 환경에 설치된 하이코미 서비스에 더해 리벨리온의 '아톰-맥스' NPU가 탑재된 AI 서버에도 제논의 생성형 AI 플랫폼 '제노스'를 적용하고 하이코미 AI 서비스가 안정적으로 운용될 수 있는 기반 환경을 조성한다. 이후 NPU 기반의 제노스 플랫폼상에서 실시간 데이터 분석·예측과 AI 추론을 포함한 자동화 시스템을 개발할 예정이다. 고석태 제논 대표는 "AI 솔루션 기업과 AI 반도체 스타트업, 공공기관이 힘을 모아 국산 기술 기반의 AI 생태계를 구축하는 모범 사례를 만들게 돼 매우 뜻깊다"며 "이번 협력을 통해 확보된 기술적 기반 위에서 하이코미 서비스가 실제 업무 현장과 보다 긴밀하게 연계되는 형태까지 고도화될 수 있도록 우리의 기술 역량을 다해 각 기관과 긴밀히 협력해 나가겠다"고 말했다.

2025.12.02 17:52한정호 기자

모빌린트, 日 유니전자와 엣지 AI 사업 협력

국내 AI 반도체 기업 모빌린트는 일본의 전자·산업 솔루션 전문기업 유니전자와 일본 내 엣지 AI 시장 공략을 위한 전략적 업무협약(MOU)을 체결했다고 2일 밝혔다. 이번 협약은 양사가 일본 AI·산업용 엣지 컴퓨팅 분야에서 공동 비즈니스 기회를 발굴하고 장기적인 파트너십 기반을 구축하기 위한 사전 협력 단계로 체결됐다. 유니전자는 제조·산업기기·전장·스마트시티 등 폭넓은 고객 네트워크를 보유한 일본 기술·유통 기업으로, 전자부품·센서·차량용 전장품을 비롯해 IoT·무선 솔루션, 산업 플랫폼 등 다양한 제품을 공급하고 있다. 최근 DX·자동화 수요 확대에 발맞춰 소형 센서·무선 디바이스 중심으로 사업 영역을 확장하고 있다. 모빌린트와 유니전자는 이번 협약을 통해 모빌린트의 고성능·저전력 NPU 기술과 유니전자의 산업 기반·현장 대응 역량을 결합해 일본 주요 산업을 대상으로 한 엣지 AI 도입 가속화에 나선다. 협력 범위에는 ▲엣지 AI 적용 분야 공동 발굴 ▲산업·전장·로보틱스 분야 PoC(개념검증) 공동 추진 ▲NPU 기반 산업 솔루션 기획 및 사업 모델 논의 ▲기술·솔루션 공유 ▲공동 마케팅 및 영업 전략 수립 등이 포함된다. 모빌린트는 제조 비전 검사, 로봇 자율주행, 스마트시티 인프라 분석 등 일본 산업 현장에서 요구되는 다양한 분야에 NPU 기반 엣지 AI 제품을 적용하며 레퍼런스를 확대해 나갈 계획이다. 양사는 PoC 운영 및 테스트베드 구축 등을 통해 협력 단계를 점진적으로 확대하고 일본 내 엣지 AI 생태계 조성에 박차를 가할 방침이다. 모빌린트 김성모 사업개발본부장은 “이번 협약은 일본 산업 시장의 엣지 AI 수요에 대응하기 위한 중요한 출발점”이라며 “유니전자의 네트워크와 모빌린트의 NPU 기술을 결합해 제조·로보틱스·스마트시티 등 주요 산업에서 빠르게 레퍼런스를 확대하고 실질적인 사업 성과를 만들어 나가겠다”고 말했다. 유니전자 스야마 대표이사는 “유니전자는 50년 이상 반도체·전자 부품을 안정적으로 공급해온 신뢰받는 전자 솔루션 기업”이라며 “이번 협업을 통해 MOBILINT의 고성능·저전력 NPU 기술과 당사의 산업 분야 전문성·고객 네트워크를 결합함으로써 제조, 로보틱스, 스마트시티 등 현장에서 즉시 적용 가능한 고부가가치 엣지 AI 솔루션을 제공할 수 있는 기반이 마련됐다”고 말했다.

2025.12.02 09:47전화평 기자

"韓, AI PC 관심도 높고 전환 속도도 빨라"

인텔은 지난 11월 한 달간 AI PC 기반 주요 기능과 응용프로그램, 여러 제조사 AI PC를 체험할 수 있는 팝업스토어를 전 세계 5대 도시에서 운영했다. 미국(뉴욕), 영국(런던), 유럽(파리·뮌헨)과 함께 아시아권에서는 유일하게 서울이 선정됐다. 팝업스토어 운영에는 삼성전자, LG전자와 델테크놀로지스, 에이수스, HP, MSI 등 국내외 AI PC 제조사가 참여해 게이머와 콘텐츠 제작자를 위한 AI PC 각종 기능을 시연했다. 네이버쇼핑과 지마켓, 쿠팡 등 국내 온라인 유통채널도 참여했다. 한 달간 서울 팝업스토어를 찾은 사람은 2만 5천여 명으로 인텔 당초 예상치인 1만5천명을 1.6배 넘어섰다. 주말을 포함해 하루 800명 이상이 팝업스토어를 방문한 셈이다. 인텔 팝업스토어 운영 종료를 이틀 앞둔 지난 28일 오후 현장에서 만난 최은빈 인텔코리아 마케팅 총괄(이사)은 "서울이 AI PC를 알리기에 적합한 곳이라는 것을 증명하기 위해 다양한 노력을 기울인 것에 대한 성과를 거뒀다"고 평가했다. "한국, AI PC 전환율 상위권 국가 중 하나" 이날 최은빈 총괄은 "인텔이 아시아지역에서 서울을 팝업스토어 운영 장소로 선정한 이유는 AI PC 전환이 가장 빠르게 일어나는 국가이기 때문"이라고 설명했다. 인텔 자체 통계에 따르면 국내 판매된 인텔 프로세서 기반 노트북 중 40% 가량이 신경망처리장치(NPU)를 내장한 제품이다. 특히 지난 해 하반기 정식 출시된 코어 울트라 200V(루나레이크) 탑재 제품이 상당수를 차지했다. 최 총괄은 "소비자들이 AI라는 단어에는 익숙하지만, AI PC에 대해 정확히 이해하거나 제대로 활용하는 경우는 적었다. 이번 팝업스토어는 단순 홍보나 전시가 아니라 경험을 통해 소비자 인식을 바꾸는 것에 주력했다"고 밝혔다. "AI PC 체험 후 구매 흐름, 작년 대비 뚜렷해" 팝업스토어에는 콘텐츠 제작자를 위한 '크리에이터 존', 게이머를 위한 '게이머 존'을 마련하고 고성능 AI PC를 배치했다. 최 총괄은 "현장에서 직접 찍은 사진을 AI PC로 다양하게 편집하고 직접 출력할 수 있는 'AI 포토 부스' 인기가 높았다. 유통 파트너사와 진행한 스탬프 랠리나 경품 이벤트도 방문 동기를 키웠다"고 설명했다. 이어 "팝업스토어에 전시된 제품을 대상으로 10여 차례 라이브 커머스를 진행한 결과 지난 해 2월 성수동에서 운영한 팝업스토어 대비 더 판매가 활발했다. AI PC 체험이 실제 구매로 이어지는 흐름이 분명히 나타났다"고 덧붙였다. "코어 울트라 200V, 배터리 효율·성능 향상에 호평" 지난 해 출시된 코어 울트라 200V 프로세서는 전력 효율 향상, 프로세서 내장 Xe2 GPU 강화를 통한 게임과 AI 성능 강화 등을 내세웠다. 최 총괄은 "코어 울트라 200V 기반 AI PC 이용자 대상 조사 결과 배터리 효율 향상, NPU를 이용한 AI 처리 분산으로 각종 응용프로그램 처리시 체감 성능 향상 등을 꼽는 소비자가 많았다"고 말했다. 데스크톱 PC용 코어 울트라 200S(애로우레이크) 프로세서에 대한 시장 평가는 노트북용과 대비된다. 커넥트웨이브 가격비교서비스 다나와에 따르면 지난 11월 말 기준 국내 조립 PC 시장에서 경쟁사인 AMD 라이젠 프로세서의 점유율이 70%를 넘어섰다. 최은빈 총괄은 "영상 편집과 콘텐츠 제작 환경에서는 코어 울트라 200S에 내장된 NPU 활용도가 높고 각종 작업 성능도 경쟁력을 갖췄다. 또 올 4분기부터는 PC방용 고성능 PC 구성시도 코어 울트라 200S를 선택하는 사례가 늘고 있다"고 반론했다. "코어 울트라 시리즈3, AI 시대 위한 기본기 갖춰" 인텔이 지난 9월 말 공개한 코어 울트라 시리즈3(팬서레이크)는 1.8나노급 인텔 18A 공정에서 생산한 컴퓨트 타일(CPU)과 GPU, NPU를 결합했다. AI 연산 성능은 GPU가 120 TOPS(1초당 1조번 연산), NPU가 50 TOPS로 코어 울트라 200V보다 50% 가까이 높아졌다. 최은빈 총괄은 "코어 울트라 시리즈3는 본격적인 AI 시대에 필요한 기본 성능을 갖추고 있다. 또 코로나19 범유행 시기에 노트북을 장만한 사람이 교체한다면 응답 속도나 처리 시간, 배터리 지속시간 등에서 체감 차이가 상당할 것"이라고 설명했다. 코어 울트라 시리즈3 기반 AI PC는 이르면 오는 1월 말부터 국내를 포함한 전 세계 시장에 공급된다. 매년 12월에서 이듬해 3월까지 이어지는 노트북 최성수기에 프로세서 세대 전환이 진행된다. 최 총괄은 "같은 시기에 코어 울트라 시리즈2(루나레이크/애로우레이크), 시리즈3(팬서레이크) 등 3개 라인업이 공존한다. 이는 필요한 성능이나 가격 등 다양한 요구사항을 지닌 소비자의 요구사항을 폭넓게 만족할 수 있을 것"이라고 답했다. "최신 AI PC, 기능·성능에서 후회 없는 선택 될 것" 새 PC를 언제 사는 것이 가장 합리적인가. 최은빈 총괄은 "AI PC가 제공하는 기능이나 성능이 필요하다면 지금 사는 것이 좋다"고 단언했다. 그는 "최신 AI PC의 배터리 지속시간과 성능은 전세대 대비 크게 개선됐다. 어도비 프리미어 프로(AI 활용 영상 분류), GGQ(게임 코치) 등 편의 기능도 늘어나고 있다. 예산과 목적이 명확하다면 AI PC 전환은 후회없는 선택이 될 것"이라고 덧붙였다.

2025.12.01 16:42권봉석 기자

엔비디아 독주에 제동…메타, TPU 도입에 'K-AI칩' 시장 열린다

글로벌 AI 반도체 시장의 힘의 추가 움직이고 있다. 메타가 구글의 TPU(텐서프로세서유닛) 도입을 본격화하며 엔비디아를 중심의 GPU(그래픽처리장치) 생태계가 흔들리기 시작한 것이다. AI 학습부터 추론까지 전 과정을 GPU로만 해결하던 기존 산업 구조가, 다양한 형태의 AI 가속기(ASIC·TPU·NPU)로 분화하는 흐름으로 전환하면서 국내 AI 반도체 업체에도 새로운 기회가 열릴 것으로 관측된다. 27일 업계에 따르면 메타는 최근 자체 AI 인프라에 구글의 새로운 TPU를 대규모로 도입하는 방안을 검토 중이다. 이미 구글 클라우드를 통한 TPU 사용 협력에도 나선 것으로 전해진다. AI 인프라 투자액이 수십조 원에 달하는 메타가 GPU 외 대안을 공식 채택하는 첫 글로벌 빅테크가 된 셈이다. 메타의 선택은 단순한 장비 교체가 아니라, AI 인프라가 더 이상 GPU 한 종류로 감당할 수 없는 단계에 접어들었다는 신호로 읽힌다. 전력·비용·수급 문제를 해결하기 위해 기업들이 맞춤형 반도체(ASIC), TPU, 자체 AI 칩으로 눈을 돌리기 시작한 것이다. 국내 AI 반도체 업계 관계자는 “데이터센터에서 TPU가 활용되기 시작됐다는 건 추론 분야에서 엔비디아 GPU의 대안이 관심 수준을 넘어서 실제 수요 기반의 시장으로 자리 잡고 있다는 의미로 해석된다”고 말했다. GPU가 놓친 틈새, 한국 업체들이 파고드는 시장 이 같은 글로벌 흐름은 국내 AI 반도체 업계에는 수년 만의 기회로 평가된다. 엔비디아 GPU 중심 구조가 흔들리면서 AI 가속기 시장이 다원화되는 구간이 열렸고, 이는 곧 국산 AI 칩이 진입할 수 있는 틈새가 커진다는 의미이기 때문이다. 국내 AI 반도체 기업 중에서는 리벨리온과 퓨리오사AI가 직접적인 수혜를 받을 것으로 전망된다. 양사는 '서버용 AI 추론'에 특화된 NPU(신경망처리장치)를 개발하는 회사다. 두 회사 모두 GPU 대비 높은 전력 효율과 비용 절감을 강점으로 내세우며, 데이터센터와 클라우드 환경에서 빠르게 늘어나는 AI 추론 부담을 줄이는 데 초점을 맞추고 있다. 양사 외에도 하이퍼엑셀이 GPU 없이 LLM 추론 인프라를 구축할 수 있는 추론 서버 풀스택 전략을 통해 업계 안팎에서 주목받고 있다. 업계에서는 TPU 채택을 시작으로 국내 추론용 칩 시장도 활성화될 것으로 내다보고 있다. AI 반도체 업계 관계자는 “이런 시장의 변화는 ASIC 업체들이 준비 중인 추론 특화 칩에 대한 논의로 자연스럽게 이어질 것”이라며 “장기적인 부분에서 의미있는 신호로 보인다”고 설명했다. K-AI칩 활성화...한국 생태계 전반에 호재 이 같은 시장 변화는 칩 개발사에 그치지 않고, 국내 반도체 생태계 전반으로 확산될 수 있다. 국내 AI 칩 생산의 상당 부분을 맡고 있는 삼성전자 파운드리(반도체 위탁생산)는 칩 수요가 늘어날수록 선단공정·2.5D 패키징 등 부가 공정 수요까지 함께 확대될 것으로 예상된다. 아울러 글로벌 HBM 시장을 주도하는 SK하이닉스도 직접적 수혜가 기대된다. 대부분의 AI 가속기가 HBM을 기본 메모리로 채택하면서, GPU 외 대안 가속기 시장이 커질수록 HBM의 전략적 중요성은 더욱 커지는 것이다. 여기에 AI 칩 설계 수요가 증가하면 가온칩스·퀄리타스반도체 등 국내 디자인하우스와 IP 기업의 일감도 자연스럽게 늘어날 것으로 보인다. ASIC 개발 프로젝트가 늘어날수록 설계·IP·검증 생태계가 함께 성장하는 구조이기 때문이다. 반도체 업계 관계자는 "GPU를 대체하는 시장 흐름은 한국 반도체 업계에는 긍정적인 신호가 될 수 있다"고 말했다.

2025.11.27 15:20전화평 기자

"시끄러운 카페서도 내 목소리만 들려줄 수 없을까"

노트북에 내장된 스피커는 크기가 매우 작고 지나치게 큰 음량으로 음성을 재생하면 갈라지거나 찢어지는 소리를 낸다. 가장 성가신 것은 소리를 높일 때 스피커의 진동이 본체나 키보드 등으로 전해지며 내는 잡음이다. 지난 12일 오후, 미국 캘리포니아 주 샌디에이고 소재 퀄컴 본사 캠퍼스에서 진행된 스냅드래곤 X2 엘리트 시스템반도체(SoC) 음향 기술 시연에서 바스데브 노약 퀄컴 엔지니어는 "이런 문제를 해결하기 위해 '퀄컴 어쿠스틱 스피커 맥스' 알고리듬을 개발했다"고 설명했다. 이 알고리듬은 잡음 등으로 지나치게 큰 소리가 스피커로 전달돼 손상으로 이어지는 것을 막는 '스피커 보호', 소리를 손상시키지 않는 허용 범위 안에서 음질을 개선하는 '후처리' 등으로 구성됐다. 진동 잡음 억제를 거친 음원을 재생하자 원래 음원 대비 스피커가 떨리며 발생하는 진동이 줄어드는 것을 확인할 수 있었다. 그는 "이 기능은 초저전력 영역인 센싱 허브에서 작동해 전력 소모를 극도로 줄였다"고 설명했다. 저전력으로 내 목소리만 걸러내 전달..."목 쉬어도 작동" 센싱 허브를 활용한 기능은 또 있다. 노트북이 내 말소리만 걸러내 정확히 전달하는 기능인 '개인 음성 분리'다. 영상통화나 화상회의, 혹은 공공장소 등에서 통화할 때 잡음을 걸러내고 내 말소리만 전달하는 데 도움을 준다. 15초에서 30초 가량 문장을 읽어 내 목소리를 등록한 다음 이 기능을 활성화하면 주위 다른 사람이 이야기하는 말소리를 깨끗이 지워준다. 디팍 쿠마 퀄컴 시니어 스태프 엔지니어는 "감기나 피로, 감정 변화로 목소리가 다소 변해도 기능 작동에는 문제가 없다"고 설명했다. 이어 "스냅드래곤 X2 엘리트의 개인 음성 기능은 다른 사람 말소리까지 걸러낼 수 있다는 것이 가장 큰 차별점이며 모든 작업을 초저전력 영역에서 수행한다"고 덧붙였다. 본사 캠퍼스 곳곳에 음향 실험 위한 '무향실' 설치 퀄컴 본사 캠퍼스에는 통제된 환경에서 음향을 재생하고 시험하기 위한 '무향실'이 여러 곳 설치돼 있다. 이 시설에서는 줌, 팀즈, 디스코드 등 음성 통화 품질 테스트, PC나 노트북의 공간 음향 재생, 음량이나 소음 환경 변화에 따른 마이크·스피커 품질 테스트를 수행한다. 안드레 셰브치우 퀄컴 어쿠스틱 부문 시니어 디렉터는 "주변 소음 등을 반복적으로 재현 가능하게 테스트하기 위한 조건을 만들기 위한 곳"이라고 설명했다. 이어 "문을 완전히 닫으면 소음 수준은 사람이 느끼기 어려운 10dB까지 떨어지며 내부에 설치된 스피커 16개를 이용해 상·하·좌·우 모든 방향에서 정확한 공간 음향을 재현할 수 있다"고 설명했다. "내 노트북 NPU를 클라우드 서버처럼 쓴다" 애니씽LLM은 NPU 성능이 상대적으로 떨어지는 스마트폰이나 웨어러블의 AI 연산을 PC에서 처리한 다음 그 결과를 돌려주는 소프트웨어다. PC에 내장된 GPU와 NPU를 모두 활용하며 클라우드 대비 지연 시간이 짧다. 카우시크 칼리타 퀄컴 엔지니어링 시니어 디렉터는 "퀄컴은 애니씽LLM과 협업해 라마3, 라마 2.5 등 다양한 LLM을 퀄컴 NPU에 최적화해 탑재한다"고 설명했다. 이어 "스마트폰에서 처리가 힘든 긴 문서 관련 질문을 보내면 이를 전달받은 PC에서 NPU를 활용해 답변을 생성한 다음 스마트폰으로 되돌려준다. 항상 가지고 다니는 PC를 AI 가속기로 활용할 수 있다"고 덧붙였다.

2025.11.23 12:05권봉석 기자

네이버클라우드 컨소시엄, 국산 AI 반도체 경쟁력 입증

네이버클라우드가 3년간 진행된 국가 사업을 통해 산업 현장 내 국산 인공지능(AI) 반도체의 상용화 가능성을 입증했다. 네이버클라우드는 자사가 주관사로 참여하는 과학기술정보통신부·정보통신산업진흥원(NIPA)의 'AI반도체 팜(Farm) 구축 및 실증' 사업의 3차년도 목표를 달성하며 전체 과업을 성공적으로 마무리했다고 20일 밝혔다. 해당 사업은 국산 AI반도체(국산 NPU) 기반의 고성능 클라우드 인프라를 구축하고, 국산 NPU의 성능을 실제 산업 환경에서 실증하는 국가 전략 프로젝트로 2023년 5월부터 2025년 11월까지 총 3개년에 걸쳐 진행됐다. 네이버클라우드는 KT클라우드, NHN클라우드와 함께 컨소시엄을 구성하고 국내 AI 반도체 기업인 퓨리오사 AI, 리벨리온과 협력해 ▲연산용량 총 19.95PF(페타플롭스) 규모의 국산 AI반도체 팜 구축 ▲클라우드 플랫폼 구축∙운영 ▲4개의 AI 응용서비스 실증 등 핵심 과업을 모두 달성하며 국산 NPU의 경쟁력을 입증했다. 특히 올해 마지막 3차년도에는 국산 NPU 상용화 가능성을 높이는 실질적인 성과를 거뒀다. 국산 NPU의 성능과 효율을 실제 산업 현장에서 실증하고, 클라우드 환경에서의 최적화 작업을 진행해 국산 NPU 활용의 현실적 기반을 마련한 것이다. 실증 과정에서는 다양한 AI 서비스가 구현됐다. 네이버클라우드는 퓨리오사AI와 함께 외국인 근로자의 원활한 소통을 위한 LLM 기반 번역·챗봇 서비스를 실증했다. 해당 서비스는 서울AI허브, 제주위미농협에 적용돼 외국인 근로자의 원활한 소통을 위해 활용되고 있다. KT클라우드와 NHN클라우드는 리벨리온과 함께 의료 분야에 집중했다. 각각 뇌 질환 진단·예측 AI 플랫폼을 가천대 길병원에 적용해 의료진의 정밀 검진과 업무 효율을 높였으며, 뇌파 분석 AI 서비스는 우리들녹지국제병원에서 우울증 조기 탐지의 임상적 유효성을 입증했다. 또 국산 NPU의 객관적인 성능 확인을 위해 제3자 시험검사 체계도 확립했다. 한국인정기구(KOLAS) 인증 시험검사기관인 AI웍스가 국산 NPU의 효율성, 안정성, 응답속도 등 주요 지표를 측정한 결과, 일부 모델이 외산 GPU 대비 우수한 성능을 보이며 경쟁력과 시장 도입 가능성을 인정받았다. 네이버클라우드 이종복 이사는 "이번 사업은 국산 NPU 기술이 실제 산업 현장에 적용되는 중요한 전환점으로, 앞으로 국산 NPU 중심으로 클라우드와 AI 서비스가 결합된 새로운 생태계가 형성될 것"이라며 "앞으로 정부와 업계가 지속적으로 협력해, 단순한 반도체 칩 개발을 넘어서 AI 생태계를 확장하고 국산 NPU 기술이 산업 전반에 적용될 수 있도록 노력하겠다"고 말했다.

2025.11.20 09:53장유미 기자

퀄컴 "에이전틱 AI에 필요한 것은 더 강력한 NPU"

[샌디에이고(미국)=권봉석 기자] "AI는 사물이나 음성인식에서 생성AI를 지나 자율성을 지닌 에이전틱 AI로 진화하고 있다. 이용자의 목표에 따라 여러 AI 에이전트가 협력해 작업을 나눠 수행한다. 1초 안에 응답을 얻으려면 100 TOPS(1초 당 1조 번 연산)를 넘어 최대 300 TOPS급 NPU가 필요한 상황이 올 것이다." 12일(이하 현지시간) 오전 미국 캘리포니아 주 샌디에이고 내 '스냅드래곤 X 엘리트 딥다이브' 행사장에서 우펜드라 쿨카르니 퀄컴 제품관리 부사장이 이렇게 설명했다. 그는 "에이전틱 AI는 PC 이용 중 내내 백그라운드에서 작동하기 때문에 초저전력 NPU 탑재가 필요하다. 스냅드래곤 X2 엘리트 익스트림에 탑재된 헥사곤 NPU는 경쟁사 대비 높은 성능으로 배터리 불안 없이 AI를 오래 쓸 수 있을 것"이라고 설명했다. "배터리 기반 노트북에서 GPU에만 의존할 수 없어" PC에서 AI를 실행하기 위한 요소로 CPU와 GPU, NPU를 꼽는다. 이는 퀄컴 뿐만 아니라 인텔과 AMD, 애플 등 모든 PC용 프로세서 제조사가 동의하는 내용이다. CPU는 복잡한 분기 처리와 운영체제 로직, 대규모 응용프로그램을 빠르게 실행하지만 대규모 추론을 지속적으로 처리하는 데는 한계가 있다. GPU는 3D 그래픽과 거대언어모델(LLM) 등 처리에 특화됐지만 전력 소모가 크다. 우펜드라 쿨카르니 부사장은 "배터리로 구동되는 노트북에서 장시간 상시 실행되는 AI 작업을 GPU에만 의존하기는 어렵다. 반면 NPU는 행렬 연산 기반의 대규모 추론을 저전력으로 처리하도록 설계된 전용 엔진"이라고 설명했다. 이어 "퀄컴은 여러 모델이 동시에 작동하는 AI에서는 NPU 전력 효율이 가장 큰 경쟁력이라고 판단하고 있고 NPU의 성능과 전력 효율이 경쟁력을 좌우할 것"이라고 설명했다. "에이전틱 AI, 100 TOPS 이상 NPU 요구할 것" 이날 퀄컴은 AI 모델의 발전 속도로 인해 PC가 필요로 하는 TOPS가 급증하고 있다고 지적했다. 단순 텍스트 생성에서 멀티모달 생성(이미지·영상), 혹은 LLM을 여러 개 조합해 실행하는 에이전틱(Agentic) AI 환경으로 전환되면서 연산 요구량이 폭증하는 추세다. 예를 들어 짧은 동영상을 생성하는 데만 최소 150 TOPS가 필요하며, 1초 내 결과물을 얻기 위한 실시간성을 원할 경우 300 TOPS까지 요구된다. 또한 일정·메일 관리, 문서·이미지 분석 등 에이전트가 여러 모델과 도구를 병렬로 호출하는 작업이 지속적으로 실시간 작동된다. 우펜드라 쿨카르니 부사장은 "AI가 항상 실행되려면 전력 대비 성능 효율이 GPU 대비 수 배 이상 높은 NPU가 필수다. 여러 LLM을 동시에 구동하려면 최소 100 TOPS, 대규모 에이전트 실행시 최소 140 TOPS 이상 성능이 요구된다"고 말했다. "헥사곤 NPU, 배터리 덜 쓰며 더 높은 성능 제공" 우펜드라 쿨카르니 부사장은 "스냅드래곤 X2 엘리트 익스트림에 탑재된 헥사곤 NPU는 최대 80 TOPS의 NPU를 기반으로 GPU·CPU 성능을 합산하면 200 TOPS에 가까운 연산량을 제공한다"고 강조했다. 이어 프로시온 AI 벤치마크 점수를 토대로 "헥사곤 NPU의 점수는 인텔 Xe2 GPU 대비 3배, 인텔 코어 울트라9 285H 내장 NPU 대비 5배 이상 높다. 전력 효율은 인텔 제품 대비 3배 이상"이라고 주장했다. 우펜드라 쿨카르니 부사장은 "전력당 성능으로 보면 스냅드래곤 X2 내장 NPU가 GPU 대비 현저히 우위를 보인다. 전기차를 예로 들면 항속거리가 최대 3.7배 이상 늘어나는 것이며 배터리 불안 없이 AI를 오래 쓸 수 있는 것"이라고 덧붙였다. "AI 처리 경로에 관계 없이 최대 성능 제공... 1천개 모델 지원" 퀄컴은 AI 성능의 지속적인 향상을 위해 운영체제·API·모델 프레임워크·드라이버 등을 통합 최적화하고 있다. 윈도ML은 하드웨어 중립적인 AI 처리를, 자체 API인 퀄컴 AI 엔진 다이렉트(QNN)를 활용하면 퀄컴 실리콘에 최적화된 처리가 가능하다. 우펜드라 쿨카르니 부사장은 "외부 소프트웨어 개발 업체가 API를 두 번 최적화하지 않아도 동일한 최대 성능을 제공하는 것이 퀄컴 목표"라고 설명했다. 퀄컴은 스냅드래곤과 드래곤윙 등 SoC에 미리 최적화된 AI 모델을 제공하는 '퀄컴 AI 허브'도 운영한다. 앱과 모델을 분리해 동시에 개발할 수 있다는 것이 큰 장점으로 꼽힌다. 우펜드라 쿨카르니 부사장은 "어도비, 어피니티, 블렌더, 블랙매직 등 주요 소프트웨어 개발 업체와 함께 컴퓨터 비전·영상 편집·이미지 생성 분야에서 이미 최적화를 진행했으며, 총 1천 개 이상의 모델과 100여 개의 앱이 퀄컴 AI 플랫폼에서 작동한다"고 밝혔다.

2025.11.19 23:20권봉석 기자

스냅드래곤 X2, 80 TOPS NPU로 상시구동 AI 지원

[샌디에이고(미국)=권봉석 기자] 퀄컴이 지난 해 출시한 스냅드래곤 X 시리즈 시스템반도체(SoC)는 45 TOPS(1초당 1조번 연산)급 신경망처리장치(NPU)로 인텔과 AMD 등 x86 프로세서 기반 SoC 대비 우위를 차지했다. 내년 상반기 중 출시할 스냅드래곤 X2 엘리트/엘리트 익스트림에는 전 세대 대비 두 배 가까운 80 TOPS급 NPU를 탑재할 예정이다. 주요 연산을 저전력 NPU로 처리해 배터리 지속시간이 중요한 노트북 분야에서 경쟁력을 확보하겠다는 것이다. 12일(이하 현지시간) 오전 미국 캘리포니아 주 샌디에이고 내 '스냅드래곤 X 엘리트 딥다이브' 행사에서 루시안 코드레스쿠 퀄컴 기술부사장은 "스냅드래곤 X2 시리즈의 헥사곤 NPU는 상시 구동 AI를 겨냥해 전 세대 대비 78% 성능을 향상시켰다"고 강조했다. 이어 "AI가 운영체제와 사용자 경험 전반을 바꾸고 있는 현 시점에서, 지속적 온디바이스 AI 실행과 다중 모델 동시 활용을 위해서는 극단적인 에너지 효율이 필수이며 헥사곤 NPU는 이를 충족한다"고 덧붙였다. 헥사곤 NPU, DSP에서 다양한 연산 처리용으로 진화 루시안 코드레스쿠 부사장은 헥사곤 제품개발 팀이 처음 구성된 2004년부터 아키텍처 팀을 이끌어왔다. 당시 개발된 QDSP6는 오디오와 멀티미디어 처리 효율 개선에 주력했고, 스마트폰 카메라의 영상처리 중요성이 커진 2014년부터 벡터 연산이 추가됐다. 2019년에는 단순한 DSP에서 벗어나 뉴럴 네트워크, 머신러닝 가속을 위해 행렬 연산을 추가한 헥사곤 NPU로 개념을 확장했다. 루시안 코드레스쿠 부사장은 "매년 새로운 NPU를 설계하고 스마트폰, PC, 오토모티브, IoT 등 다양한 제품에 이를 탑제한다. 제품마다 필요한 기능과 규모는 다르지만 기본적인 코어 기술은 공통"이라고 설명했다. "NPU, 행렬 연산만 강화하는 것이 능사 아냐" 헥사곤 NPU는 AI에 필요한 각종 연산을 조율하고 제어하는 '스칼라' 코어, SIMD(단일 명령어/다중데이터) 명령어를 주로 처리하는 '벡터' 코어, AI 연산의 주를 이루는 행렬 관련 연산을 주로 처리하는 '매트릭스' 코어 등 3개 주요 부분으로 구성됐다. 루시안 코드레스쿠 부사장은 "오픈소스와 자체 모델, 고객사 등이 만든 다양한 AI 모델을 이용해 테스트한 결과 NPU는 단순히 행렬 연산만 잘 처리하는 것이 능사가 아니다"라고 설명했다. 그는 "어떤 모델은 행렬 연산에서, 어떤 모델은 벡터 연산에서, 어떤 모델은 스칼라 코어나 메모리, 제어 계층에서 병목 현상을 일으킨다. NPU 시스템 전반의 밸런스를 맞추지 않으면 아무리 행렬 연산만 강화해도 속도 향상은 제한적일 것"이라고 말했다. 스칼라 엔진, 멀티스레딩으로 한 클록당 32개 명령어 처리 스냅드래곤 X2 엘리트/엘리트 익스트림에 내장된 헥사곤 NPU는 퀄컴 자체 기준으로 6세대 제품에 해당한다. 먼저 AI 연산을 조율하는 스칼라 엔진을 크게 강화했다. 코어는 6코어지만 멀티스레딩 방식으로 내부에서 최대 12 스레드를 처리하도록 처리했다. 한 클록(사이클) 당 처리할 수 있는 명령어는 최대 32개 수준이다. 코어는 32비트로 작동하지만 32비트의 한계를 넘어서는 큰 AI 모델을 처리할 수 있도록 메모리 주소는 64비트로 처리해 효율성을 높였다. 이런 개선 결과 전 세대 대비 처리량은 143%, 대역폭은 127% 향상됐다. 벡터 엔진은 최대 1024비트를 처리할 수 있는 레지스터를 탑재했고 FP8(실수, 8비트)와 FP16(실수, 16비트) 대비 연산량을 경감하며 비슷한 결과를 낼 수 있는 BF16 연데이터타입도 지원한다. 이를 이용해 일반적 머신러닝 연산·리사이즈·소프트맥스 등 광범위한 연산을 처리한다. 벡터 엔진의 연산 속도는 전 세대 대비 1.43배 늘어났다. 매트릭스 엔진, 2비트 가중치 처리 기능 추가 행렬 연산을 처리하는 매트릭스 엔진은 2비트로 양자화된 거대언어모델(LLM) 처리 능력을 더했고 FP8과 BF16 자료형을 처리할 수 있다. 특히 행렬 연산 처리와 활성 함수 연산까지 처리할 수 있도록 전용 파이프라인을 더해 여러 번 데이터를 옮길 필요 없이 한 번에 데이터를 처리한다. 또 매트릭스 엔진의 전압과 작동 클록을 분리해서 응용프로그램이나 AI 모델의 특성에 맞게 성능과 전력을 세밀하게 조절할 수 있다. 이런 처리 결과 매트릭스 엔진의 처리량은 전 세대 대비 78% 성능을 높였다. 새 NPU, 같은 전력에서 전 세대 대비 최대 1.6배 향상 새로 개발된 헥사곤 NPU는 스냅드래곤 X 엘리트 대비 같은 전력에서 최대 1.6배 더 높은 성능을 낸다. AI·컴퓨터 비전 벤치마크에서는 5.7배, 긱벤치 AI에서는 8만8천점이 넘는 점수를 냈다. 루시안 코드레스쿠 부사장은 "자체 실험 결과 칩 면적과 메모리 대역폭이 고정돼 있을 때 FP16, FP8, INT4 등 서로 다른 데이터 타입을 이용할 때, 정밀도를 높이면 전력 소모가 커진다는 결과를 얻었다"고 설명했다. 이어 "이 때문에 업계 전체가 보다 정밀도를 낮추는 방향으로 움직이고 있으며 허용 가능한 정확도를 유지하는 범위에서 비트 수를 최대한 줄이는 것이 에너지 효율 상 가장 큰 이득을 준다는 결론을 얻었다"고 설명했다. 스냅드래곤 X2 모든 제품군에 80 TOPS급 NPU 탑재 퀄컴은 스냅드래곤 X2 엘리트/엘리트 익스트림 뿐만 아니라 향후 출시될 윈도 PC용 SoC에 동일한 NPU를 탑재할 예정이다. 보급형 PC나 고성능 PC 모두 동일한 AI 처리 성능을 갖추게 된다. 루시안 코드레스쿠 부사장은 "80 TOPS급 헥사곤 NPU는 성능 측면에서 큰 도약을 이뤘다. 이는 스칼라, 벡터, 매트릭스 등 전반을 균형있게 재설계한 결과물이다. 이를 바탕으로 온디바이스 AI가 항상 켜진 PC 시대를 뒷받침할 중심이 될 것"이라고 밝혔다.

2025.11.19 23:15권봉석 기자

삼성 갤럭시 AI 흥행에 퀄컴이 주목받는 이유

삼성전자가 플래그십 스마트폰 시장 확대를 위한 핵심 셀링 포인트로 'AI'에 주목하고 있다. 지난해 세계 최초의 AI폰인 '갤럭시S24' 시리즈를 출시한 데 이어, 올해에는 에이전트 AI 성능을 강화한 차세대 제품으로 사용자의 호평을 이끌어내는 데 성공했다. 이러한 추세에서 주목받는 것이 바로 모바일 AP(애플리케이션 프로세서)다. 모바일 AP는 스마트폰에서 '두뇌' 역할을 담당하는 칩으로, 삼성전자 등 스마트폰 업계가 강조하는 엣지 AI 기능 구현에 필수적인 요소로 꼽힌다. 6일 업계에 따르면 스마트폰 내 AI 경험 향상에 있어 향후 모바일 AP의 성능이 더욱 부각될 것으로 전망된다. 삼성 갤럭시, AI로 흥행 성공…퀄컴 '스냅드래곤' 후광 받아 모바일 AP는 CPU와 GPU, NPU 등 각종 고성능 시스템반도체를 한 데 집적한 시스템온칩(SoC)이다. AI 기능이 고속·대용량의 데이터 처리를 요구하는 만큼, 모바일 AP가 플래그십 스마트폰의 흥행 여부에도 상당한 영향력을 끼친다는 평가가 나온다. 삼성전자가 올 상반기와 하반기에 각각 공개한 '갤럭시 S25', '갤럭시Z폴드7'가 대표적인 사례로 꼽힌다. 두 제품 모두 퀄컴의 AP인 '스냅드래곤'을 기반으로 한다. 시장조사업체 카운터포인트리서치에 따르면, 삼성전자는 갤럭시 S25와 갤럭시Z폴드7의 높은 수요로 1∼7월 국내 스마트폰 누적 판매량 점유율 82%를 기록했다. 삼성전자가 점유율 80%를 넘어선 것은 이번이 처음이다. 퀄컴은 15년 이상 AI를 연구해오며 엣지 AI 분야를 선도해 왔다. 다양한 벤치마크에서 AI 성능과 전력효율 부문 모두 업계를 선도하고 있으며, 대형 언어 모델(LLM)에서도 업계 최고 수준의 처리 성능을 제공한다. 덕분에 퀄컴 스냅드래곤은 전 세계 수십억대의 AI 지원 기기에 활용되고 있다. 퀄컴은 올 하반기 미국 하와이에서 진행한 연례 행사 '스냅드래곤 서밋'에서도 AI 성능을 강조한 차세대 모바일 AP '스냅드래곤 8 엘리트 5세대(Snapdragon 8 Elite Gen 5)'를 공개한 바 있다. 스냅드래곤 8 엘리트 5세대는 이전 세대 대비 CPU 성능이 20% 향상됐고, AI 엔진인 헥사곤(Hexagon) NPU는 37% 빠른 추론 속도와 16% 개선된 전력 효율을 달성했다. 당시 크리스 패트릭 퀄컴 수석 부사장 겸 모바일 핸드셋 부문 본부장은 “스냅드래곤 8 엘리트 5세대는 개인화된 AI 에이전트를 통해 사용자가 보고, 듣고, 생각하는 과정을 실시간으로 함께하며 사용자가 모바일 경험의 중심이 되도록 지원한다”며 “사용자는 개인 AI의 새로운 지평을 여는 스냅드래곤 8 엘리트 5세대를 통해 모바일 기술의 미래를 경험할 수 있다”고 말했다. 퀄컴, 기술력 기반으로 프리미엄 시장서 브랜드 파워 굳혀 플래그십 스마트폰 시장 내에서 모바일 AP의 존재감이 확대됨에 따라, 퀄컴 역시 IT 사용자들을 대상으로 적극적인 브랜드 제고 전략을 펼치고 있다. 돈 맥과이어 퀄컴 수석 부사장 겸 최고마케팅책임자는 스냅드래곤 서밋에서 "스냅드래곤은 단순한 부품을 넘어 '문화적 아이콘'으로 자리잡았다"며 "프리미엄 스마트폰 사용자의 95%는 저가형 모델 사용자보다 스냅드래곤을 채용한 기기에 더 많은 지불할 의향이 있다고 대답했다. 이는 강력한 브랜드 파워"라고 강조한 바 있다. 또한 스냅드래곤은 올해 영국계 시장조사기관 칸타르(Kantar)의 글로벌 브랜드 가치 평가(Kantar BrandZ)에서 세계 38위에 이름을 올렸다. 이는 약 650억 달러(한화 약 90조원)에 준하는 가치다. 실제 스마트폰 소비자들의 인식 역시 퀄컴 스냅드래곤에 우호적이다. 최근 미국 온라인매체 폰아레나(PhoneArena)에서 "갤럭시 스마트폰에 탑재되는 퀄컴 스냅드래곤 8 5세대, 삼성 엑시노스 2600 중 어떤 칩셋을 선호하느냐"는 질문으로 설문조사를 실기한 결과, 10명 중 9명 이상이 스냅드래곤을 선택했다. 배터리 효율, AI 성능 등에서 전반적인 우위를 점한 것으로 알려졌다. 퀄컴의 이러한 전략이 플래그십 스마트폰 시장에 어떠한 변화를 불러올 지 귀추가 주목된다. 현재 삼성전자는 내년 초 출시할 '갤럭시S26' 시리즈에 대한 AP 채택 전략을 두고 고심을 이어가고 있다.

2025.11.06 15:22장경윤 기자

모빌린트, LG사이언스파크와 NPU 기반 AI 기술 검증 완료

AI 반도체 전문 스타트업 모빌린트가 LG사이언스파크와 함께 자사 NPU(신경망처리장치) 기반 엣지 AI 기술의 적용 가능성을 검증하는 기술 검증(PoC) 프로젝트를 최근 완료했다고 6일 밝혔다. 모빌린트는 고성능 AI 반도체 설계 역량과 최적화 기술을 갖춘 AI 반도체 전문 기업으로, 그 혁신성을 인정받아 LG의 스타트업 육성 프로그램에 선정됐다. 이번 프로젝트는 LG와 스타트업이 함께 혁신 가설을 검증하는 육성 활동인 '슈퍼스타트 PoC'의 일환으로 진행됐다. 모빌린트 NPU가 다양한 AI 모델을 안정적으로 구동할 수 있는지를 검증하는 것이 핵심 목표였다. 이번 PoC는 LG 내 현업 부서와의 협업을 통해 언어, 비전, 음성 등 다양한 유형의 AI 모델을 실제 NPU 환경에서 테스트하는 형태로 진행됐다. 오픈소스 모델부터 LG의 초거대 AI 모델 '엑사원(EXAONE)'까지 폭넓은 AI 모델을 대상으로 검증이 이뤄졌으며 그 결과 모빌린트 NPU가 엣지 AI와 온디바이스 AI 영역에서 상용화 수준의 성능과 효율성이 검증됐다. 모빌린트 윤상현 CSO(최고전략책임자)는 “이번 PoC를 통해 기술의 범용성과 안정성을 입증할 수 있었다“며 “결과를 기반으로 가전, 로보틱스, 산업 자동화, 스마트시티 등 엣지 AI가 요구되는 다양한 산업 분야에서 실시간 AI 추론을 지원할 수 있는 기술 역량을 지속적으로 확장해 나갈 계획”이라고 전했다. LG사이언스파크 슈퍼스타트팀 관계자는 “모빌린트는 이번 PoC를 통해 기술력과 실행 역량을 입증했다. 특히 NPU의 전성비와 SDK지원역량 측면에서 특장점을 확인할 수 있었다”며, “엣지 AI 및 온디바이스 AI 분야에서의 향후 성장 가능성이 기대된다”고 말했다.

2025.11.06 11:48전화평 기자

리벨리온, AI 반도체 팜 실증 사업 3년차 과제 성공

AI 반도체 스타트업 리벨리온이 과학기술정보통신부가 주관하고 정보통신산업진흥원이 지원하는 'AI반도체 Farm(팝) 구축 및 실증 사업' 3차년도 과제를 성공적으로 수행 중이라고 5일 밝혔다. 이번 사업은 AI 반도체를 기반으로 고성능 클라우드 인프라를 구축하고, 다양한 AI 서비스 확산의 기반을 마련하기 위한 3개년 프로젝트다. 리벨리온은 1·2차년도 사업에서 케이티클라우드에 자사 AI반도체인 아톰(ATOM)으로 3.45PF 규모의 NPU 인프라를 구축하며 AI반도체 팜의 기반을 마련했다. 3차년도에는 이를 확장해 다양한 산업 분야의 실증을 지원함으로써, 국산 AI반도체의 활용 저변을 넓히고 있다. 올해 3차년도에는 인공지능 플랫폼 전문 기업 몬드리안에이아이의 서비스 실증을 지원하고 있다. 케이티클라우드는 사업 총괄기관으로서 클라우드 인프라를 제공하고 전체 시스템 운영을 지원했으며, 리벨리온은 자사 제품을 기반으로 의료 영상 분석 모델 'FastSurfer'와 메타(Meta)의 대형언어모델 Llama 3.1의 추론 성능을 최적화했다. 이를 통해 의료 AI 모델의 처리 속도와 전성비를 개선하며, NPU 기반 의료 AI 응용의 가능성을 입증했다. 이번 사업으로 리벨리온은 의료 AI에서 NPU가 안정적으로 구동될 수 있음을 보여줬다. 뇌질환 의료 영상분석 AI모델 추론을 NPU를 기반으로 구동한 것은 국내 최초 사례로, 향후 대규모 언어모델을 결합한 의료 분야에서 추론용 AI반도체 적용 확대 가능성을 제시했다. 리벨리온은 앞으로도 AI반도체의 효율성과 안정성을 입증할 수 있는 다양한 응용서비스 실증을 지속 확대해 나갈 계획이다.

2025.11.05 13:39전화평 기자

韓 NPU·코드 어시스턴트 결합…유라클-퓨리오사AI, AX 혁신 생태계 '시동'

유라클이 국내 AI 반도체 선도 기업이자 이재명 정부 첫 유니콘인 퓨리오사AI와 손잡고 국산 신경망처리장치(NPU)와 코드 어시스턴트 융합 생태계 활성화에 나선다. 개발 생산성 혁신과 산업 전반의 인공지능 전환(AX)을 함께 이끈다는 목표다. 유라클은 퓨리오사AI와 전략적 업무협약(MOU)을 체결하고 AI 기반 개발 생산성 혁신에 나선다고 3일 밝혔다. 양사는 이번 협약을 통해 퓨리오사AI의 고성능 NPU에 유라클이 개발한 아테나 코드 어시스턴트 솔루션을 탑재해 국내외 엔터프라이즈 시장을 공략할 계획이다. 구체적으로 퓨리오사AI의 2세대 NPU '레니게이드(RNGD)'로 아테나 코드 어시스턴트의 처리 속도와 에너지 효율을 획기적으로 개선할 계획이다. 이를 통해 전문 개발자가 아니더라도 일정 수준의 요구사항만으로 고품질 코드를 자동 생성할 수 있어 개발자 확보가 어려운 기업에서도 효율적인 소프트웨어(SW) 개발 및 유지보수가 가능할 전망이다. 또 어플라이언스 기반으로 제공되기에 민감한 데이터를 외부에 노출하지 않고도 안전하게 AI 코딩 기능을 활용할 수 있어 공공기관이나 보안이 중요한 금융·제조 분야에서도 안심하고 도입할 수 있도록 지원한다. 이번 협력은 국산 AI 반도체와 AI SW 기술을 결합해 AI 개발 생태계 자립 기반을 강화하는 행보로 평가된다. 단순 서비스 연계를 넘어 반도체와 코드 생성 기술의 통합형 모델을 제시하는 시도다. 양사의 AI 코드 어시스턴트 어플라이언스는 내년 초 출시를 목표로, 개발 현장의 생산성을 증대하는 솔루션을 제공한다는 목표다. 특히 기존에 AI 도입이 활발했던 금융·공공 분야 외에도 제조, IT 개발 조직, 게임 산업, SW 개발 기업 등 전 산업 영역으로 AI 코드 어시스턴트의 적용 범위를 대폭 확장할 방침이다. 아울러 국내뿐 아니라 중동·아시아 등 해외 시장 발굴·개척을 위한 사업 협력을 통해 양사 기술력을 글로벌 시장에 공동으로 전파하며 AX를 촉진할 계획이다. 백준호 퓨리오사AI 대표는 "코드 어시스턴트는 모든 산업군에서 생산성 향상을 위한 필수 솔루션으로 자리 잡고 있다"며 "큰 시장 기회가 있는 분야에서 유라클과의 협력을 통해 AX 이끌 것"이라고 밝혔다. 권태일 유라클 대표는 "퓨리오사AI와의 긴밀한 협력은 NPU 환경에 최적화된 코드 어시스턴트 어플라이언스를 제공해 개발 생산성 시장을 선도할 중요한 기반이 될 것"이라며 "양사의 혁신적인 기술 결합을 통해 국내외 기업의 디지털 전환을 가속화하고 AI 산업을 선도해 나가겠다"고 강조했다.

2025.11.03 15:51한정호 기자

퀄컴, 독자 CPU·NPU로 AI 추론 인프라 도전장...인텔과 맞붙나

퀄컴이 27일(미국 현지시간) AI 시스템반도체(SoC) 2종을 공개하며 내년 데이터센터 시장 재진입을 선언했다. 엔비디아나 AMD처럼 대규모 AI 모델을 훈련시키기 위한 칩이 아니라, 기존 모델 활용을 위한 저전력·고효율 추론용 반도체에 초점을 맞췄다. GPU 중심의 AI 훈련 수요보다 실제 비즈니스 적용 단계에서 요구되는 추론 연산 효율을 극대화해 대안을 제시하겠다는 것이다. 이런 접근 방식으로 AI PC 분야는 물론 최근 AI 추론 시장 확장에 나선 인텔과 경쟁 심화를 피할 수 없게 됐다. GPU 기반 모델 훈련 시장에서는 엔비디아가 압도적인 우위를 점하고 있는 만큼, 퀄컴과 인텔 모두 저전력·고효율을 내세운 '추론 최적화' 반도체 시장을 차세대 성장 영역으로 지목하고 있다. 퀄컴, 누비아 인수 2년만에 새 CPU '오라이온' 투입 퀄컴이 2021년 인수한 반도체 스타트업 누비아(Nubia)는 본래 Arm IP(지적재산권)를 활용해 데이터센터용 고성능 CPU '피닉스(Phoenix)'를 개발하던 회사였다. 퀄컴은 누비아 인수 이후 해당 기술을 흡수해 자사 CPU 설계 역량을 강화했고, 2022년 10월 '스냅드래곤 서밋'에서 누비아 기술을 바탕으로 한 새 CPU '오라이온(Oryon)' 개발을 공식화했다. 당시 누비아 출신으로 퀄컴에 합류한 제러드 윌리엄스 수석부사장은 "오라이온 CPU는 기존 크라이오(Kryo) CPU IP를 대체하며, 모바일부터 XR, 컴퓨트까지 다양한 플랫폼으로 확장될 것"이라고 설명했다. 퀄컴, 5월 데이터센터 진출 공식화 오라이온 CPU는 이후 PC용 '스냅드래곤 X'(2023), 스마트폰용 '스냅드래곤8 엘리트'(2024), 자동차용 '스냅드래곤 라이드 엘리트'(2024) 등 퀄컴 고성능 SoC에 순차적으로 투입됐다. 퀄컴은 지난해 말 20년 이상 서버용 프로세서를 설계한 인텔 출신 사일레시 코타팔리를 영입하고 데이터센터용 CPU 개발을 총괄하는 수석부사장으로 임명했다. 올해 5월 '컴퓨텍스 타이베이 2025' 기조연설에서는 오라이온 CPU를 서버 시장으로 확대할 계획을 공식화했다. 업계 관계자들은 당시 퀄컴이 이동통신 기지국의 데이터 처리용 서버·어플라이언스 분야를 우선 공략할 것으로 전망했다. 퀄컴, 예상 깨고 AI 추론 시장 먼저 겨냥 퀄컴이 27일 공개한 AI200/250 SoC는 오라이온 CPU와 헥사곤 NPU를 결합해 철저히 추론(인퍼런스)에 최적화된 제품이다. 새 AI 모델을 훈련하기보다 이미 완성된 모델을 저전력·비용 효율적으로 실행하려는 기업 수요를 겨냥했다. AI200은 LPDDR5 메모리를 채택해 비용 효율을 강조했으며, 최대 768GB LPDDR 메모리를 지원해 대규모 AI 추론 환경에서 유연성과 확장성을 높였다. AI200 기반 랙의 전력 소모는 약 160킬로와트(kW) 수준이다. AI250은 메모리 인접 연산 구조를 통해 지연시간을 줄이고, 대역폭을 10배 이상 향상시킬 계획이다. 퀄컴은 AI200을 2026년, AI250을 2027년 출시할 예정으로 예측 가능한 로드맵도 제시했다. 최초 고객사로 사우디 AI 스타트업 '휴메인' 나서 AI200 SoC 최초 고객사로 사우디아라비아 무함마드 빈 살만 왕세자가 설립한 AI 스타트업 '휴메인'(Humain)이 참여했다. 휴메인은 이미 퀄컴 스냅드래곤 X 엘리트를 기반으로 AI PC를 개발 중이며, 퀄컴과의 협력을 지속 강화하고 있다. 휴메인은 '미래 투자 이니셔티브(FII)' 제9차 포럼을 앞둔 28일(사우디 현지시간) 퀄컴 AI200·AI250 기반 200메가와트(MW)급 랙 솔루션을 도입, 사우디 및 글로벌 시장에 공급할 계획을 밝혔다. 휴메인은 자체 개발한 아랍어 기반 멀티모달 LLM 구현에도 퀄컴 인프라를 적극 활용할 방침이다. 인텔과 AI PC 이어 추론 시장서도 충돌 불가피 AI 관련 후발 주자로 볼 수 있는 퀄컴이 추론 시장 진출을 선언하며 비슷한 입지에 있는 인텔과 충돌이 불가피해졌다. 인텔은 엔비디아나 AMD에 비해 GPU 포트폴리오가 약하다는 평가를 받지만, 제온6 프로세서·코어 울트라·가우디3 AI 가속기를 결합한 추론 플랫폼으로 대응 중이다. 내년에는 저비용 추론용 GPU '크레센트 아일랜드' 출시도 예고돼 있다. 현재 퀄컴은 인텔과 함께 AI PC용 프로세서 시장에서도 경쟁 중이다. 인텔의 차세대 코어 울트라 시리즈 3(팬서레이크) 탑재 PC는 내년 1월 말부터, 퀄컴 스냅드래곤 X2 엘리트 탑재 PC는 내년 6월 전후 출시 전망이다.

2025.10.28 16:07권봉석 기자

애플 M5 칩, AI 처리 중심 NPU→GPU로 이동

애플이 아이폰과 아이패드, 맥 컴퓨터의 AI 연산 처리 중심 장치를 신경망처리장치(NPU)에서 GPU로 전환했다. 16일 공개한 아이패드 프로·맥용 SoC(시스템반도체) M5 칩의 GPU 안에 '신경망 가속기'를 내장한다고 밝힌 것이다. 애플 실리콘 M 시리즈는 응용프로그램 처리 등 일반적인 연산에는 CPU를, 그래픽 처리와 일부 병렬 연산에는 GPU를 활용했다. NPU '뉴럴 엔진'은 특정 AI 연산을 실행하는 방식으로 독립적으로 작동했다. 이로 인해 애플의 AI 연산은 높은 효율을 유지했지만, GPU를 통한 AI 연산 확장성은 상대적으로 제한적이었다. 그러나 AI 모델의 용량이 커지고 복잡해지면서 NPU로만 이를 처리하는 방식은 한계에 부딪혔다. GPU는 더 높은 메모리 대역폭과 병렬 연산 유연성을 제공하기 때문에, 복합 AI 워크로드에 더 적합하다. 애플이 GPU에 AI 가속 엔진을 통합한 것은 지금까지 유지해 온 구조를 벗어나 AI 연산 중심 장치를 GPU로 옮기겠다는 의도로 읽힌다. 애플, 2017년부터 A시리즈 칩에 NPU 탑재 애플은 2017년 아이폰8·X에 탑재한 SoC 'A11 바이오닉'에 처음으로 NPU인 뉴럴엔진을 통합했다. 이는 스마트폰 분야 경쟁사인 삼성전자나 퀄컴 대비 수 년을 앞선 시도였다. 애플은 이후 출시한 아이폰용 A시리즈 SoC는 물론 이 구조를 계승해 자체 설계한 PC용 SoC인 애플 실리콘 M시리즈에도 꾸준히 뉴럴엔진을 탑재했다. 뉴럴엔진은 주로 사진·음성·자연어 처리 등 다양한 기능을 처리했다. 지난 해 공개된 애플 실리콘 M4에 탑재된 뉴럴엔진은 INT8(정수, 8비트) 기준 38 TOPS 수준의 연산 성능을 갖췄다. 애플, M5 칩 GPU 구조 개선 애플이 16일 아이패드 프로와 맥북프로 신제품에 탑재한 애플 실리콘 'M5'는 최대 10코어 CPU, 10코어 GPU와 16코어 NPU '뉴럴 엔진'으로 구성됐다. 특기할 점은 GPU 내부에 AI 연산을 가속할 수 있는 '신경망 가속기'를 통합했다는 것이다. 이는 AI 연산을 전용 NPU에만 전담시키던 기존과 달리 대부분의 AI 연산을 GPU로 우선 처리하겠다는 의도로 해석된다. 애플은 이런 구조 변경을 통해 "AI 작업 처리시 M4 대비 최대 4배 성능이 향상됐다"고 설명했다. 기준이 되는 AI 연산의 정밀도(FP16, INT8, FP8)나 벤치마크 방식은 공개되지 않았지만, CPU와 뉴럴 엔진 관련 언급은 나오지 않았다. GPU를 AI 처리의 중심에 둔 것이다. 인텔·AMD, AI 연산에 GPU 우선 활용 AI PC 시장이 본격화되면서, 인텔·퀄컴 등 주요 반도체 업체들도 GPU 기반 AI 연산을 강화하는 전략을 앞다퉈 내세우고 있다. 인텔이 올 연말부터 공급할 코어 울트라 시리즈3(팬서레이크)는 GPU의 AI 연산 성능을 전작(코어 울트라 200V) 대비 두 배 가까운 120 TOPS로 끌어올린 반면 NPU 연산 성능은 소폭 상승한 50 TOPS 수준에 머물렀다. AMD가 공급하는 라이젠 AI 300 시리즈 역시 내장 라데온 GPU의 AI 처리 성능을 강화했다. 새로운 RDNA 3.5 아키텍처는 FP16·INT8 연산을 지원하며, NPU와 GPU가 AI 연산을 병행하는 구조를 구현했다. NPU TOPS보다 시스템 전체 연산 성능 중요도 상승 그동안 AI 연산 성능의 기준은 NPU의 초당 연산 횟수(TOPS)로 나타났다. 그러나 GPU를 활용한 추론이 AI 연산이 주류로 부상하면서 NPU에만 의존할 수 없게 됐다. NPU 뿐만 아니라 GPU, CPU를 모두 조화롭게 활용해야 하는 상황인 것이다. 애플이 AI 연산 처리에 GPU를 앞세운 것은 이런 변화를 반영한 것이다. AI 연산은 더 이상 NPU라는 전용 블록의 역할이 아니라, SoC 전반이 수행해야 하는 가장 중요한 작업이 됐다.

2025.10.16 17:43권봉석 기자

리벨리온-루닛, 글로벌 AI 사업 협력 "의료AI 혁신"

AI반도체 기업 리벨리온이 의료 인공지능(AI) 기업 루닛과 업무협약(MOU)을 체결하고, 의료AI 혁신 및 글로벌 AI 사업개발 협력을 본격 추진한다고 15일 밝혔다. 리벨리온은 추론 연산에 최적화된 AI반도체(NPU)를 개발하고 있으며, 루닛은 인공지능 기술을 기반으로 암 진단 및 분석 솔루션을 제공한다. 양사는 의료 특화 AI 모델과 NPU 기반 플랫폼을 결합함으로써, 국내 버티컬 AI 산업의 혁신을 주도하고 나아가 글로벌 시장 리더십을 실현하는 데 뜻을 모았다. 우선 양사는 각종 정부 과제에 참여해 루닛의 차별화된 의료AI 모델과 리벨리온의 저전력 고성능 NPU를 결합해 대국민 의료 서비스를 구현하고, 의료AI 접근성과 비용효율성, 품질을 획기적으로 개선하는 데 힘을 합친다. 특히 각종 정부 과제에 컨소시엄으로 참여해 버티컬AI 중에서도 활용도가 높은 의과학 특화 AI 모델의 운영 효율성을 극대화하고, 버티컬 AI의 활성화에 기여한다. 또한, 글로벌 사업개발 협력으로 양사가 구축한 국산 AI솔루션의 해외수출에도 나선다. 루닛의 의료AI 모델들과 리벨리온의 NPU를 하나로 구성한 어플라이언스 형태의 제품을 공동으로 영업하며, 전 세계 65개국에 AI 진단 서비스를 제공 중인 루닛과 아람코 데이터센터에 NPU를 공급한 리벨리온의 기술력과 사업 노하우를 모아 시너지를 창출한다. 이를 바탕으로 글로벌 국가 암 검진 사업 등 공공 헬스케어 프로젝트에 적극 참여해 해외시장 진출 및 사업 모델 개발을 추진한다. 이번 협력으로 양사는 의료AI 산업의 성장과 확장을 촉진하고, 최신 AI 기술을 기반으로 보다 지속가능한 한국 의료산업을 구현함으로써 글로벌 도약과 국민 건강 증진에도 기여할 것으로 기대된다. 나아가 범용 모델을 넘어 국민 실생활에 유의미한 특화 AI모델 및 서비스를 실현한다는 계획이다. 박성현 리벨리온 대표는 “리벨리온은 NPU를 기반으로 특화 AI서비스를 효율적이고 안정적으로 운영할 수 있는 기술과 경험을 축적해왔다. 대한민국 의료AI를 대표하는 루닛과 협력하게 된 만큼, 우리나라 국민이 쉽게 접근할 수 있는 AI의료 서비스 구축에 기여하고, 나아가 글로벌 공공 시장에서도 새로운 성공사례를 만들어 가겠다”고 말했다. 루닛 서범석 대표는 “양사의 이번 협력은 루닛의 의료AI 기술이 보다 폭넓은 산업 생태계로 확장되는 중요한 전환점이 될 것“이라며 “루닛의 정밀진단 알고리즘과 리벨리온의 고성능 NPU의 결합은 국내 버티컬 AI 산업의 혁신을 이끌고, 전 세계 공공 헬스케어 프로젝트에 실질적인 의료 혜택을 제공하게 될 것“이라고 전했다.

2025.10.15 10:16전화평 기자

인텔 "팬서레이크 내장 GPU, AI 성능 2배↑"

[애리조나(미국)=권봉석 기자] 인텔은 2011년 '빌트인 비주얼'을 내세우며 프로세서 안에 내장 그래픽칩셋을 탑재하기 시작했다. 이후 2018년부터 자체 개발한 Xe GPU 아키텍처를 이용해 내장 그래픽칩셋과 그래픽카드 등을 시장에 공급하고 있다. 지난 해 코어 울트라 200V(루나레이크)에 탑재된 Xe2 코어 기반 GPU는 기본 성능 강화로 1080p 해상도 게임 성능을 강화했다. 코어 울트라 200V의 AI 연산 성능은 GPU 67 TOPS(1초당 1조 번 연산), 신경망처리장치(NPU)는 48 TOPS에 달한다. 인텔 차세대 모바일(노트북)용 프로세서 '팬서레이크'는 GPU AI 연산 성능을 두 배 가까운 120 TOPS, NPU 연산 성능은 소폭 상승한 50 TOPS로 높였다. 여기에 CPU(10 TOPS)를 더하면 최대 연산 성능은 180 TOPS까지 향상된다. 29일 오전(이하 현지시간) 미국 애리조나 주 '인텔 테크투어 US' 행사장에서 톰 피터슨 인텔 아키텍처, 그래픽·소프트웨어 펠로우는 "GPU와 NPU 강화는 AI와 에이전틱 워크로드(작업)가 등장하며 변화하는 PC 요구사항을 충족하기 위한 것"이라고 설명했다. Xe3 코어 4개/6개 묶음으로 이원화... 최대 12코어 구성 가능 팬서레이크에 탑재될 내장 GPU는 Xe3 코어 기반이며 코드명 '배틀메이지', '아크 B시리즈'라는 이름으로 출시된다. 코어 울트라 200V에 탑재된 GPU는 Xe2 코어 4개와 레이트레이싱 유닛 4개를 한데 묶은 '렌더 슬라이스(조각)' 2개를 이용해 총 8코어로 구성됐다. 팬서레이크의 렌더 슬라이스는 ▲ Xe3 코어·레이트레이싱 유닛 4개 구성 ▲ Xe3 코어·레이트레이싱 유닛 6개 구성 등 총 두 개로 구성된다. 전자는 8코어 CPU(4P+4E)/16코어 CPU(4P+8E/LP 4E)와 결합되며 4코어 렌더 슬라이스 하나만 이용한다. 후자는 16코어 CPU(4P+8E/LP 4E)와 짝을 이루며 6코어 렌더 슬라이스 2개를 활용해 12코어 GPU를 만든다. Xe3, 처리 가능 데이터에 FP8 추가 Xe3 코어는 512비트 벡터 엔진 8개, AI 연산에 필요한 XMX(Xe 행렬 확장) 엔진 8개로 전세대 Xe3 코어와 차이가 없다. 그러나 데이터를 임시 저장하는 캐시를 33% 늘려 지연 시간과 성능을 향상시켰다. XMX 엔진은 INT2(정수 2비트), INT4, INT8, FP16(부동소수점 16비트), BF16, TF32 등 자료형을 처리할 수 있다. 여기에 정밀도에는 큰 차이가 없지만 연산 속도가 더 빠르고 배터리 소모가 적은 FP8(부동소수점 8비트) 양자화를 더했다. AI 연산 성능은 INT8 자료형 기준 최대 120 TOPS다. 전 세대인 코어 울트라 200V 프로세서 성능을 GPU 하나만으로 감당하게 됐다. 전세대 대비 GPU 성능 최대 50% 향상 인텔은 Xe2/Xe3 대상으로 실시한 자체 벤치마크 결과를 토대로 Xe3 GPU의 성능이 전 세대 대비 평균 50% 향상됐고 깊이 쓰기(Depth write) 벤치마크에서는 7배 이상 성능이 높아졌다고 설명했다. 톰 피터슨 펠로우는 "Xe3 GPU의 최대 성능은 루나레이크 대비 50% 높아졌고 애로우레이크H 대비 같은 전력에서 40% 더 높은 성능을 낸다"며 "게임용 고성능 노트북뿐만 아니라 휴대성을 강조한 소형·경량 노트북에서도 GPU 경쟁력을 확보했다"고 설명했다. 인텔은 마이크로소프트와 협력해 윈도 운영체제 그래픽 라이브러리인 다이렉트X 12에 Xe3 GPU의 XMX 연산 능력을 활용하는 '협동 벡터'(Cooperative Vectors)도 도입했다. 행사에서는 이를 활용해 2D 이미지로 3차원 입체를 만드는 'NeRF' 기술도 시연했다. NPU 5는 성능보다 작동 효율 향상에 방점 NPU는 소음 감소나 배경 흐림 등 최대한 전력을 적게 소모하며 상시 구동돼야 하는 작업에 최적화됐다. 팬서레이크에 탑재된 NPU 5도 전 세대 'NPU 4' 대비 연산 효율을 높이는 한편 인텔 18A 공정 적용으로 작동 효율을 높였다. NPU 4는 AI 처리에서 주로 쓰이는 MAC(Multiply–accumulate, 곱셈 가산) 연산과 DSP 처리를 수행하는 뉴럴 컴퓨트 엔진을 6개 탑재해 48 TOPS급 성능을 구현했다. 반면 NPU 5는 뉴럴 컴퓨트 엔진 수를 줄이는 대신 MAC를 처리하는 'MAC 어레이' 크기를 2배로 늘렸다. 톰 피터슨 펠로우는 "NPU 5는 FP16 대비 에너지 소모를 50% 줄이면서 유사한 품질을 얻을 수 있는 FP8(부동소수점 8비트)를 지원해 스테이블 디퓨전 등 생성 AI 작업에 필요한 전력량을 108J(줄)에서 30% 낮은 70J(줄)까지 끌어내렸다"고 설명했다. Xe3 4코어 GPU는 인텔 3 공정서 생산 예정 인텔은 노트북용 프로세서에 탑재되는 대부분의 내장·외장 GPU를 대부분 인텔 파운드리가 아닌 대만 TSMC에서 생산했다. 그러나 팬서레이크부터는 GPU 타일 중 Xe3 4코어 내장 제품을 극자외선(EUV) 기반 자체 공정인 인텔 3(Intel 3)에서 생산 예정이다. 팬서레이크는 레이트레이싱과 그래픽 연산에 필요한 각종 요소를 떼어내 GPU 타일로 분리했다. CPU는 그대로 두고 GPU를 더 강력한 제품으로 교체하는 것도 얼마든지 가능하다. 인텔은 이를 위해 더 강력한 GPU인 'Xe3P'도 준비중이다. 톰 피터슨 펠로우는 "CPU(경량 AI 모델), NPU(저전력 상시구동 윈도11 코파일럿+), GPU(대형언어모델 / 생성 AI) 등 3개 요소를 균형있게 강화해 AI 처리를 최적화하는 것이 인텔 목표"라고 강조했다.

2025.10.09 22:45권봉석 기자

인텔 "팬서레이크, 성능·효율성 모두 잡은 차세대 플랫폼"

[애리조나(미국)=권봉석 기자] "팬서레이크는 코어 울트라 200V(루나레이크)의 전력 효율성과 200H/S(애로우레이크)에서 얻은 성능을 모두 계승한 강력한 아키텍처다." 29일 오전(이하 현지시간) 미국 애리조나 주 '인텔 테크투어 US' 행사장에서 아리크 기혼 인텔 클라이언트 SoC 아키텍처 수석 엔지니어가 이렇게 설명했다. 팬서레이크는 인텔이 AI PC 시장을 겨냥해 개발한 모바일(노트북)용 새 프로세서다. 1.8나노급 인텔 18A 공정에서 생산한 컴퓨트 타일(CPU)과 GPU, 신경망처리장치(NPU)를 결합했다. AI 처리 성능은 최대 180 TOPS(1초당 1조번 연산)로 코어 울트라 200V 프로세서(120 TOPS)로 50% 가까이 향상됐다. 3개 타일 조합해 SOC 구성... GPU 타일 완전 분리 팬서레이크는 ▲ 각종 범용 연산을 담당하는 CPU, 카메라 영상을 처리하는 영상처리장치(IPU), NPU와 Xe 미디어·디스플레이 엔진, 메모리 컨트롤러를 모은 '컴퓨트 타일', ▲ 썬더볼트4와 USB, 와이파이/블루투스를 담당하는 '플랫폼 제어 타일' ▲ Xe3 코어와 레이트레이싱 등을 처리하는 GPU 타일 등 총 3개 타일로 구성된다. 아리크 기혼 수석 엔지니어는 "코어 울트라 200V 프로세서에 처음 적용된 스케일러블 패브릭 기술을 2세대로 진화시켜 다양한 공정이나 IP에 관계없이 컴퓨트(CPU·NPU) 타일, GPU 타일, 플랫폼 제어 타일 등을 자유롭게 조합할 수 있게 됐다"고 설명했다. 눈에 띄는 것은 GPU 연산만 담당하는 GPU 타일을 완전히 독립된 상태로 구성했다는 점이다. 전력 소모나 가격대, 배터리 지속시간 등 요구사항에 맞춰 GPU에 내장된 코어 수를 달리하며 체급이 다른 프로세서를 공급할 수 있다. GPU 성능을 극대화한 새로운 프로세서 출시 가능성도 열어뒀다. GPU·NPU 성능 개선으로 AI 처리 성능 향상 팬서레이크는 GPU와 NPU 성능을 높여 AI 처리 성능 향상에 큰 중점을 뒀다. GPU는 Xe3 코어와 16MB L2 캐시, 레이트레이싱 유닛 12개로 구성할 경우 전 세대 대비 최대 50% 향상된 최대 120 TOPS급 연산이 가능하다. NPU 5는 내부 구조를 최적화하는 한편 처리 속도와 배터리 지속시간에 강점을 지닌 FP8(부동소수점, 8비트) 연산을 추가했다. NPU를 포함한 컴퓨트 타일 생산에 1.8나노급 인텔 18A가 쓰이면서 차지하는 면적도 줄었다. 최대 연산 속도는 50 TOPS 급이다. 일반적인 연산을 처리하는 CPU는 고성능 P(퍼포먼스) 코어와 저전력·고효율 E(에피션트) 코어를 결합한 하이브리드 구조를 유지했다. 처음부터 인텔 18A 공정에 최적화돼 저전력 고성능을 추구했다. P코어는 지난 해 공개된 '라이언코브' 후속 제품인 '쿠거 코브', E코어 역시 지난 해 공개된 '스카이몬트' 후속 제품인 '다크몬트'를 투입했다. 다만 완전히 새롭게 설계되지는 않아 성능 향상 폭은 적을 것으로 보인다. CPU·GPU 코어 수 따라 최대 3개 구성 공급 인텔은 팬서레이크 내장 CPU와 GPU 코어 수를 달리해 최대 3개 구성을 주요 PC 제조사에 공급 예정이다. 성능에 따라 패키징이 달랐던 것과 달리 팬서레이크의 패키징은 동일해 PC 제조사가 프로세서 구성만 교체하는 방식으로 다양한 제품을 출시할 수 있다. 8코어 CPU(4P+4E)와 Xe3 코어 4개 탑재 프로세서는 성능과 배터리 지속시간의 균형을 추구한 구성이다. LPDDR5X-6800MHz, DDR5-6400MHz 메모리를 지원한다. PCI 익스프레스 4.0 레인(lane, 데이터 전송 통로)은 8개, PCI 익스프레스 5.0 레인은 4개다. 16코어 CPU(4P+8E/LP 4E)와 Xe3 코어 4개 탑재 프로세서는 PCI 익스프레스 5.0 레인을 12개로 늘리는 한편 LPDDR5X-8533MHz/DDR5-7200MHz 메모리를 지원한다. 콘텐츠 제작이나 게임 등 외부 GPU 탑재를 염두에 뒀다. 최상위 제품인 16코어 CPU와 Xe3 코어 12개는 GPU 성능을 극대화한 한편 LPDDR5X-9600MHz 메모리만 지원한다. 얇은 폼팩터에서 AI와 그래픽 성능을 강화한 프리미엄 제품을 겨냥했다. 화면 위 웹캠 영상을 처리하는 IPU 7.5와 최대 50 TOPS 연산이 가능한 5세대 NPU 'NPU 5'는 모든 구성에 동일하게 유지된다. "다양한 용도에 걸쳐 차세대 모바일 경험 제공할 것" 아리크 기혼 수석 엔지니어는 "팬서레이크는 인텔 18A 공정과 포베로스 패키징을 통해 AI, 그래픽, 게이밍, 크로스 플랫폼 워크로드를 모두 아우르는 차세대 모바일 경험을 제공할 것"이라고 강조했다. 이어 "PC 제조사는 필요에 따라 메모리와 GPU 구성을 보다 자유롭게 선택할 수 있으며 이를 접하는 소비자 역시 향상된 전원 관리 메커니즘으로 배터리 모드와 전원 어댑터 모드 사이에서 큰 차이 없는 성능을 체험할 수 있을 것"이라고 덧붙였다.

2025.10.09 22:15권봉석 기자

Prev 1 2 3 4 5 6 7 8 Next