• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
스테이블코인
인공지능
배터리
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'온디바이스'통합검색 결과 입니다. (108건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

노타, 유탑소프트와 온디바이스 AI 튜터 개발 '맞손'…비용 효율화 실현

노타가 인공지능(AI) 에듀테크 기업 유탑소프트와 손잡고 온디바이스 AI 튜터 개발에 나선다. 노타는 지난 18일 유탑소프트와 온디바이스 AI 기반 교육 서비스 사업 협력을 위한 양해각서(MOU) 체결식을 진행했다고 19일 밝혔다. 이번 체결식은 유탑소프트가 보유한 교육 업체 대상 AI 튜터 개발 역량과 노타의 AI 경량화 기술을 결합해 교육 전용 디바이스에 최적화된 생성형 AI 기반 AI 튜터 서비스를 상용화하고자 마련됐다. 양사가 구상 중인 온디바이스 AI 튜터는 외부 서버를 거치지 않고 태블릿 기기 자체에서 AI 튜터가 구동되는 방식을 기본으로 하되, 추론의 결과가 많이 필요한 경우에 한해 외부 서버와 연동하는 하이브리드 방식의 적용이 검토되고 있다. 기존 생성형 AI 기반 서비스의 고질적인 문제로 꼽히는 ▲막대한 서버 운영 비용 ▲네트워크 지연 속도 ▲데이터 보안 문제를 효율적으로 개선한다는 목표다. 향후 협력이 구체화되면 유탑소프트는 우선적으로 영어 스피킹 특화 AI 튜터 모델과 거대언어모델(LLM) 기반 문제은행 특화 AI 튜터 모델의 기획과 개발을 주도할 계획이다. 이에 맞춰 노타는 자사 핵심 기술인 AI 모델 최적화 플랫폼 '넷츠프레소'를 활용해 데이터 기반 파인튜닝 및 해당 AI 튜터 모델을 태블릿 등의 하드웨어(HW) 성능에 맞춰 압축·최적화하는 과정에서 긴밀히 협력해 나갈 방침이다. 이를 통해 구현되는 AI 튜터 솔루션은 학생 사용자수 증가에 따라 기하급수적으로 늘어나는 AI 서비스 운용 비용을 획기적으로 절감할 수 있을 것이라는 게 회사 측 설명이다. 또 인터넷 연결이 원활하지 않은 환경에서도 학생들이 끊김 없이 AI 튜터의 질문·답변 서비스를 이용할 수 있어 학습 효율성을 극대화할 전망이다. 김성범 유탑소프트 대표는 "노타와의 협력은 에듀테크 시장의 화두인 비용 효율화와 개인화 교육을 동시에 실현하는 계기가 될 것"이라며 "교육 업체가 고비용의 LLM 도입으로 발생되는 운영 비용의 부담을 하이브리드 지원 온디바이스 AI 튜터를 통해 합리적이고 안전한 솔루션을 교육 업체에 제공하겠다"고 밝혔다. 채명수 노타 대표는 "교육 업체를 위한 AI 서비스 모델 경량화는 HW 제약이 많은 모바일 교육 환경에서 필수적인 기술"이라며 "유탑소프트의 풍부한 교육 서비스 구축 경험이 우리의 온디바이스 AI 기술과 만나 실제 교육 현장에서 의미 있는 혁신 사례를 만들 수 있도록 적극 지원하겠다"고 말했다.

2025.12.19 15:32한정호

AI반도체 육성에 머리 맞댄 민·관…"내년 R&D 정책 수립에 반영"

산업통상부(이하 산업부)는 18일 오후 한국반도체산업협회에서 반도체 학계·연구계 전문가 30여명과 AI반도체 정책·기술동향을 함께 논의하기 위해 'AI반도체 M.AX 얼라이언스 워크숍'을 개최했다. 이날 워크숍에는 AI반도체 M.AX 얼라이언스 위원장을 맡고 있는 김용석 가천대 교수를 비롯해, 산업통상부 반도체과장, 한국산업기술기푁평가원, 한국전자기술연구원 등이 참석했다. 내년 AI반도체 R&D 신규 기획방향 발표, 최근 AI반도체 정책·기술동향 논의, 정책제언 및 토론 등이 핵심 안건으로 올랐다. 워크숍은 AI반도체 신규 R&D 기획 방향 및 정책 세부이행 논의(1부)와 AI반도체 최신 기술 발표 세미나(2부)로 나누어 진행됐다. 산업부는 첨단제품에 탑재될 국산 AI반도체 개발사업(K-온디바이스 AI반도체) 등 2026년 AI반도체 신규 R&D 기획방향을 설명했다. 이어 지난 10일 발표한 'AI 시대, 반도체 산업 전략'과 금일 관계부처 합동으로 발표한 'AI반도체 산업 도약 전략'을 공유했고, 참석자들은 AI반도체 산업 도약을 위한 기술 리더십 확보 및 생태계 구축 방안 등에 대한 정책 제언 및 심도 있는 토론을 진행했다. 학·연에서는 ▲NPU 디자인 분야 알고리즘 특화 가속 ▲피지컬 AI를 위한 온디바이스 AI ▲온디바이스 AI 학습 프로세서 ▲자율주행차용 칩렛 기반 AI반도체 설계 등 반도체 최신기술 동향을 공유했다. 산업부 관계자는 “이번 워크숍에서 논의된 전문가들의 의견을 2026년 R&D 기획과 정책 수립에 적극 반영하고, 앞으로도 AI반도체 M.AX 얼라이언스를 통해 K-반도체 기술 리더십 확보 방안에 대해 산·학·연 관계 전문가들과 지속적으로 소통해 나가겠다”고 밝혔다.

2025.12.18 11:00장경윤

삼성전자 "차세대 메모리 LPDDR6-PIM 표준 거의 완성"

삼성전자가 엣지 AI 영역을 위한 차세대 메모리 개발에 박차를 가하고 있다. 연내 'LPDDR6-PIM' 표준을 제정해, 제품 개발의 초석을 마련하는 것을 목표로 하고 있다. 16일 손교민 삼성전자 마스터는 서울대학교 AI 반도체 포럼에서 차세대 PIM(프로세싱-인-메모리) 개발 전략에 대해 이같이 밝혔다. PIM은 메모리 반도체에서 자체적으로 데이터 연산 기능을 처리할 수 있도록 만든 반도체다. 삼성전자의 경우, 범용 D램에서부터 HBM(고대역폭메모리)까지 전반적으로 PIM을 적용하기 위한 연구개발을 지속해 왔다. 특히 저전력 D램인 LPDDR 분야에서 PIM 적용이 활발한 추세다. LPDDR은 1-2-3-4-4X-5-5X 순으로 개발돼 왔으며, 7세대인 LPDDR5X까지 상용화가 완료됐다. 삼성전자는 LPDDR5X와 PIM을 결합한 LPDDR5X-PIM을 개발 중에 있다. 해당 제품은 기존 LPDDR5X 대비 대역폭이 8배 큰 614GB/s를 구현했으며, FP16/FP8 및 INT/4/8/16 등 다양한 연산을 지원하는 것이 특징이다. 손 마스터는 "LPDDR-PIM은 HBM 활용이 어려운 모바일, 엣지 AI 연산이 필요한 산업에서 적용될 수 있을 것"이라며 "단순히 메모리 기업만의 생각이 아닌 SoC(시스템온칩) 및 시스템 기업들도 PIM 활용을 고려하고 있다"고 말했다. 다음 세대인 LPDDR6-PIM 개발을 위한 준비도 연내 마무리짓는 것이 목표다. 이를 위해 JEDEC(국제반도체표준협의회)에서 표준 제정을 진행 중으로, 현재 마무리 단계에 접어든 것으로 알려졌다. 손 마스터는 "삼성전자의 기본 목표는 올해 말까지 LPDDR6-PIM의 개발을 시작할 수 있을 정도의 표준을 완성하는 것"이라며 "표준화가 거의 다 됐고, 몇 가지 점에 대해 회사 간의 조율을 하고 있는 중"이라고 설명했다.

2025.12.16 15:27장경윤

퀄컴, 아태 AI 스타트업 육성 시동…15개팀 성과 서울서 공개

퀄컴이 아시아·태평양(APAC) 지역 온디바이스 AI 생태계 확장을 위한 '퀄컴 AI 혁신 프로그램(QAIPI) 2025 APAC 데모데이' 행사를 5일 오후 서울 용산구 퀄컴코리아 사옥에서 진행했다. QAIPI는 퀄컴이 올해 APAC 대상으로 처음 진행한 프로그램이다. 한국과 일본, 싱가포르 등 3개 나라에서 총 15개 스타트업을 선정해 6개월 동안 퀄컴의 엣지 AI 플랫폼 기반 기술 멘토링 등을 제공했다. 또 올해 데모데이 행사 개최지를 서울로 선택했다. 5일 오전 퀄컴코리아에서 국내 기자단과 만난 이비 타이 퀄컴 타이완 사업개발 디렉터는 "한국은 세계 최고 수준 ICT 인프라와 스타트업 생태계, 기업·투자자 네트워크로 적합한 시장"이라고 설명했다. "선정 스타트업에 퀄컴 기술과 글로벌 진출 지원" 퀄컴은 올해 APAC 지역에서 '퀄컴 AI 혁신 프로그램 2025'를 시작하고 한국·일본·싱가포르에서 총 15개 유망 스타트업을 선정했다. 선정 팀들은 디바이스·제품 키트 지원, 5천 달러(약 736만원) 상당 특허 출원 인센티브도 지원받았다. 이비 타이 디렉터는 "선정된 스타트업의 요구사항을 파악해 모바일과 AI PC, IoT 등 다양한 퀄컴 엣지 AI 플랫폼을 활용한 솔루션 개발을 지원했다. 또 글로벌 시장 진출을 위한 디자인·지식재산권(IP) 교육, 특허 전략 컨설팅, 비즈니스 워크숍도 제공했다"고 설명했다. 이어 "오늘 오후 진행될 데모데이 행사에서는 한국을 포함해 총 15개 스타트업이 헬스케어, 로보틱스, 스마트시티, 산업용 AI 등 다양한 분야의 엣지 AI 솔루션을 발표하고 라이브 데모를 선보이며, 지난 6개월간의 협력 성과를 공유한다"고 덧붙였다. 반야에이아이 "퀄컴, 한국 특화 AI 모델 구현 적극 지원" QAPI에 선정된 국내 스타트업 중 한 곳인 '반야에이아이'는 올해 3월 설립됐다. 이 회사 김 안토니오 최고기술책임자(CTO)는 "어려움을 겪는 사회적 약자를 위해 '지혜'를 빌려주는 AI 기술을 개발하고 있다"고 설명했다. 이어 "온디바이스 AI는 개인 프라이버시나 민감 정보를 외부로 공개하지 않아도 챗GPT 수준의 사려 깊은 인공지능을 만들 수 있다. 오픈소스 기반으로 자체 개발한 AI 모델을 튜닝하고 훈련해 사용하고 있다"고 설명했다. 퀄컴은 반야에이아이와 협업 과정에서 스냅드래곤 X 엘리트 탑재 기기를 제공했다. 김 안토니오 CTO는 "내장 아드레노 GPU 성능이 강화돼 온디바이스 AI를 원활히 실행할 수 있다"고 평가했다. 반야에이아이는 한국어 기반 모델을 퀄컴 실리콘에 최적화하는 과정에서 퀄컴의 기술 지원을 받았다. 김 안토니오 CTO는 "2주에 한 번씩 퀄컴 기술진과 미팅을 하며 어려운 부분에 대해 도움을 받고, 매번 많은 자료를 제공받는 등 긴밀히 협업했다"고 설명했다. "아두이노 인수로 스타트업 지원 가속... 유니콘 탄생 희망" 이비 타이 퀄컴 타이완 사업개발 디렉터는 "올해 APAC 전역에서 수준 높은 지원자들이 몰렸다. 이 중 ▲AI 혁신성 ▲산업적·사회적 영향 ▲퀄컴 기술과의 시너지 ▲플랫폼 적합성을 따져 스타트업을 선정했다"고 설명했다. 이어 "특허 출원 인센티브 과정에서 모든 지적재산권은 해당 스타트업에 귀속되며 퀄컴은 관여하지 않는다. 또 기술적으로 뛰어난 곳은 내부 사업부나 고객사와 연결해 상용화 기회를 제공하는 등 장기 성장도 돕는다"고 말했다. 최근 인수한 아두이노 관련해 그는 "스타트업이 퀄컴 플랫폼 위에서 더 빠르게 AI 응용프로그램을 구현할 수 있도록 생태계를 강화하는 효과가 있다"고 설명했다. 이비 타이 디렉터는 "한국·일본·싱가포르 등 주요 국가 스타트업이 시장을 탐색하고 글로벌로 나아갈 수 있도록 지원하겠다는 입장을 밝히며, 향후 유니콘 기업이 탄생하는 데 기여할 수 있다면 큰 의미가 있을 것"이라고 덧붙였다.

2025.12.07 09:31권봉석

퀄컴, 'AI 이노베이터 프로그램 APAC 데모데이' 개최

퀄컴은 5일 오후 서울 용산구 소재 퀄컴코리아 본사에서 '퀄컴 AI 이노베이터 프로그램 2025 - APAC 데모 데이' 행사를 개최하고 한국·일본·싱가포르에서 선발된 15개 스타트업의 온디바이스 AI 솔루션을 소개했다. 퀄컴은 한국과 일본, 싱가포르 등 3개 나라의 스타트업 대상으로 6개월간 퀄컴 엔지니어 기술 지원과 하드웨어 개발 키트, 제품 구현을 위한 비즈니스 워크숍 등 기회를 제공했다. 해당 프로그램에는 최대 5천 달러(약 735만원) 상당 특허 출원 인센티브가 포함돼 스타트업의 장기적인 경쟁력 강화와 생태계 확장을 지원한다. 5일 오후 진행된 데모데이 행사에는 권오형 퀄컴 APAC 대표와 노용석 중소벤처기업부 1차관, 주한미국대사관 관계자와 15개 스타트업 임직원들이 참가해 퀄컴 플랫폼 기반으로 구현된 로보틱스, 헬스케어, 스마트시티 등 솔루션을 공개했다. 이날 노용석 중소벤처기업부 1차관은 "퀄컴을 비롯한 글로벌 기업과 기술 협력, 투자 등 다양한 방식으로 국내 스타트업을 적극 지원하겠다"고 밝혔다. 이어 "중소벤처기업부도 유망 AI 스타트업이 글로벌 리더십을 확보할 수 있도록 제조·콘텐츠·서비스 등 전 가치사슬 전반에서 AI 수요를 발굴하고, 다음 세대 혁신을 이끌 유니콘 기업 발굴·육성, 해외 지원 네트워크 구축에 나설 것"이라고 설명했다. 권오형 퀄컴 APAC 대표는 "퀄컴은 협력과 플랫폼, 생태계 조성을 통해 아시아·태평양 지역의 혁신 기업을 지원하기 위해 노력하고 있으며 '퀄컴 AI 이노베이터 프로그램'(QAIPI)은 이런 의지의 일환"이라고 설명했다. 권 대표는 "퀄컴은 한국의 스타트업 및 개발자 생태계를 지속적으로 육성하고 있으며, 특히 AI가 PC·로보틱스·사물인터넷(IoT)으로 확장되는 과정에서 한국 스타트업과 협력 기회는 더욱 커지고 있다. 한국의 혁신이 글로벌 무대로 확장될 수 있을 것이라 확신한다"고 강조했다. 퀄컴은 올해에 이어 내년에도 'QAIPI 2026 - APAC' 프로그램으로 아태지역 스타트업을 지속 지원 예정이다. 또 최근 인수한 IoT 플랫폼인 아두이노를 활용해 신속한 초기 개발과 디바이스 수준 AI 및 머신러닝 통합 지원을 확대할 예정이다. QAIPI 2026 모집 요강은 향후 퀄컴 웹사이트에서 공개 예정이다.

2025.12.07 09:00권봉석

딥엑스, 차세대 로봇용 AI 플랫폼 공개...현대차와 협력

온디바이스 AI 반도체 기업 딥엑스는 현대차·기아 로보틱스랩과 함께 세계경제포럼(WEF)의 혁신 AI 기술 MINDS 사례로 선정된 차세대 온디바이스 AI 플랫폼을 공개한다고 1일 밝혔다. 양사가 공동 개발한 온디바이스 AI 제어기는 현재 양산 적용을 위한 기술 검증 단계에 있다. 딥엑스 AI 반도체 DX-M1은 2023년 현대차·기아 로보틱스랩과 전략적 협력을 계기로 서비스 로봇용 제어 플랫폼에서 단계적 적용이 진행돼 왔다. 로봇 제어기에서 중요한 전력 효율·추론 성능·지연 시간 조건을 충족하면서도 5W 이하 전력으로 고성능 추론이 가능한 구조를 갖추고 있어 실내·외 서비스 로봇에 적합하다는 평가를 받는다. 올해 딥엑스와 로보틱스랩은 DX-M1 기반 제어기에 광각·협각 듀얼 ISP 카메라, 로보틱스랩의 비전AI기술을 통합한 차세대 제어기를 개발했다. 이는 지하주차장·지하철역·물류센터 같은 통신 불안정 환경에서도 네트워크 연결에 의존하지 않고 작동 가능한 온디바이스 기반 로봇 지능 구조를 목표로 한다. 이 시스템은 클라우드 연결이 원활하지 않아도 안정적으로 작동하는 로봇이라는 피지컬 AI의 핵심 요구 사항을 충족하기 위한 구조로 설계됐다. 또한 DX-M1이 현대차·기아 로보틱스랩의 안면 인식 시스템 '페이시(Facey)'와 연동되었고 이를 바탕으로 배송로봇 DAL-e 딜리버리는 수령인 안면 인증, 사용자 식별, 맞춤형 안내 등의 기능을 실증하고 있으며, 향후 고도화된 인터랙션 서비스를 제공할 수 있게 됐다. 해당 기술은 12월 3월부터 산업부가 주최하는 코리아 테크 페스티벌과 미국 라스베이거스에서 열리는 'CES 2026'에서 공개될 예정이다. 양사는 생산·물류·모빌리티·스마트시티 등 그룹 전반에서 피지컬 AI 기반 로봇 서비스를 확대하기 위한 파트너십을 단계적으로 넓혀 나갈 계획이다. 딥엑스는 “현대차·기아 로보틱스랩과 함께 로봇 지능 기술의 발전 속도를 더욱 높이며, 피지컬 AI 기반 로봇이 일상과 산업 현장에 자연스럽게 스며드는 시대의 기반을 구축하는 데 핵심적인 역할을 이어갈 예정”이라고 전했다.

2025.12.01 10:16전화평

노타, 삼성 '엑시노스'에 AI 최적화 기술 공급…"온디바이스 기술력·시장성 입증"

노타가 삼성전자의 최신 애플리케이션 프로세서(AP)에 인공지능(AI) 최적화 기술을 탑재해 온디바이스 생성형 AI 대중화에 박차를 가한다. 노타는 자사 AI 모델 최적화 기술을 삼성전자의 '엑시노스 2500'에 공급하는 계약을 체결했다고 26일 밝혔다. 이번 계약을 통해 노타는 삼성전자의 AI 모델 최적화 툴체인 '엑시노스 AI 스튜디오'에 핵심 기술을 제공하며 엑시노스 2500 AP에서 고도화된 생성형 AI 경험이 구현될 수 있도록 기술적 기반을 마련했다. 엑시노스 AI 스튜디오는 고객이 개발한 AI 모델을 엑시노스 프로세서에 최적화해 효율적으로 구동할 수 있도록 지원하는 툴체인이다. 여기에 노타의 기술이 접목되면서 모델 최적화 효율과 성능이 향상되는 것은 물론 클라우드 연결 없이도 스마트폰에서 한층 강화된 온디바이스 AI 경험이 가능해졌다. 삼성전자 모바일 AP S/W 개발팀 조철민 상무는 "엑시노스 AI 스튜디오에 노타의 AI 모델 최적화 기술이 적용되면서 온디바이스 AI 모델 개발 효율성이 전작 대비 향상됐다"며 "양사 간 기술 협업으로 좋은 성과를 낼 수 있어 기쁘다"고 밝혔다. 노타는 이번 삼성전자와의 협업으로 기술력에 더해 시장성과 사업성을 입증했다고 강조했다. 노타는 최근 코스닥 시장에 공식 상장했으며 확보한 자금을 북미·유럽·중동 등 주요 글로벌 시장에서의 사업 확장에 투입할 계획이다. 이를 통해 온디바이스 생성형 AI의 상용화를 선도하고 글로벌 AI 기술 리더로서의 입지를 공고히 한다는 방침이다. 채명수 노타 대표는 "삼성전자와의 협업은 우리의 AI 최적화 기술이 글로벌 소비자용 제품에 적용돼 상용화된 의미 있는 사례"라며 "AI 반도체와 소프트웨어의 유기적 결합을 통해 온디바이스에서 고성능 생성형 AI를 구현했다"고 말했다. 이어 "앞으로도 삼성전자 및 글로벌 파트너들과 함께 온디바이스 AI 생태계 확장을 주도해 나가겠다"고 덧붙였다.

2025.11.26 16:23한정호

손 안에 AI 담는다...삼성, 온디바이스 최적화 기술 혁신

"삼성리서치는 제품 중심 연구를 통해 자체 설계한 압축 알고리즘으로 사용자의 손 안에서 직접 체감되는 AI 경험 개선을 목표로 하고 있다. 또한 AI의 성능을 높이는 AI 실행기, AI의 설계도 역할을 하는 아키텍처도 활발히 개발 중이다." 21일 함명주 삼성리서치 AI센터 마스터는 삼성전자 공식 뉴스룸과의 인터뷰를 통해 온디바이스AI 구현을 위한 핵심 기술에 대해 이같이 말했다. 사용자 언어를 이해하고 자연스러운 답변을 만들어내는 생성형 AI의 중심에는 거대언어모델(LLM)이 있다. 온디바이스 AI의 첫 단계는 이 거대한 모델이 모바일 기기 안에서도 잘 작동할 수 있도록 작게, 효율적으로 만드는 일이다. 함명주 마스터는 “수십억 개의 연산을 수행하는 초고도 지능 모델을 모바일 기기나 노트북에서 그대로 구동한다면 배터리가 빠르게 소모되고, 기기 발열이 심해지거나 응답 속도가 느려져 사용자 경험이 크게 저하될 것”이라며 이를 해결하기 위해 등장한 것이 '모델 압축' 기술이라고 소개했다. 압축이 중요한 온디바이스AI…삼성, 자체 알고리즘 개발 거대언어모델은 본래 매우 복잡한 숫자로 연산을 수행한다. 모델 압축 기술은 이 숫자를 보다 효율적으로 표현하기 위해 단순한 정수 형태로 바꾸는데, 이 과정을 '양자화(Quantization)'라고 한다. 함 마스터는 “고해상도 사진을 압축해 용량은 줄였지만 육안으로는 화질 차이가 거의 없는 상태를 유지하는 것과 비슷하다”며 “예를 들어, 32비트 부동소수점 실수로 계산하던 것을 8비트나 4비트 정수로 단순화하면 메모리 용량과 연산량이 크게 줄어 응답 속도가 빨라진다”고 설명했다. 양자화 과정에서 숫자의 정밀도가 낮아지면, 모델의 정확도가 떨어질 수 있다. 삼성리서치는 속도와 정확성의 균형을 잡기 위해 압축 이후의 성능을 세밀하게 측정하고 보정하는 알고리즘과 개발 도구를 함께 설계하고 있다. 함 마스터는 “모델 압축의 핵심은 단순히 작게 만드는 것이 아니라, 작지만 정확하고 빠른 모델을 만드는 것”이라고 강조했다. 그는 “최적화 알고리즘을 통해 압축 과정에서 모델의 손실 함수를 세밀하게 분석하고, 원래 결과값과 거의 근접한 값이 나올 때까지 학습시키거나 오차가 큰 구간을 부드럽게 다듬는다”며 “모델의 가중치마다 중요도가 다르므로, 중요한 가중치는 정밀하게 유지하고 덜 중요한 부분은 과감하게 압축하는 방식으로 효율을 극대화하면서도 정확도를 유지할 수 있다”고 말했다. 삼성리서치는 모델 압축 기술을 연구 수준에서 구현하는 데 그치지 않고, AI 폰과 가전 등 실제 제품 환경에 맞춰 직접 개발하고 상용화한다. 함 마스터는 “기종마다 메모리 구조나 연산 성능이 모두 다르기 때문에, 일반적인 접근으로는 클라우드 기반 AI 수준의 성능을 내기 어렵다”며 “삼성리서치는 제품 중심 연구를 통해 자체 설계한 압축 알고리즘으로 사용자의 손 안에서 직접 체감되는 AI 경험 개선을 목표로 하고 있다”고 설명했다. AI 성능을 끌어올리는 숨은 엔진, AI 실행 소프트웨어 AI 모델을 아무리 잘 압축하더라도, 기기 안에서 어떻게 구동되는지에 따라 체감 성능은 크게 달라진다. 삼성리서치는 모델이 실제로 작동하는 단계에서 기기의 메모리와 연산 자원을 가장 효율적으로 활용할 수 있는 'AI 실행기'를 개발하고 있다. 함 마스터는 “AI 실행기는 모델의 '엔진 제어장치'와 같다”며 “모델이 CPU, GPU, NPU 등 서로 다른 연산 장치에서 동시에 작동할 때, 어떤 연산을 어느 칩에서 처리할지 자동으로 배분하고 메모리 접근을 최소화해 AI의 성능을 높인다”고 설명했다. AI 실행기는 동일한 기종의 기기 내에서 더 크고 정교한 모델도 같은 속도로 실행할 수 있게 해 준다. AI 서비스의 응답 지연 시간이 줄어들 뿐만 아니라, 더 높은 정확도와 자연스러운 대화, 정교한 이미지 처리 등 AI 품질 자체가 향상될 수 있다. 함 마스터는 “온디바이스 AI에서 가장 큰 병목은 메모리 대역폭과 저장장치 접근 속도”라며 “메모리와 연산 간의 균형을 지능적으로 조정하는 최적화 기술을 개발하고 있다”고 말했다. 예를 들어, 모든 데이터를 메모리에 올려두지 않고 필요한 시점에만 불러올 수 있도록 설계해 효율을 높이는 방식이다. 함 마스터는 “삼성리서치는 모델 크기가 16GB 이상인 300억 파라미터 규모의 생성형 모델도 3GB 이하의 메모리로 구동할 수 있는 수준의 기술력을 갖췄다”고 덧붙였다. “더 가볍고 똑똑한 AI 모델 설계” 새로운 아키텍처 연구 AI의 설계도 역할을 하는 아키텍처(Architecture) 연구도 활발하게 진행되고 있다. 함 마스터는 “온디바이스 환경에서는 연산 자원과 메모리가 제한적이기 때문에, 모델이 기기에서 원활하게 동작할 수 있도록 구조 자체를 재설계해야 한다”며 “삼성리서치의 아키텍처 연구는 하드웨어 효율을 극대화하는 모델 설계에 집중하고 있다”고 설명했다. 거대언어모델의 학습에는 막대한 시간과 비용이 투입되는데, 초기에 모델 구조를 잘못 설계하면 이 비용이 크게 늘어날 수 있다. 삼성리서치는 학습 과정에서의 자원 낭비를 최소화하기 위해 학습 이전 단계에서 하드웨어 효율을 미리 예측하고, 구조적으로 최적화된 아키텍처를 설계하고 있다. 함 마스터는 “온디바이스 AI 시대에서 핵심 경쟁력은 같은 자원으로 얼마나 높은 효율을 끌어낼 수 있느냐에 있다”며 “작은 칩 안에서 최대의 지능을 구현하는 것이 우리가 지향해야 할 기술적 방향성”이라고 말했다. 현재 대부분의 거대언어모델은 '트랜스포머(Transformer)' 아키텍처를 기반으로 한다. 트랜스포머 아키텍처는 문장 전체를 한 번에 확인하며 단어 간 관계를 계산하는 방식으로, 문맥 이해에는 뛰어나지만 문장이 길어질수록 계산량이 기하급수적으로 증가한다는 한계가 있다. 함 마스터는 “트랜스포머 아키텍처의 한계를 극복하기 위해 다양한 기술적 접근 방식을 검토하는 동시에, 실제 기기 환경에서 얼마나 효율적으로 작동할 수 있는지를 중심으로 평가하고 있다”며 “단순히 기존 방법을 개선하는 수준을 넘어 새로운 방법론을 도입한 '다음 단계의 아키텍처'를 만드는 데 집중하고 있다”고 강조했다.

2025.11.21 16:41장경윤

"스냅드래곤 오라이언 CPU, AI 최적화와 에너지 효율에 중점"

[샌디에이고(미국)=권봉석 기자] "스냅드래곤 X2 엘리트/엘리트 익스트림에 포함된 오라이언(Oryon) CPU는 통산 3세대 제품에 해당한다. 매우 뛰어난 CPU이며 향후 출시될 제품과 관련해 매우 흥미로운 로드맵이 준비돼 있다." 12일(이하 현지시간) 오후, 미국 캘리포니아 주 샌디에이고 소재 퀄컴 본사에서 국내 기자단과 마주한 프라딥 카나파티필라 퀄컴 엔지니어링 부사장 겸 CPU 아키텍트의 말이다. 프라딥 카나파티필라 부사장은 2000년 썬마이크로시스템을 시작으로 P.A 세미를 거쳐 2008년 애플에 합류해 2012년 A6 칩과 2020년 A14 바이오닉(2019, 아이폰12) 등 설계에 관여했다. 2019년 누비아에 합류 이후 2021년 퀄컴 피인수 시점부터 오라이언 CPU 설계를 전담했다. "성능 높아져도 전력 효율 역시 높일 수 있다" 프라딥 카나파티필라 부사장은 "CPU나 NPU 등 SoC의 성능이 향상된다 해서 반드시 전력 효율이 떨어지는 것은 아니다. 성능 대비 소비전력은 TOPS 증가와 관계없이 유지될 수 있다"고 설명했다. 이어 "특히 CPU 멀티스레드 성능은 코어 수와 각 코어의 싱글코어 성능에 따라 결정된다. 스냅드래곤 X2 내장 오라이언 CPU 역시 높은 성능과 에너지 효율을 동시에 달성할 수 있다"고 자신했다. "CPU 내장 가속기 '매트릭스 엔진', 지연시간 감소" 스냅드래곤 X2에 내장된 3세대 오라이언 CPU는 CPU 집합체인 클러스터(Cluster) 별로 하나씩 AI 연산에 주로 쓰이는 행렬 연산만 전용 처리하는 매트릭스 엔진을 포함했다. 프라딥 카나파티필라 부사장은 "CPU 안에서 각종 명령어와 함께 행렬 연산이 번갈아 실행되기 때문에 GPU나 NPU가 데이터를 오가며 생기는 지연을 피할 수 있다. 또 캐시 및 메모리 일관성, 전력 관리 등 CPU가 갖는 장점을 그대로 활용할 수 있다"고 강조했다" 이어 "매트릭스 엔진은 이미 공개된 Arm 명령어 기반으로 작동하도록 설계돼 소프트웨어 측에서도 호환성과 활용도가 높다. CPU, GPU, NPU 뿐만 아니라 매트릭스 엔진이 상호 보완적으로 작동하는 형태"라고 밝혔다. "각 세대마다 가장 합리적인 설계 적용할 것" 주요 PC 프로세서 제조사들은 CPU와 GPU, NPU 등을 서로 다른 공정에서 생산해 결합하는 칩렛 형식 설계로 전환하고 있다. 반면 퀄컴은 스냅드래곤 X2 엘리트 익스트림에 대만 TSMC 3나노급(N3X) 공정을 활용한 단일 다이 설계를 적용했다. 프라딥 카나파티필라 부사장은 "현재 시장에 나와 있는 모든 신기술은 검토 대상이며 필요에 따라 가장 적합한 형태를 선택한다. 각 세대마다 가장 합리적인 설계 방식을 적용할 것"이라고 말했다. 이어 "퀄컴은 SoC를 여러 제조사에 공급하고 윈도 운영체제를 공급하는 마이크로소프트 등 파트너와 호환성을 유지해야 한다. 스냅드래곤 X 시리즈에 별도의 명령어를 도입하는 일은 전체 소프트웨어 스택과 컴파일러를 다시 구축해야 하므로 현실적이지 않다"고 설명했다. 그는 이어 "향후 스냅드래곤 내 CPU는 클록 당 처리 명령어(IPC)와 최대 작동 주파수 향상, 에너지 효율 개선에 주안점을 두고 설계될 것이다. 또 매트릭스 엔진도 전력 대비 최대 TOPS 달성을 목표로 개발될 것"이라고 덧붙였다.

2025.11.20 09:10권봉석

"AI는 버블이 아닌 현실... 퀄컴, 미래 위한 성능 갖출 것"

[샌디에이고(미국)=권봉석 기자] "AI는 버블이 아니라 추론을 바탕으로 한 본격적인 활용 단계에 진입하고 있다. 퀄컴은 CPU·NPU·메모리 대역폭 전반에서 확실한 기술 리더십을 기반으로 PC 시장의 변화를 주도할 것이다." 11일(이하 현지시간) 오후, 미국 캘리포니아 주 샌디에이고 소재 퀄컴 본사에서 국내 기자단과 마주한 케다르 콘답 퀄컴 수석부사장 겸 컴퓨트·게이밍 본부장이 이렇게 강조했다. 케다르 콘답 수석부사장은 퀄컴 스냅드래곤 PC와 크롬북 생태계 확장, 휴대용 게이밍 기기 카테고리를 총괄하는 인사다. 퀄컴이 자체 개발한 Arm 호환 새 CPU 코어 '오라이언'(Oryon)을 탑재한 스냅드래곤 X 엘리트 플랫폼 개발과 상용화를 주도했다. 그는 이날 "앞으로 온디비아스 AI는 산업별 특화 모델 중심으로 확산될 것이며, 더 복잡하고 무거운 AI 모델에 대비할 수 있도록 강력한 성능을 가진 NPU와 메모리 여유폭(헤드룸)을 제공하는 것이 진정한 미래 대비 설계"라고 설명했다. "스냅드래곤 X2 시리즈 강점? 성능·배터리·AI" 케다르 콘답 수석부사장은 스냅드래곤 X2 시리즈의 강점으로 강력한 성능과 긴 배터리 지속시간, 80 TOPS 급 NPU를 이용한 AI 성능과 폼팩터 다양성을 꼽았다. 그는 "퀄컴은 지난 해 출시한 스냅드래곤 X 엘리트/플러스 등 3개 제품 모두에서 45 TOPS급 NPU와 동일한 DDR 메모리 대역폭을 적용해 모든 가격대에서 비슷한 품질의 사용자 경험을 제공했다"고 밝혔다. 이어 "향후 더 무거운 AI 모델과 산업별 특화 응용프로그램까지 원활하게 수행할 수 있도록 NPU 성능과 메모리 대역폭을 충분히 확보했다. 이는 미래 대비 전략의 일환으로, 수년 후 AI 기술 발전 속도까지 감안한 설계라는 의미다. "AI, 실제 생활에 변화... 퀄컴도 AI 적극 활용" 케다르 콘답 본부장은 AI가 실제 업무와 생활을 어떻게 바꾸고 있는지 다양한 사례도 소개했다. "법률 분야에선 스폿드래프트(SpotDraft) 애플리케이션이 퀄컴 NPU 최적화로 변호사의 요약·의견 생성 업무를 가속하고 있으며, 개인 창작 영역에서는 텍스트를 기반으로 한 동영상 생성이 이미 실용 단계에 진입했다." 그는 "퀄컴 내부에서도 전사적으로 회의 노트 요약, 코드 작성, 고객 이슈 분석 등 모든 조직이 AI를 적극 활용하고 있다"며, AI가 업무 효율과 생산성 향상에 이어지고 있다고 밝혔다. AI 변화 대응 위해 협업·성능 강화 중시 케다르 콘답 수석부사장은 "AI는 현재 전례 없는 속도로 변화하고 있으며 이를 위해 애니싱LLM, 넥사 등 툴·프레임워크 업체와의 협업, 모델 종속성을 줄이는 오케스트레이션 레이어 구축, 더 무거운 모델을 위한 충분한 성능 확보에 중점을 뒀다"고 말했다. 이어 "현재 PC 플랫폼에서 80 TOPS 수준의 NPU를 제공하는 곳은 퀄컴뿐이며 향후 등장할 차세대 AI 워크로드도 기존 하드웨어에서 안정적으로 구동될 수 있다. 이것이 바로 '미래 대비' 전략"이라고 부연했다. 기기 원격 관리 '스냅드래곤 가디언', 완전한 통제권 제공 퀄컴은 스냅드래곤 X2 플랫폼에 기기 원격 제어와 위치 기반 정보를 바탕으로 응용프로그램 실행 여부를 제어하는 '스냅드래곤 가디언' 기능을 추가했다. 케다르 콘답 수석부사장은 "스냅드래곤 가디언은 기업 내 IT 관리자와 일반 소비자 대상으로 자녀 보호를 위한 지오펜싱, 기기 위치 확인, 분실 추적 같은 관리 기능을 지원한다"고 설명했다. 이어 "기업 환경에서는 악성 행위 탐지 시 원격 조치가 가능하며, 전원이 다시 연결되면 즉시 관리자가 원하는 명령을 수행할 수 있다. 다만 이 과정에서 소비자와 기업 모두에게 기기 관리에 대한 완전한 통제권을 제공하는 것이 퀄컴 목표"라고 설명했다. "AI 보편화 곧 온다... 이를 위한 '미래 대비' 설계 적용" 케다르 콘답 수석부사장은 "아직 많은 사람들이 실감하지 못하고 있지만 AI는 아이부터 어른까지 모든 소비자의 일상 속으로 스며들 것"이라고 내다봤다. 이어 "아주 가까운 시점에 AI는 우리가 매일 사용하는 모든 기기 위에서 자연스럽게 동작하며 삶을 크게 향상시킬 것이다. 그리고 이러한 환경을 가능하게 한 것이 바로 NPU, 메모리, CPU 등 하드웨어 설계 단계에서부터 고려한 '미래 대비' 전략"이라고 강조했다.

2025.11.20 09:00권봉석

노타, 온디바이스 기술력 글로벌서 입증…'매드 랜드스케이프' 2년 연속 선정

노타가 글로벌 인공지능(AI) 생태계를 대표하는 주요 벤치마크에 이름을 올리며 기술 경쟁력을 입증했다. 노타는 글로벌 AI 산업의 핵심 지표로 평가되는 '2025 매드(머신러닝·AI·데이터) 랜드스케이프'에서에서 엣지 AI 부문에 2년 연속 선정됐다고 13일 밝혔다. 이는 올해 4월 CB 인사이트가 발표한 '2025 글로벌 혁신 AI 스타트업 100'에 이어 거둔 성과다. 매드 랜드스케이프는 글로벌 VC·테크 업계가 AI·데이터 산업의 구조적 변화를 파악하는 데 활용하는 대표 자료다. 올해 발표에서는 AI가 클라우드 중심에서 디바이스·하드웨어 중심으로 재편되는 흐름이 더욱 뚜렷해졌다는 점이 주목된다. 특히 엣지 AI는 이러한 변화의 중심에 있으며 고성능 모델의 디바이스 탑재 수요 증가에 따라 글로벌 AI 경쟁력의 핵심 지표로 부상한 분야다. 전 세계 1천150여 개 기업이 포함된 이번 매드 랜드스케이프에서 한국 기업은 삼성을 포함해 단 세 곳이며 노타는 엔비디아·퀄컴·애플·인텔·AMD 등 칩셋·디바이스 생태계를 구축한 글로벌 테크 리더들과 함께 엣지 AI 부문에 선정됐다. 이를 통해 노타는 온디바이스 AI 분야에서 기술적 존재감과 글로벌 경쟁력을 빠르게 확대하고 있음을 입증했다. 노타가 독자 개발한 AI 모델 최적화 플랫폼 '넷츠프레소'는 AI 반도체부터 IoT 디바이스까지 다양한 하드웨어에서 모델을 효율적으로 압축·최적화·배포할 수 있는 기술 플랫폼이다. 모델 크기를 최대 90% 이상 줄이면서도 정확도를 유지해 개발·운영 비용을 대폭 절감하며 다양한 산업의 AI 도입 속도를 크게 높이고 있다. 노타는 삼성전자·퀄컴·르네사스·소니 등 글로벌 반도체 기업과 협력을 통해 엣지 인텔리전스 산업 전반에서 입지를 확대하고 있다. 최근에는 저사양 디바이스에서도 대규모언어모델(LLM)을 구동할 수 있는 최적화 기술을 선보여 제조·가전·IoT 등 디바이스 중심 산업으로 온디바이스 AI 적용 범위를 확장 중이다. 또 정부의 독자 AI 파운데이션 모델 개발 프로젝트에 정예팀으로 참여하며 국가적 차원에서도 기술력을 인정받고 있다. 채명수 노타 대표는 "CB 인사이트 AI 100에 이어 매드 랜드스케이프 엣지 AI 부문에도 연달아 선정된 것은 우리의 기술 혁신성이 글로벌에서 인정받은 중요한 성과"라며 "앞으로도 독보적인 AI 경량화·최적화 기술을 기반으로 제조·모빌리티·로봇·가전 등 산업 전반의 적용 범위를 넓히고 글로벌 시장에서 새로운 성장 기회를 주도하겠다"고 말했다.

2025.11.13 16:55한정호

"中, 이미 시스템 반도체 설계에서 韓 추월"

“온디바이스 AI 반도체는 세트 업체가 주도해야 합니다.” 김용석 가천대학교 반도체교육원장은 6일 가천컨벤션센터에서 열린 'AIoT용 핵심 시스템반도체 기술 워크숍'에서 이같이 밝혔다. 한국 기업들이 AI 전환기에 세계 경쟁력을 유지하기 위해서는 더 적극적인 투자가 필요하다는 의견이다. 김 교수는 “제품을 직접 만드는 기업이 미래에 필요한 칩의 사양을 스스로 예측하고 설계할 수 있어야 한다”며 “빠르게 칩을 만들고 제품에 채용하는 시장 진입 속도가 곧 성패를 좌우한다”고 강조했다. 세트업체가 온디바이스 AI 반도체 리더십을 가져야 하는 이유로는 '시장 요구와 사용 환경'이라고 봤다. 그는 “제품을 직접 만드는 기업만이 미래 시장의 요구와 사용 환경을 가장 잘 알고 있다”며“이들이 스스로 필요한 칩의 성능과 사양을 예측하고, 2년·5년·10년 후를 내다보며 팹리스와 협업해 설계해야 한다”고 말했다. 이는 단순히 칩을 구매하는 하청 구조가 아닌, 세트기업이 기술 방향성을 주도하고 반도체 산업 생태계를 설계해야 한다는 의미다. 김 원장은 “외부 칩을 사다 쓰는 방식으로는 2등, 3등에 머물 수밖에 없다. 회사를 1등으로 만들려면 반드시 스스로 칩을 만들어야 한다”며 칩 내재화의 필요성을 분명히 했다. 이어 “제품 차별화를 이루려면 반도체부터 직접 설계해야 한다”며 “하드웨어 설계는 물론, 시스템 소프트웨어까지 통합해 완성도 있는 온디바이스 AI 플랫폼을 갖추는 것이 중요하다”고 덧붙였다. 중국, 이미 시스템 반도체 설계에서 한국 추월 김 원장은 한국이 직면한 가장 큰 위협으로 중국의 시스템 반도체 설계 능력을 지목했다. 이날 발표에 따르면 중국 반도체 산업은 2000년대 초부터 본격화돼 20여 년만에 비약적인 성장을 이뤘다. 팹리스 숫자만 해도 중국이 지난 2019년 1천780개에서 2024년 3천626개로 2배가 넘게 늘었지만, 국내 팹리스의 숫자는 현재 150여개에 불과하다. 이마저도 지속적으로 감소하는 추세다. 그는 설계-제조-소프트웨어를 완결하는 생태계가 오늘날 중국을 반도체 설계 리더로 올려놨다고 전했다. 김 원장은 “(중국이) 스마트폰, 자동차, PC까지 확장 가능한 자립형 구조를 이미 만들어냈다”며 “중국은 반도체 산업의 '패스트 팔로어'가 아니라 이미 설계 주도국으로 전환했다”고 말했다. 그러면서 “한국이 이 같은 통합 구조를 갖추지 못하면 AI 산업의 핵심 경쟁력을 잃게 된다”고 경고했다. 아울러 “시스템 수요기업–팹리스–파운드리의 삼각 협력 구조가 구축되어야 한다. 이 연계가 완성돼야 시장을 선점할 수 있다”고 제언했다.

2025.11.06 11:54전화평

모빌린트, LG사이언스파크와 NPU 기반 AI 기술 검증 완료

AI 반도체 전문 스타트업 모빌린트가 LG사이언스파크와 함께 자사 NPU(신경망처리장치) 기반 엣지 AI 기술의 적용 가능성을 검증하는 기술 검증(PoC) 프로젝트를 최근 완료했다고 6일 밝혔다. 모빌린트는 고성능 AI 반도체 설계 역량과 최적화 기술을 갖춘 AI 반도체 전문 기업으로, 그 혁신성을 인정받아 LG의 스타트업 육성 프로그램에 선정됐다. 이번 프로젝트는 LG와 스타트업이 함께 혁신 가설을 검증하는 육성 활동인 '슈퍼스타트 PoC'의 일환으로 진행됐다. 모빌린트 NPU가 다양한 AI 모델을 안정적으로 구동할 수 있는지를 검증하는 것이 핵심 목표였다. 이번 PoC는 LG 내 현업 부서와의 협업을 통해 언어, 비전, 음성 등 다양한 유형의 AI 모델을 실제 NPU 환경에서 테스트하는 형태로 진행됐다. 오픈소스 모델부터 LG의 초거대 AI 모델 '엑사원(EXAONE)'까지 폭넓은 AI 모델을 대상으로 검증이 이뤄졌으며 그 결과 모빌린트 NPU가 엣지 AI와 온디바이스 AI 영역에서 상용화 수준의 성능과 효율성이 검증됐다. 모빌린트 윤상현 CSO(최고전략책임자)는 “이번 PoC를 통해 기술의 범용성과 안정성을 입증할 수 있었다“며 “결과를 기반으로 가전, 로보틱스, 산업 자동화, 스마트시티 등 엣지 AI가 요구되는 다양한 산업 분야에서 실시간 AI 추론을 지원할 수 있는 기술 역량을 지속적으로 확장해 나갈 계획”이라고 전했다. LG사이언스파크 슈퍼스타트팀 관계자는 “모빌린트는 이번 PoC를 통해 기술력과 실행 역량을 입증했다. 특히 NPU의 전성비와 SDK지원역량 측면에서 특장점을 확인할 수 있었다”며, “엣지 AI 및 온디바이스 AI 분야에서의 향후 성장 가능성이 기대된다”고 말했다.

2025.11.06 11:48전화평

정신아 카카오 "스스로 사고하고 제안하는 AI 시대 왔다"

정신아 카카오 대표가 인공지능(AI)이 단순히 명령을 수행하는 도구를 넘어, 스스로 사고하고 제안하는 'Agentic(에이전틱) AI' 시대가 왔다고 강조했다. 정신아 대표는 3일 서울 코엑스에서 열린 'SK AI 서밋 2025'에서 '에이전틱 AI, 가능성에서 현실로' 주제로 키노트를 진행했다. 정 대표는 온디바이스 기술과 자체 모델 '카나나'를 기반으로 일상 속에서 자연스럽게 작동하는 프로액티브 에이전트를 구현해 나가고 있다고 소개했다. 정 대표는 기존의 'AI 에이전트'가 사용자의 명령을 수행하는 단일 기능형 인공지능이라면, '에이전틱 AI'는 스스로 목표를 설정하고 계획을 세워 학습하고 성장하는 자율형 AI라고 설명했다. 정 대표는 “생각하고 기억하고 행동하고 성장하는 AI, 이것이 바로 우리가 말하는 에이전틱 AI”라며 “사용자의 맥락을 이해하고 여러 에이전트를 조합해 스스로 계획하고 실행하는 것이 핵심”이라고 말했다. 예를 들어 주말 계획을 짤 때에도 AI가 사용자의 일정, 대화 이력, 날씨 등을 종합해 실내활동이나 공연·맛집을 제안하는 방식이다. 정 대표는 “사용자의 맥락을 이해하고 먼저 제안하는 능동적 AI 경험이 바로 결정 피로를 줄이는 미래형 서비스의 핵심”이라며 “에이전틱 AI는 이용자가 덜 고민하면서도 더 나은 선택을 할 수 있도록 돕는 기술”이라고 했다. 정 대표는 카카오다운 에이전트 AI의 세 가지 축으로 ▲Proactive(능동성) ▲Planning(계획) ▲Action(실행)을 꼽았다. 이런 구조를 뒷받침하는 핵심 기술은 온디바이스 AI다. 정 대표는 “카카오는 대화라는 가장 풍부한 맥락을 보유하고 있다. 이를 스마트폰 안에서 처리해 프라이버시를 보호하면서도 즉각적인 반응이 가능하도록 했다”며 "'카나나 나노 1.3B' 모델을 통해 이러한 온디바이스 AI를 구현하고 있으며, 서버 전송 없이 기기 내에서 사용자 맥락을 이해해 필요한 행동을 수행한다"고 말했다. 정 대표는 이른바 '리얼월드' 환경에서 에이전트가 다양한 상황을 반영해 작동할 수 있도록 모델의 품질을 정확하게 판단할 수 있는 전용 벤치마크 세트를 새롭게 제작했다고도 밝혔다. 여행·금융·쇼핑 등 17개 영역, 99개 가상 툴을 포함해 AI가 단순한 지시 수행을 넘어 실제 문제 해결력을 갖추도록 훈련시키고 있다는 설명이다. 정 대표는 “기존 상용 모델들은 점수는 높지만 현실 문제 해결엔 한계가 있다”면서 “카카오의 벤치마크는 실제 서비스 확장을 전제로 설계됐다”고 강조했다. 마지막으로 정 대표는 “카카오는 사람 중심의 AI를 지향하며, 연결과 신뢰를 기반으로 한 지속 가능한 기술 생태계를 만들어 나가겠다”고 덧붙였다

2025.11.03 17:41안희정

"K-온디바이스 AI, 지금이 '골든 타임'…칩·SW 동시에 키워야"

"온디바이스 AI 산업은 지금이 '골든 타임'으로, 한국에서도 5년 내에 글로벌 경쟁력을 갖춘 AI 반도체와 소프트웨를 상용화할 수 있는 기업들을 키워내야 한다. 이를 위해 정부에서도 수요기업·팹리스·파운드리 간 연계를 통해 온디바이스 AI 반도체 생태계를 구축하기 위한 과제를 추진 중이다." 김용석 가천대학 반도체대학 석좌교수 겸 AI반도체 M.AX 얼라이언스 위원장은 최근 지디넷코리아와의 인터뷰에서 국내 온디바이스 AI의 발전 방향 및 전략에 대해 이같이 밝혔다. 김 교수는 지난 1983년 삼성전자 종합연구소에 입사해 약 30년간 엔지니어로 근무한 시스템반도체 전문가다. TV·오디오·통신기기용 ASIC(주문형반도체)를 개발했으며, 초기 갤럭시 스마트폰의 소프트웨어 개발 등을 담당한 바 있다. 김 교수가 지목한 국내 반도체 산업의 차세대 성장동력은 온디바이스 AI다. 온디바이스 AI는 서버 및 클라우드를 거치지 않고 기기 자체에서 AI 기능을 구현하는 기술이다. 글로벌 시장조사에 따르면, 글로벌 온디바이스 AI 반도체 시장은 지난해 기준 173억달러 수준이다. AX가 확산되면서 2030년께엔 1천33억까지 시장이 커질 것으로 분석된다. 김 교수는 "온디바이스 AI 산업은 이제 막 시작한 단계로, 스마트폰·가전·자동차·로봇 등 거의 모든 산업에 걸쳐 확산될 잠재력을 지니고 있다"며 "지금이 바로 골든 타임으로, 앞으로 5년 기간이 매우 중요한 시기라고 본다"고 강조했다. 이에 김 교수는 산업통상자원부가 추진 중인 'K-온디바이스 AI 반도체 기술개발' 사업 총괄위원장을 맡아 국내 생태계 조성에 힘쓰고 있다. 또한 지난달 산업부가 출범시킨 'M.AX 얼라이언스' 내 AI반도체 분야 위원장직에도 올랐다. M.AX 얼라이언스는 제조 AI의 본격적인 실행을 위해 지난달 산업부에서 출범한 초대형 협의체다. AI 반도체를 비롯해 총 10개의 분야로 나뉘며, 삼성전자·LG전자·현대차 등 주요 기업과 연구 기관 등 총 1천여곳이 참여했다. AI 반도체 얼라이언스의 경우, 4대 분야(자동차, IoT·가전, 기계·로봇, 방산)를 목표로 2026년부터 과제에 착수해 오는 2028년 국산 AI 반도체 시제품을 내놓는 것이 목표다. 나아가 오는 2030년까지는 AI 반도체 10종의 개발을 완료할 계획이다. 김 교수는 "오랜 기간 준비해 왔던 K-온디바이스 AI 과제가 AI 반도체 얼라이언스의 중심 역할을 하게 될 것"이라며 "또한 M.AX 얼라이언스 내 주행차·AI가전·휴머노이드·AI방산 등 타 분야와의 연계 및 협업을 강화해야 할 것"이라고 말했다. K-온디바이스 AI 반도체 돌파구는 '맞춤형 칩' 온디바이스 AI 반도체는 스마트폰·자동차·로봇 등 개별 기기 내부에서 작동해야 하기 때문에 전력과 발열, 용량 등 전반에서 제약이 크다. 이 경우 외부의 범용 칩으로는 최적의 성과를 내기 어렵고, 가격 역시 비싸다는 단점이 있다. 이에 김 교수는 각 제품의 특성을 고려한 맞춤형 칩이 온디바이스 AI 산업에 필수적이라고 보고 있다. 그는 "스마트폰은 발열, 자동차는 안정성, IoT는 초저전력 등 제품별로 요구조건이 달라 맞춤형으로 SoC(시스템온칩) 설계가 이뤄져야 한다"고 말했다. 실제로 K-온디바이스 AI 반도체 과제는 국내 대형 시스템 기업(LG전자, 현대차, 두산로보틱스 등)-팹리스-파운드리(삼성)로 이어지는 생태계 만들고, 밀접한 협업구도의 얼라이언스를 통해 개발을 진행하고 있다. 칩도 중요하지만…시스템 소프트웨어 개발에 더 비중 둬야 온디바이스 AI는 전력 효율과 성능 최적화가 무엇보다 중요하다. 김 교수는 이러한 조건을 만족시키기 위해서는 칩 설계 상위 단계에서의 '아키텍처' 설계가 필요하다고 내다봤다. AI 모델을 칩 구조에 맞게 변환하고 최적화하는 컴파일러, 런타임 소프트웨어 등이 사실상 칩의 성능을 결정짓는 요소로 작용하기 때문이다. 김 교수는 "칩 외에 소프트웨어와 SDK(소프트웨어개발키트), AI모델 및 프레임워크 등이 모두 유기적으로 개발돼야 한다"며 "칩에서 구동되는 AI 모델이 효율적으로 경량화되고, 그 모델을 쉽게 구현할 수 있는 개발 프레임워크와 SDK가 갖춰져야 온디바이스 AI를 제대로 구현할 수 있을 것"이라고 설명했다. 결과적으로 온디바이스 AI 개발에는 칩 설계자와 ML 엔지니어간의 밀접한 협력이 요구될 것으로 관측된다. 김 교수는 "온디바이스 AI 전체 개발 비중을 100으로 놓자면, 칩은 40 정도가 될 것"이라며 "AI 모델과 컴파일러, SDK, 시스템 소프트웨어 등 통합 소프트웨어 개발은 60 정도로 비중이 더 커야 한다"고 덧붙였다. 온디바이스 AI, 앞으로 5년이 중요…中 넘어서야 김 교수는 향후 5년이 온디바이스 AI 개발에 있어 가장 중요한 시기가 될 것으로 전망했다. 이에 맞춰 ▲공급사들은 글로벌 경쟁력과 호환성을 갖춘 AI 반도체 및 소프트웨어를 개발하고 ▲수요 기업은 3~5년을 내다볼 수 있는 칩 기획능력을 갖춰야 함을 강조했다. 또한 ▲대학은 AI 인재 육성 ▲정부는 AI 팹리스와 파운데이션 AI 모델 기업, 소프트웨어 기업 육성 및 개발 생태계 조성에 앞장서야 한다고 내다 봤다. 김 교수는 "M.AX 얼라이언스를 구호에 그치지 않게 만들고, 온디바이스 AI 반도체를 중심으로 한 협력 생태계를 실질적으로 작동시키는 게 중요하다"며 "계획은 구체적이어야 하고, 온 힘을 다해서 실천해야 한다"고 말했다. 국내 팹리스 기업들이 넘어서야 할 목표로는 중국 호라이즌 로보틱스를 제시했다. 지난 2015년 설립된 호라이즌 로보틱스는 첨단운전자보조시스템(ADAS)과 자율주행용 칩을 개발하고 있다. BYD를 비롯해 리오토·니오·체리자동차·지리자동차 등 중국 10대 완성차 기업에 솔루션을 공급하고 있으며, 중국 시장에 진출한 티어(Tier)-1 공급사와도 협력 중이다. 호라이즌 로보틱스는 단순히 NPU(신경망처리장치)를 만드는 데 그치지 않고, 자체 SDK와 AI 프레임워크를 고객사에 함께 제공한다는 점에서 차별화를 이뤄냈다. 현지 완성차 기업과 공동 개발을 통해 실제 차량 환경에서 칩의 성능을 검증하는 등 고객사에 최적화된 제품을 개발한다는 점도 성공 요인 중 하나다. 김 교수는 "이번 K-온디바이스 AI 과제도 호라이즌 로보틱스의 사례처럼 팹리스와 시스템 기업과 함께 성장하는 파트너형 구조를 만드는 데 중점을 두고자 한다"며 "호라이즌 로보틱스는 국내 팹리스가 넘어야할 기업으로서, 한국에서 최고의 자동차용 전문 팹리스가 탄생돼야 한다"고 설명했다. K-온디바이스 생태계 조성에 1조원 투입…삼성 파운드리 적극 고려 정부는 이번 K-온디바이스 AI 반도체 개발에 총 9천973억원의 사업비를 조성했다. 국비 6천891억5천만원, 시스템 수요 기업들의 3천81억5천만으로 구성됐다. 김 교수는 "4대 분야별 수요 기업들이 적합한 팹리스와 소프트웨어 기업을 선정하는 일을 진행할 예정으로, 파운드리는 삼성전자를 적극 고려중"이라며 "삼성전자는 팹리스와 업무협약을 체결해 시제품 제작 비용 일부를 분담하고, 양산 일정도 우선 배정할 계획"이라고 설명했다. 이에 따른 본격적인 과제 착수 시기는 내년 초로 예상된다. M.AX 얼라이언스 위원회에서는 개발 진도 지원 및 성과 모너티렁을 위한 자문단을 구성할 계획이다. 김 교수는 "K-온디바이스 AI 반도체 사업을 통해 반도체 설계부터 소프트웨어를 통합적으로 개발할 수 있는 역량과 생태계를 확보하게 되고, 국산 칩에 최적화된 AI 플랫폼을 자체적으로 구현할 수 있는 토대를 마련하게 될 것"이라며 "실용적이고 알찬 최고의 정부 과제로서, 앞으로도 이러한 형태의 정부과제가 많이 나오길 기대한다"고 밝혔다.

2025.10.13 14:07장경윤

산업부, K-온디바이스 AI반도체 생태계 구축 위한 포럼 개최

산업통상자원부(이하 산업부)는 성남 글로벌 융합센터에서 반도체 수요·공급 기업들과 함께 'K-온디바이스 AI반도체 기술개발 사업'의 성공적 추진을 위한 포럼을 개최했다고 30일 밝혔다. 이번 포럼은 2030년 제조 AX 최강국 도약을 위해 출범한 AI반도체 M.AX 얼라이언스(이하 얼라이언스)의 첫 걸음이라는 점에서 의미가 깊다. 행사장에는 자동차, IoT·가전, 기계·로봇, 방산 등 4대 업종 반도체 수요기업과 국내 AI반도체 팹리스(설계기업)·파운드리(제조기업), 글로벌 IP 기업(반도체 설계블록 제공기업) 등 150여명의 AI반도체 업계 관계자가 참석했다. 포럼에서는 딥엑스·모빌린트·퓨리오사AI 등 AI반도체 팹리스들의 기술시연과 산업부 주관 프로젝트 추진계획 발표, 프로젝트 성공을 위한 산업부·수요·팹리스·파운드리·IP 기업간 MOU 체결, 수요기업·Arm·삼성 파운드리의 국내 AI반도체 생태계 기여방안 논의 등이 차례로 진행됐다. 업종별 수요기업과 반도체 분야 IP 기업·팹리스·파운드리가 함께 참여하는 얼라이언스에서는 프로젝트를 기반으로 상호간 연계(LINK)를 강화할 계획이다. 수요기업은 데이터 공유, 현장실증 지원 등을 통해 사업 성과가 단순한 AI반도체 개발에서 나아가, 첨단제품 탑재·양산에 이를 수 있도록 지원하고, 글로벌 IP 기업과 국내 파운드리는 프로젝트 참여 컨소시엄이 시제품을 적기에 합리적인 단가로 양산할 수 있게 지원한다. 산업부는 얼라이언스 내 AI 팹리스들은 도약을, 파운드리는 고객 확보를, 수요기업들은 조속한 AI 대전환을 할 수 있도록 동반성장 방안을 지속 모색할 예정이다. 특히 AI반도체 분야는 다른 업종과의 협력이 중요한 만큼, 프로젝트의 성과들이 전 업종으로 활용·확산될 수 있도록 자율주행차·AI가전·휴머노이드·AI방산 등 업종별 M.AX 얼라이언스와의 연계도 강화해 나갈 계획이다. 김정관 산업부 장관은 “AI반도체는 자율차, 휴머노이드 등 첨단제품의 AI 대전환을 구현하는 혁신엔진이므로 제조 AX의 중요한 축”이라며 “정부는 K-온디바이스 AI반도체 기술개발 사업을 내년부터 신속히 착수해 하드웨어 분야의 경쟁력 달성을 반드시 이끌어 낼 것”이라고 밝혔다.

2025.09.30 17:39장경윤

퀄컴·삼성, '갤럭시 AI'서 한뜻…"개인 맞춤형 AI 강화"

"퀄컴은 다양한 기기에서 개인 맞춤형 AI 경험을 제공하는 방향을 강조했고, 삼성전자도 같은 방향성을 갖고 있다. 차세대 갤럭시 AI는 이를 목표로 공동 개발하고 있다" 비네쉬 수쿠마 퀄컴 부사장 겸 AI 제품 총괄은 지난 25일(현지시간) 미국 하와이에서 열린 '스냅드래곤 서밋'에서 한국 기자들과 만나 이같이 밝혔다. 이날 수쿠마 부사장은 퀄컴이 목표로 하고 있는 다양한 AI 전략을 소개했다. 올해 기조연설에서부터 'AI Everywhere(모든 곳에 AI)'를 내건 것처럼, 퀄컴은 차세대 모바일 및 PC SoC(시스템온칩)를 통해 엣지(Edge) AI 시장을 적극 공략하겠다는 의지를 내비쳤다. 특히 퀄컴은 분산형 '온디바이스 AI'에 주목하고 있다. 온디바이스 AI란 중앙형 클라우드에 의존하지 않고 기기 자체에서 AI 기능을 처리하는 기술을 뜻한다. 나아가 퀄컴은 온디바이스 AI가 단일 기기가 아닌, 다양한 기기에서 공유되는 분산 형태로 나아갈 것으로 보고 있다. 수쿠마 부사장은 "만약 사용자의 PC 및 스마트폰이 서로 데이터를 공유하고 개인화할 수 있다면, 스마트폰이 방전돼 꺼져도 노트북을 켜자마자 작업을 계속 할 수 있을 것"이라며 "기기 간 맥락 정보의 공유가 온디바이스 AI 추론을 강화하는 것"이라고 말했다. '엠비언트 AI'도 주요 화두 중 하나다. 앰비언트 AI는 사용자가 인지하지 못하는 다양한 환경까지 파악해, 실시간으로 맞춤형 경험을 제공할 수 있는 AI를 뜻한다. 퀄컴의 주요 고객사이자 파트너인 삼성전자 역시 올해 서밋에서 '갤럭시 AI'가 나아갈 방향으로 해당 기술을 강조한 바 있다. 수쿠마 부사장은 "퀄컴은 스마트폰과 PC, 웨어러블, 스마트글라스 등 여러 기기에서 사용자의 정보를 안전하게 저장 및 개별 맞춤화하는 방향을 강조했고, 삼성도 같은 방향성을 갖고 있다"며 "차세대 갤럭시 AI는 더 개인화되는 것을 목표로 공동 개발을 추진 중"이라고 말했다. 이를 위해 퀄컴은 'AI 허브' 플랫폼을 지속 고도화하고 있다. 퀄컴 AI 허브는 온디바이스 AI를 구현하는 데 필요한 각종 리소스 및 소프트웨어 툴을 제공하는 라이브러리다. 수쿠마 부사장은 "AI 허브의 성과는 상당히 눈에 띄는 수준으로, 점점 더 많은 개발자들이 AI 허브에서 제공하는 자산을 활용하고 있다"며 "퀄컴의 목표는 AI 허브에서 개발된 모든 애플리케이션을 안드로이드 및 삼성 스토어에 업스트림하는 것으로, 아직 진행 중인 작업이지만 현재까지 생태계 및 파트너들로부터 매우 긍정적인 반응을 얻고 있다"고 강조했다. 한편 퀄컴은 지난 4월 베트남 빈AI의 생성형 AI 사업부인 '모비안AI'를 인수하는 등, AI 기술 강화를 위한 인수합병도 적극적으로 추진 중이다. 수쿠마 부사장은 "이미 일부 인수가 공개됐고, AI 인재에 대한 수요가 커 추가 인수도 계속 검토 중"이라고 밝혔다.

2025.09.28 09:15장경윤

퀄컴·휴메인, '에이전틱 AI' 혁신 위해 손잡았다

[하와이(미국)=장경윤 기자] 퀄컴과 휴메인(Humain)이 기업(엔터프라이즈)용 AI의 시장의 판도를 바꾸기 위해 손을 잡았다. 휴메인의 소프트웨어와 퀄컴의 하드웨어 기술을 결합해 효율적이면서도 통합적인 '에이전틱 AI'를 구현하는 것이 핵심이다. 특히 양사의 협업은 '하이브리드 AI'를 중심으로 전개될 전망이다. 크리스티아노 아몬 퀄컴 최고경영자(CEO)는 25일(한국시간 26일) 미국 하와이에서 열린 '스냅드래곤 서밋 2025' 행사에서 타레크 아민 휴메인 CEO와의 대담을 진행했다. 이날 휴메인은 에이전틱 AI 기능을 지원하는 차세대 AI PC '호라이즌 프로(Horizon Pro)를 발표했다. 에이전틱 AI는 사용자의 최소한의 개입만으로도 AI가 목표 설정부터 계획 수립, 작업, 결과 학습 등 전 과정을 스스로 수행하는 기술을 뜻한다. 휴메인은 에이전틱 AI를 구현할 핵심 운영체제인 '휴메인 원(One)'을 자체 개발했다. 휴메인 원은 사용자의 니즈를 예측하고 의사결정을 도와주는 적응형 인터페이스를 통해 엔터프라이즈 운영 전반을 돕는다. 특히 법무, 재무, 조달 등 기존 개별적으로 운영돼 온 솔루션을 하나로 통합한 것이 특징이다. 타레크 아민 휴메인 CEO는 "예를 들어 과거에는 급여 지급을 위해 ERP 시스템과 엑셀, 은행 포털, 급여 지급, 사후 감사 등의 복잡한 과정을 거쳤다"며 "반면 휴메인 원에서는 급여 이체만 명령하면 전 과정이 자동으로 처리된다. 예전에는 11명이 필요했던 HR 부서를 한명과 AI 비서만으로 운영할 수 있다"고 설명했다. 해당 기능이 온디바이스 AI에서 구현된다는 것도 장점이다. 온디바이스 AI는 기기 스스로 AI 기능을 수행하는 기술로, 클라우드를 거치지 않기 때문에 개인정보 보안에 유리하다. 데이터 처리의 효율성 및 속도도 향상된다. 호라이즌 프로는 퀄컴의 고성능 PC 프로세서인 '스냅드래곤 X 엘리트' 시리즈를 기반으로 한다. 특히 초고성능을 지원하는 울트라 모델의 경우, 퀄컴이 올해 서밋에서 공개한 최신형 칩인 '스냅드래곤 X2 엘리트'를 채용했다. 타레크 아민 휴메인 CEO는 "퀄컴은 우리의 아이디어를 받아줄 수 있는 몇 안되는 회사 중 하나로, 호라이즌 프로 역시 퀄컴 엔지니어들과 9개월간 공동 개발해 왔다"며 "퀄컴의 스냅드래곤 X2 엘리트를 특히나 더 좋아한다"고 강조했다. 양사 주요 임원진은 하이브리드 AI의 중요성에 대해서도 뜻을 같이했다. 특정 업무의 경우 클라우드 기반의 방대한 데이터 처리가 필요하기 때문에, 클라우드와 온디바이스를 오가는 하이브리드 AI 운용이 필요하다. 크리스티아노 아몬 퀄컴 CEO는 "기기에서 300억~400억 파라미터 모델을 실현할 수 있다면 대부분의 엔터프라이즈 운영은 기기만으로 해결이 가능하고, 부족한 부분만 클라우드로 보완하면 된다"며 "이것이 업계가 필요로 하는 조화고, 퀄컴과 휴메인이 함께 선도해 나갈 것"이라고 밝혔다. 타레크 아민 휴메인 CEO는 "동의한다. 대규모 모델도 가치가 있지만 특정 분야에 특화된 소규모언어모델(SLM)이 더 절실하다"며 "우리는 기기 자체에서 실행하고, 필요한 경우만 클라우드와 연동하는 하이브리드 AI 구조를 만들고 있다"고 응답했다.

2025.09.26 09:44장경윤

LGU+, '엑사원 3.5' 기반 온디바이스 sLM 개발

LG유플러스가 LG AI연구원, 옵트에이아이와 손잡고 대규모 언어 모델(LLM) '엑사원 3.5' 기반 온디바이스 소형 언어 모델(sLM)을 개발했다고 25일 밝혔다. 이 모델은 AI 통화 앱 '익시오'에 적용해 서비스를 고도화할 방침이다. 이번 온디바이스 sLM 개발은 LG AI연구원이 지난해 12월 선보인 '엑사원 3.5 2.4B' 모델을 기반으로 이뤄졌다. LG유플러스와 LG AI연구원, 온디바이스 AI 솔루션 업체인 옵트에이아이는 약 6개월에 걸친 연구를 통해 개발에 성공했다. AI 모델을 경량화하는 '온디바이스' 기술은 AI 서비스 확산 및 보안성 향상에 필수적이다. 네트워크와 서버를 거쳐야 구동되는 LLM과 달리, 온디바이스 sLM은 이용자의 스마트폰 내에서 바로 서비스를 이용할 수 있어 보안성이 강화된다. 또한 스마트폰 내 신경망처리장치(NPU)를 통해 답변을 제공하는 만큼 빠른 응답이 가능하고, 다양한 단말에서 사용할 수 있다는 장점이 있다. LG유플러스는 새로 개발한 sLM을 통해 AI 에이전트 '익시오'에 적용해 서비스를 고도화할 계획이다. ▲한 줄 요약 ▲상세 요약 ▲키워드 추출 ▲AI Task 제안 등 기능을 오는 10월 베타 테스트를 통해 안정성 및 품질 검증을 완료하고, 이르면 내년 상반기 상용화에 나설 계획이다. 엑사원 기반 온디바이스 sLM은 퀄컴의 '스냅드래곤8' 칩셋 기반 스마트폰에 탑재된다. 내년에는 iOS 운영체제가 적용된 스마트폰까지 적용 범위를 확대할 예정이다. 나아가 LG유플러스와 LG AI연구원, 옵트에이아이는 지속적인 온디바이스 AI 기술 개발을 통해 지난 7월 출시된 '엑사원 4.0'도 온디바이스 sLM으로 구현할 방침이다. 이를 통해 온디바이스 sLM 기반의 익시오가 제공하는 서비스도 개인별 맞춤형으로 발전시킨다는 전략이다. 송대원 LG유플러스 기술개발그룹장은 “온디바이스 AI 기술 고도화를 지속해 초개인화된 온디바이스 에이전트를 선보이며 시장 내 선도 사업자로서의 입지를 한층 더 강화하고 차별화된 사용자 경험을 제공할 것”이라고 말했다.

2025.09.25 09:53진성우

카톡에 들어간 챗GPT..."가장 혁신적인 AI 경험 제공"

카카오가 오픈AI 협업 결과를 선보이며, 글로벌 AI 기술과 자사 플랫폼을 아우르는 '카카오 AI 에이전트' 전략을 가속화했다. 카카오톡 내 '챗GPT' 탑재로 이용자 경험을 확장하는 동시에, 자체 모델 '카나나'와 온디바이스 AI를 결합해 차별화된 생태계 구축을 노린다. 외부 기술 제휴와 자체 기술 내재화를 동시에 추진해 향후 AI 경쟁에서 주도권을 확보하겠다는 포석이다. 23일 카카오는 경기 용인시 카카오 AI 캠퍼스에서 '이프 카카오(if kakao)25'를 열고 새롭게 변화하는 카카오톡의 모습을 공개했다. 이날은 오픈AI의 공동 프로덕트가 처음 공개됐다. 이번에 선보인 프로덕트는 카카오의 플랫폼 및 생태계를 오픈AI의 기술과 결합시켜 이용자에게 혁신적인 AI 경험을 제공한다. 카카오톡 대화 속에서도 챗GPT 이용 유용하 AI에이전트 플랫폼 성과리더는 “양사 협업 시 카카오톡 이용자가 챗GPT를 안전하고 쉽게 이용할 수 있게 하고, 챗GPT 안에 카카오와 외부의 서비스를 연결해 AI 생태계를 확장하는 것에 집중했다”며 “이용자들의 눈높이에 맞춰 글로벌 최고 수준의 서비스를 제공하는 것이 목표”라고 말했다. 카카오톡 이용자라면 누구나 채팅탭 상단의 '챗GPT'를 눌러 서비스를 사용할 수 있다. 챗GPT로 주고 받은 대화와 생성된 콘텐츠를 대화방에 바로 공유할 수 있으며, 카카오톡 대화 중 손쉽고 빠르게 챗GPT로 전환해 사용 가능하다. 카카오톡에서 사용하는 챗GPT는 오픈AI의 최신 모델 GPT-5로, 텍스트와 이미지 처리와 생성 및 고도화된 컨텍스트 인지 능력을 갖췄다. 단순히 카카오톡에 챗GPT를 적용한 것에 그치지 않고, 카카오의 다양한 서비스와 연결되는 '카카오 에이전트'를 통해 차별화된 사용성을 제공한다. 이를 통해 이용자는 별도의 앱 전환이나 메뉴 탐색 없이도 선물하기, 카카오맵, 예약하기, 멜론 등을 사용할 수 있다. 카카오 에이전트는 향후 카카오톡의 다양한 기능과 편리한 연결로 범위를 더욱 확대할 예정이다. 카카오 뿐 아니라 계열사, 공공기관, 외부 파트너 등이 함께 참여하는 AI 서비스 생태계 플랫폼으로 확장할 계획이다. 이를 위해 지난 8월 AI 서비스를 위한 툴(Tool) 제작과 등록을 직접 진행할 수 있게 지원하는 'PlayMCP' 플랫폼을 국내 최초로 오픈했다. 이용자들이 이를 쉽게 발견할 수 있는 마켓 플레이스 'PlayTools'를 통해 AI 서비스와 이용자를 연결하는 선순환 구조를 계획중이다. 올리버 제이 오픈AI 인터내셔널 비즈니스 총괄은 “카카오와 협력해 챗GPT를 새롭고 현지화된 방식으로 제공하게 되어 매우 기쁘다”며 “챗GPT 경험을 카카오 생태계와 결합함으로써 사람들의 일상에서 AI가 더욱 유용하게 활용될 것으로 기대한다”고 말했다. 먼저 말 걸어주는 '카나나 인 카카오톡' 강지훈 AI디스커버리 성과리더는 온디바이스 AI, '카나나 인 카카오톡'에 대한 상세한 내용을 공개했다. 카나나 인 카카오톡은 '필요한 순간 먼저 말을 걸어주는 AI'로, 대화 속에서 필요한 맥락을 이해하고 먼저 카톡을 보내 일정관리, 예약, 구매, 지식검색 등 일상에 필요한 활동들을 제안한다. 카나나 인 카카오톡은 카카오가 직접 개발한 온디바이스 AI 모델인 '카나나 나노(Kanana Nano)'를 활용한다. 글로벌 최고 수준의 한국어 맥락 이해 능력을 가진 경량 모델을 적용해, 스마트폰 안에서 작동하며 안전하게 서비스를 이용할 수 있다는 것이 특징이다. 강 성과리더는 'Privacy First' 원칙 하에 이용자 프라이버시를 지키면서도 카나나가 똑똑하게 도움을 줄 수 있는 방법으로 온디바이스를 선택했다고 밝혔다. 이날부터 카나나 웹사이트에서 베타 테스트 신청이 가능하며, 선정된 인원은 10월 중순부터 테스트에 참여할 수 있다. 강 성과리더는 카카오톡 채팅방에 탑재할 AI 검색 서비스 '카나나 검색'도 함께 소개했다. 채팅방 안에서 검색과 검색 결과 공유가 가능한 서비스로, '함께' 그리고 '쉽게' 할 수 있는 것이 강점이라고 설명했다. 채팅방 입력창 옆에서 언제든 불러내 손쉽게 검색이 가능하면서도, 단순 정보 검색을 넘어 유용한 정보를 공유하고 다양한 대화 소재를 발굴하는 역할을 할 예정이다. 자체 개발 AI '카나나 모델 패밀리'도 공개 김병학 카나나 성과리더는 자체 모델 '카나나(Kanana)'에 대해 글로벌 모델과 견줄 수 있는 ▲성능과 효율성 ▲서비스 특성에 맞는 최적화 ▲보안과 안전성에 집중하고 있으며, 온디바이스(On-device)와 에이전틱 AI(Agentic AI)로 진화 중이라고 설명했다. 또한, 지난 2월 오픈소스를 공개한 뒤 5월 업그레이드를 거친 카나나 1.5버전에 대해 언급하며, 추론 구조의 강화와 함께 'MLA(Multi-Head Latent Attention)' 기법 및 'MoE(Mixture of Experts)' 구조를 적용해 2.0버전으로 고도화 하고 있다고 밝혔다. 카나나 모델이 적용된 사례에 대해서도 소개됐다. 현재 카나나 모델들은 ▲온디바이스AI ▲통화 녹음 ▲통화 및 대화 요약 ▲상담 매니저 ▲숏폼 분석 ▲숏폼 생성 등에 적용되어 있다. 김 성과리더는 “카카오톡 뿐 아니라 다양한 카카오 서비스에서 카나나 모델을 자연스럽게 경험하게 될 것” 이라며 “앞으로 Agentic AI 연구를 통해 이 경험을 확장하고 일상을 보다 편리하게 변화시켜 갈 것”이라고 말했다.

2025.09.23 12:28안희정

  Prev 1 2 3 4 5 6 Next  

지금 뜨는 기사

이시각 헤드라인

AI, 추론 모델→행동도구로…'월드모델' 경쟁 불붙는다

디지털 자산 2단계 법안 통과?…더민당 "한은 신경써야 하냐?"

로봇이 차 만들고 로봇개가 품질검사…현대차그룹 '제조혁신' 가속

새해 AI 반도체 지도 바뀐다…메모리·시스템 신성장 국면 도래

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.