• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
지스타2025
인공지능
스테이블코인
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'스냅드래곤 X2'통합검색 결과 입니다. (7건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

퀄컴 "에이전틱 AI에 필요한 것은 더 강력한 NPU"

[샌디에이고(미국)=권봉석 기자] "AI는 사물이나 음성인식에서 생성AI를 지나 자율성을 지닌 에이전틱 AI로 진화하고 있다. 이용자의 목표에 따라 여러 AI 에이전트가 협력해 작업을 나눠 수행한다. 1초 안에 응답을 얻으려면 100 TOPS(1초 당 1조 번 연산)를 넘어 최대 300 TOPS급 NPU가 필요한 상황이 올 것이다." 12일(이하 현지시간) 오전 미국 캘리포니아 주 샌디에이고 내 '스냅드래곤 X 엘리트 딥다이브' 행사장에서 우펜드라 쿨카르니 퀄컴 제품관리 부사장이 이렇게 설명했다. 그는 "에이전틱 AI는 PC 이용 중 내내 백그라운드에서 작동하기 때문에 초저전력 NPU 탑재가 필요하다. 스냅드래곤 X2 엘리트 익스트림에 탑재된 헥사곤 NPU는 경쟁사 대비 높은 성능으로 배터리 불안 없이 AI를 오래 쓸 수 있을 것"이라고 설명했다. "배터리 기반 노트북에서 GPU에만 의존할 수 없어" PC에서 AI를 실행하기 위한 요소로 CPU와 GPU, NPU를 꼽는다. 이는 퀄컴 뿐만 아니라 인텔과 AMD, 애플 등 모든 PC용 프로세서 제조사가 동의하는 내용이다. CPU는 복잡한 분기 처리와 운영체제 로직, 대규모 응용프로그램을 빠르게 실행하지만 대규모 추론을 지속적으로 처리하는 데는 한계가 있다. GPU는 3D 그래픽과 거대언어모델(LLM) 등 처리에 특화됐지만 전력 소모가 크다. 우펜드라 쿨카르니 부사장은 "배터리로 구동되는 노트북에서 장시간 상시 실행되는 AI 작업을 GPU에만 의존하기는 어렵다. 반면 NPU는 행렬 연산 기반의 대규모 추론을 저전력으로 처리하도록 설계된 전용 엔진"이라고 설명했다. 이어 "퀄컴은 여러 모델이 동시에 작동하는 AI에서는 NPU 전력 효율이 가장 큰 경쟁력이라고 판단하고 있고 NPU의 성능과 전력 효율이 경쟁력을 좌우할 것"이라고 설명했다. "에이전틱 AI, 100 TOPS 이상 NPU 요구할 것" 이날 퀄컴은 AI 모델의 발전 속도로 인해 PC가 필요로 하는 TOPS가 급증하고 있다고 지적했다. 단순 텍스트 생성에서 멀티모달 생성(이미지·영상), 혹은 LLM을 여러 개 조합해 실행하는 에이전틱(Agentic) AI 환경으로 전환되면서 연산 요구량이 폭증하는 추세다. 예를 들어 짧은 동영상을 생성하는 데만 최소 150 TOPS가 필요하며, 1초 내 결과물을 얻기 위한 실시간성을 원할 경우 300 TOPS까지 요구된다. 또한 일정·메일 관리, 문서·이미지 분석 등 에이전트가 여러 모델과 도구를 병렬로 호출하는 작업이 지속적으로 실시간 작동된다. 우펜드라 쿨카르니 부사장은 "AI가 항상 실행되려면 전력 대비 성능 효율이 GPU 대비 수 배 이상 높은 NPU가 필수다. 여러 LLM을 동시에 구동하려면 최소 100 TOPS, 대규모 에이전트 실행시 최소 140 TOPS 이상 성능이 요구된다"고 말했다. "헥사곤 NPU, 배터리 덜 쓰며 더 높은 성능 제공" 우펜드라 쿨카르니 부사장은 "스냅드래곤 X2 엘리트 익스트림에 탑재된 헥사곤 NPU는 최대 80 TOPS의 NPU를 기반으로 GPU·CPU 성능을 합산하면 200 TOPS에 가까운 연산량을 제공한다"고 강조했다. 이어 프로시온 AI 벤치마크 점수를 토대로 "헥사곤 NPU의 점수는 인텔 Xe2 GPU 대비 3배, 인텔 코어 울트라9 285H 내장 NPU 대비 5배 이상 높다. 전력 효율은 인텔 제품 대비 3배 이상"이라고 주장했다. 우펜드라 쿨카르니 부사장은 "전력당 성능으로 보면 스냅드래곤 X2 내장 NPU가 GPU 대비 현저히 우위를 보인다. 전기차를 예로 들면 항속거리가 최대 3.7배 이상 늘어나는 것이며 배터리 불안 없이 AI를 오래 쓸 수 있는 것"이라고 덧붙였다. "AI 처리 경로에 관계 없이 최대 성능 제공... 1천개 모델 지원" 퀄컴은 AI 성능의 지속적인 향상을 위해 운영체제·API·모델 프레임워크·드라이버 등을 통합 최적화하고 있다. 윈도ML은 하드웨어 중립적인 AI 처리를, 자체 API인 퀄컴 AI 엔진 다이렉트(QNN)를 활용하면 퀄컴 실리콘에 최적화된 처리가 가능하다. 우펜드라 쿨카르니 부사장은 "외부 소프트웨어 개발 업체가 API를 두 번 최적화하지 않아도 동일한 최대 성능을 제공하는 것이 퀄컴 목표"라고 설명했다. 퀄컴은 스냅드래곤과 드래곤윙 등 SoC에 미리 최적화된 AI 모델을 제공하는 '퀄컴 AI 허브'도 운영한다. 앱과 모델을 분리해 동시에 개발할 수 있다는 것이 큰 장점으로 꼽힌다. 우펜드라 쿨카르니 부사장은 "어도비, 어피니티, 블렌더, 블랙매직 등 주요 소프트웨어 개발 업체와 함께 컴퓨터 비전·영상 편집·이미지 생성 분야에서 이미 최적화를 진행했으며, 총 1천 개 이상의 모델과 100여 개의 앱이 퀄컴 AI 플랫폼에서 작동한다"고 밝혔다.

2025.11.19 23:20권봉석

스냅드래곤 X2, 80 TOPS NPU로 상시구동 AI 지원

[샌디에이고(미국)=권봉석 기자] 퀄컴이 지난 해 출시한 스냅드래곤 X 시리즈 시스템반도체(SoC)는 45 TOPS(1초당 1조번 연산)급 신경망처리장치(NPU)로 인텔과 AMD 등 x86 프로세서 기반 SoC 대비 우위를 차지했다. 내년 상반기 중 출시할 스냅드래곤 X2 엘리트/엘리트 익스트림에는 전 세대 대비 두 배 가까운 80 TOPS급 NPU를 탑재할 예정이다. 주요 연산을 저전력 NPU로 처리해 배터리 지속시간이 중요한 노트북 분야에서 경쟁력을 확보하겠다는 것이다. 12일(이하 현지시간) 오전 미국 캘리포니아 주 샌디에이고 내 '스냅드래곤 X 엘리트 딥다이브' 행사에서 루시안 코드레스쿠 퀄컴 기술부사장은 "스냅드래곤 X2 시리즈의 헥사곤 NPU는 상시 구동 AI를 겨냥해 전 세대 대비 78% 성능을 향상시켰다"고 강조했다. 이어 "AI가 운영체제와 사용자 경험 전반을 바꾸고 있는 현 시점에서, 지속적 온디바이스 AI 실행과 다중 모델 동시 활용을 위해서는 극단적인 에너지 효율이 필수이며 헥사곤 NPU는 이를 충족한다"고 덧붙였다. 헥사곤 NPU, DSP에서 다양한 연산 처리용으로 진화 루시안 코드레스쿠 부사장은 헥사곤 제품개발 팀이 처음 구성된 2004년부터 아키텍처 팀을 이끌어왔다. 당시 개발된 QDSP6는 오디오와 멀티미디어 처리 효율 개선에 주력했고, 스마트폰 카메라의 영상처리 중요성이 커진 2014년부터 벡터 연산이 추가됐다. 2019년에는 단순한 DSP에서 벗어나 뉴럴 네트워크, 머신러닝 가속을 위해 행렬 연산을 추가한 헥사곤 NPU로 개념을 확장했다. 루시안 코드레스쿠 부사장은 "매년 새로운 NPU를 설계하고 스마트폰, PC, 오토모티브, IoT 등 다양한 제품에 이를 탑제한다. 제품마다 필요한 기능과 규모는 다르지만 기본적인 코어 기술은 공통"이라고 설명했다. "NPU, 행렬 연산만 강화하는 것이 능사 아냐" 헥사곤 NPU는 AI에 필요한 각종 연산을 조율하고 제어하는 '스칼라' 코어, SIMD(단일 명령어/다중데이터) 명령어를 주로 처리하는 '벡터' 코어, AI 연산의 주를 이루는 행렬 관련 연산을 주로 처리하는 '매트릭스' 코어 등 3개 주요 부분으로 구성됐다. 루시안 코드레스쿠 부사장은 "오픈소스와 자체 모델, 고객사 등이 만든 다양한 AI 모델을 이용해 테스트한 결과 NPU는 단순히 행렬 연산만 잘 처리하는 것이 능사가 아니다"라고 설명했다. 그는 "어떤 모델은 행렬 연산에서, 어떤 모델은 벡터 연산에서, 어떤 모델은 스칼라 코어나 메모리, 제어 계층에서 병목 현상을 일으킨다. NPU 시스템 전반의 밸런스를 맞추지 않으면 아무리 행렬 연산만 강화해도 속도 향상은 제한적일 것"이라고 말했다. 스칼라 엔진, 멀티스레딩으로 한 클록당 32개 명령어 처리 스냅드래곤 X2 엘리트/엘리트 익스트림에 내장된 헥사곤 NPU는 퀄컴 자체 기준으로 6세대 제품에 해당한다. 먼저 AI 연산을 조율하는 스칼라 엔진을 크게 강화했다. 코어는 6코어지만 멀티스레딩 방식으로 내부에서 최대 12 스레드를 처리하도록 처리했다. 한 클록(사이클) 당 처리할 수 있는 명령어는 최대 32개 수준이다. 코어는 32비트로 작동하지만 32비트의 한계를 넘어서는 큰 AI 모델을 처리할 수 있도록 메모리 주소는 64비트로 처리해 효율성을 높였다. 이런 개선 결과 전 세대 대비 처리량은 143%, 대역폭은 127% 향상됐다. 벡터 엔진은 최대 1024비트를 처리할 수 있는 레지스터를 탑재했고 FP8(실수, 8비트)와 FP16(실수, 16비트) 대비 연산량을 경감하며 비슷한 결과를 낼 수 있는 BF16 연데이터타입도 지원한다. 이를 이용해 일반적 머신러닝 연산·리사이즈·소프트맥스 등 광범위한 연산을 처리한다. 벡터 엔진의 연산 속도는 전 세대 대비 1.43배 늘어났다. 매트릭스 엔진, 2비트 가중치 처리 기능 추가 행렬 연산을 처리하는 매트릭스 엔진은 2비트로 양자화된 거대언어모델(LLM) 처리 능력을 더했고 FP8과 BF16 자료형을 처리할 수 있다. 특히 행렬 연산 처리와 활성 함수 연산까지 처리할 수 있도록 전용 파이프라인을 더해 여러 번 데이터를 옮길 필요 없이 한 번에 데이터를 처리한다. 또 매트릭스 엔진의 전압과 작동 클록을 분리해서 응용프로그램이나 AI 모델의 특성에 맞게 성능과 전력을 세밀하게 조절할 수 있다. 이런 처리 결과 매트릭스 엔진의 처리량은 전 세대 대비 78% 성능을 높였다. 새 NPU, 같은 전력에서 전 세대 대비 최대 1.6배 향상 새로 개발된 헥사곤 NPU는 스냅드래곤 X 엘리트 대비 같은 전력에서 최대 1.6배 더 높은 성능을 낸다. AI·컴퓨터 비전 벤치마크에서는 5.7배, 긱벤치 AI에서는 8만8천점이 넘는 점수를 냈다. 루시안 코드레스쿠 부사장은 "자체 실험 결과 칩 면적과 메모리 대역폭이 고정돼 있을 때 FP16, FP8, INT4 등 서로 다른 데이터 타입을 이용할 때, 정밀도를 높이면 전력 소모가 커진다는 결과를 얻었다"고 설명했다. 이어 "이 때문에 업계 전체가 보다 정밀도를 낮추는 방향으로 움직이고 있으며 허용 가능한 정확도를 유지하는 범위에서 비트 수를 최대한 줄이는 것이 에너지 효율 상 가장 큰 이득을 준다는 결론을 얻었다"고 설명했다. 스냅드래곤 X2 모든 제품군에 80 TOPS급 NPU 탑재 퀄컴은 스냅드래곤 X2 엘리트/엘리트 익스트림 뿐만 아니라 향후 출시될 윈도 PC용 SoC에 동일한 NPU를 탑재할 예정이다. 보급형 PC나 고성능 PC 모두 동일한 AI 처리 성능을 갖추게 된다. 루시안 코드레스쿠 부사장은 "80 TOPS급 헥사곤 NPU는 성능 측면에서 큰 도약을 이뤘다. 이는 스칼라, 벡터, 매트릭스 등 전반을 균형있게 재설계한 결과물이다. 이를 바탕으로 온디바이스 AI가 항상 켜진 PC 시대를 뒷받침할 중심이 될 것"이라고 밝혔다.

2025.11.19 23:15권봉석

퀄컴 "아드레노 X2, 가장 크고 빠른 고효율 GPU"

[샌디에이고(미국)=권봉석 기자] 퀄컴이 지난 해 출시한 윈도 PC용 시스템반도체(SoC)인 스냅드래곤 X 엘리트는 아드레노 X1 GPU를 내장했다. 아드레노 X1은 2022년 공개된 스냅드래곤8 2세대 내장 GPU와 비슷한 수준으로 성능 면에서 제약이 있었다. 반면 내년 상반기 중 출시될 스냅드래곤 X2 엘리트 익스트림은 성능을 크게 강화한 아드레노 X2 GPU를 내장했다. 전세대 대비 평균 2.3배 이상 성능 향상, 전력 소모 25% 절감을 내세웠다. 11일(이하 현지시간) 오전 미국 캘리포니아 주 샌디에이고 내 '스냅드래곤 X 엘리트 딥다이브' 행사장에서 에릭 데머스 퀄컴 엔지니어링 수석부사장은 "아드레노 X2는 퀄컴이 지금까지 만든 GPU 중 가장 크고 빠른 제품"이라고 강조했다. 아드레노 X2 GPU, 2022년부터 개발 시작 아드레노 GPU는 퀄컴이 2009년 1월 AMD의 모바일용 GPU IP(지적재산권)를 인수한 이후 개발하기 시작한 GPU다. 에릭 데머스 부사장은 2011년 경 퀄컴에 합류해 3세대 아드레노 GPU부터 개발에 관여했다. 에릭 데머스 부사장은 "아드레노 X2는 세대별 구분으로 8세대에 해당하는 제품이며 2022년 경부터 설계를 시작했다. 아드레노 X1 대비 높은 성능을 내기 위해 GPU 규모를 33% 늘리는 한편 작동 클록을 스마트폰용 GPU 대비 크게 끌어올렸다"고 밝혔다. 이어 "단순히 작동 속도만 끌어올리면 전력 소모가 커질 수 있다. 그러나 스냅드래곤 X2의 타겟 플랫폼은 얇고 가벼운 노트북이며 전력 상승을 억제해야 했다. 아키텍처 전반에 걸쳐 효율을 개선하는 작업을 병행했고 이 부분에서도 좋은 성과를 거뒀다"고 설명했다. 아드레노 X2 GPU는 8세대 제품에 해당하며 내부적으로 X2-90, X2-85 등 두 가지로 나뉜다. 기능이나 성능 등 아키텍처는 동일하지만 연산 성능이나 유닛 수 등에 차이가 있다. 슬라이스 단위 최적화로 개발 효율 향상 GPU 개발 회사는 프론트엔드, 지오메트리 처리, 고정 함수, 셰이더 등 그래픽 처리를 담당하는 GPU 전 과정과 주요 기능을 일정 단위로 분할해 구분한다. 아드레노 X2 GPU는 여기에 '슬라이스'(Slice, 조각)라는 이름을 붙였다. 슬라이스를 늘려서 배치할 수록 GPU 성능은 늘어나게 돼 있다. 최상위 GPU인 X2-90은 슬라이스 4개를 조합해 구성된다. 에릭 데머스 부사장은 "이 방식은 설계 자원을 절약하는 동시에 단일 슬라이스를 정말 잘 만들 수 있게 집중할 수 있다는 장점이 있다"고 설명했다. 하드웨어 가속 레이트레이싱 유닛 탑재 각 슬라이스에는 128KB 캐시 메모리와 함께 별도로 쓸 수 있는 21MB 용량 고성능 메모리를 내장했다. 슬라이스끼리 공유하는 L2 캐시 2MB를 더해 메모리에 접근하는 시간을 단축하고 전력 소모를 절감했다. 물체 표면에서 광원을 반사하거나 흡수하는 효과를 처리하는 레이트레이싱도 강화됐다. 에릭 데머스 부사장은 "아드레노 X1은 명령어 확장으로 이를 처리했지만 아드레노 X2는 하드웨어 가속이 가능한 레이트레이싱 유닛을 슬라이스당 4개씩 추가 배치했다"고 설명했다. 아드레노 X2는 SoC 내장 GPU로 별도 그래픽 메모리를 활용하지 않는다. 외부 메모리는 LPDDR5x-9600까지 지원하며 대역폭은 초당 최대 228GB까지 향상됐다. 전세대 대비 게임 프레임 최대 2.3배 향상 퀄컴은 자체 수행 벤치마크를 토대로 아드레노 X2 GPU의 게임 성능(초당 평균 프레임)이 아드레노 X1 대비 최대 2.3배 향상됐다고 설명했다. '토탈워: 워해머'에서는 최대 69프레임, 워썬더에서는 최대 194 프레임을 기록했다. 에릭 데머스 부사장은 "인텔 Xe2 GPU(코어 울트라9 288V) 대비 최대 50%, AMD 라이젠 AI 9 HX 370 내장 라데온 GPU 대비 최대 29% 더 높은 프레임을 낸다"고 설명했다. 이어 "전력 효율 면에서도 큰 개선이 있다. 3D마크 타임스파이 기반으로 측정 결과 아드레노 X1 대비 같은 전력에서 70% 성능 향상이 있었고, 같은 성능을 내는 데 필요한 전력도 40% 절감됐다"고 설명했다. "주요 게임사와 협업해 안티치트 솔루션 Arm 호환성 향상" 아드레노 X2는 게임 이외에도 GPU를 활용한 각종 연산 가속 기능을 지원한다. 마이크로소프트 윈도의 AI 연산을 위한 다이렉트ML, 코파일럿 런타임 기반 머신러닝 연산 가속이 가능하다. 퀄컴은 아드레노 X1 내장 GPU 드라이버 업데이트를 분기별 최소 한 번 이상 제공해 왔다. 에릭 데머스 부사장은 "스냅드래곤 X2 엘리트 익스트림의 GPU 드라이버 업데이트 주기를 월간으로 단축하는 것이 목표"라고 설명했다. 이어 "게임별 프로파일과 GPU 제어, 스팀 라이브러리의 게임을 자동 인식해 옵션을 조절하는 스냅드래곤 컨트롤 패널도 곧 제공할 예정"이라고 덧붙였다. 스냅드래곤 X2 엘리트 출시를 앞두고 게임 호환성도 강화된다. 에릭 데머스 부사장은"안티치트 업체들과 긴밀히 협력해 Arm 지원을 확대하고 있으며 스냅드래곤 X2 엘리트 출시 시점인 내년 1분기 시점에 실행률을 90% 이상으로 높이는 것이 목표"라고 밝혔다.

2025.11.19 23:10권봉석

"스냅드래곤 X2 엘리트 익스트림 CPU, 전세대比 성능 39% 향상"

[샌디에이고(미국)=권봉석 기자] 퀄컴은 지난 해 상반기 스냅드래곤 X 엘리트 탑재 PC 출시 이후 현재까지 CPU 관련 내부 구조나 설계 철학 등 상세 내용을 공개한 적이 없다. 11일(이하 현지시간) 오전 미국 캘리포니아 주 샌디에이고 내 '스냅드래곤 X 엘리트 딥다이브' 행사에서는 프라딥 카나파티필라 퀄컴 엔지니어링 부사장 겸 CPU 아키텍트가 직접 관련 내용을 설명했다. 퀄컴이 내년 출시를 앞둔 고성능 PC용 시스템반도체(SoC)인 스냅드래곤 X2 엘리트 익스트림은 자체 개발한 오라이언(Oryon) CPU 코어를 큰 폭으로 개선해 성능을 높였다. CPU 코어 수도 전 세대 대비 50% 늘어난 최대 18개로 늘려 다중작업시 효율을 강화했다. 프라딥 카나파티필라 부사장은 "스냅드래곤 X2 엘리트 익스트림에 탑재된 오라이언 CPU는 3세대에 해당하는 제품으로 처음부터 완전히 새로 설계했다. 전세대 대비 성능과 에너지 효율 면에서 큰 도약을 이뤄냈다"고 평가했다. 단일 코어에서 프라임/퍼포먼스 2개 코어로 계층 변경 전세대인 스냅드래곤 X 엘리트는 오라이온 CPU 코어를 한 종류만 탑재했다. 어떤 상황에서도 같은 성능을 내지만 복잡하지 않은 동작을 수행할 때 전력 소모가 커지는 것이 단점이었다. 스냅드래곤 X2 엘리트 익스트림은 기본 4.4GHz로 작동하는 코어 6개와 L2 캐시 16MB로 구성된 '프라임 클러스터' 2개, 3.6GHz로 작동하는 코어 6개와 L2 캐시 12MB로 구성된 '퍼포먼스 클러스터' 1개 등 총 3개 클러스터로 작동한다. 프라임 클러스터는 최대 5GHz로 작동하며 고성능 작동이 필요한 환경에 적합하다. 반면 퍼포먼스 코어는 성능 극대화가 필요없는 일상적인 작업과 에너지 효율과 저전력 운영 구간에 최적화됐다. 프라임 코어, 조건 분기 예측 성능 향상 프라임 코어는 한 클록당 16개 명령어를 동시에 불러오는 구조로 설계됐다. 또 분기 예측 처리 효율을 높이기 위해 두 클록이 필요한 조건 분기 예측기 등이 포함됐다. 프라딥 카나파티필라 부사장은 "분기 예측에 실패했을 때 이를 다시 예측하는 데 필요한 페널티는 13사이클에 불과하다"고 설명했다. 정수 연산을 처리하는 실행 유닛은 총 6개이며 64비트 폭으로 설계됐다. 벡터·부동소수점 유닛은 128비트 파이프 4개로 FP32, FP64, BF16, INT 계열 연산을 지원하며, 조건부 벡터 연산 효율을 높였다. 메모리 관리 유닛은 가상화와 2단계 주소 전환을 지원하며 6웨이 데이터케시 96KB, 로드/스토어 유닛 4개로 빠른 메모리 접근과 캐시 일관성을 보장한다. 행렬 연산 가속기 '매트릭스 엔진' 내장 프라임 클러스터와 퍼포먼스 클러스터에는 AI 연산에 주로 쓰이는 행렬 연산만 전용 처리하는 매트릭스 엔진이 포함된다. 프라딥 카나파티필라 부사장은 "매트릭스 엔진은 CPU 기반 머신러닝과 대규모 행렬 연산에서 성능 향상을 제공하며, 일반 벡터 유닛 대비 폭넓은 연산 처리가 가능하다"고 설명했다. 스냅드래곤 X2 엘리트 익스트림의 경우 프라임 클러스터 2개, 퍼포먼스 클러스터 1개 등 총 3개가 내장된다. 매트릭스 엔진과 CPU 코어의 작동 클록은 동기화되지 않으며 이를 통해 전력 소모를 최적화할 수 있다. 프라임 클러스터의 매트릭스 엔진은 8×8 배열, 퍼포먼스 클러스터의 매트릭스 엔진은 4×8 배열 행렬 처리가 가능하며 BF16, FP16, FP32, INT32, INT8 등 다양한 데이터 타입을 지원한다. 현재까지 발견된 보안 취약점 모두 방어 프라임 코어는 신뢰영역(트러스트존) 기반 명령어 실행, 포인터 인증(PAC), 스펙터/멜트다운 등 현재까지 발견된 분기 예측이나 메모리 관련 보안 취약점에 모두 대응했다. 메모리 주소마다 꼬리표를 달아 데이터 저장 영역과 실행 영역을 분리하는 메모리 태깅도 포함됐다. 암호화에 필요한 난수생성기(RNG)도 각 CPU 클러스터마다 하나씩 추가됐다. 프라딥 카나파티필라 부사장은 긱벤치 6.5 자체 테스트 결과를 토대로 "프라임 코어는 1세대에 해당하는 스냅드래곤 X 엘리트 탑재 제품 대비 최대 성능은 39% 늘어났고 같은 성능을 내는 데 필요한 소비 전력은 43% 감소했다"고 설명했다. 퍼포먼스 코어, 2W 미만 저전력 작동에 최적화 퍼포먼스 코어는 전력 효율과 성능의 균형을 추구했다. 소모전력이 2W 미만인 저전력 환경에서 프라임 코어 대비 더 나은 에너지 효율을 지녔다. 기본 구조는 모두 비슷하지만 작동 클록은 3.6GHz, L2 캐시 용량은 12MB로 줄이는 등 다이 사이즈 제약이 있는 환경에 더 효과적이다. 프라딥 카나파티필라 부사장은 "프라임 코어는 클록당 처리할 수 있는 명령어(IPC)가 많지만 실제 환경에서는 최고 성능이 필요하지 않은 작업은 더 효율적인 코어에서 실행하는 것이 전체 전력·효율 측면에서 유리하다"고 설명했다.

2025.11.19 23:05권봉석

퀄컴 "스냅드래곤 X2 엘리트 익스트림, 저전력·고성능 동시 달성"

[샌디에이고(미국)=권봉석 기자] "스냅드래곤 X2 엘리트 익스트림은 모바일 분야에서 축적한 저전력 기술과 PC급 고성능 설계를 결합해 구성한 새로운 세대의 플랫폼이다. PC 구조 전반의 성능과 전력 효율, 연결성, AI 성능 등을 크게 개선했다." 11일(이하 현지시간) 오전 미국 캘리포니아 주 샌디에이고 내 '스냅드래곤 X 엘리트 딥다이브' 행사장에서 파라그 아가시 퀄컴 엔지니어링 수석부사장이 이렇게 설명했다. 퀄컴은 지난 9월 연례 기술행사 '스냅드래곤 서밋'에서 PC용 고성능 SoC인 스냅드래곤 X2 엘리트 익스트림을 공개했다. 이번 행사에서는 스냅드래곤 X2 엘리트 익스트림의 주요 구성 요소에 대한 보다 상세한 내용이 공개됐다. 이날 파라그 아가시 수석부사장은 "스냅드래곤 X2 엘리트 익스트림은 최근 PC 역사에서 거의 보기 힘들 정도로 큰 세대 간 성능 향상과 전력 효율 향상을 동시에 달성한 제품"이라고 강조했다. 3나노급 단일 칩 구성, LPDDR5 메모리 통합 스냅드래곤 X2 엘리트 익스트림은 대만 TSMC 3나노급(N3X) 공정에서 모든 요소를 한 칩 안에 넣어 만든 단일 다이 시스템반도체(SoC)다. 집적된 트랜지스터는 약 310억 개이며 고성능 LPDDR5 메모리를 다이 위에 동시에 탑재했다. 메모리와 프로세서를 연결하는 버스 대역폭은 192비트, 이를 바탕으로 오가는 데이터 대역폭은 초당 최대 228GB로 향상됐다. 스냅드래곤 X2 엘리트 익스트림은 CPU·GPU·NPU·ISP를 포함한 모든 코어를 새롭게 설계했다. 새로 정의된 스케일러블 구조와 고대역폭 패브릭은 여러 컴퓨팅 블록의 동시 동작 시 병목을 완화하도록 구성됐다. 저전력 기반 상시 동작 센싱에 AI 처리 더해 스냅드래곤 X2 엘리트 익스트림은 PC가 대기 상태에서도 카메라·마이크·네트워크 신호를 분석할 수 있는 저전력 센싱 허브를 탑재했다. 센싱 허브는 DSP와 eNPU를 활용해 사용자 감지 기반 화면 잠금 해제, 저전력 음성 명령 처리, 화상회의시 노이즈 제거 등 다양한 AI 기능을 낮은 전력으로 처리한다. 파라그 아가시 수석부사장은 "센싱 허브에 내장된 eNPU는 소형언어모델(SLM)을 구동할 수 있으며 외부 소프트웨어 개발사 등이 활용할 수 있도로 지원 확대를 추진중"이라고 설명했다. 3천600만 화소 처리 ISP 내장... 전문가용 영상코덱 지원 내장 카메라를 처리하는 스펙트라 이미지처리장치(ISP)는 최대 3천600만 화소 CMOS 센서에서 전달받은 18비트 영상 데이터를 바탕으로 얼굴 인식과 배경 흐림 등 처리를 자체 처리한다. 영상 코덱을 담당하는 아드레노 영상처리장치(VPU)는 듀얼코어 구조로 영상 코덱 변환시 속도를 전 세대 대비 2.5배 향상했다. 오픈소스 코덱인 AV1 인코딩에 더해 전문가용 오픈소스 코덱인 APV도 지원한다. 와이파이7·5G 동시 지원, 원격 관리 기능도 탑재 스냅드래곤 X2 엘리트 익스트림에는 스냅드래곤 X75 5G 모뎀-RF 시스템(2023년)이 통합된다. 다운로드 속도는 최대 10Gbps, 업로드 속도는 최대 3.5Gbps이며 스냅드래곤 X2 SoC와 PCI 익스프레스(M.2)로 연결된다. 와이파이7(802.11be)과 블루투스 5.4 등 기능은 패스트커넥트 7800(2022년)으로 지원한다. 와이파이 다운로드 속도는 최대 5.8Gbps 수준이다. 이외에 원격 환경에서 기기를 관리할 수 있는 '스냅드래곤 가디언'도 지원한다. 도난/분실시 기기를 잠그거나 지역에 따라 특정 응용프로그램 실행을 방지하는 지오펜싱 등을 지원한다. 이는 경쟁사인 인텔 v프로, AMD 프로(PRO) 등 기업용 PC의 관리를 위한 기능을 벤치마크해 도입한 것이다.

2025.11.19 23:00권봉석

퀄컴 차세대 AI PC 프로세서, 컴퓨팅·AI 성능서 경쟁사 '압도'

퀄컴이 올해 공개한 차세대 AI 프로세서의 성능을 자신했다. 실제 벤치마크 테스트 결과, CPU·GPU·NPU 등 모든 분야에서 이전 세대 대비 및 경쟁사 대비 뛰어난 성능을 구현한 것으로 나타났다. 퀄컴은 지난 23~25일(현지시간) 미국 하와이에서 개최된 '스냅드래곤 서밋' 행사를 통해 차세대 AI PC용 프로세서인 '스냅드래곤 X2 엘리트'의 성능을 공개했다. 스냅드래곤 X2 엘리트는 성능에 따라 일반 모델과 익스트림 모델로 나뉜다. 두 모델 모두 첨단 파운드리 공정인 3나노미터(nm)를 기반으로 하며, 내년 상반기부터 상용화가 시작될 예정이다. 초고성능의 익스트림 모델의 경우 18코어(12 프라임 코어+6 퍼포먼스 코어)를 갖췄으며, 3세대 퀄컴 오라이온 CPU를 탑재했다. 해당 CPU는 ISO(국제 표준) 전력 조건에서 경쟁사 대비 최대 75% 향상된 성능을 제공한다. GPU는 이전 세대 대비 2.3배 높아진 와트 당 성능 및 전력 효율을, NPU는 80 TOPS의 AI 처리 성능을 지원한다. 퀄컴은 올해 서밋에서 해당 칩셋에 대한 벤치마크 결과를 공개했다. 설명에 따르면, 이번 스냅드래곤 X2 엘리트 익스트림의 벤치마크 성능은 주요 경쟁사의 칩셋을 크게 웃도는 수준이다. CPU 긱벤치(Geekbench) 6.5버전 테스트 점수는 멀티코어 기준 2만3천491점으로 인텔 코어 울트라 9 285H(1만7천680점), 애플 M4(1만5천146점)를 모두 앞선다. GPU 벤치마크(UL3DMark Solar Bay)도 90.06점으로 50~60점대인 인텔, 애플, AMD 칩셋 대비 크게 높은 것으로 나타났다. NPU 벤치마크(긱벤치 AI 1.5 버전) 역시 8만8천615점으로 애플 M4(5만2천193점), 인텔 코어 울트라 9 288V(4만8천566점) 등을 능가했다. 퀄컴 관계자는 "해당 칩에 탑재된 퀄컴 오라이온 CPU는 동급 최고 성능의 CPU로, 경쟁사 대비 싱글코어에서는 최대 41%, 멀티코어에서는 최대 2배 더 빠르다"며 "GPU와 NPU도 경쟁사 대비 우월한 성능을 보여준다"고 설명했다. 실제로 기자가 위 벤치마크 항목에 대해 실제 테스트를 진행해 본 결과, CPU 벤치마크는 싱글코어 4천83점, 멀티코어 2만3천349점으로 나타났다. 퀄컴이 제시한 기준치인 싱글코어 4천50~4천89점, 멀티코어 2만2천835~2만3천768점에 부합한다. GPU 벤치마크도 89.68FPS로 기준치(84.37~90.47)에 부합했으며, NPU는 긱벤치 AI 1.5 버전에서 8만9천157점으로 기준치(8만4천58~8만8천919)를 초과하기도 했다.

2025.09.29 22:00장경윤

퀄컴, 차세대 PC 프로세서 흥행 자신…"삼성과 흥미로운 소식 있을 것"

퀄컴이 차세대 PC 프로세서인 '스냅드래곤 X2 엘리트' 시리즈를 공개했다. 해당 칩은 강력한 AI 성능을 지원하는 것이 특징으로, 내년 상반기부터 상용화될 계획이다. 특히 주요 고객사인 삼성전자 '갤럭시 북'과의 협력이 예상된다. 만다르 데쉬판데 퀄컴 컴퓨트 제품 관리 시니어 디렉터는 지난 25일(현지시간) 미국 하와이에서 열린 '스냅드래곤 서밋'에서 "스냅드래곤 X2 엘리트는 성능과 전력효율성, AI라는 세 가지 축을 두고 설계된 제품"이라며 "삼성전자의 차세대 제품에서도 흥미로운 소식을 기대해도 좋다"고 말했다. 3나노미터(nm) 공정 기반의 스냅드래곤 X2 엘리트는 이전 세대(최대 12개) 대비 크게 늘어난 최대 18개의 코어(12 프라임 코어+6 퍼포먼스 코어)를 갖췄다. CPU 및 GPU 성능도 크게 개선됐으며, 현존하는 노트북 시장에서 가장 빠른 헥사곤 NPU를 탑재했다. 헥사곤 NPU의 성능은 80TOPS(1TOPS; 초당 1조번 연산)에 이른다. 이전 세대가 45TOPS였다는 점을 고려하면 2배에 가까운 성능 향상이다. 만다르 디렉터는 "1세대 칩은 마이크로소프트가 코파일럿+ 표준을 정의할 때의 최소 성능 요구치인 40TOPS에 대응했던 것"이라며 "그러나 점점 더 많은 고객사들이 성능 향상을 요구했고, 에이전틱 AI가 대중화됨에 따라 2세대 칩을 80TOPS의 성능으로 설계하게 됐다"고 말했다. 스냅드래곤 X2 엘리트 시리즈는 성능 및 가격 경쟁력을 동시에 갖춘 일반 모델과, 초고성능 PC를 타겟으로 한 '스냅드래곤 X2 엘리트 익스트림'으로 나뉜다. 각 칩을 탑재한 제품은 이르면 내년 상반기부터 출시될 예정이다. 또한 1세대 칩이 주요 고객사인 삼성전자 '갤럭시 북4 엣지'에 탑재된 적이 있는 만큼, 양사 간 협력 강화가 기대된다. 만다르 디렉터는 "삼성전자는 모바일과 PC 분야 모두 퀄컴의 훌륭한 파트너로서 1세대 칩을 채용한 바 있다"며 "때문에 차세대에서도 흥미로운 소식을 기대해도 좋다"고 말했다. 특히 익스트림 모델은 맥슨(Maxon), 다빈치리졸브(DaVinci Resolve) 등 글로벌 주요 소프트웨어 업체로부터 호평을 받고 있다. 만다르 디렉터는 "스냅드래곤 X2 엘리트 익스트림은 멀시트레드에 최적화된 앱에서 실행 속도와 렌더링 시간을 크게 단축시키고, 토큰 응답 속도를 획기적으로 높인다"며 "특정 파트너 이름을 언급할 수는 없으나 산업 전반의 피드백은 매우 긍정적"이라고 말했다. 그는 이어 "퀄컴은 소비자 중심에서 출발해 게이밍, 크리에이터 작업으로 영역을 확장했고, 앞으로는 워크스테이션을 본격적으로 목표로 할 계획"이라며 "PC 시장은 우리에게 매우 중요한 시장으로, 2029년까지 PC 부문에서 40억 달러의 매출을 달성하도록 할 것"이라고 덧붙였다.

2025.09.29 09:00장경윤

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

팩트시트 나왔지만...조선3사 마스가TF 조용한 이유

"유럽풍 겨울 정취 그대로"…롯데百 크리스마스 마켓 가보니

엔비디아 실적 발표에 쏠린 눈…분석가들의 전망은?

구글, 신규 모델 '제미나이3' 출시…"추론력 최고치"

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.