• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
2026전망
스테이블코인
배터리
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'Xe'통합검색 결과 입니다. (7건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

엔비디아와 손잡은 '델'…AI 인프라·자동화 통합으로 기업 부담 '최소화'

델 테크놀로지스(이하 델)가 엔비디아와 함께 기업 인공지능(AI) 도입에 필요한 모든 인프라와 자동화 서비스를 통합 제공한다. 랙부터 서버, 스토리지, 네트워크, 자동화까지 아우르는 통합 플랫폼을 통해 기업의 부담을 최소화하고 혁신을 가속화한다는 구상이다. 델의 바룬 차브라 인프라 솔루션 그룹 부사장은 18일 미국 세인트루이스에서 개최한 슈퍼컴퓨팅 25(SC25)에서 새롭게 개편한 '델 AI 팩토리'를 공개하며 고성능컴퓨팅(HPC)·생성형 AI 인프라 전략을 공개했다. 바룬 차브라 부사장은 기업에서 AI 도입하는 과정 중 최대 진입장벽으로 기술 인력 부족과 예산, 투자수익률(ROI)을 꼽았다. 이러한 기업 부담을 최소화하기 위해 델은 엔터프라이즈 AI 구축을 더 간편하고 빠르게 만들기 위해 델 AI 팩토리 제품군을 대폭 확장했다. 새롭게 강화된 포트폴리오를 통해 기업의 AI 워크로드 운영 과정에서 발생하는 병목을 줄이고 보다 유연하고 통합된 온프레미스 인프라 환경을 구현할 수 있도록 하기 위함이다. 바룬 차브라 부사장은 "고객은 이제 GPU를 얼마나 많이 사느냐보다, 데이터센터 전체를 어떻게 AI에 맞게 설계하고 운영할 수 있는지가 더 중요하다"며 "델 AI 팩토리는 기업이 복잡한 설계 없이 바로 쓸 수 있는 레퍼런스 'AI 공장'을 제공하는 것이 목표"라고 말했다. 이번 개편의 핵심은 새로운 랙 스케일 시스템 '델 파워에지 XE8712'다. 엔비디아와 협력해 선보이는 것으로 'GB200 그레이스 블랙웰 슈퍼칩' 기반이다. 이 시스템은 델 통합 랙과 결합해 랙 단위로 서버·전력·냉각·네트워크 상태를 자동 모니터링하고 최적화하는 '자가 관리형' AI 랙을 지향한다. 랙 한 대에 최대 36노드, 엔비디아 B200 GPU 144개까지 실어 고밀도 연산 성능을 구현하고 직결 액체냉각을 적용해 대규모 언어모델(LLM) 학습과 멀티 노드 추론 시 발생하는 전력·열 문제를 동시에 해결하도록 설계했다. 차브라 부사장은 "랙 차원에서 전력과 냉각, 네트워크까지 함께 설계하는 것이 초대형 AI 환경에서는 필수"라며 "XE8712는 이런 요구를 반영한 랙 스케일 AI 플랫폼"이라고 설명했다. 컴퓨트 라인업도 AI·HPC에 맞게 재정비했다. '파워에지 XE9785/XE9785L'은 AMD '인스팅트 MI355X' GPU와 전용 AI 네트워크카드(NIC)를 탑재한 서버로, 공랭식 10U 모델과 직접 칩을 식히는 액체냉각 3U 모델 두 가지로 제공된다. 내부 벤치마크 기준 기존 MI300X 기반 서버 대비 MLPerf 학습 성능이 최대 2.7배 향상됐고, GPU당 HBM3E 메모리는 288GB까지 확장돼 더 큰 모델과 긴 시퀀스를 한 번에 메모리에 적재할 수 있다. 인텔 제온 6 프로세서를 탑재한 '파워에지 R770AP'는 고빈도 매매(HFT) 등 초저지연 워크로드에 맞춰 연산 성능과 와트당 효율을 끌어올렸다. 차브라 부사장은 "엔비디아, AMD, 인텔과 협력해 다양한 선택지를 제공함으로써 고객이 워크로드에 맞는 최적 조합을 고를 수 있게 하는 것이 델의 전략"이라고 말했다. 네트워크와 스토리지는 '데이터 병목' 해소에 초점을 맞췄다. 델은 개방형 스위치 OS인 '엔터프라이즈 소닉(SONiC) 배포판'에 엔비디아 스펙트럼X를 공식 지원해 델 파워스위치와 엔비디아 기반 스위치를 하나의 패브릭으로 운영할 수 있게 했다. 여기에 스마트패브릭 매니저를 더해 장비 자동 탐지·검증, 블루프린트 기반 자동 구성, 광모듈 텔레메트리와 열 지도 기능을 제공해 수동 설정에 비해 구성 단계를 크게 줄였다. 스토리지 측면에서는 델 파워스케일·오브젝트스케일에 엔비디아 '다이나모' 라이브러리를 연동했다. 자주 쓰는 대규모언어모델(LLM)의 중간 계산 결과를 GPU 메모리에만 쌓아 두지 않고 스토리지로 옮겨 저장해 두었다가 다시 가져다 쓰는 방식으로 GPU 부담을 줄이고 응답 속도를 높이도록 한 것이다. 이를 통해 델 내부 테스트 기준 대규모 컨텍스트 환경에서도 첫 토큰 응답 시간을 1초 수준으로 유지하고 토큰 처리량도 개선한 것으로 나타났다. 차브라 부사장은 "많은 고객이 GPU가 있지만 데이터가 따라오지 못한다는 고민을 안고 있다"며 "네트워크와 스토리지를 AI 워크로드에 맞게 다시 설계한 것이 이번 포트폴리오의 중요한 차별점"이라고 말했다. 자동화와 서비스는 기업의 AI 도입 속도를 끌어올리는 역할을 맡는다. 델은 '델 오토메이션 플랫폼'을 통해 코히어 에이전트, 탭나인 코드 어시스턴트 등 주요 AI 워크로드를 온라인 카탈로그에서 선택해 최소한의 클릭으로 자동 배포할 수 있도록 했다. 이를 통해 수십 단계에 이르는 수작업을 줄이고, 구축 시간을 최대 3분의 1 수준으로 단축할 수 있다는 설명이다. 또 실제 고객 데이터를 활용해 8주 안에 AI 파일럿을 검증하는 'AI 유스케이스 파일럿' 서비스, 액체냉각 인프라를 사전에 점검하는 예방 정비 서비스도 함께 제공한다. 차브라 부사장은 "고객 입장에서는 대규모 투자를 결정하기 전에 자기 환경에서 성능과 효과를 직접 확인하는 것이 가장 중요하다"며 "델은 인프라부터 파일럿 검증, 운영 자동화까지 전 과정을 함께 설계하는 파트너가 되겠다"고 강조했다.

2025.11.18 11:08남혁우

인텔 팬서레이크, LP E코어로 일상 작업 전성비 ↑

[애리조나(미국)=권봉석 기자] 인텔이 지난 9월 29일부터 30일(이하 현지시간) 이틀간 미국 애리조나에서 진행한 연례 기술 행사 '인텔 테크투어 US' 행사에서 차세대 모바일(노트북)용 프로세서 '팬서레이크'(Panther Lake)의 각종 신기능을 대거 공개했다. 30일 오후 시연장에서는 새로 탑재된 '다크몬트' LP E코어 4개의 저전력 구동, NPU를 활용한 음성 인식 자동 프롬프터, GPU 기반 로컬 AI 브라우저, HDR 콘텐츠 재생 시 전력을 최대 50% 절감하는 스마트 파워 기술 등을 공개했다. 특히 행사에서는 인텔이 자체 18A 공정으로 생산한 팬서레이크 컴퓨트 타일 웨이퍼도 전시돼 눈길을 끌었다. 전세대 코어 울트라 200 시리즈가 전량 TSMC에서 생산된 것과 달리, 팬서레이크부터는 CPU·NPU가 집약된 컴퓨트 타일 전량과 GPU 타일 중 일부를 인텔 파운드리에서 직접 생산해 기술 자립도를 높였다. 팬서레이크 LP E 코어, 다중작업 7W대로 처리 팬서레이크는 각종 연산을 담당하는 컴퓨트 타일 안에 새로 개발된 고성능 P코어 '쿠거 코브', 저전력·고효율 E코어 '다크몬트'를 탑재했다. 여기에 대기시나 높은 성능이 필요하지 않은 상태에서 배터리 소모를 줄이는 '다크몬트' LP E코어 4개도 추가됐다. 시연장에서는 마이크로소프트 팀즈, 엑셀, 파워포인트, 10개 탭이 열린 브라우저와 동영상 재생을 LP E코어 4개로만 구동하는 시연이 진행됐다. 팬서레이크 탑재 노트북 시제품은 코어 울트라 200V(루나레이크) 대비 0.7W, 코어 울트라 200H(애로우레이크) 대비 4W 낮은 전력소모를 보였다. 현장 관계자는 "코어 울트라 200H 프로세서에 탑재된 LP E코어는 코어 울트라 시리즈1(메테오레이크)에 탑재된 것과 같은 크레스트몬트로 전력 소모가 컸다. 그러나 팬서레이크에 탑재된 다크몬트 LP E코어는 더 나은 성능을 내면서 전력 소모는 더 낮다"고 설명했다. NPU와 음성인식 기술 결합해 프롬프터 자동 스크롤 프롬프터는 생방송 도중 카메라에 시전을 맞추고 방송 원고를 정확히 읽을 수 있도록 도와주는 장치다. 인텔은 인텔 오픈비노 API, 위스퍼 언어 모델과 방송 장비 전문 기업인 엘가토의 마이크를 결합해 NPU로 자동 스크롤 기능을 구현한 시연을 공개했다. 마이크로 입력되는 음성을 자동 인식해 NPU로 실시간으로 처리하면서 문장을 읽는 속도에 따라 자연스럽게 프롬프터에 나타난 문장이 흘러갔다. 인식하는 언어(영어)가 아닌 한국어나 일본어 등으로 혼잣말을 하면 스크롤이 멈췄다. 현장 인텔 관계자는 "모든 작업이 실시간으로 NPU에서 처리되기 때문에 CPU와 GPU는 4K 카메라 녹화, 스트리밍, AI 분석 등 다른 작업에 집중할 수 있다"며 "실제 출시 시점에는 영어 이외에 한국어 등 더 많은 언어를 지원할 것"이라고 설명했다. 팬서레이크 AI 역량 활용하는 웹브라우저 플러그인 인텔은 팬서레이크의 GPU 등 AI 관련 자원을 활용할 수 있는 웹브라우저 플러그인 형태 프로그램도 개발중이다. '인텔 AI 수퍼브라우저'라는 이 플러그인을 설치하면 클라우드 힘을 빌지 않은 로컬 상태에서 유튜브 영상 요약 등을 수행한다. 현장의 인텔 관계자는 "현재 인텔 AI 수퍼브라우저는 개발 단계에 있으며 GPU만 활용한다. 그러나 개발이 진척되면 NPU를 함께 활용해 효율을 높일 것"이라고 설명했다. HDR 재생시 OLED 패널 전력 소모 최적화 기능 시연 OLED 패널을 탑재한 노트북에서 HDR 모드를 활성화하면 전력 소모가 줄어들고 배터리 지속시간이 급격히 줄어드는 경향이 있다. 현장 인텔 관계자는 "이는 패널이 콘텐츠의 밝기를 감지하지 못하기 때문"이라고 설명했다. 이 관계자는 "인텔은 팬서레이크에 영상 콘텐츠 소스의 밝기를 식별하고 이 정보를 패널에 전달해 휘도 변화에 따라 전압을 동적으로 조정하는 '스마트 파워 HDR' 기술을 탑재했다"고 밝혔다. 시연에서는 세 대의 시스템이 동일한 HDR 콘텐츠를 재생했다. 첫 번째는 일반 HDR 모드(빨간색 그래프), 두 번째도 HDR 모드, 세 번째는 인텔의 최적화된 스마트 파워 HDR(파란색 그래프)로 작동했다. 최적화된 모드는 일반 HDR과 동일한 밝기와 선명도를 유지하면서도 전력 소비는 현저히 낮았으며, 콘텐츠 휘도를 실시간으로 감지해 패널 전압을 동적으로 조절했다. 특히 HDR 콘텐츠에서 SDR 콘텐츠로 전환될 때, 시스템이 자동으로 휘도 변화를 감지하고 패널 전압을 조정해 전력 소비를 SDR 수준까지 낮췄다. 실시간 전력 측정 그래프에서 파란색 선(최적화 HDR)은 SDR 모드의 전력 소비와 거의 동일한 수준이었다. 팬서레이크 컴퓨트 다이 생산한 인텔 18A 웨이퍼도 전시 시연장 한 켠에는 팬서레이크에서 CPU와 NPU, 캐시 메모리 등을 집약한 컴퓨트 타일 웨이퍼가 전시됐다. 팬서레이크의 컴퓨트 타일은 모두 인텔 18A 공정을 활용하며 애리조나 주 오코틸로 소재 인텔 '팹52'에서 생산된다. 인텔 코어 울트라 200V/H는 모든 공정을 대만 TSMC N3B에서 생산했다. 반면 팬서레이크부터는 반도체 타일 중 많은 부분을 인텔 파운드리에서 만들 예정이다. 먼저 면적의 상당 부분을 차지하는 컴퓨트 타일은 인텔 18A에서 생산한다. 또 Xe3 4코어로 구성된 GPU도 극자외선(EUV)을 활용한 인텔 3 공정에서 생산한다.

2025.10.10 00:09권봉석

인텔의 이유 있는 자신감 "보급형 외장 GPU 필요 없다"

[애리조나(미국)=권봉석 기자] "올 연말부터 대량 생산될 차세대 모바일(노트북)용 프로세서, '팬서레이크'(Panther Lake)는 그간 게임 성능을 위해 탑재하던 보급형 외장 GPU 필요성을 줄일 것이다." 29일 오후(이하 미국 현지시간) 미국 애리조나 주 '인텔 테크투어 US' 행사장에서 각국 기자단과 마주한 톰 피터슨 인텔 아키텍처, 그래픽·소프트웨어 펠로우가 이렇게 강조했다. 톰 피터슨 펠로우는 "이제 노트북에서도 AI 기반 프레임 생성 기술 'XeSS-MFG'을 활용해 AAA급 유명 타이틀을 원활하게 구동할 수 있다. 과거 초당 30프레임 대에 그쳤던 게임 성능이 초당 150프레임까지 상승할 수 있을 것"이라고 설명했다. "프레임 생성 신기능 더해 최대 3배 성능 향상" 팬서레이크 내장 GPU인 Xe3는 코어 울트라 200V(루나레이크) 내장 'Xe2' GPU 대비 L1 캐시 33% 확대, L2 캐시 16MB 증설 등으로 클록당 명령어 처리(IPC) 성능을 크게 높였다(관련기사 참조). 톰 피터슨 펠로우는 "Xe3는 전 세대 대비 기본 성능이 최대 50% 향상됐다. 여기에 오늘(29일) 공개한 신기술인 XeSS-MFG(다프레임 생성) 기술을 더하면 기존 대비 최대 3배의 성능 향상을 기대할 수 있다"고 설명했다. 실제로 이날 인텔은 10월 말 출시를 앞둔 일인칭시점슈팅(FPS) 게임인 '페인킬러 리바이벌' 시연을 통해 초당 220프레임을 넘기는 장면을 공개하기도 했다. XeSS 2 지원 게임, XeSS 3로 업그레이드 가능 2020년 이후 출시된 최신 GPU는 상대적으로 처리 시간이 더 짧은 저해상도 화면을 먼저 그린 다음 AI로 해상도를 높이며 초당 프레임 수를 크게 높인다. 인텔은 이 기술에 XeSS(Xe 슈퍼샘플링)라는 이름을 붙였다. XeSS-MFG는 인텔이 제공하는 XeSS 3 기술의 일부이다. 톰 피터슨 펠로우는 "XeSS 2.0을 지원하던 62개 게임이 자동으로 XeSS 3.0을 지원하게 되며, 드라이버 UI에서 간단히 XeSS-MFG 기능을 활성화할 수 있다"고 밝혔다. 단 XeSS-MFG는 현 단계에서 팬서레이크 내장 GPU와 배틀메이지 외장 GPU만 지원한다. 톰 피터슨 펠로우는 "XeSS-MFG 구동 과정에서 AI 처리에서 주로 쓰이는 행렬 연산을 가속하는 XMX(Xe 행렬 확장) 엔진을 활용하기 때문"이라고 설명했다. 신경망처리장치(NPU)를 활용하는 방안에 대해서는 "코파일럿+ 등 다른 작업과 게임이 NPU를 효과적으로 공유하기 어렵다. GPU가 기본 프레임을 생성하고 NPU가 중간 프레임을 생성하는 것이 가장 이상적이지만 NPU 탑재 PC가 더 늘어날 필요가 있다"고 설명했다. "AI 프레임 생성 기술, 지연 시간 크지 않아" AI 프레임 생성 기술은 GPU만 온전히 활용하던 것과 달리 초당 프레임 수는 높일 수 있지만 생성하는 시간이 지연될 수 있다는 우려도 낳는다. 톰 피터슨 펠로우는 "AI 프레임 생성 기술을 활용하는 경우에도 과거 단일 프레임 생성 대비 지연시간이 크게 늘지는 않는다. 최악의 경우에도 한 프레임 시간, 초당 60프레임 기준으로 16ms 정도만 지연된다"고 설명했다. 이어 "대부분의 사용자는 이를 감지하지 못하며, 초당 프레임이 향상되기 때문에 체감 지연 시간은 오히려 줄어든다. 또 XeSS는 지연 시간에 민감한 소비자를 위해 일부 게임을 대상으로 저지연성(LL) 모드도 내장하고 있다"고 덧붙였다. 인텔 클라우드로 게임 데이터 사전 구성... 로딩 시간도 단축 인텔은 팬서레이크 탑재 노트북 대상으로 게임을 처음 실행할 때 로딩 시간을 대폭 줄일 수 있는 '사전 컴파일 셰이더'를 제공할 예정이다. 현재는 밸브가 운영하는 게임 판매 플랫폼 '스팀'에 등록된 게임만 지원한다. 톰 피터슨 펠로우는 "인텔이 구동하는 클라우드 서비스가 게임과 드라이버 변경에 맞춰 셰이더를 자동 업데이트하면, 인텔 게이밍 소프트웨어가 이를 사전 다운로드해 설치하는 방식"이라고 설명했다. 팬서레이크는 CPU와 GPU 부하를 실시간으로 감지해 필요할 경우 GPU에 더 많은 전력을 공급하는 기술인 '인텔리전트 바이어스 컨트롤' v3를 지원한다. 톰 피터슨 펠로우는 "이 기능은 0.001초마다 이를 파악해 세밀하게 작동하는 반응형 기술"이라고 설명했다. 이어 "이 과정에서 저전력·고효율 E(에피션트) 코어를 활용한다. 프레임 하락이나 반응성 저하에 대한 염려가 있을 수 있지만 이는 기우다. E코어 성능은 대부분의 게임에 충분한 성능을 낸다"고 덧붙였다.

2025.10.09 23:57권봉석

팬서레이크 Xe3 GPU, 게임 성능 가속 'XeSS-MFG' 기술 투입

[애리조나(미국)=권봉석 기자] 29일 오후(이하 미국 현지시간) 미국 애리조나 주 '인텔 테크투어 US' 행사장. 톰 피터슨 인텔 아키텍처, 그래픽·소프트웨어 펠로우가 10월 말 출시를 앞둔 일인칭시점슈팅(FPS) 게임인 '페인킬러 리바이벌' 시연을 시작했다. "이것은 게임 개발사인 안샤 스튜디오와 협력해 처음 공개하는 시연이다. 팬서레이크로 구동되고 있으며 동기화 기능(V싱크)을 끈 1920×1080 해상도에서 초당 220프레임을 소화한다. 오늘 공개할 신기술을 활용해 이런 성능을 구현했다." 이날 톰 피터슨 펠로우는 팬서레이크 내장 GPU 'Xe3'에서 구동되는 AI 기반 프레임 생성 기술 'XeSS-MFG'와 지능형 전력 제어 시스템 등을 현지에 참여한 기자단에 공개했다. Xe3, 전세대 대비 프레임 생성 지연시간 단축 팬서레이크 내장 GPU인 Xe3는 코어 울트라 200V(루나레이크) 내장 'Xe2' GPU 대비 L1 캐시 33% 확대, L2 캐시 16MB 증설 등으로 클록당 명령어 처리(IPC) 성능을 크게 높였다(관련기사 참조). 톰 피터슨 펠로우는 "그래픽 고정함수 유닛 강화와 벡터 엔진 스레드 확장, 개선된 레이 트레이싱 유닛 덕분에 마이크로 벤치마크에서 최대 50% 이상 성능 향상을 달성했다"고 설명했다. 한 프레임을 구성하는 데 필요한 시간은 전 세대(45ms) 절반 수준인 22ms까지 줄어들었다. 렌더 프리패스 단계에서 2.93ms, L2 캐시 확대로 0.39ms, 레지스터 활용 최적화로 1.63ms를 아껴 같은 시간에 더 많은 프레임을 처리하게 됐다. 게임 체감 성능 최대 네 배 강화 'XeSS-MFG' 공개 2020년 이후 출시된 최신 GPU는 상대적으로 처리 시간이 더 짧은 저해상도 화면을 먼저 그린 다음 AI로 해상도를 높이며 초당 프레임 수를 크게 높인다. 인텔은 이 기술에 XeSS(Xe 슈퍼샘플링)라는 이름을 붙였다. 톰 피터슨 펠로우는 "예전에는 모든 프레임을 GPU가 일일이 그려야 했지만 이제는 AI가 저해상도 이미지를 업스케일(SR)하고, AI 프레임 생성(FG)으로 초당 프레임을 높인다"고 설명했다. 팬서레이크 내장 Xe3는 한 단계 나아가 신기능인 XeSS-MFG(다프레임 생성) 기능을 지원한다. 톰 피터슨 펠로우는 "기준 프레임 두 개로 최대 세 개 중간 프레임을 AI로 생성하며 체감상 최대 4배 성능 향상 효과가 있다"고 밝혔다. "게임 로딩 시간 단축·끊김 현상 완화 기술 제공" 게임을 처음 실행할 때 로딩 단계에서 그래픽 데이터를 재구성하는 과정을 겪는다. 데스크톱 PC 대비 성능이 제한된 노트북에서는 실제 게임 실행까지 많은 시간이 걸린다. 톰 피터슨 펠로우는 "인텔이 클라우드를 활용해 필요한 데이터를 미리 구성한 다음 게임을 처음 실행하면 이 데이터를 다운로드해 지연 시간을 줄이는 '사전 컴파일 셰이더'를 제공할 것"이라고 밝혔다. 이어 "CPU와 GPU 부하를 실시간으로 감지해 필요할 경우 GPU에 더 많은 전력을 공급하는 기술인 '인텔리전트 바이어스 컨트롤' v3를 이용해 화면 끊김 현상을 최소화할 예정"이라고 설명했다.

2025.10.09 23:37권봉석

인텔 "팬서레이크 내장 GPU, AI 성능 2배↑"

[애리조나(미국)=권봉석 기자] 인텔은 2011년 '빌트인 비주얼'을 내세우며 프로세서 안에 내장 그래픽칩셋을 탑재하기 시작했다. 이후 2018년부터 자체 개발한 Xe GPU 아키텍처를 이용해 내장 그래픽칩셋과 그래픽카드 등을 시장에 공급하고 있다. 지난 해 코어 울트라 200V(루나레이크)에 탑재된 Xe2 코어 기반 GPU는 기본 성능 강화로 1080p 해상도 게임 성능을 강화했다. 코어 울트라 200V의 AI 연산 성능은 GPU 67 TOPS(1초당 1조 번 연산), 신경망처리장치(NPU)는 48 TOPS에 달한다. 인텔 차세대 모바일(노트북)용 프로세서 '팬서레이크'는 GPU AI 연산 성능을 두 배 가까운 120 TOPS, NPU 연산 성능은 소폭 상승한 50 TOPS로 높였다. 여기에 CPU(10 TOPS)를 더하면 최대 연산 성능은 180 TOPS까지 향상된다. 29일 오전(이하 현지시간) 미국 애리조나 주 '인텔 테크투어 US' 행사장에서 톰 피터슨 인텔 아키텍처, 그래픽·소프트웨어 펠로우는 "GPU와 NPU 강화는 AI와 에이전틱 워크로드(작업)가 등장하며 변화하는 PC 요구사항을 충족하기 위한 것"이라고 설명했다. Xe3 코어 4개/6개 묶음으로 이원화... 최대 12코어 구성 가능 팬서레이크에 탑재될 내장 GPU는 Xe3 코어 기반이며 코드명 '배틀메이지', '아크 B시리즈'라는 이름으로 출시된다. 코어 울트라 200V에 탑재된 GPU는 Xe2 코어 4개와 레이트레이싱 유닛 4개를 한데 묶은 '렌더 슬라이스(조각)' 2개를 이용해 총 8코어로 구성됐다. 팬서레이크의 렌더 슬라이스는 ▲ Xe3 코어·레이트레이싱 유닛 4개 구성 ▲ Xe3 코어·레이트레이싱 유닛 6개 구성 등 총 두 개로 구성된다. 전자는 8코어 CPU(4P+4E)/16코어 CPU(4P+8E/LP 4E)와 결합되며 4코어 렌더 슬라이스 하나만 이용한다. 후자는 16코어 CPU(4P+8E/LP 4E)와 짝을 이루며 6코어 렌더 슬라이스 2개를 활용해 12코어 GPU를 만든다. Xe3, 처리 가능 데이터에 FP8 추가 Xe3 코어는 512비트 벡터 엔진 8개, AI 연산에 필요한 XMX(Xe 행렬 확장) 엔진 8개로 전세대 Xe3 코어와 차이가 없다. 그러나 데이터를 임시 저장하는 캐시를 33% 늘려 지연 시간과 성능을 향상시켰다. XMX 엔진은 INT2(정수 2비트), INT4, INT8, FP16(부동소수점 16비트), BF16, TF32 등 자료형을 처리할 수 있다. 여기에 정밀도에는 큰 차이가 없지만 연산 속도가 더 빠르고 배터리 소모가 적은 FP8(부동소수점 8비트) 양자화를 더했다. AI 연산 성능은 INT8 자료형 기준 최대 120 TOPS다. 전 세대인 코어 울트라 200V 프로세서 성능을 GPU 하나만으로 감당하게 됐다. 전세대 대비 GPU 성능 최대 50% 향상 인텔은 Xe2/Xe3 대상으로 실시한 자체 벤치마크 결과를 토대로 Xe3 GPU의 성능이 전 세대 대비 평균 50% 향상됐고 깊이 쓰기(Depth write) 벤치마크에서는 7배 이상 성능이 높아졌다고 설명했다. 톰 피터슨 펠로우는 "Xe3 GPU의 최대 성능은 루나레이크 대비 50% 높아졌고 애로우레이크H 대비 같은 전력에서 40% 더 높은 성능을 낸다"며 "게임용 고성능 노트북뿐만 아니라 휴대성을 강조한 소형·경량 노트북에서도 GPU 경쟁력을 확보했다"고 설명했다. 인텔은 마이크로소프트와 협력해 윈도 운영체제 그래픽 라이브러리인 다이렉트X 12에 Xe3 GPU의 XMX 연산 능력을 활용하는 '협동 벡터'(Cooperative Vectors)도 도입했다. 행사에서는 이를 활용해 2D 이미지로 3차원 입체를 만드는 'NeRF' 기술도 시연했다. NPU 5는 성능보다 작동 효율 향상에 방점 NPU는 소음 감소나 배경 흐림 등 최대한 전력을 적게 소모하며 상시 구동돼야 하는 작업에 최적화됐다. 팬서레이크에 탑재된 NPU 5도 전 세대 'NPU 4' 대비 연산 효율을 높이는 한편 인텔 18A 공정 적용으로 작동 효율을 높였다. NPU 4는 AI 처리에서 주로 쓰이는 MAC(Multiply–accumulate, 곱셈 가산) 연산과 DSP 처리를 수행하는 뉴럴 컴퓨트 엔진을 6개 탑재해 48 TOPS급 성능을 구현했다. 반면 NPU 5는 뉴럴 컴퓨트 엔진 수를 줄이는 대신 MAC를 처리하는 'MAC 어레이' 크기를 2배로 늘렸다. 톰 피터슨 펠로우는 "NPU 5는 FP16 대비 에너지 소모를 50% 줄이면서 유사한 품질을 얻을 수 있는 FP8(부동소수점 8비트)를 지원해 스테이블 디퓨전 등 생성 AI 작업에 필요한 전력량을 108J(줄)에서 30% 낮은 70J(줄)까지 끌어내렸다"고 설명했다. Xe3 4코어 GPU는 인텔 3 공정서 생산 예정 인텔은 노트북용 프로세서에 탑재되는 대부분의 내장·외장 GPU를 대부분 인텔 파운드리가 아닌 대만 TSMC에서 생산했다. 그러나 팬서레이크부터는 GPU 타일 중 Xe3 4코어 내장 제품을 극자외선(EUV) 기반 자체 공정인 인텔 3(Intel 3)에서 생산 예정이다. 팬서레이크는 레이트레이싱과 그래픽 연산에 필요한 각종 요소를 떼어내 GPU 타일로 분리했다. CPU는 그대로 두고 GPU를 더 강력한 제품으로 교체하는 것도 얼마든지 가능하다. 인텔은 이를 위해 더 강력한 GPU인 'Xe3P'도 준비중이다. 톰 피터슨 펠로우는 "CPU(경량 AI 모델), NPU(저전력 상시구동 윈도11 코파일럿+), GPU(대형언어모델 / 생성 AI) 등 3개 요소를 균형있게 강화해 AI 처리를 최적화하는 것이 인텔 목표"라고 강조했다.

2025.10.09 22:45권봉석

인텔 "팬서레이크, 성능·효율성 모두 잡은 차세대 플랫폼"

[애리조나(미국)=권봉석 기자] "팬서레이크는 코어 울트라 200V(루나레이크)의 전력 효율성과 200H/S(애로우레이크)에서 얻은 성능을 모두 계승한 강력한 아키텍처다." 29일 오전(이하 현지시간) 미국 애리조나 주 '인텔 테크투어 US' 행사장에서 아리크 기혼 인텔 클라이언트 SoC 아키텍처 수석 엔지니어가 이렇게 설명했다. 팬서레이크는 인텔이 AI PC 시장을 겨냥해 개발한 모바일(노트북)용 새 프로세서다. 1.8나노급 인텔 18A 공정에서 생산한 컴퓨트 타일(CPU)과 GPU, 신경망처리장치(NPU)를 결합했다. AI 처리 성능은 최대 180 TOPS(1초당 1조번 연산)로 코어 울트라 200V 프로세서(120 TOPS)로 50% 가까이 향상됐다. 3개 타일 조합해 SOC 구성... GPU 타일 완전 분리 팬서레이크는 ▲ 각종 범용 연산을 담당하는 CPU, 카메라 영상을 처리하는 영상처리장치(IPU), NPU와 Xe 미디어·디스플레이 엔진, 메모리 컨트롤러를 모은 '컴퓨트 타일', ▲ 썬더볼트4와 USB, 와이파이/블루투스를 담당하는 '플랫폼 제어 타일' ▲ Xe3 코어와 레이트레이싱 등을 처리하는 GPU 타일 등 총 3개 타일로 구성된다. 아리크 기혼 수석 엔지니어는 "코어 울트라 200V 프로세서에 처음 적용된 스케일러블 패브릭 기술을 2세대로 진화시켜 다양한 공정이나 IP에 관계없이 컴퓨트(CPU·NPU) 타일, GPU 타일, 플랫폼 제어 타일 등을 자유롭게 조합할 수 있게 됐다"고 설명했다. 눈에 띄는 것은 GPU 연산만 담당하는 GPU 타일을 완전히 독립된 상태로 구성했다는 점이다. 전력 소모나 가격대, 배터리 지속시간 등 요구사항에 맞춰 GPU에 내장된 코어 수를 달리하며 체급이 다른 프로세서를 공급할 수 있다. GPU 성능을 극대화한 새로운 프로세서 출시 가능성도 열어뒀다. GPU·NPU 성능 개선으로 AI 처리 성능 향상 팬서레이크는 GPU와 NPU 성능을 높여 AI 처리 성능 향상에 큰 중점을 뒀다. GPU는 Xe3 코어와 16MB L2 캐시, 레이트레이싱 유닛 12개로 구성할 경우 전 세대 대비 최대 50% 향상된 최대 120 TOPS급 연산이 가능하다. NPU 5는 내부 구조를 최적화하는 한편 처리 속도와 배터리 지속시간에 강점을 지닌 FP8(부동소수점, 8비트) 연산을 추가했다. NPU를 포함한 컴퓨트 타일 생산에 1.8나노급 인텔 18A가 쓰이면서 차지하는 면적도 줄었다. 최대 연산 속도는 50 TOPS 급이다. 일반적인 연산을 처리하는 CPU는 고성능 P(퍼포먼스) 코어와 저전력·고효율 E(에피션트) 코어를 결합한 하이브리드 구조를 유지했다. 처음부터 인텔 18A 공정에 최적화돼 저전력 고성능을 추구했다. P코어는 지난 해 공개된 '라이언코브' 후속 제품인 '쿠거 코브', E코어 역시 지난 해 공개된 '스카이몬트' 후속 제품인 '다크몬트'를 투입했다. 다만 완전히 새롭게 설계되지는 않아 성능 향상 폭은 적을 것으로 보인다. CPU·GPU 코어 수 따라 최대 3개 구성 공급 인텔은 팬서레이크 내장 CPU와 GPU 코어 수를 달리해 최대 3개 구성을 주요 PC 제조사에 공급 예정이다. 성능에 따라 패키징이 달랐던 것과 달리 팬서레이크의 패키징은 동일해 PC 제조사가 프로세서 구성만 교체하는 방식으로 다양한 제품을 출시할 수 있다. 8코어 CPU(4P+4E)와 Xe3 코어 4개 탑재 프로세서는 성능과 배터리 지속시간의 균형을 추구한 구성이다. LPDDR5X-6800MHz, DDR5-6400MHz 메모리를 지원한다. PCI 익스프레스 4.0 레인(lane, 데이터 전송 통로)은 8개, PCI 익스프레스 5.0 레인은 4개다. 16코어 CPU(4P+8E/LP 4E)와 Xe3 코어 4개 탑재 프로세서는 PCI 익스프레스 5.0 레인을 12개로 늘리는 한편 LPDDR5X-8533MHz/DDR5-7200MHz 메모리를 지원한다. 콘텐츠 제작이나 게임 등 외부 GPU 탑재를 염두에 뒀다. 최상위 제품인 16코어 CPU와 Xe3 코어 12개는 GPU 성능을 극대화한 한편 LPDDR5X-9600MHz 메모리만 지원한다. 얇은 폼팩터에서 AI와 그래픽 성능을 강화한 프리미엄 제품을 겨냥했다. 화면 위 웹캠 영상을 처리하는 IPU 7.5와 최대 50 TOPS 연산이 가능한 5세대 NPU 'NPU 5'는 모든 구성에 동일하게 유지된다. "다양한 용도에 걸쳐 차세대 모바일 경험 제공할 것" 아리크 기혼 수석 엔지니어는 "팬서레이크는 인텔 18A 공정과 포베로스 패키징을 통해 AI, 그래픽, 게이밍, 크로스 플랫폼 워크로드를 모두 아우르는 차세대 모바일 경험을 제공할 것"이라고 강조했다. 이어 "PC 제조사는 필요에 따라 메모리와 GPU 구성을 보다 자유롭게 선택할 수 있으며 이를 접하는 소비자 역시 향상된 전원 관리 메커니즘으로 배터리 모드와 전원 어댑터 모드 사이에서 큰 차이 없는 성능을 체험할 수 있을 것"이라고 덧붙였다.

2025.10.09 22:15권봉석

인텔, 워크스테이션용 '아크 프로' 2세대 GPU 공개 임박

인텔이 워크스테이션용 '아크 프로' 2세대 GPU를 이르면 이달 하순 진행되는 '컴퓨텍스 타이베이 2025' 기간 중 공개 예정이다. 2023년 '아크 프로 A60' 출시 이후 약 2년만이다. 인텔은 연산 성능과 전력 효율, AI 처리를 최적화한 Xe2 아키텍처 기반 아크 2세대 GPU(배틀메이지)를 지금까지 데스크톱PC용 B570/B580 그래픽카드와 노트북용 코어 울트라 200V(루나레이크) 내 GPU 타일에만 공급했다. 아크 프로 2세대 GPU는 기존 데스크톱PC용으로 출시된 아크 B580(BMG-G21)을 기반으로 최대 24GB 메모리를 탑재해 AI 처리를 강화할 것으로 보인다. 초급 AI 개발자나 보급형 워크스테이션 탑재가 예상된다. 지난 해 9월부터 노트북·데스크톱용 제품 출시 인텔 아크 2세대 GPU는 연산 성능을 개선한 Xe2 코어로 구성됐다. 전세대 Xe 코어 대비 전력 효율과 AI 처리 성능 향상에 중점을 뒀다. AI 연산에 필요한 XMX(Xe 행렬 확장) 엔진이 추가됐고 INT2, INT4, INT8, FP16, BF16 등 AI 연산이 요구하는 자료형을 폭넓게 지원한다. Xe2 코어를 적용한 GPU는 코어 울트라 200V(루나레이크) 프로세서에 내장된 아크 130V/140V GPU, 데스크톱PC용으로 출시된 아크 B570/B580 등이 전부다. 노트북용 코어 울트라 200H(애로우레이크)에는 아크 1세대 GPU에 XMX를 더한 제품이 탑재됐다. 반면 일반 소비자용 제품과 달리 Xe2 아키텍처를 적용한 워크스테이션용 GPU는 현재까지 출시되지 않았다. 티저 이미지로 아크 프로 2세대 GPU 공개 예고 인텔은 2022년 8월 모바일(노트북) 워크스테이션용 '아크 프로 A30M', 데스크톱PC용 '아크 프로 A40·A50'을 시작으로 2023년 '아크 프로 A60·A60M'까지 총 5종의 전문가·워크스테이션용 GPU를 출시했다. 그러나 인텔은 8일 공식 X(구 트위터) 계정에 '새 인텔 아크 프로 GPU가 기다리고 있다. 타이베이에서 만나자'며 아크 프로 GPU 탑재 그래픽카드로 추정되는 티저 이미지를 노출했다. AI·LLM 처리 위해 최대 24GB 메모리 탑재 전망 아크 프로 2세대 제품 관련 정보는 이미 지난 3월 말부터 포착되기 시작했다. 아크 B580의 다이(Die)에 부여된 모델명인 'BMG-G21' 관련 부품이 베트남으로 선적됐다는 사실이 드러난 바 있다. 전 세대 제품인 아크 프로 A60이 탑재 가능한 메모리는 최대 12GB다. 그러나 매개변수(패러미터)가 100억 개 이상인 거대언어모델(LLM) 용량은 8GB에서 10GB를 가볍게 넘어서며 이를 원활히 처리하려면 최소 16GB 이상이 필요하다. BMG-G21(B580)은 Xe2 코어 20개로 구성됐고 최대 24GB 메모리를 탑재할 수 있다. 곧 공개될 아크 프로 그래픽카드도 최대 24GB 메모리를 탑재해 의료 영상 분석, 8K 영상 편집 등 대용량 데이터 처리 최적화를 꾀할 것으로 보인다. 인텔, 이달 하순 타이베이서 브리핑 진행 단 아크 B580 GPU의 성능은 엔비디아 지포스 RTX 4060과 비슷하거나 조금 아래 수준인 것으로 평가된다. 이에 따라 고성능보다는 가격 대비 성능을 앞세워 보급형 워크스테이션이나 AI 개발자를 겨냥할 것으로 보인다. 관련 업계에 따르면 인텔은 이달 하순 컴퓨텍스 타이베이 2025 기간 중 각국 기자단을 대상으로 아크 프로 GPU 관련 브리핑을 진행할 예정이다. 구체적인 제품군(SKU)과 출시 일정도 해당 시점에 공개될 전망이다.

2025.05.09 16:22권봉석

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

AI PC 확산 본격화... 새해도 GPU·NPU 성능 경쟁 예고

[유미's 픽] "주사위는 던져졌다"…국대 AI 첫 탈락자, 1차 발표회서 판가름?

엔씨 '아이온2', 달라진 '소통 운영'에 새해 전망도 '맑음'

정부, 쿠팡 사태에 "법적으로 가능한 모든 방안 조치"

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.