[기기검증] 인텔 아크 2세대 'B580', 얼마나 빨라졌나
인텔이 오는 16일부터 데스크톱PC용 아크 2세대 GPU(배틀메이지) 탑재 그래픽카드를 국내 시장에 본격 공급한다. 2022년 10월 아크 1세대 GPU '알케미스트'(Alchemist) 탑재 A770·A750 그래픽카드 출시 이후 약 2년만이다. 아크 B시리즈는 지난 9월 출시된 노트북용 프로세서, 코어 울트라 200V(루나레이크) 내장 GPU와 같은 Xe2 코어 기반으로 구성됐다. 연산 폭을 넓히고 AI 연산에 필요한 XMX 등을 지원한다. 저해상도 화면을 AI로 업스케일하는 '슈퍼 레졸루션'(SR) 이외에 AI를 이용해 게임 장면 사이 프레임을 추가로 그리는 '프레임 생성'(FG), 프레임 구성시 지연 시간을 낮추는 '저지연성'(LL) 등 3개 기술을 지원한다. B580(BMG-G21)은 Xe2 코어 20개로 구성됐다. 인텔은 전 세대 대비 코어 당 성능은 70%, 소비 전력 당 성능은 50% 향상됐다고 설명했다. B580 탑재 인텔 한정판 그래픽카드로 벤치마크와 게임 등 소프트웨어를 이용해 성능 향상 폭을 확인했다. 디스플레이포트 2.1 단자로 최대 8K 60Hz 화면 표시 가능 인텔이 대여한 B580 한정판 그래픽카드는 전 세대 상위급 제품인 A750과 크기나 냉각 방식(냉각팬 2개)에 큰 차이가 없다. 영상 출력 단자는 디스플레이포트 2.1 3개, HDMI 2.1a 1개 등 총 4개로 전 세대와 같다. 디스플레이포트는 8K(7680×4320) 60Hz, 4K(3840×2160) 360Hz 등 고주사율 디스플레이를 지원하며 HDMI 2.1 단자는 8K 120Hz, 4K 480Hz를 지원한다. 전력 공급은 PCI 익스프레스 8핀만으로 공급받는다. A750은 최대 225W를 쓰므로 전원 공급도 8+6핀만 이용한다. 반면 B580은 TSMC 5나노급(N5) 적용 등으로 최대 소모 전력을 190W까지 낮췄다. 3D마크 타임스파이 측정값 전세대 대비 20% 향상 UL 솔루션즈(구 퓨처마크)가 개발한 벤치마크 프로그램인 3D마크는 실제 게임 화면을 흉내낸 여러 시나리오로 그래픽카드와 프로세서 성능을 동시에 측정할 수 있다. 각 테스트 결과에서 초당 프레임 수를 이용해 성능 향상 폭을 살펴봤다. 다이렉트X 12 얼티밋 기반 화면을 그리며 성능을 측정하는 대표 시나리오 '타임스파이'(Time Spy)에서는 첫 번째 시나리오와 두 번째 시나리오 모두 전 세대 상위 제품(A750) 대비 20% 프레임 수가 상승했다. '스틸노매드'(Steel Nomad)는 타임스파이 대비 처리 부하를 4K 해상도 기반으로 3배 높인 테스트다. 타임스파이 대비 극적인 성능 향상은 없지만 다이렉트X 12와 불칸(Vulcan) 등 그래픽 API 사이에 큰 차이가 없다는 것도 특기할 점이다. XeSS 활성화시 최대 2배 프레임 향상 인텔 아크 GPU는 원래 해상도보다 낮은 화면을 그린 다음 AI로 업스케일링해 GPU 부하는 줄이면서 비슷한 품질 화면을 보여주는 XeSS(Xe 슈퍼샘플링) 기능을 지원한다. 3D마크에 내장된 XeSS 성능 테스트로 초당 프레임과 성능 향상 폭을 확인했다. XeSS는 성능과 화면 품질에 따라 성능, 균형, 품질, 울트라 등 4개 모드를 갖췄으며 일반적으로 '균형'(Balanced) 모드를 많이 활용한다. XeSS 활성화시 풀HD(1920×1080 화소) 보다 QHD(2560×1440 화소) 등 해상도가 높아질 수록 성능 향상 폭이 크다. 단 실제 게임에서는 가장 이상적인 경우 30% 정도 성능 향상을 확인할 수 있다(아래 테스트 참조). 사이버펑크 2077에서 초당 프레임 최대 30% 향상 게임 5종에 내장된 벤치마크 기능을 이용해 초당 프레임을 측정했다. 풀HD 해상도에서는 적게는 16%(파크라이5)부터 많게는 38%(사이버펑크 2077) 등 모든 게임에서 두 자릿수 성능 향상을 볼 수 있다. QHD 해상도에서는 전 세대 대비 최저 21%(파크라이5), 최대 30%(사이버펑크 2077) 성능 향상이 있다. 그래픽 수준 '높음' 설정시 쾌적함을 느낄 수 있는 최저 수준인 초당 60프레임은 모두 넘어섰다. XeSS를 활성화할 때 성능 향상 폭도 B580이 더 크다. GTA Ⅴ는 모든 해상도, 모든 그래픽카드에서 거의 같은 성능을 보인다. 개발 시점 당시인 2010년 초반 주류 프로세서인 4코어 프로세서 위주 최적화와 다이렉트X 11로 개발된 게임 엔진 등이 영향을 미쳤다. 향후 최신 하드웨어 테스트에는 활용하기 어렵다. ※ 테스트 조건 : 모든 게임은 내장 벤치마크 모드 활용. V싱크 기능과 프레임 제한 기능은 해제. 그래픽 옵션은 '높음'. XeSS는 '균형'(Balanced)으로 설정. XeSS·프레임 생성 활성화시 기본 대비 프레임 2배 상승 인텔이 아크 2세대에 탑재한 XeSS 2는 화면 업스케일 기능 '슈퍼 레졸루션' 이외에 게임 장면 사이 프레임을 추가로 그리는 '프레임 생성'(FG) 기능을 포함했다.13일 현재 이를 정식 지원하는 게임은 EA가 개발한 F1 24가 유일하다. 해상도는 QHD, 그래픽 수준은 '높음'(High)과 '매우 높음'(Ultra High)로 설정하고 XeSS 2 각 기능 설정시 성능 추이를 확인했다. 아무 기능도 적용하지 않은 상태에서는 '매우 높음'에서 초당 프레임이 50프레임까지 떨어져 원활한 구동이 어렵다. XeSS 적용시는 81프레임까지 올라가며 프레임 생성 기능까지 추가로 활성화하면 초당 프레임이 기본 상태 대비 2배 이상 늘어난다. 이를 지원하는 게임이 늘어나면 고해상도에서 더 높은 프레임을 뽑아낼 수 있을 것으로 보인다. ※ 벤치마크 설정 : Australia, Wet, Loop 3, 카메라 시점 순환(Cycle). XeSS 수준은 '균형'(Balanced). AI 이미지 생성·LLM 초당 토큰도 B580 앞서 아크 2세대를 구성하는 Xe2 코어는 512비트 벡터 엔진 8개에 AI 연산에 필요한 XMX(Xe 행렬 확장) 엔진을 추가하고 INT2, INT4, INT8, FP16, BF16 등 AI 연산이 요구하는 자료형을 폭넓게 지원한다. UL 솔루션즈 프로시온(Procyon)에 내장된 AI 이미지 생성 벤치마크는 스테이블 디퓨전 1.5로 이미지 생성 시간을 측정한다. 속도는 빠르지만 정밀도가 떨어지는 INT8, 정밀도가 높은 FP16 두 테스트에서 B580의 소요 시간이 더 짧다. AI 텍스트 생성 벤치마크는 비교적 최근에 출시된 거대언어모델(LLM) 벤치마크이며 파이3.5, 미스트랄(70억), 라마 3.1(80억), 라마2(130억) 등 4개 LLM 구동시 성능을 측정한다. B580은 A750(8GB) 대비 넉넉한 메모리(12GB)와 빠른 처리 속도를 살려 초당 토큰(단어) 생성 수에서 60% 가량 성능 향상이 있다. A750은 라마2 실행시 초당 토큰 수가 극히 떨어지는데 메모리 용량에 제약을 받은 것이 원인으로 보인다. ※ 벤치마크 설정 : 프로시온 권장치인 '인텔 오픈비노'(OpenVINO) 프레임워크 이용. 전 세대 대비 확실한 성능 향상... 늦은 출시 시기는 유감 인텔이 아크 시리즈에 붙이는 모델명은 3, 5, 7로 구성된다. 비교에 쓰인 A750은 상위 제품, 이번에 출시될 B580은 중간급 제품이다. 전 세대 상위권 제품을 현 세대 한 단계 아래 제품이 더 앞서는 결과를 보여줬다. 아크 A750용 드라이버는 출시 이후 2년간 업데이트를 거치며 꾸준히 성능이 향상된 반면 B580은 드라이버 최적화를 통해 성능이 더 향상될 여지가 남아 있다. '프레임 생성' 기능을 지원하는 게임 확보가 관건이다. 이미 아크 A750/A770은 동영상 처리 가속, 혹은 AI 모델 개발용으로 틈새 수요를 찾아 보급된 상태다. 아크 B580은 게임 성능을 향상시키고 경쟁 제품 대비 더 넉넉한 12GB 메모리를 탑재해 전 세대 대비 주목을 받을 가능성이 더 커졌다. 다만 출시 시기가 적어도 반 년 정도 빨랐더라면 엔비디아나 AMD 등 기존 그래픽카드 제조사의 대안을 찾는 소비자들의 좋은 선택지가 됐을 것이다. 인텔 권장가는 249달러(약 35만 6천원)지만 최근 오른 원-달러 환율로 국내 유통가도 비싸질 것으로 보인다. ※ 테스트 시스템 제원 메인보드 : 에이수스 ROG 막시무스 Z890 히어로 (바이오스 1101) -인텔 디폴트 설정(Intel Default Settings), 퍼포먼스(Performance) 프로세서 : 인텔 코어 울트라9 285K (정격 클록 작동) 메모리 : 커세어 DDR5-6400MHz 16GB×2 (32GB) SSD : 씨게이트 파이어쿠다 540 2TB (PCIe 4.0) 그래픽카드 : 아크 A750 (8GB, 드라이버 32.0.101.6319), 아크 B580 (12GB, 드라이버 32.0.101.6252) 냉각장치 : 에이수스 ROG RYUJIN Ⅲ 60×3 (수랭식 3열 일체형) 운영체제 : 윈도11 프로 24H2 (10.0.22621.674, UEFI, 성능 최상, 절전모드 끔, VBS 활성화)