• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
  • AI의 눈
반도체
인공지능
AI의 눈
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'아크 프로'통합검색 결과 입니다. (5건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

래블업 "인텔 '아크 프로 B70', RTX 프로 4000 대비 추론 처리량 높아"

AI 시장의 중심이 모델 학습에서 추론과 에이전틱 AI 서비스 운영으로 이동하면서 GPU 내장 메모리 용량의 중요성이 커지고 있다. 거대언어모델(LLM)에서 길게 이어지는 대화의 맥락을 처리하고 여러 이용자를 동시에 처리하려면 대용량 메모리가 중요하다. 특히 에이전틱 AI는 장시간 대화 맥락을 유지하고 여러 작업을 병렬 처리해야 하는 만큼 GPU 메모리 사용량이 급격히 증가한다. 이 과정에서 이전 추론 결과를 저장하는 'KV 캐시(Key-Value Cache)'가 중요한 역할을 한다. KV 캐시가 충분하지 않으면 기존 KV 캐시 데이터를 제거하거나 재배치해야 하며 이 과정에서 처리량이 감소하거나 응답 지연이 발생할 수 있다. 반대로 KV 캐시를 담을 메모리 용량이 충분하면 더 많은 사용자 요청과 긴 컨텍스트를 동시에 처리할 수 있다. 래블업, '백엔드.AI'에서 LLM 2종 대상 벤치마크 수행 국내 AI 플랫폼 기업인 래블업은 최근 엔터프라이즈 AI 인프라 운영 플랫폼 '백엔드.AI'에서 인텔 아크 프로 B70과 엔비디아 RTX 프로 4000 블랙웰을 대상으로 한 LLM 벤치마크 결과를 공개했다.(인텔 제온 w9-3475X, 우분투 25.10 환경) 인텔 아크 프로 B70은 지난 3월 말 출시된 워크스테이션용 GPU로 AI 추론 수요를 겨냥했다. Xe2 코어 32개와 32GB 메모리 기반으로 대용량 AI 모델을 분할 없이 구동할 수 있다는 점이 차별화 포인트다. 연산 성능은 최대 367 INT8 TOPS(초당 1조 회 연산) 수준이며 GDDR6 32GB 메모리를 탑재해 중소규모 기업과 개발자가 대형 언어모델(LLM)을 로컬 환경에서 직접 구동할 수 있게 했다. 비교 대상이 된 RTX 프로 4000 블랙웰은 쿠다 코어 8960개, ECC GDDR7 24GB 메모리를 탑재했고 메모리 대역폭은 672GB/s 수준이다. Qwen3 8B 모델에서 동시 요청시 초당 처리량 향상 현재 기업들이 활용하는 7B~30B급 오픈소스 LLM은 추론 과정에서 상당한 KV 캐시 공간을 요구하기 때문에 24GB와 32GB 메모리의 차이가 실제 처리량 격차로 이어질 수 있다. 래블업이 Qwen3 8B 모델을 기반으로 수행한 8K 컨텍스트 테스트에서 아크 프로 B70은 동시 요청 수가 늘어나도 초당 처리량이 꾸준히 높아졌다. 반면 RTX 프로 4000 블랙웰은 동시 요청 수가 16개 수준에 도달하자 메모리 부족 현상으로 처리량이 급감했다. 이 테스트에서 아크 프로 B70은 엔비디아 GPU 대비 최대 2.24배 높은 처리량을 기록했다. 컨텍스트 길이를 32K까지 늘린 환경에서는 격차가 더욱 커졌고 특정 구간에서는 아크 프로 B70이 최대 4배 이상 높은 처리량을 보였다. 이는 AI 에이전트 시대에 GPU 연산 성능 못지않게 메모리 용량이 중요해지고 있음을 시사한다. GPT-OSS 20B에서도 RTX 프로 4000 대비 처리량 25% 우위 GPT-OSS 20B 모델을 이용한 테스트에서도 비슷한 경향이 확인됐다. 아크 프로 B70은 동시 요청 수가 증가해도 안정적으로 성능을 유지했으며 32개 동시 요청 환경에서 RTX 프로 4000 블랙웰 대비 25% 처리량이 높았다. 래블업은 실제 벤치마크에서 아크 프로 B70의 KV 캐시 활용 가능 용량이 RTX 프로 4000 블랙웰 대비 평균 2배 수준으로 나타났다고 설명했다. 래블업 관계자는 "이에 따라 모델 가중치를 적재한 이후에도 더 많은 메모리 여유 공간을 확보할 수 있다"고 설명했다. 이어 "처리량과 가격을 함께 고려한 비용 효율 분석에서도 아크 프로 B70이 더 나은 결과를 보였고 AI 서비스 운영에 중요한 토큰당 비용 기준으로는 최대 8배 이상의 효율 향상이 가능하다"고 분석했다. AI 에이전트 등장에 GPU 메모리 용량 중요성 ↑ 래블업은 "장비와 솔루션 도입 시 토큰 처리 비용은 주요 검토 항목 중 하나이며 처리량과 GPU 가격에 따라 결정된다. 정가 기준 아크 프로 B70은 1099달러(약 149만원), RTX 프로 4000 블랙웰은 2199달러(약 297만원)로 벤치마크 결과를 반영하면 두 제품 간 비용 효율 격차는 더욱 커진다"고 설명했다. 다만 이번 결과는 특정 모델과 특정 추론 환경에서 측정된 것으로, AI 학습 성능이나 모든 워크로드에서 동일한 우위를 의미하지는 않는다. 또 AI 생태계 전반에서는 여전히 엔비디아의 영향력이 압도적이다. 쿠다(CUDA)를 중심으로 구축된 개발 환경과 풍부한 소프트웨어 지원은 AMD나 인텔 등 경쟁사가 단시간에 따라잡기 힘들다. 그러나 오픈소스 기반 인텔 AI 프레임워크인 '오픈비노'를 비롯해 vLLM, llama.cpp 등 주요 AI 프레임워크가 인텔 GPU 지원을 확대하고 있다. 업계에서는 아크 프로 B70이 AI 추론 시장을 겨냥한 실용적인 대안으로 자리잡을 가능성이 높다고 보고 있다. AI 에이전트가 확산될 수록 연산 성능뿐 아니라 메모리 용량과 비용 효율이 중요해지고 있기 때문이다.

2026.06.18 16:08권봉석 기자

인텔 "아크 프로 B70·B65, 추론 특화 GPU 시장 현실적 선택지"

"아크 프로 B70은 클라우드에 의존하지 않는 온프레미스(On-Premise) AI를 구축할 수 있는 성능과 32GB 대용량 메모리를 갖췄습니다. AI가 실험 단계를 넘어 실무로 확산되는 현 시점에서 현실적인 선택지입니다." 21일 서울 여의도 인텔코리아에서 만난 주민규 인텔코리아 한국 채널영업본부장(전무)가 이렇게 강조했다. 인텔은 지난 3월 말 AI 추론 수요를 겨냥한 워크스테이션용 GPU '아크 프로 B70/B65'를 출시했다. GDDR6 32GB 메모리를 탑재해 중소규모 기업과 개발자가 대형 언어모델(LLM)을 로컬 환경에서 직접 구동할 수 있게 한 것이 핵심이다. "32GB 메모리로 클라우드 없이 대용량 LLM 구동" 아크 프로 B70은 Xe2 코어 32개와 32GB 메모리 기반으로 대용량 AI 모델을 분할 없이 구동할 수 있다는 점이 차별화 포인트다. 연산 성능은 최대 367 INT8 TOPS(초당 1조 회 연산) 수준이다. 현재 시중에서 32GB 메모리를 탑재한 엔비디아 지포스 RTX 5090이 500만원을 웃도는 반면, 아크 프로 B70은 949달러(약 140만원) 수준이다. 200억 개 이상 매개변수를 가진 모델도 로컬 GPU에서 직접 실행할 수 있다. 메모리 용량과 비용 효율을 중시하는 환경을 겨냥했다. 주민규 본부장은 "보안 규제로 클라우드 활용이 제한된 기업이나 기관에서 관심이 높다"며 "비용 부담을 낮추려는 중소규모 조직에도 현실적인 대안이 될 수 있다"고 말했다. "추론 특화 GPU 시장 선점 노린다" 주 본부장은 아크 프로 B70/B65를 소비자용이 아닌 '추론 특화 GPU'로 규정했다. 그는 "현재 AI 시장은 학습보다 실제 서비스 운영 단계의 추론 수요가 더 빠르게 증가하고 있다"며 "다수 기업이 참여하는 성장 초기 시장이라고 판단했다"고 설명했다. 이어 "기업들이 AI를 실험 단계에서 실제 적용 단계로 전환하면서, 추론을 효율적으로 처리할 수 있는 인프라에 대한 관심이 높아지고 있다"며 "이 수요를 겨냥해 선제적으로 제품을 출시했다"고 덧붙였다. "AI 도입 초기 설치 장벽 낮추는 SW도 준비" 온프레미스 AI 확산의 걸림돌로는 초기 구축 난이도가 꼽힌다. 현재는 비개발자가 로컬 환경에서 AI를 실행하기까지 복잡한 설치 과정을 거쳐야 한다. 에이전틱 AI 소프트웨어 '오픈클로'도 윈도 환경에서 최소 5단계를 거쳐야 구동된다. 주 본부장은 "AI 활용의 확산은 초기 진입 장벽을 얼마나 낮추느냐에 달려 있다"고 말했다. 인텔은 이를 해결하기 위해 소프트웨어 협력사와 함께 클릭 한 번으로 AI 실행 환경을 구성할 수 있는 설치 도구를 준비 중이다. 해당 소프트웨어는 근시일 내 배포될 예정이다. "안정적 드라이버 지원으로 제품 수명·활용 범위 확장" 인텔은 아크 GPU 출시 이후 드라이버 지원을 지속적으로 강화해왔다. 게임 출시와 동시에 대응하는 '데이제로' 드라이버를 제공하고, 월 2~3회 업데이트를 유지하고 있다. 최근 펄어비스 신작 게임 '붉은사막'이 아크 GPU에서 실행되지 않는 문제가 발생하자 약 10일 만에 수정 드라이버를 배포하기도 했다. 신규 장비 도입 후 장기간 운영되는 기업 환경에서는 드라이버 업데이트의 중요성이 더 크다. AI 모델과 소프트웨어 지원을 통해 활용 범위를 지속적으로 확장할 수 있기 때문이다. 주 본부장은 "제품 수명주기 동안 일관된 드라이버 지원은 필수"라며 "시장 점유율과 무관하게 지원을 지속하는 것이 인텔의 방향"이라고 강조했다. "방향성 다른 소비자·기업 만족 위해 노력" 인텔은 2022년 이후 아크 GPU 라인업을 확대해왔다. 데스크톱용 A770·A750을 시작으로 B580/B570을 출시했고, 워크스테이션용으로는 A60, B60/B50, B70/B65까지 제품군을 확장했다. 주 본부장은 "인텔은 일반 소비자 시장과 전문가용 시장 모두 중요하게 보고 있다. 일반 소비자용 시장은 경쟁이 치열하지만 전체적인 시장 규모는 기업용 시장이 크다. 어느 시장에 더 중점을 둔다고 말하기는 어렵다"고 말했다. 그는 "다만 일반 소비자가 원하는 게임 성능과 기업·개발자가 요구하는 추론 성능은 기술적으로 차이가 있다"며 "두 시장을 동시에 만족시키는 것이 인텔의 목표"라고 덧붙였다.

2026.04.22 08:49권봉석 기자

GPU 기반 추론 워크스테이션 '배틀매트릭스' 힘 주는 인텔

엔비디아·AMD GPU 대비 가격 대비 성능을 극대화한 인텔 AI GPU 워크스테이션 '프로젝트 배틀매트릭스'(Project Battlematrix)가 최근 리눅스용 소프트웨어 정식 버전(1.0)을 공개하고 지속적인 업데이트를 예고했다. 프로젝트 배틀매트릭스는 최대 1만 달러(약 1천383만원) 가격에 1천500억 개 매개변수로 구성된 거대언어모델(LLM)을 처리할 수 있는 AI 추론 특화 워크스테이션이다. 비용 대비 효율을 중시하는 중/소규모 기업과 개발자 대상으로 클라우드 의존도가 높은 현 AI 워크로드 운영 방식을 온프레미스 중심으로 일부 전환할 수 있는 가능성을 제공한다는 점에서 의미가 크다. 5월 아크 프로 GPU 기반 '배틀매트릭스' 공개 프로젝트 배틀매트릭스는 인텔이 지난 5월 워크스테이션 GPU인 아크 프로 B시리즈와 함께 공개한 AI 워크스테이션 플랫폼이다. Xe2 코어 20개와 24GB 메모리를 탑재한 아크 프로 B60 GPU 최대 8개를 결합해 INT8(정수, 8비트) 기준 1,576 TOPS(1초당 1조 번 연산)급 연산 성능을 구현했다. GPU가 활용하는 메모리 용량은 192GB로 1천500억 개 매개변수로 구성된 거대언어모델(LLM)을 구동할 수 있다. 운영체제 구동에는 워크스테이션급 제온 프로세서를 활용하고 운영체제는 리눅스를 활용하다. 가격대는 5천 달러(약 691만원)에서 1만 달러(약 1천383만원)로 AI 추론 인프라에 대한 진입 장벽을 낮추는 것을 목표로 한다. LLM 스케일러 1.0 공개... 추론 속도 최대 4배 향상 인텔은 배틀매트릭스용 소프트웨어 구축에 CPU와 GPU, NPU와 가속기 등 연산 자원을 모두 활용하는 원API(OneAPI)를 활용하고 이를 지속적으로 개선하고 있다. 이달 초순 공개된 LLM 스케일러 1.0 버전은 초기 버전 대비 LLM 처리 속도 향상에 중점을 뒀다. 매개변수 320억 개 규모 모델 기준 처리 속도는 1.8배, 700억 개급 모델 처리 성능은 4.2배 높아졌다. 레이어별 온라인 양자화를 통해 GPU 메모리 요구량을 줄였고, vLLM 기반 파이프라인 병렬 처리를 실험적으로 도입해 대규모 모델 추론의 병목을 완화했다. 임베딩·재순위 모델 지원, 멀티모달 입력 처리 강화, 최대 길이 자동 감지, 데이터 병렬 처리 최적화 기능도 새롭게 추가됐다. 원격 관리가 필요한 기업 환경에서 GPU 전력 관리와 펌웨어 업데이트, 메모리 대역폭 모니터링 등 기능을 갖춘 XPU 매니저를 추가했다. GPU 1개를 여러 가상화 인스턴스가 활용할 수 있는 SR-IOV 기능도 추가했다. 중소기업·개인 개발자 위한 온프레미스 추론 인프라 제공 현재 GPU 시장은 엔비디아와 AMD가 성능 중심의 서버 시장을 양분하다시피 하는 상황이다. 반면 인텔이 하바나랩스 인수 후 출시하고 있는 AI 가속기인 가우디3는 제한적인 시장 점유율을 확보하고 있다. 배틀매트릭스는 정체된 서버 시장 대신 합리적인 가격·멀티 GPU 확장성·관리 편의성을 무기로 중소기업과 개인 개발자층을 직접 공략하기 위한 제품이다. 향후 로드맵도 공격적이다. 인텔은 이달 LLM 스케일러 공개에 이어 오는 SR-IOV 고도화, VDI 지원, 관리 소프트웨어 배포 기능 등 모든 기능을 구현한 완전판을 공개 예정이다.

2025.08.14 15:36권봉석 기자

인텔, 전문가용 아크 프로 GPU 2종 출시

[타이베이(대만)=권봉석 기자] 인텔이 컴퓨텍스 2025 기간 중 크리에이터, 개발자, 엔지니어를 겨냥한 아크 프로 GPU 2종을 공개했다. 신제품은 Xe2 코어를 20개 내장한 '아크 프로 B60', 16개 내장한 '아크 프로 B50' 등 2종이다. 아크 프로 B60은 메모리를 최대 24GB, 아크 프로 B50은 메모리를 최대 16GB 이용할 수 있다. 인텔은 "아크 프로 B60은 추론 작업을 수행하기 위한 워크스테이션에, 아크 프로 B50은 그래픽 작업을 수행하기 위한 워크스테이션에 적합한 제품"이라고 설명했다. 두 제품 모두 PCI 익스프레스 5.0 인터페이스 기반으로 작동하며 윈도 운영체제와 리눅스 상에서 작동한다. 독립소프트웨어업체(ISV) 인증을 통해 주요 산업 소프트웨어와 호환된다. 인텔은 윈도 운영체제용으로 성능을 중시한 일반 드라이버, 안정성과 호환성을 중시한 전문가용 드라이버를 모두 제공한다. 리눅스에서는 컨테이너 기반 소프트웨어 스택을 지원한다. 인텔은 AI 개발 과정을 가속할 수 있는 인텔 제온 프로세서 기반 GPU 플랫폼 '프로젝트 배틀매트릭스'도 함께 공개했다. 프로젝트 배틀매트릭스는 아크 프로 B60 24GB GPU를 최대 8개 탑재해 192GB 메모리를 활용 가능하며 최대 1천500억 개 매개변수로 구성된 대용량 AI 모델을 구동할 수 있다. 비비안 리엔(Vivian Lien) 인텔 클라이언트 그래픽 부문 총괄은 "아크 프로 B시리즈는 Xe2 아키텍처 고급 기능과 소프트웨어 생태계를 기반으로 중소기업이나 개인, 초급 개발자 등에 더 높은 접근성을 제공할 것"이라고 설명했다. 애즈락, 니르, 래너, 맥선, 오닉스 등 그래픽카드 제조사는 아크 프로 B60 그래픽카드를 추론 성능을 강조한 워크스테이션에 선탑재 형태로 주로 공급할 예정이다. GPU 하나당 단가는 500달러(약 70만원) 선으로 책정됐다. 아크 프로 B50 공급가는 299달러(약 42만원)로 책정됐고 오는 7월부터 시장 공급 예정이다.

2025.05.20 07:00권봉석 기자

인텔, 워크스테이션용 '아크 프로' 2세대 GPU 공개 임박

인텔이 워크스테이션용 '아크 프로' 2세대 GPU를 이르면 이달 하순 진행되는 '컴퓨텍스 타이베이 2025' 기간 중 공개 예정이다. 2023년 '아크 프로 A60' 출시 이후 약 2년만이다. 인텔은 연산 성능과 전력 효율, AI 처리를 최적화한 Xe2 아키텍처 기반 아크 2세대 GPU(배틀메이지)를 지금까지 데스크톱PC용 B570/B580 그래픽카드와 노트북용 코어 울트라 200V(루나레이크) 내 GPU 타일에만 공급했다. 아크 프로 2세대 GPU는 기존 데스크톱PC용으로 출시된 아크 B580(BMG-G21)을 기반으로 최대 24GB 메모리를 탑재해 AI 처리를 강화할 것으로 보인다. 초급 AI 개발자나 보급형 워크스테이션 탑재가 예상된다. 지난 해 9월부터 노트북·데스크톱용 제품 출시 인텔 아크 2세대 GPU는 연산 성능을 개선한 Xe2 코어로 구성됐다. 전세대 Xe 코어 대비 전력 효율과 AI 처리 성능 향상에 중점을 뒀다. AI 연산에 필요한 XMX(Xe 행렬 확장) 엔진이 추가됐고 INT2, INT4, INT8, FP16, BF16 등 AI 연산이 요구하는 자료형을 폭넓게 지원한다. Xe2 코어를 적용한 GPU는 코어 울트라 200V(루나레이크) 프로세서에 내장된 아크 130V/140V GPU, 데스크톱PC용으로 출시된 아크 B570/B580 등이 전부다. 노트북용 코어 울트라 200H(애로우레이크)에는 아크 1세대 GPU에 XMX를 더한 제품이 탑재됐다. 반면 일반 소비자용 제품과 달리 Xe2 아키텍처를 적용한 워크스테이션용 GPU는 현재까지 출시되지 않았다. 티저 이미지로 아크 프로 2세대 GPU 공개 예고 인텔은 2022년 8월 모바일(노트북) 워크스테이션용 '아크 프로 A30M', 데스크톱PC용 '아크 프로 A40·A50'을 시작으로 2023년 '아크 프로 A60·A60M'까지 총 5종의 전문가·워크스테이션용 GPU를 출시했다. 그러나 인텔은 8일 공식 X(구 트위터) 계정에 '새 인텔 아크 프로 GPU가 기다리고 있다. 타이베이에서 만나자'며 아크 프로 GPU 탑재 그래픽카드로 추정되는 티저 이미지를 노출했다. AI·LLM 처리 위해 최대 24GB 메모리 탑재 전망 아크 프로 2세대 제품 관련 정보는 이미 지난 3월 말부터 포착되기 시작했다. 아크 B580의 다이(Die)에 부여된 모델명인 'BMG-G21' 관련 부품이 베트남으로 선적됐다는 사실이 드러난 바 있다. 전 세대 제품인 아크 프로 A60이 탑재 가능한 메모리는 최대 12GB다. 그러나 매개변수(패러미터)가 100억 개 이상인 거대언어모델(LLM) 용량은 8GB에서 10GB를 가볍게 넘어서며 이를 원활히 처리하려면 최소 16GB 이상이 필요하다. BMG-G21(B580)은 Xe2 코어 20개로 구성됐고 최대 24GB 메모리를 탑재할 수 있다. 곧 공개될 아크 프로 그래픽카드도 최대 24GB 메모리를 탑재해 의료 영상 분석, 8K 영상 편집 등 대용량 데이터 처리 최적화를 꾀할 것으로 보인다. 인텔, 이달 하순 타이베이서 브리핑 진행 단 아크 B580 GPU의 성능은 엔비디아 지포스 RTX 4060과 비슷하거나 조금 아래 수준인 것으로 평가된다. 이에 따라 고성능보다는 가격 대비 성능을 앞세워 보급형 워크스테이션이나 AI 개발자를 겨냥할 것으로 보인다. 관련 업계에 따르면 인텔은 이달 하순 컴퓨텍스 타이베이 2025 기간 중 각국 기자단을 대상으로 아크 프로 GPU 관련 브리핑을 진행할 예정이다. 구체적인 제품군(SKU)과 출시 일정도 해당 시점에 공개될 전망이다.

2025.05.09 16:22권봉석 기자

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

마이크론, 메모리 장기계약 비중 확대...삼성·SK도 성장 구도 바뀐다

[AI 리더스] 오혜연 "글로벌 AI 협력, 한국이 의제 주도권 잡을 때"

퀄컴, AI 데이터센터 청사진 공개..."전용 CPU 2028년 출시"

"전남광주 반도체 패키징, '유리급 기판'도 선택지"

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.