• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
창간특집
인공지능
배터리
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'인텔 3'통합검색 결과 입니다. (21건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

CES 2025서 PC용 새 프로세서 대거 등장 예정

오는 7일(이하 현지시각) 미국 네바다 주 라스베이거스에서 개막하는 세계 최대 IT·가전 전시회 'CES 2025' 기간 중 주요 PC 관련 기업들이 데스크톱PC·노트북용 새 프로세서와 GPU를 대거 공개할 예정이다. 5일 업계에 따르면 인텔은 개막 하루 전인 이달 6일(한국시간 7일) 게임·콘텐츠 제작용 고성능 노트북 탑재를 염두에 둔 애로우레이크H/HX 프로세서를 선보일 계획이다. 애로우레이크 H/HX 프로세서는 지난 해 9월 출시된 코어 울트라 200V(루나레이크) 대비 코어 수를 늘리고 메모리를 프로세서 다이(Die)에서 분리한 구조로 32GB 이상 메모리 탑재가 가능하다. 지난 해 10월 출시된 데스크톱PC용 코어 울트라 200S 프로세서에 이어 오버클록이 불가능한 최대 소모 전력 65W급 프로세서 추가 출시도 예상된다. AMD가 지난 해 출시한 데스크톱PC용 라이젠 9000 시리즈 프로세서는 게임 성능에서 코어 울트라 200S 대비 좋은 평가를 받았다. 올해 CES에서는 3D V캐시를 추가해 게임 성능을 강화한 X3D 프로세서를 추가 출시할 것으로 보인다. 엔비디아는 젠슨 황 CEO가 2019년 이후 6년만에 직접 참석해 6일 오후 6시(한국시간 7일 오전 11시) 기조연설을 진행한다. 이 자리에서는 데스크톱PC와 노트북용 지포스 RTX 50 시리즈 공개와 함께 지난 해부터 출하를 시작한 서버용 AI GPU '블랙웰' 관련 진척 상황도 공개될 것으로 보인다.

2025.01.05 09:27권봉석

[기기검증] 인텔 아크 2세대 'B580', 얼마나 빨라졌나

인텔이 오는 16일부터 데스크톱PC용 아크 2세대 GPU(배틀메이지) 탑재 그래픽카드를 국내 시장에 본격 공급한다. 2022년 10월 아크 1세대 GPU '알케미스트'(Alchemist) 탑재 A770·A750 그래픽카드 출시 이후 약 2년만이다. 아크 B시리즈는 지난 9월 출시된 노트북용 프로세서, 코어 울트라 200V(루나레이크) 내장 GPU와 같은 Xe2 코어 기반으로 구성됐다. 연산 폭을 넓히고 AI 연산에 필요한 XMX 등을 지원한다. 저해상도 화면을 AI로 업스케일하는 '슈퍼 레졸루션'(SR) 이외에 AI를 이용해 게임 장면 사이 프레임을 추가로 그리는 '프레임 생성'(FG), 프레임 구성시 지연 시간을 낮추는 '저지연성'(LL) 등 3개 기술을 지원한다. B580(BMG-G21)은 Xe2 코어 20개로 구성됐다. 인텔은 전 세대 대비 코어 당 성능은 70%, 소비 전력 당 성능은 50% 향상됐다고 설명했다. B580 탑재 인텔 한정판 그래픽카드로 벤치마크와 게임 등 소프트웨어를 이용해 성능 향상 폭을 확인했다. 디스플레이포트 2.1 단자로 최대 8K 60Hz 화면 표시 가능 인텔이 대여한 B580 한정판 그래픽카드는 전 세대 상위급 제품인 A750과 크기나 냉각 방식(냉각팬 2개)에 큰 차이가 없다. 영상 출력 단자는 디스플레이포트 2.1 3개, HDMI 2.1a 1개 등 총 4개로 전 세대와 같다. 디스플레이포트는 8K(7680×4320) 60Hz, 4K(3840×2160) 360Hz 등 고주사율 디스플레이를 지원하며 HDMI 2.1 단자는 8K 120Hz, 4K 480Hz를 지원한다. 전력 공급은 PCI 익스프레스 8핀만으로 공급받는다. A750은 최대 225W를 쓰므로 전원 공급도 8+6핀만 이용한다. 반면 B580은 TSMC 5나노급(N5) 적용 등으로 최대 소모 전력을 190W까지 낮췄다. 3D마크 타임스파이 측정값 전세대 대비 20% 향상 UL 솔루션즈(구 퓨처마크)가 개발한 벤치마크 프로그램인 3D마크는 실제 게임 화면을 흉내낸 여러 시나리오로 그래픽카드와 프로세서 성능을 동시에 측정할 수 있다. 각 테스트 결과에서 초당 프레임 수를 이용해 성능 향상 폭을 살펴봤다. 다이렉트X 12 얼티밋 기반 화면을 그리며 성능을 측정하는 대표 시나리오 '타임스파이'(Time Spy)에서는 첫 번째 시나리오와 두 번째 시나리오 모두 전 세대 상위 제품(A750) 대비 20% 프레임 수가 상승했다. '스틸노매드'(Steel Nomad)는 타임스파이 대비 처리 부하를 4K 해상도 기반으로 3배 높인 테스트다. 타임스파이 대비 극적인 성능 향상은 없지만 다이렉트X 12와 불칸(Vulcan) 등 그래픽 API 사이에 큰 차이가 없다는 것도 특기할 점이다. XeSS 활성화시 최대 2배 프레임 향상 인텔 아크 GPU는 원래 해상도보다 낮은 화면을 그린 다음 AI로 업스케일링해 GPU 부하는 줄이면서 비슷한 품질 화면을 보여주는 XeSS(Xe 슈퍼샘플링) 기능을 지원한다. 3D마크에 내장된 XeSS 성능 테스트로 초당 프레임과 성능 향상 폭을 확인했다. XeSS는 성능과 화면 품질에 따라 성능, 균형, 품질, 울트라 등 4개 모드를 갖췄으며 일반적으로 '균형'(Balanced) 모드를 많이 활용한다. XeSS 활성화시 풀HD(1920×1080 화소) 보다 QHD(2560×1440 화소) 등 해상도가 높아질 수록 성능 향상 폭이 크다. 단 실제 게임에서는 가장 이상적인 경우 30% 정도 성능 향상을 확인할 수 있다(아래 테스트 참조). 사이버펑크 2077에서 초당 프레임 최대 30% 향상 게임 5종에 내장된 벤치마크 기능을 이용해 초당 프레임을 측정했다. 풀HD 해상도에서는 적게는 16%(파크라이5)부터 많게는 38%(사이버펑크 2077) 등 모든 게임에서 두 자릿수 성능 향상을 볼 수 있다. QHD 해상도에서는 전 세대 대비 최저 21%(파크라이5), 최대 30%(사이버펑크 2077) 성능 향상이 있다. 그래픽 수준 '높음' 설정시 쾌적함을 느낄 수 있는 최저 수준인 초당 60프레임은 모두 넘어섰다. XeSS를 활성화할 때 성능 향상 폭도 B580이 더 크다. GTA Ⅴ는 모든 해상도, 모든 그래픽카드에서 거의 같은 성능을 보인다. 개발 시점 당시인 2010년 초반 주류 프로세서인 4코어 프로세서 위주 최적화와 다이렉트X 11로 개발된 게임 엔진 등이 영향을 미쳤다. 향후 최신 하드웨어 테스트에는 활용하기 어렵다. ※ 테스트 조건 : 모든 게임은 내장 벤치마크 모드 활용. V싱크 기능과 프레임 제한 기능은 해제. 그래픽 옵션은 '높음'. XeSS는 '균형'(Balanced)으로 설정. XeSS·프레임 생성 활성화시 기본 대비 프레임 2배 상승 인텔이 아크 2세대에 탑재한 XeSS 2는 화면 업스케일 기능 '슈퍼 레졸루션' 이외에 게임 장면 사이 프레임을 추가로 그리는 '프레임 생성'(FG) 기능을 포함했다.13일 현재 이를 정식 지원하는 게임은 EA가 개발한 F1 24가 유일하다. 해상도는 QHD, 그래픽 수준은 '높음'(High)과 '매우 높음'(Ultra High)로 설정하고 XeSS 2 각 기능 설정시 성능 추이를 확인했다. 아무 기능도 적용하지 않은 상태에서는 '매우 높음'에서 초당 프레임이 50프레임까지 떨어져 원활한 구동이 어렵다. XeSS 적용시는 81프레임까지 올라가며 프레임 생성 기능까지 추가로 활성화하면 초당 프레임이 기본 상태 대비 2배 이상 늘어난다. 이를 지원하는 게임이 늘어나면 고해상도에서 더 높은 프레임을 뽑아낼 수 있을 것으로 보인다. ※ 벤치마크 설정 : Australia, Wet, Loop 3, 카메라 시점 순환(Cycle). XeSS 수준은 '균형'(Balanced). AI 이미지 생성·LLM 초당 토큰도 B580 앞서 아크 2세대를 구성하는 Xe2 코어는 512비트 벡터 엔진 8개에 AI 연산에 필요한 XMX(Xe 행렬 확장) 엔진을 추가하고 INT2, INT4, INT8, FP16, BF16 등 AI 연산이 요구하는 자료형을 폭넓게 지원한다. UL 솔루션즈 프로시온(Procyon)에 내장된 AI 이미지 생성 벤치마크는 스테이블 디퓨전 1.5로 이미지 생성 시간을 측정한다. 속도는 빠르지만 정밀도가 떨어지는 INT8, 정밀도가 높은 FP16 두 테스트에서 B580의 소요 시간이 더 짧다. AI 텍스트 생성 벤치마크는 비교적 최근에 출시된 거대언어모델(LLM) 벤치마크이며 파이3.5, 미스트랄(70억), 라마 3.1(80억), 라마2(130억) 등 4개 LLM 구동시 성능을 측정한다. B580은 A750(8GB) 대비 넉넉한 메모리(12GB)와 빠른 처리 속도를 살려 초당 토큰(단어) 생성 수에서 60% 가량 성능 향상이 있다. A750은 라마2 실행시 초당 토큰 수가 극히 떨어지는데 메모리 용량에 제약을 받은 것이 원인으로 보인다. ※ 벤치마크 설정 : 프로시온 권장치인 '인텔 오픈비노'(OpenVINO) 프레임워크 이용. 전 세대 대비 확실한 성능 향상... 늦은 출시 시기는 유감 인텔이 아크 시리즈에 붙이는 모델명은 3, 5, 7로 구성된다. 비교에 쓰인 A750은 상위 제품, 이번에 출시될 B580은 중간급 제품이다. 전 세대 상위권 제품을 현 세대 한 단계 아래 제품이 더 앞서는 결과를 보여줬다. 아크 A750용 드라이버는 출시 이후 2년간 업데이트를 거치며 꾸준히 성능이 향상된 반면 B580은 드라이버 최적화를 통해 성능이 더 향상될 여지가 남아 있다. '프레임 생성' 기능을 지원하는 게임 확보가 관건이다. 이미 아크 A750/A770은 동영상 처리 가속, 혹은 AI 모델 개발용으로 틈새 수요를 찾아 보급된 상태다. 아크 B580은 게임 성능을 향상시키고 경쟁 제품 대비 더 넉넉한 12GB 메모리를 탑재해 전 세대 대비 주목을 받을 가능성이 더 커졌다. 다만 출시 시기가 적어도 반 년 정도 빨랐더라면 엔비디아나 AMD 등 기존 그래픽카드 제조사의 대안을 찾는 소비자들의 좋은 선택지가 됐을 것이다. 인텔 권장가는 249달러(약 35만 6천원)지만 최근 오른 원-달러 환율로 국내 유통가도 비싸질 것으로 보인다. ※ 테스트 시스템 제원 메인보드 : 에이수스 ROG 막시무스 Z890 히어로 (바이오스 1101) -인텔 디폴트 설정(Intel Default Settings), 퍼포먼스(Performance) 프로세서 : 인텔 코어 울트라9 285K (정격 클록 작동) 메모리 : 커세어 DDR5-6400MHz 16GB×2 (32GB) SSD : 씨게이트 파이어쿠다 540 2TB (PCIe 4.0) 그래픽카드 : 아크 A750 (8GB, 드라이버 32.0.101.6319), 아크 B580 (12GB, 드라이버 32.0.101.6252) 냉각장치 : 에이수스 ROG RYUJIN Ⅲ 60×3 (수랭식 3열 일체형) 운영체제 : 윈도11 프로 24H2 (10.0.22621.674, UEFI, 성능 최상, 절전모드 끔, VBS 활성화)

2024.12.13 08:30권봉석

VR 기기 없이 3D 게임을?...텐센트-인텔 휴대용 콘솔기기 첫선

텐센트와 인텔이 맨 눈으로 3D 게임을 할 수 있는 게임 콘솔을 내놨다. 26일 중국 텐센트가 인텔과 공동으로 헤드마운트 없는 3D PC 게임 콘솔인 '썬데이 드래곤 3D 원'을 출시했다. 이 제품은 텐센트 게임즈에서 자체 개발하고 인텔이 기술적으로 지원했다. 맨 눈으로 3D 게임을 할 수 있도록 개발된 핸드헬드 콘솔기기다. 이 콘솔에는 11인치의 2.5K 해상도 120Hz 고해상도 스크리닝 탑재됐으며 실시간 안구 추적 센서가 장착됐다. 자체적으로 개발된 게임 론처 3D 존을 적용해 게임을 빠르게 실행할 수 있다. 디스플레이 기술적으로 TN 액정 격자 기술을 적용했으며, 실시간 이미지 인터리빙 알고리즘을 통해 보조 장비 없이 육안으로 볼 수 있는 3D 시각 효과를 생성시킨다. 디스플레이는 중국 BOE가 공급했다. 이 기기는 인텔의 울트라 7 258V '루나 레이크' 프로세서를 탑재했다. 32GB LPDDR5x 메모리를 갖추고 1TB 고속 SSD가 표준으로 제공된다. 콘텐츠 측면에서는 텐센트의 '아레나 브레이크 아웃'과 '블레이드앤소울', '패스 오브 엑자일' 등 클라이언트 게임이 최적화를 통해 3D 게임의 몰입감을 제공한다고 소개됐다.

2024.11.27 09:48유효정

인텔-美 상무부, 15.9조 규모 반도체법 보조금 최종 합의

미국 상무부와 인텔은 26일(미국 현지시간) 반도체지원법(CHIPS Act)에 따른 108억 달러(약 15조 843억원) 규모 보조금 지급에 최종 합의했다고 밝혔다. 직접 지원 보조금 규모는 3월 양해각서 체결시 85억 달러에서 6억 4천만 달러(약 8천940억원) 줄어들었다. 인텔은 "시큐어 인클레이브 지원을 위한 30억 달러 보조금이 반도체지원법 아래에서 이뤄져 의회 요구 사항에 따라 당초 예상보다 감액됐다"고 설명했다. 인텔-미국 상무부, 3월 양해각서 초안에 서명 인텔과 미국 상무부는 지난 3월 반도체 지원법에 따른 양해각서 초안에 서명했다. 이 양해각서는 미국 내 신규 반도체 생산 시설과 신규 공정 개발을 위한 85억 달러(약 11조 8천702억원) 규모 보조금 지급을 약속했다. 양해각서에는 향후 연간 50억 달러(약 6조 9천825억원), 5년간 최대 250억 달러(약 34조 9천125억원) 규모 세액공제안도 담겼다. 인텔은 지난 9월 중순 미국 국방부 요구사항에 따라 기밀 정보 저장을 위한 '시큐어 인클레이브' 기술을 개발 후 이를 반영한 반도체를 미국 내에서 생산·설계하기 위한 보조금인 30억 달러(약 4조 1천886억원)를 추가 확보했다. 그러나 인텔과 상무부가 합의한 보조금은 현재까지 전혀 지급되지 않았다. 팻 겔싱어 인텔 CEO 역시 3분기 실적발표에서 이에 대한 불만을 우회적으로 드러내기도 했다. 미국 상무부, 보조금 최종 규모 108억 6천만 달러로 확정 이날 미국 상무부는 인텔에 직접 지급하는 78억 6천만 달러(약 10조 9천764억원), 국방부 소요에 따른 시큐어 인클레이브 기술 개발을 위한 30억 달러를 합쳐 총 108억 6천만 달러를 지원한다고 밝혔다. 이날 팻 겔싱어 인텔 CEO는 "인텔 3(Intel 3, 3나노급) 공정이 이미 대량생산 단계에 접어들었고 인텔 18A(Intel 18A, 1.8나노급) 공정이 내년 양산에 들어가고 있어 첨단 반도체가 다시 미국 내에서 만들어지고 있다"고 밝혔다. 이어 "미국 기술과 제조업 리더십을 회복하기 위한 양당의 강력한 지지는 향후 미국의 장기적 경제 성장과 국가 안보에 중요한 역사적 투자를 이끌어 냈다. 인텔은 향후 수 년간 미국 내 사업을 확대해 이런 공공의 우선순위를 실천하는 데 앞장설 것"이라고 덧붙였다. 인텔, 향후 700억 달러 이상 추가 투자 예정 인텔은 미국 상무부와 합의에 따라 향후 10년간 1천억 달러(약 139조 7천500억원)를 미국 내 반도체 생산 시설과 기술에 투자해야 한다. 이는 지난 3월 양자 합의시 조건인 '5년간 1천억 달러'에서 다소 완화된 것이다. 인텔은 오레곤 주 힐스보로, 뉴멕시코 주 리오랜초, 오하이오주 뉴 앨바니, 애리조나 주 챈들러 등 미국 내 4개 지역의 반도체 신규 생산 시설과 공정 개발에 현재까지 300억 달러(약 41조 9천250억원)를 투자했다. 인텔은 앞으로도 미국 내 반도체 관련 생산시설에 700억 달러(약 97조원) 이상을 투자할 것으로 보인다. 미국 상무부는 "반도체지원법 보조금은 생산시설 건설과 기술 개발, 제품 생산과 상업적 성과에 따라 단계적으로 지급될 것이며 각 수혜자의 보고에 따라 성과를 판단할 것"이라고 밝혔다.

2024.11.26 23:33권봉석

엔비디아 "세계 첫 GPU '지포스 256' 출시 25주년"

엔비디아가 1999년 출시한 '지포스'(GeForce) 브랜드 첫 GPU인 '지포스 256'이 출시 25주년을 맞았다. 존 펜노(John Fenno) 엔비디아 지포스 마케팅 이사가 11일(미국 현지시간) 공식 블로그에 이를 기념하는 게시물을 공개했다. 엔비디아는 이 게시물에서 "25년 전 출시된 지포스 256은 열성 PC 게이머와 최신기술 고관여층의 관심을 모았고 오늘날 생성 AI의 토대를 마련했다"고 설명했다. 이어 "지포스 256은 단순한 그래픽카드가 아니며 세계 최초로 'GPU'라는 개념을 소개했고 미래 게임과 컴퓨팅 발전의 무대를 만든 제품"이라고 밝혔다. ■ 엔비디아, 1998년 '리바 TNT' 출시 지포스 256은 엔비디아가 처음 출시한 GPU는 아니다. 한 해 전인 1998년 128비트 3D 처리 성능을 갖춘 '리바 TNT'(RIVA TNT)가 출시됐다. 730만 개 트랜지스터를 집적한 리바 TNT 탑재 그래픽카드 가격은 당시 199달러(현재 물가 기준 약 385달러/약 52만원)에 책정됐다. 3D 그래픽 시장에서 강자로 꼽혔던 3dfx 부두(Voodoo) 시리즈와 경쟁할 수 있는 초석을 놓은 제품으로 평가받는다. 지난 8월 운영을 중단한 미국 PC 매체 아난드테크는 1998년 10월 12일자 기사에서 "리바 TNT는 3Dfx 부두2와 비교했을 때 거의 대등한 성능을 낸다"고 평가하기도 했다. ■ "가장 빠른 GPU 찾는다면 지포스 256이 유일한 선택지" 지포스 256은 그래픽 구현에 필요한 모든 기능을 칩 하나에 집적하고 당시 고해상도 영상으로 평가받았던 DVD 영상을 처리할 수 있는 점, 당시 최신 그래픽 API였던 마이크로소프트 다이렉트X 7 완전 지원으로 인기를 모았다. 아난드테크는 1999년 10월 11일자 기사에서 "지포스 256은 현재 시장에 나온 3D 가속기 중 가장 빠른 제품이다. 돈이 넉넉하고 가장 빠른 제품을 찾는다면 사야 할 제품은 명확하다"고 평가했다. 이 평가는 25년이 지난 지금 엔비디아 PC용 그래픽카드 최상위 제품인 지포스 RTX 4090에도 그대로 적용된다. ■ 현재 엔비디아만 생존... 3Dfx도 S3도 소멸 1999년 당시 그래픽 기술 강자로 꼽혔던 수 많은 업체들 중 현재까지 온전히 생존한 업체는 엔비디아가 유일하다. 부두 시리즈로 인기를 모았던 3Dfx는 2000년 엔비디아에 모든 IP(지적재산권)를 넘기고 역사의 뒤안길로 사라졌다. '새비지'(Savage) 시리즈를 앞세운 S3 그래픽스도 2000년 대만 팹리스 비아(VIA)에 인수됐다. 1998년 2월 PC 시장에 i740 그래픽칩셋을 공급했던 인텔은 2021년 '아크'(Arc) GPU를 앞세워 재진출했다. 최근 출시된 코어 울트라 200V(루나레이크)에는 1080p 해상도에서 초당 60프레임 이상을 소화하는 Xe2 기반 아크 140V GPU가 내장됐다. ■ 최대 경쟁업체 ATI, 2006년 AMD에 흡수 캐나다 소재 그래픽 업체 ATI는 '레이지'(RAGE)·'라데온'(RADEON) GPU로 엔비디아와 치열한 경쟁을 벌였다. 2003년경 출시한 라데온 XT 9000 시리즈는 엔비디아 지포스 FX 대비 대등한 성능에 더 저렴한 가격으로 주목받았다. 2000년대 초 엔비디아 인수까지 검토하던 ATI는 2006년 AMD에 인수됐다. ATI의 GPU IP(지적재산권)는 AMD에 모두 흡수됐고 '라데온'이라는 이름만 남았다. 2006년 당시 한 국내 PC 업계 관계자는 PC 전문 월간지 'PC라인' 인터뷰에서 "(AMD의 ATI 인수에 따라) 그래픽카드가 프로세서에 통합돼 사라지게 될 날도 멀지 않아 보인다"고 평가하기도 했다. 이런 그의 전망은 5년 뒤 2011년 AMD가 한 다이(Die) 안에 CPU와 GPU를 통합한 '퓨전 APU'를 공개하며 일부 실현됐다. AMD의 APU는 이후 콘솔 게임기인 소니 플레이스테이션4, 마이크로소프트 X박스 등에 투입됐다. 레나토 프라게일(Renato Fragale) AMD 제품 관리 부문 시니어 디렉터는 지난 8월 전문가용 소셜미디어인 링크드인 프로파일에 "소니 플레이스테이션용 개발팀을 꾸렸고 이는 AMD 역사에서 파산을 막은 가장 성공적인 출시"라고 밝히기도 했다. ■ 엔비디아 "지포스 256, 세계 바꿀 토대 놓은 제품" 엔비디아는 "지포스 256으로 시작된 혁명은 오늘날 게임과 엔터테인먼트에 계승되고 있으며 개인 컴퓨팅에서는 엔비디아 GPU로 가속된 AI가 일상생활의 일부분이 됐다"고 설명했다. 이어 "지포스 256은 게이밍과 컴퓨팅, AI가 단순히 진화하는 것에서 그치지 않고 함께 세계를 변화시킬 수 있는 토대를 만들었다"고 평가했다.

2024.10.13 07:56권봉석

인텔, 인플렉션 AI와 기업용 AI 시스템 구축 협력

인텔은 8일 인플렉션 AI와 기업용 AI 시스템 '인플렉션 포 엔터프라이즈' 구축을 위해 협력한다고 밝혔다. 인플렉션 포 엔터프라이즈는 공감형, 대화형, 직원친화 AI 기능을 제공하는 시스템으로 가우디 AI 가속기와 인텔 타이버 AI 클라우드 기반으로 구축된다. 인플렉션 AI는 하드웨어 테스트와 모델 구축 등 초기 비용을 절감하며 클라우드를 활용해 각 기업에 적합한 AI 환경을 구축할 수 있다. 또 Pi 응용프로그램으로 강화된 미세 조정 및 인간 피드백 기반 강화학습으로 조직 전체 생산성과 일관성을 향상시킨다. 인텔과 인플렉션 AI는 인텔이 이 솔루션의 초기 고객이 될 것으로 예상하며, 인텔 내부에 인플렉션 포 엔터프라이즈를 도입하기 위해 협력하고 있다. 인플렉션 포 엔터프라이즈는 현재 AI 클라우드에서 작동하며 내년 1분기부터 가우디3 AI 가속기를 탑재한 AI 어플라이언스도 출시 예정이다. 이 어플라이언스는 가우디3 기반으로 엔비디아 등 경쟁사 제품 대비 최대 2배 높은 가격 대비 성능, 128GB 고대역폭 메모리를 활용해 총소유비용(TCO)을 줄일 수 있다. 저스틴 호타드 인텔 DCAI(데이터센터·AI) 사업 총괄(수석부사장)은 "이번 인플렉션 AI와 전략적 협업을 통해 즉각적이고 높은 영향력을 발휘하는 AI 솔루션의 새로운 기준을 제시하고 있다"고 밝혔다. 테드 쉘튼 인플렉션 AI 최고운영책임자(COO)는 "엔터프라이즈 조직은 단순한 일반 상용 AI 이상의 것이 필요하지만, 스스로 모델을 파인 튜닝할 전문성이 부족하다. 이번 협력을 통해 이러한 문제를 해결하는 AI 시스템을 제공하게 되었으며, 인텔 가우디에서 얻는 성능 향상을 통해 모든 기업의 요구를 충족하도록 확장할 수 있다"고 밝혔다. 인텔과 인플렉션 AI는 개발자들이 강력하고 인간 중심적인 인플렉션 3.0 시스템을 활용하여 중요한 소프트웨어 도구를 생성할 수 있는 인플렉션 포 엔터프라이즈를 구축할 수 있도록 지원 예정이다.

2024.10.08 09:44권봉석

인텔 "제온6, AI·HPC 데이터센터에 최적 제품"

"현재 AI 관련 처리 시장이 주로 GPU에 주목하고 있지만 AI는 여전히 초기 단계이며 CPU 역시 GPU 못지 않게 다양한 작업을 처리한다. 엔터프라이즈 데이터베이스, 대형 ERP(전사적 자원관리) 처리에는 여전히 CPU 코어의 성능 향상이 중요하다." 26일 오전 서울 여의도에서 진행된 제온6 프로세서·가우디3 AI 가속기 브리핑에서 나승주 인텔코리아 상무가 제온6 프로세서 강점에 대해 이렇게 설명했다. 인텔이 25일 전세계 출시한 제온6 6900P 프로세서는 고성능 P(퍼포먼스) 코어를 최대 3개 타일에 분할해 집적하는 방식으로 한 소켓 당 코어 수를 최대 128개까지 늘렸다. 2018년 이후 코어 수를 앞세워 서버·데이터센터 시장을 파고든 AMD 에픽(EPYC) 프로세서와 동등한 수준까지 올라왔다. 이날 나승주 인텔코리아 상무는 "제온6 6900P 프로세서는 코어당 고성능 제품을 원하는 고객을 위한 제품이며 조만간 주요 OEM에서 오늘 출시한 인텔 제품을 탑재한 서버를 국내 출시 예정"이라고 밝혔다. ■ 인텔 3 기반 코어 다이 3개로 최대 128코어 구현 제온6 6900P 프로세서는 프로세서 코어를 포함한 컴퓨트 다이(Die)는 EUV(극자외선)를 활용한 인텔 3(Intel 3) 공정에서, 메모리와 각종 가속기를 포함한 I/O 다이는 인텔 7(Intel 7) 공정에서 생산했다. 나승주 상무는 "성능과 집적도가 중요한 컴퓨트 다이는 최신 공정을, 제조 원가와 작동 주파수 등에서 요구사항이 큰 I/O 다이는 한 세대 전 공정인 인텔 7을 활용한 것"이라고 설명했다. 최대 128개 코어를 탑재할 수 있는 UCC는 컴퓨트 다이 3개, 최대 86개 코어를 탑재할 수 있는 XCC 모델은 컴퓨트 다이 2개, 최대 48개 코어를 탑재하는 HCC는 컴퓨트 다이 1개로 구성된다. PCI 익스프레스 5.0 레인(lane, 데이터 전송 통로)와 메모리 대역폭을 축소한 LCC 모델은 최대 16개 코어를 탑재한다. 각 타일은 반도체 평면 연결 기술인 인텔 EMIB로 연결된다. 이 중 128개 코어 탑재 UCC 모델이 우선 공급되며 나머지 모델은 내년 초부터 시장에 공급된다. ■ MRDIMM·CXL 2.0 타입3로 최대 3TB 메모리 운용 가능 인메모리 데이터베이스 등 대용량 데이터 처리시 가능한 한 많은 데이터를 메모리에 올려야 처리 효율을 높일 수 있다. 제온6 6900P는 DDR5-6400MHz와 MRDIMM 8400MHz 메모리와 CXL 2.0 타입3를 활용해 최대 3TB 메모리를 운용할 수 있다. MRDIMM(멀티랭크 DIMM)은 디램 메모리 집적도를 두 배로 높여 최대 접근 가능한 메모리 용량을 늘려서 성능을 30-50% 가량 높일 수 있다. 나승주 상무는 "현재 삼성전자, SK하이닉스, 마이크론 등 주요 메모리 제조사와 협업하고 있다"고 설명했다. CXL(컴퓨트 익스프레스 링크) 기술은 PCI 익스프레스 기반으로 디램을 유연하게 확장할 수 있다. 제온6는 CXL로 연결된 메모리 모듈까지 메모리와 직접 연결된 상태로 활용할 수 있다. 나승주 상무는 "데이터센터 업데이트 후 남은 DDR4 메모리를 모아 CXL 2.0 방식으로 연결하면 메모리 탑재 비용은 줄이면서 더 큰 메모리 용량을 쓸 수 있고 성능 저하는 프로세서와 직접 연결된 메모리 대비 3%에 불과해 효율적"이라고 밝혔다. ■ AI 처리 확대 위한 명령어 추가... BF16/FP16 모두 지원 AI 처리의 대부분은 행렬(matrix) 형태로 구성된 데이터를 처리하는 과정으로 진행된다. 제온6 P시리즈는 이를 처리하는 내장 가속기인 AMX(고급 벡터 확장)에 FP16(부동소수점 16비트) 처리 기능을 추가했다. 나승주 상무는 "제온6 6972P(96코어)는 메타 라마2(Llama-2) 70억 매개변수 챗봇, GPT-J 60억 매개변수 요약 등 AI 추론 실행시 전 세대 대비 2배 이상, AMD 에픽 9654(96코어) 대비 최대 5배 이상 빠른 성능을 낸다"고 밝혔다. 이어 "GPU를 이용한 AI 가속시에도 전통적인 서버용 프로세서는 데이터 전처리, 전송은 물론 CPU에서 더 효율적으로 처리 가능한 AI 워크로드를 실행하고 있으며 엔비디아 HGX/MGX와 조합해 더 나은 성능을 낼 수 있다"고 밝혔다. ■ "가우디3, 개방형 생태계에 최적화" 인텔은 가우디3 AI 가속기도 10월부터 국내외 시장에 공급 예정이다. 서버용 OCP 가속화 모듈인 HL-325L, HL-325L을 8개 탑재한 UBB 표준 모듈인 HLB-325, 워크스테이션에 장착 가능한 확장 카드인 HL-338 등 3개 형태로 시장에 공급된다. 나승주 상무는 "가우디3 성능 비교 결과 80억 매개변수 내장 메타 라마3 처리에서 엔비디아 H100 대비 9% 더 나은 성능을 내지만 가격은 2/3 수준이다. 비용 대비 효율성은 약 2배이며 향후 소프트웨어 최적화로 더 개선될 것"이라고 밝혔다. 그는 또 "가우디3는 업계 표준인 이더넷 기술을 활용하는 개방형 생태계에 최적화된 제품이며 가격 효율성 측면에서 강점을 지녔다. 엔비디아 등 특정 제조사에 종속되는 것을 원하지 않는 고객사에게 충분한 장점을 제공할 것"이라고 덧붙였다.

2024.09.26 16:26권봉석

인텔-AWS, 다년간 AI 반도체 공동 개발 계약 체결

인텔과 아마존웹서비스(AWS)가 16일(미국 현지시간) 앞으로 수 년간 인텔 반도체 설계·생산 역량을 활용한 맞춤형 AI 반도체 생산에 합의했다고 밝혔다. 인텔은 이번 합의에 따라 내년부터 양산을 시작할 1.8나노급 인텔 18A(Intel 18A) 공정에서 AWS가 주문한 AI 반도체를 생산 예정이다. 인텔은 인텔 3(Intel 3) 공정에서 생산중인 제온6 프로세서도 AWS 요구사항에 맞춰 일부 제원 등을 바꿔 맞춤형으로 공급 예정이다. 맷 가만 AWS CEO는 "AWS는 고객사에 가장 강력하고 혁신적인 클라우드 저변을 제공하기 위해 노력하고 있다. 인텔 18A 공정 기반 차세대 AI 패브릭 칩 공동 개발을 통해 2006년부터 시작된 협업을 지속할 것"이라고 밝혔다. 팻 겔싱어 인텔 CEO는 "AWS와 협업 연장은 인텔 공정 기술의 강점을 드러낸 것이며 고객사 워크로드에 차별화된 솔루션을 제공할 것"이라고 밝히고 "인텔의 설계와 제조 역량이 AWS의 서비스와 결합해 양사의 성장과 미국 내 AI 공급망 지속성을 뒷받침할 것"이라고 밝혔다. 인텔과 AWS 협업은 앞으로 여러 해 동안 수십억 달러 규모로 진행 예정이다. 내년부터 양산에 들어가는 인텔 18A를 시작으로 일부 성능을 개선한 '인텔 18AP', 1.4나노급 인텔 14(Intel 14) 공정 활용도 검토 예정이다.

2024.09.17 06:03권봉석

인텔, 2나노 양산 백지화..."1.8나노 공정에 집중"

인텔이 오는 4분기부터 가동 예정이었던 인텔 20A(2나노급) 공정 양산 대신 내년부터 가동될 인텔 18A(1.8나노급) 공정에 집중하기로 했다. 인텔은 4일(미국 현지시간) 벤 셀(Ben Sell) 인텔 기술개발 부사장 명의 기고문을 통해 이렇게 밝혔다. 4분기 투입 예정이었던 데스크톱PC·노트북용 새 프로세서 '애로우레이크'(Arrow Lake)도 인텔 20A 공정 대신 외부 파운드리(대만 TSMC)에서 생산한다. 인텔은 TSMC가 만든 반도체 조각(타일)을 3차원 패키징 기술 '포베로스'로 조립한다. ■ 인텔 20A 공정, 지난 해 하반기 윈도 운영체제 부팅 성공 인텔 20A 공정은 2021년 7월 팻 겔싱어 인텔 CEO가 공개한 '5N4Y'(4년 동안 5개 공정 실현) 로드맵 중 4단계에 해당하는 공정이다. 새 트랜지스터 구조 '리본펫'(RibbonFET), 반도체 후면 전력 전달 기술 '파워비아'(PowerVIA) 등이 적용된다. 인텔은 지난 해 6월 인텔 4(Intel 4) 공정에서 생산한 E(에피션트) CPU 코어 8개와 파워비아 기술을 결합한 시제품 생산에 성공했고, 이를 인텔 20A 공정에도 적용할 것이라고 공언하기도 했다. 또 작년 9월 진행한 '인텔 이노베이션' 행사에서는 인텔 20A 공정에서 생산한 애로우레이크 웨이퍼가 공개됐다. 팻 겔싱어 인텔 CEO는 같은 해 10월 3분기 실적발표에서 "인텔 20A 공정 기반 애로우레이크는 이미 윈도 운영체제 부팅에 성공했다"고 밝히기도 했다. ■ 인텔 20A 패싱, 8월 2분기 실적 발표서 예견 인텔은 오는 4분기 출시할 데스크톱PC·노트북용 프로세서 신제품 '애로우레이크' 생산에 인텔 20A 공정과 외부 파운드리(대만 TSMC)를 모두 활용할 예정이었다. 그러나 지난 8월 2분기 인텔 실적 발표에서 이상 기류가 포착됐다. 당시 팻 겔싱어 인텔 CEO는 "내년 양산될 '팬서레이크'(Panther Lake)는 인텔 18A 공정과 함께 리본펫·파워비아 기술을 적용할 첫 마이크로프로세서가 될 것"이라고 설명했다. 문제는 인텔 20A 역시 양대 첨단 기술을 모두 적용하는 공정이라는 것이다. 예상대로라면 팬서레이크가 아닌 인텔 20A 공정 기반 애로우레이크가 언급되는 것이 맞다. 당시 인텔 관계자는 "인텔 20A 관련 상세 내용은 추후 공개할 것"이라고 답했다. ■ "애로우레이크, 주로 외부 협력사 이용해 만들 것" 벤 셀 부사장은 2분기 실적 발표 이후 한 달이 지난 4일(미국 현지시간) "인텔 18A 시제품은 전원 인가와 운영체제 부팅에 성공하고 있으며 2025년 출시 일정도 변함 없다. 이런 성과를 통해 얻은 이점은 인텔 20A에 투입하던 자원을 인텔 18A 공정으로 옮길 수 있게 된 것"이라고 밝혔다. 이어 "이런 결정에 따라 애로우레이크 프로세서는 주로 외부 협력사를 이용해 만들어질 것이며 인텔 파운드리에서 패키징될 것"이라고 덧붙였다. 이에 따라 최근 공개한 모바일(노트북)용 저전력 프로세서인 '코어 울트라 200V 시리즈'(루나레이크)에 이어 애로우레이크도 전량 TSMC N3B 공정을 이용해 생산하게 됐다. ■ "인텔 20A 공정서 리본펫·파워비아 성공적 통합" 단 인텔 20A 공정이 로드맵에만 존재하고 실체가 없었던 공정은 전혀 아니다. 인텔 20A 공정에서 생산한 웨이퍼가 이미 인텔 이노베이션 등 외부 행사를 통해 여러 번 공개됐기 때문이다. 또 인텔 18A 공정은 인텔 20A를 개선해야 만들 수 있는 공정이기도 하다. 예를 들어 제온6 프로세서 생산에 쓰이는 인텔 3 공정이 지난 해 가동에 들어간 EUV(극자외선) 기반 인텔 4 공정을 개선한 것이다. 벤 셀 부사장 역시 "인텔 18A로 가는 여정은 인텔 20A에서 얻은 지식을 기초로 했다. 인텔 20A를 이용해 무어의 법칙을 발전시키는 데 중요한 새로운 기술과 소재, 트랜지스터 구조를 연구할 수 있었다"고 밝혔다. 이어 "인텔 20A 공정에서 리본펫 GAA(게이트올어라운드) 트랜지스터와 파워비아 기술을 최초로 통합했고 이를 통해 양대 기술을 인텔 18A에서 상용화할 수 있음을 깨달았다. 이런 진보를 모든 인텔 파운드리 고객사에 적용할 수 있게 돼 기쁘다"고 덧붙였다. ■ "인텔 18A 공정 수율, 업계 기준 양호" 반도체 업계는 생산 공정의 수율을 판단하는 기준으로 흔히 쓰이는 '결함 밀도'(D0, defect density)가 평방 센티미터당 0.5(0.5 def/cm2) 이하일 때 해당 공정을 양호하다고 판단한다. 벤 셀 부사장은 인텔 18A 공정 수율과 관련해 "인텔 18A의 결함 밀도는 이미 0.40 미만"이라고 밝혔다. 그는 "인텔 18A에 자원을 집중하는 것은 기술적인 투자 최적화에도 도움을 준다. 인텔 20A 공정 개발 당시 수율에 대해 얻은 교훈은 인텔 18A 공정으로도 이어질 것"이라고 밝혔다. ■ "고객사 더 많은 인텔 18A에 자원 집중 투입하겠다는 것" 익명을 요구한 반도체 업계 관계자는 "인텔 20A 공정 양산 백지화는 비용 문제도 큰 영향을 미쳤을 것"이라고 설명했다. 그는 "인텔 20A 공정 고객사는 인텔 프로덕트 그룹 한 곳 뿐인 반면 인텔 18A는 인텔 뿐만 아니라 마이크로소프트와 에릭슨, Arm, 브로드컴을 포함해 더 많은 고객사가 있어 해당 공정 개선이 더 중요하다고 판단했을 것"이라고 추측했다. 인텔은 그간 PC용 프로세서 경쟁에서 자체 파운드리를 대량 생산으로 AMD 대비 납기와 생산 물량에서 우위를 다져왔다. 그러나 적어도 내년 상반기까지는 이들 제품 생산시 대만 TSMC에 의존해야 하는 상황이 됐다. 이는 매출 중 대부분을 인텔 프로덕트 그룹 자체 물량에서 내는 인텔 파운드리 실적에도 좋지 않은 영향을 미칠 것으로 보인다.

2024.09.05 13:29권봉석

인텔, 코어 울트라 200V 프로세서 정식 출시

"인텔은 올 초 (CES 2024에서) 최고의 CPU와 GPU, AI 성능을 갖춘 '루나레이크'를 약속했고 오늘 그 약속을 실현했다. 소비자에게 타협 없는 AI PC 경험을 제공할 수 있는 규모를 갖춘 기업은 오직 인텔 뿐이다." 3일 오후(베를린 현지시간, 한국시간 4일 오전 1시) 진행된 코어 울트라 200V 프로세서(시리즈2, 루나레이크) 출시 행사에서 미셸 존스턴 홀타우스(Michelle Johnston Holthaus) 인텔 클라이언트 컴퓨팅 그룹 총괄(수석부사장)이 강조했다. 이날 인텔은 일반 연산 성능과 그래픽 성능, 전력 효율과 AI 성능 향상을 염두에 두고 개발한 새 모바일(노트북) 프로세서, 코어 울트라 200V 9종을 공개했다. 국내외 주요 제조사는 이를 탑재한 PC를 이르면 이달 말부터 전세계 시장에 출시한다. ■ "성능·전력 효율 등 모든 면에서 타협하지 않은 프로세서" 이날 짐 존슨 인텔 클라이언트 비즈니스 그룹 총괄은 "코어 울트라 200V 프로세서는 CPU 코어, 그래픽 성능, AI 성능을 향상시켰고 가장 전력 효율이 뛰어나며 모든 면에서 타협하지 않은 완전히 새로운 프로세서"라고 설명했다. 코어 울트라 200V는 전작인 코어 울트라 시리즈1(메테오레이크)처럼 프로세서를 구성하는 주요 IP를 타일 구조로 분할해 탑재했다. 단 타일 갯수는 저전력 구조를 염두에 두고 네 개에서 두 개로 크게 줄었다(관련기사 참조). CPU를 모은 컴퓨트 타일, GPU와 NPU 등을 한데 모든 플랫폼 컨트롤러 타일을 인텔 포베로스 기술로 적층했다. 프로세서 다이 옆에는 고성능 LPDDR5 메모리를 직접 올려 기존 대비 전력 소모를 줄였다. 또 모든 타일을 파운드리 부문 경쟁사인 대만 TSMC 3나노급 맞춤형 공정(N3B)에서 생산하고 이를 결합하는 타일만 인텔 22나노 공정에서 생산하는 등 역대 인텔 프로세서 중 가장 이색적인 제품이다. ■ CPU 코어 IPC 향상에 중점...내장 그래픽도 향상 코어 울트라 200V 프로세서는 고성능 P(퍼포먼스) 코어 '라이언코브'(Lion Cove) 4개와 저전력·고효율 E(에피션트) 코어 '스카이몬트'(Skymont) 4개 등 총 8개 코어 CPU를 탑재했다. 짐 존슨 총괄은 "컴퓨트 타일에 탑재된 P(퍼포먼스) 코어인 라이온코브는 현재까지 만들었던 코어 중 가장 빠르고 IPC(클록 당 명령어 처리수)는 14%, 와트 당 성능은 15% 향상됐다"고 설명했다. 이어 "저전력·고효율 E(에피션트) 코어인 스카이몬트는 AI 처리량을 코어 울트라 시리즈1(메테오레이크) 대비 2배 향상하고 IPC는 68% 끌어올렸다"고 밝혔다. ■ "내장 그래픽 성능, AMD 동급 제품 대비 최대 16% 빨라" 코어 울트라 200V 프로세서 내장 그래픽은 최대 Xe2 코어 8개로 구성된다. 짐 존슨 총괄은 "사이버펑크 2077, 스파이더맨, 호그와트 레거시에서 전작 대비 최대 50% 성능이 향상됐다"고 설명했다. 인텔은 이날 출시 행사에 AMD 라이젠 AI 300 시리즈, 퀄컴 스냅드래곤 X 엘리트 등 경쟁사 제품과 성능 비교 결과를 추가로 공개했다. 짐 존슨 총괄은 "코어 울트라 200V 프로세서 내장 그래픽 성능은 AMD 라이젠 HX 370 프로세서 탑재 내장 그래픽과 비교시 16% 빠르며 퀄컴 스냅드래곤 X 엘리트(X1E-84-100, 12코어, 3.8GHz)는 23개 게임이 아예 작동하지 않았다"고 밝혔다. 인텔은 이날 도타2를 같은 그래픽 품질에서 구동할 때 초당 프레임 수와 소모 전력도 공개했다. 코어 울트라 200V 프로세서는 AMD 라이젠 HX 370과 초당 프레임 수는 같지만 소비 전력은 30% 낮았다. 퀄컴 스냅드래곤 X의 소비 전력은 최대 57W로 코어 울트라 200V의 두 배 가량이었다. ■ "AI 성능 퀄컴 대비 20% 우위... 배터리 지속 시간도 호각" 인텔은 UL 프로시온 벤치마크에 내장된 AI 이미지 생성 테스트 기준 성능 비교 결과도 함께 공개했다. GPU 기반 구동시 최상위 제품인 코어 울트라9 288V 프로세서는 AMD 라이젠 HX 370 대비 두 배 빠르며 퀄컴 스냅드래곤 X 엘리트는 테스트 구동에 실패했다. 인텔이 공개한 자료에 따르면 코어 울트라9 288V 프로세서는 최근 공개된 긱벤치 AI의 NPU 성능 테스트(INT8 기준)에서도 퀄컴 스냅드래곤 X 엘리트를 20% 가량 앞섰다. 반면 AMD 라이젠 HX 370은 테스트 구동에 실패했다는 것이 인텔 주장이다. UL 프로시온에 내장된 오피스 생산성 테스트 구동시 코어 울트라9 288V 프로세서는 최대 20시간 작동해 전세대(코어 울트라 155H) 대비 6시간 이상 늘어났다. 퀄컴 스냅드래곤 X 엘리트는 18.4시간 작동했다. ■ 코어 구성은 동일, GPU·NPU 코어 수 달리해 총 9개 제품 공급 코어 울트라 200V 프로세서는 모두 동일한 8코어(P4+E4) CPU를 탑재하며 모델에 따라 최대 작동 클록이 달라진다. 여기에 GPU 코어 수와 작동 클록, NPU 코어 수와 최대 메모리 탑재 용량을 달리해 총 9개 제품이 공급된다. 최상위 제품인 코어 울트라9 288V 프로세서는 P코어 최대 5.1GHz, E코어 최대 3.7GHz로 작동한다. 9개 제품 모두 LPDDR5X-8533 메모리 16GB/32GB를 기본 탑재하며 PCI 익스프레스 5.0 SSD 연결을 위한 레인(lane, 데이터 전송 통로)도 4개 제공한다. 기본 소모 전력은 코어 울트라9 288V(30W)를 제외한 모든 제품이 17W급이며 필요한 경우 PC 제조사 설계에 따라 최대 37W로 최대 성능을 낼 수 있다. ■ 국내외 주요 제조사 이달 말부터 실 제품 공급 삼성전자, LG전자 등 국내 제조사와 레노버, 델테크놀로지스 등 글로벌 제조사는 코어 울트라 200V 탑재 제품 예판에 들어가 24일부터 전세계 시장에 공급한다. 국내 출시 일정은 미정이다. PC업계 관계자는 "주요 제조사가 국내 노트북 최성수기인 12월부터 이듬해 2월에 맞춰 신제품을 내놓는 경향이 있어 국내 출시는 글로벌 시장 대비 다소 늦춰질 수 있다"고 전망했다. 인텔이 오늘 공개한 코어 울트라 200V 프로세서는 소비전력이 평균 15W, 최대 37W인 슬림 노트북 대상 제품이다. 게임과 콘텐츠 제작을 위해 더 많은 코어를 탑재한 후속 제품도 4분기 이후 출시 예정이다.

2024.09.04 03:00권봉석

인텔 가우디3 AI 가속기, 신규 고객사로 IBM 확보

인텔이 곧 출시할 AI 가속기 '가우디3'(Gaudi 3)가 대형 고객사인 IBM을 확보했다. 양사는 29일(미국 현지시간) 공동으로 "IBM 클라우드 고객사에 내년 초부터 가우디3를 제공할 것"이라고 밝혔다. IBM은 자체 데이터센터와 클라우드를 혼합한 하이브리드 환경과 온프레미스 환경에 모두 가우디3를 적용 예정이며 왓슨x 클라우드에도 가우디3를 통합 예정이다. 현재 대부분의 클라우드 서비스 제공업체(CSP)가 이미 시장을 선점한 엔비디아 하드웨어·소프트웨어 환경에 종속된 상황이다. 인텔은 이런 상황에서 전세계 10위권 내 CSP 중 하나인 IBM을 가우디3 고객사로 확보해 고민을 덜었다. ■ 가우디3, 엔비디아 대비 납기·가격 면에서 강점 가우디3는 2022년 5월 출시된 가속기인 가우디2 후속 제품이며 TSMC 5나노급(N5) 공정에서 생산된다. 96MB S램과 128GB HBM2e 메모리를 이용해 최대 대역폭 3.7TB/s를 구현했다. 인텔 자체 성능비교에 따르면 가우디3 8천192개 클러스터 구성시 같은 규모 엔비디아 H100 클러스터 대비 학습 시간을 40% 단축할 수 있다. 또 700억 개 매개변수로 구성된 LLM인 메타 라마2(Llama 2) 구동시 가우디3 64개 클러스터는 엔비디아 H100 대비 최대 15% 빠른 학습 처리량을 제공 예정이다. ■ AI 운영 비용 부담 느끼는 CSP 고객사 겨냥 인텔은 올 3분기 출시할 가우디3 고객사 확보를 위해 많은 노력을 기울였다. 지난 6월 컴퓨텍스 2024 기조연설 당시 팻 겔싱어 CEO는 가우디3의 가격 대비 성능을 강조하며 "덜 쓰고 더 얻을 수 있다"고 강조했다. 인텔은 "인텔과 IBM은 서버·데이터센터용 5세대 제온 스케일러블 프로세서(에메랄드래피즈)와 결합한 가우디3를 통해 총소유비용(TCO)을 낮추면서 AI를 활용할 수 있는 수단을 제공하는 것이 목적"이라고 설명했다. 이어 "5세대 제온과 가우디3는 데이터센터와 클라우드의 기업용 AI 워크로드를 지원하면서 소프트웨어 스택 제어, 워크로드와 응용프로그램 관리 단순화, 비용 절감을 실현할 수 있을 것"이라고 덧붙였다. ■ 올해 가우디3 공급 매출도 증가 예상 앨런 피콕(Alan Peacock) IBM 클라우드 총괄 매니저는 "IBM 클라우드에서 인텔 가우디3 가속기를 활용하면 고객들에게 비용 성능을 최적화하는 유연한 AI 솔루션을 제공할 수 있다"고 밝혔다. 양사는 클라우드와 온프레미스의 장점을 결합한 IBM 가상프라이빗클라우드(VPC)에 가우디3를 통합해 기존 x86 기반 인프라 구축 기업의 응용프로그램 실행 속도와 이용자 경험을 개선할 예정이다. 인텔은 올 한해 가우디3 공급으로 5억 달러(약 6천672억원) 매출을 올릴 것으로 예상했다. 이번 IBM 공급 계약으로 가우디3 매출도 늘어날 것으로 보인다.

2024.08.30 09:40권봉석

인텔, 내년 5월 옵테인 메모리 200 시리즈 단종 예고

인텔이 3D 크로스포인트(3D XPoint) 기술을 적용한 서버용 메모리 제품인 옵테인 퍼시스턴트 메모리 200 시리즈를 내년 5월 단종하겠다고 밝혔다. 인텔은 2019년 초 D램과 낸드 플래시메모리의 중간 정도의 성능을 내는 옵테인 DC 퍼시스턴트 메모리를 출시한 바 있다. 당시 용량이 부족한 D램, 상대적으로 용량은 크지만 작동 시간이 느린 SSD를 보완하기 위한 용도였다. 그러나 현재는 서버용 메모리 가격이 크게 내려간 데다 용량과 속도를 모두 늘릴 수 있는 MCR DIMM 기술도 상용화를 앞두고 있다. 인텔 역시 2022년 8월 채산성을 이유로 옵테인 관련 신규 사업을 중단한다고 밝힌 바 있다. 인텔은 최근 주요 서버 제조사와 고객사 대상으로 발행하는 PCN(제품변경통보)를 통해 "2020년 2분기 출시한 인텔 옵테인 퍼시스턴트 메모리 200 시리즈는 올 연말까지 최종 주문을 받을 예정이며 이후 신규 주문은 불가능하다"고 밝혔다. 인텔은 주문받은 물량을 생산해 내년(2025년) 연말까지 공급할 예정이다. 주문은 128GB, 256GB, 512GB 모듈을 4개, 또는 50개 단위로만 가능하다. 지난 해 인텔 4세대 제온 프로세서(사파이어래피즈)와 함께 공개된 옵테인 퍼시스턴트 메모리 300 시리즈는 변함 없이 주요 고객사나 서버 제조사에 공급된다.

2024.07.03 10:00권봉석

인텔, VLSI 심포지엄서 인텔 3 공정 개선 사항 공개

인텔은 최근 미국 하와이에서 진행된 연례 글로벌 반도체 학회 'VLSI 심포지엄'에서 최근 본격 가동에 들어간 '인텔 3'(Intel 3) 공정의 개선 사항을 공개했다고 밝혔다. 인텔 3 공정은 EUV(극자외선)을 활용하는 인텔 두 번째 공정이며 2021년 팻 겔싱어 CEO 취임 이후 공개된 '4년 내 5개 공정'(5N4Y) 로드맵의 세 번째 단계에 있다. 인텔 3 공정은 지난 해 하반기부터 대량생산 단계(HVM)에 돌입한 인텔 4(Intel 4) 공정의 트랜지스터와 메탈 커넥트 등을 개선했다. 전체 프로세서 코어에서 동일 전력 공급시 인텔 4 공정 대비 최대 18% 더 나은 성능을 내며 같은 면적에서 최대 10% 더 많은 트랜지스터를 집적했다. 인텔 3 공정은 미국 오레곤과 아일랜드 레익슬립 소재 시설에서 가동중이다. 오는 3분기부터 시장에 공급될 제온6 6700E 프로세서 등 인텔 내부 제품은 물론 외부 고객사 반도체 위탁 생산에도 활용된다. 인텔은 올 하반기부터 인텔 3 공정을 다양한 고객사의 요구사항에 맞게 확장 예정이다. 컴퓨트 노드와 메모리 등 3차원 적층을 위한 인텔 3-T 공정, I/O 세트를 추가한 인텔 3-E 공정, 9나노미터급 TSV와 하이브리드 본딩 등을 적용하고 성능을 개선한 인텔 3-PT 공정 등이 내부/외부 파운드리 고객사를 위해 가동 예정이다.

2024.06.21 19:41권봉석

인텔, 개방형 AI 생태계로 反엔비디아 전선 구축..."韓 협력 중요"

인텔이 인공지능(AI) 개방형 생태계를 구축하기 위해 국내 기술 업체들과 협력을 가속화한다. 엔비디아가 독점하고 있는 그래픽처리장치(GPU) 시장에서 차세대 AI 가속기 '가우디3'을 토대로 경쟁력을 키우려는 전략이다. 저스틴 호타드 인텔 데이터센터·AI 사업 총괄 수석 부사장은 5일 서울 서초구 JW 메리어트 호텔에서 열린 '인텔 AI 서밋 서울 2024'에서 인텔의 AI 전략을 소개하고 국내 업체들과의 협업의 중요성을 강조했다. 호타드 부사장은 “한국 기업들과의 파트너십이 AI 미래 비전의 중심에 있다”며 “네이버와 삼성, SK하이닉스 등 기업들과 장기적인 파트너십을 갖고 협력하고 있다”고 말했다. 또 “삼성메디슨과 SKT 등 다방면 협업이 이뤄지고 있다”고 덧붙였다. 그는 “삼성과 LG가 디바이스 협력사로서 중요한 기업”이라며 “이런 파트너들과 함께 AI PC 시대를 열어가는 것에 대해서 큰 기대를 가지고 있다”고 밝혔다. 네이버와 협력 관계는 갖게 된 배경에 대해서는 “네이버가 글로벌 클라우드 프로바이더로서 자체 파운데이션 모델을 구축하고 있는 혁신 기업이기 때문에 파트너로 선정했다”며 “네이버 파운데이션 모델은 광범위한 이용 사례를 갖춰 새로운 기회나 아이디어를 테스트할 수 있는 좋은 파트너”라고 설명했다. 인텔은 앞서 네이버와 AI 가속기 '가우디2'를 이용해 거대언어모델(LLM)과 소프트웨어 생태계 확대에 나선다고 밝힌 바 있다. 장기적인 협력을 위해 국내 대학교·스타트업과 함께 AI 공동연구센터(NICL)도 설립하기로 했다. 호타드 부사장은 엔비디아 제품 대비 인텔 제품이 갖는 장점에 대한 질문에는 3가지 측면을 꼽았다. 개방형 플랫폼·생태계와 총소유비용(TCO), 워크로드의 최적화를 제시했다. 그는 “가우디3은 시장에 존재하는 다른 솔루션 대비, 가격 대비 성능에서 가장 강력한 제품이라고 생각한다”며 “인텔은 균형 잡힌 접근 방식을 통해 효율성을 극대화했다”고 전했다. 이어 “인텔의 우선순위는 핵심 고객들, 생태계 파트너들과 협력하는 것”이라며 “AI는 강력한 개방형 생태계를 필요로 한다. 네이버도 비슷한 비전을 가지고 있기에 인텔이 전략적으로 파트너십을 통해 이러한 목표를 수행해가고자 한다”고 포부를 밝혔다.

2024.06.05 15:15신영빈

인텔 "노트북용 프로세서 '팬서레이크', 인텔 18A로 찍는다"

[타이베이(대만)=권봉석 기자] 인텔이 내년 출시할 모바일(노트북)용 프로세서 '팬서레이크'(Panther Lake) 출시와 함께 그동안 뒤처졌던 반도체 제조 공정 리더십을 회복하겠다고 밝혔다. 팬서레이크는 인텔이 내년 출시 목표로 개발중인 PC용 프로세서다. 올 3분기부터 시장에 공급될 인텔 모바일(노트북)용 프로세서 '루나레이크'(Lunar Lake) 후속 제품이다. 루나레이크는 인텔이 저전력·고효율을 목표로 개발한 프로세서로 핵심 요소인 컴퓨트 타일(N3B)과 플랫폼 제어 타일 모두 대만 TSMC가 생산했다(관련기사 참조). ■ 인텔 "루나레이크, 개발 초기 단계부터 TSMC 선택" 지난 주 진행된 인텔 연례 행사 '테크투어 타이완' 기간 중 인텔 관계자는 "루나레이크 개발 초기 단계부터 최고의 성능과 전력 효율성을 확보하는 것을 목표로 출시 시기 등 많은 목표를 고려한 결과 외부 파운드리(TSMC)를 활용하겠다고 결정했다"고 설명했다. 인텔은 '테크투어 이스라엘 2022' 행사 당시 프로세서 개발에 평균 2년 반 정도를 투자한다고 밝힌 바 있다. 이를 토대로 역산하면 루나레이크는 2021년 말에서 2022년 초부터 제품 기획에 들어갔고 2022년 상반기 당시 가장 선도적인 미세 공정인 대만 TSMC의 3나노급 'N3'를 선택했음을 짐작할 수 있다. 인텔은 지난 해 9월 미국 새너제이에서 진행한 연례 기술행사 '인텔 이노베이션 2023' 당시 오픈소스 이미지 프로그램 '김프'(GIMP)와 스테이블 디퓨전 플러그인을 활용해 생성 AI 시연을 진행한 바 있다. 인텔 관계자는 "당시 시연에는 루나레이크 초기 단계 제품이 탑재됐으며 이 역시 대만 TSMC가 생산한 컴퓨트 타일(CPU)을 적용했다"고 설명했다. ■ 인텔 "내년 반도체 제조 공정 리더십 회복할 것" 인텔은 2021년 팻 겔싱어 CEO 취임 이후 5개 공정을 4년 안에 실현하겠다는 목표 아래 인텔 7, 인텔 4/3, 인텔 20A/18A 등 5개 공정을 개발하고 있다. 팻 겔싱어 인텔 CEO는 4일(대만 현지시간) 대만 타이베이 난강전람관에서 진행된 컴퓨텍스 2024 기조연설 행사에서 "2025년 출시할 팬서레이크는 인텔 18A 공정에서 생산할 예정이며 전원을 넣어 작동을 확인하는 '파워 온' 공정에 진입할 것"이라고 설명했다. 이어 "내년에는 반도체 제조 공정 리더십을 되찾겠다"고 덧붙였다.

2024.06.04 20:14권봉석

인텔 "가우디3, 납기·비용·성능 모두 뛰어난 엔비디아 대체재"

[타이베이(대만)=권봉석 기자] 인텔이 4일(이하 대만 현지시간) 오전 대만 타이베이 난강전시관에서 진행된 기조연설에서 AI 가속기 '가우디3'의 가격 대비 성능을 강조했다. 가우디3는 2022년 5월 출시된 가속기인 가우디2 후속 제품이며 TSMC 5나노급 공정에서 생산된다. 96MB S램과 128GB HBM2e 메모리를 이용해 최대 대역폭 3.7TB/s를 구현했다. 서버용 프로세서와 PCI 익스프레스 5.0 규격으로 연결되며 200Gbps 이더넷으로 서로 연결된다. 전세계 10개 이상의 글로벌 공급업체가 올 3분기부터 가우디3 기반 솔루션을 공급 계획중이다. ■ "네이버도 가우디 선택했다...TCO·TTM에서 엔비디아 대비 우위" 이날 팻 겔싱어 인텔 CEO는 "현재 클라우드 이용 현황을 보면 전체 워크로드 중 60%가 클라우드에서 실행되며 생성된 데이터 중 80%가 여전히 활용되지 않는 상황"이라고 설명했다. 이어 "LLM(거대언어모델)에 기업이나 기관의 데이터를 더한 검색증강생성(RAG)은 잠자는 데이터를 활용할 수 있는 기회를 줄 것이다. 6월부터 내년 1분기에 걸쳐 출시될 제온6 프로세서와 가우디 가속기는 이를 바꿀 수 있다"고 설명했다. 현재 AI용 GPU 시장은 엔비디아가 독식하고 있다. 팻 겔싱어 CEO는 "기업들은 대안과 개방형 구조를 원한다. 또 제품/서비스 출시 시간(TTM)을 단축하고 총소유비용을 낮추길 희망하고 있다"고 지적했다. 이어 "한국 네이버클라우드가 가우디를 쓰고 있다. 또 오픈소스 리눅스 재단과 기업용 AI 플랫폼 구축에 협업하고 있으며 제온6와 가우디가 기업 AI 워크로드에 도움을 줄 것"이라고 강조했다. ■ "가우디3, 덜 쓰고 더 얻을 수 있는 '가성비' 가속기" 팻 겔싱어 CEO는 올 3분기부터 공급될 차세대 가속기 가우디3에 대해 "같은 규모 클러스터 구성시 엔비디아 H100에서 추론 성능은 2배이며 H200 GPU 대비 경쟁력을 갖고 있다"고 설명했다. 인텔 자체 성능비교에 따르면 가우디3 8천192개 클러스터 구성시 같은 규모 엔비디아 H100 클러스터 대비 학습 시간은 40% 단축할 수 있다. 또 700억 개 매개변수로 구성된 LLM인 메타 라마2(Llama2) 구동시 가우디3 64개 클러스터는 엔비디아 H100 대비 최대 15% 빠른 학습 처리량을 제공할 예정이다. 팻 겔싱어 CEO는 "가우디3는 '덜 쓰고 더 얻을 수' 있는 AI 가속기"라며 가우디3의 개방성도 강조했다. 그는 "가우디3는 업계 표준 인터페이스인 이더넷으로 작동하며 파이토치 등 오픈소스 AI 프레임워크에 최적화됐고 수십만 개의 AI 모델을 지원한다"고 말했다. ■ 가우디3 솔루션 공급 업체 10개 이상으로 확대 가우디3는 서버용 OCP 가속화 모듈인 HL-325L, HL-325L을 8개 탑재한 UBB 표준 모듈인 HLB-325, 워크스테이션에 장착 가능한 확장 카드인 HL-338 등 3개 형태로 시장에 공급된다. 인텔은 이날 가우디3 기반 AI 서버 공급업체로 델테크놀로지스, HPe, 레노버, 슈퍼마이크로에 더해 폭스콘, 기가바이트, 인벤텍, 콴타, 위스트론 등 총 10개 이상 글로벌 업체가 참여하고 있다고 밝혔다.

2024.06.04 19:01권봉석

인텔 루나레이크, 저전력·고효율 목표로 경쟁력 강화

[타이베이(대만)=권봉석 기자] "3분기 출시할 모바일(노트북)용 프로세서 '루나레이크'(Lunar Lake)는 x86 프로세서에 대해 사람들이 가진 생각은 물론 AI PC를 경험하는 방식을 바꿀 것이다. CPU와 GPU(그래픽처리장치), NPU(신경망처리장치) 모두 경쟁에서 이길 것이다." 컴퓨텍스 타이베이 2024 전 주 진행된 '인텔 테크투어 타이완' 기조연설에서 미셸 존스턴 홀타우스 인텔 CCG(클라이언트 컴퓨팅 그룹) 총괄(수석부사장)이 이렇게 강조했다. 인텔 테크투어는 2022년부터 시작된 연례 기술 행사다. 매년 새 프로세서 출시를 앞두고 각국 기자단에 강점과 특징 등을 소개한다. 올해 행사에는 한국을 포함해 15개 국가와 지역에서 150개 매체, 227명이 참석했다. 올해 행사 핵심은 오는 3분기 출시될 모바일용 프로세서, 루나레이크다. 이달부터 국내 포함 전 세계 시장에 출시되는 퀄컴 스냅드래곤 X 엘리트/플러스, 하반기 출시될 AMD 라이젠 프로세서와 경쟁할 제품이다. ■ TSMC 위탁생산 타일과 메모리, 인텔 기술로 조립 전작인 코어 울트라 시리즈1(메테오레이크)는 컴퓨트(CPU), GPU, SOC, I/O 등 4개 타일을 인텔과 TSMC가 생산한 다음 3차원 적층 기술 '포베로스'(FOVEROS)로 결합해 구성했다. 반면 루나레이크는 CPU 타일, 그리고 GPU와 NPU, 미디어 엔진 등 다양한 반도체 IP(지적재산권)를 재배치/통합한 플랫폼 제어 타일 등 단 두 개로 구성됐다. 여기에 LPDDR5X 메모리를 결합해 주요 PC 제조사에 공급된다. CPU와 GPU가 한 메모리를 같이 쓰는 통합 구조로 애플 M시리즈 프로세서와 같은 방식의 접근을 택했다. 한 다이(Die) 안에서 데이터가 오가므로 메모리를 분리했던 과거와 달리 지연시간과 면적은 줄이면서 대역폭은 높일 수 있다. 핵심 요소인 컴퓨트 타일(TSMC N3B), 그리고 플랫폼 제어 타일 모두 대만 TSMC가 만들었다는 것도 특징이다. 두 타일을 연결하는 베이스 타일은 인텔 22나노미터 공정에서 생산됐다. ■ 컴퓨트 타일 내 P·E코어, 전력 효율성 강화에 방점 컴퓨트 타일은 고성능 P(퍼포먼스) 코어 '라이언코브'(Lion Cove) 4개와 저전력·고효율 E(에피션트) 코어 '스카이몬트'(Skymont) 4개, 총 8개 코어로 구성된다. 대부분의 작업은 E코어가 먼저 처리하며 고성능이 필요한 작업에서 P코어가 작동한다. P코어와 E코어는 최근 강조되는 지표인 와트 당 성능, 다시 말해 전력 효율성 향상에 중점을 뒀다. E코어 '스카이몬트'는 P코어 '라이언코브'보다 적은 전력으로 같은 성능을 내도록 설계됐다. 인텔 자체 검증 결과 전작(메테오레이크) 대비 클록 당 명령어 처리 성능은 P코어 최대 14%, E코어 최대 68%까지 향상됐다. 동영상 재생이나 대기 상태 등 단순한 작업만 처리하던 '저전력 아일랜드 E코어' 성능도 전세대 대비 최대 2배 향상됐다. P코어 한 개를 두 개처럼 쓰는 프로세서 효율 향상 기술인 '하이퍼스레딩'은 루나레이크에서 빠졌다. 하이퍼스레딩이 빠진 대신 IPC(클록당 처리 가능 명령어 수)를 크게 높여 성능 하락이 일어나지 않을 것이라는 것이 인텔 관계자 설명이다. ■ 성능 높이고 전력소모 줄인 Xe2 GPU로 AI 가속 GPU는 게임이나 동영상 처리 뿐만 아니라 AI PC에서 중요도가 한층 커졌다. 고밀도 연속 AI 연산을 단시간에 처리하려면 GPU의 도움은 필수다. AI 연산 성능을 가늠하는 지표인 TOPS(1초 당 1조 번 AI 연산) 중 상당수가 GPU에서 나온다. 루나레이크의 GPU는 새롭게 개발한 Xe 코어 8개를 결합한 'Xe2'다. 내부 구조를 보완해 메테오레이크 대비 성능은 50% 가까이 늘어났다. AI 연산 중 상당수를 차지하는 행렬 관련 처리를 위한 XMX도 더해 AI 처리량은 1.5배 이상 향상됐다. Xe2 GPU의 AI 연산 성능은 최대 67 TOPS다. 디스플레이 규격은 2022년 하반기 정식 확정된 디스플레이포트 2.1, HDMI 2.1과 함께 노트북 직결 디스플레이 패널과 연결되는 eDP 1.5도 함께 지원한다. 처리가 쉽지 않은 차세대 코덱인 VVC(H.266) 재생도 지원한다. ■ AI 연산 성능 NPU 단독 48 TOPS, 최대 120 TOPS 가능 마이크로소프트는 최근 '빌드' 행사에서 PC 이용 이력을 추적하는 기능인 '리콜' 등을 담은 새로운 PC 카테고리인 '코파일럿+ PC'를 공개한 바 있다. 코파일럿+ PC는 40 TOPS 이상 NPU 탑재를 요구한다. 루나레이크에 탑재된 인텔 4세대 NPU인 'NPU 4' 성능은 전작(10.5 TOPS) 대비 3배 이상인 최대 48 TOPS까지 향상됐다. 과거 2개에 그쳤던 NPU 내 연산 장치를 최대 6개까지 늘리는 한편 작동 클록도 끌어올렸다. NPU와 GPU의 성능 강화에 따라 루나레이크의 AI 연산 성능도 세 자릿수까지 올라섰다. NPU 48 TOPS, GPU 67 TOPS와 CPU 5 TOPS를 합해 최대 120 TOPS까지 AI 연산이 가능해졌다는 것이 인텔 설명이다. ■ S/W 생태계 확대 위해 루나레이크 개발킷도 보급 AI PC의 쓰임새를 최대한 확보할 수 있는 소프트웨어 관련 역량 확보도 중요하다. 인텔은 이미 AI 모델 500개를 코어 울트라에 최적화하는 한편 에이수스와 협력해 코어 울트라 시리즈1 기반 개발자 키트도 보급중이다. 미셸 존스턴 홀타우스 총괄은 "최대 120 TOPS를 실현 가능한 개발자 키트를 생산해 AI PC용 소프트웨어 개발자에게 공급할 것이다. 업그레이드가 가능한 구조로 개발돼 향후 등장할 '팬서레이크'(Panther Lake) 등 다음 제품과도 호환될 것"이라고 설명했다. 인텔은 현재 루나레이크 제품화 단계인 'B0' 스테핑 단계 실리콘이 생산에 들어갔다고 밝혔다. 오는 3분기부터 주요 PC 제조사에 공급되며 오는 연말까지 20개 제조사가 80개 이상의 제품을 출시 예정이다.

2024.06.04 12:00권봉석

3D 벤치마크 대명사 '타임스파이', GPU 성능 상향 평준화로 8년만에 퇴장

그래픽카드와 게임용 데스크톱PC·노트북 성능 비교용으로 널리 쓰이는 벤치마크 프로그램 '3D마크'(3DMark)에 최근 새 그래픽 성능 테스트 시나리오 '스틸노매드'(Steel Nomad)가 추가됐다. 2016년 투입된 다이렉트X 12 얼티밋 기반 테스트 시나리오 '타임스파이'가 최근 2~3년간 급격한 그래픽카드 성능 향상으로 변별력을 상실했고 퀄컴 등 Arm IP 기반 비(非) x86 프로세서 탑재 PC를 제대로 지원하지 못하는 것이 그 이유로 꼽힌다. 스틸노매드는 타임스파이를 대신해 4K 해상도에서 그래픽 부하를 측정해 변별력을 강화했다. 이르면 올 연말 등장할 지포스 RTX 50 시리즈 등을 포함해 앞으로 눈부시게 발전할 그래픽카드 성능 평가의 지표가 될 것으로 보인다. ■ '타임스파이', 2016년 처음 등장 후 실행 건수 4천800만 건 돌파 타임스파이는 2016년 처음 등장한 3D 벤치마크 시나리오로 윈도 운영체제의 다이렉트X 12 얼티밋 기반 게임의 구동 성능을 측정한다. 프레임 생성에 걸리는 시간과 프로세서·그래픽카드 성능을 종합해 절대 점수를 표시한다. 본지를 비롯해 국내외 많은 IT 전문매체가 데스크톱용 프로세서와 게임용 노트북, 그래픽카드 성능 측정에 타임스파이를 활용했다. 일반 소비자도 새 PC 조립 후, 혹은 그래픽카드 교체 전/후 성능 파악을 위해 타임스파이를 '돌렸다'. 타임스파이를 실행한 후 각종 데이터는 3D마크 개발사인 UL 퓨처마크에 전송된다. 지금까지 집계된 테스트 결과는 총 4천800만 건 이상이다. ■ "테스트 평균 점수 8년만에 4배 가까이 급등" 그러나 UL 퓨처마크는 최근 "등장 초기 4천 점대 후반에서 5천점 대 초반에 그쳤던 타임스파이 평균 점수가 최근 3배 이상으로 급증했다"고 밝혔다. 실제로 최근 2-3년간 PC용 그래픽카드 성능은 비약적으로 발전했다. 예를 들어 엔비디아 지포스 RTX 20 시리즈(2018년), RTX 30 시리즈(2020년), RTX 40 시리즈(2022년) 등 2년 단위로 새 그래픽카드가 나올 때마다 성능이 크게 향상됐다. 커넥트웨이브 가격비교서비스 다나와가 제공한 자료에 따르면 노트북용 외장 그래픽칩셋 벤치마크 점수는 지포스 RTX 3050 선에서 5천 점에 근접했고 지포스 RTX 4060에서 1만 점을 넘겼다. 최상위 칩인 지포스 RTX 4090의 점수는 2만 점을 넘어섰다. ■ 최근 3년간 노트북 내장 GPU 성능도 크게 향상 노트북용 프로세서 내장 그래픽칩셋(GPU) 성능도 최근 3년간 급격히 향상됐다. 과거 MX150 등 노트북용 외장 그래픽칩셋을 공급하던 엔비디아는 이런 추세에 따라 지난 해부터 추가 생산과 공급을 중단한 상태다. 인텔 11세대 코어 프로세서(타이거레이크) 내장 GPU인 아이리스 Xe는 1816점에 그쳤다. 반면 지난 해 출시된 코어 울트라 프로세서 내장 아크 그래픽스 점수는 4157점으로 2배 이상 올랐다. 이는 풀HD(1920×1080 화소) 해상도에서 옵션을 조절하면 초당 60프레임 내외로 게임을 즐길 수 있는 수준이다. 여기에 올 3분기부터 공급될 차세대 프로세서 루나레이크 역시 AI 처리 속도 단축을 위해 GPU 성능을 크게 향상시킬 예정이다. ■ 스틸노매드, 4K 해상도 기본으로 부하 최대 7배 강화 새롭게 개발된 벤치마크 시나리오인 스틸노매드는 앞으로 대중화될 4K 해상도를 기점으로 삼고 처리 부하를 크게 높였다. UL 퓨처마크는 "타임스파이 대비 3배, 파이어스트라이크 대비 7배 가까이 처리가 무거워졌다"고 설명했다. 여기에 인텔·AMD 등 x86 프로세서 뿐만 아니라 퀄컴 스냅드래곤 X 엘리트/플러스 등 Arm 계열 프로세서가 등장하는 것을 감안해 다이렉트X와 벌칸을 모두 지원한다. 안드로이드(벌칸)와 iOS(메탈)도 지원한다. 단 아직 맥OS를 정식 지원하지 않아 최근 공개된 M4 등 애플 M시리즈 내장 GPU 성능을 측정할 수는 없다. UL 퓨처마크는 "맥OS와 리눅스 지원 버전도 개발을 준비중"이라고 밝혔다.

2024.05.28 15:34권봉석

인텔 "서버·AI PC서 메타 라마3 구동 지원"

인텔은 19일 메타가 공개한 생성 AI LLM(거대언어모델) 라마3(Llama 3)를 제온 프로세서와 가우디 AI 가속기, 코어 울트라 탑재 AI PC 등에서 지원한다고 밝혔다. 메타가 공개한 라마3는 오픈소스 생성 AI 모델이며 데이터셋 중 비영어권 데이터 비중을 5%까지 높였다. 현재 매개변수 80억 개, 700억 개 버전이 선 공개됐다. 매개변수 4천억 개 버전은 현재 데이터셋 훈련중이다. 인텔은 가우디 AI 가속기, 제온/코어 울트라 프로세서와 아크 GPU로 메타가 선공개한 매개변수 80억/700억 개 버전의 구동을 검증했다고 밝혔다. 인텔은 파이토치(PyTorch), 딥스피드, 인텔 옵티멈 하바나 라이브러리, 인텔 파이토치 익스텐션 등 오픈소스 소프트웨어로 수행한 자체 벤치마크 결과도 공개했다. 인텔이 2분기 중 출시할 P코어 제온6 프로세서는 80억 개 모델 추론 구동시 4세대 제온 스케일러블 프로세서 대비 지연 시간을 절반으로 단축했다. 또 700억 개 버전에서 토큰 하나당 지연시간을 0.1초 미만으로 줄였다. 코어 울트라 프로세서는 내장 아크 GPU를 이용해 라마3 구동시 사람이 읽을 수 있는 것보다 더 빠른 속도로 토큰을 생성했다. Xe 행렬곱셈 확장(XMX)을 내장한 아크 A770은 16GB 메모리를 활용해 라마3 처리를 가속한다. 가우디2 AI 가속기는 라마2 3개 모델(70억개, 130억개, 7천억개)에 이어 라마3 모델도 구동했다. 올 하반기 출시될 가우디3 AI 가속기도 라마3를 지원한다. 인텔은 향후 매개변수를 늘리고 성능을 강화한 라마3 모델도 지속 지원할 예정이다.

2024.04.19 10:24권봉석

델, 파워엣지 서버에서 인텔 가우디3 AI 가속기 지원

델테크놀로지스는 고성능 AI 서버 '델 파워엣지 XE9680'에 '인텔 가우디 3' AI 가속기 지원을 추가한다고 15일 밝혔다. 델 파워엣지 XE9680은 x86 서버 아키텍처에 8개의 GPU를 탑재하는 모델로 AI 운영에 특화된 성능을 제공한다. 델은 XE9680 에코시스템에 인텔 가우디3 가속기를 통합함으로써 고객이 생성형 AI 워크로드와 관련된 컴퓨팅 요구 사항에 맞춰 시스템을 맞춤화 할 수 있도록 지원한다. 델은 범용성과 강력한 성능을 모두 갖춘 AI 가속 인프라를 제공하겠다는 전략이다. XE9680은 가우디3 가속기를 추가함으로써 더 풍부한 서버 구성 옵션을 제공하게 됐다. 최대 32개의 DDR5 메모리 DIMM 슬롯을 통해 데이터 처리량을 향상시켰고, 16개의 EDSFF3 플래시 스토리지 드라이브와 8개의 PCIe Gen 5.0 슬롯으로 확장된 연결성과 대역폭을 제공한다. 프로세서당 최대 56개 코어를 지원하는 4세대 인텔 제온 스케일러블 프로세서를 2개를 장착했으며, 가장 고난도의 AI·ML 워크로드에 대한 데이터 처리 및 분석에 최적화됐다. 기존 하드웨어 성능을 뛰어넘어 AI를 통해 심층적인 데이터 인사이트를 확보하고자 하는 기업에서는 폭넓은 가속기 옵션을 갖춘 XE9680을 중요 자산으로 활용할 수 있다. 고급 처리 능력과 효율적인 공랭식 설계가 결합된 이 제품은 AI 가속화의 새로운 기준을 제시하며, 비즈니스 성과를 촉진하는 신속하고 실행 가능한 인사이트를 제공한다. 인텔 가우디 3 AI 가속기를 탑재한 '파워엣지 XE9680' 서버 모델은 올해 안에 국내 출시될 계획이다 인텔 가우디3 AI 가속기는 64개의 커스텀 및 프로그래밍 가능한 텐서 프로세서 코어(TPC)와 128GB의 HBMe2 메모리 용량, 3.7TB의 메모리 대역폭, 96MB의 온보드 SRAM 등 생성형 AI 워크로드에 필수적인 스펙을 갖췄다. 가우디3는 개방형 에코시스템을 갖춰 파트너십 기반의 최적화 및 모델 라이브러리 프레임워크 지원의 이점이 있다. 기존 코드베이스의 전환을 간소화하는 개발 툴로 간편한 마이그레이션을 지원한다. 가우디3 가속기로 강화된 파워엣지 XE9680은 6개의 OSFP 800GbE 포트를 통해 가속기에 직접 결합된 새로운 네트워킹 기능을 제공한다. 외장 NIC를 시스템에 배치할 필요 없이 외부 가속기 패브릭에 직접 연결 가능해 인프라를 단순화하고 인프라의 총소유비용과 복잡성을 낮추는데 효과적이다. 인텔 가우디3 전문 미디어 디코더는 AI 비전 애플리케이션을 위해 설계됐다. 광범위한 사전 처리 작업을 지원해 비디오에서 텍스트로의 변환을 간소화하고 엔터프라이즈 AI 애플리케이션의 성능을 향상시킨다. 델은 최근 포레스터웨이브 보고서에서 AI 분야 선도 기업으로 선정됐다. IT 및 데이터 과학자가 AI를 적용하고 생산성을 높일 수 있도록 포괄적인 솔루션을 제공함으로써 엔드투엔드 환경의 생성형AI 성과를 이끌어낸다는 평가를 받으며 전략과 오퍼링 측면 모두에서 높은 점수를 획득했다. 김경진 한국델테크놀로지스의 총괄 사장은 “델은 폭넓은 협업 전략을 통해 AI 개발의 경계를 확장하고, 새로운 표준을 끊임없이 제시하고 있다”며 “고객이 AI 여정의 어느 단계에 있든 목표 달성을 가속하고, 미래에 필요하게 될 요구 성능에 대비하는 동시에 이 여정이 안전하게 지속될 수 있도록 지원하는데 집중할 계획”이라고 강조했다.

2024.04.15 11:39김우용

  Prev 1 2 Next  

지금 뜨는 기사

이시각 헤드라인

폴더블 아이폰, 펀치홀 카메라 탑재 유력

배민·요기요, 먹통 뒤 정상화..."금요일 밤 비 내린 탓"

과학자들, 납으로 금 만들었다…'연금술사의 꿈' 실현되나

SKT 유심교체 누적 193만...교체 예약 대기 686만

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현