• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
AI페스타
배터리
양자컴퓨팅
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'레이크'통합검색 결과 입니다. (125건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

인텔, 코어 13·14세대 프로세서 불안정 문제 원인 찾았다

인텔이 데스크톱PC용 13/14세대 코어 프로세서에서 발생하던 게임 튕김이나 비정상 종료 문제에 대한 근본 원인을 찾았다고 밝혔다. 프로세서 내 작동을 제어하는 소프트웨어인 마이크로코드(microcode)의 버그가 원인이라는 것이다. 인텔은 해당 문제를 해결할 마이크로코드 패치 검증을 거쳐 오는 8월 중순까지 주요 PC 제조사와 메인보드 제조사에 공급할 예정이다. ■ 지난 3월 말부터 국내외 커뮤니티서 문제 불거져 인텔 13·14세대 코어 프로세서 제품에서 게임 구동시 발생하는 문제는 미국과 유럽, 국내 PC·게임 커뮤니티에서 지난 3월 말부터 제기됐다(관련기사 참조). PC용 게임 '철권8'을 시작으로 더파이널스, 배틀필드 2042, 램넌트2, 로드오브폴른, 호그와트 레거시, 팰월드, 호라이즌, 오버워치2, P의 거짓말 등 언리얼 엔진으로 개발된 게임에서 문제가 발생한다는 것이다. 인텔은 당초 일부 메인보드 펌웨어(바이오스)에서 지나치게 높은 전압을 공급해 프로세서를 불안정하게 만든다고 판단했다. 온도가 상승한 상황에서 급격히 부하가 걸리는 작업을 실행할 경우 강제 종료 현상이 발생한다는 것이다. ■ 5월 주요 메인보드 제조사에 '인텔 디폴트 설정' 배표 인텔은 지난 5월 주요 메인보드 제조사를 대상으로 '인텔 디폴트 설정'을 배포했다. 프로세서 고성능 작동시 안정성을 확보하기 위한 CEP(전류 일탈 방지), 서멀 벨로시티 부스트 작동시 전압 최적화 등을 모두 활성화하고 최대 전류량을 제한하는 것이 핵심이다. 이어 6월에는 "13/14세대 코어 프로세서의 기능 중 하나인 '인핸스드 서멀 벨로시티 부스트'(eTVB) 알고리듬에 버그가 있다는 사실을 파악했다"고 추가로 밝혔다. eTVB 기능은 프로세서 작동 온도와 전원 공급에 여유가 있는 상황에서 최대 2코어(듀얼코어)의 작동 클록을 자동으로 끌어올린다. 인텔은 "eTVB 알고리듬의 버그는 작동 조건에 문제를 일으킬 수 있다"고 설명했다. 또 "eTVB 알고리듬 버그가 문제의 근본 원인은 아니며 조사중"이라고 덧붙였다. ■ "문제 근본 원인은 마이크로코드 알고리듬 버그" 22일(미국 현지시간) 인텔은 고객지원 페이지를 통해 "13/14세대 코어 프로세서의 불안정 문제를 일으키던 원인을 파악했다"고 밝혔다. 인텔은 "불안정 문제로 교환된 13/14세대 코어 프로세서를 집중 분석한 결과 상승된 전압이 문제를 일으키고 있음을 파악했다"고 설명했다. 이어 "교환된 프로세서를 분석한 결과 프로세서에 올바르지 않은 전압을 요구하는 마이크로코드 알고리듬으로 전압이 높아졌다"고 밝혔다. 지난 6월 발견된 eTVB 알고리듬 버그에 이어 또 다른 버그가 발견된 것이다. ■ 인텔 "오는 8월 중순까지 마이크로코드 패치 공급 예정" 인텔은 "13/14세대 코어 프로세서의 불안정 현상이 일어나는 시나리오를 계속해서 검증중이며 전압을 상승시키는 근본 원인을 해결할 마이크로코드 패치를 오는 8월 중순까지 공급할 예정"이라고 밝혔다. 조립PC는 메인보드 제조사가 공급하는 UEFI 펌웨어(바이오스) 업데이트로, 완제PC는 제조사가 공급하는 펌웨어 업데이트를 적용해 문제를 해결할 수 있다. 문제는 프로세서가 규정치보다 높은 전압에 지속 노출되면 시간이 지나면서 손상될 수 있다는 점이다. 마이크로코드 패치가 물리적 손상까지 복구해주지는 못하며 결국 프로세서 교체가 필요하다. 인텔 관계자는 "13/14세대 코어 프로세서의 불안정성 문제를 겪고 있는 소비자는 인텔 고객 지원팀에 관련 지원을 요청해 달라"고 밝혔다.

2024.07.23 11:22권봉석

HPE, 파트너 수익성 강화하는 AI 활성화 프로그램 발표

HPE는 엔비디아와 협력해 파트너의 수익성 강화와 신규 수익원 창출을 지원하는 인공지능(AI) 활성화 프로그램을 28일 발표했다. 해당 프로그램은 AI, 컴퓨팅, 스토리지, 네트워킹, 하이브리드 클라우드, 지속가능성 부문을 모두 아우르는 새로운 기능 및 추가 리소스와 함께 향상된 HPE 그린레이크 프로그램 및 역량을 제공한다. HPE는 새롭게 공개한 HPE 기반 엔비디아 AI 컴퓨팅 포트폴리오의 일환으로 엔비디아와 협력해 새로운 AI 파트너 전략을 수립했다. 양사는 HPE의 선두적인 엣지투클라우드(edge-to-cloud) 포트폴리오를 활용해 더 큰 혁신과 기회를 도모할 계획이다. HPE는 주요 파트너사들이 자사 AI 기술을 더욱 발전시킬 수 있도록 차별화된 트레이닝 및 자격 과정 AI 워크숍 및 역량 프로그램을 제공할 예정이다: AI 가속화 워크숍은 AI 활용을 희망하는 파트너들을 지원하며, AI 활용 준비 상태를 평가하고 맞춤형 AI 성장 전략, 성공여부 평가기준, AI 서비스 사례 구축을 위한 로드맵 등을 제공한다. AI 기술 개발 워크숍, 자기주도 학습 콘텐츠 및 자격증 프로그램이 운영된다. HPE 테크 프로에서 해당 워크숍 및 프로그램 등 모든 기능들을 이용할 수 있으며, 엔비디아가 개발한 자기주도 트레이닝 프로그램도 제공될 예정이다. HPE는 엔비디아의 최신 자격증 프로그램도 활용할 계획이다. 이러한 자료들은 HPE와 엔비디아의 AI 솔루션 포트폴리오의 풀스택 AI 솔루션을 판매하고 구축할 수 있는 역량 등, 파트너사들의 AI 역량을 한층 더 발전시킬 수 있도록 도와준다. HPE AI 솔루션 역량은 파트너들이 AI의 모든 라이프 사이클에 걸쳐서 폭넓은 AI 사용 사례를 개발할 수 있도록 지원한다. AI를 처음 도입하는 고객사, 또는 기존 사용 사례를 더욱 확장하는 경우, 고급 AI 연구를 실행하는 사례에 이르기까지 다양한 단계에 거쳐 활용할 수 있다. 엔비디아와 HPE는 채널 파트너들을 대상으로 더욱 종합적인 역량 강화 프로그램을 제공한다. 채널 파트너들은 AI 워크로드용으로 설계된 풀스택 턴키 프라이빗 클라우드인 HPE 프라이빗 클라우드 AI 같은 AI 소프트웨어 및 하드웨어 솔루션 스택을 추천, 배포 및 관리할 수 있는 역량을 기를 수 있다. HPE 컴퓨팅 역량은 파트너로 하여금 고객이 계획한 AI 모델과 사용사례를 더욱 원활하게 지원할 수 있도록 추론 솔루션에 대한 전문성을 개발할 수 있도록 한다. 일례로 엔비디아 인증 HPE 프로라이언트 GenAI 추론 서버는 고객이 원하는 추론 성능 요구 사항에 최적화된 AI 및 데이터 소프트웨어를 갖추고 있으며 성능 대비 효율성도 뛰어나 투자수익률(ROI)에도 긍정적인 효과를 가져올 수 있다. 파트너들은 파트너 프로그램을 통해 이처럼 최적화된 HPE의 컴퓨팅 역량을 고객에게 추천할 수도 있다. HPE의 엔터프레이즈 레벨 고성능 컴퓨팅(HPC) 역량은 파트너들이 더욱 독자적인 생성형 AI 모델을 개발하고 있는 기업 고객들의 더욱 높은 수준을 지원할 수 있도록 한다. 또한, HPC 역량은 딥러닝, 자율주행, 금융 모델링과 같은 데이터 집약적인 모델과 사용사례를 지원할 수 있는 전문성을 더욱 개발할 수 있다. 해당 역량은 파트너들이 엔비디아 인증 HPE 크레이 시스템 등 HPE 크레이 포트폴리오를 자사 AI 및 HPC 전략에 통합하여 활용할 수 있도록 한다. HPE 스토리지 및 데이터 서비스 역량은 HPE 알레트라 MP 파일 스토리지를 지원할 수 있는 전문성을 더욱 강화해 업데이트됐다. NVIDIA DGX BasePOD 인증 및 NVIDIA OVX 검증이 완료된 엔터프라이즈급 파일 스토리지 솔루션을 제공해 AI, 생성형 AI 및 GPU 집약적인 워크로드의 대규모 활용을 가속한다. HPE 파트너 레디 벤티지 프로그램은 파트너들이 연간 반복 매출(ARR)을 증대시키고 서비스를 지속적으로 성장시킬 수 있는 기반을 제공하는 프로그램이다. 해당 프로그램은 포괄적인 영역을 다루는 COE 및 역량(competency)을 제공해 파트너들이 새로운 역량과 더욱 차별화된 솔루션 및 서비스를 개발해 수익과 성장을 견인할 수 있도록 지원한다. HPE는 글로벌 시장조사업체 카날리스와 협력해 파트너 경제 승수 지표에 대한 연구를 통해 프로그램에 등록한 파트너들이 수익을 낼 수 있는 기회들을 수치화했다. 해당 연구에 따르면, 고객이 HPE 솔루션에 투자한 1달러당, 파트너의 제품 및 서비스에 최대 4.9달러를 지출한다. 이는 곧 HPE 파트너 레디 벤티지 프로그램에 등록해 고객들에게 추가적인 서비스를 제공하는 파트너들은 잠재적으로 지속 우상향하는 수익 창출 기회를 얻을 수 있다는 점을 시사한다. 파트너 레디 벤티지에 등록된 파트너는 추가적인 수익 향상 지원으로, HPE 아루바 네트워킹 시큐리티 서비스 엣지, 지속가능성을 위한 HPE 솔루션, HPE 파이낸셜 서비스(HPEFS) 파트너 참여 가이드, HPE 그린레이크 기반 서비스 제공 등을 이용할 수 있다. HPE는 새로운 HPE 그린레이크 제품 및 서비스를 제공해 파트너들이 더욱 빠르게 가치를 실현하고 고객의 하이브리드 클라우드 환경에 관한 강력한 인사이트를 도출할 수 있도록 했다. HPE 그린레이크 인스턴스는 표준화돼 빠르게 이용할 수 있게 됐다. HPE 그린레이크 플렉스 솔루션은 지속가능성 및 옵저버비리리티 관련 기능을 갖춘 하이브리드 클라우드 환경을 제공할 수 있도록 업그레이드 됐다. HPE 그린레이크 관리형 서비스 공급자(MSP)용 워크스페이스는 옵스램프, 컴퓨팅 옵스 매니지먼트를 위한 HPE 그린레이크, HPE 아루바 네트워킹 UXI를 지원한다. 사이먼 유잉턴 HPE 월드와이드 채널 및 파트너 생태계 부사장은 “이러한 최신 기술들을 통해 HPE는 파트너 에코시스템이 더욱 확장하고 새로운 수익원을 창출할 수 있도록 계속해서 투자하고 있다”며 “파트너들이 AI를 활용할 수 있도록 필요한 툴과 기술을 제공하고 시장에서 거대한 기회를 모색할 수 있도록 지원하고 있는 노력들이 이에 해당된다”고 밝혔다. 그는 “엔비디아와 협력을 더욱 확대하면서, HPE의 새로운 기술 개발 프로그램은 파트너들로 하여금 그들의 고객이 새로운 AI 기술을 개발하고 배포하는 방법을 더욱 잘 안내할 수 있도록 지원한다”며 “이로써 고객은 다양한 사용 사례를 개발하고 전 산업부문에 걸쳐 경쟁력을 더욱 강화할 수 있게 된다”고 강조했다.

2024.06.28 15:02김우용

노트북 기본 메모리 16GB 시대, AI PC가 앞당긴다

올 하반기 이후 출시될 노트북 메모리 용량이 기본 16GB를 넘길 것으로 예상된다. 시장조사업체 트렌드포스는 올해 출시되는 노트북 컴퓨터 메모리 평균 용량이 11.8GB까지 늘어날 것으로 예상했다. 또 내년 출시되는 노트북이 대부분 16GB 이상 메모리를 탑재할 것으로 전망했다. 마이크로소프트는 코파일럿+ PC 구동을 위한 조건으로 최소 16GB 메모리를 요구한다. 또 AI PC의 NPU(신경망처리장치)를 활용한 각종 응용프로그램도 AI 모델을 구동하기 위해 메모리를 더 많이 쓰기 때문에 16GB 이상 메모리 탑재가 필수 조건이다. ■ 코파일럿+ PC, 최소 메모리 16GB 요구 마이크로소프트는 코파일럿+ PC 구동을 위한 하드웨어 요구사항으로 40 TOPS(1초당 1조 번 연산)급 NPU를 내장한 프로세서와 256GB SSD/UFS 저장장치, DDR5/LPDDR5 16GB 메모리를 요구한다. 마이크로소프트가 윈도11 구동에 요구하는 최소 메모리는 4GB인데 코파일럿+ PC는 이의 4배 이상을 요구하는 것이다. 갑자기 많은 용량을 요구하는 것처럼 보일 수 있지만 실제로는 마냥 넉넉하지도 않다. 16GB 메모리를 설치한 PC에서는 통상적으로 윈도11 부팅 후 약 8GB 가량이 남는다. 또 윈도11에서 제공하는 AI 관련 기능인 코크리에이터, 라이브 캡션 등을 활용하려면 이에 맞는 AI 모델이 메모리에 올라와야 한다. 여기에 16GB 메모리를 윈도11이 모두 쓸 수 있는 것도 아니다. 일례로 퀄컴 스냅드래곤 X 엘리트 탑재 PC는 내부 하드웨어와 아드레노 GPU 등을 위해 전체 메모리 용량 중 약 600MB를 따로 떼어 놓는다. 결국 실제 이용 가능한 용량은 15.4GB가 된다. ■ 트렌드포스 "올해 노트북 메모리 평균 용량, 전년比 12% 증가" 시장조사업체 트렌드포스는 25일 "노트북에 탑재되는 평균 메모리 용량은 지난 해 10.5GB에서 올해 12% 늘어난 11.8GB까지 늘어날 것"이라고 전망했다. 이어 "내년에는 최소 16GB 이상 메모리를 갖춘 AI 처리 가능 노트북 보급률이 20%까지 높아지며 메모리 평균 용량은 12GB까지 높아질 것"이라고 설명했다. 트렌드포스는 "AI 노트북 등장은 노트북 메모리 평균 용량을 높이고 LPDDR 등 저전력 고성능 메모리 수요도 불러올 것"이라고 전망했다. ■ 노트북 메모리 교체 대부분 불가능... 16/32GB 양자택일 필요 메모리 용량이 넉넉할 수록 좋다는 데는 이견이 없다. 문제는 대부분의 PC 제조사가 메모리를 교체/업그레이드 할 수 없는 형태로 노트북을 출시하는데다 메모리 용량이 늘어난 만큼 노트북 가격을 더 비싸게 매긴다는 것이다. 다음 달부터 공급될 AMD 라이젠 AI 300 프로세서는 이를 공급받는 PC 제조사 설계에 따라 메인보드 일체형이나 SO-DIMM 모듈 등을 선택할 수 있다. 인텔이 3분기부터 공급할 루나레이크(Lunar Lake) 프로세서는 프로세서 다이에 LPDDR5 메모리를 집적한 상태로 공급되며 별도 업그레이드나 메모리 모듈 교체가 불가능하다. 퀄컴 스냅드래곤 X 엘리트/플러스는 슬림 노트북 위주로 공급 예정이며 대부분 메인보드에 메모리 모듈을 결합한 형태로 생산된다. 이들 제품을 구입할 경우 16GB나 32GB 용량 중 원하는 메모리 용량을 신중하게 선택해야 한다는 과제가 남는다.

2024.06.28 09:46권봉석

AI PC 성능, NPU TOPS 값만 놓고 판단할 수 있나

AI PC용 프로세서와 SoC(시스템반도체)를 개발하는 여러 제조사는 현재 NPU(신경망처리장치)의 AI 연산 처리 속도를 나타내는 값인 TOPS(1초당 1조번 연산)로 치열한 신경전을 벌이고 있다. 애플은 지난 5월 아이패드 프로에 M4 칩을 탑재하며 "M4의 뉴럴 엔진 성능은 지금까지 출시된 어떤 AI PC의 NPU보다 빠르다"고 자평하기도 했다. 인텔은 오는 3분기 출시할 루나레이크(Lunar Lake)의 NPU 성능이 메테오레이크 대비 3배 이상인 48 TOPS라고 공언했다. 다음 달 출시를 앞둔 AMD 라이젠 AI 300 프로세서는 50 TOPS를 내세웠다. 그러나 많은 제조사가 경쟁적으로 내세우는 TOPS 값은 단순 계산을 통해 얻은 이상적인 최대치이며 실제 AI 연산의 성능까지 반영하지 못한다. 또 NPU가 처리하는 데이터의 정밀도 기준을 바꾸면 두 배로 늘어나거나, 정반대로 반토막날 수 있다. ■ TOPS 값은 어떻게 얻나 TOPS는 이미지 생성, LLM(거대언어모델) 등에 필요한 AI 연산을 1초 당 몇 번 수행할 수 있는지 계산을 통해 얻은 숫자다. AI 연산에 가장 널리 쓰이는 계산 방식은 행렬로 구성된 숫자를 서로 곱한 다음 더하는 방식인 MAC(Multiply–accumulate, 곱셈 가산)이다. 이를 바탕으로 CPU나 NPU, GPU가 한 클록당 수행 가능한 'MAC 연산 갯수', 내장된 MAC 처리 가능 '엔진 숫자', 작동 클록을 모두 곱한 다음 1조 번(10의 12승)으로 나눈 값이 TOPS다. 이런 계산 방식에는 각 제조사간 이론의 여지가 없다. ■ 각 제조사 간 TOPS 산출시 데이터 정밀도 모두 달라 각 제조사는 이를 토대로 계산한 값을 TOPS 값으로 내세운다. 인텔 코어 울트라 시리즈1(메테오레이크) 내장 NPU 3의 TOPS는 11.5, 루나레이크(Lunar Lake) 내장 NPU 4의 TOPS는 48이다. AMD 라이젠 AI 300 시리즈의 TOPS는 50이다. 그러나 주요 프로세서 제조사가 내놓은 TOPS 값 계산 과정이 대등하지 않다는 것이 문제다. 가장 대표적인 것이 바로 MAC 연산 처리량에 가장 큰 영향을 미치는 자료형(데이터타입)의 정밀도 수준이다. 가령 생성 AI로 그림 파일을 생성할 경우 처리하는 데이터의 비트 수가 늘어날 수록 보다 선명하고 사실적인 이미지를 얻을 수 있다. 단 MAC 연산량은 비트 수에 반비례 해 떨어진다. 반대로 정밀도를 낮추는 대신 연산 속도를 높이는 선택도 가능하다. ■ 인텔·AMD·퀄컴은 INT8, 애플은 INT4 기준 산출 문제는 TOPS를 산출할 때 각 제조사가 기준으로 삼은 자료형이 같지 않다는 것이다. 다시 말해 동일 선상에서 단순 비교가 어렵다는 것이다. 전통적인 x86 프로세서 제조사인 인텔과 AMD는 INT8(정수, 8비트) 데이터 처리시를 기준으로 TOPS를 산출해 이를 밝히고 있다. 퀄컴 스냅드래곤 X 엘리트/플러스의 헥사곤 NPU도 INT8을 기준으로 했다. 애플이 M4 칩 공개 당시 내세운 뉴럴 엔진의 TOPS는 38 TOPS이며 INT4(정수, 4비트) 기준이다. 정밀도가 절반으로 떨어지면 TOPS는 두 배로 오른다. INT8 기준으로 TOPS를 다시 계산하면 애플 M4의 AI 성능은 절반으로 떨어진다. ■ 작동 클록 증감도 NPU 성능에 영향 미친다 작동 기기의 전원 공급 상태(어댑터/배터리)에 따라 NPU의 작동 클록이 떨어지거나 높아지면 TOPS 값도 자연히 달라진다. 그러나 TOPS 값은 어디까지나 NPU를 구성하는 반도체 IP(지적재산권)의 이론상 제원을 토대로 계산한 가장 이상적인 값이다. 여기에 AI 연산의 성격이 모두 달라 CPU나 NPU, GPU 어느 하나만으로 원활한 처리가 쉽지 않다는 것도 고려할 필요가 있다. NPU는 저전력 상시구동으로 기존 CPU의 전력 소모 등 부담을 덜기 위한 장치다. 연산량이 집중되는 생성 AI는 NPU에만 의존할 수 없다. 또 GPU는 AI 연산에 가장 뛰어난 성능을 내지만 장시간 구동시 배터리를 크게 소모한다. ■ "일관성 지닌 벤치마크 등장할 때까지 최소 반년 이상 걸릴 것" PC 탑재 프로세서와 메모리, SSD 등 각 부품의 상태를 보여주는 윈도11 기본 프로그램인 '작업 관리자'는 지난 해 업데이트를 통해 NPU의 활용률과 메모리 이용량을 표시하는 기능을 추가했다. 그러나 실제 작동 클록까지 실시간으로 보여 주지 않는다. 가장 이상적인 방법은 모든 제조사가 TOPS의 기준점이 되는 데이터 정밀도에 INT8, FP16(부동소수점, 16비트) 등 동일한 기준을 적용해 최소한의 일관성을 확보하는 것이다. 하지만 NPU TOPS 값으로 우열을 가리고 싶은 제조사 사이에 중립적인 논의는 사실상 불가능하다. 컴퓨텍스 2024 기간 중 진행된 라운드테이블에서 팻 겔싱어 인텔 CEO는 "아직까지 좋은 비교 기준으로 삼을 수 있는 벤치마크 소프트웨어가 없으며 관련 업계에 일관성 있는 기준이 생기기까지 최소 반년, 적어도 1년 이상이 걸릴 것"이라고 전망했다.

2024.06.20 10:01권봉석

HPE-엔비디아, 생성형 AI 인프라 협업 포트폴리오 출시

HPE는 엔비디아와 공동 개발한 AI 솔루션 'HPE 기반 엔비디아 AI 컴퓨팅(NVIDIA AI Computing by HPE) 포트폴리오'를 19일 출시했다. 이는 HPE가 기업 고객들이 생성형 AI 도입을 가속할 수 있도록 엔비디아와 협력해 개발한 AI 솔루션 및 고투마켓 포트폴리오다. 포트폴리오의 주요 제공 서비스 중 하나는 HPE 프라이빗 클라우드 AI다. HPE 프라이빗 클라우드 AI는 엔비디아의 AI 컴퓨팅, 네트워킹과 소프트웨어를 HPE의 AI 스토리지, 컴퓨팅, 및 HPE 그린레이크 클라우드와 가장 견고하게 통합됐다. IT 운영이 워크로드 및 IT 효율성을 향상시킬 수 있도록 새로운 옵스램프 AI 코파일럿을 제공한다. 전체 수명주기 관리를 포함한 셀프 서비스 클라우드 경험을 제공하며, 다양한 AI 워크로드와 사용 사례를 지원하기 위해 4가지 사이즈의 다른 구성으로 제공된다. HPE가 제공하는 모든 엔비디아 AI 컴퓨팅 제품 및 서비스는 양사의 공통 고투마켓 전략을 기반으로 제공되며, 이 전략에는 판매팀 및 채널 파트너, 교육, 그리고 딜로이트, HCL테크, 인포시스, TCS 및 위프로 등 SI 업체를 아우르는 글로벌 네트워크를 포함한다. HPE 프라이빗 클라우드 AI는 혁신을 가속화하고 투자 수익을 높이는 동시에 AI로 인한 기업의 리스크를 관리할 수 있는 독특한 클라우드 기반 경험을 제공한다. 이 솔루션은 고유 데이터를 활용한 추론, 미세 조정 및 RAG AI 워크로드를 지원한다. 데이터 프라이버시, 보안, 투명성, 거버넌스 요건을 위한 엔터프라이즈급 제어 기능을 제공하며, 생산성 향상을 위한 IT옵스 및 AI옵스 기능을 포함한 클라우드 경험을 갖췄다. AI 및 데이터 소프트웨어 스택의 기반은 엔비디아 NIM 추론 마이크로 서비스를 포함한 엔비디아 AI 엔터프라이즈 소프트웨어 플랫폼으로 시작된다. 엔비디아 AI 엔터프라이즈는 데이터 사이언스 파이프라인을 가속하고, 프로덕션급 코파일럿 및 기타 생성형 AI 애플리케이션의 개발 및 배포를 간소화한다. 엔비디아 AI 엔터프라이즈에 포함된 엔비디아 NIM은 최적화된 AI 모델 추론을 위한 사용하기 쉬운 마이크로서비스를 제공하여 다양한 사용 사례에 대해 프로토타입에서 안전한 AI 모델 배포로 원활하게 전환할 수 있도록 한다. 엔비디아 AI 엔터프라이즈 및 엔비디아 NIM을 보완하는 HPE AI 에센셜 소프트웨어는 적응형 솔루션, 지속적인 기업 지원, 안전한 AI 서비스를 제공하는 통합 컨트롤 플레인을 갖춘 준비된AI 및 데이터 기반 툴 세트를 제공하며, 이를 통해 데이터 및 모델 준수, 확장 가능한 기능 등 AI 수명 주기 전반에 걸쳐, AI 파이프라인이 규정을 준수하는 동시에 설명 및 재현이 가능하도록 보장한다. HPE 프라이빗 클라우드 AI는 엔비디아 스펙트럼-X 이더넷 네트워킹, HPE 알레트라 MP 파일 스토리지, 엔비디아 L40S·H100 NVL 텐서코어 GPU·GH200 NVL2 등을 지원하는 HPE 프로라이언트 서버로 구성된다. HPE 프라이빗 클라우드 AI는 HPE 그린레이크 클라우드 기반의 셀프 서비스 클라우드 환경을 제공한다. HPE 그린레이크 클라우드 서비스를 이용하는 고객들은 단일 플랫폼 기반 컨트롤 플레인을 통해 하이브리드 환경 전반에서 엔드포인트, 워크로드 및 데이터를 자동화, 조정 및 관리할 수 있는 관리 기능 및 옵저버빌리티를 제공 받으며, 워크로드 및 엔드포인트의 지속 가능성 관련 지표도 확인할 수 있다. 옵스램프의 IT 운영은 HPE 그린레이크 클라우드와 통합돼 모든 HPE 제품 및 서비스에 대한 통합 옵저버빌리티 및 AI옵스를 제공한다. 또한, 엔비디아 NIM 및 AI 소프트웨어 같은 엔비디아 가속 컴퓨팅 스택과 엔비디아 텐서 코어 GPU, AI 클러스터 및 엔비디아 퀀텀 인피니밴드, 엔비디아 스펙트럼 이더넷 스위치에 대한 엔드투엔드 통합 옵저버빌리티도 제공한다. 옵스램프 운영 코파일럿은 엔비디아의 가속 컴퓨팅 플랫폼을 활용해 대규모 데이터를 대화형 어시스턴트를 통해 분석하고 통찰력을 제공하여 운영 관리의 생산성을 높인다. 옵스램프는 또한 크라우드스트라이크 API와 통합돼 전체 인프라와 애플리케이션 전반에 걸친 엔드포인트 보안 현황을 한눈에 볼 수 있도록 한다. 안토니오 네리 HPE 회장 겸 CEO는 “생성형 AI는 기업 혁신을 위한 엄청난 잠재력을 가지고 있지만, 단편화된 AI 기술의 복잡성은 대규모 기업의 AI 기술 도입을 어렵게 하는 많은 리스크와 장애물을 포함하고 있어 기업의 가장 가치있는 자산인 고유 데이터를 위험에 처하게 할 수 있다”며 “HPE와 엔비디아는 기업에서 생성형 AI의 엄청난 잠재력을 발휘할 수 있도록 하기 위해 AI를 위한 포괄적인 턴키 프라이빗 클라우드를 공동 개발했다”고 말했다. 젠슨 황 엔비디아 참립자 겸 CEO는 “생성형 AI와 가속 컴퓨팅은 모든 산업이 산업 혁명에 동참하기 위해 경쟁하면서 근본적인 변화를 일으키고 있다”며 “엔비디아와 HPE는 우리의 기술을 이렇게 깊게 통합한 적이 없었으며, 엔비디아의 전체 AI 컴퓨팅 스택과 HPE의 프라이빗 클라우드 기술을 결합해 기업 고객과 AI 전문가들에게 AI의 경계를 확장할 수 있는 가장 진보된 컴퓨팅 인프라와 서비스를 제공할 계획”이라고 강조했다.

2024.06.19 15:30김우용

인텔 CPU '루나레이크' 탑재 휴대용 게임PC 파이 커진다

레노버 리전고, ROG 앨리(ROG ALLY) 등 현재까지 출시된 휴대형 게임PC는 대부분 AMD 라이젠 Z1/Z1 프리미엄 APU 기반이다. 인텔 프로세서 기반 제품은 올 초 MSI가 공개한 '클로 A1M'이 유일하다. 그러나 올 하반기에는 MSI 뿐만 아니라 더 많은 회사가 인텔 루나레이크(Lunar Lake) 프로세서 기반 제품을 내놓을 것으로 보인다. MSI가 루나레이크 기반 '클로 8 AI+'를 공개한 데 이어, 대형 제조사 중 한 곳이 제품 출시를 검토하고 있다. ■ MSI, 올 초 메테오레이크 기반 '클로 A1M' 공개 MSI는 올 초 CES 2024에서 코어 울트라 시리즈1(메테오레이크) 탑재 휴대용 게임PC인 '클로 A1M'을 공개했다. 인텔 모바일용 프로세서를 탑재한 휴대용 게임PC는 클로 A1M이 처음이다. CES 2024 기조연설 중 미셸 존스턴 홀터스 인텔 클라이언트 컴퓨팅 그룹(CCG) 수석부사장은 "클로 A1M은 MSI와 긴밀한 협력을 통해 탄생한 제품이며 코어 울트라의 전력 효율성을 통해 실현된 새로운 폼팩터"라고 소개했다. 클로 A1M은 인텔 코어 울트라7 155H 프로세서와 7인치, 1920×1080 화소 IPS 터치스크린을 탑재하고 기존 윈도 PC에서 구동되는 모든 게임을 실행할 수 있다. 국내에는 지난 5월부터 유통된 데 이어 최근 성능 개선 펌웨어도 공개됐다. ■ 루나레이크 탑재 후속 제품 '클로 8 AI+' 첫 선 MSI는 컴퓨텍스 타이베이 2024 기간 중 난강전람관 부스에서 클로 2세대 제품인 '클로 8 AI+'(A2VM) 시제품을 공개했다. 제품 보호를 위해 아크릴 케이스 안에 전시했지만 버튼 배치나 디자인은 1세대 제품과 큰 차이가 없음을 알 수 있다. 크기나 무게는 기존 제품과 유사하지만 디스플레이 크기를 7인치에서 8인치로 키우고 배터리 용량은 최대 80Whr까지 선택할 수 있다. 현장의 MSI 관계자는 "해당 제품 출시 시기와 가격은 미정"이라고 밝혔다. ■ 인텔 기조연설에 등장한 의문의 기기 MSI 이외에 또 다른 대형 대만 제조사도 루나레이크 기반 휴대용 게임PC를 출시할 가능성이 크다. 지난 4일 팻 겔싱어 인텔 CEO는 컴퓨텍스 2024 기조연설 중 루나레이크 탑재 기기 시제품을 일제히 공개했다. 이 중 대만 ODM 업체인 '인벤텍'(Inventec) 로고가 표시된 휴대용 게임PC가 화제를 모았다. 이 기기는 지금까지 공개된 적이 없는 제품이며 버튼 배치와 스피커 위치, 각종 버튼 모양 등 디자인도 MSI 클로와 전혀 다르다. 당시 현장에 있던 인텔 관계자는 "전시된 기기는 코어 울트라 시리즈1과 루나레이크 탑재 제품이 섞여 있으며 어느 제품에 어떤 기기가 탑재됐는지 공개할 수 없다"고 설명했다. 제품을 보다 가까이서 보여 달라는 취재진의 요청도 거절했다. ■ "대만 대형 제조사와 루나레이크 탑재 기기 출시 협의중" 난강전람관 4층의 인벤텍 부스에 있던 관계자는 해당 기기가 찍힌 사진을 보고 처음에는 "이것은 처음 보는 기기"라고 답했지만 내부 확인을 거친 후 "이것은 우리가 만든 기기가 맞다"고 확인했다. '안에 들어간 프로세서가 어떤 제품인가'라고 묻자, 그는 행사장 안에 있던 인텔타이완 관계자를 호출했다. 인텔타이완 관계자는 "인벤텍은 대형 대만 제조사의 ODM 업체이며 사진에 찍힌 기기는 루나레이크 탑재 제품이 맞다"고 답했다. 이어 "인텔타이완과 인벤텍은 해당 제조사가 루나레이크 탑재 휴대용 게임PC를 출시할 수 있도록 협의중"이라고 덧붙였다. 이 관계자는 해당 제조사가 구체적으로 어느 회사인지, 그리고 출시 가능성은 어느 정도인지 묻자 "답변할 수 없다"고 말했다.

2024.06.10 17:17권봉석

데이터브릭스, 아이스버그 창시자가 설립한 '타뷸러' 인수

데이터브릭스가 데이터 관리 기업인 타뷸러(Tabular) 인수에 합의했다고 10일 발표했다. 타뷸러는 개방형 테이블 포맷 '아파치 아이스버그'의 창시자인 라이언 블루, 다니엘 윅스, 제이슨 리드 등에 의해 설립된 회사다. 이번 인수로 데이터브릭스는 두 가지 대표적인 오픈소스 레이크하우스 형식인 아파치 아이스버와 리눅스 파운데이션 델타 레이크 창시자 간의 시너지를 발휘하고, 데이터 호환성을 선도해 조직이 더 이상 데이터의 형식에 제약을 받지 않도록 지원한다는 방침이다. 데이터브릭스는 레이크하우스에 형식 호환성을 제공하기 위해 델타 레이크 및 아이스버그 커뮤니티와 긴밀히 협력할 계획이다. 이러한 협력은 단기적으로는 델타 레이크 유니폼 내에서 이루어지며, 장기적으로는 개방적이고 공통적인 단일 상호운용성 표준으로 발전하게 된다. 데이터브릭스는 2020년 레이크하우스 아키텍처를 개척하고, 기존의 데이터 웨어하우징 워크로드와 AI 워크로드를 관리가 가능한 단일 데이터 사본에 통합할 수 있게 했다. 이를 위해서는 다양한 워크로드, 애플리케이션, 엔진이 동일한 데이터에 액세스할 수 있도록 모든 데이터가 개방형 형식이어야 한다. 레이크하우스 아키텍처는 데이터에 대한 접근을 보편화함으로써 기업의 생산성을 극대화하는데, 이는 독점 데이터 웨어하우스와는 대조적이다. 독점 데이터 웨어하우스에서는 독점 SQL 엔진만이 데이터를 읽거나 쓰거나 공유할 수 있으며, 다른 애플리케이션에서 데이터를 사용하기 위해서는 데이터를 복사하고 내보내야 해 특정 공급업체에 종속될 가능성이 높기 때문이다. 4년이 지난 현재, 전 세계 기업의 약 74%가 레이크하우스 아키텍처를 구축했다. 레이크하우스의 기반은 오브젝트 스토리지에 저장된 데이터의 ACID 트랜잭션을 지원하는 오픈소스 데이터 형식이다. 이러한 형식은 아파치 스파크, 트리노 및 프레스토 같은 오픈소스 엔진을 위해 특별히 설계됐으며, 데이터 레이크에서 데이터 작업의 안정성 및 성능을 획기적으로 개선한다. 데이터브릭스는 이를 지원하기 위해 리눅스 재단과 협력해 델타 레이크 프로젝트를 출범했다. 지금까지 다양한 조직의 500명 이상의 코드 기여자가 이 프로젝트에 참여했으며, 전 세계 10,000개 이상의 기업이 델타 레이크를 사용해 매일 평균 4엑사바이트 이상의 데이터를 처리하고 있다. 델타 레이크가 만들어질 무렵, 라이언 블루와 다니엘 윅스는 넷플릭스에서 아이스버그 프로젝트를 개발해 아파치 소프트웨어 재단에 기부했다. 이후 델타 레이크와 아이스버그는 레이크하우스 형식의 두 가지 주요 오픈소스 표준으로 부상했다. 이 두 포맷은 모두 아파치 파케이를 기반으로 하며 비슷한 목표와 설계를 갖추고 있지만, 독립적으로 개발되어 호환되지는 않게 됐다. 시간이 지나면서 다른 여러 오픈소스 및 독점 엔진이 이들 형식을 채택했으나 두 표준 중 하나만, 그것도 일부만 채택하는 경우가 많았다. 이로써 기업 데이터가 파편화되고 사일로화되어 레이크하우스 아키텍처의 가치가 훼손되는 문제가 발생했다. 기업들은 레이크하우스의 이점을 실현하기 위해 데이터 상호운용성이 필요로 하며, 데이터브릭스는 델타 레이크 및 아이스버그 커뮤니티와 긴밀히 협력해 시간이 지남에 따라 형식에 상호운용성을 제공할 계획이다. 이는 결코 짧지 않은 여정으로, 해당 커뮤니티에서 달성하는 데 몇 년이 걸릴 수도 있다. 이것이 바로 작년에 데이터브릭스가 델타 레이크 유니폼을 발표한 이유다. 유니폼 테이블은 델타 레이크, 아이스버그, 후디 간에 상호 운용성을 제공하며, 기업이 모든 데이터에서 이미 익숙한 분석 엔진과 도구를 사용할 수 있도록 아이스버그의 안정적인 카탈로그 인터페이스를 지원한다. 기업은 현재 즉시 사용 가능한 유니폼을 통해 호환성을 확보할 수 있다. 아이스버그 팀의 합류로 데이터브릭스는 델타 레이크 유니폼을 한층 더 확장할 수 있게 되었다. 알리 고드시 데이터브릭스 공동창립자 겸 CEO는 "오늘날 레이크하우스 패러다임은 가장 널리 사용되는 두 가지 형식인 델타 레이크와 아이스버그로 나뉘어져 있다”며 “데이터브릭스와 타뷸러는 오픈소스 커뮤니티와 협력하여 시간이 지남에 따라 두 형식을 더 가깝게 만들어 개방성을 높이며 고객의 사일로와 마찰을 줄여나갈 계획”이라고 밝혔다. 그는 “작년에 우리는 이 두 형식 간의 상호 운용성을 제공하기 위해 델타 레이크 유니폼을 발표했다”며 “유니폼을 통해 모든 워크로드에 대한 데이터를 통합하는 최고의 방법을 제공하기 위해 오픈 데이터 레이크하우스 형식의 선두 주자들을 한자리에 모으게 되어 매우 기쁘다”고 강조했다. 데이터브릭스와 타뷸러는 오픈소스 형식을 옹호한다는 공통점을 공유해왔다. 두 기업 모두 창립자가 개발한 오픈소스 기술을 상용화하기 위해 설립됐으며, 현재 데이터브릭스는 매출 기준으로 가장 규모가 크고 성공적인 독립 오픈소스 회사로서 오픈소스 프로젝트에 1천200만 줄의 코드를 기부하기도 했다. 이번 인수는 클라우드에서 개방형 포맷과 오픈소스 데이터에 대한 데이터브릭스의 지속적인 노력을 보여주며, 기업이 데이터를 제어하고 독점 공급업체 소유의 형식으로 인한 종속성에서 벗어날 수 있도록 지원한다. 라이언 블루 타뷸러 공동창업자 겸 CEO는 "우리는 정확성, 성능 및 확장성과 관련된 중요한 데이터 문제를 해결하기 위해 아파치 아이스버그를 개발했다"며 “개방형 레이크하우스가 업계 표준으로 자리 잡으면서 아이스버그와 델타 레이크의 인기는 크게 상승했다”고 밝혔다. 그는 “타뷸러는 데이터브릭스에 합류해 개방형 레이크하우스 형식을 기반으로 최고의 데이터 관리 플랫폼을 구축할 계획으로, 이를 통해 '올바른' 형식을 선택하기 위한, 그리고 독점 데이터 포맷에 종속되지 않기 위한 기업의 우려를 해결하는 데 힘쓰고자 한다”고 강조했다.

2024.06.10 14:15김우용

[인터뷰] "루나레이크, 개발 과정 단축에 조기 출시"

"루나레이크는 개발 기간 중 모든 이정표를 예정보다 앞당겨 달성했다. 개발 과정은 그만큼 성공적이었다. 개발 기간과 출시 시기 등을 종합적으로 고려한 결과 업계 예상보다 보다 이른 시기에 출시하기로 결정된 것이다." 지난 5월 31일(이하 현지시간) 인텔 연례 기술행사 '테크투어 타이완' 행사장에서 국내 기자단과 만난 로버트 할록(Robert Hallock) 인텔 클라이언트 AI 및 기술 마케팅 총괄이 이렇게 설명했다. 인텔은 지난 4일 컴퓨텍스 타이베이 2024 기조연설에서 오는 3분기부터 공급할 차세대 코어 프로세서 '루나레이크'(Lunar Lake)를 공개했다. 이날 로버트 할록 총괄은 "2010년대 초반 PC용 프로세서에 그래픽칩셋이 처음 통합됐을 때 사람들은 용도를 폄하했지만 현재는 지극히 당연한 상식이 됐다"며 "현재 쓰이는 'AI PC'라는 이름도 앞으로 4년 정도 지나면 원래 이름인 'PC'로 돌아갈 것"이라고 내다봤다. 다음은 로버트 할록 총괄과 일문일답. Q. 주요 프로세서 제조사가 TOPS 경쟁을 벌이고 있다. 그러나 특히 노트북 환경에서 TOPS 향상에 한계가 있을 것으로 보이기도 하는데 이런 양상이 언제까지 계속될 것으로 보는가. "현재 외장 그래픽칩셋은 100 TOPS를 넘으며 앞으로 계속 높아질 것이다. 단 LLM은 메모리 대역폭의 제약을 받고 있다. 그러나 LPDDR5-5300 메모리로 구동할 때도 LLM이 초당 생성하는 단어는 30개 이상으로 사람 눈으로 쫓아가기도 어렵다." Q. 인텔을 포함한 AI PC용 프로세서 제조사가 NPU(신경망처리장치) 성능 중 하나로 TOPS(1초 당 1조 번 연산)을 내세운다. 그러나 연산 정밀도 기준에 따라 TOPS는 얼마든지 달라질 수 있다고 보는데. "TOPS는 NPU가 낼 수 있는 최대 속도를 숫자로 나타낸 것이며 MAC(행렬 곱셈 후 덧셈) 연산 능력과 작동 속도, 코어 수를 곱한 다음 작동 클록으로 나눠 구한다. 엄밀히 말하자면 숫자에 불과하다." Q. AI PC의 TOPS를 정확히 측정할 수 있는 방법은 없는가. "AI PC 대표적인 활용 사례인 LLM(거대언어모델)은 첫 단어(토큰)가 나올 때까지 걸리는 시간, 초당 생성 단어 수를 측정할 수 있다. 그러나 LLM에 주는 프롬프트를 정확히 통제해야 공정한 비교가 가능하다. Q. 인텔은 공정한 테스트를 위해 어떤 노력을 기울이고 있는가. "PC 업계가 자주 활용하는 벤치마크 소프트웨어 'UL 프로시온'은 AI 추론 등 여러 벤치마크를 포함하고 있는데 특정 제조사에 치우치지 않은 비교적 공정한 소프트웨어로 평가한다. 인텔은 여러 회사와 협업해 보다 현실적인 벤치마크를 여름까지 내놓기 위해 준비중이다." Q. 인텔은 '김프'(GIMP) 등 오픈소스 소프트웨어에서 AI PC 역량을 활용할 수 있는 소프트웨어를 보급중이다. 그러나 미세한 버전 차이로 작동에 문제가 발생하고 설치 절차도 까다롭다. 다른 대안은 없는가. "AI PC는 새로운 개념이며 이를 정착시키기 위해 여러 노력을 기울이고 있다. 인텔은 스테이블 디퓨전이나 LLM을 보다 쉽게 설치할 수 있는 도구를 개발중이다. 앞서 언급했듯 벤치마크 역시 마찬가지다." Q. 마이크로소프트가 코파일럿+ PC에 요구하는 40 TOPS NPU라는 기준에 대해 어떻게 보는가. "다른 소프트웨어 제조사는 마이크로소프트만큼 강력한 연산 성능을 요구하지 않는다. 실행 작업에 따라 적합한 장치가 달라지기 때문이다. 내년에는 전체 AI 모델 중 30%가 CPU, 40%가 GPU, 30%가 NPU에서 작동할 것이다. 그리고 실제 이용자는 어떤 엔진이 어떤 장치로 구동되는지 관심이 없다." Q. 루나레이크가 내세운 저전력과 전세대 대비 두 배 향상된 GPU 성능은 휴대용 게임PC에도 적합해 보인다. 경쟁사(AMD) 대비 유사한 플랫폼을 갖춘 PC가 적은데 현재 협업하는 제조사가 있나. "지금 밝히기는 어렵지만 다음 분기에 등장할 것이다."

2024.06.06 09:00권봉석

인텔 "노트북용 프로세서 '팬서레이크', 인텔 18A로 찍는다"

[타이베이(대만)=권봉석 기자] 인텔이 내년 출시할 모바일(노트북)용 프로세서 '팬서레이크'(Panther Lake) 출시와 함께 그동안 뒤처졌던 반도체 제조 공정 리더십을 회복하겠다고 밝혔다. 팬서레이크는 인텔이 내년 출시 목표로 개발중인 PC용 프로세서다. 올 3분기부터 시장에 공급될 인텔 모바일(노트북)용 프로세서 '루나레이크'(Lunar Lake) 후속 제품이다. 루나레이크는 인텔이 저전력·고효율을 목표로 개발한 프로세서로 핵심 요소인 컴퓨트 타일(N3B)과 플랫폼 제어 타일 모두 대만 TSMC가 생산했다(관련기사 참조). ■ 인텔 "루나레이크, 개발 초기 단계부터 TSMC 선택" 지난 주 진행된 인텔 연례 행사 '테크투어 타이완' 기간 중 인텔 관계자는 "루나레이크 개발 초기 단계부터 최고의 성능과 전력 효율성을 확보하는 것을 목표로 출시 시기 등 많은 목표를 고려한 결과 외부 파운드리(TSMC)를 활용하겠다고 결정했다"고 설명했다. 인텔은 '테크투어 이스라엘 2022' 행사 당시 프로세서 개발에 평균 2년 반 정도를 투자한다고 밝힌 바 있다. 이를 토대로 역산하면 루나레이크는 2021년 말에서 2022년 초부터 제품 기획에 들어갔고 2022년 상반기 당시 가장 선도적인 미세 공정인 대만 TSMC의 3나노급 'N3'를 선택했음을 짐작할 수 있다. 인텔은 지난 해 9월 미국 새너제이에서 진행한 연례 기술행사 '인텔 이노베이션 2023' 당시 오픈소스 이미지 프로그램 '김프'(GIMP)와 스테이블 디퓨전 플러그인을 활용해 생성 AI 시연을 진행한 바 있다. 인텔 관계자는 "당시 시연에는 루나레이크 초기 단계 제품이 탑재됐으며 이 역시 대만 TSMC가 생산한 컴퓨트 타일(CPU)을 적용했다"고 설명했다. ■ 인텔 "내년 반도체 제조 공정 리더십 회복할 것" 인텔은 2021년 팻 겔싱어 CEO 취임 이후 5개 공정을 4년 안에 실현하겠다는 목표 아래 인텔 7, 인텔 4/3, 인텔 20A/18A 등 5개 공정을 개발하고 있다. 팻 겔싱어 인텔 CEO는 4일(대만 현지시간) 대만 타이베이 난강전람관에서 진행된 컴퓨텍스 2024 기조연설 행사에서 "2025년 출시할 팬서레이크는 인텔 18A 공정에서 생산할 예정이며 전원을 넣어 작동을 확인하는 '파워 온' 공정에 진입할 것"이라고 설명했다. 이어 "내년에는 반도체 제조 공정 리더십을 되찾겠다"고 덧붙였다.

2024.06.04 20:14권봉석

삼성메디슨 초음파 진단기, 인텔 컴퓨텍스 기조연설에 등장

[타이베이(대만)=권봉석 기자] 인텔 코어 울트라 프로세서를 통합한 삼성메디슨 초음파 진단기가 4일(대만 현지시간) 인텔 컴퓨텍스 기조연설에 등장했다. 삼성메디슨은 2020년부터 인텔과 협력해 신경외과와 산부인과 등 각종 초음파 진단 기술에 AI를 활용해 왔다. 지난 해 말 인텔 코어 울트라 시리즈1(메테오레이크) 출시 행사에서는 이 프로세서를 탑재한 사례가 소개됐다. 당시 팻 겔싱어 인텔 CEO는 "삼성메디슨은 코어 울트라에 내장된 NPU와 아크 GPU 성능을 평가한 후 별도 GPU를 탑재하지 않겠다고 결정했다"고 설명했다. 팻 겔싱어 CEO는 이날 오전 대만 타이베이 난강전람관에서 진행된 기조연설에서 코어 울트라 기반 헬스케어 솔루션의 사례로 삼성메디슨 초음파 진단기 'HERA W10'을 소개했다. 그는 "삼성메디슨의 초음파 진단기 솔루션은 의사들이 초음파 영상을 쉽고 빠르게 포착할 수 있도록 AI를 활용했다. 이는 코어 울트라와 오픈비노(OpenVINO)를 활용한 사례"라고 말했다. 이어 "의사들은 해당 솔루션을 활용해 신생아 심장 영상에서 10개 크로스 섹션(X-Section)을 실시간으로 포착할 수 있다. AI 스루풋과 성능, 초당 영상 프레임 수도 20% 늘어났다"고 덧붙였다. 인텔은 오는 7일까지 대만 타이베이 난강전람관에서 진행되는 동북아 최대 규모 ICT 전시회 '컴퓨텍스 2024'에서 삼성메디슨 초음파 진단기를 비롯해 코어 울트라 탑재 엣지 AI 솔루션을 전시 예정이다.

2024.06.04 19:39권봉석

GPU 포기설 부인한 인텔...2세대 '배틀메이지' 온다

[타이베이(대만)=권봉석 기자] 인텔은 GPU 시장 재진출 선언 이후 오랜 준비 과정을 거쳐 지난 2022년 3월 모바일(노트북)용 아크 A350M, 6월 데스크톱용 아크 A380, 10월 데스크톱용 아크 A750/A770 등 아크 A시리즈(개발명 '알케미스트') GPU를 출시했다. 그러나 개발 과정이 지연된 탓에 출시 시점이 지연됐고 결국 AMD와 엔비디아 등 경쟁사 제품 대비 한 세대 전 제품 성능으로 경쟁하는 상황이 벌어졌다. 일각에서는 인텔이 GPU 개발 우선순위를 낮추거나 포기할 수 있다는 전망도 나왔다. 이에 톰 피터슨(Tom Peterson) 인텔 그래픽 및 소프트웨어 아키텍처 부문 펠로우는 지난 주 진행된 '테크투어 타이완' 행사에서 "차세대 프로세서, 루나레이크에는 성능과 AI 연산 성능을 크게 강화한 Xe2 그래픽 기술이 탑재되며 이를 기반으로 한 2세대 GPU '배틀메이지'도 출시될 것"이라고 밝혔다. ■ Xe2, AI 성능 강화에 중점 톰 피터슨 펠로우는 "Xe2는 Xe 코어를 개발하며 얻은 경험을 바탕으로 전력 효율과 성능 향상에 중점을 뒀고 기존 게임과 호환성을 강화했다. 게임 뿐만 아니라 고부하 작업에 최적화된 GPU"라고 설명했다. 핵심을 이루는 것은 2세대 Xe 코어이며 내부를 완전히 새로 설계했다. 512비트 벡터 엔진 8개는 AI 연산에 필요한 XMX(Xe 행렬 확장) 엔진도 8개 추가했다. 이는 기존 모바일(노트북)용 아크 그래픽스에는 추가되지 않았던 것이다. 벡터 엔진은 SIMD16(16개 수치를 동시에 처리)급 ALU(정수연산유닛)와 XMX 엔진 8개 등으로 구성됐다. XMX 엔진은 INT2, INT4, INT8, FP16, BF16 등 AI 연산이 요구하는 자료형을 폭넓게 지원한다. FP16 자료형 기준으로 행렬 곱셈시 한 클록당 2천48개 작업, INT8 자료형 기준으로 클록당 4천96 작업을 처리한다. AI 연산 성능은 INT8 자료형 기준 최대 67 TOPS(1초 당 1조번 연산)이며 정밀도가 낮은 INT4 등을 이용하면 TOPS는 더 높아진다. ■ 메테오레이크와 전력소모 같지만 성능은 1.5배 향상 전작 메테오레이크는 GPU 타일을 별도로 분리했지만 루나레이크는 GPU, 각종 코덱을 다루는 미디어, 출력을 담당하는 디스플레이 등 반도체 IP(지적재산권)를 모두 '플랫폼 제어 타일'에 분산 통합했다. Xe2 GPU는 2세대 Xe 코어 8개로 구성된다. 톰 피터슨 펠로우는 "Xe2 GPU는 기존 메테오레이크 GPU 대비 같은 전력으로 1.5배 높은 성능을 낼 것"이라고 설명했다. 2세대 Xe 코어 8개로 구성된 루나레이크 GPU의 AI 연산 성능은 67 TOPS다. 스테이블 디퓨전 1.5로 그림 파일 한 장을 생성하는 시연에서 메테오레이크 소요시간은 13.29초, 루나레이크 소요 시간은 6.345초로 처리 시간이 절반으로 단축됐다. ■ 디스플레이 엔진, 주사율 조정·절전 기능 포함 GPU가 처리한 영상을 모니터나 화면을 보내는 디스플레이 엔진은 8K60p HDR 화면 1개, 혹은 4K 60p HDR 화면 3개를 동시에 출력할 수 있다. HDMI 2.1, 디스플레이포트 2.1 규격 외에 노트북 화면을 제어하는 eDP 1.5를 지원한다. eDP 1.5의 주요 기능 중 화면주사율 가변 조정이 있다. 초당 24개 그림으로 구성된 영화 재생시 60Hz 디스플레이에서는 움직임이 부자연스러워질 수 있지만 이를 2의 배수인 48Hz로 표시하면 보다 자연스러운 화면을 볼 수 있다. 이외 기능으로는 같은 화면이 표시될 경우 데이터 전송 빈도를 낮추고 대기 상태에서 전력 소모를 최소화하는 기능을 포함했다. 대기 화면에서는 기존 대비 18mW, 유튜브 전체 화면 재생시는 351mW를 절감해 배터리 지속시간을 늘린다. ■ 미디어 엔진, 차세대 코덱 VVC 재생 지원 미디어 엔진은 각종 영상 코덱을 압축·재생하는 역할을 담당한다. 루나레이크에 포함된 미디어 엔진은 최대 8K 60p HDR 영상까지 처리할 수 있다. 처리 가능한 코덱은 현재 널리 쓰이는 영상 코덱인 H.264/265, 오픈소스 코덱인 AV1이며 H.265 이후 차세대 코덱으로 꼽히는 VVC(H.266) 재생도 추가했다. VVC 코덱은 AV1 코덱 대비 파일 용량을 10% 더 줄일 수 있고 화면의 글자나 그림에 맞는 압축방법을 지원해 화면 녹화시 유용하다. 그러나 현 시점에서 이를 재생하려면 고성능 CPU/GPU가 필요하다. 루나레이크 내장 미디어 엔진은 VVC 코덱 재생을 하드웨어로 처리해 전력 소모를 줄였다. 4K(3840×2160 화소) 재생시 메테오레이크는 CPU를 이용한 소프트웨어 재생으로 35W를, 루나레이크는 2.9W를 써 전력 소모는 1/10 수준으로 줄어든다. ■ XeSS 이용해 1080p 게임 초당 60프레임 이상으로 구동 톰 피터슨 펠로우는 루나레이크 내장 Xe2 GPU가 AI 기반 저해상도 업스케일 기술 'XeSS'를 활용해 최신 게임을 보다 원활하게 즐길 수 있다고 강조했다. 이를 극단적으로 드러나는 것이 게임 'F1 24' 시연이다. 지난 5월 28일 출시된 게임을 루나레이크는 1080p '높음' 설정에서 문제없이 소화했다. 초당 프레임도 60프레임 이상으로 매우 원활히 구동된다. 인텔 관계자는 "게임 실행시 960×540 화소 화면을 업스케일해 풀HD(1920×1080 화소) 해상도로 4배 업스케일하는 XeSS 기능을 이용했다. 레이트레이싱이 적용돼 보다 사실적인 화면을 볼 수 있다"고 설명했다.

2024.06.04 12:30권봉석

CPU 코어 분신술 '하이퍼스레딩' 20년만에 버린 인텔

[타이베이(대만)=권봉석 기자] 지난 해 12월 출시된 코어 울트라 시리즈1(메테오레이크) 중 하나인 코어 울트라5 125H 프로세서는 고성능 P(퍼포먼스) 코어 4개, E(에피션트) 코어 8개 등 총 12개 코어를 내장했다. 그러나 동시 실행 가능 작업 단위를 나타내는 '스레드'(Thread)는 총 18개로 코어 수와 1:1로 일치하지 않는다. '4+8=12'라는 단순한 수식이 성립하지 않는다. 이런 현상은 AMD 라이젠 프로세서에서도 나타난다. 이런 현상이 벌어지는 이유는 매우 단순하다. P코어 한 개를 마치 두 개처럼 쓰는 기술인 'SMT'(동시 멀티스레딩) 때문이다. AMD는 'SMT'라는 명칭을 그대로 쓰는 반면 인텔은 이 기술에 '하이퍼스레딩'(Hyperthreading)이라는 이름을 붙였다. '코어 한 개를 마치 두 개처럼 쓰는 기술'. 쉽게 이해가 가지 않는다. 그러나 프로세서 작동 구조를 살펴보면 마냥 불가능한 일은 아니다. ■ 메모리·SSD에서 데이터 가져올 때 지연시간 발생 프로세서 내 코어의 연산은 ① SSD나 메모리, 캐시(임시 메모리)에 저장된 데이터나 명령어 가져오기(Fetch)-② 해석(Decode)-③ 실행(execute) 등 3단계를 전원이 꺼질 때까지 반복하며 실행된다. 문제는 프로세서 내 임시 저장공간(Cache)에 원하는 데이터가 없을 때 발생한다. '가져오기' 단계를 실행한 후 필요한 데이터가 전달될 때까지 기다려야 하는 것이다. 하지만 이 시간동안 귀중한 코어를 마냥 놀려두는 것은 아쉬운 일이다. 분식집에서 김밥을 만드는 과정을 생각해 보자. 참치김밥을 먼저 주문받았는데 참치가 떨어졌다면 어떻게 해야 하나. 참치를 보충할 때까지 김을 굽고, 두 번째 주문받은 야채김밥을 만들기 위해 야채를 손질해 두는 등 다른 김밥을 만들 준비를 할 수 있다. ■ 코어 수 최대한 늘리기 위해 등장한 '하이퍼스레딩' 이처럼 코어를 놀려두지 않고 계속 일을 시켜 어떻게든 작동 속도를 끌어올리기 위한 기술이 하이퍼스레딩(SMT)이다. 단 하이퍼스레딩의 성능 향상 폭은 최대 30% 정도에 그치는 것으로 알려져 있다. 인텔은 2002년 11월 출시된 '펜티엄4 HT' 프로세서에 처음 탑재됐다. 하이퍼스레딩이 일반 소비자용 프로세서로 내려와 보편화된 2003년 하반기부터 리눅스를 시작으로 윈도 운영체제(윈도XP)에서 정식 지원되기 시작했다. 이후 하이퍼스레딩은 20년이 흐른 현재까지 인텔 프로세서에 꾸준히 탑재됐다. 인텔이 P/E 코어 기반 하이브리드 구조를 채택한 2021년(12세대 코어 프로세서) 이후 지난 해 코어 울트라 시리즈1(메테오레이크)까지 하이퍼스레딩이 쓰였다. ■ "하이퍼스레딩에는 댓가가 따른다" 그러나 하이퍼스레딩이 반드시 유용한 결과만 가져 오는 것은 아니다. 성능이 최대 30% 늘어나는 대신 코어를 구성하는 공간 중 10% 가량을 하이퍼스레딩에 써야 한다. 소모 전력이 상승할 뿐만 아니라 보안 문제를 낳기도 한다. 지난 주 진행된 '테크투어 타이완' 행사에서 스테판 로빈슨(Stephen Robinson) 인텔 수석 아키텍트겸 펠로우는 "하이퍼스레딩은 공짜가 아니며 댓가가 따른다"고 설명했다. 그는 "하이퍼스레딩은 성능이 극도로 중요한 데이터센터라면 전력 소모 등의 댓가를 치를 가치가 있다. 그러나 루나레이크처럼 전력 소모를 최소로 줄이고 트랜지스터 갯수를 줄여야 하는 상황에서는 의미가 없다"고 설명했다. 또다른 댓가는 바로 보안이다. 하이퍼스레딩 구조 설계 당시는 프로세서 내부 보안에 대한 관심이 오늘날 대비 상대적으로 낮았다. 인텔 역시 큰 개선 없이 2002년 당시 확립된 구조를 그대로 유지했다. 결국 이는 16년 후(2018년) 스펙터·멜트다운 등 보안 결함으로 돌아와 인텔 프로세서에 대한 신뢰도를 떨어뜨렸다. ■ "하이퍼스레딩 대신 코어 늘리는 방향으로 갈 것" 지난 20년간 크게 발전한 반도체 제조 공정 기술도 하이퍼스레딩의 빛을 바래게 했다. 2003년 당시 100nm(나노미터) 급이었던 반도체 제조공정은 이제 수 나노급으로 축소됐다. 하이퍼스레딩보다는 코어 수를 더 늘리는 것이 보안이나 전력 효율성 면에서 오히려 더 효과적일 수 있다. 인텔 관계자는 지난 30일 "P/E 코어를 조합하는 하이브리드 방식이 도입되며 하이퍼스레딩 기술로 스레드 수를 늘릴 필요가 사라졌다"고 설명했다. 이에 따라 인텔이 올 3분기부터 공급할 모바일(노트북)용 프로세서, 루나레이크(Lunar Lake)부터는 P코어의 하이퍼스레딩이 빠졌다. 코어 수(P4+E4)와 스레드 수(8개)도 일치한다. 스테판 로빈슨 펠로우는 "앞으로 데이터센터나 서버용 제온 프로세서가 아닌 일반 소비자용 제품에서는 하이퍼스레딩을 안 쓰는 방향으로 갈 것이며 다음 세대에도 이런 추세는 계속될 것"이라고 전망했다.

2024.06.04 12:00권봉석

루나레이크, 모든 작업 E코어 우선 실행으로 전력 효율 ↑

[타이베이(대만)=권봉석 기자] 인텔이 오는 3분기 출시할 모바일(노트북)용 프로세서, '루나레이크'(Lunar Lake)는 x86 프로세서의 약점으로 꼽히던 전력 효율 강화에 초점을 뒀다. 개발 당시 시점에서 가장 우수한 성능을 내는 파운드리인 TSMC 위탁생산을 목표로 했다. 루나레이크는 저전력·고효율을 담당하는 E(에피션트) 코어 '스카이몬트'(Skymont)를 4개 탑재한다. 전작인 메테오레이크와 달리 저전력 E코어 아일랜드(2코어)는 빠졌다. 모든 작업은 기본적으로 E코어 4개에서 실행해 전력 소모를 최소화했다. 특히 저전력·고효율을 담당하는 E(에피션트) 코어 '스카이몬트'는 비슷한 전력 소모에서 전세대 고성능 담당 P(퍼포먼스) 코어 이상의 성능을 낼 정도로 강화됐다. ■ "E코어 '스카이몬트', 전작 대비 최대 2.9배 성능 향상" 지난 주 진행된 '테크투어 타이완' 행사에서 스테판 로빈슨(Stephen Robinson) 인텔 수석 아키텍트겸 펠로우는 "스카이몬트는 전작 메테오레이크에 탑재된 E코어(크레스트몬트) 대비 같은 전력에서 최대 2.9배 더 높은 성능을 낸다"고 설명했다. 성능 개선에 영향을 준 가장 큰 요소는 바로 다음 명령어를 예측하는 '분기 예측' 확대다. 또 복잡한 명령어를 분해하고 해석해 실행 다음 단계로 전달하는 장치인 '디코더'를 한 개 더 늘렸다. 비순차실행(OOE)은 전후 연산 결과에 영향을 받지 않는 명령어를 앞질러 처리해 클록당 처리 명령어 수(IPC)를 향상시킨다. 스카이몬트는 동시 실행할 수 있는 비순차실행 명령어를 메테오레이크(6개) 대비 2개 늘어난 8개로 확대했다. AI 연산 속도를 올리기 위한 벡터 연산도 강화됐다. AI 연산에 주로 쓰이는 128비트 부동소수점(Float) 처리기를 4개 탑재하고 부동소수점 곱셈(FMUL), 덧셈(FADD), 곱셈·덧셈(FMA) 명령어의 지연시간은 낮췄다. ■ 4코어 모두 활용시 전작 대비 최대 4배 성능 향상 이런 개선이 더해진 결과 스카이몬트 코어의 연산 성능은 메테오레이크에 탑재되던 저전력 아일랜드 E코어 대비 정수 기준 1.38배, 실수(부동소수점) 기준 1.68배 높아졌다. 단일 작업 기준으로 스카이몬트 코어 4개로 구성한 클러스터 성능은 듀얼코어(2코어)인 메테오레이크 저전력 아일랜드 E코어 대비 최대 2배 향상됐다. 코어 수가 더 늘어났지만 소비 전력은 1/3 줄었고 같은 전력 공급시 성능은 1.7배 늘어났다. 모든 코어를 활용할 때 성능은 최대 4배 향상되며 동일 전력 대비 성능은 최대 2.9배 높아졌다. ■ 데스크톱용 P코어보다 같은 전력에서 더 높은 성능 스테판 로빈슨 펠로우는 "스카이몬트 4코어는 데스크톱용 13세대 코어 프로세서(랩터레이크)에 탑재되는 P코어, 랩터코브(Raptor Cove)와 비교했을 때 오히려 더 높은 성능을 내기도 한다"고 설명했다. 그는 "최대 작동 클록에서는 랩터코브가 6GHz를 넘어설 수 있는 반면 스카이몬트는 6GHz를 넘지 못한다. 그러나 단일 작업 처리시 최대 성능 면에서는 스카이몬트가 같은 전력 대비 더 나은 성능을 낸다"고 밝혔다. 이어 "메테오레이크의 저전력 아일랜드 E코어는 넷플릭스나 유튜브 영상 재생은 원활했지만 마이크로소프트 팀즈 등에서는 충분한 성능을 내지 못했다. 그러나 이제는 이런 작업도 E코어로 충분히 처리할 수 있을 것"이라고 덧붙였다. 루나레이크는 단시간 안에 빨리 처리해야 하는 작업에만 P(퍼포먼스) 코어 '라이언코브'(Lion Cove)를 활용한다. P코어는 총 4개만 탑재되는 데다 최대 작동 클록은 메테오레이크 탑재 P코어보다 낮지만 IPC 향상으로 이를 보완했다는 것이 인텔 설명이다. 오리 렘펠(Ori Lempel) 인텔 수석 엔지니어는 "작동 클록이 낮아질 수 있지만 IPC를 높이면 성능 향상은 자연스럽게 따라온다"며 "라이언코브의 IPC는 메테오레이크 탑재 P코어 '레드우드코브' 대비 최대 14% 향상됐다"고 밝혔다. 또 하나 특징은 코어 한 개를 두 개처럼 활용하는 기술 '하이퍼스레딩'을 더 이상 쓰지 않는다는 것이다. 오리 렘펠 인텔 수석 엔지니어는 "개발 도중 여러 요소를 고려한 결과 루나레이크에 탑재되는 라이언코브에서는 지원하지 않는 것으로 결정했다"고 밝혔다. 그는 "하이퍼스레딩에는 댓가가 따른다. 명령어를 처리하는 절차인 파이프라인이 길어져 속도를 떨어뜨리며 보안 문제도 있다. 라이언코브를 단일 작업에 최적화한 결과 더 적은 면적과 전력에서 더 높은 속도를 낼 수 있다"고 설명했다. ■ "제품 특성에 맞는 다양한 '라이언코브' 등장할 것" 2021년 출시된 12세대 코어 프로세서(엘더레이크)를 시작으로 지금까지 E코어는 4개를 기준으로 클러스터 한 개를 구성했다. 스티븐 로빈슨은 "현 세대는 4개 묶음이 여전히 유효하며 2개, 혹은 6개 등 축소나 확대를 고려하지 않는다"고 밝혔다. 라이언코브는 루나레이크 뿐만 아니라 4분기 출시될 데스크톱PC용 프로세서 '애로우레이크' 등에도 적합하게 설계됐다. 오리 렘펠 수석 엔지니어는 "예전과 달리 서버나 데스크톱PC, 노트북 등 제품 특성에 맞는 다양한 P코어 변종이 등장할 것"이라고 설명했다.

2024.06.04 12:00권봉석

"AI PC, 사생활 침해·지연 없는 맞춤형 경험 제공할 것"

[타이베이(대만)=권봉석 기자] AI PC의 핵심은 클라우드에 의존했던 AI 기능을 PC로 가져오는 것이다. 미리 학습된 AI 모델을 내려받아 CPU와 GPU, NPU(신경망처리장치)를 모두 활용해 가동하므로 LTE/5G나 와이파이가 없는 곳에서도 작동한다. 톰 피터슨(Tom Peterson) 인텔 그래픽 및 소프트웨어 아키텍처 부문 펠로우는 지난 주 진행된 '테크투어 타이완' 행사에서 "AI PC는 금융 정보나 건강 정보 등 민감한 정보를 관리하는 한편 이용자 특성을 학습해 맞춤형 비서 서비스를 제공할 수 있다"고 밝혔다. 이어 "금융 정보나 건강 정보 모두 외부에 공개하기 어려운 정보지만 AI PC는 이를 클라우드에 올리는 대신 기기 내에서 자체적으로 처리해 사생활 침해나 유출을 막는다"고 덧붙였다. ■ "AI PC 구현에 CPU·GPU·NPU 모두 중요" 현재 인텔을 포함해 주요 프로세서 제조사가 AI 처리 성능 기준으로 NPU TOPS(1초당 1조 번 연산)를 내세운다. 이는 모든 AI 처리가 NPU만 활용한다는 인식을 줄 수 있지만 실제는 이와 다르다. 톰 피터슨 펠로우는 지난 5월 인텔 자체 조사 결과를 토대로 "올해 AI 엔진을 구동하는 장치 비중은 NPU가 25%, GPU가 40%, CPU가 35%지만 내년에는 NPU 비율이 30%대로 다소 상승, CPU 비율은 30%로 다소 변화가 있을 것"이라고 전망했다. 그는 "AI 응용프로그램의 작동 방식에 따라 차이가 있다. GPU는 생성과 인식에, NPU는 항시 가동돼야 하는 악성코드 감지 등에 유용하다. CPU의 TOPS는 낮지만 빠른 시간 안에 결과를 얻어야 할 때 유용하다"고 설명했다. ■ "AI 처리 부하 줄이는 양자화 기술, 오픈소스로 개방" AI 모델의 정밀도가 높아질 수록 처리 시간과 용량, CPU/GPU/NPU에 가해지는 부하도 급증한다. 현재 AI 모델의 주류를 이루는 것은 FP32(32비트 부동소수점), FP16이지만 용량과 처리 속도 면에서 이를 PC로 처리하는 데는 무리가 있다. 정밀도를 FP16(32비트 부동소수점), INT8(8비트 정수) 등 PC에서 처리할 수 있는 수준으로 조절해야 한다. 이를 해결하기 위한 방법이 양자화이며 처리 속도 향상, AI 모델 용량 축소 등이 가능하다. 톰 피터슨 펠로우는 "양자화를 쉽게 처리할 수 있는 기술인 '인텔 신경망 압축'을 오픈소스 AI 생태계인 ONNX에 오픈소스 기술로 제공할 것"이라고 설명했다. ■ 인텔, 파이3 코어 울트라에 최적화...초당 25 단어 생성 인텔은 지난 4월 공개된 마이크로소프트 LLM(거대언어모델)인 파이3를 코어 울트라 시리즈 프로세서에 최적화했다. 코어 울트라 시리즈1(메테오레이크)에서 첫 단어가 나오는 데는 1초 미만, 초당 25단어를 생성해 이미 사람 눈으로 따라갈 수 없는 수준까지 향상됐다. 루나레이크의 AI 처리 성능은 여기서 한 단게 더 나아갔을 것으로 추정된다. 톰 피터슨 펠로우는 "AI 처리 속도를 높이는 것은 매우 중요한 일이다. 앞으로는 AI 응용프로그램이 사람 대신 다른 프로그램, 다른 서비스와 직접 상호작용하며 학습하게 될 것"이라고 설명했다. ■ "생태계 확대 위해 루나레이크 개발자 키트 곧 공급" 인텔이 AI PC 구현을 위해 이용하는 기술은 오픈비노(OpenVINO)다. PC의 CPU와 GPU, NPU를 모두 활용해 AI 처리 연산을 가속한다. 윈도 다이렉트ML, ONNX 런타임, 윈도 AI 등 다양한 소프트웨어를 지원한다. 인텔은 오픈비노를 활용한 개발자 생태계 확대를 위해 루나레이크 프로세서 기반 AI PC 개발 키트도 사전 공급할 예정이다. 가로·세로 165mm×150mm, 높이 27mm의 슬림한 케이스에 루나레이크 프로세서와 LPDDR5 32GB 메모리를 장착했다. 톰 피터슨 펠로우는 "루나레이크는 5 TOPS CPU, 67 TOPS GPU, 48 TOPS NPU를 결합해 최대 120 TOPS를 발휘할 수 있으며 게임과 AI 비서, 생성 AI를 이용한 콘텐츠 제작에 최적화됐다"고 강조했다.

2024.06.04 12:00권봉석

인텔 루나레이크, 저전력·고효율 목표로 경쟁력 강화

[타이베이(대만)=권봉석 기자] "3분기 출시할 모바일(노트북)용 프로세서 '루나레이크'(Lunar Lake)는 x86 프로세서에 대해 사람들이 가진 생각은 물론 AI PC를 경험하는 방식을 바꿀 것이다. CPU와 GPU(그래픽처리장치), NPU(신경망처리장치) 모두 경쟁에서 이길 것이다." 컴퓨텍스 타이베이 2024 전 주 진행된 '인텔 테크투어 타이완' 기조연설에서 미셸 존스턴 홀타우스 인텔 CCG(클라이언트 컴퓨팅 그룹) 총괄(수석부사장)이 이렇게 강조했다. 인텔 테크투어는 2022년부터 시작된 연례 기술 행사다. 매년 새 프로세서 출시를 앞두고 각국 기자단에 강점과 특징 등을 소개한다. 올해 행사에는 한국을 포함해 15개 국가와 지역에서 150개 매체, 227명이 참석했다. 올해 행사 핵심은 오는 3분기 출시될 모바일용 프로세서, 루나레이크다. 이달부터 국내 포함 전 세계 시장에 출시되는 퀄컴 스냅드래곤 X 엘리트/플러스, 하반기 출시될 AMD 라이젠 프로세서와 경쟁할 제품이다. ■ TSMC 위탁생산 타일과 메모리, 인텔 기술로 조립 전작인 코어 울트라 시리즈1(메테오레이크)는 컴퓨트(CPU), GPU, SOC, I/O 등 4개 타일을 인텔과 TSMC가 생산한 다음 3차원 적층 기술 '포베로스'(FOVEROS)로 결합해 구성했다. 반면 루나레이크는 CPU 타일, 그리고 GPU와 NPU, 미디어 엔진 등 다양한 반도체 IP(지적재산권)를 재배치/통합한 플랫폼 제어 타일 등 단 두 개로 구성됐다. 여기에 LPDDR5X 메모리를 결합해 주요 PC 제조사에 공급된다. CPU와 GPU가 한 메모리를 같이 쓰는 통합 구조로 애플 M시리즈 프로세서와 같은 방식의 접근을 택했다. 한 다이(Die) 안에서 데이터가 오가므로 메모리를 분리했던 과거와 달리 지연시간과 면적은 줄이면서 대역폭은 높일 수 있다. 핵심 요소인 컴퓨트 타일(TSMC N3B), 그리고 플랫폼 제어 타일 모두 대만 TSMC가 만들었다는 것도 특징이다. 두 타일을 연결하는 베이스 타일은 인텔 22나노미터 공정에서 생산됐다. ■ 컴퓨트 타일 내 P·E코어, 전력 효율성 강화에 방점 컴퓨트 타일은 고성능 P(퍼포먼스) 코어 '라이언코브'(Lion Cove) 4개와 저전력·고효율 E(에피션트) 코어 '스카이몬트'(Skymont) 4개, 총 8개 코어로 구성된다. 대부분의 작업은 E코어가 먼저 처리하며 고성능이 필요한 작업에서 P코어가 작동한다. P코어와 E코어는 최근 강조되는 지표인 와트 당 성능, 다시 말해 전력 효율성 향상에 중점을 뒀다. E코어 '스카이몬트'는 P코어 '라이언코브'보다 적은 전력으로 같은 성능을 내도록 설계됐다. 인텔 자체 검증 결과 전작(메테오레이크) 대비 클록 당 명령어 처리 성능은 P코어 최대 14%, E코어 최대 68%까지 향상됐다. 동영상 재생이나 대기 상태 등 단순한 작업만 처리하던 '저전력 아일랜드 E코어' 성능도 전세대 대비 최대 2배 향상됐다. P코어 한 개를 두 개처럼 쓰는 프로세서 효율 향상 기술인 '하이퍼스레딩'은 루나레이크에서 빠졌다. 하이퍼스레딩이 빠진 대신 IPC(클록당 처리 가능 명령어 수)를 크게 높여 성능 하락이 일어나지 않을 것이라는 것이 인텔 관계자 설명이다. ■ 성능 높이고 전력소모 줄인 Xe2 GPU로 AI 가속 GPU는 게임이나 동영상 처리 뿐만 아니라 AI PC에서 중요도가 한층 커졌다. 고밀도 연속 AI 연산을 단시간에 처리하려면 GPU의 도움은 필수다. AI 연산 성능을 가늠하는 지표인 TOPS(1초 당 1조 번 AI 연산) 중 상당수가 GPU에서 나온다. 루나레이크의 GPU는 새롭게 개발한 Xe 코어 8개를 결합한 'Xe2'다. 내부 구조를 보완해 메테오레이크 대비 성능은 50% 가까이 늘어났다. AI 연산 중 상당수를 차지하는 행렬 관련 처리를 위한 XMX도 더해 AI 처리량은 1.5배 이상 향상됐다. Xe2 GPU의 AI 연산 성능은 최대 67 TOPS다. 디스플레이 규격은 2022년 하반기 정식 확정된 디스플레이포트 2.1, HDMI 2.1과 함께 노트북 직결 디스플레이 패널과 연결되는 eDP 1.5도 함께 지원한다. 처리가 쉽지 않은 차세대 코덱인 VVC(H.266) 재생도 지원한다. ■ AI 연산 성능 NPU 단독 48 TOPS, 최대 120 TOPS 가능 마이크로소프트는 최근 '빌드' 행사에서 PC 이용 이력을 추적하는 기능인 '리콜' 등을 담은 새로운 PC 카테고리인 '코파일럿+ PC'를 공개한 바 있다. 코파일럿+ PC는 40 TOPS 이상 NPU 탑재를 요구한다. 루나레이크에 탑재된 인텔 4세대 NPU인 'NPU 4' 성능은 전작(10.5 TOPS) 대비 3배 이상인 최대 48 TOPS까지 향상됐다. 과거 2개에 그쳤던 NPU 내 연산 장치를 최대 6개까지 늘리는 한편 작동 클록도 끌어올렸다. NPU와 GPU의 성능 강화에 따라 루나레이크의 AI 연산 성능도 세 자릿수까지 올라섰다. NPU 48 TOPS, GPU 67 TOPS와 CPU 5 TOPS를 합해 최대 120 TOPS까지 AI 연산이 가능해졌다는 것이 인텔 설명이다. ■ S/W 생태계 확대 위해 루나레이크 개발킷도 보급 AI PC의 쓰임새를 최대한 확보할 수 있는 소프트웨어 관련 역량 확보도 중요하다. 인텔은 이미 AI 모델 500개를 코어 울트라에 최적화하는 한편 에이수스와 협력해 코어 울트라 시리즈1 기반 개발자 키트도 보급중이다. 미셸 존스턴 홀타우스 총괄은 "최대 120 TOPS를 실현 가능한 개발자 키트를 생산해 AI PC용 소프트웨어 개발자에게 공급할 것이다. 업그레이드가 가능한 구조로 개발돼 향후 등장할 '팬서레이크'(Panther Lake) 등 다음 제품과도 호환될 것"이라고 설명했다. 인텔은 현재 루나레이크 제품화 단계인 'B0' 스테핑 단계 실리콘이 생산에 들어갔다고 밝혔다. 오는 3분기부터 주요 PC 제조사에 공급되며 오는 연말까지 20개 제조사가 80개 이상의 제품을 출시 예정이다.

2024.06.04 12:00권봉석

인텔 "루나레이크 NPU 성능 4배 강화... 전력 효율도 개선"

[타이베이(대만)=권봉석 기자] 인텔이 올 3분기부터 주요 PC 제조사에 공급할 모바일(노트북)용 프로세서, 루나레이크(Lunar Lake)는 플랫폼 컨트롤러 타일에 최대 48 TOPS(1초 당 1조 번) AI 연산이 가능한 4세대 NPU(신경망처리장치), NPU 4를 탑재한다. NPU 4는 CPU나 GPU 대비 훨씬 적은 전력으로 CPU(5 TOPS)의 5배 이상, Xe2 GPU(67 TOPS)의 71% 수준 AI 처리를 수행한다. AI 연산 성능만 따지면 코어 울트라 시리즈1(메테오레이크)의 CPU, GPU, NPU를 모두 합친 수치(34 TOPS)를 넘어선다. NPU 4는 PC가 켜져 있을 때 항상 같이 돌아가야 하는 음성 인식, 악성코드 탐지, 카메라를 이용한 사물 인식 등에 적합하다. 스테이블 디퓨전 1.5 기준으로 NPU 3 대비 최대 4배 빠르게 이미지를 생성해 전력 효율도 2.9배 향상됐다. ■ 인텔 NPU, 2018년 첫 출시 이후 올해 4세대 돌입 인텔 NPU는 2016년 인텔이 인수한 스타트업 '모비디우스' 기술력 기반으로 만들어졌다. 2018년 출시된 첫 제품은 별도 칩으로 출시돼 USB 단자 등을 통해 PC에 연결해 작동했다. 연산 성능은 0.5 TOPS로 영상 처리나 사물 인식 등에 적합했다. 2세대 제품인 'NPU 2'는 2021년 출시된 제품이며 IoT(사물인터넷) 기기를 대상으로 했다. 연산 속도는 7 TOPS 수준이며 배경 흐림, 프레임 인물 고정 등 윈도 스튜디오 효과를 지원했다. 지난 주 진행된 '테크투어 타이완' 행사에서 대런 크루스(Darren Crews) 인텔 NPU 수석 아키텍트는 "NPU는 7년 전만 해도 카메라를 통한 사물 인식 등에 주로 쓰였지만 현재는 높은 연산 성능과 함께 전력 효율성 등 두 가지 목표를 모두 달성해야 하는 상황"이라고 설명했다. ■ NPU 4 하나로 메테오레이크 연산 성능 능가 지난 해 출시된 코어 울트라 시리즈1(메테오레이크)는 SOC 타일에 3세대 제품 'NPU 3'를 통합했다. 연산 성능은 11.5 TOPS로 전체 연산 성능(34 TOPS)의 1/3 가량을 차지한다. 반면 후속 제품인 루나레이크에 탑재된 NPU 4의 AI 연산 성능은 최대 48 TOPS로 메테오레이크의 CPU, GPU, NPU를 모두 합친 것보다 더 빠르다. 대련 크루스 수석 아키텍트는 "AI 연산을 실제로 수행하는 엔진 수 증가, 작동 주파수 향상, 내부 아키텍처 개선으로 NPU 4의 성능이 급격히 향상됐다"고 설명했다. ■ "TOPS 수치, 작동 클록과 MAC 연산 능력이 좌우" 최근 PC용 프로세서를 구성하는 CPU와 GPU, NPU의 AI 연산 성능 측정을 위한 기준으로 'TOPS'가 널리 쓰인다. 그러나 이 수치가 정확히 어떤 과정을 거쳐 나오는지 정확히 아는 사람은 드물다. 대런 크루스 수석 아키텍트는 "TOPS는 AI 처리에 주로 쓰이는 연산 속도와 NPU 작동 클록에 크게 영향을 받는다" 고 설명했다. AI 연산에 가장 널리 쓰이는 연산 방식은 큰 수치를 서로 곱해 더하는 행렬 연산인 MAC 연산이다. 메테오레이크의 NPU 3내 연산 엔진은 두 개이며 한 클록당 4천96개의 MAC 연산을 수행한다. 여기에 작동 클록(1.4GHz)을 곱하고 1조 번(10의 12승)으로 나눈 값이 11.5 TOPS다. 같은 방식으로 계산하면 루나레이크 내장 NPU 4의 TOPS는 48 TOPS다. ■ "TOPS는 행렬 연산에 치중... 벡터 계산 성능 향상도 중요" 단 MAC 연산 처리량은 자료형(데이터타입)의 정밀도에 큰 영향을 받는다. 예를 들어 인텔이 기준으로 삼은 자료형은 INT8(정수 8비트)이다. 이를 INT4(정수 4비트)로 바꾸면 MAC 연산량과 TOPS는 각각 두 배로 뛴다. 대런 크루스 수석 아키텍트는 "TOPS 값은 계산으로 얻어진 값이며 주로 행렬 연산에 집중됐다. 그러나 큰 수치를 한꺼번에 처리하는 벡터 연산이 실제 AI 응용프로그램 성능에 더 큰 영향을 미친다"고 설명했다. NPU 4는 벡터 연산을 처리하는 레지스터 크기를 512비트로 확장하고, 대역폭은 전 세대 대비 4배 높였다. 행렬과 수치 연산을 모두 강화해 다양한 AI 연산을 처리할 수 있게 됐다. 양자화 전용 회로도 내장해 INT8, FP16 자료형을 모두 지원한다. ■ "TOPS, 행렬 연산에 치중...벡터 계산 성능 향상도 중요" NPU 4는 뉴럴 연산 엔진을 2개에서 6개로 3배 늘렸다. MAC 연산을 담당하는 어레이도 4천 개에서 1만 2천개로 늘어났다. 같은 소비 전력에서 NPU 3 대비 성능은 두 배 늘어났고 최대 성능은 4배로 뛰어올랐다. 벡터 연산 성능은 최대 12배, TOPS는 4배 이상 향상됐다. LLM(거대언어모델)의 토큰 생성 속도에 영향을 미치는 대역폭도 최대 2배 향상됐다. 오픈소스 그래픽 프로그램 '김프'(GIMP)로 스테이블 디퓨전 1.5 플러그인을 이용해 이미지를 생성하는 테스트에서 메테오레이크는 22.08초, 루나레이크는 5.43초로 실제 처리 시간이 1/4 수준으로 줄었다. 전력 소모는 NPU 3와 NPU 4 사이에 큰 차이가 없다. 메테오레이크 소모전력은 9W, 루나레이크 소모전력은 11.2W다. 대런 크루스 수석 아키텍트는 "소모 전력이 높아졌지만 소요 시간이 크게 줄어 실제 전력 소모는 줄어든다. 이를 통해 전력 효율을 2.9배 높였다"고 밝혔다.

2024.06.04 12:00권봉석

루나레이크, 와이파이7 IP 흡수..."끊김 없는 연결 실현"

[타이베이(대만)=권봉석 기자] 인텔은 2003년 펜티엄M 프로세서와 와이파이 모듈을 통합한 센트리노 플랫폼으로 노트북 와이파이 보편화를 이끌어냈다. 지난 해 출시한 코어 울트라 시리즈1(메테오레이크)는 5Gbps 이상 데이터를 전송하는 와이파이7(802.11be) 모듈을 탑재했다. 올 3분기부터 주요 PC 제조사에 공급될 루나레이크는 PCI 익스프레스 인터페이스로 연결했던 와이파이 모듈 중 대부분을 프로세서 안 '플랫폼 컨트롤러 타일'에 통합했다. 이를 통해 기판 면적 축소, 전력 소모 절감 등을 구현했다. 카를로스 코데이로(Carlos Cordeiro) 인텔 무선 부문 CTO(최고기술책임자)는 지난 주 진행된 '테크투어 타이완' 행사에서 "루나레이크는 와이파이7과 썬더볼트4, 블루투스 5.4를 통합하고 와이파이 속도를 향상하기 위한 소프트웨어로 우수한 연결성을 확보했다"고 설명했다. ■ 와이파이 속도 최적화 소프트웨어 기본 제공 줌, 팀즈 등 화상회의 솔루션은 코로나19 범유행 기간 중 협업을 돕는 도구로 급성장했다. 그러나 와이파이 혼잡도 등 문제로 화면이나 소리가 끊기는 현상이 새로운 문제로 등장했다. 인텔은 이런 문제를 해결하기 위해 지난 해부터 '인텔 연결 성능 수트'(ICPS) 소프트웨어를 보급중이다. 이 소프트웨어는 유무선공유기와 액세스포인트(AP) 품질과 WPA/3 등 보안 수준, 속도를 자동으로 평가해 가장 우수한 곳으로 접속한다. 기업용 노트북에 탑재되는 '인텔 연결 애널리틱스'는 와이파이 채널의 혼잡도와 지연시간을 실시간 분석한다. 기업 IT 관리자는 이 정보를 토대로 AP 수를 늘리거나 채널을 재조정해 최적 무선 환경을 만들 수 있다. ■ 루나레이크, 썬더볼트4 단자 최대 3개 지원 루나레이크는 최대 전송 속도 40Gbps(5GB/s)인 썬더볼트4 단자를 최대 3개 지원한다. 각 단자는 데이터 전송 이외에 USB-PD 방식 충전과 외부 모니터 연결도 지원하며 USB-C 형식 케이블을 모두 지원한다. 카를로스 코데이로 CTO는 "인텔은 주요 PC 제조사에 썬더볼트4(USB-C) 단자를 노트북 양쪽에 달아 놓을 것을 요구한다. 썬더볼트4 단자를 한 쪽에만 몰아 놓으면 외부 모니터나 외장 GPU 연결이 불편하기 때문"이라고 설명했다. 현장에서는 최근 공개된 썬더볼트 기반 화면·파일 공유 기능인 '썬더볼트 쉐어' 시연도 함께 진행됐다. 이 기능은 썬더볼트4 이상을 탑재한 윈도 PC 두 대를 연결해 대용량 파일 전송과 원격 제어를 구현했다(관련기사 참조). 시연에서는 1GB 파일을 거의 1초만에, 10GB 영상 파일을 11초만에 전송했다. 연결된 PC에서 동영상을 재생해도 끊김이나 지연이 나타나지 않았다. 연결된 PC가 잠기자 두 PC간 연결도 중단됐다. ■ 루나레이크, 와이파이7 기술 상당 부분 통합 인텔은 최근 와이파이 모듈 기능 중 상당수를 PC 프로세서 내부에 통합하는 CNVI 기술을 추진중이다. 루나레이크는 3세대 CNVI 기술을 이용해 전파를 주고 받는 부분 이외에 물리층(PHY)과 전용 메모리를 모두 '플랫폼 컨트롤러 타일'에 통합했다. 카를로스 코데이로 CTO는 "루나레이크 프로세서 내 와이파이 기술 통합으로 메인보드에서 와이파이 칩이 차지하는 면적은 최대 28% 줄어들었다"고 설명했다. 무선 작동을 담당하는 칩은 인텔 16나노급 공정에서 개발된 BE201 모듈이며 인텔이 자체 개발한 11Gbps급 직렬(시리얼) 인터페이스로 연결된다. 카를로스 코데이로 CTO는 "DDR 메모리 등 PC 내부 반도체의 간섭 현상으로 노이즈가 발생하면 전체 스루풋(입출력 데이터양)이 최대 50% 가량 떨어질 수 있으며 이를 막기 위해 메모리 드라이버 칩과 와이파이 모듈 사이에서 작동 클록을 조절하는 기능도 추가됐다"고 밝혔다. ■ 혼잡 상황서 끊김 없는 연결 지원하는 eMLSR 기능 와이파이7(802.11be)의 핵심 기능으로 '다중연결 작동'(MLO) 기능이 꼽힌다. 2.4GHz, 5GHz, 6GHz로 유무선공유기나 AP(액세스포인트)에 미리 연결을 유지하다 데이터 전송 속도가 떨어지거나 간섭이 발생하면 덜 혼잡한 채널로 옮겨간다. 인텔은 MLO 기능을 확장한 eMLSR(개선된 다중 연결 단일 주파수) 기능을 적용했다. 노트북에 내장된 안테나 두 개를 활용해 서로 다른 주파수로 연결한 다음 혼잡 상태가 발생하면 간섭이 적은 다른 채널로 작동한다. 카를로스 코데이로 CTO는 "와이파이는 국제 ISM 대역 주파수 기반으로 다른 기기의 혼잡 상태가 항상 발생한다. 인텔은 메타와 와이파이7 관련 기술에 협력하고 있으며 eMLSR 기능을 적용 결과 혼잡 상황에서 퀘스트 헤드셋의 영상 전송 지연 등이 최대 55% 감소했다"고 설명했다. ■ 모바일 기기 연동 '유니슨', 태블릿으로 확장 대부분의 노트북은 화면 위에 와이파이 신호를 잡기 위한 안테나 두 개를 내장하며 사람이 가까워지거나 멀어지면 와이파이 전파 수신률에도 변화가 생긴다. 루나레이크는 이를 감지해 이용자가 멀어지면 화면을 끄거나 아예 잠그는 와이파이 센싱 기능을 추가했다. 인텔이 메테오레이크부터 도입한 유니슨 기능도 업데이트됐다. 스마트폰 뿐만 아니라 아이패드와 안드로이드 태블릿을 노트북 키보드와 마우스, 혹은 터치패드로 조작할 수 있다. 카를로스 코데이로 CTO는 "미래에는 와이파이 전파 감도와 AI를 접목해 거리 뿐만 아니라 각종 동작을 인식할 수 있을 것이다. AI와 연결성을 결합하면 PC 경험을 바꿀 수 있다"고 설명했다.

2024.06.04 12:00권봉석

인텔 "루나레이크, P/E코어 작업 배분 효율화로 전력 절감"

[타이베이(대만)=권봉석 기자] 인텔은 12세대 코어 프로세서(엘더레이크)부터 고성능 P(퍼포먼스) 코어, 저전력·고효율 기반 E(에피션트) 코어를 혼합한 하이브리드 코어를 투입했다. 윈도 운영체제는 각 코어의 성능과 실행하는 작업의 상태를 파악해 윈도 운영체제가 적절한 코어에 작업을 배정하고 원활하게 실행될 수 있도록 할 필요가 있었다. 이 과정에서 새롭게 등장한 것이 '스레드 디렉터'(Thread Director)다. 지난 주 진행된 '테크투어 타이완' 행사에서 라즈쉬리 차북스와(Rajshree Chabukswar) 인텔 클라이언트 컴퓨팅 그룹 펠로우는 "윈도 운영체제는 PC 제조사나 OEM의 의도, 어댑터 연결 유무에 따른 코어 최대 성능까지 파악할 수 없으며 이를 전달하는 것이 스레드 디렉터"라고 설명했다. ■ 코어 배분 방식, 프로세서 개발 의도에 따라 변화 라즈쉬리 차북스와 펠로우는 "CPU의 IPC(클록당 처리 명렁어)는 전력 소모 상태에 따라 바뀐다. 어떤 상황에서는 E코어가 P코어보다 더 빠르고 효율적일 수 있다. 스레드 디렉터는 이를 파악해 윈도 운영체제에 전달한다"고 설명했다. 스레드 디렉터는 코어 프로세서 출시 세대마다 작동 방식과 내부 처리 우선 순위에 변화가 있었다. 12/13세대 코어 프로세서는 다중 작업 역량과 성능을 중시했기 때문에 거의 모든 작업 실행시 P코어를 우선했다. 코어 울트라 시리즈1(메테오레이크)은 전력 효율성을 우선했다. P코어, E코어 이외에 듀얼코어(2코어)로 구성된 '저전력 아일랜드 E코어'를 내장했다. 이 세대에서는 저전력 아일랜드 E코어→E코어→P코어 순으로 작업을 배분했다. ■ 루나레이크, 대부분 작업에서 E코어 우선 반면 인텔이 올 3분기부터 공급할 루나레이크(Lunar Lake)는 P코어 '라이언코브'(Lion Cove) 4개, E코어 '스카이몬트'(Skymont) 4개 등 코어 2종류만 탑재한다. 라즈쉬리 차북스와 펠로우는 "루나레이크에 포함된 스카이몬트 코어 4개는 IPC가 상당히 향상됐고 좋은 성능을 낸다. 이에 따라 스레드 디렉터도 전력 효율이 좋은 E코어에 모든 작업을 우선하도록 설계됐다"고 밝혔다. 예를 들어 PC 부팅이 끝난 대기상태에서 오피스 프로그램이나 웹브라우저를 실행할 때 처음에는 E코어를 활용한다. 그러나 많은 숫자를 피벗 테이블로 처리하는 엑셀 파일이나 복잡한 자바스크립트 실행시는 이를 모두 P코어로 옮기는 방식이다. 라즈쉬리 차북스와 펠로우는 "이런 작업은 모두 윈도 운영체제가 실행하는 것이며 스레드 디렉터는 어디까지나 필요한 정보만 제공한다. E코어에서 P코어로 실행 작업을 옮기는 데 필요한 지연 시간은 0.02초 미만"이라고 설명했다. 다만 이런 작동 방식은 제조사의 의도와 다를 수 있다. 게임용 노트북에서 게임을 실행할 때 E코어를 활용하면 초기 실행이 늦어질 수 있다. PC 제조사 역시 일정 부분 유연성을 부여할 수 있다. ■ 루나레이크, E코어만 작동시 P코어 완전히 끈다 루나레이크에 포함된 스레드 디렉터는 실행하는 작업의 의도를 보다 잘 파악할 수 있는 방향으로 개선됐다. 내장된 P/E코어를 효율성 중시 'E 영역', 고성능 중시 'P 영역', '무영역'(Zoneless)으로 나눠 격리 실행한다. 예를 들어 E 영역에 있는 E코어 실행시 P코어는 대기 상태로 들어간다. 또 P 영역에 있는 P코어 작동시 E코어는 대기 상태로 전환돼 전력 효율을 극대화할 수 있다. 루나레이크는 모든 작업을 E 영역에서 실행하며 P코어는 모두 대기상태로 돌린다. 라즈쉬리 차북스와 펠로우는 "'무영역'은 인텔이 제공하는 기본값이 있지만 PC 제조사가 효율성과 성능 중 어떤 목표를 우선할 것인지에 따라 배치되는 코어가 달라진다"고 밝혔다. ■ 마이크로소프트 팀즈 구동시 전력 소모 35% 절감 메테오레이크는 부하가 조금만 높아져도 P코어로 모든 작업을 옮기도록 윈도 운영체제에 권고했다. 그러나 루나레이크 내장 스레드 디렉터는 작업 배분에 소프트웨어 특성까지 고려한다. 라즈쉬리 차북스와 펠로우는 "웹사이트를 연 상태에서 화면을 위아래로 스크롤하면 CPU 점유율이 갑자기 높아질 수 있다. 돌발적인 상황이 아니라 일정 시간 이상 지속되는 작업이 발견될 경우 이를 운영체제에 알리고 코어 변경을 권고한다"고 설명했다. 이어 "동일한 루나레이크 프로세서에서 스레드 디렉터의 절전 관련 기능 비활성화/활성화시 마이크로소프트 팀즈 전력 소모를 보면 관련 기능을 활성화할 때 전력 소모가 35% 더 낮았다"고 소개했다. ■ "AI 작업시 CPU·GPU·NPU 사이 작업 배분도 고려중" 스레드 디렉터가 한 가지 더 고려하는 조건은 바로 PC 제조사가 선택한 사전 작동 모드다. 라즈쉬리 차북스와 펠로우는 "많은 제조사는 제품 설계 의도에 따라 P코어나 E코어 중 적절한 코어에 융통성을 부여하길 원했다"고 설명했다. 이어 "PC 제조사는 탑재 배터리 용량이나 설계 의도, 용도에 따라 배터리 지속시간 중시나 성능 중시 등 총 7단계 중 하나를 선택할 수 있으며 스레드 디렉터는 코어 배분에도 이를 고려할 것"이라고 밝혔다. 스레드 디렉터는 코어에 작업 배분시 실행되는 명령어 등 평가에 일정 부분 AI를 활용한다. 그러나 이는 인텔 내부에서 학습을 거쳐 설정한 것이며 실제 사용 패턴과 차이가 있을 수 있다. 라즈쉬리 차북스와 펠로우는 "향후 스레드 디렉터는 머신러닝을 이용한 AI 기반 스케줄링이 가능할 것이다. 또 AI 작업 처리시 CPU를 넘어서 NPU(신경망처리장치)와 GPU 사이 작업 배분을 위해 내부 관계자와 논의하고 있다"고 덧붙였다.

2024.06.04 12:00권봉석

대만 진출 40年 맞은 인텔, 생태계 파트너로 PC 혁신 이뤘다

[타이베이(대만)=권봉석 기자] 세계 PC 중 상당수가 대만 지역을 기반으로 생산된다. IDC·가트너등 시장조사업체 기준 3·4위를 두고 경쟁하는 업체는 대만에 본사를 둔 에이서, 에이수스다. 국내 PC 마니아에 잘 알려진 데스크톱PC용 메인보드, 그래픽카드 제조사로 에이수스, 기가바이트, MSI 등을 꼽을 수 있다. 전세계 PC 제조사의 노트북 위탁생산(ODM)을 담당하는 컴팔, 콴타, 폭스콘 역시 대만 기업이다. 왕지아후위(汪佳慧, Grace Wang) 인텔타이완 세일즈·마케팅 총괄은 지난 5월 31일 진행된 '테크투어 타이완' 2일째 행사에서 "인텔은 40년 전 대만 지사(인텔타이완)를 설립 후 현지에 꾸준히 투자해 왔다"고 밝혔다. ■ 대만 내 10만명이 94개 업체서 반도체로 먹고 산다 대만 전체 면적은 3만6천197km²(제곱킬로미터)로 한국의 35%에 불과하다. 그러나 전체 인구 중 74%가 대학 교육을 마쳤고 반도체 산업 종사자도 10만 명이 넘는다. 왕지아후위 총괄은 "대만 서쪽에는 노트북 분야 선두 업체와 클라우드 서비스 제공사(CSP), 인텔타이완 설계 센터 등 PC 생태계가, 동쪽에는 TSMC와 UMC를 비롯한 파운드리 업체, 패키징(조립) 등 반도체 생태계가 존재한다"고 설명했다. 2024년 현재 대만 소재 비메모리/메모리 위탁생산(파운드리) 업체는 총 29개, 팹리스 업체는 총 29개가 운영중이다. 또 파운드리 업체가 생산한 반도체 다이(Die)를 기판에 부착하고 최종 제품으로 출하하는 패키징 등 반도체 후공정(OSAT) 업체는 총 36개다. ■ 인텔타이완, 대만 내 파트너와 협업 위해 연구소 개설 그는 "PC 산업은 처음에는 데스크톱PC로 시작해 임베디드 기기, 사물인터넷(IoT)으로 확장됐다. 또 지난 15년간 클라우드 컴퓨팅을 지탱하는 서버가 등장했다. 인텔은 이런 변화 속에서 꾸준히 대만 PC 산업을 지원했다"고 설명했다. 전세계 유일한 IDM(종합반도체기업)인 인텔도 2019년부터 대만 지역 활동에 힘을 싣고 있다. 2019년부터 시작된 노트북 경험 향상을 위한 인증 프로그램 '이보'(구 아테나 프로젝트)에서 협업을 위해 대만 타이베이 현지에 연구소를 운영중이다. 왕지아후위 총괄은 "인텔타이완은 고속 전송 규격인 썬더볼트 인증과 와이파이 연구를 위한 연구소 설립에 이어 최근에는 5G 오픈랜(OpenRAN) 연구소를 만들어 현지 생태계와 함께 하고 있다. AI 시대를 맞아 서버 냉각 솔루션이 도전과제로 등장했고 이를 해결하기 위한 액침 냉각 기술도 연구중"이라고 설명했다. ■ 코로나19 기간 중 폐쇄 제로...차질 없는 운영으로 생태계 지원 인텔타이완에 근무하는 엔지니어는 5월 말 현재 총 1천500명으로 각자 맡은 분야에서 PC/서버 생태계 파트너사를 지원하고 있다. 이들은 2020년 3월부터 시작된 코로나19 범유행 기간동안 이들은 대만 PC 생태계를 흔들림 없이 지탱했다. 왕지아후위 총괄은 "타이베이 내 인텔타이완 사무소와 연구소는 코로나19 범유행 이후 원격근무가 보편화된 상황에서 단 하루도 시설 폐쇄나 원격 근무 없이 운영됐다. 각 엔지니어가 맡은 프로젝트 수행을 도왔고 한 번도 문을 닫은 적이 없다"고 설명했다. ■ "센트리노, 울트라북, 이보... 모두 대만 거쳤다" 인텔타이완은 2003년 센트리노(Centrino)를 시작으로 20년간 인텔 노트북 혁신에 꾸준히 관여했다. 센트리노는 저전력 펜티엄M 프로세서와 와이파이 칩셋을 통합한 노트북 플랫폼이다. 당시 일반 소비자에 낯설었던 무선 통신 기술인 와이파이를 보급하는 데 크게 기여했다. 또 향후 20년간 인텔이 출시할 노트북의 토대가 됐다. 2007년에는 센트리노에 기업 IT 관리자를 겨냥한 기능을 통합한 센트리노 v프로가 공개됐다. 왕지아후위 총괄은 "원격 진단 등 관리 기능을 구현하기 위해 대만 현지 바이오스(BIOS) 제조사의 협업이 꼭 필요했다"고 설명했다. 2010년에 처음 등장해 이듬해부터 본격 보급되기 시작한 울트라북에도 대만 생태계 기여가 컸다. 왕지아후위 총괄은 "울트라북의 두께와 무게를 줄이기 위한 소재 연구, 얇아진 두께만큼 중요성이 커진 냉각 솔루션, 터치 인터페이스 반응성 강화에 대만 생태계 기술력이 투입됐다"고 설명했다. ■ "루나레이크, 대만 생태계와 함께 만든 차세대 플랫폼" 왕지아후위 총괄은 "지난 해 말 출시한 코어 울트라 시리즈1(메테오레이크)에 이어 올 3분기 출시될 루나레이크는 인텔 뿐만 아니라 다양한 대만 내 생태계 파트너사와 협력해 만든 차세대 PC 플랫폼"이라고 설명했다. 이어 "단 1W(와트)만 소모하는 노트북용 저전력 디스플레이 패널과 얇지만 강력한 냉각 솔루션 등 설계와 제조에 대만 생태계와 인텔이 협력했고 이를 조합해 얇고 가벼운 AI PC가 만들어졌다"고 밝혔다. 그는 "인텔은 AI PC 개발에 꼭 필요한 기술을 제공하지만 이를 구현하기 위한 중심에 대만 생태계가 있다. 앞으로 다가올 AI PC의 미래를 만들기 위해 이들과 꾸준히 협력할 것"이라고 말했다.

2024.06.04 12:00권봉석

인텔, NPU 내장 데스크톱용 '애로우레이크' 4분기 출시 재확인

인텔이 20일(미국 현지시간) 데스크톱PC용 차세대 프로세서 '애로우레이크'(Arrow Lake)를 올 4분기 출시하겠다고 밝혔다. 인텔은 지난 해 인텔 4(Intel 4) 공정 기반 프로세서인 코어 울트라(개발명 '메테오레이크')를 노트북에만 출시했다. 데스크톱PC용 프로세서 신제품으로는 2022년 출시한 13세대 코어 프로세서(랩터레이크)를 일부 개선한 14세대 코어 프로세서(랩터레이크 리프레시)를 출시했다. 인텔이 올 4분기 출시할 애로우레이크는 인텔 20A(Å, 0.2nm급) 공정에서 생산되며 반도체 후면 전력 전달 기술 '파워비아'(PowerVIA), 새 트랜지스터 구조 '리본펫'(RibbonFET) 등 신기술이 모두 투입된다. 2021년 12세대 코어 프로세서(엘더레이크) 이후 현재까지 쓰이는 LGA 1700 소켓 대신 LGA 1851 소켓이 적용되며 DDR5 메모리만 지원할 것으로 예상된다. 애로우레이크에는 AI 연산을 가속할 NPU(신경망처리장치)도 탑재될 예정이다. CES 2024에서 미셸 존스턴 홀터스 인텔 클라이언트 컴퓨팅 그룹(CCG) 수석부사장은 "애로우레이크는 AI 가속 성능을 갖춘 게임용 프로세서가 될 것"이라고 밝히기도 했다. 반면 AMD는 인텔보다 앞선 올 1월 라데온 700M GPU와 NPU를 탑재한 라이젠 8000G 프로세서를 출시했다. 애로우레이크에 탑재되는 NPU의 성능은 지난 해 출시된 코어 울트라 시리즈1과 비슷한 수준인 11 TOPS(초당 1조 번 연산) 수준으로 예상된다. AI 처리 성능이 추가로 필요할 경우 데스크톱PC의 그래픽카드를 교체해 이를 쉽게 높일 수 있기 때문이다. 인텔은 오는 6월 초 대만 타이베이에서 진행되는 동북아 최대 규모 ICT 전시회 '컴퓨텍스 2024'에서 애로우레이크 관련 상세 정보를 공개할 예정이라고 밝혔다. 행사 첫 날인 4일 오전 11시(대만 현지시간) 팻 겔싱어 인텔 CEO가 진행하는 기조연설에서 관련 정보가 공개될 것으로 보인다.

2024.05.21 09:29권봉석

  Prev 1 2 3 4 5 6 7 Next  

지금 뜨는 기사

이시각 헤드라인

"AI가 은행 업무 직접한다"…금융시장 타깃 웹케시, 기업형 AI 에이전트 강자로 '우뚝'

"최대 월 120만장인데"...오픈AI, 삼성·SK에 HBM용 D램 90만장 요청

야놀자 "글로벌 트래블 테크기업 관람객에 인식"

韓 AI 최대축제 한가운데 빛으로 꾸민 KT AI 기술

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.