• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
창간특집
인공지능
배터리
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'테크투어'통합검색 결과 입니다. (8건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

[인터뷰] "루나레이크, 개발 과정 단축에 조기 출시"

"루나레이크는 개발 기간 중 모든 이정표를 예정보다 앞당겨 달성했다. 개발 과정은 그만큼 성공적이었다. 개발 기간과 출시 시기 등을 종합적으로 고려한 결과 업계 예상보다 보다 이른 시기에 출시하기로 결정된 것이다." 지난 5월 31일(이하 현지시간) 인텔 연례 기술행사 '테크투어 타이완' 행사장에서 국내 기자단과 만난 로버트 할록(Robert Hallock) 인텔 클라이언트 AI 및 기술 마케팅 총괄이 이렇게 설명했다. 인텔은 지난 4일 컴퓨텍스 타이베이 2024 기조연설에서 오는 3분기부터 공급할 차세대 코어 프로세서 '루나레이크'(Lunar Lake)를 공개했다. 이날 로버트 할록 총괄은 "2010년대 초반 PC용 프로세서에 그래픽칩셋이 처음 통합됐을 때 사람들은 용도를 폄하했지만 현재는 지극히 당연한 상식이 됐다"며 "현재 쓰이는 'AI PC'라는 이름도 앞으로 4년 정도 지나면 원래 이름인 'PC'로 돌아갈 것"이라고 내다봤다. 다음은 로버트 할록 총괄과 일문일답. Q. 주요 프로세서 제조사가 TOPS 경쟁을 벌이고 있다. 그러나 특히 노트북 환경에서 TOPS 향상에 한계가 있을 것으로 보이기도 하는데 이런 양상이 언제까지 계속될 것으로 보는가. "현재 외장 그래픽칩셋은 100 TOPS를 넘으며 앞으로 계속 높아질 것이다. 단 LLM은 메모리 대역폭의 제약을 받고 있다. 그러나 LPDDR5-5300 메모리로 구동할 때도 LLM이 초당 생성하는 단어는 30개 이상으로 사람 눈으로 쫓아가기도 어렵다." Q. 인텔을 포함한 AI PC용 프로세서 제조사가 NPU(신경망처리장치) 성능 중 하나로 TOPS(1초 당 1조 번 연산)을 내세운다. 그러나 연산 정밀도 기준에 따라 TOPS는 얼마든지 달라질 수 있다고 보는데. "TOPS는 NPU가 낼 수 있는 최대 속도를 숫자로 나타낸 것이며 MAC(행렬 곱셈 후 덧셈) 연산 능력과 작동 속도, 코어 수를 곱한 다음 작동 클록으로 나눠 구한다. 엄밀히 말하자면 숫자에 불과하다." Q. AI PC의 TOPS를 정확히 측정할 수 있는 방법은 없는가. "AI PC 대표적인 활용 사례인 LLM(거대언어모델)은 첫 단어(토큰)가 나올 때까지 걸리는 시간, 초당 생성 단어 수를 측정할 수 있다. 그러나 LLM에 주는 프롬프트를 정확히 통제해야 공정한 비교가 가능하다. Q. 인텔은 공정한 테스트를 위해 어떤 노력을 기울이고 있는가. "PC 업계가 자주 활용하는 벤치마크 소프트웨어 'UL 프로시온'은 AI 추론 등 여러 벤치마크를 포함하고 있는데 특정 제조사에 치우치지 않은 비교적 공정한 소프트웨어로 평가한다. 인텔은 여러 회사와 협업해 보다 현실적인 벤치마크를 여름까지 내놓기 위해 준비중이다." Q. 인텔은 '김프'(GIMP) 등 오픈소스 소프트웨어에서 AI PC 역량을 활용할 수 있는 소프트웨어를 보급중이다. 그러나 미세한 버전 차이로 작동에 문제가 발생하고 설치 절차도 까다롭다. 다른 대안은 없는가. "AI PC는 새로운 개념이며 이를 정착시키기 위해 여러 노력을 기울이고 있다. 인텔은 스테이블 디퓨전이나 LLM을 보다 쉽게 설치할 수 있는 도구를 개발중이다. 앞서 언급했듯 벤치마크 역시 마찬가지다." Q. 마이크로소프트가 코파일럿+ PC에 요구하는 40 TOPS NPU라는 기준에 대해 어떻게 보는가. "다른 소프트웨어 제조사는 마이크로소프트만큼 강력한 연산 성능을 요구하지 않는다. 실행 작업에 따라 적합한 장치가 달라지기 때문이다. 내년에는 전체 AI 모델 중 30%가 CPU, 40%가 GPU, 30%가 NPU에서 작동할 것이다. 그리고 실제 이용자는 어떤 엔진이 어떤 장치로 구동되는지 관심이 없다." Q. 루나레이크가 내세운 저전력과 전세대 대비 두 배 향상된 GPU 성능은 휴대용 게임PC에도 적합해 보인다. 경쟁사(AMD) 대비 유사한 플랫폼을 갖춘 PC가 적은데 현재 협업하는 제조사가 있나. "지금 밝히기는 어렵지만 다음 분기에 등장할 것이다."

2024.06.06 09:00권봉석

CPU 코어 분신술 '하이퍼스레딩' 20년만에 버린 인텔

[타이베이(대만)=권봉석 기자] 지난 해 12월 출시된 코어 울트라 시리즈1(메테오레이크) 중 하나인 코어 울트라5 125H 프로세서는 고성능 P(퍼포먼스) 코어 4개, E(에피션트) 코어 8개 등 총 12개 코어를 내장했다. 그러나 동시 실행 가능 작업 단위를 나타내는 '스레드'(Thread)는 총 18개로 코어 수와 1:1로 일치하지 않는다. '4+8=12'라는 단순한 수식이 성립하지 않는다. 이런 현상은 AMD 라이젠 프로세서에서도 나타난다. 이런 현상이 벌어지는 이유는 매우 단순하다. P코어 한 개를 마치 두 개처럼 쓰는 기술인 'SMT'(동시 멀티스레딩) 때문이다. AMD는 'SMT'라는 명칭을 그대로 쓰는 반면 인텔은 이 기술에 '하이퍼스레딩'(Hyperthreading)이라는 이름을 붙였다. '코어 한 개를 마치 두 개처럼 쓰는 기술'. 쉽게 이해가 가지 않는다. 그러나 프로세서 작동 구조를 살펴보면 마냥 불가능한 일은 아니다. ■ 메모리·SSD에서 데이터 가져올 때 지연시간 발생 프로세서 내 코어의 연산은 ① SSD나 메모리, 캐시(임시 메모리)에 저장된 데이터나 명령어 가져오기(Fetch)-② 해석(Decode)-③ 실행(execute) 등 3단계를 전원이 꺼질 때까지 반복하며 실행된다. 문제는 프로세서 내 임시 저장공간(Cache)에 원하는 데이터가 없을 때 발생한다. '가져오기' 단계를 실행한 후 필요한 데이터가 전달될 때까지 기다려야 하는 것이다. 하지만 이 시간동안 귀중한 코어를 마냥 놀려두는 것은 아쉬운 일이다. 분식집에서 김밥을 만드는 과정을 생각해 보자. 참치김밥을 먼저 주문받았는데 참치가 떨어졌다면 어떻게 해야 하나. 참치를 보충할 때까지 김을 굽고, 두 번째 주문받은 야채김밥을 만들기 위해 야채를 손질해 두는 등 다른 김밥을 만들 준비를 할 수 있다. ■ 코어 수 최대한 늘리기 위해 등장한 '하이퍼스레딩' 이처럼 코어를 놀려두지 않고 계속 일을 시켜 어떻게든 작동 속도를 끌어올리기 위한 기술이 하이퍼스레딩(SMT)이다. 단 하이퍼스레딩의 성능 향상 폭은 최대 30% 정도에 그치는 것으로 알려져 있다. 인텔은 2002년 11월 출시된 '펜티엄4 HT' 프로세서에 처음 탑재됐다. 하이퍼스레딩이 일반 소비자용 프로세서로 내려와 보편화된 2003년 하반기부터 리눅스를 시작으로 윈도 운영체제(윈도XP)에서 정식 지원되기 시작했다. 이후 하이퍼스레딩은 20년이 흐른 현재까지 인텔 프로세서에 꾸준히 탑재됐다. 인텔이 P/E 코어 기반 하이브리드 구조를 채택한 2021년(12세대 코어 프로세서) 이후 지난 해 코어 울트라 시리즈1(메테오레이크)까지 하이퍼스레딩이 쓰였다. ■ "하이퍼스레딩에는 댓가가 따른다" 그러나 하이퍼스레딩이 반드시 유용한 결과만 가져 오는 것은 아니다. 성능이 최대 30% 늘어나는 대신 코어를 구성하는 공간 중 10% 가량을 하이퍼스레딩에 써야 한다. 소모 전력이 상승할 뿐만 아니라 보안 문제를 낳기도 한다. 지난 주 진행된 '테크투어 타이완' 행사에서 스테판 로빈슨(Stephen Robinson) 인텔 수석 아키텍트겸 펠로우는 "하이퍼스레딩은 공짜가 아니며 댓가가 따른다"고 설명했다. 그는 "하이퍼스레딩은 성능이 극도로 중요한 데이터센터라면 전력 소모 등의 댓가를 치를 가치가 있다. 그러나 루나레이크처럼 전력 소모를 최소로 줄이고 트랜지스터 갯수를 줄여야 하는 상황에서는 의미가 없다"고 설명했다. 또다른 댓가는 바로 보안이다. 하이퍼스레딩 구조 설계 당시는 프로세서 내부 보안에 대한 관심이 오늘날 대비 상대적으로 낮았다. 인텔 역시 큰 개선 없이 2002년 당시 확립된 구조를 그대로 유지했다. 결국 이는 16년 후(2018년) 스펙터·멜트다운 등 보안 결함으로 돌아와 인텔 프로세서에 대한 신뢰도를 떨어뜨렸다. ■ "하이퍼스레딩 대신 코어 늘리는 방향으로 갈 것" 지난 20년간 크게 발전한 반도체 제조 공정 기술도 하이퍼스레딩의 빛을 바래게 했다. 2003년 당시 100nm(나노미터) 급이었던 반도체 제조공정은 이제 수 나노급으로 축소됐다. 하이퍼스레딩보다는 코어 수를 더 늘리는 것이 보안이나 전력 효율성 면에서 오히려 더 효과적일 수 있다. 인텔 관계자는 지난 30일 "P/E 코어를 조합하는 하이브리드 방식이 도입되며 하이퍼스레딩 기술로 스레드 수를 늘릴 필요가 사라졌다"고 설명했다. 이에 따라 인텔이 올 3분기부터 공급할 모바일(노트북)용 프로세서, 루나레이크(Lunar Lake)부터는 P코어의 하이퍼스레딩이 빠졌다. 코어 수(P4+E4)와 스레드 수(8개)도 일치한다. 스테판 로빈슨 펠로우는 "앞으로 데이터센터나 서버용 제온 프로세서가 아닌 일반 소비자용 제품에서는 하이퍼스레딩을 안 쓰는 방향으로 갈 것이며 다음 세대에도 이런 추세는 계속될 것"이라고 전망했다.

2024.06.04 12:00권봉석

루나레이크, 모든 작업 E코어 우선 실행으로 전력 효율 ↑

[타이베이(대만)=권봉석 기자] 인텔이 오는 3분기 출시할 모바일(노트북)용 프로세서, '루나레이크'(Lunar Lake)는 x86 프로세서의 약점으로 꼽히던 전력 효율 강화에 초점을 뒀다. 개발 당시 시점에서 가장 우수한 성능을 내는 파운드리인 TSMC 위탁생산을 목표로 했다. 루나레이크는 저전력·고효율을 담당하는 E(에피션트) 코어 '스카이몬트'(Skymont)를 4개 탑재한다. 전작인 메테오레이크와 달리 저전력 E코어 아일랜드(2코어)는 빠졌다. 모든 작업은 기본적으로 E코어 4개에서 실행해 전력 소모를 최소화했다. 특히 저전력·고효율을 담당하는 E(에피션트) 코어 '스카이몬트'는 비슷한 전력 소모에서 전세대 고성능 담당 P(퍼포먼스) 코어 이상의 성능을 낼 정도로 강화됐다. ■ "E코어 '스카이몬트', 전작 대비 최대 2.9배 성능 향상" 지난 주 진행된 '테크투어 타이완' 행사에서 스테판 로빈슨(Stephen Robinson) 인텔 수석 아키텍트겸 펠로우는 "스카이몬트는 전작 메테오레이크에 탑재된 E코어(크레스트몬트) 대비 같은 전력에서 최대 2.9배 더 높은 성능을 낸다"고 설명했다. 성능 개선에 영향을 준 가장 큰 요소는 바로 다음 명령어를 예측하는 '분기 예측' 확대다. 또 복잡한 명령어를 분해하고 해석해 실행 다음 단계로 전달하는 장치인 '디코더'를 한 개 더 늘렸다. 비순차실행(OOE)은 전후 연산 결과에 영향을 받지 않는 명령어를 앞질러 처리해 클록당 처리 명령어 수(IPC)를 향상시킨다. 스카이몬트는 동시 실행할 수 있는 비순차실행 명령어를 메테오레이크(6개) 대비 2개 늘어난 8개로 확대했다. AI 연산 속도를 올리기 위한 벡터 연산도 강화됐다. AI 연산에 주로 쓰이는 128비트 부동소수점(Float) 처리기를 4개 탑재하고 부동소수점 곱셈(FMUL), 덧셈(FADD), 곱셈·덧셈(FMA) 명령어의 지연시간은 낮췄다. ■ 4코어 모두 활용시 전작 대비 최대 4배 성능 향상 이런 개선이 더해진 결과 스카이몬트 코어의 연산 성능은 메테오레이크에 탑재되던 저전력 아일랜드 E코어 대비 정수 기준 1.38배, 실수(부동소수점) 기준 1.68배 높아졌다. 단일 작업 기준으로 스카이몬트 코어 4개로 구성한 클러스터 성능은 듀얼코어(2코어)인 메테오레이크 저전력 아일랜드 E코어 대비 최대 2배 향상됐다. 코어 수가 더 늘어났지만 소비 전력은 1/3 줄었고 같은 전력 공급시 성능은 1.7배 늘어났다. 모든 코어를 활용할 때 성능은 최대 4배 향상되며 동일 전력 대비 성능은 최대 2.9배 높아졌다. ■ 데스크톱용 P코어보다 같은 전력에서 더 높은 성능 스테판 로빈슨 펠로우는 "스카이몬트 4코어는 데스크톱용 13세대 코어 프로세서(랩터레이크)에 탑재되는 P코어, 랩터코브(Raptor Cove)와 비교했을 때 오히려 더 높은 성능을 내기도 한다"고 설명했다. 그는 "최대 작동 클록에서는 랩터코브가 6GHz를 넘어설 수 있는 반면 스카이몬트는 6GHz를 넘지 못한다. 그러나 단일 작업 처리시 최대 성능 면에서는 스카이몬트가 같은 전력 대비 더 나은 성능을 낸다"고 밝혔다. 이어 "메테오레이크의 저전력 아일랜드 E코어는 넷플릭스나 유튜브 영상 재생은 원활했지만 마이크로소프트 팀즈 등에서는 충분한 성능을 내지 못했다. 그러나 이제는 이런 작업도 E코어로 충분히 처리할 수 있을 것"이라고 덧붙였다. 루나레이크는 단시간 안에 빨리 처리해야 하는 작업에만 P(퍼포먼스) 코어 '라이언코브'(Lion Cove)를 활용한다. P코어는 총 4개만 탑재되는 데다 최대 작동 클록은 메테오레이크 탑재 P코어보다 낮지만 IPC 향상으로 이를 보완했다는 것이 인텔 설명이다. 오리 렘펠(Ori Lempel) 인텔 수석 엔지니어는 "작동 클록이 낮아질 수 있지만 IPC를 높이면 성능 향상은 자연스럽게 따라온다"며 "라이언코브의 IPC는 메테오레이크 탑재 P코어 '레드우드코브' 대비 최대 14% 향상됐다"고 밝혔다. 또 하나 특징은 코어 한 개를 두 개처럼 활용하는 기술 '하이퍼스레딩'을 더 이상 쓰지 않는다는 것이다. 오리 렘펠 인텔 수석 엔지니어는 "개발 도중 여러 요소를 고려한 결과 루나레이크에 탑재되는 라이언코브에서는 지원하지 않는 것으로 결정했다"고 밝혔다. 그는 "하이퍼스레딩에는 댓가가 따른다. 명령어를 처리하는 절차인 파이프라인이 길어져 속도를 떨어뜨리며 보안 문제도 있다. 라이언코브를 단일 작업에 최적화한 결과 더 적은 면적과 전력에서 더 높은 속도를 낼 수 있다"고 설명했다. ■ "제품 특성에 맞는 다양한 '라이언코브' 등장할 것" 2021년 출시된 12세대 코어 프로세서(엘더레이크)를 시작으로 지금까지 E코어는 4개를 기준으로 클러스터 한 개를 구성했다. 스티븐 로빈슨은 "현 세대는 4개 묶음이 여전히 유효하며 2개, 혹은 6개 등 축소나 확대를 고려하지 않는다"고 밝혔다. 라이언코브는 루나레이크 뿐만 아니라 4분기 출시될 데스크톱PC용 프로세서 '애로우레이크' 등에도 적합하게 설계됐다. 오리 렘펠 수석 엔지니어는 "예전과 달리 서버나 데스크톱PC, 노트북 등 제품 특성에 맞는 다양한 P코어 변종이 등장할 것"이라고 설명했다.

2024.06.04 12:00권봉석

"AI PC, 사생활 침해·지연 없는 맞춤형 경험 제공할 것"

[타이베이(대만)=권봉석 기자] AI PC의 핵심은 클라우드에 의존했던 AI 기능을 PC로 가져오는 것이다. 미리 학습된 AI 모델을 내려받아 CPU와 GPU, NPU(신경망처리장치)를 모두 활용해 가동하므로 LTE/5G나 와이파이가 없는 곳에서도 작동한다. 톰 피터슨(Tom Peterson) 인텔 그래픽 및 소프트웨어 아키텍처 부문 펠로우는 지난 주 진행된 '테크투어 타이완' 행사에서 "AI PC는 금융 정보나 건강 정보 등 민감한 정보를 관리하는 한편 이용자 특성을 학습해 맞춤형 비서 서비스를 제공할 수 있다"고 밝혔다. 이어 "금융 정보나 건강 정보 모두 외부에 공개하기 어려운 정보지만 AI PC는 이를 클라우드에 올리는 대신 기기 내에서 자체적으로 처리해 사생활 침해나 유출을 막는다"고 덧붙였다. ■ "AI PC 구현에 CPU·GPU·NPU 모두 중요" 현재 인텔을 포함해 주요 프로세서 제조사가 AI 처리 성능 기준으로 NPU TOPS(1초당 1조 번 연산)를 내세운다. 이는 모든 AI 처리가 NPU만 활용한다는 인식을 줄 수 있지만 실제는 이와 다르다. 톰 피터슨 펠로우는 지난 5월 인텔 자체 조사 결과를 토대로 "올해 AI 엔진을 구동하는 장치 비중은 NPU가 25%, GPU가 40%, CPU가 35%지만 내년에는 NPU 비율이 30%대로 다소 상승, CPU 비율은 30%로 다소 변화가 있을 것"이라고 전망했다. 그는 "AI 응용프로그램의 작동 방식에 따라 차이가 있다. GPU는 생성과 인식에, NPU는 항시 가동돼야 하는 악성코드 감지 등에 유용하다. CPU의 TOPS는 낮지만 빠른 시간 안에 결과를 얻어야 할 때 유용하다"고 설명했다. ■ "AI 처리 부하 줄이는 양자화 기술, 오픈소스로 개방" AI 모델의 정밀도가 높아질 수록 처리 시간과 용량, CPU/GPU/NPU에 가해지는 부하도 급증한다. 현재 AI 모델의 주류를 이루는 것은 FP32(32비트 부동소수점), FP16이지만 용량과 처리 속도 면에서 이를 PC로 처리하는 데는 무리가 있다. 정밀도를 FP16(32비트 부동소수점), INT8(8비트 정수) 등 PC에서 처리할 수 있는 수준으로 조절해야 한다. 이를 해결하기 위한 방법이 양자화이며 처리 속도 향상, AI 모델 용량 축소 등이 가능하다. 톰 피터슨 펠로우는 "양자화를 쉽게 처리할 수 있는 기술인 '인텔 신경망 압축'을 오픈소스 AI 생태계인 ONNX에 오픈소스 기술로 제공할 것"이라고 설명했다. ■ 인텔, 파이3 코어 울트라에 최적화...초당 25 단어 생성 인텔은 지난 4월 공개된 마이크로소프트 LLM(거대언어모델)인 파이3를 코어 울트라 시리즈 프로세서에 최적화했다. 코어 울트라 시리즈1(메테오레이크)에서 첫 단어가 나오는 데는 1초 미만, 초당 25단어를 생성해 이미 사람 눈으로 따라갈 수 없는 수준까지 향상됐다. 루나레이크의 AI 처리 성능은 여기서 한 단게 더 나아갔을 것으로 추정된다. 톰 피터슨 펠로우는 "AI 처리 속도를 높이는 것은 매우 중요한 일이다. 앞으로는 AI 응용프로그램이 사람 대신 다른 프로그램, 다른 서비스와 직접 상호작용하며 학습하게 될 것"이라고 설명했다. ■ "생태계 확대 위해 루나레이크 개발자 키트 곧 공급" 인텔이 AI PC 구현을 위해 이용하는 기술은 오픈비노(OpenVINO)다. PC의 CPU와 GPU, NPU를 모두 활용해 AI 처리 연산을 가속한다. 윈도 다이렉트ML, ONNX 런타임, 윈도 AI 등 다양한 소프트웨어를 지원한다. 인텔은 오픈비노를 활용한 개발자 생태계 확대를 위해 루나레이크 프로세서 기반 AI PC 개발 키트도 사전 공급할 예정이다. 가로·세로 165mm×150mm, 높이 27mm의 슬림한 케이스에 루나레이크 프로세서와 LPDDR5 32GB 메모리를 장착했다. 톰 피터슨 펠로우는 "루나레이크는 5 TOPS CPU, 67 TOPS GPU, 48 TOPS NPU를 결합해 최대 120 TOPS를 발휘할 수 있으며 게임과 AI 비서, 생성 AI를 이용한 콘텐츠 제작에 최적화됐다"고 강조했다.

2024.06.04 12:00권봉석

인텔 루나레이크, 저전력·고효율 목표로 경쟁력 강화

[타이베이(대만)=권봉석 기자] "3분기 출시할 모바일(노트북)용 프로세서 '루나레이크'(Lunar Lake)는 x86 프로세서에 대해 사람들이 가진 생각은 물론 AI PC를 경험하는 방식을 바꿀 것이다. CPU와 GPU(그래픽처리장치), NPU(신경망처리장치) 모두 경쟁에서 이길 것이다." 컴퓨텍스 타이베이 2024 전 주 진행된 '인텔 테크투어 타이완' 기조연설에서 미셸 존스턴 홀타우스 인텔 CCG(클라이언트 컴퓨팅 그룹) 총괄(수석부사장)이 이렇게 강조했다. 인텔 테크투어는 2022년부터 시작된 연례 기술 행사다. 매년 새 프로세서 출시를 앞두고 각국 기자단에 강점과 특징 등을 소개한다. 올해 행사에는 한국을 포함해 15개 국가와 지역에서 150개 매체, 227명이 참석했다. 올해 행사 핵심은 오는 3분기 출시될 모바일용 프로세서, 루나레이크다. 이달부터 국내 포함 전 세계 시장에 출시되는 퀄컴 스냅드래곤 X 엘리트/플러스, 하반기 출시될 AMD 라이젠 프로세서와 경쟁할 제품이다. ■ TSMC 위탁생산 타일과 메모리, 인텔 기술로 조립 전작인 코어 울트라 시리즈1(메테오레이크)는 컴퓨트(CPU), GPU, SOC, I/O 등 4개 타일을 인텔과 TSMC가 생산한 다음 3차원 적층 기술 '포베로스'(FOVEROS)로 결합해 구성했다. 반면 루나레이크는 CPU 타일, 그리고 GPU와 NPU, 미디어 엔진 등 다양한 반도체 IP(지적재산권)를 재배치/통합한 플랫폼 제어 타일 등 단 두 개로 구성됐다. 여기에 LPDDR5X 메모리를 결합해 주요 PC 제조사에 공급된다. CPU와 GPU가 한 메모리를 같이 쓰는 통합 구조로 애플 M시리즈 프로세서와 같은 방식의 접근을 택했다. 한 다이(Die) 안에서 데이터가 오가므로 메모리를 분리했던 과거와 달리 지연시간과 면적은 줄이면서 대역폭은 높일 수 있다. 핵심 요소인 컴퓨트 타일(TSMC N3B), 그리고 플랫폼 제어 타일 모두 대만 TSMC가 만들었다는 것도 특징이다. 두 타일을 연결하는 베이스 타일은 인텔 22나노미터 공정에서 생산됐다. ■ 컴퓨트 타일 내 P·E코어, 전력 효율성 강화에 방점 컴퓨트 타일은 고성능 P(퍼포먼스) 코어 '라이언코브'(Lion Cove) 4개와 저전력·고효율 E(에피션트) 코어 '스카이몬트'(Skymont) 4개, 총 8개 코어로 구성된다. 대부분의 작업은 E코어가 먼저 처리하며 고성능이 필요한 작업에서 P코어가 작동한다. P코어와 E코어는 최근 강조되는 지표인 와트 당 성능, 다시 말해 전력 효율성 향상에 중점을 뒀다. E코어 '스카이몬트'는 P코어 '라이언코브'보다 적은 전력으로 같은 성능을 내도록 설계됐다. 인텔 자체 검증 결과 전작(메테오레이크) 대비 클록 당 명령어 처리 성능은 P코어 최대 14%, E코어 최대 68%까지 향상됐다. 동영상 재생이나 대기 상태 등 단순한 작업만 처리하던 '저전력 아일랜드 E코어' 성능도 전세대 대비 최대 2배 향상됐다. P코어 한 개를 두 개처럼 쓰는 프로세서 효율 향상 기술인 '하이퍼스레딩'은 루나레이크에서 빠졌다. 하이퍼스레딩이 빠진 대신 IPC(클록당 처리 가능 명령어 수)를 크게 높여 성능 하락이 일어나지 않을 것이라는 것이 인텔 관계자 설명이다. ■ 성능 높이고 전력소모 줄인 Xe2 GPU로 AI 가속 GPU는 게임이나 동영상 처리 뿐만 아니라 AI PC에서 중요도가 한층 커졌다. 고밀도 연속 AI 연산을 단시간에 처리하려면 GPU의 도움은 필수다. AI 연산 성능을 가늠하는 지표인 TOPS(1초 당 1조 번 AI 연산) 중 상당수가 GPU에서 나온다. 루나레이크의 GPU는 새롭게 개발한 Xe 코어 8개를 결합한 'Xe2'다. 내부 구조를 보완해 메테오레이크 대비 성능은 50% 가까이 늘어났다. AI 연산 중 상당수를 차지하는 행렬 관련 처리를 위한 XMX도 더해 AI 처리량은 1.5배 이상 향상됐다. Xe2 GPU의 AI 연산 성능은 최대 67 TOPS다. 디스플레이 규격은 2022년 하반기 정식 확정된 디스플레이포트 2.1, HDMI 2.1과 함께 노트북 직결 디스플레이 패널과 연결되는 eDP 1.5도 함께 지원한다. 처리가 쉽지 않은 차세대 코덱인 VVC(H.266) 재생도 지원한다. ■ AI 연산 성능 NPU 단독 48 TOPS, 최대 120 TOPS 가능 마이크로소프트는 최근 '빌드' 행사에서 PC 이용 이력을 추적하는 기능인 '리콜' 등을 담은 새로운 PC 카테고리인 '코파일럿+ PC'를 공개한 바 있다. 코파일럿+ PC는 40 TOPS 이상 NPU 탑재를 요구한다. 루나레이크에 탑재된 인텔 4세대 NPU인 'NPU 4' 성능은 전작(10.5 TOPS) 대비 3배 이상인 최대 48 TOPS까지 향상됐다. 과거 2개에 그쳤던 NPU 내 연산 장치를 최대 6개까지 늘리는 한편 작동 클록도 끌어올렸다. NPU와 GPU의 성능 강화에 따라 루나레이크의 AI 연산 성능도 세 자릿수까지 올라섰다. NPU 48 TOPS, GPU 67 TOPS와 CPU 5 TOPS를 합해 최대 120 TOPS까지 AI 연산이 가능해졌다는 것이 인텔 설명이다. ■ S/W 생태계 확대 위해 루나레이크 개발킷도 보급 AI PC의 쓰임새를 최대한 확보할 수 있는 소프트웨어 관련 역량 확보도 중요하다. 인텔은 이미 AI 모델 500개를 코어 울트라에 최적화하는 한편 에이수스와 협력해 코어 울트라 시리즈1 기반 개발자 키트도 보급중이다. 미셸 존스턴 홀타우스 총괄은 "최대 120 TOPS를 실현 가능한 개발자 키트를 생산해 AI PC용 소프트웨어 개발자에게 공급할 것이다. 업그레이드가 가능한 구조로 개발돼 향후 등장할 '팬서레이크'(Panther Lake) 등 다음 제품과도 호환될 것"이라고 설명했다. 인텔은 현재 루나레이크 제품화 단계인 'B0' 스테핑 단계 실리콘이 생산에 들어갔다고 밝혔다. 오는 3분기부터 주요 PC 제조사에 공급되며 오는 연말까지 20개 제조사가 80개 이상의 제품을 출시 예정이다.

2024.06.04 12:00권봉석

인텔 "루나레이크 NPU 성능 4배 강화... 전력 효율도 개선"

[타이베이(대만)=권봉석 기자] 인텔이 올 3분기부터 주요 PC 제조사에 공급할 모바일(노트북)용 프로세서, 루나레이크(Lunar Lake)는 플랫폼 컨트롤러 타일에 최대 48 TOPS(1초 당 1조 번) AI 연산이 가능한 4세대 NPU(신경망처리장치), NPU 4를 탑재한다. NPU 4는 CPU나 GPU 대비 훨씬 적은 전력으로 CPU(5 TOPS)의 5배 이상, Xe2 GPU(67 TOPS)의 71% 수준 AI 처리를 수행한다. AI 연산 성능만 따지면 코어 울트라 시리즈1(메테오레이크)의 CPU, GPU, NPU를 모두 합친 수치(34 TOPS)를 넘어선다. NPU 4는 PC가 켜져 있을 때 항상 같이 돌아가야 하는 음성 인식, 악성코드 탐지, 카메라를 이용한 사물 인식 등에 적합하다. 스테이블 디퓨전 1.5 기준으로 NPU 3 대비 최대 4배 빠르게 이미지를 생성해 전력 효율도 2.9배 향상됐다. ■ 인텔 NPU, 2018년 첫 출시 이후 올해 4세대 돌입 인텔 NPU는 2016년 인텔이 인수한 스타트업 '모비디우스' 기술력 기반으로 만들어졌다. 2018년 출시된 첫 제품은 별도 칩으로 출시돼 USB 단자 등을 통해 PC에 연결해 작동했다. 연산 성능은 0.5 TOPS로 영상 처리나 사물 인식 등에 적합했다. 2세대 제품인 'NPU 2'는 2021년 출시된 제품이며 IoT(사물인터넷) 기기를 대상으로 했다. 연산 속도는 7 TOPS 수준이며 배경 흐림, 프레임 인물 고정 등 윈도 스튜디오 효과를 지원했다. 지난 주 진행된 '테크투어 타이완' 행사에서 대런 크루스(Darren Crews) 인텔 NPU 수석 아키텍트는 "NPU는 7년 전만 해도 카메라를 통한 사물 인식 등에 주로 쓰였지만 현재는 높은 연산 성능과 함께 전력 효율성 등 두 가지 목표를 모두 달성해야 하는 상황"이라고 설명했다. ■ NPU 4 하나로 메테오레이크 연산 성능 능가 지난 해 출시된 코어 울트라 시리즈1(메테오레이크)는 SOC 타일에 3세대 제품 'NPU 3'를 통합했다. 연산 성능은 11.5 TOPS로 전체 연산 성능(34 TOPS)의 1/3 가량을 차지한다. 반면 후속 제품인 루나레이크에 탑재된 NPU 4의 AI 연산 성능은 최대 48 TOPS로 메테오레이크의 CPU, GPU, NPU를 모두 합친 것보다 더 빠르다. 대련 크루스 수석 아키텍트는 "AI 연산을 실제로 수행하는 엔진 수 증가, 작동 주파수 향상, 내부 아키텍처 개선으로 NPU 4의 성능이 급격히 향상됐다"고 설명했다. ■ "TOPS 수치, 작동 클록과 MAC 연산 능력이 좌우" 최근 PC용 프로세서를 구성하는 CPU와 GPU, NPU의 AI 연산 성능 측정을 위한 기준으로 'TOPS'가 널리 쓰인다. 그러나 이 수치가 정확히 어떤 과정을 거쳐 나오는지 정확히 아는 사람은 드물다. 대런 크루스 수석 아키텍트는 "TOPS는 AI 처리에 주로 쓰이는 연산 속도와 NPU 작동 클록에 크게 영향을 받는다" 고 설명했다. AI 연산에 가장 널리 쓰이는 연산 방식은 큰 수치를 서로 곱해 더하는 행렬 연산인 MAC 연산이다. 메테오레이크의 NPU 3내 연산 엔진은 두 개이며 한 클록당 4천96개의 MAC 연산을 수행한다. 여기에 작동 클록(1.4GHz)을 곱하고 1조 번(10의 12승)으로 나눈 값이 11.5 TOPS다. 같은 방식으로 계산하면 루나레이크 내장 NPU 4의 TOPS는 48 TOPS다. ■ "TOPS는 행렬 연산에 치중... 벡터 계산 성능 향상도 중요" 단 MAC 연산 처리량은 자료형(데이터타입)의 정밀도에 큰 영향을 받는다. 예를 들어 인텔이 기준으로 삼은 자료형은 INT8(정수 8비트)이다. 이를 INT4(정수 4비트)로 바꾸면 MAC 연산량과 TOPS는 각각 두 배로 뛴다. 대런 크루스 수석 아키텍트는 "TOPS 값은 계산으로 얻어진 값이며 주로 행렬 연산에 집중됐다. 그러나 큰 수치를 한꺼번에 처리하는 벡터 연산이 실제 AI 응용프로그램 성능에 더 큰 영향을 미친다"고 설명했다. NPU 4는 벡터 연산을 처리하는 레지스터 크기를 512비트로 확장하고, 대역폭은 전 세대 대비 4배 높였다. 행렬과 수치 연산을 모두 강화해 다양한 AI 연산을 처리할 수 있게 됐다. 양자화 전용 회로도 내장해 INT8, FP16 자료형을 모두 지원한다. ■ "TOPS, 행렬 연산에 치중...벡터 계산 성능 향상도 중요" NPU 4는 뉴럴 연산 엔진을 2개에서 6개로 3배 늘렸다. MAC 연산을 담당하는 어레이도 4천 개에서 1만 2천개로 늘어났다. 같은 소비 전력에서 NPU 3 대비 성능은 두 배 늘어났고 최대 성능은 4배로 뛰어올랐다. 벡터 연산 성능은 최대 12배, TOPS는 4배 이상 향상됐다. LLM(거대언어모델)의 토큰 생성 속도에 영향을 미치는 대역폭도 최대 2배 향상됐다. 오픈소스 그래픽 프로그램 '김프'(GIMP)로 스테이블 디퓨전 1.5 플러그인을 이용해 이미지를 생성하는 테스트에서 메테오레이크는 22.08초, 루나레이크는 5.43초로 실제 처리 시간이 1/4 수준으로 줄었다. 전력 소모는 NPU 3와 NPU 4 사이에 큰 차이가 없다. 메테오레이크 소모전력은 9W, 루나레이크 소모전력은 11.2W다. 대런 크루스 수석 아키텍트는 "소모 전력이 높아졌지만 소요 시간이 크게 줄어 실제 전력 소모는 줄어든다. 이를 통해 전력 효율을 2.9배 높였다"고 밝혔다.

2024.06.04 12:00권봉석

루나레이크, 와이파이7 IP 흡수..."끊김 없는 연결 실현"

[타이베이(대만)=권봉석 기자] 인텔은 2003년 펜티엄M 프로세서와 와이파이 모듈을 통합한 센트리노 플랫폼으로 노트북 와이파이 보편화를 이끌어냈다. 지난 해 출시한 코어 울트라 시리즈1(메테오레이크)는 5Gbps 이상 데이터를 전송하는 와이파이7(802.11be) 모듈을 탑재했다. 올 3분기부터 주요 PC 제조사에 공급될 루나레이크는 PCI 익스프레스 인터페이스로 연결했던 와이파이 모듈 중 대부분을 프로세서 안 '플랫폼 컨트롤러 타일'에 통합했다. 이를 통해 기판 면적 축소, 전력 소모 절감 등을 구현했다. 카를로스 코데이로(Carlos Cordeiro) 인텔 무선 부문 CTO(최고기술책임자)는 지난 주 진행된 '테크투어 타이완' 행사에서 "루나레이크는 와이파이7과 썬더볼트4, 블루투스 5.4를 통합하고 와이파이 속도를 향상하기 위한 소프트웨어로 우수한 연결성을 확보했다"고 설명했다. ■ 와이파이 속도 최적화 소프트웨어 기본 제공 줌, 팀즈 등 화상회의 솔루션은 코로나19 범유행 기간 중 협업을 돕는 도구로 급성장했다. 그러나 와이파이 혼잡도 등 문제로 화면이나 소리가 끊기는 현상이 새로운 문제로 등장했다. 인텔은 이런 문제를 해결하기 위해 지난 해부터 '인텔 연결 성능 수트'(ICPS) 소프트웨어를 보급중이다. 이 소프트웨어는 유무선공유기와 액세스포인트(AP) 품질과 WPA/3 등 보안 수준, 속도를 자동으로 평가해 가장 우수한 곳으로 접속한다. 기업용 노트북에 탑재되는 '인텔 연결 애널리틱스'는 와이파이 채널의 혼잡도와 지연시간을 실시간 분석한다. 기업 IT 관리자는 이 정보를 토대로 AP 수를 늘리거나 채널을 재조정해 최적 무선 환경을 만들 수 있다. ■ 루나레이크, 썬더볼트4 단자 최대 3개 지원 루나레이크는 최대 전송 속도 40Gbps(5GB/s)인 썬더볼트4 단자를 최대 3개 지원한다. 각 단자는 데이터 전송 이외에 USB-PD 방식 충전과 외부 모니터 연결도 지원하며 USB-C 형식 케이블을 모두 지원한다. 카를로스 코데이로 CTO는 "인텔은 주요 PC 제조사에 썬더볼트4(USB-C) 단자를 노트북 양쪽에 달아 놓을 것을 요구한다. 썬더볼트4 단자를 한 쪽에만 몰아 놓으면 외부 모니터나 외장 GPU 연결이 불편하기 때문"이라고 설명했다. 현장에서는 최근 공개된 썬더볼트 기반 화면·파일 공유 기능인 '썬더볼트 쉐어' 시연도 함께 진행됐다. 이 기능은 썬더볼트4 이상을 탑재한 윈도 PC 두 대를 연결해 대용량 파일 전송과 원격 제어를 구현했다(관련기사 참조). 시연에서는 1GB 파일을 거의 1초만에, 10GB 영상 파일을 11초만에 전송했다. 연결된 PC에서 동영상을 재생해도 끊김이나 지연이 나타나지 않았다. 연결된 PC가 잠기자 두 PC간 연결도 중단됐다. ■ 루나레이크, 와이파이7 기술 상당 부분 통합 인텔은 최근 와이파이 모듈 기능 중 상당수를 PC 프로세서 내부에 통합하는 CNVI 기술을 추진중이다. 루나레이크는 3세대 CNVI 기술을 이용해 전파를 주고 받는 부분 이외에 물리층(PHY)과 전용 메모리를 모두 '플랫폼 컨트롤러 타일'에 통합했다. 카를로스 코데이로 CTO는 "루나레이크 프로세서 내 와이파이 기술 통합으로 메인보드에서 와이파이 칩이 차지하는 면적은 최대 28% 줄어들었다"고 설명했다. 무선 작동을 담당하는 칩은 인텔 16나노급 공정에서 개발된 BE201 모듈이며 인텔이 자체 개발한 11Gbps급 직렬(시리얼) 인터페이스로 연결된다. 카를로스 코데이로 CTO는 "DDR 메모리 등 PC 내부 반도체의 간섭 현상으로 노이즈가 발생하면 전체 스루풋(입출력 데이터양)이 최대 50% 가량 떨어질 수 있으며 이를 막기 위해 메모리 드라이버 칩과 와이파이 모듈 사이에서 작동 클록을 조절하는 기능도 추가됐다"고 밝혔다. ■ 혼잡 상황서 끊김 없는 연결 지원하는 eMLSR 기능 와이파이7(802.11be)의 핵심 기능으로 '다중연결 작동'(MLO) 기능이 꼽힌다. 2.4GHz, 5GHz, 6GHz로 유무선공유기나 AP(액세스포인트)에 미리 연결을 유지하다 데이터 전송 속도가 떨어지거나 간섭이 발생하면 덜 혼잡한 채널로 옮겨간다. 인텔은 MLO 기능을 확장한 eMLSR(개선된 다중 연결 단일 주파수) 기능을 적용했다. 노트북에 내장된 안테나 두 개를 활용해 서로 다른 주파수로 연결한 다음 혼잡 상태가 발생하면 간섭이 적은 다른 채널로 작동한다. 카를로스 코데이로 CTO는 "와이파이는 국제 ISM 대역 주파수 기반으로 다른 기기의 혼잡 상태가 항상 발생한다. 인텔은 메타와 와이파이7 관련 기술에 협력하고 있으며 eMLSR 기능을 적용 결과 혼잡 상황에서 퀘스트 헤드셋의 영상 전송 지연 등이 최대 55% 감소했다"고 설명했다. ■ 모바일 기기 연동 '유니슨', 태블릿으로 확장 대부분의 노트북은 화면 위에 와이파이 신호를 잡기 위한 안테나 두 개를 내장하며 사람이 가까워지거나 멀어지면 와이파이 전파 수신률에도 변화가 생긴다. 루나레이크는 이를 감지해 이용자가 멀어지면 화면을 끄거나 아예 잠그는 와이파이 센싱 기능을 추가했다. 인텔이 메테오레이크부터 도입한 유니슨 기능도 업데이트됐다. 스마트폰 뿐만 아니라 아이패드와 안드로이드 태블릿을 노트북 키보드와 마우스, 혹은 터치패드로 조작할 수 있다. 카를로스 코데이로 CTO는 "미래에는 와이파이 전파 감도와 AI를 접목해 거리 뿐만 아니라 각종 동작을 인식할 수 있을 것이다. AI와 연결성을 결합하면 PC 경험을 바꿀 수 있다"고 설명했다.

2024.06.04 12:00권봉석

인텔 "루나레이크, P/E코어 작업 배분 효율화로 전력 절감"

[타이베이(대만)=권봉석 기자] 인텔은 12세대 코어 프로세서(엘더레이크)부터 고성능 P(퍼포먼스) 코어, 저전력·고효율 기반 E(에피션트) 코어를 혼합한 하이브리드 코어를 투입했다. 윈도 운영체제는 각 코어의 성능과 실행하는 작업의 상태를 파악해 윈도 운영체제가 적절한 코어에 작업을 배정하고 원활하게 실행될 수 있도록 할 필요가 있었다. 이 과정에서 새롭게 등장한 것이 '스레드 디렉터'(Thread Director)다. 지난 주 진행된 '테크투어 타이완' 행사에서 라즈쉬리 차북스와(Rajshree Chabukswar) 인텔 클라이언트 컴퓨팅 그룹 펠로우는 "윈도 운영체제는 PC 제조사나 OEM의 의도, 어댑터 연결 유무에 따른 코어 최대 성능까지 파악할 수 없으며 이를 전달하는 것이 스레드 디렉터"라고 설명했다. ■ 코어 배분 방식, 프로세서 개발 의도에 따라 변화 라즈쉬리 차북스와 펠로우는 "CPU의 IPC(클록당 처리 명렁어)는 전력 소모 상태에 따라 바뀐다. 어떤 상황에서는 E코어가 P코어보다 더 빠르고 효율적일 수 있다. 스레드 디렉터는 이를 파악해 윈도 운영체제에 전달한다"고 설명했다. 스레드 디렉터는 코어 프로세서 출시 세대마다 작동 방식과 내부 처리 우선 순위에 변화가 있었다. 12/13세대 코어 프로세서는 다중 작업 역량과 성능을 중시했기 때문에 거의 모든 작업 실행시 P코어를 우선했다. 코어 울트라 시리즈1(메테오레이크)은 전력 효율성을 우선했다. P코어, E코어 이외에 듀얼코어(2코어)로 구성된 '저전력 아일랜드 E코어'를 내장했다. 이 세대에서는 저전력 아일랜드 E코어→E코어→P코어 순으로 작업을 배분했다. ■ 루나레이크, 대부분 작업에서 E코어 우선 반면 인텔이 올 3분기부터 공급할 루나레이크(Lunar Lake)는 P코어 '라이언코브'(Lion Cove) 4개, E코어 '스카이몬트'(Skymont) 4개 등 코어 2종류만 탑재한다. 라즈쉬리 차북스와 펠로우는 "루나레이크에 포함된 스카이몬트 코어 4개는 IPC가 상당히 향상됐고 좋은 성능을 낸다. 이에 따라 스레드 디렉터도 전력 효율이 좋은 E코어에 모든 작업을 우선하도록 설계됐다"고 밝혔다. 예를 들어 PC 부팅이 끝난 대기상태에서 오피스 프로그램이나 웹브라우저를 실행할 때 처음에는 E코어를 활용한다. 그러나 많은 숫자를 피벗 테이블로 처리하는 엑셀 파일이나 복잡한 자바스크립트 실행시는 이를 모두 P코어로 옮기는 방식이다. 라즈쉬리 차북스와 펠로우는 "이런 작업은 모두 윈도 운영체제가 실행하는 것이며 스레드 디렉터는 어디까지나 필요한 정보만 제공한다. E코어에서 P코어로 실행 작업을 옮기는 데 필요한 지연 시간은 0.02초 미만"이라고 설명했다. 다만 이런 작동 방식은 제조사의 의도와 다를 수 있다. 게임용 노트북에서 게임을 실행할 때 E코어를 활용하면 초기 실행이 늦어질 수 있다. PC 제조사 역시 일정 부분 유연성을 부여할 수 있다. ■ 루나레이크, E코어만 작동시 P코어 완전히 끈다 루나레이크에 포함된 스레드 디렉터는 실행하는 작업의 의도를 보다 잘 파악할 수 있는 방향으로 개선됐다. 내장된 P/E코어를 효율성 중시 'E 영역', 고성능 중시 'P 영역', '무영역'(Zoneless)으로 나눠 격리 실행한다. 예를 들어 E 영역에 있는 E코어 실행시 P코어는 대기 상태로 들어간다. 또 P 영역에 있는 P코어 작동시 E코어는 대기 상태로 전환돼 전력 효율을 극대화할 수 있다. 루나레이크는 모든 작업을 E 영역에서 실행하며 P코어는 모두 대기상태로 돌린다. 라즈쉬리 차북스와 펠로우는 "'무영역'은 인텔이 제공하는 기본값이 있지만 PC 제조사가 효율성과 성능 중 어떤 목표를 우선할 것인지에 따라 배치되는 코어가 달라진다"고 밝혔다. ■ 마이크로소프트 팀즈 구동시 전력 소모 35% 절감 메테오레이크는 부하가 조금만 높아져도 P코어로 모든 작업을 옮기도록 윈도 운영체제에 권고했다. 그러나 루나레이크 내장 스레드 디렉터는 작업 배분에 소프트웨어 특성까지 고려한다. 라즈쉬리 차북스와 펠로우는 "웹사이트를 연 상태에서 화면을 위아래로 스크롤하면 CPU 점유율이 갑자기 높아질 수 있다. 돌발적인 상황이 아니라 일정 시간 이상 지속되는 작업이 발견될 경우 이를 운영체제에 알리고 코어 변경을 권고한다"고 설명했다. 이어 "동일한 루나레이크 프로세서에서 스레드 디렉터의 절전 관련 기능 비활성화/활성화시 마이크로소프트 팀즈 전력 소모를 보면 관련 기능을 활성화할 때 전력 소모가 35% 더 낮았다"고 소개했다. ■ "AI 작업시 CPU·GPU·NPU 사이 작업 배분도 고려중" 스레드 디렉터가 한 가지 더 고려하는 조건은 바로 PC 제조사가 선택한 사전 작동 모드다. 라즈쉬리 차북스와 펠로우는 "많은 제조사는 제품 설계 의도에 따라 P코어나 E코어 중 적절한 코어에 융통성을 부여하길 원했다"고 설명했다. 이어 "PC 제조사는 탑재 배터리 용량이나 설계 의도, 용도에 따라 배터리 지속시간 중시나 성능 중시 등 총 7단계 중 하나를 선택할 수 있으며 스레드 디렉터는 코어 배분에도 이를 고려할 것"이라고 밝혔다. 스레드 디렉터는 코어에 작업 배분시 실행되는 명령어 등 평가에 일정 부분 AI를 활용한다. 그러나 이는 인텔 내부에서 학습을 거쳐 설정한 것이며 실제 사용 패턴과 차이가 있을 수 있다. 라즈쉬리 차북스와 펠로우는 "향후 스레드 디렉터는 머신러닝을 이용한 AI 기반 스케줄링이 가능할 것이다. 또 AI 작업 처리시 CPU를 넘어서 NPU(신경망처리장치)와 GPU 사이 작업 배분을 위해 내부 관계자와 논의하고 있다"고 덧붙였다.

2024.06.04 12:00권봉석

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

폴더블 아이폰, 펀치홀 카메라 탑재 유력

배민·요기요, 먹통 뒤 정상화..."금요일 밤 비 내린 탓"

과학자들, 납으로 금 만들었다…'연금술사의 꿈' 실현되나

"북한 해커, 위장취업해 北 송금"…메일 1천개 적발

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현