• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
창간특집
인공지능
배터리
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'스카이몬트'통합검색 결과 입니다. (3건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

CPU 코어 분신술 '하이퍼스레딩' 20년만에 버린 인텔

[타이베이(대만)=권봉석 기자] 지난 해 12월 출시된 코어 울트라 시리즈1(메테오레이크) 중 하나인 코어 울트라5 125H 프로세서는 고성능 P(퍼포먼스) 코어 4개, E(에피션트) 코어 8개 등 총 12개 코어를 내장했다. 그러나 동시 실행 가능 작업 단위를 나타내는 '스레드'(Thread)는 총 18개로 코어 수와 1:1로 일치하지 않는다. '4+8=12'라는 단순한 수식이 성립하지 않는다. 이런 현상은 AMD 라이젠 프로세서에서도 나타난다. 이런 현상이 벌어지는 이유는 매우 단순하다. P코어 한 개를 마치 두 개처럼 쓰는 기술인 'SMT'(동시 멀티스레딩) 때문이다. AMD는 'SMT'라는 명칭을 그대로 쓰는 반면 인텔은 이 기술에 '하이퍼스레딩'(Hyperthreading)이라는 이름을 붙였다. '코어 한 개를 마치 두 개처럼 쓰는 기술'. 쉽게 이해가 가지 않는다. 그러나 프로세서 작동 구조를 살펴보면 마냥 불가능한 일은 아니다. ■ 메모리·SSD에서 데이터 가져올 때 지연시간 발생 프로세서 내 코어의 연산은 ① SSD나 메모리, 캐시(임시 메모리)에 저장된 데이터나 명령어 가져오기(Fetch)-② 해석(Decode)-③ 실행(execute) 등 3단계를 전원이 꺼질 때까지 반복하며 실행된다. 문제는 프로세서 내 임시 저장공간(Cache)에 원하는 데이터가 없을 때 발생한다. '가져오기' 단계를 실행한 후 필요한 데이터가 전달될 때까지 기다려야 하는 것이다. 하지만 이 시간동안 귀중한 코어를 마냥 놀려두는 것은 아쉬운 일이다. 분식집에서 김밥을 만드는 과정을 생각해 보자. 참치김밥을 먼저 주문받았는데 참치가 떨어졌다면 어떻게 해야 하나. 참치를 보충할 때까지 김을 굽고, 두 번째 주문받은 야채김밥을 만들기 위해 야채를 손질해 두는 등 다른 김밥을 만들 준비를 할 수 있다. ■ 코어 수 최대한 늘리기 위해 등장한 '하이퍼스레딩' 이처럼 코어를 놀려두지 않고 계속 일을 시켜 어떻게든 작동 속도를 끌어올리기 위한 기술이 하이퍼스레딩(SMT)이다. 단 하이퍼스레딩의 성능 향상 폭은 최대 30% 정도에 그치는 것으로 알려져 있다. 인텔은 2002년 11월 출시된 '펜티엄4 HT' 프로세서에 처음 탑재됐다. 하이퍼스레딩이 일반 소비자용 프로세서로 내려와 보편화된 2003년 하반기부터 리눅스를 시작으로 윈도 운영체제(윈도XP)에서 정식 지원되기 시작했다. 이후 하이퍼스레딩은 20년이 흐른 현재까지 인텔 프로세서에 꾸준히 탑재됐다. 인텔이 P/E 코어 기반 하이브리드 구조를 채택한 2021년(12세대 코어 프로세서) 이후 지난 해 코어 울트라 시리즈1(메테오레이크)까지 하이퍼스레딩이 쓰였다. ■ "하이퍼스레딩에는 댓가가 따른다" 그러나 하이퍼스레딩이 반드시 유용한 결과만 가져 오는 것은 아니다. 성능이 최대 30% 늘어나는 대신 코어를 구성하는 공간 중 10% 가량을 하이퍼스레딩에 써야 한다. 소모 전력이 상승할 뿐만 아니라 보안 문제를 낳기도 한다. 지난 주 진행된 '테크투어 타이완' 행사에서 스테판 로빈슨(Stephen Robinson) 인텔 수석 아키텍트겸 펠로우는 "하이퍼스레딩은 공짜가 아니며 댓가가 따른다"고 설명했다. 그는 "하이퍼스레딩은 성능이 극도로 중요한 데이터센터라면 전력 소모 등의 댓가를 치를 가치가 있다. 그러나 루나레이크처럼 전력 소모를 최소로 줄이고 트랜지스터 갯수를 줄여야 하는 상황에서는 의미가 없다"고 설명했다. 또다른 댓가는 바로 보안이다. 하이퍼스레딩 구조 설계 당시는 프로세서 내부 보안에 대한 관심이 오늘날 대비 상대적으로 낮았다. 인텔 역시 큰 개선 없이 2002년 당시 확립된 구조를 그대로 유지했다. 결국 이는 16년 후(2018년) 스펙터·멜트다운 등 보안 결함으로 돌아와 인텔 프로세서에 대한 신뢰도를 떨어뜨렸다. ■ "하이퍼스레딩 대신 코어 늘리는 방향으로 갈 것" 지난 20년간 크게 발전한 반도체 제조 공정 기술도 하이퍼스레딩의 빛을 바래게 했다. 2003년 당시 100nm(나노미터) 급이었던 반도체 제조공정은 이제 수 나노급으로 축소됐다. 하이퍼스레딩보다는 코어 수를 더 늘리는 것이 보안이나 전력 효율성 면에서 오히려 더 효과적일 수 있다. 인텔 관계자는 지난 30일 "P/E 코어를 조합하는 하이브리드 방식이 도입되며 하이퍼스레딩 기술로 스레드 수를 늘릴 필요가 사라졌다"고 설명했다. 이에 따라 인텔이 올 3분기부터 공급할 모바일(노트북)용 프로세서, 루나레이크(Lunar Lake)부터는 P코어의 하이퍼스레딩이 빠졌다. 코어 수(P4+E4)와 스레드 수(8개)도 일치한다. 스테판 로빈슨 펠로우는 "앞으로 데이터센터나 서버용 제온 프로세서가 아닌 일반 소비자용 제품에서는 하이퍼스레딩을 안 쓰는 방향으로 갈 것이며 다음 세대에도 이런 추세는 계속될 것"이라고 전망했다.

2024.06.04 12:00권봉석

루나레이크, 모든 작업 E코어 우선 실행으로 전력 효율 ↑

[타이베이(대만)=권봉석 기자] 인텔이 오는 3분기 출시할 모바일(노트북)용 프로세서, '루나레이크'(Lunar Lake)는 x86 프로세서의 약점으로 꼽히던 전력 효율 강화에 초점을 뒀다. 개발 당시 시점에서 가장 우수한 성능을 내는 파운드리인 TSMC 위탁생산을 목표로 했다. 루나레이크는 저전력·고효율을 담당하는 E(에피션트) 코어 '스카이몬트'(Skymont)를 4개 탑재한다. 전작인 메테오레이크와 달리 저전력 E코어 아일랜드(2코어)는 빠졌다. 모든 작업은 기본적으로 E코어 4개에서 실행해 전력 소모를 최소화했다. 특히 저전력·고효율을 담당하는 E(에피션트) 코어 '스카이몬트'는 비슷한 전력 소모에서 전세대 고성능 담당 P(퍼포먼스) 코어 이상의 성능을 낼 정도로 강화됐다. ■ "E코어 '스카이몬트', 전작 대비 최대 2.9배 성능 향상" 지난 주 진행된 '테크투어 타이완' 행사에서 스테판 로빈슨(Stephen Robinson) 인텔 수석 아키텍트겸 펠로우는 "스카이몬트는 전작 메테오레이크에 탑재된 E코어(크레스트몬트) 대비 같은 전력에서 최대 2.9배 더 높은 성능을 낸다"고 설명했다. 성능 개선에 영향을 준 가장 큰 요소는 바로 다음 명령어를 예측하는 '분기 예측' 확대다. 또 복잡한 명령어를 분해하고 해석해 실행 다음 단계로 전달하는 장치인 '디코더'를 한 개 더 늘렸다. 비순차실행(OOE)은 전후 연산 결과에 영향을 받지 않는 명령어를 앞질러 처리해 클록당 처리 명령어 수(IPC)를 향상시킨다. 스카이몬트는 동시 실행할 수 있는 비순차실행 명령어를 메테오레이크(6개) 대비 2개 늘어난 8개로 확대했다. AI 연산 속도를 올리기 위한 벡터 연산도 강화됐다. AI 연산에 주로 쓰이는 128비트 부동소수점(Float) 처리기를 4개 탑재하고 부동소수점 곱셈(FMUL), 덧셈(FADD), 곱셈·덧셈(FMA) 명령어의 지연시간은 낮췄다. ■ 4코어 모두 활용시 전작 대비 최대 4배 성능 향상 이런 개선이 더해진 결과 스카이몬트 코어의 연산 성능은 메테오레이크에 탑재되던 저전력 아일랜드 E코어 대비 정수 기준 1.38배, 실수(부동소수점) 기준 1.68배 높아졌다. 단일 작업 기준으로 스카이몬트 코어 4개로 구성한 클러스터 성능은 듀얼코어(2코어)인 메테오레이크 저전력 아일랜드 E코어 대비 최대 2배 향상됐다. 코어 수가 더 늘어났지만 소비 전력은 1/3 줄었고 같은 전력 공급시 성능은 1.7배 늘어났다. 모든 코어를 활용할 때 성능은 최대 4배 향상되며 동일 전력 대비 성능은 최대 2.9배 높아졌다. ■ 데스크톱용 P코어보다 같은 전력에서 더 높은 성능 스테판 로빈슨 펠로우는 "스카이몬트 4코어는 데스크톱용 13세대 코어 프로세서(랩터레이크)에 탑재되는 P코어, 랩터코브(Raptor Cove)와 비교했을 때 오히려 더 높은 성능을 내기도 한다"고 설명했다. 그는 "최대 작동 클록에서는 랩터코브가 6GHz를 넘어설 수 있는 반면 스카이몬트는 6GHz를 넘지 못한다. 그러나 단일 작업 처리시 최대 성능 면에서는 스카이몬트가 같은 전력 대비 더 나은 성능을 낸다"고 밝혔다. 이어 "메테오레이크의 저전력 아일랜드 E코어는 넷플릭스나 유튜브 영상 재생은 원활했지만 마이크로소프트 팀즈 등에서는 충분한 성능을 내지 못했다. 그러나 이제는 이런 작업도 E코어로 충분히 처리할 수 있을 것"이라고 덧붙였다. 루나레이크는 단시간 안에 빨리 처리해야 하는 작업에만 P(퍼포먼스) 코어 '라이언코브'(Lion Cove)를 활용한다. P코어는 총 4개만 탑재되는 데다 최대 작동 클록은 메테오레이크 탑재 P코어보다 낮지만 IPC 향상으로 이를 보완했다는 것이 인텔 설명이다. 오리 렘펠(Ori Lempel) 인텔 수석 엔지니어는 "작동 클록이 낮아질 수 있지만 IPC를 높이면 성능 향상은 자연스럽게 따라온다"며 "라이언코브의 IPC는 메테오레이크 탑재 P코어 '레드우드코브' 대비 최대 14% 향상됐다"고 밝혔다. 또 하나 특징은 코어 한 개를 두 개처럼 활용하는 기술 '하이퍼스레딩'을 더 이상 쓰지 않는다는 것이다. 오리 렘펠 인텔 수석 엔지니어는 "개발 도중 여러 요소를 고려한 결과 루나레이크에 탑재되는 라이언코브에서는 지원하지 않는 것으로 결정했다"고 밝혔다. 그는 "하이퍼스레딩에는 댓가가 따른다. 명령어를 처리하는 절차인 파이프라인이 길어져 속도를 떨어뜨리며 보안 문제도 있다. 라이언코브를 단일 작업에 최적화한 결과 더 적은 면적과 전력에서 더 높은 속도를 낼 수 있다"고 설명했다. ■ "제품 특성에 맞는 다양한 '라이언코브' 등장할 것" 2021년 출시된 12세대 코어 프로세서(엘더레이크)를 시작으로 지금까지 E코어는 4개를 기준으로 클러스터 한 개를 구성했다. 스티븐 로빈슨은 "현 세대는 4개 묶음이 여전히 유효하며 2개, 혹은 6개 등 축소나 확대를 고려하지 않는다"고 밝혔다. 라이언코브는 루나레이크 뿐만 아니라 4분기 출시될 데스크톱PC용 프로세서 '애로우레이크' 등에도 적합하게 설계됐다. 오리 렘펠 수석 엔지니어는 "예전과 달리 서버나 데스크톱PC, 노트북 등 제품 특성에 맞는 다양한 P코어 변종이 등장할 것"이라고 설명했다.

2024.06.04 12:00권봉석

인텔 "루나레이크, P/E코어 작업 배분 효율화로 전력 절감"

[타이베이(대만)=권봉석 기자] 인텔은 12세대 코어 프로세서(엘더레이크)부터 고성능 P(퍼포먼스) 코어, 저전력·고효율 기반 E(에피션트) 코어를 혼합한 하이브리드 코어를 투입했다. 윈도 운영체제는 각 코어의 성능과 실행하는 작업의 상태를 파악해 윈도 운영체제가 적절한 코어에 작업을 배정하고 원활하게 실행될 수 있도록 할 필요가 있었다. 이 과정에서 새롭게 등장한 것이 '스레드 디렉터'(Thread Director)다. 지난 주 진행된 '테크투어 타이완' 행사에서 라즈쉬리 차북스와(Rajshree Chabukswar) 인텔 클라이언트 컴퓨팅 그룹 펠로우는 "윈도 운영체제는 PC 제조사나 OEM의 의도, 어댑터 연결 유무에 따른 코어 최대 성능까지 파악할 수 없으며 이를 전달하는 것이 스레드 디렉터"라고 설명했다. ■ 코어 배분 방식, 프로세서 개발 의도에 따라 변화 라즈쉬리 차북스와 펠로우는 "CPU의 IPC(클록당 처리 명렁어)는 전력 소모 상태에 따라 바뀐다. 어떤 상황에서는 E코어가 P코어보다 더 빠르고 효율적일 수 있다. 스레드 디렉터는 이를 파악해 윈도 운영체제에 전달한다"고 설명했다. 스레드 디렉터는 코어 프로세서 출시 세대마다 작동 방식과 내부 처리 우선 순위에 변화가 있었다. 12/13세대 코어 프로세서는 다중 작업 역량과 성능을 중시했기 때문에 거의 모든 작업 실행시 P코어를 우선했다. 코어 울트라 시리즈1(메테오레이크)은 전력 효율성을 우선했다. P코어, E코어 이외에 듀얼코어(2코어)로 구성된 '저전력 아일랜드 E코어'를 내장했다. 이 세대에서는 저전력 아일랜드 E코어→E코어→P코어 순으로 작업을 배분했다. ■ 루나레이크, 대부분 작업에서 E코어 우선 반면 인텔이 올 3분기부터 공급할 루나레이크(Lunar Lake)는 P코어 '라이언코브'(Lion Cove) 4개, E코어 '스카이몬트'(Skymont) 4개 등 코어 2종류만 탑재한다. 라즈쉬리 차북스와 펠로우는 "루나레이크에 포함된 스카이몬트 코어 4개는 IPC가 상당히 향상됐고 좋은 성능을 낸다. 이에 따라 스레드 디렉터도 전력 효율이 좋은 E코어에 모든 작업을 우선하도록 설계됐다"고 밝혔다. 예를 들어 PC 부팅이 끝난 대기상태에서 오피스 프로그램이나 웹브라우저를 실행할 때 처음에는 E코어를 활용한다. 그러나 많은 숫자를 피벗 테이블로 처리하는 엑셀 파일이나 복잡한 자바스크립트 실행시는 이를 모두 P코어로 옮기는 방식이다. 라즈쉬리 차북스와 펠로우는 "이런 작업은 모두 윈도 운영체제가 실행하는 것이며 스레드 디렉터는 어디까지나 필요한 정보만 제공한다. E코어에서 P코어로 실행 작업을 옮기는 데 필요한 지연 시간은 0.02초 미만"이라고 설명했다. 다만 이런 작동 방식은 제조사의 의도와 다를 수 있다. 게임용 노트북에서 게임을 실행할 때 E코어를 활용하면 초기 실행이 늦어질 수 있다. PC 제조사 역시 일정 부분 유연성을 부여할 수 있다. ■ 루나레이크, E코어만 작동시 P코어 완전히 끈다 루나레이크에 포함된 스레드 디렉터는 실행하는 작업의 의도를 보다 잘 파악할 수 있는 방향으로 개선됐다. 내장된 P/E코어를 효율성 중시 'E 영역', 고성능 중시 'P 영역', '무영역'(Zoneless)으로 나눠 격리 실행한다. 예를 들어 E 영역에 있는 E코어 실행시 P코어는 대기 상태로 들어간다. 또 P 영역에 있는 P코어 작동시 E코어는 대기 상태로 전환돼 전력 효율을 극대화할 수 있다. 루나레이크는 모든 작업을 E 영역에서 실행하며 P코어는 모두 대기상태로 돌린다. 라즈쉬리 차북스와 펠로우는 "'무영역'은 인텔이 제공하는 기본값이 있지만 PC 제조사가 효율성과 성능 중 어떤 목표를 우선할 것인지에 따라 배치되는 코어가 달라진다"고 밝혔다. ■ 마이크로소프트 팀즈 구동시 전력 소모 35% 절감 메테오레이크는 부하가 조금만 높아져도 P코어로 모든 작업을 옮기도록 윈도 운영체제에 권고했다. 그러나 루나레이크 내장 스레드 디렉터는 작업 배분에 소프트웨어 특성까지 고려한다. 라즈쉬리 차북스와 펠로우는 "웹사이트를 연 상태에서 화면을 위아래로 스크롤하면 CPU 점유율이 갑자기 높아질 수 있다. 돌발적인 상황이 아니라 일정 시간 이상 지속되는 작업이 발견될 경우 이를 운영체제에 알리고 코어 변경을 권고한다"고 설명했다. 이어 "동일한 루나레이크 프로세서에서 스레드 디렉터의 절전 관련 기능 비활성화/활성화시 마이크로소프트 팀즈 전력 소모를 보면 관련 기능을 활성화할 때 전력 소모가 35% 더 낮았다"고 소개했다. ■ "AI 작업시 CPU·GPU·NPU 사이 작업 배분도 고려중" 스레드 디렉터가 한 가지 더 고려하는 조건은 바로 PC 제조사가 선택한 사전 작동 모드다. 라즈쉬리 차북스와 펠로우는 "많은 제조사는 제품 설계 의도에 따라 P코어나 E코어 중 적절한 코어에 융통성을 부여하길 원했다"고 설명했다. 이어 "PC 제조사는 탑재 배터리 용량이나 설계 의도, 용도에 따라 배터리 지속시간 중시나 성능 중시 등 총 7단계 중 하나를 선택할 수 있으며 스레드 디렉터는 코어 배분에도 이를 고려할 것"이라고 밝혔다. 스레드 디렉터는 코어에 작업 배분시 실행되는 명령어 등 평가에 일정 부분 AI를 활용한다. 그러나 이는 인텔 내부에서 학습을 거쳐 설정한 것이며 실제 사용 패턴과 차이가 있을 수 있다. 라즈쉬리 차북스와 펠로우는 "향후 스레드 디렉터는 머신러닝을 이용한 AI 기반 스케줄링이 가능할 것이다. 또 AI 작업 처리시 CPU를 넘어서 NPU(신경망처리장치)와 GPU 사이 작업 배분을 위해 내부 관계자와 논의하고 있다"고 덧붙였다.

2024.06.04 12:00권봉석

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

폴더블 아이폰, 펀치홀 카메라 탑재 유력

배민·요기요, 먹통 뒤 정상화..."금요일 밤 비 내린 탓"

과학자들, 납으로 금 만들었다…'연금술사의 꿈' 실현되나

"북한 해커, 위장취업해 北 송금"…메일 1천개 적발

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현