• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
인공지능
스테이블코인
배터리
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'AMD'통합검색 결과 입니다. (117건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

인텔, 퀄컴 '아드레노' GPU 설계 주역 에릭 데머스 영입

인텔이 데이터센터·서버용 GPU 전략 타개를 위해 AMD-퀄컴 출신 GPU 전문가 에릭 데머스(Eric Demers)를 영입했다. 에릭 데머스 수석부사장은 2012년부터 최근까지 퀄컴에서 수석부사장(SVP)으로 재직하며 퀄컴 스냅드래곤 시리즈에 내장되는 모바일용 GPU인 '아드레노(Adreno)'에 깊게 관여한 전문가다. 2020년 이후 AI GPU 시장에서 고전중인 인텔은 조직 개편과 로드맵 수정에도 불구하고 데이터센터용 AI GPU 시장에서 존재감을 회복하지 못했다. GPU 아키텍처 설계와 조직 운영 역량을 갖춘 전문가를 통해 기술적 방향성과 실행력을 동시에 강화하겠다는 의도로 보인다. 에릭 데머스, 작년 11월 퀄컴 행사에 등장 에릭 데머스는 2000년대 초반부터 ATI(AMD에 피인수), AMD 등을 거치며 그래픽관련 하드웨어와 소프트웨어 설계를 도맡은 전문가다. 가장 최근까지 몸담은 곳은 퀄컴으로 2012년 3월부터 지난 주까지 수석부사장(SVP)으로 재직했다. 에릭 데머스는 지난 해 11월 퀄컴이 미국 캘리포니아 주 샌디에이고에서 진행한 기술 행사 '스냅드래곤 X 엘리트 딥 다이브' 행사에서 스냅드래곤 X2 엘리트/익스트림 내장 GPU에 대해 설명하기도 했다. 그는 당시 "14년 전에 퀄컴에 합류해서 3세대 아드레노 GPU를 처음 만들었고 아드레노 X2는 퀄컴이 지금까지 만든 GPU 중 가장 크고 빠른 제품"이라고 강조하기도 했다. "이번 주부터 인텔서 수석부사장으로 근무" 16일(이하 현지시간) 미국 CRN에 따르면, 에릭 데머스는 이번 주부터 인텔에서 수석부사장으로 AI 처리 성능에 중점을 두고 GPU 엔지니어링 조직을 이끌 예정이다. 에릭 데머스 수석부사장은 자신의 링크드인 계정을 통해 "지난 몇 달간 립부 탄 인텔 CEO와 조직 내 몇몇 수장을 만났고 2025년 동안 일어났던 여러 사건 이후에도 CEO에 대한 확신과 긍정적인 전망에 깊은 인상을 받았다"고 설명했다. 이어 "새로운 인텔에서 일하고 지속적인 전환 과정에 참여할 수 있다는 점에서 기대감이 크다. 당분간 원격근무 예정이지만 다친 어깨가 낫는 대로 여러 팀을 방문할 것"이라고 덧붙였다. 인텔, 최근 수 년간 AI GPU 가속기 분야서 고전 인텔의 AI GPU 가속기 전략은 제품과 조직 모두 현재 매우 불안정한 상태다. 2022년 5월 처음 개발 계획을 밝혔던 '팰콘 쇼어'는 CPU와 GPU, 메모리를 자유롭게 조합할 수 있는 제품으로 출발했다. 그러나 이는 GPU만 조합한 제품으로 퇴보했고 지난 해 2월에는 이마저도 출시를 포기했다. 인텔 로드맵대로라면 올해는 서버용 GPU '재규어 쇼어'를 출시 예정이지만 시제품이나 구체적인 제원 중 어느 것도 드러나지 않았다. 지난 해 10월에는 추론 특화 GPU '크레센트 아일랜드'(Crescent Island)를 공개하고 올해 안에 시제품 공급을 선언했지만 이 역시 불투명하다. 에릭 데머스 구심점으로 AI·GPU 전략 재정비 전망 립부 탄 CEO는 지난 해 3월 취임 이후 데이터센터와 묶여 있던 AI 부문을 독립 조직으로 분리하고 사친 카티를 최고 기술 및 AI 책임자(CTO)로 선임하기도 했다. 그러나 사친 카티는 지난 해 11월 오픈AI로 이적했다. 인텔은 에릭 데머스 영입을 통해 엔비디아와 AMD 대비 뒤처진 AI GPU 가속기 전략과 로드맵 등 재정비에 나설 것으로 보인다. GPU가 수행할 수 있는 여러 분야 중 AI에 중점을 뒀다는 면에서 특히 그렇다. 시장조사업체 무어인사이트 소속 안셸 색 수석 분석가는 "에릭 데머스의 이적은 사람들의 생각보다 큰 의미가 있다. 그는 임원인 동시에 GPU 구조를 백지 상태부터 시작해 완전히 만들 수 있는 수준의 아키텍트"라고 평가했다. 인텔, 과거에도 엔비디아·AMD 등 경쟁사 임원 영입 인텔은 에릭 데머스 이전에도 AMD와 엔비디아 등 GPU 경쟁사의 임원들을 다수 영입했다. 가장 대표적인 인물은 애플과 AMD를 거쳐 2017년 11월 인텔로 이적했던 라자 코두리다. 그는 노트북부터 서버까지 커버할 수 있는 그래픽 구조인 Xe 아키텍처를 개발하고 2022년 1월 가속 컴퓨팅 시스템·그래픽 그룹(AXG) 수장까지 올랐다. 라자 코두리는 2023년 초 인텔을 떠난 후 비슷한 커리어 경로를 거친 짐 켈러가 이끄는 RISC-V(리스크파이브) 기반 팹리스인 텐스토렌트 이사회에 이름을 올렸다. 2019년 엔비디아에서 인텔로 이적한 톰 피터슨 그래픽 및 소프트웨어 아키텍처 부문 펠로우는 인텔이 주최하는 여러 행사에서 GPU 관련 기술적인 해설에 꾸준히 나서고 있다.

2026.01.19 16:42권봉석

그래픽카드도 메모리 쇼크...16GB 줄고 8GB 모델 늘어난다

글로벌 빅테크가 서버와 데이터센터 등 AI 관련 투자에 경쟁적으로 나서며 메모리 반도체 관련 수급난과 가격 상승이 이어지고 있다. PC용 그래픽카드도 메모리 반도체 수급난의 여파를 피해갈 수 없게 됐다. 그래픽카드 원가에서 큰 비중을 차지하는 GDDR6·GDDR7 메모리 가격이 급등하면서, 제조사들은 제품 구성과 출하 전략 조정에 나서고 있다. 엔비디아가 지포스 RTX 50 GPU 중 16GB 모델 수량을 조절한데 이어 AMD도 이르면 이달부터 공급가를 올릴 전망이다. 고해상도 게임이나 대용량 AI 모델을 실행하려는 일반 소비자들은 당분간 8GB 내장 그래픽카드를 써야 할 형편이다. 트렌드포스 "엔비디아, 16GB 메모리 GPU 출하량 조정" 시장조사업체 트렌드포스는 공급망 관계자를 인용해 "엔비디아가 16GB 메모리를 적용한 지포스 RTX 5060 Ti와 RTX 5070 Ti 출하량을 줄이고 메모리를 8GB로 줄인 지포스 RTX 5060/5060 Ti 출하량을 늘릴 것"이라고 밝혔다. 트렌드포스는 "엔비디아는 2월부터 16GB 이상 GPU 출하량을 조정하고 AMD도 1월부터 일부 제품군의 가격을 올릴 것으로 예상된다"고 설명했다. 국내 시장에서 지포스 RTX 5060 Ti/5070 Ti와 RTX 5080 탑재 그래픽카드 가격도 오르기 시작했다. RTX 5070 Ti 16GB 모델, RTX 5080 모두 지난 해 말 대비 적게는 15만원, 크게는 20만원까지 상승했다. 작년 10월 대비 GDDR6/7 원가 3배 상승 엔비디아와 AMD가 공급하는 AI GPU 가속기는 고대역폭메모리(HBM) 등 고성능 메모리를 주로 적용했다. 그러나 HBM 가격이 비싸지자 추론 등에 중점을 둔 일부 제품에는 상대적으로 단가가 낮은 GDDR6/7 등 메모리가 쓰이고 있다. 시장조사업체 디램익스체인지에 따르면 그래픽카드 구성을 위해 주로 쓰이는 GDDR6 모듈 가격은 지난 해 10월 대비 3배 이상 올랐다. GDDR6 8Gb(1GB) 모듈의 평균 거래가는 지난 해 10월 하순 2.80달러였지만 현재는 8.40달러까지 상승했다. 8GB를 구성하기 위한 원가는 22.4달러에서 67.2달러까지 상승했다. 8GB GPU 메모리는 현 시점에 다소 부족 그래픽카드 메모리는 게임 그래픽 품질과 거대언어모델(LLM) 로딩 가능 용량에 큰 영향을 미친다. 용량이 클 수록 더 높은 해상도를 구현할 수 있고 더 큰 용량의 LLM을 그래픽카드에 올릴 수 있다. 최근 출시되는 게임을 QHD(2560×1440) 해상도로 실행하면 그래픽카드에 탑재된 메모리를 10GB에서 14GB 가량 쓴다. 메모리가 모자라면 PC 메모리를 끌어다 쓰며 이 과정에서 성능이 하락한다. 2K 이상 고해상도로 게임 실행을 원하는 소비자들에게 8GB 메모리는 극히 부족하게 느껴질 수 밖에 없다. 그래픽카드로 LLM을 구동하려는 개발자는 AI 모델 용량을 낮춰야 한다. AMD "그래픽카드 가격 적정 수준 유지 위해 노력" 엔비디아와 AMD 등 GPU 제조사가 8GB 메모리를 주력 모델로 추진하면 8GB 이상 메모리를 탑재한 그래픽카드 중 가장 저렴한 그래픽카드로는 인텔 아크 B570/B580만 남게 된다. 15일(미국 현지시간) 데이비드 맥아피 AMD 클라이언트 비즈니스 그룹 부문 제품 관리 및 마케팅 총괄 부사장은 "AMD는 모든 D램 제조사와 다년간 전략적인 파트너십을 구축해 왔다. 이를 통해 그래픽 사업에서 필요한 물량과 가격대를 적정한 수준으로 유지하도록 보장한다"고 밝혔다. 이어 "AMD는 주요 그래픽카드 제조사와 실제 가격을 AMD 권장가에 유사하게 유지하도록 협업하고 있다. 그러나 앞으로 상황을 예측하기는 어렵다"고 덧붙였다.

2026.01.16 15:55권봉석

美 "첨단 반도체 25% 관세 부과"…대중 수출 겨냥

미국이 자국을 거쳐 타 국가로 환적되는 반도체에 25%의 관세를 부과하기로 했다. 사실상 중국으로 수출되는 엔비디아 'H200' 등 AI 반도체를 겨냥한 조치다. 앞서 미국은 중국향 AI 반도체 수출을 허용하기로 하면서, 해당 제품이 미국을 통해야 한다는 조건을 내건 바 있다. 도널드 트럼프 미국 대통령은 반도체 및 파생제품에 즉시 25%의 관세를 부과하는 행정명령에 14일(현지시간) 서명했다. 관세는 미국 동부시간 기준 15일 0시 1분 이후 소비 목적으로 반입되거나 출고되는 물품에 적용된다. 트럼프 대통령은 이날 무역확장법 232조에 따라 반도체 및 파생제품이 미국 내 반도체 제조역량 강화에 기여하지 않거나, 미국 내 데이터센터 부문에 활용되지 않는 경우 25%의 관세를 부과하겠다고 밝혔다. 트럼프 대통령은 "특정 반도체 및 파생 제품의 국내 제조 개발을 장려하고, 특정 제품 수입 의존도를 줄이며, 미국의 첨단 기술 인프라 및 기술 역량을 지원함으로써 국가 안보에 대한 위협을 해결할 것"이라고 기술했다. 다만 이번 관세 정책은 미국 내로 수입되는 반도체 전반을 겨냥한 조치는 아니다. 관세를 면제 받는 품목은 세부적으로 미국 내 ▲데이터센터용 ▲수리 및 교체용 ▲연구개발용 ▲스타트업용 ▲소비자 기기용 ▲공공부문 등으로, 사실상 내수용 제품이 대부분 포함된다. 트럼프 대통령은 미국을 경유해 다른 국가, 특히 중국으로 환적되는 최첨단 반도체에 관세를 부과하려는 것으로 풀이된다. 엔비디아 H200, AMD 325X 등이 대표적인 제품이다. 앞서 미 상무부는 전날 엔비디아 H200과 동급 제품 등의 중국·마카오 수출 정책을 기존의 '거부 추정' 방식에서 '사례별 심사' 방식으로 전환한다고 밝힌 바 있다. 대신 "미국 내 독립된 제3자 기관의 평가를 거쳐야 한다"는 조건을 달면서, 사실상 미국이 공급망을 관리하도록 했다. 윌 샤프 백악관 부속실장은 이번 조치에 대해 "미국으로 수입된 반도체 중 국내에서 AI와 컴퓨팅 인프라 구축에 사용되지 않는 제품에 25% 관세를 부과한다"며 "예를 들어 미국을 경유해 다른 국가로 환적되는 반도체도 25% 관세 대상이 된다"고 설명했다.

2026.01.15 10:24장경윤

데스크톱 PC용 그래픽카드, 올해는 정체 국면

올해 데스크톱 PC용 GPU 시장이 정체될 것으로 보인다. 주요 GPU 공급사가 AI, 데이터센터, 서버용 가속기 등 고부가가치 영역으로 우선순위를 옮기며 일반 소비자용 그래픽카드는 후순위로 밀려났다. 엔비디아, AMD는 올해 CES 2026에서 PC용 그래픽카드 새 제품이나 파생 제품을 공개하지 않았다. 인텔은 2024년 말 아크 B570/B580 GPU에 이어 성능을 높인 B770 GPU를 내부에서 테스트하고 있지만 출시가 현실화 될지는 미지수다. 엔비디아, 올해 일반 소비자용 GPU 전무 엔비디아는 일반 소비자용 GPU 출시 이후 일정 시간이 지나면 작동 클록을 높이고 메모리 탑재량을 늘린 '슈퍼' 시리즈를 추가 출시했다. 이는 제품 수명을 연장하고 경쟁사 대응력을 유지하기 위한 전통적인 전략이었다. 그러나 올해 CES에서는 신제품 출시가 없었다. 엔비디아가 CES 기간 중 PC용 새 GPU를 공개하지 못한 것은 2020년 이후 6년만에 처음이다. 엔비디아는 새 GPU 대신 DLSS 4.5 등 AI 기반으로 성능을 개선할 수 있는 기술을 전면에 내세웠다. 하드웨어 교체 없이 드라이버와 소프트웨어 개선으로 경쟁력을 유지하겠다는 의도로 보인다. AMD, 서버용 AI GPU 가속기 'MI455X'만 공개 AMD는 지난 해 3월 3세대 레이트레이싱 가속기와 2세대 AI 가속기를 내장한 라데온 RX 9070·9070 XT를 공개했다. 올해 CES 2026 기조연설에서는 서버용 인스팅트 MI455X AI GPU 가속기만 공개됐다. 인스팅트 MI455X는 연산에 특화된 AMD GPU 아키텍처인 CDNA 기반으로 설계됐다. 대규모 AI 모델 학습과 추론 작업을 처리하는 고대역폭 메모리 및 병렬 처리 성능을 MI355X 대비 최대 10배 강화했다. AMD 역시 엔비디아와 마찬가지로 CPU·GPU 실리콘 생산을 대만 TSMC에 위탁하고 있다. 생산 우선 순위를 인스팅트 GPU와 서버용 에픽 프로세서로 돌리면서 PC용 GPU 우선 순위도 내려갈 것으로 보인다. 인텔, '아크 B770' 물밑에서 꾸준히 테스트 인텔은 2024년 말 출시한 아크 B570/580 GPU 대비 더 많은 코어를 내는 고성능 제품인 아크 B770 GPU 출시 시기를 저울질하고 있다. 지난 해 6월 PCI-SIG가 관리하는 기기 고유 ID에 PCI 익스프레스 5.0 기반 기기 3개를 신규 등록했고 이들 기기 중 하나가 현재 출시된 제품 대비 고성능인 BMG-G31 GPU로 추정됐다. 각종 선적 자료에서 B770 관련 언급이 등장한 데 이어 최근 인텔 아크용 드라이버에서 BMG-G31 관련 펌웨어도 발견됐다. 정황상 인텔이 실제 제품을 내부에서 계속 테스트하는 것으로 추측되지만 실제 제품화 여부는 미지수다. 메모리 반도체 가격 상승으로 조립 PC 시장도 영향 올해 데스크톱 PC용 GPU 시장은 신제품 부족과 세대 교체 지연으로 인해 전반적인 정체가 예상된다. 여기에 작년 말부터 시작된 D램·SSD 가격 상승으로 데스크톱 PC용 그래픽카드 주요 수요처인 조립PC 시장 위축도 우려되고 있다. 데스크톱 GPU 분야에서는 기존 제품과 소프트웨어 업데이트 중심의 제한적인 변화가 이어질 가능성이 높다. 소비자 입장에서는 단기간 내 대대적인 업그레이드보다는 현 세대 제품을 활용하는 흐름이 지속될 전망이다.

2026.01.13 17:17권봉석

AMD "데스크톱용 라이젠 AI 400, AI PC 저변 넓힐 것"

[라스베이거스(미국)=권봉석 기자] "AMD가 5일(이하 현지시간) CES 2026 기조연설에서 공개한 AI PC용 새 프로세서, 라이젠 AI 400 시리즈(고르곤 포인트)는 단순한 세대 교체가 아니라 모바일과 데스크톱을 아우르는 하나의 통합 AI 플랫폼이다." 7일 오전, 라스베이거스 베니션 엑스포 내 미팅룸에서 기자단과 마주한 마이클 노드퀴스트 AMD 클라이언트 제품 마케팅 담당 부사장은 새로운 라이제 AI 400 시리즈 출시 의미를 이렇게 설명했다. 마이클 노드퀴스트 부사장은 이날 "불과 2~3년 전만 해도 클라우드에서만 쓸 수 있었던 AI 워크로드를 이제 PC에서 실행할 수 있는 시대가 됐다"며 "AMD의 목표는 AI를 비싼 PC에서 벗어나 더 많은 사람들에게 전달되도록 보편화하는 것"이라고 설명했다. "소켓 AM5 기반 라이젠 AI 400 시리즈, 2분기 출시" 라이젠 AI 400 시리즈는 기존 제품(라이젠 AI 300) 아키텍처 기반으로 메모리 속도와 작동 클록, GPU와 신경망처리장치(NPU) 등 전반적인 성능을 개선했다. 마이클 노드퀴스트 부사장은 "라이젠 AI 400 시리즈는 노트북 뿐만 아니라 데스크톱용 소켓 AM5 제품도 올 2분기부터 등장할 것"이라고 설명했다. 그는 메인보드 호환성과 관련해 "소켓 규격은 같을 수 있지만 전력 공급이나 메인보드 제조사 정책에 따라 지원 여부가 달라질 것이다. 또 개인 소비자를 위한 박스 제품이 아니라 PC 제조사에 주로 공급될 것"이라고 말했다. "기업용 라이젠 AI 400 프로, 성능·관리 편의성에 강점" AMD는 기업 시장을 겨냥해 관리 기능을 추가하고 보안을 강화한 프로세서인 '라이젠 AI 400 프로'도 PC 제조사에 공급 예정이다. 마이클 노드퀴스트 부사장은 "기업 고객이 가장 먼저 묻는 것은 여전히 성능"이라며 "라이젠 AI 400 프로는 SMT를 활용한 높은 멀티스레드 성능, 배터리 작동시 일정하게 유지되는 성능, 마이크로소프트 플루톤 등 보안 기능을 강점으로 들 수 있다"고 말했다. 그는 기업 시장 최대 경쟁사인 인텔을 겨냥해 "경쟁사는 세대별로 서로 다른 아키텍처와 소프트웨어 스택을 제공하지만 AMD는 라이젠 AI 200·300·400을 관통하는 일관된 구조로 기업 내 IT 관리자의 부담을 던다"고 말했다. "ROCm, 더 이상 서버 전유물 아냐" AMD는 4일 기조연설에서 AMD 인스팅트와 라데온 GPU, 라이젠 CPU를 활용해 AI 관련 처리를 수행할 수 있는 오픈소스 기반 프레임워크 'ROCm' 새 버전(7.2)을 이달 중 공개하겠다고 밝혔다. 마이클 노드퀴스트 부사장은 "ROCm은 이제 더 이상 서버나 고성능 GPU 가속기만 지원하지 않는다. 동일한 소프트웨어 스택을 서버와 데스크톱, 노트북(모바일)에 제공해 기업과 개발자 모두의 관리와 배포를 돕는다"고 설명했다. 이어 "새로운 아드레날린 소프트웨어에는 ROCm과 이미지 생성 프레임워크 '컴피UI'(ComfyUI)를 선택적으로 설치할 수 있는 기능이 포함된다. 복잡한 설치 과정을 단순화해 개발 진입 장벽을 크게 낮췄다"고 덧붙였다. "라이젠 AI 400·9000 X3D로 다양한 소비자 품는다" 마이클 노드퀴스트 부사장은 "라이젠 AI 400 시리즈는 저전력·고효율과 만족할 만한 성능을 원하는 소비자에게, 라이젠 9000/9000X3D 시리즈는 고성능을 원하는 게이머에게 다가갈 것"이라고 설명했다. 최근 AMD가 AI에 치중하며 데스크톱 PC와 게이밍 시장의 중요도가 상대적으로 낮아졌다는 의견에 그는 "데스크톱 PC와 게이밍은 AMD의 핵심이며 3D V캐시를 내장한 고성능 데스크톱 프로세서 출시는 계속될 것"이라고 답했다.

2026.01.09 08:49권봉석

글로벌 반도체 기업 CEO, 레노버 테크월드 기조연설에 총출동

[라스베이거스(미국)=권봉석 기자] 레노버가 6일(이하 현지시간) 저녁 라스베이거스 소재 대규모 전시장 '스피어'에서 진행한 테크월드 2026 기조연설에 글로벌 반도체 기업 CEO가 대거 등장해 눈길을 끈다. 이날 행사에는 CPU와 GPU, 인프라 등에서 레노버와 협력관계에 있는 굴지의 글로벌 IT 기업 CEO가 다수 참여해 최신 기술과 제품을 소개하고 향후 협력 방안을 공개했다. 립부 탄 인텔 CEO는 "레노버 최신 제품에 인텔 코어 울트라 시리즈3 프로세서가 폭넓게 적용되며 레노버와 인텔의 협업은 미래 PC 및 AI 경험 향상에 있어 중요한 이정표"라고 설명했다. 이어 "인텔은 레노버 하드웨어 로드맵에서 필수적인 역할을 하고 있으며 앞으로도 PC와 서버 시장에서 레노버 제품의 AI 성능과 제조 기술 향상에 기여할 것"이라고 덧붙였다. 리사 수 AMD CEO는 "AMD는 레노버와 긴밀히 협력해 AI 인프라/서버 라인업의 AI 추론과 고성능컴퓨팅(HPC) 지원을 강화할 것"이라고 설명했다. 이어 "AMD 서버용 에픽(EPYC) 프로세서 기반 서버 플랫폼은 다양한 AI 워크로드 처리에 도움을 줄 것"이라고 강조했다. 젠슨 황 엔비디아 CEO는 "최신 응용프로그램 구축시 핵심은 AI이며 기업들이 연구개발 예산을 AI 중심으로 이동시키고 있다"고 지적했다. 4일 진행된 CES 2026 기조연설에서 공개한 AI GPU '베라 루빈' 플랫폼과 관련해 그는 "베라 루빈 기반 AI 인프라는 IT 산업에서 중요한 역할을 담당할 것이며 레노버와 파트너십으로 AI 클라우드 인프라 구축 가속에 나설 것"이라고 밝혔다. 크리스티아노 아몬 퀄컴 CEO는 "스마트폰과 태블릿, PC 등 기존 기기 뿐만 아니라 지능형 웨어러블 등 새로운 기기 카테고리에서 퀄컴의 역할이 더욱 커질 것으로 기대한다"고 밝혔다. 그는 또 "퀄컴은 레노버와 모토로라를 포함한 다양한 제조사와 협력해 스냅드래곤 기반 기기들을 시장에 출시하고 사용자와 기기가 자연스럽게 상호작용하는 보다 스마트하고 직관적인 경험을 제공할 것"이라고 말했다.

2026.01.07 17:39권봉석

레노버, 테크월드 기조연설서 하이브리드 AI 시대 선언

[라스베이거스(미국)=권봉석 기자] 레노버가 6일(이하 현지시간) 저녁 라스베이거스 소재 대규모 전시장 '스피어'에서 테크월드 2026 기조연설을 진행하고 디바이스부터 인프라, 산업 협업까지 전방위 AI 비전을 제시했다. 레노버는 이날 개인화 AI 에이전트, AI PC와 스마트폰, 에이전트 네이티브 웨어러블 개념증명(PoC) 제품, 차세대 엔터프라이즈 AI 인프라를 대거 선보였다. 또 AI가 개인의 삶과 기업, 산업 전반에 어떻게 스며들고 있는지를 체감형으로 보여주는 데 초점을 맞췄다. 이날 행사에는 양위안칭 레노버 CEO를 비롯해 업계 리더와 주요 파트너들이 한자리에 모였다. 또 CPU와 GPU, 인프라 등에서 레노버와 협력관계에 있는 굴지의 글로벌 IT 기업 CEO가 다수 참여해 눈길을 끌었다. 레노버, 하이브리드 AI 전략에 '방점' 레노버가 이번 테크월드에서 가장 강하게 내세운 키워드는 클라우드와 온디바이스 AI를 결합한 '하이브리드 AI'다. 퍼블릭 모델과 프라이빗 모델, 온디바이스 AI를 유기적으로 결합해 성능과 보안, 확장성을 동시에 확보하겠다는 전략이다. 레노버는 수년간 축적한 AI 기술과 경험을 바탕으로, AI가 이제 개인화되고 인지하며 선제적으로 작동하고, 모든 환경에 존재하는 단계에 진입했다고 진단했다. 새로운 솔루션들은 개인과 조직의 특성에 맞춰 최적화되며, 디지털 트윈처럼 작동해 복잡한 활동을 조율한다. 레노버 생태계 넘나드는 에이전트 '키라' 공개 레노버는 이날 인텔·AMD·퀄컴 등 주요 반도체 제조사가 공급하는 최신 시스템반도체(SoC)를 탑재한 차세대 AI PC와 플래그십 스마트폰, 인지형 AI 펜던트와 스마트 글래스 콘셉트 등 다양한 AI 네이티브 디바이스를 공개했다. 씽크패드 롤러블 XD 콘셉트, 레노버 리전 프로 롤러블 콘셉트, AI 인지 컴패니언, 개인형 AI 허브 등 실험적 성격이 강한 각종 개념증명(PoC) 제품도 등장했다. 레노버가 모토로라와 공동으로 개발한 통합 개인화 AI 슈퍼 에이전트 '키라'(Qira)도 이날 처음 공개됐다. 키라는 PC, 스마트폰, 태블릿, 웨어러블 등 레노버 기기 전반을 넘나들며 작동한다. 레노버는 이를 '하나의 AI, 다수 기기'(one AI, multiple devices)' 비전의 구현 사례로 소개했다. 엔비디아와 협력해 'AI 기가팩토리' 공개 엔터프라이즈 영역에서는 AI 추론 성능을 대폭 강화한 새로운 씽크시스템과 씽크엣지 서버가 발표됐다. 레노버 하이브리드 AI 어드밴티지는 에이전틱 AI 서비스를 포함해 한 단계 진화했다. 레노버는 엔비디아와 협력해 '레노버 AI 클라우드 기가팩토리'를 선보이며, 기업 고객이 AI 모델 생성부터 실제 운영 환경 구축까지 신속하게 이어갈 수 있도록 지원한다는 계획을 밝혔다. 오는 6월 월드컵에 공식 기술 파트너로 참여 레노버는 국제축구연맹(피파) 공식 기술 파트너사로 참여해 오는 6월 11일부터 7월 19일까지 미국, 캐나다, 멕시코에서 진행되는 '2026 피파 월드컵'을 지원할 예정이다. 아울러 씽크패드, 씽크북, 요가, 리전, 모토로라 등 주요 제품 카테고리에서 월드컵을 테마로 한 한정판 기기도 출시 예정이다. 또한 포뮬러원(F1)과의 파트너십을 통해 레노버 넵튠(Neptune) 액체 냉각 기술을 글로벌 방송 인프라에 도입하고 안정성과 효율성을 높이겠다는 전략도 제시했다. 양위안칭 "AI, 인간 잠재력 한 차원 더 끌어올릴 것" 이날 양위안칭 레노버 CEO는 "AI는 우리의 언어와 습관, 기억을 학습하며 인간의 창의성과 직관을 증폭시키고 있다. 이는 인간의 잠재력을 한 차원 끌어올리는 근본적 변화"라고 강조했다. 그는 이어 “기업에 있어 AI는 단순한 프로세스 자동화를 넘어, 스스로 학습하고 혁신하는 '자기 재발명적 실체'로 진화하도록 지원하는 핵심 요소"라고 덧붙였다. 톨가 쿠르토글루 레노버 CTO는 "AI 슈퍼 에이전트는 매 순간 가장 적합한 모델을 선택해 성능과 보안, 비용을 동시에 최적화한다"며 "온디바이스부터 클라우드까지 연결되는 하이브리드 구조가 레노버 AI의 본질"이라고 밝혔다.

2026.01.07 17:17권봉석

'알파마요' 내놓은 엔비디아, 성장세 계속 이어질까

엔비디아가 미국 라스베이거스에서 열리고 있는 CES 2026에서 차세대 인공지능(AI) GPU '베라 루빈' 플랫폼, 자율주행 AI 모델 '알파마요' 등을 선보이며 시장의 주목을 받고 있다. 다만, 월가에서는 엔비디아의 폭발적 성장세가 지속될 수 있을 지를 두고 엇갈린 시각이 나오고 있다. 미국 경제포털 야후파이낸스는 6일(현지시간) 엔비디아의 향후 성장 전망을 둘러싼 월가 주요 분석가들의 상반된 전망을 보도했다. 웨드부시 증권의 댄 아이브스는 AI 시장에 대해 낙관적인 입장을 보였다. 그는 “AI가 거품이라고 생각해서 이 시장을 떠난다면, 라스베이거스에서 술을 너무 많이 마신 것”이라며 “현실은 AI 분야에 수조 달러 규모 자금이 투자되고 있다는 점”이라고 말했다. 아이브스의 발언은 젠슨 황 엔비디아 최고경영자(CEO)가 CES 2026에서 베라 루빈 플랫폼을 공개한 직후 나왔다. 베라 루빈은 올해 하반기 양산이 예정된 6종의 신규 칩으로 구성된 차세대 AI GPU 제품군이다. 올해 젠슨 황은 기조 연설에서 로봇, 자율주행차, 엣지 컴퓨팅 등 이른바 '피지컬 AI'에 초점을 맞췄다. 하지만 월가의 논쟁은 여전히 데이터센터 투자 사이클의 정점 여부에 집중되고 있다. 베라 루빈 공개에도 엇갈린 시선…”다음 성장세가 얼마나 빨리 올 지가 관건” 기술주 낙관론자로 알려진 아이브스는 지난해 말 엔비디아의 시가총액이 향후 12~18개월 내 6조 달러에 이를 수 있다고 전망한 바 있다. 반면 리서치 회사 DA 데이비슨의 길 루리아 분석가는 보다 신중한 접근이 필요하다고 지적했다. 엔비디아는 지난 2년간 AI GPU에 대한 폭발적인 수요에 힘입어 주가가 급등했다. 하지만 루리아는 데이터센터 수요가 정점에 근접하고 있다는 점을 주가에 반영되기 시작했다고 분석했다. 그는 “다음 성장 국면이 얼마나 빠르게 도래해 기존 수요 둔화를 만회할 수 있을지가 핵심”이라고 말했다. 루리아는 “엔비디아 주가가 저렴해 보이는 이유는 시장이 데이터센터 시장의 정점 가능성만을 가격에 반영하고 있기 때문”이라며 젠슨 황 CEO가 이미 '그 다음 단계'를 준비하고 있다고 평가했다. 그는 엔비디아가 GPU를 로봇과 자동차 등으로 확장하고 있다는 점을 언급하면서도 “궁극적인 관건은 타이밍”이라고 강조했다. 강력한 경쟁자 AMD도 변수 경쟁사들의 움직임도 무시할 수 없는 변수다. 리사 수 AMD CEO는 최근 연산 성능의 새로운 기준으로 '요타플롭(Yottaflop)'이라는 개념을 제시하며 차세대 AI 경쟁에 대한 의지를 드러냈다. 엔비디아가 여전히 AI 반도체 시장의 표준으로 평가받고 있지만, 아이브스는 “시장이 AMD가 AI 혁명의 다음 단계를 주도할 잠재력을 과소평가하고 있다”고 지적했다. 그는 “AMD는 AI 혁명의 다음 국면에서 핵심 플레이어가 될 것”이라면서도 “주가에는 이러한 가능성이 아직 충분히 반영되지 않았다”고 덧붙였다. 오픈AI, 1천억 달러 자금 조달 계획, 또 다른 변수 AI 열풍을 부추길 촉매제가 엔비디아 외부에서 등장할 가능성도 있다. 루리아는 오픈AI가 올해 3월 말까지 약 1천억 달러 규모 자금 조달을 추진하고 있다는 보도를 언급하며, 해당 목표가 달성될 경우 주요 기업들의 AI 인프라 투자가 한층 확대될 수 있다고 전망했다. 다만 그는 “이 자금 조달 목표는 다소 야심 찬 수준”이라며 신중한 태도를 유지했다. 자금 조달이계획에 미치지 않을 경우 엔비디아의 베라 루빈 칩에 대한 대규모 주문이 예상만큼 확실하지 않을 수도 있다고 예상했다.

2026.01.07 13:59이정현

AMD, 올해 투입할 베니스·MI455X 실제 제품 첫 공개

[라스베이거스(미국)=권봉석 기자] AMD가 5일(이하 현지시간) 오후 라스베이거스 팔라조에서 진행한 CES 2026 기조연설 중 서버용 프로세서 '베니스', 인스팅트 MI455X GPU 가속기 등 데이터센터용 신제품 실물을 최초 공개했다. 이날 리사 수 AMD CEO가 공개한 서버용 에픽(EPYC) 프로세서 '베니스'는 젠6(Zen 6) 아키텍처 기반으로 설계된 고성능 CPU 코어를 최대 256개 탑재 예정이다. 이를 통해 전세대 대비 다중작업과 데이터센터 처리 역량이 향상될 예정이다. 리사 수 CEO가 함께 공개한 인스팅트 MI455X AI GPU 가속기는 연산에 특화된 AMD GPU 아키텍처인 CDNA 기반으로 설계됐다. 대규모 AI 모델 학습과 추론 작업을 처리하는 고대역폭 메모리 및 병렬 처리 성능을 MI355X 대비 최대 10배 강화했다. AMD는 지난 해 공개한 개방형 표준 기반 데이터센터급 AI 랙 시스템 '헬리오스 AI 랙' 실물을 기조연설 관람객에게 선보였다. 헬리오스 AI 랙은 서버 CPU, GPU 및 고속 네트워킹을 하나의 랙 단위로 묶은 형태이며 특정 제조사가 아닌 개방형으로 다양한 하드웨어 제조사, 소프트웨어 생태계와 상호운용성을 높인 것이 특징이다. 헬리오스 AI 랙에 탑재되는 트레이는 인스팅트 MI455X GPU 4개, 베니스 프로세서 4개와 HBM4 메모리 432GB로 구성되며 수랭식 냉각 시스템을 적용했다. 리사 수 AMD CEO는 "헬리오스 AI 랙에 젠6 기반 베니스 코어 최대 4천600개, HBM4 메모리 31TB, 1만 8천 코어 GPU 등을 집약해 올해 안에 출시할 것"이라고 밝혔다. 이날 리사 수 AMD CEO는 "2027년 출시 예정인 인스팅트 MI500는 CDNA 6 아키텍처와 HBM4E 메모리 기반으로 대만 TSMC 2나노급(N2) 공정에서 생산 에정이며 현재 순조롭게 개발이 진행중"이라고 설명했다. 이어 "인스팅트 MI500은 4년 전 대비 AI 성능을 최대 1천 배 높일 것"이라고 설명했다.

2026.01.06 17:40권봉석

AMD, AI PC 겨냥 '라이젠 AI 400' 프로세서 공개

[라스베이거스(미국)=권봉석 기자] AMD가 5일(현지시간) AI PC와 워크스테이션, 게이밍 PC를 위한 새 프로세서를 공개하고 이달부터 공급에 들어간다고 밝혔다. AMD는 사전 브리핑에서 "AI 도입 확산에 따라 신경망처리장치(NPU) 내장 프로세서 기반 AI PC 수요도 확대되고 있으며 올해는 작년 대비 2.5배 많은 250개 이상의 AI PC 플랫폼이 등장할 것"이라고 설명했다. 이어 "라이젠 AI 프로세서는 문서 작성 시간을 종전 대비 절반으로 줄이는 한편 30초만에 새로운 이미지를 생성하고 코딩 시간을 1/5로 단축하는 등 소비자들에게 매일 새로운 경험을 제공하고 생산성을 높일 것"이라고 강조했다. 라이젠 AI 400, 60 TOPS급 NPU 내장 AMD가 이날 공개한 라이젠 AI 400 프로세서(고르곤 포인트)는 지난 해 출시된 라이젠 AI 300 프로세서 대비 CPU와 GPU, NPU 성능을 모두 강화했다. CPU는 젠5(Zen 5) 아키텍처 기반으로 최대 12코어, 24스레드로 구성되며 최대 작동 클록은 5.2GHz까지 높아졌다. 통합형 GPU인 라데온 그래픽스는 최대 16코어(CU) 구성으로 최대 작동 클록은 3.1GHz다. 내장 NPU는 XDNA 2 아키텍처 기반이며 최대 연산 성능은 60 TOPS(1초당 1조 번 연산)로 마이크로소프트 윈도11 코파일럿+ 기준을 충족한다. 메모리 작동 속도는 8533MHz까지 끌어올려 그래픽과 AI 처리 성능을 높였다. AMD는 자체 성능 측정 결과를 토대로 "최상위 제품인 라이젠 AI 9 HX 470 프로세서는 인텔 코어 울트라 288V(루나레이크) 대비 다중작업 성능은 1.3배, 콘텐츠 제작 성능은 1.7배, NPU 성능은 1.25배 높다"고 설명했다. 라이젠 AI 400 프로세서는 코어 수와 작동 클록, 캐시 메모리와 GPU/NPU 성능을 달리해 시장에 총 7종이 공급된다. 노트북과 데스크톱 PC 등 기존 전통적인 형태에 더해 키보드 일체형 초경량 PC에도 탑재된다. 고성능 노트북용 '라이젠 AI 맥스+' Soc 2종 추가 출시 AMD는 이날 콘텐츠 제작자와 AI 개발자, 게이머를 겨냥한 고성능 노트북 프로세서 '라이젠 AI 맥스+' 제품군도 확장하겠다고 밝혔다. AMD는 "라이젠 AI 맥스+는 콘텐츠 제작, 유명 게임 구동은 물론 128GB CPU·GPU 통합 메모리로 거대언어모델(LLM)을 처리할 수 있다. 엔비디아 개인용 AI 워크스테이션 'DGX 스파크' 대비 가격 대비 성능과 윈도 호환성에서도 우위에 있다"고 밝혔다. AMD는 올 1분기에 기존 출시 제품 대비 코어 수와 작동 클록, GPU 성능 등을 소폭 조정한 라이젠 AI 맥스+ 392(12코어/5.0GHz), 라이젠 AI 맥스+ 388(8코어/5.0GHz) 등 프로세서 2종을 추가 출시 예정이다. NPU 성능은 두 제품 모두 40 TOPS로 같다. 3D V캐시 탑재 '라이젠 7 9850X3D' 시장에 공급 AMD는 지난 해 게임 성능을 높일 수 있는 3D V캐시를 내장한 라이젠 9 9950X3D 프로세서 등을 시장에 출시했다. 경쟁 제품인 인텔 코어 울트라 200S 프로세서 대비 우위를 차지했고 이런 기조는 올 상반기까지 이어질 예정이다. AMD는 올 1분기에 최대 작동 클록을 더 높인 파생 제품인 라이젠 7 9850X3D를 시장에 추가 투입한다. 2024년 11월 출시된 전작(라이젠 7 9800X3D) 대비 최대 작동 클록을 400MHz 높인 5.6GHz까지 끌어올렸다. AMD는 주요 게임 35종을 1080p 해상도에서 구동한 자체 벤치마크 결과를 바탕으로 "라이젠 7 9850X3D 프로세서는 인텔 코어 울트라9 285K 프로세서 대비 평균 27% 더 나은 성능을 낸다"고 설명했다. AI 프레임워크 'ROCm 7.2' 이달 중 배포 ROCm은 AMD 인스팅트와 라데온 GPU, 라이젠 CPU를 활용해 AI 관련 처리를 수행할 수 있는 오픈소스 기반 프레임워크다. 2022년 2월 첫 버전인 ROCm 5가 출시됐고 작년 9월 출시된 ROCm 7에는 성능 향상과 인스팅트 MI350 등 새 하드웨어 지원을 추가했다. ROCm 7은 2023년 12월 공개된 ROCm 6 대비 추론 성능을 크게 강화했다. 메타 라마 3.1 700B 모델 연산 성능은 3.8배, 딥시크 R1은 3.4배 향상됐다. 또 단일 노드부터 멀티 노드·클러스터까지 분산 추론과 학습이 가능하도록 확장했다. AMD가 올 1월 중 배포할 새 버전인 ROCm 7.2는 라이젠 AI 400 시리즈 등 새 하드웨어 지원을 추가한다. 또 스테이블 디퓨전 기반 이미지 생성 도구인 '컴피UI'(Comfy UI)를 통합 지원 예정이다.

2026.01.06 12:30권봉석

글로벌 빅테크 거물들, 새해 벽두 'CES 2026' 총출동

새해 벽두부터 미국 네바다 주 라스베이거스에서 열리는 세계 최대 IT·가전 전시회 'CES 2026'에 글로벌 반도체 기업과 PC 제조사가 집결한다. 올 상반기를 시작으로 시장에 투입할 AI PC 관련 신제품과 전략을 공개할 예정이다. 오는 5일(현지시간)에는 퀄컴과 인텔, AMD와 엔비디아 기조연설이 예정됐다. 6일 저녁에는 세계 1위 PC 기업인 레노버가 대형 공연장 '스피어'에서 테크월드 기조연설을 진행한다. 각 회사는 시스템반도체(SoC)와 CPU, GPU, NPU 전반에서 초당 수십~수백 TOPS에 이르는 AI 연산 능력을 강조할 예정이다. 온디바이스 AI 구현을 위한 하드웨어 경쟁이 한층 가속화되는 모습이다. 퀄컴, 스냅드래곤 X2 엘리트 정식 출시 퀄컴은 오는 5일(이하 현지시간) 오전 윈(Wynn) 호텔에서 AI PC용 시스템반도체(SoC)인 스냅드래곤 X2 엘리트 정식 출시 행사를 진행한다. 스냅드래곤 X2 엘리트는 작년 9월 퀄컴 연례 기술행사 '스냅드래곤 서밋'에서 공개됐다. 대만 TSMC 3나노급(N3X) 공정에서 생산되며 전 세대 제품 '스냅드래곤 X 엘리트' 대비 최대 18개 코어로 구성된 오라이언(Oryon) CPU를 내장했다. 스냅드래곤 X2 엘리트가 내세운 가장 큰 무기는 바로 80 TOPS(1초당 1조번 연산) 성능을 갖춘 신경망처리장치(NPU)다. 전세대(45 TOPS) 대비 2배 가까이 성능이 향상됐다. 레노버, 삼성전자 등 국내외 주요 PC 제조사가 스냅드래곤 X2 엘리트 탑재 PC를 1분기부터 출시 예정이다. 인텔, 코어 울트라 시리즈3 정식 공개 5일 오후에는 인텔이 베니션 호텔에서 AI PC 시장을 겨냥해 개발한 모바일(노트북)용 제품인 코어 울트라 시리즈3(팬서레이크) 출시 행사를 진행한다. 코어 울트라 시리즈3는 1.8나노급 인텔 18A 공정에서 생산한 컴퓨트 타일(CPU)과 Xe3 GPU, 신경망처리장치(NPU)를 결합했다. 전력 소모를 줄이며 처리 속도를 높일 수 있는 새 트랜지스터 구조인 리본펫, 전력 전달 회로를 CPU 다이(Die) 아래로 배치한 파워비아 구조를 적용했다. 코어 울트라 시리즈3는 GPU와 NPU 성능을 높여 AI 처리 성능 향상에 큰 중점을 뒀다. Xe3 12 코어 구성시 최대 120 TOPS 연산이 가능하며 NPU 5는 최대 50 TOPS 연산이 가능하다. 이를 탑재한 PC는 이달 말부터 국내 포함 전세계 시장에 출시된다. 엔비디아·AMD도 5일 CEO 기조연설 예정 엔비디아는 5일 오후 젠슨 황 CEO가 진행하는 CES 기조연설을 진행한다. 지난 해 CES에서 일반 PC용 지포스 RTX 50 시리즈 GPU를 공개했지만 올해는 서버용 AI GPU 신제품 '루빈'(Rubin)에 대한 테마가 주를 이룰 것으로 보인다. AMD는 같은 날 저녁 베니션 호텔에서 리사 수 CEO의 CES 2026 기조연설을 진행한다. AMD는 이 행사에서 AI PC 시장을 겨냥해 GPU 성능을 보강한 라이젠 AI 400(가칭) 프로세서, 데스크톱 PC용 프로세서 등을 공개할 전망이다. 레노버, 6일 저녁 '스피어'에서 기조 연설 IDC, 가트너 등 시장조사업체 기준 출하량 1위 회사인 레노버는 6일 저녁 라스베이거스 소재 초대형 공연장 '스피어'에서 신기술과 제품, 솔루션 공개 행사 '테크월드' 기조연설을 진행한다. 기조연설에는 양위안칭 레노버 CEO가 직접 나서 AI, 디바이스, 인프라, 서비스의 융합을 통해 레노버가 어떻게 미래를 정의하고 있는지 공개할 예정이다. 또 포뮬러 원(F1)과 2026 FIFA 월드컵 기술 파트너인 레노버의 혁신도 공개한다. 행사에는 젠슨 황 엔비디아 CEO, 립부 탄 인텔 CEO, 리사 수 AMD CEO, 크리스티아노 아몬 퀄컴 CEO 등 PC·서버용 프로세서와 GPU 공급사, 지아니 인판티노 피파 회장 등도 등장 예정이다.

2026.01.04 09:29권봉석

AI PC 확산 본격화... 새해도 GPU·NPU 성능 경쟁 예고

2025년은 한국 ICT 산업에 '성장 둔화'와 '기술 대격변'이 공존한 해였다. 시장 침체 속에서도 AI에너지로봇반도체 등 미래 산업은 위기 속 새 기회를 만들었고, 플랫폼소프트웨어모빌리티유통금융 등은 비즈니스 모델의 전환을 꾀했다. 분야별 올해 성과와 과제를 정리하고, AI 대전환으로 병오년(丙午年) 더 힘차게 도약할 우리 ICT 산업의 미래를 전망한다[편집자주] 2025년 PC 산업은 신경망처리장치(NPU)를 앞세운 로컬 AI 구동과 각종 편의기능 구현, 윈도10 지원 종료를 핵심 동력으로 삼아 전진했다. IDC, 가트너 등 주요 시장조사업체는 올해 출하량이 2024년 대비 5% 내외 증가할 것으로 내다봤다. 새해 역시 GPU와 NPU 성능 강화를 앞세운 AI PC 보급에 따라 기업 시장의 생산성 향상, 콘텐츠 제작, 엔터프라이즈 응용프로그램 확산 등이 기대된다. 또 클라우드 의존성을 낮춘 로컬 AI 실행 및 보안 강화도 더 많은 소비자의 관심을 끌 전망이다. 그러나 올해 11월부터 시작된 메모리 반도체 수급난이 AI PC의 판매와 보급 확대에도 적지 않은 영향을 미칠 것으로 보인다. 주요 글로벌 제조사들은 기존 제품 가격은 그대로 유지하며 새해 출시할 신제품 가격을 올리는 방안을 검토중이다. 올해 NPU 탑재 PC용 프로세서 대거 등장 올해 인텔, AMD, 퀄컴 등 주요 PC용 프로세서 제조사들은 거의 모든 신제품에 NPU를 내장한 프로세서를 출시했다. 인텔은 데스크톱 PC·노트북용 코어 울트라 시리즈2 프로세서, AMD는 라이젠 AI 프로세서에 NPU를 내장했다. 퀄컴은 PC용 스냅드래곤 X 엘리트에 40 TOPS(1초당 1조 번 연산) 급 NPU를 앞세웠다. NPU는 배경 흐림, 소음 감소, 보안 강화, 상시 구동이 필요한 각종 기능을 GPU 대비 저전력으로 실행하면서 지연 시간 단축 등을 실현한다. 이를 통해 클라우드에 의존하지 않는 다양한 AI 기능을 실행할 수 있게 됐다. 새해도 GPU·NPU 성능 경쟁 치열 새해 PC 시장은 AI 처리 능력 강화를 두고 GPU와 NPU 강화 흐름이 더 거세질 것으로 보인다. 단 GPU와 NPU 중 어느 쪽에 중점을 둘 것인지는 강점을 지닌 IP 포트폴리오가 서로 다른 회사마다 차이가 있다. 인텔과 AMD등 전통적인 x86 기반 프로세서 제조사는 게임 성능과 AI 성능을 동시에 높일 수 있는 GPU에 중점을 뒀다. 새해 본격 출시될 코어 울트라 시리즈3 프로세서 내장 GPU는 120 TOPS, NPU는 50 TOPS급이다. 퀄컴이 새해 공급할 스냅드래곤 X2 엘리트/엘리트 익스트림은 전 세대 대비 두 배 가까운 80 TOPS급 NPU를 탑재한다. 주요 연산을 저전력 NPU로 처리해 배터리 지속시간이 중요한 노트북 분야에서 경쟁력을 확보하겠다는 것이다. 다만 올 11월 이후 심화된 D램·SSD(낸드 플래시메모리) 등 메모리 반도체 수급난은 AI PC 보급에 적지 않은 변수가 될 것으로 보인다. 제조 원가 상승은 물론 출하량 감소도 예상되는 상황이다. 메모리 반도체 수급난, PC 출하량·가격 전체에 영향 IDC는 이달 중순 발표한 보고서에서 "최악의 경우 새해 PC 출하량이 올해 대비 8.9% 줄어들고 가격 상승 압박도 커질 것"이라고 설명했다. 또 이런 메모리 반도체 수급난이 AI PC에 더 큰 영향을 줄 것이라고 설명했다. IDC는 "AI PC는 소형언어모델(SLM)과 대형언어모델(LLM)을 PC 메모리에 바로 올려 실행해야 하기 때문에 기존 PC 대비 메모리를 더 많이 쓴다. 많은 고성능 시스템이 32GB 이상 메모리로 옮겨갈 것이며 원가와 출하량 관련 압박도 커질 것"이라고 설명했다. 글로벌 PC 제조사 국내 법인 관계자들도 "원가 부담이 더해진 탓에 이득을 줄이면서 판매 대수를 늘리는 행사를 진행하기 어려워졌다. 출고가·권장판매가와 실제 시장가의 차이도 급속히 줄어들 것"이라고 내다봤다. AI 처리의 중심을 클라우드 대신 PC나 하이브리드 환경으로 옮기려는 주요 PC 제조사의 계획도 지연될 가능성이 있다. 웹 기반으로 구동되는 클라우드 기반 각종 서비스는 접속하는 PC 성능에 큰 영향을 받지 않기 때문이다.

2025.12.31 10:13권봉석

AMD, 차세대 아키텍처 '젠6'서 구조적 전환 예고

AMD가 최근 개발자용 문서를 통해 내년 6월께 투입할 차세대 CPU 아키텍처 '젠6'(Zen 6)의 일부 특성을 공개했다. 젠6 기반 PC·서버·데이터센터용 프로세서 출시까지 반 년 이상 남아 있지만 구조적 변화에 따른 상당한 성능 향상이 예상된다. 이번에 공개된 자료는 프로세서 내부 동작을 분석하고 성능을 측정하는 개발자와 소프트웨어 엔지니어를 위한 문서다. 이를 통해 차세대 아키텍처의 설계 방향을 간접적으로 확인할 수 있다. AMD는 내년 젠6 기반 PC·서버용 프로세서를 시장에 투입할 예정이다. 이미 지난 6월 연례 기술행사 '어드밴싱 AI 2025' 행사에서는 젠6 기반 서버용 에픽 프로세서 '베니스'(Venice)의 일부 제원이 공개되며 차세대 제품 로드맵이 공식화된 바 있다. AMD, 2016년 젠1 공개 이후 지속 성능 개선 AMD는 2014년 리사 수 CEO 취임 이후 경쟁력 확보를 위해 프로세서 설계 전문가 짐 켈러(현 텐스토렌트 CEO) 등을 영입하고 완전히 새로운 CPU 아키텍처 '젠'(Zen)을 설계했다. 젠 아키텍처는 PC용 프로세서 '라이젠', 서버용 프로세서 '에픽' 등 모든 AMD x86 프로세서의 기반으로 자리 잡았다. AMD는 2016년 젠1을 시작으로 2년 간격으로 새로운 젠 아키텍처를 공개하며 IPC(클록당 명령어 처리량)와 전력 효율을 꾸준히 개선했다. 현재 최신 아키텍처는 2024년 공개된 젠5이며, 일부 보급형 노트북이나 임베디드 프로세서에는 젠4(2022년)도 여전히 활용되고 있다. 젠6는 이러한 연속적 개선 흐름 속에서 등장하는 차세대 아키텍처다. 젠6 프로세서 성능 측정 위한 개발자용 문서 공개 AMD가 지난 12일자로 공개한 문서는 개발자 대상으로 프로세서 작동 시 성능 측정 지표를 수집하기 위한 자료다. 코어 활용률, 캐시 적중률, 명령 실행 특성 등을 분석할 수 있는 '성능 모니터 카운터'(PMC) 관련 내용이 담겼다. 문서는 젠6 아키텍처를 상세히 설명하지는 않는다. 그러나 성능 측정 항목에 포함된 내용을 바탕으로 젠6 기반 CPU 코어의 처리 능력을 어느 정도 짐작할 수 있다. 명령 처리 폭 확장·벡터 연산 성능 강화 시사 문서에 따르면 젠6는 현행 아키텍처인 젠4·젠5 대비 명령 처리 폭을 확장한 새로운 코어 구조를 적용했다. 가장 큰 변화는 실행 명령어를 동시에 불러와 처리할 수 있는 디스패치(dispatch) 능력의 확대다. 현행 젠5 아키텍처는 한 사이클에 최대 6개 명령어를 디스패치할 수 있지만, 젠6 코어는 이를 최대 8개까지 확장했다. 명령 처리 폭 확대는 게임 등 단일 스레드 작업, 여러 작업이 동시에 실행되는 고부하 작업의 처리 효율 개선으로 이어질 수 있다. 젠6 아키텍처는 AI, 그래픽스, 과학 연산 등에 활용되는 벡터 연산 관련 성능도 강화한 것으로 보인다. 문서에 따르면 젠6 기반 프로세서는 FP64/32/16(부동소수점 64/32/16비트), BF16 자료형을 모두 지원하는 AVX-512 명령어를 실행할 수 있다. AI 연산에 주로 쓰이는 행렬 관련 연산인 FMA(곱셈·덧셈 동시처리), MAC(가중합) 연산과 부동소수점과 정수 연산이 혼합된 벡터 처리(VNNI 계열 연산, AES, SHA 등)도 함께 지원한다. 이르면 내년 6월경 세부 내용 공개 전망 AMD는 내년부터 대만 TSMC의 2나노급(N2) 공정을 활용해 차세대 서버 프로세서 '베니스'(Venice)를 생산·공급할 예정이다. AMD는 베니스가 프로세서당 최대 256개 코어를 탑재하고, 젠5 대비 최대 1.7배 성능 향상을 달성하는 것을 목표로 하고 있다. 젠6 아키텍처의 보다 구체적인 기술 정보는 내년 6월 전후 공개될 가능성이 크다. 6월 초에는 대만에서 동아시아 최대 ICT 전시회 '컴퓨텍스 타이베이 2026'이 열릴 예정이다. 또 같은 달 중순에는 AMD의 연례 기술 행사 '어드밴싱 AI'가 예정돼 있어 관련 발표가 이어질 것으로 전망된다.

2025.12.23 14:58권봉석

AMD "ROCm 7, 성능·확장성 강화"...개방형 AI 스택 보급 가속

"AMD가 추구하는 ROCm은 단순한 AI 라이브러리가 아니라 개방성과 포용성을 담은 하나의 철학이다. 특정 활용 사례에 대해 솔루션을 공급하거나 제시하지는 않으며 모든 것을 갖추지도 않았다. 그러나 AMD와 함께 하는 개발자와 AI의 미래를 만들 수 있다." 지난 12일 오전 국내 기자단과 온라인으로 진행한 인터뷰에서 아누쉬 엘랑고반 AMD AI 소프트웨어 부문 총괄부사장은 AI 기술 개발 방향에 대해 이같이 설명했다. ROCm은 AMD 인스팅트와 라데온 GPU를 활용해 AI 관련 처리를 수행할 수 있는 오픈소스 기반 프레임워크다. 2022년 2월 첫 버전인 ROCm 5가 출시됐고 올해 9월 출시된 ROCm 7에는 성능 향상과 인스팅트 MI350 등 새 하드웨어 지원을 추가했다. 이날 아누쉬 엘랑고반 총괄부사장은 "ROCm은 오픈소스 기반으로 누구나 커뮤니티에 기여해 성능과 효율을 높일 수 있다. 엔비디아 쿠다(CUDA), 인텔 원API 등 경쟁사의 폐쇄적인 프레임워크 대비 개선점을 모두 누릴 수 있다"고 강조했다. "ROCm 7, 성능·확장성 강화" ROCm 7은 2023년 12월 공개된 ROCm 6 대비 추론 성능을 크게 강화했다. 메타 라마 3.1 700B 모델 연산 성능은 3.8배, 딥시크 R1은 3.4배 향상됐다. 또 단일 노드부터 멀티 노드·클러스터까지 분산 추론과 학습이 가능하도록 확장했다. 아누쉬 엘랑고반 총괄부사장은 "성능 향상은 알고리듬, 오퍼레이터, 커널 퓨전 등 소프트웨어 스택 전반에서 최적화를 진행한 결과이며 동일한 하드웨어에서도 추론과 학습 성능이 눈에 띄게 개선됐다. 전력 효율과 총소유비용(TCO) 측면에서도 경쟁력을 확보했다"고 설명했다. 서버용 인스팅트 GPU 뿐만 아니라 라데온 RX 등 RDNA 아키텍처 기반 GPU, 노트북용 라이젠 맥스에 포함된 GPU도 지원한다. 모바일 워크스테이션이나 노트북에서도 클라우드 없는 거대언어모델(LLM) 추론이 가능해졌다. "최신 AI 모델 개발 단계부터 협업, 출시 당일 지원" AMD는 ROCm의 성능과 호환성을 강화하기 위해 새 AI 모델 출시 당일부터 이를 지원하는 '데이제로'(Day-0) 모델 지원을 내세웠다. 아누쉬 엘랑고반 총괄부사장은 "오픈AI, 메타, 딥시크 등 주요 AI 모델 개발사와 협력을 강화하고 있다. 내부 조직인 '프론티어 랩'을 중심으로 모델 설계 단계부터 협력해 출시 당일부터 AMD GPU를 활용할 수 있도록 했다"고 밝혔다. 이어 "출시 이후에는 성능 최적화와 미세 조정을 위한 소프트웨어 도구를 개발자와 실사용자에게 공급한다"고 설명했다. ROCm의 개방성은 vLLM, SGLANG, 파이토치 등 주요 오픈소스 프레임워크와의 빠른 통합으로 이어지고 있다. 아누쉬 엘랑고반 부사장은 "폐쇄적인 생태계보다 훨씬 빠르게 진화하며 조그만 개선이 모든 사람에게 긍정적인 영향을 미친다는 점이 ROCm의 가장 큰 강점"이라고 말했다. 우분투 리눅스 통합·윈도 운영체제 지원 강화 AMD는 이달 초 우분투 리눅스를 관리하는 캐노니컬과의 협력을 통해 ROCm을 우분투에 공식 통합했다. 아누쉬 엘랑고반 부사장은 "과거 우분투 커뮤니티에서 프로젝트 중심으로 지원하던 것과 달리 이제는 명령어 한 줄로 쉽게 설치할 수 있다"고 설명했다. ROCm 최초 출시 이후 수 차례 지적됐던 윈도 운영체제 호환성도 ROCm 7 출시 이후 개선됐다. 아누쉬 엘랑고반 부사장은 "ROCm에서 윈도 운영체제는 1등 시민이며 AMD 역시 윈도 지원을 중요하게 여기고 있다"고 설명했다. 최신 기능을 가장 빨리 통합하는 나이틀리(nightly) 빌드가 리눅스와 윈도 운영체제용으로 모두 제공된다. 윈도 환경에서 ROCm과 AMD GPU를 활용하려는 개발자들이 이를 활용해 개발 과정을 단축할 수 있게 됐다. 국내 AI 스타트업과 ROCm 생태계 확대 위한 협업 강화 AMD는 ROCm 생태계 확장과 관련해 AI 스타트업 '모레'(Moreh), 카카오엔터프라이즈, 망고부스트 등 국내 기업과도 협업을 강화하고 있다. 카카오엔터프라이즈는 지난 6월 4세대 에픽 프로세서 기반 클라우드 컴퓨팅 서비스 'BCS m3az' 인스턴스를 출시하고 추론·학습 환경 모두에서 성능 최적화·비용 효율화를 달성했다. 아누쉬 엘랑고반 부사장은 "망고부스트가 인스팅트 MI300X GPU와 ROCm을 활용해 개발한 AI 추론 최적화 소프트웨어 '망고 LLM부스트'는 글로벌 AI 성능 평가 벤치마크인 ML퍼프(MLPerf) 추론 5.0에서 새로운 기록을 달성하기도 했다"고 소개했다. 개발자 클라우드로 접근성 강화..."더 다양한 곳에서 쓰이기 희망" AMD는 고성능 CPU·GPU 접근이 어려운 스타트업이나 학생 등 개발자 대상으로 별도 개발자 클라우드도 운영하고 있다. 개발자와 오픈소스 기여자에게는 일정 시간을 무료로 쓸 수 있는 크레딧을 제공한다. 아누쉬 엘랑고반 총괄부사장은 "누구나 깃허브 계정만 있으면 인스팅트 GPU를 체험할 수 있도록 지원하고, 교육 프로그램·해커톤·대학 협업을 통해 ROCm 전문 인력 양성에도 힘을 쏟고 있다"고 설명했다. 이어 "AMD 하드웨어가 많은 곳에서 쓰이는 것처럼 ROCm도 보다 다양한 곳에서 쓰이길 바란다. 저수준 하드웨어부터 엔터프라이즈급 클러스터를 통한 추론, 배포 등 누구나 선호하는 개방형 AI 스택으로 만드는 것이 목표"라고 덧붙였다.

2025.12.15 13:43권봉석

AMD, 인프라 시장 겨냥 에픽 임베디드 2005 프로세서 출시

AMD가 9일(미국 현지시간) 차세대 임베디드 인프라 시장을 겨냥한 '에픽 임베디드 2005' 시리즈 프로세서를 공개했다. 에픽 임베디드 2005 시리즈는 젠5(Zen 5) 아키텍처 기반으로 8코어, 2.8GHz(2435), 12코어, 2.7GHz(2655), 16코어, 3GHz(2875) 등 총 3개 제품군으로 공급된다. 네트워킹 스위치와 라우터, DPU 제어부, 콜드 클라우드 스토리지, 항공우주 및 로보틱스까지 확장되는 AI 기반 워크로드 수요에 대응하기 위한 제품으로, 높은 연산 밀도와 전력 효율, 장기 안정성을 소형 폼팩터에서 제공하는 것이 특징이다. 기판과 밀착되는 40×40mm 볼그리드어레이(BGA) 패키지를 적용해 인텔 제온 6500P-B(77.5×50mm) 대비 60% 가량 적은 설계 면적으로 시스템 제조 비용과 공간 효율성을 동시에 높였다. 핀이나 접점 대신 기판에 밀착되므로 신호 무결성 개선, 더 짧은 전기 경로, 고밀도 I/O 구성이 가능해 고집적 네트워킹 및 스토리지 장비에 적합하다. PCI 익스프레스 5.0 레인은 28개로 고성능 네트워크 카드와 외부 기기 통합이 가능하며 리눅스 커널 드라이버, Yocto, EDK II 등 오픈소스 생태계 지원도 강화했다. 24시간 상시 구동 환경을 전제로 설계됐고 플랫폼 시큐어 부트, 메모리 암호화 기술 등을 포함한 인피니티 가드 기술을 지원한다. 부품 공급과 기술 지원은 10년간, 소프트웨어 유지보수는 15년간 제공한다.

2025.12.10 14:41권봉석

트럼프 "엔비디아 H200 中 수출 허용"…HBM 수요 촉진 기대

미국 정부가 엔비디아의 고성능 인공지능(AI) 반도체 'H(호퍼)200' 수출을 허가하기로 했다. 도널드 트럼프 미국 대통령은 8일(현지시간) SNS 트루스소셜을 통해 "미국 국가안보 유지 조건 하에, 엔비디아가 중국 및 다른 국가의 승인된 고객에 H200을 공급하는 것을 허용할 것이라고 시진핑 중국 국가주석에게 통보했다"며 "시 주석도 긍정적으로 반응했다"고 밝혔다. H200은 엔비디아가 지난해 본격 양산한 AI 반도체다. 최신 세대인 '블랙웰' 시리즈보다는 구형이지만, 매우 강력한 데이터 처리 성능을 자랑한다. 특히 일부 AI 기능이 엔비디아가 중국 시장을 겨냥해 만들었던 H20의 6배를 웃도는 것으로 알려져 있다. 엔비디아는 지난 2022년 미국의 규제로 AI 반도체를 중국에 수출할 수 없게 되자, AI반도체인 H100의 성능을 대폭 낮춰 H20을 개발한 바 있다. 트럼프 대통령의 결정으로, 엔비디아는 H200 판매액의 25%를 미국에 지급하는 조건으로 수출을 재개할 것으로 예상된다. 다만 블랙웰이나 엔비디아가 내년 출시할 '루빈' 칩 등은 이번 계약에 포함되지 않는다. 또한 트럼프 대통령은 “상무부가 세부 사항을 조율하고 있다"며 "AMD, 인텔 등 다른 미국 기업들에도 이러한 접근 방식이 적용될 것"이라고 밝혔다. 로이터통신은 이에 대해 "트럼프 대통령이 최신형 칩인 블랙웰 칩의 중국 수출을 허가하거나, 아예 칩 수출을 막는 방안 사이의 타엽한을 낸 것으로 보인다"고 논평했다. H200의 수출 재개는 삼성전자, SK하이닉스 등 국내 메모리 기업들의 HBM 수요를 촉진할 수 있을 것으로 관측된다. H200은 HBM3E 8단 제품을 탑재한다. 현재 HBM은 HBM3E 12단까지 상용화된 상태로, 내년부터는 HBM4 양산이 본격화된다.

2025.12.09 08:31장경윤

美 상원, 엔비디아 AI칩 中 수출 차단 법안 발의

미국 상원 소속 초당적 의원들이 엔비디아·AMD 등 미국산 고급 AI 칩의 중국 등 적대국 수출을 2년 반 동안 사실상 봉쇄하는 법안인 '세이프 칩스 액트(SAFE CHIPS Act)'를 공개했다고 로이터가 4일(현지시간) 보도했다. 이 법안은 미국 행정부가 해당 AI 칩 수출 규제를 완화하지 못하도록 막는 것이 핵심이다. 새 법안은 미국 상무부가 현재 허용된 수준보다 성능이 뛰어난 AI 칩을 중국·러시아·이란·북한에 수출하려 할 경우, 라이선스를 승인하지 못하도록 한다. 적용 기간은 30개월이다. 이후 상무부가 규제 완화를 제안할 경우, 반드시 시행 한 달 전에 의회에 사전 보고해야 한다. 상원에서 발의한 주체는 공화당의 피트 리켓츠 의원과 민주당의 크리스 쿤스 의원. 공화당 내 대표적인 대중 강경파인 톰 코튼 등도 동참하며, 트럼프 행정부의 수출 규제 완화 움직임에 제동을 건 모양새다. 공화·민주 양당이 함께 나선 점이 이례적이라는 평가다. 리켓츠 의원은 “미국산 최고의 AI 칩을 중국에 넘기는 것을 막는 일은 국가 안보에 필수적”이라고 강조했다. 이번 법안 발의는 최근 행정부가 중국에 대한 AI 칩 수출 규제를 사실상 완화하려 한다는 보도가 나온 직후 나왔다. 특히 엔비디아가 최신 세대 GPU인 H200의 중국 수출 허가를 검토 중이라는 보도가 배경이 됐다. 이를 두고 미국 내에서는 중국이 해당 칩을 군사, 감시 등에 활용할 수 있다는 우려가 제기돼 왔다. 한편, 이번 입법 움직임은 같은 날 보도된 AMD의 AI 반도체 MI 308 중국 수출 허용 및 이에 따른 15% 수출료 부과 움직임과 직접적으로 맞물린다.

2025.12.05 15:55전화평

"AI 데이터센터 혁신"…HPE, AMD·브로드컴 손잡고 '헬리오스' AI 랙 출시

HPE가 AMD, 브로드컴 손잡고 업계 최초로 통합 스케일업 이더넷 네트워킹을 탑재한 인프라를 구축했다. HPE는 'AMD 헬리오스(Helios) 인공지능(AI) 랙 스케일 아키텍처'를 공개했다고 4일 밝혔다. 해당 아키텍처는 조 단위 파라미터의 AI 학습과 대규모 추론을 위한 단일 턴키 랙을 제공해 클라우드 서비스 제공업체(CSP)의 AI 배포 속도를 올릴 수 있다. 표준 기반 이더넷과 HPE 주니퍼 네트워킹의 전용 스위치·소프트웨어(SW)를 결합해 AI 워크로드 성능과 유연성, 에너지 효율성을 강화한 것이 특징이다. 특히 FP4 기준 최대 2.9 AI 엑사플롭스와 초당 260테라바이트(TB)의 통합 스케일업 대역폭을 제공해 거대 모델 학습에서 발생하는 트래픽을 효율적으로 지원한다. HPE는 개방형 울트라 엑셀러레이터 링크 오버 이더넷(UALoE) 표준 기반으로 업계 표준 중심의 대규모 AI 워크로드를 위한 통합 플랫폼을 구축했다. 이 솔루션은 랙당 72개의 AMD 인스팅트 MI455X 그래픽처리장치(GPU)를 연결하며, 가장 까다로운 AI·고성능 컴퓨팅(HPC) 워크로드를 위해 31TB 용량의 4세대 고대역폭메모리(HBM4)를 갖췄다. HPE 서비스 팀의 직접 액체냉각 인프라·엑사스케일급 구축 경험을 바탕으로, 높은 서비스성과 에너지 효율성까지 확보했다. HPE는 이 턴키 랙 스케일 솔루션을 제공하는 최초의 기업 중 하나가 될 예정이다. HPE는 AMD '헬리오스' 아키텍처를 위해 특별히 설계된 스케일업 이더넷 스위치·SW로 'AI용 네트워크' 솔루션을 확장했다. 브로드컴과 협력해 개발된 이 신규 솔루션은 표준 이더넷을 통해 AI 워크로드에 최적화된 성능을 제공하는 최초의 스케일업 스위치다. 이는 AI 네이티브 자동화 및 보장 기능을 활용해 네트워크 운영을 간소화함으로써 더 빠른 배포와 전반적인 비용 절감을 실현한다. 이 아키텍처는 오픈 컴퓨트 프로젝트(OCP)의 오픈 랙 와이드(ORW) 사양을 기반으로 구축됐다. 실용적인 설계와 전력·에너지 효율적인 수냉 방식을 제공하는 기능을 갖췄다. 또 오픈 소스 AMD ROCm와 AMD 펜산도 네트워킹 기술을 활용해 혁신을 가속화하고 총소유비용(TCO) 절감을 돕는다. 이더넷 기반의 HPE 주니퍼 네트워킹 스위치는 개방적이고 검증된 통신 표준을 기반으로 해 벤더 종속성을 최소화한다. 안토니오 네리 HPE 회장 겸 최고경영자(CEO)는 "CSP 고객들에게 더 빠른 배포, 더 유연한 확장성, 더 낮은 리스크를 제공할 것"이라며 "표준 이더넷으로 강력한 AI 데이터센터 구축을 지원함으로써 고객에게 더 많은 선택권과 유연성, 뛰어난 확장성을 제공하는 것이 목표"라고 강조했다.

2025.12.04 17:20김미정

슈퍼마이크로, 'AMD MI355X' 탑재 공냉식 서버 출시…AI 포트폴리오 확대

슈퍼마이크로가 AMD의 그래픽처리장치(GPU)를 탑재한 차세대 서버 제품군을 선보이며 인공지능(AI) 워크로드 성능 강화 포트폴리오를 확대한다. 슈퍼마이크로는 'AMD 인스팅트 MI355X' GPU 탑재 10U 공냉식 서버를 출시했다고 20일 밝혔다. 이번 솔루션은 AMD 인스팅트 MI355X GPU의 고성능을 공냉식 냉각 환경에서 구현하려는 기업을 위해 설계됐으며 우수한 성능·확장성·전력 효율성을 제공한다. 슈퍼마이크로 빅 말얄라 테크놀로지·AI부문 수석부사장은 "우리의 데이터센터 빌딩 블록 솔루션(DCBBS)은 검증된 서비스를 시장에 공급하는 과정에서 AMD 솔루션과 같은 최첨단 기술을 신속하게 통합할 수 있도록 한다"고 강조했다. 이어 "새로운 AMD 인스팅트 MI355X GPU 공냉식 솔루션 추가로 우리 AI 제품군을 확장·강화하며 고객들의 차세대 데이터센터 구축에 다양한 선택지를 제공할 수 있게 됐다"고 덧붙였다. 슈퍼마이크로는 이번 10U 공냉식 서버 출시를 통해 수냉식 및 공냉식 기반 고성능 제품군을 확장했다. 해당 솔루션은 업계 표준 OCP 가속기 모듈(OAM)을 활용해 GPU당 288GB의 HBM3e 메모리와 8TB/s 대역폭을 제공한다. 또 TDP가 1천 와트(W)에서 1천400W로 증가함에 따라 기존 8U MI350X 공냉식 시스템 대비 최대 두 자릿수의 성능 향상이 이뤄져 데이터를 빠르게 처리할 수 있다. 이번 제품군 확장으로 슈퍼마이크로 고객은 공냉식과 수냉식 인프라 모두에서 랙당 성능을 효율적으로 확장할 수 있다는 설명이다. 특히 이번 GPU 솔루션은 클라우드 서비스 제공 업체와 엔터프라이즈 환경 전반에서 대규모 AI 및 추론 워크로드에 최대 성능을 제공하도록 설계됐다. AMD 트래비스 카 데이터센터 GPU 사업부문 비즈니스 개발 담당 부사장은 "슈퍼마이크로와 협력해 공냉식 AMD 인스팅트 MI355X GPU를 시장에 선보여 고객들은 기존 인프라에서도 고급 AI 성능을 보다 쉽게 도입할 수 있게 됐다"며 "양사는 성능과 효율성 분야의 선두주자로서 전 세계 데이터센터의 혁신을 가속화하는 차세대 AI 및 고성능컴퓨팅(HPC) 솔루션을 제공하고 있다"고 말했다.

2025.11.20 17:19한정호

[기고] 스마트 산업 위한 센서 집약적 AI 컴퓨팅 개발 가속화

제조 현장에서 폭발적으로 증가하는 데이터 수요를 충족시키기 위해 필요한 센서의 종류 및 센서의 채널 수가 지속적으로 증가함에 따라, 산업용 컴퓨터의 설계 및 확장이 점점 더 어려워지고 있다. 이와 함께 산업계 및 의료기관들의 자동화 도입 요구가 높아지면서, 기기 레벨에서 엣지 및 클라우드에 이르기까지 시스템 전반에 걸쳐 AI, 머신러닝, 데이터 분석 소프트웨어 및 지능형 디스플레이 등의 기술 융합 또한 가속화되고 있다. 이로 인해 보다 높은 수준의 다각화된 컴퓨팅 성능에 대한 요구가 증가하면서, 센서 집약적 제어 애플리케이션을 위해 설계된 적응형 컴퓨팅 플랫폼(Adaptive Compute Platform) 기반의 새로운 접근방식이 주목받고 있다. 적응형 컴퓨팅 플랫폼은 개발을 가속화하고, 하드웨어 및 소프트웨어 통합을 간소화하는 것은 물론, 전력소모를 정밀하게 제어하면서 안정적인 성능을 유지할 수 있도록 지원한다. 센서와 적응형 컴퓨팅 플랫폼이 탑재된 수많은 엣지 기기는 시스템과 연결되어 있거나 자체적으로 내장된 PC를 갖추고 있다. x86 기반 컴퓨팅과 AI, 제어, 센서 인터페이스 및 프로세싱, 시각화 및 네트워킹 기능을 긴밀하게 통합하면 전반적인 크기를 소형화할 수 있어 구축 및 설치를 용이하게 하는 등 여러 중요 이점을 얻을 수 있다. 실시간 센서 프로세싱 및 제어, 네트워킹 및 AI 추론을 처리할 수 있는 적응형 컴퓨팅 플랫폼은 지연시간과 전력소모 및 전체 솔루션 크기를 최소화하는데 도움을 준다. 이를 기반으로, 임베디드 프로세싱에 적합한 효율적이고 강력한 플랫폼을 구현할 수 있다. 임베디드 PC, 다양한 컴퓨팅 요소 통합 필요 엣지 애플리케이션의 지속적인 디지털화는 센서화를 비롯해 엣지 및 클라우드 컴퓨팅 전반에 걸친 AI 및 머신러닝 도입, HMI(Human Machine Interface)와 멀티미디어 경험 및 네트워킹, 그리고 운영기술(OT) 및 정보기술(IT) 영역 간의 통합 등 여러 요소들을 통해 가속화되고 있으며, 이러한 구성 요소들이 최적의 성능을 발휘하기 위해서는 서로 다른 형태의 다양한 컴퓨팅 요소가 필요하다. 의료 영상 시스템을 예로 든다면, 이러한 시스템은 일반적으로 다양한 프로브를 통해 수집된 데이터를 여러 알고리즘을 이용해 인터페이스 및 처리해야 한다. 이러한 작업은 워크로드가 매우 복잡하기 때문에 상당한 규모의 컴퓨팅 성능이 필요하다. 이러한 과정에서 생성된 데이터는 불필요한 정보를 제거하고, 체계적으로 정리 및 가공된 후에 비로소 영상의학 전문의나 심장 전문의와 같은 의료진에게 유용한 정보로 활용될 수 있다. 따라서, 데이터 분석 엔진과 AI 추론 기능을 활용하여 결과 분석 과정을 더욱 신속하게 수행하고 통찰력을 얻을 수 있다. 또한, 이러한 모든 정보는 의료 분석가들이 진단에 활용할 수 있도록 디스플레이 모니터에 시각화되어야 하며, 의료기관의 네트워크를 통해 의료 데이터베이스로 전달되어야 한다. 이는 광범위한 센서화(sensorization)를 통해 임베디드 애플리케이션의 효율성 및 생산성을 향상시켜 다양한 변화를 가능하게 하는 하나의 사례에 불과하다. 이러한 광범위한 센서들은 최대한의 응답성을 달성하기 위해 밀리초 단위에서 신속하게 인터페이스되고, 처리되어야 한다. 또한, 대규모로 구축된 센서는 빅데이터 알고리즘에 데이터를 제공하여 프로세스에 대한 통찰력 및 인사이트를 도출함으로써 성능 개선은 물론, 차세대 제품 개발에 기여할 수 있다. 센서와 적응형 컴퓨팅 플랫폼이 탑재된 수많은 엣지 기기는 시스템과 연결되어 있거나 자체적으로 내장된 PC를 갖추고 있다. 이러한 x86 기반 컴퓨팅과 AI, 제어, 센서 인터페이스 및 프로세싱, 시각화 및 네트워킹 기능을 긴밀하게 통합하면 전반적인 크기를 소형화할 수 있어 구축 및 설치를 용이하게 하는 등 여러 중요 이점을 얻을 수 있다. 또한, 통합 솔루션을 통해 전력소모를 줄임으로써 전력 설계를 간소화하고 공장 내에서의 부품, 자재, 완제품 운반에 사용되는 AMR과 같은 배터리 기반 애플리케이션을 한 번의 충전으로 더 오래 작동할 수 있도록 한다. 반면, 프로세싱 엔진의 과도한 전력소모로 인해 손실되는 런타임을 보완하기 위해 더 큰 배터리를 장착하면 시스템의 비용과 무게가 증가하게 된다. 하지만 통합 솔루션을 이용하면 총 소유 비용(TCO)을 낮추는데 기여할 수 있다. 그러나 이러한 통합은 상당한 수준의 하드웨어 및 소프트웨어 엔지니어링 노력이 필요하다. 특히 더 높은 생산성과 안전성, 보다 효율적인 운영 계획 수립을 위해 계속해서 더 많은 센서 채널이 추가됨에 따라 이러한 통합 작업은 더욱 어려워지고 있다. 엣지 AI 통합 적응형 컴퓨팅 플랫폼으로 지연 시간 최소화 이러한 통합을 위한 일반적인 접근방식은 산업 및 의료 컴퓨팅 분야에 널리 사용되는 x86 프로세서 아키텍처 기반의 풍부한 생태계와 함께 실시간 머신 제어, 센서 인터페이스 및 네트워킹 기능을 실행할 수 있는 적응형 컴퓨팅 플랫폼을 활용하는 것이다. 이러한 조합을 통해 머신 비전, 산업용 네트워킹, 로봇 컨트롤러, 의료 영상, 스마트 시티, 보안 및 리테일 분석 등과 같은 다양한 적용 사례를 구현할 수 있다. 기존에는 게이트키퍼 역할을 수행하는 산업용 PC가 유입되는 센서 데이터를 처리하고 이 데이터를 x86 코어에서 처리할지, 아니면 PCI 익스프레스 인터페이스로 연결된 FPGA 기반 가속기 카드에서 처리할지 판단했다. 하지만 이러한 접근방식은 지연 시간이라는 중요한 문제를 유발시킨다. 센서 데이터를 수집하고 처리한 뒤, 가속기로 전송하는데 소요되는 시간으로 인해 지연시간이 가중됨으로써 실시간 시스템 응답이 불가능해질 수 있다. 반면, FPGA 기반 적응형 컴퓨팅 플랫폼에 센서 인터페이스와 AI 프로세서, 네트워크 프로세싱을 통합하면 상당한 이점을 얻을 수 있다. 단일 마더보드에 이러한 기능들을 통합함으로써 컴퓨팅 효율을 높이고 지연시간을 줄이는 것은 물론, 데이터가 여러 구성요소를 거쳐야 할 필요성도 없어진다. 따라서 이와 같은 통합 접근방식은 더 빠른 응답 속도와 더 높은 정확도를 제공할 뿐만 아니라, 전력소모를 낮출 수 있는 잠재력을 제공한다. AMD, 버설 기반 적응형 컴퓨팅 플랫폼 제공 실시간 센서 프로세싱 및 제어, 네트워킹 및 AI 추론을 처리할 수 있는 적응형 컴퓨팅 플랫폼은 지연시간과 전력소모 및 전체 솔루션 크기를 최소화하는데 도움을 준다. 이를 기반으로, 임베디드 프로세싱에 적합한 효율적이고 강력한 플랫폼을 구현할 수 있다. AMD 버설(Versal) 적응형 이기종 프로세서와 같은 디바이스에 구현된 이러한 원리를 확장하면 기존의 다양한 워크로드를 처리하는 동시에, 가속화되는 센서화 흐름에도 대응할 수 있는 임베디드 컴퓨팅 플랫폼을 보다 간단하게 구현할 수 있다. x86 프로세서 IP를 추가하고, 특화된 적응형 컴퓨팅 솔루션을 활용하고, 센서 인터페이스에 적합한 다수의 I/O 구성을 이용함으로써 더 높은 수준의 통합, 전력 효율성 및 시스템 응답 속도를 달성할 수 있다. 특히 다수의 I/O 구성은 다양한 유형의 센서를 연결하고 해당 신호를 직접 라우팅하여 처리할 수 있도록 지원한다. 이는 GMSL(Gigabit Multimedia Serial Link) 카메라나 10/25GE, 라이다(LiDAR)를 비롯해 내시경 및 초음파와 같은 의료용 프로브 등 다양한 유형의 센서에 적용할 수 있다. 또한, 필요에 따라 추가 센서 채널을 쉽게 구성할 수 있어 확장성 확보에도 유리하다. 이러한 접근방식은 확장 가능한 센서 인터페이스와 이기종 가속의 장점 그리고 x86 플랫폼 기반의 산업용 프로세싱을 지원하는 광범위한 생태계를 통해 센싱과 AI, 제어 및 네트워킹 소프트웨어를 간소화할 수 있다. 이를 통해 엔지니어는 자신들의 요구사항에 정확히 부합하는 최적의 임베디드 컴퓨터를 구현할 수 있다. 센서 I/O 수를 조정하고, 각 채널을 CPU, 실시간 코어, DSP, AI 엔진 또는 프로그래머블 로직 등 가장 적합한 가속 엔진에 개별적으로 연결할 수 있으며, 세밀하게 조정된 최적의 전력소모 및 성능을 구현할 수 있다. 모든 입력 채널 신호를 칩 상의 가장 적합한 프로세싱 엔진에 유연하게 연결할 수 있는 이러한 기능은 엔지니어가 신호의 우선순위나 실시간 결정론적 성능 요구에 따라 복합적인 센서 중요도(Mixed Sensor Criticality)를 효과적으로 처리하는데 도움을 준다. x86 기반 임베디드 컴퓨팅을 지원하는 광범위한 생태계는 머신 비전, 의료 영상 스캐닝, 로봇 제어 등 다양한 애플리케이션 개발을 지원하는 풍부한 리소스를 제공한다.

2025.11.20 13:41이희만

  Prev 1 2 3 4 5 6 Next  

지금 뜨는 기사

이시각 헤드라인

[단독] 최태원 SK 회장, 다음달 방미…하이닉스에 '협업' 주문

[AI 기본법 시행②] "준비만이 살 길"…대기업·스타트업·협단체 대응 총력

"두쫀쿠 유행 타고 싶지만"…식품사·프랜차이즈 망설이는 이유

쿠팡 가입자들, 보상 쿠폰만 쓰고 나갔나

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.