• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
  • AI의 눈
MWC26
스테이블코인
인공지능
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'커스텀'통합검색 결과 입니다. (2건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

SK하이닉스, AI 추론 병목 줄이는 '커스텀 HBM' 정조준

SK하이닉스가 향후 다가올 커스텀 HBM(고대역폭메모리) 시대를 위한 무기로 '스트림DQ(StreamDQ)'를 꺼내 들었다. 기존 GPU가 담당해 추론 과정에서 병목 현상을 일으키던 작업을, HBM이 자체적으로 수행해 데이터 처리 성능을 끌어올리는 것이 골자다. GPU 업체 입장에서도 HBM으로 일부 기능을 이전할 수 있기 때문에 칩 설계를 보다 유연하게 할 수 있다는 이점이 있다. SK하이닉스는 해당 기술을 통해 엔비디아 등 주요 고객사와 협의를 진행할 것으로 관측된다. SK하이닉스는 지난 6일(현지시간) 미국 라스베이거스 베니션 호텔에서 'CES 2026' 프라이빗 전시관을 마련하고 커스텀 HBM 기술을 공개했다. 커스텀 HBM 시장 정조준…고객사에 '스트림DQ' 기술 제안 커스텀 HBM은 차세대 버전인 HBM4E(7세대 HBM)부터 본격적으로 적용될 것으로 전망되는 제품이다. 기존 HBM이 표준에 따라 제작됐다면, 커스텀 HBM은 고객사가 원하는 기능을 베이스 다이에 추가하는 것이 가장 큰 차별점이다. 베이스 다이는 HBM을 적층한 코어 다이의 메모리 컨트롤러 기능을 담당하는 칩으로, HBM과 GPU 등의 시스템반도체를 PHY(물리계층)로 연결한다. 기존에는 메모리 회사가 이를 제조했으나, 다양한 로직 기능이 추가되면서 HBM4부터는 주로 파운드리 공정을 통해 양산된다. SK하이닉스는 커스텀 HBM 상용화를 위해 고객사에 스트림DQ라는 기술을 제안하고 있다. 얼마전 막을 내린 CES 2026 전시관이 고객사 대상으로 운영된 만큼, 엔비디아 등 글로벌 빅테크에 적극적인 프로모션을 진행했을 것으로 예상된다. SK하이닉스 관계자는 "스트림DQ는 커스텀 HBM의 한 사례로서, SK하이닉스는 해당 기술을 논문으로도 냈다"며 "고객사가 커스텀 HBM 관련 기술을 우리에게 제안하기도 하지만, 반대로 SK하이닉스가 제시하기도 한다"고 설명했다. GPU 일부 기능 HBM으로 이전…빅테크 부담 덜어준다 스트림DQ 기술은 기존 GPU 내부의 컨트롤러 기능 일부를 HBM의 베이스 다이로 이전하는 것이 주 골자다. 이렇게 되면 GPU 제조사는 칩 내부 공간을 더 넓게 쓸 수 있어, 시스템반도체의 성능 및 효율성 향상을 도모할 수 있다. SK하이닉스 입장에서는 베이스 다이에 GPU 컨트롤러 등을 추가하더라도 큰 부담이 없다. 대만 주요 파운드리인 TSMC의 선단 공정을 적용하기 때문이다. 또한 SK하이닉스는 해당 베이스 다이에 UCIe 인터페이스를 적용해 칩의 집적도를 더 높였다. UCIe는 칩을 기능별 단위로 분할해 제조한 후, 서로 연결하는 최첨단 기술이다. HBM이 '역양자화' 대신 처리…LLM 처리 속도 7배 향상 가능 AI 가속기의 데이터 처리 성능 역시 획기적으로 높아진다. 대규모언어모델(LLM)은 메모리 사용량을 효율적으로 감축하기 위해 낮은 비트 정수로 데이터를 압축하는 '양자화(Quantization)' 과정을 거친다. 이후 실제 연산 과정에서는 데이터를 다시 압축 해제하는 '역양자화(Dequantization)'를 진행한다. 기존 역양자화 작업은 GPU가 담당했다. 그런데 GPU가 역양자화를 진행하면 전체 LLM 추론 시간의 최대 80%를 잡아먹는 메모리 병목 현상을 일으키는 문제가 발생해 왔다. 반면 스트림DQ는 양자화된 정보를 그대로 GPU에 보내는 것이 아니라, HBM 내부에서 데이터가 흘러가는 과정에서 역양자화를 곧바로(on-the-fly) 진행한다. 덕분에 GPU는 별도의 작업 없이 곧바로 연산 작업을 진행할 수 있게 된다. 이처럼 흘러가는(스트림) 데이터를 곧바로 역양자화(DQ)한다는 관점에서 스트림DQ라는 이름이 붙었다. 이를 통해 병목 현상이 발생했던 LLM 추론 처리 속도가 약 7배 이상으로 개선될 수 있다는 게 SK하이닉스의 설명이다. 전체 AI 가속기의 추론 속도 역시 크게 향상될 것으로 기대된다. SK하이닉스 관계자는 "방대한 양의 데이터를 처리하는 시스템반도체를 메모리 근처에 가져다 놓고 데이터 결과값만 받게 하면 시스템적으로 굉장히 효율적"이라며 "프로세싱 니어 메모리(PNM)의 개념으로 볼 수 있다"고 말했다.

2026.01.14 13:48장경윤 기자

美 마벨, 맞춤형 S램 칩 시장 정조준...韓 반도체 업계에 기회

글로벌 반도체 기업 마벨(Marvell)이 맞춤형(Custom) AI반도체 전략을 전면에 내세우며 시장 판도 변화를 예고했다. 2나노(nm, 10억분의 1m) 공정으로 제작된 커스텀 S램을 통해 AI 인프라 시장에서 선두주자로 입지를 강화한다는 전략이다. 이에 AI칩 생태계 확대 과정에서 국내 메모리 양사가 협업 파트너로 부상할 가능성이 제기된다. 미국 마벨은 현지시간 17일 AI 기술 웨비나를 개최하고 초미세 공정 기반 맞춤형 AI칩 전략을 공개했다. 클라우드, 데이터센터 등 고객에게 맞춤형 칩을 제공해 엔비디아와 차별화하겠다는 계획이다. “2나노 맞춤형 S램, AI워크로드 최적화 메모리” 이날 발표 중에는 기존 메모리와는 다른 혁신적인 기술 내용이 이어졌다. 기존 10나노~20나노 수준에 머물던 S램을 TSMC 2나노 공정을 통해 양산한다는 내용이다. S램은 전원을 공급하는 한 저장된 데이터가 보존되는 메모리다. 주로 CPU의 캐시 메모리, AI가속기 내부 버퍼, 네트워크 프로세서 등에 활용돼 데이터 접근 속도를 높이는 역할을 담당한다. D램과 달리 리프레시(새로고침) 동작이 필요 없어 속도가 더 빠르지만, 집적도가 낮아 용량이 작고 비싸다는 특징을 가지고 있다. 마벨이 공개한 2나노 맞춤형 S램은 AI 가속기 연산 중간 데이터 전송 지연 시간을 매우 짧게 만든다. 아울러 AI 전용 커스텀 IP(설계자산) 형태로 공급돼, S램의 단점으로 꼽히던 면적을 15% 줄였다. 최선단 공정인 2나노를 통해 양산되는 만큼 동일 밀도에서 표준 SRAM보다 최대 66% 적은 전력을 소비한다. 전반적으로 최적화된 셈이다. 회사는 범용 S램보다 특정 AI 워크로드에 최적화된 맞춤형 메모리 구조가 향후 인프라 시장을 이끌어 갈 것으로 내다봤다. 윌 추(Will Chu) 마벨 커스텀 클라우드 솔루션 담당 수석 부사장은 “커스텀은 AI 인프라의 미래”라며 “오늘날 하이퍼스케일러들이 최첨단 커스텀 XPU를 개발하는 데 사용해왔던 기술은 더 많은 고객, 더 다양한 기기, 더 많은 애플리케이션에 적용될 것”이라고 말했다. 그러면서 “커스텀 시대를 위한 선도적인 기술 포트폴리오를 구축하기 위해 파트너 및 고객과 협력하기를 기대한다”고 덧붙였다. 열리는 맞춤형 시장...韓 반도체에 기회 이 같은 행보는 국내 반도체 업계에 기회로 작용할 전망이다. 마벨은 칩을 자체적으로 설계하지만 생산은 외주에 맡기는 팹리스(반도체 설계전문)다. 국내 파운드리(반도체 위탁생산) 업체인 삼성전자의 잠재적인 고객인 셈이다. 또 맞춤형 칩은 범용 칩보다 생산이 복잡한 만큼 IP, 패키징 등 협력사 확대가 필수적이다. 메모리 업체 입장에서는 HBM 등 AI 메모리와 연계할 가능성 있다. S램 IP를 통한 고속 XPU IP 플랫폼을 확장하면 HBM과 공동 최적화를 할 수 있는 것이다. 장비업체 입장에서는 맞춤형 S램에 필요한 테스트, 패키징 장비 분야에서 기회가 있을 것으로 관측된다. 다만 단기간에 국내 업계에 영향을 주지는 않을 것으로 보인다. 메모리 업계 관계자는 “당장은 큰 영향이 없을 것 같다”며 “이와 관련해서 칩이 실제로 나와봐야 알 수 있을 것”이라고 말했다.

2025.06.18 16:17전화평 기자

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

구글에 내준 '내비게이션' 지도, 1대 5000 지도와 뭐가 다를까

[단독] 주병기 공정위장 "과자 등 가공식품 가격도 내려야"

[사스포칼립스 위기 ㊦] AI 재편기, 한국 소프트웨어 과제는 '구조 전환'

삼성 HBM4 자신감의 근원 '1c D램'…다음 목표는 수율 개선

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.