• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
인공지능
배터리
양자컴퓨팅
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'NPU'통합검색 결과 입니다. (150건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

리벨리온, 삼성·ARM·에이디테크놀로지와 AI CPU '칩렛' 플랫폼 개발 추진

리벨리온은 Arm, 삼성전자 파운드리사업부, 에이디테크놀로지(ADT테크놀로지)와 협력해 AI CPU 칩렛(Chiplet) 플랫폼을 개발한다고 15일 밝혔다. 최근 데이터센터 및 HPC(고성능컴퓨팅) 영역에서 AI 워크로드에 대한 수요가 커짐에 따라 첨단 칩렛 기술을 활용해 성능과 에너지효율성을 갖춘 AI 인프라를 제공하기 위함이다. 칩렛은 각기 다른 기능을 가진 반도체를 제조하고 하나의 칩으로 이어붙이는 첨단 패키징 기술이다. 이번 협업은 4개 사의 기술적 강점을 살려 이뤄진다. 리벨리온은 자사 AI반도체 '리벨(REBEL)'에 에이디테크놀로지가 설계한 CPU 칩렛을 통합한다. 이 CPU 칩렛은 Arm의 '네오버스 컴퓨팅 서브 시스템(Arm Neoverse Compute Subsystems) V3'를 기반으로 설계되며, 삼성전자 파운드리는 최첨단 2나노 공정 기술을 활용해 CPU 칩렛을 생산한다. 이렇게 만들어진 통합 플랫폼은 '라마(Llama) 3.1 405B'를 비롯한 초거대언어모델 연산에 있어 2배 이상의 에너지 효율성 향상을 보일 것으로 예상된다. 리벨리온은 이러한 업계 선도 파트너사들과 협력해 AI 추론에 특화된 고효율 칩렛 솔루션 개발에 속도를 더할 계획이다. 특히 리벨리온의 칩 설계 전문성과 파트너사들이 보유한 방대한 경험을 결합해, AI 컴퓨팅 역량을 향상시킬 뿐 아니라 반도체 솔루션의 확장가능성과 효율성의 새로운 기준을 제시하는 계기가 될 것으로 기대된다. 오진욱 리벨리온 CTO는 “리벨리온은 반도체 스타트업으로선 전례 없는 속도로 칩렛 기술을 도입해 AI모델 개발사, 하이퍼스케일러 등 다양한 종류의 AI 워크로드 수요에 대응하고 있다”며 “리벨리온이 보유한 AI반도체 기술과 경험을 살려 생성형AI 시대의 혁신을 이끌고, 훌륭한 파트너들과 함께 칩렛 생태계의 새로운 지평을 열어가게 되어 매우 뜻깊게 생각한다”고 말했다. 황선욱 Arm코리아 사장은 “이번 다자간 협업으로 빠르게 변화하는 AI 인프라 시장의 다양한 요구에 대응할 수 있을 것으로 기대한다"며 "리벨리온이 그간 선제적으로 개발해 온 칩렛 기술과 Arm의 반도체 플랫폼 및 에코시스템이 결합한 만큼 높은 수준의 성능과 효율성을 갖춘 플랫폼으로 AI 혁신을 이끌 것”이라고 밝혔다. 송태중 삼성전자 파운드리사업부 Business Development팀 상무는 “삼성전자 파운드리사업부 또한 이번 다자협력에서 최첨단 공정 기술과 첨단 패키징 솔루션을 활용하는 만큼 이번 기회가 AI반도체 분야의 미래와 생태계 구축에 있어 중요한 이정표가 될 것”이라고 말했다. 박준규 에이디테크놀로지 대표는 “Arm 토탈 디자인 생태계의 일환으로 진행 되는 프로젝트”라며 “에이디테크놀로지는 CPU 클러스터와 인터페이스 설계를 통해 연산 성능과 에너지 효율성을 극대화하여 AI 반도체 시장에서 독보적인 경쟁력을 확보 할 것”이라 강조했다.

2024.10.15 22:00장경윤

AMD, 라이젠 AI 프로 300 CPU 3종 공개

AMD가 10일(미국 현지시간) 미국 캘리포니아 주 샌프란시스코에서 진행된 '어드밴싱 AI 2024' 행사에서 새 프로세서 '라이젠 AI 프로 300' 3종을 공개했다. 라이젠 AI 프로 300 시리즈는 최신 아키텍처인 젠5(Zen 5) 기반 CPU, RDNA 3.5 기반 GPU와 XDNA 2 NPU(신경망처리장치)를 결합했고 기업용 노트북 시장을 겨냥했다. CPU는 8/10/12 코어 중 선택할 수 있다. AMD는 UL 프로시온 내장 오피스 생산성 테스트 결과를 토대로 "최상위 제품인 라이젠 AI 9 HX 프로 375(12코어, 24스레드 / 5.1GHz)가 인텔 코어 울트라7 v프로 165U 프로세서 대비 최대 14% 더 높은 성능을 낸다"고 밝혔다. 내장 NPU는 INT8(정수, 8비트) AI 연산시 최대 55 TOPS(1초당 1조 번) AI 연산이 가능하며 전세대 제품인 라이젠 프로 8040 대비 3배 이상 향상됐다. 마이크로소프트 윈도11 코파일럿+이 요구하는 40 TOPS를 넘어선다. 대규모 조직이나 기업에서 노트북 등 기기 배포와 관리에 활용할 수 있는 AMD 프로 기술을 탑재했고 내부 보안 프로세서 버전을 2.0으로 업데이트했다. 잭 후인(Jack Huynh) AMD 컴퓨팅/그래픽그룹 총괄(부사장)은 "라이젠 AI 프로 300 프로세서는 배터리 지속시간, x86 응용프로그램 호환성, AI 처리 능력을 위한 NPU 등 기업용 PC를 위해 설계된 가장 강력한 AI 프로세서"라고 밝혔다. AMD는 "주요 PC 제조사가 이달(10월)을 시작으로 오는 2025년까지 라이젠 AI 프로 300 탑재 노트북을 100종 이상 출시할 것"이라고 밝혔다.

2024.10.11 10:37권봉석

백준호 퓨리오사AI 대표 "2세대 레니게이드 AI칩, 글로벌 경쟁력 입증 완료"

"AI 반도체 스타트업으로서 많은 선입견이 있었지만, 회사의 차세대 AI 반도체인 '레니게이드'는 하드웨어와 소프트웨어 모두 글로벌 시장에서 경쟁력을 갖춘 제품입니다. 실제로 엔비디아의 칩과 비슷한 성능을 구현하면서도, 전력소모량은 크게 낮춘 테스트 결과를 도출하기도 했습니다." 백준호 퓨리오사AI 대표는 10일 서울 삼성동 코엑스에서 개막한 '디지털 혁신 페스타 2024' 부대행사로 열린 '퓨처 테크 컨퍼런스'에서 이같이 밝혔다. 이날 '생성형 AI시대의 AI반도체 프론티어'를 주제로 발표를 진행한 백 대표는 AI 반도체 '레니게이드'의 경쟁력을 강조했다. 레니게이드는 회사의 2세대 NPU(신경망처리장치) 칩으로, 최대 초당 1.5 TB(테라바이트) 이상의 대역폭을 구현한다. 퓨리오사는 이 레니게이드에 대해 올 하반기부터 잠재 고객사와 제품(퀄) 테스트를 본격화했다. 레니게이드는 대만 주요 파운드리 TSMC의 5나노미터(nm) 공정 및 첨단 2.5D 패키징 기술인 'CoWoS'를 기반으로 한다. 메모리는 HBM3(4세대 고대역폭메모리)를 탑재했다. 실제로 퓨리오사AI가 AI 추론 영역에서 벤치마크 테스트를 진행한 결과, 초당 쿼리 수 기준으로 레니게이드(11.5)는 엔비디아 L40S(12.3)와 비슷한 성능을 나타냈다. 반면 소비전력은 엔비디아 L40S가 320W인 데 비해, 레니게이드는 185W로 훨씬 높은 효율성을 기록했다. 백 대표는 "최근에는 레니게이드의 초당 당쿼리 수가 13~14로 올라갈 만큼 성능이 더 향상된 상황"이라며 "레니게이드가 글로벌 시장에서도 충분히 경쟁할 수 있는 제품임을 입증했다"고 밝혔다. 단순히 칩의 하드웨어만이 아니라, 소프트웨어 성능을 강화한 것도 레니게이드가 지닌 강점이다. 백준호 대표는 "AI 반도체가 도입이 늦어지는 이유 중 하나는 소프트웨어 스택이 칩을 잘 받쳐주지 못한다는 것"이라며 "퓨리오사AI는 이를 해결하고자 TCP(텐서축약프로세서)라고 부르는 소프트웨어 설계 역량에 집중했다"고 설명했다. 텐서란 3차원 이상의 행렬로 데이터를 배열한 데이터 구조다. 통상적인 AI 가속기는 이를 처리하는 데 여러 비효율적인 면이 발생하지만, 퓨리오사AI의 TCP 아키텍처는 효율적인 방식으로 데이터를 처리한다. 백 대표는 "회사의 전체 엔지니어 120명 중 하드웨어 담당은 30%, 소프트웨어 담당은 70%에 해당할 정도"라며 "설계의 혁신이 레니게이드의 가장 큰 혁신으로, 이를 통해 향후 AI 반도체 시장 공략을 위해 노력할 것"이라고 말했다.

2024.10.10 17:46장경윤

정철호 퀄컴 상무 "온디바이스 AI 필요성, 멀티 모달에서 더 커질 것"

"많은 기기가 AI 서비스를 원하지만 모든 처리를 클라우드에 맡기는 것은 불가능합니다. 현재 추세대로라면 오는 2030년에 전세계 전력 소비 중 약 3.5%가 AI에 투입되며 지연시간이나 처리 비용, 프라이버시 보호에도 한계가 있습니다." 10일 오후 서울 코엑스에서 진행된 '퓨처테크 컨퍼런스 2024' 행사에서 정철호 퀄컴코리아 상무가 이렇게 강조했다. 퓨처테크 컨퍼런스 2024는 과학기술정보통신부 주최, 한국소프트웨어산업협회(KOSA) 주관으로 오는 12일까지 서울 강남구 삼성동 코엑스에서 열리는 '디지털 혁신 페스타(DINNO, 디노) 2024' 부대 행사로 기획됐다. 이날 정철호 상무는 "퀄컴은 모바일 분야를 시작으로 저전력·고성능 처리가 가능한 CPU와 GPU, NPU 등 컴퓨팅 기기를 개발해 왔고 이를 바탕으로 컴퓨터, XR 기기 등 다양한 기기에 온디바이스 AI 역량을 보급할 것"이라고 밝혔다. ■ "스마트폰서 시작한 AI, XR 글래스에서 완성" 정철호 상무는 "2019년 출시된 삼성전자 갤럭시S10 스마트폰은 카메라에 투입된 AI 기술이 이미지 보정 위주로 4개 들어가 있지만 5년 뒤 출시된 갤럭시S24는 사진 처리 모든 과정에 120여 개 모델을 투입하고 있다"고 설명했다. 이어 "최근 윈도11 버전 24H2에 투입된 '리콜' 기능은 5초마다 작업 환경을 기록하는 방식으로 작동한다. 개인화된 정보를 다루므로 클라우드가 아닌 기기 내부에서 처리가 필요하다. 이 과정에서 NPU(신경망처리장치)를 활용하는 것"이라고 부연했다. 정철호 상무는 "음성, 이미지, 영상 처리로 시작한 AI는 몰입 경험을 주는 XR(혼합현실) 기반 제품으로 수렴할 것으로 보이는데 무게와 배터리 지속시간, 성능 등 여러가지 제약이 많다. 그러나 극도로 개인화된 경험을 제공하는 면에서 XR 제품이 AI 미래가 될 것"이라고 전망했다. ■ "스마트폰에서 100억 개 매개변수 모델도 자체 실행" 이날 정철호 상무는 "거대언어모델(LLM)이 다루는 매개변수(패러미터)는 최근 팽창했다 최적화 후 부피를 줄이는 과정을 반복하면서 성능이 향상되고 있다. 현재 매개변수 100억 개로 구성된 대부분의 모델로 일상생활에 필요한 각종 기능을 소화할 수 있게 됐다"고 소개했다. 이어 "지난 해 출시된 스냅드래곤8 3세대 등 모바일용 SoC는 매개변수 70억 개까지 처리 가능하며 향후 출시될 제품에서는 그 이상의 매개변수를 포함한 AI 모델을 클라우드 도움 없이 처리할 수 있다"고 설명했다. 정 상무는 "스마트폰·태블릿 등 모바일 환경에서 시작해 스냅드래곤 X 엘리트/플러스 등 컴퓨팅, 스냅드래곤 디지털 섀시 등 자동차와 IoT(사물인터넷)까지 온디바이스 역량을 확대하는 것이 퀄컴의 목표"라고 강조했다. ■ "온디바이스 AI, 멀티 모달 환경서 중요성 ↑" 10여 년 전에는 음성이나 영상 처리를 위해 각 AI 기술이 따로 필요했다. 그러나 현재는 이용자와 텍스트, 음성이나 이미지 파일 등을 주고 받으며 작동하는 멀티 모달 형식 AI 모델이 주목받고 있다. 퀄컴은 올 초 진행된 MWC 2024 기간 중 70억 개 매개변수를 바탕으로 이용자와 다양한 방식으로 소통하는 '라바'(LLaVA)를 공개하기도 했다. 음식을 찍은 사진을 바탕으로 이용자와 텍스트로 이야기를 나누고 원하는 레시피를 제안하는 기능을 갖췄다. 정철호 상무는 "향후 출시되는 AI 모델은 음성과 이미지, 영상을 모두 처리하는 멀티 모달로 나아가고 있으며 구글 역시 이런 기술을 온디바이스 AI로 구현할 것이라고 밝혔다. 온디바이스 AI 중요성도 커질 것"이라고 설명했다. ■ "퀄컴, 15년 전부터 이기종 컴퓨팅에 주력" 현재 AI 관련 반도체로 가장 주목받는 것은 NPU다. 그러나 NPU만으로 모든 작업을 처리하는 데는 엄연히 한계가 있다. 지연 시간이 중요한 작업은 CPU가, 저전력 LLM/LVM(거대비전모델) 처리는 NPU가 담당한다. 정철호 상무는 "AI 처리시 저전력으로 짧은 시간 안에 모든 작업을 처리하려면 SoC가 내장한 다양한 블록을 원하는 목표와 특성에 맞춰 활용하는 '이기종 컴퓨팅'이 반드시 필요하다. 퀄컴은 이미 15년 전부터 이런 기능을 연구해 왔다"고 설명했다. 이어 "최근 맞춤형 경험과 개인정보 보호, 기업 비밀 보호와 처리 비용 등에서 온디바이스 AI의 역할이 커지고 있다. 특히 자율주행은 지연시간이 늘어나면 긴급 상황에서 치명적이다. 퀄컴의 접근 방식은 온디바이스 AI에서 강점을 드러낼 것"이라고 덧붙였다. ■ '퀄컴 AI 허브'로 개발자 지원..."책임있는 AI 고려도 필요" 퀄컴은 지난 2월부터 온디바이스 AI 구현에 필요한 리소스와 도구, 서비스를 제공하는 웹사이트 '퀄컴 AI 허브'를 운영중이다. 미리 최적화된 100개 이상의 AI 모델을 제공해 AI 모델 통합과 테스트 등을 제공한다. 정철호 상무는 "이제 막 AI 모델을 이용해 응용프로그램을 개발하는 분들은 이해도 문제로 어려움을 겪기도 한다. 퀄컴 AI 허브는 스마트폰과 PC, 스마트워치 등 다양한 기기에 최적화된 모델을 제공해 이런 어려움을 덜어준다"고 밝혔다. 최근 LLM 기반 생성 AI의 윤리나 저작권 등 문제도 대두되고 있는 상황이다. 정 상무는 "환각으로 인한 부정확하거나 해로운 답변 등 '책임있는 AI'에 대한 요구 사항이 커지고 있으며 기업 역시 AI 모델 활용시 이를 고려해야 할 것"이라고 조언했다.

2024.10.10 16:23권봉석

韓 AI칩 팹리스, 최첨단 패키징 '칩렛' 도입 본격화

기존 글로벌 빅테크의 전유물처럼 여겨지던 첨단 패키징 기술인 '칩렛' 분야에 국내 팹리스들도 본격적으로 발을 디딘다. AI 반도체 스타트업 리벨리온을 시작으로, 넥스트칩과 퓨리오사AI 등이 차세대 칩 성능 강화를 위해 칩렛 도입을 추진 중인 것으로 알려졌다. 30일 업계에 따르면 국내 팹리스 기업들은 차세대 반도체 제작에 칩렛 기술을 적용하는 방안을 적극 검토하고 있다. 칩렛은 각기 다른 기능을 가진 반도체를 제조하고 하나의 칩으로 이어붙이는 최첨단 패키징 기술이다. 한 번에 칩 전체를 만드는 기존 모놀리식 방식 대비 수율 향상에 유리하며, 복잡한 구성의 칩을 보다 효율적으로 제조할 수 있게 만든다. 기존 칩렛의 수요처는 엔비디아·AMD·인텔 등 해외 거대 팹리스가 주류를 차지해 왔다. 칩렛의 기술적 난이도가 매우 높고, 최선단 공정 기반의 칩에만 적용되고 있기 때문이다. 다만 국내 팹리스 기업들도 최근 들어 칩렛 적용 계획을 구체화하고 있다. 차량용 ADAS(첨단운전자보조시스템) AP(애플리케이션 프로세서)인 '아파치' 시리즈를 개발하는 넥스트칩은 차세대 제품에 칩렛을 적용하는 방안을 적극 검토 중이다. 김경수 넥스트칩 대표는 최근 기자와 만나 "다음 세대인 '아파치7'는 아파치6 대비 10배 정도 강화된 컴퓨팅 성능을 구현하는 것으로 방향을 잡았다"며 "이를 위해서는 칩 사이즈가 커지는데, NPU(신경망처리장치)·GPU(그래픽처리장치) 등을 각각 따로 만들어 집적하는 칩렛 기술이 필요하다"고 설명했다. 국내 데이터센터용 AI 반도체 스타트업 리벨리온은 이르면 올해 칩렛 기술을 적용한 차세대 칩을 선보일 계획이다. 리벨리온은 올 연말 차세대 NPU인 '리벨'을 출시하고, 이를 기반으로 리벨 칩 4개를 칩렛 구조로 묶은 '리벨-쿼드'를 상용화하기로 했다. 리벨은 삼성 파운드리 4나노미터(nm) 공정을 기반으로 12단 HBM3E(5세대 고대역폭메모리)를 탑재한다. 리벨-쿼드의 경우 총 4개의 HBM3E가 연결돼 메모리 용량이 144GB, 대역폭이 4.8TB/s까지 확장된다. 또 다른 스타트업 퓨리오사AI도 올해 출시하는 2세대 NPU '레니게이드'의 다음 제품에 칩렛을 적용하겠다고 밝힌 바 있다. 3나노 공정, HBM4 등 최선단 기술을 채용한 것이 또 다른 특징이다. 국내 시스템반도체 업계 관계자는 "기존에는 높은 비용과 한정된 적용처로 국내 팹리스가 칩렛을 고려하지 않았으나, 최근에는 데이터센터와 자율주행을 중심으로 일부 기업들이 도입을 준비하는 분위기"라며 "칩렛을 위한 각종 표준 및 IP(설계자산)도 어느 정도 준비가 된 상황"이라고 설명했다.

2024.09.30 13:40장경윤

칩스앤미디어, 500만 달러 규모 NPU IP 라이선스 계약

국내 반도체 설계기술(IP) 업체 칩스앤미디어가 창사 이래 단일계약으로 가장 큰 IP 라이선스 계약을 체결했다. 스앤미디어는 중국 AI 시스템온칩(SoC) 반도체 개발 기업과 500만 달러 규모의 IP 라이선스를 체결했다고 30일 발표했다. 계약 내용은 비디오 IP와 NPU IP가 동시에 포함된 라이선스 계약으로 수주계약만 약 500만 달러다. 이는 칩스앤미디어의 2023년 매출액 대비 24%에 해당된다. 이번 계약은 ▲단일 계약 규모 최대치 ▲ NPU IP 라이선스 첫 계약 ▲ 글로벌 판매확대 토대 마련이라는 점에서 의미가 있다. 특히 칩스앤미디어의 AI 기술이 본격적으로 글로벌 시장에 선보이는 중요한 이정표로 평가된다. NPU IP는 영상 처리에 특화된 인공지능 연산을 지원하는 기술로, 데이터 센터, AI-PC, 로봇 등에서 고성능 영상 처리를 위한 AI SoC 개발에 필수적으로 적용될 예정이다. 중국은 미중 반도체 갈등 속에서 자국 반도체 생태계 강화에 힘쓰고 있으며, AI 분야에 집중한 기업들이 지속적으로 증가하고 있는 상황이다. 이를 통해 칩스앤미디어는 중국 AI SoC 시장에서 더욱 강화된 입지를 다질 것으로 기대된다. 김상현 칩스앤미디어 대표이사는 "이번 계약은 당사의 새로운 기술인 영상 특화 인공지능 NPU IP의 첫 번째 라이선스 계약이라는 점에서 의미가 크다"며 "인공지능 기술이 요구되는 분야에서 칩스앤미디어의 IP는 중요한 역할을 하며, 글로벌 고객사들과의 협력 기회도 지속적으로 늘어날 것으로 예상된다"고 말했다. 한편, 칩스앤미디어는 2003년 설립된 반도체 IP 전문기업으로 영상처리를 담당하는 비디오 IP 사업에 주력한다. 주요매출은 IP 공급시점에 발생하는 라이선스 매출과 고객사가 이를 활용해 만든 반도체가 생산, 판매될 때 받는 로열티 매출로 구분된다. 국내외 150여개 고객을 확보하고 있으며, 90% 이상의 수출비중, 안정적인 라이선스 매출기반 로열티 매출로 30% 대의 높은 수익성을 달성하고 있다.

2024.09.30 09:38이나리

네이버클라우드, 국산 NPU 상용화·비즈니스 기회 창출 '가속'

네이버클라우드가 국산 연산유닛(NPU) 상용화와 클라우드 플랫폼 도입을 통해 인공지능(AI) 기술 발전과 클라우드 경쟁력 강화에 앞장서고 있다. 네이버클라우드는 과학기술정보통신부·정보통신산업진흥원이 실행하는 'AI반도체 팜(Farm) 구축 및 실증' 사업 주관사로서 2년차 구축을 지원하고 있다고 27일 밝혔다. 네이버클라우드는 이 프로젝트의 성공적 수행을 위해 KT클라우드, NHN클라우드와 함께 컨소시엄을 구성하고 국내 AI 반도체 기업인 퓨리오사AI, 리벨리온, 사피온 등과 협업 중이다. 'AI반도체 팜 구축 및 실증' 사업은 과기정통부 'K-클라우드' 프로젝트 중 하나로, 국내 데이터센터 시장에서 국산 AI 반도체 점유율을 확대시켜 클라우드 경쟁력을 강화하고 기술수준을 높이는 것이 목표다. 지난 해 5월부터 3년 동안 진행된 이 사업은 세 가지 세부 핵심사업으로 구성됐다. 핵심사업에는 국산 AI반도체 기반 컴퓨팅 인프라 구축, 클라우드 플랫폼 구축∙운영, AI 응용서비스가 포함됐다. 지난 해에는 1.1PF 구축 달성과 관제분야 AI 응용서비스 1개 실증 등의 목표를 성공적으로 달성한 바 있다. 올해 컨소시엄은 국산 NPU 개발과 상용화에 집중하고 있다. NPU는 다양한 AI 작업에서 우수한 전력효율과 추론 성능을 제공해 클라우드 운영 비용 절감에 도움을 주기 때문이다. 특히 고성능·저전력 AI 반도체가 필수적인 데이터 센터 고도화에 활용할 수 있는 것으로 알려졌다. 이에 네이버클라우드 컨소시엄은 퓨리오사AI·리벨리온·사피온이 개발한 국산 NPU의 성능을 높이기 위해 2세대 칩을 도입했다. 또 상용화를 위해 올해까지 누적 16.95PF 용량을 클라우드 플랫폼에 적용했다. 세 회사가 개발한 국산 NPU는 AI 모델 추론 과정에서 발생하는 방대한 데이터를 효율적으로 처리해 클라우드 서비스 제공자(CSP)에게 매력적인 선택지가 될 것으로 기대된다. 이와 함께 다양한 AI 서비스 개발과 비즈니스 기회 창출에도 힘쓰고 있다. 국산 NPU를 활용해 다양한 AI 애플리케이션 추론 서비스를 실증하고 있으며 자연어분야, 교육분야, 관제분야 등을 실증·구현하고 있다. 네이버클라우드 관계자는 "국산 NPU의 클라우드 적용은 국내 AI 산업 발전에 큰 기여를 하는 것은 물론 글로벌 AI 시장에서 중요한 위치를 차지할 것으로 기대된다"며 "NPU와 클라우드를 적극적으로 활용해 AI 기술 발전과 새로운 비즈니스 기회를 창출하도록 정부정책을 적극 지원하겠다"고 밝혔다.

2024.09.27 11:20조이환

"AI PC, 내년 출하량 1억 대 돌파... 올해보다 2.6배 ↑"

NPU(신경망처리장치)를 내장한 AI PC 출하량이 내년 1억 대를 넘어 설 전망이다. 시장조사업체 가트너가 26일 '전 세계 Arm 및 x86 기반 AI PC 전망 분석' 보고서에서 이렇게 밝혔다. 가트너에 따르면 올해 전 세계 AI PC 출하량은 노트북 4천52만 대, 데스크톱PC 250만 7천대 등 총 4천300만 대 규모다. 노트북과 데스크톱PC 모두 작년 대비 두 배 이상 늘어날 것으로 보인다. 내년 AI PC 출하량은 노트북 1억 242만 대, 데스크톱PC 1천180만 4천대 등 1억 1천400만 대로 올해 대비 두 배 이상 늘어날 것으로 예상된다. 란짓 아트왈(Ranjit Atwal) 가트너 시니어 디렉터 애널리스트는 "결과적으로 대부분의 PC에 NPU가 통합되며 표준으로 자리 잡을 것"이라고 밝혔다. 가트너는 내년 PC 출하량에서 AI PC 비중이 43%까지 늘어나며 데스크톱PC보다 노트북 비중이 더 커질 것이라고 밝혔다. 아트왈 시니어 디렉터 애널리스트는 "PC 시장의 중심이 AI PC로 이동함에 따라 x86 아키텍처의 지배력이 줄어들고 있다"며 "2025년에는 x86·윈도 기반 AI 노트북이 비즈니스 부문에서 주도하겠지만, 결국 Arm 기반 AI 노트북이 더 많은 점유율을 차지할 것"이라고 덧붙였다. 그는 이어 "보통 기업들은 AI 기능에 대한 추가적인 비용 지불은 꺼려하지만, AI PC는 미래를 대비하고 보다 안전하고 개인적인 컴퓨팅 환경을 제공하는 유일한 선택지로 보고 구매할 것"으로 전망했다.

2024.09.26 08:51권봉석

리벨리온–코오롱베니트, AI 반도체·시장확대 위해 맞손

AI반도체 스타트업 리벨리온이 코오롱그룹 IT서비스 전문기업 코오롱베니트와 AI 분야 기술협력 및 시장확대를 위한 협약을 체결했다고 26일 밝혔다. 이번 협약 체결로 양사는 각 사가 가진 AI솔루션 및 인프라 노하우와 IT 파트너 네트워크를 활용해 저전력 고효율 NPU(Neural Processing Unit) 기반의 AI 솔루션 시장을 확대할 계획이다. 먼저 현장 실증 프로젝트로 시장 확대를 위한 검증에 돌입한다. 양사는 리벨리온의 NPU를 기반으로 비전 AI 등 AI를 접목한 현장 실증 프로젝트를 수행한다. 이어 NPU 기반 하드웨어와 소프트웨어를 구성하고 이를 활용해 비전 및 LLM(Large Language Model, 거대언어모델), 멀티모달(Multi Modal) 모델을 아우르는 AI 솔루션을 선보일 계획이다. 향후 서비스 모델 발굴과 성공적인 사업화를 위해서도 힘을 모은다. 국가 R&D 과제 참여 등으로 시장성 확보에 나서고, NPU 및 AI 관련 분야에서 양사가 개발한 기술 및 서비스 모델을 확산하는 것이 목표다. 리벨리온은 올해 양산에 나선 AI반도체 '아톰(ATOM)'을 기반으로 본격적으로 AI반도체 비즈니스 모델을 구현하고 있다. 비전 AI, AI 보안, 언어모델 등 다양한 영역의 솔루션 기업과 기술 협력 레퍼런스를 쌓는 등 국산 NPU 기반의 AI서비스 확산에도 나선다. 코오롱베니트는 최근 최적의 정보와 솔루션을 제공하는 원스톱 AI 공급체계를 AI 애그리게이터(AI Aggregator)로 정의했다. 60여 개의 AI 솔루션 기업 및 유통 파트너와 체결한 협의체 '코오롱베니트 AI얼라이언스'를 통해 AI가 생소한 SMB(중소중견기업)을 위한 해결책을 제공한다. 리벨리온 박성현 대표는 “리벨리온이 그간 개발해 온 AI반도체 기술을 이제는 AI솔루션과 결합해 완성도 있는 서비스로서 고객에게 제공하고자 한다”며, “코오롱베니트와 손잡고 NPU가 실제 기업 비즈니스 환경에서 활용될 수 있는 모범사례를 발굴하고 새로운 AI 비즈니스 모델의 가능성을 보여주겠다”고 밝혔다. 코오롱베니트 강이구 대표는 "고성능 알고리즘 연산에 최적화된 NPU를 가진 리벨리온과 함께 고부가가치 AI 반도체 생태계를 확장할 것”이라며, “솔루션과 서비스를 제공하는 수준을 넘어, 고객 성장을 가속화하고 비즈니스 모델을 혁신하는 등 더 큰 가치를 제공하는 AI 신사업 밸류체인을 완성하겠다”라고 밝혔다.

2024.09.26 07:48이나리

넥스트칩, 차세대 ADAS칩 대형 수주 노린다…"이르면 연내 윤곽"

국내 주요 팹리스 기업 넥스트칩이 차세대 ADAS(첨단운전자보조시스템)용 AP(어플리케이션 프로세서)인 '아파치6'로 자동차·로봇 시장을 공략한다. 특히 자동차의 경우 고객사 확보에 많은 진전을 이룬 상황으로, 내년 초까지 구체적인 성과가 드러날 전망이다. 김경수 넥스트칩 대표는 최근 경기 판교 소재의 본사에서 기자들과 만나 "주요 고객사향 아파치6 프로젝트가 올 하반기에서 늦어도 내년 초 정도면 결정될 예정"이라며 "공급 계약 시 회사 기준으로는 단일 최대 수주가 될 것"이라고 밝혔다. 지난 1997년 설립된 넥스트칩은 영상신호를 처리하는 ISP, 영상신호를 전송하는 AHD와 더불어 자율주행차의 두뇌 역할을 담당하는 ADAS용 AP인 '아파치' 시리즈를 개발하고 있다. 현재 국내 현대자동차와 일본, 유럽 등에 고객사를 두고 있다. 가장 최근 개발된 아파치6는 엣지 프로세서인 전작(아파치5)와 달리, 차량의 중앙 시스템에서 자율 주차 주행을 제어하는 칩이다. Arm '코어텍스' CPU와 '말리' GPU, 최대 8TOPS(1초당 8조번 연산) 성능을 갖춘 NPU가 탑재됐다. 또한 아파치6는 vSLAM(위치 측정 및 동시 지도화)과 이동을 위한 경로 생성, 트래킹 기능을 구현한다. 카메라 입력은 최대 8개 채널을 지원한다. 이를 통해 운전자 없이도 차량이 스스로 목적지에 도착할 수 있도록 한다. 김 대표는 "ADAS용 AP의 경쟁력은 결국 차량 제어의 성능과 신뢰성을 높일 수 있는 센서에 있다"며 "이를 위해 넥스트칩은 CMOS 이미지센서, iTOF(간접 ToF), 열화상, 라이다(LiDAR) 등을 모두 독자 및 협력 개발하고 있어 경쟁력이 있다"고 설명했다. 아파치6의 상용화 성과는 이르면 올 연말에 드러날 전망이다. 현재 유럽 주요 자동차 제조업체와 퀄(품질) 테스트를 진행 중으로, 이르면 올 연말이나 내년 초에 양산 공급이 결정될 것으로 관측된다. 김경수 대표는 "아파치6의 유럽 고객사 확보가 현실화되면 회사 단일 수주로는 역대 최대 매출이 발생하게 될 것"이라며 "이외에도 국내외 고객사와 향후 POC(개념증명)를 진행하는 등 사업 확대를 추진하고 있다"고 밝혔다. 나아가 넥스트칩은 아파치6의 적용처를 로봇 산업으로 확장할 계획이다. 김 대표는 "서빙, 배달 등 다양한 서비스의 로봇에 필요한 자율주행 기술과 차량용 ADAS 기술은 약 80%가량 동일하다"며 "시장 진출을 위한 기초 작업을 이미 진행하고 있고, 국내 잠재 고객사들을 중심으로 내년부터 본격적으로 사업화를 진행할 생각"이라고 강조했다. 한편 넥스트칩은 기존 주력 사업인 ISP, AHD 등도 올해와 내년 견조한 수요를 기록할 것으로 내다봤다. 특히 내년 하반기에는 영업이익 또한 분기 기준 흑자전환에 성공하는 것을 목표로 하고 있다. 앞서 넥스트칩은 지난해 연간 매출액 162억원, 영업손실 225억원을 기록한 바 있다. 김 대표는 "올해 매출은 전년 대비 2배 이상을 기록할 것으로 예상하고, 내년 하반기에는 분기 기준 흑자 전환을 기록하는 것이 목표"라며 "사업 특성상 차세대 칩 개발에만 1천억 원 이상이 소요되기 때문에, 선제적으로 매출처를 확보하는 데 주력할 것"이라고 밝혔다.

2024.09.22 12:00장경윤

ISC, 차세대 AI칩 테스트 소켓 'WiDER-FLEX' 첫 공개

반도체 부품 기업 아이에스시(ISC)는 이달 4일부터 6일까지 대만 타이베이에서 열린 '세미콘 타이완 2024'에서 최신 AI용 반도체 테스트 소켓을 포함한 다양한 신제품을 공개했다고 11일 밝혔다. '세미콘 타이완 2024'는 대만의 반도체 및 하이테크 산업을 배경으로 약 1천100개 이상의 기업이 참가해 기술력을 선보이는 전시회다. 이 자리에서 아이에스시는 특히 'WiDER-FLEX' 소켓으로 많은 관심을 받았다. 'WiDER-FLEX'는 기존 WiDER 브랜드의 3세대 버전으로, 대형 패키징 전용 테스트 소켓이다. 최근 AI 서버 시장의 확대와 함께 패키징 대형화가 진행됨에 따라 이러한 변화에 맞춘 제품 수요가 급증하고 있다는 점에서 주목받고 있다. 아이에스시 관계자는 "'WiDER-FLEX'는 초대형 사이즈 칩 테스트 시 필요한 작동 범위와 접촉 압력을 기존 제품 대비 30% 이상 개선한 제품"이라며 "특히 생성형 AI를 위한 GPU, CPU, NPU 등의 하이엔드 반도체 테스트에 탁월한 성능을 보여 대만 현지 글로벌 OSAT와 파운드리 담당자들의 높은 관심을 받았다"고 밝혔다. 또한 "현재 글로벌 반도체 시장에서 우월한 위치를 차지하고 있는 대만에서 자사의 기술력을 알릴 수 있게 되어 뜻 깊다"며 "지속적인 연구개발 투자와 증가하는 AI 반도체 테스트 소켓 매출로 계속 성장하는 기업이 되겠다"고 강조했다.

2024.09.11 09:52장경윤

퀄컴, 스냅드래곤 X 플러스 8코어 SoC 추가 출시

퀄컴이 4일 오후 1시(베를린 현지시간, 한국시간 오후 8시) 독일 베를린에서 진행한 프레스 컨퍼런스에서 8코어를 탑재한 스냅드래곤 X 플러스 SoC를 추가 출시했다. 퀄컴은 지난 6월 중순 최대 12코어를 탑재한 스냅드래곤 X 엘리트, 10코어를 탑재한 스냅드래곤 X 플러스 등 두 개 SoC를 출시했다. 이날 공개한 스냅드래곤 X 플러스 8코어 모델은 단가가 중요한 기업용·상업용 PC 시장을 겨냥했다. 이날 크리스티아노 아몬 퀄컴 CEO는 "현재 기업들은 AI 기능이 없는 노트북 구매에 900달러(약 120만원)를 쓰고 있으며 긴 배터리 지속시간과 AI 기능, 성능을 700달러(약 94만원) 선에서 제공할 수 있다면 이를 안 살 기업이 없을 것"이라고 강조했다. ■ CPU·GPU 성능 낮추고 NPU는 45TOPS급으로 유지 스냅드래곤 X 시리즈는 퀄컴이 자체 개발한 '오라이온'(Oryon) CPU 코어의 갯수와 작동 클록, 캐시 메모리 용량과 GPU 성능을 조절해 차등을 뒀다. 이번에 투입된 8코어 SoC(X1P-46-100, X1P-42-100)는 최대 3.4GHz, 1코어 최대 4GHz로 작동하며 아드레노 GPU 성능에 제한을 뒀다. 그러나 NPU(신경망처리장치) 성능은 45 TOPS(초당 조 횟수의 연산 처리) 급으로 동일하게 유지했다. 크리스티아노 아몬 퀄컴 CEO는 프로세서 벤치마크 프로그램 '긱벤치 6.2' 실행 결과를 토대로 "스냅드래곤 X 플러스 8코어(X1P-46-100)는 인텔 코어 울트라7 155U와 소모전력 10W 선에서 비교할 때 최대 61% 더 빠르다"고 밝혔다. 이어 같은 방법으로 AMD 라이젠 7 8840U 프로세서를 비교하며 "스냅드래곤 X 플러스 8코어 모델은 소모전력 12W 공급시 AMD 대비 최대 22% 빠르다"고 강조했다. ■ "700달러대에 살 수 있는 AI PC는 좋은 거래" 크리스티아노 아몬 퀄컴 CEO는 "700달러(약 94만원) 선에서 인텔·AMD 프로세서 대비 더 좋은 노트북을 살 수 있다면 이것은 분명히 좋은 거래이며 윈도 PC의 전환을 가속할 것"이라고 설명했다. 이어 "기업 환경과 상업용 환경에서 필요한 모든 소프트웨어가 퀄컴 스냅드래곤에 최적화된 상태로 작동하도록 노력할 예정이다. 보안 접속을 위해 필요한 VPN(가상사설망) 중 널리 알려진 노드VPN, 익스프레스VPN이 스냅드래곤을 지원하며 구글 드라이브 앱도 4분기 중 정식 지원될 것"이라고 말했다. 삼성전자는 스냅드래곤 X 플러스 8코어 SoC 공개 시점에 맞춰 이를 탑재한 갤럭시북4 엣지 15형 모델을 공개했다. 레노버, 델테크놀로지스, HP 등 주요 PC 제조사는 스냅드래곤 X 플러스 8코어 SoC 탑재 PC를 이르면 이달 말부터 전세계 시장에 공급 예정이다.

2024.09.04 21:46권봉석

삼성전자, 인텔 AI칩 탑재 '갤럭시 북5 프로 360' 공개

삼성전자가 4일(현지시간) 차세대 인텔 AI 칩셋을 탑재한 코파일럿+ PC '갤럭시 북5 프로 360'을 공개했다. '갤럭시 북5 프로 360'은 최대 47 TOPS의 NPU를 지원하는 '인텔 코어 울트라 프로세서 시리즈 2 (코드명 루나레이크)'를 탑재해 폭넓은 AI 애플리케이션 호환성을 자랑한다. '갤럭시 북5 프로 360'은 인텔 아크 GPU(Intel ARC GPU)로 최대 17% 향상된 그래픽 성능을 지원한다. 비전 부스터(Vision Booster)가 탑재된 고해상도의 다이내믹 아몰레드(Dynamic AMOLED) 2X 디스플레이, 3K 수준의 고해상도, 120Hz의 주사율은 보다 섬세하고 선명한 스크린 경험을 제공한다. 또한 컬러 볼륨 120 %의 풍부한 색감과 깊은 명암비는 그래픽 작업은 물론 영화, OTT 등 다양한 콘텐츠의 몰입감을 더욱 높여준다. 마이크로소프트의 '폰 링크(Phone Link)' 기능을 활용해 '갤럭시 북5 프로 360'과 갤럭시 스마트폰을 연결하면 서클 투 서치(Circle to Search), 채팅 어시스트(Chat Assist), 실시간 통역(Live Translate) 등 스마트폰에서 지원되는 '갤럭시 AI'의 다양한 기능을 PC의 대화면에서도 즐길 수 있다. '갤럭시 북5 프로 360'은 돌비 애트모스(Dolby Atmos®)가 적용된 강력한 4개의 스피커와 함께 더 커진 우퍼가 장착돼 풍부하고 깊은 저음을 구현한다. 또한 S펜은 한 차원 업그레이드 된 PC 경험을 완성해 주며, 가볍고 얇은 슬림 디자인으로 이동성 또한 강화됐다. 뿐만 아니라 고용량 배터리는 영상 재생 기준으로 최대 25시간 사용을 지원한다. '갤럭시 북5 프로 360'은 Wi-Fi 7을 지원해 더욱 빠르고 안전한 인터넷 연결이 가능하다. 또한, 강력한 보안 플랫폼 '삼성 녹스(Samsung Knox)'는 별도의 보안칩을 통해 악의적인 외부의 공격으로부터 펌웨어 등 시스템 데이터를 더욱 안전하게 보호해준다. '갤럭시 북5 프로 360'은 그레이와 실버 두가지 색상으로 제공되며 독일, 미국, 영국, 프랑스, 캐나다 등에서 9월부터 판매될 예정이다. 국내 출시는 연내로 예정돼 있다. 김학상 삼성전자 MX사업부 NC개발팀장(부사장)은 "업계 리더들과의 긴밀한 협력을 통해 선보이는 '갤럭시 북5 프로 360'은 사용자의 일상과 업무를 더욱 쉽고 편리하고 보다 효율적으로 만들어 줄 것"이라며 "갤럭시 북5 프로 360은 갤럭시 AI 생태계를 더욱 강화하고 AI PC 대중화를 선도할 것"이라고 말했다.

2024.09.04 15:27장경윤

"AI 성능 3배"…LG전자, 차세대 인텔 프로세서 탑재 'LG 그램' 공개

LG전자가 인텔의 차세대 프로세서를 탑재한 'LG 그램(gram)'을 공개한다. 초경량 디자인은 물론, 역대 최고로 강력해진 성능을 앞세워 초경량 프리미엄 노트북 리더십을 공고히 한다는 전략이다. LG전자는 이달 6일부터 독일 베를린에서 열리는 'IFA 2024'를 앞두고 진행된 인텔의 차세대 프로세서 출시 행사에서 '인텔 코어 Ultra 프로세서'를 탑재한 16형 'LG 그램 프로(Pro)'을 처음 선보였다고 4일 밝혔다. LG 그램 프로에 탑재된 새로운 프로세서의 AI 처리 성능은 이전 세대 대비 3배 더 강력해졌다. 전력 효율은 최대 40%, 그래픽 성능도 최대 50% 더 향상됐다. 특히 인공지능 연산에 특화된 신경망처리장치(NPU) 성능 역시 크게 향상됐다. NPU는 AI 작업에 필요한 복잡한 수학 연산을 효율적으로 처리하는 전용 프로세서로 뛰어난 효율성과 성능, 전력 절감 효과 등이 장점이다. 네트워크 연결 없이도 기기 자체에서 AI 연산을 수행하는 '온디바이스 AI'를 구현하기 위한 핵심 요소로 손꼽힌다. 인텔의 차세대 프로세서에 탑재된 NPU는 '초당 최고 48조 회 연산(48TOPS)'이 가능하다. 이전 세대 대비 4배 이상 향상된 AI 연산 성능을 기반으로 최신 생성형 AI는 물론, 다양한 AI 서비스 기능을 쾌적하게 수행할 수 있다. LG 그램 프로는 그램 본연의 초경량 정체성을 유지하면서도 LG 그램 시리즈 가운데 가장 뛰어난 성능을 갖춘 최상위 라인업이다. 새롭게 설계된 내부 구조와 강화된 발열 제어 시스템 등을 기반으로 고성능 노트북은 휴대성이 떨어진다는 고정관념을 깼다. 특히 제품에 탑재된 'AI 그램 링크' 기능으로 최대 10대의 안드로이드 및 iOS 기기와 사진 등을 간편하게 주고받거나 화면을 공유할 수 있다. 또한 AI가 사진을 분석해 인물, 장소, 날짜 등 39개 카테고리에 따라 자동으로 분류해 주는 등 편의성도 뛰어나다. LG전자는 이번 공개된 'LG 그램 프로 16'을 포함, 차세대 AI 프로세서를 탑재한 LG 그램 시리즈를 연내 글로벌 주요 시장에 순차 출시할 예정이다. 글로벌 시장조사기관 IDC에 따르면 노트북을 포함, 올해 글로벌 PC 출하량은 전년 대비 2% 증가한 2억6천540만 대에 이를 전망이다. IDC는 AI PC의 등장이 PC 시장 확대를 이끌 것이라며 오는 2027년에는 전체 PC 출하량 가운데 AI PC의 비중이 약 60%까지 증가할 것으로 예상했다. 이윤석 LG전자 IT사업부장은 “LG 그램은 출시 이래 끊임없는 도전과 혁신으로 초경량 노트북 트렌드를 선도해 왔다”며 “인텔의 차세대 프로세서를 기반으로 진정한 프리미엄 AI PC의 기준을 제시할 것”이라고 말했다.

2024.09.04 09:00장경윤

인텔, AI PC 활용 돕는 S/W 'AI 플레이그라운드' 소개

인텔이 3일 오후(베를린 현지시간, 한국시간 4일 새벽 1시) 진행한 코어 울트라 200V(시리즈2, 루나레이크) 출시 행사에서 일반 소비자의 AI PC 활용을 돕는 무료 소프트웨어 'AI 플레이그라운드'(AI Playground)를 소개했다. 이날 댄 로저스(Dan Rogers) 인텔 클라이언트 컴퓨팅 그룹 클라이언트 성능 마케팅 랩 총괄은 "인텔은 클라우드 도움 없이 AI를 PC에서 직접 실행할 수 있는 하드웨어를 갖추고 있지만 이를 활용하려면 AI 모델 다운로드와 스크립트 실행 등 복잡한 절차가 필요하다"고 설명했다. AI 플레이그라운드는 인텔이 오픈소스 저장소 '깃헙'에 무료로 공개한 AI 소프트웨어다. 코어 울트라 H시리즈(메테오레이크)와 8GB 이상 메모리를 탑재한 인텔 아크 A750/A770 그래픽카드와 호환된다. 윈도 운영체제에서 간편히 설치 가능한 것이 가장 큰 장점이다. 댄 로저스 총괄은 "AI 플레이그라운드는 인텔 PC에서 실행하기에 적합한 다양한 AI 모델을 쉽게 선택할 수 있다. 스테이블 디퓨전을 이용한 이미지 생성시 클라우드 도움 없이 아크 GPU만 활용해 거의 즉시 실행된다"고 밝혔다. AI 플레이그라운드는 검색-증강 생성(RAG)이 적용된 SLM(소형언어모델)도 탑재했다. SLM이 알지 못하는 최신 정보나 지식을 학습시키는 것도 가능하다. 댄 로저스 총괄은 "인텔 PC에 저장된 데이터로 구동되는 개인용 챗봇"이라고 설명했다. 이어 "AI 플레이그라운드는 개방돼 있고 누구나 접근 가능하며 보안 면에서 안전하다. PC에서 AI를 처음 활용할 때 간편하게 쓸 수 있는 유용한 도구"라고 덧붙였다. 오픈소스 저장소 '깃헙'에 현재 등록된 베타버전은 코어 울트라 H시리즈(메테오레이크)만 지원한다. 인텔은 코어 울트라 200V 탑재 PC 출시 시점을 전후해 아크 130V/140V GPU를 지원하는 업데이트도 공개 예정이다.

2024.09.04 04:32권봉석

퓨리오사AI, 차세대 AI칩 '레니게이드' 공개

AI 반도체 스타트업 퓨리오사AI는 미국 현지시간 기준 26일 'Hot Chips 2024' 컨퍼런스에서 2세대 AI 반도체 RNGD(레니게이드)를 공개했다고 28일 밝혔다. 퓨리오사의 2세대 AI 반도체 RNGD는 거대언어모델(LLM) 및 멀티모달모델의 효율적인 추론을 위해 설계된 데이터센터용 가속기다. 국내 팹리스가 Hot Chips 행사에서 신제품 발표자로 선정된 것은 최초다. HBM3가 탑재된 추론용 AI 반도체에 대한 행사 현장의 관심과 반응도 높았던 것으로 전해진다. 이날 백준호 대표는 '퓨리오사 RNGD: 지속 가능한 AI 컴퓨팅을 위한 텐서 축약 프로세서(Tensor Contraction Processor)'라는 주제로 제품 소개 및 초기 벤치마크를 공개하며, Llama 3.1 70B의 라이브 데모를 선보였다. 초기 테스트 결과 RNGD는 GPT-J 및 Llama 3.1과 같은 주요 벤치마크 및 LLM에서 경쟁력 있는 성능을 보였으며, 단일 PCIe 카드 기준으로 약 100억 개의 파라미터를 가진 모델에서 초당 2천~3천개의 토큰을 처리할 수 있는 성능을 나타냈다. RNGD는 범용성과 전력 효율의 균형을 이룬 텐서 축약 프로세서(TCP) 기반 아키텍처다. 주요 GPU의 TDP가 1000W 이상인 것에 비해, 150W TDP의 높은 효율성을 갖췄다. 또한 48GB HBM3 메모리를 탑재해 Llama 3.1 8B와 같은 모델을 단일 카드에서 효율적으로 실행 가능하다. 퓨리오사AI는 2017년 삼성전자, AMD, 퀄컴 출신의 세 명의 공동 창업자에 의해 설립된 이후, 지속적인 기술 혁신과 제품 양산에 집중해 왔다. 그 결과 TSMC로부터 첫RNGD 샘플을 올 5월에 받은 후 빠른 속도로 브링업을 완료했다. 소프트웨어 역량도 강화했다. 퓨리오사AI는 2021년 당시 출시된 1세대 칩 첫 샘플을 받은 지 3주 만에 브링업을 완료하고 MLPerf 벤치마크 결과를 제출한 바 있으며, 이후 컴파일러 개선만을 통해 성능을 113% 향상시킨 바 있다. 백준호 퓨리오사AI 대표는 "이번 Hot Chips에서 RNGD를 글로벌 시장에 공개하고 빠른 초기 브링업 결과를 발표할 수 있었던 것은 회사의 기술 개발이 하나의 결실을 맺은 것”이라며 “RNGD는 업계의 실질적인 추론 니즈를 충족시킬 수 있는 지속 가능하고 현실적인 AI 컴퓨팅 솔루션”이라고 강조했다. 그는 이어 “우리 제품이 LLM을 효율적으로 연산할 수 있다는 것을 증명하였다는 것은 회사가 다음 성장 단계에 접어들었다는 것을 의미한다"며 "팀의 헌신과 지속적인 노력에 대해 매우 자랑스럽고 감사하다”고 말했다. 아디티아 라이나 GUC 최고마케팅책임자(CMO)는 "퓨리오사AI와의 협력으로 성능과 전력 효율성 모두 뛰어난 RNGD를 시장에 선보이게 됐다"며 "퓨리오사AI는 설계에서부터 양산 샘플 출시까지 탁월한 역량을 보여주며, 업계에서 가장 효율적인 AI 추론 칩을 출시하게 되었다"고 밝혔다.

2024.08.28 15:04장경윤

'韓 반도체' 미래기술 로드맵 나왔다…CFET·3D 메모리 주목

국내 반도체 산업의 경쟁력 강화를 위한 전략이 한층 고도화된다. 기존 선정된 45개 연구주제에 더해, CFET과 3D 적층 등 14개 핵심기술이 추가 과제로 선정됐다. 27일 '2024 반도체 미래기술 로드맵 발표회'가 양재 엘타워에서 진행됐다. 앞서 정부는 지난해 5월 반도체 초격차 기술 확보를 위한 반도체 미래기술 로드맵을 발표한 바 있다. 해당 로드맵에는 고집적 메모리·AI 반도체·첨단 패키징 및 소부장 등이 포함됐다. 추진 전략은 크게 설계 소자·설계·공정 등 세 가지로 나뉜다. 세부적으로는 ▲D램·낸드 신소자 메모리 및 차세대 소자 개발 ▲AI·6G·전력·차량용 반도체 설계 분야 원천기술 선점 ▲전·후공정 분야 핵심기술 확보로 소재·장비·공정 자립화 등이다. 이번 발표회에서는 지난해 추진 전략을 고도화한 신규 로드맵이 발표됐다. 반도체 기술이 나노미터(nm)를 넘어 옹스트롬(0.1nm)으로 넘어가는 추세에 선제 대응하기 위해, 연구주제를 기존 45개에서 59개로 총 14개 추가한 것이 주 골자다. 새롭게 추가된 주요 과제로는 CFET과 3D 메모리 등이 있다. CFET은 가장 최근 상용화된 트랜지스터 구조인 GAA(게이트-올-어라운드)를 또 한번 뛰어넘는 기술로, GAA를 수직으로 쌓아 올리는 구조다. 3D 메모리는 기존 수평으로 집적하던 셀(Cell)을 수직으로 적층하는 기술을 뜻한다. 정부 역시 반도체 분야 R&D 투자에 더 많은 지원을 펼치고 있다. 정부의 예산 투자 규모는 지난해 5천635억원에서 올해 6천361억원으로 12.8% 증가했다. 김형준 차세대지능형반도체사업단 단장은 "AI 반도체 시장이 부흥하고 있는 만큼 국내에서도 1페타바이트 급의 NPU(신경망처리장치) 개발을 추진할 것"이라며 "하이브리드 본딩과 고방열 소재, 광패키징 등 최첨단 패키징 분야도 새롭게 로드맵에 추가했다"고 밝혔다.

2024.08.27 17:35장경윤

칩스앤미디어, 中 AI 반도체 기업과 JV 설립

글로벌 비디오IP 기술 선도기업 칩스앤미디어는 26일 이사회 결정을 통해, 중국 AI SOC 기업과 조인트벤처(이하, JV)를 설립한다고 27일 밝혔다. 조인트벤처 설립의 목표는 ▲중국 시장내 자체 IP 재판매 ▲기존 IP기반 데이터센터용 특화 IP를 추가 개발로 중국 데이터센터 시장 직접 공략 ▲중국내 영업 경쟁력 강화 ▲JV향 반도체 설계 라이선스 매출 극대화 등이다. 최근 중국은 미중 반도체 전쟁으로 자체 반도체 생태계를 구축하기 위해 엔비디아의 GPU를 대체하려는 움직임이 활발한 상황이다. 이에 따라 자체 GPU나 AI SoC(NPU) 개발을 강화하고 있으며, 경기 악화에도 불구하고 팹리스 기업이 2010년 약 600곳에서 2023년 기준 3천450여곳으로 크게 급증하고 있다. 실제로 이번 JV 설립 상대회사는 중국 내 AI반도체 특화 기술 경쟁력이 높은 회사다. 칩스앤미디어의 장기 고객이기도 해 비즈니스 협업관계가 높아 시너지가 기대된다. 그동안 칩스앤미디어는 온-디바이스 AI 성장 기회에 맞춰 해외사업을 적극 모색해 왔다. 김상현 칩스앤미디어 대표이사는 "최근 중국내 반도체 굴기, 독자적 반도체 생태계 구축 의지가 강해 중국 지방정부 및 테크 기업의 AI 반도체 수요도 꾸준히 증가하고 있다"며 "중국 반도체 생태계 합류로 중국내 데이터센터 공략과 자체 IP의 재판매 더 나아가 제품 고도화 등을 통해 중국 반도체 시장 선점에 나설 것"이라고 밝혔다.

2024.08.27 09:03장경윤

PC AI 성능 측정 벤치마크 프로그램 '긱벤치 AI' 등장

PC와 스마트폰 성능 비교에 가장 흔히 쓰이는 것이 바로 벤치마크 프로그램이다. 통제된 환경에서 서로 다른 회사(혹은 같은 회사) 프로세서나 제품 성능을 수치와 그래프로 가장 잘 비교할 수 있기 때문이다. 예를 들어 CPU 성능 비교에는 마이크로소프트 오피스 기반 자동화된 스크립트로 반응 시간을 측정하는 PC마크나 UL 프로시온을, GPU 성능 비교는 3D마크(3DMark)나 각종 게임에 내장된 벤치마크 모드를 활용할 수 있다. 그러나 지난 해 말부터 등장한 AI PC의 실제 처리 성능을 정확히 측정할 수 있는 소프트웨어는 없었다. 윈도 운영체제 탑재 PC 성능 비교용으로 널리 쓰이는 UL 프로시온 역시 AI 이미지 생성 벤치마크와 AI 컴퓨터 비전 벤치마크를 내장했지만 맥OS는 지원하지 않았다. PC·스마트폰용 프로세서 성능 비교에 널리 쓰이는 '긱벤치'(Geekbench)를 만든 프리미티브랩스는 최근 AI 성능 측정용 벤치마크인 '긱벤치 AI 1.0'을 정식 출시했다. 인텔과 AMD 등 x86 기반 프로세서, 애플 M시리즈와 퀄컴 스냅드래곤 등 Arm 기반 PC에서 보다 폭 넓은 비교가 가능하다. ■ 주요 PC 프로세서, AI 성능 TOPS로 비교 AI 처리 성능에는 다양한 요소가 작용한다. 먼저 CPU 뿐만 아니라 NPU와 GPU가 함께 개입하는데다 FP32(부동소수점, 32비트), FP16(부동소수점, 16비트)나 INT8(정수, 8비트) 등 데이터 정밀도도 영향을 미친다. 여기에 각 운영체제나 프로세서 제조사마다 지원하는 AI 처리용 라이브러리에도 차이가 있다. 인텔은 AI 실행을 위한 자체 라이브러리 '오픈비노'를 제공하며 마이크로소프트 윈도 운영체제는 ONNX 런타임을 지원한다. 애플은 M 시리즈 실리콘에 내장된 NPU를 활용할 수 있는 라이브러리인 코어ML을 이용한다. 지금까지 각 제조사는 NPU 성능을 비교하기 위한 요소로 TOPS(1초 당 1조 번 AI 연산)를 내세웠지만 이는 어디까지나 계산상으로 얻은 값이며 실제 성능을 정확히 반영하기 어렵다. ■ 긱벤치 AI, 폭넓은 운영체제·프로세서 지원 프리미티브랩스가 지난 14일 공개한 긱벤치 AI는 윈도11과 맥OS 등 다양한 운영체제는 물론 인텔, 퀄컴, 애플, AMD가 제공하는 최적화된 라이브러리를 모두 활용한다. 인텔 오픈비노, 마이크로소프트 ONNX, 애플 코어ML을 지원하며 지원 운영체제 역시 윈도와 맥OS로 확대했다. CPU와 NPU 별로 지원하는 라이브러리와 데이터 정밀도를 달리하며 작동 시간을 측정한다. 이를 활용하면 정밀도 별 CPU나 NPU 작동 특성, ONNX 런타임이나 코어ML 등 운영체제 제공 라이브러리 별 특성 비교에도 도움이 될 것으로 예상된다. ■ 소비자와 업계에 TOPS 벗어난 실제 성능 제시 가능 긱벤치 AI 역시 한정된 시나리오에서 성능을 평가한다는 한계를 지녔다. 그러나 프로세서·GPU 제조사가 아닌 제3의 회사가 만든 중립적인 벤치마크 프로그램이 늘어났다는 데 의미가 있다. 오는 9월 인텔 코어 울트라 시리즈2(루나레이크)를 시작으로 이르면 내년 상반기 등장할 스냅드래곤 X 엘리트/플러스 2세대 등이 등장하는 시점에는 AI PC의 성능에 대한 보다 객관적인 비교가 가능해질 것으로 보인다.

2024.08.25 11:53권봉석

리벨리온, 차세대 AI칩 '리벨-쿼드' 양산 앞당긴다…"삼성 지원 덕분"

"회사의 최신 NPU 아톰은 중동 아람코 등 주요 잠재 고객사와의 긴밀한 협의로 올해 4분기 매출 성장을 기대하고 있습니다. 이 칩은 경쟁사 대비 성능과 전력 효율성을 모두 높인 것이 장점이죠. 다음 세대 칩인 '리벨-쿼드'도 삼성전자의 많은 지원 덕분에 생산 일정을 올해 말에서 내년 초 정도로 앞당길 수 있을 것으로 보입니다." 오진욱 리벨리온 CTO는 최근 경기 성남시 소재 사무실에서 기자들과 만나 회사의 AI 반도체 개발 및 상용화 로드맵에 대해 이같이 말했다. 리벨리온은 지난 2020년 설립된 국내 AI 반도체 스타트업이다. 올해 상반기에는 회사의 2번째 NPU(신경망처리장치) 칩인 '아톰(ATOM)'의 양산을 시작했다. 아톰은 5나노미터(nm) 공정을 기반으로, 128TOPS(1초 당 128조번의 정수 연산) 및 32TFLOPS(1초 당 32조번의 부동소수점 연산)의 성능을 갖췄다. 특히 전력 소모량이 보편적인 GPU 대비 5분의 1에 불과한 것이 특징이다. ■ 칩 넘어 '랙 솔루션' 준비…아람코에 4분기 공급 목표 리벨리온이 아톰을 통해 거둔 가장 최근의 성과는 지난달 사우디아라비아 국영 석유그룹 아람코로부터 200억원 규모의 투자를 유치한 것이다. 이를 통해 리벨리온은 사우디에 현지 법인을 설립하고, 사우디 정부가 추진하는 소버린(주권) AI 인프라와 서비스 구축을 지원할 예정이다. 오진욱 CTO는 "중동은 공급망 및 보안 이슈로 자체 LLM(거대언어모델) 구축을 원하고 있는데, 데이터센터에 리벨리온의 NPU를 랙(복수의 서버를 저장할 수 있는 특수 프레임) 형태로 도입하는 방안을 논의 중"이라며 "카드 형태는 소량 발주됐으며, 랙 단위로는 올 4분기 매출을 발생시키는 게 목표"라고 설명했다. 이를 위해 리벨리온은 HP, 델, 레노버, 슈퍼마이크로 등 서버 OEM 업체들과도 적극적으로 협력하고 있다. 리벨리온이 자사 NPU를 고객사에 실제 공급하기 위해선 칩에 여러 인터페이스 기능을 추가한 카드나, 이 카드를 여러 개 모은 서버·랙 등의 형태로 제작해야 하기 때문이다. 오진욱 CTO는 "NPU 자체도 중요하지만, 이를 기반으로 한 서버 랙 역시 데이터센터의 발열, 성능 등에 영향을 미치기 때문에 매우 중요하다"며 "아톰 칩은 저전력 설계로 서버 하나에 칩을 240~250개가량 집적할 수 있어, 고성능 서버 구축을 원하는 중동 고객사에게 수요가 있다"고 밝혔다. ■ 소프트웨어 기술력도 강점…'RSD'가 핵심 무기 현재 서버용 AI 가속기 시장에서는 HBM(고대역폭메모리)가 각광받고 있다. HBM은 여러 개의 D램을 수직으로 적층해 일반 D램 대비 대역폭을 수십 배 끌어올린 메모리다. 대역폭은 데이터가 송수신되는 통로로, 넓으면 넓을수록 데이터를 빠르게 처리할 수 있다. 반면 아톰은 HBM이 아닌 GDDR(그래픽 D램)을 채용했다. 그럼에도 리벨리온이 아람코 등에서 협업을 얻어낼 수 있었던 이유는, GDDR로도 저전력·고효율 데이터 처리 성능을 구현할 수 있는 자체 소프트웨어 기술을 갖추고 있었기 때문이다. 오진욱 CTO는 "GDDR을 여러 개 붙여 HBM과 비슷한 대역폭을 구현하는 동시에, 전력 소모량은 HBM보다 적도록 메모리 컴포넌트 등의 기술력을 확보했다"며 "또한 각 칩을 효율적으로 운용할 수 있도록 만드는 RSD 기술력도 중요하다"고 말했다. RSD는 'Rebellions Scalable Design'로, 리벨리온이 자체 개발한 분산 컴퓨팅용 소프트웨어 스택이다. 방대한 데이터 처리가 필요한 LLM은 140~180GB(기가바이트)에 달하는 메모리 용량이 필요하다. 이는 일반적인 AI 가속기 카드 하나로는 수용하기 어려운 용량인데, 결과적으로 이를 여러 카드에 나눠 데이터를 처리해야 한다. 이 여러 개의 카드가 단일 카드처럼 잘 작동하도록 만드는 기술이 RSD다. 오진욱 CTO는 "여러 개의 카드를 구동하는 데 필요한 컴파일러, 인터페이스 등을 가장 효율적으로 사용하는 방식을 파악해내는 게 RSD의 핵심"이라며 "이를 위해 메모리 제조사나 엔비디아 등 거대 기업을 제외하면 PCIe 5.0(고속 데이터 전송용 표준)을 제일 빨리 도입하기도 했다"고 강조했다. ■ "차세대 '리벨-쿼드' 양산, 삼성 협업으로 일정 앞당길 것" 나아가 리벨리온은 성능을 더 높인 차세대 NPU '리벨'을 이르면 올 연말 출시한다. 리벨은 삼성전자 파운드리 4나노미터(nm) 공정을 기반으로, 삼성전자의 36GB HBM3E 12단(5세대 고대역폭메모리)을 처음으로 탑재한다. 리벨 개발이 완료되는 경우, 리벨리온은 리벨 칩 4개를 칩렛 구조로 집적한 '리벨-쿼드'를 실제 제품으로 상용화할 계획이었다. 리벨-쿼드는 총 4개의 HBM3E을 탑재하기 때문에 메모리 용량이 144GB로 확장되며, 대역폭을 4.8TB/s까지 구현할 수 있을 것으로 예상된다. 칩렛은 기능별로 각 칩을 제작한 뒤 단일 칩에 붙이는 최첨단 패키징 기술이다. 특정 용도에 맞춰 칩을 이종집적하기 때문에 설계 유연성이 높고, 고속 인터커넥트를 활용하면 전체 시스템의 성능을 높일 수 있어 단일 칩 제작보다 성능을 강화할 수도 있다. 당초 리벨-쿼드는 2026년을 전후로 개발이 완료될 것으로 예상됐으나, 최근 일정이 앞당겨졌다. 이르면 올해 말이나 내년 초에 제작이 가능해질 전망이다. 오진욱 CTO는 "삼성전자의 적극적인 지원으로, 리벨 싱글 제품과 같은 일정으로 쿼드 제품을 출시하는 것이 가능해질 것으로 판단한다"며 "설계 유연성이 높은 칩렛 기술을 적용했기 때문에 다양한 서버 고객사의 요구에 부응할 수 있을 것"이라고 말했다. ■ "사피온과의 합병, 시너지 효과 구상 중" 앞서 리벨리온은 이달 18일 국내 또다른 AI 반도체 기업 사피온코리아와의 합병을 위한 본계약을 체결한 바 있다. 합병 후 존속법인은 '사피온코리아'로 하고, 리벨리온 경영진이 합병법인을 이끌기로 하면서 새 회사의 사명은 '리벨리온'으로 결정됐다. 박성현 리벨리온 대표가 합병법인의 경영을 맡게 될 예정이다. 이와 관련해 오진욱 CTO는 "사피온은 당사와 동일한 NPU 개발사이나, 지금까지 주력하는 사업 모델들과 파트너사들이 달랐기 때문에 서로 다른 시각을 가진 부분이 있다"며 "이러한 부분들을 종합하고 각자의 장점을 채택해서 더 좋은 솔루션을 개발할 수 있을 것"이라고 설명했다. 합병 이후 파운드리 이원화 가능성에 대해서는 유보적인 입장을 취했다. 현재 리벨리온은 삼성전자와, 사피온은 대만 주요 파운드리 TSMC에 칩 제작을 의뢰하고 있다. 오진욱 CTO는 "삼성전자와 리벨 칩 개발에 집중하고 있기 때문에 현재로선 이원화는 고려하고 있지 않다고 보는 게 맞다"며 "삼성전자가 메모리부터 파운드리, 패키징에 이르는 다양한 공정을 턴키 서비스로 제공할 수 있기 때문에 많은 이점이 있다고 생각한다"고 밝혔다.

2024.08.22 09:00장경윤

  Prev 1 2 3 4 5 6 7 8 Next  

지금 뜨는 기사

이시각 헤드라인

정부 AI 예산 역대 최대…소프트웨어·클라우드 투자는 '실종'

백종원 더본코리아 ”K-소스 5년 후 최소 1천억 매출”

'전승절 열병식' 시진핑 의전차 주목…중국판 롤스로이스라는데

LG엔솔, 벤츠 전기차에 배터리 공급계약...15조 규모 추정

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.