• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
창간특집
인공지능
배터리
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'스퀴즈비츠'통합검색 결과 입니다. (2건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

스퀴즈비츠, LLM서빙 최적화 '핏츠 온 칩스' 선보여

- LLM 서빙에 필요한 모든 단계를 원스톱으로 지원…시간과 비용 획기적으로 줄여 - 엔비디아의 GPU, 인텔의 가우디 등 비교 가능한 하드웨어 범위 확대 AI 경량화 및 최적화 전문 스타트업 스퀴즈비츠(대표 김형준)는 대형언어모델(LLM) 서빙을 위한 맞춤형 솔루션 '핏츠 온 칩스(Fits on Chips)'를 출시했다고 3일 밝혔다. '핏츠 온 칩스'는 LLM 서빙 전 과정을 단순화하고 최적의 설정을 찾을 수 있도록 돕는 솔루션이다. 모델 선택 단계부터 서빙 옵션 조정, 장치 및 프레임워크 설정, 성능 평가, 배포까지 LLM 서빙에 필요한 모든 단계를 원스톱으로 지원한다. 허깅페이스 등 오픈소스 라이브러리와 연동해 다양한 LLM 모델을 손쉽게 통합하고 성능을 비교 평가해 최적의 LLM 서빙 설정 값을 찾아 적용하는 방식이다. 이를 통해 엔지니어의 기존 작업 시간을 30시간에서 3시간까지 기존보다 10분의 1로 줄일 수 있고, 비용도 약 2배 이상 절약할 수 있다고 회사는 설명했다. '스퀴즈비츠'는 최근 인텔, 네이버와 함께 인텔의 가우디 하드웨어에서 LLM을 효율적으로 작동시키기 위한 협업 프로젝트를 진행하고 있다. 이번 협업을 통해 엔비디아의 GPU에 이어 인텔의 가우디까지 '핏츠 온 칩스'의 지원 범위를 확장했다. 추후 다양한 하드웨어를 비용, 속도 관점에서 비교할 수 있도록 제공할 방침이다. 하드웨어뿐 아니라 vLLM, TensorRT-LLM과 같은 프레임워크를 다각도로 비교 분석하는 기능도 제공한다. 사용자는 분석 결과를 바탕으로 최적화한 LLM 서빙 환경을 구축해 인프라의 전체적인 효율을 극대화할 수 있다. 추후 AI에이전트를 연동하거나 AMD, 아마존, 구글 등의 하드웨어를 지원하는 등 더 다양한 모델과 하드웨어, 서버 환경 등을 지원할 수 있게 확장할 계획이다. 스퀴즈비츠 김형준 대표는 “누구나 쉽게 LLM 서빙을 시뮬레이션하고 분석해볼 수 있도록 제품을 설계하고 개발했다”며 “앞으로도 LLM 서빙 솔루션을 비롯한 다양한 기술 개발을 통해 AI 서비스 기업의 성능 최적화와 비용 절감을 적극 지원하겠다”고 밝혔다. 한편 2022년 3월 설립한 스퀴즈비츠는 AI 서비스 비용 절감을 위해 AI 경량화 및 최적화 기술을 개발하는 딥테크 스타트업이다. 서울대, 포스텍, 카이스트 AI 연구진과 AI 분야에서 오랜 기간 경험을 쌓아 온 전문가들을 중심으로 구성된 팀이다. AI 경량화와 가속화 기술에 전문성을 가지고 있으며, 주요 AI/ML 학회에서 연구 논문을 70편 이상 제출했다. 카카오벤처스, 네이버 D2SF, 삼성넥스트, 포스텍 홀딩스, 포스코기술투자 등 국내 주요 투자사에서 투자를 유치했다.

2024.12.03 09:16방은주

리벨리온-스퀴즈비츠, AI 기술 고도화 위한 파트너십 체결

AI반도체 스타트업 리벨리온은 AI모델 경량화 전문 스타트업 스퀴즈비츠와 NPU(신경망처리장치)에 최적화된 생성형AI 모델 개발과 관련한 전략적 파트너십을 체결했다고 29일 밝혔다. 이번 협력은 특히 소형언어모델(SLM)의 경량화에 초점을 둔다. SLM은 범용인공지능(AGI) 대비 작은, 통상 300억개 미만의 파라미터를 가진 언어모델을 뜻한다. 스퀴즈비츠는 정확도 손실을 최소화하면서도 AI모델의 계산량을 압축할 수 있는 경량화 전문성을 가지고 있다. 리벨리온은 국내에선 최초로 소형언어모델 가속이 가능한 NPU를 양산한다. 이번 파트너십을 기반으로 양사는 각사가 가진 AI 경량화 노하우와 AI 추론 전용 하드웨어 기술을 바탕으로 다양한 소형언어모델을 리벨리온의 NPU에 최적화하여 경량화하는데 전략적으로 협력한다. 스퀴즈비츠는 현재 지원 중인 엔비디아 GPU 뿐 아니라 리벨리온의 NPU향으로 생성형AI 모델을 경량화할 수 있는 기술적 기반을 확보하게 된다. 리벨리온 또한 자사 하드웨어에 최적화된 경량화 언어모델을 활용해 생성형AI용 NPU의 판매 활로를 확장한다. 이번 파트너십은 생성형AI에 특화된 하드웨어를 기반으로 경량화 소프트웨어 기술을 개발하는 국내 최초 사례다. 양사는 소형언어모델 경량화 분야에 선도적인 역할을 수행해 지속가능한 생성형AI 서비스 제공 환경을 구축하고, 나아가 국내 AI 생태계 발전에 기여한다는 목표다. 이번 파트너십은 최근 생성형AI 가동에 소요되는 비용과 전력을 최소화하기 위한 최신 기술 트렌드를 반영한다. 최근 제한된 컴퓨팅 자원으로도 효율적으로 활용할 수 있는 소형언어모델이 각광받고 있으며, AI모델을 압축해 하드웨어 연산의 부담을 더는 경량화 기술 또한 크게 주목받고 있다. AI추론에 특화된 NPU 역시 전력소모와 구축비용을 대폭 줄이는 역할을 수행할 것으로 기대된다. 김형준 스퀴즈비츠 대표는 “리벨리온과의 협력을 통해 생성형 AI 기반 서비스 기업 고객들에게 더욱 다양한 하드웨어 옵션을 제공할 수 있게 되었다”며 “다양성을 바탕으로 각각의 서비스에 가장 최적화된 하드웨어와 경량화 기술을 제공함으로써 기업들이 더 효율적으로 AI를 사용할 수 있게 지원할 것”이라고 말했다. 박성현 리벨리온 대표는 “NPU와 AI경량화 기술은 지속가능하고 비용효율적인 AI 비즈니스를 위한 필수요소로 자리잡고 있다”며 “이번 파트너십으로 사용자들에게 리벨리온의 NPU 상에서 경량화된 생성형AI 모델을 활용해 부담없고 손쉽게 AI를 도입할 수 있는 기회를 제공할 것으로 기대한다”고 밝혔다.

2024.05.29 10:03장경윤

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

"요금 올리거나, 무료 풀거나"…OTT, 전략 분화

"책 대신 '아이패드'로 수업을"…디지털이 바꾼 교실 풍경은

과학자들, 납으로 금 만들었다…'연금술사의 꿈' 실현되나

[ZD브리핑] 아시아 IT 박람회 컴퓨텍스 개최...21대 대선 후보 첫 토론회

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현