• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
APEC2025
국감2025
양자컴퓨팅
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'스파이어'통합검색 결과 입니다. (2건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

IBM, '스파이어 엑셀러레이터' 가속기로 메인프레임 AI 시대 연다

IBM이 메인프레임과 서버 인프라에 적용 가능한 차세대 인공지능(AI) 가속기를 선보였다. 보안성과 복원력을 유지하면서도 생성형 및 에이전트 기반 AI를 효율적으로 처리할 수 있는 전용 하드웨어(HW)를 통해 기업 워크로드 성능과 확장성을 강화하겠다는 목표다. IBM은 메인프레임 시스템 'IBM z17'과 'IBM 리눅스원 5'에 적용 가능한 AI 가속기 '스파이어 엑셀러레이터'를 정식 출시한다고 28일 밝혔다. 스파이어 엑셀러레이터는 생성형 및 에이전트 기반 AI 업무를 지원하는 빠른 추론 기능을 제공하며 핵심 업무의 보안과 복원력을 최우선으로 고려해 설계됐다. IBM은 오는 12월 초부터 파워11 서버용 제품도 추가로 선보일 예정이다. 최근 IT 환경은 논리 기반 업무 흐름에서 에이전트 기반 AI 추론 중심으로 빠르게 전환되고 있다. 기업들은 저지연 추론과 실시간 반응성을 필요로 하는 AI 모델을 기존 업무와 함께 안정적으로 처리할 수 있는 인프라를 요구하고 있다. IBM은 이러한 수요에 대응해 보안성과 운영 효율성을 동시에 확보한 AI 추론 전용 HW를 개발했다. 이번에 공개된 스파이어 엑셀러레이터는 IBM 리서치 AI HW 센터의 기술과 인프라 사업부의 개발 역량이 결합된 결과물이다. IBM 요크타운 하이츠 연구소와 올버니대학교 산하 신흥 AI 시스템 센터와의 협업을 통해 빠른 반복 개발 과정을 거치며 완성도를 높였다. 상용화된 제품은 32개의 가속 코어와 256억 개 트랜지스터를 탑재한 5나노미터 기반 시스템온칩(SoC) 형태로, 75와트 PCIe 카드에 장착된다. IBM Z 및 리눅스원 시스템에는 최대 48개, IBM 파워 시스템에는 최대 16개까지 클러스터 구성이 가능하다. 스파이어 엑셀러레이터를 통해 IBM 고객은 온프레미스 환경에서 빠르고 안전한 AI 추론 기능을 활용할 수 있다. 특히 IBM Z 및 리눅스원 시스템에서는 텔럼 II 프로세서와 결합해 고도화된 사기 탐지, 유통 자동화 등 예측 기반 업무에서 다중 AI 모델을 적용할 수 있다. 파워 기반 서버에서는 AI 서비스 카탈로그를 통해 생성형 AI 모델을 업무에 손쉽게 통합할 수 있으며 128개 토큰 길이의 프롬프트 입력을 지원해 시간당 800만 건 이상의 대규모 문서를 지식 베이스에 통합할 수 있다. IBM 인프라 사업부 배리 베이커 최고운영책임자(COO)는 "스파이어 엑셀러레이터를 통해 우리 시스템은 생성형 및 에이전트 기반 AI를 포함한 다중 모델 AI를 지원할 수 있는 역량을 갖추게 됐다"며 "고객이 AI 기반 핵심 업무를 보안성·복원력·효율성을 저해하지 않고 확장할 수 있도록 돕는 동시에, 기업 데이터의 가치를 효과적으로 끌어낼 수 있도록 지원한다"고 말했다. IBM 반도체·하이브리드 클라우드 부문 무케시 카레 부사장은 "최근 고도화된 AI 역량에 대한 수요가 높아지는 가운데 AI HW 리서치 센터에서 개발된 첫 번째 칩이 상용화 단계에 진입해 자랑스럽다"며 "이번 스파이어 칩의 정식 출시로 메인프레임 및 서버 고객에게 향상된 성능과 생산성을 제공할 수 있게 됐다"고 강조했다.

2025.10.28 14:46한정호

IBM, 텔럼2 칩셋에 부착하는 '스파이어'로 AI 가속기 시장 공략

생성형 인공지능(AI)이 실용 단계로 접어든 가운데 AI와 대규모언어모델(LLM)의 빠른 연산을 제공하기 위해 IBM이 새로운 칩셋과 가속기를 발표했다. IBM은 반도체 학회 '핫칩스 2024'에서 메인프레임 칩셋 '텔럼 2' 프로세서와 '스파이어' 인공지능(AI) 가속기를 공개했다고 27일 밝혔다. 이번 공개된 텔럼 2 프로세서는 차세대 IBM Z 시스템에 구동되도록 1세대 텔럼 칩에 비해 클록·메모리 용량 증가, 데이터 처리에 일관성을 제공하는 부속 데이터 처리 장치(DPU)가 특징이다. 또 이 제품은 5.5기가헤르츠(GHz)로 실행되는 8개의 고성능 코어 및 기존 대비 약 40% 증가한 360메가바이트(MB) 용량의 온칩 캐시 용량도 가지고 있다. 동시에 발표된 스파이어 엑셀러레이터는 텔럼 2 프로세스를 보완하기 위해 추가적인 AI 연산 능력을 제공한다. 이번에 공개된 스파이어는 신규 모델로 텔럼2와 함께 작동해 여러 개의 머신 러닝 AI 모델을 인코더 LLM과 결합할 수 있다. 각 칩은 지연 시간이 짧고 대규모 처리가 필요한 AI 애플리케이션을 위해 인트4, 인트8, 에프피8 및 에프피16 데이터 유형을 지원하는 32개의 컴퓨팅 코어를 가질 전망이다. 티나 타르퀴니오 IBM Z 제품 관리 담당 부사장은 "강력한 로드맵을 통해 증가하는 AI 수요를 비롯한 기술 트렌드에서 앞서 나갈 수 있는 기반을 마련했다"며 "텔럼 2 프로세서와 스파이어 엑셀러레이터는 고성능, 보안, 전력 효율성이 우수한 엔터프라이즈 컴퓨팅 솔루션을 제공해 고객이 LLM과 생성형 AI를 대규모로 활용할 수 있게 할 것"이라고 말했다.

2024.08.27 10:17양정민

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

대미 현금투자 2천억, 年상한 200억 달러…車관세 15%로 인하

유통가로 번지는 한국시리즈 열기...LG·한화 ‘우승 세일’ 기대감↑

[르포] "디자이너도 '깃허브 코파일럿' 쓴다"…AI 개발 장벽 낮아져

11월 1일부터 車관세 15%…현대차 연손실 3조 줄어든다

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.