검색 - IT세상을 바꾸는 힘 지디넷코리아

ZDNet 검색 페이지

'이기종 컴퓨팅'통합검색 결과 입니다. (2건)

태그
기간
- 3개월
- 1년
- 1년 이전

재검색

퀄컴, AI 스타트업 '모듈러' 39억 달러에 인수

퀄컴이 24일(현지시간) AI 인프라 스타트업 모듈러(Modular)를 39억 달러(약 6조 196억원)에 인수한다고 밝혔다. 토큰 생성·처리 비용을 낮추기 위한 이기종 컴퓨팅 강화 목적이다. 모듈러는 구글 출신 크리스 래트너와 팀 데이비스가 CPU와 GPU 제조사별로 파편화된 소프트웨어 문제를 해결하기 위해 2022년에 만든 스타트업이다. 파이썬 대비 실행 속도가 빠른 새 언어 '모조(mojo)' 등을 개발했다. 특정 가속기마다 별도 코드를 작성해야 하는 기존 방식과 달리 한 번 개발한 AI 모델을 여러 하드웨어 환경에 배포할 수 있는 것이 특징이다. 기업 입장에서는 특정 벤더에 대한 종속성을 줄이고 인프라 구축 비용을 낮출 수 있다. 크리스티아노 아몬 퀄컴 CEO는 24일(현지시간) 미국 뉴욕에서 열린 인베스터 데이 행사에서 "에이전틱 AI 시대에는 데이터센터와 엣지 환경 전반에 걸쳐 AI가 확산될 것이며 여러 공급업체의 기술이 결합된 분산형 아키텍처로 이동하고 있다"고 밝혔다. 그는 "미래는 개발자 친화적이면서 다양한 컴퓨팅 환경에서 동작하는 수평적 플랫폼에 있다"며 "모듈러 인수를 통해 고객이 AI를 어디서 어떻게 배치할지 스스로 선택할 수 있는 개방형 생태계를 가속화할 것"이라고 강조했다. 이번 인수는 퀄컴이 이날 공개한 데이터센터 전략의 핵심 축 가운데 하나다. 퀄컴은 서버용 CPU '드래곤플라이 C1000', AI 추론 가속기 'AI250·AI300', 고속 네트워크 기술과 함께 모듈러를 데이터센터 소프트웨어 계층의 중심으로 활용할 계획이다. 퀄컴이 모듈러를 선택한 이유는 AI 산업이 성능 경쟁에서 효율 경쟁으로 전환되고 있기 때문이다. 대규모 AI 서비스가 확산되면서 단순한 연산 성능보다 전력 효율과 운영 비용이 중요한 요소로 부상하고 있다. 퀄컴은 이러한 환경에서 하드웨어만으로는 한계가 있다고 보고 있다. 서로 다른 CPU와 GPU, AI 가속기를 효율적으로 연결하고 최적화하는 소프트웨어 계층이 필수적이라는 판단이다. 향후 데이터센터에는 인텔과 AMD의 CPU, 엔비디아와 AMD의 GPU, 각종 AI 가속기가 혼재할 것으로 예상되는 만큼 특정 하드웨어가 아닌 다양한 플랫폼을 연결하는 소프트웨어가 중요해질 것이라는 분석이다. 토니 피알리스 퀄컴 데이터센터 부문 총괄은 이를 두고 "다른 기업들이 자사 하드웨어를 보호하기 위한 해자를 구축하는 동안 퀄컴은 업계를 연결하는 다리를 만들고 있다"고 말했다. 크리스 래트너 모듈러 CEO는 "AI에는 다양한 하드웨어와 배포 환경을 아우를 수 있는 개방적이고 효율적인 소프트웨어 기반이 필요하다"며 "퀄컴과 함께 개발자의 접근성을 높이고 하드웨어 간 이식성을 강화해 보다 개방적인 AI 생태계를 구축할 것"이라고 밝혔다.

2026.06.25 08:20권봉석 기자

노타, 인텔 AI PC 추론 효율 끌어올렸다

노타가 인공지능(AI) PC 환경에서 그래픽처리장치(GPU)와 신경망처리장치(NPU)를 동시에 활용하는 이기종 컴퓨팅 기반 거대언어모델(LLM) 추론 최적화 기술을 구현하며 온디바이스 AI 성능 개선에 나섰다. 노타는 인텔 루나 레이크 기반 AI PC에서 이기종 컴퓨팅 기반 LLM 추론 최적화 기술을 구현했다고 4일 밝혔다. 이기종 컴퓨팅은 서로 다른 장점을 가진 프로세서를 함께 활용하는 방식이다. 하나의 프로세서에 모든 일을 맡기는 대신 중앙처리장치(CPU)와 GPU, NPU처럼 역할이 다른 장치가 각자 잘하는 일을 나눠 맡도록 설계하는 것이 핵심이다. 노타는 인텔 루나 레이크 기반 AI PC에서 LLM 실행 과정을 입력 처리 단계와 답변 생성 단계로 나눠 분석하고 각 단계에 적합한 연산 장치를 배치하는 분리형 추론 방식을 적용했다. 이에 따라 입력 처리 연산은 GPU에서, 답변 생성 연산은 NPU에서 실행되도록 구성했다. 성능 평가에 따르면 노타의 분리형 추론 방식을 적용한 결과, 단일 GPU 실행 방식 대비 토큰당 에너지 소비를 약 32% 줄이고 생성 처리량을 약 12% 높였다. 또 단일 NPU 실행 방식 대비 첫 응답 지연시간을 약 89% 단축했다. 채명수 노타 대표는 "AI PC 시대엔 GPU, NPU 등 다양한 연산 장치를 모델 특성에 맞게 조합하는 최적화 역량이 실제 AI 경험을 좌우한다"며 "모델 경량화, 런타임 최적화, 하드웨어 최적화 기술을 결합해 AI PC 시대의 온디바이스 AI 실행 효율을 높이겠다"고 말했다.

2026.06.04 15:02이나연 기자