MS, 첫 멀티모달 SLM 공개…저비용·고효율 AI 구현
마이크로소프트가 소규모 언어 모델(SLM) 제품군 파이(Phi)의 신규 모델 2종을 발표했다. 이번 모델들은 적은 컴퓨팅 자원으로도 멀티모달 처리와 경량화된 고성능 AI 모델의 가능성을 확대하는 데 중점을 두고 있다. 3일 마이크로소프트는 SLM 파이4 멀티모달과 파이4 미니를 공개했다고 공식홈페이지를 통해 밝혔다. 파이4 멀티모달은 56억 개의 파라미터를 갖춘 마이크로소프트의 최초 멀티모달 AI 모델로 텍스트, 이미지, 음성을 동시에 처리할 수 있다. 기존 멀티모달 AI가 각각의 입력 유형을 개별적으로 분석한 것과 달리 하나의 모델에서 통합적으로 이해하고 분석할 수 있도록 설계됐다. 이 AI모델은 LoRA 조합 기법(MoL)을 활용해 모델 크기를 최적화하면서도 고성능을 유지하는 것이 특징이다. 허깅페이스 오픈ASR 리더보드에서 6.14%의 단어 오류율(WER)을 기록하며 위스퍼 V2와 같은 오픈소스 음성 인식 모델보다 뛰어난 성능을 기록했다. 마이크로소프트는 파이4 멀티모달이 문서 이해, 차트 및 테이블 해석, 과학적 추론 등의 작업에서 탁월한 성능을 발휘하며, 향후 AI 비서, 음성 기반 서비스, 스마트 기기 등에 폭넓게 적용될 수 있을 것이라고 밝혔다. 이와 함께 파이4 미니는 이 모델은 38억 개의 파라미터를 갖춘 경량화된 고성능 AI 모델이다. 최대 12만8천 토큰 규모의 긴 컨텍스트를 한 번에 처리할 수 있어 코딩, 함수 호출, 과학적 계산, 명령어 실행 등 다양한 텍스트 기반 작업에서 보다 높은 성능을 제공한다 파이4 미니는 작은 규모에도 대규모 AI모델 수준의 성능을 제공할 수 있어 스마트폰, IoT 기기, 자동차, 로봇 등 엣지 디바이스에서 효율적으로 활용 가능하다. 마이크로소프트는 이를 통해 AI 모델을 보다 저렴한 비용으로 다양한 분야에서 효율적으로 운영할 수 있을 것이라고 설명했다. 이제 마이크로소프트는 AI 기술이 단순히 모델 크기를 키우는 방향에서 벗어나, 더 효율적이고 실용적인 모델을 바탕으로 AI사업을 확대할 전망이다. 마이크로소프트의 웨이주 첸 생성형AI 부사장은 "새롭게 선보인 2종의 AI 모델은 복잡한 작업을 효율적으로 처리하도록 설계돼 성능이 제한된 엣지컴퓨팅 환경 등에 이상적"이라며 "낮은 컴퓨팅 요구 사항은 더욱 낮은 대기 시간과 적은 비용을 요구하며 미세 조정이 쉬운 만큼 산업 전반에 걸쳐 다양한 분야에 활용될 수 있을 것"이라고 설명했다.