알리바바, 피지컬AI 모델 '린브레인' 공개…"구글·엔비디아 넘었다"
알리바바가 피지컬 인공지능(AI) 전용 모델 '린브레인'을 오픈소스로 공개하며 글로벌 로보틱스 AI 경쟁에 뛰어들었다. 구글과 엔비디아의 로보틱스 AI 모델과의 벤치마크에서 최고 수준의 성능을 기록했다고 밝히며 기술 경쟁력을 전면에 내세웠다. 알리바바는 산하 다모(DAMO) 아카데미가 로봇과 스마트 기기의 복잡한 현실 세계 작업을 돕는 AI 파운데이션 모델 '린브레인'을 허깅페이스와 깃허브를 통해 오픈소스로 공개했다고 11일 밝혔다. 린브레인은 알리바바 다모 아카데미가 개발한 파운데이션 모델로 알리바바의 비전 언어 모델 '큐웬3-VL(Qwen3-VL)'을 기반으로 학습됐다. 단순한 시각 인식을 넘어, 물리 공간에서의 행동과 결과를 연계해 이해하는 것이 특징이다. 함께 공개한 데모 영상에서는 린브레인 기반 로봇이 가정 환경을 연상시키는 장면에서 여러 작업을 수행하는 모습이 공개됐다. 씽크대에서 지정한 포크나 컵을 정확하게 집어내고 과일 바구니에서 오렌지를 자연스럽게 집어드는 사물 특성에 맞춰 작업하는 모습을 확인할 수 있다. 이 밖에도 냉장고 문을 열거나 책을 책장에 정리하는 등 가정 환경에서 다양한 작업을 수행하는 모습이 담겼다. 알리바바는 이 모델이 객체 위치 추적, 궤적 예측, 환경 탐색 등에서 구글의 '제미나이 로보틱스-ER 1.5'와 엔비디아의 '코스모스-리즌2' 대비 최고 수준의 성능을 보였다고 설명했다. 모델은 총 세 가지 기본 버전으로 공개됐다. 파라미터 수 2억 개와 8억 개의 일반 밀집형 모델, 그리고 30억 파라미터 규모의 혼합전문가(MoE) 모델이다. 여기에 로봇 작업 계획에 특화된 '린브레인-플랜', 비전 언어 기반 내비게이션을 위한 '린브레인-내비', 체인 오브 포인트 추론을 강화한 '린브레인-CoP' 등 후처리 모델도 함께 제공된다. 모든 모델은 허깅페이스와 깃허브를 통해 오픈소스로 배포된다. 기술적으로 린브레인은 자아 시점 영상 이해와 세밀한 공간 추론에 강점을 가진다. 영상 기반 질의응답, 개수 세기, 문자 인식 등 세부적인 작업을 수행하며, 시간에 따른 객체 변화와 이동 경로를 정밀하게 파악한다. 텍스트 추론과 공간적 그라운딩을 교차 적용하는 방식으로, 추론 과정 자체를 물리 공간에 밀착시키는 구조를 채택했다. 이를 통해 로봇이 실제 환경에서 실행 가능한 수준의 정밀한 행동 계획을 수립할 수 있다. 아키텍처 측면에서는 통합 인코더-디코더 구조를 적용해, 다양한 시각 입력과 텍스트 지시를 동시에 처리한다. 출력 결과는 단순 텍스트를 넘어 공간 경로, 물리적 포인팅, 행동 계획 등 멀티모달 형태로 제공된다. 대규모 시공간 데이터와 물리 공간 중심 학습을 통해 범용성을 유지하면서도 로봇 특화 추론 능력을 강화했다는 설명이다. 이번 공개는 중국 AI 업계가 일관되게 유지해온 오픈소스 전략의 연장선으로 평가된다. 그동안 물리 AI 분야의 오픈소스는 스탠퍼드대, 캘리포니아대 버클리 캠퍼스 등 학계가 주도해왔다. 알리바바는 린브레인을 전면 개방함으로써 글로벌 개발자와 연구자의 참여를 유도하고 기술 고도화 속도를 끌어올리겠다는 전략이다. 이는 서구권 중심의 로보틱스 AI 주도권에 도전하는 행보로도 해석된다. 알리바바의 로보틱스 행보는 투자 측면에서도 이어지고 있다. 최근 알리바바는 휴머노이드 로봇 제조사 '엑스 스퀘어 로봇(X Square Robot)'에 1억4000만 달러를 투자했다. 해당 기업의 로봇은 이미 학교, 호텔, 의료기관 등에 적용되고 있다. 이는 알리바바가 단순 연구를 넘어, 실제 상용 로봇 시장까지 염두에 두고 있음을 보여준다. 업계에서는 린브레인이 오픈소스 기반 로봇 AI 생태계 확산의 기폭제가 될 가능성에 주목하고 있다. 개발자 접근성을 앞세운 전략이 기술 혁신 주기를 단축시키고, 글로벌 로보틱스 경쟁 구도를 재편할 수 있을지 관심이 쏠리고 있다. 다모 아카데미 롱하오 당 연구원 등 연구진은 "린브레인은 물리적 현실에 기반을 둔 파운데이션 모델로 수동적인 관찰을 넘어 물리적 세계에 대한 이해를 확고히 한다"며 "이러한 체계적인 개선을 통해 능동적이고 물리적 현실을 고려한 추론 및 복잡한 작업 실행이 가능하다"고 설명했다.