검색 - IT세상을 바꾸는 힘 지디넷코리아

ZDNet 검색 페이지

'컴퓨터비전'통합검색 결과 입니다. (3건)

태그
기간
- 3개월
- 1년
- 1년 이전

재검색

트웰브랩스, 아마존 '베드록' 입성…韓 최초로 영상 AI 모델 공급

트웰브랩스가 아마존의 대표 인공지능(AI) 플랫폼에 입성한다. 세계 주요 파운데이션 모델 기업들과 어깨를 나란히 하며 글로벌 영상 AI 시장 주도권 확보에 나서는 모양새다. 트웰브랩스는 아마존웹서비스(AWS)의 완전 관리형 AI 서비스 '아마존 베드록'에 자사 멀티모달 AI 모델인 '마렝고'와 '페가수스'를 제공하기로 했다고 7일 밝혔다. 국내 기반 영상 AI 모델이 '베드록'에 들어가는 것은 이번이 처음이다. 아마존 '베드록'은 메타, 앤트로픽, 미스트랄AI, 스태빌리티AI 등 세계 유수의 AI기업 모델을 단일 애플리케이션 프로그램 인터페이스(API)로 제공하는 플랫폼이다. 아마존 내부 모델인 '노바'를 제외하면 트웰브랩스는 베드록 내 유일한 영상이해 AI 제공사로 자리하게 됐다. 트웰브랩스의 영상 모델들은 객체, 행동, 배경음 등 영상 내 요소를 자연어로 검색하고 해석할 수 있다. 이를 통해 영상 콘텐츠의 검색, 분류, 요약, 인사이트 추출 등 전 과정을 자동화할 수 있는 것이 특징이다. 이에 고객은 '베드록'에서 인프라 관리 없이 트웰브랩스 모델을 활용해 생성형 AI 기반 영상 서비스를 구축할 수 있게 된다. 모델이 작은 영상 클립부터 대규모 콘텐츠 라이브러리까지 일관된 분석 성능을 제공하고 기업 수준의 보안 및 데이터 통제 기능도 갖췄기 때문이다. 업계 일각에서는 이번 협력이 스포츠, 미디어, 엔터테인먼트, 광고 등 영상 중심 산업 전반에 파급력을 미칠 것으로 전망한다. 방송사와 스튜디오는 촬영분 아카이빙을 자동화할 수 있고 스포츠 팀은 하이라이트를 자동 생성해 팬 맞춤형 콘텐츠를 제작할 수 있게 된다. 트웰브랩스는 AWS와의 전략적 협업 계약(SCA)을 바탕으로 아마존 '세이지메이커 하이퍼팟'도 활용 중이다. 이를 통해 모델 학습 속도는 최대 10% 빨라졌고 비용은 15% 이상 절감한 것으로 알려졌다. 글로벌 진출도 본격화하고 있다. 회사는 AWS 액티베이트 프로그램의 지원을 통해 해외 확장을 준비 중이며 AWS 마켓플레이스를 통해 전 세계 고객에게 자사 서비스를 제공할 계획이다. 사미라 파나 바크티아르 AWS 미디어·엔터테인먼트 총괄은 "트웰브랩스 모델 도입으로 영상 데이터의 활용이 쉬워졌다"며 "기업들이 인프라 없이도 AI 기술을 확장 가능하게 됐다"고 밝혔다. 이재성 트웰브랩스 대표는 "세계 영상 데이터의 80%가 사실상 미활용 상태"라며 "이번 베드록 공급은 우리 기술력이 세계 최고 수준임을 입증한 결과"라고 말했다.

2025.04.07 15:30조이환 기자

팀네이버, CVPR 2025에 논문 14편 게재…공간지능·AI 글로벌 기술력 입증

네이버는 네이버랩스, 네이버랩스 유럽, 네이버클라우드 등 '팀네이버'의 다양한 기술 조직이 발표한 연구 논문 14편이 컴퓨터비전 분야 세계적 학회 중 하나인 'CVPR(컴퓨터비전 및 패턴 인식 컨퍼런스 학술대회) 2025'에 게재 승인됐다고 25일 밝혔다. 공간지능·비전 AI 기술 경쟁력을 입증한 결과다. 1983년 시작된 CVPR은 세계 최대 기술 전문 단체인 전기전자공학자협회(IEEE)와 컴퓨터비전협회(CVF)가 공동 주최하는 학술대회로, 비전 AI 분야의 대표적인 학회이자 컴퓨터 공학에서 가장 영향력 있는 학회로 알려져 있다. 이로써 네이버는 컴퓨터비전 분야 세계 3대 학회로 꼽히는 CVPR, ECCV(European Conference on Computer Vision, 유럽 컴퓨터비전 학회), ICCV(International Conference on Computer Vision, 국제 컴퓨터비전 학회)에 최근 5년여 동안(2020년~2025년 3월) 151건의 정규 논문을 등재하고, 이 기간 동안 이들 학회에 매년 총 두 자릿수의 논문을 게재하며 세계적 수준의 AI 기술 기업으로 자리잡았다. CVPR 2025에서 팀네이버는 먼저 네이버랩스 유럽이 지난해 공개해 글로벌 빅테크 기업들의 큰 관심을 받았던 3D 재구성 AI 도구 'DUSt3R(더스터)'의 후속 연구 결과들을 발표할 예정이다. 한두 장의 사진만으로 3차원 복원을 쉽게 할 수 있는 AI인 더스터를 기반으로, 여러 장의 이미지에서 보다 정확한 3차원 공간을 재구성할 수 있는 AI 모델 'MUSt3R(머스터)'와, 다양한 카메라 및 장면 정보를 통합해 추론 능력을 높인 AI 모델 'Pow3R(파워)' 등이 새로 등재됐다. 또한 사전에 학습되지 않은 물체의 위치와 방향을 신속하고 정확하게 찾아내는 기술을 제안한 네이버랩스의 논문(제목: Co-op: Correspondence-based Novel Object Pose Estimation) 등 다수의 공간지능 논문이 학회에 채택됐다. 또한 최근 멀티모달(Multimodal) AI 기술의 부상으로 주목받고 있는 이미지 학습 모델 관련 연구들이 채택되는 성과도 있었다. 네이버클라우드는 '마스킹(masking)' 기법을 활용해 AI가 이미지 학습을 할 때 발현되는 훈련 불안정성 문제를 해결한 효율적인 학습 방법론을 제안했으며(제목: Masking meets Supervision: A Strong Learning Alliance), 네이버랩스 유럽은 시각언어모델(Vision-and-Language Model)을 활용해 추가 학습 없이 이미지 속 새로운 사물을 정교하게 구분하는 기술을 선보였다(제목: LPOSS: Label Propagation Over Patches and Pixels for Open-vocabulary Semantic Segmentation). 로봇 연구에서의 성과도 돋보였다. 시각 정보 입력부터 행동 출력까지 전체 과정을 학습하는 '엔드 투 엔드(End-to-End)' 방식으로 빠르게 이동하는 로봇이 효율적으로 경로를 찾는 자율주행 시스템에 관한 연구(제목: Reasoning in visual navigation of end-to-end trained agents: a dynamical systems approach)가 채택됐으며, 이 외에 이미지 생성 AI 모델의 창의성을 향상시키기 위한 방법을 제안한 연구(제목: Enhancing Creative Generation on Stable Diffusion-based Models) 등도 채택됐다. 팀네이버는 컴퓨터비전 뿐만 아니라 자연어처리, 음성, 머신러닝 등 분야별 탑티어(top-tier) AI 학회에서 우수한 선행 연구 성과를 내고 있다. 현재까지 총 450편 이상의 연구를 발표했으며, 연구의 영향력을 가늠할 수 있는 지표 중 하나인 피인용 수는 4만7천여 회에 달한다. 네이버는 적극적인 연구개발 투자를 지속하며 선행기술을 확보해나겠다고 밝혔다. 나아가 '온 서비스 AI(On-Service AI)' 전략 아래, 생성형 AI와 공간지능 등 성공적으로 내재화한 핵심 기술을 네이버 주요 서비스에 도입해 사용자에게 차별화된 서비스 경험을 제공할 계획이다.

2025.03.25 17:01안희정 기자

"영상 AI의 챗GPT 순간 열까"…트웰브랩스, '페가수스-1.2' 공개

트웰브랩스가 차세대 영상언어 생성 모델을 공개해 산업 현장에서의 인공지능(AI) 활용성을 극대화한다. 트웰브랩스는 자사가 최근 개발한 '페가수스-1.2'가 다양한 길이의 영상을 분석할 수 있다고 12일 밝혔다. 이 모델은 성능이 대폭 향상돼 텍스트 요약·질의응답·하이라이트 생성 등 고도화된 영상 처리가 가능하다. 트웰브랩스는 이번 모델에 고급 비전 인코딩 전략과 토큰 감소 기술을 적용해 모델의 효율성과 이해도를 높였다. 이를 통해 기존 초거대 모델 대비 가벼운 크기로도 높은 성능을 구현했다. 특히 'GPT-4o'·'제미니 1.5 프로' 등 경쟁 모델보다 응답 속도가 빠르고 비용 효율성이 뛰어난 점이 강점으로 꼽힌다. '페가수스-1.2'는 트웰브랩스의 자체 멀티모달 임베딩 모델인 '마렝고'와 결합돼 보다 정교한 영상 이해 능력을 갖췄다. 이를 통해 엔터테인먼트·교육·보안 등 다양한 산업에서 활용될 전망이다. 일례로 방송·미디어 업계에서는 영상 콘텐츠 자동 분류, 하이라이트 추출, 교육 분야에서는 강의 요약 및 핵심 내용 정리에 활용될 것으로 기대되며 보안 산업에서는 CCTV 영상 분석과 이상 징후 탐지 등에 적용될 것으로 보인다. 트웰브랩스는 지난 2021년 설립 이후 멀티모달 신경망 기술을 기반으로 빠르게 성장했다. 글로벌 리서치 기업 CB 인사이트가 선정한 'AI 100'에 3년 연속 이름을 올렸으며 '세계 50대 생성형 AI 스타트업'에도 포함됐다. 지난해 12월에는 이승준 CTO가 포브스 '30세 미만 30인' AI 리더로 선정되며 기술력을 인정받았다. 이승준 트웰브랩스 최고기술책임자(CTO)는 "영상 속 객체의 공간적 관계와 시간적 변화를 정확히 분석하는 AI 모델이 필요하다"며 "'페가수스-1.2'는 혁신적인 시공간 정보 이해 방식을 도입해 다양한 산업 요구를 충족할 것"이라고 말했다.

2025.02.12 15:12조이환 기자