검색 - IT세상을 바꾸는 힘 지디넷코리아

ZDNet 검색 페이지

'비오'통합검색 결과 입니다. (13건)

태그
기간
- 3개월
- 1년
- 1년 이전

재검색

[AI는 지금] "몸값 낮춰도 27조"…中 클링 AI, 4조 실탄 들고 글로벌 공세 본격화

중국 인공지능(AI) 영상 생성 분야 경쟁이 치열해지는 가운데 클링 AI가 대규모 외부 자금 조달에 나섰다. 모회사 콰이서우가 클링 AI 분사와 홍콩 상장을 추진하면서 컴퓨팅 인프라와 인재 확보를 위한 실탄 마련에 속도를 내는 분위기다. 2일 홍콩 사우스차이나모닝포스트(SCMP)에 따르면 콰이서우가 지원하는 클링 AI는 30억 달러(약 4조6500억원) 규모 투자 유치를 거의 마무리했다. 이번 투자 이후 기업가치는 180억 달러(약 27조9000억원)로, 지난 4월 콰이서우가 클링 AI 분사를 처음 추진할 당시 설정했던 초기 목표치 200억 달러보다 낮아졌다. 앞서 콰이서우는 지난 5월 12일 홍콩증권거래소 공시에서 외부 투자자 대상 자금 조달을 포함한 클링 AI 구조조정 검토 사실을 공개했다. 이후 중국 게임·소셜미디어 대기업 텐센트가 이번 투자 라운드에 참여한 것으로 알려졌다. 이번 자금 조달은 클링 AI의 상장 준비와도 맞물려 있다. 콰이서우는 향후 12개월 안에 클링 AI의 홍콩증권거래소 상장 절차를 시작할 것으로 예상되고 있다. 상장을 통해 확보한 자금은 컴퓨팅 인프라와 데이터센터 구축, 인재 확보에 쓰일 것으로 전해졌다. 클링 AI는 중국 숏폼 플랫폼 콰이서우가 키운 AI 영상 생성 서비스다. 콰이서우는 중국 시장에서 틱톡의 중국판인 더우인과 경쟁하는 대표 숏폼 기업이다. 클링 AI는 텍스트나 이미지를 입력하면 영상을 생성하는 모델을 앞세워 해외 시장에서 빠르게 이용자를 늘리고 있다. 매출 성장세도 가파르다. 콰이서우는 지난 5월 분기 실적 발표에서 클링 AI의 3월 기준 연간 반복 매출이 5억 달러에 달했다고 밝혔다. 1년 전보다 5배 늘어난 규모다. 1분기 매출은 6억5000만 위안으로 전년 동기 대비 300% 증가했다. 콰이서우에 따르면 클링 AI 매출의 약 75%는 해외에서 발생하며 지난달 기준 글로벌 이용자는 1억 명을 넘어섰다. 클링 AI가 급성장 중인 AI 영상 생성 시장에서 앞으로 영향력을 더 확대해 나갈지도 주목된다. 이 시장은 현재 중국과 미국 기업 간 경쟁이 격화되며 빠르게 성장해 1400억 달러로 추산되며 향후 3년간 연 10% 성장이 예상된다. 클링 AI 외에도 중국 바이트댄스의 시댄스, 미국 런웨이, 구글 비오 등이 이 시장에서 경쟁 중이다. 업계에선 AI 영상 생성 도구 시장이 현재 모델 성능뿐 아니라 상업적 활용 범위, 제작 워크플로 연동, 저작권 대응 능력까지 겨루는 단계로 넘어가고 있다고 보고 있다. 이 같은 분위기 속에 클링 AI는 지난 2월 최신 3.0 모델 시리즈를 공개하며 시장 확대에 적극 나서는 모습을 보였다. 또 최근에는 한국 시장에서 고객 확보를 위해 본격 나선 상태로, 오는 7일 서울영화센터에서 AI 영상 공모전 시상식을 열어 국내 영상 창작자를 대상으로 인지도 구축에 나설 예정이다. SCMP는 "클링 AI의 외부 자금 조달을 위한 분사는 글로벌 AI 영상 분야 경쟁이 심화되는 가운데 성장 모멘텀이 커지는 시점에 추진되고 있다"면서도 "기업가치 하락은 클링 AI를 둘러싼 시장 분위기 변화를 반영한 것"이라고 말했다.

2026.07.02 09:48장유미 기자

[AI는 지금] 오픈AI, 챗GPT에 '소라' 품는다…AI 영상 전략 흔들리나

오픈AI가 인공지능(AI) 영상 서비스를 별도 플랫폼으로 키우려던 초기 구상에서 한발 물러나 기존 플랫폼 중심의 '실리 전략'으로 방향 조정에 나섰다. 생성형 AI 영상 시장이 기술 경쟁 중심의 초기 경쟁 단계를 지나 수익성과 사용자 기반을 중시하는 플랫폼 경쟁 단계로 이동하고 있다는 판단에서다.11일 IT 전문매체 디인포메이션에 따르면 오픈AI는 자사 동영상 생성 인공지능(AI) '소라(Sora)'를 별도 서비스가 아닌 챗GPT에 통합하는 방안을 검토하고 있다. 이는 지난해 소라를 전용 웹사이트와 모바일 애플리케이션 형태로 출시하며 독립 플랫폼으로 육성하려 했던 초기 전략과는 다른 행보다.오픈AI의 이 같은 움직임은 최근 소라 전용 서비스의 성장세 둔화와 무관치 않다. 모바일 앱 시장 분석 업체 앱피겨스에 따르면 소라 전용 앱의 올해 1월 다운로드 수는 전월 대비 45% 감소한 약 120만 건을 기록했다. 같은 기간 동안 사용자 지출액은 32% 감소한 36만7000달러(약 4억8000만원) 수준에 머물렀다. 또 출시 직후 미국 앱스토어 다운로드 순위 1위를 기록했으나, 올해 초에는 101위까지 밀려나며 상위 100위권 밖으로 이탈했다. 이처럼 기술적 기대감이 실제 이용 지속성으로 이어지지 못하면서 오픈AI는 '소라'의 단독 플랫폼 육성 대신 기존 플랫폼인 '챗GPT' 강화 전략으로 선회했다. 챗GPT의 대규모 사용자 기반을 활용해 소라 기능의 접근성을 높이겠다는 구상이다. 업계에선 오픈AI의 이 같은 결정이 생성형 AI 영상 시장의 경쟁 구도 변화와도 맞물려 있다는 분석이 나온다. 초기에는 누가 더 사실적인 영상을 만들어내느냐를 두고 기술 경쟁이 치열했지만, 최근에는 어떤 플랫폼 안에서 얼마나 많은 사용자가 서비스를 활용하느냐가 핵심 변수로 떠오르고 있기 때문이다. 특히 영상 생성 AI는 텍스트·이미지 생성보다 훨씬 많은 연산 자원을 필요로 한다. 수백~수천 개의 프레임을 동시에 생성해야 하는 특성상 그래픽처리장치(GPU) 사용량이 크게 늘어나 서비스 운영 비용이 빠르게 증가한다. 이 때문에 독립 서비스로 이용자를 대규모로 확보하기보다 기존 플랫폼과 구독 모델을 결합하는 전략이 현실적일 수 있다는 분석도 나온다. 오픈AI 역시 이러한 구조를 고려해 소라 기능을 챗GPT 생태계 안으로 편입하려는 것으로 보인다. 텍스트와 이미지 생성에 이어 영상 생성 기능까지 하나의 인터페이스에서 제공함으로써 챗GPT 유료 구독 서비스의 경쟁력을 높이려는 전략을 펼치는 것으로도 해석된다. AI 영상 시장의 경쟁도 기업별로 서로 다른 방향에서 전개되고 있다. 구글은 생성형 영상 모델 '비오(Veo)'를 앞세워 유튜브와의 연계를 강화하는 등 플랫폼 생태계 전략을 추진하고 있다. 특히 숏폼 콘텐츠 제작 시장을 겨냥해 모바일 환경에 최적화된 영상 생성 기능을 확대하고 있다. 영상 제작 도구 기업 런웨이는 전문 제작 시장을 공략하고 있다. 캐릭터 일관성 유지, 카메라 움직임 제어 등 영화 제작에 필요한 기능을 강화하며 광고·영상 제작사와 협업을 확대하는 방식이다. 루마 AI 역시 빠른 생성 속도와 상대적으로 낮은 비용을 내세워 경량 영상 제작 시장을 겨냥하고 있다. 이는 짧은 콘텐츠를 빠르게 제작하려는 크리에이터 수요를 공략하는 전략이다. 업계 관계자는 "생성형 AI 영상 시장이 기술 경쟁 중심에서 플랫폼과 비즈니스 모델 경쟁으로 점차 이동하는 분위기"라며 "초기에는 어떤 모델이 더 사실적인 영상을 만들 수 있는지가 핵심이었지만, 이제는 어떤 플랫폼에서 실제로 얼마나 많은 사용자가 활용하느냐가 더 중요한 경쟁 요소가 되고 있다"고 말했다.

2026.03.11 17:38장유미 기자

[AI는 지금] 구글도 숏폼에 '올인'…AI 영상 '비오'에 세로형 지원 나선 이유

구글이 인공지능(AI) 영상 생성 모델 '비오'를 숏폼 콘텐츠에 적합한 세로형 영상 제작이 가능하도록 개선했다. 빠르게 성장하는 숏폼 영상 시장과 AI 영상 생성 주도권을 동시에 겨냥한 전략적 행보로 풀이된다.14일 테크크런치에 따르면 구글은 지난 13일 '비오 3.1'에 9대 16 비율의 네이티브 세로 영상 생성 기능을 추가했다. 이를 통해 이용자는 유튜브 쇼츠를 비롯해 인스타그램, 틱톡 등 주요 소셜 플랫폼에 최적화된 영상을 별도의 크롭 없이 바로 제작할 수 있게 됐다. 해당 기능은 유튜브 쇼츠와 유튜브 크리에이트 앱에도 직접 통합됐다.이번 업데이트로 참조 이미지를 활용한 영상 생성 품질도 대폭 개선됐다. 짧은 프롬프트만으로도 캐릭터의 표정과 움직임이 보다 자연스럽게 구현되며 캐릭터·오브젝트·배경 간의 일관성이 강화됐다. 여러 요소를 결합해 하나의 통합된 영상 결과물을 만드는 기능 역시 추가됐다. 구글이 이처럼 나선 것은 영상 소비 구조의 변화 때문으로 분석된다. 글로벌 콘텐츠 시장에서 가로형 중심의 영상 소비는 빠르게 세로형 숏폼으로 이동하고 있고, 유튜브 쇼츠·틱톡·인스타그램 릴스가 핵심 유통 채널로 자리 잡은 탓이다. 구글 입장에선 유튜브 생태계를 지키기 위해 AI 영상 생성 단계부터 쇼츠에 최적화된 환경을 제공할 필요성이 커졌다. 동시에 AI 영상 생성 시장을 둘러싼 경쟁도 구글의 행보에 영향을 미쳤다. 오픈AI의 소라, 런웨이, 메타의 생성형 AI 도구 등 경쟁사들이 고품질 영상 생성과 크리에이터 친화적 기능을 앞세우는 가운데 구글은 기술 성능과 플랫폼 결합을 차별화 전략으로 선택했다. '비오'를 중심으로 생성된 콘텐츠가 유튜브 쇼츠와 크리에이트 앱으로 자연스럽게 이어지도록 설계해 제작부터 배포까지 구글 생태계 안에서 완결되도록 한 것이다. AI 영상 생성이 점차 대중화되고 있다는 점도 한 몫 했다. 기존 생성형 영상 도구는 복잡한 프롬프트 작성이 진입 장벽으로 작용해 왔다. 그러나 '비오 3.1'은 참조 이미지 활용과 자동화된 표현력 개선을 통해 전문 지식이 없는 일반 사용자나 소규모 크리에이터도 손쉽게 고품질 영상을 만들 수 있도록 방향을 잡았다. 이번 업데이트는 소비자용 기능에 그치지 않는다는 점도 주목할 요소다. '비오 3.1'의 고급 기능은 구글의 영상 편집 도구 플로우(Flow), 제미나이 API, 버텍스 AI, 구글 비즈 등을 통해 기업과 전문가에게도 제공된다. 여기에 1천80p, 4K 업스케일링 기능까지 더해지며 광고·마케팅·브랜드 영상 제작 등 B2B 영역에서의 활용 가능성도 확대됐다. 업계 관계자는 "구글의 비오 3.1 업데이트는 숏폼 중심으로 재편된 콘텐츠 시장에서 유튜브의 경쟁력을 유지하고, AI 영상 생성 기술을 플랫폼·클라우드 사업과 연결해 확장하려는 다층적인 전략의 결과로 보인다"며 "AI 영상 기술 경쟁이 본격화된 상황에서 구글이 이번 일을 통해 주도권을 가질 수 있을지 주목된다"고 말했다.

2026.01.14 17:24장유미 기자

[현장] "몇 분 만에 엔딩 교체"…AI 만난 영상 편집, 실시간 마법 시연

[로스앤젤레스(미국)=조이환 기자] "인공지능(AI) 도구는 퍼즐 조각과 같습니다. 창작자가 호기심을 가지고 이를 집어 들어 세상을 만드는 것이죠." 영국의 유명 콘텐츠 크리에이터 브랜든 바움은 29일 미국 로스앤젤레스에서 진행된 '어도비 맥스 2025' 기조연설 무대에서 이같이 말했다. 이날 그는 어도비 파이어플라이 라이브 시연을 시작하며 자신이 전날 게시했던 영상의 엔딩에 청중이 단 댓글에서 영감을 받아 실시간으로 재창조하는 과정을 선보였다. 바움은 자신이 어제 올린 '석상과 싸우는' 영상에 달린 "적들이 연인이 되는 반전을 기다렸다"는 댓글을 화면에 띄웠다. 그는 "이 댓글이 속편에 대한 좋은 영감이 될 수 있겠다"며 즉석에서 '석상 적이 갑자기 키스를 하려고 달려드는' 반전 엔딩 제작에 돌입했다. 그는 먼저 어도비 '파이어플라이 보드'에서 기존 영상 클립을 불러왔다. 영상 속 석상이 명확히 보이는 프레임과 사막 배경 프레임을 각각 캡처해 보드 위에 꺼내 놓으며 "퍼즐 조각을 모으기 시작했다"고 말했다. 핵심 이미지 생성에는 구글의 '제미나이 2.5 나노 바나나' 모델이 사용됐다. 바움은 "대리석 석상이 (키스하기 위해) 입술을 오므리고 사막 폭풍 속을 카메라를 향해 달려온다"는 프롬프트를 입력하고 앞서 캡처한 석상 이미지를 레퍼런스로 지정했다. 그는 "무서우면서도 멋진 결과물이 나왔다"며 생성된 이미지를 보드에 추가했다. 바움은 '변형(Vary)' 기능을 사용해 다양한 변형 이미지를 순식간에 생성했다. 그는 결과에 대해 "때로는 마법 같고 때로는 완전히 정신 나간 결과가 나오지만 그게 재미"라고 설명했다. 최종 엔딩 영상 제작에는 구글 '비오 3.1' 모델이 동원됐다. 그는 "비디오, 대리석 석상이 사막에서 카메라를 쫓아 빠르게 달려와 렌즈를 향해 입술을 오므리고 렌즈에 키스한다"는 구체적인 프롬프트를 입력했다. 앞서 생성한 이미지를 첫 프레임으로 지정하고 '비오' 모델의 오디오 동시 생성 기능을 활성화했다. 영상이 생성되는 동안 바움은 '사운드트랙 생성' 툴로 이동했다. 그는 분위기를 '드라마틱', '업비트', '코믹'으로, 스타일을 '클래식', '시네마틱'으로 설정했다. 특히 목적에는 댓글에서 영감을 받은 "적에서 연인으로 스토리"라고 직접 입력해 눈길을 끌었다. AI가 생성한 4개의 트랙 중 그는 극적인 첫 번째 트랙을 선택했다. 모든 재료가 준비되자 바움은 웹 기반 '파이어플라이 비디오 에디터'를 열었다. 기존 실사 영상 마지막 부분과 '비오'로 생성한 '키스 엔딩' AI 영상을 타임라인에 배치했다. 두 영상이 자연스럽게 연결되지 않자 그는 즉석에서 AI로 전환 장면 생성에 나섰다. 그는 두 클립 사이에 플레이헤드를 놓고 '생성 설정'을 열었다. 전환 장면의 첫 프레임은 앞선 실사 클립의 마지막 프레임으로, 마지막 프레임은 뒤따를 AI 클립의 첫 프레임으로 지정했다. 이어 "슬로우 모션, 석상이 모래 깊은 곳에서 나타나 카메라를 향해 매우 느리게 달려오기 시작한다"고 프롬프트를 입력했다. 바움은 "현재 베타 버전은 5초 길이 제한이 있다"며 "프롬프트에 '슬로우 모션'을 반복해서 넣어 길게 생성한 뒤 에디터에서 속도를 200%로 높여 원하는 길이를 맞추는 팁을 사용한다"고 귀띔하기도 했다. 생성된 전환 장면과 앞서 만든 사운드트랙까지 타임라인에 추가되자 모든 준비가 끝났다. 최종 실사 영상은 성공적으로 완성됐다. 기존 영상에서 주인공과 싸우던 석상이 장면 전환 후 모래 속에서 천천히 나타나 달려오더니 갑자기 입술을 오므리고 카메라 렌즈에 키스하는 코믹한 반전 엔딩에 청중은 큰 박수를 보냈다. 바움은 "이 모든 과정이 단 몇 분 만에 이뤄졌다"며 "호기심을 화면 위의 무언가로 바꾸었다"고 말했다. 이어 "도구가 아닌 스토리텔러가 이야기를 만든다"고 강조했다.

2025.10.30 02:55조이환 기자

"텍스트만으로 뮤직비디오 완성"…구글 클라우드, '비오 3'로 영상 제작 혁신

구글 클라우드가 텍스트 명령만으로 고품질 영상을 생성하는 차세대 인공지능(AI) 동영상 생성 모델 '비오 3'를 앞세워 콘텐츠 제작 혁신을 주도한다. 구글 클라우드는 비오 3를 도입한 국내 기업들의 성공 사례를 29일 공개했다. 비오 3는 구글 딥마인드의 기술을 기반으로 세밀한 스타일 제어와 고해상도 영상 생성이 가능한 AI 모델이다. 기존 영상 제작에 수개월이 걸리던 작업을 단 며칠 내로 단축할 수 있어 국내 미디어·엔터테인먼트 업계에서 창작 효율의 게임체인저로 평가받고 있다. 타이거 JK가 이끄는 힙합 레이블 필굿뮤직은 구글 클라우드, GS네오텍과 협력해 드렁큰 타이거의 곡 '끄덕이는 노래' 뮤직비디오를 비오 3로 제작했다. 복잡한 시각효과와 3D 연출을 텍스트 프롬프트로 구현하며 기존 수개월 걸리던 프로세스를 단 2주 만에 완성했다. 필굿뮤직 한상범 감독은 "비오 3는 아티스트의 음악적 비전을 효율적으로 시각화하는 강력한 도구"라며 "AI의 시각화 능력과 인간의 창의적 디렉팅을 결합해 새로운 예술적 가능성을 실현하고 있다"고 말했다. SM엔터테인먼트 자회사 스튜디오리얼라이브는 비오 3 기술을 활용한 AI 영화 제작 도구 '플로우'로 신곡 '리치 맨' 뮤직비디오를 공개했다. 해당 영상은 현실과 상상을 넘나드는 몰입형 비주얼을 구현해 글로벌 팬덤의 호평을 받았다. 스튜디오리얼라이브는 비오 2 베타 버전부터 구글 클라우드 및 구글 딥마인드와 협업을 이어왔으며 자체 AI 에이전트를 구축해 기획부터 영상 제작까지 전 과정에 AI를 접목하고 있다. 이승우 스튜디오리얼라이브 대표는 "케이팝 IP와 팬들이 더 깊이 연결될 수 있도록 생성형 AI를 적극 도입 중"이라며 "구글 클라우드와 협력해 차세대 콘텐츠 혁신을 주도하겠다"고 밝혔다. 패러닷의 생성형 AI 서비스 캐럿은 구글 클라우드의 '버텍스 AI' 플랫폼 기반으로 제미나이 언어 모델과 비오 3를 결합해 영상 기획부터 제작까지 자동화했다. 사용자가 영상 목적을 입력하면 제미나이가 이를 분석해 비오 3에 최적의 프롬프트를 생성하고 결과물은 즉시 렌더링된다. 장진욱 패러닷 대표는 "캐럿은 비오 3를 통해 누구나 전문적인 영상 제작 경험 없이도 고품질 콘텐츠를 손쉽게 만들 수 있도록 돕는다"며 "향후 새 AI 모델을 빠르게 도입해 누구에게나 쉽고 편리한 창작 환경을 제공할 것"이라고 말했다. 지기성 구글 클라우드 코리아 사장은 "비오 3는 콘텐츠 제작 전반에서 영상 제작의 장벽을 혁신적으로 낮추며 전문적인 수준의 영상을 빠르게 제작할 수 있는 강력한 도구로, 제작 프로세스의 효율성을 향상하고 창작자에게 더 많은 상상력과 가능성을 현실화할 수 있는 기회를 제공한다"고 강조했다. 이어 "비오 3를 통해 국내 미디어 및 엔터테인먼트 기업들이 차세대 콘텐츠 혁신을 주도하고 크리에이티브 경쟁력을 강화할 수 있도록 적극 협력할 것"이라고 덧붙였다.

2025.10.29 16:48한정호 기자

구글클라우드, 새 AI 영상 모델 정식 출시…버텍스 AI에 추가

구글클라우드가 인공지능(AI) 영상 제작 모델을 정식 출시해 AI 시장 주도권 확보에 나섰다. 구글클라우드는 버텍스 AI를 통해 '비오 3'와 '비오 3 패스트'를 정식 출시했다고 1일 밝혔다. 비오 3는 고품질 AI 영상 생성 모델이며, 비오 3 패스트는 빠른 속도에 최적화된 경량 모델이다. 구글은 지난 5월 비오 3를 첫 공개한 후 전 세계에서 7천만 개 이상의 영상이 생성됐다고 밝혔다. 특히 버텍스 AI 프리뷰 버전이 출시된 지난 6월 이후 약 한 달 만에 600만 개 이상의 기업용 영상이 제작된 것으로 나타났다. 이번 정식 출시로 모든 고객은 비오 3와 비오 3 패스트로 고급 수준의 영상 콘텐츠를 손쉽게 제작할 수 있다. 제품 데모, 짧은 영화, 소셜 콘텐츠 등 다양한 형식에 대응하는 영상 제작이 가능한 셈이다. 8월 중에는 정적인 이미지를 동영상으로 바꾸는 이미지-투-비디오 기능도 버텍스 AI에 퍼블릭 프리뷰 버전으로 제공될 예정이다. 사용자는 이미지와 텍스트 프롬프트만으로 생동감 있는 영상을 자동 생성할 수 있다. 비오 3는 영상과 오디오를 동시에 생성할 수 있어 말하는 캐릭터와 음향 효과가 포함된 장면을 자동으로 구성한다. 생성된 영상은 고해상도 1천80픽셀(p) 품질을 제공해 마케팅, 제품 시연, 내부 커뮤니케이션 등에 적합하다. 글로벌 진출을 돕는 다국어 현지화 기능도 지원한다. 한 번 생성한 영상에서 수십 개 언어로 대사를 변환해 콘텐츠 확산 속도를 높일 수 있다. 비오 3 패스트는 빠른 제작이 중요한 광고, 교육, 제품 데모 분야에 유용하다는 평을 받고 있다. 특히 이미지 기반 제품 카탈로그 영상이나 다양한 광고 콘셉트 테스트에도 적합하다. 구글클라우드는 버텍스 AI에서 제공되는 비오 3와 비오 3 패스트가 기업 고객을 위한 보안성과 확장성을 갖췄다고 강조했다. 영상에는 신스ID 워터마크가 삽입돼 위조·출처 불명 콘텐츠 확산을 막는다. 저작권 보호도 강화됐다. 생성형 AI에 대한 구글의 면책 조항을 기반으로 기업은 안심하고 콘텐츠를 배포할 수 있다. 디자인 플랫폼 캔바도 비오 3를 활용한 사용자용 영상 제작 기능을 도입했다. 마케팅, 소셜미디어용 콘텐츠를 쉽게 제작할 수 있도록 돕고 있다. 캐머런 애덤스 캔바 공동 창립자 겸 최고제품책임자는 :구글클라우드의 비오 3를 통해 사용자가 고품질의 영상과 사운드로 아이디어를 실현할 수 있게 됐다"고 강조했다.

2025.08.01 17:31김미정 기자

"AI가 사진을 영상으로"…구글, '비오 3' 기능 제미나이에 통합

구글이 영상 인공지능(AI) '비오 3'의 주요기능을 '제미나이' 언어모델에 통합했다. 사진 한 장으로 동영상을 만들 수 있는 AI 기능이 사용자 경험의 핵심 축으로 자리잡게 됐다. 11일 테크크런치에 따르면 구글은 지난주부터 '비오 3' 기반 '이미지-투-비디오' 기능을 전 세계 150여 개국에 확대 적용했다. 해당 기능은 '제미나이 앱'과 '플로우 툴'을 통해 제공되며 'AI 울트라'와 'AI 프로' 유료 요금제 사용자에게만 지원된다. 무료 사용자 확대 여부는 공개되지 않았다. 사용자는 '제미나이' 앱에서 프롬프트 창 하단 '비디오' 항목을 선택한 뒤 이미지를 업로드하면 된다. 여기에 영상 분위기나 배경음에 대한 설명을 함께 입력하면 이를 바탕으로 시청각 요소가 결합된 짧은 클립이 생성된다. 생성된 영상은 즉시 다운로드하거나 타인과 공유할 수 있다. 구글은 '비오 3' 모델의 상용화 이후 7주 만에 전체 플랫폼에서 4천만 건 이상의 AI 영상이 제작됐다고 밝혔다. 모든 영상에는 '비오' 로고가 삽입된 시각적 워터마크와 함께 '신스ID' 기반의 비가시 디지털 워터마크가 포함된다. '신스ID'는 생성형 인공지능 콘텐츠 식별을 위해 구글이 개발한 기술로, 외형 변경이나 영상 편집이 이뤄져도 식별이 가능하다. 구글은 올해 초부터 '신스ID' 탐지 기능도 별도 도구로 제공하며 생성물의 투명성 확보에 주력해왔다. 이번 기능은 지난 5월 구글 I/O에서 먼저 공개된 AI 기반 영상 툴 플로우에서 선제 적용된 바 있다. 이후 같은 기능을 '비오 3' 기반 제미나이 앱에도 옮긴 것이다. 테크크런치는 "영상 생성은 요금제에 따라 하루 최대 3건까지 가능하며 미사용 횟수는 이월되지 않는다"며 "생성된 콘텐츠는 공유 또는 저장은 가능하지만 편집 기능은 제공되지 않는다"고 밝혔다.

2025.07.11 09:22조이환 기자

[유미's 픽] "구독자 벌써 40만명, 궁금한 사람?"…유튜브 휘저은 김햄찌, AI 덕에 컸다

"서른n살. 암컷. 잔인한 퀸." 최근 햄스터 한 마리를 주인공으로 한 '정서불안 김햄찌'가 빠르게 유튜브 구독자 수를 올리며 화제를 모으고 있는 가운데 생성형 인공지능(AI) 기술을 활용한 버튜버들이 속속 등장해 주목된다. AI 기업들도 점차 생성형 AI 영상 모델의 기술을 고도화 해 어색함을 줄이고 점차 사실에 가까운 결과물을 도출할 수 있도록 함으로써 사용자들을 빠르게 늘려가는 분위기다. 9일 업계에 따르면 유튜버 '정서불안 김햄찌'는 첫 콘텐츠를 게시한 지 두 달여만에 구독자 수가 40만 명을 돌파했다. AI로 만든 햄스터를 주인공으로 회사원들이 누구나 겪을 법한 이야기를 재미있게 담아낸 덕에 여행 유튜버 '빠니보틀' 등 유명인들까지 관심을 보이고 있다. '정서불안 김햄찌'는 자신의 소소한 일상을 우수한 기획력을 바탕으로 재미있게 영상으로 풀어냈다는 점에서 많은 호평을 받고 있다. 특히 ▲퇴근 2시간 전 상사의 업무 지시에 속마음으로 분노를 표출하는 모습 ▲첨부파일명에 욕설이 담긴 것을 모른 채 고객사에게 실수로 이메일을 보내 상사에게 혼나는 모습 ▲다이어트 과정에서 계란빵, 마라탕, 탕후루를 먹으면서도 살이 안찐다고 합리화 하는 모습 등이 많은 공감을 자아내고 있다. 덕분에 신생 채널임에도 불구하고 입소문을 타고 구독자 수가 하루에 2만~3만 명씩 늘어나며 빠르게 성장하고 있다. 또 '정서불안 김햄찌'의 인기에 최근에는 이와 비슷한 콘셉트의 영상을 AI로 제작해 만든 유튜버들도 빠르게 늘어나는 추세다. 이 같은 AI 영상들은 챗GPT 같은 AI 챗봇에서 이미지 프롬프트를 만든 후 소라, 하이루오AI 등 동영상 생성형 AI로 제작하면 된다. 효과음은 픽사베이, 편집은 캡컷 등을 활용하면 된다. 전문가가 아니더라도 이젠 AI를 활용해 누구든 텍스트 몇 마디만 입력하면 사진·영상을 만들 수 있게 된 것이다. 업계 관계자는 "AI 기술 발전으로 일반인들도 전문가 수준의 콘텐츠 제작이 가능해졌다"며 "사람이 했을 때 보다 시간, 비용 측면에서도 많이 절감돼 기업들도 점차 AI 기술을 콘텐츠 제작과 마케팅 활동에 많이 활용하는 분위기"라고 말했다. 실제 쿠팡플레이는 한국프로축구리그에 AI를 접목해 눈길을 끌었다. 경기 중 선수의 움직임을 실시간으로 분석해 해설진과 시청자에게 제공함으로써 몰입감을 더 높였다는 평가를 받는다. KT는 자체 제작 드라마 신병3의 줄거리를 요약한 숏폼을 AI로 만들어 유튜브에 공개했다. CJ ENM은 AI를 활용해 올해 초 방영한 tvN 예능 프로그램 '컨츄리쿡'에 가상간접광고(VPP)를 진행시켰다. 매일유업과 협의해 두유가 전면 노출되는 컷을 촬영이 끝난 후 AI로 추가한 것이다. 생성 AI를 활용해 아바타, 캐릭터에 생명력이 부여되면서 버튜버(가상 캐릭터로 인터넷 방송을 진행하는 방송인)나 버추얼 휴먼도 급격하게 늘었다. 지난 2023년 3월 데뷔한 플레이브는 대표적인 버추얼 아이돌 그룹으로, 각종 음악방송 1위와 빌보드 '글로벌 200 차트'에 버추얼 아이돌 그룹 최초로 진입했다. 또 오는 8월부터 서울 콘서트를 시작으로 홍콩, 도쿄, 방콕 등 글로벌 팬들을 위한 아시아 투어도 앞두고 있다. 6인조 버추얼 아티스트인 이세계아이돌도 유명하다. 2021년 12월 17일 데뷔한 이 그룹은 지난해 '키딩'이라는 곡을 통해 국내 차트 1위는 물론, 빌보드 코리아 3위, 빌보드 글로벌 200차트에서 167위를 기록하기도 했다. 업계 관계자는 "사실적인 묘사에 중점을 둔 1세대 버추얼 휴먼은 표정과 동작 하나하나 수작업을 거칠 정도로 시간이 많이 소요돼 효율이 떨어져 시장의 외면을 받았다"며 "최근 등장한 2세대 버추얼 휴먼은 AI 기술을 활용해 제작이 좀 더 쉬워진데다 상호작용 능력을 갖추고 있다는 점에서 인기를 얻고 있다"고 말했다. 덕분에 전 세계 버튜버 시장도 빠르게 성장하고 있다. 실제 글로벌 시장조사기관 글로벌인포메이션에 따르면 글로벌 버튜버 시장 규모는 지난해 14억1천638만 달러(약 1조9천200억원)에서 2030년 38억5천242만 달러(약 5조2천473억원)까지 성장할 것으로 전망됐다. 이에 버튜버들이 즐겨 쓰는 동영상 생성형 AI 시장도 호황을 맞았다. 시장 조사 기관 포춘비즈니스인사이트에 따르면 글로벌 생성형 AI 비디오 시장은 지난해 약 6억1천500만 달러(약 8천445억원)에서 올해 7억1천700만 달러(약 9천846억원)으로 성장할 것으로 관측됐다. 또 매년 20%씩 성장해 오는 2032년에는 25억6천300만 달러(약 3조5천203억원) 규모로 커질 것으로 예상됐다. 이 같은 분위기에 맞춰 AI 기업들도 발 빠르게 새로운 모델을 내놓으며 기술 고도화에 집중하고 있다. 특히 구글은 영상뿐 아니라 음향까지 AI가 삽입해주는 생성형 AI 영상 모델 '비오3'를 조만간 선보일 것으로 알려져 기대감을 모으고 있다. '비오3'는 최대 8초 길이의 동영상을 생성할 수 있으며 텍스트 입력만으로 영상과 소리를 동시에 만들어준다. 오픈AI가 만든 '소라'도 지난 해 2월 처음 공개된 후 10개월 만에 시장에 등장했다. 생성되는 동영상의 길이는 최대 20초로, 기존 동영상을 확장하거나 빠진 프레임을 채우는 '스토리보드' 기능도 제공한다. 런웨이는 지난 4월 '젠-4'를 공개해 눈길을 끌었다. 이전보다 캐릭터, 배경, 사물의 일관성을 유지하며 사실적인 움직임과 스타일을 구현할 수 있게 한 것이 특징이다. '포토샵'으로 유명한 어도비도 '파이어플라이 비디오 모델'을 같은 달 정식 출시했다. 텍스트 프롬프트나 이미지로 1천80p 비디오를 생성하고 카메라 구도 조정, B-롤 제작, 모션 디자인까지 생성할 수 있는 것이 특징이다. 최근에는 이를 더욱 쉽게 구현할 수 있는 모바일 앱도 출시했다. 이 외에 ▲메타 '무비젠' ▲마이크로소프트 '드래그누와' ▲바이트댄스 '매직비디오' ▲스태빌리티 AI '스테이블 비디오 디퓨전' ▲콰이쇼우 '클링' ▲미니맥스 '하이루오AI' 등도 동영상 생성형 AI 시장에서 각광 받고 있다. 이 중 중국 AI 4대 기업으로 꼽히는 미니맥스는 연내 홍콩 상장을 추진할 정도로 빠르게 성장하고 있다. 이처럼 본격적인 동영상 생성 AI 시대가 열리면서 영상 관련 산업도 빠르게 변화하고 있다. 실제 소니픽처스는 영화 제작 비용을 줄이기 위해 생성형 AI를 적극 활용하겠다고 공개적으로 밝힌 바 있다. 다만 영화, 애니메이션, 증강현실(AR) 및 가상현실(VR) 등 다양한 분야에서 AI 기술을 활용할 수 있게 되면서 일자리를 위협 받는 이들도 상당해질 것으로 예상된다. 영화 CG 일러스트레이터인 리드 사우든은 "2022년 미드저니(이미지 생성 AI)가 처음 나왔을 때 우리는 '귀엽다'며 비웃었다"며 "하지만 이제 사람들은 생성 AI 때문에 일자리를 잃고 있다"고 말했다. 일각에선 딥페이크 문제에 대해서도 우려하고 있다. AI 기술로 유명인들의 얼굴을 합성해 정교한 가짜 영상을 만드는 것이 쉬워졌기 때문이다. 업계 관계자는 "오픈소스로 공개된 AI 영상 제작 기술을 악의적으로 활용하게 되면 진위를 판단하는 게 쉽지 않다"며 "이를 막을 수 있는 법·제도가 하루 빨리 정비돼 피해 확산을 막아야 한다"고 지적했다.

2025.07.09 16:32장유미 기자

구글, 생성형 AI 영상툴 '비오 3' 세계 출시…오디오까지 붙는 영상 제작

구글이 생성형 인공지능(AI) 영상 모델 '비오 3(Veo3)'를 전세계에 출시하면서 영상 제작의 진입장벽을 대폭 낮추는 기술 확장을 본격화했다. 4일 테크크런치에 따르면 구글은 '비오 3'를 이달부터 159개국 이상에서 제미나이 사용자에게 순차적으로 적용 중이다. 이 모델은 최대 8초 길이의 동영상을 생성할 수 있으며 텍스트 입력만으로 영상과 소리를 동시에 만들어준다. '비오 3'는 지난 5월 공개 당시에도 영상 품질과 프레임 전환 자연도에서 높은 평가를 받았지만 이번 세계 출시를 통해 음성까지 생성하는 '네이티브 오디오' 기능이 정식 반영됐다. 동영상 한 편 안에 장면, 움직임, 사운드를 모두 구현하는 생성형 AI는 시장 내에서도 제한된 기술로 꼽힌다. 사용자는 단순한 글을 입력하거나 캐릭터, 사물, 상황 등을 설명하는 방식만으로 애니메이션, 밈, 스토리보드 등을 즉시 생성할 수 있다. 콘텐츠 제작 초기 단계인 콘셉트 시안, 브레인스토밍, 프로토타입 영상 제작에도 유용하다. 생성 과정은 전부 '제미나이' 플랫폼 안에서 이뤄진다. 요금제에 따라 기능과 품질도 차등화된다. 'AI 프로'는 신속한 속도와 기본 품질에 중점을 두며 'AI 울트라'는 고화질 영상과 더 정교한 오디오까지 포함하는 최상위 옵션이다. 두 요금제 모두 인터넷 연결과 일정 기준의 사용자 조건을 충족해야 이용 가능하다. 또 구글은 '비오 3'에 이미지 기반 입력 기능도 곧 도입할 예정이다. 텍스트뿐 아니라 이미지를 활용해 영상으로 전환하는 기능은 현재 개발 중이며 향후 제미나이 업데이트를 통해 반영될 계획이다. 영상 제작을 위한 입력 방식 다변화를 통해 더 직관적인 창작 흐름을 노리는 것으로 풀이된다. 현재 '제미나이'에는 '비오 3 패스트'라는 경량 모델도 함께 제공되고 있다. 이는 상대적으로 짧은 시간 안에 빠르게 결과물을 확인할 수 있도록 최적화된 버전으로, 복잡한 품질 조정이나 고해상도 출력은 '울트라' 요금제 전용 기능으로 분리돼 있다. 조쉬 우드워드 구글 제미나이 담당은 "현재 이미지 기반 비디오 생성 기능도 '제미나이'에 추가하는 작업을 진행 중"이라고 밝혔다.

2025.07.04 09:23조이환 기자

[현장] "韓 대학생도 봉?"…美서 무료로 쓰는 구글 제미나이, 프로모션 두고 韓 '차별'

구글이 인공지능(AI) '제미나이'의 대중적 활용 가능성을 강조하며 국내 체험 행사를 열었으나 정작 미국 대학생들에게만 유료 기능을 무료 제공하는 프로모션 정책을 운영 중인 것으로 드러나 형평성 논란이 일고 있다. '글로벌 확장'을 내세우면서도 국내 이용자는 배제돼 한국 소비자들에 대한 차별 논란이 일고 있다. 구글코리아는 20일 서울 강남파이낸스센터 본사에서 '제미나이 워크숍 : 티치 미 하우 투 제미나이'를 개최했다. 이 행사는 음성 대화 기능을 포함한 '제미나이' 최신 기능과 새로운 생성형 AI 도구들을 소개하는 자리였다. 이날 행사에서는 김기환 구글코리아 매니저가 '딥리서치', '제미나이 라이브' 등 핵심 기능을 발표했다. 이어 연세대학교 학생들이 '제미나이'를 활용한 일상 접목 사례를 직접 소개했다. 다만 미국 대학생들에게는 유료 기능을 무료로 제공하는 프로모션 정책이 시행 중인 데 비해 국내에서는 아직 적용되지 않아 이쉬운 대목으로 남았다. "더는 실험실 이론이 아니다"…구글이 제시한 AI 활용법은? 이날 구글코리아는 '제미나이'의 진화 과정과 활용 방안을 집중적으로 소개했다. 모바일·웹·음성 등 멀티모달 환경에서 실제로 사용 가능한 기능을 사례 중심으로 설명하며 기술 확산만큼이나 '현실 적용'에 방점을 찍는 모습이었다. 김기환 구글코리아 커뮤니케이션팀 매니저는 "이제 AI는 단순한 기술을 넘어 이용자의 실생활을 직접 바꾸는 도구가 되고 있다"며 "오늘 소개할 기능은 모두 실제 스마트폰이나 브라우저에서 바로 실행 가능한 것들"이라고 강조했다. 김 매니저는 발표 초반에 '제미나이' 모델의 계보와 구글 AI 전략의 변화를 간략히 정리했다. 지난 2016년 구글 딥마인드가 개발해 이세돌을 이긴 바둑 AI '알파고'를 시작으로, 'AI 퍼스트'를 선언한 순다 피차이 CEO의 기조 아래 구글은 트랜스포머 아키텍처·람다·알파폴드·팜·제미나이 시리즈로 이어지는 대형 모델 개발을 지속해왔다. 이 중 '제미나이 2.5'는 올해 구글 I/O에서 가장 주목받은 최신 버전이다. 김 매니저는 "'제미나이'는 하나의 모델이 아니라 '모델군(family)'이며 '플래시', '플래시-라이트', '프로'처럼 목적과 성능에 따라 구분된다"며 "특히 '프로'는 복잡한 작업 수행에 강하고 플래시는 응답 속도와 비용 효율에서 유리하다"고 설명했다. 제미나이의 실사용 예시도 이어졌다. 음성 기반 대화가 가능한 '제미나이 라이브' 기능은 스마트폰 카메라 화면을 실시간으로 분석해 사용자에게 적절한 피드백을 제공한다. 김 매니저는 "방 구조 변경을 고민하며 제미나이에게 영상을 보여줬더니 도면 개선 방향까지 추천해줬다"고 말했다. 더불어 김 매니저는 '딥 리서치(Deep Research)' 기능도 소개했다. 이 기능은 복잡한 주제에 대해 AI가 조사부터 요약까지 전담하는 개인 연구 어시스턴트 역할을 한다. 텍스트 기반 질문은 물론 PDF와 같은 대용량 문서도 처리할 수 있으며 답변에는 출처와 인용 링크가 자동 포함된다. 그는 "기자처럼 정량적 정보 검증이 중요한 사용자에게 특히 유용한 기능"이라고 강조했다. 개인화 기능도 소개됐다. 구글 지메일, 캘린더, 드라이브, 문서 등과 '제미나이'를 연동하면 이용자의 일정과 파일을 AI가 직접 분석해 맞춤형 안내를 제공한다. 일례로 문자 작성부터 전송, 일정 등록까지 음성 지시 한 번으로 일괄 수행할 수 있다. 창작 도구도 빠짐없이 언급됐다. '캔버스(Canvas)' 기능은 입력한 프롬프트를 기반으로 HTML 코드를 생성해 미리보기까지 지원한다. 또 '스티치(Stitch)'를 이용하면 개발 지식이 없는 사용자도 자연어로 앱 프로토타입을 생성할 수 있다. 영상 생성 AI '비오(Veo)'와 이를 기반으로 한 편집 툴 '플로우(Flow)'도 함께 소개됐다. '비오 3'는 음성 지시만으로 현실감 있는 장면을 생성할 수 있는 모델이다. 실제 개발자 커뮤니티에서는 단편 영화 제작 도구로 활용되고 있다. '플로우'는 이처럼 생성된 짧은 영상 클립들을 시간 순서에 따라 연결하고 프롬프트나 이미지 등을 활용해 이어지는 장면을 자동 확장해주는 타임라인 기반 편집 툴이다. 김기환 구글코리아 매니저는 "영상 생성의 완성도가 카메라 촬영과 구별되지 않을 정도"라며 "자체 워터마크 삽입과 감지 기술인 '신스아이디 디텍터'를 병행해 콘텐츠 투명성을 확보하고 있다"고 밝혔다. 연세대 학생들 "AI, 우리들의 친구"…韓엔 없는 학생 혜택, 확장성엔 의문 이어 진행된 세션에서는 연세대학교 언론홍보학과 학생들이 직접 기획하고 제작한 세 편의 영상이 공개됐다. 해당 영상은 구글과 학과 측이 공동으로 기획한 상반기 프로젝트의 결과물로, '제미나이'를 실생활에서 어떻게 활용할 수 있는지를 구체적인 상황에 맞춰 보여주는 것을 목표로 했다. 첫 번째 영상은 가족 구성원의 건강과 일상을 챙기는 보호자의 시점을 중심으로 '제미나이'를 활용한 사례를 다뤘다. 계란 알러지가 있는 아이의 급식 확인, 병원 면회 시간 계산, 복약 정보 검색 등 음성 기반 인터페이스를 통해 AI가 실시간으로 정보를 제공하는 장면들이 담겼다. 두 번째 팀은 다이어트, 연애, 야근 등 청년층의 생활 속에서 AI가 일종의 동료처럼 대응하는 상황을 연출했다. 간식의 영양 성분 분석부터 고백 준비, 스트레스 해소 영상 추천까지 이어지는 흐름은 '제미나이'가 단순한 정보 검색 도구가 아니라 개인화된 조언자로 작동할 수 있다는 점을 부각했다. 세 번째 영상은 캠퍼스 생활을 배경으로, AI가 복학생의 정보 격차를 메우고 실질적인 학업 보조 역할을 하는 모습을 담았다. 쇼츠 형식의 시리즈물로 구성돼 영상 집중도가 낮은 청년 겨냥했고 연동성 강점을 살려 유튜브·구글 문서·노트북LM 등 다양한 기능을 유기적으로 활용하는 장면이 포함됐다. 학생들은 발표를 통해 "AI는 나를 대체하는 존재가 아니라 함께 살아가는 존재로 자리 잡아야 한다"며 "광고처럼 정보를 주입하는 것이 아니라 스스로 찾아보게 만드는 도구로서 '제미나이'를 설계했다"고 설명했다. 이후 질의 응답 시간에선 학교를 대상으로 진행되는 제미나이 프로모션이 국가별로 다르게 적용되는 것을 두고 많은 관심이 집중됐다. 특히 미국 대학생에게는 유료 플랜을 일정 기간 무료로 제공하는 프로모션과 관련해 국내 대학생에게도 동일한 혜택이 제공될 예정인지에 대한 질문이 많았다. 이에 대해 구글 측은 "해당 프로모션은 미국 등 일부 국가에서만 운영되고 있다"며 "아직 한국은 대상에 포함돼 있지 않다"고 밝혔다.

2025.06.20 15:05조이환 기자

구글, 제미나이에 영상 AI 모델 '비오2' 탑재…"현실 이해하는 AI 구현"

구글이 영상 인공지능(AI) 모델 '비오2'를 AI 서비스 '제미나이'에 탑재해 동영상 AI 시장 경쟁력을 높였다. 16일 더버지 등 외신에 따르면 구글은 비오2를 유료 AI 서비스인 '제미나이 어드밴스드' 이용자에게 제공하기 시작했다. 비오는 텍스트를 영상 콘텐츠로 변형할 수 있는 생성형 AI 모델이다. 2023년 5월 처음 소개됐다. 비오2는 같은 해 말 공개된 후 소수 이용자에 한해 시범 운영됐다. 이번 제미나이 통합으로 활용 범위가 넓어졌다. 제미나이 어드밴스드 사용자는 16대9 화면 비율, 720픽셀(p) 해상도, 최대 8초 분량의 짧은 영상 클립을 생성할 수 있다. 완성된 영상은 MP4 형식으로 내려받을 수 있다. 콘텐츠가 AI로 제작된 것임을 알리기 위해 자체 인증 마크 '신스 ID' 워터마크를 영상에 삽입한다. 구글은 "비오2가 실제 촬영한 듯한 정밀한 디테일을 구현할 수 있다"며 "현실적 물리 법칙과 인체 움직임을 이해해 다양한 주제에 맞는 고품질 영상을 만들어낼 수 있다"고 강조했다. 앞서 데미스 허사비스 구글 딥마인드 최고경영자(CEO)도 비오와 제미나이 결합을 통해 AI의 물리 세계 이해력을 강화할 계획이라고 밝힌 바 있다. 앞서 오픈AI는 지난해 12월 최대 1분 분량 영상을 생성하는 '소라'를 공개했다. 메타는 같은 해 텍스트 기반 영상 생성 모델 '무비젠'을 출시했다. AI 스타트업 런웨이는 4세대 동영상 생성 모델을 출시하며 3억 달러(약 4천264억원)넘는 투자 유치를 기록하는 등 기술력과 시장 가능성을 동시에 인정받고 있다. 더버지는 "구글은 오픈AI와 메타, 런웨이 등과 동영상 생성 AI 분야 경쟁에 본격적으로 뛰어들었다"고 평가했다.

2025.04.16 17:43김미정 기자

챗GPT 다음은 '이것'?…구글 멀티모달 AI가 바꿀 로보틱스 혁명

데미스 하사비스 구글 딥마인드 최고경영자(CEO)가 구글의 인공지능(AI) 모델 '제미나이'와 영상 생성 AI '비오2'를 결합한다는 계획을 발표했다. 11일 테크크런치에 따르면 하사비스 CEO는 리드 호프먼 링크드인 공동 창립자가 진행하는 팟캐스트 파서블에 출연해 제미나이에 비오2를 결합해 물리 세계를 이해할 수 있는 AI 모델로 고도화하겠다고 밝혔다. 하사비스 CEO는 "비오2가 많은 유튜브 영상을 학습하는 것만으로도 현실 세계의 물리 법칙을 이해할 수 있다는 것에 놀랐다"며 "이는 로봇 산업에 엄청난 영향을 미칠 수 있다고 생각했다"고 말했다. 이어 "우리가 개발한 멀티모달 파운데이션 모델 제미나이와 비오2를 향후 결합할 계획"이라며 "AI가 단순 챗봇 수준을 넘어 인간이 살고 있는 현실 세계를 이해하고 도움을 줄 수 있도록 할 것"이라고 강조했다. 두 AI 모델을 결합해 유튜브 영상 학습과 같은 기존의 강화 학습만으로 복잡한 인간의 창의성과 행동을 모방할 수 있는 '인공 일반 지능(AGI)'에 도달할 수 있다는 게 구글의 기대다. 특히 로보틱스 산업에서의 활용도 성공적일 것이란 관측이다. 로보틱스 기술에 필요한 물리적 상호작용 없이도 영상 AI를 기반으로 현실 세계를 이해할 수 있다는 것이다. 앞서 구글 딥마인드는 로봇 맞춤형 AI 모델인 '제미나이 로보틱스'와 다른 고급 시각·언어·행동(VLA) 모델 대비 성능이 2배 향상된 벤치마크 결과도 발표한 바 있다. 하사비스 CEO는 "우리 삶에 실질적인 도움을 주는 AI 기술은 로보틱스 영역에도 필요하다"며 "물리 법칙을 이해하는 멀티모달 모델들에 로봇이 필요로 하는 행동, 운동 제어, 계획 수립과 관련된 미세조정을 수행해 이를 성공적으로 구현할 수 있다"고 설명했다. 이어 "범용 AI 모델에 데이터를 추가 학습하거나 특별한 노력 없이도 로보틱스 환경에 알맞은 AI를 개발·이식할 수 있다"며 "이는 5년 전 최고의 로봇공학자들조차 예측하기 어려웠던 결과"라고 덧붙였다. 그러면서 "우리가 만들고 있는 범용 멀티모달 모델들이 충분히 정교해져 로봇에 그대로 탑재될 것"이라며 "언어·과학 분야에 챗GPT·알파고·알파폴드가 가져온 결정적인 순간이 아직 로보틱스 산업에는 오지 않았으나 그 시점이 곧 올 것"이라고 강조했다.

2025.04.11 11:16한정호 기자

"AI 영상 생성, 1시간에 250만원"…구글, '비오 2' 초고품질 전략 성공할까

인공지능(AI) 기반 비디오 생성 시장의 경쟁이 본격화되는 가운데 구글이 자사 영상 AI인 '비오 2'의 가격을 공개했다. 4K 초고품질 영상을 지원하나, 오픈AI의 '소라'보다 가격이 높아 비용 대비 경쟁력이 있을지에 대한 의문이 제기되고 있다. 두 모델 모두 환각 및 물리 법칙 구현 등 기술적 한계를 드러내고 있다는 점도 해결 과제다. 24일 테크크런치에 따르면 구글은 AI 비디오 생성 모델 '비오 2'의 가격을 초당 50센트(한화 약 700원)로 책정했다. 이는 시간당 1천800달러(한화 약 250만원), 분당 30달러(한화 약 4만2천원)에 해당하는 수준으로, 구글은 '비오 2'를 통해 고품질 영상 시장을 공략하며 영상 생성의 상업적 활용도를 높이려는 전략을 펼치고 있다. '비오 2'는 최대 4K 해상도를 지원하는 고급형 비디오 생성 모델이다. 구글 클라우드의 '버텍스 AI(Vertex AI)' 플랫폼을 통해 제공되며 고해상도와 정밀한 디테일을 구현하는 데 초점을 맞췄다. 다만 비용이 초당 50센트로 책정되면서 일반 사용자보다는 전문가 및 기업 시장을 겨냥한 서비스로 보인다. 특히 오픈AI의 비디오 생성 AI인 '소라'와의 가격 정책 차이가 주목된다. 오픈AI는 크레딧 기반의 구독 모델을 통해 '소라'를 운영하고 있으며 1천80p 기준 초당 20센트(한화 약 280원)로 '비오 2'보다 상대적으로 저렴한 가격을 제시하고 있다. 오픈AI의 비디오 AI 가격 구조는 이용자의 구독 플랜에 따라 달라지며 저해상도에서는 보다 낮은 비용으로 비디오를 생성할 수 있다. 현재 '소라'는 월 20달러(한화 약 2만8천원)의 챗GPT '플러스'와 월 200달러(한화 약 28만원)의 '프로' 플랜을 통해 제공되며 각각 1천 크레딧과 1만 크레딧을 지급하는 방식이다. 480p 해상도의 경우 초당 4크레딧으로 약 8센트(한화 약 110원), 1천80p 해상도에서는 초당 100크레딧으로 약 20센트(한화 약 280원)이 소모된다. '소라'는 현재 4K 해상도를 지원하지 않지만 비용 효율성 면에서는 '비오 2'보다 경쟁력이 높은 것으로 보인다. 다만 실제 영상 제작 현장에서는 두 모델 모두 완벽하지 않다는 지적이 나온다. 최근 업계 평가에 따르면 '비오 2'는 손가락, 눈동자, 피부 질감 등 세부 표현에서 비현실적인 결과가 발생하며 물리 법칙에 부합하지 않는 액체 유동성 표현 등의 문제가 드러난다. 또 '소라'는 인체 움직임에서 부자연스러운 관절 회전과 신체 비율 왜곡 현상이 잦으며 보행 시 다리 움직임이 로봇처럼 경직되는 문제를 보인다. 이 외에도 장면 전환 시 객체의 색상 및 크기 변화가 불안정해 시간적 일관성을 유지하는 데 어려움을 겪고 있다. 이 같은 기술적 한계는 두 모델이 아직 실제 영상 수준에 미치지 못하는 부분을 여실히 보여준다. 전문가들은 물리 엔진 통합 등 추가 개발이 필요하다고 지적하며 특히 의류 주름 시뮬레이션과 액체-고체 상호작용 구현이 시급한 과제라고 평가한다. 향후 개선된 기술이 도입될 경우 보다 현실적인 AI 영상 제작이 가능할 것으로 기대된다. 디나 베라다 유튜브 제품 담당 이사는 "'비오 2'는 현실 세계의 물리 법칙과 인간의 움직임을 더 잘 이해해 세밀하고 현실적인 결과물을 만든다"며 "스타일, 렌즈, 시네마틱 효과까지 지정할 수 있어 쉽고 재미있게 영상을 표현한다"고 강조했다.

2025.02.24 10:55조이환 기자

Prev 1 Next

ZDNet 검색 페이지

'비오'통합검색 결과 입니다. (13건)

[AI는 지금] "몸값 낮춰도 27조"…中 클링 AI, 4조 실탄 들고 글로벌 공세 본격화

[AI는 지금] 오픈AI, 챗GPT에 '소라' 품는다…AI 영상 전략 흔들리나

[AI는 지금] 구글도 숏폼에 '올인'…AI 영상 '비오'에 세로형 지원 나선 이유

[현장] "몇 분 만에 엔딩 교체"…AI 만난 영상 편집, 실시간 마법 시연

"텍스트만으로 뮤직비디오 완성"…구글 클라우드, '비오 3'로 영상 제작 혁신

구글클라우드, 새 AI 영상 모델 정식 출시…버텍스 AI에 추가

"AI가 사진을 영상으로"…구글, '비오 3' 기능 제미나이에 통합

[유미's 픽] "구독자 벌써 40만명, 궁금한 사람?"…유튜브 휘저은 김햄찌, AI 덕에 컸다

구글, 생성형 AI 영상툴 '비오 3' 세계 출시…오디오까지 붙는 영상 제작

[현장] "韓 대학생도 봉?"…美서 무료로 쓰는 구글 제미나이, 프로모션 두고 韓 '차별'

구글, 제미나이에 영상 AI 모델 '비오2' 탑재…"현실 이해하는 AI 구현"

챗GPT 다음은 '이것'?…구글 멀티모달 AI가 바꿀 로보틱스 혁명

"AI 영상 생성, 1시간에 250만원"…구글, '비오 2' 초고품질 전략 성공할까

지금 뜨는 기사

이시각 헤드라인

최태원 SK 회장 "반도체, 과거 사이클 벗어나 구조적 변화…공급 확대 총력"

테슬라, FSD 구독제 전환…일시불 904만원→월 15만원

태양 수명 다해도 지구는 살아남는다..."기존 가설 뒤집혔다" [우주로 간다]

애플, 오픈AI 전격 제소…"영업비밀 훔쳤다"

ZDNet Power Center