• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
창간특집
인공지능
배터리
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'비오'통합검색 결과 입니다. (7건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

구글, 제미나이에 영상 AI 모델 '비오2' 탑재…"현실 이해하는 AI 구현"

구글이 영상 인공지능(AI) 모델 '비오2'를 AI 서비스 '제미나이'에 탑재해 동영상 AI 시장 경쟁력을 높였다. 16일 더버지 등 외신에 따르면 구글은 비오2를 유료 AI 서비스인 '제미나이 어드밴스드' 이용자에게 제공하기 시작했다. 비오는 텍스트를 영상 콘텐츠로 변형할 수 있는 생성형 AI 모델이다. 2023년 5월 처음 소개됐다. 비오2는 같은 해 말 공개된 후 소수 이용자에 한해 시범 운영됐다. 이번 제미나이 통합으로 활용 범위가 넓어졌다. 제미나이 어드밴스드 사용자는 16대9 화면 비율, 720픽셀(p) 해상도, 최대 8초 분량의 짧은 영상 클립을 생성할 수 있다. 완성된 영상은 MP4 형식으로 내려받을 수 있다. 콘텐츠가 AI로 제작된 것임을 알리기 위해 자체 인증 마크 '신스 ID' 워터마크를 영상에 삽입한다. 구글은 "비오2가 실제 촬영한 듯한 정밀한 디테일을 구현할 수 있다"며 "현실적 물리 법칙과 인체 움직임을 이해해 다양한 주제에 맞는 고품질 영상을 만들어낼 수 있다"고 강조했다. 앞서 데미스 허사비스 구글 딥마인드 최고경영자(CEO)도 비오와 제미나이 결합을 통해 AI의 물리 세계 이해력을 강화할 계획이라고 밝힌 바 있다. 앞서 오픈AI는 지난해 12월 최대 1분 분량 영상을 생성하는 '소라'를 공개했다. 메타는 같은 해 텍스트 기반 영상 생성 모델 '무비젠'을 출시했다. AI 스타트업 런웨이는 4세대 동영상 생성 모델을 출시하며 3억 달러(약 4천264억원)넘는 투자 유치를 기록하는 등 기술력과 시장 가능성을 동시에 인정받고 있다. 더버지는 "구글은 오픈AI와 메타, 런웨이 등과 동영상 생성 AI 분야 경쟁에 본격적으로 뛰어들었다"고 평가했다.

2025.04.16 17:43김미정

챗GPT 다음은 '이것'?…구글 멀티모달 AI가 바꿀 로보틱스 혁명

데미스 하사비스 구글 딥마인드 최고경영자(CEO)가 구글의 인공지능(AI) 모델 '제미나이'와 영상 생성 AI '비오2'를 결합한다는 계획을 발표했다. 11일 테크크런치에 따르면 하사비스 CEO는 리드 호프먼 링크드인 공동 창립자가 진행하는 팟캐스트 파서블에 출연해 제미나이에 비오2를 결합해 물리 세계를 이해할 수 있는 AI 모델로 고도화하겠다고 밝혔다. 하사비스 CEO는 "비오2가 많은 유튜브 영상을 학습하는 것만으로도 현실 세계의 물리 법칙을 이해할 수 있다는 것에 놀랐다"며 "이는 로봇 산업에 엄청난 영향을 미칠 수 있다고 생각했다"고 말했다. 이어 "우리가 개발한 멀티모달 파운데이션 모델 제미나이와 비오2를 향후 결합할 계획"이라며 "AI가 단순 챗봇 수준을 넘어 인간이 살고 있는 현실 세계를 이해하고 도움을 줄 수 있도록 할 것"이라고 강조했다. 두 AI 모델을 결합해 유튜브 영상 학습과 같은 기존의 강화 학습만으로 복잡한 인간의 창의성과 행동을 모방할 수 있는 '인공 일반 지능(AGI)'에 도달할 수 있다는 게 구글의 기대다. 특히 로보틱스 산업에서의 활용도 성공적일 것이란 관측이다. 로보틱스 기술에 필요한 물리적 상호작용 없이도 영상 AI를 기반으로 현실 세계를 이해할 수 있다는 것이다. 앞서 구글 딥마인드는 로봇 맞춤형 AI 모델인 '제미나이 로보틱스'와 다른 고급 시각·언어·행동(VLA) 모델 대비 성능이 2배 향상된 벤치마크 결과도 발표한 바 있다. 하사비스 CEO는 "우리 삶에 실질적인 도움을 주는 AI 기술은 로보틱스 영역에도 필요하다"며 "물리 법칙을 이해하는 멀티모달 모델들에 로봇이 필요로 하는 행동, 운동 제어, 계획 수립과 관련된 미세조정을 수행해 이를 성공적으로 구현할 수 있다"고 설명했다. 이어 "범용 AI 모델에 데이터를 추가 학습하거나 특별한 노력 없이도 로보틱스 환경에 알맞은 AI를 개발·이식할 수 있다"며 "이는 5년 전 최고의 로봇공학자들조차 예측하기 어려웠던 결과"라고 덧붙였다. 그러면서 "우리가 만들고 있는 범용 멀티모달 모델들이 충분히 정교해져 로봇에 그대로 탑재될 것"이라며 "언어·과학 분야에 챗GPT·알파고·알파폴드가 가져온 결정적인 순간이 아직 로보틱스 산업에는 오지 않았으나 그 시점이 곧 올 것"이라고 강조했다.

2025.04.11 11:16한정호

"AI 영상 생성, 1시간에 250만원"…구글, '비오 2' 초고품질 전략 성공할까

인공지능(AI) 기반 비디오 생성 시장의 경쟁이 본격화되는 가운데 구글이 자사 영상 AI인 '비오 2'의 가격을 공개했다. 4K 초고품질 영상을 지원하나, 오픈AI의 '소라'보다 가격이 높아 비용 대비 경쟁력이 있을지에 대한 의문이 제기되고 있다. 두 모델 모두 환각 및 물리 법칙 구현 등 기술적 한계를 드러내고 있다는 점도 해결 과제다. 24일 테크크런치에 따르면 구글은 AI 비디오 생성 모델 '비오 2'의 가격을 초당 50센트(한화 약 700원)로 책정했다. 이는 시간당 1천800달러(한화 약 250만원), 분당 30달러(한화 약 4만2천원)에 해당하는 수준으로, 구글은 '비오 2'를 통해 고품질 영상 시장을 공략하며 영상 생성의 상업적 활용도를 높이려는 전략을 펼치고 있다. '비오 2'는 최대 4K 해상도를 지원하는 고급형 비디오 생성 모델이다. 구글 클라우드의 '버텍스 AI(Vertex AI)' 플랫폼을 통해 제공되며 고해상도와 정밀한 디테일을 구현하는 데 초점을 맞췄다. 다만 비용이 초당 50센트로 책정되면서 일반 사용자보다는 전문가 및 기업 시장을 겨냥한 서비스로 보인다. 특히 오픈AI의 비디오 생성 AI인 '소라'와의 가격 정책 차이가 주목된다. 오픈AI는 크레딧 기반의 구독 모델을 통해 '소라'를 운영하고 있으며 1천80p 기준 초당 20센트(한화 약 280원)로 '비오 2'보다 상대적으로 저렴한 가격을 제시하고 있다. 오픈AI의 비디오 AI 가격 구조는 이용자의 구독 플랜에 따라 달라지며 저해상도에서는 보다 낮은 비용으로 비디오를 생성할 수 있다. 현재 '소라'는 월 20달러(한화 약 2만8천원)의 챗GPT '플러스'와 월 200달러(한화 약 28만원)의 '프로' 플랜을 통해 제공되며 각각 1천 크레딧과 1만 크레딧을 지급하는 방식이다. 480p 해상도의 경우 초당 4크레딧으로 약 8센트(한화 약 110원), 1천80p 해상도에서는 초당 100크레딧으로 약 20센트(한화 약 280원)이 소모된다. '소라'는 현재 4K 해상도를 지원하지 않지만 비용 효율성 면에서는 '비오 2'보다 경쟁력이 높은 것으로 보인다. 다만 실제 영상 제작 현장에서는 두 모델 모두 완벽하지 않다는 지적이 나온다. 최근 업계 평가에 따르면 '비오 2'는 손가락, 눈동자, 피부 질감 등 세부 표현에서 비현실적인 결과가 발생하며 물리 법칙에 부합하지 않는 액체 유동성 표현 등의 문제가 드러난다. 또 '소라'는 인체 움직임에서 부자연스러운 관절 회전과 신체 비율 왜곡 현상이 잦으며 보행 시 다리 움직임이 로봇처럼 경직되는 문제를 보인다. 이 외에도 장면 전환 시 객체의 색상 및 크기 변화가 불안정해 시간적 일관성을 유지하는 데 어려움을 겪고 있다. 이 같은 기술적 한계는 두 모델이 아직 실제 영상 수준에 미치지 못하는 부분을 여실히 보여준다. 전문가들은 물리 엔진 통합 등 추가 개발이 필요하다고 지적하며 특히 의류 주름 시뮬레이션과 액체-고체 상호작용 구현이 시급한 과제라고 평가한다. 향후 개선된 기술이 도입될 경우 보다 현실적인 AI 영상 제작이 가능할 것으로 기대된다. 디나 베라다 유튜브 제품 담당 이사는 "'비오 2'는 현실 세계의 물리 법칙과 인간의 움직임을 더 잘 이해해 세밀하고 현실적인 결과물을 만든다"며 "스타일, 렌즈, 시네마틱 효과까지 지정할 수 있어 쉽고 재미있게 영상을 표현한다"고 강조했다.

2025.02.24 10:55조이환

"동영상 생성 AI 최강자 떴다"…오픈AI '소라' 출시에 빅테크도 일자리도 '충격'

동영상 생성 인공지능(AI) 최강자로 지목된 오픈AI의 '소라'가 드디어 모습을 드러내며 구글, 메타 등 경쟁자들을 긴장시키고 있다. 텍스트만으로도 빠른 시간 내에 원하는 동영상을 간편하게 만들 수 있다는 점에서 일자리 위협을 느낀 예술가들의 반발도 더 커지는 모양새다. 10일 업계에 따르면 오픈AI는 지난 9일(현지시간) 온라인 행사를 통해 '소라'를 정식 출시한다고 발표했다. 지난 2월 처음 공개한 후 10개월 만으로, 그간 일부 이용자들을 대상으로 테스트를 한 후 문제점을 보완해 왔다. 공개 됐을 당시 도쿄 밤거리를 걷고 있는 여성의 다리가 불안정하게 움직이는 등 환각 현상이 발견된 바 있다. '소라'는 이용자가 글로 프롬프트(명령어)를 넣으면 동영상을 생성해주는 AI로, 생성되는 동영상의 길이는 최대 20초다. 당초 최대 1분 길이의 동영상을 빠르게 제작할 수 있다고 오픈AI가 밝혔던 것에 비해선 상당히 시간이 줄었다. 이에 대해 오픈AI는 "최대한 많은 사람들이 소라에 접근할 수 있도록 하기 위해 성능과 확장성 사이의 균형을 맞춘 것"이라고 설명했다. '소라'는 텍스트뿐 아니라 이미지, 동영상에서 영감을 받아 동영상을 생성하는 것은 물론, 기존 동영상을 확장하거나 빠진 프레임을 채우는 '스토리보드' 기능도 제공한다. 오픈AI가 공개한 '우주에 떠 있는 토끼(a rabbit floating in outer space)'라는 프롬프트로 만든 데모 시연 영상에선 약 7초만에 5초짜리 동영상이 만들어져 이목을 집중시켰다. 만든 영상이 마음에 들지 않으면 프롬프트를 수정하거나 스토리보드를 고치면 된다. '소라'는 구글이 올해 1월 공개한 생성 AI 모델 '루미에르'가 단 5초 분량의 영상물을 제작해주는 것에 비해 월등한 기술력을 갖고 있다는 평가를 받고 있다. 이날부터 한국을 포함한 대부분의 국가에서 사용할 수 있지만 영국, 스위스, 유럽경제지역(EEA)은 이번에 출시가 제외됐다. 이는 이들 지역에서 테크 기업에 대한 규제가 강화하고 있는 데 따른 것으로, 영국 등에서의 정식 출시 일정은 미정이다. '소라'는 현재 '챗GPT 플러스', '챗GPT 프로'에 포함돼 기존 유료 이용자들은 이 동영상 AI 모델 이용에 대한 추가 비용을 지불할 필요 없이 이용할 수 있다. 월 20달러를 지불하는 '챗GPT 플러스' 이용자들은 매월 50개(480p 또는 그 이하 해상도), 월 200달러인 '챗GPT 프로' 구독자들은 매월 500개의 영상을 생성할 수 있다. 챗GPT 팀, 엔터프라이즈, 에듀 계정에선 소라를 쓸 수 없다. 이번 일로 동영상 생성 AI 시장 경쟁은 과열되는 분위기다. 지난해 11월에는 스태빌리티 AI가 '스테이블 비디오 디퓨전'을, 올해 1월에는 마이크로소프트(MS)가 비디오 프레임의 움직임을 조작하는 동영상 생성 모델 '드래그누와'를 선보였다. 바이트댄스는 '매직비디오-V2'를, 애플도 2월 대형언어모델(LLM)을 활용해 동영상을 생성하는 '키프레이머'를 내놨다. 오픈AI가 올해 2월 '소라'를 선보인 후에는 구글 동영상 생성 AI '비오(Veo)'와 중국 콰이쇼우 '클링', 미국 루마 AI '드림 머신', 런웨이 '젠-3 알파', 메타 '무비 젠' 등이 지금까지 공개됐다. 어도비도 지난 10월 '어도비 맥스' 행사에서 파이어 플라이 기반 동영상 AI를 발표하며 경쟁에 합류했고, 아마존도 이달 초 '리인벤트' 행사를 통해 동영상 생성 AI '노바 릴'을 처음 선보였다. 이에 따라 유튜브는 내년부터 동영상 생성 AI '비오'를 활용해 유튜브 쇼츠 영상을 만들 수 있게 할 계획이다. 메타는 '무비 젠'이 만든 AI 동영상을 인스타그램 등 SNS와 연계할 수 있도록 할 예정이다. 사용자들은 AI를 사용해 실감나는 릴스(인스타그램을 통해 공유할 수 있는 15초 이내 분량의 짧은 동영상)를 직접 만들어낼 수 있고 페이스북, 왓츠앱, 스레드 등 메타의 다른 SNS 플랫폼에도 공유할 수 있게 된다. 파이낸셜타임스(FT)는 "메타의 무비 젠 AI 동영상 모델은 할리우드 영화 제작사, 동영상 콘텐츠 크리에이터, SNS 인플루언서들의 창조 작업용 툴로 사용되기를 원하고 있다"며 "메타는 영화 등 예능, 오락산업, 광고를 넘어 보다 광범위한 산업 분야에서 수익 창출 모델을 발굴하려고 하고 있다"고 분석했다. 이처럼 본격적인 동영상 생성 AI 시대가 열리면서 영상 관련 산업은 큰 변화를 맞게 됐다. 영화, 애니메이션, 증강현실(AR) 및 가상현실(VR) 등 다양한 분야에서 활용할 수 있게 되면서 일자리를 위협 받는 이들도 상당해질 것으로 예상된다. 실제 소니픽처스는 영화 제작 비용을 줄이기 위해 생성형 AI를 적극 활용하겠다고 공개적으로 밝힌 바 있다. 이미 코카콜라의 최근 홀리데이 캠페인과 같은 광고에선 AI로 제작된 콘텐츠가 등장하고 있다. 영화 CG 일러스트레이터인 리드 사우든은 "2022년 미드저니(이미지 생성 AI)가 처음 나왔을 때 우리는 '귀엽다'며 비웃었다"며 "하지만 이제 사람들은 생성 AI 때문에 일자리를 잃고 있다"고 말했다. 이에 지난해 미국 할리우드에선 배우와 작가를 중심으로 생성형 AI 활용에 대항하기 위해 파업을 벌이기도 했다. 자칭 '소라 PR(대외홍보) 퍼펫'이라고 부르는 예술가 그룹은 지난달 26일 오픈AI '소라'에 접속할 수 있는 프로그래밍 인터페이스(API)를 온라인에 공개하며 반발하는 모습을 보였다. 업계 관계자는 "오픈AI '소라'가 등장하며 많은 기업들에게 동영상 생성 AI 모델에 대한 강력한 동기가 생겼다"며 "여러 모델들이 한꺼번에 풀리면서 산업계, 특히 미디어 시장에 엄청난 반향을 일으킬 것으로 보인다"고 밝혔다. 일각에선 딥페이크 문제에 대해서도 우려하고 있다. AI 기술로 유명인들의 얼굴을 합성해 정교한 가짜 영상을 만드는 것이 쉬워졌기 때문이다. 이에 오픈AI는 레드팀(취약점을 발견해 AI 안전성을 검증하는 팀)을 만들어 딥페이크를 방지하기 위해 나섰다. 또 '소라'로 생성된 모든 동영상에 C2PA(콘텐트 출처 및 진위 확인을 위한 연합) 표준 AI 워터마크를 넣어 AI가 생성한 콘텐츠임을 알 수 있도록 했다. 로한 사하이 오픈AI 엔지니어링 리드는 "도널드 트럼프 대통령 같은 주요 정치인이나 공적 인물은 생성이 차단된다"며 "잘못된 정보의 확산을 방지하려고 노력하고 있다"고 말했다.

2024.12.10 09:21장유미

[영상] "오픈AI '소라'보다 낫다"…메타, '무비 젠'으로 동영상 생성 AI 시장 흔들까

오픈AI가 만든 '소라'에 맞서 동영상 생성 인공지능(AI) 모델들이 쏟아지고 있는 가운데 '페이스북' 모회사 메타 플랫폼이 우수한 기술을 앞세워 최근 새로운 무기를 공개해 주목 받고 있다. 6일 업계에 따르면 메타는 지난 4일 공식 블로그를 통해 동영상 생성 AI 모델 '무비 젠(Movie Gen)'을 공개했다. 영상은 물론 오디오를 동시에 생성하는 것이 특징으로, 영상 중 일부분만 편집할 수 있는 등 강력한 기능도 갖추고 있다. '무비 젠'은 텍스트 입력으로 최대 16초 길이의 새 동영상을 만들 수 있다. 기존 동영상을 편집할 수도 있고 오디오를 생성할 수도 있으며 사진을 사용해 실제 인물이 등장하는 맞춤형 동영상도 만들 수 있다. 메타는 이번 연구가 2022년 공개한 '메이크 어 신(Make-A-Scene)', '메이크 어 비디오(Make-A-Video)' 등을 통해 쌓은 노하우를 반영했다고 강조했다. 더불어 하마가 물속에서 헤엄치고 코알라가 서핑을 즐기는 한편, 남극의 펭귄이 옷을 갈아입는 등 '무비 젠'을 이용한 만든 동영상도 공개했다. 메타는 "할리우드에서 성공하기를 희망하는 영화 제작자 지망생이든, 동영상 제작을 즐기는 크리에이터이든, 누구나 창의력을 향상시키는 데 도움이 되는 도구를 이용할 수 있어야 한다고 생각한다"고 설명했다. 기능은 이제까지 등장한 영상 모델 중 가장 강력한 편으로 평가된다. 최대 16FPS로 16초짜리의 사실적이고 개인화된 HD 비디오와 48kHz 오디오를 제작할 수 있으며 비디오 편집 기능도 제공한다. '무비 젠'은 일부 내부 직원과 일부 영화 제작자를 포함한 소수의 외부 파트너에게만 우선 제공된다. 메타는 내년에 인스타그램과 왓츠앱, 메신저 등 자사의 소셜미디어 앱에 탑재할 계획이다. 이번 일로 동영상 생성 AI 시장 경쟁은 과열되는 분위기다. 올해 2월 오픈AI가 '소라(Sora)'를 선보인 이후 구글 동영상 생성 AI '비오(Veo)'와 중국 콰이쇼우 '클링', 미국 루마 AI '드림 머신', 런웨이 '젠-3 알파' 등이 지금까지 공개됐다. 오픈AI의 '소라'는 최대 1분 길이의 동영상을 제작할 수 있으며 연내 일반인들도 이용할 수 있을 것으로 예상된다. 구글도 '비오'를 조만간 출시할 예정이다. 런웨이는 지난 7월부터 마케팅과 광고 등 콘텐츠 제작자를 대상으로 '젠-3 알파'를 유료로 제공하고 있다. 앞서 지난해 11월에는 스태빌리티 AI가 '스테이블 비디오 디퓨전'을 선보였다. 올해 1월에는 마이크로소프트(MS)가 비디오 프레임의 움직임을 조작하는 동영상 생성 모델 '드래그누와'를, 바이트댄스는 '매직비디오-V2'를 공개했다. 애플도 2월 대형언어모델(LLM)을 활용해 동영상을 생성하는 '키프레이머'를 내놨다. 이 같은 상황 속에 메타는 "'무비 젠'이 작업 전반에서 업계 유사 모델보다 우수한 성능을 보였다"며 경쟁사들을 겨냥했다. 코너 헤이즈 메타 생성형 AI 제품 부사장은 "더 많은 사람이 동영상 게시물을 만들거나 편집하도록 장려하는 것이 목표"라고 말했다. 업계 관계자는 "오픈AI '소라'가 등장하며 많은 기업들에게 동영상 생성 AI 모델에 대한 강력한 동기가 생겼다"며 "여러 모델들이 하반기에 한꺼번에 풀리면 산업계, 특히 미디어 시장에 엄청난 반향을 일으킬 것으로 보인다"고 말했다.

2024.10.06 10:29장유미

유튜브 쇼츠, '비오'와 통합...AI 동영상 제작 기능 지원

유튜브 크리에이터들이 구글의 딥마인드 인공지능(AI) 동영상 생성 모델인 '비오(Veo)'를 활용해 동영상을 제작할 수 있게 됐다. 18일(현지시간) 유튜브 공식 블로그에 따르면, 유튜브는 미국 뉴욕에서 연례 행사인 '메이드(Made) 온 유튜브'를 개최하고 비오를 유튜브 쇼츠에 통합한다고 발표했다. 이에 따라 앞으로 유튜브 크리에이터는 동영상에 AI가 생성한 배경을 추가하고 프롬프트(명령어)를 사용해 6초 짜리 쇼츠를 생성할 수 있다. 비오는 구글이 지난 5월 공개한 동영상 생성형 AI 모델이다. 유튜브는 올해 말 비오 배경 기능을 출시할 예정이다. 또 6초 짜리 AI 클립은 내년에 출시할 예정이다. AI 기능은 유튜브 스튜디오에서도 확대된다. 유튜브는 크리에이터들이 AI가 만든 동영상 제목, 썸네일, 개요 등을 활용할 수 있도록 하는 기능도 발표했다. 단 AI로 제작된 콘텐츠에는 AI가 만들었음을 알리는 워터마크가 표시된다. 또한 AI를 활용한 자동 더빙 기능도 추가한다. 원어 음성의 말투, 억양 등과 최대한 어울리게 만든 더빙을 영상에 자동으로 입힐 수 있도록 한다는 설명이다. 언어는 프랑스어, 스페인어, 포르투갈어, 이탈리아어 등이 제공된다. 닐 모한 유튜브 최고경영자(CEO)는 "비오를 통해 유튜브 크리에이터가 AI의 도움을 받아 더 많은 숏 동영상을 제작할 수 있게 된다"며 "우리가 AI로 선보인 모든 것은 여러분이 하는 작업을 더 빠르고 더 효율적으로 만들 것"이라고 밝혔다.

2024.09.19 10:47최지연

'오픈AI 소라 경쟁자 등장'...구글, 동영상 생성 모델 '비오' 공개

구글이 동영상 생성모델 '비오'를 공개하며 오픈AI의 '소라'와 맞서기에 나선다. 14일(현지시간) 구글은 연례개발자 컨퍼런스 구글 I/O를 통해 동영상 생성모델 '비오'를 선보였다. 비오는 1080p해상도로 1분 이상 길이의 영상을 생성할 수 있다. 이 동영상 생성모델은 프롬프트를 보다 정확하게 이해하고 따를 수 있도록 교육 데이터의 각 비디오 캡션에 더 많은 세부 정보를 추가해 개발된 것이 특징이다. 또한 고품질의 압축된 비디오 표현을 사용해 효율성도 향상시켰으며 영상 생성 시간도 단축됐다. 자연어와 시각적 의미에 대한 높은 이해도를 갖춘 만큼 사용자가 프롬프터를 통해 세부적으로 작성하는 요구사항을 파악하고 이를 영상에 반영할 수 있다. 예를 들어 타입랩스, 항공촬영 등 영화 촬영 기법 등을 프롬프터로 입력하면 이를 파악해 그대로 적용 가능하다. 비오는 실제 영상 제작이나 편집을 보다 적극적으로 지원하는 것을 목표로 개발됐다. 이를 위해 텍스트 프롬프트와 함께 이미지를 입력으로 사용하여 비디오를 생성할 수 있는 기능을 지원한다. 영상 제작의 기준이 되는 참조 이미지를 지원함으로써 사용자는 보다 일관성 있고 의도한 비디오를 생성할 수 있다. 더불어 원활한 편집을 위해 영상에서 특정 부분만 지정하는 마스크 영역 기능도 지원한다. 또한 프롬프터를 이용해 스토리를 시리즈 형식으로 제작하면 1분으로 제한된 영상 길이를 넘어 연속성 있는 영상도 제작 가능하다. 이를 활용한다면 실제 영화 같은 영상물도 제작 가능하다는 것이 구글 측의 설명이다. 구글은 실제로 비오를 이용한 영화 제작을 준비 중으로 영화 제작자 도널드 글로버 및 그의 크리에이티브 스튜디오인 길가(Gilga)와 함께 작업을 진행하고 있다. 구글의 엘리 콜린스 제품 관리 부사장은 "비오는 전례 없는 수준의 창의적인 제어 기능을 제공한다"며 "창작자가 제작 과정에서 기술 개발 방식에 대해 목소리를 낼 수 있도록 지원할 것"이라고 설명했다.

2024.05.15 09:11남혁우

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

‘블록버스터’ 국산 신약 개발하려면 ‘통큰’ 정부 지원 필요하다

"책 대신 '아이패드'로 수업을"…디지털이 바꾼 교실 풍경은

과학자들, 납으로 금 만들었다…'연금술사의 꿈' 실현되나

[ZD브리핑] 아시아 IT 박람회 컴퓨텍스 개최...21대 대선 후보 첫 토론회

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현