• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
인공지능
배터리
양자컴퓨팅
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'비오'통합검색 결과 입니다. (8건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

[현장] "韓 대학생도 봉?"…美서 무료로 쓰는 구글 제미나이, 프로모션 두고 韓 '차별'

구글이 인공지능(AI) '제미나이'의 대중적 활용 가능성을 강조하며 국내 체험 행사를 열었으나 정작 미국 대학생들에게만 유료 기능을 무료 제공하는 프로모션 정책을 운영 중인 것으로 드러나 형평성 논란이 일고 있다. '글로벌 확장'을 내세우면서도 국내 이용자는 배제돼 한국 소비자들에 대한 차별 논란이 일고 있다. 구글코리아는 20일 서울 강남파이낸스센터 본사에서 '제미나이 워크숍 : 티치 미 하우 투 제미나이'를 개최했다. 이 행사는 음성 대화 기능을 포함한 '제미나이' 최신 기능과 새로운 생성형 AI 도구들을 소개하는 자리였다. 이날 행사에서는 김기환 구글코리아 매니저가 '딥리서치', '제미나이 라이브' 등 핵심 기능을 발표했다. 이어 연세대학교 학생들이 '제미나이'를 활용한 일상 접목 사례를 직접 소개했다. 다만 미국 대학생들에게는 유료 기능을 무료로 제공하는 프로모션 정책이 시행 중인 데 비해 국내에서는 아직 적용되지 않아 이쉬운 대목으로 남았다. "더는 실험실 이론이 아니다"…구글이 제시한 AI 활용법은? 이날 구글코리아는 '제미나이'의 진화 과정과 활용 방안을 집중적으로 소개했다. 모바일·웹·음성 등 멀티모달 환경에서 실제로 사용 가능한 기능을 사례 중심으로 설명하며 기술 확산만큼이나 '현실 적용'에 방점을 찍는 모습이었다. 김기환 구글코리아 커뮤니케이션팀 매니저는 "이제 AI는 단순한 기술을 넘어 이용자의 실생활을 직접 바꾸는 도구가 되고 있다"며 "오늘 소개할 기능은 모두 실제 스마트폰이나 브라우저에서 바로 실행 가능한 것들"이라고 강조했다. 김 매니저는 발표 초반에 '제미나이' 모델의 계보와 구글 AI 전략의 변화를 간략히 정리했다. 지난 2016년 구글 딥마인드가 개발해 이세돌을 이긴 바둑 AI '알파고'를 시작으로, 'AI 퍼스트'를 선언한 순다 피차이 CEO의 기조 아래 구글은 트랜스포머 아키텍처·람다·알파폴드·팜·제미나이 시리즈로 이어지는 대형 모델 개발을 지속해왔다. 이 중 '제미나이 2.5'는 올해 구글 I/O에서 가장 주목받은 최신 버전이다. 김 매니저는 "'제미나이'는 하나의 모델이 아니라 '모델군(family)'이며 '플래시', '플래시-라이트', '프로'처럼 목적과 성능에 따라 구분된다"며 "특히 '프로'는 복잡한 작업 수행에 강하고 플래시는 응답 속도와 비용 효율에서 유리하다"고 설명했다. 제미나이의 실사용 예시도 이어졌다. 음성 기반 대화가 가능한 '제미나이 라이브' 기능은 스마트폰 카메라 화면을 실시간으로 분석해 사용자에게 적절한 피드백을 제공한다. 김 매니저는 "방 구조 변경을 고민하며 제미나이에게 영상을 보여줬더니 도면 개선 방향까지 추천해줬다"고 말했다. 더불어 김 매니저는 '딥 리서치(Deep Research)' 기능도 소개했다. 이 기능은 복잡한 주제에 대해 AI가 조사부터 요약까지 전담하는 개인 연구 어시스턴트 역할을 한다. 텍스트 기반 질문은 물론 PDF와 같은 대용량 문서도 처리할 수 있으며 답변에는 출처와 인용 링크가 자동 포함된다. 그는 "기자처럼 정량적 정보 검증이 중요한 사용자에게 특히 유용한 기능"이라고 강조했다. 개인화 기능도 소개됐다. 구글 지메일, 캘린더, 드라이브, 문서 등과 '제미나이'를 연동하면 이용자의 일정과 파일을 AI가 직접 분석해 맞춤형 안내를 제공한다. 일례로 문자 작성부터 전송, 일정 등록까지 음성 지시 한 번으로 일괄 수행할 수 있다. 창작 도구도 빠짐없이 언급됐다. '캔버스(Canvas)' 기능은 입력한 프롬프트를 기반으로 HTML 코드를 생성해 미리보기까지 지원한다. 또 '스티치(Stitch)'를 이용하면 개발 지식이 없는 사용자도 자연어로 앱 프로토타입을 생성할 수 있다. 영상 생성 AI '비오(Veo)'와 이를 기반으로 한 편집 툴 '플로우(Flow)'도 함께 소개됐다. '비오 3'는 음성 지시만으로 현실감 있는 장면을 생성할 수 있는 모델이다. 실제 개발자 커뮤니티에서는 단편 영화 제작 도구로 활용되고 있다. '플로우'는 이처럼 생성된 짧은 영상 클립들을 시간 순서에 따라 연결하고 프롬프트나 이미지 등을 활용해 이어지는 장면을 자동 확장해주는 타임라인 기반 편집 툴이다. 김기환 구글코리아 매니저는 "영상 생성의 완성도가 카메라 촬영과 구별되지 않을 정도"라며 "자체 워터마크 삽입과 감지 기술인 '신스아이디 디텍터'를 병행해 콘텐츠 투명성을 확보하고 있다"고 밝혔다. 연세대 학생들 "AI, 우리들의 친구"…韓엔 없는 학생 혜택, 확장성엔 의문 이어 진행된 세션에서는 연세대학교 언론홍보학과 학생들이 직접 기획하고 제작한 세 편의 영상이 공개됐다. 해당 영상은 구글과 학과 측이 공동으로 기획한 상반기 프로젝트의 결과물로, '제미나이'를 실생활에서 어떻게 활용할 수 있는지를 구체적인 상황에 맞춰 보여주는 것을 목표로 했다. 첫 번째 영상은 가족 구성원의 건강과 일상을 챙기는 보호자의 시점을 중심으로 '제미나이'를 활용한 사례를 다뤘다. 계란 알러지가 있는 아이의 급식 확인, 병원 면회 시간 계산, 복약 정보 검색 등 음성 기반 인터페이스를 통해 AI가 실시간으로 정보를 제공하는 장면들이 담겼다. 두 번째 팀은 다이어트, 연애, 야근 등 청년층의 생활 속에서 AI가 일종의 동료처럼 대응하는 상황을 연출했다. 간식의 영양 성분 분석부터 고백 준비, 스트레스 해소 영상 추천까지 이어지는 흐름은 '제미나이'가 단순한 정보 검색 도구가 아니라 개인화된 조언자로 작동할 수 있다는 점을 부각했다. 세 번째 영상은 캠퍼스 생활을 배경으로, AI가 복학생의 정보 격차를 메우고 실질적인 학업 보조 역할을 하는 모습을 담았다. 쇼츠 형식의 시리즈물로 구성돼 영상 집중도가 낮은 청년 겨냥했고 연동성 강점을 살려 유튜브·구글 문서·노트북LM 등 다양한 기능을 유기적으로 활용하는 장면이 포함됐다. 학생들은 발표를 통해 "AI는 나를 대체하는 존재가 아니라 함께 살아가는 존재로 자리 잡아야 한다"며 "광고처럼 정보를 주입하는 것이 아니라 스스로 찾아보게 만드는 도구로서 '제미나이'를 설계했다"고 설명했다. 이후 질의 응답 시간에선 학교를 대상으로 진행되는 제미나이 프로모션이 국가별로 다르게 적용되는 것을 두고 많은 관심이 집중됐다. 특히 미국 대학생에게는 유료 플랜을 일정 기간 무료로 제공하는 프로모션과 관련해 국내 대학생에게도 동일한 혜택이 제공될 예정인지에 대한 질문이 많았다. 이에 대해 구글 측은 "해당 프로모션은 미국 등 일부 국가에서만 운영되고 있다"며 "아직 한국은 대상에 포함돼 있지 않다"고 밝혔다.

2025.06.20 15:05조이환

구글, 제미나이에 영상 AI 모델 '비오2' 탑재…"현실 이해하는 AI 구현"

구글이 영상 인공지능(AI) 모델 '비오2'를 AI 서비스 '제미나이'에 탑재해 동영상 AI 시장 경쟁력을 높였다. 16일 더버지 등 외신에 따르면 구글은 비오2를 유료 AI 서비스인 '제미나이 어드밴스드' 이용자에게 제공하기 시작했다. 비오는 텍스트를 영상 콘텐츠로 변형할 수 있는 생성형 AI 모델이다. 2023년 5월 처음 소개됐다. 비오2는 같은 해 말 공개된 후 소수 이용자에 한해 시범 운영됐다. 이번 제미나이 통합으로 활용 범위가 넓어졌다. 제미나이 어드밴스드 사용자는 16대9 화면 비율, 720픽셀(p) 해상도, 최대 8초 분량의 짧은 영상 클립을 생성할 수 있다. 완성된 영상은 MP4 형식으로 내려받을 수 있다. 콘텐츠가 AI로 제작된 것임을 알리기 위해 자체 인증 마크 '신스 ID' 워터마크를 영상에 삽입한다. 구글은 "비오2가 실제 촬영한 듯한 정밀한 디테일을 구현할 수 있다"며 "현실적 물리 법칙과 인체 움직임을 이해해 다양한 주제에 맞는 고품질 영상을 만들어낼 수 있다"고 강조했다. 앞서 데미스 허사비스 구글 딥마인드 최고경영자(CEO)도 비오와 제미나이 결합을 통해 AI의 물리 세계 이해력을 강화할 계획이라고 밝힌 바 있다. 앞서 오픈AI는 지난해 12월 최대 1분 분량 영상을 생성하는 '소라'를 공개했다. 메타는 같은 해 텍스트 기반 영상 생성 모델 '무비젠'을 출시했다. AI 스타트업 런웨이는 4세대 동영상 생성 모델을 출시하며 3억 달러(약 4천264억원)넘는 투자 유치를 기록하는 등 기술력과 시장 가능성을 동시에 인정받고 있다. 더버지는 "구글은 오픈AI와 메타, 런웨이 등과 동영상 생성 AI 분야 경쟁에 본격적으로 뛰어들었다"고 평가했다.

2025.04.16 17:43김미정

챗GPT 다음은 '이것'?…구글 멀티모달 AI가 바꿀 로보틱스 혁명

데미스 하사비스 구글 딥마인드 최고경영자(CEO)가 구글의 인공지능(AI) 모델 '제미나이'와 영상 생성 AI '비오2'를 결합한다는 계획을 발표했다. 11일 테크크런치에 따르면 하사비스 CEO는 리드 호프먼 링크드인 공동 창립자가 진행하는 팟캐스트 파서블에 출연해 제미나이에 비오2를 결합해 물리 세계를 이해할 수 있는 AI 모델로 고도화하겠다고 밝혔다. 하사비스 CEO는 "비오2가 많은 유튜브 영상을 학습하는 것만으로도 현실 세계의 물리 법칙을 이해할 수 있다는 것에 놀랐다"며 "이는 로봇 산업에 엄청난 영향을 미칠 수 있다고 생각했다"고 말했다. 이어 "우리가 개발한 멀티모달 파운데이션 모델 제미나이와 비오2를 향후 결합할 계획"이라며 "AI가 단순 챗봇 수준을 넘어 인간이 살고 있는 현실 세계를 이해하고 도움을 줄 수 있도록 할 것"이라고 강조했다. 두 AI 모델을 결합해 유튜브 영상 학습과 같은 기존의 강화 학습만으로 복잡한 인간의 창의성과 행동을 모방할 수 있는 '인공 일반 지능(AGI)'에 도달할 수 있다는 게 구글의 기대다. 특히 로보틱스 산업에서의 활용도 성공적일 것이란 관측이다. 로보틱스 기술에 필요한 물리적 상호작용 없이도 영상 AI를 기반으로 현실 세계를 이해할 수 있다는 것이다. 앞서 구글 딥마인드는 로봇 맞춤형 AI 모델인 '제미나이 로보틱스'와 다른 고급 시각·언어·행동(VLA) 모델 대비 성능이 2배 향상된 벤치마크 결과도 발표한 바 있다. 하사비스 CEO는 "우리 삶에 실질적인 도움을 주는 AI 기술은 로보틱스 영역에도 필요하다"며 "물리 법칙을 이해하는 멀티모달 모델들에 로봇이 필요로 하는 행동, 운동 제어, 계획 수립과 관련된 미세조정을 수행해 이를 성공적으로 구현할 수 있다"고 설명했다. 이어 "범용 AI 모델에 데이터를 추가 학습하거나 특별한 노력 없이도 로보틱스 환경에 알맞은 AI를 개발·이식할 수 있다"며 "이는 5년 전 최고의 로봇공학자들조차 예측하기 어려웠던 결과"라고 덧붙였다. 그러면서 "우리가 만들고 있는 범용 멀티모달 모델들이 충분히 정교해져 로봇에 그대로 탑재될 것"이라며 "언어·과학 분야에 챗GPT·알파고·알파폴드가 가져온 결정적인 순간이 아직 로보틱스 산업에는 오지 않았으나 그 시점이 곧 올 것"이라고 강조했다.

2025.04.11 11:16한정호

"AI 영상 생성, 1시간에 250만원"…구글, '비오 2' 초고품질 전략 성공할까

인공지능(AI) 기반 비디오 생성 시장의 경쟁이 본격화되는 가운데 구글이 자사 영상 AI인 '비오 2'의 가격을 공개했다. 4K 초고품질 영상을 지원하나, 오픈AI의 '소라'보다 가격이 높아 비용 대비 경쟁력이 있을지에 대한 의문이 제기되고 있다. 두 모델 모두 환각 및 물리 법칙 구현 등 기술적 한계를 드러내고 있다는 점도 해결 과제다. 24일 테크크런치에 따르면 구글은 AI 비디오 생성 모델 '비오 2'의 가격을 초당 50센트(한화 약 700원)로 책정했다. 이는 시간당 1천800달러(한화 약 250만원), 분당 30달러(한화 약 4만2천원)에 해당하는 수준으로, 구글은 '비오 2'를 통해 고품질 영상 시장을 공략하며 영상 생성의 상업적 활용도를 높이려는 전략을 펼치고 있다. '비오 2'는 최대 4K 해상도를 지원하는 고급형 비디오 생성 모델이다. 구글 클라우드의 '버텍스 AI(Vertex AI)' 플랫폼을 통해 제공되며 고해상도와 정밀한 디테일을 구현하는 데 초점을 맞췄다. 다만 비용이 초당 50센트로 책정되면서 일반 사용자보다는 전문가 및 기업 시장을 겨냥한 서비스로 보인다. 특히 오픈AI의 비디오 생성 AI인 '소라'와의 가격 정책 차이가 주목된다. 오픈AI는 크레딧 기반의 구독 모델을 통해 '소라'를 운영하고 있으며 1천80p 기준 초당 20센트(한화 약 280원)로 '비오 2'보다 상대적으로 저렴한 가격을 제시하고 있다. 오픈AI의 비디오 AI 가격 구조는 이용자의 구독 플랜에 따라 달라지며 저해상도에서는 보다 낮은 비용으로 비디오를 생성할 수 있다. 현재 '소라'는 월 20달러(한화 약 2만8천원)의 챗GPT '플러스'와 월 200달러(한화 약 28만원)의 '프로' 플랜을 통해 제공되며 각각 1천 크레딧과 1만 크레딧을 지급하는 방식이다. 480p 해상도의 경우 초당 4크레딧으로 약 8센트(한화 약 110원), 1천80p 해상도에서는 초당 100크레딧으로 약 20센트(한화 약 280원)이 소모된다. '소라'는 현재 4K 해상도를 지원하지 않지만 비용 효율성 면에서는 '비오 2'보다 경쟁력이 높은 것으로 보인다. 다만 실제 영상 제작 현장에서는 두 모델 모두 완벽하지 않다는 지적이 나온다. 최근 업계 평가에 따르면 '비오 2'는 손가락, 눈동자, 피부 질감 등 세부 표현에서 비현실적인 결과가 발생하며 물리 법칙에 부합하지 않는 액체 유동성 표현 등의 문제가 드러난다. 또 '소라'는 인체 움직임에서 부자연스러운 관절 회전과 신체 비율 왜곡 현상이 잦으며 보행 시 다리 움직임이 로봇처럼 경직되는 문제를 보인다. 이 외에도 장면 전환 시 객체의 색상 및 크기 변화가 불안정해 시간적 일관성을 유지하는 데 어려움을 겪고 있다. 이 같은 기술적 한계는 두 모델이 아직 실제 영상 수준에 미치지 못하는 부분을 여실히 보여준다. 전문가들은 물리 엔진 통합 등 추가 개발이 필요하다고 지적하며 특히 의류 주름 시뮬레이션과 액체-고체 상호작용 구현이 시급한 과제라고 평가한다. 향후 개선된 기술이 도입될 경우 보다 현실적인 AI 영상 제작이 가능할 것으로 기대된다. 디나 베라다 유튜브 제품 담당 이사는 "'비오 2'는 현실 세계의 물리 법칙과 인간의 움직임을 더 잘 이해해 세밀하고 현실적인 결과물을 만든다"며 "스타일, 렌즈, 시네마틱 효과까지 지정할 수 있어 쉽고 재미있게 영상을 표현한다"고 강조했다.

2025.02.24 10:55조이환

"동영상 생성 AI 최강자 떴다"…오픈AI '소라' 출시에 빅테크도 일자리도 '충격'

동영상 생성 인공지능(AI) 최강자로 지목된 오픈AI의 '소라'가 드디어 모습을 드러내며 구글, 메타 등 경쟁자들을 긴장시키고 있다. 텍스트만으로도 빠른 시간 내에 원하는 동영상을 간편하게 만들 수 있다는 점에서 일자리 위협을 느낀 예술가들의 반발도 더 커지는 모양새다. 10일 업계에 따르면 오픈AI는 지난 9일(현지시간) 온라인 행사를 통해 '소라'를 정식 출시한다고 발표했다. 지난 2월 처음 공개한 후 10개월 만으로, 그간 일부 이용자들을 대상으로 테스트를 한 후 문제점을 보완해 왔다. 공개 됐을 당시 도쿄 밤거리를 걷고 있는 여성의 다리가 불안정하게 움직이는 등 환각 현상이 발견된 바 있다. '소라'는 이용자가 글로 프롬프트(명령어)를 넣으면 동영상을 생성해주는 AI로, 생성되는 동영상의 길이는 최대 20초다. 당초 최대 1분 길이의 동영상을 빠르게 제작할 수 있다고 오픈AI가 밝혔던 것에 비해선 상당히 시간이 줄었다. 이에 대해 오픈AI는 "최대한 많은 사람들이 소라에 접근할 수 있도록 하기 위해 성능과 확장성 사이의 균형을 맞춘 것"이라고 설명했다. '소라'는 텍스트뿐 아니라 이미지, 동영상에서 영감을 받아 동영상을 생성하는 것은 물론, 기존 동영상을 확장하거나 빠진 프레임을 채우는 '스토리보드' 기능도 제공한다. 오픈AI가 공개한 '우주에 떠 있는 토끼(a rabbit floating in outer space)'라는 프롬프트로 만든 데모 시연 영상에선 약 7초만에 5초짜리 동영상이 만들어져 이목을 집중시켰다. 만든 영상이 마음에 들지 않으면 프롬프트를 수정하거나 스토리보드를 고치면 된다. '소라'는 구글이 올해 1월 공개한 생성 AI 모델 '루미에르'가 단 5초 분량의 영상물을 제작해주는 것에 비해 월등한 기술력을 갖고 있다는 평가를 받고 있다. 이날부터 한국을 포함한 대부분의 국가에서 사용할 수 있지만 영국, 스위스, 유럽경제지역(EEA)은 이번에 출시가 제외됐다. 이는 이들 지역에서 테크 기업에 대한 규제가 강화하고 있는 데 따른 것으로, 영국 등에서의 정식 출시 일정은 미정이다. '소라'는 현재 '챗GPT 플러스', '챗GPT 프로'에 포함돼 기존 유료 이용자들은 이 동영상 AI 모델 이용에 대한 추가 비용을 지불할 필요 없이 이용할 수 있다. 월 20달러를 지불하는 '챗GPT 플러스' 이용자들은 매월 50개(480p 또는 그 이하 해상도), 월 200달러인 '챗GPT 프로' 구독자들은 매월 500개의 영상을 생성할 수 있다. 챗GPT 팀, 엔터프라이즈, 에듀 계정에선 소라를 쓸 수 없다. 이번 일로 동영상 생성 AI 시장 경쟁은 과열되는 분위기다. 지난해 11월에는 스태빌리티 AI가 '스테이블 비디오 디퓨전'을, 올해 1월에는 마이크로소프트(MS)가 비디오 프레임의 움직임을 조작하는 동영상 생성 모델 '드래그누와'를 선보였다. 바이트댄스는 '매직비디오-V2'를, 애플도 2월 대형언어모델(LLM)을 활용해 동영상을 생성하는 '키프레이머'를 내놨다. 오픈AI가 올해 2월 '소라'를 선보인 후에는 구글 동영상 생성 AI '비오(Veo)'와 중국 콰이쇼우 '클링', 미국 루마 AI '드림 머신', 런웨이 '젠-3 알파', 메타 '무비 젠' 등이 지금까지 공개됐다. 어도비도 지난 10월 '어도비 맥스' 행사에서 파이어 플라이 기반 동영상 AI를 발표하며 경쟁에 합류했고, 아마존도 이달 초 '리인벤트' 행사를 통해 동영상 생성 AI '노바 릴'을 처음 선보였다. 이에 따라 유튜브는 내년부터 동영상 생성 AI '비오'를 활용해 유튜브 쇼츠 영상을 만들 수 있게 할 계획이다. 메타는 '무비 젠'이 만든 AI 동영상을 인스타그램 등 SNS와 연계할 수 있도록 할 예정이다. 사용자들은 AI를 사용해 실감나는 릴스(인스타그램을 통해 공유할 수 있는 15초 이내 분량의 짧은 동영상)를 직접 만들어낼 수 있고 페이스북, 왓츠앱, 스레드 등 메타의 다른 SNS 플랫폼에도 공유할 수 있게 된다. 파이낸셜타임스(FT)는 "메타의 무비 젠 AI 동영상 모델은 할리우드 영화 제작사, 동영상 콘텐츠 크리에이터, SNS 인플루언서들의 창조 작업용 툴로 사용되기를 원하고 있다"며 "메타는 영화 등 예능, 오락산업, 광고를 넘어 보다 광범위한 산업 분야에서 수익 창출 모델을 발굴하려고 하고 있다"고 분석했다. 이처럼 본격적인 동영상 생성 AI 시대가 열리면서 영상 관련 산업은 큰 변화를 맞게 됐다. 영화, 애니메이션, 증강현실(AR) 및 가상현실(VR) 등 다양한 분야에서 활용할 수 있게 되면서 일자리를 위협 받는 이들도 상당해질 것으로 예상된다. 실제 소니픽처스는 영화 제작 비용을 줄이기 위해 생성형 AI를 적극 활용하겠다고 공개적으로 밝힌 바 있다. 이미 코카콜라의 최근 홀리데이 캠페인과 같은 광고에선 AI로 제작된 콘텐츠가 등장하고 있다. 영화 CG 일러스트레이터인 리드 사우든은 "2022년 미드저니(이미지 생성 AI)가 처음 나왔을 때 우리는 '귀엽다'며 비웃었다"며 "하지만 이제 사람들은 생성 AI 때문에 일자리를 잃고 있다"고 말했다. 이에 지난해 미국 할리우드에선 배우와 작가를 중심으로 생성형 AI 활용에 대항하기 위해 파업을 벌이기도 했다. 자칭 '소라 PR(대외홍보) 퍼펫'이라고 부르는 예술가 그룹은 지난달 26일 오픈AI '소라'에 접속할 수 있는 프로그래밍 인터페이스(API)를 온라인에 공개하며 반발하는 모습을 보였다. 업계 관계자는 "오픈AI '소라'가 등장하며 많은 기업들에게 동영상 생성 AI 모델에 대한 강력한 동기가 생겼다"며 "여러 모델들이 한꺼번에 풀리면서 산업계, 특히 미디어 시장에 엄청난 반향을 일으킬 것으로 보인다"고 밝혔다. 일각에선 딥페이크 문제에 대해서도 우려하고 있다. AI 기술로 유명인들의 얼굴을 합성해 정교한 가짜 영상을 만드는 것이 쉬워졌기 때문이다. 이에 오픈AI는 레드팀(취약점을 발견해 AI 안전성을 검증하는 팀)을 만들어 딥페이크를 방지하기 위해 나섰다. 또 '소라'로 생성된 모든 동영상에 C2PA(콘텐트 출처 및 진위 확인을 위한 연합) 표준 AI 워터마크를 넣어 AI가 생성한 콘텐츠임을 알 수 있도록 했다. 로한 사하이 오픈AI 엔지니어링 리드는 "도널드 트럼프 대통령 같은 주요 정치인이나 공적 인물은 생성이 차단된다"며 "잘못된 정보의 확산을 방지하려고 노력하고 있다"고 말했다.

2024.12.10 09:21장유미

[영상] "오픈AI '소라'보다 낫다"…메타, '무비 젠'으로 동영상 생성 AI 시장 흔들까

오픈AI가 만든 '소라'에 맞서 동영상 생성 인공지능(AI) 모델들이 쏟아지고 있는 가운데 '페이스북' 모회사 메타 플랫폼이 우수한 기술을 앞세워 최근 새로운 무기를 공개해 주목 받고 있다. 6일 업계에 따르면 메타는 지난 4일 공식 블로그를 통해 동영상 생성 AI 모델 '무비 젠(Movie Gen)'을 공개했다. 영상은 물론 오디오를 동시에 생성하는 것이 특징으로, 영상 중 일부분만 편집할 수 있는 등 강력한 기능도 갖추고 있다. '무비 젠'은 텍스트 입력으로 최대 16초 길이의 새 동영상을 만들 수 있다. 기존 동영상을 편집할 수도 있고 오디오를 생성할 수도 있으며 사진을 사용해 실제 인물이 등장하는 맞춤형 동영상도 만들 수 있다. 메타는 이번 연구가 2022년 공개한 '메이크 어 신(Make-A-Scene)', '메이크 어 비디오(Make-A-Video)' 등을 통해 쌓은 노하우를 반영했다고 강조했다. 더불어 하마가 물속에서 헤엄치고 코알라가 서핑을 즐기는 한편, 남극의 펭귄이 옷을 갈아입는 등 '무비 젠'을 이용한 만든 동영상도 공개했다. 메타는 "할리우드에서 성공하기를 희망하는 영화 제작자 지망생이든, 동영상 제작을 즐기는 크리에이터이든, 누구나 창의력을 향상시키는 데 도움이 되는 도구를 이용할 수 있어야 한다고 생각한다"고 설명했다. 기능은 이제까지 등장한 영상 모델 중 가장 강력한 편으로 평가된다. 최대 16FPS로 16초짜리의 사실적이고 개인화된 HD 비디오와 48kHz 오디오를 제작할 수 있으며 비디오 편집 기능도 제공한다. '무비 젠'은 일부 내부 직원과 일부 영화 제작자를 포함한 소수의 외부 파트너에게만 우선 제공된다. 메타는 내년에 인스타그램과 왓츠앱, 메신저 등 자사의 소셜미디어 앱에 탑재할 계획이다. 이번 일로 동영상 생성 AI 시장 경쟁은 과열되는 분위기다. 올해 2월 오픈AI가 '소라(Sora)'를 선보인 이후 구글 동영상 생성 AI '비오(Veo)'와 중국 콰이쇼우 '클링', 미국 루마 AI '드림 머신', 런웨이 '젠-3 알파' 등이 지금까지 공개됐다. 오픈AI의 '소라'는 최대 1분 길이의 동영상을 제작할 수 있으며 연내 일반인들도 이용할 수 있을 것으로 예상된다. 구글도 '비오'를 조만간 출시할 예정이다. 런웨이는 지난 7월부터 마케팅과 광고 등 콘텐츠 제작자를 대상으로 '젠-3 알파'를 유료로 제공하고 있다. 앞서 지난해 11월에는 스태빌리티 AI가 '스테이블 비디오 디퓨전'을 선보였다. 올해 1월에는 마이크로소프트(MS)가 비디오 프레임의 움직임을 조작하는 동영상 생성 모델 '드래그누와'를, 바이트댄스는 '매직비디오-V2'를 공개했다. 애플도 2월 대형언어모델(LLM)을 활용해 동영상을 생성하는 '키프레이머'를 내놨다. 이 같은 상황 속에 메타는 "'무비 젠'이 작업 전반에서 업계 유사 모델보다 우수한 성능을 보였다"며 경쟁사들을 겨냥했다. 코너 헤이즈 메타 생성형 AI 제품 부사장은 "더 많은 사람이 동영상 게시물을 만들거나 편집하도록 장려하는 것이 목표"라고 말했다. 업계 관계자는 "오픈AI '소라'가 등장하며 많은 기업들에게 동영상 생성 AI 모델에 대한 강력한 동기가 생겼다"며 "여러 모델들이 하반기에 한꺼번에 풀리면 산업계, 특히 미디어 시장에 엄청난 반향을 일으킬 것으로 보인다"고 말했다.

2024.10.06 10:29장유미

유튜브 쇼츠, '비오'와 통합...AI 동영상 제작 기능 지원

유튜브 크리에이터들이 구글의 딥마인드 인공지능(AI) 동영상 생성 모델인 '비오(Veo)'를 활용해 동영상을 제작할 수 있게 됐다. 18일(현지시간) 유튜브 공식 블로그에 따르면, 유튜브는 미국 뉴욕에서 연례 행사인 '메이드(Made) 온 유튜브'를 개최하고 비오를 유튜브 쇼츠에 통합한다고 발표했다. 이에 따라 앞으로 유튜브 크리에이터는 동영상에 AI가 생성한 배경을 추가하고 프롬프트(명령어)를 사용해 6초 짜리 쇼츠를 생성할 수 있다. 비오는 구글이 지난 5월 공개한 동영상 생성형 AI 모델이다. 유튜브는 올해 말 비오 배경 기능을 출시할 예정이다. 또 6초 짜리 AI 클립은 내년에 출시할 예정이다. AI 기능은 유튜브 스튜디오에서도 확대된다. 유튜브는 크리에이터들이 AI가 만든 동영상 제목, 썸네일, 개요 등을 활용할 수 있도록 하는 기능도 발표했다. 단 AI로 제작된 콘텐츠에는 AI가 만들었음을 알리는 워터마크가 표시된다. 또한 AI를 활용한 자동 더빙 기능도 추가한다. 원어 음성의 말투, 억양 등과 최대한 어울리게 만든 더빙을 영상에 자동으로 입힐 수 있도록 한다는 설명이다. 언어는 프랑스어, 스페인어, 포르투갈어, 이탈리아어 등이 제공된다. 닐 모한 유튜브 최고경영자(CEO)는 "비오를 통해 유튜브 크리에이터가 AI의 도움을 받아 더 많은 숏 동영상을 제작할 수 있게 된다"며 "우리가 AI로 선보인 모든 것은 여러분이 하는 작업을 더 빠르고 더 효율적으로 만들 것"이라고 밝혔다.

2024.09.19 10:47최지연

'오픈AI 소라 경쟁자 등장'...구글, 동영상 생성 모델 '비오' 공개

구글이 동영상 생성모델 '비오'를 공개하며 오픈AI의 '소라'와 맞서기에 나선다. 14일(현지시간) 구글은 연례개발자 컨퍼런스 구글 I/O를 통해 동영상 생성모델 '비오'를 선보였다. 비오는 1080p해상도로 1분 이상 길이의 영상을 생성할 수 있다. 이 동영상 생성모델은 프롬프트를 보다 정확하게 이해하고 따를 수 있도록 교육 데이터의 각 비디오 캡션에 더 많은 세부 정보를 추가해 개발된 것이 특징이다. 또한 고품질의 압축된 비디오 표현을 사용해 효율성도 향상시켰으며 영상 생성 시간도 단축됐다. 자연어와 시각적 의미에 대한 높은 이해도를 갖춘 만큼 사용자가 프롬프터를 통해 세부적으로 작성하는 요구사항을 파악하고 이를 영상에 반영할 수 있다. 예를 들어 타입랩스, 항공촬영 등 영화 촬영 기법 등을 프롬프터로 입력하면 이를 파악해 그대로 적용 가능하다. 비오는 실제 영상 제작이나 편집을 보다 적극적으로 지원하는 것을 목표로 개발됐다. 이를 위해 텍스트 프롬프트와 함께 이미지를 입력으로 사용하여 비디오를 생성할 수 있는 기능을 지원한다. 영상 제작의 기준이 되는 참조 이미지를 지원함으로써 사용자는 보다 일관성 있고 의도한 비디오를 생성할 수 있다. 더불어 원활한 편집을 위해 영상에서 특정 부분만 지정하는 마스크 영역 기능도 지원한다. 또한 프롬프터를 이용해 스토리를 시리즈 형식으로 제작하면 1분으로 제한된 영상 길이를 넘어 연속성 있는 영상도 제작 가능하다. 이를 활용한다면 실제 영화 같은 영상물도 제작 가능하다는 것이 구글 측의 설명이다. 구글은 실제로 비오를 이용한 영화 제작을 준비 중으로 영화 제작자 도널드 글로버 및 그의 크리에이티브 스튜디오인 길가(Gilga)와 함께 작업을 진행하고 있다. 구글의 엘리 콜린스 제품 관리 부사장은 "비오는 전례 없는 수준의 창의적인 제어 기능을 제공한다"며 "창작자가 제작 과정에서 기술 개발 방식에 대해 목소리를 낼 수 있도록 지원할 것"이라고 설명했다.

2024.05.15 09:11남혁우

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

삼성전자, 브로드컴과 HBM3E 12단 공급 추진…ASIC서 기회 포착

메타의 공격적 AI 인재 사냥, 핵심은 '데이터 전쟁'

입점하면 서로 이득…유통가, ‘올다무’ 유치 경쟁 치열

새정부 독자AI 구축 의지...통신사, 자체 AI 모델 공개

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.