• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
창간특집
인공지능
배터리
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'이마젠 3'통합검색 결과 입니다. (2건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

딥마인드, 영상 만드는 AI '비오 2' 출시…"기능 미흡·저작권 문제 해결부터"

구글 딥마인드가 동영상 만드는 인공지능(AI) 모델 '비오(Veo) 2'를 발표한 가운데 복잡한 영상 생성 기능 미흡과 저작권 문제 해결이 시급하다는 지적을 받고 있다. 17일 테크크런치 등 외신에 따르면 구글 딥마인드는 기존 AI 기반 영상 생성 모델 비오 차기 모델을 출시했다. 현재 비오 2는 구글 영상 제작 플랫폼에 탑재됐다. 내년 개발자 플랫폼 버텍스 AI에도 공급될 예정이다. 비오 2는 최대 4K 해상도로 2분 이상 분량의 영상을 생성할 수 있다. 이는 오픈AI 영상 모델인 '소라'보다 우수한 기능이다. 소라는 해상도 1천80p와 20초 분량이 최대다. 다만 외신은 비오 2가 해당 분량의 영상을 생성할 수 있을지 의문이라고 했다. 현재 비오 2를 탑재한 구글 영상 제작툴 '비디오FX'는 해상도 720p로 8초 분량 동영상까지 만들 수 있어서다. 비오 2는 이전 모델과 마찬가지로 텍스트 프롬프트 또는 텍스트와 참조 이미지로 동영상을 생성한다. 딥마인드는 비오 2가 카메라 제어에 대한 이해도가 향상돼 더 선명한 영상을 생성한다고 밝혔다. 특히 움직임 많은 장면에서 텍스처와 이미지가 더 뚜렷해졌다는 설명이다. 이 외에도 비오 2는 동영상에서 가상 카메라를 더욱 정밀하게 조작할 수 있어 객체와 사람을 다양한 각도에서 인식할 수 있는 것으로 전해졌다. 움직임, 유체 동역학, 빛의 특성을 기존보다 사실적으로 재현할 수 있다는 평가다. 다양한 렌즈 효과와 영화적 기법, 미세한 인간 표정까지 구현 가능한 상태다. 외신 "비오 2 직접 이용해 보니…복잡한 영상 생성 미흡" 외신은 비오 2가 굴절이나 복잡한 액체 표현 등 까다로운 시각적 효과 생성에 강점을 보였다고 보도했다. 특히 픽사 스타일의 애니메이션 표현이 우수하다는 평가다. 그러나 모델 개선이 필요해 보인다고 입을 모았다. 테크크런치는 "강아지 캐릭터 눈이 지나치게 생기 없어 보이거나, 영상 속 도로가 비현실적으로 미끄러워 보이는 장면이 등장했다"며 "배경 속 보행자와 건물이 서로 섞이거나 물리적으로 불가능한 구조를 보이는 경우도 있었다"고 지적했다. 이에 딥마인드 엘린 콜린스 제품 부사장은 "비오 2는 몇 분 동안 프롬프트에 따라 일관된 동영상을 생성할 수 있지만, 복잡한 프롬프트를 긴 시간 동안 유지하는 데 한계가 있다"며 "캐릭터 일관성과 디테일, 복잡한 동작 생성 등에서 더 발전해야 한다"고 밝혔다. "데이터 학습·저작권 문제 우려"…이마젠 3 업그레이드 외신은 비오 2의 학습 데이터 출처·저작권 문제 우려 가능성도 언급했다. 딥마인드는 구체적으로 어디서 영상 데이터를 가져왔는지 밝히지 않은 상태다. 다수 외신은 유튜브가 주요 데이터 출처일 가능성 있다고 분석했다. 현재 구글이 유튜브를 소유하고 있다는 이유에서다. 외신은 저작권 문제 우려도 여전하다고 평가했다. 앞서 딥마인드는 공개 데이터를 학습하는 것이 공정 이용(fair use)에 해당한다고 주장한 바 있다. 데이터 소유자 허가를 받지 않고 학습해도 된다는 설명이다. 그러나 창작자들은 이에 동의하지 않는다는 입장을 취하고 있다. 딥마인드는 딥페이크 방지를 위해 자체 워터마킹 기술인 신스(Synth)ID를 비오 2에 적용했다. 신스ID는 생성된 동영상 프레임에 보이지 않는 마커를 삽입하는 기술이다. AI가 생성한 콘텐츠를 추적할 수 있다. 다만 다른 워터마킹 기술처럼 완벽한 방지가 어렵다는 지적도 이어지고 있다. 이날 딥마인드는 이미지 생성 모델 '이마젠 3' 업그레이드 버전도 발표했다. 새 이마젠 3 모델은 구글의 이미지 생성 도구인 '이미지FX'를 통해 제공된다. 이마젠 3는 포토리얼리즘과 인상주의, 애니메이션 스타일 등 다양한 스타일로 더 밝고 잘 구성된 이미지를 생성할 수 있다. 디테일과 텍스처를 풍부하게 표현할 수 있는 것으로 평가받고 있다. 딥마인드는 "이번 업그레이드 모델은 프롬프트 입력 시 칩렛를 통해 주요 키워드를 강조하고 연관된 단어를 자동 제안함으로써 사용자 편의성을 높였다"고 강조했다.

2024.12.17 09:31김미정

이번엔 괜찮을까…구글, 제미나이 이미지 기능 재출시

구글이 '엉터리 이미지 묘사'로 비난받아 중단했던 이미지 생성 기능을 제미나이 챗봇에 다시 추가한다. 29일 구글은 9월부터 제미나이 인공지능(AI) 챗봇에 이미지 생성 기능을 추가할 예정이라고 밝혔다. 이 기능은 제미나이 고급, 비즈니스 및 엔터프라이즈 일부 사용자만 이용할 수 있으며, 영어만 지원한다. 이미지 생성 기능은 텍스트-이미지 도구 '이마젠 3' 기반으로 작동한다. 구글은 이달 초 이마젠 3을 비공식 출시했다. 해당 도구는 텍스트 명령으로 이미지를 생성할 수 있는 기능을 갖췄다. 사실적 풍경부터 질감 있는 유화 제작까지 만들 수 있다. 구글은 지난 2월 제미나이 챗봇에 들어간 이미지 생성 기능 때문에 뭇매를 맞았다. 챗봇이 인종·역사적으로 부정확한 이미지 생성했다는 오류 보고가 잇따라 나온 때문이다. 논란이 커지자 구글은 이미지 생성 기능을 중단했다. 이번 이미지 생성 도구는 공인 실사 이미지, 미성년자를 포함한 콘텐츠, 잔인하고 폭력적이며 성적인 장면을 생성하지 않는다. 이마젠 3 내 프롬프트 안전장치가 해당 프롬프트 명령을 거부할 수 있기 때문이다. 구글 데이브 시트론 제미나이 제품 관리 수석 디렉터는 향후 영어뿐 아니라 다양한 언어로 AI 이미지 기능을 확대할 것"이라고 공식 홈페이지서 밝혔다.

2024.08.29 08:50김미정

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

"요금 올리거나, 무료 풀거나"…OTT, 전략 분화

"책 대신 '아이패드'로 수업을"…디지털이 바꾼 교실 풍경은

과학자들, 납으로 금 만들었다…'연금술사의 꿈' 실현되나

[써보고서] 괴물 카메라를 가진 폰 '샤오미 15 울트라'

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현