• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
AI페스타
배터리
양자컴퓨팅
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'소라 2'통합검색 결과 입니다. (4건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

美 영화협회 "오픈AI 소라2, 저작권 침해 즉각 조치해야"

미국영화협회(MPA)가 오픈AI의 비디오 생성 모델 '소라2'가 저작권이 있는 미디어를 침해하는 콘텐츠를 만들고 있다며 즉각적인 조치를 촉구했다. 7일(현지시간) CNBC에 따르면 찰스 리브킨 MPA 최고경영자(CEO)는 성명에서 “소라2의 출시 이후 회원사들의 영화, 프로그램, 캐릭터를 침해하는 영상이 오픈AI 서비스와 소셜미디어 전반에 걸쳐 급증했다”고 밝혔다. 오픈AI는 소라2를 지난달 30일 출시했다. 앞서 샘 알트먼 오픈AI CEO는 블로그에서 “(자사 플랫폼이 권리자들에게)그들의 캐릭터가 어떻게 사용되는지에 대해 더 세밀한 통제권을 부여할 것”이라고 언급했다. 그러나 리브킨 CEO는 오픈AI가 “저작권 침해를 방지할 책임은 권리자가 아니라 오픈AI 자신에게 있다”는 점을 인정해야 한다며 “잘 확립된 저작권법은 창작자의 권리를 보호하며 이 경우에도 동일하게 적용된다”고 반박했다. 소라2는 출시 직후 '제임스 본드가 올트먼 CEO와 포커를 치는 장면', '만화 캐릭터 마리오가 경찰을 피해 도망치는 바디캠 영상' 등 이용자 제작물이 확산하며 저작권 논란이 불거졌다. 오픈AI는 소라2 공개 당시 스튜디오 측이 요청할 경우에만 캐릭터 사용을 제한하는 '옵트아웃' 방식을 차용했다. 이후 블로그 글에서 저작권자 허가 없이는 소라2에서 캐릭터를 사용할 수 없도록 변경하는 '옵트인' 방식으로의 전환을 예고했다. 다만, 알트먼 CEO는 완벽한 방지가 어려울 수 있다는 점을 시사하면서 “일부 예외적인 상황에서는 걸러지지 말아야 할 생성물이 통과할 수도 있다"며 "시스템을 안정화하는 데에는 반복적인 조정이 필요하다”고 덧붙였다. 현재 생성형 인공지능(AI) 성장과 함께 저작권 문제가 크게 대두되고 있다. 지난 6월 디즈니와 유니버설은 AI 이미지 생성 회사 미드저니를 상대로 소송을 제기했다. 양 사는 미드저니가 자사 영화 캐릭터를 무단으로 사용, 배포했으며 중단 요청을 무시했다고 주장했다. 아울러, 디즈니는 지난달 AI 스타트업 캐릭터 AI에 저작권 캐릭터의 무단 사용 중단을 요청하는 경고장을 발송하기도 했다.

2025.10.08 11:19박서린

"AI가 앱 만든다"…오픈AI, '데브데이'서 차세대 생태계 청사진 공개

오픈AI가 개발자 행사를 열고 차세대 언어·영상·에이전트 기술을 한꺼번에 공개하며 생태계 확장에 뛰어들었다. 8일 테크크런치에 따르면 오픈AI는 지난 6일부터 연례 개발자 행사인 '데브데이 2025'에서 'GPT-5 프로', 소라2, 'gpt-리얼타임 미니', '에이전트킷'을 포함한 대규모 응용 프로그램 인터페이스(API) 업데이트를 발표했다. 이날 행사에서는 '챗GPT' 내부에서 직접 앱을 구동할 수 있는 '앱 소프트웨어 개발 키트(SDK)' 프리뷰와 주간 활성 사용자 8억명 달성 소식도 함께 공개됐다. 오픈AI에 따르면 'GPT-5 프로'는 금융·법률·의료 등 고정밀 추론이 필요한 산업군을 겨냥한 신규 언어모델이다. 샘 알트먼 최고경영자는 "정확성과 논리적 깊이가 필요한 분야에서 GPT-5 프로의 가치가 클 것"이라며 전문가용 시장 공략 의지를 드러냈다. 함께 공개된 음성 모델 'gpt-리얼타임 미니'는 오픈AI의 기존 고급 음성모델 대비 70% 저렴한 가격으로, 실시간 스트리밍 대화를 지원한다. 오픈AI는 이번 모델이 동일한 음성 품질과 표현력을 유지하면서도 저지연 환경을 제공한다고 설명했다. 더불어 영상 생성 모델 '소라2'도 API 프리뷰 형태로 공개됐다. 소라2는 물리적으로 일관된 장면 구성과 동기화된 사운드를 구현하며 카메라 연출·화면 비율·스타일 지정 등 세밀한 창작 제어 기능을 지원한다. 오픈AI 측은 "아이폰 뷰를 시네마틱 와이드샷으로 확장하는 수준의 비주얼 컨트롤이 가능하다"고 강조했다. 해당 앱은 틱톡형 알고리즘 피드를 기반으로 짧은 AI 영상을 만들고 공유할 수 있게 설계됐다. '에이전트킷'은 기업이 자체 AI 에이전트를 쉽게 설계·배포·관리할 수 있도록 만든 개발 툴이다. 핵심 구성요소는 ▲시각형 에이전트 설계 도구 '에이전트 빌더' ▲앱 내 챗 인터페이스를 제공하는 '챗킷' ▲성능 평가용 '에이벌스 포 에이전츠' ▲내부 시스템 연동을 위한 '커넥터 레지스트리' 등이다. 이와 함께 오픈AI는 챗GPT 내부에서 바로 실행되는 '앱 인 챗GPT' 기능을 공개했다. 이 기능은 이용자가 대화 중 "피그마에서 다이어그램으로 바꿔줘"나 "코세라에서 머신러닝 강의 알려줘"와 같이 명령하면 관련 앱이 바로 작동하도록 지원한다. 현재 부킹닷컴, 익스피디아, 스포티파이, 피그마, 코세라, 질로우, 캔바 등 주요 서비스가 초기 파트너로 참여했다. 도어대시·인스타카트·우버·올트레일스 등이 뒤따를 예정이다. 앱 시스템은 모델 컨텍스트 프로토콜(MCP)을 기반으로 하며 외부 데이터 연결과 UI 렌더링을 지원한다. 사용자는 '챗GPT' 내에서 직접 계정을 연동해 서비스를 이용할 수 있고 향후 인스턴트 체크아웃 기능을 통해 유료 앱 결제도 지원될 예정이다. 다만 외신은 서드파티가 접근 가능한 대화 데이터의 범위가 명확하지 않다는 점을 잠재적 쟁점으로 지적했다. 더불어 알트먼 CEO는 행사 첫날 '챗GPT'의 주간 활성 사용자가 8억 명을 돌파했다고 공식 발표했다. 오픈AI에 따르면 현재 400만명 이상의 개발자가 플랫폼을 사용 중이며 API에서는 분당 6조개 이상 토큰이 처리된다. 테크크런치는 "오픈AI가 개발자 도구와 모델 라인업을 한데 묶으며 자사 플랫폼 중심의 AI 생태계를 구축하고 있다"며 "개발자 친화 전략이 경쟁사의 시장 점유율을 빠르게 잠식할 가능성이 있다"고 분석했다.

2025.10.08 08:56조이환

"AI 영상 생성, 1시간에 250만원"…구글, '비오 2' 초고품질 전략 성공할까

인공지능(AI) 기반 비디오 생성 시장의 경쟁이 본격화되는 가운데 구글이 자사 영상 AI인 '비오 2'의 가격을 공개했다. 4K 초고품질 영상을 지원하나, 오픈AI의 '소라'보다 가격이 높아 비용 대비 경쟁력이 있을지에 대한 의문이 제기되고 있다. 두 모델 모두 환각 및 물리 법칙 구현 등 기술적 한계를 드러내고 있다는 점도 해결 과제다. 24일 테크크런치에 따르면 구글은 AI 비디오 생성 모델 '비오 2'의 가격을 초당 50센트(한화 약 700원)로 책정했다. 이는 시간당 1천800달러(한화 약 250만원), 분당 30달러(한화 약 4만2천원)에 해당하는 수준으로, 구글은 '비오 2'를 통해 고품질 영상 시장을 공략하며 영상 생성의 상업적 활용도를 높이려는 전략을 펼치고 있다. '비오 2'는 최대 4K 해상도를 지원하는 고급형 비디오 생성 모델이다. 구글 클라우드의 '버텍스 AI(Vertex AI)' 플랫폼을 통해 제공되며 고해상도와 정밀한 디테일을 구현하는 데 초점을 맞췄다. 다만 비용이 초당 50센트로 책정되면서 일반 사용자보다는 전문가 및 기업 시장을 겨냥한 서비스로 보인다. 특히 오픈AI의 비디오 생성 AI인 '소라'와의 가격 정책 차이가 주목된다. 오픈AI는 크레딧 기반의 구독 모델을 통해 '소라'를 운영하고 있으며 1천80p 기준 초당 20센트(한화 약 280원)로 '비오 2'보다 상대적으로 저렴한 가격을 제시하고 있다. 오픈AI의 비디오 AI 가격 구조는 이용자의 구독 플랜에 따라 달라지며 저해상도에서는 보다 낮은 비용으로 비디오를 생성할 수 있다. 현재 '소라'는 월 20달러(한화 약 2만8천원)의 챗GPT '플러스'와 월 200달러(한화 약 28만원)의 '프로' 플랜을 통해 제공되며 각각 1천 크레딧과 1만 크레딧을 지급하는 방식이다. 480p 해상도의 경우 초당 4크레딧으로 약 8센트(한화 약 110원), 1천80p 해상도에서는 초당 100크레딧으로 약 20센트(한화 약 280원)이 소모된다. '소라'는 현재 4K 해상도를 지원하지 않지만 비용 효율성 면에서는 '비오 2'보다 경쟁력이 높은 것으로 보인다. 다만 실제 영상 제작 현장에서는 두 모델 모두 완벽하지 않다는 지적이 나온다. 최근 업계 평가에 따르면 '비오 2'는 손가락, 눈동자, 피부 질감 등 세부 표현에서 비현실적인 결과가 발생하며 물리 법칙에 부합하지 않는 액체 유동성 표현 등의 문제가 드러난다. 또 '소라'는 인체 움직임에서 부자연스러운 관절 회전과 신체 비율 왜곡 현상이 잦으며 보행 시 다리 움직임이 로봇처럼 경직되는 문제를 보인다. 이 외에도 장면 전환 시 객체의 색상 및 크기 변화가 불안정해 시간적 일관성을 유지하는 데 어려움을 겪고 있다. 이 같은 기술적 한계는 두 모델이 아직 실제 영상 수준에 미치지 못하는 부분을 여실히 보여준다. 전문가들은 물리 엔진 통합 등 추가 개발이 필요하다고 지적하며 특히 의류 주름 시뮬레이션과 액체-고체 상호작용 구현이 시급한 과제라고 평가한다. 향후 개선된 기술이 도입될 경우 보다 현실적인 AI 영상 제작이 가능할 것으로 기대된다. 디나 베라다 유튜브 제품 담당 이사는 "'비오 2'는 현실 세계의 물리 법칙과 인간의 움직임을 더 잘 이해해 세밀하고 현실적인 결과물을 만든다"며 "스타일, 렌즈, 시네마틱 효과까지 지정할 수 있어 쉽고 재미있게 영상을 표현한다"고 강조했다.

2025.02.24 10:55조이환

딥마인드, 영상 만드는 AI '비오 2' 출시…"기능 미흡·저작권 문제 해결부터"

구글 딥마인드가 동영상 만드는 인공지능(AI) 모델 '비오(Veo) 2'를 발표한 가운데 복잡한 영상 생성 기능 미흡과 저작권 문제 해결이 시급하다는 지적을 받고 있다. 17일 테크크런치 등 외신에 따르면 구글 딥마인드는 기존 AI 기반 영상 생성 모델 비오 차기 모델을 출시했다. 현재 비오 2는 구글 영상 제작 플랫폼에 탑재됐다. 내년 개발자 플랫폼 버텍스 AI에도 공급될 예정이다. 비오 2는 최대 4K 해상도로 2분 이상 분량의 영상을 생성할 수 있다. 이는 오픈AI 영상 모델인 '소라'보다 우수한 기능이다. 소라는 해상도 1천80p와 20초 분량이 최대다. 다만 외신은 비오 2가 해당 분량의 영상을 생성할 수 있을지 의문이라고 했다. 현재 비오 2를 탑재한 구글 영상 제작툴 '비디오FX'는 해상도 720p로 8초 분량 동영상까지 만들 수 있어서다. 비오 2는 이전 모델과 마찬가지로 텍스트 프롬프트 또는 텍스트와 참조 이미지로 동영상을 생성한다. 딥마인드는 비오 2가 카메라 제어에 대한 이해도가 향상돼 더 선명한 영상을 생성한다고 밝혔다. 특히 움직임 많은 장면에서 텍스처와 이미지가 더 뚜렷해졌다는 설명이다. 이 외에도 비오 2는 동영상에서 가상 카메라를 더욱 정밀하게 조작할 수 있어 객체와 사람을 다양한 각도에서 인식할 수 있는 것으로 전해졌다. 움직임, 유체 동역학, 빛의 특성을 기존보다 사실적으로 재현할 수 있다는 평가다. 다양한 렌즈 효과와 영화적 기법, 미세한 인간 표정까지 구현 가능한 상태다. 외신 "비오 2 직접 이용해 보니…복잡한 영상 생성 미흡" 외신은 비오 2가 굴절이나 복잡한 액체 표현 등 까다로운 시각적 효과 생성에 강점을 보였다고 보도했다. 특히 픽사 스타일의 애니메이션 표현이 우수하다는 평가다. 그러나 모델 개선이 필요해 보인다고 입을 모았다. 테크크런치는 "강아지 캐릭터 눈이 지나치게 생기 없어 보이거나, 영상 속 도로가 비현실적으로 미끄러워 보이는 장면이 등장했다"며 "배경 속 보행자와 건물이 서로 섞이거나 물리적으로 불가능한 구조를 보이는 경우도 있었다"고 지적했다. 이에 딥마인드 엘린 콜린스 제품 부사장은 "비오 2는 몇 분 동안 프롬프트에 따라 일관된 동영상을 생성할 수 있지만, 복잡한 프롬프트를 긴 시간 동안 유지하는 데 한계가 있다"며 "캐릭터 일관성과 디테일, 복잡한 동작 생성 등에서 더 발전해야 한다"고 밝혔다. "데이터 학습·저작권 문제 우려"…이마젠 3 업그레이드 외신은 비오 2의 학습 데이터 출처·저작권 문제 우려 가능성도 언급했다. 딥마인드는 구체적으로 어디서 영상 데이터를 가져왔는지 밝히지 않은 상태다. 다수 외신은 유튜브가 주요 데이터 출처일 가능성 있다고 분석했다. 현재 구글이 유튜브를 소유하고 있다는 이유에서다. 외신은 저작권 문제 우려도 여전하다고 평가했다. 앞서 딥마인드는 공개 데이터를 학습하는 것이 공정 이용(fair use)에 해당한다고 주장한 바 있다. 데이터 소유자 허가를 받지 않고 학습해도 된다는 설명이다. 그러나 창작자들은 이에 동의하지 않는다는 입장을 취하고 있다. 딥마인드는 딥페이크 방지를 위해 자체 워터마킹 기술인 신스(Synth)ID를 비오 2에 적용했다. 신스ID는 생성된 동영상 프레임에 보이지 않는 마커를 삽입하는 기술이다. AI가 생성한 콘텐츠를 추적할 수 있다. 다만 다른 워터마킹 기술처럼 완벽한 방지가 어렵다는 지적도 이어지고 있다. 이날 딥마인드는 이미지 생성 모델 '이마젠 3' 업그레이드 버전도 발표했다. 새 이마젠 3 모델은 구글의 이미지 생성 도구인 '이미지FX'를 통해 제공된다. 이마젠 3는 포토리얼리즘과 인상주의, 애니메이션 스타일 등 다양한 스타일로 더 밝고 잘 구성된 이미지를 생성할 수 있다. 디테일과 텍스처를 풍부하게 표현할 수 있는 것으로 평가받고 있다. 딥마인드는 "이번 업그레이드 모델은 프롬프트 입력 시 칩렛를 통해 주요 키워드를 강조하고 연관된 단어를 자동 제안함으로써 사용자 편의성을 높였다"고 강조했다.

2024.12.17 09:31김미정

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

"공공 AX 골든타임 왔다…117만 공무원부터 AI 익혀야"

두산, 반도체 제조 대신 '소재·후공정·설계'로 보폭 확대

네이버·두나무 ‘AI+웹3’ 동맹…새 디지털 경제 생태계 출발점 되나

"AI가 앱 만든다"…오픈AI, '데브데이'서 차세대 생태계 청사진 공개

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.