• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
국감2025
배터리
양자컴퓨팅
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'비디오 생성'통합검색 결과 입니다. (4건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

xAI, '월드 모델' AI 개발…엔비디아 출신 전문가 영입

인공지능(AI) 스타트업 xAI가 소위 '월드 모델'이라고 불리는 차세대 AI 시스템 개발 경쟁에 본격적으로 뛰어들었다. 이 기술은 경쟁사인 메타와 구글도 주력하고 분야로, AI가 물리적 환경을 탐색하고 설계할 수 있도록 하는 것을 목표로 하고 있다. 12일(현지시간) 파이낸셜타임스 등 외신에 따르면 xAI는 미국 반도체 기업 엔비디아 출신 전문가를 고용해 로봇과 영상 데이터로부터 현실 세계를 학습하는 차세대 AI 모델을 개발하기 시작했다. 엔비디아는 자사 옴니버스 플랫폼을 통해 시뮬레이션을 구축하고 실행하는 월드 모델 분야의 선도 기업이다. xAI가 개발에 착수한 월드 모델은 텍스트 기반의 대규모 언어모델(LLM)을 넘어서는 기술로 평가된다. 현재 오픈AI 챗GPT와 xAI 챗봇 그록과 같은 생성형 AI는 텍스트 데이터로만 훈련되지만, 월드 모델은 물리 법칙과 실제 환경 속 사물 간의 상호작용을 이해할 수 있는 AI를 개발하려는 시도로 해석된다. 사안에 정통한 관계자에 따르면 xAI는 월드 모델을 게임 분야에 우선 적용하는 것을 계획하고 있다. 이 기술은 AI가 직접 상호작용 가능한 3D 환경을 생성하는 데 사용될 수 있으며 이후에는 로봇용 AI 시스템에도 적용될 수 있다. 머스크 최고경영자(CEO)는 엑스(X)에서 “내년 말까지 AI가 만든 훌륭한 게임을 출시할 것”이라고 밝혔다. 월드 모델은 실시간으로 물리 법칙과 사물 간 인과 관계를 이해해 현실 세계 동작을 더욱 정확하게 시뮬레이션할 수 있다. xAI는 이미지 및 비디오 생성 기술 인력을 모집 중이며 이들이 합류할 '옴니 팀'은 텍스트를 넘어 이미지·영상·음성 등 다양한 형태의 콘텐츠를 이해하고 생성하는 팀이다. 구인하는 인력의 연봉은 18만~44만 달러(약 2억5천677만~6억2천766만원)에 달한다. 또 xAI는 '비디오 게임 튜터' 직책도 공개했는데, 이 역할은 그록이 AI 기반 게임을 제작하고 사용자가 AI와 함께 게임 디자인을 실험할 수 있도록 훈련시키는 것이다. 시급은 45~100달러 (6만4천200~14만2천650원) 수준이다.

2025.10.13 10:17박서린

오픈AI, 기술 한계 직면했나…'소라' 출시 직후 연일 '먹통'

오픈AI의 야심작인 동영상 생성 인공지능(AI) 모델 '소라(Sora)'가 서비스 정식 출시와 동시에 마비됐다. 시장 내 '게임체인저'가 될 것이란 기대감과 달리 사전 대비가 소홀했다는 지적이 나오면서 AI 기술 주도권을 쥔 오픈AI가 오점을 남겼다는 평가다. 11일 업계에 따르면 오픈AI '소라'를 경험하기 위한 이용자들이 일시적으로 몰리면서 이날 오후 4시 14분(한국시간) 현재도 '소라닷컴'에 접속이 되지 않고 있다. 서비스는 이달 10일(현지 시간 9일) 오픈됐지만 트래픽이 심해 일시적으로 비활성화 조치가 내려졌다. 오픈AI '소라'가 무료가 아닌 유료 이용자들을 대상으로 서비스 된다는 점에서 이번 일은 상당한 실망감을 가져다줬다. '소라'는 현재 '챗GPT 플러스', '챗GPT 프로'에 포함돼 기존 유료 이용자들은 이 동영상 AI 모델 이용에 대한 추가 비용을 지불할 필요 없이 이용할 수 있다. 월 20달러를 지불하는 '챗GPT 플러스' 이용자들은 매월 50개(480p 또는 그 이하 해상도), 월 200달러인 '챗GPT 프로' 구독자들은 매월 500개의 영상을 생성할 수 있다. 챗GPT 팀, 엔터프라이즈, 에듀 계정에선 소라를 쓸 수 없다. 사실상 유료 서비스인 셈이다. 하지만 서비스 정식 출시 후 3일째가 된 이날도 여전히 정상화되지 않고 있다는 점에서 이용자들은 점차 불만을 터트리고 있다. '소라'를 이용하기 위해 '챗GPT 플러스'를 다시 구독하기 시작한 이용자들도 상당히 있지만, 사이트가 '먹통'이 된 탓에 많은 아쉬움을 드러내고 있다. 일각에선 국내와 달리 해외 기업의 서비스 먹통에 대한 민감도가 낮은 듯 하다고 지적했다. 앞서 카카오의 경우 지난 2022년 10월 SK C&C 데이터센터 화재로 서비스가 줄줄이 중단돼 많은 비난이 쏟아진 바 있다. 카카오는 카카오톡 등 무료 서비스에 대해서도 서비스 중단에 대한 책임을 지기 위해 보상안을 마련하며 여론을 달래기 위해 노력했다. 하지만 오픈AI는 유료 고객을 대상으로 한 서비스가 제대로 작동하고 있지 않음에도 개선책은커녕 보상안에 대해서도 제대로 내놓지 못하고 있어 눈살을 찌푸리고 있다. 오픈AI는 '소라닷컴' 알림창에 "현재 트래픽이 심해 소라 계정 생성을 일시적으로 비활성화했다"고만 공지한 상태다. 또 언제 서비스 정상화가 될 수 있냐는 질문에는 명확한 답변을 내놓지 못했다. 이에 대해 샘 올트먼 오픈AI 최고경영자(CEO)는 자신의 X(옛 트위터)에 "소라에 대한 수요를 상당히 과소 평가했다"고만 말했다. 업계 관계자는 "접속 채널에 동시 접속자가 많으면 많을수록 비용이 많이 든다"며 "그만큼 인프라를 확보해 둬야 하기 때문"이라고 설명했다. 이어 "한정된 자원과 예산으로 동시에 들어올 수 있는 인원수를 제한하려고 하다 보니 이 같은 일이 벌어진 듯 하다"며 "유료 구독자를 대상으로 하는 서비스임에도 기술적 한계와 비용 투입이 제대로 일어나지 않아 이 같은 일이 벌어진 듯 해 아쉽다"고 덧붙였다. 그러면서 "영상을 AI로 제작하는 서비스인 만큼 컴퓨팅 리소스를 엄청나게 소모할 듯 한 데 이를 오픈AI가 최적화하지 못한 측면도 있지 않을까 싶다"며 "유료 임에도 SLA(최저보장속도)을 보장해주지 않았다는 점에서 사용자들의 권리를 침해한 것으로 보여 비즈니스 모델로서도 성공적인 시작을 하진 못한 듯 하다"고 평가했다.

2024.12.11 16:19장유미

딥페이크 범죄 '급증'…글로벌 테크 기업 대응 나섰다

최근 딥페이크 성범죄와 허위 뉴스 영상 제작이 급격히 증가하면서 이를 탐지·대응하는 기술이 주목받고 있다. 국내외에서 딥페이크 범죄가 사회적 문제로 떠오르자 관련 기업들의 움직임에 대한 시장 기대감이 높아지고 있다. 19일 업계에 따르면 경찰은 올해 500건 넘는 딥페이크 사건을 수사 중이며 특히 10대들이 연루된 사례가 급증하고 있다. 국내외 가해자들은 텔레그램 등 익명성이 보장된 플랫폼을 통해 음란물을 유포하고 있으며 주로 여성인 피해자들이 심각한 피해를 입고 있다. 해외에서도 상황은 심각하다. 유로뉴스에 따르면 유럽에서 제작된 딥페이크 영상 96%가 여성과 청소년을 대상으로 한 음란물이다. 미국에서는 최근 스칼렛 요한슨과 테일러 스위프트 등 유명인들이 딥페이크 포르노의 피해자가 되기도 했다. 딥페이크 음란물뿐만 아니라 가짜뉴스로 인한 문제도 부각되고 있다. 정치인이나 공공 인물의 발언을 조작하거나 허위 정보를 담은 영상을 제작해 유포하는 사례가 증가하고 있기 때문이다. 지난 2022년 국내 지방 선거 당시 윤석열 대통령이 특정 후보를 지지하는 딥페이크 영상이 퍼져 큰 논란이 된 바 있다. 이와 관련해 딥페이크 선거 사용 방지법이 지난 1월 통과됐지만 해외에서는 딥페이크를 통한 가짜뉴스 남용이 여전히 큰 문제가 되고 있다. 이런 상황에서 딥페이크 탐지 기술에 대한 수요가 급증하고 있다. 글로벌 시장조사업체 마켓앤마켓에 따르면 글로벌 딥페이크 탐지 시장은 지난 2022년 5억 달러(한화 6천500억원)였지만 오는 2027년에는 18억 달러(한화 2조3천400억원) 규모로 성장할 것으로 예상된다. 이미 마이크로소프트는 지난 2020년 AI와 머신러닝을 결합한 '비디오 인증기(Video Authenticator)'를 공개한 바 있다. 이 도구는 사진이나 비디오를 분석해 미디어가 조작되었을 가능성을 백분율로 나타내는 신뢰도 점수를 제공한다. 특히 실시간으로 동영상을 프레임 단위로 분석해 각 프레임에서 조작 가능성을 보여준다. 미국뿐 아니라 유럽 스타트업들도 이에 가세했다. 그 중 에스토니아의 센티넬 AI는 클라우드 기반 솔루션을 통한 실시간 딥페이크 탐지를 제공하는 것으로 알려졌다. 이 회사는 얼굴 랜드마크 분석과 시간적 일관성 등을 활용해 딥페이크를 식별한다. 특히 최근 딥페이크 탐지 경연대회에서 135만 달러의 상금을 획득하며 기술력을 인정받았다. 요하네스 타메캔드 센티넬 AI 대표는 자사 제품을 소개하며 "우리는 잘못된 디지털 기술의 활용이 민주주의에 가장 큰 위협 중 하나라는 것을 잘 알고 있다"며 "사회가 잘못된 정보에 빠지는 것을 막기 위해 최선을 다할 것"이라고 밝혔다. 네덜란드의 센시티 AI도 실시간 딥페이크 탐지 플랫폼을 제공하고 있다. 이 회사는 얼굴 조작, 음성 합성, 전신 조작 등 다양한 유형의 딥페이크를 식별하며 인공지능(AI) 기반 분석으로 조작된 미디어의 출처를 추적한다. 조르지오 파트리니 센시티 AI 대표는 "딥페이크 기술의 발전 속도가 매우 빠르기 때문에 우리의 탐지 시스템도 지속적으로 진화해야 한다"며 "디지털 미디어 생태계의 신뢰성을 유지하는 것이 우리의 목표"라고 말했다. 이렇게 유럽에서 딥페이크 탐지 기술이 발전한 것은 민주주의와 인권이 딥페이크 위협에 직접적으로 노출되었기 때문이라고 전문가들은 지적한다. 개인정보 보호를 중요시하는 유럽의 규제 환경이 딥페이크 기술 오용에 대한 경각심을 높였다는 것이 이들의 분석이다. 국내에서도 다양한 테크 기업들이 딥페이크의 폐해를 예방하기 위해 노력을 기울이고 있다. 특히 라온시큐어는 올 하반기에 개인이 쉽게 딥페이크 여부를 체크할 수 있는 탐지 서비스를 자사의 개인용 모바일 백신 애플리케이션에 탑재할 계획이다. 라온시큐어의 딥페이크 탐지 기술은 합성된 얼굴과 정상 얼굴을 각각 학습해 이를 상호 비교 분류할 수 있도록 AI를 학습시킨다. 이미지부터 동영상, 안면 추출, 주파수 계열 변환 등 다양한 기술을 적용해 생성형 AI의 특징을 탐지한다. 이때 딥페이크 탐지 정확도를 높이기 위해 여러 모델을 동시에 사용한다. 특정 학습 유형에 맞춰 설계된 각각의 모델이 따로 존재하기 때문에 한 가지 모델에 의존했을 때 발생하는 탐지 정확도 저하를 방지할 수 있다. 이를 통해 얼굴의 부자연스러운 형태· 움직임·오디오 등을 종합적으로 분석해 더욱 정교한 탐지가 가능할 것으로 전망된다. 박현우 라온시큐어 AI연구센터장은 "딥페이크가 보편 기술이 돼 이를 악용한 범죄가 퍼지는 와중에 간편하게 딥페이크 여부를 탐지할 수 있는 기술도 보편화돼야 한다"며 "자사 보안 앱인 '라온 모바일 시큐리티'에 딥페이크 탐지 기능을 탑재하는 등 모든 개인들을 위한 잠재적 피해 예방에 매진하겠다"고 강조했다. 딥브레인AI도 '딥페이크 탐지 솔루션'을 개발해 주목받고 있다. '딥페이크 탐지 솔루션'은 사진의 경우 12분, 짧은 영상은 57분 내에 딥페이크 여부를 판별할 수 있다. 이미지와 비디오를 픽셀 단위로 분석하고 음성은 주파수, 시간, 노이즈 등 다양한 요소를 종합적으로 고려해 탐지하는 것으로 알려졌다. 이렇게 국내 기업들이 약진하는 가운데 딥페이크 방지 기술의 개발만으로 실제 범죄를 완전히 막기에는 한계가 있다는 지적도 나온다. AI 기술이 기하급수적으로 발전하고 있기 때문이다. 익명을 요청한 국내 AI 기업 관계자는 "딥페이크 기술은 계속해서 발전하고 있어 탐지 기술만으로는 완벽한 대응이 어렵다"며 "기술의 오용을 막기 위한 사회적 합의와 강력한 처벌 등이 병행돼야 한다"고 강조했다.

2024.09.19 17:40조이환

어도비, 프리미어프로의 최신 생성형 AI 혁신 공개

어도비는 프리미어 프로에서 영상 제작 및 제작 워크플로우를 재구상할 획기적인 생성형 AI 혁신을 16일 공개했다. 최신 혁신은 빠른 속도의 영상 제작을 위해 모든 전문 편집자에게 필요한 새로운 창의적 가능성을 제공한다. 올해 프리미어 프로에 새롭게 도입될 새로운 생성형 AI 툴을 통해 사용자는 장면에서 개체를 추가 또는 제거하거나 기존 클립을 확장하는 등 전체 영상 편집을 간소화할 수 있다. 새로운 편집 워크플로우는 이미지, 벡터, 디자인, 텍스트 효과를 포함한 파이어플라이 제품군에 추가될 새로운 비디오 모델에 의해 구동될 예정이다. 어도비는 이미징, 영상, 오디오 및 3D와 같이 어도비가 깊은 전문성을 갖고 있는 영역에서 파이어플라이 AI 모델을 지속적으로 개발하고 있으며, 이 모델들을 크리에이티브 클라우드와 어도비 익스프레스에 긴밀하게 통합할 예정이다. 어도비는 서드파티 생성형 AI 모델을 프리미어 프로와 같은 어도비 애플리케이션에 직접 가져오는 비전도 선공개했다. 크리에이티브 클라우드는 풍부한 파트너 및 플러그인 생태계를 보유하고 있으며 이번 진화를 통해 프리미어 프로를 모든 워크플로우에 적합한 가장 유연하고 확장 가능한 전문 영상 툴로 확장했다. 어도비 고객은 차세대 엔터테인먼트와 미디어의 제작 및 편집 시 폭넓은 선택지와 무한한 가능성을 원하고 있다. 초기 탐색 단계에서 어도비는 전문 영상 편집자가 향후 프리미어 프로에 통합된 오픈AI 및 런웨이의 영상 생성 모델을 활용해 자신의 프로젝트에서 편집 가능한 B-롤을 생성하는 법을 제시한다. 또한 피카 랩스와 생성형 확장 툴을 함께 사용해 마지막 장면을 몇 초 더 늘리는 방법도 보여준다. 어도비는 어도비 파이어플라이와 다양한 서드파티 모델로 구동되는 새로운 생성형 AI 역량을 제공함으로써 고객이 프리미어 프로에서 매일 사용하는 워크플로우를 벗어나지 않고도 다양한 신규 역량을 활용할 수 있도록 지원한다. 이 밖에도 어도비는 새로운 페이드 핸들, 클립 배지, 동적 파형, AI 기반 카테고리 태깅 등 프리미어 프로의 AI 구동 오디오 워크플로우를 곧 출시한다고 밝혔다. 어도비는 올해 말 프리미어 프로에 도입될 파이어플라이용 새로운 영상 모델로 구동되는 생성형 AI 워크플로우의 기술 프리뷰를 선보였다. 전문 편집자가 향후 오픈 AI 및 런웨이의 영상 생성 모델을 활용해 B-롤을 생성하거나, 생성형 확장 툴과 피카 랩스로 장면 끝에 몇 초를 추가하는 초기 단계의 모습도 공개했다. 생성형 확장으로 프레임을 매끄럽게 추가해 클립을 더 길게 만들 수 있어, 더 쉽게 편집 시간을 완벽히 맞추고 부드러운 전환을 추가할 수 있다. 이 기술은 미세 조정 편집을 위한 추가 미디어를 만들고 추가 비트에 맞춰 장면을 유지하거나 원활하게 장면 전환을 다루도록 지원해 전문 편집자가 매일 직면하는 고충을 해결한다. 개체 추가 및 제거 기능은 간단하게 개체를 선택하고 추적한 후 교체하는 기능으로, 원치 않는 아이템을 제거하거나 배우의 의상을 변경할 수 있고, 책상 위 그림 또는 사실적인 꽃과 같은 세트 장식을 빠르게 추가하는 것도 가능하다. '텍스트를 영상으로' 기능은 간단하게 프롬프트에 텍스트를 입력하거나 참조 이미지를 업로드 해, 프리미어 프로에서 완전히 새로운 영상을 생성할 수 있다. 해당 클립은 아이디어를 도출하고 스토리보드를 만들거나, 실사 영상을 보강하는 B-롤을 만드는 데 사용 가능하다. 생성형 AI에 대한 초기 논의가 대부분 최고의 AI 모델을 만드는 기업 간 경쟁에 초점을 뒀지만, 어도비는 각 분야에서 강점을 가진 수천 개의 전문 모델이 등장할 것으로 전망한다. 수십년 간 이어진 어도비의 AI 경험에 따르면 AI 로 생성된 콘텐츠는 일상 업무에 자연스럽게 활용될 때 가장 유용하다. 대부분의 어도비 고객에게 생성형 AI는 창의적인 방향을 모색하기 위한 시작점이자 영감의 원천으로 역할하고 있다. 어도비는 사용자가 플랫폼과 소스에 구애받지 않고 모든 자료를 사용해 상상하는 속도로 제작할 수 있도록 업계 표준 툴과 원활한 워크플로우를 제공하는 데 목표를 두고 있다. 어도비는 파이어플라이 또는 다른 특정 AI 모델을 통해 어도비 애플리케이션 내에서 최대한 원활한 통합 프로세스를 제공하기 위해 노력하고 있다. 어도비는 책임감 있는 혁신을 바탕으로 자체 AI 모델을 개발했으며, 자사 안전 기준을 애플리케이션 내 서드파티 모델을 통합하는 데 동일하게 적용할 계획이다. 콘텐츠 진위 이니셔티브(CAI)를 출범한 기업 중 하나인 어도비는 온라인 콘텐츠의 '영양 성분 표시' 역할을 하는 무료 오픈 소스 기술인 콘텐츠 자격증명을 애플리케이션에서 제작한 에셋에 첨부해, 사용자가 콘텐츠 제작 방식과 어도비 플랫폼에서 제작된 콘텐츠 생성에 어떤 AI 모델이 사용되었는지 확인할 수 있다. 어도비는 오는 5월 새로운 생성형 AI 영상 툴과 프리미어 프로의 새로운 오디오 워크플로우를 출시하며 편집자가 소리 품질을 정밀하게 제어하고 개선하는 데 필요한 모든 기능을 제공한다. 새롭게 제공되는 기능 중 '인터랙티브 페이드 핸들'으로 편집자는 클립 핸들을 드래그해 오디오 페이드 효과를 만듦으로써 더욱 빠르게 맞춤형 오디오 전환을 생성할 수 있다. 오디오 카테고리 태깅으로 새로워진 에센셜 사운드 배지 기능으로 AI가 오디오 클립을 대화, 음악, 음향 효과, 배경 소리 등으로 자동 태그하고 새로운 아이콘을 추가해 편집자는 클릭 한 번으로 작업에 적합한 기능을 사용 가능하다. '효과 배지 기능을 활용해 편집자는 새로운 시각적 표시기를 통해 어떤 클립에 효과가 적용되었는 지 쉽게 확인하고 새로운 효과를 빠르게 추가할 수 있으며, 시퀀스에서 바로 효과 매개 변수를 자동으로 실행할 수 있다. 새로운 디자인의 동적 파형 기능으로 클립의 트랙 높이가 변경되면 파형의 크기가 지능적으로 조정되며, 새롭게 추가된 색상으로 시퀀스를 더 쉽게 파악할 수 있다. 이 밖에도 편집자는 AI 구동 음성 향상 툴을 사용해 원치 않는 노이즈를 즉시 제거하거나 녹음 품질이 낮은 대화를 개선하는 것도 가능하다. 애슐리 스틸 어도비 크리에이티브제품그룹 수석 부사장은 “어도비는 크리에이터의 비전 실현을 위한 새로운 역량과 유연성을 제공하기 위해 영상 제작 및 제작 워크플로우의 모든 단계를 재구상하고 있다”며 “프리미어 프로의 핵심 워크플로우에 생성형 AI 혁신을 도입함으로써 영상 편집자가 매일 겪는 실질적인 고충을 해결하는 동시에 자신의 작업에 더 집중할 수 있는 여유를 제공한다”고 밝혔다.

2024.04.16 10:41김우용

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

LG전자, 3분기 실적 예상 웃돌아…전장사업이 효자

"GPU 256장, 누가 거머쥘까"…정부 '특화 AI' 사업 디데이, 흥행 성공할까

금속맛·성적쾌감 등 격한운동 후 7가지 생리현상과 그 이유

LG엔솔, 3분기도 선방…美 전기차 배터리 감소분 ESS가 상쇄

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.