• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
창간특집
인공지능
배터리
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'영상 생성'통합검색 결과 입니다. (16건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

사진 한 장이 말하고 움직인다…캐릭터.AI, 영상 생성형 기술 '아바타FX' 공개

영상 생성형 인공지능(AI)이 인기를 얻고 있는 가운데, 2D 이미지를 사람처럼 움직이게 하는 기술이 공개돼 주목받고 있다. 다만 실제 인물을 활용한 애니메이션 생성이 가능해짐에 따라 악용 우려도 커지고 있다. 23일 테크크런치에 따르면 AI 기반 채팅·롤플레잉 플랫폼 기업 캐릭터.AI는 비디오 생성 모델인 '아바타FX'를 공개했다. 해당 모델은 비공개 베타 버전으로 제공된다. 아바타FX는 캐릭터들을 다양한 스타일과 음성으로 애니메이션화해 사람 같은 캐릭터부터 2D 동물 만화까지 다양한 모습으로 구현한다. 특히 오픈AI의 대표적인 영상 생성형 모델 '소라'와 차별화돼 이목을 끌고 있다. 아바타FX는 단순히 텍스트를 비디오로 변환하는 것이 아니라, 기존 이미지를 활용해 비디오를 제작할 수 있다. 이를 통해 실제 인물 사진을 애니메이션으로도 표현할 수 있다. 다만 이로 인해 업계에서는 영상 생성형 AI 기술이 악용될 수 있다는 우려도 보이고 있다. 사용자들이 유명인이나 지인의 사진을 업로드해 범죄가 될 만한 행동이나 말을 하는 영상을 사실적으로 만들 수 있기 때문이다. 특히 캐릭터.AI는 최근 많은 사용자들로부터 인기를 얻고 있어 딥페이크 기술로 악용될 가능성이 높다는 게 업계 관측이다. 실제 캐릭터.AI는 자사 챗봇이 사용자들에게 비윤리적인 채팅을 전한다는 이유로 자녀를 둔 미국의 부모들로부터 피소된 바 있다. 챗봇 메시지가 사람에게 부정적인 영향을 미칠 것이란 우려가 퍼지는 가운데, 현실적인 영상을 생성하는 캐릭터.AI의 이번 서비스는 이같은 문제를 더욱 증폭시킬 수 있다는 전망이 나오고 있다. 테크크런치는 "캐릭터.AI는 자녀 보호 기능과 같은 추가적인 안전장치를 구축했지만, 완벽한 보호 체계를 갖췄다고 보장하기는 어렵다"고 설명했다.

2025.04.23 14:29한정호

캐럿, 구글 최신 영상 생성 AI '비오2' 탑재

인공지능(AI) 영상 생성 플랫폼 '캐럿' 운영사 패러닷(대표 장진욱)이 구글 딥마인드가 개발한 차세대 고성능 영상 생성 AI 모델 '비오2'를 탑재했다고 31일 밝혔다. 비오2는 기존 모델 대비 물리 법칙과 인간 움직임에 대한 이해도가 높다. 따라서 다양한 구도를 활용해 영상을 제작할 수 있으며, 결과물 품질 또한 더욱 자연스럽고 사실적이다. 아울러 우수한 프롬프트 이행 능력으로 사용자 의도를 영상에 정확히 반영하며, 다양한 렌즈 효과, 영화적 기법 등을 학습해 제작자 창의성을 더욱 폭넓게 구현할 수 있다. 캐럿은 구글 승인을 받아 비오2의 정식 서비스 제공을 시작했다. 현재 비오2는 비공대 베타 테스트 단계로, 일부 기업에게만 제공하고 있다. 캐럿은 현재 720p 화질로 5초 영상 생성을 지원하지만, 향후 4K 화질, 최대 2분까지 수준을 높일 계획이다. 또한 비오2 탑재를 기념해 사용자를 대상으로 해당 기능을 7일까지 30% 할인가에 제공한다. 장진욱 패러닷 대표는 "캐럿이 국내 대표 AI 영상 플랫폼으로서 비오 2를 고객에게 선보일 수 있어 기쁘다"며 "앞으로도 사용자들이 글로벌 AI 콘텐츠 트렌드를 손쉽게 따라갈 수 있도록 최신 모델을 발빠르게 탑재하겠다"고 말했다. 캐럿은 이미지 및 영상 콘텐츠 제작을 특화시켰다. 현재 이마젠3, 플럭스 등 이미지 생성 모델 7개, 비오 2, 클링 등 영상 생성 모델 9개를 지원한다. 각 모델을 개별 구독할 필요 없이 캐럿에서 제공하는 멤버십에 가입하거나 포인트를 충전, 사용하는 일 만으로 합리적인 가격에 고품질 콘텐츠를 제작할 수 있다.

2025.03.31 08:44백봉삼

"삼성 TV는 AI 더한 세계 베스트셀러"

삼성전자가 미국 라스베이거스에서 열리는 세계 최대 전자 전시회 'CES 2025' 개막에 앞서 공개한 TV를 '인공지능(AI)이 더해진 세계 베스트셀러'라고 미국 블룸버그통신이 평가했다. 블룸버그는 6일(현지시간) 삼성전자는 '비전 AI'라는 브랜드로 TV에 새로운 인공지능 기능을 추가해 인공지능 시장을 공략하고 있다며 이같이 보도했다. 삼성전자는 사용자의 취향·의도를 파악해 개인에게 맞춘 서비스를 제공하는 TV를 전날 선보였다. ▲영상을 보면서도 한 번 클릭하면 사용자가 원하는 정보를 알 수 있는 '클릭 투 서치' ▲외국어 영상의 자막을 실시간으로 우리말로 바꿔주는 '실시간 번역' ▲사용자 취향과 선호도를 반영해 이미지를 만드는 '생성형 배경화면' 등 기능을 공개했다. 삼성전자는 20년 동안 세계에서 가장 많이 TV를 판 업체라며 다양한 회사와 협업해 비전 AI 제품을 늘릴 것이라고 블룸버그는 분석했다. 삼성전자는 마이크로소프트와 구글 등 기업들과 손잡고 AI 서비스를 제공하기로 했다.

2025.01.06 17:20유혜진

오픈AI '소라' 게임 콘텐츠 무단 활용 의혹…"법적 리스크 커"

오픈AI가 최근 출시한 비디오 생성 인공지능(AI) '소라'에 게임 콘텐츠를 훈련 데이터로 사용했다는 주장이 제기되면서 법적 문제가 우려되고 있다. 12일 테크크런치에 따르면 '소라'는 텍스트 프롬프트나 이미지를 기반으로 최대 20초 길이의 비디오를 생성할 수 있는 기능을 갖추고 있다. 이미 오픈AI는 '소라'를 시연할 때 훈련에 유명 비디오게임 마인크래프트의 플레이 영상을 사용했다고 밝혔으며 전문가들은 다른 게임 콘텐츠도 훈련 데이터로 포함됐을 가능성이 높다고 분석했다. 실제로 '소라'는 닌텐도 게임인 '슈퍼마리오 브라더스'나 유명 1인칭 슈팅 게임인 '콜오브듀티' 스타일의 영상을 생성할 수 있다. 이와 함께 유명 트위치 스트리머의 외모를 반영한 캐릭터도 만들어내고 그의 문신을 복제하는 등 저작권 문제가 불거질 소지가 큰 것으로 나타났다. 법률 전문가들은 오픈AI가 무단으로 게임 플레이 영상을 사용했을 경우 저작권 침해 소송에 직면할 수 있다고 경고했다. 특히 게임 콘텐츠에는 개발사 뿐만 아니라 스트리머 등 여러 이해관계자가 얽혀 있어 저작권 관련 법적 리스크가 크다. 오픈AI는 훈련 데이터 출처에 대해 명확히 밝히지 않고 있으며 공공 데이터와 라이센스 데이터를 활용했다고만 언급했다. 지적재산권 변호사인 조슈아 와이겐스버그는 "비디오 게임 플레이 영상을 무단으로 사용하는데는 많은 리스크가 있다"고 밝혔다.

2024.12.12 11:27조이환

영상 생성AI '소라' 나오자...中 바이트댄스·텐센트 반격

미국 오픈AI의 영상 생성 인공지능(AI) 서비스 '소라'가 출시되면서 중국 기업들의 영상 생성 서비스도 속도를 내고 있다. 10일 중국 바이트댄스는 자사 초거대 AI 챗봇 더우바오의 PC 버전을 내놓으면서 영상 생성 모델 '픽셀댄스(PixelDance)'의 내부 테스트를 시작하고 일부 사용자에게 공개했다. 사용자들은 하루에 무료로 10개 영상을 생성할 수 있다. 픽셀댄스는 지난 9월 처음 발표됐으며, 더우바오 영상 생성 초거대 모델을 기반으로 하고 있다. 아직 테스트 단계이긴 하지만 고급 카메라 모션 및 각종 영상 효과를 지원한다. 관계자에 따르면 약 10초 영상을 생성하면서 3~5개의 효과를 적용하는 경우 최적의 영상을 만들 수 있다고 소개됐다. 이달 초 중국 텐센트도 '훈위안 영상 생성 모델(HunYuan-Vieo)' 기반 영상 생성 기능을 내놨다. 130억 매개 변수를 가진 이 모델은 중국어와 영어 입력을 통한 영상 생성을 지원하며, 개인 사용자 혹은 기업 고객이 신청을 통해 사용해볼 수 있다. 텐센트는 이 매개 변수가 업계 최대 수준이며, 5초 짜리 영상을 생성할 수 있다고 소개했다. 이뿐 아니라 지난 3일엔 중국 국유 통신사 차이나텔레콤의 AI 연구소인 '텔레AI(TeleAI)'도 자사 싱천 초거대 모델 기반의 영상 생성 모델을 공개했다. 이 모델은 중국 국유 기업이 개발한 첫 영상 생성 모델로도 관심을 모았다. 바이트댄스와 텐센트, 차이나텔레콤뿐 아니라 앞서 중국 콰이서우, 센스타임, 미니맥스 등 기업도 AI 영상 생성 플랫폼을 공개한 바 있다. 중국 동영상 플랫폼 콰이서우가 내놓은 영상 생성 초거대 모델 '클링(KLING)'은 최대 2분짜리(30fps 주사율) 1080P 영상을 만들 수 있다.

2024.12.11 08:17유효정

"동영상 생성 AI 최강자 떴다"…오픈AI '소라' 출시에 빅테크도 일자리도 '충격'

동영상 생성 인공지능(AI) 최강자로 지목된 오픈AI의 '소라'가 드디어 모습을 드러내며 구글, 메타 등 경쟁자들을 긴장시키고 있다. 텍스트만으로도 빠른 시간 내에 원하는 동영상을 간편하게 만들 수 있다는 점에서 일자리 위협을 느낀 예술가들의 반발도 더 커지는 모양새다. 10일 업계에 따르면 오픈AI는 지난 9일(현지시간) 온라인 행사를 통해 '소라'를 정식 출시한다고 발표했다. 지난 2월 처음 공개한 후 10개월 만으로, 그간 일부 이용자들을 대상으로 테스트를 한 후 문제점을 보완해 왔다. 공개 됐을 당시 도쿄 밤거리를 걷고 있는 여성의 다리가 불안정하게 움직이는 등 환각 현상이 발견된 바 있다. '소라'는 이용자가 글로 프롬프트(명령어)를 넣으면 동영상을 생성해주는 AI로, 생성되는 동영상의 길이는 최대 20초다. 당초 최대 1분 길이의 동영상을 빠르게 제작할 수 있다고 오픈AI가 밝혔던 것에 비해선 상당히 시간이 줄었다. 이에 대해 오픈AI는 "최대한 많은 사람들이 소라에 접근할 수 있도록 하기 위해 성능과 확장성 사이의 균형을 맞춘 것"이라고 설명했다. '소라'는 텍스트뿐 아니라 이미지, 동영상에서 영감을 받아 동영상을 생성하는 것은 물론, 기존 동영상을 확장하거나 빠진 프레임을 채우는 '스토리보드' 기능도 제공한다. 오픈AI가 공개한 '우주에 떠 있는 토끼(a rabbit floating in outer space)'라는 프롬프트로 만든 데모 시연 영상에선 약 7초만에 5초짜리 동영상이 만들어져 이목을 집중시켰다. 만든 영상이 마음에 들지 않으면 프롬프트를 수정하거나 스토리보드를 고치면 된다. '소라'는 구글이 올해 1월 공개한 생성 AI 모델 '루미에르'가 단 5초 분량의 영상물을 제작해주는 것에 비해 월등한 기술력을 갖고 있다는 평가를 받고 있다. 이날부터 한국을 포함한 대부분의 국가에서 사용할 수 있지만 영국, 스위스, 유럽경제지역(EEA)은 이번에 출시가 제외됐다. 이는 이들 지역에서 테크 기업에 대한 규제가 강화하고 있는 데 따른 것으로, 영국 등에서의 정식 출시 일정은 미정이다. '소라'는 현재 '챗GPT 플러스', '챗GPT 프로'에 포함돼 기존 유료 이용자들은 이 동영상 AI 모델 이용에 대한 추가 비용을 지불할 필요 없이 이용할 수 있다. 월 20달러를 지불하는 '챗GPT 플러스' 이용자들은 매월 50개(480p 또는 그 이하 해상도), 월 200달러인 '챗GPT 프로' 구독자들은 매월 500개의 영상을 생성할 수 있다. 챗GPT 팀, 엔터프라이즈, 에듀 계정에선 소라를 쓸 수 없다. 이번 일로 동영상 생성 AI 시장 경쟁은 과열되는 분위기다. 지난해 11월에는 스태빌리티 AI가 '스테이블 비디오 디퓨전'을, 올해 1월에는 마이크로소프트(MS)가 비디오 프레임의 움직임을 조작하는 동영상 생성 모델 '드래그누와'를 선보였다. 바이트댄스는 '매직비디오-V2'를, 애플도 2월 대형언어모델(LLM)을 활용해 동영상을 생성하는 '키프레이머'를 내놨다. 오픈AI가 올해 2월 '소라'를 선보인 후에는 구글 동영상 생성 AI '비오(Veo)'와 중국 콰이쇼우 '클링', 미국 루마 AI '드림 머신', 런웨이 '젠-3 알파', 메타 '무비 젠' 등이 지금까지 공개됐다. 어도비도 지난 10월 '어도비 맥스' 행사에서 파이어 플라이 기반 동영상 AI를 발표하며 경쟁에 합류했고, 아마존도 이달 초 '리인벤트' 행사를 통해 동영상 생성 AI '노바 릴'을 처음 선보였다. 이에 따라 유튜브는 내년부터 동영상 생성 AI '비오'를 활용해 유튜브 쇼츠 영상을 만들 수 있게 할 계획이다. 메타는 '무비 젠'이 만든 AI 동영상을 인스타그램 등 SNS와 연계할 수 있도록 할 예정이다. 사용자들은 AI를 사용해 실감나는 릴스(인스타그램을 통해 공유할 수 있는 15초 이내 분량의 짧은 동영상)를 직접 만들어낼 수 있고 페이스북, 왓츠앱, 스레드 등 메타의 다른 SNS 플랫폼에도 공유할 수 있게 된다. 파이낸셜타임스(FT)는 "메타의 무비 젠 AI 동영상 모델은 할리우드 영화 제작사, 동영상 콘텐츠 크리에이터, SNS 인플루언서들의 창조 작업용 툴로 사용되기를 원하고 있다"며 "메타는 영화 등 예능, 오락산업, 광고를 넘어 보다 광범위한 산업 분야에서 수익 창출 모델을 발굴하려고 하고 있다"고 분석했다. 이처럼 본격적인 동영상 생성 AI 시대가 열리면서 영상 관련 산업은 큰 변화를 맞게 됐다. 영화, 애니메이션, 증강현실(AR) 및 가상현실(VR) 등 다양한 분야에서 활용할 수 있게 되면서 일자리를 위협 받는 이들도 상당해질 것으로 예상된다. 실제 소니픽처스는 영화 제작 비용을 줄이기 위해 생성형 AI를 적극 활용하겠다고 공개적으로 밝힌 바 있다. 이미 코카콜라의 최근 홀리데이 캠페인과 같은 광고에선 AI로 제작된 콘텐츠가 등장하고 있다. 영화 CG 일러스트레이터인 리드 사우든은 "2022년 미드저니(이미지 생성 AI)가 처음 나왔을 때 우리는 '귀엽다'며 비웃었다"며 "하지만 이제 사람들은 생성 AI 때문에 일자리를 잃고 있다"고 말했다. 이에 지난해 미국 할리우드에선 배우와 작가를 중심으로 생성형 AI 활용에 대항하기 위해 파업을 벌이기도 했다. 자칭 '소라 PR(대외홍보) 퍼펫'이라고 부르는 예술가 그룹은 지난달 26일 오픈AI '소라'에 접속할 수 있는 프로그래밍 인터페이스(API)를 온라인에 공개하며 반발하는 모습을 보였다. 업계 관계자는 "오픈AI '소라'가 등장하며 많은 기업들에게 동영상 생성 AI 모델에 대한 강력한 동기가 생겼다"며 "여러 모델들이 한꺼번에 풀리면서 산업계, 특히 미디어 시장에 엄청난 반향을 일으킬 것으로 보인다"고 밝혔다. 일각에선 딥페이크 문제에 대해서도 우려하고 있다. AI 기술로 유명인들의 얼굴을 합성해 정교한 가짜 영상을 만드는 것이 쉬워졌기 때문이다. 이에 오픈AI는 레드팀(취약점을 발견해 AI 안전성을 검증하는 팀)을 만들어 딥페이크를 방지하기 위해 나섰다. 또 '소라'로 생성된 모든 동영상에 C2PA(콘텐트 출처 및 진위 확인을 위한 연합) 표준 AI 워터마크를 넣어 AI가 생성한 콘텐츠임을 알 수 있도록 했다. 로한 사하이 오픈AI 엔지니어링 리드는 "도널드 트럼프 대통령 같은 주요 정치인이나 공적 인물은 생성이 차단된다"며 "잘못된 정보의 확산을 방지하려고 노력하고 있다"고 말했다.

2024.12.10 09:21장유미

"o1·소라 첫선 보일까"…오픈AI, 연말 12일간 AI 기술 공개 '대장정'

오픈AI가 크리스마스 시즌 동안 새로운 제품과 서비스를 선보이며 기술 혁신의 장을 연다. 5일 더버지에 따르면 오픈AI는 총 12일간 매일 새로운 기능, 제품, 데모를 발표할 계획이다. 발표에는 영상 생성 인공지능(AI) 도구 '소라(Sora)'와 추론 모델 'o1'의 풀 버전이 포함될 가능성이 높은 것으로 알려졌다. 샘 알트먼 오픈AI 대표는 최근 뉴욕타임즈 주최 딜북 컨퍼런스에서 "12일간의 발표를 준비 중"이라고 밝히며 이를 공식 확인했다. 다만 구체적인 발표 내용이나 일정은 언급하지 않았다. '소라'는 텍스트를 기반으로 고품질 비디오를 생성할 수 있는 AI 도구로, 거대 언어 모델의 확장판으로 알려져 있다. 이 도구는 올해 중 동안 일부 아티스트를 대상으로 알파 테스트가 진행됐으며 연말 출시를 목표로 개발 중이다. 발표를 앞두고 오픈AI 직원들도 소셜 미디어를 통해 기대감을 드러냈다. 한 기술 부서 담당자는 "크리스마스 소원 목록에 무엇을 적었나요"라는 포스트를 올렸고 다른 직원은 "트리를 막 세울 시간에 맞춰 돌아왔다"고 말했다. 알트먼 대표는 자신의 X 계정을 통해 "내일 태평양 시간 오전 10시부터 매주 평일마다 발표와 데모가 진행될 예정"이라며 "멋진 것들을 공유할 예정이니 기대해달라"고 말했다.

2024.12.05 13:06조이환

AI 영상 생성 모델 '소라' 유출 논란…예술가들 오픈AI에 반격

오픈AI의 동영상 생성 인공지능(AI) '소라'가 정식 오픈 전에 유출돼 혼란을 빚고 있다. 일자리에 위협을 느끼고 있는 예술가들이 오픈AI의 움직임이 반발해 '소라'에 대한 접근 권한을 유출시켰기 때문이다. 27일 테크크런치에 따르면 자칭 '소라 PR(대외홍보) 퍼펫'이라고 부르는 예술가 그룹은 지난 26일 오픈AI '소라'에 접속할 수 있는 프로그래밍 인터페이스(API)를 온라인에 공개했다. 이들은 조기 접근 시스템에서 가져온 것으로 추정되는 인증 토큰을 사용해 이용자가 '소라'로 비디오를 생성할 수 있는 프론트엔드를 만들었다. 이들은 AI 개발 플랫폼인 '허깅 페이스'에 소라를 사용해 볼 수 있도록 API를 게시했다. 이를 통해 테스터가 아닌 일반인들도 사실상 소라의 기능을 미리 써볼 수 있게 됐다. 다만 미국 동부시각 기준 정오부터 접근이 중단됐다. 이번 일로 수 많은 이용자들은 '소라'를 통해 1천80p 고해상도의 10초짜리 영상을 제작해볼 수 있었다. 이용자들이 한꺼번에 몰리면서 서비스를 이용할 때 대기자까지 발생한 것으로 알려졌다. 이후 소셜미디어에 올라간 결과물들은 오픈AI의 워터마크가 삽입돼 있어 눈길을 끌었다. '소라'는 지난 2월 오픈AI가 공개한 동영상 생성 AI 모델로, 텍스트만 입력하면 최대 1분 분량의 영상 제작이 가능하다. 구글이 올해 1월 공개한 생성 AI 모델 '루미에르'가 단 5초 분량의 영상물을 제작해주는 것에 비해 월등한 기술력이란 평가를 받고 있다. 덕분에 유튜브·틱톡 등에서 인기를 끌고 있는 1분 미만의 짦은 영상(숏폼) 제작에 용이하다. 콘텐츠만 있으면 누구나 영상 크리에이터가 될 수 있는 환경이 마련된 것이다. 하지만 영상 제작 관련 업종에 종사하는 이들에게는 위협이 되고 있다. 간단한 명령어 몇 마디로도 디즈니 애니메이션이나 할리우드 영화에서나 나올 듯한 영상을 순식간에 만들 수 있어서다. 특히 할리우드의 단역 배우, 촬영 스태프, 작가 등의 일자리를 빼앗을 수 있다는 우려가 커지고 있다. 이에 오픈AI는 '소라'를 바로 출시하지 않고 기능을 보완하기 위해 일부 예술가들을 대상으로 테스트만 진행해왔다. 샘 알트먼 오픈AI 최고경영자(CEO)는 지난 1일 레딧에서 열린 AMA(Ask Me Anything) 채팅 행사에서 '소라'와 관련해 "모델을 완성하고 안전 및 딥페이크 문제를 처리하고 컴퓨팅을 확장해야 하는 문제로 출시가 지연되고 있다"고 설명했다. 하지만 이번에 '소라 PR 퍼펫'이란 예술가 그룹이 API를 공개해버리면서 다소 난감해졌다. 테스트를 진행한 예술가들은 오픈AI가 '소라'에 대한 긍정적인 이야기를 퍼뜨리라고 압력을 가하고 있다고 주장하며 불만을 드러내기도 했다. 또 익명으로 활동했던 이들은 '소라' 접근권이 공개된 이후 청원서와 함께 자신들과 함께할 예술가들의 서명을 받기 시작했다. 이들은 "수 백명의 아티스트가 1천500억 달러 규모의 회사를 위해 버그 테스트, 피드백, 실험작 제작 등의 무급 노동을 제공하고 있다"며 "우리의 작업에 오픈AI가 공정한 보상을 하지 않고 있다"고 주장했다. 오픈AI는 그동안 테스터들을 엄격하게 통제하고 '소라'로 만들어진 결과물을 공유하기 전에 승인을 받도록 조치한 것으로 알려졌다. 일각에선 오픈AI가 예술가들의 작품을 통제하는 것을 두고 '소라'의 개발 속도가 느려졌기 때문이라는 분석을 내놨다. '소라' 개발을 이끈 책임자 중 한 명인 팀 브룩스가 지난 10월 오픈AI를 떠나면서 생성된 영상에서 캐릭터의 일관성을 유지하는데 오류가 여전한 것으로 전해졌다. '소라'는 공개 당시 도쿄 밤거리를 걷는 여성의 영상을 생성했지만 다리가 불안정하게 움직이는 모습이 포착돼 눈길을 끈 바 있다. 예술가들은 "우리는 예술도구로서의 AI를 반대하지 않는다"며 "예술가들에 대한 대우가 어떻게 형성되는지, 이 도구로 만들어지는 결과물이 어떻게 확산되는지에 대한 뚜렷한 답이 없어 반대하는 것"이라고 밝혔다. 이에 대해 오픈AI는 "수백 명의 예술가들이 '소라'를 쓰고 있고 기밀 정보를 공유하지 않는 것 외에는 주어진 의무가 없다"고 반박했다. 다만 오픈AI는 어떤 세부 정보가 '기밀'로 취급되는지는 설명하지 않았다. 테크크런치는 "이번 사태는 오픈AI의 '아트워싱'에 항의하기 위한 것"이라며 "예술 단체와 AI 기업의 갈등이 보다 심해지고 있다"고 분석했다.

2024.11.27 10:09장유미

시놀로지 "생성 AI·DX 시대에 자원 부족한 IT 파트너 도울 것"

"생성 AI와 디지털 전환으로 경쟁이 치열해진 오늘날 비용 최적화, 운영 간소화를 통한 효율 향상 중요성이 커졌습니다. 시놀로지는 이런 환경에서 한정된 예산과 인력으로 운영하는 IT 부서 담당자가 이상적인 환경을 구축하도록 돕고 있습니다." 15일 오후 더케이호텔 서울에서 진행된 '시놀로지 솔루션 데이 2024' 행사에서 조앤 웡(Joanne Weng) 시놀로지 국제 사업 총괄이 생성 AI와 디지털 전환 시대 비용 효율화된 자사 신제품을 소개하면서 이같이 설명했다. 시놀로지 솔루션 데이는 고객사와 협력사 관계자, 전문가를 대상으로 시놀로지 스토리지 제품과 소프트웨어 솔루션, 서비스를 소개하는 행사다. 국내에서는 작년 11월 초순 이후 두 번째 진행됐다. 이날 시놀로지는 일체형 백업 솔루션인 액티브프로텍트 어플라이언스, 스케일 아웃 스토리지 솔루션, 클라우드 기반 영상감시 솔루션 'C2 서베일런스 스테이션', 생성 AI를 접목한 협업 솔루션인 시놀로지 오피스 등 향후 출시할 신제품을 대거 소개했다. ■ 비인가 로그온 막는 SSO 솔루션 'C2 아이덴티티' 석미은 시놀로지 시니어 세일즈 매니저는 "현재 IT 부서가 가장 걱정하는 것은 랜섬웨어 공격과 데이터 침해이며 이를 막으려면 비인가 접속 차단과 신속한 데이터 복구, 데이터 유출을 막는 이중 보호 전략이 필요하다"고 설명했다. 시놀로지 서비스인 C2 아이덴티티는 자체 서비스와 1천개 이상의 외부 서비스형 소프트웨어(SaaS), 내부 서비스 로그인 관리를 돕는다. 직원 입사·퇴사시 여러 서비스 로그온 권한을 간단히 부여·회수할 수 있다. 비밀번호 입력 없이 스마트폰 전용 앱 '시큐어 사인인'의 안면·지문인식, FIDO2 프로토콜을 지원하는 물리 키로 로그온한다. 복잡한 비밀번호를 일일이 외우는 대신 비밀번호 관리자 기능을 이용해 클라우드에 저장된 정보로 로그온 가능하다. 석미은 매니저는 "C2 아이덴티티에 저장된 비밀번호 관련 데이터는 AES-256 종단간 암호화로 저장되며 시놀로지도 접근할 수 없다. 무차별 대입 방식 공격도 방어 가능하며 비밀번호가 네트워크로 직접 전달되지 않아 중간자 공격도 막는다"고 설명했다. ■ 액티브프로텍트, 중앙 집중 백업·중복 제거 기능 탑재 시놀로지는 지난 6월 전용 백업 소프트웨어와 하드웨어를 결합한 기업용 어플라이언스 '액티브프로텍트'(ActiveProtect)를 공개했다. AMD 2세대 에픽(EPYC) 7272 프로세서와 DDR4 64GB ECC 메모리, 140TB 스토리지를 내장했다. 석미은 매니저는 "백업은 사이버 공격의 최후 방어선이지만 자체 조사 결과 실제 복구가 필요한 상황에서 백업 플랜을 계획대로 이행할 수 있는 업체는 약 20% 미만으로 나타났다"고 설명했다. 이어 "액티브프로텍트는 가상머신과 개인 PC, 클라우드 서비스의 데이터를 중앙 집중 백업하며 각 사이트(site) 별 백업을 통합하고 중복 제거 기술을 활용해 효율적 백업을 돕는다"고 밝혔다. 액티브프로텍트는 필요한 인원이 필요한 백업 데이터에만 접근할 수 있도록 철저한 다중 권한 기능을 부여했다. 백업된 가상머신은 내장 하이퍼바이저로 정상 여부를 자동 검증하고 백업된 데이터가 악성코드나 부주의로 손상되지 않도록 보호한다. ■ 자체 클라우드 기반 오피스 스위트에 올 연말 AI 기능 추가 시놀로지는 NAS(네트워크 저장장치)의 자유로운 백업·저장공간 특성을 살려 외부 클라우드 없이 오피스 문서와 이메일, 일정 관리, 기업용 메신저를 운용할 수 있는 오피스 스위트를 무료로 제공하고 있다. 이날 셸리 추 시놀로지 어카운트 매니저는 "시놀로지 오피스 스위트는 NAS의 용량이 허락하는 한 기업 내 데이터를 완전 무제한 저장 가능하며 구독료가 필요없다. 이런 특성으로 지난 해 전세계 이용자는 20%, 월간 이용자 수는 24% 성장했다"고 설명했다. 이어 "올 연말 경 오피스 스위트에 문서 요약, 초안 작성, 번역과 요약 등 생성 AI 기반 기능이 추가되며 잘못된 정보로 인한 환각 현상을 막는 RAG(검색증강생성) 기능도 추가된다"고 설명했다. 오픈AI, 구글 제미나이 등 외부 AI 모델 활용을 위한 프롬프트 생성시 이름이나 전화번호, 사회보장번호(SSN), 주민등록번호 등 개인을 식별할 수 있는 민감 정보가 포함되는 것을 막는 비식별화 기능도 탑재 예정이다. ■ 영상 데이터 클라우드에 직접 전송하는 IP 카메라 시놀로지는 NAS 전용 운영체제 DSM(디스크스테이션매니저)에 IP 카메라의 영상을 저장하고 분석하는 솔루션인 '서베일런스 스테이션'을 제공한다. 지난 해 9.0으로 업데이트를 거치며 자동차 번호판 인식, 지정 구역 혼잡도 알림, 침입 탐지 등 기능을 추가했다. 셸리 추 매니저는 "서베일런스 스테이션은 영상 데이터 손실을 막는 이중화 솔루션, 사람 얼굴을 흐리게 만드는 프라이버시 마스크, 영상 유출을 막는 워터마크 기능, 비인가 접속을 막는 다중 인증 등을 내장했다"고 설명했다. 이어 "NAS를 직접 설치하기 힘든 환경에서 영상 데이터를 클라우드 기반 'C2 서베일런스'로 자동 전송하는 카메라 2종을 출시할 것이다. 영상 데이터는 단대단 암호화되며 마이크로SD카드를 이용한 영상 백업으로 영상 유출을 막는다"고 덧붙였다. ■ 한국 내 비즈니스 부문 매출 2019년 대비 2배 성장 시놀로지는 현재 국내 시장에서 방송국과 연구소, 물류 기업 등 대형 고객사를 확보하며 시장 점유율을 꾸준히 늘리고 있다. 2019년 이후 국내 비즈니스 부문 매출은 두 배 가량 성장했다. 조앤 웡 시놀로지 국제 사업 총괄은 "기업 내 IT 부서 중 상당수가 예산 제약 속에서 사업 연속성 확보와 재해 복구 전략에 어려움을 느끼고 있다"며 "그러나 시놀로지와 각 국가별 채널 파트너는 여러 기업의 경쟁력 강화에 기여했다"고 밝혔다. 이어 "시놀로지 목표는 IT 부서를 강화하고 산업을 견고하게 만드는 것이며 이를 위해 안정적이고, 안전하며 비용 효율적인 솔루션을 지속 공급할 것"이라고 덧붙였다.

2024.10.16 09:06권봉석

[영상] "오픈AI '소라'보다 낫다"…메타, '무비 젠'으로 동영상 생성 AI 시장 흔들까

오픈AI가 만든 '소라'에 맞서 동영상 생성 인공지능(AI) 모델들이 쏟아지고 있는 가운데 '페이스북' 모회사 메타 플랫폼이 우수한 기술을 앞세워 최근 새로운 무기를 공개해 주목 받고 있다. 6일 업계에 따르면 메타는 지난 4일 공식 블로그를 통해 동영상 생성 AI 모델 '무비 젠(Movie Gen)'을 공개했다. 영상은 물론 오디오를 동시에 생성하는 것이 특징으로, 영상 중 일부분만 편집할 수 있는 등 강력한 기능도 갖추고 있다. '무비 젠'은 텍스트 입력으로 최대 16초 길이의 새 동영상을 만들 수 있다. 기존 동영상을 편집할 수도 있고 오디오를 생성할 수도 있으며 사진을 사용해 실제 인물이 등장하는 맞춤형 동영상도 만들 수 있다. 메타는 이번 연구가 2022년 공개한 '메이크 어 신(Make-A-Scene)', '메이크 어 비디오(Make-A-Video)' 등을 통해 쌓은 노하우를 반영했다고 강조했다. 더불어 하마가 물속에서 헤엄치고 코알라가 서핑을 즐기는 한편, 남극의 펭귄이 옷을 갈아입는 등 '무비 젠'을 이용한 만든 동영상도 공개했다. 메타는 "할리우드에서 성공하기를 희망하는 영화 제작자 지망생이든, 동영상 제작을 즐기는 크리에이터이든, 누구나 창의력을 향상시키는 데 도움이 되는 도구를 이용할 수 있어야 한다고 생각한다"고 설명했다. 기능은 이제까지 등장한 영상 모델 중 가장 강력한 편으로 평가된다. 최대 16FPS로 16초짜리의 사실적이고 개인화된 HD 비디오와 48kHz 오디오를 제작할 수 있으며 비디오 편집 기능도 제공한다. '무비 젠'은 일부 내부 직원과 일부 영화 제작자를 포함한 소수의 외부 파트너에게만 우선 제공된다. 메타는 내년에 인스타그램과 왓츠앱, 메신저 등 자사의 소셜미디어 앱에 탑재할 계획이다. 이번 일로 동영상 생성 AI 시장 경쟁은 과열되는 분위기다. 올해 2월 오픈AI가 '소라(Sora)'를 선보인 이후 구글 동영상 생성 AI '비오(Veo)'와 중국 콰이쇼우 '클링', 미국 루마 AI '드림 머신', 런웨이 '젠-3 알파' 등이 지금까지 공개됐다. 오픈AI의 '소라'는 최대 1분 길이의 동영상을 제작할 수 있으며 연내 일반인들도 이용할 수 있을 것으로 예상된다. 구글도 '비오'를 조만간 출시할 예정이다. 런웨이는 지난 7월부터 마케팅과 광고 등 콘텐츠 제작자를 대상으로 '젠-3 알파'를 유료로 제공하고 있다. 앞서 지난해 11월에는 스태빌리티 AI가 '스테이블 비디오 디퓨전'을 선보였다. 올해 1월에는 마이크로소프트(MS)가 비디오 프레임의 움직임을 조작하는 동영상 생성 모델 '드래그누와'를, 바이트댄스는 '매직비디오-V2'를 공개했다. 애플도 2월 대형언어모델(LLM)을 활용해 동영상을 생성하는 '키프레이머'를 내놨다. 이 같은 상황 속에 메타는 "'무비 젠'이 작업 전반에서 업계 유사 모델보다 우수한 성능을 보였다"며 경쟁사들을 겨냥했다. 코너 헤이즈 메타 생성형 AI 제품 부사장은 "더 많은 사람이 동영상 게시물을 만들거나 편집하도록 장려하는 것이 목표"라고 말했다. 업계 관계자는 "오픈AI '소라'가 등장하며 많은 기업들에게 동영상 생성 AI 모델에 대한 강력한 동기가 생겼다"며 "여러 모델들이 하반기에 한꺼번에 풀리면 산업계, 특히 미디어 시장에 엄청난 반향을 일으킬 것으로 보인다"고 말했다.

2024.10.06 10:29장유미

딥페이크 범죄 '급증'…글로벌 테크 기업 대응 나섰다

최근 딥페이크 성범죄와 허위 뉴스 영상 제작이 급격히 증가하면서 이를 탐지·대응하는 기술이 주목받고 있다. 국내외에서 딥페이크 범죄가 사회적 문제로 떠오르자 관련 기업들의 움직임에 대한 시장 기대감이 높아지고 있다. 19일 업계에 따르면 경찰은 올해 500건 넘는 딥페이크 사건을 수사 중이며 특히 10대들이 연루된 사례가 급증하고 있다. 국내외 가해자들은 텔레그램 등 익명성이 보장된 플랫폼을 통해 음란물을 유포하고 있으며 주로 여성인 피해자들이 심각한 피해를 입고 있다. 해외에서도 상황은 심각하다. 유로뉴스에 따르면 유럽에서 제작된 딥페이크 영상 96%가 여성과 청소년을 대상으로 한 음란물이다. 미국에서는 최근 스칼렛 요한슨과 테일러 스위프트 등 유명인들이 딥페이크 포르노의 피해자가 되기도 했다. 딥페이크 음란물뿐만 아니라 가짜뉴스로 인한 문제도 부각되고 있다. 정치인이나 공공 인물의 발언을 조작하거나 허위 정보를 담은 영상을 제작해 유포하는 사례가 증가하고 있기 때문이다. 지난 2022년 국내 지방 선거 당시 윤석열 대통령이 특정 후보를 지지하는 딥페이크 영상이 퍼져 큰 논란이 된 바 있다. 이와 관련해 딥페이크 선거 사용 방지법이 지난 1월 통과됐지만 해외에서는 딥페이크를 통한 가짜뉴스 남용이 여전히 큰 문제가 되고 있다. 이런 상황에서 딥페이크 탐지 기술에 대한 수요가 급증하고 있다. 글로벌 시장조사업체 마켓앤마켓에 따르면 글로벌 딥페이크 탐지 시장은 지난 2022년 5억 달러(한화 6천500억원)였지만 오는 2027년에는 18억 달러(한화 2조3천400억원) 규모로 성장할 것으로 예상된다. 이미 마이크로소프트는 지난 2020년 AI와 머신러닝을 결합한 '비디오 인증기(Video Authenticator)'를 공개한 바 있다. 이 도구는 사진이나 비디오를 분석해 미디어가 조작되었을 가능성을 백분율로 나타내는 신뢰도 점수를 제공한다. 특히 실시간으로 동영상을 프레임 단위로 분석해 각 프레임에서 조작 가능성을 보여준다. 미국뿐 아니라 유럽 스타트업들도 이에 가세했다. 그 중 에스토니아의 센티넬 AI는 클라우드 기반 솔루션을 통한 실시간 딥페이크 탐지를 제공하는 것으로 알려졌다. 이 회사는 얼굴 랜드마크 분석과 시간적 일관성 등을 활용해 딥페이크를 식별한다. 특히 최근 딥페이크 탐지 경연대회에서 135만 달러의 상금을 획득하며 기술력을 인정받았다. 요하네스 타메캔드 센티넬 AI 대표는 자사 제품을 소개하며 "우리는 잘못된 디지털 기술의 활용이 민주주의에 가장 큰 위협 중 하나라는 것을 잘 알고 있다"며 "사회가 잘못된 정보에 빠지는 것을 막기 위해 최선을 다할 것"이라고 밝혔다. 네덜란드의 센시티 AI도 실시간 딥페이크 탐지 플랫폼을 제공하고 있다. 이 회사는 얼굴 조작, 음성 합성, 전신 조작 등 다양한 유형의 딥페이크를 식별하며 인공지능(AI) 기반 분석으로 조작된 미디어의 출처를 추적한다. 조르지오 파트리니 센시티 AI 대표는 "딥페이크 기술의 발전 속도가 매우 빠르기 때문에 우리의 탐지 시스템도 지속적으로 진화해야 한다"며 "디지털 미디어 생태계의 신뢰성을 유지하는 것이 우리의 목표"라고 말했다. 이렇게 유럽에서 딥페이크 탐지 기술이 발전한 것은 민주주의와 인권이 딥페이크 위협에 직접적으로 노출되었기 때문이라고 전문가들은 지적한다. 개인정보 보호를 중요시하는 유럽의 규제 환경이 딥페이크 기술 오용에 대한 경각심을 높였다는 것이 이들의 분석이다. 국내에서도 다양한 테크 기업들이 딥페이크의 폐해를 예방하기 위해 노력을 기울이고 있다. 특히 라온시큐어는 올 하반기에 개인이 쉽게 딥페이크 여부를 체크할 수 있는 탐지 서비스를 자사의 개인용 모바일 백신 애플리케이션에 탑재할 계획이다. 라온시큐어의 딥페이크 탐지 기술은 합성된 얼굴과 정상 얼굴을 각각 학습해 이를 상호 비교 분류할 수 있도록 AI를 학습시킨다. 이미지부터 동영상, 안면 추출, 주파수 계열 변환 등 다양한 기술을 적용해 생성형 AI의 특징을 탐지한다. 이때 딥페이크 탐지 정확도를 높이기 위해 여러 모델을 동시에 사용한다. 특정 학습 유형에 맞춰 설계된 각각의 모델이 따로 존재하기 때문에 한 가지 모델에 의존했을 때 발생하는 탐지 정확도 저하를 방지할 수 있다. 이를 통해 얼굴의 부자연스러운 형태· 움직임·오디오 등을 종합적으로 분석해 더욱 정교한 탐지가 가능할 것으로 전망된다. 박현우 라온시큐어 AI연구센터장은 "딥페이크가 보편 기술이 돼 이를 악용한 범죄가 퍼지는 와중에 간편하게 딥페이크 여부를 탐지할 수 있는 기술도 보편화돼야 한다"며 "자사 보안 앱인 '라온 모바일 시큐리티'에 딥페이크 탐지 기능을 탑재하는 등 모든 개인들을 위한 잠재적 피해 예방에 매진하겠다"고 강조했다. 딥브레인AI도 '딥페이크 탐지 솔루션'을 개발해 주목받고 있다. '딥페이크 탐지 솔루션'은 사진의 경우 12분, 짧은 영상은 57분 내에 딥페이크 여부를 판별할 수 있다. 이미지와 비디오를 픽셀 단위로 분석하고 음성은 주파수, 시간, 노이즈 등 다양한 요소를 종합적으로 고려해 탐지하는 것으로 알려졌다. 이렇게 국내 기업들이 약진하는 가운데 딥페이크 방지 기술의 개발만으로 실제 범죄를 완전히 막기에는 한계가 있다는 지적도 나온다. AI 기술이 기하급수적으로 발전하고 있기 때문이다. 익명을 요청한 국내 AI 기업 관계자는 "딥페이크 기술은 계속해서 발전하고 있어 탐지 기술만으로는 완벽한 대응이 어렵다"며 "기술의 오용을 막기 위한 사회적 합의와 강력한 처벌 등이 병행돼야 한다"고 강조했다.

2024.09.19 17:40조이환

中 'AI로 만든 영화' 나온다...감독 9명 참여

중국에서 초거대 생성형 인공지능(AI) 모델을 이용한 영화가 제작된다. 9일 중국 언론 중궈신원왕에 따르면 중국 숏클립 플랫폼 '콰이서우'는 '클링 AI(Kling AI) 감독 공동 창작 계획'에 착수한다고 밝혔다. 중국산 영상 생성 초거대 모델 기술로 영화 콘텐츠를 제작하는 프로젝트다. 계획에는 리샤오훙, 자장커, 예진톈, 쉐샤오뤼, 위바이메이, 둥룬녠, 장츠위, 왕쯔추안, 왕마오마오 등 9명의 유명 감독이 참여하는데, AI 기술을 써서 9편의 AIGC(AI 생성 콘텐츠) 단편영화를 제작한다. 이 9편의 단편 영화는 모두 콰이서우의 대규모 영상 생성 모델인 '클링 AI'로 제작된다. 감독이 전적으로 영상 생성 모델에만 의존하게 된다. 물리적 세계 시뮬레이션, 컨셉 생성 및 조합에 클링 AI를 활용하고, 클링 AI로 영상 이미지를 생성해 3분 길이의 단편 영화 9편을 선보일 예정이다. 콰이서우에 따르면 9명의 감독은 다양한 스타일의 영상 제작 경험을 보유했으며, 영화, TV 시리즈, 애니메이션, 만화 등 분야에서 누적 흥행액이 200억 위안(약 3조 7천700억 원)을 넘는다. 영화 제작에는 AIGC 크리에이터 9명도 기술 컨설턴트로 감독들을 지원하게 된다. 클링 AI는 콰이서우가 올해 6월 발표한 영상 생성 초거대 모델로서 발표 직후 오픈AI의 '소라'에 비견되는 중국판 영상 생성 모델로 평가됐다. 텍스트 입력을 통해 1080P의 2분 길이(30fps) 영상을 생성할 수 있다고 소개됐는데, 올해 8월 기준 출시 3개월 만에 이미 160만 명이 클링 AI를 사용해 1천600만 개 이상의 영상을 생성했다. 누적 생성 이미지 수도 2천500만 개에 달한다. 콰이서우는 7월 24일 전 세계 사용자에게 공개 베타 버전을 공개했으며, 이미지의 영상 전환과 모션 화면, 렌즈 제어 등 방면에서 좋은 성능을 보이고 있다는 평가다. 앞서 지난 7월 중국에서 이미 단편 드라마 제작에 클링 AI가 적용된 바 있다. 중국 최초 AIGC 오리지널 판타지 단편 드라마 '산하이치징-피부잔랑'이 콰이서우에서 공개됐다. 콰이서우는 '더우인(틱톡의 중국 버전)'과 경쟁하는 중국 유명 숏클립 플랫폼으로, 올해 2분기 콰이서우의 일 평균 활동 사용자 수가 3억9천500만 명을 넘어서 역대 최고치를 기록했다. 월 평균 활동 사용자 수는 6억9천200만 명으로 집계됐다.

2024.09.10 09:16유효정

中 센스타임 "인물 사진으로 영상 생성...표정도 제어"

중국 인공지능(AI) 기업 센스타임이 인물 사진을 영상으로 바꿔주는 기술을 내놓고 영상 속 표정 제어도 가능하다고 전했다. 4일 중국 언론 IT즈자에 따르면 중국 센스타임은 세계인공지능컨퍼런스(WAIC)에서 '제어 가능한' 인물 영상을 생성해주는 초거대 모델 '비미(Vimi)'를 발표했다. 임의의 한 장 사진으로 목표 동작과 일치하는 인물 영상을 생성할 수 있는 기술로서, 인물 영상, 애니메이션, 목소리, 텍스트 등 여러 요소를 구현할 수 있다. 기존에 나온 인물 사진 영상화 기술과 차이점은, 인물의 정밀한 표정 제어가 가능하다는 점이다. 반신 영역 내에서 사진 속 인물의 자연스러운 피부 변화를 가능하게 하고, 인물에 어울리는 헤어 스타일과 의상을 자동으로 생성하면서 배경도 자동으로 생성한다. 비미에 따르면 1분 짜리 단일 렌즈 인물 영상을 안정적으로 생성할 수 있으며, 시간이 지나도 영상 효과가 저하되거나 왜곡되지 않아 엔터테인먼트 등에서 요구되는 장시간 영상 생성 수요를 충족한다고 소개됐다. 비미는 일반 사용자에게 공개될 전망이다. 사용자가 다양한 각도에서 고화질 사진을 업로드하면, 여러 가지 유형의 디지털 아바타와 영상이 자동으로 생성된다. 얼굴의 변화뿐 아니라 손집, 피부, 헤어 스타일의 매칭, 그리고 보다 완성되고 일관된 동작을 형성하면서, 창작자가 생성된 영상의 각 요소에 대한 편집과 재창작이 가능하다.

2024.07.05 09:55유효정

中 콰이서우, 오픈AI '소라' 대적할 AI 영상 생성 기술 출시

중국 동영상 플랫폼 콰이서우가 미국 오픈AI의 '소라'에 대적하겠다며 초거대 인공지능(AI) 모델을 기반 이미지 생성 기술을 발표했다. 소라는 명령어를 입력하면 1분 분량의 영상을 만들어주는 AI 서비스다. 6일 중국 언론 IT즈자에 따르면 콰이서우는 '텍스트투이미지', '이미지투이미지' 기능을 제공하는 AI 초거대 모델 '칼라스(KOLORS, 중국어명 可灵)'를 발표하고 공식 홈페이지와 위챗 등을 통해 서비스한다고 밝혔다. 칼라스는 텍스트 입력을 통해 1080P의 2분 길이(30fps) 영상을 생성할 수 있으며 화면 비율을 자유롭게 조정할 수 있다. 유화, 컴퓨터그래픽, 핸드페인팅, 중국 판화, 3D 등 다양한 이미지 스타일 제작과, 8K의 고화질 이미지 생성을 지원한다는 게 콰이서우의 설명이다. 주요 기능은 '텍스트투이미지' 기능으로, 텍스트를 입력하면 다양한 스타일과 높은 화질을 갖춘 이미지를 생성한다. 입력된 테스트를 토대로 다양한 스타일의 이미지를 생성해주며 사용자가 참조 이미지를 업로드할 수도 있다. 이미지의 스타일, 테마, 세부 사항을 기반으로 새 작품을 생성한다. 'AI 이미지 커스터마이징' 기능은, 사용자가 인물 사진을 업로드하면 다양한 가상 이미지로 만들어주는 것이다. 일명 '인물 보존 기술'을 이용해 인물의 자연스러운 특성을 유지하면서 다양한 스타일의 인물 이미지를 생성해주는 것이다. 콰이서우는 "칼라스 초거대 모델은, 콰이서우의 AI팀이 자체 개발했으며, 소라와 유사한 기술 노선을 채택하면서 여러 자체 개발 기술 혁신을 결합해 소라에 맞대결 할 것"이라고 전했다. 콰이서우에 따르면, 칼라스의 초거대 모델 매개변수 규모는 10억 개 수준으로, 오픈소스 커뮤니티 소스 및 자체 AI 기술을 더했다. 텍스트투이미지 기능의 긴 텍스트와 복잡한 의미의 텍스트 입력을 위해 강화학습보상모델기술(RLHF)도 적용했다. 매체에 따르면 콰이서우는 칼라스 초거대 모델에 더 많은 기능이 구현하고, 표정과 신체 움직임이 동시에 구현되는 새로운 'AI 노래와 춤' 서비스도 출시할 예정이다. 한 장의 사진만 있으면, 노래하고 춤추는 영상을 얻을 수 있는 기능이다. 콰이서우는 지난해 연말 기준 평균 월 활성 사용자 수가 7억 명을 넘어선 중국의 주요 영상 플랫폼이다.

2024.06.07 09:08유효정

중국판 '소라' 등장...최대 16초짜리 AI 영상 생성

중국에서 미국 오픈AI의 텍스트투비디오 생성 모델 '소라(Sora)'를 벤치마킹한 인공지능(AI) 영상 생성 모델을 발표했다. 27일 중국 성수커지(ShengShu)가 칭화대와 협력해 개발한 중국 AI 초거대 모델 '비두(Vidu)'를 발표했다. 이 모델은 장시간, 높은 일치성, 높은 동태성 등 특징을 가지는 모델로서, 중국 언론과 업계 관계자들은 이 모델이 중국 최초의 '소라'급 영상 모델이라고 평가하고 있다. 이 모델은 '중관춘포럼미래인공지능선봉포럼'에서 처음 공개됐다. 비두는 원클릭으로 최대 16초 길이와 최대 1080p 해상도의 영상 생성을 지원하는 독창적 '유빗(U-ViT)' 아키텍처를 사용했다고 설명했다. U-ViT은 소라처럼, 디퓨전(이미지 데이터에 노이즈를 추가 및 제거하며 이미지를 생성)과 트랜스포머(텍스트 맥락을 통해 이미지를 생성) 방식을 결합해 구성된 아키텍처다. 회사측에 따르면 U-ViT 아키텍처는 소라가 채택한 DiT 아키텍처보다 먼저 2022년 9월 개발팀이 제안한 것으로 디퓨전과 트랜스포머를 통합한 세계 최초의 아키텍처다. 개발팀은 앞서 U-ViT 융합 아키텍처를 기반으로 한 세계 최초 다중 모드 확산 모델인 유니디퓨저(UniDiffuser)를 오픈소스화하고 U-ViT 아키텍처의 대규모 확장성 검증을 완료했다고도 설명했다. 비두에 따르면 비두는 실제 물리적 세계를 시뮬레이션 할 수 있을뿐 아니라 창의력과 높은 시공간적 일관성 등을 갖추고 있다. 성수커지는 칭화대 인공지능연구원 출신 인력이 지난해 3월 설립한 AI 스타트업으로 알리바바, 텐센트, 바이트댄스 등 출신 인력으로 구성됐다.

2024.04.29 08:59유효정

AI가 영상 만드는 시대 왔다…"컴퓨팅 파워·수익 모델 마련해야"

오픈AI가 영상을 생성하는 인공지능(AI) 모델 '소라'를 공개한 가운데, AI 영상 생성 서비스 상용화에 대한 여러 전망이 나왔다. 국내 업계 관계자들은 영상을 생성할 때 드는 컴퓨팅 인프라 수급 문제부터 해결해야 한다고 주장했다. 모델 수익화 방안도 마련해야 하고, 데이터 학습 방식도 주요 고려사항으로 보고 있다. 오픈AI는 지난 15일 문자를 입력하면 고화질 영상을 생성하는 모델 소라를 홈페이지를 통해 공개했다. 현재 내부 개발팀을 비롯한 소수 영상 편집가, 아티스트, 기업인들에게 공급된 상태다. 사용자 피드백을 통해 기술을 검증한 후 서비스를 출시할 방침이다. 출시 일정은 미정이다. "컴퓨팅 인프라 수요 감당해야…모델 수익화 방안도" 국내 전문가들은 영상모델을 통한 비즈니스가 활성화하려면 아직 멀었다고 입을 모았다. 우선 서비스 구동에 필요한 컴퓨팅 인프라 수급부터 해결해야 한다고 강조했다. AI 영상 생성 서비스의 상용화가 본격화하면 이를 구동하는 그래픽처리장치(GPU) 등 컴퓨팅 인프라 수요가 더 높아질 것으로 보인다는 이유에서다. 업계 관계자는 "언어모델보다 이미지·영상모델 구동에 더 많은 컴퓨팅 파워가 든다"고 했다. 단순 GPU 확보를 넘어 영상 생성 서비스를 비용 효율적으로 운영하기 위한 기술 개발도 본격화할 전망이다. 네이버 관계자는 "AI 모델 압축과 경량화를 돕는 AI 칩 필요성이 더욱 커질 것"이라며 "네이버가 삼성전자와 손잡고 AI 반도체 솔루션을 공동 개발하고 있는 이유"라고 본지에 전했다. 영상모델을 통한 수익화 마련도 구체적이지 않다. 한 업계 관계자는 "오픈AI가 챗GPT를 운영하는 데 드는 컴퓨팅 인프라 비용만 하루 70만 달러(약 9억3천만원)"라며 "이보다 더 무거운 영상모델을 서비스하려면 몇 배 더 높은 운영 비용을 감당해야 할 것"이라고 설명했다. 단순히 API나 구독형으로 기업들에 제공하다간 적자가 불가피할 것이란 분석이다. 현재 AI 기업들은 범용 LLM 개발·운영에 드는 비용을 줄이기 위해 소형언어모델(SLM)을 개발하는 추세다. 범용 LLM에 자사 데이터를 넣어 파인튜닝 하는 방식도 진행하고 있다. 전문가들은 영상 생성 모델에도 동일한 방식을 적용했다간 낭패라는 입장이다. 한국어 LLM을 보유한 한 기업 관계자는 "LLM과 달리 영상모델은 기술적으로 경량화하기 힘들다"며 "모델 경량화는 퀄리티 낮은 영상을 생성할 수 있다"고 지적했다. 영상모델, 언어모델보다 3배 많은 데이터 필요 영상모델의 훈련 데이터양도 중요하다는 지적도 있다. AI 모델이 영화, 광고 등 산업에서 활용 가능할 정도로 수준 높은 이미지를 생성하기 위해선 이미지 데이터를 대량으로 학습해야 해서다. 3D 설계용 AI 모델을 개발 중인 다쏘시스템의 수칫 제인 솔리드웍스·3D익스피리언스 웍스 전략 및 비즈니스 개발 부사장은 "일반적으로 언어모델을 학습시키는 것보다 영상모델 학습시키는 데 3배 더 많은 데이터양과 시간이 걸린다"고 기자에 전한 바 있다. 이미지 데이터에 스며든 사실 왜곡, 혐오 콘텐츠, 편향 등도 제거 해야 한다. 생성 결과물이 비윤리적이거나 편향된 경우 논란을 피할 수 없기 때문이다. 이에 오픈AI는 이미지 데이터 문제 해소를 위한 안전 조치를 취할 예정이라고 홈페이지를 통해 밝힌 바 있다. 영상에 등장할 수 있는 왜곡, 혐오 등의 기술적인 제거를 목표로 뒀다. 오픈AI는 "현재 사내 레드팀이 소라에 적대적 모델 테스트를 진행 중"이라며 "소라로 만든 영상을 분류할 수 있는 소프트웨어 도구도 개발하고 있다"고 설명했다.

2024.02.20 17:31김미정

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

폴더블 아이폰, 펀치홀 카메라 탑재 유력

배민·요기요, 먹통 뒤 정상화..."금요일 밤 비 내린 탓"

과학자들, 납으로 금 만들었다…'연금술사의 꿈' 실현되나

SKT 유심교체 누적 193만...교체 예약 대기 686만

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현