• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
국감2025
배터리
양자컴퓨팅
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'AI 영상'통합검색 결과 입니다. (79건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

'AI+영상' 본격화 한 네이버..."트웰브랩스와 협업 언제나 열려있어"

영상에 인공지능(AI) 기술을 더해 실감형 미디어 경험을 확대하기로 한 네이버가 영상이해 인공지능(AI) 개발 기업 트웰브랩스와의 협업 가능성을 시사했다. 확장현실(XR) 콘텐츠 시장으로의 진출도 본격화했는데, 이는 삼성전자의 XR 헤드셋을 통해 이뤄질 전망이다. 김성호 네이버 이머시브 미디어 플랫폼 리더는 지난 16일 경기 분당 네이버1784에서 열린 기자간담회를 통해 “2025년도 미디어 사업 방향성으로 인해 트웰브랩스와 현재는 협업하고 있지 않지만, 2026년이나 그 이후 언제나 가능성을 열어두고 있다”고 말했다. 동영상 전체를 이해해 검색과 연결할 수 있는 AI 기술을 보유한 트웰브랩스의 기술력이 ▲미디어 AI ▲XR 스튜디오 ▲버추얼 스트리밍을 축으로 삼는 네이버의 '비전 트라이앵글' 전략과 맞닿아 취재진 질문이 나왔고 이에 답한 것이다. 트웰브랩스는 영상 검색 모델 '마렝고'와 영상 요약 및 질의응답 모델 '페가수스'를 보유하고 있는 기업이다. 네이버가 해외 투자법인인 네이버벤처스를 통해 지난달 트웰브랩스에 첫 투자를 단행해 업계의 주목을 받았다. 이날 네이버는 영상을 볼 때 사용자 몰입감을 높이기 위해 '이머시브 미디어 플랫폼'을 확대 구축하고 영상의 맥락을 심층적으로 이해하는 AI 기술인 '뮤(MU)Ai' 플랫폼과, 텍스트 콘텐츠를 영상으로 자동 변환해주는 '오토클립Ai' 연내 출시 계획을 밝히기도 했다. 여기에 안드로이드 운영체제(OS)를 기반으로 한 XR 콘텐츠 플랫폼을 준비 중이라고 소개하기도 했다. 출시되는 XR 플랫폼이 삼성전자의 XR 헤드셋인 '프로젝트 무한'에 탑재되는 것이냐는 질문에 오한기 네이버 리얼타임 엔진 스튜디오 리더는 “프로젝트 무한에 포함된다”며 “정식 서비스 명칭이 결정되지 않았지만 주력 콘텐츠는 '치지직'이 될 가능성이 될 가능성이 높다”고 답했다. 프로젝트 무한의 출시가 현실화되면 치지직 내 케이팝과 버추얼 스트리밍 콘텐츠를 XR로 즐길 수 있게 된다. 현재 삼성전자는 프로젝트 무한을 연내 출시하기 위해 개발에 박차를 가하고 있다.

2025.07.17 15:29박서린

상상만 하면 AI가 '뚝딱'...네이버 실감형 미디어 기술 엿보니

카메라 앞에 선 우주인이 인사를 건넨다. 그 뒤로 펼쳐진 배경은 현실이 아닌, 네이버가 만든 가상 공간. 이제 영상 속 장면은 사람이 아닌 AI가 구성하고, 텍스트 한 줄로도 숏폼 영상이 자동 생성된다. 네이버가 AI 기술을 일상으로 확장하는 '온서비스 AI' 전략을 영상 콘텐츠 생태계로 본격 확장하며, 올해 안에 다양한 영상 기술과 확장현실(XR) 콘텐츠 플랫폼 공개를 예고했다. 16일 네이버는 경기 분당구에서 기자간담회를 열고 '이머시브 미디어 플랫폼' 확대 구축과 함께 이같은 사실을 알렸다. 버추얼 콘텐츠 경험 확대가 미디어 업계 화두로 부상함에 따라 네이버는 독자 구축한 ▲미디어 AI ▲XR 스튜디오 ▲버추얼 스트리밍 등 '비전 테크 트라이앵글 기술'을 바탕으로 서비스 전반에 실감형 미디어 경험 확대에 나설 계획이다. 연내 영상에 AI 접목한 플랫폼·기술 출시…텍스트를 영상으로 변환 네이버는 실감형 미디어 경험 확대를 위해 AI 기반 영상 콘텐츠 플랫폼과 기술을 선보인다. 먼저, 영상의 맥락을 심층적으로 이해하는 AI 기술인 '뮤(MU)Ai' 플랫폼을 연내 확대해 공개할 예정이다. 해당 플랫폼은 저작권 관리, 유해 콘텐츠 및 저품질 영상 감지 기능을 기반으로 한층 고도화됐다. 올해는 영상 이해 기술의 범위를 확대해 영상의 챕터를 구분하고 설명을 제공하는 오토 챕터 기술, 분위기·장소 등 영상의 세부 내용을 분석하고 메타 데이터화 해 네이버 피드의 추천을 고도화하는 등 사용자 경험을 개선한다. 해당 플랫폼에는 여러 AI 모델과 이미지 처리 기술이 유형별로 내재화 돼 있어 비용 경쟁력도 확보했다는 것이 네이버 측 설명이다. 텍스트 콘텐츠를 영상으로 자동 변환해주는 '오토클립Ai'도 내놓는다. 멀티모달 초거대언어모델(LLM)을 활용해 블로그 맥락을 이해하고 요약해 숏폼에 최적화된 내용을 자동 생성하는 기술이다. 음성, 배경음악 등 내용에 맞는 편집 기법을 자동 적용해 최적화된 콘텐츠를 생성한다. 비전 스테이지서 가상화면·실제화면도 연동한다 네이버는 이날 확대 구축한 이머시브 미디어 플랫폼 구현의 대표 사례로 '비전·모션 스테이지'를 제시했다. 비전 스테이지와 모션 스테이지는 각각 다양한 주제에 맞춰 초현실화한 가상 배경을 제공할 수 있는 스튜디오, 고품질 3D 콘텐츠를 제작하고자 하는 치지직 스트리머들이 활용할 수 있도록 전문 기술력과 인력 등을 지원하는 스튜디오를 일컫는다. 그 중에서도 비전 스테이지는 ▲커머스부터 ▲드라마나 ▲영화까지도 제작 가능할 정도로 활용도가 높은 것이 특징이다. 현재 많이 제작되고 있는 콘텐츠는 라이브 커머스이며 무한도전 등 치지직의 오리지널 콘텐츠에도 활용되고 있다. 모션 스테이지는 캐릭터에 움직임을 부여하고 가상 배경을 혼합해 끊김 없는 실시간 방송이 가능하다. 이날 현장에서는 시연도 이뤄졌다. 비전 스테이지에서는 카메라 트래킹 기술이 적용돼 실제 촬영 시점과 가상 화면이 실시간으로 연동되는 장면을 볼 수 있었다. 고해상도 LED 디스플레이에 모습을 드러낸 후 사라진 우주인이 카메라 트래킹 기술이 적용된 화면에서는 오한기 네이버 리얼타임 엔진 스튜디오 리더와 인사하는 장면이 연출되기도 했다. 오 리더는 “비전 스테이지는 지난해 완공된 스튜디오로 사람이 많이 만드는 그래픽을 통해서도 콘텐츠를 만들지만 생성형 AI 이미지를 통해서도 다양한 콘텐츠를 단시간에 빨리 만들 수 있다”며 “실제로 콘텐츠가 나오는 속도가 짧기 때문에 브랜드가 원하는 콘텐츠를 즉각적으로 확보할 수 있다는 장점이 있다”고 설명했다. 이같은 미디어 기술 고도화 다음 목표로 네이버는 XR 콘텐츠 시장을 들여다보고 있다. XR은 ▲증강현실(AR) ▲가상현실(VR) ▲혼합현실(MR)을 포괄하는 기술로 네이버는 안드로이드 운영체제 기반의 XR 콘텐츠 플랫폼을 준비하고 있다고 언급하기도 했다.

2025.07.17 13:53박서린

트웰브랩스, 아마존 베드록에 '영상 AI' 공급…韓 AI, 글로벌 주류 '진입'

세계 주요 클라우드 플랫폼이 생성형 인공지능(AI) 확장에 나서는 가운데 트웰브랩스가 회사의 영상 AI 모델을 아마존에 공급하며 글로벌 시장 공략을 본격화했다. 트웰브랩스는 회사의 초거대 영상 AI 모델 '마렝고'와 '페가수스'를 아마존웹서비스(AWS)의 완전관리형 서비스 '아마존 베드록'을 통해 제공한다고 16일 밝혔다. 국내에서 개발된 파운데이션 모델이 글로벌 AI 플랫폼에 공식 편입된 건 이번이 처음이다. 아마존 베드록은 개발자가 단일 응용 프로그램 인터페이스(API)로 여러 AI 모델을 호출할 수 있는 플랫폼으로, 메타, 엔트로픽, 딥시크, 미스트랄AI 등 주요 AI 기업의 모델을 포함하고 있다. 트웰브랩스는 베드록 내에서 영상 이해 AI를 제공하는 유일한 서드파티 기업으로, 아마존 자체 모델인 '노바'를 제외하면 독점적 위치에 있다. 이번 공급을 통해 전 세계 AWS 고객들은 별도의 인프라 구축 없이 영상 내 객체, 행동, 배경음 등 다양한 요소를 자연어로 탐색할 수 있는 트웰브랩스의 모델을 활용할 수 있다. 영상 분석, 하이라이트 제작, 콘텐츠 태깅 등의 작업이 자동화돼 영상 기반 산업의 업무 생산성을 높일 수 있는 기반이 마련됐다. 트웰브랩스는 모델이 영상 분석 시간 단축 외에도 기업 내부의 아카이브 자산을 구조화하거나 마케팅과 서비스에 쓰이는 짧은 형식의 2차 콘텐츠를 제작하는데 쓰일 수 있다고 밝혔다. 활용 가능한 산업은 미디어, 스포츠, 엔터테인먼트 전반으로 확장된다. 실제로 북미 최대 스포츠 엔터테인먼트 기업인 메이플리프스포츠앤엔터테인먼트(MSLE)는 트웰브랩스 모델을 도입해 콘텐츠 제작 시간을 16시간에서 9분으로 줄였다. 트웰브랩스는 이를 통해 '데이터로서의 영상' 활용이 본격화될 것이라고 전망했다. 업계에서는 트웰브랩스의 아마존 베드록 진입을 '소버린 AI'의 실질적 구현 사례로 평가한다. 기존의 소버린 AI 개념이 국산 기술의 국내 활용에 머물렀다면 트웰브랩스는 글로벌 공급망 안에서 국산 AI가 주도권을 확보할 수 있음을 입증한 셈이다. 이재성 트웰브랩스 대표는 "이번 아마존 내 모델 공급 개시로 영상 데이터의 새로운 가치를 창출해 고객사의 비즈니스 성장에 기여할 것"이라며 "AWS와 지속 협력해 전 세계 기업들이 국산 영상 AI를 사용하는 진정한 소버린 AI를 실현하겠다"고 밝혔다.

2025.07.16 16:09조이환

시각효과 '멋집' 덱스터스튜디오..."韓 반지의제왕·아바타 만들고파"

'오징어 게임 시즌3'·'하얼빈'의 디지털색보정·음향뿐 아니라, 최근 tvN 화제의 드라마인 '견우와 선녀' 시각효과(Visual effects, VFX)를 맡아 주목 받는 회사가 있다. 바로 3D VFX 전문 기업 덱스터스튜디오다. 영화 '신과 함께', 넷플릭스 오리지널 '기생수 더 그레이'·'경성 크리처'도 이 회사의 기술이 녹아든 작품이다. 2012년 설립된 덱스터스튜디오는 자체 R&D연구소를 갖추고 있을 만큼, 고품질 영화·온라인동영상플랫폼(OTT) VFX 영역에서 견고한 전문성을 쌓아왔다. 이 회사는 자체 VFX 소프트웨어 80여개를 보유 중이며, 사내에서 연구·개발(R&D)을 전담하는 인력만 약 15명을 갖추고 있다. R&D 연구소의 AI 전담팀은 크게 '아티스트'와 '엔지니어' 그룹으로 나뉘는데, 아티스트는 AI 기술과 노하우를 바탕으로 고품질 이미지와 영상을 만들어낸다. 엔지니어는 최신 AI를 조사·연구하고 기술적인 지원을 통해 아티스트가 원하는 결과물을 구현하는 역할을 한다. 기자는 최근 서울 마포구 상암동에 위치한 덱스터스튜디오와 덱스터 R&D 연구소를 찾아 영상물에 VFX가 어떻게 입혀지는지, 나아가 AI 기술이 영상물 제작에 어떤 도움과 효과를 주는지 직접 살펴봤다. 아울러 버추얼 휴먼 시연도 살펴보고, 직접 포토그래메트리(사진 기반 3D 모델 생성 기술) 3D 스캔 체험까지 해봤다. 이어 송재원 덱스터 R&D 연구소장과의 인터뷰를 통해 덱스터 R&D 연구소의 기술력과 비전 등을 들어봤다. 모션 캡처 스튜디오부터 전신 3D 스캐너까지...영상 기술의 모든 것이 한 곳에 먼저 덱스터스튜디오가 있는 상암 DDMC 1층 한편에는 덱스터 R&D 연구소가 있다. AI 전담팀이 근무하는 이곳에는 몸에 부착된 센서를 활용해 인체의 움직임을 디지털 좌표 형태로 기록하는 모션 캡처 스튜디오가 갖춰져 있다. 현장에서 가장 먼저 기자는 덱스터스튜디오의 AI 리에이징(에이징+디에이징) 기술 시연을 감상했다. PC 모니터 화면에서 한 배우의 얼굴이 분할된 화면에서 동시에 보였는데, 왼편에는 현재의 얼굴이 오른쪽에는 나이든 얼굴이 보였다. 이 기술은 영상 속 인물의 얼굴을 어리게도, 늙게도 할 수 있는데 별도의 학습 데이터를 다량 확보하지 않고도 단 시간 내 4K 영화에 활용가능한 수준의 결과물 도출이 가능하다. AI 기술을 활용해 영화·드라마·뮤직비디오 속 인물의 나이를 손쉽게 바꿀 수 있는 기술이어서 활용도가 높아보였다. 또 위층 덱스터스튜디오 본 사무실에는 ▲인물 얼굴의 3D 스캔을 초당 24~60회 이상까지 수행할 수 있는 고품질 스캔 장비 '페이셜 4D 스캐너'와 ▲인물 전신 3D 스캔 데이터를 얻을 수 있는 '전신 3D 스캐너' ▲인물 얼굴에 대한 상세 3D 스캔 데이터를 얻을 수 있는 '얼굴 3D 스캐너' ▲영화·드라마 등에 필요한 소품의 3D 데이터를 정확하게 획득할 수 있는 '사물 3D 스캐너' 장비 등이 있다. 이 중 기자는 얼굴 3D 스캐너를 직접 체험해봤다. 안경을 벗고 머리띠로 얼굴로 쏟아지는 머리카락을 밀어 올린 후 50여대의 DSLR 카메라로 둘러싸인 의자에 앉았다. 의자 높낮이 조절 후, 하나·둘·셋 소리와 함께 강력한 플래시가 터지며 주변을 둘러싼 모든 카메라의 셔터가 열렸다 닫혔다. 그렇게 촬영된 이미지는 PC를 통해 몇 분만에 3D 모델링 이미지로 변환됐다. 기자의 얼굴이 3D 입체적인 이미지로 꾸밈없이 구현돼 차마 눈뜨고 보기 힘들었는데, 잠시 후 같은 방식으로 촬영된 꽃미남 가수 OOO의 이미지가 비교 샘플로 띄워져 민망함은 배가 됐다. “3D 스캔은 거짓말을 하지 않는다”는 스캔 엔지니어의 멘트가 조용히 가슴에 와 박혔다. '반지의 제왕'·'아바타' 같은 디지털 휴먼을 우리 작품에도 구현할 그 날까지 이런 최신 기술과 노하우가 녹아든 VFX R&D를 진두지휘하는 송재원 소장은 KAIST에서 석·박사를 컴퓨터 그래픽스로 전공하며 디지털 휴먼과 모션 캡처 분야에서 전문성을 높여왔다. 우리나라 작품에는 3D VFX가 부분적으로만 사용되지만, 언젠가는 할리우드 영화처럼 작품 처음부터 끝까지 디지털 휴먼 캐릭터가 등장하는 작품을 만들어 보고 싶다는 게 그의 꿈이다. 현재까지는 기술적 어려움과 자본의 한계가 있었으나, AI 기술의 발달로 이런 문턱이 점차 낮아질 것으로 기대했다. 송 소장은 “디지털 배우가 국내 영화에 주연으로 나온 경우는 없었다. 배우를 잠깐 교체(스왑)한다든지, 잠시 디지털 배우를 사용하는 장면은 만들 수 있었지만 반지의제왕 골룸 같은 캐릭터는 없었다”면서 “덱스터는 이런 한계를 뚫기 위한 시도들을 하고 있으며, 이와 유사한 수준의 프로젝트를 수행하고 있다. 할리우드에서 제안이 들어온다면 바로 착수할 수 있는 파이프라인도 갖추고 있다”고 설명했다. 또 덱스터스튜디오는 대규모 전쟁 장면이라든지 우주와 같은 세트 촬영이 어려운 경우 컴퓨터 그래픽(CG)을 활용해 실감나게 구현할 수 있다고도 강조했다. AI 기술을 활용하면 현실에선 구현이 어려운 배경을 어색하지 않게 고화질 영상으로 만들어낼 수 있다고. 이를 통해 제작사는 제작 단가를 낮춤은 물론, 창작자의 상상을 보다 현실적으로 구현해 낼 수 있게 된다. "고품질 영화·OTT가 주력 시장...AI, 실무와 실전에 잘 녹아들어야" 덱스터스튜디오는 디지털색보정이나 음향과 같은 작업부터, 실제로는 존재하지 않는 인물이나 괴물 등을 CG로 창조해낼 수 있다. 또 이 회사는 생성형 AI 이미지를 VFX에서 활용 가능한 16/32비트 고품질·고색심도 이미지로 변환하는 자체 프로세스를 개발해 제작 파이프 라인에 접목하고 있다. 아울러 이미지에 일부분을 다시 그리는 '인페인팅' 기술과 , 실사 촬영 장면을 분석해 위치·각도 등의 데이터를 가상의 3D 공간으로 추적·복원하는 AI 매치메이션 특허도 보유 중이다. 이 밖에 AI 학습을 통해 촬영된 인물의 얼굴을 다른 인물의 얼굴로 교체하는 'AI 페이스 스왑', 입력된 음성파일을 입모양 움직임으로 AI가 자동 생성하는 기술도 갖고 있다. 특히 더 전문 분야인 SF 또는 크리처 장르인 경우, 덱스터스튜디오는 제작사와 컨셉 아트·캐릭터 스캔 작업을 하는 등 CG VFX 슈퍼바이저 역할을 한다. 촬영 현장에도 출동해 보다 자연스럽고 원활한 CG 작업을 미리 설계하고 조율하기도 한다. 이런 세심한 작업 과정들이 작품의 완성도를 높이고 덱스터를 경쟁사들과 차별화 하는 요소로 보였다. 송재원 소장은 “덱스터의 근본은 고품질을 요구하는 영화 또는 영화급 OTT 시리즈를 주력 시장으로 본다”면서 “미디어 아트 전시 사업도 하는데, 올 10월에는 경주에 신라의 역사와 문화를 체험할 수 있는 상설 미디어 전시관도 문을 열 예정”이라고 소개했다. 10월 말 경주에서 제32차 아시아·태평양 경제협력체(APEC) 정상회의가 예정돼 있어, 회사는 각국 정상을 비롯해 관광객들에게 특별한 경험을 선사한다는 계획이다. 인터뷰 후반부에 송 소장은 AI 기술이 기존 파이프라인에 잘 녹아들어가는 것이 굉장히 중요하다고도 강조했다. AI로 생성된 영상이 기존 촬영분과 이질감 없이 자연스럽게 붙는 기술이 진짜 핵심이란 설명이었다. 송재원 소장은 "단순히 AI를 잘한다고만 되는 것이 아니라, 실무와 실전에 적용될 수 있는 AI와 파이프라인을 갖추는 게 중요하다"면서 "AI 등 기술은 결국 인간의 창작을 돕는 유용한 도구"라고 말했다. 이어 “유명 감독의 고품질 영화를 보고 싶어하고, 감동과 재미를 얻고자 하는 인간의 근본적인 심리는 바뀌지 않는다”며 “이를 위해 덱스터는 기술을 개발하고 계속 차별화를 끌고 나갈 것이다. 반지의 제왕, 아바타급의 디지털 휴먼이 영화 내내 등장하는 작품을 국내에서 꼭 만들어 보고 싶다”고 강조했다. 끝으로 그는 “기술은 어디까지나 아티스들의 창조 역량을 극대화 하는 데 도움을 주는 도구인 만큼, 아티스트들의 창의적인 작업을 지원하는 기술 개발을 이어가겠다”고 다짐했다.

2025.07.16 09:50백봉삼

"AI가 사진을 영상으로"…구글, '비오 3' 기능 제미나이에 통합

구글이 영상 인공지능(AI) '비오 3'의 주요기능을 '제미나이' 언어모델에 통합했다. 사진 한 장으로 동영상을 만들 수 있는 AI 기능이 사용자 경험의 핵심 축으로 자리잡게 됐다. 11일 테크크런치에 따르면 구글은 지난주부터 '비오 3' 기반 '이미지-투-비디오' 기능을 전 세계 150여 개국에 확대 적용했다. 해당 기능은 '제미나이 앱'과 '플로우 툴'을 통해 제공되며 'AI 울트라'와 'AI 프로' 유료 요금제 사용자에게만 지원된다. 무료 사용자 확대 여부는 공개되지 않았다. 사용자는 '제미나이' 앱에서 프롬프트 창 하단 '비디오' 항목을 선택한 뒤 이미지를 업로드하면 된다. 여기에 영상 분위기나 배경음에 대한 설명을 함께 입력하면 이를 바탕으로 시청각 요소가 결합된 짧은 클립이 생성된다. 생성된 영상은 즉시 다운로드하거나 타인과 공유할 수 있다. 구글은 '비오 3' 모델의 상용화 이후 7주 만에 전체 플랫폼에서 4천만 건 이상의 AI 영상이 제작됐다고 밝혔다. 모든 영상에는 '비오' 로고가 삽입된 시각적 워터마크와 함께 '신스ID' 기반의 비가시 디지털 워터마크가 포함된다. '신스ID'는 생성형 인공지능 콘텐츠 식별을 위해 구글이 개발한 기술로, 외형 변경이나 영상 편집이 이뤄져도 식별이 가능하다. 구글은 올해 초부터 '신스ID' 탐지 기능도 별도 도구로 제공하며 생성물의 투명성 확보에 주력해왔다. 이번 기능은 지난 5월 구글 I/O에서 먼저 공개된 AI 기반 영상 툴 플로우에서 선제 적용된 바 있다. 이후 같은 기능을 '비오 3' 기반 제미나이 앱에도 옮긴 것이다. 테크크런치는 "영상 생성은 요금제에 따라 하루 최대 3건까지 가능하며 미사용 횟수는 이월되지 않는다"며 "생성된 콘텐츠는 공유 또는 저장은 가능하지만 편집 기능은 제공되지 않는다"고 밝혔다.

2025.07.11 09:22조이환

"AI 세상을 내 판으로 만들다"…KT, AI 영상 공모전 개최

KT가 인공지능(AI) 창작 생태계 확산을 위해 AI 영상 공모전 '2025 KT AI P.A.N(Playground, AI, Now)'을 개최한다고 9일 밝혔다. KT 미디어 그룹사 및 영화계 주요 파트너들과 함께한다. 이번 공모전은 AI를 통해 누구나 쉽게 창작할 수 있는 축제의 일환이며, 'AI 세상을 내 판으로 만들다'를 슬로건으로 내걸었다. KT는 차세대 AI 창작자와 산업계가 함께 성장할 수 있는 개방형 생태계 조성을 목표로, 그룹사 및 파트너사가 보유한 다양한 콘텐츠 IP와 첨단 AI 기술을 결합한 새로운 형식의 영상 창작을 장려한다. 2025 KT AI P.A.N은 KT와 한국영화감독조합(DGK)이 공동 주관하고 영화진흥위원회가 자문기관으로 참여한다. 이를 통해 콘텐츠 산업계의 공신력과 전문성을 확보했으며, 나아가 산업계와 창작자의 연결고리가 더욱 견고해질 것으로 기대된다. 공모 부문은 ▲단편영화 ▲숏폼 ▲광고 ▲배우 IP ▲KT 그룹 미디어 IP 등 총 5개로 운영된다. 응모는 자유 창작을 주제로 하며, KT 스튜디오지니·밀리의 서재·스토리위즈 등 KT 그룹의 소설·웹툰·드라마 IP와 함께 AI 영화 '나야, 고준'과 연계해 배우 고준의 얼굴과 음성을 활용한 작품도 제출할 수 있다. '나야, 고준'은 AI 배우 기술을 실제 작품에 도입했던 AI 영상 스튜디오 MCA사의 AI 영화 '나야, 문희'의 후속작이다. 다양한 공모 부문 운영으로 창작자들이 AI를 활용해 미디어 콘텐츠를 자유롭게 실현할 수 있다. KT는 이번 공모전을 통해 AI 창작자들이 산업 전반으로 진출할 수 있는 발판을 마련할 계획이다. 수상작으로 선정된 작품에게는 IPTV와 국내 주요 극장 상영 기회를 제공하고, KT 미디어 그룹과 MCA, 영화계 전문가 네트워크와의 협업 등 산업 연계형 후속 지원을 다각도로 제공할 예정이다. 응모 기간은 올해 8월 1일부터 15일까지이며, KT닷컴 내 'KT AI P.A.N' 공식 페이지에서 국적 및 연령 제한 없이 누구나 접수 가능하다. 8월 말 수상작을 발표하고 9월 중 시상식이 개최될 예정이다. 자세한 내용은 KT닷컴 공지사항과 2025 KT AI P.A.N 공식 블로그에서 확인할 수 있다. 김채희 KT 미디어부문장 전무는 “AI는 기술을 넘어 창작의 도구이자 콘텐츠 산업 미래를 여는 혁신의 열쇠”라며 “KT는 미디어 그룹사와 영화계 전문 파트너들과 함께 AI 기술을 기반으로 한 창작 생태계 확산에 앞장서며, 전 국민이 상상력을 펼칠 수 있는 '판(P.A.N)'을 열어가겠다”고 말했다.

2025.07.09 11:06진성우

구글, 생성형 AI 영상툴 '비오 3' 세계 출시…오디오까지 붙는 영상 제작

구글이 생성형 인공지능(AI) 영상 모델 '비오 3(Veo3)'를 전세계에 출시하면서 영상 제작의 진입장벽을 대폭 낮추는 기술 확장을 본격화했다. 4일 테크크런치에 따르면 구글은 '비오 3'를 이달부터 159개국 이상에서 제미나이 사용자에게 순차적으로 적용 중이다. 이 모델은 최대 8초 길이의 동영상을 생성할 수 있으며 텍스트 입력만으로 영상과 소리를 동시에 만들어준다. '비오 3'는 지난 5월 공개 당시에도 영상 품질과 프레임 전환 자연도에서 높은 평가를 받았지만 이번 세계 출시를 통해 음성까지 생성하는 '네이티브 오디오' 기능이 정식 반영됐다. 동영상 한 편 안에 장면, 움직임, 사운드를 모두 구현하는 생성형 AI는 시장 내에서도 제한된 기술로 꼽힌다. 사용자는 단순한 글을 입력하거나 캐릭터, 사물, 상황 등을 설명하는 방식만으로 애니메이션, 밈, 스토리보드 등을 즉시 생성할 수 있다. 콘텐츠 제작 초기 단계인 콘셉트 시안, 브레인스토밍, 프로토타입 영상 제작에도 유용하다. 생성 과정은 전부 '제미나이' 플랫폼 안에서 이뤄진다. 요금제에 따라 기능과 품질도 차등화된다. 'AI 프로'는 신속한 속도와 기본 품질에 중점을 두며 'AI 울트라'는 고화질 영상과 더 정교한 오디오까지 포함하는 최상위 옵션이다. 두 요금제 모두 인터넷 연결과 일정 기준의 사용자 조건을 충족해야 이용 가능하다. 또 구글은 '비오 3'에 이미지 기반 입력 기능도 곧 도입할 예정이다. 텍스트뿐 아니라 이미지를 활용해 영상으로 전환하는 기능은 현재 개발 중이며 향후 제미나이 업데이트를 통해 반영될 계획이다. 영상 제작을 위한 입력 방식 다변화를 통해 더 직관적인 창작 흐름을 노리는 것으로 풀이된다. 현재 '제미나이'에는 '비오 3 패스트'라는 경량 모델도 함께 제공되고 있다. 이는 상대적으로 짧은 시간 안에 빠르게 결과물을 확인할 수 있도록 최적화된 버전으로, 복잡한 품질 조정이나 고해상도 출력은 '울트라' 요금제 전용 기능으로 분리돼 있다. 조쉬 우드워드 구글 제미나이 담당은 "현재 이미지 기반 비디오 생성 기능도 '제미나이'에 추가하는 작업을 진행 중"이라고 밝혔다.

2025.07.04 09:23조이환

"오픈AI·구글 못지 않다"…'영상 분석 강자' 트웰브랩스, LG CNS와 新 사업 발굴 본격화

트웰브랩스가 LG CNS와 영상 분석 기술 고도화와 신규 사업 발굴을 위해 함께 나선다. 트웰브랩스는 LG CNS와 영상 AI 기술 협력을 위한 업무협약(MOU)을 체결했다고 1일 밝혔다. 이번 협약으로 양사는 미디어·방송, 공공·안전, 법률·수사기관 등 다양한 산업 분야에서 혁신적인 영상 AI 솔루션 공급을 가속화할 계획이다. 트웰브랩스는 멀티모달 신경망 기술을 바탕으로 글로벌 영상 시장 내 오픈AI, 구글과 어깨를 나란히 하고 있다는 평가를 받고 있다. 지난 4월 한국 AI 모델 최초이자 영상 모델 최초로 아마존 베드록(Amazon Bedrock)에 자사 멀티모달 AI 모델 '마렝고(Marengo)'와 '페가수스(Pegasus)'를 공급하는 성과를 이뤘다. LG CNS는 금융 분야에서 생성형 AI를 기반으로 한 기업 고객의 비즈니스 혁신을 선도하고 있다. 특히 ▲NH농협은행 ▲신한은행 ▲신한카드 ▲미래에셋생명 ▲미래에셋증권 ▲우리은행 등 주요 금융 기업의 AX 사업을 맡으며 금융 AX 시장에서도 두각을 나타내고 있다. 최근에는 공공 분야에서도 외교부, 경기도교육청, 경찰청 등의 대규모 AX 사업을 연이어 수주해 기술력을 인정 받고 있으며 제조, 물류 등 다양한 분야로 사업을 확장해 나가고 있다. 양사의 협력은 기술 및 사업적 협업 두 축으로 진행된다. 연구 협력을 통해 트웰브랩스의 영상이해 모델(Video Foundation Model, VFM)을 고도화하고 이를 바탕으로 고객 서비스 기획 및 구축으로 다양한 고객 대상 협업을 통해 사업 기회를 창출할 계획이다. 미디어·방송 분야에선 ▲뉴스, 스포츠, 드라마 콘텐츠 자동 요약 및 하이라이트 추출 ▲대규모 아카이브 영상 내 특정 키워드 및 상황 검색 ▲콘텐츠 시청 시 소비 중인 장면과 유사한 광고를 노출하는 맥락 광고 서비스 등을 제공한다. 공공·안전 및 법률·수사기관 분야에서는 ▲CCTV 특정 이벤트 자동 감지 ▲바디캠·블랙박스 영상 자동 요약 ▲사건 관련 장면 검색 등의 솔루션을 구현해 전방위 혁신을 가속화한다. 이재성 트웰브랩스 대표는 "LG CNS와의 협력을 통해 우리의 영상이해 기술이 더 많은 산업 현장에서 실질적인 가치를 창출할 수 있게 됐다"며 "양사의 시너지를 바탕으로 영상 데이터의 가치를 극대화하고 영상 분야에서 대한민국이 글로벌 AI 3대 강국으로 도약할 수 있는 토대를 마련하겠다"고 말했다.

2025.07.01 15:59장유미

캐럿, 대화형 AI와 소통하며 이미지·영상 콘텐츠 만든다

생성형 AI 플랫폼 '캐럿' 개발사 패러닷(대표 장진욱)이 대규모 업데이트를 통해 캐럿의 콘텐츠 생성 기능과 사용자 편의성을 높였다고 12일 밝혔다. 업데이트 핵심은 최신 이미지·영상·음성 생성형 AI 모델을 손쉽게 활용할 수 있는 '멀티 모달 시스템' 도입이다. ▲소재 발굴 ▲대본 작성 ▲영상 제작 ▲배경음악 및 립싱크 작업 ▲최종 편집에 이르는 과정을 대화형 AI와 소통하며 진행할 수 있다. 해당 기능은 무료로 이용할 수 있으며, 더 정교한 제작 기능과 높은 사용 한도가 필요한 이들은 유료 구독 서비스를 활용할 수 있다. 캐럿은 이미지, 영상, 오디오 등 콘텐츠 생성에 특화된 AI 에이전트를 지향한다. 거대언어모델(LLM)을 통한 대화 기능에 구글 이마젠, 비오, 런웨이 등 이미지·영상 생성 AI와 일레븐랩스 등 음성·음악 생성 AI를 적용해 누구나 쉽게 콘텐츠를 제작할 수 있도록 돕는다. 여기에 AI 오케스트레이션 기술을 더해 사용자 의도를 파악해 AI가 스스로 모델을 선택해 완성도 높은 콘텐츠를 생성한다. 비용 면에서도 각 서비스를 개별 구독하는 경우보다 유리하다. 장진욱 패러닷 대표는 "캐럿은 변화무쌍한 글로벌 AI 트렌드를 가장 빠르게 따라가는 국내 유일 컨슈머 생성형 AI 앱"이라며 "이미지 AI로 시작한 캐럿은 챗GPT와 같은 텍스트 AI 보다 콘텐츠 제작 면에서 큰 강점이 있다. 올해 하반기 중에는 자율적으로 콘텐츠를 제작해주는 AI 에이전트를 출시할 예정"이라고 말했다. 패러닷은 기업이 마케팅·광고 소재 제작 비용을 대폭 절감할 수 있도록 기업용 구독 서비스 '캐럿 Biz'도 함께 운영 중이다. 캐럿이 제공하는 콘텐츠 생성 기능과 더불어, 전문 AI 크리에이터에게 각종 멘토링 서비스까지 받을 수 있다. 파트너사 LG 유플러스는 캐럿 Biz를 포함한 AI 도구를 활용해 광고 제작비를 기존 대비 95% 절감했다고 밝힌 바 있다.

2025.06.12 09:37백봉삼

포바이포-팔레트, 디지털 광고 시장 본격 공략

콘텐츠 AI 솔루션 기업 포바이포(대표 윤준호)가 AI 크리에이티브 기업 팔레트와 디지털 광고 시장 공략을 위한 전략적 업무 협약(MOU)을 체결했다고 23일 밝혔다. 팔레트는 생성형 AI 기술을 기반으로 광고 및 디지털 콘텐츠 등을 전문적으로 제작하는 AI 크리에이티브 기업이다. 팔레트는 AI를 활용해 광고 영상을 직접 제작하기도 하지만 사용자가 스스로 원하는 디지털 콘텐츠 영상을 만들 수 있는 AI 콘텐츠 제작 플랫폼도 서비스하고 있다. 광고를 원하는 기업과 영상 제작자를 연결해주는 AI 아티스트 플랫폼도 운영 중이다. 포바이포와 팔레트 양사는 이번 업무 협약을 계기로 브랜드 전략형 AI 광고에 8K 화질을 적용해 디지털 광고 산업 전반에 새 기준 제시를 목표로 하고 있다. 또 두 회사의 AI 기술 결합을 통해 더 효율적인 콘텐츠 제작 환경을 조성하고 광고주와 소비자 양쪽에 더 높은 가치를 제공할 수 있을 것으로 기대하고 있다. 팔레트 이종근 대표는 "브랜드 광고는 소재의 질감, 인물의 미세한 표정까지 온전히 전달해야 하기 때문에 화질 업스케일링 기술은 이제 선택이 아니라 필수"라며 "포바이포의 픽셀 솔루션을 활용해 팔레트가 만드는 다양한 디지털 콘텐츠들을 8K 초고화질로 바꾼다면 이런 다양한 정보를 미디어월, 리테일 미디어 등 대형 스크린에서도 더 효과적으로 보여 줄 수 있게 될 것"이라고 설명했다. 포바이포 솔루션사업본부 배성완 본부장도 "팔레트가 서비스하고 있는 영상 제작 플랫폼에 픽셀 솔루션을 API 형태로 결합시키면 사용자는 본인이 만드는 디지털 콘텐츠가 업스케일링 과정을 거친다는 사실조차 모른 채 초고화질의 결과물을 얻을 수 있게 된다"면서 "이번 협력으로 AI 기반 영상 제작의 진입 장벽은 낮추고 결과물의 품질은 손쉽게 높이는 일석이조의 효과를 기대할 수 있게 될 것"이라고 말했다. 포바이포가 제공하는 화질 개선 AI 솔루션 '픽셀'은 원클릭으로 최대 8K 수준으로 영상의 화질을 개선해준다.

2025.05.23 08:34백봉삼

네이버클라우드, 맥락 이해하는 AI 영상 분석 서비스 'MAIU' 공개

네이버클라우드가 영상 제작자를 위한 인공지능(AI) 기반의 영상 분석 서비스를 선보였다. 네이버클라우드는 서울 코엑스에서 개최되는 'KOBA 2025(국제 방송·미디어·음향·조명 전시회)'에서 방대한 영상 속 정보를 AI가 분석해 메타 데이터로 자동 추출하고 검색해주는 영상 분석 서비스 'MAIU(엠에이아이유, Media AI Understanding)'를 공개했다고 21일 밝혔다. 해당 서비스는 현재 국내 방송사 및 파트너사를 대상으로 클로즈드 베타 서비스(CBT) 중이며, 내달 정식 공개될 예정이다. MAIU는 영상 내 인물·행동·배경·음성 등 다양한 정보를 AI가 자동으로 분석해 메타데이터를 생성하고 '와인잔 나오는 장면', '남주인공 달리는 장면' 등 텍스트 검색만으로 원하는 장면을 빠르게 찾을 수 있는 서비스다. 이를 통해 방송사와 영상 제작사 뿐 아니라 유튜브와 숏폼 콘텐츠 등 수많은 영상 제작자들이 반복적인 편집 시간을 줄이고 창의적인 작업에 집중할 수 있을 것으로 기대하고 있다. MAIU를 활용하면 영상 제작에서 가장 많은 시간이 드는 메타데이터 추출 및 가편집 시간을 획기적으로 줄일 수 있다. 통상 예능 프로그램 1편 제작 시 3천600분에 해당하는 영상을 촬영하게 되는데 기존에는 편집팀이 3-4일에 걸쳐 분석 및 가편집을 마쳤다면, MAIU를 활용하면 2시간 이내로 끝낼 수 있다. 15배 이상의 시간이 단축되는 셈이다. 이에 네이버클라우드 측은 "기존 AI 분석 서비스는 일반적으로 개별 프레임 단위의 탐지나 객체 인식에 국한돼 있어 영상 콘텐츠의 흐름이나 맥락 이해가 어려웠던 반면, MAIU는 영상의 의미 단위인 구간을 중심으로 분석하는 것이 가장 큰 차이점"이라고 설명했다. 이어 "프레임이나 샷 단위가 아닌, 이야기의 흐름이나 구성상 자연스러운 구간 단위로 분석하기 에 실질적으로 콘텐츠를 편집하거나 재가공할 때 훨씬 직관적이고 현업에서 바로 활용 가능한 구조로 제공할 수 있다"고 덧붙였다. 사용 요금도 모델 경량화를 통해 경쟁력을 갖춰 글로벌 경쟁 제품 대비 최대 1/3 수준으로 정식 출시될 예정이다. 또 MAIU 서비스를 이용할 경우 모바일 라이브 스트리밍, VOD 영상 송출 등의 기능을 동일 플랫폼 내에서 함께 활용할 수 있어 제작부터 송출까지의 전 과정을 효율적으로 운영할 수 있다. 네이버클라우드 성무경 네이버 클라우드 플랫폼 기획 총괄은 "급속도로 성장하고 있는 영상 산업은 클라우드 전환 및 적극적인 AI 기술 도입으로 혁신이 가장 기대되는 분야 중 하나"라며 "AI 영상 분석 서비스를 포함해 콘텐츠 제작·편집·유통·관리에 이르는 전 과정을 아우르는 엔드투엔드 미디어 서비스로 고객의 다양한 니즈를 만족시키고 영상 산업의 혁신을 이끌어 낼 수 있도록 노력하겠다"고 말했다.

2025.05.21 13:08한정호

혈관 CT 검사 결과로 심장질환 발생 위험까지 예측하는 딥러닝 모델 개발

혈관 CT 검사 결과로 관상동맥질환 진단과 함께 미래 심장질환 발생 위험까지 예측하는 딥러닝 모델이 개발됐다. 세브란스병원 영상의학과 허진 교수 연구팀은 계명대학교 동산병원 영상의학과 김진영 교수, 의료영상 인공지능 기업 팬토믹스 연구팀과 함께 관상동맥질환 진단과 예후 예측 딥러닝 모델을 개발하고 실제 임상에 적용할 수 있는 가능성을 확인했다고 19일 밝혔다. 급성 흉통으로 응급실을 찾는 환자에게는 빠르고 정확한 관상동맥질환 진단과 함께 미래에 발생할 수 있는 심장질환의 가능성을 평가하는게 중요하다. 이러한 진단과 위험을 평가하기 위해 CT 혈관조영술을 실시하고 있지만 결과 판독이 나오기까지 오랜 시간이 걸리고 판독자에 따라 해석이 달라질 수 있다는 한계가 있다. 연구팀은 인공지능 딥러닝 기술을 이용해 관상동맥 협착을 자동으로 판독하고 협착 정도에 따라 정상, 비폐색성(협착 50% 미만), 폐색성(협착 50% 이상) 세 그룹으로 분류하는 모델을 개발하고 정확성을 살폈다. 딥러닝 모델은 2018년부터 2022년까지 3개 대학병원 응급실에 내원해 CT 혈관조영술을 시행한 408명의 환자 데이터를 학습했다. 또 물체 위치 파악과 종류 분류를 동시에 수행하기 때문에 데이터 처리 속도가 빠른 YOLO 아키텍처를 사용해 혈관 협착을 발견하는 속도를 높였다. 딥러닝 모델의 유효성을 검증하기 위해 전체 환자의 심장 사건 발생을 평균 2년6개월간 추적 관찰한 결과, 환자 중 15%가 심근경색, 불안정 협심증 등으로 입원과 사망을 겪었다. 특히 폐색성 환자군의 발생률은 38.8%로 정상군(0.6%), 비폐색성군(3.2%)보다 크게 높은 것으로 나타났다. 미래 심장질환 발생 위험을 따질 때 고지혈증이나 심장 효소 수치인 트로포닌-T 등 기존 위험인자와 비교해 딥러닝이 분석한 폐색성 정도가 가장 유효한 지표라는 것도 나타났다. 또 딥러닝이 기존 위험인자에 관상동맥 폐색성을 추가해 미래 심장질환 발생 위험을 분석하면 기존 위험인자만 가지고 분석했을 때(판별력 80%)보다 위험도 판별력이 14% 향상했다. 허진 교수는 “이번 연구로 빠른 진단과 치료 결정이 중요한 응급실에서 단순히 관상동맥질환의 유무를 판별하는 것을 넘어 환자 예후까지 예측하는데 딥러닝 모델을 적용할 수 있다는 가능성을 제시했다”며 “인공지능 기술이 단순한 진단 보조를 넘어 임상 의사결정 지원 도구로 확장할 수 있다는 것을 확인했다”고 말했다. 이번 연구 결과는 국제학술지 '영상의학:인공지능(Radiology:Artificial Intelligence, IF 8.1)'에 게재됐다.

2025.05.19 16:23조민규

틱톡, 사진 한 장으로 움직이는 영상 만든다…'AI 얼라이브' 공개

틱톡이 사진을 단편 영상으로 제작할 수 있는 인공지능(AI) 기능을 선보인다. 14일 테크크런치에 따르면 틱톡은 첫 번째 이미지 투 비디오 AI 기능인 '틱톡 AI 얼라이브'를 출시한다고 발표했다. 이 기능은 사용자가 틱톡 스토리에서 촬영한 단일 사진을 비디오로 변환할 수 있도록 지원한다. AI를 활용해 움직임, 분위기, 창의적인 효과가 있는 단편 영상을 만들 수 있는 기능이다. 정지된 풍경 사진뿐만 아니라 몸짓과 표정이 담긴 단체 촬영 사진을 애니메이션으로 변환할 수도 있다. 사용자는 틱톡 스토리 카메라를 열고 받은편지함 페이지 또는 프로필 페이지 상단의 파란색 플러스 버튼을 눌러 AI 얼라이브 비디오를 제작할 수 있다. 이후 스토리 앨범에서 사진을 선택하면 사진 편집 페이지의 도구 모음에 AI 얼라이브 아이콘이 표시된다. AI 얼라이브 스토리에는 콘텐츠가 AI로 제작됐음을 사용자에게 알리는 AI 생성 라벨도 포함된다. 또 이 콘텐츠에는 C2PA 메타데이터가 내장된다. 이는 틱톡 외부에서 다운로드·공유되더라도 다른 사람들이 해당 동영상이 AI 생성 동영상임을 식별하는 데 도움이 되는 기술 표준입니다. 특히 사용자들이 AI 기능을 통해 부적절한 영상을 제작할 경우 신고할 수 있으며 크리에이터가 AI 얼라이브 스토리를 공유하면 틱톡 앱 내에서 최종 안전 검사가 수행된다. 틱톡은 블로그 게시물을 통해 "저희는 항상 안전을 최우선으로 생각하며 AI 혁신도 마찬가지"라며 "기술은 새로운 형태의 창의적 표현을 가능하게 하므로 커뮤니티를 보호하기 위해 여러 차례의 신뢰 및 안전 검사를 거친다"고 강조했다. 이어 "정책을 위반하는 콘텐츠 제작을 방지하기 위해 업로드된 사진과 AI 생성 프롬프트, AI 얼라이브 영상은 크리에이터에게 공개되기 전에 검열 기술을 통해 검토된다"고 덧붙였다.

2025.05.14 12:16한정호

사진 한 장이 말하고 움직인다…캐릭터.AI, 영상 생성형 기술 '아바타FX' 공개

영상 생성형 인공지능(AI)이 인기를 얻고 있는 가운데, 2D 이미지를 사람처럼 움직이게 하는 기술이 공개돼 주목받고 있다. 다만 실제 인물을 활용한 애니메이션 생성이 가능해짐에 따라 악용 우려도 커지고 있다. 23일 테크크런치에 따르면 AI 기반 채팅·롤플레잉 플랫폼 기업 캐릭터.AI는 비디오 생성 모델인 '아바타FX'를 공개했다. 해당 모델은 비공개 베타 버전으로 제공된다. 아바타FX는 캐릭터들을 다양한 스타일과 음성으로 애니메이션화해 사람 같은 캐릭터부터 2D 동물 만화까지 다양한 모습으로 구현한다. 특히 오픈AI의 대표적인 영상 생성형 모델 '소라'와 차별화돼 이목을 끌고 있다. 아바타FX는 단순히 텍스트를 비디오로 변환하는 것이 아니라, 기존 이미지를 활용해 비디오를 제작할 수 있다. 이를 통해 실제 인물 사진을 애니메이션으로도 표현할 수 있다. 다만 이로 인해 업계에서는 영상 생성형 AI 기술이 악용될 수 있다는 우려도 보이고 있다. 사용자들이 유명인이나 지인의 사진을 업로드해 범죄가 될 만한 행동이나 말을 하는 영상을 사실적으로 만들 수 있기 때문이다. 특히 캐릭터.AI는 최근 많은 사용자들로부터 인기를 얻고 있어 딥페이크 기술로 악용될 가능성이 높다는 게 업계 관측이다. 실제 캐릭터.AI는 자사 챗봇이 사용자들에게 비윤리적인 채팅을 전한다는 이유로 자녀를 둔 미국의 부모들로부터 피소된 바 있다. 챗봇 메시지가 사람에게 부정적인 영향을 미칠 것이란 우려가 퍼지는 가운데, 현실적인 영상을 생성하는 캐릭터.AI의 이번 서비스는 이같은 문제를 더욱 증폭시킬 수 있다는 전망이 나오고 있다. 테크크런치는 "캐릭터.AI는 자녀 보호 기능과 같은 추가적인 안전장치를 구축했지만, 완벽한 보호 체계를 갖췄다고 보장하기는 어렵다"고 설명했다.

2025.04.23 14:29한정호

캐럿, LG유플러스에 기업용 AI 영상 제작 서비스 '캐럿 Biz' 공급

인공지능(AI) 영상 생성 플랫폼 '캐럿' 운영사 패러닷(대표 장진욱)이 LG유플러스에 기업용 AI 영상 제작 솔루션 '캐럿 Biz'를 공급한다고 21일 밝혔다. 캐럿 Biz는 기업을 대상으로 세계적인 이미지·영상 생성 모델을 실행 횟수 제한 없이 제공한다. 구글 이마젠3, 런웨이, 플럭스 등 각종 AI모델을 개별 구독하는 경우와 비교해 최소 약 75% 저렴한 가격에 이용할 수 있다. 인물이 등장하는 영상에 더빙 음성 및 입 움직임을 더하는 '영상 립싱크', 특정 인물 및 사물을 학습해 콘텐츠에 반영시켜주는 '이미지 학습' 등 제작자 친화적인 기능까지 탑재했다. 앞으로 LG 유플러스는 캐럿을 활용해 직접 광고 및 마케팅 영상을 제작할 계획이다. 인공지능 중심 사업 전환(AX)을 위한 전략 일환이다. 운영사 패러닷은 LG유플러스 실무자들이 AI 창작을 신속히 익힐 수 있도록 라이언오슬링, 연신내호랭이, 김땡땡 등 유수 AI 크리에이터를 배치해 멘토링 서비스를 지원한다. 장진욱 패러닷 대표는 “어느 분야에서든 AI는 실무자 업무 역량을 10배 이상 성장시킬 수 있는 '생산성 혁신'을 일으킬 가능성이 충분하다”며 “캐럿은 앞으로 콘텐츠 및 엔터테인먼트 업계에서 유용하게 활용할 수 있는 기능을 다수 탑재한 AI 에이전트를 개발하고 제공할 계획”이라고 말했다.

2025.04.21 09:04백봉삼

구글, 제미나이에 영상 AI 모델 '비오2' 탑재…"현실 이해하는 AI 구현"

구글이 영상 인공지능(AI) 모델 '비오2'를 AI 서비스 '제미나이'에 탑재해 동영상 AI 시장 경쟁력을 높였다. 16일 더버지 등 외신에 따르면 구글은 비오2를 유료 AI 서비스인 '제미나이 어드밴스드' 이용자에게 제공하기 시작했다. 비오는 텍스트를 영상 콘텐츠로 변형할 수 있는 생성형 AI 모델이다. 2023년 5월 처음 소개됐다. 비오2는 같은 해 말 공개된 후 소수 이용자에 한해 시범 운영됐다. 이번 제미나이 통합으로 활용 범위가 넓어졌다. 제미나이 어드밴스드 사용자는 16대9 화면 비율, 720픽셀(p) 해상도, 최대 8초 분량의 짧은 영상 클립을 생성할 수 있다. 완성된 영상은 MP4 형식으로 내려받을 수 있다. 콘텐츠가 AI로 제작된 것임을 알리기 위해 자체 인증 마크 '신스 ID' 워터마크를 영상에 삽입한다. 구글은 "비오2가 실제 촬영한 듯한 정밀한 디테일을 구현할 수 있다"며 "현실적 물리 법칙과 인체 움직임을 이해해 다양한 주제에 맞는 고품질 영상을 만들어낼 수 있다"고 강조했다. 앞서 데미스 허사비스 구글 딥마인드 최고경영자(CEO)도 비오와 제미나이 결합을 통해 AI의 물리 세계 이해력을 강화할 계획이라고 밝힌 바 있다. 앞서 오픈AI는 지난해 12월 최대 1분 분량 영상을 생성하는 '소라'를 공개했다. 메타는 같은 해 텍스트 기반 영상 생성 모델 '무비젠'을 출시했다. AI 스타트업 런웨이는 4세대 동영상 생성 모델을 출시하며 3억 달러(약 4천264억원)넘는 투자 유치를 기록하는 등 기술력과 시장 가능성을 동시에 인정받고 있다. 더버지는 "구글은 오픈AI와 메타, 런웨이 등과 동영상 생성 AI 분야 경쟁에 본격적으로 뛰어들었다"고 평가했다.

2025.04.16 17:43김미정

"AI, 화재·폭력·쓰러짐까지 사전 감지"…日 산업계 사로잡은 韓 기술, 비결은?

슈퍼브에이아이가 영상관제 솔루션을 앞세워 일본 시장 공략에 속도를 낸다. 디지털 트윈과 비전 AI의 결합을 통해 산업 현장 안전관리 수요를 선점하는 행보다. 슈퍼브에이아이는 일본 도쿄에서 열리는 '넥스테크위크 인공지능 엑스포'와 '재팬 IT 위크'에 참가한다고 9일 밝혔다. 넥스테크위크는 인공지능(AI)과 블록체인 등 첨단기술 중심의 행사로 작년 3만명이 관람했고 재팬 IT 위크는 약 9만명이 찾은 일본 최대 규모의 종합 IT 박람회다. 두 전시는 각각 오는 15일, 23일부터 도쿄 빅사이트에서 열린다. 슈퍼브에이아이는 이번 전시에서 비전 AI 기반 '슈퍼브 영상관제' 솔루션을 중점적으로 선보인다. 맞춤형 AI 제안과 산업별 컨설팅도 병행해 사업 확장을 꾀한다. 직관적인 대시보드에서 실시간으로 수십 개 영상 데이터를 분석할 수 있는 구조다. 이 솔루션은 화재 연기 감지, 차량 및 얼굴 인식, 쓰러짐과 이상 행동 탐지까지 다양한 상황을 자동 판별한다. 영상 데이터를 AI 학습용으로 자동 합성해 데이터 부족 문제도 해결하며 2주 만에 현장 시스템에 도입할 수 있다. 일상어로 영상 장면을 검색할 수 있는 기능도 차별점이다. 사용자가 "빨간 모자 쓴 사람 찾아줘"라고 입력하면 비전-언어 모델(VLM)이 해당 인물의 영상과 시간을 자동으로 찾아준다. 기존 검색 방식과 달리 콘텐츠 자체를 인식하고 추출하는 구조다. 고가의 3D 라이다 없이도 2D 카메라만으로 디지털 트윈 맵을 구성할 수 있는 기술력도 갖췄다. 그래픽 처리 장치(GPU) 1대로 20대의 CCTV를 초당 3회 이상 분석해 빠른 속도와 효율성도 확보했다. 슈퍼브에이아이는 한국, 미국, 일본 법인을 기반으로 글로벌 영향력을 확대하고 있으며 특히 일본 시장에서 성과를 보이고 있다. 지난해 토요타와 재계약을 체결했고 일본제철과의 파트너십도 강화했다. 최근에는 일본 국립 의료기관과 대형 전자제품 제조사 등으로 고객층을 넓혔다. 이 회사는 AI 컨설팅부터 데이터 설계, 알고리즘 개발, 운영까지 전 과정 일괄 제공하는 '슈퍼브 서비스'와 AI 개발 전주기를 포괄하는 '슈퍼브 플랫폼'을 함께 운영하고 있다. 김현수 슈퍼브에이아이 대표는 "일본 시장에서의 지속적인 성장을 바탕으로 더 많은 일본 기업들과의 협력 기회를 모색할 계획"이라며 "특히 안전관제 분야에서 일본 기업들의 수요가 높아지는 만큼 이 분야에 특화된 솔루션을 중점적으로 소개할 예정"이라고 밝혔다.

2025.04.09 15:20조이환

트웰브랩스, 아마존 '베드록' 입성…韓 최초로 영상 AI 모델 공급

트웰브랩스가 아마존의 대표 인공지능(AI) 플랫폼에 입성한다. 세계 주요 파운데이션 모델 기업들과 어깨를 나란히 하며 글로벌 영상 AI 시장 주도권 확보에 나서는 모양새다. 트웰브랩스는 아마존웹서비스(AWS)의 완전 관리형 AI 서비스 '아마존 베드록'에 자사 멀티모달 AI 모델인 '마렝고'와 '페가수스'를 제공하기로 했다고 7일 밝혔다. 국내 기반 영상 AI 모델이 '베드록'에 들어가는 것은 이번이 처음이다. 아마존 '베드록'은 메타, 앤트로픽, 미스트랄AI, 스태빌리티AI 등 세계 유수의 AI기업 모델을 단일 애플리케이션 프로그램 인터페이스(API)로 제공하는 플랫폼이다. 아마존 내부 모델인 '노바'를 제외하면 트웰브랩스는 베드록 내 유일한 영상이해 AI 제공사로 자리하게 됐다. 트웰브랩스의 영상 모델들은 객체, 행동, 배경음 등 영상 내 요소를 자연어로 검색하고 해석할 수 있다. 이를 통해 영상 콘텐츠의 검색, 분류, 요약, 인사이트 추출 등 전 과정을 자동화할 수 있는 것이 특징이다. 이에 고객은 '베드록'에서 인프라 관리 없이 트웰브랩스 모델을 활용해 생성형 AI 기반 영상 서비스를 구축할 수 있게 된다. 모델이 작은 영상 클립부터 대규모 콘텐츠 라이브러리까지 일관된 분석 성능을 제공하고 기업 수준의 보안 및 데이터 통제 기능도 갖췄기 때문이다. 업계 일각에서는 이번 협력이 스포츠, 미디어, 엔터테인먼트, 광고 등 영상 중심 산업 전반에 파급력을 미칠 것으로 전망한다. 방송사와 스튜디오는 촬영분 아카이빙을 자동화할 수 있고 스포츠 팀은 하이라이트를 자동 생성해 팬 맞춤형 콘텐츠를 제작할 수 있게 된다. 트웰브랩스는 AWS와의 전략적 협업 계약(SCA)을 바탕으로 아마존 '세이지메이커 하이퍼팟'도 활용 중이다. 이를 통해 모델 학습 속도는 최대 10% 빨라졌고 비용은 15% 이상 절감한 것으로 알려졌다. 글로벌 진출도 본격화하고 있다. 회사는 AWS 액티베이트 프로그램의 지원을 통해 해외 확장을 준비 중이며 AWS 마켓플레이스를 통해 전 세계 고객에게 자사 서비스를 제공할 계획이다. 사미라 파나 바크티아르 AWS 미디어·엔터테인먼트 총괄은 "트웰브랩스 모델 도입으로 영상 데이터의 활용이 쉬워졌다"며 "기업들이 인프라 없이도 AI 기술을 확장 가능하게 됐다"고 밝혔다. 이재성 트웰브랩스 대표는 "세계 영상 데이터의 80%가 사실상 미활용 상태"라며 "이번 베드록 공급은 우리 기술력이 세계 최고 수준임을 입증한 결과"라고 말했다.

2025.04.07 15:30조이환

캐럿, 구글 최신 영상 생성 AI '비오2' 탑재

인공지능(AI) 영상 생성 플랫폼 '캐럿' 운영사 패러닷(대표 장진욱)이 구글 딥마인드가 개발한 차세대 고성능 영상 생성 AI 모델 '비오2'를 탑재했다고 31일 밝혔다. 비오2는 기존 모델 대비 물리 법칙과 인간 움직임에 대한 이해도가 높다. 따라서 다양한 구도를 활용해 영상을 제작할 수 있으며, 결과물 품질 또한 더욱 자연스럽고 사실적이다. 아울러 우수한 프롬프트 이행 능력으로 사용자 의도를 영상에 정확히 반영하며, 다양한 렌즈 효과, 영화적 기법 등을 학습해 제작자 창의성을 더욱 폭넓게 구현할 수 있다. 캐럿은 구글 승인을 받아 비오2의 정식 서비스 제공을 시작했다. 현재 비오2는 비공대 베타 테스트 단계로, 일부 기업에게만 제공하고 있다. 캐럿은 현재 720p 화질로 5초 영상 생성을 지원하지만, 향후 4K 화질, 최대 2분까지 수준을 높일 계획이다. 또한 비오2 탑재를 기념해 사용자를 대상으로 해당 기능을 7일까지 30% 할인가에 제공한다. 장진욱 패러닷 대표는 "캐럿이 국내 대표 AI 영상 플랫폼으로서 비오 2를 고객에게 선보일 수 있어 기쁘다"며 "앞으로도 사용자들이 글로벌 AI 콘텐츠 트렌드를 손쉽게 따라갈 수 있도록 최신 모델을 발빠르게 탑재하겠다"고 말했다. 캐럿은 이미지 및 영상 콘텐츠 제작을 특화시켰다. 현재 이마젠3, 플럭스 등 이미지 생성 모델 7개, 비오 2, 클링 등 영상 생성 모델 9개를 지원한다. 각 모델을 개별 구독할 필요 없이 캐럿에서 제공하는 멤버십에 가입하거나 포인트를 충전, 사용하는 일 만으로 합리적인 가격에 고품질 콘텐츠를 제작할 수 있다.

2025.03.31 08:44백봉삼

"中에 220배 뒤처져"...자율주행차 발목잡는 규제

“지난해까지 중국 바이두가 쌓은 자율주행 운행 기록이 1억1천만km였다. 국내 1위 업체로 평가받는 오토노머스에이투지가 50만km로 약 220배 차이가 난다. 방대한 데이터 차이를 극복하려면 양질의 데이터를 수집할 수 있게 해야 한다.” 이상동 한국자율주행산업협회 팀장은 지난 27일 열린 '자율주행 산업 지원 국회 토론회'에서 이같이 말했다. 최근 중국 스타트업이 내놓은 AI 모델 '딥시크'가 저성능 칩으로 충격적인 성능을 보여주자 BYD와 지리 등 현지 자동차 기업들이 잇따라 자율주행 기술에 딥시크를 활용하겠다고 나섰다. 일찍이 자율주행 기술을 내세워온 테슬라도 지난해 말 완전자율주행(FSD) 소프트웨어 최신 버전을 업데이트하고, 오는 6월 이를 기반으로 한 로보택시 서비스를 예고하는 등 기술 고도화에 집중하는 추세다. 해외 기업들이 실제 주행 데이터를 수집하고, 이를 토대로 기술을 고도화하는 반면 우리나라는 데이터 수집 제한 규제로 양적 격차가 크게 벌어지고 있다는 지적이다. 이상동 팀장은 “AI 기업과 자율주행 기업, 완성차 기업들이 경계선 없이 넘나들면서 협업을 하며 AI 학습을 위한 데이터 수집과 활용이 중요하게 됐다”며 “국내에 자율주행차가 돌아다니려면 국내 환경에 맞는 최적화 데이터가 꼭 필요하다”고 강조했다. 특히 국가 차원에서 양질의 주행 데이터를 수집하는 것이 바람직하다고 봤다. 영세한 스타트업도 산업에 진입할 수 있게 하자는 취지다. 지난 2023년 개인정보보호법 개정에 따라 '이동형 영상정보처리기기'라는 개념으로 주행 영상을 데이터로 활용할 수 있는 법적 근거가 마련됐다. 그러나 데이터의 질적 측면에서 미국, 중국 등 자율주행 기술에 공들이는 국가 대비 여건이 불리하다는 지적이다. 이 팀장은 “테슬라로 예를 들면, 500만대 차량이 도로를 주행하며 사고가 발생하면 당시 영상을 그대로 본사에 전송함에 따라 그 데이터를 자율주행 AI 성능 개선에 활용하고 있다”며 “이런 회사와 규제 샌드박스 차량 몇십 대의 주행 데이터를 토대로 기술을 개발하는 (우리나라) 회사 간 경쟁력이 어디에 있겠나”라고 강조했다. 특히 현 제도 하에서 주행 영상 데이터를 활용할 때 개인정보 비식별화 처리 과정을 거치게 하는 점을 문제 삼았다. 비식별 처리된 영상을 학습한 AI보다 원본 영상을 학습한 AI가 객체 인식이나 주행 판단의 정확도가 17% 이상 높아졌다는 연구 결과를 소개했다. 이 팀장은 “특히 야간 주행, 악천우 등 복잡한 도심 환경에서 원본 주행 영상의 활용 가치가 더욱 올라간다”고 덧붙였다. 우리나라에선 설정된 규칙에 따라 자율주행 AI 모델이 주어진 상황을 인지하고 제어하는 반면, 테슬라 등 선도 기업들은 AI가 사람처럼 새로운 상황에서도 적절한 판단을 할 수 있도록 엔드투엔드(E2E) 방식을 쓰고 있는 점에도 주목했다. E2E 방식 자율주행 AI 성능을 개선하기 위해 더욱 양질의 주행 데이터가 요구되고 있다는 분석이다. 이 팀장은 “결국 모든 사례를 사전에 정의할 수 없기 때문에, 정의된 내용을 벗어나는 사례에서 자율주행 AI가 어떻게 대응할지 모른다는 기술적 어려움이 있다”고 첨언했다. 규제 샌드박스를 통해 원본 주행 데이터 활용이 일부 허용되고 있지만, 대규모 개발 프로젝트에는 한계가 있어 많은 기업들이 비식별 처리된 영상 데이터를 사용할 수밖에 없는 상황이다. 이 팀장은 “규제 샌드박스는 일시적인 예외를 두는 제도인데 자율주행 산업은 계속 고도화해나갈 산업”이라며 “원본 주행 데이터 활용에 대한 지속적인 법적 근거가 마련돼야 한다”고 주장했다.

2025.02.28 18:37김윤희

  Prev 1 2 3 4 Next  

지금 뜨는 기사

이시각 헤드라인

삼성 파운드리, 현대차 8나노 車 반도체 수주

OTT 중도해지 제재 시끌…"소비자 보호" VS "체리피킹 우려"

'메이플스토리' 성지 될까…강남에 문 연 '메이플 아지트' 가보니

나라장터 복구됐지만 기업·기관 '혼선'…공공사업 유찰 속출

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.