• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
스테이블코인
배터리
AI의 눈
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'AI 영상'통합검색 결과 입니다. (66건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

[AI는 지금] 구글도 숏폼에 '올인'…AI 영상 '비오'에 세로형 지원 나선 이유

구글이 인공지능(AI) 영상 생성 모델 '비오'를 숏폼 콘텐츠에 적합한 세로형 영상 제작이 가능하도록 개선했다. 빠르게 성장하는 숏폼 영상 시장과 AI 영상 생성 주도권을 동시에 겨냥한 전략적 행보로 풀이된다.14일 테크크런치에 따르면 구글은 지난 13일 '비오 3.1'에 9대 16 비율의 네이티브 세로 영상 생성 기능을 추가했다. 이를 통해 이용자는 유튜브 쇼츠를 비롯해 인스타그램, 틱톡 등 주요 소셜 플랫폼에 최적화된 영상을 별도의 크롭 없이 바로 제작할 수 있게 됐다. 해당 기능은 유튜브 쇼츠와 유튜브 크리에이트 앱에도 직접 통합됐다.이번 업데이트로 참조 이미지를 활용한 영상 생성 품질도 대폭 개선됐다. 짧은 프롬프트만으로도 캐릭터의 표정과 움직임이 보다 자연스럽게 구현되며 캐릭터·오브젝트·배경 간의 일관성이 강화됐다. 여러 요소를 결합해 하나의 통합된 영상 결과물을 만드는 기능 역시 추가됐다. 구글이 이처럼 나선 것은 영상 소비 구조의 변화 때문으로 분석된다. 글로벌 콘텐츠 시장에서 가로형 중심의 영상 소비는 빠르게 세로형 숏폼으로 이동하고 있고, 유튜브 쇼츠·틱톡·인스타그램 릴스가 핵심 유통 채널로 자리 잡은 탓이다. 구글 입장에선 유튜브 생태계를 지키기 위해 AI 영상 생성 단계부터 쇼츠에 최적화된 환경을 제공할 필요성이 커졌다. 동시에 AI 영상 생성 시장을 둘러싼 경쟁도 구글의 행보에 영향을 미쳤다. 오픈AI의 소라, 런웨이, 메타의 생성형 AI 도구 등 경쟁사들이 고품질 영상 생성과 크리에이터 친화적 기능을 앞세우는 가운데 구글은 기술 성능과 플랫폼 결합을 차별화 전략으로 선택했다. '비오'를 중심으로 생성된 콘텐츠가 유튜브 쇼츠와 크리에이트 앱으로 자연스럽게 이어지도록 설계해 제작부터 배포까지 구글 생태계 안에서 완결되도록 한 것이다. AI 영상 생성이 점차 대중화되고 있다는 점도 한 몫 했다. 기존 생성형 영상 도구는 복잡한 프롬프트 작성이 진입 장벽으로 작용해 왔다. 그러나 '비오 3.1'은 참조 이미지 활용과 자동화된 표현력 개선을 통해 전문 지식이 없는 일반 사용자나 소규모 크리에이터도 손쉽게 고품질 영상을 만들 수 있도록 방향을 잡았다. 이번 업데이트는 소비자용 기능에 그치지 않는다는 점도 주목할 요소다. '비오 3.1'의 고급 기능은 구글의 영상 편집 도구 플로우(Flow), 제미나이 API, 버텍스 AI, 구글 비즈 등을 통해 기업과 전문가에게도 제공된다. 여기에 1천80p, 4K 업스케일링 기능까지 더해지며 광고·마케팅·브랜드 영상 제작 등 B2B 영역에서의 활용 가능성도 확대됐다. 업계 관계자는 "구글의 비오 3.1 업데이트는 숏폼 중심으로 재편된 콘텐츠 시장에서 유튜브의 경쟁력을 유지하고, AI 영상 생성 기술을 플랫폼·클라우드 사업과 연결해 확장하려는 다층적인 전략의 결과로 보인다"며 "AI 영상 기술 경쟁이 본격화된 상황에서 구글이 이번 일을 통해 주도권을 가질 수 있을지 주목된다"고 말했다.

2026.01.14 17:24장유미 기자

세미파이브, 한화비전 AI 반도체 '와이즈넷9' 양산 가속화

글로벌 AI 맞춤형 반도체(ASIC) 전문 기업 세미파이브는 한화비전과 협력 개발한 보안 카메라용 AI ASIC 반도체 '와이즈넷(Wisenet)9'이 양산 확대 단계에 돌입했다고 14일 밝혔다. 이번 프로젝트는 지난해 3분기 초도 물량 PO(구매주문) 수주를 시작으로, 지난해 4분기부터 수십만 개 단위의 추가 양산 PO로 이어지고 있다. AI 보안카메라 시장은 영상 기록 중심의 기존 CCTV를 넘어, 실시간 분석과 현장 대응을 전제로 한 지능형 시스템 중심으로 재편되고 있다. 이에 따라 제품에 탑재되는 반도체 역시 저전력·실시간 처리·비용 효율성을 동시에 충족해야 하며, 이러한 요구사항을 실제 제품 양산으로 연결할 수 있는 설계 및 공급 서비스 역량의 중요해지고 있다. 이번 양산 확대는 영상보안 환경에 최적화된 맞춤형 AI 반도체가 상용 제품에 적용돼, 사업화 단계에 안정적으로 안착했음을 보여주는 사례다. AI 기반 영상보안 전략을 강화하고 있는 한화비전은 지능형 영상보안 솔루션으로의 전환을 추진하고 있으며, 세미파이브는 반도체 설계 핵심 파트너로서 지속적인 협업을 이어가고 있다. 한화비전 관계자는 “고화질 영상 처리와 AI 추론을 효율적으로 분담·처리할 수 있는 전용 반도체에 대한 수요가 확대되고 있다”며 “AI 기반 영상보안 수요가 점차 확대되는 가운데, 이번 양산을 계기로 한화비전의 지능형 보안 솔루션 경쟁력과 시장 대응력이 더욱 강화될 것으로 기대한다”고 덧붙였다. 세미파이브 관계자는 “빠르게 성장하는 영상보안 시장에서 기술 리더십을 갖춘 고객사의 핵심 제품에 적용되는 AI 반도체를 함께 개발해 실제 양산으로 이어졌다는 점에서 의미가 있다”며 “현재 제품 적용 범위와 공급 물량이 단계적으로 확대되고 있어, 이번 양산 경험을 바탕으로 향후 다양한 비전 AI 분야에서도 고객사의 제품 경쟁력 강화를 지속적으로 지원해 나갈 계획”이라고 말했다.

2026.01.14 08:50장경윤 기자

캐럿, 대화만으로 앱 만드는 'AI 미니앱' 출시

생성형 AI 플랫폼 캐럿이 개발 지식이 전혀 없어도 누구나 손쉽게 앱을 제작할 수 있는 '미니앱 생성 기능'을 출시했다고 22일 밝혔다. 캐럿은 이미지, 영상, 음악 등 다양한 형태의 콘텐츠를 대화 기반으로 제작할 수 있는 AI 에이전트 서비스다. 이번에 선보인 'AI 미니앱 생성 기능'은 개발 전문 지식이 전혀 없는 사용자도 대화만으로 자신만의 웹 애플리케이션을 만들 수 있다는 것이 핵심이다. 사용자가 캐럿 에이전트에게 특정 주제의 미니앱을 만들어 달라고 요청하면 AI가 기획부터 디자인, 개발까지 전 과정을 수행한 후 실행 가능한 미니앱을 제공한다. 이번 기능은 어린이도 직접 학습용 앱을 만들 수 있을 정도로 직관적이고 쉬운 사용성을 자랑한다. 특히 캐럿의 AI 미니앱은 단순히 텍스트 기반 앱에 그치지 않고, 이미지·영상·음악 생성 및 웹 검색 등 캐럿이 보유한 멀티미디어 AI 도구를 통합적으로 활용한다. 이를 통해 사용자들은 보다 완성도 높은 AI 미니앱을 제작할 수 있다. 캐럿은 향후 데이터베이스 연동, 결제 시스템 등의 통합 기능도 순차적으로 제공할 예정이다. 이용자들은 AI 미니앱 서비스를 통해 자기만의 외국어 단어장이나 미션 기록 앱, 밸런스게임 등 다양한 형태의 앱을 만들 수 있다. 장진욱 캐럿 대표는 “누구나 아이디어만 있다면 AI와 함께 자신만의 콘텐츠를 만들 수 있도록 돕는 것이 캐럿의 지향점”이라며 “앞으로도 사용자 중심의 AI 기능을 지속적으로 고도화해 모두가 더 쉽고 편리하게 AI를 활용할 수 있도록 하겠다”고 밝혔다.

2025.12.22 18:01백봉삼 기자

알리바바클라우드 "영상 생성 AI '완 2.5', 경쟁사 모델보다 압도적 가성비"

"현재 인터넷에서 생성되는 콘텐츠의 약 50%를 인공지능(AI)이 만들고 있습니다. 알리바바클라우드는 영상 생성 AI 모델 '완 2.5'를 통해 누구나 합리적인 비용으로 고품질의 비디오와 이미지를 제작할 수 있는 환경을 지원합니다." 알리바바클라우드 임종진 테크 리드는 11일 서울 중구 신라호텔에서 열린 'AI & 클라우드 컨퍼런스 2025(ACC 2025)'에서 자사의 최신 AI 영상 모델(VLM)인 '완 2.5 프리뷰(Wan 2.5-Preview)'를 소개하며 이같이 강조했다. 임 리드는 이번 발표에 앞서 알리바바그룹의 대규모 투자를 언급했다. 그는 "에디 우 알리바바클라우드 회장이 올해 초 향후 3년 간 AI와 인프라 리소스에 75조원을 투자하겠다고 밝혔다"며 "이 중심에 비디오 파운데이션 모델 '통이(Tongyi)'가 있다"고 설명했다. 이어 "통이 2.6 모델은 이르면 차주 중 공개될 것으로 예상한다"고 덧붙였다. 임 리드는 이날 발표의 핵심인 '완 2.5 프리뷰' 모델의 강력한 멀티모달 기능을 시연했다. 그는 "완 2.5는 텍스트·이미지·오디오·비디오 등의 입·출력을 모두 지원하는 네이티브 다중 모델 프레임워크"라며 "모델 학습 단계에서는 인간 피드백 기반 강화 학습(RLHF)라는 아키텍처를 채택해 자연스러운 결과물을 만들어낸다"고 소개했다. 특히 영상과 음향의 정교한 동기화 기능이 주목받았다. 임 리드는 "탁구공이 튀는 소리나 스키를 탈 때 얼음이 갈리는 소리까지 영상과 거의 정확히 일치시킬 수 있다"며 "한국어 립싱크 또한 어색함 없이 구현 가능하다"고 설명했다. 기존 이미지 생성 AI의 고질적인 문제였던 '텍스트 렌더링' 능력도 대폭 개선됐다. 임 리드는 "한글이나 영어 텍스트가 깨지지 않고 정확하게 생성된다"며 "복잡한 시스템 아키텍처 다이어그램이나 플로우 차트까지 전문가급으로 그려낼 수 있어 업무 활용도가 높다"고 강조했다. 임 리드는 경쟁사 대비 압도적인 '가성비'를 완 모델의 최대 강점으로 꼽았다. 그는 "720p 해상도의 10초 영상을 생성할 때 경쟁사 모델들은 약 3~5달러가 소요되지만, 완 2.5는 단 1달러면 충분하다"며 "대량의 콘텐츠를 발주하면 추가 할인이 제공될 수 있어 비용 절감에 크게 도움될 것"이라고 자신했다. 기업 실무자를 위한 구체적인 활용 팁도 제시했다. 임 리드는 "단순한 명령어보다는 조명·카메라 구도·렌즈 종류 등 구체적인 '힌트'를 프롬프트에 포함해야 고품질의 결과물을 얻을 수 있다"고 조언했다. 아울러 자사에서 완 모델로 제작한 영상과 이에 활용된 프롬프트를 예시로 정리한 자료도 공유했다. 임 리드는 "완 2.5 프리뷰는 현재 웹사이트와 API를 통해 바로 사용할 수 있다"며 "알리바바클라우드의 AI 솔루션을 통해 기업들이 비즈니스 혁신을 이루길 바란다"고 밝혔다.

2025.12.11 13:16진성우 기자

데이븐AI, 공모전 지원 이벤트 시작..."지원만 해도 보상"

AI 창작 테크 스타트업 데이븐AI가 '참가만 해도 보상받는' 공모전 지원 이벤트를 시작했다고 9일 밝혔다. 이번 이벤트는 콘텐츠 창작자들이 보다 안정적이고 부담 없는 환경에서 자유롭게 창작할 수 있도록 기획됐다. 기존 공모전의 결과 중심 구조를 넘어, AI 를 처음 접하는 일반인들에게도 참여 자체를 독려하기 위해 보상을 한다는 점에서 주목받고 있다. 데이븐AI의 공모전 지원 이벤트는 '도전하기 → 제출하기 → 입상하기'의 3단계로, 각 단계마다 토큰 보상을 지급하는 것이 특징이다. 1단계 '도전하기'에서는 공모전에 처음 참여하는 무료 사용자에게 라이트 멤버십을 무료로 체험할 수 있는 기회를 제공한다. 라이트 멤버십 가입 시 600토큰(약 1만원 상당)이 즉시 지급되며, 이를 활용해 AI 영상 생성 툴로 약 30개 이상의 영상, 100여개 이상의 이미지나 음악 콘텐츠를 제작할 수 있다. 2단계 '제출하기'에서는 참여자가 콘텐츠를 제작해 공모전에 제출하고 관리자 승인을 받으면 건당 500토큰이 추가 지급된다. 3단계 '입상하기'에서는 심사를 통해 입상할 경우 최대 2천~3천 토큰 수준의 보상이 추가로 주어진다. 지급된 토큰은 데이븐 플랫폼 내 AI 툴에서 이미지, 영상, 음악, 쇼츠, 동화책, 광고 영상 등 다양한 형태의 콘텐츠 제작에 활용할 수 있다. 데이븐AI의 공모전 지원 이벤트는 참가자 모두에게 실질적인 창작 자원을 제공함으로써 누구나 AI 콘텐츠를 제작하고 크리에이터가 될 수 있도록 진입장벽을 낮추는 것을 목표로 한다. 데이븐AI 김연지 최고마케팅책임자는 "창작 AI가 태동하는 지금이 다양한 AI 공모전을 계기로 AI 를 통한 창작을 경험하고 배우기에 가장 좋은 기회"라고 밝혔다. 현재 진행 중인 주요 공모전으로는 ▲해양환경공단 릴레이 영상 공모전(상금 150만 원) ▲아모레퍼시픽 AI 이노베이션 챌린지(상금 3천만원) ▲도와조 영상 공모전(상금 1천200만원) ▲롯데장학재단 사회공헌 영상 공모전(상금 1천150만원) 등이 있다. 데이븐 공식 홈페이지 또는 플랫폼 내 '공모전 탭'을 통해 누구나 바로 참여할 수 있다. 1인 창작자 시장을 겨냥해 만든 크리에이터를 위한 AI 통합 플랫폼 데이븐AI는 다양한 100여 개 AI 모델을 제공한다. 사용자가 단 하나의 명령어만으로 글·영상·음악 등을 한 번에 생성할 수 있게 한다. 데이븐AI는 이를 'AI 통합 OS'로 정의하며, 사용자가 창작의 전 과정을 한 플랫폼 안에서 해결할 수 있도록 돕는 인프라를 사용자와 함께 만들어 나가고 있다.

2025.12.09 10:57백봉삼 기자

삼성전자, 올해 특허 125건 무상 나눔…누적 7천건 달해

산업통상부는 4일 서울 삼성동 코엑스 1층(B홀 메인무대)에서 윤성환 삼성전자 상무, 70여 개 기술나눔 수혜기업 대표 등이 참석한 가운데 '2025년 산업부-삼성전자 기술나눔 행사'를 개최했다. 삼성전자는 2015년부터 금년까지 매년 빠짐없이 기술나눔에 참여해왔고 누적 제공기술은 7천8건에 달하며, 이 중 1천335건의 특허를 772개 기업에 무상으로 이전하는 등 기술나눔 참여기관 중 가장 우수한 실적을 보여주고 있다. 올해 삼성전자의 나눔대상 기술은 모바일·통신, 디스플레이, 가전, 영상·음향기기, 의료기기 등 다양한 분야의 특허들로 이루어졌으며, 99개 기업에 125건의 우수기술이 이전되었다. 특히 올해에는 삼성전자가 선도하는 모바일·통신 기술이 가장 많은 기업에 이전되었는데, 그중에서 'AI 기반 콘텐츠 자동 검색·추천 시스템'이 가장 많은 관심을 모았다. 이는 딥러닝을 통해 메시지와 콘텐츠를 대응시켜 입력된 메시지의 문맥·감정상태에 맞는 콘텐츠를 효율적으로 제공하는 기술이다. 또한 ▲ 영상의 영역별 특성을 반영해 픽셀 위치 등을 정밀하게 결정하는 영상 스케일링 장치▲ 장애물의 높이정보를 기반으로 3D 장애물맵을 생성해 청소하는 기술 ▲ 동적 비전 센서를 활용해 낙상 등 위험상황을 감지하는 기술 ▲ 건강관리 앱 등에서 누락된 건강정보를 파악한 후 사용자 생체정보 등을 감지하여 맞춤형 데이터 입력 등을 지원하는 기술 등이 이전됐다. 산업부는 “앞으로도 기술나눔을 통해 우수기술이 활발히 이전되어 우리 기업들이 적극적으로 사업화 및 시장진출에 도전할 수 있도록 지원하겠다”고 밝혔다.

2025.12.04 11:19장경윤 기자

트웰브랩스, 차세대 영상 이해 모델 '마렝고 3.0' 공개…"업계 최고 수준"

트웰브랩스가 영상 속 장면의 텍스트·음성·움직임·상황 맥락을 통합적으로 이해하는 인공지능(AI)을 선보인다. 트웰브랩스는 차세대 영상 AI 파운데이션 모델 '마렝고 3.0'을 공식 출시했다고 2일 밝혔다. 마렝고 3.0은 영상 속 대사와 몇 분 후에 등장하는 동작을 연결해 해석하고 사물·행동·감정·상황 변화를 시간의 흐름에 따라 추적하는 등 인간에 가까운 수준의 영상 이해 능력을 구현한다. 특히 이미지와 텍스트를 동시에 검색할 수 있는 '복합 이미지 검색' 기능과 사람이나 제품을 별도로 등록해 찾아볼 수 있는 '고유명사 검색' 기능도 도입됐다. 이번 모델은 36개 언어를 지원해 글로벌 기업 환경에서도 안정적으로 활용할 수 있다. 또 스토리지 비용 50% 절감, 인덱싱 속도 2배 향상 등의 효율성 개선도 확인했다는 게 트웰브랩스 측 설명이다. 마렝고 3.0은 기존 프레임 기반 분석이나 이미지·오디오 모델의 단순 조합 방식에서 벗어나 영상 이해를 위해 처음부터 설계된 네이티브 파운데이션 구조를 갖췄다. 영상 전체를 시간·공간적으로 해석하는 방식이다. 장면 간의 연속성과 맥락을 자연스럽게 파악하며 스포츠·미디어·엔터테인먼트·광고 등 고난도 콘텐츠에 대한 이해 능력이 대폭 강화된 것이다. 공공·보안 등의 영상 분석 환경에서도 높은 정확도를 보인다. 마렝고 3.0은 다양한 산업 현장에서 즉시 활용 가능하다. 프로 스포츠 리그에서는 특정 선수의 득점 장면이나 결정적 플레이만을 즉시 검색해서 찾아내 하이라이트를 빠르게 제작할 수 있으며 경기 분석 효율 향상을 지원한다. 방송·포스트 프로덕션 분야에서는 수십 년치 아카이브에서 특정 유명인의 얼굴을 '고유명사'로 등록해 원하는 행동을 하는 장면을 몇 초 만에 찾아낼 수 있다. 공공보안 쪽에서는 CCTV 영상 전체를 몇시간씩 볼 필요 없이 빠르게 원하는 장면만을 정확하게 찾아낼 수 있다. 이커머스 분야에서도 브랜드, 제품 혹은 호스트가 언제 등장하고 어떤 행동을 하고 있는지 원하는대로 즉시 검색해 볼 수 있다. 이재성 트웰브랩스 대표는 "전 세계 디지털 데이터의 90%가 영상인데 사람이 직접 분석하기에 너무 오래 걸리고 기존 기술로는 모든 것을 파악하기가 어려워 그동안 대부분 제대로 활용되지 못했다"며 "이 문제를 해결하는 것이 우리의 목표"라고 말했다. 이어 "마렝고 3.0은 그동안 영상 이해 기술이 가졌던 한계를 완전히 뛰어넘는 모델로, 기업과 개발자에게 기존과 다른 혁신적인 기준을 제시할 것"이라고 덧붙였다. AWS 니샨트 메타 AI 인프라 부문 부사장은 "트웰브랩스의 영상 이해 기술은 그동안 수작업 중심이었던 영상 분석 프로세스에 전례 없는 속도와 효율성을 제공하며 산업 전반의 혁신을 이끌고 있다"며 "마렝고와 페가수스 모델이 아마존 베드록에서 큰 성과를 거둔 데 이어, 마렝고 3.0은 세계 최고 수준의 영상 이해 능력을 필요로 하는 고객들에게 최적의 솔루션이 될 것으로 기대한다"고 강조했다.

2025.12.02 17:51한정호 기자

에스지헬스케어, 3분기 영업 흑자 전환

에스지헬스케어는 3분기 실적이 글로벌 수주 확대에 힘입어 턴어라운드에 성공했다고 1일 밝혔다. 회사의 올해 3분기 연결기준 매출액은 51억원으로 전년 동기(22억원) 대비 133% 증가했다. 영업이익은 약 1억원으로 분기 흑자 전환했다. 이번 실적 개선은 핵심 시장 점유 확대와 글로벌시장 침투 가속화 전략이 맞물리며 실질적인 성과로 이어진 결과라는 설명이다. 에스지헬스케어 관계자는 “글로벌 프로젝트 납품이 본격화되며 3분기 수익성 개선 흐름을 만들어냈다”며 “4분기에도 주요 계약에 대한 실적 반영이 이뤄지며 견조한 성장세를 유지할 것”이라고 말했다. AI 기반 영상진단 의료기기 전문기업 에스지헬스케어는 MRI, CT, 씨암(C-arm) 등 고부가 영상진단 장비 중심의 풀 라인업(Full Line-up)을 보유하고, 전 세계 81개국 136개 유통채널을 기반으로 글로벌 사업을 운영 중이다. 특히 신흥국에서 증가하는 영상진단 수요에 대응해 딜러 네트워크 확충과 대규모 입찰 참여를 지속하고 있다. 최근에는 신규사업으로 글로벌 영상진단센터 시장에 진출하며 포트폴리오 다변화에도 속도를 내고 있다. 카자흐스탄 알마티 1호점을 시작으로 향후 5년간 중앙아시아 지역에 총 15개 서울메디컬센터 지점을 구축할 계획이며, 해당 센터에는 에스지헬스케어의 영상진단 장비가 공급될 예정이다. 회사 관계자는 “양적 성장뿐 아니라 질적 경쟁력 강화를 위해 기술 개발, 영업 역량 확장, 사업 다각화에 지속 투자할 계획”이라고 말했다. 에스지헬스케어는 디지털 X-ray에서부터 'AI가속 MRI', '헬륨프리'(Free) 기술이 적용된 MRI '인빅터스'(INVICTUS)까지 풀 라인업을 구축한 기업이며, AI 기반 의료영상 소프트웨어 분야에서 글로벌 수준의 노이즈 캔슬링 기술도 보유하고 있다. 또 자회사 민트랩스를 통해 한국과학기술원(KAIST)과 2021년부터 공동 개발한 MRI AI 가속화 솔루션 'IAI'는 현재 북남미 시장 진출을 목표로 미국 FDA 510(k) 승인 절차를 진행 중이다.

2025.12.02 14:06조민규 기자

아마존 프라임 비디오, 지난 줄거리 AI가 영상으로 요약해준다

아마존의 온라인동영상서비스(OTT) 서비스 프라임 비디오가 일부 TV 프로그램에 '생성형 AI 비디오 요약(비디오 리캡스)' 기능을 도입한다. 이는 새로운 시즌을 시청하기 전 지난 줄거리를 빠르게 파악할 수 있도록 도와주는 기능이다. 19일(현지시간) 테크크런치에 따르면 아마존은 비디오 리캡스가 생성형 AI를 활용해 단순 편집본이 아닌 '극장판 수준의 시즌 요약 영상'을 제작한다고 설명했다. 이 AI 모델은 영상에 맞춰 내레이션, 등장인물의 대사, 배경음악까지 정교한 요약본을 제공한다. 이 기능은 베타 버전으로 우선 출시되며, '폴아웃', '톰 클랜시의 잭 라이언', '업로드' 등 프라임 비디오의 인기 오리지널 시리즈에 먼저 적용될 예정이다. 프라임 비디오는 이미 지난해 '엑스레이 리캡'이라는 AI 기반 기능을 선보인 바 있다. 이는 전체 시즌이나 특정 에피소드 구간을 텍스트로 요약해주는 기능으로, 스포일러를 노출하지 않도록 안전장치가 적용돼 있었다. 소비자들은 이미 문자 메시지 요약이나 구글 검색 상단의 AI 요약 등을 통해 '텍스트 기반 AI'에는 익숙해진 상태다. 이번 비디오 요약 기능은 텍스트를 넘어 시청 경험에 직접적인 영향을 미치는 시각적 영역으로 AI 활용을 확장했다는 점에서 주목받는다. 스트리밍 업계의 경쟁사들도 생성형 AI 도입에 속도를 내고 있다. 유튜브 TV는 시청자가 스포츠 중계를 처음부터 시청하지 않더라도 그전까지의 주요 장면을 모아 볼 수 있는 '키 플레이' 기능을 제공 중이다. 알고리즘이 다소 불완전한 부분이 있으나, 이 기술로 '기술 공학 에미상'을 수상했다. 넷플릭스는 서비스 기능보다는 콘텐츠 제작 측면에 AI를 적극 도입하고 있다. ▲아르헨티나 드라마 '더 에터너트'의 건물 붕괴 장면 생성 ▲영화 '해피 길모어 2' 오프닝의 배우 디에이징(젊어 보이게 만드는 기술) ▲'빌리어네어 벙커' 사전 제작 단계에서의 의상·세트 디자인 등에 생성형 AI가 활용됐다. 이런 기술 도입은 영상 산업계에 지속적인 논쟁을 불러일으키고 있다. 예술가들과 창작자들은 AI가 허가 없이 자신들의 작품을 학습해 일자리를 위협할 수 있다고 우려한다. 반면, 애니메이션이나 특수효과(VFX) 분야의 단순 반복 작업을 AI가 대체함으로써 창작자들이 더 창의적인 작업에 집중할 수 있게 될 것이라는 옹호론도 맞서고 있다.

2025.11.21 10:16진성우 기자

2030년 내연차-전기차 가격 같아진다…전기차 주행거리 1500km·충전시간 5분

정부가 전기자동차 기술개발 지원을 강화해 2030년 동급 내연기관 자동차와 동등한 수준의 판매가격을 달성할 계획이다. 또 2030년까지 차량용 반도체 자립화율을 현행 5%에서 10%로 끌어올리기로 했다. 정부는 14일 기아 화성공장 'EVO 플랜트 East 준공과 West 기공식' 이후 김민석 국무총리 주재로 '제2차 미래차 산업전략 대화'를 개최해 이같은 내용을 담은 '세계를 넘어 미래를 여는 K-모빌리티 글로벌 선도전략'을 발표하고 적극 추진하기로 했다. 정부는 우선 미국 자도차 관세 극복과 재도약을 위한 긴급처방으로 내년 자동차 산업을 지원하는 정책금융을 올해 수준인 15조원 이상으로 확대 지원하고 자동차·부품 생산을 위한 원자재 품목은 할당관세를 적용한다. 또 내년 전기차(승용) 보조금도 올해 7천150억원에서 9천360억원으로 대폭확대하고 전기·수소버스 도입을 희망하는 운수사 대상으로 구매융자 사업을 실시한다. 정부는 글로벌 보호무역주의와 국내 기업의 현지 진출 확대에 대응해 국내 400만대+α 자동차 생산량 유지와 생산의 질적 고도화를 위한 정책 지원도 강화한다. 산업통상부는 관계 부처와 함께 친환경차·첨단자동차 부품 등 생산·연구개발(R&D)·투자를 위한 인센티브 구조 재설계를 검토하고, 2026년부터 노후차 폐차 후 전기차 구매시 보조금을 최대 100만원 추가 지원하는 등 친환경차 생산 확대를 유도한다. 전기차 기술개발 지원을 강화해 2030년에는 주행거리 1천500km, 충전속도 5분, 동급 내연차와 동등한 수준의 전기차 판매 가격을 달성할 계획이다. 자동차와 부품 제조공정 전 과정에 인공지능(AI) 활용을 확산하고 미래차 AI 팩토리 구축을 위한 금융·컨설팅 등을 지원한다. 한편, 제조 인력이 보유한 현장 노하우를 데이터화해 휴머노이드에 적용하고, 'HTC(Human-Technology Collaboration)-부트캠프'를 통해 근로자와 첨단로봇의 공생을 위한 '일터 혁신'을 추진한다. 산업부는 2035 NDC 목표가 발표됨에 따라 향후 친환경차 보급이 본격화할 것으로 보고 자동차 부품기업의 미래차 전환을 선제적으로 지원한다. 2030년까지 미래차 전문기업을 200개 지정하고 내연차 부품기업의 70%가 미래차 부품기업으로 전환하는 것을 목표로 금융·R&D 등을 집중지원한다. 또 '산업 GX R&D'를 통해 부품기업의 미래차 전환 R&D를 지원한다. 2033년까지 기업·대학 등과 연계해 AI·자율주행 전문인력 등 미래차 전문인력을 7만명 육성한다. 정부는 2030년까지 미-중 자율주행 기술을 따라잡기 위한 기술개발을 집중지원한다. E2E-AI 자율주행 소버린 기술을 확보하기 위해 2030년까지 대규모 R&D 기획을 추진하는 한편, 기존의 인지·판단·제어 단계별 룰-베이스 자율주행 기술에서 AI 단일 신경망 기반 E2E 기술로 자율주행 기술개발 패러다임을 전환한다. 차량 기능이 SW로 구현되는 SDV 표준플랫폼을 LG 전자·현대모비스 주도로 개발하며, HL클레무브를 앵커기업으로 E2E-AI 자율주행 모델을 2027년까지 개발한다. 차량용 반도체 자립화율을 현 5%에서 2030년 10%까지 끌어올리기 위해 완성차 기업 중심으로 국내 공급망과 시장을 확보한다. AI 모빌리티 종합실증 컴플렉스를 조성하고 AI 자율주행 우수기업에는 그래픽 처리장치(GPU) 활용을 지원한다. 자율주행차 시대를 대비하기 위한 제도개선도 추진한다. 2028년 자율주행차(레벨2+) 본격 양산을 목표로 2026년까지 제도개선을 마무리할 계획이며. 자율주행 데이터 공유 활성화을 위한 가이드라인도 마련한다. 지난 9월 대통령 주재 제1차 규제합리화회의 후속조치로 원본 영상데이터 활용 허용, 임시운행 제한구역 완화, 자율주행 시범 운행지구 확대 등 규제를 우선 개선한다. 또 내년에는 실증범위를 도시 규모로 대폭 확대한다. 산학연 공동으로 '한국 SDV 표준화 협의체'를 구성해 한국형 표준 보급으로 글로벌 표준을 주도하고 SDV 시장을 선점할 계획이다.

2025.11.14 12:37주문정 기자

뷰웍스 의료영상 처리 소프트웨어 'VXvue', 미국 FDA 승인 획득

뷰웍스는 디지털 의료영상 획득 및 처리 소프트웨어 '브이엑스뷰'(VXvue)가 미국 식품의약국(FDA)으로부터 시판 전 허가(510K) 승인을 획득했다고 12일 밝혔다. 이번 승인으로 뷰웍스는 북미 시장에 엑스레이 디텍터 및 전용 소프트웨어가 결합된 시스템 일체를 공급할 수 있게 돼, 시장 경쟁력을 더욱 확보하게 됐다. 뷰웍스는 창사 이래 처음으로 FDA로부터 AI 기반 영상처리 알고리즘을 포함한 소프트웨어로 승인을 획득했다. 특히 기존보다 강화된 당국의 심사 기준에 맞춰 시판 의료기기와의 동등성, 품질관리 절차와 사후관리 체계를 입증하는 등 기술 역량과 신뢰성을 확보했다. 뷰웍스가 개발한 브이엑스뷰는 엑스레이 디텍터를 통해 획득한 임상 이미지의 송출과 처리를 수행하는 사용자 중심의 소프트웨어다. 임상 이미지의 선명도를 높이는 '퓨어임팩트'(PureImpact) 알고리즘을 탑재해 인체 연조직과 골격의 세부 묘사에 뛰어나며, 인체용, 수의용, 차량내 검진 등 진료 대상과 방식에 따라 세분화된 프리셋을 제공하는 등 편의성을 높였다고 회사 측은 설명했다. 최근에는 다수의 AI 기반 영상처리 솔루션을 내부 기능으로 통합하며 편의성과 사용성을 대폭 강화, ▲흉부 엑스레이 이미지에서 연조직의 가시성을 높이는 '본엑스'(Bone-X AI) ▲딥러닝 기반 알고리즘으로 영상 노이즈를 저감하는 '노이즈엑스'(Noise-X AI) 등 분야별로 특화된 기능을 갖췄다고 한다. 뷰웍스는 FDA 승인과 유럽 CE 인증 등을 빠르게 늘리며 전 세계적으로 기술력을 인정받고 있다. 지난해 11월 장형 디텍터 'VIVIX-S 1751S', 올해 1월 유방촬영술(맘모그래피)용 엑스레이 디텍터 'VIVIX-M 1824S' 및 'VIVIX-M 2430S'에 대해 FDA 승인을 취득했으며, 지난 5월에는 슬라이드 스캐너 신제품 'VISQUE DPS(Digital Pathology system) LH510'에 대해 유럽 체외진단의료기기 인증인 'CE IVDR'을 획득했다. 뷰웍스 관계자는 “이번 FDA 승인으로 뷰웍스는 하드웨어뿐만 아니라 소프트웨어 분야에서도 글로벌 기술 우위를 갖춘 기업임을 증명했다”며 “저선량 방사선 촬영, 병원 내 데이터 관리, 협진 용이성 등 최근 헬스케어 트렌드에 부합하는 고부가가치 제품을 꾸준히 선보이는 한편, 관련 규제 변화에 적극 대응해 나가겠다”고 말했다. 한편 뷰웍스는 인증 제품들을 주력으로 영업망 확대 및 마케팅에 적극 나선다는 전략으로, 이달 말 북미 최대의 영상의학 전시회 RSNA 2025에서 신소재 엑스레이 디텍터와 신규 영상처리 솔루션이 탑재된 브이엑스뷰 등 FDA 승인 솔루션을 대거 선보일 계획이다.

2025.11.12 11:55조민규 기자

트웰브랩스, LIG넥스원과 국방·우주 분야 멀티모달 AI 기술 적용 '맞손'

트웰브랩스가 LIG넥스원과 손잡고 방산·우주·위성 분야 멀티모달 인공지능(AI) 도입에 나선다. 트웰브랩스는 LIG넥스원과 전략적 업무협약(MOU)을 체결했다고 11일 밝혔다. 이번 협약으로 양사는 영상 이해 기반 멀티모달 AI 기술을 방위 산업 및 우주·위성 분야에 적용하기 위한 기술 협력과 공동 연구 기반을 마련했다. 양사는 트웰브랩스의 비디오 이해 기반 멀티모달 AI 모델 기술을 LIG넥스원의 국방·우주·위성 시스템 및 기술 개발 영역에 접목한다. 각 사가 보유한 기술력과 자원을 활용해 지능형 방위체계 및 영상 분석, 의사결정 지원 솔루션 개발을 공동으로 추진할 예정이다. 향후에는 공동 연구개발(R&D), 시범사업(PoC), 기술 검증 및 적용 모델 개발 등으로 협력을 확대해 나갈 계획이다. 이번 협력으로 트웰브랩스는 국방·공공 부문에서 기술 확장 기회를 마련하게 됐으며 LIG넥스원은 AI 기반 미래형 방위 솔루션 개발 역량을 강화한다는 목표다. 트웰브랩스 관계자는 "글로벌 무대에서 활약하고 있는 한국인들이 개발한 첨단 멀티모달 AI 기술과 국방·우주·위성 분야의 기술력이 결합된 상징적인 파트너십"이라며 "방대한 영상 데이터를 이해하고 분석하는 우리의 기술이 국방 분야의 영상 감시·정찰·지휘통제 등에 효율적으로 응용될 것"이라고 말했다. 이어 "AI 모델 경쟁 속에서 영상 이해 분야를 이끌어가는 우리의 기술력과 AI, 자율화, 지능형 방산 시스템을 향한 LIG넥스트원의 디지털 전환 로드맵이 만나 최상의 시너지를 낼 것으로 기대한다"며 "앞으로도 공동 연구개발, 시범사업 추진 등으로 협력을 확장해 나가겠다"고 덧붙였다.

2025.11.11 16:23한정호 기자

"36시간 걸리던 영상 제작, 5분 만에"...'데이븐AI' 한국 출시

인공지능(AI) 창작 테크 기업 '데이븐 AI'가 한국 시장에 공식 진출하며, K-콘텐츠의 세계적 성공과 빠르게 성장하는 1인 창작자 시장에 혁신적인 AI 통합 플랫폼을 선보인다. 데이븐 AI는 ▲글쓰기 ▲이미지 생성 ▲음악 작곡 등 각 분야에 특화된 AI 모델들을 자동으로 조합해, 마치 오케스트라 지휘자처럼 각 AI의 장점을 최대치로 끌어낸다. 이를 통해 글, 그림, 영상, 음악을 한 번에 만들어 내는 AI 통합 OS(운영체제)다. 데이븐 AI는 초보자 누구나 한글 프롬프트 단 한줄로 영상·음악·이미지 등을 하나의 대화창에서 '이탈없이' 한 번에 완성할 수 있다. 예를 들어 "우주 탄생에 대한 다큐멘터리 쇼츠 만들어줘"라고 입력하면 대본 자동 작성부터 나레이션 음성 생성, 관련 이미지·영상 자동 제작, 배경음악 작곡까지 가능해 1주일 걸리던 작업을 10여분 만에 완성할 수 있다. 유튜버나 비디오 크리에이터는 기획·대본·편집·썸네일·음악을 한 번에 제작할 수 있다. 작가와 블로거는 글쓰기부터 삽화, 북커버, 홍보물까지 자동 생성이 가능하다. 일러스트레이터와 디자이너는 아이디어 스케치부터 완성 시안까지 빠르게 반복 작업을 수행할 수 있으며, 작곡가는 작곡·편곡·앨범 아트워크, 뮤직비디오까지 동시에 완성할 수 있다. 이처럼 높은 생산성을 가능하게 하는 핵심 기술은 데이븐 AI의 'AI 컨텍스트 에이전트'다. 이 기능은 사용자의 의도와 맥락을 스스로 이해하고, 가장 적절한 구성으로 콘텐츠를 설계한다. 또 멀티모달 생성 기술을 통해 글, 이미지, 음성, 영상 등 다양한 형식의 결과물을 동시에 만들어낸다. 여기에 더해 '미세 조정' 기능은 사용자의 스타일과 선호를 학습해, 사용할수록 점점 더 정교하고 개인화된 결과를 제공한다. 덕분에 초보자부터 전문가까지 누구나 자신만의 콘텐츠를 손쉽게 제작할 수 있다. 이런 혁신의 기반에는 데이븐 AI의 독자 기술인 'AI 시너지 엔진'이 있다. 이 엔진은 사용자의 요청을 분석해 글쓰기 AI, 검색 AI, 디자인 AI를 동시에 작동시켜 최적의 결과를 조합한다. 마치 기획자·디자이너·개발자가 협업해 프로젝트를 완성하듯, 여러 AI 모델이 각자의 역할을 수행하며 유기적으로 협력하는 구조다. 또 단순한 '명령-실행' 구조를 넘어 '상호 주도형 협업' 방식으로 사람과 AI가 함께 창작하는 협업 구조를 완성했다. 사용자가 질문하거나 원하는 작업을 제안하면 AI가 보완 아이디어를 내고, 사용자가 선택하면 즉시 실행하며 개선 방향까지 제안하는 식의 양방향 협업이 이뤄진다. 크리에이터뿐만 아니라 1인 다역을 해내야 하는 업무에서도 데이븐은 실제 팀원처럼 역할을 해낸다. 마케터는 광고 카피와 디자인, 영상 제작을 통합적으로 관리할 수 있고, 직장인은 보고서·요약 등 문서 작업을 자동화할 수 있다. 교육자는 학습 자료와 퀴즈, 시험 문제까지 자동 설계할 수 있다. 데이븐 AI의 창립자 데이빗 정은 "수많은 AI 모델을 연결해 빠르고 저렴하며 새로운 사용자 경험을 제공하고, AI를 학습시킬 피드백을 축적하는 것이 우리의 초점"이라고 말했다. 또 그는 "초기 아이폰이 부품을 직접 생산하지 않고도 혁신적인 사용자 경험과 앱 생태계로 세상을 바꿨듯, 수많은 AI 모델들이 하룻밤 사이에도 쏟아지는 상황에서 데이븐 AI 역시 발상의 전환으로 접근하고 있다"고 덧붙였다. 아울러 "챗GPT가 '혼자 일하는 똑똑한 비서'라면, 데이븐 AI는 '각 분야 전문가 팀을 고용하는 것'과 같다"며 "기술 장벽을 낮춰, 아이디어만 있으면 누구나 프로 수준의 콘텐츠를 만들 수 있도록 돕는 것이 목표"라고 설명했다. 데이븐 AI는 현재 창작자를 위한 서비스에서 출발해 앞으로 전문 영화 제작 AI 서비스와 학습 지원 AI 서비스 등 다양한 수직적(Vertical) 영역으로 사업을 확장할 계획이다. 이를 통해 AI 생태계 내에서 다양한 분야를 아우르며 한국 AI 산업의 글로벌 경쟁력을 한층 강화한다는 전략이다.

2025.11.11 08:45백봉삼 기자

노타, KISA 지능형 CCTV 성능 인증 획득…AI 영상 관제 상용화 '가속'

노타가 인공지능(AI) 영상 분석 기술의 신뢰성과 완성도를 공식적으로 입증했다. 노타는 한국인터넷진흥원(KISA)이 주관한 지능형 CCTV 성능시험·인증 4개 부문(배회·침입·쓰러짐·유기)을 통과했다고 6일 밝혔다. KISA 지능형 CCTV 성능시험·인증 제도는 AI 영상 분석 기술의 객체 탐지 정확도, 행위 인식 성능, 환경 적응성 등을 종합적으로 검증하는 공신력 있는 평가 제도다. 노타는 4개 부문 평가에서 평균 95점의 높은 성적을 기록하며 자사 영상 분석 기술이 산업·공공·교통 등 다양한 실제 환경에서 안정적이고 신뢰성 있게 작동할 수 있음을 공식적으로 확인받았다. 인증을 획득한 노타의 '노타 비전 에이전트(NVA)'는 비전언어모델(VLM)을 기반으로 영상 속 객체 간의 관계와 상황의 맥락을 이해해 위험을 정밀하게 감지하고 대응할 수 있는 영상 관제 솔루션이다. 특히 노타의 독자적인 AI 모델 경량화·최적화 기술을 적용해 대규모 인프라나 네트워크 제약이 있는 현장에서도 실시간으로 정밀한 분석이 가능한 것이 특징이다. 노타는 지난 8월 코오롱인더스트리 김천2공장에 NVA를 도입하며 국내 최초로 VLM 기반 영상 관제 솔루션의 상용화를 실현했다. 이후 제조·건설·교통·공공안전 등 다양한 산업 분야로 적용 영역을 확대하고 있다. 두바이 도로교통국(RTA)과도 협력해 교통사고를 자동 인식·보고하고 상황별 대응을 제안하는 에이전트형 교통 관리 시스템을 선보일 예정이다. 또 교통·제조·안전 등 NVA 수요가 높은 동남아 시장 진출에도 속도를 내며 글로벌 시장 다각화를 추진하고 있다. 채명수 노타 대표는 "이번 KISA 인증은 노타의 AI 영상 관제 기술이 공인된 수준의 신뢰성과 완성도를 갖췄음을 입증한 결과"라며 "앞으로도 산업·교통·공공안전 등 다양한 분야에서 영상 AI 기술의 표준을 제시하고 실질적인 사고 예방과 인명 보호를 통해 사회 안전망 구축에 기여하겠다"고 말했다. 이어 "AI가 현실 공간의 상황을 인식하고 대응하는 피지컬 AI 시대가 빠르게 다가오고 있는 만큼, 생성형 AI 영상 관제 기술을 중심으로 이러한 산업적 변화 속에서 새로운 가치를 만들어가며 혁신을 선도해 나가겠다"고 덧붙였다.

2025.11.06 17:09한정호 기자

뷰웍스, 3분기 매출 537억원 기록…전년 대비 10.9% 증가

뷰웍스가 올해 3분기 연결기준 매출액 537억원을 기록, 전년 동기대비 10.9% 증가한 것으로 나타났다. 회사에 따르면 3분기는 정지영상 및 산업용 디텍터 부문에서 유의미한 매출 성장을 기록하며 전체 실적 호조를 이끌었고 제품 믹스 개선이 이어지며 상반기 수준의 매출 총이익률을 확보했으며, 영업이익은 일시적인 판관비 증가로 인해 소폭(4.9%) 감소했다. 세부적으로 보면 의료용 정지영상 디텍터 부문은 236억원의 매출을 기록하며 전년 동기대비 약 11.9% 증가했다. 유럽 지역 대형 고객사의 발주 재개로 매출액이 평년 수준으로 회복했으며 수의진단 디텍터 제품군이 견고한 성장세를 보였는데, 이는 뷰웍스의 소프트웨어 기반 산란보정 기술(SBS), AI 영상진단 보조 솔루션인 '노이즈엑스(Noise-X) AI' 등이 경쟁력 확보에 크게 기여한 것으로 나타났다. 또 유방촬영용(맘모그래피) 엑스레이 디텍터는 국내와 남미 시장에서 발주량이 큰 폭으로 증가했다. 동영상 디텍터 부문은 매출 81억원으로 전년 동기와 동일한 수준을 유지했다. 유럽과 북미 등 주요 치과 시스템 시장의 수요가 전년과 비슷한 수준으로 유지되고 있으며, 향후 주력 고객사의 발주 재개에 따라 실적이 더욱 개선될 것으로 예상되고 있다. 비파괴검사(NDT)용 산업용 디텍터 부문은 3분기 60억원의 매출을 달성하며 전년 동기(35억원) 대비 약 71% 증가하며 1년 연속 뚜렷한 성장세를 보였다. 유럽 지역은 자동 엑스레이 검사 시스템(AXI)에 필요한 산업용 CT 제품이, 중동 지역에서는 휴대용 보안 시스템의 포터블 디텍터 제품의 매출이 크게 증가했다. 회사 측은 국내의 경우 배터리 검사 애플리케이션 수요가 점진적으로 늘어나는 추세로 이는 4분기에도 이어질 것으로 전망했다. 산업용 이미징 솔루션 부문에서는 머신비전 카메라가 99억원의 매출을 거두며 전년 동기대비 약 4.5% 감소했다. 이는 반도체 시장의 성장 속에서도 신규 설비투자 둔화로 일시적인 조정 국면을 보였으며, 4분기에는 설비투자 회복이 이뤄질 것으로 회사 측은 예상했다. 3분기 의료영상 부문 호조에 힘입어 뷰웍스는 4분기에는 북미 최대의 영상의학 전시회 RSNA 2025에서 신제품 및 신규 AI 영상진단 솔루션을 다수 선보이며 영업망을 크게 확보할 계획이다. 이와 함께 반도체 및 디스플레이 시장에서 고해상도 및 대면적 이미징 솔루션 등 제품 적용 분야를 확대해 나간다는 전략이다. 뷰웍스 관계자는 “이번 3분기는 정지영상 디텍터, 산업용 디텍터 등에서 두 자릿수 매출 확대로 유의미한 실적 개선을 이룬 분기였다”며 “4분기에는 연구개발 투자와 비용 효율화를 병행해 성장 기반과 수익구조를 더욱 탄탄히 다질 것”이라고 말했다.

2025.11.06 14:49조민규 기자

[현장] "몇 분 만에 엔딩 교체"…AI 만난 영상 편집, 실시간 마법 시연

[로스앤젤레스(미국)=조이환 기자] "인공지능(AI) 도구는 퍼즐 조각과 같습니다. 창작자가 호기심을 가지고 이를 집어 들어 세상을 만드는 것이죠." 영국의 유명 콘텐츠 크리에이터 브랜든 바움은 29일 미국 로스앤젤레스에서 진행된 '어도비 맥스 2025' 기조연설 무대에서 이같이 말했다. 이날 그는 어도비 파이어플라이 라이브 시연을 시작하며 자신이 전날 게시했던 영상의 엔딩에 청중이 단 댓글에서 영감을 받아 실시간으로 재창조하는 과정을 선보였다. 바움은 자신이 어제 올린 '석상과 싸우는' 영상에 달린 "적들이 연인이 되는 반전을 기다렸다"는 댓글을 화면에 띄웠다. 그는 "이 댓글이 속편에 대한 좋은 영감이 될 수 있겠다"며 즉석에서 '석상 적이 갑자기 키스를 하려고 달려드는' 반전 엔딩 제작에 돌입했다. 그는 먼저 어도비 '파이어플라이 보드'에서 기존 영상 클립을 불러왔다. 영상 속 석상이 명확히 보이는 프레임과 사막 배경 프레임을 각각 캡처해 보드 위에 꺼내 놓으며 "퍼즐 조각을 모으기 시작했다"고 말했다. 핵심 이미지 생성에는 구글의 '제미나이 2.5 나노 바나나' 모델이 사용됐다. 바움은 "대리석 석상이 (키스하기 위해) 입술을 오므리고 사막 폭풍 속을 카메라를 향해 달려온다"는 프롬프트를 입력하고 앞서 캡처한 석상 이미지를 레퍼런스로 지정했다. 그는 "무서우면서도 멋진 결과물이 나왔다"며 생성된 이미지를 보드에 추가했다. 바움은 '변형(Vary)' 기능을 사용해 다양한 변형 이미지를 순식간에 생성했다. 그는 결과에 대해 "때로는 마법 같고 때로는 완전히 정신 나간 결과가 나오지만 그게 재미"라고 설명했다. 최종 엔딩 영상 제작에는 구글 '비오 3.1' 모델이 동원됐다. 그는 "비디오, 대리석 석상이 사막에서 카메라를 쫓아 빠르게 달려와 렌즈를 향해 입술을 오므리고 렌즈에 키스한다"는 구체적인 프롬프트를 입력했다. 앞서 생성한 이미지를 첫 프레임으로 지정하고 '비오' 모델의 오디오 동시 생성 기능을 활성화했다. 영상이 생성되는 동안 바움은 '사운드트랙 생성' 툴로 이동했다. 그는 분위기를 '드라마틱', '업비트', '코믹'으로, 스타일을 '클래식', '시네마틱'으로 설정했다. 특히 목적에는 댓글에서 영감을 받은 "적에서 연인으로 스토리"라고 직접 입력해 눈길을 끌었다. AI가 생성한 4개의 트랙 중 그는 극적인 첫 번째 트랙을 선택했다. 모든 재료가 준비되자 바움은 웹 기반 '파이어플라이 비디오 에디터'를 열었다. 기존 실사 영상 마지막 부분과 '비오'로 생성한 '키스 엔딩' AI 영상을 타임라인에 배치했다. 두 영상이 자연스럽게 연결되지 않자 그는 즉석에서 AI로 전환 장면 생성에 나섰다. 그는 두 클립 사이에 플레이헤드를 놓고 '생성 설정'을 열었다. 전환 장면의 첫 프레임은 앞선 실사 클립의 마지막 프레임으로, 마지막 프레임은 뒤따를 AI 클립의 첫 프레임으로 지정했다. 이어 "슬로우 모션, 석상이 모래 깊은 곳에서 나타나 카메라를 향해 매우 느리게 달려오기 시작한다"고 프롬프트를 입력했다. 바움은 "현재 베타 버전은 5초 길이 제한이 있다"며 "프롬프트에 '슬로우 모션'을 반복해서 넣어 길게 생성한 뒤 에디터에서 속도를 200%로 높여 원하는 길이를 맞추는 팁을 사용한다"고 귀띔하기도 했다. 생성된 전환 장면과 앞서 만든 사운드트랙까지 타임라인에 추가되자 모든 준비가 끝났다. 최종 실사 영상은 성공적으로 완성됐다. 기존 영상에서 주인공과 싸우던 석상이 장면 전환 후 모래 속에서 천천히 나타나 달려오더니 갑자기 입술을 오므리고 카메라 렌즈에 키스하는 코믹한 반전 엔딩에 청중은 큰 박수를 보냈다. 바움은 "이 모든 과정이 단 몇 분 만에 이뤄졌다"며 "호기심을 화면 위의 무언가로 바꾸었다"고 말했다. 이어 "도구가 아닌 스토리텔러가 이야기를 만든다"고 강조했다.

2025.10.30 02:55조이환 기자

"텍스트만으로 뮤직비디오 완성"…구글 클라우드, '비오 3'로 영상 제작 혁신

구글 클라우드가 텍스트 명령만으로 고품질 영상을 생성하는 차세대 인공지능(AI) 동영상 생성 모델 '비오 3'를 앞세워 콘텐츠 제작 혁신을 주도한다. 구글 클라우드는 비오 3를 도입한 국내 기업들의 성공 사례를 29일 공개했다. 비오 3는 구글 딥마인드의 기술을 기반으로 세밀한 스타일 제어와 고해상도 영상 생성이 가능한 AI 모델이다. 기존 영상 제작에 수개월이 걸리던 작업을 단 며칠 내로 단축할 수 있어 국내 미디어·엔터테인먼트 업계에서 창작 효율의 게임체인저로 평가받고 있다. 타이거 JK가 이끄는 힙합 레이블 필굿뮤직은 구글 클라우드, GS네오텍과 협력해 드렁큰 타이거의 곡 '끄덕이는 노래' 뮤직비디오를 비오 3로 제작했다. 복잡한 시각효과와 3D 연출을 텍스트 프롬프트로 구현하며 기존 수개월 걸리던 프로세스를 단 2주 만에 완성했다. 필굿뮤직 한상범 감독은 "비오 3는 아티스트의 음악적 비전을 효율적으로 시각화하는 강력한 도구"라며 "AI의 시각화 능력과 인간의 창의적 디렉팅을 결합해 새로운 예술적 가능성을 실현하고 있다"고 말했다. SM엔터테인먼트 자회사 스튜디오리얼라이브는 비오 3 기술을 활용한 AI 영화 제작 도구 '플로우'로 신곡 '리치 맨' 뮤직비디오를 공개했다. 해당 영상은 현실과 상상을 넘나드는 몰입형 비주얼을 구현해 글로벌 팬덤의 호평을 받았다. 스튜디오리얼라이브는 비오 2 베타 버전부터 구글 클라우드 및 구글 딥마인드와 협업을 이어왔으며 자체 AI 에이전트를 구축해 기획부터 영상 제작까지 전 과정에 AI를 접목하고 있다. 이승우 스튜디오리얼라이브 대표는 "케이팝 IP와 팬들이 더 깊이 연결될 수 있도록 생성형 AI를 적극 도입 중"이라며 "구글 클라우드와 협력해 차세대 콘텐츠 혁신을 주도하겠다"고 밝혔다. 패러닷의 생성형 AI 서비스 캐럿은 구글 클라우드의 '버텍스 AI' 플랫폼 기반으로 제미나이 언어 모델과 비오 3를 결합해 영상 기획부터 제작까지 자동화했다. 사용자가 영상 목적을 입력하면 제미나이가 이를 분석해 비오 3에 최적의 프롬프트를 생성하고 결과물은 즉시 렌더링된다. 장진욱 패러닷 대표는 "캐럿은 비오 3를 통해 누구나 전문적인 영상 제작 경험 없이도 고품질 콘텐츠를 손쉽게 만들 수 있도록 돕는다"며 "향후 새 AI 모델을 빠르게 도입해 누구에게나 쉽고 편리한 창작 환경을 제공할 것"이라고 말했다. 지기성 구글 클라우드 코리아 사장은 "비오 3는 콘텐츠 제작 전반에서 영상 제작의 장벽을 혁신적으로 낮추며 전문적인 수준의 영상을 빠르게 제작할 수 있는 강력한 도구로, 제작 프로세스의 효율성을 향상하고 창작자에게 더 많은 상상력과 가능성을 현실화할 수 있는 기회를 제공한다"고 강조했다. 이어 "비오 3를 통해 국내 미디어 및 엔터테인먼트 기업들이 차세대 콘텐츠 혁신을 주도하고 크리에이티브 경쟁력을 강화할 수 있도록 적극 협력할 것"이라고 덧붙였다.

2025.10.29 16:48한정호 기자

엠피에이지, 음악 교육앱 '마이뮤직파이브' 출시

엠피에이지(대표 정인서)가 AI 음악 교육 앱 '마이뮤직파이브'를 정식 출시했다고 14일 밝혔다. 마이뮤직파이브는 연주자의 소리를 실시간으로 인식해 연주음의 정확도를 판별하는 서비스다. 알맞은 시점에 악보를 자동으로 넘겨 손으로 악보를 넘기는 번거로움 없이 연주에 온전히 몰입할 수 있는 환경을 제공한다. 핵심 기능으로는 ▲왼손·오른손·양손 파트별 연습 모드 ▲사운드 인식 AI 기술을 활용해 악보를 넘겨주는 '자동 넘김' ▲미리듣기 연주와 같은 연주자의 체계적인 연습을 돕는 교육 기능을 포함한다. 또 엠피에이지가 운영하는 글로벌 디지털 악보 플랫폼을 연동해 30만 개 이상 다양한 장르의 난이도별 악보를 제공하며, 이와 함께 사용자들이 연주 영상을 공유하고 서로 소통하는 숏폼 영상 커뮤니티까지 갖춘 것이 특징이다. 마이뮤직파이브는 지난 11일 구글 플레이스토어 및 애플 앱스토어에 정식 오픈했다. 회사는 향후 사용자 경험을 개선하는 AI 음악 학습 기능을 단계적으로 업데이트해 나갈 계획이다. 특히 엠피에이지는 그동안 자체 기업부설연구소를 중심으로 음악 인식 AI 기술 개발에 주력해왔다. 음의 높이, 길이, 강약을 실시간으로 정밀 분석하는 기술을 비롯해, 사운드 멜로디를 분석해 음표를 식별하는 기술, 악보의 구조적 정보를 파악하는 기술 등 핵심 기술을 보유하고 있다. 정인서 엠피에이지 대표는 “마이뮤직파이브는 최신 AI 기술을 통해 음악을 배우고 즐기는 방식을 바꾸는 새로운 경험을 제공할 것”이라며 “글로벌 최고 수준의 악기 사운드 인식 기술과 디지털 악보 시장을 선도해 온 경험으로 전 세계 음악인들에게 사랑받는 서비스를 만들겠다”고 말했다.

2025.10.14 14:33백봉삼 기자

머스크 xAI, '월드 모델' 개발 착수…AI가 직접 게임 만든다

일론 머스크가 이끄는 xAI가 물리적 공간을 인지하고 설계할 수 있는 차세대 인공지능(AI) '월드 모델' 개발에 나선다. 13일 파이낸셜타임스(FT)에 따르면 xAI는 텍스트 기반 언어모델을 넘어 영상·로봇 데이터를 학습한 AI 기술을 활용해 직접 만든 게임을 내년 공개할 계획이다. 월드 모델은 메타와 구글 등 주요 빅테크가 집중하는 차세대 AI 기술로, 물리적 공간을 이해하고 시뮬레이션하는 능력을 구현하는 것이 목표다. 앞서 xAI는 엔비디아 출신 전문가들을 다수 영입해 영상과 로봇 데이터를 기반으로 실제 환경을 학습하는 AI 모델 개발을 진행 중이다. 특히 이 기술을 활용해 상호작용 가능한 3D 게임 환경을 자동 생성하는 등 게임 산업 적용을 목표로 하고 있으며 향후 로봇 제어 시스템에도 응용할 계획이다. 일론 머스크 xAI 대표는 자사 SNS 플랫폼 X를 통해 "내년 말까지 AI가 직접 생성한 게임을 선보일 것"이라고 밝혔으며 최근 대규모 업그레이드를 거친 이미지·영상 생성 모델을 무료로 공개하기도 했다. 현재 오픈AI의 '소라'와 같은 영상 생성 AI는 학습 데이터를 기반으로 연속된 이미지 프레임을 예측하는 수준이다. 이에 반해 월드 모델은 물리 법칙과 사물 간 상호작용을 실시간으로 이해해 훨씬 높은 수준의 현실 시뮬레이션을 가능케 하는 것으로 알려졌다. xAI는 이미지·비디오 생성 엔지니어를 포함해 다양한 멀티모달 콘텐츠 제작 인력을 모집 중이다. 특히 자사 AI 챗봇 '그록'에게 게임 제작을 학습시키는 업무 담당자도 채용하고 있다. xAI를 비롯한 구글·메타 등이 월드 모델 개발에 집중하는 가운데, 업계에서는 실제 세계를 묘사할 데이터 확보와 막대한 비용 문제 해결을 주요 과제로 꼽고 있다. 라리안 스튜디오의 마이클 다우스 퍼블리싱 총괄은 "AI가 게임 산업의 가장 큰 문제인 리더십과 비전을 해결해 주진 못한다"며 "수학적으로 계산된 게임 루프보다 사람들이 진심으로 몰입하고 싶어 하는 세계를 표현하는 것이 더 중요하다"고 말했다.

2025.10.13 14:43한정호 기자

오픈AI 소라, 출시 첫 주 '챗GPT' 다운로드 제쳤다

오픈AI의 영상 생성 인공지능(AI) '소라'가 출시 초반 흥행 기록으로 전작인 '챗GPT'를 넘어서는 돌풍을 일으켰다. 12일 앱 분석 기관 앱피겨스에 따르면 오픈AI의 새 앱 소라는 출시 첫 주 iOS에서 62만7천 건의 다운로드를 기록했다. 이는 앞서 출시된 챗GPT의 첫 주 기록인 60만6천 건을 넘어선 수치다. 소라는 지난달 30일 처음 공개됐다. 소라의 초기 흥행 속도는 챗GPT를 능가하는 수준이다. 빌 피블스 오픈AI 소라 책임자는 앱 출시 5일도 안 돼 다운로드 100만 건을 돌파했다고 직접 밝혔다. 소라의 성과는 접근이 제한된 '초대 전용' 방식으로 운영되는 가운데 달성돼 더욱 주목받는다. 출시 당시 누구나 사용할 수 있었던 챗GPT와는 다른 조건에서 거둔 성공이기 때문이다. 소라는 출시 첫날부터 시장의 폭발적인 반응을 얻었다. 공개 직후 5만6천 건의 설치를 기록하며 단숨에 미국 앱스토어 전체 3위에 올랐고 지난 3일에는 1위 자리를 차지했다. 이러한 초기 돌풍은 앤트로픽의 '클로드'나 마이크로소프트의 '코파일럿' 등 경쟁 AI 앱들의 출시 성적을 뛰어넘는 기록이다. 일론 머스크의 xAI가 내놓은 그록과 비견될 만한 수준이다. 출시 국가를 고려하면 소라의 흥행세는 더욱 두드러진다. 챗GPT가 첫 주 미국에서만 서비스된 반면 소라는 미국과 캐나다에서 동시에 출시됐으며 캐나다에서만 약 4만5천 건의 설치가 발생했다. 소셜미디어에서는 새로운 '소라 2' 모델로 제작된 영상들이 빠르게 확산하고 있다. 특히 실제와 가까운 딥페이크 영상 제작이 가능해지면서 고인이 된 배우 로빈 윌리엄스의 영상을 만드는 사례까지 등장했다. 이에 그의 딸 젤다 윌리엄스가 "AI로 생성한 아버지의 이미지를 그만 보내달라"고 공개적으로 요청하기도 했다. 앱피겨스는 "소라가 지난 1일 10만7천800건으로 일일 다운로드 최고치를 기록한 뒤 다소 안정화됐다"면서도 "초대 전용 앱인 점을 고려하면 여전히 상당한 수치"라고 분석했다.

2025.10.12 10:14조이환 기자

  Prev 1 2 3 4 Next  

지금 뜨는 기사

이시각 헤드라인

트럼프, 관세 인상 발언 하루만에 "한국과 해결책 마련"

'큰손' 애플도 백기...삼성·SK, 아이폰용 LPDDR 가격 인상

타는 목마름으로 우주와 생명, 한살림을 노래하다

정부의 '쿠팡 때리기'...알리·테무·쉬인 밀어주기라고?

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.