• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
인공지능
배터리
양자컴퓨팅
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'영상 인공지능'통합검색 결과 입니다. (27건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

트웰브랩스, 아마존 베드록에 '영상 AI' 공급…韓 AI, 글로벌 주류 '진입'

세계 주요 클라우드 플랫폼이 생성형 인공지능(AI) 확장에 나서는 가운데 트웰브랩스가 회사의 영상 AI 모델을 아마존에 공급하며 글로벌 시장 공략을 본격화했다. 트웰브랩스는 회사의 초거대 영상 AI 모델 '마렝고'와 '페가수스'를 아마존웹서비스(AWS)의 완전관리형 서비스 '아마존 베드록'을 통해 제공한다고 16일 밝혔다. 국내에서 개발된 파운데이션 모델이 글로벌 AI 플랫폼에 공식 편입된 건 이번이 처음이다. 아마존 베드록은 개발자가 단일 응용 프로그램 인터페이스(API)로 여러 AI 모델을 호출할 수 있는 플랫폼으로, 메타, 엔트로픽, 딥시크, 미스트랄AI 등 주요 AI 기업의 모델을 포함하고 있다. 트웰브랩스는 베드록 내에서 영상 이해 AI를 제공하는 유일한 서드파티 기업으로, 아마존 자체 모델인 '노바'를 제외하면 독점적 위치에 있다. 이번 공급을 통해 전 세계 AWS 고객들은 별도의 인프라 구축 없이 영상 내 객체, 행동, 배경음 등 다양한 요소를 자연어로 탐색할 수 있는 트웰브랩스의 모델을 활용할 수 있다. 영상 분석, 하이라이트 제작, 콘텐츠 태깅 등의 작업이 자동화돼 영상 기반 산업의 업무 생산성을 높일 수 있는 기반이 마련됐다. 트웰브랩스는 모델이 영상 분석 시간 단축 외에도 기업 내부의 아카이브 자산을 구조화하거나 마케팅과 서비스에 쓰이는 짧은 형식의 2차 콘텐츠를 제작하는데 쓰일 수 있다고 밝혔다. 활용 가능한 산업은 미디어, 스포츠, 엔터테인먼트 전반으로 확장된다. 실제로 북미 최대 스포츠 엔터테인먼트 기업인 메이플리프스포츠앤엔터테인먼트(MSLE)는 트웰브랩스 모델을 도입해 콘텐츠 제작 시간을 16시간에서 9분으로 줄였다. 트웰브랩스는 이를 통해 '데이터로서의 영상' 활용이 본격화될 것이라고 전망했다. 업계에서는 트웰브랩스의 아마존 베드록 진입을 '소버린 AI'의 실질적 구현 사례로 평가한다. 기존의 소버린 AI 개념이 국산 기술의 국내 활용에 머물렀다면 트웰브랩스는 글로벌 공급망 안에서 국산 AI가 주도권을 확보할 수 있음을 입증한 셈이다. 이재성 트웰브랩스 대표는 "이번 아마존 내 모델 공급 개시로 영상 데이터의 새로운 가치를 창출해 고객사의 비즈니스 성장에 기여할 것"이라며 "AWS와 지속 협력해 전 세계 기업들이 국산 영상 AI를 사용하는 진정한 소버린 AI를 실현하겠다"고 밝혔다.

2025.07.16 16:09조이환

"AI가 사진을 영상으로"…구글, '비오 3' 기능 제미나이에 통합

구글이 영상 인공지능(AI) '비오 3'의 주요기능을 '제미나이' 언어모델에 통합했다. 사진 한 장으로 동영상을 만들 수 있는 AI 기능이 사용자 경험의 핵심 축으로 자리잡게 됐다. 11일 테크크런치에 따르면 구글은 지난주부터 '비오 3' 기반 '이미지-투-비디오' 기능을 전 세계 150여 개국에 확대 적용했다. 해당 기능은 '제미나이 앱'과 '플로우 툴'을 통해 제공되며 'AI 울트라'와 'AI 프로' 유료 요금제 사용자에게만 지원된다. 무료 사용자 확대 여부는 공개되지 않았다. 사용자는 '제미나이' 앱에서 프롬프트 창 하단 '비디오' 항목을 선택한 뒤 이미지를 업로드하면 된다. 여기에 영상 분위기나 배경음에 대한 설명을 함께 입력하면 이를 바탕으로 시청각 요소가 결합된 짧은 클립이 생성된다. 생성된 영상은 즉시 다운로드하거나 타인과 공유할 수 있다. 구글은 '비오 3' 모델의 상용화 이후 7주 만에 전체 플랫폼에서 4천만 건 이상의 AI 영상이 제작됐다고 밝혔다. 모든 영상에는 '비오' 로고가 삽입된 시각적 워터마크와 함께 '신스ID' 기반의 비가시 디지털 워터마크가 포함된다. '신스ID'는 생성형 인공지능 콘텐츠 식별을 위해 구글이 개발한 기술로, 외형 변경이나 영상 편집이 이뤄져도 식별이 가능하다. 구글은 올해 초부터 '신스ID' 탐지 기능도 별도 도구로 제공하며 생성물의 투명성 확보에 주력해왔다. 이번 기능은 지난 5월 구글 I/O에서 먼저 공개된 AI 기반 영상 툴 플로우에서 선제 적용된 바 있다. 이후 같은 기능을 '비오 3' 기반 제미나이 앱에도 옮긴 것이다. 테크크런치는 "영상 생성은 요금제에 따라 하루 최대 3건까지 가능하며 미사용 횟수는 이월되지 않는다"며 "생성된 콘텐츠는 공유 또는 저장은 가능하지만 편집 기능은 제공되지 않는다"고 밝혔다.

2025.07.11 09:22조이환

구글, 생성형 AI 영상툴 '비오 3' 세계 출시…오디오까지 붙는 영상 제작

구글이 생성형 인공지능(AI) 영상 모델 '비오 3(Veo3)'를 전세계에 출시하면서 영상 제작의 진입장벽을 대폭 낮추는 기술 확장을 본격화했다. 4일 테크크런치에 따르면 구글은 '비오 3'를 이달부터 159개국 이상에서 제미나이 사용자에게 순차적으로 적용 중이다. 이 모델은 최대 8초 길이의 동영상을 생성할 수 있으며 텍스트 입력만으로 영상과 소리를 동시에 만들어준다. '비오 3'는 지난 5월 공개 당시에도 영상 품질과 프레임 전환 자연도에서 높은 평가를 받았지만 이번 세계 출시를 통해 음성까지 생성하는 '네이티브 오디오' 기능이 정식 반영됐다. 동영상 한 편 안에 장면, 움직임, 사운드를 모두 구현하는 생성형 AI는 시장 내에서도 제한된 기술로 꼽힌다. 사용자는 단순한 글을 입력하거나 캐릭터, 사물, 상황 등을 설명하는 방식만으로 애니메이션, 밈, 스토리보드 등을 즉시 생성할 수 있다. 콘텐츠 제작 초기 단계인 콘셉트 시안, 브레인스토밍, 프로토타입 영상 제작에도 유용하다. 생성 과정은 전부 '제미나이' 플랫폼 안에서 이뤄진다. 요금제에 따라 기능과 품질도 차등화된다. 'AI 프로'는 신속한 속도와 기본 품질에 중점을 두며 'AI 울트라'는 고화질 영상과 더 정교한 오디오까지 포함하는 최상위 옵션이다. 두 요금제 모두 인터넷 연결과 일정 기준의 사용자 조건을 충족해야 이용 가능하다. 또 구글은 '비오 3'에 이미지 기반 입력 기능도 곧 도입할 예정이다. 텍스트뿐 아니라 이미지를 활용해 영상으로 전환하는 기능은 현재 개발 중이며 향후 제미나이 업데이트를 통해 반영될 계획이다. 영상 제작을 위한 입력 방식 다변화를 통해 더 직관적인 창작 흐름을 노리는 것으로 풀이된다. 현재 '제미나이'에는 '비오 3 패스트'라는 경량 모델도 함께 제공되고 있다. 이는 상대적으로 짧은 시간 안에 빠르게 결과물을 확인할 수 있도록 최적화된 버전으로, 복잡한 품질 조정이나 고해상도 출력은 '울트라' 요금제 전용 기능으로 분리돼 있다. 조쉬 우드워드 구글 제미나이 담당은 "현재 이미지 기반 비디오 생성 기능도 '제미나이'에 추가하는 작업을 진행 중"이라고 밝혔다.

2025.07.04 09:23조이환

"오픈AI·구글 못지 않다"…'영상 분석 강자' 트웰브랩스, LG CNS와 新 사업 발굴 본격화

트웰브랩스가 LG CNS와 영상 분석 기술 고도화와 신규 사업 발굴을 위해 함께 나선다. 트웰브랩스는 LG CNS와 영상 AI 기술 협력을 위한 업무협약(MOU)을 체결했다고 1일 밝혔다. 이번 협약으로 양사는 미디어·방송, 공공·안전, 법률·수사기관 등 다양한 산업 분야에서 혁신적인 영상 AI 솔루션 공급을 가속화할 계획이다. 트웰브랩스는 멀티모달 신경망 기술을 바탕으로 글로벌 영상 시장 내 오픈AI, 구글과 어깨를 나란히 하고 있다는 평가를 받고 있다. 지난 4월 한국 AI 모델 최초이자 영상 모델 최초로 아마존 베드록(Amazon Bedrock)에 자사 멀티모달 AI 모델 '마렝고(Marengo)'와 '페가수스(Pegasus)'를 공급하는 성과를 이뤘다. LG CNS는 금융 분야에서 생성형 AI를 기반으로 한 기업 고객의 비즈니스 혁신을 선도하고 있다. 특히 ▲NH농협은행 ▲신한은행 ▲신한카드 ▲미래에셋생명 ▲미래에셋증권 ▲우리은행 등 주요 금융 기업의 AX 사업을 맡으며 금융 AX 시장에서도 두각을 나타내고 있다. 최근에는 공공 분야에서도 외교부, 경기도교육청, 경찰청 등의 대규모 AX 사업을 연이어 수주해 기술력을 인정 받고 있으며 제조, 물류 등 다양한 분야로 사업을 확장해 나가고 있다. 양사의 협력은 기술 및 사업적 협업 두 축으로 진행된다. 연구 협력을 통해 트웰브랩스의 영상이해 모델(Video Foundation Model, VFM)을 고도화하고 이를 바탕으로 고객 서비스 기획 및 구축으로 다양한 고객 대상 협업을 통해 사업 기회를 창출할 계획이다. 미디어·방송 분야에선 ▲뉴스, 스포츠, 드라마 콘텐츠 자동 요약 및 하이라이트 추출 ▲대규모 아카이브 영상 내 특정 키워드 및 상황 검색 ▲콘텐츠 시청 시 소비 중인 장면과 유사한 광고를 노출하는 맥락 광고 서비스 등을 제공한다. 공공·안전 및 법률·수사기관 분야에서는 ▲CCTV 특정 이벤트 자동 감지 ▲바디캠·블랙박스 영상 자동 요약 ▲사건 관련 장면 검색 등의 솔루션을 구현해 전방위 혁신을 가속화한다. 이재성 트웰브랩스 대표는 "LG CNS와의 협력을 통해 우리의 영상이해 기술이 더 많은 산업 현장에서 실질적인 가치를 창출할 수 있게 됐다"며 "양사의 시너지를 바탕으로 영상 데이터의 가치를 극대화하고 영상 분야에서 대한민국이 글로벌 AI 3대 강국으로 도약할 수 있는 토대를 마련하겠다"고 말했다.

2025.07.01 15:59장유미

캐럿, LG유플러스에 기업용 AI 영상 제작 서비스 '캐럿 Biz' 공급

인공지능(AI) 영상 생성 플랫폼 '캐럿' 운영사 패러닷(대표 장진욱)이 LG유플러스에 기업용 AI 영상 제작 솔루션 '캐럿 Biz'를 공급한다고 21일 밝혔다. 캐럿 Biz는 기업을 대상으로 세계적인 이미지·영상 생성 모델을 실행 횟수 제한 없이 제공한다. 구글 이마젠3, 런웨이, 플럭스 등 각종 AI모델을 개별 구독하는 경우와 비교해 최소 약 75% 저렴한 가격에 이용할 수 있다. 인물이 등장하는 영상에 더빙 음성 및 입 움직임을 더하는 '영상 립싱크', 특정 인물 및 사물을 학습해 콘텐츠에 반영시켜주는 '이미지 학습' 등 제작자 친화적인 기능까지 탑재했다. 앞으로 LG 유플러스는 캐럿을 활용해 직접 광고 및 마케팅 영상을 제작할 계획이다. 인공지능 중심 사업 전환(AX)을 위한 전략 일환이다. 운영사 패러닷은 LG유플러스 실무자들이 AI 창작을 신속히 익힐 수 있도록 라이언오슬링, 연신내호랭이, 김땡땡 등 유수 AI 크리에이터를 배치해 멘토링 서비스를 지원한다. 장진욱 패러닷 대표는 “어느 분야에서든 AI는 실무자 업무 역량을 10배 이상 성장시킬 수 있는 '생산성 혁신'을 일으킬 가능성이 충분하다”며 “캐럿은 앞으로 콘텐츠 및 엔터테인먼트 업계에서 유용하게 활용할 수 있는 기능을 다수 탑재한 AI 에이전트를 개발하고 제공할 계획”이라고 말했다.

2025.04.21 09:04백봉삼

구글, 제미나이에 영상 AI 모델 '비오2' 탑재…"현실 이해하는 AI 구현"

구글이 영상 인공지능(AI) 모델 '비오2'를 AI 서비스 '제미나이'에 탑재해 동영상 AI 시장 경쟁력을 높였다. 16일 더버지 등 외신에 따르면 구글은 비오2를 유료 AI 서비스인 '제미나이 어드밴스드' 이용자에게 제공하기 시작했다. 비오는 텍스트를 영상 콘텐츠로 변형할 수 있는 생성형 AI 모델이다. 2023년 5월 처음 소개됐다. 비오2는 같은 해 말 공개된 후 소수 이용자에 한해 시범 운영됐다. 이번 제미나이 통합으로 활용 범위가 넓어졌다. 제미나이 어드밴스드 사용자는 16대9 화면 비율, 720픽셀(p) 해상도, 최대 8초 분량의 짧은 영상 클립을 생성할 수 있다. 완성된 영상은 MP4 형식으로 내려받을 수 있다. 콘텐츠가 AI로 제작된 것임을 알리기 위해 자체 인증 마크 '신스 ID' 워터마크를 영상에 삽입한다. 구글은 "비오2가 실제 촬영한 듯한 정밀한 디테일을 구현할 수 있다"며 "현실적 물리 법칙과 인체 움직임을 이해해 다양한 주제에 맞는 고품질 영상을 만들어낼 수 있다"고 강조했다. 앞서 데미스 허사비스 구글 딥마인드 최고경영자(CEO)도 비오와 제미나이 결합을 통해 AI의 물리 세계 이해력을 강화할 계획이라고 밝힌 바 있다. 앞서 오픈AI는 지난해 12월 최대 1분 분량 영상을 생성하는 '소라'를 공개했다. 메타는 같은 해 텍스트 기반 영상 생성 모델 '무비젠'을 출시했다. AI 스타트업 런웨이는 4세대 동영상 생성 모델을 출시하며 3억 달러(약 4천264억원)넘는 투자 유치를 기록하는 등 기술력과 시장 가능성을 동시에 인정받고 있다. 더버지는 "구글은 오픈AI와 메타, 런웨이 등과 동영상 생성 AI 분야 경쟁에 본격적으로 뛰어들었다"고 평가했다.

2025.04.16 17:43김미정

"AI, 화재·폭력·쓰러짐까지 사전 감지"…日 산업계 사로잡은 韓 기술, 비결은?

슈퍼브에이아이가 영상관제 솔루션을 앞세워 일본 시장 공략에 속도를 낸다. 디지털 트윈과 비전 AI의 결합을 통해 산업 현장 안전관리 수요를 선점하는 행보다. 슈퍼브에이아이는 일본 도쿄에서 열리는 '넥스테크위크 인공지능 엑스포'와 '재팬 IT 위크'에 참가한다고 9일 밝혔다. 넥스테크위크는 인공지능(AI)과 블록체인 등 첨단기술 중심의 행사로 작년 3만명이 관람했고 재팬 IT 위크는 약 9만명이 찾은 일본 최대 규모의 종합 IT 박람회다. 두 전시는 각각 오는 15일, 23일부터 도쿄 빅사이트에서 열린다. 슈퍼브에이아이는 이번 전시에서 비전 AI 기반 '슈퍼브 영상관제' 솔루션을 중점적으로 선보인다. 맞춤형 AI 제안과 산업별 컨설팅도 병행해 사업 확장을 꾀한다. 직관적인 대시보드에서 실시간으로 수십 개 영상 데이터를 분석할 수 있는 구조다. 이 솔루션은 화재 연기 감지, 차량 및 얼굴 인식, 쓰러짐과 이상 행동 탐지까지 다양한 상황을 자동 판별한다. 영상 데이터를 AI 학습용으로 자동 합성해 데이터 부족 문제도 해결하며 2주 만에 현장 시스템에 도입할 수 있다. 일상어로 영상 장면을 검색할 수 있는 기능도 차별점이다. 사용자가 "빨간 모자 쓴 사람 찾아줘"라고 입력하면 비전-언어 모델(VLM)이 해당 인물의 영상과 시간을 자동으로 찾아준다. 기존 검색 방식과 달리 콘텐츠 자체를 인식하고 추출하는 구조다. 고가의 3D 라이다 없이도 2D 카메라만으로 디지털 트윈 맵을 구성할 수 있는 기술력도 갖췄다. 그래픽 처리 장치(GPU) 1대로 20대의 CCTV를 초당 3회 이상 분석해 빠른 속도와 효율성도 확보했다. 슈퍼브에이아이는 한국, 미국, 일본 법인을 기반으로 글로벌 영향력을 확대하고 있으며 특히 일본 시장에서 성과를 보이고 있다. 지난해 토요타와 재계약을 체결했고 일본제철과의 파트너십도 강화했다. 최근에는 일본 국립 의료기관과 대형 전자제품 제조사 등으로 고객층을 넓혔다. 이 회사는 AI 컨설팅부터 데이터 설계, 알고리즘 개발, 운영까지 전 과정 일괄 제공하는 '슈퍼브 서비스'와 AI 개발 전주기를 포괄하는 '슈퍼브 플랫폼'을 함께 운영하고 있다. 김현수 슈퍼브에이아이 대표는 "일본 시장에서의 지속적인 성장을 바탕으로 더 많은 일본 기업들과의 협력 기회를 모색할 계획"이라며 "특히 안전관제 분야에서 일본 기업들의 수요가 높아지는 만큼 이 분야에 특화된 솔루션을 중점적으로 소개할 예정"이라고 밝혔다.

2025.04.09 15:20조이환

트웰브랩스, 아마존 '베드록' 입성…韓 최초로 영상 AI 모델 공급

트웰브랩스가 아마존의 대표 인공지능(AI) 플랫폼에 입성한다. 세계 주요 파운데이션 모델 기업들과 어깨를 나란히 하며 글로벌 영상 AI 시장 주도권 확보에 나서는 모양새다. 트웰브랩스는 아마존웹서비스(AWS)의 완전 관리형 AI 서비스 '아마존 베드록'에 자사 멀티모달 AI 모델인 '마렝고'와 '페가수스'를 제공하기로 했다고 7일 밝혔다. 국내 기반 영상 AI 모델이 '베드록'에 들어가는 것은 이번이 처음이다. 아마존 '베드록'은 메타, 앤트로픽, 미스트랄AI, 스태빌리티AI 등 세계 유수의 AI기업 모델을 단일 애플리케이션 프로그램 인터페이스(API)로 제공하는 플랫폼이다. 아마존 내부 모델인 '노바'를 제외하면 트웰브랩스는 베드록 내 유일한 영상이해 AI 제공사로 자리하게 됐다. 트웰브랩스의 영상 모델들은 객체, 행동, 배경음 등 영상 내 요소를 자연어로 검색하고 해석할 수 있다. 이를 통해 영상 콘텐츠의 검색, 분류, 요약, 인사이트 추출 등 전 과정을 자동화할 수 있는 것이 특징이다. 이에 고객은 '베드록'에서 인프라 관리 없이 트웰브랩스 모델을 활용해 생성형 AI 기반 영상 서비스를 구축할 수 있게 된다. 모델이 작은 영상 클립부터 대규모 콘텐츠 라이브러리까지 일관된 분석 성능을 제공하고 기업 수준의 보안 및 데이터 통제 기능도 갖췄기 때문이다. 업계 일각에서는 이번 협력이 스포츠, 미디어, 엔터테인먼트, 광고 등 영상 중심 산업 전반에 파급력을 미칠 것으로 전망한다. 방송사와 스튜디오는 촬영분 아카이빙을 자동화할 수 있고 스포츠 팀은 하이라이트를 자동 생성해 팬 맞춤형 콘텐츠를 제작할 수 있게 된다. 트웰브랩스는 AWS와의 전략적 협업 계약(SCA)을 바탕으로 아마존 '세이지메이커 하이퍼팟'도 활용 중이다. 이를 통해 모델 학습 속도는 최대 10% 빨라졌고 비용은 15% 이상 절감한 것으로 알려졌다. 글로벌 진출도 본격화하고 있다. 회사는 AWS 액티베이트 프로그램의 지원을 통해 해외 확장을 준비 중이며 AWS 마켓플레이스를 통해 전 세계 고객에게 자사 서비스를 제공할 계획이다. 사미라 파나 바크티아르 AWS 미디어·엔터테인먼트 총괄은 "트웰브랩스 모델 도입으로 영상 데이터의 활용이 쉬워졌다"며 "기업들이 인프라 없이도 AI 기술을 확장 가능하게 됐다"고 밝혔다. 이재성 트웰브랩스 대표는 "세계 영상 데이터의 80%가 사실상 미활용 상태"라며 "이번 베드록 공급은 우리 기술력이 세계 최고 수준임을 입증한 결과"라고 말했다.

2025.04.07 15:30조이환

캐럿, 구글 최신 영상 생성 AI '비오2' 탑재

인공지능(AI) 영상 생성 플랫폼 '캐럿' 운영사 패러닷(대표 장진욱)이 구글 딥마인드가 개발한 차세대 고성능 영상 생성 AI 모델 '비오2'를 탑재했다고 31일 밝혔다. 비오2는 기존 모델 대비 물리 법칙과 인간 움직임에 대한 이해도가 높다. 따라서 다양한 구도를 활용해 영상을 제작할 수 있으며, 결과물 품질 또한 더욱 자연스럽고 사실적이다. 아울러 우수한 프롬프트 이행 능력으로 사용자 의도를 영상에 정확히 반영하며, 다양한 렌즈 효과, 영화적 기법 등을 학습해 제작자 창의성을 더욱 폭넓게 구현할 수 있다. 캐럿은 구글 승인을 받아 비오2의 정식 서비스 제공을 시작했다. 현재 비오2는 비공대 베타 테스트 단계로, 일부 기업에게만 제공하고 있다. 캐럿은 현재 720p 화질로 5초 영상 생성을 지원하지만, 향후 4K 화질, 최대 2분까지 수준을 높일 계획이다. 또한 비오2 탑재를 기념해 사용자를 대상으로 해당 기능을 7일까지 30% 할인가에 제공한다. 장진욱 패러닷 대표는 "캐럿이 국내 대표 AI 영상 플랫폼으로서 비오 2를 고객에게 선보일 수 있어 기쁘다"며 "앞으로도 사용자들이 글로벌 AI 콘텐츠 트렌드를 손쉽게 따라갈 수 있도록 최신 모델을 발빠르게 탑재하겠다"고 말했다. 캐럿은 이미지 및 영상 콘텐츠 제작을 특화시켰다. 현재 이마젠3, 플럭스 등 이미지 생성 모델 7개, 비오 2, 클링 등 영상 생성 모델 9개를 지원한다. 각 모델을 개별 구독할 필요 없이 캐럿에서 제공하는 멤버십에 가입하거나 포인트를 충전, 사용하는 일 만으로 합리적인 가격에 고품질 콘텐츠를 제작할 수 있다.

2025.03.31 08:44백봉삼

"中에 220배 뒤처져"...자율주행차 발목잡는 규제

“지난해까지 중국 바이두가 쌓은 자율주행 운행 기록이 1억1천만km였다. 국내 1위 업체로 평가받는 오토노머스에이투지가 50만km로 약 220배 차이가 난다. 방대한 데이터 차이를 극복하려면 양질의 데이터를 수집할 수 있게 해야 한다.” 이상동 한국자율주행산업협회 팀장은 지난 27일 열린 '자율주행 산업 지원 국회 토론회'에서 이같이 말했다. 최근 중국 스타트업이 내놓은 AI 모델 '딥시크'가 저성능 칩으로 충격적인 성능을 보여주자 BYD와 지리 등 현지 자동차 기업들이 잇따라 자율주행 기술에 딥시크를 활용하겠다고 나섰다. 일찍이 자율주행 기술을 내세워온 테슬라도 지난해 말 완전자율주행(FSD) 소프트웨어 최신 버전을 업데이트하고, 오는 6월 이를 기반으로 한 로보택시 서비스를 예고하는 등 기술 고도화에 집중하는 추세다. 해외 기업들이 실제 주행 데이터를 수집하고, 이를 토대로 기술을 고도화하는 반면 우리나라는 데이터 수집 제한 규제로 양적 격차가 크게 벌어지고 있다는 지적이다. 이상동 팀장은 “AI 기업과 자율주행 기업, 완성차 기업들이 경계선 없이 넘나들면서 협업을 하며 AI 학습을 위한 데이터 수집과 활용이 중요하게 됐다”며 “국내에 자율주행차가 돌아다니려면 국내 환경에 맞는 최적화 데이터가 꼭 필요하다”고 강조했다. 특히 국가 차원에서 양질의 주행 데이터를 수집하는 것이 바람직하다고 봤다. 영세한 스타트업도 산업에 진입할 수 있게 하자는 취지다. 지난 2023년 개인정보보호법 개정에 따라 '이동형 영상정보처리기기'라는 개념으로 주행 영상을 데이터로 활용할 수 있는 법적 근거가 마련됐다. 그러나 데이터의 질적 측면에서 미국, 중국 등 자율주행 기술에 공들이는 국가 대비 여건이 불리하다는 지적이다. 이 팀장은 “테슬라로 예를 들면, 500만대 차량이 도로를 주행하며 사고가 발생하면 당시 영상을 그대로 본사에 전송함에 따라 그 데이터를 자율주행 AI 성능 개선에 활용하고 있다”며 “이런 회사와 규제 샌드박스 차량 몇십 대의 주행 데이터를 토대로 기술을 개발하는 (우리나라) 회사 간 경쟁력이 어디에 있겠나”라고 강조했다. 특히 현 제도 하에서 주행 영상 데이터를 활용할 때 개인정보 비식별화 처리 과정을 거치게 하는 점을 문제 삼았다. 비식별 처리된 영상을 학습한 AI보다 원본 영상을 학습한 AI가 객체 인식이나 주행 판단의 정확도가 17% 이상 높아졌다는 연구 결과를 소개했다. 이 팀장은 “특히 야간 주행, 악천우 등 복잡한 도심 환경에서 원본 주행 영상의 활용 가치가 더욱 올라간다”고 덧붙였다. 우리나라에선 설정된 규칙에 따라 자율주행 AI 모델이 주어진 상황을 인지하고 제어하는 반면, 테슬라 등 선도 기업들은 AI가 사람처럼 새로운 상황에서도 적절한 판단을 할 수 있도록 엔드투엔드(E2E) 방식을 쓰고 있는 점에도 주목했다. E2E 방식 자율주행 AI 성능을 개선하기 위해 더욱 양질의 주행 데이터가 요구되고 있다는 분석이다. 이 팀장은 “결국 모든 사례를 사전에 정의할 수 없기 때문에, 정의된 내용을 벗어나는 사례에서 자율주행 AI가 어떻게 대응할지 모른다는 기술적 어려움이 있다”고 첨언했다. 규제 샌드박스를 통해 원본 주행 데이터 활용이 일부 허용되고 있지만, 대규모 개발 프로젝트에는 한계가 있어 많은 기업들이 비식별 처리된 영상 데이터를 사용할 수밖에 없는 상황이다. 이 팀장은 “규제 샌드박스는 일시적인 예외를 두는 제도인데 자율주행 산업은 계속 고도화해나갈 산업”이라며 “원본 주행 데이터 활용에 대한 지속적인 법적 근거가 마련돼야 한다”고 주장했다.

2025.02.28 18:37김윤희

알리바바, 오픈소스 '완2.1' 출시…글로벌 AI 영상 시장 '공략'

알리바바 클라우드가 인공지능(AI) 영상 생성 모델을 오픈소스로 공개해 기술 개방성을 강화한다. 브랜드 이미지를 제고하는 동시에 자사 클라우드 플랫폼의 글로벌 활용을 확대하려는 조치다. 알리바바 클라우드는 비디오 파운데이션 모델 '통이 완샹(Tongyi Wanxiang)'의 최신 버전인 '완2.1(Wan2.1)'의 140억 및 13억 패러미터 모델 4종을 출시했다고 27일 밝혔다. 해당 모델은 AI 모델 커뮤니티인 '모델스코프(ModelScope)'와 프랑스의 오픈소스 AI 플랫폼 '허깅페이스(Hugging Face)'에서 다운로드할 수 있다. 이번에 공개된 모델은 ▲T2V-14B ▲T2V-1.3B ▲I2V-14B-720P ▲I2V-14B-480P 등 4종으로 텍스트와 이미지 입력을 기반으로 고품질의 영상과 이미지를 생성하도록 설계됐다. 특히 'T2V-14B' 모델은 복잡한 동작이 포함된 고품질 영상 생성에 특화돼 있으며 'T2V-1.3B' 모델은 연산 효율성과 생성 품질의 균형을 맞춰 연구 및 개발을 위한 최적의 솔루션을 제공한다. 'Wan2.1' 시리즈는 텍스트 효과를 지원하는 최초의 AI 영상 생성 모델로, 픽셀 품질을 향상시키고 물리적 원칙을 준수하며 명령 수행 정확도를 최적화하는 데 강점을 지닌다. 이러한 성능을 바탕으로 영상 생성 AI 모델의 종합 벤치마크인 'V벤치' 리더보드에서 종합 점수 86.22%를 기록하며 1위를 차지했다. 또 허깅페이스의 'V벤치' 리더보드 상위 5개 모델 중 유일한 오픈소스 모델로 자리매김했다. 'T2V-1.3B' 모델은 일반적인 개인용 노트북에서도 480p 해상도의 5초 길이 영상을 약 4분 만에 생성할 수 있다. 이를 통해 연구자 및 개발자들이 보다 쉽고 효율적으로 AI 영상 생성 모델을 활용할 수 있는 환경이 조성될 것으로 기대된다. 또 'I2V-14B-720P' 및 'I2V-14B-480P' 모델은 이미지 기반 영상 생성 기능까지 지원한다. 사용자는 한 장의 이미지와 간단한 텍스트 설명만 입력하면 역동적인 영상 콘텐츠를 제작할 수 있으며 특정 크기 제한 없이 다양한 해상도의 이미지를 정상적으로 처리할 수 있다. 알리바바 클라우드는 AI 모델을 오픈소스로 공개한 최초의 글로벌 테크 기업 중 하나다. 지난해 8월에는 자체 개발한 대규모 AI 모델 '큐원(Qwen-7B)'을 첫 공개했으며 이후 허깅페이스의 오픈 LLM 리더보드에서 지속적으로 상위권을 유지하고 있다. 현재까지 큐원을 기반으로 개발된 파생 모델이 10만 개를 넘어서며, 세계 최대 규모의 AI 모델군 중 하나로 자리 잡았다. 알리바바 클라우드 관계자는 "영상 생성 AI 모델을 훈련에는 막대한 컴퓨팅 자원과 대량의 고품질 학습 데이터가 요구된다"며 "이번 모델의 오픈소스 개방은 AI 활용의 장벽을 낮추어 보다 효율적이고 경제적으로 고품질 영상 콘텐츠를 제작을 가능하게 할 것으로 기대된다"고 밝혔다.

2025.02.27 17:03조이환

"AI 영상 생성, 1시간에 250만원"…구글, '비오 2' 초고품질 전략 성공할까

인공지능(AI) 기반 비디오 생성 시장의 경쟁이 본격화되는 가운데 구글이 자사 영상 AI인 '비오 2'의 가격을 공개했다. 4K 초고품질 영상을 지원하나, 오픈AI의 '소라'보다 가격이 높아 비용 대비 경쟁력이 있을지에 대한 의문이 제기되고 있다. 두 모델 모두 환각 및 물리 법칙 구현 등 기술적 한계를 드러내고 있다는 점도 해결 과제다. 24일 테크크런치에 따르면 구글은 AI 비디오 생성 모델 '비오 2'의 가격을 초당 50센트(한화 약 700원)로 책정했다. 이는 시간당 1천800달러(한화 약 250만원), 분당 30달러(한화 약 4만2천원)에 해당하는 수준으로, 구글은 '비오 2'를 통해 고품질 영상 시장을 공략하며 영상 생성의 상업적 활용도를 높이려는 전략을 펼치고 있다. '비오 2'는 최대 4K 해상도를 지원하는 고급형 비디오 생성 모델이다. 구글 클라우드의 '버텍스 AI(Vertex AI)' 플랫폼을 통해 제공되며 고해상도와 정밀한 디테일을 구현하는 데 초점을 맞췄다. 다만 비용이 초당 50센트로 책정되면서 일반 사용자보다는 전문가 및 기업 시장을 겨냥한 서비스로 보인다. 특히 오픈AI의 비디오 생성 AI인 '소라'와의 가격 정책 차이가 주목된다. 오픈AI는 크레딧 기반의 구독 모델을 통해 '소라'를 운영하고 있으며 1천80p 기준 초당 20센트(한화 약 280원)로 '비오 2'보다 상대적으로 저렴한 가격을 제시하고 있다. 오픈AI의 비디오 AI 가격 구조는 이용자의 구독 플랜에 따라 달라지며 저해상도에서는 보다 낮은 비용으로 비디오를 생성할 수 있다. 현재 '소라'는 월 20달러(한화 약 2만8천원)의 챗GPT '플러스'와 월 200달러(한화 약 28만원)의 '프로' 플랜을 통해 제공되며 각각 1천 크레딧과 1만 크레딧을 지급하는 방식이다. 480p 해상도의 경우 초당 4크레딧으로 약 8센트(한화 약 110원), 1천80p 해상도에서는 초당 100크레딧으로 약 20센트(한화 약 280원)이 소모된다. '소라'는 현재 4K 해상도를 지원하지 않지만 비용 효율성 면에서는 '비오 2'보다 경쟁력이 높은 것으로 보인다. 다만 실제 영상 제작 현장에서는 두 모델 모두 완벽하지 않다는 지적이 나온다. 최근 업계 평가에 따르면 '비오 2'는 손가락, 눈동자, 피부 질감 등 세부 표현에서 비현실적인 결과가 발생하며 물리 법칙에 부합하지 않는 액체 유동성 표현 등의 문제가 드러난다. 또 '소라'는 인체 움직임에서 부자연스러운 관절 회전과 신체 비율 왜곡 현상이 잦으며 보행 시 다리 움직임이 로봇처럼 경직되는 문제를 보인다. 이 외에도 장면 전환 시 객체의 색상 및 크기 변화가 불안정해 시간적 일관성을 유지하는 데 어려움을 겪고 있다. 이 같은 기술적 한계는 두 모델이 아직 실제 영상 수준에 미치지 못하는 부분을 여실히 보여준다. 전문가들은 물리 엔진 통합 등 추가 개발이 필요하다고 지적하며 특히 의류 주름 시뮬레이션과 액체-고체 상호작용 구현이 시급한 과제라고 평가한다. 향후 개선된 기술이 도입될 경우 보다 현실적인 AI 영상 제작이 가능할 것으로 기대된다. 디나 베라다 유튜브 제품 담당 이사는 "'비오 2'는 현실 세계의 물리 법칙과 인간의 움직임을 더 잘 이해해 세밀하고 현실적인 결과물을 만든다"며 "스타일, 렌즈, 시네마틱 효과까지 지정할 수 있어 쉽고 재미있게 영상을 표현한다"고 강조했다.

2025.02.24 10:55조이환

"영상 AI의 챗GPT 순간 열까"…트웰브랩스, '페가수스-1.2' 공개

트웰브랩스가 차세대 영상언어 생성 모델을 공개해 산업 현장에서의 인공지능(AI) 활용성을 극대화한다. 트웰브랩스는 자사가 최근 개발한 '페가수스-1.2'가 다양한 길이의 영상을 분석할 수 있다고 12일 밝혔다. 이 모델은 성능이 대폭 향상돼 텍스트 요약·질의응답·하이라이트 생성 등 고도화된 영상 처리가 가능하다. 트웰브랩스는 이번 모델에 고급 비전 인코딩 전략과 토큰 감소 기술을 적용해 모델의 효율성과 이해도를 높였다. 이를 통해 기존 초거대 모델 대비 가벼운 크기로도 높은 성능을 구현했다. 특히 'GPT-4o'·'제미니 1.5 프로' 등 경쟁 모델보다 응답 속도가 빠르고 비용 효율성이 뛰어난 점이 강점으로 꼽힌다. '페가수스-1.2'는 트웰브랩스의 자체 멀티모달 임베딩 모델인 '마렝고'와 결합돼 보다 정교한 영상 이해 능력을 갖췄다. 이를 통해 엔터테인먼트·교육·보안 등 다양한 산업에서 활용될 전망이다. 일례로 방송·미디어 업계에서는 영상 콘텐츠 자동 분류, 하이라이트 추출, 교육 분야에서는 강의 요약 및 핵심 내용 정리에 활용될 것으로 기대되며 보안 산업에서는 CCTV 영상 분석과 이상 징후 탐지 등에 적용될 것으로 보인다. 트웰브랩스는 지난 2021년 설립 이후 멀티모달 신경망 기술을 기반으로 빠르게 성장했다. 글로벌 리서치 기업 CB 인사이트가 선정한 'AI 100'에 3년 연속 이름을 올렸으며 '세계 50대 생성형 AI 스타트업'에도 포함됐다. 지난해 12월에는 이승준 CTO가 포브스 '30세 미만 30인' AI 리더로 선정되며 기술력을 인정받았다. 이승준 트웰브랩스 최고기술책임자(CTO)는 "영상 속 객체의 공간적 관계와 시간적 변화를 정확히 분석하는 AI 모델이 필요하다"며 "'페가수스-1.2'는 혁신적인 시공간 정보 이해 방식을 도입해 다양한 산업 요구를 충족할 것"이라고 말했다.

2025.02.12 15:12조이환

"삼성 TV는 AI 더한 세계 베스트셀러"

삼성전자가 미국 라스베이거스에서 열리는 세계 최대 전자 전시회 'CES 2025' 개막에 앞서 공개한 TV를 '인공지능(AI)이 더해진 세계 베스트셀러'라고 미국 블룸버그통신이 평가했다. 블룸버그는 6일(현지시간) 삼성전자는 '비전 AI'라는 브랜드로 TV에 새로운 인공지능 기능을 추가해 인공지능 시장을 공략하고 있다며 이같이 보도했다. 삼성전자는 사용자의 취향·의도를 파악해 개인에게 맞춘 서비스를 제공하는 TV를 전날 선보였다. ▲영상을 보면서도 한 번 클릭하면 사용자가 원하는 정보를 알 수 있는 '클릭 투 서치' ▲외국어 영상의 자막을 실시간으로 우리말로 바꿔주는 '실시간 번역' ▲사용자 취향과 선호도를 반영해 이미지를 만드는 '생성형 배경화면' 등 기능을 공개했다. 삼성전자는 20년 동안 세계에서 가장 많이 TV를 판 업체라며 다양한 회사와 협업해 비전 AI 제품을 늘릴 것이라고 블룸버그는 분석했다. 삼성전자는 마이크로소프트와 구글 등 기업들과 손잡고 AI 서비스를 제공하기로 했다.

2025.01.06 17:20유혜진

엔비디아, 35만원짜리 AI앱용 칩 출시

인공지능(AI) 반도체 기업 엔비디아가 AI 응용프로그램에 쓰는 소형 컴퓨팅 기판 '젯슨(Jetson)' 신제품을 출시한다고 미국 일간지 월스트리트저널(WSJ)이 17일(현지시간) 보도했다. 신제품 이름은 '오린 나노 슈퍼(Orin Nano Super)'다. 가격은 이전 제품(499달러)의 절반인 249달러(약 35만원)다. 엔비디아는 젠슨 황 창업자가 이를 소개하는 영상을 공개했다. 그는 갓 구운 빵처럼 쟁반에 담긴 신제품을 오븐에서 꺼내 손바닥 크기라고 선보였다. 엔비디아는 첨단 칩을 탑재하지 않았지만 이전 제품보다 속도가 2배 빠르고 연산 작업을 70% 더 많이 처리할 수 있다고 밝혔다. 이처럼 비교적 사양이 낮은 제품이라 중국에서도 팔 것이라고 엔비디아는 설명했다. 미국은 엔비디아가 첨단 칩을 중국에서 팔지 못하게 했다. 중국이 첨단 칩을 군사용으로 쓸 수 있다고 봐서다.

2024.12.18 16:23유혜진

오픈AI '소라' 게임 콘텐츠 무단 활용 의혹…"법적 리스크 커"

오픈AI가 최근 출시한 비디오 생성 인공지능(AI) '소라'에 게임 콘텐츠를 훈련 데이터로 사용했다는 주장이 제기되면서 법적 문제가 우려되고 있다. 12일 테크크런치에 따르면 '소라'는 텍스트 프롬프트나 이미지를 기반으로 최대 20초 길이의 비디오를 생성할 수 있는 기능을 갖추고 있다. 이미 오픈AI는 '소라'를 시연할 때 훈련에 유명 비디오게임 마인크래프트의 플레이 영상을 사용했다고 밝혔으며 전문가들은 다른 게임 콘텐츠도 훈련 데이터로 포함됐을 가능성이 높다고 분석했다. 실제로 '소라'는 닌텐도 게임인 '슈퍼마리오 브라더스'나 유명 1인칭 슈팅 게임인 '콜오브듀티' 스타일의 영상을 생성할 수 있다. 이와 함께 유명 트위치 스트리머의 외모를 반영한 캐릭터도 만들어내고 그의 문신을 복제하는 등 저작권 문제가 불거질 소지가 큰 것으로 나타났다. 법률 전문가들은 오픈AI가 무단으로 게임 플레이 영상을 사용했을 경우 저작권 침해 소송에 직면할 수 있다고 경고했다. 특히 게임 콘텐츠에는 개발사 뿐만 아니라 스트리머 등 여러 이해관계자가 얽혀 있어 저작권 관련 법적 리스크가 크다. 오픈AI는 훈련 데이터 출처에 대해 명확히 밝히지 않고 있으며 공공 데이터와 라이센스 데이터를 활용했다고만 언급했다. 지적재산권 변호사인 조슈아 와이겐스버그는 "비디오 게임 플레이 영상을 무단으로 사용하는데는 많은 리스크가 있다"고 밝혔다.

2024.12.12 11:27조이환

"동영상 생성 AI 최강자 떴다"…오픈AI '소라' 출시에 빅테크도 일자리도 '충격'

동영상 생성 인공지능(AI) 최강자로 지목된 오픈AI의 '소라'가 드디어 모습을 드러내며 구글, 메타 등 경쟁자들을 긴장시키고 있다. 텍스트만으로도 빠른 시간 내에 원하는 동영상을 간편하게 만들 수 있다는 점에서 일자리 위협을 느낀 예술가들의 반발도 더 커지는 모양새다. 10일 업계에 따르면 오픈AI는 지난 9일(현지시간) 온라인 행사를 통해 '소라'를 정식 출시한다고 발표했다. 지난 2월 처음 공개한 후 10개월 만으로, 그간 일부 이용자들을 대상으로 테스트를 한 후 문제점을 보완해 왔다. 공개 됐을 당시 도쿄 밤거리를 걷고 있는 여성의 다리가 불안정하게 움직이는 등 환각 현상이 발견된 바 있다. '소라'는 이용자가 글로 프롬프트(명령어)를 넣으면 동영상을 생성해주는 AI로, 생성되는 동영상의 길이는 최대 20초다. 당초 최대 1분 길이의 동영상을 빠르게 제작할 수 있다고 오픈AI가 밝혔던 것에 비해선 상당히 시간이 줄었다. 이에 대해 오픈AI는 "최대한 많은 사람들이 소라에 접근할 수 있도록 하기 위해 성능과 확장성 사이의 균형을 맞춘 것"이라고 설명했다. '소라'는 텍스트뿐 아니라 이미지, 동영상에서 영감을 받아 동영상을 생성하는 것은 물론, 기존 동영상을 확장하거나 빠진 프레임을 채우는 '스토리보드' 기능도 제공한다. 오픈AI가 공개한 '우주에 떠 있는 토끼(a rabbit floating in outer space)'라는 프롬프트로 만든 데모 시연 영상에선 약 7초만에 5초짜리 동영상이 만들어져 이목을 집중시켰다. 만든 영상이 마음에 들지 않으면 프롬프트를 수정하거나 스토리보드를 고치면 된다. '소라'는 구글이 올해 1월 공개한 생성 AI 모델 '루미에르'가 단 5초 분량의 영상물을 제작해주는 것에 비해 월등한 기술력을 갖고 있다는 평가를 받고 있다. 이날부터 한국을 포함한 대부분의 국가에서 사용할 수 있지만 영국, 스위스, 유럽경제지역(EEA)은 이번에 출시가 제외됐다. 이는 이들 지역에서 테크 기업에 대한 규제가 강화하고 있는 데 따른 것으로, 영국 등에서의 정식 출시 일정은 미정이다. '소라'는 현재 '챗GPT 플러스', '챗GPT 프로'에 포함돼 기존 유료 이용자들은 이 동영상 AI 모델 이용에 대한 추가 비용을 지불할 필요 없이 이용할 수 있다. 월 20달러를 지불하는 '챗GPT 플러스' 이용자들은 매월 50개(480p 또는 그 이하 해상도), 월 200달러인 '챗GPT 프로' 구독자들은 매월 500개의 영상을 생성할 수 있다. 챗GPT 팀, 엔터프라이즈, 에듀 계정에선 소라를 쓸 수 없다. 이번 일로 동영상 생성 AI 시장 경쟁은 과열되는 분위기다. 지난해 11월에는 스태빌리티 AI가 '스테이블 비디오 디퓨전'을, 올해 1월에는 마이크로소프트(MS)가 비디오 프레임의 움직임을 조작하는 동영상 생성 모델 '드래그누와'를 선보였다. 바이트댄스는 '매직비디오-V2'를, 애플도 2월 대형언어모델(LLM)을 활용해 동영상을 생성하는 '키프레이머'를 내놨다. 오픈AI가 올해 2월 '소라'를 선보인 후에는 구글 동영상 생성 AI '비오(Veo)'와 중국 콰이쇼우 '클링', 미국 루마 AI '드림 머신', 런웨이 '젠-3 알파', 메타 '무비 젠' 등이 지금까지 공개됐다. 어도비도 지난 10월 '어도비 맥스' 행사에서 파이어 플라이 기반 동영상 AI를 발표하며 경쟁에 합류했고, 아마존도 이달 초 '리인벤트' 행사를 통해 동영상 생성 AI '노바 릴'을 처음 선보였다. 이에 따라 유튜브는 내년부터 동영상 생성 AI '비오'를 활용해 유튜브 쇼츠 영상을 만들 수 있게 할 계획이다. 메타는 '무비 젠'이 만든 AI 동영상을 인스타그램 등 SNS와 연계할 수 있도록 할 예정이다. 사용자들은 AI를 사용해 실감나는 릴스(인스타그램을 통해 공유할 수 있는 15초 이내 분량의 짧은 동영상)를 직접 만들어낼 수 있고 페이스북, 왓츠앱, 스레드 등 메타의 다른 SNS 플랫폼에도 공유할 수 있게 된다. 파이낸셜타임스(FT)는 "메타의 무비 젠 AI 동영상 모델은 할리우드 영화 제작사, 동영상 콘텐츠 크리에이터, SNS 인플루언서들의 창조 작업용 툴로 사용되기를 원하고 있다"며 "메타는 영화 등 예능, 오락산업, 광고를 넘어 보다 광범위한 산업 분야에서 수익 창출 모델을 발굴하려고 하고 있다"고 분석했다. 이처럼 본격적인 동영상 생성 AI 시대가 열리면서 영상 관련 산업은 큰 변화를 맞게 됐다. 영화, 애니메이션, 증강현실(AR) 및 가상현실(VR) 등 다양한 분야에서 활용할 수 있게 되면서 일자리를 위협 받는 이들도 상당해질 것으로 예상된다. 실제 소니픽처스는 영화 제작 비용을 줄이기 위해 생성형 AI를 적극 활용하겠다고 공개적으로 밝힌 바 있다. 이미 코카콜라의 최근 홀리데이 캠페인과 같은 광고에선 AI로 제작된 콘텐츠가 등장하고 있다. 영화 CG 일러스트레이터인 리드 사우든은 "2022년 미드저니(이미지 생성 AI)가 처음 나왔을 때 우리는 '귀엽다'며 비웃었다"며 "하지만 이제 사람들은 생성 AI 때문에 일자리를 잃고 있다"고 말했다. 이에 지난해 미국 할리우드에선 배우와 작가를 중심으로 생성형 AI 활용에 대항하기 위해 파업을 벌이기도 했다. 자칭 '소라 PR(대외홍보) 퍼펫'이라고 부르는 예술가 그룹은 지난달 26일 오픈AI '소라'에 접속할 수 있는 프로그래밍 인터페이스(API)를 온라인에 공개하며 반발하는 모습을 보였다. 업계 관계자는 "오픈AI '소라'가 등장하며 많은 기업들에게 동영상 생성 AI 모델에 대한 강력한 동기가 생겼다"며 "여러 모델들이 한꺼번에 풀리면서 산업계, 특히 미디어 시장에 엄청난 반향을 일으킬 것으로 보인다"고 밝혔다. 일각에선 딥페이크 문제에 대해서도 우려하고 있다. AI 기술로 유명인들의 얼굴을 합성해 정교한 가짜 영상을 만드는 것이 쉬워졌기 때문이다. 이에 오픈AI는 레드팀(취약점을 발견해 AI 안전성을 검증하는 팀)을 만들어 딥페이크를 방지하기 위해 나섰다. 또 '소라'로 생성된 모든 동영상에 C2PA(콘텐트 출처 및 진위 확인을 위한 연합) 표준 AI 워터마크를 넣어 AI가 생성한 콘텐츠임을 알 수 있도록 했다. 로한 사하이 오픈AI 엔지니어링 리드는 "도널드 트럼프 대통령 같은 주요 정치인이나 공적 인물은 생성이 차단된다"며 "잘못된 정보의 확산을 방지하려고 노력하고 있다"고 말했다.

2024.12.10 09:21장유미

"o1·소라 첫선 보일까"…오픈AI, 연말 12일간 AI 기술 공개 '대장정'

오픈AI가 크리스마스 시즌 동안 새로운 제품과 서비스를 선보이며 기술 혁신의 장을 연다. 5일 더버지에 따르면 오픈AI는 총 12일간 매일 새로운 기능, 제품, 데모를 발표할 계획이다. 발표에는 영상 생성 인공지능(AI) 도구 '소라(Sora)'와 추론 모델 'o1'의 풀 버전이 포함될 가능성이 높은 것으로 알려졌다. 샘 알트먼 오픈AI 대표는 최근 뉴욕타임즈 주최 딜북 컨퍼런스에서 "12일간의 발표를 준비 중"이라고 밝히며 이를 공식 확인했다. 다만 구체적인 발표 내용이나 일정은 언급하지 않았다. '소라'는 텍스트를 기반으로 고품질 비디오를 생성할 수 있는 AI 도구로, 거대 언어 모델의 확장판으로 알려져 있다. 이 도구는 올해 중 동안 일부 아티스트를 대상으로 알파 테스트가 진행됐으며 연말 출시를 목표로 개발 중이다. 발표를 앞두고 오픈AI 직원들도 소셜 미디어를 통해 기대감을 드러냈다. 한 기술 부서 담당자는 "크리스마스 소원 목록에 무엇을 적었나요"라는 포스트를 올렸고 다른 직원은 "트리를 막 세울 시간에 맞춰 돌아왔다"고 말했다. 알트먼 대표는 자신의 X 계정을 통해 "내일 태평양 시간 오전 10시부터 매주 평일마다 발표와 데모가 진행될 예정"이라며 "멋진 것들을 공유할 예정이니 기대해달라"고 말했다.

2024.12.05 13:06조이환

딥노이드, AI 기반 폐 결절 진단 성과 'RSNA'서 발표

딥노이드(대표 최우식)가 미국 시카고에서 개최되는 2024년 북미영상의학회(RSNA 2024)에서 'AI 기반 폐 결절 진단 기술'에 대한 연구 성과를 발표한다. 딥노이드는 RSNA에서 '폐 결절의 국소화 및 Lung-RADS 범주를 고려한 AI 기반 CAD 시스템의 진단 성능'을 주제로한 초록을 통해 딥렁(DEEP:LUNG)의 진단 성능을 선보인다고 3일 밝혔다. 이번 임상 연구는 부산대학교병원, 양산부산대학교병원, 화순전남대학교병원의 2019년 1월부터 2023년 7월까지 외래와 응급실을 방문한 저선량 흉부 컴퓨터단층촬영(LDCT) 데이터 455건을 활용해 딥렁의 진단 성능을 평가했다. 폐 결절의 조직, 크기, 악성도 분류, Lung-RADS 카테고리화 및 결절 위치 국소화 등이다. 딥렁 활용 시 주요 평가 지표에서 민감도 91.38%, 특이도 93.08%, 악성도 분류 AUROC 89.62%라는 높은 정확도를 기록하며 우수한 결과를 보였다. AUROC는 분류 모델의 성능을 평가하는 지표로 AUROC 85% 이상이면 상당히 좋은 성능으로 간주된다. 렁-RADS 카테고리별 평가에서도 민감도와 특이도에서 안정적인 성능을 입증했다. 고형 결절과 간유리 음영 결절의 크기 측정에서도 각각 2mm 및 3mm 이내의 오차 범위를 유지하며 높은 정밀도를 보였다. 최우식 딥노이드 대표이사는 “본 연구를 통해 폐 결절 진단 및 악성 분류 분야에서 AI가 의료진에게 큰 도움을 줄 수 있음을 입증할 수 있었다”며 “2025년에는 뇌 질환 진단 솔루션과 함께 흉부 영역으로 AI 솔루션의 적용 범위를 확대할 계획으로, 의료 현장에 보다 포괄적인 AI 진단 지원 도구를 제공하는 것이 다음 목표”라고 덧붙였다.

2024.12.03 10:10남혁우

AI 영상 생성 모델 '소라' 유출 논란…예술가들 오픈AI에 반격

오픈AI의 동영상 생성 인공지능(AI) '소라'가 정식 오픈 전에 유출돼 혼란을 빚고 있다. 일자리에 위협을 느끼고 있는 예술가들이 오픈AI의 움직임이 반발해 '소라'에 대한 접근 권한을 유출시켰기 때문이다. 27일 테크크런치에 따르면 자칭 '소라 PR(대외홍보) 퍼펫'이라고 부르는 예술가 그룹은 지난 26일 오픈AI '소라'에 접속할 수 있는 프로그래밍 인터페이스(API)를 온라인에 공개했다. 이들은 조기 접근 시스템에서 가져온 것으로 추정되는 인증 토큰을 사용해 이용자가 '소라'로 비디오를 생성할 수 있는 프론트엔드를 만들었다. 이들은 AI 개발 플랫폼인 '허깅 페이스'에 소라를 사용해 볼 수 있도록 API를 게시했다. 이를 통해 테스터가 아닌 일반인들도 사실상 소라의 기능을 미리 써볼 수 있게 됐다. 다만 미국 동부시각 기준 정오부터 접근이 중단됐다. 이번 일로 수 많은 이용자들은 '소라'를 통해 1천80p 고해상도의 10초짜리 영상을 제작해볼 수 있었다. 이용자들이 한꺼번에 몰리면서 서비스를 이용할 때 대기자까지 발생한 것으로 알려졌다. 이후 소셜미디어에 올라간 결과물들은 오픈AI의 워터마크가 삽입돼 있어 눈길을 끌었다. '소라'는 지난 2월 오픈AI가 공개한 동영상 생성 AI 모델로, 텍스트만 입력하면 최대 1분 분량의 영상 제작이 가능하다. 구글이 올해 1월 공개한 생성 AI 모델 '루미에르'가 단 5초 분량의 영상물을 제작해주는 것에 비해 월등한 기술력이란 평가를 받고 있다. 덕분에 유튜브·틱톡 등에서 인기를 끌고 있는 1분 미만의 짦은 영상(숏폼) 제작에 용이하다. 콘텐츠만 있으면 누구나 영상 크리에이터가 될 수 있는 환경이 마련된 것이다. 하지만 영상 제작 관련 업종에 종사하는 이들에게는 위협이 되고 있다. 간단한 명령어 몇 마디로도 디즈니 애니메이션이나 할리우드 영화에서나 나올 듯한 영상을 순식간에 만들 수 있어서다. 특히 할리우드의 단역 배우, 촬영 스태프, 작가 등의 일자리를 빼앗을 수 있다는 우려가 커지고 있다. 이에 오픈AI는 '소라'를 바로 출시하지 않고 기능을 보완하기 위해 일부 예술가들을 대상으로 테스트만 진행해왔다. 샘 알트먼 오픈AI 최고경영자(CEO)는 지난 1일 레딧에서 열린 AMA(Ask Me Anything) 채팅 행사에서 '소라'와 관련해 "모델을 완성하고 안전 및 딥페이크 문제를 처리하고 컴퓨팅을 확장해야 하는 문제로 출시가 지연되고 있다"고 설명했다. 하지만 이번에 '소라 PR 퍼펫'이란 예술가 그룹이 API를 공개해버리면서 다소 난감해졌다. 테스트를 진행한 예술가들은 오픈AI가 '소라'에 대한 긍정적인 이야기를 퍼뜨리라고 압력을 가하고 있다고 주장하며 불만을 드러내기도 했다. 또 익명으로 활동했던 이들은 '소라' 접근권이 공개된 이후 청원서와 함께 자신들과 함께할 예술가들의 서명을 받기 시작했다. 이들은 "수 백명의 아티스트가 1천500억 달러 규모의 회사를 위해 버그 테스트, 피드백, 실험작 제작 등의 무급 노동을 제공하고 있다"며 "우리의 작업에 오픈AI가 공정한 보상을 하지 않고 있다"고 주장했다. 오픈AI는 그동안 테스터들을 엄격하게 통제하고 '소라'로 만들어진 결과물을 공유하기 전에 승인을 받도록 조치한 것으로 알려졌다. 일각에선 오픈AI가 예술가들의 작품을 통제하는 것을 두고 '소라'의 개발 속도가 느려졌기 때문이라는 분석을 내놨다. '소라' 개발을 이끈 책임자 중 한 명인 팀 브룩스가 지난 10월 오픈AI를 떠나면서 생성된 영상에서 캐릭터의 일관성을 유지하는데 오류가 여전한 것으로 전해졌다. '소라'는 공개 당시 도쿄 밤거리를 걷는 여성의 영상을 생성했지만 다리가 불안정하게 움직이는 모습이 포착돼 눈길을 끈 바 있다. 예술가들은 "우리는 예술도구로서의 AI를 반대하지 않는다"며 "예술가들에 대한 대우가 어떻게 형성되는지, 이 도구로 만들어지는 결과물이 어떻게 확산되는지에 대한 뚜렷한 답이 없어 반대하는 것"이라고 밝혔다. 이에 대해 오픈AI는 "수백 명의 예술가들이 '소라'를 쓰고 있고 기밀 정보를 공유하지 않는 것 외에는 주어진 의무가 없다"고 반박했다. 다만 오픈AI는 어떤 세부 정보가 '기밀'로 취급되는지는 설명하지 않았다. 테크크런치는 "이번 사태는 오픈AI의 '아트워싱'에 항의하기 위한 것"이라며 "예술 단체와 AI 기업의 갈등이 보다 심해지고 있다"고 분석했다.

2024.11.27 10:09장유미

  Prev 1 2 Next  

지금 뜨는 기사

이시각 헤드라인

[속보] 이재용 회장 '부당합병·회계부정' 최종 무죄 확정

135억원 투입해 'G-클라우드' 확장…정부, 공공시스템 대전환 나선다

"테슬라와 경쟁하지 않아...B2B 자율주행 선두 되겠다"

배경훈 장관 임명에 쏠리는 기대...SW-AI-클라우드 업계 ‘환영’

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.