• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
창간특집
인공지능
배터리
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'소라'통합검색 결과 입니다. (29건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

사진 한 장이 말하고 움직인다…캐릭터.AI, 영상 생성형 기술 '아바타FX' 공개

영상 생성형 인공지능(AI)이 인기를 얻고 있는 가운데, 2D 이미지를 사람처럼 움직이게 하는 기술이 공개돼 주목받고 있다. 다만 실제 인물을 활용한 애니메이션 생성이 가능해짐에 따라 악용 우려도 커지고 있다. 23일 테크크런치에 따르면 AI 기반 채팅·롤플레잉 플랫폼 기업 캐릭터.AI는 비디오 생성 모델인 '아바타FX'를 공개했다. 해당 모델은 비공개 베타 버전으로 제공된다. 아바타FX는 캐릭터들을 다양한 스타일과 음성으로 애니메이션화해 사람 같은 캐릭터부터 2D 동물 만화까지 다양한 모습으로 구현한다. 특히 오픈AI의 대표적인 영상 생성형 모델 '소라'와 차별화돼 이목을 끌고 있다. 아바타FX는 단순히 텍스트를 비디오로 변환하는 것이 아니라, 기존 이미지를 활용해 비디오를 제작할 수 있다. 이를 통해 실제 인물 사진을 애니메이션으로도 표현할 수 있다. 다만 이로 인해 업계에서는 영상 생성형 AI 기술이 악용될 수 있다는 우려도 보이고 있다. 사용자들이 유명인이나 지인의 사진을 업로드해 범죄가 될 만한 행동이나 말을 하는 영상을 사실적으로 만들 수 있기 때문이다. 특히 캐릭터.AI는 최근 많은 사용자들로부터 인기를 얻고 있어 딥페이크 기술로 악용될 가능성이 높다는 게 업계 관측이다. 실제 캐릭터.AI는 자사 챗봇이 사용자들에게 비윤리적인 채팅을 전한다는 이유로 자녀를 둔 미국의 부모들로부터 피소된 바 있다. 챗봇 메시지가 사람에게 부정적인 영향을 미칠 것이란 우려가 퍼지는 가운데, 현실적인 영상을 생성하는 캐릭터.AI의 이번 서비스는 이같은 문제를 더욱 증폭시킬 수 있다는 전망이 나오고 있다. 테크크런치는 "캐릭터.AI는 자녀 보호 기능과 같은 추가적인 안전장치를 구축했지만, 완벽한 보호 체계를 갖췄다고 보장하기는 어렵다"고 설명했다.

2025.04.23 14:29한정호

[유미's 픽] 오픈AI 新 무기 출격에 한숨 쉬는 美 기업, 주가 또 흔들릴까

'포토샵'으로 잘 알려진 미국 소프트웨어 기업 어도비가 오픈AI·구글·xAI 등 인공지능(AI) 기술을 앞세운 새로운 경쟁자들의 등장으로 위기에 몰렸다. 간단한 프롬프트 입력만으로 전문가 못지 않은 퀄리티의 이미지를 쉽게 만들 수 있는 서비스들이 속속 등장하면서 존재감이 점차 희미해지고 있다는 평가가 나온다. 26일 업계에 따르면 어도비의 최근 1년간 주가는 무려 19.98%나 하락해 오후 4시 45분 현재 403.64달러에 머무르고 있다. 한 때 주가가 597.75달러까지 치솟았으나 경쟁사들의 잇따른 등장과 함께 새로운 성장 동력으로 내세운 AI 비즈니스가 시장에서 큰 호응을 얻고 있지 못한 까닭이다. 앞서 어도비는 지난 2023년 오픈AI가 '챗GPT'를 출시한 직후 AI 사진 편집 시장에 진입하기 위해 '파이어플라이'를 출시했다. 이후 어도비 익스프레스를 비롯한 포토샵, 일러스트레이터, 어도비 스톡 등 크리에이티브 클라우드 앱들에 생성형 AI를 탑재했다. 특히 포토샵에는 '제너레이티브 필(Generative Fill)', 어도비 스톡에서는 '텍스트 투 이미지(Text-to-Image)', 일러스트레이터에는 '제너레이티브 리컬러(Generative Recolor)' 등 AI 기반 기능이 출시됐다. 올해 초에는 파이어플레이 비디오 티어 등 새로운 AI 기반 서비스를 발표해 주목 받았다. 이 서비스는 사용자가 제출한 텍스트나 이미지 기반으로 비디오부터 3D 그래픽, 2D 애니메이션을 생성한다. 이를 시장에 확산시키고자 어도비는 서비스 내 생성형 AI 일부 기능을 무료로 제공하는 등 승부수를 걸었다. 확장 기능이나 상업적 사용을 위해서만 유로 플랜을 서비스에 적용한 상태로, 사용자 기반이 넓어지면 서비스 유료 전환을 순차적으로 유도하려는 전략도 세웠다. 최근에는 AI 에이전트가 접목된 새로운 애플리케이션(앱)인 '브랜드 컨시어지'를 선보여 주목을 받았다. 기존 고객 데이터를 바탕으로 맞춤화된 콘텐츠 등을 추천하는 작업을 수행하는 것으로, 어도비가 AI 에이전트 제품을 선보인 것은 이번이 처음이다. 이 같은 어도비의 노력에도 불구하고 시장 내 반응은 뜨뜻미지근하다. 사용자들은 비용을 지불할 정도로 어도비의 AI 기능들이 가치가 있는지 불확실하다는 평가를 내놓고 있다. 경쟁사들의 기술력이 빠른 속도로 발전하고 있어서다. 실제 오픈소스로 제공되는 미드저니나 오픈AI의 '소라'는 텍스트와 사진 몇장 만으로도 AI 기반 이미지 콘텐츠 제작이 가능하도록 지원하고 있다. 해당 서비스 제공자들은 영상과 오디오, 사진 편집 기능까지 추가할 계획이라고 밝힌 상태다. 런웨이AI, 메타, 아마존 등도 잇따라 동영상 생성 AI 도구를 선보이며 어도비를 위협하고 있다. 이 같은 상황에서 오픈AI가 지난 25일 '챗GPT-4o 이미지 생성(ChatGPT-4o Image Generation) 모델'을 출시해 발등에 불이 떨어졌다. 맥락과 그리는 대상에 대한 이해도가 한층 더 높아져 이전보다 더 정확한 결과를 내놓을 수 있게 돼서다. 새 모델은 오픈AI의 시그니처 멀티모달 AI 모델인 챗GPT-4o와 결합한 이미지 생성 모델로, 텍스트와 이미지를 통합한 첫 모델이다. '그림'만 학습한 기존 이미지 모델에 GPT-4o 언어 모델이 결합하며 목적에 맞는 이미지를 쉽게 생성할 수 있게 됐다. 이 모델은 현재 유료 구독자들은 물론 무료 사용자들도 이용할 수 있다. 오픈AI는 기존에 '달리(DALL·E)'를 앞세워 이미지 생성 AI 시장에서 존재감을 키워왔다. 이를 사용했을 땐 숫자와 문자가 '그림'으로 해석돼 그려져 삐뚤게 이미지에서 표현됐지만, 새 모델은 언어 모델을 이해한 후 그림을 만들어 내 보다 정확한 결과물을 얻어낼 수 있다. '삼각형 바퀴를 가진 자전거'를 그려달라고 하면 기존 모델은 훈련되지 않은 데이터여서 결과물을 내놓는데 어려움을 겪었지만, 새 모델은 가능해졌다. 동영상 생성 AI인 '소라'에도 새 모델의 언어 이해가 적용돼 더 자연스러운 영상을 만들 수 있게 됐다. 이는 서비스 경쟁력 개선에 나선 오픈AI의 노력의 일환이다. 오픈AI 관계자는 "GPT-4o의 언어 지식과 이미지 지능이 결합된 모델"이라며 "기존 모델이 참신했다면 이 모델은 유용하다"고 설명했다. 오픈AI 외에도 구글은 제미나이에서 '이마젠' 이미지 생성 모델을 제공하고 있다. 중국 딥시크도 '야누스'라는 이름의 이미지 생성 모델을 출시했다. 동영상 생성 AI 시장에선 미드저니와 런웨이AI, 메타, 아마존 등도 잇따라 서비스를 선보이며 어도비를 위협하고 있다. RBC 애널리스트 매튜 스완슨은 "어도비가 생성형 AI 제품 로드맵을 잘 따라가고 있지만, 명확한 수익화 지표가 부족한 상태"라며 "투자자들이 어도비 진행 상황을 신뢰하기 어려운 상황"이라고 평가했다. 도이치뱅크 브래드 젤닉 애널리스트 역시 "어도비 경영진은 파이어플라이의 가능성을 강조하고 있지만, 아직 재무적 영향은 확인되지 않았다"고 지적했다. 조던 클라인 미즈호 애널리스트는 "어도비 플랫폼에서 점유율을 차지할 새로운 AI 기반 비디오 제작 엔진이 (투자자들에게) 우려 사항으로 남아 있다"며 "어도비는 소프트웨어 분야에서 가장 논쟁이 많은 주식 중 하나"라고 평가했다.

2025.03.26 17:21장유미

"AI 영상 생성, 1시간에 250만원"…구글, '비오 2' 초고품질 전략 성공할까

인공지능(AI) 기반 비디오 생성 시장의 경쟁이 본격화되는 가운데 구글이 자사 영상 AI인 '비오 2'의 가격을 공개했다. 4K 초고품질 영상을 지원하나, 오픈AI의 '소라'보다 가격이 높아 비용 대비 경쟁력이 있을지에 대한 의문이 제기되고 있다. 두 모델 모두 환각 및 물리 법칙 구현 등 기술적 한계를 드러내고 있다는 점도 해결 과제다. 24일 테크크런치에 따르면 구글은 AI 비디오 생성 모델 '비오 2'의 가격을 초당 50센트(한화 약 700원)로 책정했다. 이는 시간당 1천800달러(한화 약 250만원), 분당 30달러(한화 약 4만2천원)에 해당하는 수준으로, 구글은 '비오 2'를 통해 고품질 영상 시장을 공략하며 영상 생성의 상업적 활용도를 높이려는 전략을 펼치고 있다. '비오 2'는 최대 4K 해상도를 지원하는 고급형 비디오 생성 모델이다. 구글 클라우드의 '버텍스 AI(Vertex AI)' 플랫폼을 통해 제공되며 고해상도와 정밀한 디테일을 구현하는 데 초점을 맞췄다. 다만 비용이 초당 50센트로 책정되면서 일반 사용자보다는 전문가 및 기업 시장을 겨냥한 서비스로 보인다. 특히 오픈AI의 비디오 생성 AI인 '소라'와의 가격 정책 차이가 주목된다. 오픈AI는 크레딧 기반의 구독 모델을 통해 '소라'를 운영하고 있으며 1천80p 기준 초당 20센트(한화 약 280원)로 '비오 2'보다 상대적으로 저렴한 가격을 제시하고 있다. 오픈AI의 비디오 AI 가격 구조는 이용자의 구독 플랜에 따라 달라지며 저해상도에서는 보다 낮은 비용으로 비디오를 생성할 수 있다. 현재 '소라'는 월 20달러(한화 약 2만8천원)의 챗GPT '플러스'와 월 200달러(한화 약 28만원)의 '프로' 플랜을 통해 제공되며 각각 1천 크레딧과 1만 크레딧을 지급하는 방식이다. 480p 해상도의 경우 초당 4크레딧으로 약 8센트(한화 약 110원), 1천80p 해상도에서는 초당 100크레딧으로 약 20센트(한화 약 280원)이 소모된다. '소라'는 현재 4K 해상도를 지원하지 않지만 비용 효율성 면에서는 '비오 2'보다 경쟁력이 높은 것으로 보인다. 다만 실제 영상 제작 현장에서는 두 모델 모두 완벽하지 않다는 지적이 나온다. 최근 업계 평가에 따르면 '비오 2'는 손가락, 눈동자, 피부 질감 등 세부 표현에서 비현실적인 결과가 발생하며 물리 법칙에 부합하지 않는 액체 유동성 표현 등의 문제가 드러난다. 또 '소라'는 인체 움직임에서 부자연스러운 관절 회전과 신체 비율 왜곡 현상이 잦으며 보행 시 다리 움직임이 로봇처럼 경직되는 문제를 보인다. 이 외에도 장면 전환 시 객체의 색상 및 크기 변화가 불안정해 시간적 일관성을 유지하는 데 어려움을 겪고 있다. 이 같은 기술적 한계는 두 모델이 아직 실제 영상 수준에 미치지 못하는 부분을 여실히 보여준다. 전문가들은 물리 엔진 통합 등 추가 개발이 필요하다고 지적하며 특히 의류 주름 시뮬레이션과 액체-고체 상호작용 구현이 시급한 과제라고 평가한다. 향후 개선된 기술이 도입될 경우 보다 현실적인 AI 영상 제작이 가능할 것으로 기대된다. 디나 베라다 유튜브 제품 담당 이사는 "'비오 2'는 현실 세계의 물리 법칙과 인간의 움직임을 더 잘 이해해 세밀하고 현실적인 결과물을 만든다"며 "스타일, 렌즈, 시네마틱 효과까지 지정할 수 있어 쉽고 재미있게 영상을 표현한다"고 강조했다.

2025.02.24 10:55조이환

"구글·오픈AI와 경쟁"…어도비, 파이어플라이 구독 모델 출시

어도비가 생성형 인공지능(AI) 모델군 '파이어플라이'를 별도 구독 서비스로 출시해 구글과 오픈AI 등과 영상 AI 경쟁을 본격화했다. 13일 테크크런치 등 외신에 따르면 어도비는 이같은 구독 서비스를 발표했다. 현재 어도비는 얼리 엑세스로 제공되는 새로운 파이어플라이 스탠다드·파이어플라이 프로 구독 플랜을 추가로 선보인다. 파이어플라이 스탠다드 플랜은 월 1만3천200원에 5초 분량 1080p 영상을 최대 20건 생성할 수 있는 2천 건 영상·오디오 크레딧을 제공한다. 파이어플라이 프로 플랜은 월 3만9천600원에 5초 분량의 1080p 영상을 최대 70건 생성할 수 있는 7천 건의 영상·오디오 크레딧을 제공한다. 파이어플라이 프리미엄(Firefly Premium) 플랜도 공개 예정이다. 그동안 어도비는 크리에이티브 클라우드 사용자에게 파이어플라이를 추가 비용 없이 제공해 왔다. 이번 서비스 출시로 인해 파이어플라이를 유로 구독 모델로 제공할 방침이다. 파이어플라이는 텍스트와 이미지 입력을 5초 길이 영상으로 변환할 수 있다. 사용자는 카메라 각도, 움직임, 화면 비율 등을 조정할 수 있다. 이를 통해 영상 전문가들에게 맞춤형 기능을 제공한다. 기존 영상의 길이를 연장하고 배경 소음을 자연스럽게 잇는 '생성형 확장(Generative Extend)' 기능도 제공한다. 다수 외신은 어도비가 파이어플라이로 오픈AI의 '소라'와 런웨이의 '젠-3 알파', 구글 딥마인드의 '베오' 등과 경쟁할 것으로 봤다. 이에 어도비는 파이어플라이가 라이선스 확보된 데이터셋 기반으로 학습해 저작권 문제없이 상업적으로 안전하다는 점을 파이어플라이 특장점으로 강조하고 있다. 어도비 알렉산드루 코스틴 생성형 AI 담당 부사장은 "파이어플라이 모델은 지적 재산권(IP) 친화적이고, 상업적으로 안전하다"며 "고객이 직면한 문제를 깊이 이해하는 것이 회사 경쟁력"이라고 밝혔다.

2025.02.13 09:22김미정

"이번 달에만 두 번"…오픈AI, 챗GPT·소라 서비스 장애 발생

오픈AI의 인공지능(AI) 서비스 '챗GPT'와 '소라'가 이번 달에만 두 번의 서비스 장애가 발생했다. 27일 서비스 중단 추적 사이트 다운디텍터에 따르면 한국시간 기준 오전 4시경 오픈AI 접속 장애 신고가 급증했다. 이번 장애는 장애 신고 회수는 1만4천500건을 넘어섰으며, 장애 신고 비율은 챗GPT가 91%, 웹 브라우저가 7%, API는 2%로 나타났다. 오픈AI측은 이번 장애에 대해 업스트립 공급자에 의해 발생하며 현재 모니터링 중이라고 밝혔지만 자세한 기술적인 내용 등은 공개하지 않았다. 1시간마다 경과보고를 지속한 결과 오전 7시경 챗GPT를 부분적으로 복구했으며 한 시간이 더 지난 8시에는 소라를 완전히 복구했다고 밝혔다. 오픈AI는 현재 아직 불안정한 챗GPT와 API에 대한 전반적인 수정 작업을 계속 진행 중이라고 설명했다. 오픈AI의 챗GPT와 소라가 지난 12일에 이어 이번까지 2주 만에 2번의 장애가 발생했다. 당시 서비스 장애 방지를 위해 여러 가지 조치를 채택할 것이라고 밝혔음에도 장애가 발생하면서 사용자들의 불만이 커지는 상황이다. 레딧 등 해외 커뮤니티에서는 챗GPT에 발생한 오류 메시지를 담은 이미지를 공유하며 장애를 지적하고 있는 중이다.

2024.12.27 08:46남혁우

요스타, 애니 판타지 액션RPG '스텔라소라' 첫 공개

요스타(YOSTAR)는 판타지 액션 어드벤처 모바일 게임 '스텔라 소라'를 최초로 공개하고, 글로벌 사전예약을 시작했다고 18일 밝혔다. '스텔라 소라'는 '노바 대륙'이라는 판타지 세계 속에서 유저는 '마왕'의 신분으로 귀여운 소녀 여행가들과 함께 '별의 탑'이라는 거대하고 신비한 미궁을 정복하고, '노바 대륙'을 탐험하며 숨겨진 수수께끼를 풀어나가는 이야기로 꾸민 작품이다. 특히 유머러스하고 캐주얼한 스토리와 랜덤성 높고 전략적인 요소가 추가된 액션 게임으로, 자동 전투와 수동 회피를 핵심으로 하는 새로운 조작 모드를 제공한다. 또 높은 자유도와 한 편의 애니메이션을 보는 듯한 메인 및 캐릭터 시나리오는 차별화된 게임성과 색다른 재미를 제공할 수 있을 것으로 기대되고 있다. 여기에 애니메이션 스타일에 바탕을 둔 만화 스타일의 그래픽이 더해진 일러스트는 캐릭터의 피부 질감, 표정 등을 사실적으로 표현해 몰입도를 극대화했다고 알려졌다. 사전예약은 공식 홈페이지를 통해 실시되며, 참여자 전원에게는 별의 파편, 레코드-휴식의 순간, 하늘 티켓 10장, 여행가-안즈 등 풍성한 보상이 지급한다. 이 밖에 글로벌 사전예약 실시를 기념해 선보인 트레일러 영상에서는 귀여운 캐릭터 일러스트, 전투 등이 공개되어 정식 출시에 대한 기대감을 불러일으키고 있다.

2024.12.18 17:10이도원

딥마인드, 영상 만드는 AI '비오 2' 출시…"기능 미흡·저작권 문제 해결부터"

구글 딥마인드가 동영상 만드는 인공지능(AI) 모델 '비오(Veo) 2'를 발표한 가운데 복잡한 영상 생성 기능 미흡과 저작권 문제 해결이 시급하다는 지적을 받고 있다. 17일 테크크런치 등 외신에 따르면 구글 딥마인드는 기존 AI 기반 영상 생성 모델 비오 차기 모델을 출시했다. 현재 비오 2는 구글 영상 제작 플랫폼에 탑재됐다. 내년 개발자 플랫폼 버텍스 AI에도 공급될 예정이다. 비오 2는 최대 4K 해상도로 2분 이상 분량의 영상을 생성할 수 있다. 이는 오픈AI 영상 모델인 '소라'보다 우수한 기능이다. 소라는 해상도 1천80p와 20초 분량이 최대다. 다만 외신은 비오 2가 해당 분량의 영상을 생성할 수 있을지 의문이라고 했다. 현재 비오 2를 탑재한 구글 영상 제작툴 '비디오FX'는 해상도 720p로 8초 분량 동영상까지 만들 수 있어서다. 비오 2는 이전 모델과 마찬가지로 텍스트 프롬프트 또는 텍스트와 참조 이미지로 동영상을 생성한다. 딥마인드는 비오 2가 카메라 제어에 대한 이해도가 향상돼 더 선명한 영상을 생성한다고 밝혔다. 특히 움직임 많은 장면에서 텍스처와 이미지가 더 뚜렷해졌다는 설명이다. 이 외에도 비오 2는 동영상에서 가상 카메라를 더욱 정밀하게 조작할 수 있어 객체와 사람을 다양한 각도에서 인식할 수 있는 것으로 전해졌다. 움직임, 유체 동역학, 빛의 특성을 기존보다 사실적으로 재현할 수 있다는 평가다. 다양한 렌즈 효과와 영화적 기법, 미세한 인간 표정까지 구현 가능한 상태다. 외신 "비오 2 직접 이용해 보니…복잡한 영상 생성 미흡" 외신은 비오 2가 굴절이나 복잡한 액체 표현 등 까다로운 시각적 효과 생성에 강점을 보였다고 보도했다. 특히 픽사 스타일의 애니메이션 표현이 우수하다는 평가다. 그러나 모델 개선이 필요해 보인다고 입을 모았다. 테크크런치는 "강아지 캐릭터 눈이 지나치게 생기 없어 보이거나, 영상 속 도로가 비현실적으로 미끄러워 보이는 장면이 등장했다"며 "배경 속 보행자와 건물이 서로 섞이거나 물리적으로 불가능한 구조를 보이는 경우도 있었다"고 지적했다. 이에 딥마인드 엘린 콜린스 제품 부사장은 "비오 2는 몇 분 동안 프롬프트에 따라 일관된 동영상을 생성할 수 있지만, 복잡한 프롬프트를 긴 시간 동안 유지하는 데 한계가 있다"며 "캐릭터 일관성과 디테일, 복잡한 동작 생성 등에서 더 발전해야 한다"고 밝혔다. "데이터 학습·저작권 문제 우려"…이마젠 3 업그레이드 외신은 비오 2의 학습 데이터 출처·저작권 문제 우려 가능성도 언급했다. 딥마인드는 구체적으로 어디서 영상 데이터를 가져왔는지 밝히지 않은 상태다. 다수 외신은 유튜브가 주요 데이터 출처일 가능성 있다고 분석했다. 현재 구글이 유튜브를 소유하고 있다는 이유에서다. 외신은 저작권 문제 우려도 여전하다고 평가했다. 앞서 딥마인드는 공개 데이터를 학습하는 것이 공정 이용(fair use)에 해당한다고 주장한 바 있다. 데이터 소유자 허가를 받지 않고 학습해도 된다는 설명이다. 그러나 창작자들은 이에 동의하지 않는다는 입장을 취하고 있다. 딥마인드는 딥페이크 방지를 위해 자체 워터마킹 기술인 신스(Synth)ID를 비오 2에 적용했다. 신스ID는 생성된 동영상 프레임에 보이지 않는 마커를 삽입하는 기술이다. AI가 생성한 콘텐츠를 추적할 수 있다. 다만 다른 워터마킹 기술처럼 완벽한 방지가 어렵다는 지적도 이어지고 있다. 이날 딥마인드는 이미지 생성 모델 '이마젠 3' 업그레이드 버전도 발표했다. 새 이마젠 3 모델은 구글의 이미지 생성 도구인 '이미지FX'를 통해 제공된다. 이마젠 3는 포토리얼리즘과 인상주의, 애니메이션 스타일 등 다양한 스타일로 더 밝고 잘 구성된 이미지를 생성할 수 있다. 디테일과 텍스처를 풍부하게 표현할 수 있는 것으로 평가받고 있다. 딥마인드는 "이번 업그레이드 모델은 프롬프트 입력 시 칩렛를 통해 주요 키워드를 강조하고 연관된 단어를 자동 제안함으로써 사용자 편의성을 높였다"고 강조했다.

2024.12.17 09:31김미정

오픈AI, 생산성 관리 '프로젝트' 기능 공개…향후 '쉽마스'서 AI 에이전트 등장 관심

오픈AI가 '쉽마스' 행사의 절반을 넘긴 시점에서 '챗GPT' 활용도를 체계적으로 관리하는 '프로젝트' 기능을 선보였다. 앞서 첫 6일 동안 추론 모델, 비디오 생성 AI 등 다채로운 기능을 연이어 공개하며 주목 받은 쉽마스에서는 남은 5일 동안 새로운 기능이 추가로 발표될 것으로 보여 귀추가 주목된다. 오픈AI는 지난 13일(현지시간) 쉽마스 7일 차에 새로운 대화 관리 방식인 '프로젝트' 기능을 발표하며 대화를 프로젝트 단위로 체계적으로 관리할 수 있는 기능을 선보였다. 이 기능은 특히 복잡한 작업과 대규모 대화를 효율적으로 관리할 수 있도록 설계돼 생성형 AI의 활용성을 크게 확대할 것으로 기대를 모으고 있다. 프로젝트 기능의 핵심은 대화를 프로젝트 단위로 정리하고 이를 주제별로 분류할 수 있다는 점이다. 사용자는 각 프로젝트에 맞춤형 지침을 설정할 수 있어 '챗GPT'가 프로젝트 목적에 적합한 응답 톤과 방식으로 대화를 이어갈 수 있다. 맞춤형 지침은 프로젝트의 특성과 요구 사항에 따라 설정할 수 있으며 최대 8천 자까지 세부 지침을 추가할 수 있다. 프로젝트당 최대 20개의 파일 업로드가 지원되며 텍스트, PDF, 문서, 이미지 등 다양한 파일 형식을 포함한다. 이에 따라 사용자는 프로젝트 내에서 관련 자료를 쉽게 관리하고 필요한 자료를 즉시 참조할 수 있다. 현재 이 기능은 플러스(Plus), 프로(Pro), 팀스(Teams) 사용자에게 우선 적용되고 있으며 무료 사용자와 교육용 및 기업용 계정에는 내년 초부터 확대 적용될 예정이다. 업계 전문가들은 프로젝트 기능이 기업 및 개인 사용자의 생산성을 크게 높이고 연구, 개발, 고객 관리 등 다양한 분야에서 실질적인 도구로 자리 잡을 것으로 전망하고 있다. 오픈AI 관계자는 "팀 프로젝트를 통해 각 팀원이 특정 작업에 대한 대화를 독립적으로 관리하면서도 전체 프로젝트 문맥을 유지할 수 있을 것"이라며 "연구자들은 논문 자료와 참고 문헌 확인 뿐만 아니라 고객 관리나 이벤트 기획에서도 유용한 도구가 될 것"이라고 말했다. 앞서 오픈AI는 쉽마스 첫 6일간 다양한 AI 기술 업데이트로 활용 범위를 크게 넓혀왔다. 첫째날 공개된 'o1' 모델은 정확도와 응답 속도를 개선했으며 멀티모달 기능과 복잡한 논리 문제 해결 능력을 갖췄다. '프로' 구독 서비스는 고난도 작업에 특화된 환경을 제공해 최신 모델과 고급 음성 모드에 무제한 접근을 지원한다. 둘째날 발표된 강화 학습 미세 조정 프로그램은 연구자·대학·기업을 대상으로 자체 AI 모델 개선을 지원해 다양한 산업 분야에서 활용 가능성을 높였다. 셋째날에는 올해 초에 데모가 시연됐던 영상 AI '소라'가 공개됐다. 텍스트 입력만으로 동영상을 제작하고 기존 이미지에 애니메이션을 입히거나 새로운 스타일로 리믹스하는 등 멀티미디어 콘텐츠 제작의 진입 장벽을 낮추는 데 기여할 예정이다. 넷째날 소개된 캔버스 기능은 파이썬 코드 실행, 그래픽 미리보기, 'GPT-4o' 연계를 통해 AI와 협업의 폭을 넓혔다. 다섯째날 애플 인텔리전스 통합은 비교적 주목도가 낮았지만 업계 관계자들은 애플 생태계와의 연계를 시도했다는 데 의미가 있다고 평가했다. 여섯째날에는 '고급 음성 모드'와 '산타 모드'가 추가됐다. 산타 모드는 크리스마스 기간 동안 휴일 분위기를 반영한 재미 요소로 사용자 경험을 풍부하고 있으며 '고급 음성 모드'는 기존의 실시간 음성 모드에 영상 인식 기능을 추가해 '챗GPT'가 움직이는 사물을 보고 실시간으로 사용자와 소통이 가능해졌다. 일각에서는 앞으로 남은 5일 동안 오픈AI가 차세대 모델 '오리온(Orion)'과 자율 AI 에이전트 '오퍼레이터(Operator)'를 공개할 지도 모른다는 관측을 내놓고 있다. 업계 소식통에 의하면 '오리온'은 아직 오픈AI가 공개하지 않은 거대언어모델(LLM)로, 'GPT-4o' 대비 최대 100배 강력한 성능과 멀티모달 처리, 고도화된 추론 기능을 갖춘 차세대 모델로 기대를 모으고 있다. 또 '오퍼레이터'는 브라우저 상에서 자율적으로 작업을 수행할 수 있는 에이전트 형태로 알려졌다. 사내 시연을 통해 배달 음식 주문이나 코딩 문제 해결 능력을 선보여 사용자가 직접 처리하던 작업 일부를 AI가 대행할 수 있는 가능성을 제시한 것으로 알려졌다. 다만 이들 차세대 모델과 에이전트는 아직 공식 발표되지 않은 추측 단계다. 실제 공개 시기나 구체적 형태는 미지수로, 오픈AI가 쉽마스 기간 중 어떤 제품을 추가로 발표할지는 불명확하다. 샘 알트먼 오픈AI 최고경영자(CEO)는 "이번 쉽마스는 오픈AI가 지난 1년간 얼마나 진화했는지를 보여주는 기회"라며 "모든 사용자가 AI를 통해 더 나은 경험을 할 수 있도록 계속 노력할 것"이라고 강조했다.

2024.12.14 15:11조이환

산타 목소리 내는 챗GPT, 영상도 이해한다…오픈AI, 접속장애 문제도 사과

오픈AI가 'GPT-4o' 공개 7개월 만에 '챗GPT'에서 실시간으로 동영상에서 관찰한 내용을 처리하고 사용자와 대화할 수 있는 기능을 새롭게 추가했다. 13일 블룸버그통신에 따르면 오픈AI는 지난 12일(현지시간) '쉽마스(Sheepmas)' 행사를 6일차를 맞아 온라인을 통해 '챗GPT' 고급 음성 모드(AVM)에 실시간 영상 이해 모드를 추가한다고 발표했다. '쉽마스'는 12일간 오픈AI가 매일 새로운 기술을 공개하는 대규모 이벤트다. 앞서 오픈AI는 지난 5월 'GPT-4o' 공개 당시 휴대폰 카메라로 사물을 비추면 이를 이해하고 답해주는 기능을 선보였다. 영상으로 다양한 설정 메뉴를 설명하거나 수학 문제를 풀어주는 식인데, 이날 오픈AI는 드립 커피를 만드는 과정을 '챗GPT'와 대화를 하며 선보였다. 이 기능은 채팅창 옆에 있는 음성 아이콘을 누른 후 왼쪽 하단에 있는 비디오 아이콘을 선택하면 시작된다. 화면 공유도 가능하다. 실시간 영상 이해 기능은 AI 음성 비서의 핵심 기능으로 꼽혔으나, 내부 개발 일정이 밀렸다는 이유로 그간 정식 출시를 미루고 있었다. 하지만 이날 온라인을 통해 기능을 공개하며 유료인 '챗GPT 플러스'와 '챗GPT 프로' 구독자들도 사용할 수 있게 됐다. 엔터프라이즈, 에듀 이용자는 내년 1월부터 사용할 수 있으며 유럽연합(EU)과 스위스 등 일부 국가에서도 당분간 지원되지 않는다. 현재 국내에서는 기능이 아직 추가되지 않은 상태로, 업데이트는 다음주께 완료될 예정이다. 블룸버그통신은 "오픈AI가 2년 전 '챗GPT'를 출시한 후 꾸준히 투자해 오디오와 이미지, 비디오에 응답하는 소위 멀티모달 기능을 선보이기 위해 노력해왔다"며 "이 과정에서 오픈AI가 보다 매력적인 AI 어시스턴트(비서)를 제공할 수 있게 됐다"고 말했다. 오픈AI는 이 기능과 함께 챗GPT 고급 음성 모드에 한시적으로 산타 목소리도 추가했다. 사용자는 챗GPT 채팅창 옆에 있는 눈송이 아이콘을 클릭하면 사용할 수 있다. 이 기능은 1월 초까지 서비스된 후 종료될 예정이다. 산타와의 각 대화는 채팅 기록이나 메모리에는 영향을 미치지 않는다. 국내에서도 현재 13세 이상이면 활용할 수 있다. 또 오픈AI는 이날 새로운 기능 공개와 함께 전날 발생한 '챗GPT'와 '소라'의 접속 장애 문제에 대해서도 사과했다. '챗GPT'는 전날 오전 8시 17분부터 오후 12시 38분까지 로그인, 사용 등이 원활하지 않았던 것으로 파악됐다. 오픈AI는 공식 X(옛 트위터) 계정을 통해 전날 오전 9시 15분에 문제를 확인했다고 밝힌 후 같은 날 오후 2시쯤 서비스가 복구됐다고 알렸다. 다만 장애 원인을 설명하진 않았다. 업계는 접속 장애 원인을 동영상AI '소라' 출시 및 챗GPT와 애플의 음성 비서 '시리' 간 협업에 따른 트래픽 증가에 따른 것으로 봤다. 앞서 오픈AI와 애플은 전날 iOS 18.2 업데이트를 통해 시리와 글쓰기 도구 등에 챗GPT를 결합했다고 발표했다. 이에 따라 아이폰·아이패드 등 기기 이용자들의 챗GPT 수요가 증가하면서 접속 장애가 발생했다는 분석이 나온다. 오픈AI 관계자는 공식 유튜브를 통해 "많은 이들이 우리에게 의존하고 있다는 것을 알고 있고, 오류가 난 것에 대해 정말 죄송하게 생각한다"며 "전날 몇 시간 동안 서버가 접속되지 않은 것에 대한 자세한 내용은 향후 공유할 것"이라고 밝혔다.

2024.12.13 09:24장유미

오픈AI '소라' 게임 콘텐츠 무단 활용 의혹…"법적 리스크 커"

오픈AI가 최근 출시한 비디오 생성 인공지능(AI) '소라'에 게임 콘텐츠를 훈련 데이터로 사용했다는 주장이 제기되면서 법적 문제가 우려되고 있다. 12일 테크크런치에 따르면 '소라'는 텍스트 프롬프트나 이미지를 기반으로 최대 20초 길이의 비디오를 생성할 수 있는 기능을 갖추고 있다. 이미 오픈AI는 '소라'를 시연할 때 훈련에 유명 비디오게임 마인크래프트의 플레이 영상을 사용했다고 밝혔으며 전문가들은 다른 게임 콘텐츠도 훈련 데이터로 포함됐을 가능성이 높다고 분석했다. 실제로 '소라'는 닌텐도 게임인 '슈퍼마리오 브라더스'나 유명 1인칭 슈팅 게임인 '콜오브듀티' 스타일의 영상을 생성할 수 있다. 이와 함께 유명 트위치 스트리머의 외모를 반영한 캐릭터도 만들어내고 그의 문신을 복제하는 등 저작권 문제가 불거질 소지가 큰 것으로 나타났다. 법률 전문가들은 오픈AI가 무단으로 게임 플레이 영상을 사용했을 경우 저작권 침해 소송에 직면할 수 있다고 경고했다. 특히 게임 콘텐츠에는 개발사 뿐만 아니라 스트리머 등 여러 이해관계자가 얽혀 있어 저작권 관련 법적 리스크가 크다. 오픈AI는 훈련 데이터 출처에 대해 명확히 밝히지 않고 있으며 공공 데이터와 라이센스 데이터를 활용했다고만 언급했다. 지적재산권 변호사인 조슈아 와이겐스버그는 "비디오 게임 플레이 영상을 무단으로 사용하는데는 많은 리스크가 있다"고 밝혔다.

2024.12.12 11:27조이환

'소라' 이어 '챗GPT'도 먹통…오픈AI "서비스 중단 발생"

동영상 생성 인공지능(AI) '소라'에 이어 '챗GPT'까지 먹통되면서 오픈AI가 난감한 상태에 놓였다. 12일 업계에 따르면 오픈AI '챗GPT'는 이날 오전부터 로그인, 사용 등이 원활하지 않아 이용자들의 불만이 터져 나오고 있다. '챗GPT'는 주간 전 세계 사용자가 2억5천만 명에 달한다. 현재 '챗GPT'는 어떤 질문에도 응답하지 않고 있다. 로그인을 시도하면 "죄송하다. 문제가 발생했으니, 잠시 뒤 다시 시도하라(We are sorry, an error occurred. Please retry after a few minutes)"는 메시지만 뜬다. '챗GPT'는 지난 11월에도 대규모 접속장애를 일으켰다가 1시간 만에 복구된 바 있다. 업계는 '챗GPT' 장애 역시 '소라'로 인한 트래픽 과다가 원인일 것으로 추정했다. 앞서 오픈AI의 야심작인 동영상 생성 인공지능(AI) 모델 '소라(Sora)'도 지난 9일 정식 출시와 함께 사이트가 마비됐다. 시장 내 '게임체인저'가 될 것이란 기대감과 달리 사전 대비가 소홀했다는 지적이 나온다. 이에 대해 샘 올트먼 오픈AI 최고경영자(CEO)는 자신의 X(옛 트위터)에 "소라에 대한 수요를 상당히 과소 평가했다"고 말했다. 오픈AI는 현재 서비스가 막혀 있다고 긴급히 공식 X(옛 트위터) 계정을 통해 공지했다. 오픈AI는 "지금 서비스 중단 상황(outage)이 발생하고 있다"며 "문제를 파악했고 수정을 위해 노력 중"이라고 말했다. 그러면서 "죄송하다"며 "계속 업데이트하겠다"고 안내했다.

2024.12.12 09:35장유미

오픈AI, 기술 한계 직면했나…'소라' 출시 직후 연일 '먹통'

오픈AI의 야심작인 동영상 생성 인공지능(AI) 모델 '소라(Sora)'가 서비스 정식 출시와 동시에 마비됐다. 시장 내 '게임체인저'가 될 것이란 기대감과 달리 사전 대비가 소홀했다는 지적이 나오면서 AI 기술 주도권을 쥔 오픈AI가 오점을 남겼다는 평가다. 11일 업계에 따르면 오픈AI '소라'를 경험하기 위한 이용자들이 일시적으로 몰리면서 이날 오후 4시 14분(한국시간) 현재도 '소라닷컴'에 접속이 되지 않고 있다. 서비스는 이달 10일(현지 시간 9일) 오픈됐지만 트래픽이 심해 일시적으로 비활성화 조치가 내려졌다. 오픈AI '소라'가 무료가 아닌 유료 이용자들을 대상으로 서비스 된다는 점에서 이번 일은 상당한 실망감을 가져다줬다. '소라'는 현재 '챗GPT 플러스', '챗GPT 프로'에 포함돼 기존 유료 이용자들은 이 동영상 AI 모델 이용에 대한 추가 비용을 지불할 필요 없이 이용할 수 있다. 월 20달러를 지불하는 '챗GPT 플러스' 이용자들은 매월 50개(480p 또는 그 이하 해상도), 월 200달러인 '챗GPT 프로' 구독자들은 매월 500개의 영상을 생성할 수 있다. 챗GPT 팀, 엔터프라이즈, 에듀 계정에선 소라를 쓸 수 없다. 사실상 유료 서비스인 셈이다. 하지만 서비스 정식 출시 후 3일째가 된 이날도 여전히 정상화되지 않고 있다는 점에서 이용자들은 점차 불만을 터트리고 있다. '소라'를 이용하기 위해 '챗GPT 플러스'를 다시 구독하기 시작한 이용자들도 상당히 있지만, 사이트가 '먹통'이 된 탓에 많은 아쉬움을 드러내고 있다. 일각에선 국내와 달리 해외 기업의 서비스 먹통에 대한 민감도가 낮은 듯 하다고 지적했다. 앞서 카카오의 경우 지난 2022년 10월 SK C&C 데이터센터 화재로 서비스가 줄줄이 중단돼 많은 비난이 쏟아진 바 있다. 카카오는 카카오톡 등 무료 서비스에 대해서도 서비스 중단에 대한 책임을 지기 위해 보상안을 마련하며 여론을 달래기 위해 노력했다. 하지만 오픈AI는 유료 고객을 대상으로 한 서비스가 제대로 작동하고 있지 않음에도 개선책은커녕 보상안에 대해서도 제대로 내놓지 못하고 있어 눈살을 찌푸리고 있다. 오픈AI는 '소라닷컴' 알림창에 "현재 트래픽이 심해 소라 계정 생성을 일시적으로 비활성화했다"고만 공지한 상태다. 또 언제 서비스 정상화가 될 수 있냐는 질문에는 명확한 답변을 내놓지 못했다. 이에 대해 샘 올트먼 오픈AI 최고경영자(CEO)는 자신의 X(옛 트위터)에 "소라에 대한 수요를 상당히 과소 평가했다"고만 말했다. 업계 관계자는 "접속 채널에 동시 접속자가 많으면 많을수록 비용이 많이 든다"며 "그만큼 인프라를 확보해 둬야 하기 때문"이라고 설명했다. 이어 "한정된 자원과 예산으로 동시에 들어올 수 있는 인원수를 제한하려고 하다 보니 이 같은 일이 벌어진 듯 하다"며 "유료 구독자를 대상으로 하는 서비스임에도 기술적 한계와 비용 투입이 제대로 일어나지 않아 이 같은 일이 벌어진 듯 해 아쉽다"고 덧붙였다. 그러면서 "영상을 AI로 제작하는 서비스인 만큼 컴퓨팅 리소스를 엄청나게 소모할 듯 한 데 이를 오픈AI가 최적화하지 못한 측면도 있지 않을까 싶다"며 "유료 임에도 SLA(최저보장속도)을 보장해주지 않았다는 점에서 사용자들의 권리를 침해한 것으로 보여 비즈니스 모델로서도 성공적인 시작을 하진 못한 듯 하다"고 평가했다.

2024.12.11 16:19장유미

오픈AI '소라' 등장에 주눅 든 어도비…뒤처진 기술 우려에 주가도 '뚝'

'포토샵'으로 잘 알려진 미국 소프트웨어 기업 어도비가 경쟁사인 오픈AI가 동영상 생성 인공지능(AI) '소라'를 정식 출시하자 또 다시 위기설에 휩싸였다. 관련 서비스를 아직 제대로 선보이지 않고 있는 탓에 오픈AI보다 기술력에서 뒤처지고 있다는 평가도 받고 있다. 11일 블룸버그통신 등에 따르면 어도비는 생성형 AI를 사용해 프롬프트나 이미지에서 동영상을 만들 수 있는 브라우저 기반 서비스를 발표한 지 두 달이 지났지만, 여전히 테스트 단계에 머물고 있는 것으로 나타났다. 현재 어도비와 계약을 맺은 소수의 이용자만 접근할 수 있는 상태다. 앞서 어도비는 지난 10월 초 연례 컨퍼런스를 통해 '파이어플라이 AI' 제품군의 일부로 동영상 생성 AI 기능을 발표했으나, 베타 버전으로만 선보였다. 또 '프리미어'에 동영상 편집 툴을 출시했는데, 이는 사용자가 생성형 AI를 사용해 동영상 클립을 확장할 수 있게 해준다. 어도비는 자사 웹사이트에 "다양한 사용 사례를 가장 잘 지원하고 모델 안전을 보장하기 위해 피드백 수집에 중점을 두고 제한적으로 베타 서비스에 접근할 수 있게 하고 있다"며 "(이용을 원하면) 대기자 명단에 가입하면 된다"고 기재했다. 반면 오픈AI는 지난 9일 동영상 생성 AI '소라'를 정식 출시하며 업계의 주목을 받았다. 이는 지난 2월 발표한 지 10개월 만으로, 그간 일부 이용자들을 대상으로 테스트를 한 후 문제점을 보완해 왔다. 공개 됐을 당시 도쿄 밤거리를 걷고 있는 여성의 다리가 불안정하게 움직이는 등 환각 현상이 발견된 바 있다. '소라'는 이용자가 글로 프롬프트(명령어)를 넣으면 동영상을 생성해주는 AI로, 생성되는 동영상의 길이는 최대 20초다. 당초 최대 1분 길이의 동영상을 빠르게 제작할 수 있다고 오픈AI가 밝혔던 것에 비해선 상당히 시간이 줄었다. '챗GPT 플러스', '챗GPT 프로'에 포함돼 기존 유료 이용자들은 '소라'에 대한 추가 비용을 지불할 필요 없이 이용할 수 있다. 월 20달러를 지불하는 '챗GPT 플러스' 이용자들은 매월 50개(480p 또는 그 이하 해상도), 월 200달러인 '챗GPT 프로' 구독자들은 매월 500개의 영상을 생성할 수 있다. 챗GPT 팀, 엔터프라이즈, 에듀 계정에선 소라를 쓸 수 없다. 현재 한국을 포함한 대부분의 국가에서 사용할 수 있지만 영국, 스위스, 유럽경제지역(EEA)은 이번에 출시가 제외됐다. 이는 이들 지역에서 테크 기업에 대한 규제가 강화하고 있는 데 따른 것으로, 영국 등에서의 정식 출시 일정은 미정이다. 다만 오픈AI가 '소라'를 정식 출시한 후 이용자가 몰리면서 현재 이를 사용할 수 있는 '소라닷컴'의 접속은 원활하게 이뤄지지 않고 있다. 이에 대해 샘 올트먼 오픈AI 최고경영자(CEO)는 자신의 X(옛 트위터)에 "소라에 대한 수요를 상당히 과소 평가했다"고 말했다. 이 외에도 미드저니와 런웨이AI, 메타, 아마존 등도 잇따라 동영상 생성 AI 도구를 선보이며 어도비를 위협하고 있다. 이 탓에 어도비의 주가는 올 들어 8.3%나 하락해 동종 업계보다 뒤처진 모습을 보였다. '소라'가 발표된 후 지난 10일 주가는 전 거래일 대비 0.16% 하락한 547.05달러로 마감했다. 이를 두고 업계에선 어도비가 AI에 대해 두려움을 갖고 혁신적으로 나서지 못했다고 지적했다. 어도비는 "앞으로 몇 주~몇 달 안에 (AI 서비스) 가용성을 확대할 예정"이라며 "어도비 파이어플라이는 상업적으로 안전한 유일한 비디오 모델로, 6주 전에 출시된 후 강력한 고객들의 반응을 확인했다"고 말했다. 그러면서 "모델의 최종 조정과 안전성을 위해 여전히 노력하고 있다"며 "(비디오 AI에 대해선) 전문가들이 사용하는 워크 플로우에 대한 통합뿐 아니라 모델에 초점을 맞추고 있다"고 덧붙였다. 조던 클라인 미즈호 애널리스트는 "어도비 플랫폼에서 점유율을 차지할 새로운 AI 기반 비디오 제작 엔진이 (투자자들에게) 우려 사항으로 남아 있다"며 "어도비는 소프트웨어 분야에서 가장 논쟁이 많은 주식 중 하나"라고 평가했다.

2024.12.11 09:08장유미

"동영상 생성 AI 최강자 떴다"…오픈AI '소라' 출시에 빅테크도 일자리도 '충격'

동영상 생성 인공지능(AI) 최강자로 지목된 오픈AI의 '소라'가 드디어 모습을 드러내며 구글, 메타 등 경쟁자들을 긴장시키고 있다. 텍스트만으로도 빠른 시간 내에 원하는 동영상을 간편하게 만들 수 있다는 점에서 일자리 위협을 느낀 예술가들의 반발도 더 커지는 모양새다. 10일 업계에 따르면 오픈AI는 지난 9일(현지시간) 온라인 행사를 통해 '소라'를 정식 출시한다고 발표했다. 지난 2월 처음 공개한 후 10개월 만으로, 그간 일부 이용자들을 대상으로 테스트를 한 후 문제점을 보완해 왔다. 공개 됐을 당시 도쿄 밤거리를 걷고 있는 여성의 다리가 불안정하게 움직이는 등 환각 현상이 발견된 바 있다. '소라'는 이용자가 글로 프롬프트(명령어)를 넣으면 동영상을 생성해주는 AI로, 생성되는 동영상의 길이는 최대 20초다. 당초 최대 1분 길이의 동영상을 빠르게 제작할 수 있다고 오픈AI가 밝혔던 것에 비해선 상당히 시간이 줄었다. 이에 대해 오픈AI는 "최대한 많은 사람들이 소라에 접근할 수 있도록 하기 위해 성능과 확장성 사이의 균형을 맞춘 것"이라고 설명했다. '소라'는 텍스트뿐 아니라 이미지, 동영상에서 영감을 받아 동영상을 생성하는 것은 물론, 기존 동영상을 확장하거나 빠진 프레임을 채우는 '스토리보드' 기능도 제공한다. 오픈AI가 공개한 '우주에 떠 있는 토끼(a rabbit floating in outer space)'라는 프롬프트로 만든 데모 시연 영상에선 약 7초만에 5초짜리 동영상이 만들어져 이목을 집중시켰다. 만든 영상이 마음에 들지 않으면 프롬프트를 수정하거나 스토리보드를 고치면 된다. '소라'는 구글이 올해 1월 공개한 생성 AI 모델 '루미에르'가 단 5초 분량의 영상물을 제작해주는 것에 비해 월등한 기술력을 갖고 있다는 평가를 받고 있다. 이날부터 한국을 포함한 대부분의 국가에서 사용할 수 있지만 영국, 스위스, 유럽경제지역(EEA)은 이번에 출시가 제외됐다. 이는 이들 지역에서 테크 기업에 대한 규제가 강화하고 있는 데 따른 것으로, 영국 등에서의 정식 출시 일정은 미정이다. '소라'는 현재 '챗GPT 플러스', '챗GPT 프로'에 포함돼 기존 유료 이용자들은 이 동영상 AI 모델 이용에 대한 추가 비용을 지불할 필요 없이 이용할 수 있다. 월 20달러를 지불하는 '챗GPT 플러스' 이용자들은 매월 50개(480p 또는 그 이하 해상도), 월 200달러인 '챗GPT 프로' 구독자들은 매월 500개의 영상을 생성할 수 있다. 챗GPT 팀, 엔터프라이즈, 에듀 계정에선 소라를 쓸 수 없다. 이번 일로 동영상 생성 AI 시장 경쟁은 과열되는 분위기다. 지난해 11월에는 스태빌리티 AI가 '스테이블 비디오 디퓨전'을, 올해 1월에는 마이크로소프트(MS)가 비디오 프레임의 움직임을 조작하는 동영상 생성 모델 '드래그누와'를 선보였다. 바이트댄스는 '매직비디오-V2'를, 애플도 2월 대형언어모델(LLM)을 활용해 동영상을 생성하는 '키프레이머'를 내놨다. 오픈AI가 올해 2월 '소라'를 선보인 후에는 구글 동영상 생성 AI '비오(Veo)'와 중국 콰이쇼우 '클링', 미국 루마 AI '드림 머신', 런웨이 '젠-3 알파', 메타 '무비 젠' 등이 지금까지 공개됐다. 어도비도 지난 10월 '어도비 맥스' 행사에서 파이어 플라이 기반 동영상 AI를 발표하며 경쟁에 합류했고, 아마존도 이달 초 '리인벤트' 행사를 통해 동영상 생성 AI '노바 릴'을 처음 선보였다. 이에 따라 유튜브는 내년부터 동영상 생성 AI '비오'를 활용해 유튜브 쇼츠 영상을 만들 수 있게 할 계획이다. 메타는 '무비 젠'이 만든 AI 동영상을 인스타그램 등 SNS와 연계할 수 있도록 할 예정이다. 사용자들은 AI를 사용해 실감나는 릴스(인스타그램을 통해 공유할 수 있는 15초 이내 분량의 짧은 동영상)를 직접 만들어낼 수 있고 페이스북, 왓츠앱, 스레드 등 메타의 다른 SNS 플랫폼에도 공유할 수 있게 된다. 파이낸셜타임스(FT)는 "메타의 무비 젠 AI 동영상 모델은 할리우드 영화 제작사, 동영상 콘텐츠 크리에이터, SNS 인플루언서들의 창조 작업용 툴로 사용되기를 원하고 있다"며 "메타는 영화 등 예능, 오락산업, 광고를 넘어 보다 광범위한 산업 분야에서 수익 창출 모델을 발굴하려고 하고 있다"고 분석했다. 이처럼 본격적인 동영상 생성 AI 시대가 열리면서 영상 관련 산업은 큰 변화를 맞게 됐다. 영화, 애니메이션, 증강현실(AR) 및 가상현실(VR) 등 다양한 분야에서 활용할 수 있게 되면서 일자리를 위협 받는 이들도 상당해질 것으로 예상된다. 실제 소니픽처스는 영화 제작 비용을 줄이기 위해 생성형 AI를 적극 활용하겠다고 공개적으로 밝힌 바 있다. 이미 코카콜라의 최근 홀리데이 캠페인과 같은 광고에선 AI로 제작된 콘텐츠가 등장하고 있다. 영화 CG 일러스트레이터인 리드 사우든은 "2022년 미드저니(이미지 생성 AI)가 처음 나왔을 때 우리는 '귀엽다'며 비웃었다"며 "하지만 이제 사람들은 생성 AI 때문에 일자리를 잃고 있다"고 말했다. 이에 지난해 미국 할리우드에선 배우와 작가를 중심으로 생성형 AI 활용에 대항하기 위해 파업을 벌이기도 했다. 자칭 '소라 PR(대외홍보) 퍼펫'이라고 부르는 예술가 그룹은 지난달 26일 오픈AI '소라'에 접속할 수 있는 프로그래밍 인터페이스(API)를 온라인에 공개하며 반발하는 모습을 보였다. 업계 관계자는 "오픈AI '소라'가 등장하며 많은 기업들에게 동영상 생성 AI 모델에 대한 강력한 동기가 생겼다"며 "여러 모델들이 한꺼번에 풀리면서 산업계, 특히 미디어 시장에 엄청난 반향을 일으킬 것으로 보인다"고 밝혔다. 일각에선 딥페이크 문제에 대해서도 우려하고 있다. AI 기술로 유명인들의 얼굴을 합성해 정교한 가짜 영상을 만드는 것이 쉬워졌기 때문이다. 이에 오픈AI는 레드팀(취약점을 발견해 AI 안전성을 검증하는 팀)을 만들어 딥페이크를 방지하기 위해 나섰다. 또 '소라'로 생성된 모든 동영상에 C2PA(콘텐트 출처 및 진위 확인을 위한 연합) 표준 AI 워터마크를 넣어 AI가 생성한 콘텐츠임을 알 수 있도록 했다. 로한 사하이 오픈AI 엔지니어링 리드는 "도널드 트럼프 대통령 같은 주요 정치인이나 공적 인물은 생성이 차단된다"며 "잘못된 정보의 확산을 방지하려고 노력하고 있다"고 말했다.

2024.12.10 09:21장유미

"o1·소라 첫선 보일까"…오픈AI, 연말 12일간 AI 기술 공개 '대장정'

오픈AI가 크리스마스 시즌 동안 새로운 제품과 서비스를 선보이며 기술 혁신의 장을 연다. 5일 더버지에 따르면 오픈AI는 총 12일간 매일 새로운 기능, 제품, 데모를 발표할 계획이다. 발표에는 영상 생성 인공지능(AI) 도구 '소라(Sora)'와 추론 모델 'o1'의 풀 버전이 포함될 가능성이 높은 것으로 알려졌다. 샘 알트먼 오픈AI 대표는 최근 뉴욕타임즈 주최 딜북 컨퍼런스에서 "12일간의 발표를 준비 중"이라고 밝히며 이를 공식 확인했다. 다만 구체적인 발표 내용이나 일정은 언급하지 않았다. '소라'는 텍스트를 기반으로 고품질 비디오를 생성할 수 있는 AI 도구로, 거대 언어 모델의 확장판으로 알려져 있다. 이 도구는 올해 중 동안 일부 아티스트를 대상으로 알파 테스트가 진행됐으며 연말 출시를 목표로 개발 중이다. 발표를 앞두고 오픈AI 직원들도 소셜 미디어를 통해 기대감을 드러냈다. 한 기술 부서 담당자는 "크리스마스 소원 목록에 무엇을 적었나요"라는 포스트를 올렸고 다른 직원은 "트리를 막 세울 시간에 맞춰 돌아왔다"고 말했다. 알트먼 대표는 자신의 X 계정을 통해 "내일 태평양 시간 오전 10시부터 매주 평일마다 발표와 데모가 진행될 예정"이라며 "멋진 것들을 공유할 예정이니 기대해달라"고 말했다.

2024.12.05 13:06조이환

AI 영상 생성 모델 '소라' 유출 논란…예술가들 오픈AI에 반격

오픈AI의 동영상 생성 인공지능(AI) '소라'가 정식 오픈 전에 유출돼 혼란을 빚고 있다. 일자리에 위협을 느끼고 있는 예술가들이 오픈AI의 움직임이 반발해 '소라'에 대한 접근 권한을 유출시켰기 때문이다. 27일 테크크런치에 따르면 자칭 '소라 PR(대외홍보) 퍼펫'이라고 부르는 예술가 그룹은 지난 26일 오픈AI '소라'에 접속할 수 있는 프로그래밍 인터페이스(API)를 온라인에 공개했다. 이들은 조기 접근 시스템에서 가져온 것으로 추정되는 인증 토큰을 사용해 이용자가 '소라'로 비디오를 생성할 수 있는 프론트엔드를 만들었다. 이들은 AI 개발 플랫폼인 '허깅 페이스'에 소라를 사용해 볼 수 있도록 API를 게시했다. 이를 통해 테스터가 아닌 일반인들도 사실상 소라의 기능을 미리 써볼 수 있게 됐다. 다만 미국 동부시각 기준 정오부터 접근이 중단됐다. 이번 일로 수 많은 이용자들은 '소라'를 통해 1천80p 고해상도의 10초짜리 영상을 제작해볼 수 있었다. 이용자들이 한꺼번에 몰리면서 서비스를 이용할 때 대기자까지 발생한 것으로 알려졌다. 이후 소셜미디어에 올라간 결과물들은 오픈AI의 워터마크가 삽입돼 있어 눈길을 끌었다. '소라'는 지난 2월 오픈AI가 공개한 동영상 생성 AI 모델로, 텍스트만 입력하면 최대 1분 분량의 영상 제작이 가능하다. 구글이 올해 1월 공개한 생성 AI 모델 '루미에르'가 단 5초 분량의 영상물을 제작해주는 것에 비해 월등한 기술력이란 평가를 받고 있다. 덕분에 유튜브·틱톡 등에서 인기를 끌고 있는 1분 미만의 짦은 영상(숏폼) 제작에 용이하다. 콘텐츠만 있으면 누구나 영상 크리에이터가 될 수 있는 환경이 마련된 것이다. 하지만 영상 제작 관련 업종에 종사하는 이들에게는 위협이 되고 있다. 간단한 명령어 몇 마디로도 디즈니 애니메이션이나 할리우드 영화에서나 나올 듯한 영상을 순식간에 만들 수 있어서다. 특히 할리우드의 단역 배우, 촬영 스태프, 작가 등의 일자리를 빼앗을 수 있다는 우려가 커지고 있다. 이에 오픈AI는 '소라'를 바로 출시하지 않고 기능을 보완하기 위해 일부 예술가들을 대상으로 테스트만 진행해왔다. 샘 알트먼 오픈AI 최고경영자(CEO)는 지난 1일 레딧에서 열린 AMA(Ask Me Anything) 채팅 행사에서 '소라'와 관련해 "모델을 완성하고 안전 및 딥페이크 문제를 처리하고 컴퓨팅을 확장해야 하는 문제로 출시가 지연되고 있다"고 설명했다. 하지만 이번에 '소라 PR 퍼펫'이란 예술가 그룹이 API를 공개해버리면서 다소 난감해졌다. 테스트를 진행한 예술가들은 오픈AI가 '소라'에 대한 긍정적인 이야기를 퍼뜨리라고 압력을 가하고 있다고 주장하며 불만을 드러내기도 했다. 또 익명으로 활동했던 이들은 '소라' 접근권이 공개된 이후 청원서와 함께 자신들과 함께할 예술가들의 서명을 받기 시작했다. 이들은 "수 백명의 아티스트가 1천500억 달러 규모의 회사를 위해 버그 테스트, 피드백, 실험작 제작 등의 무급 노동을 제공하고 있다"며 "우리의 작업에 오픈AI가 공정한 보상을 하지 않고 있다"고 주장했다. 오픈AI는 그동안 테스터들을 엄격하게 통제하고 '소라'로 만들어진 결과물을 공유하기 전에 승인을 받도록 조치한 것으로 알려졌다. 일각에선 오픈AI가 예술가들의 작품을 통제하는 것을 두고 '소라'의 개발 속도가 느려졌기 때문이라는 분석을 내놨다. '소라' 개발을 이끈 책임자 중 한 명인 팀 브룩스가 지난 10월 오픈AI를 떠나면서 생성된 영상에서 캐릭터의 일관성을 유지하는데 오류가 여전한 것으로 전해졌다. '소라'는 공개 당시 도쿄 밤거리를 걷는 여성의 영상을 생성했지만 다리가 불안정하게 움직이는 모습이 포착돼 눈길을 끈 바 있다. 예술가들은 "우리는 예술도구로서의 AI를 반대하지 않는다"며 "예술가들에 대한 대우가 어떻게 형성되는지, 이 도구로 만들어지는 결과물이 어떻게 확산되는지에 대한 뚜렷한 답이 없어 반대하는 것"이라고 밝혔다. 이에 대해 오픈AI는 "수백 명의 예술가들이 '소라'를 쓰고 있고 기밀 정보를 공유하지 않는 것 외에는 주어진 의무가 없다"고 반박했다. 다만 오픈AI는 어떤 세부 정보가 '기밀'로 취급되는지는 설명하지 않았다. 테크크런치는 "이번 사태는 오픈AI의 '아트워싱'에 항의하기 위한 것"이라며 "예술 단체와 AI 기업의 갈등이 보다 심해지고 있다"고 분석했다.

2024.11.27 10:09장유미

[영상] "오픈AI '소라'보다 낫다"…메타, '무비 젠'으로 동영상 생성 AI 시장 흔들까

오픈AI가 만든 '소라'에 맞서 동영상 생성 인공지능(AI) 모델들이 쏟아지고 있는 가운데 '페이스북' 모회사 메타 플랫폼이 우수한 기술을 앞세워 최근 새로운 무기를 공개해 주목 받고 있다. 6일 업계에 따르면 메타는 지난 4일 공식 블로그를 통해 동영상 생성 AI 모델 '무비 젠(Movie Gen)'을 공개했다. 영상은 물론 오디오를 동시에 생성하는 것이 특징으로, 영상 중 일부분만 편집할 수 있는 등 강력한 기능도 갖추고 있다. '무비 젠'은 텍스트 입력으로 최대 16초 길이의 새 동영상을 만들 수 있다. 기존 동영상을 편집할 수도 있고 오디오를 생성할 수도 있으며 사진을 사용해 실제 인물이 등장하는 맞춤형 동영상도 만들 수 있다. 메타는 이번 연구가 2022년 공개한 '메이크 어 신(Make-A-Scene)', '메이크 어 비디오(Make-A-Video)' 등을 통해 쌓은 노하우를 반영했다고 강조했다. 더불어 하마가 물속에서 헤엄치고 코알라가 서핑을 즐기는 한편, 남극의 펭귄이 옷을 갈아입는 등 '무비 젠'을 이용한 만든 동영상도 공개했다. 메타는 "할리우드에서 성공하기를 희망하는 영화 제작자 지망생이든, 동영상 제작을 즐기는 크리에이터이든, 누구나 창의력을 향상시키는 데 도움이 되는 도구를 이용할 수 있어야 한다고 생각한다"고 설명했다. 기능은 이제까지 등장한 영상 모델 중 가장 강력한 편으로 평가된다. 최대 16FPS로 16초짜리의 사실적이고 개인화된 HD 비디오와 48kHz 오디오를 제작할 수 있으며 비디오 편집 기능도 제공한다. '무비 젠'은 일부 내부 직원과 일부 영화 제작자를 포함한 소수의 외부 파트너에게만 우선 제공된다. 메타는 내년에 인스타그램과 왓츠앱, 메신저 등 자사의 소셜미디어 앱에 탑재할 계획이다. 이번 일로 동영상 생성 AI 시장 경쟁은 과열되는 분위기다. 올해 2월 오픈AI가 '소라(Sora)'를 선보인 이후 구글 동영상 생성 AI '비오(Veo)'와 중국 콰이쇼우 '클링', 미국 루마 AI '드림 머신', 런웨이 '젠-3 알파' 등이 지금까지 공개됐다. 오픈AI의 '소라'는 최대 1분 길이의 동영상을 제작할 수 있으며 연내 일반인들도 이용할 수 있을 것으로 예상된다. 구글도 '비오'를 조만간 출시할 예정이다. 런웨이는 지난 7월부터 마케팅과 광고 등 콘텐츠 제작자를 대상으로 '젠-3 알파'를 유료로 제공하고 있다. 앞서 지난해 11월에는 스태빌리티 AI가 '스테이블 비디오 디퓨전'을 선보였다. 올해 1월에는 마이크로소프트(MS)가 비디오 프레임의 움직임을 조작하는 동영상 생성 모델 '드래그누와'를, 바이트댄스는 '매직비디오-V2'를 공개했다. 애플도 2월 대형언어모델(LLM)을 활용해 동영상을 생성하는 '키프레이머'를 내놨다. 이 같은 상황 속에 메타는 "'무비 젠'이 작업 전반에서 업계 유사 모델보다 우수한 성능을 보였다"며 경쟁사들을 겨냥했다. 코너 헤이즈 메타 생성형 AI 제품 부사장은 "더 많은 사람이 동영상 게시물을 만들거나 편집하도록 장려하는 것이 목표"라고 말했다. 업계 관계자는 "오픈AI '소라'가 등장하며 많은 기업들에게 동영상 생성 AI 모델에 대한 강력한 동기가 생겼다"며 "여러 모델들이 하반기에 한꺼번에 풀리면 산업계, 특히 미디어 시장에 엄청난 반향을 일으킬 것으로 보인다"고 말했다.

2024.10.06 10:29장유미

中 바이트댄스, 텍스트 기반 비디오 생성 AI 출시

틱톡을 운영하는 중국 기업 바이트댄스가 텍스트-비디오 생성 인공지능(AI) 모델 시장에 도전장을 냈다. 7일 로이터 등 외신에 따르면 바이트댄스는 텍스트 프롬프트를 기반으로 비디오를 생성하는 소프트웨어(SW) 제품군을 확대했다. 바이트댄스 소유의 파세우 테크놀로지가 개발한 지멩AI가 지난 31일 안드로이드에서 출시된 데 이어 중국 사용자를 위한 애플 앱스토어까지 출시를 마친 것이다. 다만 한국에선 아직 접근할 수 없다. 지멩AI는 구독제 시스템도 내놓았다. 월 69위안(약 1만3천원), 연간 659위안(약 12만6천원)의 구독제가 있으며 사용자는 월 약 2천 여개의 이미지 또는 168개의 AI 비디오를 만들 수 있다. 중국 내 텍스트-비디오 모델 시장은 점차 커지고 있다. 중국 최대 비디오 앱인 콰이쇼우는 지난 7월 '킬링AI' 앱을 글로벌 출시했다. 베타 버전을 중국 내부뿐 아니라 한국 포함 전 세계에서 접근할 수 있게 하며 많은 이용자 데이터를 수집하고 있다. 이 외에도 중국 AI 스타트업 지푸 AI가 지난달에 영상 생성 모델 '잉'을 출시했으며 또 다른 스타트업 셩슈도 '비두' 앱을 공식 출시했다. 반면 오픈AI가 내놓은 '소라'의 출시는 뒤처지는 모습이다. 오픈AI는 지난 2월 텍스트-비디오 모델인 소라를 공개했지만 대중 공개는 계속 미뤄지고 있다. 당시 오픈AI 측은 소라 개발 과정에서 프롬프트의 공간적 세부 사항을 혼동하고 특정 카메라 궤적을 따라가는 데 어려움을 겪고 있다고 설명했다. 오픈AI 미라 무라티 최고경영기술자(CTO)는 "소라는 올해 안에 사용자들에게 공개될 것"이라고 말했지만 별도의 정식 출시 계획은 언급하지 않았다.

2024.08.07 14:39양정민

"오픈AI '소라'보다 낫다"…동영상 생성 AI 강자 런웨이, 新무기 공개

오픈AI가 만든 '소라'에 맞서 동영상 생성 인공지능(AI) 모델들이 쏟아지고 있는 가운데 런웨이가 우수한 기술을 앞세워 최근 새로운 무기를 공개해 주목 받고 있다. 19일 테크레이더, 벤처비트 등 외신에 따르면 런웨이는 지난 17일 동영상 생성 AI 모델 '젠-3 알파(Zen-3 Alpha)'를 공개했다. 미국 스타트업 루마 AI가 '드림 머신'을 공개한 지 일주일 만이다. 런웨이는 지난해 3월 본격적인 동영상 생성 AI 모델이라 할 수 있는 '젠-1(Gen-1)'을 출시했다. 프롬프트를 입력하거나 특정 이미지를 참조해 기존 영상을 새로운 영상으로 변환할 수 있는 모델이다. 또 한 달 뒤인 같은 해 3월에는 기존 모델을 '멀티모달' 기능으로 업그레이드한 '젠-2(Gen-2)'를 출시했다. '젠-1'에서 영상을 만들 때 원본 영상이 꼭 필요했다면 '젠-2'에서는 텍스트만으로도 영상을 만들어낼 수 있다. '텍스트 투 비디오'의 경우 2022년 메타나 구글이 이미 기술을 시연한 적 있다. 하지만 일반인들이 사용할 수 있게 프로그램을 풀지 않은 것과 달리 런웨이는 구독자들이 사용할 수 있도록 상용화해 서비스를 제공하고 있다. '젠-3 알파'도 텍스트 프롬프트, 정지 이미지 또는 사전 녹화된 비디오를 프롬프트로 사용한다. 이를 통해 다양한 감정 표현 및 카메라 움직임을 통해 10초 길이의 고품질의 매우 상세하고 사실적인 장면을 90초 안에 생성할 수 있다. 전작에 비해선 생성 속도, 충실도가 대폭 향상됐을 뿐만 아니라 생성 동영상의 구조, 스타일 및 모션 등을 세밀하게 제어할 수도 있다. 런웨이는 지난 2월 오픈AI '소라' 출시 당시 "게임은 시작됐다"라고 전면전을 선언해 주목 받은 바 있다. 이날 '젠-3 알파'를 통해 만든 영상을 확인한 이들은 완성도가 높아 런웨이의 자신감이 과장이 아니라고 평가했다. 특히 영화처럼 연출 장면은 좋은 반응을 얻었다. 런웨이는 '젠-3 알파'를 이번 주말쯤 유료 사용자에게 정식 공개할 예정이다. 현재는 월 12달러에 유료로 이용할 수 있다. 런웨이는 이후 무료 사용자에게도 점차 서비스를 확대한다는 방침이다. 이처럼 최근 등장한 고퀼리티 동영상 생성 AI 중 정식 서비스를 시작하는 것은 런웨이가 처음이다. 런웨이는 "공개된 모든 영상은 수정 없이 '젠-3 알파'로 모두 제작됐다"며 "대규모 멀티모달 훈련을 위해 구축된 새로운 인프라에서 만들어진 첫 번째 모델"이라고 설명했다. 런웨이는 주요 엔터테인먼트 및 미디어 기업들과 제휴를 노리고 '젠-3'의 맞춤형 버전도 제작했다. 이 버전은 제작자의 예술적 의도에 맞춰 일관된 비디오를 생성하도록 한다. 또 생성된 캐릭터, 배경 및 요소들이 다양한 장면에서 일관된 외모와 행동을 유지할 수 있는 것이 특징이다. 런웨이는 "조만간 이 기술이 적용된 광고, 쇼트 비디오 등을 만나볼 수 있을 것으로 기대한다"며 "젠-3알파는 새로운 C2PA(콘텐츠 자격 증명) 출처 표준을 포함한 보호 장치와 함께 출시될 예정"이라고 밝혔다. 런웨이 외에도 최근 여러 스타트업들이 동영상 생성 AI 모델을 잇따라 출시하며 시장 경쟁은 과열되는 분위기다. 올해 2월 오픈AI가 '소라(Sora)'를 선보인 이후 지난달 구글 동영상 생성 AI '비오(Veo)'와 중국 콰이쇼우 '클링', 미국 루마 AI '드림 머신' 등이 공개됐다. 앞서 지난해 11월에는 스태빌리티 AI가 '스테이블 비디오 디퓨전'을, 메타가 '에뮤' 동영상 생성기를 선보였다. 올해 1월에는 마이크로소프트(MS)가 비디오 프레임의 움직임을 조작하는 동영상 생성 모델 '드래그누와'를, 바이트댄스는 '매직비디오-V2'를 공개했다. 애플도 2월 대형언어모델(LLM)을 활용해 동영상을 생성하는 '키프레이머'를 내놨다. 미드저니는 조만간 비디오 모델을 내놓을 것으로 알려졌다. 업계 관계자는 "오픈AI '소라'가 등장하며 많은 기업들에게 동영상 생성 AI 모델에 대한 강력한 동기가 생겼다"며 "여러 모델들이 하반기쯤 한꺼번에 풀리면 산업계, 특히 미디어 시장에 엄청난 반향을 일으킬 것으로 보인다"고 말했다.

2024.06.19 09:41장유미

中 콰이서우, 오픈AI '소라' 대적할 AI 영상 생성 기술 출시

중국 동영상 플랫폼 콰이서우가 미국 오픈AI의 '소라'에 대적하겠다며 초거대 인공지능(AI) 모델을 기반 이미지 생성 기술을 발표했다. 소라는 명령어를 입력하면 1분 분량의 영상을 만들어주는 AI 서비스다. 6일 중국 언론 IT즈자에 따르면 콰이서우는 '텍스트투이미지', '이미지투이미지' 기능을 제공하는 AI 초거대 모델 '칼라스(KOLORS, 중국어명 可灵)'를 발표하고 공식 홈페이지와 위챗 등을 통해 서비스한다고 밝혔다. 칼라스는 텍스트 입력을 통해 1080P의 2분 길이(30fps) 영상을 생성할 수 있으며 화면 비율을 자유롭게 조정할 수 있다. 유화, 컴퓨터그래픽, 핸드페인팅, 중국 판화, 3D 등 다양한 이미지 스타일 제작과, 8K의 고화질 이미지 생성을 지원한다는 게 콰이서우의 설명이다. 주요 기능은 '텍스트투이미지' 기능으로, 텍스트를 입력하면 다양한 스타일과 높은 화질을 갖춘 이미지를 생성한다. 입력된 테스트를 토대로 다양한 스타일의 이미지를 생성해주며 사용자가 참조 이미지를 업로드할 수도 있다. 이미지의 스타일, 테마, 세부 사항을 기반으로 새 작품을 생성한다. 'AI 이미지 커스터마이징' 기능은, 사용자가 인물 사진을 업로드하면 다양한 가상 이미지로 만들어주는 것이다. 일명 '인물 보존 기술'을 이용해 인물의 자연스러운 특성을 유지하면서 다양한 스타일의 인물 이미지를 생성해주는 것이다. 콰이서우는 "칼라스 초거대 모델은, 콰이서우의 AI팀이 자체 개발했으며, 소라와 유사한 기술 노선을 채택하면서 여러 자체 개발 기술 혁신을 결합해 소라에 맞대결 할 것"이라고 전했다. 콰이서우에 따르면, 칼라스의 초거대 모델 매개변수 규모는 10억 개 수준으로, 오픈소스 커뮤니티 소스 및 자체 AI 기술을 더했다. 텍스트투이미지 기능의 긴 텍스트와 복잡한 의미의 텍스트 입력을 위해 강화학습보상모델기술(RLHF)도 적용했다. 매체에 따르면 콰이서우는 칼라스 초거대 모델에 더 많은 기능이 구현하고, 표정과 신체 움직임이 동시에 구현되는 새로운 'AI 노래와 춤' 서비스도 출시할 예정이다. 한 장의 사진만 있으면, 노래하고 춤추는 영상을 얻을 수 있는 기능이다. 콰이서우는 지난해 연말 기준 평균 월 활성 사용자 수가 7억 명을 넘어선 중국의 주요 영상 플랫폼이다.

2024.06.07 09:08유효정

  Prev 1 2 Next  

지금 뜨는 기사

이시각 헤드라인

폴더블 아이폰, 펀치홀 카메라 탑재 유력

배민·요기요, 먹통 뒤 정상화..."금요일 밤 비 내린 탓"

과학자들, 납으로 금 만들었다…'연금술사의 꿈' 실현되나

"북한 해커, 위장취업해 北 송금"…메일 1천개 적발

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현