검색 - IT세상을 바꾸는 힘 지디넷코리아

ZDNet 검색 페이지

'소라'통합검색 결과 입니다. (41건)

태그
기간
- 3개월
- 1년
- 1년 이전

재검색

산타 목소리 내는 챗GPT, 영상도 이해한다…오픈AI, 접속장애 문제도 사과

오픈AI가 'GPT-4o' 공개 7개월 만에 '챗GPT'에서 실시간으로 동영상에서 관찰한 내용을 처리하고 사용자와 대화할 수 있는 기능을 새롭게 추가했다. 13일 블룸버그통신에 따르면 오픈AI는 지난 12일(현지시간) '쉽마스(Sheepmas)' 행사를 6일차를 맞아 온라인을 통해 '챗GPT' 고급 음성 모드(AVM)에 실시간 영상 이해 모드를 추가한다고 발표했다. '쉽마스'는 12일간 오픈AI가 매일 새로운 기술을 공개하는 대규모 이벤트다. 앞서 오픈AI는 지난 5월 'GPT-4o' 공개 당시 휴대폰 카메라로 사물을 비추면 이를 이해하고 답해주는 기능을 선보였다. 영상으로 다양한 설정 메뉴를 설명하거나 수학 문제를 풀어주는 식인데, 이날 오픈AI는 드립 커피를 만드는 과정을 '챗GPT'와 대화를 하며 선보였다. 이 기능은 채팅창 옆에 있는 음성 아이콘을 누른 후 왼쪽 하단에 있는 비디오 아이콘을 선택하면 시작된다. 화면 공유도 가능하다. 실시간 영상 이해 기능은 AI 음성 비서의 핵심 기능으로 꼽혔으나, 내부 개발 일정이 밀렸다는 이유로 그간 정식 출시를 미루고 있었다. 하지만 이날 온라인을 통해 기능을 공개하며 유료인 '챗GPT 플러스'와 '챗GPT 프로' 구독자들도 사용할 수 있게 됐다. 엔터프라이즈, 에듀 이용자는 내년 1월부터 사용할 수 있으며 유럽연합(EU)과 스위스 등 일부 국가에서도 당분간 지원되지 않는다. 현재 국내에서는 기능이 아직 추가되지 않은 상태로, 업데이트는 다음주께 완료될 예정이다. 블룸버그통신은 "오픈AI가 2년 전 '챗GPT'를 출시한 후 꾸준히 투자해 오디오와 이미지, 비디오에 응답하는 소위 멀티모달 기능을 선보이기 위해 노력해왔다"며 "이 과정에서 오픈AI가 보다 매력적인 AI 어시스턴트(비서)를 제공할 수 있게 됐다"고 말했다. 오픈AI는 이 기능과 함께 챗GPT 고급 음성 모드에 한시적으로 산타 목소리도 추가했다. 사용자는 챗GPT 채팅창 옆에 있는 눈송이 아이콘을 클릭하면 사용할 수 있다. 이 기능은 1월 초까지 서비스된 후 종료될 예정이다. 산타와의 각 대화는 채팅 기록이나 메모리에는 영향을 미치지 않는다. 국내에서도 현재 13세 이상이면 활용할 수 있다. 또 오픈AI는 이날 새로운 기능 공개와 함께 전날 발생한 '챗GPT'와 '소라'의 접속 장애 문제에 대해서도 사과했다. '챗GPT'는 전날 오전 8시 17분부터 오후 12시 38분까지 로그인, 사용 등이 원활하지 않았던 것으로 파악됐다. 오픈AI는 공식 X(옛 트위터) 계정을 통해 전날 오전 9시 15분에 문제를 확인했다고 밝힌 후 같은 날 오후 2시쯤 서비스가 복구됐다고 알렸다. 다만 장애 원인을 설명하진 않았다. 업계는 접속 장애 원인을 동영상AI '소라' 출시 및 챗GPT와 애플의 음성 비서 '시리' 간 협업에 따른 트래픽 증가에 따른 것으로 봤다. 앞서 오픈AI와 애플은 전날 iOS 18.2 업데이트를 통해 시리와 글쓰기 도구 등에 챗GPT를 결합했다고 발표했다. 이에 따라 아이폰·아이패드 등 기기 이용자들의 챗GPT 수요가 증가하면서 접속 장애가 발생했다는 분석이 나온다. 오픈AI 관계자는 공식 유튜브를 통해 "많은 이들이 우리에게 의존하고 있다는 것을 알고 있고, 오류가 난 것에 대해 정말 죄송하게 생각한다"며 "전날 몇 시간 동안 서버가 접속되지 않은 것에 대한 자세한 내용은 향후 공유할 것"이라고 밝혔다.

2024.12.13 09:24장유미

오픈AI '소라' 게임 콘텐츠 무단 활용 의혹…"법적 리스크 커"

오픈AI가 최근 출시한 비디오 생성 인공지능(AI) '소라'에 게임 콘텐츠를 훈련 데이터로 사용했다는 주장이 제기되면서 법적 문제가 우려되고 있다. 12일 테크크런치에 따르면 '소라'는 텍스트 프롬프트나 이미지를 기반으로 최대 20초 길이의 비디오를 생성할 수 있는 기능을 갖추고 있다. 이미 오픈AI는 '소라'를 시연할 때 훈련에 유명 비디오게임 마인크래프트의 플레이 영상을 사용했다고 밝혔으며 전문가들은 다른 게임 콘텐츠도 훈련 데이터로 포함됐을 가능성이 높다고 분석했다. 실제로 '소라'는 닌텐도 게임인 '슈퍼마리오 브라더스'나 유명 1인칭 슈팅 게임인 '콜오브듀티' 스타일의 영상을 생성할 수 있다. 이와 함께 유명 트위치 스트리머의 외모를 반영한 캐릭터도 만들어내고 그의 문신을 복제하는 등 저작권 문제가 불거질 소지가 큰 것으로 나타났다. 법률 전문가들은 오픈AI가 무단으로 게임 플레이 영상을 사용했을 경우 저작권 침해 소송에 직면할 수 있다고 경고했다. 특히 게임 콘텐츠에는 개발사 뿐만 아니라 스트리머 등 여러 이해관계자가 얽혀 있어 저작권 관련 법적 리스크가 크다. 오픈AI는 훈련 데이터 출처에 대해 명확히 밝히지 않고 있으며 공공 데이터와 라이센스 데이터를 활용했다고만 언급했다. 지적재산권 변호사인 조슈아 와이겐스버그는 "비디오 게임 플레이 영상을 무단으로 사용하는데는 많은 리스크가 있다"고 밝혔다.

2024.12.12 11:27조이환

'소라' 이어 '챗GPT'도 먹통…오픈AI "서비스 중단 발생"

동영상 생성 인공지능(AI) '소라'에 이어 '챗GPT'까지 먹통되면서 오픈AI가 난감한 상태에 놓였다. 12일 업계에 따르면 오픈AI '챗GPT'는 이날 오전부터 로그인, 사용 등이 원활하지 않아 이용자들의 불만이 터져 나오고 있다. '챗GPT'는 주간 전 세계 사용자가 2억5천만 명에 달한다. 현재 '챗GPT'는 어떤 질문에도 응답하지 않고 있다. 로그인을 시도하면 "죄송하다. 문제가 발생했으니, 잠시 뒤 다시 시도하라(We are sorry, an error occurred. Please retry after a few minutes)"는 메시지만 뜬다. '챗GPT'는 지난 11월에도 대규모 접속장애를 일으켰다가 1시간 만에 복구된 바 있다. 업계는 '챗GPT' 장애 역시 '소라'로 인한 트래픽 과다가 원인일 것으로 추정했다. 앞서 오픈AI의 야심작인 동영상 생성 인공지능(AI) 모델 '소라(Sora)'도 지난 9일 정식 출시와 함께 사이트가 마비됐다. 시장 내 '게임체인저'가 될 것이란 기대감과 달리 사전 대비가 소홀했다는 지적이 나온다. 이에 대해 샘 올트먼 오픈AI 최고경영자(CEO)는 자신의 X(옛 트위터)에 "소라에 대한 수요를 상당히 과소 평가했다"고 말했다. 오픈AI는 현재 서비스가 막혀 있다고 긴급히 공식 X(옛 트위터) 계정을 통해 공지했다. 오픈AI는 "지금 서비스 중단 상황(outage)이 발생하고 있다"며 "문제를 파악했고 수정을 위해 노력 중"이라고 말했다. 그러면서 "죄송하다"며 "계속 업데이트하겠다"고 안내했다.

2024.12.12 09:35장유미

오픈AI, 기술 한계 직면했나…'소라' 출시 직후 연일 '먹통'

오픈AI의 야심작인 동영상 생성 인공지능(AI) 모델 '소라(Sora)'가 서비스 정식 출시와 동시에 마비됐다. 시장 내 '게임체인저'가 될 것이란 기대감과 달리 사전 대비가 소홀했다는 지적이 나오면서 AI 기술 주도권을 쥔 오픈AI가 오점을 남겼다는 평가다. 11일 업계에 따르면 오픈AI '소라'를 경험하기 위한 이용자들이 일시적으로 몰리면서 이날 오후 4시 14분(한국시간) 현재도 '소라닷컴'에 접속이 되지 않고 있다. 서비스는 이달 10일(현지 시간 9일) 오픈됐지만 트래픽이 심해 일시적으로 비활성화 조치가 내려졌다. 오픈AI '소라'가 무료가 아닌 유료 이용자들을 대상으로 서비스 된다는 점에서 이번 일은 상당한 실망감을 가져다줬다. '소라'는 현재 '챗GPT 플러스', '챗GPT 프로'에 포함돼 기존 유료 이용자들은 이 동영상 AI 모델 이용에 대한 추가 비용을 지불할 필요 없이 이용할 수 있다. 월 20달러를 지불하는 '챗GPT 플러스' 이용자들은 매월 50개(480p 또는 그 이하 해상도), 월 200달러인 '챗GPT 프로' 구독자들은 매월 500개의 영상을 생성할 수 있다. 챗GPT 팀, 엔터프라이즈, 에듀 계정에선 소라를 쓸 수 없다. 사실상 유료 서비스인 셈이다. 하지만 서비스 정식 출시 후 3일째가 된 이날도 여전히 정상화되지 않고 있다는 점에서 이용자들은 점차 불만을 터트리고 있다. '소라'를 이용하기 위해 '챗GPT 플러스'를 다시 구독하기 시작한 이용자들도 상당히 있지만, 사이트가 '먹통'이 된 탓에 많은 아쉬움을 드러내고 있다. 일각에선 국내와 달리 해외 기업의 서비스 먹통에 대한 민감도가 낮은 듯 하다고 지적했다. 앞서 카카오의 경우 지난 2022년 10월 SK C&C 데이터센터 화재로 서비스가 줄줄이 중단돼 많은 비난이 쏟아진 바 있다. 카카오는 카카오톡 등 무료 서비스에 대해서도 서비스 중단에 대한 책임을 지기 위해 보상안을 마련하며 여론을 달래기 위해 노력했다. 하지만 오픈AI는 유료 고객을 대상으로 한 서비스가 제대로 작동하고 있지 않음에도 개선책은커녕 보상안에 대해서도 제대로 내놓지 못하고 있어 눈살을 찌푸리고 있다. 오픈AI는 '소라닷컴' 알림창에 "현재 트래픽이 심해 소라 계정 생성을 일시적으로 비활성화했다"고만 공지한 상태다. 또 언제 서비스 정상화가 될 수 있냐는 질문에는 명확한 답변을 내놓지 못했다. 이에 대해 샘 올트먼 오픈AI 최고경영자(CEO)는 자신의 X(옛 트위터)에 "소라에 대한 수요를 상당히 과소 평가했다"고만 말했다. 업계 관계자는 "접속 채널에 동시 접속자가 많으면 많을수록 비용이 많이 든다"며 "그만큼 인프라를 확보해 둬야 하기 때문"이라고 설명했다. 이어 "한정된 자원과 예산으로 동시에 들어올 수 있는 인원수를 제한하려고 하다 보니 이 같은 일이 벌어진 듯 하다"며 "유료 구독자를 대상으로 하는 서비스임에도 기술적 한계와 비용 투입이 제대로 일어나지 않아 이 같은 일이 벌어진 듯 해 아쉽다"고 덧붙였다. 그러면서 "영상을 AI로 제작하는 서비스인 만큼 컴퓨팅 리소스를 엄청나게 소모할 듯 한 데 이를 오픈AI가 최적화하지 못한 측면도 있지 않을까 싶다"며 "유료 임에도 SLA(최저보장속도)을 보장해주지 않았다는 점에서 사용자들의 권리를 침해한 것으로 보여 비즈니스 모델로서도 성공적인 시작을 하진 못한 듯 하다"고 평가했다.

2024.12.11 16:19장유미

오픈AI '소라' 등장에 주눅 든 어도비…뒤처진 기술 우려에 주가도 '뚝'

'포토샵'으로 잘 알려진 미국 소프트웨어 기업 어도비가 경쟁사인 오픈AI가 동영상 생성 인공지능(AI) '소라'를 정식 출시하자 또 다시 위기설에 휩싸였다. 관련 서비스를 아직 제대로 선보이지 않고 있는 탓에 오픈AI보다 기술력에서 뒤처지고 있다는 평가도 받고 있다. 11일 블룸버그통신 등에 따르면 어도비는 생성형 AI를 사용해 프롬프트나 이미지에서 동영상을 만들 수 있는 브라우저 기반 서비스를 발표한 지 두 달이 지났지만, 여전히 테스트 단계에 머물고 있는 것으로 나타났다. 현재 어도비와 계약을 맺은 소수의 이용자만 접근할 수 있는 상태다. 앞서 어도비는 지난 10월 초 연례 컨퍼런스를 통해 '파이어플라이 AI' 제품군의 일부로 동영상 생성 AI 기능을 발표했으나, 베타 버전으로만 선보였다. 또 '프리미어'에 동영상 편집 툴을 출시했는데, 이는 사용자가 생성형 AI를 사용해 동영상 클립을 확장할 수 있게 해준다. 어도비는 자사 웹사이트에 "다양한 사용 사례를 가장 잘 지원하고 모델 안전을 보장하기 위해 피드백 수집에 중점을 두고 제한적으로 베타 서비스에 접근할 수 있게 하고 있다"며 "(이용을 원하면) 대기자 명단에 가입하면 된다"고 기재했다. 반면 오픈AI는 지난 9일 동영상 생성 AI '소라'를 정식 출시하며 업계의 주목을 받았다. 이는 지난 2월 발표한 지 10개월 만으로, 그간 일부 이용자들을 대상으로 테스트를 한 후 문제점을 보완해 왔다. 공개 됐을 당시 도쿄 밤거리를 걷고 있는 여성의 다리가 불안정하게 움직이는 등 환각 현상이 발견된 바 있다. '소라'는 이용자가 글로 프롬프트(명령어)를 넣으면 동영상을 생성해주는 AI로, 생성되는 동영상의 길이는 최대 20초다. 당초 최대 1분 길이의 동영상을 빠르게 제작할 수 있다고 오픈AI가 밝혔던 것에 비해선 상당히 시간이 줄었다. '챗GPT 플러스', '챗GPT 프로'에 포함돼 기존 유료 이용자들은 '소라'에 대한 추가 비용을 지불할 필요 없이 이용할 수 있다. 월 20달러를 지불하는 '챗GPT 플러스' 이용자들은 매월 50개(480p 또는 그 이하 해상도), 월 200달러인 '챗GPT 프로' 구독자들은 매월 500개의 영상을 생성할 수 있다. 챗GPT 팀, 엔터프라이즈, 에듀 계정에선 소라를 쓸 수 없다. 현재 한국을 포함한 대부분의 국가에서 사용할 수 있지만 영국, 스위스, 유럽경제지역(EEA)은 이번에 출시가 제외됐다. 이는 이들 지역에서 테크 기업에 대한 규제가 강화하고 있는 데 따른 것으로, 영국 등에서의 정식 출시 일정은 미정이다. 다만 오픈AI가 '소라'를 정식 출시한 후 이용자가 몰리면서 현재 이를 사용할 수 있는 '소라닷컴'의 접속은 원활하게 이뤄지지 않고 있다. 이에 대해 샘 올트먼 오픈AI 최고경영자(CEO)는 자신의 X(옛 트위터)에 "소라에 대한 수요를 상당히 과소 평가했다"고 말했다. 이 외에도 미드저니와 런웨이AI, 메타, 아마존 등도 잇따라 동영상 생성 AI 도구를 선보이며 어도비를 위협하고 있다. 이 탓에 어도비의 주가는 올 들어 8.3%나 하락해 동종 업계보다 뒤처진 모습을 보였다. '소라'가 발표된 후 지난 10일 주가는 전 거래일 대비 0.16% 하락한 547.05달러로 마감했다. 이를 두고 업계에선 어도비가 AI에 대해 두려움을 갖고 혁신적으로 나서지 못했다고 지적했다. 어도비는 "앞으로 몇 주~몇 달 안에 (AI 서비스) 가용성을 확대할 예정"이라며 "어도비 파이어플라이는 상업적으로 안전한 유일한 비디오 모델로, 6주 전에 출시된 후 강력한 고객들의 반응을 확인했다"고 말했다. 그러면서 "모델의 최종 조정과 안전성을 위해 여전히 노력하고 있다"며 "(비디오 AI에 대해선) 전문가들이 사용하는 워크 플로우에 대한 통합뿐 아니라 모델에 초점을 맞추고 있다"고 덧붙였다. 조던 클라인 미즈호 애널리스트는 "어도비 플랫폼에서 점유율을 차지할 새로운 AI 기반 비디오 제작 엔진이 (투자자들에게) 우려 사항으로 남아 있다"며 "어도비는 소프트웨어 분야에서 가장 논쟁이 많은 주식 중 하나"라고 평가했다.

2024.12.11 09:08장유미

"동영상 생성 AI 최강자 떴다"…오픈AI '소라' 출시에 빅테크도 일자리도 '충격'

동영상 생성 인공지능(AI) 최강자로 지목된 오픈AI의 '소라'가 드디어 모습을 드러내며 구글, 메타 등 경쟁자들을 긴장시키고 있다. 텍스트만으로도 빠른 시간 내에 원하는 동영상을 간편하게 만들 수 있다는 점에서 일자리 위협을 느낀 예술가들의 반발도 더 커지는 모양새다. 10일 업계에 따르면 오픈AI는 지난 9일(현지시간) 온라인 행사를 통해 '소라'를 정식 출시한다고 발표했다. 지난 2월 처음 공개한 후 10개월 만으로, 그간 일부 이용자들을 대상으로 테스트를 한 후 문제점을 보완해 왔다. 공개 됐을 당시 도쿄 밤거리를 걷고 있는 여성의 다리가 불안정하게 움직이는 등 환각 현상이 발견된 바 있다. '소라'는 이용자가 글로 프롬프트(명령어)를 넣으면 동영상을 생성해주는 AI로, 생성되는 동영상의 길이는 최대 20초다. 당초 최대 1분 길이의 동영상을 빠르게 제작할 수 있다고 오픈AI가 밝혔던 것에 비해선 상당히 시간이 줄었다. 이에 대해 오픈AI는 "최대한 많은 사람들이 소라에 접근할 수 있도록 하기 위해 성능과 확장성 사이의 균형을 맞춘 것"이라고 설명했다. '소라'는 텍스트뿐 아니라 이미지, 동영상에서 영감을 받아 동영상을 생성하는 것은 물론, 기존 동영상을 확장하거나 빠진 프레임을 채우는 '스토리보드' 기능도 제공한다. 오픈AI가 공개한 '우주에 떠 있는 토끼(a rabbit floating in outer space)'라는 프롬프트로 만든 데모 시연 영상에선 약 7초만에 5초짜리 동영상이 만들어져 이목을 집중시켰다. 만든 영상이 마음에 들지 않으면 프롬프트를 수정하거나 스토리보드를 고치면 된다. '소라'는 구글이 올해 1월 공개한 생성 AI 모델 '루미에르'가 단 5초 분량의 영상물을 제작해주는 것에 비해 월등한 기술력을 갖고 있다는 평가를 받고 있다. 이날부터 한국을 포함한 대부분의 국가에서 사용할 수 있지만 영국, 스위스, 유럽경제지역(EEA)은 이번에 출시가 제외됐다. 이는 이들 지역에서 테크 기업에 대한 규제가 강화하고 있는 데 따른 것으로, 영국 등에서의 정식 출시 일정은 미정이다. '소라'는 현재 '챗GPT 플러스', '챗GPT 프로'에 포함돼 기존 유료 이용자들은 이 동영상 AI 모델 이용에 대한 추가 비용을 지불할 필요 없이 이용할 수 있다. 월 20달러를 지불하는 '챗GPT 플러스' 이용자들은 매월 50개(480p 또는 그 이하 해상도), 월 200달러인 '챗GPT 프로' 구독자들은 매월 500개의 영상을 생성할 수 있다. 챗GPT 팀, 엔터프라이즈, 에듀 계정에선 소라를 쓸 수 없다. 이번 일로 동영상 생성 AI 시장 경쟁은 과열되는 분위기다. 지난해 11월에는 스태빌리티 AI가 '스테이블 비디오 디퓨전'을, 올해 1월에는 마이크로소프트(MS)가 비디오 프레임의 움직임을 조작하는 동영상 생성 모델 '드래그누와'를 선보였다. 바이트댄스는 '매직비디오-V2'를, 애플도 2월 대형언어모델(LLM)을 활용해 동영상을 생성하는 '키프레이머'를 내놨다. 오픈AI가 올해 2월 '소라'를 선보인 후에는 구글 동영상 생성 AI '비오(Veo)'와 중국 콰이쇼우 '클링', 미국 루마 AI '드림 머신', 런웨이 '젠-3 알파', 메타 '무비 젠' 등이 지금까지 공개됐다. 어도비도 지난 10월 '어도비 맥스' 행사에서 파이어 플라이 기반 동영상 AI를 발표하며 경쟁에 합류했고, 아마존도 이달 초 '리인벤트' 행사를 통해 동영상 생성 AI '노바 릴'을 처음 선보였다. 이에 따라 유튜브는 내년부터 동영상 생성 AI '비오'를 활용해 유튜브 쇼츠 영상을 만들 수 있게 할 계획이다. 메타는 '무비 젠'이 만든 AI 동영상을 인스타그램 등 SNS와 연계할 수 있도록 할 예정이다. 사용자들은 AI를 사용해 실감나는 릴스(인스타그램을 통해 공유할 수 있는 15초 이내 분량의 짧은 동영상)를 직접 만들어낼 수 있고 페이스북, 왓츠앱, 스레드 등 메타의 다른 SNS 플랫폼에도 공유할 수 있게 된다. 파이낸셜타임스(FT)는 "메타의 무비 젠 AI 동영상 모델은 할리우드 영화 제작사, 동영상 콘텐츠 크리에이터, SNS 인플루언서들의 창조 작업용 툴로 사용되기를 원하고 있다"며 "메타는 영화 등 예능, 오락산업, 광고를 넘어 보다 광범위한 산업 분야에서 수익 창출 모델을 발굴하려고 하고 있다"고 분석했다. 이처럼 본격적인 동영상 생성 AI 시대가 열리면서 영상 관련 산업은 큰 변화를 맞게 됐다. 영화, 애니메이션, 증강현실(AR) 및 가상현실(VR) 등 다양한 분야에서 활용할 수 있게 되면서 일자리를 위협 받는 이들도 상당해질 것으로 예상된다. 실제 소니픽처스는 영화 제작 비용을 줄이기 위해 생성형 AI를 적극 활용하겠다고 공개적으로 밝힌 바 있다. 이미 코카콜라의 최근 홀리데이 캠페인과 같은 광고에선 AI로 제작된 콘텐츠가 등장하고 있다. 영화 CG 일러스트레이터인 리드 사우든은 "2022년 미드저니(이미지 생성 AI)가 처음 나왔을 때 우리는 '귀엽다'며 비웃었다"며 "하지만 이제 사람들은 생성 AI 때문에 일자리를 잃고 있다"고 말했다. 이에 지난해 미국 할리우드에선 배우와 작가를 중심으로 생성형 AI 활용에 대항하기 위해 파업을 벌이기도 했다. 자칭 '소라 PR(대외홍보) 퍼펫'이라고 부르는 예술가 그룹은 지난달 26일 오픈AI '소라'에 접속할 수 있는 프로그래밍 인터페이스(API)를 온라인에 공개하며 반발하는 모습을 보였다. 업계 관계자는 "오픈AI '소라'가 등장하며 많은 기업들에게 동영상 생성 AI 모델에 대한 강력한 동기가 생겼다"며 "여러 모델들이 한꺼번에 풀리면서 산업계, 특히 미디어 시장에 엄청난 반향을 일으킬 것으로 보인다"고 밝혔다. 일각에선 딥페이크 문제에 대해서도 우려하고 있다. AI 기술로 유명인들의 얼굴을 합성해 정교한 가짜 영상을 만드는 것이 쉬워졌기 때문이다. 이에 오픈AI는 레드팀(취약점을 발견해 AI 안전성을 검증하는 팀)을 만들어 딥페이크를 방지하기 위해 나섰다. 또 '소라'로 생성된 모든 동영상에 C2PA(콘텐트 출처 및 진위 확인을 위한 연합) 표준 AI 워터마크를 넣어 AI가 생성한 콘텐츠임을 알 수 있도록 했다. 로한 사하이 오픈AI 엔지니어링 리드는 "도널드 트럼프 대통령 같은 주요 정치인이나 공적 인물은 생성이 차단된다"며 "잘못된 정보의 확산을 방지하려고 노력하고 있다"고 말했다.

2024.12.10 09:21장유미

"o1·소라 첫선 보일까"…오픈AI, 연말 12일간 AI 기술 공개 '대장정'

오픈AI가 크리스마스 시즌 동안 새로운 제품과 서비스를 선보이며 기술 혁신의 장을 연다. 5일 더버지에 따르면 오픈AI는 총 12일간 매일 새로운 기능, 제품, 데모를 발표할 계획이다. 발표에는 영상 생성 인공지능(AI) 도구 '소라(Sora)'와 추론 모델 'o1'의 풀 버전이 포함될 가능성이 높은 것으로 알려졌다. 샘 알트먼 오픈AI 대표는 최근 뉴욕타임즈 주최 딜북 컨퍼런스에서 "12일간의 발표를 준비 중"이라고 밝히며 이를 공식 확인했다. 다만 구체적인 발표 내용이나 일정은 언급하지 않았다. '소라'는 텍스트를 기반으로 고품질 비디오를 생성할 수 있는 AI 도구로, 거대 언어 모델의 확장판으로 알려져 있다. 이 도구는 올해 중 동안 일부 아티스트를 대상으로 알파 테스트가 진행됐으며 연말 출시를 목표로 개발 중이다. 발표를 앞두고 오픈AI 직원들도 소셜 미디어를 통해 기대감을 드러냈다. 한 기술 부서 담당자는 "크리스마스 소원 목록에 무엇을 적었나요"라는 포스트를 올렸고 다른 직원은 "트리를 막 세울 시간에 맞춰 돌아왔다"고 말했다. 알트먼 대표는 자신의 X 계정을 통해 "내일 태평양 시간 오전 10시부터 매주 평일마다 발표와 데모가 진행될 예정"이라며 "멋진 것들을 공유할 예정이니 기대해달라"고 말했다.

2024.12.05 13:06조이환

AI 영상 생성 모델 '소라' 유출 논란…예술가들 오픈AI에 반격

오픈AI의 동영상 생성 인공지능(AI) '소라'가 정식 오픈 전에 유출돼 혼란을 빚고 있다. 일자리에 위협을 느끼고 있는 예술가들이 오픈AI의 움직임이 반발해 '소라'에 대한 접근 권한을 유출시켰기 때문이다. 27일 테크크런치에 따르면 자칭 '소라 PR(대외홍보) 퍼펫'이라고 부르는 예술가 그룹은 지난 26일 오픈AI '소라'에 접속할 수 있는 프로그래밍 인터페이스(API)를 온라인에 공개했다. 이들은 조기 접근 시스템에서 가져온 것으로 추정되는 인증 토큰을 사용해 이용자가 '소라'로 비디오를 생성할 수 있는 프론트엔드를 만들었다. 이들은 AI 개발 플랫폼인 '허깅 페이스'에 소라를 사용해 볼 수 있도록 API를 게시했다. 이를 통해 테스터가 아닌 일반인들도 사실상 소라의 기능을 미리 써볼 수 있게 됐다. 다만 미국 동부시각 기준 정오부터 접근이 중단됐다. 이번 일로 수 많은 이용자들은 '소라'를 통해 1천80p 고해상도의 10초짜리 영상을 제작해볼 수 있었다. 이용자들이 한꺼번에 몰리면서 서비스를 이용할 때 대기자까지 발생한 것으로 알려졌다. 이후 소셜미디어에 올라간 결과물들은 오픈AI의 워터마크가 삽입돼 있어 눈길을 끌었다. '소라'는 지난 2월 오픈AI가 공개한 동영상 생성 AI 모델로, 텍스트만 입력하면 최대 1분 분량의 영상 제작이 가능하다. 구글이 올해 1월 공개한 생성 AI 모델 '루미에르'가 단 5초 분량의 영상물을 제작해주는 것에 비해 월등한 기술력이란 평가를 받고 있다. 덕분에 유튜브·틱톡 등에서 인기를 끌고 있는 1분 미만의 짦은 영상(숏폼) 제작에 용이하다. 콘텐츠만 있으면 누구나 영상 크리에이터가 될 수 있는 환경이 마련된 것이다. 하지만 영상 제작 관련 업종에 종사하는 이들에게는 위협이 되고 있다. 간단한 명령어 몇 마디로도 디즈니 애니메이션이나 할리우드 영화에서나 나올 듯한 영상을 순식간에 만들 수 있어서다. 특히 할리우드의 단역 배우, 촬영 스태프, 작가 등의 일자리를 빼앗을 수 있다는 우려가 커지고 있다. 이에 오픈AI는 '소라'를 바로 출시하지 않고 기능을 보완하기 위해 일부 예술가들을 대상으로 테스트만 진행해왔다. 샘 알트먼 오픈AI 최고경영자(CEO)는 지난 1일 레딧에서 열린 AMA(Ask Me Anything) 채팅 행사에서 '소라'와 관련해 "모델을 완성하고 안전 및 딥페이크 문제를 처리하고 컴퓨팅을 확장해야 하는 문제로 출시가 지연되고 있다"고 설명했다. 하지만 이번에 '소라 PR 퍼펫'이란 예술가 그룹이 API를 공개해버리면서 다소 난감해졌다. 테스트를 진행한 예술가들은 오픈AI가 '소라'에 대한 긍정적인 이야기를 퍼뜨리라고 압력을 가하고 있다고 주장하며 불만을 드러내기도 했다. 또 익명으로 활동했던 이들은 '소라' 접근권이 공개된 이후 청원서와 함께 자신들과 함께할 예술가들의 서명을 받기 시작했다. 이들은 "수 백명의 아티스트가 1천500억 달러 규모의 회사를 위해 버그 테스트, 피드백, 실험작 제작 등의 무급 노동을 제공하고 있다"며 "우리의 작업에 오픈AI가 공정한 보상을 하지 않고 있다"고 주장했다. 오픈AI는 그동안 테스터들을 엄격하게 통제하고 '소라'로 만들어진 결과물을 공유하기 전에 승인을 받도록 조치한 것으로 알려졌다. 일각에선 오픈AI가 예술가들의 작품을 통제하는 것을 두고 '소라'의 개발 속도가 느려졌기 때문이라는 분석을 내놨다. '소라' 개발을 이끈 책임자 중 한 명인 팀 브룩스가 지난 10월 오픈AI를 떠나면서 생성된 영상에서 캐릭터의 일관성을 유지하는데 오류가 여전한 것으로 전해졌다. '소라'는 공개 당시 도쿄 밤거리를 걷는 여성의 영상을 생성했지만 다리가 불안정하게 움직이는 모습이 포착돼 눈길을 끈 바 있다. 예술가들은 "우리는 예술도구로서의 AI를 반대하지 않는다"며 "예술가들에 대한 대우가 어떻게 형성되는지, 이 도구로 만들어지는 결과물이 어떻게 확산되는지에 대한 뚜렷한 답이 없어 반대하는 것"이라고 밝혔다. 이에 대해 오픈AI는 "수백 명의 예술가들이 '소라'를 쓰고 있고 기밀 정보를 공유하지 않는 것 외에는 주어진 의무가 없다"고 반박했다. 다만 오픈AI는 어떤 세부 정보가 '기밀'로 취급되는지는 설명하지 않았다. 테크크런치는 "이번 사태는 오픈AI의 '아트워싱'에 항의하기 위한 것"이라며 "예술 단체와 AI 기업의 갈등이 보다 심해지고 있다"고 분석했다.

2024.11.27 10:09장유미

[영상] "오픈AI '소라'보다 낫다"…메타, '무비 젠'으로 동영상 생성 AI 시장 흔들까

오픈AI가 만든 '소라'에 맞서 동영상 생성 인공지능(AI) 모델들이 쏟아지고 있는 가운데 '페이스북' 모회사 메타 플랫폼이 우수한 기술을 앞세워 최근 새로운 무기를 공개해 주목 받고 있다. 6일 업계에 따르면 메타는 지난 4일 공식 블로그를 통해 동영상 생성 AI 모델 '무비 젠(Movie Gen)'을 공개했다. 영상은 물론 오디오를 동시에 생성하는 것이 특징으로, 영상 중 일부분만 편집할 수 있는 등 강력한 기능도 갖추고 있다. '무비 젠'은 텍스트 입력으로 최대 16초 길이의 새 동영상을 만들 수 있다. 기존 동영상을 편집할 수도 있고 오디오를 생성할 수도 있으며 사진을 사용해 실제 인물이 등장하는 맞춤형 동영상도 만들 수 있다. 메타는 이번 연구가 2022년 공개한 '메이크 어 신(Make-A-Scene)', '메이크 어 비디오(Make-A-Video)' 등을 통해 쌓은 노하우를 반영했다고 강조했다. 더불어 하마가 물속에서 헤엄치고 코알라가 서핑을 즐기는 한편, 남극의 펭귄이 옷을 갈아입는 등 '무비 젠'을 이용한 만든 동영상도 공개했다. 메타는 "할리우드에서 성공하기를 희망하는 영화 제작자 지망생이든, 동영상 제작을 즐기는 크리에이터이든, 누구나 창의력을 향상시키는 데 도움이 되는 도구를 이용할 수 있어야 한다고 생각한다"고 설명했다. 기능은 이제까지 등장한 영상 모델 중 가장 강력한 편으로 평가된다. 최대 16FPS로 16초짜리의 사실적이고 개인화된 HD 비디오와 48kHz 오디오를 제작할 수 있으며 비디오 편집 기능도 제공한다. '무비 젠'은 일부 내부 직원과 일부 영화 제작자를 포함한 소수의 외부 파트너에게만 우선 제공된다. 메타는 내년에 인스타그램과 왓츠앱, 메신저 등 자사의 소셜미디어 앱에 탑재할 계획이다. 이번 일로 동영상 생성 AI 시장 경쟁은 과열되는 분위기다. 올해 2월 오픈AI가 '소라(Sora)'를 선보인 이후 구글 동영상 생성 AI '비오(Veo)'와 중국 콰이쇼우 '클링', 미국 루마 AI '드림 머신', 런웨이 '젠-3 알파' 등이 지금까지 공개됐다. 오픈AI의 '소라'는 최대 1분 길이의 동영상을 제작할 수 있으며 연내 일반인들도 이용할 수 있을 것으로 예상된다. 구글도 '비오'를 조만간 출시할 예정이다. 런웨이는 지난 7월부터 마케팅과 광고 등 콘텐츠 제작자를 대상으로 '젠-3 알파'를 유료로 제공하고 있다. 앞서 지난해 11월에는 스태빌리티 AI가 '스테이블 비디오 디퓨전'을 선보였다. 올해 1월에는 마이크로소프트(MS)가 비디오 프레임의 움직임을 조작하는 동영상 생성 모델 '드래그누와'를, 바이트댄스는 '매직비디오-V2'를 공개했다. 애플도 2월 대형언어모델(LLM)을 활용해 동영상을 생성하는 '키프레이머'를 내놨다. 이 같은 상황 속에 메타는 "'무비 젠'이 작업 전반에서 업계 유사 모델보다 우수한 성능을 보였다"며 경쟁사들을 겨냥했다. 코너 헤이즈 메타 생성형 AI 제품 부사장은 "더 많은 사람이 동영상 게시물을 만들거나 편집하도록 장려하는 것이 목표"라고 말했다. 업계 관계자는 "오픈AI '소라'가 등장하며 많은 기업들에게 동영상 생성 AI 모델에 대한 강력한 동기가 생겼다"며 "여러 모델들이 하반기에 한꺼번에 풀리면 산업계, 특히 미디어 시장에 엄청난 반향을 일으킬 것으로 보인다"고 말했다.

2024.10.06 10:29장유미

中 바이트댄스, 텍스트 기반 비디오 생성 AI 출시

틱톡을 운영하는 중국 기업 바이트댄스가 텍스트-비디오 생성 인공지능(AI) 모델 시장에 도전장을 냈다. 7일 로이터 등 외신에 따르면 바이트댄스는 텍스트 프롬프트를 기반으로 비디오를 생성하는 소프트웨어(SW) 제품군을 확대했다. 바이트댄스 소유의 파세우 테크놀로지가 개발한 지멩AI가 지난 31일 안드로이드에서 출시된 데 이어 중국 사용자를 위한 애플 앱스토어까지 출시를 마친 것이다. 다만 한국에선 아직 접근할 수 없다. 지멩AI는 구독제 시스템도 내놓았다. 월 69위안(약 1만3천원), 연간 659위안(약 12만6천원)의 구독제가 있으며 사용자는 월 약 2천 여개의 이미지 또는 168개의 AI 비디오를 만들 수 있다. 중국 내 텍스트-비디오 모델 시장은 점차 커지고 있다. 중국 최대 비디오 앱인 콰이쇼우는 지난 7월 '킬링AI' 앱을 글로벌 출시했다. 베타 버전을 중국 내부뿐 아니라 한국 포함 전 세계에서 접근할 수 있게 하며 많은 이용자 데이터를 수집하고 있다. 이 외에도 중국 AI 스타트업 지푸 AI가 지난달에 영상 생성 모델 '잉'을 출시했으며 또 다른 스타트업 셩슈도 '비두' 앱을 공식 출시했다. 반면 오픈AI가 내놓은 '소라'의 출시는 뒤처지는 모습이다. 오픈AI는 지난 2월 텍스트-비디오 모델인 소라를 공개했지만 대중 공개는 계속 미뤄지고 있다. 당시 오픈AI 측은 소라 개발 과정에서 프롬프트의 공간적 세부 사항을 혼동하고 특정 카메라 궤적을 따라가는 데 어려움을 겪고 있다고 설명했다. 오픈AI 미라 무라티 최고경영기술자(CTO)는 "소라는 올해 안에 사용자들에게 공개될 것"이라고 말했지만 별도의 정식 출시 계획은 언급하지 않았다.

2024.08.07 14:39양정민

"오픈AI '소라'보다 낫다"…동영상 생성 AI 강자 런웨이, 新무기 공개

오픈AI가 만든 '소라'에 맞서 동영상 생성 인공지능(AI) 모델들이 쏟아지고 있는 가운데 런웨이가 우수한 기술을 앞세워 최근 새로운 무기를 공개해 주목 받고 있다. 19일 테크레이더, 벤처비트 등 외신에 따르면 런웨이는 지난 17일 동영상 생성 AI 모델 '젠-3 알파(Zen-3 Alpha)'를 공개했다. 미국 스타트업 루마 AI가 '드림 머신'을 공개한 지 일주일 만이다. 런웨이는 지난해 3월 본격적인 동영상 생성 AI 모델이라 할 수 있는 '젠-1(Gen-1)'을 출시했다. 프롬프트를 입력하거나 특정 이미지를 참조해 기존 영상을 새로운 영상으로 변환할 수 있는 모델이다. 또 한 달 뒤인 같은 해 3월에는 기존 모델을 '멀티모달' 기능으로 업그레이드한 '젠-2(Gen-2)'를 출시했다. '젠-1'에서 영상을 만들 때 원본 영상이 꼭 필요했다면 '젠-2'에서는 텍스트만으로도 영상을 만들어낼 수 있다. '텍스트 투 비디오'의 경우 2022년 메타나 구글이 이미 기술을 시연한 적 있다. 하지만 일반인들이 사용할 수 있게 프로그램을 풀지 않은 것과 달리 런웨이는 구독자들이 사용할 수 있도록 상용화해 서비스를 제공하고 있다. '젠-3 알파'도 텍스트 프롬프트, 정지 이미지 또는 사전 녹화된 비디오를 프롬프트로 사용한다. 이를 통해 다양한 감정 표현 및 카메라 움직임을 통해 10초 길이의 고품질의 매우 상세하고 사실적인 장면을 90초 안에 생성할 수 있다. 전작에 비해선 생성 속도, 충실도가 대폭 향상됐을 뿐만 아니라 생성 동영상의 구조, 스타일 및 모션 등을 세밀하게 제어할 수도 있다. 런웨이는 지난 2월 오픈AI '소라' 출시 당시 "게임은 시작됐다"라고 전면전을 선언해 주목 받은 바 있다. 이날 '젠-3 알파'를 통해 만든 영상을 확인한 이들은 완성도가 높아 런웨이의 자신감이 과장이 아니라고 평가했다. 특히 영화처럼 연출 장면은 좋은 반응을 얻었다. 런웨이는 '젠-3 알파'를 이번 주말쯤 유료 사용자에게 정식 공개할 예정이다. 현재는 월 12달러에 유료로 이용할 수 있다. 런웨이는 이후 무료 사용자에게도 점차 서비스를 확대한다는 방침이다. 이처럼 최근 등장한 고퀼리티 동영상 생성 AI 중 정식 서비스를 시작하는 것은 런웨이가 처음이다. 런웨이는 "공개된 모든 영상은 수정 없이 '젠-3 알파'로 모두 제작됐다"며 "대규모 멀티모달 훈련을 위해 구축된 새로운 인프라에서 만들어진 첫 번째 모델"이라고 설명했다. 런웨이는 주요 엔터테인먼트 및 미디어 기업들과 제휴를 노리고 '젠-3'의 맞춤형 버전도 제작했다. 이 버전은 제작자의 예술적 의도에 맞춰 일관된 비디오를 생성하도록 한다. 또 생성된 캐릭터, 배경 및 요소들이 다양한 장면에서 일관된 외모와 행동을 유지할 수 있는 것이 특징이다. 런웨이는 "조만간 이 기술이 적용된 광고, 쇼트 비디오 등을 만나볼 수 있을 것으로 기대한다"며 "젠-3알파는 새로운 C2PA(콘텐츠 자격 증명) 출처 표준을 포함한 보호 장치와 함께 출시될 예정"이라고 밝혔다. 런웨이 외에도 최근 여러 스타트업들이 동영상 생성 AI 모델을 잇따라 출시하며 시장 경쟁은 과열되는 분위기다. 올해 2월 오픈AI가 '소라(Sora)'를 선보인 이후 지난달 구글 동영상 생성 AI '비오(Veo)'와 중국 콰이쇼우 '클링', 미국 루마 AI '드림 머신' 등이 공개됐다. 앞서 지난해 11월에는 스태빌리티 AI가 '스테이블 비디오 디퓨전'을, 메타가 '에뮤' 동영상 생성기를 선보였다. 올해 1월에는 마이크로소프트(MS)가 비디오 프레임의 움직임을 조작하는 동영상 생성 모델 '드래그누와'를, 바이트댄스는 '매직비디오-V2'를 공개했다. 애플도 2월 대형언어모델(LLM)을 활용해 동영상을 생성하는 '키프레이머'를 내놨다. 미드저니는 조만간 비디오 모델을 내놓을 것으로 알려졌다. 업계 관계자는 "오픈AI '소라'가 등장하며 많은 기업들에게 동영상 생성 AI 모델에 대한 강력한 동기가 생겼다"며 "여러 모델들이 하반기쯤 한꺼번에 풀리면 산업계, 특히 미디어 시장에 엄청난 반향을 일으킬 것으로 보인다"고 말했다.

2024.06.19 09:41장유미

中 콰이서우, 오픈AI '소라' 대적할 AI 영상 생성 기술 출시

중국 동영상 플랫폼 콰이서우가 미국 오픈AI의 '소라'에 대적하겠다며 초거대 인공지능(AI) 모델을 기반 이미지 생성 기술을 발표했다. 소라는 명령어를 입력하면 1분 분량의 영상을 만들어주는 AI 서비스다. 6일 중국 언론 IT즈자에 따르면 콰이서우는 '텍스트투이미지', '이미지투이미지' 기능을 제공하는 AI 초거대 모델 '칼라스(KOLORS, 중국어명 可灵)'를 발표하고 공식 홈페이지와 위챗 등을 통해 서비스한다고 밝혔다. 칼라스는 텍스트 입력을 통해 1080P의 2분 길이(30fps) 영상을 생성할 수 있으며 화면 비율을 자유롭게 조정할 수 있다. 유화, 컴퓨터그래픽, 핸드페인팅, 중국 판화, 3D 등 다양한 이미지 스타일 제작과, 8K의 고화질 이미지 생성을 지원한다는 게 콰이서우의 설명이다. 주요 기능은 '텍스트투이미지' 기능으로, 텍스트를 입력하면 다양한 스타일과 높은 화질을 갖춘 이미지를 생성한다. 입력된 테스트를 토대로 다양한 스타일의 이미지를 생성해주며 사용자가 참조 이미지를 업로드할 수도 있다. 이미지의 스타일, 테마, 세부 사항을 기반으로 새 작품을 생성한다. 'AI 이미지 커스터마이징' 기능은, 사용자가 인물 사진을 업로드하면 다양한 가상 이미지로 만들어주는 것이다. 일명 '인물 보존 기술'을 이용해 인물의 자연스러운 특성을 유지하면서 다양한 스타일의 인물 이미지를 생성해주는 것이다. 콰이서우는 "칼라스 초거대 모델은, 콰이서우의 AI팀이 자체 개발했으며, 소라와 유사한 기술 노선을 채택하면서 여러 자체 개발 기술 혁신을 결합해 소라에 맞대결 할 것"이라고 전했다. 콰이서우에 따르면, 칼라스의 초거대 모델 매개변수 규모는 10억 개 수준으로, 오픈소스 커뮤니티 소스 및 자체 AI 기술을 더했다. 텍스트투이미지 기능의 긴 텍스트와 복잡한 의미의 텍스트 입력을 위해 강화학습보상모델기술(RLHF)도 적용했다. 매체에 따르면 콰이서우는 칼라스 초거대 모델에 더 많은 기능이 구현하고, 표정과 신체 움직임이 동시에 구현되는 새로운 'AI 노래와 춤' 서비스도 출시할 예정이다. 한 장의 사진만 있으면, 노래하고 춤추는 영상을 얻을 수 있는 기능이다. 콰이서우는 지난해 연말 기준 평균 월 활성 사용자 수가 7억 명을 넘어선 중국의 주요 영상 플랫폼이다.

2024.06.07 09:08유효정

'오픈AI 소라 경쟁자 등장'...구글, 동영상 생성 모델 '비오' 공개

구글이 동영상 생성모델 '비오'를 공개하며 오픈AI의 '소라'와 맞서기에 나선다. 14일(현지시간) 구글은 연례개발자 컨퍼런스 구글 I/O를 통해 동영상 생성모델 '비오'를 선보였다. 비오는 1080p해상도로 1분 이상 길이의 영상을 생성할 수 있다. 이 동영상 생성모델은 프롬프트를 보다 정확하게 이해하고 따를 수 있도록 교육 데이터의 각 비디오 캡션에 더 많은 세부 정보를 추가해 개발된 것이 특징이다. 또한 고품질의 압축된 비디오 표현을 사용해 효율성도 향상시켰으며 영상 생성 시간도 단축됐다. 자연어와 시각적 의미에 대한 높은 이해도를 갖춘 만큼 사용자가 프롬프터를 통해 세부적으로 작성하는 요구사항을 파악하고 이를 영상에 반영할 수 있다. 예를 들어 타입랩스, 항공촬영 등 영화 촬영 기법 등을 프롬프터로 입력하면 이를 파악해 그대로 적용 가능하다. 비오는 실제 영상 제작이나 편집을 보다 적극적으로 지원하는 것을 목표로 개발됐다. 이를 위해 텍스트 프롬프트와 함께 이미지를 입력으로 사용하여 비디오를 생성할 수 있는 기능을 지원한다. 영상 제작의 기준이 되는 참조 이미지를 지원함으로써 사용자는 보다 일관성 있고 의도한 비디오를 생성할 수 있다. 더불어 원활한 편집을 위해 영상에서 특정 부분만 지정하는 마스크 영역 기능도 지원한다. 또한 프롬프터를 이용해 스토리를 시리즈 형식으로 제작하면 1분으로 제한된 영상 길이를 넘어 연속성 있는 영상도 제작 가능하다. 이를 활용한다면 실제 영화 같은 영상물도 제작 가능하다는 것이 구글 측의 설명이다. 구글은 실제로 비오를 이용한 영화 제작을 준비 중으로 영화 제작자 도널드 글로버 및 그의 크리에이티브 스튜디오인 길가(Gilga)와 함께 작업을 진행하고 있다. 구글의 엘리 콜린스 제품 관리 부사장은 "비오는 전례 없는 수준의 창의적인 제어 기능을 제공한다"며 "창작자가 제작 과정에서 기술 개발 방식에 대해 목소리를 낼 수 있도록 지원할 것"이라고 설명했다.

2024.05.15 09:11남혁우

AI로 포르노 영상까지?…오픈AI, '콘텐츠 제작 허용' 입장 번복한 이유

챗GPT 개발사인 오픈AI가 최근 포르노나 유혈 표현, 비방 등을 포함한 콘텐츠를 생성할 수 있도록 하는 방안을 검토했다가 반대에 부딪히자 입장을 번복하며 진땀을 뺐다. 11일 IT 매체 기즈모도 등 외신에 따르면 오픈AI는 지난 9일 "인공지능(AI)으로 포르노 등을 만들 의도가 없다"며 "용납할 수 없는 딥페이크를 방지하기 위해 강력한 안전 장치를 갖추고 있다"고 입장을 밝혔다. 이어 "어린이 보호를 최우선으로 생각한다"며 "연령에 적합한 맥락에서 성에 관한 대화를 신중하게 탐색하는 것이 중요하다고 믿는다"고 덧붙였다. 오픈AI가 이처럼 해명에 나선 것은 자사 제품을 통해 개발자와 사용자가 책임감 있게 NSFW(욕설, 포르노, 누드, 고어 등 위험한 게시물) 콘텐츠를 생성할 수 있도록 하는 방안을 검토하고 있다는 소식이 전해지면서 비판이 이어졌기 때문이다. 오픈AI는 채팅 AI인 '챗GPT'와 이미지 생성 AI '달리', AI 동영상 생성 서비스 '소라'를 개발한 기업으로, 샘 알트먼 최고경영자(CEO)가 이끌고 있다. 앞서 가디언, 기가진 등 일부 외신들은 오픈AI가 사용자들이 포르노나 유혈 표현, 비방 등을 포함한 콘텐츠를 생성할 수 있도록 하는 방안을 검토 중이라고 보도했다. 또 선정적인 텍스트와 누드 이미지 생성을 앞으로도 금지해야 하는지에 대한 논의도 시작할 것이라고 분위기를 전했다. 다만 딥페이크 생성이 허용돼서는 안 된다는 입장을 갖고 있는 것으로 알려졌다. 이 제안은 AI 도구 개발 방법을 논의하는 오픈AI 문서의 일부로 공개됐다. 미라 무라티 오픈AI 최고기술책임자(CTO)는 "아티스트들이 AI를 통해 표현하는 것에 더 창의적인 환경을 원하고 있다"며 "다양한 분야의 아티스트 및 크리에이터들과 협력하여 무엇이 유용하고 어느 정도의 유연성을 제공해야 하는지 파악하는 중"이라고 밝혔다. 이 같은 소식이 알려지자 업계에선 비판을 쏟아냈다. '안전하고 유익한 AI를 생산한다'는 회사의 목표를 훼손한다는 이유에서다. 올해 노골적으로 제작된 미국 가수 테일러 스위프트의 딥페이크 이미지가 X(옛 트위터)에서 무차별 확산되며 논란이 있었다는 점에서도 우려하는 목소리가 나왔다. X는 테일러 스위프트에 관한 콘텐츠 검색을 일시적으로 금지하며 대응했으나, 이 일로 AI가 생성한 포르노 확산의 위험성이 강조된 바 있다. 이에 영국에서는 노동당이 사람의 나체 이미지를 생성하는 누드화 도구를 금지하는 방안을 검토하고 나섰다. 클레어 맥글린 더럼대 법학과 교수는 "오픈AI가 NSFW 콘텐츠의 생성을 합법적인 자료로 제한하려는 어떠한 방식에도 회의적"이라고 말했다. 온라인 성적 학대로부터 아동을 보호하는 자선단체 '인터넷 워치 파운데이션'(Internet Watch Foundation)은 "오픈AI가 실질적인 대책을 마련하지 않고 AI가 만들어내는 피해에 대해 기업이 책임을 지지 않는 것은 매우 유감스럽다"고 비판했다.

2024.05.11 07:56장유미

중국판 '소라' 등장...최대 16초짜리 AI 영상 생성

중국에서 미국 오픈AI의 텍스트투비디오 생성 모델 '소라(Sora)'를 벤치마킹한 인공지능(AI) 영상 생성 모델을 발표했다. 27일 중국 성수커지(ShengShu)가 칭화대와 협력해 개발한 중국 AI 초거대 모델 '비두(Vidu)'를 발표했다. 이 모델은 장시간, 높은 일치성, 높은 동태성 등 특징을 가지는 모델로서, 중국 언론과 업계 관계자들은 이 모델이 중국 최초의 '소라'급 영상 모델이라고 평가하고 있다. 이 모델은 '중관춘포럼미래인공지능선봉포럼'에서 처음 공개됐다. 비두는 원클릭으로 최대 16초 길이와 최대 1080p 해상도의 영상 생성을 지원하는 독창적 '유빗(U-ViT)' 아키텍처를 사용했다고 설명했다. U-ViT은 소라처럼, 디퓨전(이미지 데이터에 노이즈를 추가 및 제거하며 이미지를 생성)과 트랜스포머(텍스트 맥락을 통해 이미지를 생성) 방식을 결합해 구성된 아키텍처다. 회사측에 따르면 U-ViT 아키텍처는 소라가 채택한 DiT 아키텍처보다 먼저 2022년 9월 개발팀이 제안한 것으로 디퓨전과 트랜스포머를 통합한 세계 최초의 아키텍처다. 개발팀은 앞서 U-ViT 융합 아키텍처를 기반으로 한 세계 최초 다중 모드 확산 모델인 유니디퓨저(UniDiffuser)를 오픈소스화하고 U-ViT 아키텍처의 대규모 확장성 검증을 완료했다고도 설명했다. 비두에 따르면 비두는 실제 물리적 세계를 시뮬레이션 할 수 있을뿐 아니라 창의력과 높은 시공간적 일관성 등을 갖추고 있다. 성수커지는 칭화대 인공지능연구원 출신 인력이 지난해 3월 설립한 AI 스타트업으로 알리바바, 텐센트, 바이트댄스 등 출신 인력으로 구성됐다.

2024.04.29 08:59유효정

오픈AI에 자극 받은 어도비…'소라' 위협할 동영상 생성기 만든다

오픈AI의 영상 생성 인공지능(AI) '소라'가 등장한 후 위기설에 휩싸인 어도비가 AI 텍스트-동영상 생성기를 구축하기 위한 움직임에 본격 나섰다. 11일 블룸버그 통신에 따르면 어도비는 사진 작가, 아티스트 등을 대상으로 감정 표현, 일상 행동 등을 하는 사람들의 동영상을 제출할 경우 최대 120달러를 제공키로 했다. AI 훈련을 위한 자산 확보 차원에서다. 어도비는 지난 1년간 포토샵, 일러스트레이터를 비롯한 전문가용 소프트웨어 포트폴리오에 생성 AI 기능을 추가하는 데 주력해 왔다. 또 지금까지 수십억 번 사용된 텍스트를 사용해 이미지와 일러스트레이션을 제작하는 도구도 출시했다. 하지만 오픈AI의 소라가 등장한 후 시장에선 어도비에 대한 우려를 드러냈다. 실제 오픈AI가 지난 2월 16일 소라를 공개하자, 어도비 주가는 다음날 하루만에 7.41% 하락했다. 이에 어도비는 최근 동영상 생성 기술을 개발 중으로, 올해 말께 더 자세한 내용을 공개할 것이라고 밝히며 진화에 나섰다. 앞서 어도비는 자사 생성형AI 파이어플라이에 영상 생성 기능을 탑재한다는 계획을 드러낸 바 있다. 알렉산드루 코스틴 어도비 생성형AI 부문 부사장도 지난달 27일(현지 시각) 미국 라스베이거스에서 열린 기자 간담회를 통해 "현재 (영상 생성 기능 등) AI 모델을 향상시키기 위한 피드백을 얻기 위해 최선을 다하고 있다"며 "다른 AI모델에서 생성된 영상을 어도비 제품으로 가지고 올 수 있게 하는 방안도 검토하고 있다"고 밝혔다. 어도비는 현재 발, 손, 눈 등 간단한 해부학 사진뿐만 아니라 동작을 취하고 감정을 보여주는 100개 이상의 짧은 클립을 요구하고 있다. 또 스마트폰이나 피트니스 장비와 같은 사물과 상호 작용하는 사람의 영상도 구하고 있다. 다만 저작권이 있는 자료, 누드 또는 기타 불쾌감을 주는 콘텐츠는 제공 받지 않는다. 제출된 동영상에 대한 지불금은 평균 분당 약 2.62달러로 책정됐다. 최대 분당 가격은 약 7.25달러다. 블룸버그 통신은 "이번 일은 인기 있는 콘텐츠 제작의 기반이 되는 AI 모델을 구축하는 데 방대한 양의 데이터가 필요하다는 것을 뜻한다"며 "데이터 출처에 대해선 여전히 많은 논쟁이 있다"고 지적했다. 실제 오픈AI의 경우 텍스트 기반 생성형 AI '챗GPT' 출시 이후 계속해서 저작권 침해 논란에 휩싸였다. 앞서 미국 뉴욕타임스는 자사 콘텐츠를 무단으로 기계 학습에 활용했다며 오픈AI를 상대로 지난해 저작권 침해 소송을 냈다. 논란이 이어지자 오픈AI는 CNN·타임지 등에 뉴스 사용료를 내고 콘텐츠를 기계 학습에 이용하는 내용의 계약을 맺기도 했다. 다만 오픈AI는 이에 대해 명확한 입장을 드러내지 않고 있다. 다만 미라 무라티 오픈AI 최고 기술 책임자(CTO)는 지난달 월스트리트저널과의 인터뷰에서 "소라가 유튜브, 페이스북, 인스타그램의 사용자 제작 동영상으로 학습했는지 여부는 확실하지 않다"고 밝힌 바 있다. 블룸버그 통신은 "어도비는 스톡 라이브러리를 중심으로 (AI) 모델을 교육하며 차별화를 모색해 왔다"며 "AI 학습을 위해 대량의 사진을 제출하는 이들에게는 이미지당 6센트에서 16센트 정도의 보수도 지급했다"고 설명했다. 어도비는 파이어플라이의 영상 생성 기능에 대해 자신감을 드러내고 있다. 새로운 영상을 생성하는 기존의 AI 모델들은 영상 생성에 그쳤지만, 파이어플라이의 영상 생성 기능은 실제로 활용 가능하게 한다는 방침이다. 코스틴 부사장은 "우리 계획은 AI모델을 맥락에 맞게 가져오는 것"이라며 "어도비 만의 차별화된 제품을 개발하는 것이 중요하다"고 강조했다.

2024.04.11 09:22장유미

영상 생성AI '소라', 하반기엔 공식 출시되나

오픈AI가 지난 달 선보인 영상 생성 인공지능(AI) 서비스 '소라'가 올 하반기 출시될 것이란 전망이 제기됐다. 미라 무라티 오픈AI 최고기술책임자(CTO)는 "올해 일반 사용자들도 소라를 이용할 수 있을 것"이라고 말했다고 월스트리트저널이 13일(현지시간) 보도했다. 무라티는 구체적인 출시 일정은 언급하지 않은 채 "몇 달 후 출시될 예정"이라고만 밝혔다. 이에 월스트리트저널은 소라 출시는 올 하반기로 유력하다고 전망했다. 오픈AI가 지난 달 공개한 소라는 텍스트를 영상으로 변환하는 생성형 AI 서비스다. 현재 일부 개발자와 창작자들에게만 공개된 상태다. 오픈AI는 이들의 피드백을 받으면서 서비스 개선 작업을 진행하고 있다. 미라 무라티 CTO는 소라의 음향 기능도 개선할 계획이라고 말했다. 그는 "소라가 만드는 영상에 현실감을 더하기 위해 음향 품질을 높일 것"이라고 설명했다. 또 "현재는 소라 영상을 편집할 수 없는 상태다"면서 "향후 이용자가 소라 영상을 직접 편집할 수 있는 기능도 추가할 것을 고려 중"이라고 설명했다. 월스트리트저널은 미라 무라티 CTO가 "법적으로 허가된 데이터만 학습했다"고 말하고 구체적인 데이터는 공개하지 않았다고 전했다. 이 외에도 무라티는 "소라 이용자는 정치인을 비롯한 가수, 영화배우 등 공인 이미지를 생성할 수 없을 것"이라며 "소라의 영상과 실제 영상을 구분할 수 있도록 워터마크도 부착할 예정"이라고 덧붙였다. 오픈AI가 생성형 AI 악용 사례인 딥페이크, 가짜뉴스 등을 예방하려는 조치다.

2024.03.14 14:07김미정

이탈리아 "오픈AI, '소라' 데이터 처리 방식 알려야"

이탈리아가 오픈AI의 영상 생성 인공지능(AI) 모델 '소라' 조사에 나섰다. 현재 오픈AI에게 소라의 개인정보 처리 방식을 설명해달라고 요청한 상태다. 8일 로이터는 이탈리아 개인정보 보호기구인 '가란테'가 소라의 개인정보 처리법에 대한 조사를 시작했다고 보도했다. 현재 가란테는 오픈AI에게 소라에 대한 정보 제공을 요청한 상태다. 해당 기구는 오픈AI에게 이탈리아 사용자의 개인 데이터를 어떻게 처리했는지, 처리 방법이 향후 서비스 운영에 어떤 영향을 미칠 수 있는지 구체적으로 명시해 달라는 요구를 한 셈이다. 가란테는 "이탈리아 사용자의 데이터 처리 방식과 이에 따른 영향을 알아볼 필요가 있다"고 밝혔다. 이에 오픈AI는 소라 학습 방법과 훈련에 활용한 데이터를 어떻게 수집했는지 알려야 한다. 또 사용된 데이터가 유럽연합(EU) 정보보호규정을 준수하는지 증명해야 한다. 오픈AI는 20일 안에 관련 문의에 답해야 한다. 오픈AI는 지난달 15일 소라에 대한 기술과 데모 영상을 공개한 바 있다. 그러나 소라의 출시 예정일을 밝히진 않았다. 일부 제한된 테스터들로부터 피드백 받고 있다고만 알렸다. 이에 소라에 활용된 정보처리 방식 서류를 이탈리아 기구에 제공할 진 미지수다. 이탈리아는 지난해 오픈AI의 챗GPT 사용 금지 조치를 내린 첫 서방 국가다. 이에 이번 소라 조사 착수에 대한 관심이 주목받고 있다.

2024.03.10 09:21김미정

기술 고도화 나선 韓 기업, 글로벌 AI 생태계서 생존 가능?

국내 기업이 생성형 인공지능(AI) 사업 다각화에 속도를 내고 있다. 자사 AI 서비스와 기술 적용 범위를 해외로 확장하기 위해서다. 3일 업계에 따르면 국내 빅테크를 비롯한 중소·중견 기업, 스타트업은 올해를 해외 진출 원년으로 삼고 있다. 지난해까지 생성형 AI 기술·제품 개발에 집중했다면, 올해 이를 고도화하고 해외로 확장할 방침이다. 자사 기술과 서비스에 자신감이 붙은 셈이다. 기업이 해외에서 성공적인 사업 확장을 이룰지는 미지수라는 의견도 있다. 현재 대기업조차 자사 AI 모델을 해외 서비스에 적용한 사례는 없다. 미국 기업과 차이 나는 기술, 자금력도 주요 이유다. 전문가들은 이를 극복하기 위해 기업과 정부의 공동 노력이 필요하다고 목소리를 내고 있다. 국내 빅테크, AI 기술·서비스로 해외 진출 '청신호' LG AI연구원은 초거대 멀티모달 모델 '엑사원2.0'의 전문성을 필두로 해외 진출을 본격화한다. 엑사원2.0은 전문 분야에 특화된 모델이다. 단순 범용 데이터뿐 아니라 전문 분야 데이터까지 학습했기 때문이다. 이 모델은 전문 문헌 4천500만 건과 이미지 3억5천600만 장을 학습했다. 한국어와 영어도 동시에 이해할 수 있다. 주로 의료, 법률, SW 등 전문 분야에서 활동한다. 지난해 LG전자 AI컨택센터, LG생활건강 K-뷰티 제품 디자인 등에 엑사원2.0이 들어선 상태다. LG AI연구원 측은 올해 엑사원2.0이 국내뿐 아니라 해외 전문 산업서도 승산 있을 것으로 보고 있다. LG AI연구원 김유철 X유닛 부문장은 "올해 바이오를 비롯한 금융, 특허, 학술, 공공, SW 개발, 제조 관련한 해외 파트너사들과 협력해 엑사원 활용 사례를 늘릴 것"이라고 밝혔다. 네이버도 올해 '소버린 AI'로 해외 진출을 본격화한다. 소버린AI는 각국이 글로벌 빅테크에 종속되지 않고 완전한 데이터 주권을 갖기 위해 자국 언어와 문화에 맞는 LLM을 구축하도록 돕는 시스템을 의미한다. 네이버는 소버린AI 시스템 구축 기술로 해외 시장을 공략할 방침이다. 네이버 클라우드 성낙호 하이퍼스케일AI 기술 총괄은 "이미 한국과 일본에서 생성형 AI 서비스를 구축한 적 있다"며 "'하이퍼클로바X'를 통해 각 국가 언어와 문화에 맞는 LLM을 빠르게 구축할 수 있을 것"이라고 밝혔다. 소버린AI로 해당 국가 중요 데이터 유출을 방지하면서도 LLM을 서비스할 수 있는 솔루션도 제공할 계획이다. 이 외에도 '클로바 스튜디오' '뉴로클라우드' 기능을 확대하고 국내외 파트너 대상으로 일상에서 적용할 수 있는 생성형 AI 도구를 추가 개발한다고 덧붙였다. KT는 자사 LLM '믿음'으로 해외 진출을 지난해 말 본격화했다. 지난해 10월 KT는 태국 정보통신기업 자스민그룹과 손잡고 믿음을 활용한 태국어 LLM을 구축하기로 했다. KT는 올해 상반기 자스민그룹 자회사 자스텔의 신규 데이터센터에 GPU 팜을 구축한 뒤 하반기부터 태국어 전용 LLM을 만들기 시작한다. AI 스타트업 "국내는 좁다…해외서도 자신 있어" AI 스타트업도 해외 진출에 속도를 낸다. 지난해 AI 제품 개발에 집중하며 국내 시장에 주로 머물렀다면, 올해는 제품을 고도화하고 해외로 영향력을 넓힐 계획이다. 기존 해외 진출을 추진하던 기업도 올해 시장 점유율을 더 늘리는 것을 목표로 뒀다. 포티투마루는 지난해 6월 영국서 출시한 '사이트버니'로 해외 고객 유치에 나섰다. 사이트버니는 기업용 커뮤니케이션 채널 플랫폼으로 서비스형 소프트웨어(SaaS)로 제공된다. 이 기업이 처음으로 해외 고객을 겨냥한 제품을 내놓은 셈이다. 사이트버니는 자사 질의응답 엔진을 통해 답변한다. 김동환 포티투마루 대표는 "올해부터 AI와 분야별 융합이 본격 시작될 것으로 보인다"며 "스타트업들에게도 돈 버는 AI의 원년일 것"이라고 말했다. 뤼튼테크놀로지스는 지난해 일본에 이어 올해 중동과 동남아 지역에 진출한다. '뤼튼 2.0' 플랫폼을 각 나라 특성에 맞게 전환한 후 고객 유치에 나설 예정이다. 뤼튼은 현재 자사 플랫폼을 국내·일본 고객에게 무료로 제공하고 있다. 중동, 동남아 시장에도 무료로 개방할 계획이다. 이세영 뤼튼테크놀로지스 대표는 "지난해 일본판 뤼튼 플랫폼을 구축한 경험이 있는 만큼 올해 중동과 동남아 시장 공략에 자신있다"고 강조했다. 이 외에도 올거나이즈, 플리토 등도 자사 생성형 AI 서비스로 해외 시장에 영향력을 확대한다고 밝혔다. "美 빅테크 이길 순 없어…자본·기술력 부족" 국내 기업들이 올해를 해외 진출 원년으로 삼지만 성공적인 사업 확장을 이룰지는 미지수다. 현재 국내 빅테크 조차 생성형 AI 모델과 서비스로 해외서 눈에 띄는 성과를 얻지 못했기 때문이다. 최근 네이버가 해외 진출에 속도를 내겠다고 재차 발표했으나 하이퍼클로바X를 해외 서비스에 구축한 사례는 없다. 네이버가 지난해 10월 사우디아라비아 자치행정주택부로부터 디지털 플랫폼 구축 사업을 수주하긴 했다. 그러나 자사 AI 기술이 들어갈 뿐 하이퍼클로바X를 이 사업에 직접 활용하는 건 아니다. 국내 기업의 AI 기술력이 부족한 것도 주요 이유다. 현재 미국 기업들은 올해 LLM을 넘어 멀티모달 생태계를 본격화한 상황이다. 오픈AI는 지난달 텍스트로 이미지를 생성하는 '소라'를 공개했다. 구글도 멀티모달 모델 '제미나이 1.5' 버전과 소형 모델 '젬마'를 출시했다. 국내 기업들도 멀티모달 기술과 서비스를 내놓고는 있다. 그러나 오픈AI의 소라나 구글 제미나이1.5보다 경쟁력 있을지도 미지수다. 업계 관계자는 "국내 AI 기업이 내놓은 멀티모달 모델은 기존 이미지를 편집하거나 단순 흥미용 영상 생성하는 것에 그친다"고 말했다. 이어 "구글은 AI 기술에만 매년 조단위로 투자한다"며 "이런 생태계에서 국내 기업이 해외 기술을 당장 따라잡긴 힘들 것"이라고 설명했다. 국내 AI 기술이 글로벌 생태계서 살아남으려면 정부의 AI 규제보다 지원이 우선이라는 목소리가 나오고 있다. 정부가 AI의 부정적 활용을 방지하기 위해 규제를 엄격히 제한하는 것보다 일단 AI 기술이 커야 한다는 이유에서다. 김진형 카이스트 명예교수는 최근 본지와 진행한 좌담회서 "기업의 힘만으로 AI 기술을 키울 순 없다"며 "정부는 기업들에 자유로운 AI 개발 환경을 주면서 물심양면으로 지원해야 할 것"이라고 강조했다.

2024.03.03 07:00김미정

AI가 영상 만드는 시대 왔다…"컴퓨팅 파워·수익 모델 마련해야"

오픈AI가 영상을 생성하는 인공지능(AI) 모델 '소라'를 공개한 가운데, AI 영상 생성 서비스 상용화에 대한 여러 전망이 나왔다. 국내 업계 관계자들은 영상을 생성할 때 드는 컴퓨팅 인프라 수급 문제부터 해결해야 한다고 주장했다. 모델 수익화 방안도 마련해야 하고, 데이터 학습 방식도 주요 고려사항으로 보고 있다. 오픈AI는 지난 15일 문자를 입력하면 고화질 영상을 생성하는 모델 소라를 홈페이지를 통해 공개했다. 현재 내부 개발팀을 비롯한 소수 영상 편집가, 아티스트, 기업인들에게 공급된 상태다. 사용자 피드백을 통해 기술을 검증한 후 서비스를 출시할 방침이다. 출시 일정은 미정이다. "컴퓨팅 인프라 수요 감당해야…모델 수익화 방안도" 국내 전문가들은 영상모델을 통한 비즈니스가 활성화하려면 아직 멀었다고 입을 모았다. 우선 서비스 구동에 필요한 컴퓨팅 인프라 수급부터 해결해야 한다고 강조했다. AI 영상 생성 서비스의 상용화가 본격화하면 이를 구동하는 그래픽처리장치(GPU) 등 컴퓨팅 인프라 수요가 더 높아질 것으로 보인다는 이유에서다. 업계 관계자는 "언어모델보다 이미지·영상모델 구동에 더 많은 컴퓨팅 파워가 든다"고 했다. 단순 GPU 확보를 넘어 영상 생성 서비스를 비용 효율적으로 운영하기 위한 기술 개발도 본격화할 전망이다. 네이버 관계자는 "AI 모델 압축과 경량화를 돕는 AI 칩 필요성이 더욱 커질 것"이라며 "네이버가 삼성전자와 손잡고 AI 반도체 솔루션을 공동 개발하고 있는 이유"라고 본지에 전했다. 영상모델을 통한 수익화 마련도 구체적이지 않다. 한 업계 관계자는 "오픈AI가 챗GPT를 운영하는 데 드는 컴퓨팅 인프라 비용만 하루 70만 달러(약 9억3천만원)"라며 "이보다 더 무거운 영상모델을 서비스하려면 몇 배 더 높은 운영 비용을 감당해야 할 것"이라고 설명했다. 단순히 API나 구독형으로 기업들에 제공하다간 적자가 불가피할 것이란 분석이다. 현재 AI 기업들은 범용 LLM 개발·운영에 드는 비용을 줄이기 위해 소형언어모델(SLM)을 개발하는 추세다. 범용 LLM에 자사 데이터를 넣어 파인튜닝 하는 방식도 진행하고 있다. 전문가들은 영상 생성 모델에도 동일한 방식을 적용했다간 낭패라는 입장이다. 한국어 LLM을 보유한 한 기업 관계자는 "LLM과 달리 영상모델은 기술적으로 경량화하기 힘들다"며 "모델 경량화는 퀄리티 낮은 영상을 생성할 수 있다"고 지적했다. 영상모델, 언어모델보다 3배 많은 데이터 필요 영상모델의 훈련 데이터양도 중요하다는 지적도 있다. AI 모델이 영화, 광고 등 산업에서 활용 가능할 정도로 수준 높은 이미지를 생성하기 위해선 이미지 데이터를 대량으로 학습해야 해서다. 3D 설계용 AI 모델을 개발 중인 다쏘시스템의 수칫 제인 솔리드웍스·3D익스피리언스 웍스 전략 및 비즈니스 개발 부사장은 "일반적으로 언어모델을 학습시키는 것보다 영상모델 학습시키는 데 3배 더 많은 데이터양과 시간이 걸린다"고 기자에 전한 바 있다. 이미지 데이터에 스며든 사실 왜곡, 혐오 콘텐츠, 편향 등도 제거 해야 한다. 생성 결과물이 비윤리적이거나 편향된 경우 논란을 피할 수 없기 때문이다. 이에 오픈AI는 이미지 데이터 문제 해소를 위한 안전 조치를 취할 예정이라고 홈페이지를 통해 밝힌 바 있다. 영상에 등장할 수 있는 왜곡, 혐오 등의 기술적인 제거를 목표로 뒀다. 오픈AI는 "현재 사내 레드팀이 소라에 적대적 모델 테스트를 진행 중"이라며 "소라로 만든 영상을 분류할 수 있는 소프트웨어 도구도 개발하고 있다"고 설명했다.

2024.02.20 17:31김미정

Prev 1 2 3 Next