• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
인공지능
배터리
양자컴퓨팅
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'소라'통합검색 결과 입니다. (29건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

'오픈AI 소라 경쟁자 등장'...구글, 동영상 생성 모델 '비오' 공개

구글이 동영상 생성모델 '비오'를 공개하며 오픈AI의 '소라'와 맞서기에 나선다. 14일(현지시간) 구글은 연례개발자 컨퍼런스 구글 I/O를 통해 동영상 생성모델 '비오'를 선보였다. 비오는 1080p해상도로 1분 이상 길이의 영상을 생성할 수 있다. 이 동영상 생성모델은 프롬프트를 보다 정확하게 이해하고 따를 수 있도록 교육 데이터의 각 비디오 캡션에 더 많은 세부 정보를 추가해 개발된 것이 특징이다. 또한 고품질의 압축된 비디오 표현을 사용해 효율성도 향상시켰으며 영상 생성 시간도 단축됐다. 자연어와 시각적 의미에 대한 높은 이해도를 갖춘 만큼 사용자가 프롬프터를 통해 세부적으로 작성하는 요구사항을 파악하고 이를 영상에 반영할 수 있다. 예를 들어 타입랩스, 항공촬영 등 영화 촬영 기법 등을 프롬프터로 입력하면 이를 파악해 그대로 적용 가능하다. 비오는 실제 영상 제작이나 편집을 보다 적극적으로 지원하는 것을 목표로 개발됐다. 이를 위해 텍스트 프롬프트와 함께 이미지를 입력으로 사용하여 비디오를 생성할 수 있는 기능을 지원한다. 영상 제작의 기준이 되는 참조 이미지를 지원함으로써 사용자는 보다 일관성 있고 의도한 비디오를 생성할 수 있다. 더불어 원활한 편집을 위해 영상에서 특정 부분만 지정하는 마스크 영역 기능도 지원한다. 또한 프롬프터를 이용해 스토리를 시리즈 형식으로 제작하면 1분으로 제한된 영상 길이를 넘어 연속성 있는 영상도 제작 가능하다. 이를 활용한다면 실제 영화 같은 영상물도 제작 가능하다는 것이 구글 측의 설명이다. 구글은 실제로 비오를 이용한 영화 제작을 준비 중으로 영화 제작자 도널드 글로버 및 그의 크리에이티브 스튜디오인 길가(Gilga)와 함께 작업을 진행하고 있다. 구글의 엘리 콜린스 제품 관리 부사장은 "비오는 전례 없는 수준의 창의적인 제어 기능을 제공한다"며 "창작자가 제작 과정에서 기술 개발 방식에 대해 목소리를 낼 수 있도록 지원할 것"이라고 설명했다.

2024.05.15 09:11남혁우

AI로 포르노 영상까지?…오픈AI, '콘텐츠 제작 허용' 입장 번복한 이유

챗GPT 개발사인 오픈AI가 최근 포르노나 유혈 표현, 비방 등을 포함한 콘텐츠를 생성할 수 있도록 하는 방안을 검토했다가 반대에 부딪히자 입장을 번복하며 진땀을 뺐다. 11일 IT 매체 기즈모도 등 외신에 따르면 오픈AI는 지난 9일 "인공지능(AI)으로 포르노 등을 만들 의도가 없다"며 "용납할 수 없는 딥페이크를 방지하기 위해 강력한 안전 장치를 갖추고 있다"고 입장을 밝혔다. 이어 "어린이 보호를 최우선으로 생각한다"며 "연령에 적합한 맥락에서 성에 관한 대화를 신중하게 탐색하는 것이 중요하다고 믿는다"고 덧붙였다. 오픈AI가 이처럼 해명에 나선 것은 자사 제품을 통해 개발자와 사용자가 책임감 있게 NSFW(욕설, 포르노, 누드, 고어 등 위험한 게시물) 콘텐츠를 생성할 수 있도록 하는 방안을 검토하고 있다는 소식이 전해지면서 비판이 이어졌기 때문이다. 오픈AI는 채팅 AI인 '챗GPT'와 이미지 생성 AI '달리', AI 동영상 생성 서비스 '소라'를 개발한 기업으로, 샘 알트먼 최고경영자(CEO)가 이끌고 있다. 앞서 가디언, 기가진 등 일부 외신들은 오픈AI가 사용자들이 포르노나 유혈 표현, 비방 등을 포함한 콘텐츠를 생성할 수 있도록 하는 방안을 검토 중이라고 보도했다. 또 선정적인 텍스트와 누드 이미지 생성을 앞으로도 금지해야 하는지에 대한 논의도 시작할 것이라고 분위기를 전했다. 다만 딥페이크 생성이 허용돼서는 안 된다는 입장을 갖고 있는 것으로 알려졌다. 이 제안은 AI 도구 개발 방법을 논의하는 오픈AI 문서의 일부로 공개됐다. 미라 무라티 오픈AI 최고기술책임자(CTO)는 "아티스트들이 AI를 통해 표현하는 것에 더 창의적인 환경을 원하고 있다"며 "다양한 분야의 아티스트 및 크리에이터들과 협력하여 무엇이 유용하고 어느 정도의 유연성을 제공해야 하는지 파악하는 중"이라고 밝혔다. 이 같은 소식이 알려지자 업계에선 비판을 쏟아냈다. '안전하고 유익한 AI를 생산한다'는 회사의 목표를 훼손한다는 이유에서다. 올해 노골적으로 제작된 미국 가수 테일러 스위프트의 딥페이크 이미지가 X(옛 트위터)에서 무차별 확산되며 논란이 있었다는 점에서도 우려하는 목소리가 나왔다. X는 테일러 스위프트에 관한 콘텐츠 검색을 일시적으로 금지하며 대응했으나, 이 일로 AI가 생성한 포르노 확산의 위험성이 강조된 바 있다. 이에 영국에서는 노동당이 사람의 나체 이미지를 생성하는 누드화 도구를 금지하는 방안을 검토하고 나섰다. 클레어 맥글린 더럼대 법학과 교수는 "오픈AI가 NSFW 콘텐츠의 생성을 합법적인 자료로 제한하려는 어떠한 방식에도 회의적"이라고 말했다. 온라인 성적 학대로부터 아동을 보호하는 자선단체 '인터넷 워치 파운데이션'(Internet Watch Foundation)은 "오픈AI가 실질적인 대책을 마련하지 않고 AI가 만들어내는 피해에 대해 기업이 책임을 지지 않는 것은 매우 유감스럽다"고 비판했다.

2024.05.11 07:56장유미

중국판 '소라' 등장...최대 16초짜리 AI 영상 생성

중국에서 미국 오픈AI의 텍스트투비디오 생성 모델 '소라(Sora)'를 벤치마킹한 인공지능(AI) 영상 생성 모델을 발표했다. 27일 중국 성수커지(ShengShu)가 칭화대와 협력해 개발한 중국 AI 초거대 모델 '비두(Vidu)'를 발표했다. 이 모델은 장시간, 높은 일치성, 높은 동태성 등 특징을 가지는 모델로서, 중국 언론과 업계 관계자들은 이 모델이 중국 최초의 '소라'급 영상 모델이라고 평가하고 있다. 이 모델은 '중관춘포럼미래인공지능선봉포럼'에서 처음 공개됐다. 비두는 원클릭으로 최대 16초 길이와 최대 1080p 해상도의 영상 생성을 지원하는 독창적 '유빗(U-ViT)' 아키텍처를 사용했다고 설명했다. U-ViT은 소라처럼, 디퓨전(이미지 데이터에 노이즈를 추가 및 제거하며 이미지를 생성)과 트랜스포머(텍스트 맥락을 통해 이미지를 생성) 방식을 결합해 구성된 아키텍처다. 회사측에 따르면 U-ViT 아키텍처는 소라가 채택한 DiT 아키텍처보다 먼저 2022년 9월 개발팀이 제안한 것으로 디퓨전과 트랜스포머를 통합한 세계 최초의 아키텍처다. 개발팀은 앞서 U-ViT 융합 아키텍처를 기반으로 한 세계 최초 다중 모드 확산 모델인 유니디퓨저(UniDiffuser)를 오픈소스화하고 U-ViT 아키텍처의 대규모 확장성 검증을 완료했다고도 설명했다. 비두에 따르면 비두는 실제 물리적 세계를 시뮬레이션 할 수 있을뿐 아니라 창의력과 높은 시공간적 일관성 등을 갖추고 있다. 성수커지는 칭화대 인공지능연구원 출신 인력이 지난해 3월 설립한 AI 스타트업으로 알리바바, 텐센트, 바이트댄스 등 출신 인력으로 구성됐다.

2024.04.29 08:59유효정

오픈AI에 자극 받은 어도비…'소라' 위협할 동영상 생성기 만든다

오픈AI의 영상 생성 인공지능(AI) '소라'가 등장한 후 위기설에 휩싸인 어도비가 AI 텍스트-동영상 생성기를 구축하기 위한 움직임에 본격 나섰다. 11일 블룸버그 통신에 따르면 어도비는 사진 작가, 아티스트 등을 대상으로 감정 표현, 일상 행동 등을 하는 사람들의 동영상을 제출할 경우 최대 120달러를 제공키로 했다. AI 훈련을 위한 자산 확보 차원에서다. 어도비는 지난 1년간 포토샵, 일러스트레이터를 비롯한 전문가용 소프트웨어 포트폴리오에 생성 AI 기능을 추가하는 데 주력해 왔다. 또 지금까지 수십억 번 사용된 텍스트를 사용해 이미지와 일러스트레이션을 제작하는 도구도 출시했다. 하지만 오픈AI의 소라가 등장한 후 시장에선 어도비에 대한 우려를 드러냈다. 실제 오픈AI가 지난 2월 16일 소라를 공개하자, 어도비 주가는 다음날 하루만에 7.41% 하락했다. 이에 어도비는 최근 동영상 생성 기술을 개발 중으로, 올해 말께 더 자세한 내용을 공개할 것이라고 밝히며 진화에 나섰다. 앞서 어도비는 자사 생성형AI 파이어플라이에 영상 생성 기능을 탑재한다는 계획을 드러낸 바 있다. 알렉산드루 코스틴 어도비 생성형AI 부문 부사장도 지난달 27일(현지 시각) 미국 라스베이거스에서 열린 기자 간담회를 통해 "현재 (영상 생성 기능 등) AI 모델을 향상시키기 위한 피드백을 얻기 위해 최선을 다하고 있다"며 "다른 AI모델에서 생성된 영상을 어도비 제품으로 가지고 올 수 있게 하는 방안도 검토하고 있다"고 밝혔다. 어도비는 현재 발, 손, 눈 등 간단한 해부학 사진뿐만 아니라 동작을 취하고 감정을 보여주는 100개 이상의 짧은 클립을 요구하고 있다. 또 스마트폰이나 피트니스 장비와 같은 사물과 상호 작용하는 사람의 영상도 구하고 있다. 다만 저작권이 있는 자료, 누드 또는 기타 불쾌감을 주는 콘텐츠는 제공 받지 않는다. 제출된 동영상에 대한 지불금은 평균 분당 약 2.62달러로 책정됐다. 최대 분당 가격은 약 7.25달러다. 블룸버그 통신은 "이번 일은 인기 있는 콘텐츠 제작의 기반이 되는 AI 모델을 구축하는 데 방대한 양의 데이터가 필요하다는 것을 뜻한다"며 "데이터 출처에 대해선 여전히 많은 논쟁이 있다"고 지적했다. 실제 오픈AI의 경우 텍스트 기반 생성형 AI '챗GPT' 출시 이후 계속해서 저작권 침해 논란에 휩싸였다. 앞서 미국 뉴욕타임스는 자사 콘텐츠를 무단으로 기계 학습에 활용했다며 오픈AI를 상대로 지난해 저작권 침해 소송을 냈다. 논란이 이어지자 오픈AI는 CNN·타임지 등에 뉴스 사용료를 내고 콘텐츠를 기계 학습에 이용하는 내용의 계약을 맺기도 했다. 다만 오픈AI는 이에 대해 명확한 입장을 드러내지 않고 있다. 다만 미라 무라티 오픈AI 최고 기술 책임자(CTO)는 지난달 월스트리트저널과의 인터뷰에서 "소라가 유튜브, 페이스북, 인스타그램의 사용자 제작 동영상으로 학습했는지 여부는 확실하지 않다"고 밝힌 바 있다. 블룸버그 통신은 "어도비는 스톡 라이브러리를 중심으로 (AI) 모델을 교육하며 차별화를 모색해 왔다"며 "AI 학습을 위해 대량의 사진을 제출하는 이들에게는 이미지당 6센트에서 16센트 정도의 보수도 지급했다"고 설명했다. 어도비는 파이어플라이의 영상 생성 기능에 대해 자신감을 드러내고 있다. 새로운 영상을 생성하는 기존의 AI 모델들은 영상 생성에 그쳤지만, 파이어플라이의 영상 생성 기능은 실제로 활용 가능하게 한다는 방침이다. 코스틴 부사장은 "우리 계획은 AI모델을 맥락에 맞게 가져오는 것"이라며 "어도비 만의 차별화된 제품을 개발하는 것이 중요하다"고 강조했다.

2024.04.11 09:22장유미

영상 생성AI '소라', 하반기엔 공식 출시되나

오픈AI가 지난 달 선보인 영상 생성 인공지능(AI) 서비스 '소라'가 올 하반기 출시될 것이란 전망이 제기됐다. 미라 무라티 오픈AI 최고기술책임자(CTO)는 "올해 일반 사용자들도 소라를 이용할 수 있을 것"이라고 말했다고 월스트리트저널이 13일(현지시간) 보도했다. 무라티는 구체적인 출시 일정은 언급하지 않은 채 "몇 달 후 출시될 예정"이라고만 밝혔다. 이에 월스트리트저널은 소라 출시는 올 하반기로 유력하다고 전망했다. 오픈AI가 지난 달 공개한 소라는 텍스트를 영상으로 변환하는 생성형 AI 서비스다. 현재 일부 개발자와 창작자들에게만 공개된 상태다. 오픈AI는 이들의 피드백을 받으면서 서비스 개선 작업을 진행하고 있다. 미라 무라티 CTO는 소라의 음향 기능도 개선할 계획이라고 말했다. 그는 "소라가 만드는 영상에 현실감을 더하기 위해 음향 품질을 높일 것"이라고 설명했다. 또 "현재는 소라 영상을 편집할 수 없는 상태다"면서 "향후 이용자가 소라 영상을 직접 편집할 수 있는 기능도 추가할 것을 고려 중"이라고 설명했다. 월스트리트저널은 미라 무라티 CTO가 "법적으로 허가된 데이터만 학습했다"고 말하고 구체적인 데이터는 공개하지 않았다고 전했다. 이 외에도 무라티는 "소라 이용자는 정치인을 비롯한 가수, 영화배우 등 공인 이미지를 생성할 수 없을 것"이라며 "소라의 영상과 실제 영상을 구분할 수 있도록 워터마크도 부착할 예정"이라고 덧붙였다. 오픈AI가 생성형 AI 악용 사례인 딥페이크, 가짜뉴스 등을 예방하려는 조치다.

2024.03.14 14:07김미정

이탈리아 "오픈AI, '소라' 데이터 처리 방식 알려야"

이탈리아가 오픈AI의 영상 생성 인공지능(AI) 모델 '소라' 조사에 나섰다. 현재 오픈AI에게 소라의 개인정보 처리 방식을 설명해달라고 요청한 상태다. 8일 로이터는 이탈리아 개인정보 보호기구인 '가란테'가 소라의 개인정보 처리법에 대한 조사를 시작했다고 보도했다. 현재 가란테는 오픈AI에게 소라에 대한 정보 제공을 요청한 상태다. 해당 기구는 오픈AI에게 이탈리아 사용자의 개인 데이터를 어떻게 처리했는지, 처리 방법이 향후 서비스 운영에 어떤 영향을 미칠 수 있는지 구체적으로 명시해 달라는 요구를 한 셈이다. 가란테는 "이탈리아 사용자의 데이터 처리 방식과 이에 따른 영향을 알아볼 필요가 있다"고 밝혔다. 이에 오픈AI는 소라 학습 방법과 훈련에 활용한 데이터를 어떻게 수집했는지 알려야 한다. 또 사용된 데이터가 유럽연합(EU) 정보보호규정을 준수하는지 증명해야 한다. 오픈AI는 20일 안에 관련 문의에 답해야 한다. 오픈AI는 지난달 15일 소라에 대한 기술과 데모 영상을 공개한 바 있다. 그러나 소라의 출시 예정일을 밝히진 않았다. 일부 제한된 테스터들로부터 피드백 받고 있다고만 알렸다. 이에 소라에 활용된 정보처리 방식 서류를 이탈리아 기구에 제공할 진 미지수다. 이탈리아는 지난해 오픈AI의 챗GPT 사용 금지 조치를 내린 첫 서방 국가다. 이에 이번 소라 조사 착수에 대한 관심이 주목받고 있다.

2024.03.10 09:21김미정

기술 고도화 나선 韓 기업, 글로벌 AI 생태계서 생존 가능?

국내 기업이 생성형 인공지능(AI) 사업 다각화에 속도를 내고 있다. 자사 AI 서비스와 기술 적용 범위를 해외로 확장하기 위해서다. 3일 업계에 따르면 국내 빅테크를 비롯한 중소·중견 기업, 스타트업은 올해를 해외 진출 원년으로 삼고 있다. 지난해까지 생성형 AI 기술·제품 개발에 집중했다면, 올해 이를 고도화하고 해외로 확장할 방침이다. 자사 기술과 서비스에 자신감이 붙은 셈이다. 기업이 해외에서 성공적인 사업 확장을 이룰지는 미지수라는 의견도 있다. 현재 대기업조차 자사 AI 모델을 해외 서비스에 적용한 사례는 없다. 미국 기업과 차이 나는 기술, 자금력도 주요 이유다. 전문가들은 이를 극복하기 위해 기업과 정부의 공동 노력이 필요하다고 목소리를 내고 있다. 국내 빅테크, AI 기술·서비스로 해외 진출 '청신호' LG AI연구원은 초거대 멀티모달 모델 '엑사원2.0'의 전문성을 필두로 해외 진출을 본격화한다. 엑사원2.0은 전문 분야에 특화된 모델이다. 단순 범용 데이터뿐 아니라 전문 분야 데이터까지 학습했기 때문이다. 이 모델은 전문 문헌 4천500만 건과 이미지 3억5천600만 장을 학습했다. 한국어와 영어도 동시에 이해할 수 있다. 주로 의료, 법률, SW 등 전문 분야에서 활동한다. 지난해 LG전자 AI컨택센터, LG생활건강 K-뷰티 제품 디자인 등에 엑사원2.0이 들어선 상태다. LG AI연구원 측은 올해 엑사원2.0이 국내뿐 아니라 해외 전문 산업서도 승산 있을 것으로 보고 있다. LG AI연구원 김유철 X유닛 부문장은 "올해 바이오를 비롯한 금융, 특허, 학술, 공공, SW 개발, 제조 관련한 해외 파트너사들과 협력해 엑사원 활용 사례를 늘릴 것"이라고 밝혔다. 네이버도 올해 '소버린 AI'로 해외 진출을 본격화한다. 소버린AI는 각국이 글로벌 빅테크에 종속되지 않고 완전한 데이터 주권을 갖기 위해 자국 언어와 문화에 맞는 LLM을 구축하도록 돕는 시스템을 의미한다. 네이버는 소버린AI 시스템 구축 기술로 해외 시장을 공략할 방침이다. 네이버 클라우드 성낙호 하이퍼스케일AI 기술 총괄은 "이미 한국과 일본에서 생성형 AI 서비스를 구축한 적 있다"며 "'하이퍼클로바X'를 통해 각 국가 언어와 문화에 맞는 LLM을 빠르게 구축할 수 있을 것"이라고 밝혔다. 소버린AI로 해당 국가 중요 데이터 유출을 방지하면서도 LLM을 서비스할 수 있는 솔루션도 제공할 계획이다. 이 외에도 '클로바 스튜디오' '뉴로클라우드' 기능을 확대하고 국내외 파트너 대상으로 일상에서 적용할 수 있는 생성형 AI 도구를 추가 개발한다고 덧붙였다. KT는 자사 LLM '믿음'으로 해외 진출을 지난해 말 본격화했다. 지난해 10월 KT는 태국 정보통신기업 자스민그룹과 손잡고 믿음을 활용한 태국어 LLM을 구축하기로 했다. KT는 올해 상반기 자스민그룹 자회사 자스텔의 신규 데이터센터에 GPU 팜을 구축한 뒤 하반기부터 태국어 전용 LLM을 만들기 시작한다. AI 스타트업 "국내는 좁다…해외서도 자신 있어" AI 스타트업도 해외 진출에 속도를 낸다. 지난해 AI 제품 개발에 집중하며 국내 시장에 주로 머물렀다면, 올해는 제품을 고도화하고 해외로 영향력을 넓힐 계획이다. 기존 해외 진출을 추진하던 기업도 올해 시장 점유율을 더 늘리는 것을 목표로 뒀다. 포티투마루는 지난해 6월 영국서 출시한 '사이트버니'로 해외 고객 유치에 나섰다. 사이트버니는 기업용 커뮤니케이션 채널 플랫폼으로 서비스형 소프트웨어(SaaS)로 제공된다. 이 기업이 처음으로 해외 고객을 겨냥한 제품을 내놓은 셈이다. 사이트버니는 자사 질의응답 엔진을 통해 답변한다. 김동환 포티투마루 대표는 "올해부터 AI와 분야별 융합이 본격 시작될 것으로 보인다"며 "스타트업들에게도 돈 버는 AI의 원년일 것"이라고 말했다. 뤼튼테크놀로지스는 지난해 일본에 이어 올해 중동과 동남아 지역에 진출한다. '뤼튼 2.0' 플랫폼을 각 나라 특성에 맞게 전환한 후 고객 유치에 나설 예정이다. 뤼튼은 현재 자사 플랫폼을 국내·일본 고객에게 무료로 제공하고 있다. 중동, 동남아 시장에도 무료로 개방할 계획이다. 이세영 뤼튼테크놀로지스 대표는 "지난해 일본판 뤼튼 플랫폼을 구축한 경험이 있는 만큼 올해 중동과 동남아 시장 공략에 자신있다"고 강조했다. 이 외에도 올거나이즈, 플리토 등도 자사 생성형 AI 서비스로 해외 시장에 영향력을 확대한다고 밝혔다. "美 빅테크 이길 순 없어…자본·기술력 부족" 국내 기업들이 올해를 해외 진출 원년으로 삼지만 성공적인 사업 확장을 이룰지는 미지수다. 현재 국내 빅테크 조차 생성형 AI 모델과 서비스로 해외서 눈에 띄는 성과를 얻지 못했기 때문이다. 최근 네이버가 해외 진출에 속도를 내겠다고 재차 발표했으나 하이퍼클로바X를 해외 서비스에 구축한 사례는 없다. 네이버가 지난해 10월 사우디아라비아 자치행정주택부로부터 디지털 플랫폼 구축 사업을 수주하긴 했다. 그러나 자사 AI 기술이 들어갈 뿐 하이퍼클로바X를 이 사업에 직접 활용하는 건 아니다. 국내 기업의 AI 기술력이 부족한 것도 주요 이유다. 현재 미국 기업들은 올해 LLM을 넘어 멀티모달 생태계를 본격화한 상황이다. 오픈AI는 지난달 텍스트로 이미지를 생성하는 '소라'를 공개했다. 구글도 멀티모달 모델 '제미나이 1.5' 버전과 소형 모델 '젬마'를 출시했다. 국내 기업들도 멀티모달 기술과 서비스를 내놓고는 있다. 그러나 오픈AI의 소라나 구글 제미나이1.5보다 경쟁력 있을지도 미지수다. 업계 관계자는 "국내 AI 기업이 내놓은 멀티모달 모델은 기존 이미지를 편집하거나 단순 흥미용 영상 생성하는 것에 그친다"고 말했다. 이어 "구글은 AI 기술에만 매년 조단위로 투자한다"며 "이런 생태계에서 국내 기업이 해외 기술을 당장 따라잡긴 힘들 것"이라고 설명했다. 국내 AI 기술이 글로벌 생태계서 살아남으려면 정부의 AI 규제보다 지원이 우선이라는 목소리가 나오고 있다. 정부가 AI의 부정적 활용을 방지하기 위해 규제를 엄격히 제한하는 것보다 일단 AI 기술이 커야 한다는 이유에서다. 김진형 카이스트 명예교수는 최근 본지와 진행한 좌담회서 "기업의 힘만으로 AI 기술을 키울 순 없다"며 "정부는 기업들에 자유로운 AI 개발 환경을 주면서 물심양면으로 지원해야 할 것"이라고 강조했다.

2024.03.03 07:00김미정

AI가 영상 만드는 시대 왔다…"컴퓨팅 파워·수익 모델 마련해야"

오픈AI가 영상을 생성하는 인공지능(AI) 모델 '소라'를 공개한 가운데, AI 영상 생성 서비스 상용화에 대한 여러 전망이 나왔다. 국내 업계 관계자들은 영상을 생성할 때 드는 컴퓨팅 인프라 수급 문제부터 해결해야 한다고 주장했다. 모델 수익화 방안도 마련해야 하고, 데이터 학습 방식도 주요 고려사항으로 보고 있다. 오픈AI는 지난 15일 문자를 입력하면 고화질 영상을 생성하는 모델 소라를 홈페이지를 통해 공개했다. 현재 내부 개발팀을 비롯한 소수 영상 편집가, 아티스트, 기업인들에게 공급된 상태다. 사용자 피드백을 통해 기술을 검증한 후 서비스를 출시할 방침이다. 출시 일정은 미정이다. "컴퓨팅 인프라 수요 감당해야…모델 수익화 방안도" 국내 전문가들은 영상모델을 통한 비즈니스가 활성화하려면 아직 멀었다고 입을 모았다. 우선 서비스 구동에 필요한 컴퓨팅 인프라 수급부터 해결해야 한다고 강조했다. AI 영상 생성 서비스의 상용화가 본격화하면 이를 구동하는 그래픽처리장치(GPU) 등 컴퓨팅 인프라 수요가 더 높아질 것으로 보인다는 이유에서다. 업계 관계자는 "언어모델보다 이미지·영상모델 구동에 더 많은 컴퓨팅 파워가 든다"고 했다. 단순 GPU 확보를 넘어 영상 생성 서비스를 비용 효율적으로 운영하기 위한 기술 개발도 본격화할 전망이다. 네이버 관계자는 "AI 모델 압축과 경량화를 돕는 AI 칩 필요성이 더욱 커질 것"이라며 "네이버가 삼성전자와 손잡고 AI 반도체 솔루션을 공동 개발하고 있는 이유"라고 본지에 전했다. 영상모델을 통한 수익화 마련도 구체적이지 않다. 한 업계 관계자는 "오픈AI가 챗GPT를 운영하는 데 드는 컴퓨팅 인프라 비용만 하루 70만 달러(약 9억3천만원)"라며 "이보다 더 무거운 영상모델을 서비스하려면 몇 배 더 높은 운영 비용을 감당해야 할 것"이라고 설명했다. 단순히 API나 구독형으로 기업들에 제공하다간 적자가 불가피할 것이란 분석이다. 현재 AI 기업들은 범용 LLM 개발·운영에 드는 비용을 줄이기 위해 소형언어모델(SLM)을 개발하는 추세다. 범용 LLM에 자사 데이터를 넣어 파인튜닝 하는 방식도 진행하고 있다. 전문가들은 영상 생성 모델에도 동일한 방식을 적용했다간 낭패라는 입장이다. 한국어 LLM을 보유한 한 기업 관계자는 "LLM과 달리 영상모델은 기술적으로 경량화하기 힘들다"며 "모델 경량화는 퀄리티 낮은 영상을 생성할 수 있다"고 지적했다. 영상모델, 언어모델보다 3배 많은 데이터 필요 영상모델의 훈련 데이터양도 중요하다는 지적도 있다. AI 모델이 영화, 광고 등 산업에서 활용 가능할 정도로 수준 높은 이미지를 생성하기 위해선 이미지 데이터를 대량으로 학습해야 해서다. 3D 설계용 AI 모델을 개발 중인 다쏘시스템의 수칫 제인 솔리드웍스·3D익스피리언스 웍스 전략 및 비즈니스 개발 부사장은 "일반적으로 언어모델을 학습시키는 것보다 영상모델 학습시키는 데 3배 더 많은 데이터양과 시간이 걸린다"고 기자에 전한 바 있다. 이미지 데이터에 스며든 사실 왜곡, 혐오 콘텐츠, 편향 등도 제거 해야 한다. 생성 결과물이 비윤리적이거나 편향된 경우 논란을 피할 수 없기 때문이다. 이에 오픈AI는 이미지 데이터 문제 해소를 위한 안전 조치를 취할 예정이라고 홈페이지를 통해 밝힌 바 있다. 영상에 등장할 수 있는 왜곡, 혐오 등의 기술적인 제거를 목표로 뒀다. 오픈AI는 "현재 사내 레드팀이 소라에 적대적 모델 테스트를 진행 중"이라며 "소라로 만든 영상을 분류할 수 있는 소프트웨어 도구도 개발하고 있다"고 설명했다.

2024.02.20 17:31김미정

오픈AI "명령어 입력하면 고화질 영상 완성"...AI모델 '소라' 공개

오픈AI가 간단한 프롬프트 명령어로 60초 분량의 고화질 영상을 제작할 수 있는 생성형 AI 서비스를 공개했다. 15일(현지시간) 테크크런치 등 외신에 따르면 오픈AI는 텍스트 투 비디오(Text To Video) 모델 '소라(Sora)'를 공개하고 테스트에 돌입했다고 밝혔다. 소라는 높은 수준의 영상품질과 사용자의 메시지를 준수하며 최대 1분 길이의 비디오를 제작할 수 있는 생성형 AI다. 프롬프트를 정확하게 해석하고 이를 영상으로 표현할 수 있도록 달리3에 적용된 시각 훈련 데이터를 적용해 언어에 대한 이해도를 높였다. 소라는 데이터 학습을 통해 여러 캐릭터, 특정 유형의 동작, 피사체와 배경의 정확한 세부 정보로 복잡한 장면을 생성할 수 있다. 또한 실제 세계에 대한 이해를 바탕으로 사용자가 요청한 내용 외에도 사실적인 표현을 위해 세부적인 요소들이 영상에 자연스럽게 추가된다. 다만 오픈AI는 아직 소라가 완전한 제품이 아니라고 밝혔다. 복잡한 장면의 물리 표현을 시뮬레이션하는 데 어려움을 겪을 수 있으며 특정 상황의 원인과 결과에 대해 완전히 표현하지 못할 가능성이 있다. 예를 들어 쿠키를 베어 물었을 때 쿠키에 물린 자국이 표현되지 못할 수 있다는 것이다. 왼쪽과 오른쪽 표현이 잘못 표현되는 등 공간적 세부사항이 혼동될 가능성도 있으며 잘못된 정보나 편견이 포함된 영상이 제작될 우려도 있다. 오픈AI 측은 “정식으로 소라를 사용하기에 앞서 안전하게 사용할 수 있도록 몇가지 중요한 안전조치를 취하려 한다”며 “편견, 혐오 관련 도메인 전문가인 레드팀과 협력해 모델을 적극적으로 테스트 할 것”이라고 밝혔다. 이어서 “우리는 AI가 창의적인 전문가에게 가장 도움이 되는 모델을 발전시키는 방법을 모색하고 있다”며 “이를 위해 다수의 시각 예술가, 디자이너 및 영화 제작자에게 액세스 권한을 부여하고 의견을 듣고 있다”고 설명했다.

2024.02.16 11:03남혁우

  Prev 1 2 Next  

지금 뜨는 기사

이시각 헤드라인

2나노에 묶인 삼성 '엑시노스' 로드맵…최적화가 성패 가른다

서로 닮아가는 채용 플랫폼…데이팅·사주로 차별화 꾀하기도

작고 강하게…한국형 '로봇 손' 주도권 놓고 각축전

"따로 또 같이"...글로벌 서비스 ‘라인’은 현지화+기술통합 어떻게 하나

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.