• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
창간특집
인공지능
배터리
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'영상 AI'통합검색 결과 입니다. (47건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

패러닷 AI 영상 공유 플랫폼 '캐럿', 웹버전도 나왔다

인공지능(AI) 영상 공유 플랫폼 '캐럿' 운영사 패러닷(대표 장진욱)이 캐럿 웹버전을 출시했다고 13일 밝혔다. 캐럿에서는 누구나 완성도 높은 AI 콘텐츠를 만들고 서로 공유할 수 있다. Flux, Runway 등 기술 트렌드를 선도하는 AI 모델을 다수 탑재해 명령어 입력만으로 수준 높은 창작이 가능하다. AI 콘텐츠에 익숙하지 않은 입문자들은 캐럿에서 미리 '파인 튜닝'(결과 개선을 위해 AI 모델을 재학습시키고 설정값을 조정하는 작업)을 거쳐 준비한 생성 기능으로 간단하게 이미지와 영상을 만들어볼 수 있다. 캐럿 웹버전은 창작에 특화된 UI(사용자 환경)를 갖췄다. PC 환경에서 다수의 AI 모델을 활용해 콘텐츠를 만드는 고관여 사용자를 위한 선택이다. 개별 서비스를 따로 활용하는 방식에서 벗어나, '추가 작업' 기능을 통해 캐럿 안에서 다양한 작업을 수행할 수 있다. 생성한 이미지에 추가 명령어를 입력해 영상을 만들거나 기존 영상에 내용을 추가해 길게 확장하는 식이다. 이 과정에서 원하는 모델을 선택할 수 있다. 장진욱 패러닷 대표는 "캐럿은 누구나 아이디어만으로 고품질 콘텐츠를 만들고 서로 공유할 수 있는 AI 콘텐츠 생태계를 만들고 있다"며 "앞으로도 AI 창작 입문자와 고급자 모두가 유용하게 활용할 수 있는 서비스로 캐럿을 고도화해 나가겠다"고 말했다.

2024.12.13 09:10백봉삼

오픈AI '소라' 게임 콘텐츠 무단 활용 의혹…"법적 리스크 커"

오픈AI가 최근 출시한 비디오 생성 인공지능(AI) '소라'에 게임 콘텐츠를 훈련 데이터로 사용했다는 주장이 제기되면서 법적 문제가 우려되고 있다. 12일 테크크런치에 따르면 '소라'는 텍스트 프롬프트나 이미지를 기반으로 최대 20초 길이의 비디오를 생성할 수 있는 기능을 갖추고 있다. 이미 오픈AI는 '소라'를 시연할 때 훈련에 유명 비디오게임 마인크래프트의 플레이 영상을 사용했다고 밝혔으며 전문가들은 다른 게임 콘텐츠도 훈련 데이터로 포함됐을 가능성이 높다고 분석했다. 실제로 '소라'는 닌텐도 게임인 '슈퍼마리오 브라더스'나 유명 1인칭 슈팅 게임인 '콜오브듀티' 스타일의 영상을 생성할 수 있다. 이와 함께 유명 트위치 스트리머의 외모를 반영한 캐릭터도 만들어내고 그의 문신을 복제하는 등 저작권 문제가 불거질 소지가 큰 것으로 나타났다. 법률 전문가들은 오픈AI가 무단으로 게임 플레이 영상을 사용했을 경우 저작권 침해 소송에 직면할 수 있다고 경고했다. 특히 게임 콘텐츠에는 개발사 뿐만 아니라 스트리머 등 여러 이해관계자가 얽혀 있어 저작권 관련 법적 리스크가 크다. 오픈AI는 훈련 데이터 출처에 대해 명확히 밝히지 않고 있으며 공공 데이터와 라이센스 데이터를 활용했다고만 언급했다. 지적재산권 변호사인 조슈아 와이겐스버그는 "비디오 게임 플레이 영상을 무단으로 사용하는데는 많은 리스크가 있다"고 밝혔다.

2024.12.12 11:27조이환

덱스터크레마, 'AI 서밋 서울'서 인페인팅 모델 개발 성과 발표

덱스터크레마가 최근 영상 제작 분야에서 활발히 논의되는 인공지능(AI) 활용 방안과 향후 발전 방향에 대한 인사이트를 제시했다. 덱스터스튜디오의 자회사인 AI 디지털 마케팅 전문기업 덱스터크레마(대표 손동진·송경운)가 지난 10일 열린 글로벌 인공지능 컨퍼런스 'AI 서밋 서울 2024'에 초청 연사로 참여했다고 밝혔다. 글로벌 AI 컨퍼런스 'AI 서밋 서울'은 최신 기술 트렌드와 각 산업별 AI 적용 사례를 공유하기 위해 마련된 행사다. 올해로 7회째를 맞은 이번 행사에는 메타, 캔바, LG전자, 엔씨소프트 등 글로벌 빅테크 기업의 전문가들이 패널로 참여해 AI와 산업 간 연계에 대한 심도 있는 논의를 나눴다. 덱스터크레마는 행사 첫날 'AI, 영상 제작의 경계를 허물다: AI가 열어가는 새로운 가능성'이라는 주제로 발표를 진행했다. 연사로 나선 이창범 AI R&D 연구소장은 ▲영상 제작 분야의 실제 AI 활용 사례 ▲인페인팅(In-painting) 모델의 발전 ▲전문가 맞춤형 AI 모델의 필요성 등 AI가 불러온 영상 제작 과정의 변화를 분석하고, 이에 따른 미래 대응 방안을 모색했다. 특히 인페인팅 모델(이미지 내 특정 객체를 인식해 지울 수 있는 AI)을 활용한 16비트 및 32비트 이미지 처리에 대한 국내 최초의 연구 성과를 발표해 주목받았다. 이창범 연구소장은 "기존 8비트 인페인팅 모델을 확장시켜 16비트와 32비트 이상의 고해상도 이미지 또한 처리할 수 있는 모델"이라며 "원하는 색 영역으로 출력이 가능할 뿐 아니라 원본 대비 픽셀 손실이 없다는 것이 차별점"이라고 설명했다. 이어 "영상 제작 분야에서 AI가 더욱 발전하기 위해서는 전문가 집단을 위한 특화 AI 모델 개발이 무엇보다 필요한 시점"이라면서 "당사는 전문 인력을 통해 전문가용 AI 모델 개발은 물론, 고품질 데이터의 지속적인 확보 및 제공을 위해 노력 중"이라고 덧붙였다. 이와 함께 행사 현장에는 덱스터크레마의 초개인화 AI 마케팅 원스톱 솔루션 '애드플로러'의 시연 부스가 운영돼 업계 관계자 및 방문객들의 이목을 끌었다. 생성형 AI 기반 초개인화 광고 자동화 솔루션 애드플로러는 대규모 데이터에 기반한 마켓 분석과 전략 추출, 최적의 타깃팅 및 광고 매체 선택, 콘텐츠 제작 등 맞춤형 마케팅 전략을 제공하는 서비스다. 손동진 덱스터크레마 대표는 "이번 행사를 통해 당사가 다년간 축적해온 연구 성과와 새로운 솔루션을 선보일 수 있게 돼 뜻깊다"며 "앞으로도 지속적인 연구 개발을 통해 급변하는 미디어 상황에 유연하게 대응하는 혁신적인 대안을 제시할 수 있도록 노력하겠다"고 말했다.

2024.12.11 09:00백봉삼

영상 생성AI '소라' 나오자...中 바이트댄스·텐센트 반격

미국 오픈AI의 영상 생성 인공지능(AI) 서비스 '소라'가 출시되면서 중국 기업들의 영상 생성 서비스도 속도를 내고 있다. 10일 중국 바이트댄스는 자사 초거대 AI 챗봇 더우바오의 PC 버전을 내놓으면서 영상 생성 모델 '픽셀댄스(PixelDance)'의 내부 테스트를 시작하고 일부 사용자에게 공개했다. 사용자들은 하루에 무료로 10개 영상을 생성할 수 있다. 픽셀댄스는 지난 9월 처음 발표됐으며, 더우바오 영상 생성 초거대 모델을 기반으로 하고 있다. 아직 테스트 단계이긴 하지만 고급 카메라 모션 및 각종 영상 효과를 지원한다. 관계자에 따르면 약 10초 영상을 생성하면서 3~5개의 효과를 적용하는 경우 최적의 영상을 만들 수 있다고 소개됐다. 이달 초 중국 텐센트도 '훈위안 영상 생성 모델(HunYuan-Vieo)' 기반 영상 생성 기능을 내놨다. 130억 매개 변수를 가진 이 모델은 중국어와 영어 입력을 통한 영상 생성을 지원하며, 개인 사용자 혹은 기업 고객이 신청을 통해 사용해볼 수 있다. 텐센트는 이 매개 변수가 업계 최대 수준이며, 5초 짜리 영상을 생성할 수 있다고 소개했다. 이뿐 아니라 지난 3일엔 중국 국유 통신사 차이나텔레콤의 AI 연구소인 '텔레AI(TeleAI)'도 자사 싱천 초거대 모델 기반의 영상 생성 모델을 공개했다. 이 모델은 중국 국유 기업이 개발한 첫 영상 생성 모델로도 관심을 모았다. 바이트댄스와 텐센트, 차이나텔레콤뿐 아니라 앞서 중국 콰이서우, 센스타임, 미니맥스 등 기업도 AI 영상 생성 플랫폼을 공개한 바 있다. 중국 동영상 플랫폼 콰이서우가 내놓은 영상 생성 초거대 모델 '클링(KLING)'은 최대 2분짜리(30fps 주사율) 1080P 영상을 만들 수 있다.

2024.12.11 08:17유효정

"동영상 생성 AI 최강자 떴다"…오픈AI '소라' 출시에 빅테크도 일자리도 '충격'

동영상 생성 인공지능(AI) 최강자로 지목된 오픈AI의 '소라'가 드디어 모습을 드러내며 구글, 메타 등 경쟁자들을 긴장시키고 있다. 텍스트만으로도 빠른 시간 내에 원하는 동영상을 간편하게 만들 수 있다는 점에서 일자리 위협을 느낀 예술가들의 반발도 더 커지는 모양새다. 10일 업계에 따르면 오픈AI는 지난 9일(현지시간) 온라인 행사를 통해 '소라'를 정식 출시한다고 발표했다. 지난 2월 처음 공개한 후 10개월 만으로, 그간 일부 이용자들을 대상으로 테스트를 한 후 문제점을 보완해 왔다. 공개 됐을 당시 도쿄 밤거리를 걷고 있는 여성의 다리가 불안정하게 움직이는 등 환각 현상이 발견된 바 있다. '소라'는 이용자가 글로 프롬프트(명령어)를 넣으면 동영상을 생성해주는 AI로, 생성되는 동영상의 길이는 최대 20초다. 당초 최대 1분 길이의 동영상을 빠르게 제작할 수 있다고 오픈AI가 밝혔던 것에 비해선 상당히 시간이 줄었다. 이에 대해 오픈AI는 "최대한 많은 사람들이 소라에 접근할 수 있도록 하기 위해 성능과 확장성 사이의 균형을 맞춘 것"이라고 설명했다. '소라'는 텍스트뿐 아니라 이미지, 동영상에서 영감을 받아 동영상을 생성하는 것은 물론, 기존 동영상을 확장하거나 빠진 프레임을 채우는 '스토리보드' 기능도 제공한다. 오픈AI가 공개한 '우주에 떠 있는 토끼(a rabbit floating in outer space)'라는 프롬프트로 만든 데모 시연 영상에선 약 7초만에 5초짜리 동영상이 만들어져 이목을 집중시켰다. 만든 영상이 마음에 들지 않으면 프롬프트를 수정하거나 스토리보드를 고치면 된다. '소라'는 구글이 올해 1월 공개한 생성 AI 모델 '루미에르'가 단 5초 분량의 영상물을 제작해주는 것에 비해 월등한 기술력을 갖고 있다는 평가를 받고 있다. 이날부터 한국을 포함한 대부분의 국가에서 사용할 수 있지만 영국, 스위스, 유럽경제지역(EEA)은 이번에 출시가 제외됐다. 이는 이들 지역에서 테크 기업에 대한 규제가 강화하고 있는 데 따른 것으로, 영국 등에서의 정식 출시 일정은 미정이다. '소라'는 현재 '챗GPT 플러스', '챗GPT 프로'에 포함돼 기존 유료 이용자들은 이 동영상 AI 모델 이용에 대한 추가 비용을 지불할 필요 없이 이용할 수 있다. 월 20달러를 지불하는 '챗GPT 플러스' 이용자들은 매월 50개(480p 또는 그 이하 해상도), 월 200달러인 '챗GPT 프로' 구독자들은 매월 500개의 영상을 생성할 수 있다. 챗GPT 팀, 엔터프라이즈, 에듀 계정에선 소라를 쓸 수 없다. 이번 일로 동영상 생성 AI 시장 경쟁은 과열되는 분위기다. 지난해 11월에는 스태빌리티 AI가 '스테이블 비디오 디퓨전'을, 올해 1월에는 마이크로소프트(MS)가 비디오 프레임의 움직임을 조작하는 동영상 생성 모델 '드래그누와'를 선보였다. 바이트댄스는 '매직비디오-V2'를, 애플도 2월 대형언어모델(LLM)을 활용해 동영상을 생성하는 '키프레이머'를 내놨다. 오픈AI가 올해 2월 '소라'를 선보인 후에는 구글 동영상 생성 AI '비오(Veo)'와 중국 콰이쇼우 '클링', 미국 루마 AI '드림 머신', 런웨이 '젠-3 알파', 메타 '무비 젠' 등이 지금까지 공개됐다. 어도비도 지난 10월 '어도비 맥스' 행사에서 파이어 플라이 기반 동영상 AI를 발표하며 경쟁에 합류했고, 아마존도 이달 초 '리인벤트' 행사를 통해 동영상 생성 AI '노바 릴'을 처음 선보였다. 이에 따라 유튜브는 내년부터 동영상 생성 AI '비오'를 활용해 유튜브 쇼츠 영상을 만들 수 있게 할 계획이다. 메타는 '무비 젠'이 만든 AI 동영상을 인스타그램 등 SNS와 연계할 수 있도록 할 예정이다. 사용자들은 AI를 사용해 실감나는 릴스(인스타그램을 통해 공유할 수 있는 15초 이내 분량의 짧은 동영상)를 직접 만들어낼 수 있고 페이스북, 왓츠앱, 스레드 등 메타의 다른 SNS 플랫폼에도 공유할 수 있게 된다. 파이낸셜타임스(FT)는 "메타의 무비 젠 AI 동영상 모델은 할리우드 영화 제작사, 동영상 콘텐츠 크리에이터, SNS 인플루언서들의 창조 작업용 툴로 사용되기를 원하고 있다"며 "메타는 영화 등 예능, 오락산업, 광고를 넘어 보다 광범위한 산업 분야에서 수익 창출 모델을 발굴하려고 하고 있다"고 분석했다. 이처럼 본격적인 동영상 생성 AI 시대가 열리면서 영상 관련 산업은 큰 변화를 맞게 됐다. 영화, 애니메이션, 증강현실(AR) 및 가상현실(VR) 등 다양한 분야에서 활용할 수 있게 되면서 일자리를 위협 받는 이들도 상당해질 것으로 예상된다. 실제 소니픽처스는 영화 제작 비용을 줄이기 위해 생성형 AI를 적극 활용하겠다고 공개적으로 밝힌 바 있다. 이미 코카콜라의 최근 홀리데이 캠페인과 같은 광고에선 AI로 제작된 콘텐츠가 등장하고 있다. 영화 CG 일러스트레이터인 리드 사우든은 "2022년 미드저니(이미지 생성 AI)가 처음 나왔을 때 우리는 '귀엽다'며 비웃었다"며 "하지만 이제 사람들은 생성 AI 때문에 일자리를 잃고 있다"고 말했다. 이에 지난해 미국 할리우드에선 배우와 작가를 중심으로 생성형 AI 활용에 대항하기 위해 파업을 벌이기도 했다. 자칭 '소라 PR(대외홍보) 퍼펫'이라고 부르는 예술가 그룹은 지난달 26일 오픈AI '소라'에 접속할 수 있는 프로그래밍 인터페이스(API)를 온라인에 공개하며 반발하는 모습을 보였다. 업계 관계자는 "오픈AI '소라'가 등장하며 많은 기업들에게 동영상 생성 AI 모델에 대한 강력한 동기가 생겼다"며 "여러 모델들이 한꺼번에 풀리면서 산업계, 특히 미디어 시장에 엄청난 반향을 일으킬 것으로 보인다"고 밝혔다. 일각에선 딥페이크 문제에 대해서도 우려하고 있다. AI 기술로 유명인들의 얼굴을 합성해 정교한 가짜 영상을 만드는 것이 쉬워졌기 때문이다. 이에 오픈AI는 레드팀(취약점을 발견해 AI 안전성을 검증하는 팀)을 만들어 딥페이크를 방지하기 위해 나섰다. 또 '소라'로 생성된 모든 동영상에 C2PA(콘텐트 출처 및 진위 확인을 위한 연합) 표준 AI 워터마크를 넣어 AI가 생성한 콘텐츠임을 알 수 있도록 했다. 로한 사하이 오픈AI 엔지니어링 리드는 "도널드 트럼프 대통령 같은 주요 정치인이나 공적 인물은 생성이 차단된다"며 "잘못된 정보의 확산을 방지하려고 노력하고 있다"고 말했다.

2024.12.10 09:21장유미

"o1·소라 첫선 보일까"…오픈AI, 연말 12일간 AI 기술 공개 '대장정'

오픈AI가 크리스마스 시즌 동안 새로운 제품과 서비스를 선보이며 기술 혁신의 장을 연다. 5일 더버지에 따르면 오픈AI는 총 12일간 매일 새로운 기능, 제품, 데모를 발표할 계획이다. 발표에는 영상 생성 인공지능(AI) 도구 '소라(Sora)'와 추론 모델 'o1'의 풀 버전이 포함될 가능성이 높은 것으로 알려졌다. 샘 알트먼 오픈AI 대표는 최근 뉴욕타임즈 주최 딜북 컨퍼런스에서 "12일간의 발표를 준비 중"이라고 밝히며 이를 공식 확인했다. 다만 구체적인 발표 내용이나 일정은 언급하지 않았다. '소라'는 텍스트를 기반으로 고품질 비디오를 생성할 수 있는 AI 도구로, 거대 언어 모델의 확장판으로 알려져 있다. 이 도구는 올해 중 동안 일부 아티스트를 대상으로 알파 테스트가 진행됐으며 연말 출시를 목표로 개발 중이다. 발표를 앞두고 오픈AI 직원들도 소셜 미디어를 통해 기대감을 드러냈다. 한 기술 부서 담당자는 "크리스마스 소원 목록에 무엇을 적었나요"라는 포스트를 올렸고 다른 직원은 "트리를 막 세울 시간에 맞춰 돌아왔다"고 말했다. 알트먼 대표는 자신의 X 계정을 통해 "내일 태평양 시간 오전 10시부터 매주 평일마다 발표와 데모가 진행될 예정"이라며 "멋진 것들을 공유할 예정이니 기대해달라"고 말했다.

2024.12.05 13:06조이환

딥노이드, AI 기반 폐 결절 진단 성과 'RSNA'서 발표

딥노이드(대표 최우식)가 미국 시카고에서 개최되는 2024년 북미영상의학회(RSNA 2024)에서 'AI 기반 폐 결절 진단 기술'에 대한 연구 성과를 발표한다. 딥노이드는 RSNA에서 '폐 결절의 국소화 및 Lung-RADS 범주를 고려한 AI 기반 CAD 시스템의 진단 성능'을 주제로한 초록을 통해 딥렁(DEEP:LUNG)의 진단 성능을 선보인다고 3일 밝혔다. 이번 임상 연구는 부산대학교병원, 양산부산대학교병원, 화순전남대학교병원의 2019년 1월부터 2023년 7월까지 외래와 응급실을 방문한 저선량 흉부 컴퓨터단층촬영(LDCT) 데이터 455건을 활용해 딥렁의 진단 성능을 평가했다. 폐 결절의 조직, 크기, 악성도 분류, Lung-RADS 카테고리화 및 결절 위치 국소화 등이다. 딥렁 활용 시 주요 평가 지표에서 민감도 91.38%, 특이도 93.08%, 악성도 분류 AUROC 89.62%라는 높은 정확도를 기록하며 우수한 결과를 보였다. AUROC는 분류 모델의 성능을 평가하는 지표로 AUROC 85% 이상이면 상당히 좋은 성능으로 간주된다. 렁-RADS 카테고리별 평가에서도 민감도와 특이도에서 안정적인 성능을 입증했다. 고형 결절과 간유리 음영 결절의 크기 측정에서도 각각 2mm 및 3mm 이내의 오차 범위를 유지하며 높은 정밀도를 보였다. 최우식 딥노이드 대표이사는 “본 연구를 통해 폐 결절 진단 및 악성 분류 분야에서 AI가 의료진에게 큰 도움을 줄 수 있음을 입증할 수 있었다”며 “2025년에는 뇌 질환 진단 솔루션과 함께 흉부 영역으로 AI 솔루션의 적용 범위를 확대할 계획으로, 의료 현장에 보다 포괄적인 AI 진단 지원 도구를 제공하는 것이 다음 목표”라고 덧붙였다.

2024.12.03 10:10남혁우

AI 영상 생성 모델 '소라' 유출 논란…예술가들 오픈AI에 반격

오픈AI의 동영상 생성 인공지능(AI) '소라'가 정식 오픈 전에 유출돼 혼란을 빚고 있다. 일자리에 위협을 느끼고 있는 예술가들이 오픈AI의 움직임이 반발해 '소라'에 대한 접근 권한을 유출시켰기 때문이다. 27일 테크크런치에 따르면 자칭 '소라 PR(대외홍보) 퍼펫'이라고 부르는 예술가 그룹은 지난 26일 오픈AI '소라'에 접속할 수 있는 프로그래밍 인터페이스(API)를 온라인에 공개했다. 이들은 조기 접근 시스템에서 가져온 것으로 추정되는 인증 토큰을 사용해 이용자가 '소라'로 비디오를 생성할 수 있는 프론트엔드를 만들었다. 이들은 AI 개발 플랫폼인 '허깅 페이스'에 소라를 사용해 볼 수 있도록 API를 게시했다. 이를 통해 테스터가 아닌 일반인들도 사실상 소라의 기능을 미리 써볼 수 있게 됐다. 다만 미국 동부시각 기준 정오부터 접근이 중단됐다. 이번 일로 수 많은 이용자들은 '소라'를 통해 1천80p 고해상도의 10초짜리 영상을 제작해볼 수 있었다. 이용자들이 한꺼번에 몰리면서 서비스를 이용할 때 대기자까지 발생한 것으로 알려졌다. 이후 소셜미디어에 올라간 결과물들은 오픈AI의 워터마크가 삽입돼 있어 눈길을 끌었다. '소라'는 지난 2월 오픈AI가 공개한 동영상 생성 AI 모델로, 텍스트만 입력하면 최대 1분 분량의 영상 제작이 가능하다. 구글이 올해 1월 공개한 생성 AI 모델 '루미에르'가 단 5초 분량의 영상물을 제작해주는 것에 비해 월등한 기술력이란 평가를 받고 있다. 덕분에 유튜브·틱톡 등에서 인기를 끌고 있는 1분 미만의 짦은 영상(숏폼) 제작에 용이하다. 콘텐츠만 있으면 누구나 영상 크리에이터가 될 수 있는 환경이 마련된 것이다. 하지만 영상 제작 관련 업종에 종사하는 이들에게는 위협이 되고 있다. 간단한 명령어 몇 마디로도 디즈니 애니메이션이나 할리우드 영화에서나 나올 듯한 영상을 순식간에 만들 수 있어서다. 특히 할리우드의 단역 배우, 촬영 스태프, 작가 등의 일자리를 빼앗을 수 있다는 우려가 커지고 있다. 이에 오픈AI는 '소라'를 바로 출시하지 않고 기능을 보완하기 위해 일부 예술가들을 대상으로 테스트만 진행해왔다. 샘 알트먼 오픈AI 최고경영자(CEO)는 지난 1일 레딧에서 열린 AMA(Ask Me Anything) 채팅 행사에서 '소라'와 관련해 "모델을 완성하고 안전 및 딥페이크 문제를 처리하고 컴퓨팅을 확장해야 하는 문제로 출시가 지연되고 있다"고 설명했다. 하지만 이번에 '소라 PR 퍼펫'이란 예술가 그룹이 API를 공개해버리면서 다소 난감해졌다. 테스트를 진행한 예술가들은 오픈AI가 '소라'에 대한 긍정적인 이야기를 퍼뜨리라고 압력을 가하고 있다고 주장하며 불만을 드러내기도 했다. 또 익명으로 활동했던 이들은 '소라' 접근권이 공개된 이후 청원서와 함께 자신들과 함께할 예술가들의 서명을 받기 시작했다. 이들은 "수 백명의 아티스트가 1천500억 달러 규모의 회사를 위해 버그 테스트, 피드백, 실험작 제작 등의 무급 노동을 제공하고 있다"며 "우리의 작업에 오픈AI가 공정한 보상을 하지 않고 있다"고 주장했다. 오픈AI는 그동안 테스터들을 엄격하게 통제하고 '소라'로 만들어진 결과물을 공유하기 전에 승인을 받도록 조치한 것으로 알려졌다. 일각에선 오픈AI가 예술가들의 작품을 통제하는 것을 두고 '소라'의 개발 속도가 느려졌기 때문이라는 분석을 내놨다. '소라' 개발을 이끈 책임자 중 한 명인 팀 브룩스가 지난 10월 오픈AI를 떠나면서 생성된 영상에서 캐릭터의 일관성을 유지하는데 오류가 여전한 것으로 전해졌다. '소라'는 공개 당시 도쿄 밤거리를 걷는 여성의 영상을 생성했지만 다리가 불안정하게 움직이는 모습이 포착돼 눈길을 끈 바 있다. 예술가들은 "우리는 예술도구로서의 AI를 반대하지 않는다"며 "예술가들에 대한 대우가 어떻게 형성되는지, 이 도구로 만들어지는 결과물이 어떻게 확산되는지에 대한 뚜렷한 답이 없어 반대하는 것"이라고 밝혔다. 이에 대해 오픈AI는 "수백 명의 예술가들이 '소라'를 쓰고 있고 기밀 정보를 공유하지 않는 것 외에는 주어진 의무가 없다"고 반박했다. 다만 오픈AI는 어떤 세부 정보가 '기밀'로 취급되는지는 설명하지 않았다. 테크크런치는 "이번 사태는 오픈AI의 '아트워싱'에 항의하기 위한 것"이라며 "예술 단체와 AI 기업의 갈등이 보다 심해지고 있다"고 분석했다.

2024.11.27 10:09장유미

포바이포 AI 화질 개선법, ICCE 2025 학회 논문 채택

포바이포(대표 윤준호)는 사내 AI연구소가 작성한 새로운 AI 화질 고도화 방법 관련 논문이 미국 전기전자통신학회(IEEE)가 개최하는 국제학술대회 'ICCE 2025' 논문으로 채택됐다고 15일 밝혔다. 포바이포 AI 연구소 '픽셀 랩'이 작성한 이번 논문 '영상 화질 개선을 위한 시공간 순환 정렬 방법'은 영상 화질 개선을 위해 기존 사용해왔던 직선적인 프로세스를 구간별로 반복하는 순환형 프로세스로 개선함으로써 품질은 유지하고 시간과 비용은 낮출 수 있는 획기적인 제안을 담고 있다. 기존 영상의 화질을 개선하는 방법들은 영상 내 이미지를 직선으로 늘어놓은 후 앞 뒤 프레임 사이의 변화, 즉 '광학적 흐름 추정' 방법을 통해 개선해야 할 부분을 포착하고 개선해왔다. 이런 방식은 다중 연산 과정이 필요해 복잡하고 어려운데다 시간도 많이 소요된다. 또 잘못된 추정에 따른 오류도 적지 않은데다 찾아낸 결함은 고비용이 요구되는 모션 보정 과정을 별도로 거쳐야 했다. 포바이포가 이번 논문을 통해 제안한 방식은 영상 프레임들을 직선이 아닌 순환형 구조로 정렬하고 블록화해 복잡한 연산 없이도 변화된 부분과 개선해야 할 부분을 빠르게 찾아낼 수 있다. 이 방식을 사용하면 연산 처리 과정이 줄어들어 화질 개선 시간을 단축시킬 수 있을 뿐 아니라 오류와 노이즈를 줄이고 영상의 일관성도 높일 수 있어 영상의 품질을 극대화할 수 있다. 포바이포 김현철 AI연구소장은 "단순히 AI 모델을 개발하는 연구자가 아닌 실제로 화질 개선 AI 솔루션을 판매, 서비스하는 회사의 구성원의 입장에서 고민해왔기 때문에 이 같은 개선 방안을 찾아낼 수 있었다고 생각한다"며 "프레임의 정렬 방식을 바꾸는 단순한 프로세스 개선만으로 이정도로 높은 효율을 이끌어 낼 수 있다는 사실을 확인한만큼 실제 제품 성능과 서비스 개선에도 큰 도움이 될 것"이라고 말했다. 이번 논문이 채택된 'ICCE(International Conference on Consumer Electronics)'는 세계 3대 가전 전시회 CES와 함께 개최되는 국제적인 학술 행사다. 인공지능과 이미지 처리 또 이와 관련된 소비자 전자기기 최신 기술 등이 대거 소개되는 행사로 널리 알려져 있다. 특히 세계적으로 해당 분야에서 가장 높은 학술적 공신력을 자랑하는 美 전기전자통신학회 소비자 기술 학회(IEEE CTSoc)가 개최하는 연례 대표 컨퍼런스인만큼 전 세계 산업계, 정계, 학계 최고 전문가들이 한자리에 모이는 국제적인 행사다.

2024.11.15 09:57백봉삼

의료 인공지능 기업 숨빗AI, 알토스벤처스서 50억 투자 유치

의료 인공지능 기업 숨빗AI(대표 배웅)가 알토스벤처스로부터 시드 투자를 유치했다고 5일 밝혔다. 이번 투자 규모는 한화 약 50억원(360만 달러)이며, 알토스벤처스가 단독으로 참여했다. 숨빗AI는 카카오브레인에서 흉부 엑스레이 판독 보조 AI 사업을 개발한 팀이 설립한 회사다. 공동 창업자는 카카오브레인 최고 헬스케어 책임자(CHO)였던 배웅 대표와 이미지 생성 연구 총괄을 맡았던 김세훈 최고기술책임자(CTO)며, 카카오브레인 헬스케어사업실의 인력들로 구성돼 있다. 숨빗AI는 영상의학과 의사를 위한 AI 기반 초안 판독문 생성 솔루션 'AIRead-CXR'을 개발하고 있다. 생성형 AI 기반인 'AIRead-CXR'은 흉부 X레이(CXR)에서 탐지해야 할 다양한 소견에 대한 개인화된 초안 판독문과 비정상 가능성을 제공해 영상의학과 의사들이 더욱 빠르고 정확하게 영상 판독을 할 수 있도록 돕는 것을 목표로 한다. 한국은 세계에서 1인당 엑스레이와 CT 스캔 촬영 횟수가 가장 많은 국가로, 의료 영상 진단 기기의 발전과 인구 고령화로 검사 수요는 계속 증가할 것으로 예상된다. 그러나 영상의학과 의사 공급은 그에 비해 제한적으로 2023년 기준 4천206명에 불과해 10년간 연 3.4% 증가에 그쳤다. 그 결과, 영상의학과 의사들의 번아웃은 심각한 수준이다. 한 조사에 따르면 88%의 방사선과 의사들이 어느 정도의 번아웃을, 62%는 심각한 번아웃을 겪고 있다. 또 다른 연구에 따르면, 흉부 X레이(CXR)에 대한 AI 초안 판독문을 사용하는 영상의학과 의사의 경우 판독 소요 시간이 평균 약 42% 감소하고 판독 품질은 6% 향상한 것으로 나타났다. 이처럼 'AIRead-CXR'과 같은 생성형 AI 기반 의료 영상 판독 보조 AI 서비스는 과중한 업무에 지친 의료진의 생산성을 높이고, 의료 영상 연구의 다양성 확대에도 기여할 것으로 기대된다. 배웅 숨빗AI 대표는 "이번 투자를 통해 숨빗AI 팀의 뛰어난 역량 및 성장 가능성을 인정받게 되어 기쁘다"며 "한국뿐 아니라 전 세계적으로 영상 판독 서비스에 대한 수요가 영상의학과 전문의 공급을 초과해 빠르게 증가하고 있는 만큼, 인재 확보와 서비스 제공 영역 확장을 통해 의료진과 환자 모두에게 필수불가결한 의료 AI 서비스로 자리 잡을 수 있도록 최선을 다할 것"이라고 밝혔다. 알토스벤처스 정해민 심사역은 "숨빗AI 팀은 이전 제품 개발 경험을 통해 높은 연구개발 역량을 인정받고 있으며, 의료진의 과중한 업무를 줄이는 데 기여할 것으로 기대된다"면서 "특히 배웅 대표를 중심으로 단단히 결속한 팀이 역량을 쌓고 시장을 설득하는 모습을 보며, 숨빗AI 팀이라면 의료 판독 시장에서 중요한 획을 그을 것이라 믿어 이번 투자를 결정했다"고 말했다. 숨빗AI는 X-ray 외에도 CT 등 다양한 모달리티로 확장해 고객 중심의 다양한 AI 서비스를 개발해 나갈 계획이다.

2024.11.05 09:36백봉삼

시놀로지 "생성 AI·DX 시대에 자원 부족한 IT 파트너 도울 것"

"생성 AI와 디지털 전환으로 경쟁이 치열해진 오늘날 비용 최적화, 운영 간소화를 통한 효율 향상 중요성이 커졌습니다. 시놀로지는 이런 환경에서 한정된 예산과 인력으로 운영하는 IT 부서 담당자가 이상적인 환경을 구축하도록 돕고 있습니다." 15일 오후 더케이호텔 서울에서 진행된 '시놀로지 솔루션 데이 2024' 행사에서 조앤 웡(Joanne Weng) 시놀로지 국제 사업 총괄이 생성 AI와 디지털 전환 시대 비용 효율화된 자사 신제품을 소개하면서 이같이 설명했다. 시놀로지 솔루션 데이는 고객사와 협력사 관계자, 전문가를 대상으로 시놀로지 스토리지 제품과 소프트웨어 솔루션, 서비스를 소개하는 행사다. 국내에서는 작년 11월 초순 이후 두 번째 진행됐다. 이날 시놀로지는 일체형 백업 솔루션인 액티브프로텍트 어플라이언스, 스케일 아웃 스토리지 솔루션, 클라우드 기반 영상감시 솔루션 'C2 서베일런스 스테이션', 생성 AI를 접목한 협업 솔루션인 시놀로지 오피스 등 향후 출시할 신제품을 대거 소개했다. ■ 비인가 로그온 막는 SSO 솔루션 'C2 아이덴티티' 석미은 시놀로지 시니어 세일즈 매니저는 "현재 IT 부서가 가장 걱정하는 것은 랜섬웨어 공격과 데이터 침해이며 이를 막으려면 비인가 접속 차단과 신속한 데이터 복구, 데이터 유출을 막는 이중 보호 전략이 필요하다"고 설명했다. 시놀로지 서비스인 C2 아이덴티티는 자체 서비스와 1천개 이상의 외부 서비스형 소프트웨어(SaaS), 내부 서비스 로그인 관리를 돕는다. 직원 입사·퇴사시 여러 서비스 로그온 권한을 간단히 부여·회수할 수 있다. 비밀번호 입력 없이 스마트폰 전용 앱 '시큐어 사인인'의 안면·지문인식, FIDO2 프로토콜을 지원하는 물리 키로 로그온한다. 복잡한 비밀번호를 일일이 외우는 대신 비밀번호 관리자 기능을 이용해 클라우드에 저장된 정보로 로그온 가능하다. 석미은 매니저는 "C2 아이덴티티에 저장된 비밀번호 관련 데이터는 AES-256 종단간 암호화로 저장되며 시놀로지도 접근할 수 없다. 무차별 대입 방식 공격도 방어 가능하며 비밀번호가 네트워크로 직접 전달되지 않아 중간자 공격도 막는다"고 설명했다. ■ 액티브프로텍트, 중앙 집중 백업·중복 제거 기능 탑재 시놀로지는 지난 6월 전용 백업 소프트웨어와 하드웨어를 결합한 기업용 어플라이언스 '액티브프로텍트'(ActiveProtect)를 공개했다. AMD 2세대 에픽(EPYC) 7272 프로세서와 DDR4 64GB ECC 메모리, 140TB 스토리지를 내장했다. 석미은 매니저는 "백업은 사이버 공격의 최후 방어선이지만 자체 조사 결과 실제 복구가 필요한 상황에서 백업 플랜을 계획대로 이행할 수 있는 업체는 약 20% 미만으로 나타났다"고 설명했다. 이어 "액티브프로텍트는 가상머신과 개인 PC, 클라우드 서비스의 데이터를 중앙 집중 백업하며 각 사이트(site) 별 백업을 통합하고 중복 제거 기술을 활용해 효율적 백업을 돕는다"고 밝혔다. 액티브프로텍트는 필요한 인원이 필요한 백업 데이터에만 접근할 수 있도록 철저한 다중 권한 기능을 부여했다. 백업된 가상머신은 내장 하이퍼바이저로 정상 여부를 자동 검증하고 백업된 데이터가 악성코드나 부주의로 손상되지 않도록 보호한다. ■ 자체 클라우드 기반 오피스 스위트에 올 연말 AI 기능 추가 시놀로지는 NAS(네트워크 저장장치)의 자유로운 백업·저장공간 특성을 살려 외부 클라우드 없이 오피스 문서와 이메일, 일정 관리, 기업용 메신저를 운용할 수 있는 오피스 스위트를 무료로 제공하고 있다. 이날 셸리 추 시놀로지 어카운트 매니저는 "시놀로지 오피스 스위트는 NAS의 용량이 허락하는 한 기업 내 데이터를 완전 무제한 저장 가능하며 구독료가 필요없다. 이런 특성으로 지난 해 전세계 이용자는 20%, 월간 이용자 수는 24% 성장했다"고 설명했다. 이어 "올 연말 경 오피스 스위트에 문서 요약, 초안 작성, 번역과 요약 등 생성 AI 기반 기능이 추가되며 잘못된 정보로 인한 환각 현상을 막는 RAG(검색증강생성) 기능도 추가된다"고 설명했다. 오픈AI, 구글 제미나이 등 외부 AI 모델 활용을 위한 프롬프트 생성시 이름이나 전화번호, 사회보장번호(SSN), 주민등록번호 등 개인을 식별할 수 있는 민감 정보가 포함되는 것을 막는 비식별화 기능도 탑재 예정이다. ■ 영상 데이터 클라우드에 직접 전송하는 IP 카메라 시놀로지는 NAS 전용 운영체제 DSM(디스크스테이션매니저)에 IP 카메라의 영상을 저장하고 분석하는 솔루션인 '서베일런스 스테이션'을 제공한다. 지난 해 9.0으로 업데이트를 거치며 자동차 번호판 인식, 지정 구역 혼잡도 알림, 침입 탐지 등 기능을 추가했다. 셸리 추 매니저는 "서베일런스 스테이션은 영상 데이터 손실을 막는 이중화 솔루션, 사람 얼굴을 흐리게 만드는 프라이버시 마스크, 영상 유출을 막는 워터마크 기능, 비인가 접속을 막는 다중 인증 등을 내장했다"고 설명했다. 이어 "NAS를 직접 설치하기 힘든 환경에서 영상 데이터를 클라우드 기반 'C2 서베일런스'로 자동 전송하는 카메라 2종을 출시할 것이다. 영상 데이터는 단대단 암호화되며 마이크로SD카드를 이용한 영상 백업으로 영상 유출을 막는다"고 덧붙였다. ■ 한국 내 비즈니스 부문 매출 2019년 대비 2배 성장 시놀로지는 현재 국내 시장에서 방송국과 연구소, 물류 기업 등 대형 고객사를 확보하며 시장 점유율을 꾸준히 늘리고 있다. 2019년 이후 국내 비즈니스 부문 매출은 두 배 가량 성장했다. 조앤 웡 시놀로지 국제 사업 총괄은 "기업 내 IT 부서 중 상당수가 예산 제약 속에서 사업 연속성 확보와 재해 복구 전략에 어려움을 느끼고 있다"며 "그러나 시놀로지와 각 국가별 채널 파트너는 여러 기업의 경쟁력 강화에 기여했다"고 밝혔다. 이어 "시놀로지 목표는 IT 부서를 강화하고 산업을 견고하게 만드는 것이며 이를 위해 안정적이고, 안전하며 비용 효율적인 솔루션을 지속 공급할 것"이라고 덧붙였다.

2024.10.16 09:06권봉석

[영상] "오픈AI '소라'보다 낫다"…메타, '무비 젠'으로 동영상 생성 AI 시장 흔들까

오픈AI가 만든 '소라'에 맞서 동영상 생성 인공지능(AI) 모델들이 쏟아지고 있는 가운데 '페이스북' 모회사 메타 플랫폼이 우수한 기술을 앞세워 최근 새로운 무기를 공개해 주목 받고 있다. 6일 업계에 따르면 메타는 지난 4일 공식 블로그를 통해 동영상 생성 AI 모델 '무비 젠(Movie Gen)'을 공개했다. 영상은 물론 오디오를 동시에 생성하는 것이 특징으로, 영상 중 일부분만 편집할 수 있는 등 강력한 기능도 갖추고 있다. '무비 젠'은 텍스트 입력으로 최대 16초 길이의 새 동영상을 만들 수 있다. 기존 동영상을 편집할 수도 있고 오디오를 생성할 수도 있으며 사진을 사용해 실제 인물이 등장하는 맞춤형 동영상도 만들 수 있다. 메타는 이번 연구가 2022년 공개한 '메이크 어 신(Make-A-Scene)', '메이크 어 비디오(Make-A-Video)' 등을 통해 쌓은 노하우를 반영했다고 강조했다. 더불어 하마가 물속에서 헤엄치고 코알라가 서핑을 즐기는 한편, 남극의 펭귄이 옷을 갈아입는 등 '무비 젠'을 이용한 만든 동영상도 공개했다. 메타는 "할리우드에서 성공하기를 희망하는 영화 제작자 지망생이든, 동영상 제작을 즐기는 크리에이터이든, 누구나 창의력을 향상시키는 데 도움이 되는 도구를 이용할 수 있어야 한다고 생각한다"고 설명했다. 기능은 이제까지 등장한 영상 모델 중 가장 강력한 편으로 평가된다. 최대 16FPS로 16초짜리의 사실적이고 개인화된 HD 비디오와 48kHz 오디오를 제작할 수 있으며 비디오 편집 기능도 제공한다. '무비 젠'은 일부 내부 직원과 일부 영화 제작자를 포함한 소수의 외부 파트너에게만 우선 제공된다. 메타는 내년에 인스타그램과 왓츠앱, 메신저 등 자사의 소셜미디어 앱에 탑재할 계획이다. 이번 일로 동영상 생성 AI 시장 경쟁은 과열되는 분위기다. 올해 2월 오픈AI가 '소라(Sora)'를 선보인 이후 구글 동영상 생성 AI '비오(Veo)'와 중국 콰이쇼우 '클링', 미국 루마 AI '드림 머신', 런웨이 '젠-3 알파' 등이 지금까지 공개됐다. 오픈AI의 '소라'는 최대 1분 길이의 동영상을 제작할 수 있으며 연내 일반인들도 이용할 수 있을 것으로 예상된다. 구글도 '비오'를 조만간 출시할 예정이다. 런웨이는 지난 7월부터 마케팅과 광고 등 콘텐츠 제작자를 대상으로 '젠-3 알파'를 유료로 제공하고 있다. 앞서 지난해 11월에는 스태빌리티 AI가 '스테이블 비디오 디퓨전'을 선보였다. 올해 1월에는 마이크로소프트(MS)가 비디오 프레임의 움직임을 조작하는 동영상 생성 모델 '드래그누와'를, 바이트댄스는 '매직비디오-V2'를 공개했다. 애플도 2월 대형언어모델(LLM)을 활용해 동영상을 생성하는 '키프레이머'를 내놨다. 이 같은 상황 속에 메타는 "'무비 젠'이 작업 전반에서 업계 유사 모델보다 우수한 성능을 보였다"며 경쟁사들을 겨냥했다. 코너 헤이즈 메타 생성형 AI 제품 부사장은 "더 많은 사람이 동영상 게시물을 만들거나 편집하도록 장려하는 것이 목표"라고 말했다. 업계 관계자는 "오픈AI '소라'가 등장하며 많은 기업들에게 동영상 생성 AI 모델에 대한 강력한 동기가 생겼다"며 "여러 모델들이 하반기에 한꺼번에 풀리면 산업계, 특히 미디어 시장에 엄청난 반향을 일으킬 것으로 보인다"고 말했다.

2024.10.06 10:29장유미

디노티시아, 고려대 병원과 '의료 AI 솔루션' 개발 협력

인공지능 전문기업 디노티시아가 고려대학교 안암병원, 첨단의료영상연구소와 의료 AI 분야의 혁신적 발전을 위한 업무협약(MOU)를 체결했다고 27일 발표했다. 이번 협약은 각 기관의 핵심 역량을 통합해 의료 AI 기술의 새로운 패러다임을 제시하고 글로벌 의료 산업에서 경쟁력을 높이기 위해 추진됐다. 협약식은 26일 고려대학교 안암병원에서 열렸으며, 디노티시아 정무경 대표, 고려대학교 안암병원 한승범 병원장, 첨단의료영상연구소 박범진 소장을 비롯한 주요 관계자들이 참석해 협력의 방향성을 논의했다. 이번 협약을 통해 세 기관은 ▲AI 기반 의료 영상 분석 시스템 구축 ▲안전한 의료 정보 분석 시스템 개발 ▲메디컬 AI 알고리즘 공동 연구 등 다양한 분야에서 협력할 계획이다. 디노티시아는 자사의 AI 비전기술을 첨단의료영상영구소의 전문성에 접목해 더욱 정밀한 의료 영상 분석 시스템을 개발할 예정이다. 이를 통해 의료진이 보다 정확한 진단과 치료 결정을 내리는 데 도움을 줄 것으로 기대된다. 또한, 디노티시아는 자사 LLM (Large Language Model), 엣지(Edge) LLM 디바이스를 활용해 의료 데이터 분석과 관리의 효율성을 높이고, 환자 데이터의 안전한 관리와 보호를 강화할 방침이다. 한승범 고려대학교 안암병원 병원장은 “디노티시아와 첨단의료영상연구소와의 협력을 통해 의료 AI 기술의 새로운 가능성을 열게 되어 매우 기쁘다”라며, “이번 협력이 진단 및 치료의 정확도를 높이고, 전반적인 의료 서비스의 질적 향상을 기대할 수 있는 계기가 될 것”이라고 밝혔다. 박범진 첨단의료영상연구소 소장은 “이번 협약을 통해 의료 영상 분석 기술과 AI의 융합을 실현함으로써, 의료 서비스의 새로운 표준을 제시할 수 있을 것으로 기대된다”고 전했다. 정무경 디노티시아 대표는 “신생 스타트업인 디노티시아의 기술력을 신뢰하고 협력해 주신 두 기관에 깊은 감사를 드린다”라며, “디노티시아의 AI 솔루션으로 의료 산업 전반에 기술 혁신을 이끌고, 의료진과 환자 모두에게 더 나은 환경과 서비스를 제공할 수 있도록 하겠다”라고 말했다.

2024.09.27 09:51이나리

딥페이크 범죄 '급증'…글로벌 테크 기업 대응 나섰다

최근 딥페이크 성범죄와 허위 뉴스 영상 제작이 급격히 증가하면서 이를 탐지·대응하는 기술이 주목받고 있다. 국내외에서 딥페이크 범죄가 사회적 문제로 떠오르자 관련 기업들의 움직임에 대한 시장 기대감이 높아지고 있다. 19일 업계에 따르면 경찰은 올해 500건 넘는 딥페이크 사건을 수사 중이며 특히 10대들이 연루된 사례가 급증하고 있다. 국내외 가해자들은 텔레그램 등 익명성이 보장된 플랫폼을 통해 음란물을 유포하고 있으며 주로 여성인 피해자들이 심각한 피해를 입고 있다. 해외에서도 상황은 심각하다. 유로뉴스에 따르면 유럽에서 제작된 딥페이크 영상 96%가 여성과 청소년을 대상으로 한 음란물이다. 미국에서는 최근 스칼렛 요한슨과 테일러 스위프트 등 유명인들이 딥페이크 포르노의 피해자가 되기도 했다. 딥페이크 음란물뿐만 아니라 가짜뉴스로 인한 문제도 부각되고 있다. 정치인이나 공공 인물의 발언을 조작하거나 허위 정보를 담은 영상을 제작해 유포하는 사례가 증가하고 있기 때문이다. 지난 2022년 국내 지방 선거 당시 윤석열 대통령이 특정 후보를 지지하는 딥페이크 영상이 퍼져 큰 논란이 된 바 있다. 이와 관련해 딥페이크 선거 사용 방지법이 지난 1월 통과됐지만 해외에서는 딥페이크를 통한 가짜뉴스 남용이 여전히 큰 문제가 되고 있다. 이런 상황에서 딥페이크 탐지 기술에 대한 수요가 급증하고 있다. 글로벌 시장조사업체 마켓앤마켓에 따르면 글로벌 딥페이크 탐지 시장은 지난 2022년 5억 달러(한화 6천500억원)였지만 오는 2027년에는 18억 달러(한화 2조3천400억원) 규모로 성장할 것으로 예상된다. 이미 마이크로소프트는 지난 2020년 AI와 머신러닝을 결합한 '비디오 인증기(Video Authenticator)'를 공개한 바 있다. 이 도구는 사진이나 비디오를 분석해 미디어가 조작되었을 가능성을 백분율로 나타내는 신뢰도 점수를 제공한다. 특히 실시간으로 동영상을 프레임 단위로 분석해 각 프레임에서 조작 가능성을 보여준다. 미국뿐 아니라 유럽 스타트업들도 이에 가세했다. 그 중 에스토니아의 센티넬 AI는 클라우드 기반 솔루션을 통한 실시간 딥페이크 탐지를 제공하는 것으로 알려졌다. 이 회사는 얼굴 랜드마크 분석과 시간적 일관성 등을 활용해 딥페이크를 식별한다. 특히 최근 딥페이크 탐지 경연대회에서 135만 달러의 상금을 획득하며 기술력을 인정받았다. 요하네스 타메캔드 센티넬 AI 대표는 자사 제품을 소개하며 "우리는 잘못된 디지털 기술의 활용이 민주주의에 가장 큰 위협 중 하나라는 것을 잘 알고 있다"며 "사회가 잘못된 정보에 빠지는 것을 막기 위해 최선을 다할 것"이라고 밝혔다. 네덜란드의 센시티 AI도 실시간 딥페이크 탐지 플랫폼을 제공하고 있다. 이 회사는 얼굴 조작, 음성 합성, 전신 조작 등 다양한 유형의 딥페이크를 식별하며 인공지능(AI) 기반 분석으로 조작된 미디어의 출처를 추적한다. 조르지오 파트리니 센시티 AI 대표는 "딥페이크 기술의 발전 속도가 매우 빠르기 때문에 우리의 탐지 시스템도 지속적으로 진화해야 한다"며 "디지털 미디어 생태계의 신뢰성을 유지하는 것이 우리의 목표"라고 말했다. 이렇게 유럽에서 딥페이크 탐지 기술이 발전한 것은 민주주의와 인권이 딥페이크 위협에 직접적으로 노출되었기 때문이라고 전문가들은 지적한다. 개인정보 보호를 중요시하는 유럽의 규제 환경이 딥페이크 기술 오용에 대한 경각심을 높였다는 것이 이들의 분석이다. 국내에서도 다양한 테크 기업들이 딥페이크의 폐해를 예방하기 위해 노력을 기울이고 있다. 특히 라온시큐어는 올 하반기에 개인이 쉽게 딥페이크 여부를 체크할 수 있는 탐지 서비스를 자사의 개인용 모바일 백신 애플리케이션에 탑재할 계획이다. 라온시큐어의 딥페이크 탐지 기술은 합성된 얼굴과 정상 얼굴을 각각 학습해 이를 상호 비교 분류할 수 있도록 AI를 학습시킨다. 이미지부터 동영상, 안면 추출, 주파수 계열 변환 등 다양한 기술을 적용해 생성형 AI의 특징을 탐지한다. 이때 딥페이크 탐지 정확도를 높이기 위해 여러 모델을 동시에 사용한다. 특정 학습 유형에 맞춰 설계된 각각의 모델이 따로 존재하기 때문에 한 가지 모델에 의존했을 때 발생하는 탐지 정확도 저하를 방지할 수 있다. 이를 통해 얼굴의 부자연스러운 형태· 움직임·오디오 등을 종합적으로 분석해 더욱 정교한 탐지가 가능할 것으로 전망된다. 박현우 라온시큐어 AI연구센터장은 "딥페이크가 보편 기술이 돼 이를 악용한 범죄가 퍼지는 와중에 간편하게 딥페이크 여부를 탐지할 수 있는 기술도 보편화돼야 한다"며 "자사 보안 앱인 '라온 모바일 시큐리티'에 딥페이크 탐지 기능을 탑재하는 등 모든 개인들을 위한 잠재적 피해 예방에 매진하겠다"고 강조했다. 딥브레인AI도 '딥페이크 탐지 솔루션'을 개발해 주목받고 있다. '딥페이크 탐지 솔루션'은 사진의 경우 12분, 짧은 영상은 57분 내에 딥페이크 여부를 판별할 수 있다. 이미지와 비디오를 픽셀 단위로 분석하고 음성은 주파수, 시간, 노이즈 등 다양한 요소를 종합적으로 고려해 탐지하는 것으로 알려졌다. 이렇게 국내 기업들이 약진하는 가운데 딥페이크 방지 기술의 개발만으로 실제 범죄를 완전히 막기에는 한계가 있다는 지적도 나온다. AI 기술이 기하급수적으로 발전하고 있기 때문이다. 익명을 요청한 국내 AI 기업 관계자는 "딥페이크 기술은 계속해서 발전하고 있어 탐지 기술만으로는 완벽한 대응이 어렵다"며 "기술의 오용을 막기 위한 사회적 합의와 강력한 처벌 등이 병행돼야 한다"고 강조했다.

2024.09.19 17:40조이환

中 'AI로 만든 영화' 나온다...감독 9명 참여

중국에서 초거대 생성형 인공지능(AI) 모델을 이용한 영화가 제작된다. 9일 중국 언론 중궈신원왕에 따르면 중국 숏클립 플랫폼 '콰이서우'는 '클링 AI(Kling AI) 감독 공동 창작 계획'에 착수한다고 밝혔다. 중국산 영상 생성 초거대 모델 기술로 영화 콘텐츠를 제작하는 프로젝트다. 계획에는 리샤오훙, 자장커, 예진톈, 쉐샤오뤼, 위바이메이, 둥룬녠, 장츠위, 왕쯔추안, 왕마오마오 등 9명의 유명 감독이 참여하는데, AI 기술을 써서 9편의 AIGC(AI 생성 콘텐츠) 단편영화를 제작한다. 이 9편의 단편 영화는 모두 콰이서우의 대규모 영상 생성 모델인 '클링 AI'로 제작된다. 감독이 전적으로 영상 생성 모델에만 의존하게 된다. 물리적 세계 시뮬레이션, 컨셉 생성 및 조합에 클링 AI를 활용하고, 클링 AI로 영상 이미지를 생성해 3분 길이의 단편 영화 9편을 선보일 예정이다. 콰이서우에 따르면 9명의 감독은 다양한 스타일의 영상 제작 경험을 보유했으며, 영화, TV 시리즈, 애니메이션, 만화 등 분야에서 누적 흥행액이 200억 위안(약 3조 7천700억 원)을 넘는다. 영화 제작에는 AIGC 크리에이터 9명도 기술 컨설턴트로 감독들을 지원하게 된다. 클링 AI는 콰이서우가 올해 6월 발표한 영상 생성 초거대 모델로서 발표 직후 오픈AI의 '소라'에 비견되는 중국판 영상 생성 모델로 평가됐다. 텍스트 입력을 통해 1080P의 2분 길이(30fps) 영상을 생성할 수 있다고 소개됐는데, 올해 8월 기준 출시 3개월 만에 이미 160만 명이 클링 AI를 사용해 1천600만 개 이상의 영상을 생성했다. 누적 생성 이미지 수도 2천500만 개에 달한다. 콰이서우는 7월 24일 전 세계 사용자에게 공개 베타 버전을 공개했으며, 이미지의 영상 전환과 모션 화면, 렌즈 제어 등 방면에서 좋은 성능을 보이고 있다는 평가다. 앞서 지난 7월 중국에서 이미 단편 드라마 제작에 클링 AI가 적용된 바 있다. 중국 최초 AIGC 오리지널 판타지 단편 드라마 '산하이치징-피부잔랑'이 콰이서우에서 공개됐다. 콰이서우는 '더우인(틱톡의 중국 버전)'과 경쟁하는 중국 유명 숏클립 플랫폼으로, 올해 2분기 콰이서우의 일 평균 활동 사용자 수가 3억9천500만 명을 넘어서 역대 최고치를 기록했다. 월 평균 활동 사용자 수는 6억9천200만 명으로 집계됐다.

2024.09.10 09:16유효정

인공위성 데이터의 무궁무진한 가능성을 판다

우주와 인공위성 산업은 이제 한국서도 본격적으로 활성화되고 있다. 매우 희귀한 데이터로 분류되는 인공위성 촬영 영상을 활용해 다양한 분야에서 활용하려는 민간 기업이 속속 등장하고 있다. 그중 국내 인공위성 데이터 분석 산업을 선도하는 에스아이에이(SIA)는 방대한 양의 위성 데이터를 기반으로 활발하게 사업을 확장하고 있다. 전태균 SIA 대표이사는 최근 본지와 인터뷰에서 “창업 후 6년째 국내의 주요 정부기관을 대상으로 다양한 솔루션과 플랫폼을 제공하고 있다”며 “국방, 안보 시장 중심으로 국내와 다수 국가에 진출하려 다각적인 방향을 모색하고 있다”고 밝혔다. SIA는 국내 대표 인공위성제조기업인 세트렉아이의 자회사로 2018년 설립됐다. 인공지능 분야 박사학위를 취득한 전태균 대표는 세트렉아이 연구원으로 재직 중 여러 데이터 중 독보적인 데이터를 찾다가 우주, 위성 데이터에 관심을 갖게 돼 SIA를 창업하게 됐다고 한다. 현재 지구 상공에서 운영되는 국가 및 민간 소유 인공위성은 국방, 기상 등에서 쓰이고 있고, 그 수는 헤아리기 힘들 정도로 많다. 고해상도 카메라를 탑재한 인공위성이 급증하고, 다수의 초소형 위성이 군집 운영되고 있다. 이에 위성 촬영 영상의 양과 하루에 처리하는 데이터의 양도 증가하고 있다. 촬영된 영상 속 표적을 AI로 식별, 판독하는 게 가능해졌다. 전태균 대표는 “인공위성 촬영 영상은 국가 간 분쟁과 분열에 쓰이기도 하지만, 전지구적으로 하나로 뭉쳐서 해결해야 하는 기상이변, 재난재해 등의 문제에서도 중요하게 쓰인다”며 “SIA도 사업 초기 국방안보에 집중했는제 이제 전지구적 문제에 더 집중해서 사업을 확장하는 단계”라고 설명했다. 인공위성의 촬영 대상물은 지구다. 시간의 흐름에 따라 촬영 대상인 지구는 계속 바뀌고, 카메라는 오로지 한 순간만 촬영할 수 있다. 과거로 되돌아가 촬영할 수 없다는 특징을 갖는다. 순간순간 촬영한 사진을 이어붙여서 영상으로 만들게 된다. 우주에서 촬영된 사진은 가로 2만5천, 세로 2만5천의 초고해상도로, 여러 장의 사진을 영상으로 만들면 그 파일의 크기가 매우 크다. SIA는 위성 촬영 영상을 저장, 처리, 유통하고, 데이터를 분석하는 플랫폼과 솔루션을 보유했다. 전 대표에 의하면, 우주 산업은 크게 세 영역으로 나뉜다. 위성 사진의 촬영 목적에 따라 카메라를 설계해 인공위성을 제작하는 제조 분야, 만들어진 인공위성을 우주로 보내는 발사 분야, 궤도 위성으로 사진을 찍어 촬영본을 분석해 의사결정에 활용하도록 지원하는 분석 분야다. SIA는 분석 분야에서 활약하고 있다. 전 대표는 “위성 데이터를 활용하고자 하는 사용자는 두가지 중 하나를 선택할 수 있는데, 인공위성 데이터를 직접 구매하거나 자체 인공위성을 쏘아올리는 것”이라며 “위성은 안타깝게도 지구 위에서 실시간으로 멈춰서 찍을 수 없고 빠르게 회전하기 때문에 한번 지나가면 다음번까지 기다려야 한다”고 말했다. 그는 “그래서 사용자는 인공위성 자체를 궤도 상에서 공유하며, 하나가 지나가면서 사진을 찍고, 다음 위성이 또 같은 자리를 찍는 식인데, 내 머리 위에 위성 몇대가 지나갈지 감안해서 그 위성을 가진 소유자에게 사진 촬영을 요청하는 공급계약을 맺는다”며 "SIA는 한국 정부 소유 위성으로 부족하므로 해외 민간기업 소유 위성의 파트너십을 맺어서 300개 정도의 위성을 쓰고 있고, 국가 예산으로 만들 수 있는 위성보다 공유받는 역량이 훨씬 더 커서 데이터를 더 많이 빨리 처리하고 국가목적에 맞게 대응하는 장점을 갖고 있다”고 강조했다. SIA는 지구를 촬영한 사진 속 표적물을 빠르게 식별하는 기술을 보유했다. 통상 촬영 해상도의 경우 약 120km에 해당하는 면적을 사람이 일일이 분석할 수 없으므로 AI로 분석한다. 또한 표적 식별 외에도 미래를 예측할 수도 있다. 전 대표는 “건물이 토지대장 대비 비정상 건물인지, 차량이 일상적인 차량인지 특수차량인지 등을 분석하는 게 SIA의 업무”라며 “식별, 분석, 예측 등으로 업무를 나누고 미래에 여길 찍어야 할 지,. 혹은 다음주 여기를 찍어서 통상 활동이 일어날 것으로 예상되는가도 본다”고 말했다. 그는 “지구를 관측해서 더 많은 영역을 보고, 의사판단을 하고 결정하게끔 하는게 우리의 역할”이라며 “국가 모니터링뿐 아니라 이제 민간이나 기업 의사결정에서도 글로벌 전체의 상황을 보고 의사결정하는 게 많아졌다”고 덧붙였다. 인공위성 영상은 단순한 모니터링 외에도 다양하게 활용될 수 있다. 일례로 2년전 우크라이나와 러시아 간 전쟁이 발발했을 때 전세계는 우크라이나 곡창지대의 농산물 생산에 차질을 빚을 것으로 우려해 곡물 선물 가격이 급등했었다. 이에 NASA와 민간 기업이 겨울 전쟁 후 우크라이나 곡창지대를 분석했다. 그 결과 파종이 정상적으로 이뤄졌고, 수개월 뒤에도 농작물이 잘 자라고 있으며, 유통과 저장 시설도 안전하다다는 것을 밝혀내 글로벌 공급망이나 곡물생산에 영향없을 것이란 선물시장 보고서를 냈다. SIA도 특정 지역을 주기적으로 모니터링하면서 이상징후와 변화상을 알아내고 있다. 이 회사의 위성 영상 분석 모델인 SIA AI 팩은 방대한 면적의 촬영 이미지에 대한 해상도를 개선하는 초해상화 기술, 주요 지형지물 표적을 탐지하는 객체 검출 기술, 이상 상황을 탐지하는 변화 탐지 기술 등을 보유했다. 초해상화 기술인 SIA 슈퍼X는 광학 위성 영상의 가시성과 선명도를 향상시켜 이미지의 정확한 해석에 도움을 준다. 기상 위성 영상과 딥러닝 분석을 활용해 기상기후와 재난재해 시작점을 예측하는 것도 가능하다. 지금은 온실가스를 정확히 측정하는 AI 모델을 개발중이다. SIA의 관계사인 세트렉아이는 전세계 3대 위성용 카메라 제조기업으로 꼽힐 정도의 초고해상도 카메라 제조 역량을 보유했다. 분단국가란 특수성 덕에 한국은 특정 지역을 지속적으로 모니터링하는 경험과 데이터를 축적하게 됐고, 시간 흐름 상의 데이터를 축적해 활용하는 기술을 제공하는 에스아이에이의 역량도 높을 수밖에 없다. 전 대표는 “기술적인 강점은 기본적으로 갖고 있고, 데이터 구성에 대한 노하우도 보유했다”며 “유사 기업이 국내외에 많지만, 이 장벽은 쉽게 따라오지 못할 것이라고 생각한다”고 자신했다. SIA의 AI는 얼마나 경쟁력을 갖고 있을까. 전 대표에 의하면, 사진 한장을 판독가가 해석하는데 30~40분 정도 걸리지만, AI로 하면 수초 안에 식별을 찾아낼 수 있다. 전 대표는 “식별한 정보를 이미 저장 분석한 데이터와 결합해 명확한 수치정보를 곧바로 제공할 수 있다”며 “해당 지역의 대상물이 통상 몇대 발견되고, 이번엔 갑자기 절반으로 줄었다거나 혹은 두배 늘었다 같은 명확한 수치정보를 바로 제공 할 수 있으며, 직관적으로 보기에 지역이 지난주 몇대 았었나 사람이 알기 어려우니 바로 보고 영상 분석결과 보고서를 만들기까지 3~5분이면 만든다”고 밝혔다, 그는 “원래 하던 워크플로에서 AI를 넣으면 업무 생산량이 10배 늘어난다”며 “IT 디바이스의 급증처럼 위성도 폭발적으로 증가하는 시기를 겪고 있어서 봐야 할 영상이 수십 수백배로 증가했고 데이터 증가량에 따른 생산성 증가를 위해서라도 AI 적용은 필수”라고 덧붙였다. SIA는 클라우드 컴퓨팅을 적극 활용한다. 지난 AWS코리아의 퍼블릭섹터데이 행사에 전태균 대표가 패널토의에 참석해 클라우드 활용 경험을 공유하기도 했다. 일단 위성 데이터를 제공하는 곳이 클라우드를 쓰고 있다. 데이터 공급자가 방대한 데이터를 일일이 다운로드해 저장하는 자체 인프라를 구축하지 않고 클라우드로 유통한다. SIA는 AI 모델을 클라우드 상에서 개발해 운영하면서, 클라우드에 저장된 위성 데이터를 학습하게 한다. 전 대표는 “모델과 데이터를 올려서 쓰고, 완성되면 공급하는 앱도 클라우드에 같이 있어야 하는 삼박자가 맞아서 클라우드를 선택하고 있다”고 말했다. 그는 “5년전 고생한 경험이 있는데, AI 시스템을 고객사에서 시연해야 해서 블랙박스 같은 랩톱을 특수제작해 비행기에 싣고 가 시연했었다”며 “말도 못할 고생과 현지 네트워크 설정 때문에 고생을 몇번 하다가 도저히 못할 일이라 여겼고, 클라우드 기업의 도움을 받아서 북미, 싱가포르, 중동 등의 리전에서 모델을 운영하며 다양한 지역에서 바로 쓰게 준비해놓게 했다”고 덧붙였다. 현재 AWS 서비스로 아마존 EC2를 기본 활용하고, 모기업인 세트렉아이는 클라우드 기반 지상국 서비스인 AWS 그라운드 스테이션을 활용한다. 전 대표는 “특히 AWS의 기술적 지원 외에도 마켓플레이스가 많은 역할을 하고 있다”며 “솔루션 기업의 경우 많은 국가에서 요청왔을 때 그 국가에 대한 보안체계, 법률적 문제, 시장진입 관련 다양한 부분에서 넘어야 할 장벽이 많은데. 마켓픟레이스에 우리 솔루션 올리게 되면 다양한 국가 사용자에게 전달하기 위한 확장이 용이하기에 이를 협의하고 있다”고 햇다. SIA의 최근 확장 분야는 기후 변화 부분이다. 전 대표는 “한국의 슈퍼컴퓨터를 이용한 기상예측은 수치예보모델 기반인데, 움직이는 바람 같이 다양한 외적 요인을 수식화해서 조율하면서 비를 예측한다”며 “그 전체를 인공지능으로 통째로 바꿔서, 수식을 자동으로 만드는 알고리즘 만들었고, 지구 전체 데이터를 봐야 하는 문제를 해결하기 위해 유럽 정지궤도, 아시아, 미국 정지궤도 등으로 삼등분해서 다 연결하는 데이터화를 진행했다”고 말했다. 그는 “인공지능으로 구름이 어디로 이동하고, 그게 얼마나 비를 담고 있고, 언제 비를 내릴지 예측하는 걸 새로 만들었다”며 “일기예보에서 중요한 레이더 정보는 지상에서 레이터 시스템으로 공기중 수분을 측정해야 하는데, 전세계적으로 국가의 자본 역량 차이 때문에 데이터 균질성이 떨어지므로 일반 구름 사진에서 레이더 데이터로 바꾸는 생성형 AI 모델을 만들어서 데이터 부족 국가에서도 하드웨어 없이 데이터를 만들 수 있는 기술을 연구했다”고 설명했다. 그는 한국 외 국가의 건물을 잘 탐지하기 위해 국가지역 별 건물 양상을 총체적으로 인식할 수 있는 일반인공지능 모델도 개발하고 있다고 밝혔다. 그는 위성영상을 잘 이해하는 AI 역량과 그 외 위성영상 혹은 다른 일반 정보를 잘 이해하고 설명할 수 있는 대화형 언어모델은 많이 시도되지만, 이같은 시도는 없다”며 “이 기술을 내부적으로 고도화 작업을 진행중으로 앞으로 우리 회사를 독보적으로 치고 나가게 하는 성장동력이 될 거라고 생각한다”고 강조했다. 그는 마지막으로 인공위성 시스템을 만드는 것 자체에 매몰되지 말아야 한다고 했다. 그는 “많은 공공기관에서 시스템 만드는 것에 집중하고 있는데, 어떻게 시스템을 만들든 그를 잘 활용해서 어떤 국가적 이득을 올릴 수 있는가에 집중하면 좋겠다”며 “시스템이 파편화되고, 기관내에 독립적으로 존재하는 시스템이 많아져 기관마다 제품을 따로 만들어서 공급해야 하는 어려움이 있다”고 말했다. 그는 “가장 신뢰하고 먼저쓸 수 있는 준비돼 있는 클라우드를 기반으로 전체를 통째로 바꾸는 건 어렵더라도 새롭게 시작하는 비즈니스의 경우에 선제적으로 클라우드 도입해보고 효과성 나오면 공공전체로 확대하는 국가적 고민도 필요한 것 같다”고 조언했다.

2024.07.16 11:33김우용

첨단 영상 분석으로 딥페이크 신종범죄 잡는다

한국전자기술연구원(KETI·원장 신희동)은 국립과학수사연구원(원장 이봉우)과 과학수사 분야 연구 협력을 위한 업무협약(MoU)을 체결했다고 밝혔다. KETI와 국과수는 업무협약을 계기로 인공지능(AI) 기반 영상·음성 분석 등 첨단 분야 공동 기술 개발을 추진함과 동시에 과학수사 분야 내 기술 확산을 지원하는데 합의했다. KETI는 딥러닝 기반 영상 인식추적·영상 화질개선 등 지능형 영상처리 기술, 멀티모달 인터랙션 및 추론, 자연어 처리 등의 인공지능 기술 등 첨단 지능 분야 핵심 기술 육성에 집중하고 있다. 국과수는 행정안전부 소속 과학수사 감정연구기관으로, CCTV·비디오·사진을 포함하는 각종 영상·음성 판독/개선 기술 등 범죄수사에 필요한 법공학 분야 연구개발을 수행 중이며, 주요 범죄 사건사고에 필요한 해석과 감정을 지원한다. KETI와 국과수는 이번 협약을 통해 ▲과학수사에 필요한 영상 및 음성 분석 기술 교류 ▲영상 및 음성 분석 기술 활용을 위한 인적 교류 ▲과학 수사 분야 신기술 수요 공동 발굴 및 정부 전략 수립 지원 등 첨단 분야에서의 R&D 협력을 강화할 계획이다. 협약식에서는 KETI 지능정보연구본부의 지능형영상처리연구센터 및 인공지능연구센터, 국과수 법공학부의 디지털과와 법과학교육연구센터 주요 관계자가 참석해 첨단 과학수사 분야 주요 협력 기술을 논의했다. KETI 지능정보연구본부는 인물의 행동 양식을 모방하는 극사실적 인물 구현 등의 동영상 합성·판별 기술을 바탕으로 딥페이크 영상과 음성을 판별하는 탐지 기술을 보유 중이다. 신희동 KETI 원장은 “다가오는 미래 치안의 핵심은 첨단 과학 기술 개발이며, KETI는 유망 ICT 기술 구현과 확산에 필요한 최적의 파트너”라며 “두 기관의 협약이 향후 국민 안전을 보장하는 과학치안 사회로 이어지길 기원한다”고 밝혔다. 이봉우 국과수 원장은 “최근 인공지능 기술 발달에 따라 딥페이크와 같은 신종범죄로 인해 국민 안전이 위협받고 있다”며 “두 기관의 힘을 모아 기술을 연구·개발해 국민이 안전한 사회를 구현할 수 있도록 노력하겠다”고 말했다.

2024.07.10 08:25주문정

버즈니, CJ온스타일에 커머스AI 구독 서비스 제공

버즈니(대표 남상협·김성국)는 CJ온스타일과 인공지능 활용 기반 비즈니스 협업을 맺고 버즈니 커머스 AI 구독 서비스 'A Plus AI'를 제공한다고 27일 밝혔다. 버즈니는 2008년 세계 검색 대회 TREC 에서 1위(KLE팀)를 하면서 출발한 인공지능 기술 기반 서비스 회사다. 기술 개발과 함께 모바일 커머스 플랫폼 '홈쇼핑모아'를 10년 넘게 운영하며 이커머스 서비스 경험을 쌓았고, 올해부터 자사 커머스 AI기술을 제품화해 AI 도입이 필요한 이커머스사에 커머스 AI 구독 서비스를 제공하고 있다. 현재 버즈니 '에이플러스 AI'에서 제공하고 있는 AI 구독 서비스는 ▲A Plus 검색 AI ▲쇼핑 어이스턴트AI ▲숏폼 편집 AI ▲하이라이트 AI ▲리뷰분석 AI ▲추천 AI 등이 있다. 이번에 버즈니가 CJ온스타일에 공급하는 기술은 A Plus 숏폼 AI를 비롯해 카테고리 자동 분류, 고객문의 자동분류, 광학문자 인식 분석 기술이다. 이중 A Plus 숏폼 AI는 영상 편집자의 작업 효율을 제고하기 위한 서비스로 AI를 활용해 긴 영상에서 하이라이트로 예상되는 클립 구간을 자동 선별해 편집 시간을 효과적으로 단축시킨다. 버즈니 숏폼 AI는 편집자가 원하는 장면 검색 기능을 함께 제공해, AI와 영상 전문가 간의 시너지를 극대화한다. 또 하이라이트 구간을 추출하는 단계부터 숏폼 템플릿에 맞는 디자인 편집까지 전 과정을 자동화해 영상 편집자의 다양한 필요에 대응할 수 있다. 남상협 버즈니 대표는 "숏폼 AI의 경우 비즈니스 과정에서 숏폼 비디오를 활용하는 모든 이커머스 기업과 협업이 가능하다"며 "앞으로도 커머스 도메인에 특화된 ' A Plus AI'를 통해 파트너사의 AI기반 디지털 전환과 실질적인 매출 성장에 도움 되고자 한다"고 말했다.

2024.06.27 17:13백봉삼

中 콰이서우, 오픈AI '소라' 대적할 AI 영상 생성 기술 출시

중국 동영상 플랫폼 콰이서우가 미국 오픈AI의 '소라'에 대적하겠다며 초거대 인공지능(AI) 모델을 기반 이미지 생성 기술을 발표했다. 소라는 명령어를 입력하면 1분 분량의 영상을 만들어주는 AI 서비스다. 6일 중국 언론 IT즈자에 따르면 콰이서우는 '텍스트투이미지', '이미지투이미지' 기능을 제공하는 AI 초거대 모델 '칼라스(KOLORS, 중국어명 可灵)'를 발표하고 공식 홈페이지와 위챗 등을 통해 서비스한다고 밝혔다. 칼라스는 텍스트 입력을 통해 1080P의 2분 길이(30fps) 영상을 생성할 수 있으며 화면 비율을 자유롭게 조정할 수 있다. 유화, 컴퓨터그래픽, 핸드페인팅, 중국 판화, 3D 등 다양한 이미지 스타일 제작과, 8K의 고화질 이미지 생성을 지원한다는 게 콰이서우의 설명이다. 주요 기능은 '텍스트투이미지' 기능으로, 텍스트를 입력하면 다양한 스타일과 높은 화질을 갖춘 이미지를 생성한다. 입력된 테스트를 토대로 다양한 스타일의 이미지를 생성해주며 사용자가 참조 이미지를 업로드할 수도 있다. 이미지의 스타일, 테마, 세부 사항을 기반으로 새 작품을 생성한다. 'AI 이미지 커스터마이징' 기능은, 사용자가 인물 사진을 업로드하면 다양한 가상 이미지로 만들어주는 것이다. 일명 '인물 보존 기술'을 이용해 인물의 자연스러운 특성을 유지하면서 다양한 스타일의 인물 이미지를 생성해주는 것이다. 콰이서우는 "칼라스 초거대 모델은, 콰이서우의 AI팀이 자체 개발했으며, 소라와 유사한 기술 노선을 채택하면서 여러 자체 개발 기술 혁신을 결합해 소라에 맞대결 할 것"이라고 전했다. 콰이서우에 따르면, 칼라스의 초거대 모델 매개변수 규모는 10억 개 수준으로, 오픈소스 커뮤니티 소스 및 자체 AI 기술을 더했다. 텍스트투이미지 기능의 긴 텍스트와 복잡한 의미의 텍스트 입력을 위해 강화학습보상모델기술(RLHF)도 적용했다. 매체에 따르면 콰이서우는 칼라스 초거대 모델에 더 많은 기능이 구현하고, 표정과 신체 움직임이 동시에 구현되는 새로운 'AI 노래와 춤' 서비스도 출시할 예정이다. 한 장의 사진만 있으면, 노래하고 춤추는 영상을 얻을 수 있는 기능이다. 콰이서우는 지난해 연말 기준 평균 월 활성 사용자 수가 7억 명을 넘어선 중국의 주요 영상 플랫폼이다.

2024.06.07 09:08유효정

중국판 '소라' 등장...최대 16초짜리 AI 영상 생성

중국에서 미국 오픈AI의 텍스트투비디오 생성 모델 '소라(Sora)'를 벤치마킹한 인공지능(AI) 영상 생성 모델을 발표했다. 27일 중국 성수커지(ShengShu)가 칭화대와 협력해 개발한 중국 AI 초거대 모델 '비두(Vidu)'를 발표했다. 이 모델은 장시간, 높은 일치성, 높은 동태성 등 특징을 가지는 모델로서, 중국 언론과 업계 관계자들은 이 모델이 중국 최초의 '소라'급 영상 모델이라고 평가하고 있다. 이 모델은 '중관춘포럼미래인공지능선봉포럼'에서 처음 공개됐다. 비두는 원클릭으로 최대 16초 길이와 최대 1080p 해상도의 영상 생성을 지원하는 독창적 '유빗(U-ViT)' 아키텍처를 사용했다고 설명했다. U-ViT은 소라처럼, 디퓨전(이미지 데이터에 노이즈를 추가 및 제거하며 이미지를 생성)과 트랜스포머(텍스트 맥락을 통해 이미지를 생성) 방식을 결합해 구성된 아키텍처다. 회사측에 따르면 U-ViT 아키텍처는 소라가 채택한 DiT 아키텍처보다 먼저 2022년 9월 개발팀이 제안한 것으로 디퓨전과 트랜스포머를 통합한 세계 최초의 아키텍처다. 개발팀은 앞서 U-ViT 융합 아키텍처를 기반으로 한 세계 최초 다중 모드 확산 모델인 유니디퓨저(UniDiffuser)를 오픈소스화하고 U-ViT 아키텍처의 대규모 확장성 검증을 완료했다고도 설명했다. 비두에 따르면 비두는 실제 물리적 세계를 시뮬레이션 할 수 있을뿐 아니라 창의력과 높은 시공간적 일관성 등을 갖추고 있다. 성수커지는 칭화대 인공지능연구원 출신 인력이 지난해 3월 설립한 AI 스타트업으로 알리바바, 텐센트, 바이트댄스 등 출신 인력으로 구성됐다.

2024.04.29 08:59유효정

  Prev 1 2 3 Next  

지금 뜨는 기사

이시각 헤드라인

"요금 올리거나, 무료 풀거나"…OTT, 전략 분화

"책 대신 '아이패드'로 수업을"…디지털이 바꾼 교실 풍경은

과학자들, 납으로 금 만들었다…'연금술사의 꿈' 실현되나

[ZD브리핑] 아시아 IT 박람회 컴퓨텍스 개최...21대 대선 후보 첫 토론회

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현