• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
인공지능
배터리
양자컴퓨팅
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'AI 영상'통합검색 결과 입니다. (53건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

中 'AI로 만든 영화' 나온다...감독 9명 참여

중국에서 초거대 생성형 인공지능(AI) 모델을 이용한 영화가 제작된다. 9일 중국 언론 중궈신원왕에 따르면 중국 숏클립 플랫폼 '콰이서우'는 '클링 AI(Kling AI) 감독 공동 창작 계획'에 착수한다고 밝혔다. 중국산 영상 생성 초거대 모델 기술로 영화 콘텐츠를 제작하는 프로젝트다. 계획에는 리샤오훙, 자장커, 예진톈, 쉐샤오뤼, 위바이메이, 둥룬녠, 장츠위, 왕쯔추안, 왕마오마오 등 9명의 유명 감독이 참여하는데, AI 기술을 써서 9편의 AIGC(AI 생성 콘텐츠) 단편영화를 제작한다. 이 9편의 단편 영화는 모두 콰이서우의 대규모 영상 생성 모델인 '클링 AI'로 제작된다. 감독이 전적으로 영상 생성 모델에만 의존하게 된다. 물리적 세계 시뮬레이션, 컨셉 생성 및 조합에 클링 AI를 활용하고, 클링 AI로 영상 이미지를 생성해 3분 길이의 단편 영화 9편을 선보일 예정이다. 콰이서우에 따르면 9명의 감독은 다양한 스타일의 영상 제작 경험을 보유했으며, 영화, TV 시리즈, 애니메이션, 만화 등 분야에서 누적 흥행액이 200억 위안(약 3조 7천700억 원)을 넘는다. 영화 제작에는 AIGC 크리에이터 9명도 기술 컨설턴트로 감독들을 지원하게 된다. 클링 AI는 콰이서우가 올해 6월 발표한 영상 생성 초거대 모델로서 발표 직후 오픈AI의 '소라'에 비견되는 중국판 영상 생성 모델로 평가됐다. 텍스트 입력을 통해 1080P의 2분 길이(30fps) 영상을 생성할 수 있다고 소개됐는데, 올해 8월 기준 출시 3개월 만에 이미 160만 명이 클링 AI를 사용해 1천600만 개 이상의 영상을 생성했다. 누적 생성 이미지 수도 2천500만 개에 달한다. 콰이서우는 7월 24일 전 세계 사용자에게 공개 베타 버전을 공개했으며, 이미지의 영상 전환과 모션 화면, 렌즈 제어 등 방면에서 좋은 성능을 보이고 있다는 평가다. 앞서 지난 7월 중국에서 이미 단편 드라마 제작에 클링 AI가 적용된 바 있다. 중국 최초 AIGC 오리지널 판타지 단편 드라마 '산하이치징-피부잔랑'이 콰이서우에서 공개됐다. 콰이서우는 '더우인(틱톡의 중국 버전)'과 경쟁하는 중국 유명 숏클립 플랫폼으로, 올해 2분기 콰이서우의 일 평균 활동 사용자 수가 3억9천500만 명을 넘어서 역대 최고치를 기록했다. 월 평균 활동 사용자 수는 6억9천200만 명으로 집계됐다.

2024.09.10 09:16유효정

인공위성 데이터의 무궁무진한 가능성을 판다

우주와 인공위성 산업은 이제 한국서도 본격적으로 활성화되고 있다. 매우 희귀한 데이터로 분류되는 인공위성 촬영 영상을 활용해 다양한 분야에서 활용하려는 민간 기업이 속속 등장하고 있다. 그중 국내 인공위성 데이터 분석 산업을 선도하는 에스아이에이(SIA)는 방대한 양의 위성 데이터를 기반으로 활발하게 사업을 확장하고 있다. 전태균 SIA 대표이사는 최근 본지와 인터뷰에서 “창업 후 6년째 국내의 주요 정부기관을 대상으로 다양한 솔루션과 플랫폼을 제공하고 있다”며 “국방, 안보 시장 중심으로 국내와 다수 국가에 진출하려 다각적인 방향을 모색하고 있다”고 밝혔다. SIA는 국내 대표 인공위성제조기업인 세트렉아이의 자회사로 2018년 설립됐다. 인공지능 분야 박사학위를 취득한 전태균 대표는 세트렉아이 연구원으로 재직 중 여러 데이터 중 독보적인 데이터를 찾다가 우주, 위성 데이터에 관심을 갖게 돼 SIA를 창업하게 됐다고 한다. 현재 지구 상공에서 운영되는 국가 및 민간 소유 인공위성은 국방, 기상 등에서 쓰이고 있고, 그 수는 헤아리기 힘들 정도로 많다. 고해상도 카메라를 탑재한 인공위성이 급증하고, 다수의 초소형 위성이 군집 운영되고 있다. 이에 위성 촬영 영상의 양과 하루에 처리하는 데이터의 양도 증가하고 있다. 촬영된 영상 속 표적을 AI로 식별, 판독하는 게 가능해졌다. 전태균 대표는 “인공위성 촬영 영상은 국가 간 분쟁과 분열에 쓰이기도 하지만, 전지구적으로 하나로 뭉쳐서 해결해야 하는 기상이변, 재난재해 등의 문제에서도 중요하게 쓰인다”며 “SIA도 사업 초기 국방안보에 집중했는제 이제 전지구적 문제에 더 집중해서 사업을 확장하는 단계”라고 설명했다. 인공위성의 촬영 대상물은 지구다. 시간의 흐름에 따라 촬영 대상인 지구는 계속 바뀌고, 카메라는 오로지 한 순간만 촬영할 수 있다. 과거로 되돌아가 촬영할 수 없다는 특징을 갖는다. 순간순간 촬영한 사진을 이어붙여서 영상으로 만들게 된다. 우주에서 촬영된 사진은 가로 2만5천, 세로 2만5천의 초고해상도로, 여러 장의 사진을 영상으로 만들면 그 파일의 크기가 매우 크다. SIA는 위성 촬영 영상을 저장, 처리, 유통하고, 데이터를 분석하는 플랫폼과 솔루션을 보유했다. 전 대표에 의하면, 우주 산업은 크게 세 영역으로 나뉜다. 위성 사진의 촬영 목적에 따라 카메라를 설계해 인공위성을 제작하는 제조 분야, 만들어진 인공위성을 우주로 보내는 발사 분야, 궤도 위성으로 사진을 찍어 촬영본을 분석해 의사결정에 활용하도록 지원하는 분석 분야다. SIA는 분석 분야에서 활약하고 있다. 전 대표는 “위성 데이터를 활용하고자 하는 사용자는 두가지 중 하나를 선택할 수 있는데, 인공위성 데이터를 직접 구매하거나 자체 인공위성을 쏘아올리는 것”이라며 “위성은 안타깝게도 지구 위에서 실시간으로 멈춰서 찍을 수 없고 빠르게 회전하기 때문에 한번 지나가면 다음번까지 기다려야 한다”고 말했다. 그는 “그래서 사용자는 인공위성 자체를 궤도 상에서 공유하며, 하나가 지나가면서 사진을 찍고, 다음 위성이 또 같은 자리를 찍는 식인데, 내 머리 위에 위성 몇대가 지나갈지 감안해서 그 위성을 가진 소유자에게 사진 촬영을 요청하는 공급계약을 맺는다”며 "SIA는 한국 정부 소유 위성으로 부족하므로 해외 민간기업 소유 위성의 파트너십을 맺어서 300개 정도의 위성을 쓰고 있고, 국가 예산으로 만들 수 있는 위성보다 공유받는 역량이 훨씬 더 커서 데이터를 더 많이 빨리 처리하고 국가목적에 맞게 대응하는 장점을 갖고 있다”고 강조했다. SIA는 지구를 촬영한 사진 속 표적물을 빠르게 식별하는 기술을 보유했다. 통상 촬영 해상도의 경우 약 120km에 해당하는 면적을 사람이 일일이 분석할 수 없으므로 AI로 분석한다. 또한 표적 식별 외에도 미래를 예측할 수도 있다. 전 대표는 “건물이 토지대장 대비 비정상 건물인지, 차량이 일상적인 차량인지 특수차량인지 등을 분석하는 게 SIA의 업무”라며 “식별, 분석, 예측 등으로 업무를 나누고 미래에 여길 찍어야 할 지,. 혹은 다음주 여기를 찍어서 통상 활동이 일어날 것으로 예상되는가도 본다”고 말했다. 그는 “지구를 관측해서 더 많은 영역을 보고, 의사판단을 하고 결정하게끔 하는게 우리의 역할”이라며 “국가 모니터링뿐 아니라 이제 민간이나 기업 의사결정에서도 글로벌 전체의 상황을 보고 의사결정하는 게 많아졌다”고 덧붙였다. 인공위성 영상은 단순한 모니터링 외에도 다양하게 활용될 수 있다. 일례로 2년전 우크라이나와 러시아 간 전쟁이 발발했을 때 전세계는 우크라이나 곡창지대의 농산물 생산에 차질을 빚을 것으로 우려해 곡물 선물 가격이 급등했었다. 이에 NASA와 민간 기업이 겨울 전쟁 후 우크라이나 곡창지대를 분석했다. 그 결과 파종이 정상적으로 이뤄졌고, 수개월 뒤에도 농작물이 잘 자라고 있으며, 유통과 저장 시설도 안전하다다는 것을 밝혀내 글로벌 공급망이나 곡물생산에 영향없을 것이란 선물시장 보고서를 냈다. SIA도 특정 지역을 주기적으로 모니터링하면서 이상징후와 변화상을 알아내고 있다. 이 회사의 위성 영상 분석 모델인 SIA AI 팩은 방대한 면적의 촬영 이미지에 대한 해상도를 개선하는 초해상화 기술, 주요 지형지물 표적을 탐지하는 객체 검출 기술, 이상 상황을 탐지하는 변화 탐지 기술 등을 보유했다. 초해상화 기술인 SIA 슈퍼X는 광학 위성 영상의 가시성과 선명도를 향상시켜 이미지의 정확한 해석에 도움을 준다. 기상 위성 영상과 딥러닝 분석을 활용해 기상기후와 재난재해 시작점을 예측하는 것도 가능하다. 지금은 온실가스를 정확히 측정하는 AI 모델을 개발중이다. SIA의 관계사인 세트렉아이는 전세계 3대 위성용 카메라 제조기업으로 꼽힐 정도의 초고해상도 카메라 제조 역량을 보유했다. 분단국가란 특수성 덕에 한국은 특정 지역을 지속적으로 모니터링하는 경험과 데이터를 축적하게 됐고, 시간 흐름 상의 데이터를 축적해 활용하는 기술을 제공하는 에스아이에이의 역량도 높을 수밖에 없다. 전 대표는 “기술적인 강점은 기본적으로 갖고 있고, 데이터 구성에 대한 노하우도 보유했다”며 “유사 기업이 국내외에 많지만, 이 장벽은 쉽게 따라오지 못할 것이라고 생각한다”고 자신했다. SIA의 AI는 얼마나 경쟁력을 갖고 있을까. 전 대표에 의하면, 사진 한장을 판독가가 해석하는데 30~40분 정도 걸리지만, AI로 하면 수초 안에 식별을 찾아낼 수 있다. 전 대표는 “식별한 정보를 이미 저장 분석한 데이터와 결합해 명확한 수치정보를 곧바로 제공할 수 있다”며 “해당 지역의 대상물이 통상 몇대 발견되고, 이번엔 갑자기 절반으로 줄었다거나 혹은 두배 늘었다 같은 명확한 수치정보를 바로 제공 할 수 있으며, 직관적으로 보기에 지역이 지난주 몇대 았었나 사람이 알기 어려우니 바로 보고 영상 분석결과 보고서를 만들기까지 3~5분이면 만든다”고 밝혔다, 그는 “원래 하던 워크플로에서 AI를 넣으면 업무 생산량이 10배 늘어난다”며 “IT 디바이스의 급증처럼 위성도 폭발적으로 증가하는 시기를 겪고 있어서 봐야 할 영상이 수십 수백배로 증가했고 데이터 증가량에 따른 생산성 증가를 위해서라도 AI 적용은 필수”라고 덧붙였다. SIA는 클라우드 컴퓨팅을 적극 활용한다. 지난 AWS코리아의 퍼블릭섹터데이 행사에 전태균 대표가 패널토의에 참석해 클라우드 활용 경험을 공유하기도 했다. 일단 위성 데이터를 제공하는 곳이 클라우드를 쓰고 있다. 데이터 공급자가 방대한 데이터를 일일이 다운로드해 저장하는 자체 인프라를 구축하지 않고 클라우드로 유통한다. SIA는 AI 모델을 클라우드 상에서 개발해 운영하면서, 클라우드에 저장된 위성 데이터를 학습하게 한다. 전 대표는 “모델과 데이터를 올려서 쓰고, 완성되면 공급하는 앱도 클라우드에 같이 있어야 하는 삼박자가 맞아서 클라우드를 선택하고 있다”고 말했다. 그는 “5년전 고생한 경험이 있는데, AI 시스템을 고객사에서 시연해야 해서 블랙박스 같은 랩톱을 특수제작해 비행기에 싣고 가 시연했었다”며 “말도 못할 고생과 현지 네트워크 설정 때문에 고생을 몇번 하다가 도저히 못할 일이라 여겼고, 클라우드 기업의 도움을 받아서 북미, 싱가포르, 중동 등의 리전에서 모델을 운영하며 다양한 지역에서 바로 쓰게 준비해놓게 했다”고 덧붙였다. 현재 AWS 서비스로 아마존 EC2를 기본 활용하고, 모기업인 세트렉아이는 클라우드 기반 지상국 서비스인 AWS 그라운드 스테이션을 활용한다. 전 대표는 “특히 AWS의 기술적 지원 외에도 마켓플레이스가 많은 역할을 하고 있다”며 “솔루션 기업의 경우 많은 국가에서 요청왔을 때 그 국가에 대한 보안체계, 법률적 문제, 시장진입 관련 다양한 부분에서 넘어야 할 장벽이 많은데. 마켓픟레이스에 우리 솔루션 올리게 되면 다양한 국가 사용자에게 전달하기 위한 확장이 용이하기에 이를 협의하고 있다”고 햇다. SIA의 최근 확장 분야는 기후 변화 부분이다. 전 대표는 “한국의 슈퍼컴퓨터를 이용한 기상예측은 수치예보모델 기반인데, 움직이는 바람 같이 다양한 외적 요인을 수식화해서 조율하면서 비를 예측한다”며 “그 전체를 인공지능으로 통째로 바꿔서, 수식을 자동으로 만드는 알고리즘 만들었고, 지구 전체 데이터를 봐야 하는 문제를 해결하기 위해 유럽 정지궤도, 아시아, 미국 정지궤도 등으로 삼등분해서 다 연결하는 데이터화를 진행했다”고 말했다. 그는 “인공지능으로 구름이 어디로 이동하고, 그게 얼마나 비를 담고 있고, 언제 비를 내릴지 예측하는 걸 새로 만들었다”며 “일기예보에서 중요한 레이더 정보는 지상에서 레이터 시스템으로 공기중 수분을 측정해야 하는데, 전세계적으로 국가의 자본 역량 차이 때문에 데이터 균질성이 떨어지므로 일반 구름 사진에서 레이더 데이터로 바꾸는 생성형 AI 모델을 만들어서 데이터 부족 국가에서도 하드웨어 없이 데이터를 만들 수 있는 기술을 연구했다”고 설명했다. 그는 한국 외 국가의 건물을 잘 탐지하기 위해 국가지역 별 건물 양상을 총체적으로 인식할 수 있는 일반인공지능 모델도 개발하고 있다고 밝혔다. 그는 위성영상을 잘 이해하는 AI 역량과 그 외 위성영상 혹은 다른 일반 정보를 잘 이해하고 설명할 수 있는 대화형 언어모델은 많이 시도되지만, 이같은 시도는 없다”며 “이 기술을 내부적으로 고도화 작업을 진행중으로 앞으로 우리 회사를 독보적으로 치고 나가게 하는 성장동력이 될 거라고 생각한다”고 강조했다. 그는 마지막으로 인공위성 시스템을 만드는 것 자체에 매몰되지 말아야 한다고 했다. 그는 “많은 공공기관에서 시스템 만드는 것에 집중하고 있는데, 어떻게 시스템을 만들든 그를 잘 활용해서 어떤 국가적 이득을 올릴 수 있는가에 집중하면 좋겠다”며 “시스템이 파편화되고, 기관내에 독립적으로 존재하는 시스템이 많아져 기관마다 제품을 따로 만들어서 공급해야 하는 어려움이 있다”고 말했다. 그는 “가장 신뢰하고 먼저쓸 수 있는 준비돼 있는 클라우드를 기반으로 전체를 통째로 바꾸는 건 어렵더라도 새롭게 시작하는 비즈니스의 경우에 선제적으로 클라우드 도입해보고 효과성 나오면 공공전체로 확대하는 국가적 고민도 필요한 것 같다”고 조언했다.

2024.07.16 11:33김우용

첨단 영상 분석으로 딥페이크 신종범죄 잡는다

한국전자기술연구원(KETI·원장 신희동)은 국립과학수사연구원(원장 이봉우)과 과학수사 분야 연구 협력을 위한 업무협약(MoU)을 체결했다고 밝혔다. KETI와 국과수는 업무협약을 계기로 인공지능(AI) 기반 영상·음성 분석 등 첨단 분야 공동 기술 개발을 추진함과 동시에 과학수사 분야 내 기술 확산을 지원하는데 합의했다. KETI는 딥러닝 기반 영상 인식추적·영상 화질개선 등 지능형 영상처리 기술, 멀티모달 인터랙션 및 추론, 자연어 처리 등의 인공지능 기술 등 첨단 지능 분야 핵심 기술 육성에 집중하고 있다. 국과수는 행정안전부 소속 과학수사 감정연구기관으로, CCTV·비디오·사진을 포함하는 각종 영상·음성 판독/개선 기술 등 범죄수사에 필요한 법공학 분야 연구개발을 수행 중이며, 주요 범죄 사건사고에 필요한 해석과 감정을 지원한다. KETI와 국과수는 이번 협약을 통해 ▲과학수사에 필요한 영상 및 음성 분석 기술 교류 ▲영상 및 음성 분석 기술 활용을 위한 인적 교류 ▲과학 수사 분야 신기술 수요 공동 발굴 및 정부 전략 수립 지원 등 첨단 분야에서의 R&D 협력을 강화할 계획이다. 협약식에서는 KETI 지능정보연구본부의 지능형영상처리연구센터 및 인공지능연구센터, 국과수 법공학부의 디지털과와 법과학교육연구센터 주요 관계자가 참석해 첨단 과학수사 분야 주요 협력 기술을 논의했다. KETI 지능정보연구본부는 인물의 행동 양식을 모방하는 극사실적 인물 구현 등의 동영상 합성·판별 기술을 바탕으로 딥페이크 영상과 음성을 판별하는 탐지 기술을 보유 중이다. 신희동 KETI 원장은 “다가오는 미래 치안의 핵심은 첨단 과학 기술 개발이며, KETI는 유망 ICT 기술 구현과 확산에 필요한 최적의 파트너”라며 “두 기관의 협약이 향후 국민 안전을 보장하는 과학치안 사회로 이어지길 기원한다”고 밝혔다. 이봉우 국과수 원장은 “최근 인공지능 기술 발달에 따라 딥페이크와 같은 신종범죄로 인해 국민 안전이 위협받고 있다”며 “두 기관의 힘을 모아 기술을 연구·개발해 국민이 안전한 사회를 구현할 수 있도록 노력하겠다”고 말했다.

2024.07.10 08:25주문정

버즈니, CJ온스타일에 커머스AI 구독 서비스 제공

버즈니(대표 남상협·김성국)는 CJ온스타일과 인공지능 활용 기반 비즈니스 협업을 맺고 버즈니 커머스 AI 구독 서비스 'A Plus AI'를 제공한다고 27일 밝혔다. 버즈니는 2008년 세계 검색 대회 TREC 에서 1위(KLE팀)를 하면서 출발한 인공지능 기술 기반 서비스 회사다. 기술 개발과 함께 모바일 커머스 플랫폼 '홈쇼핑모아'를 10년 넘게 운영하며 이커머스 서비스 경험을 쌓았고, 올해부터 자사 커머스 AI기술을 제품화해 AI 도입이 필요한 이커머스사에 커머스 AI 구독 서비스를 제공하고 있다. 현재 버즈니 '에이플러스 AI'에서 제공하고 있는 AI 구독 서비스는 ▲A Plus 검색 AI ▲쇼핑 어이스턴트AI ▲숏폼 편집 AI ▲하이라이트 AI ▲리뷰분석 AI ▲추천 AI 등이 있다. 이번에 버즈니가 CJ온스타일에 공급하는 기술은 A Plus 숏폼 AI를 비롯해 카테고리 자동 분류, 고객문의 자동분류, 광학문자 인식 분석 기술이다. 이중 A Plus 숏폼 AI는 영상 편집자의 작업 효율을 제고하기 위한 서비스로 AI를 활용해 긴 영상에서 하이라이트로 예상되는 클립 구간을 자동 선별해 편집 시간을 효과적으로 단축시킨다. 버즈니 숏폼 AI는 편집자가 원하는 장면 검색 기능을 함께 제공해, AI와 영상 전문가 간의 시너지를 극대화한다. 또 하이라이트 구간을 추출하는 단계부터 숏폼 템플릿에 맞는 디자인 편집까지 전 과정을 자동화해 영상 편집자의 다양한 필요에 대응할 수 있다. 남상협 버즈니 대표는 "숏폼 AI의 경우 비즈니스 과정에서 숏폼 비디오를 활용하는 모든 이커머스 기업과 협업이 가능하다"며 "앞으로도 커머스 도메인에 특화된 ' A Plus AI'를 통해 파트너사의 AI기반 디지털 전환과 실질적인 매출 성장에 도움 되고자 한다"고 말했다.

2024.06.27 17:13백봉삼

中 콰이서우, 오픈AI '소라' 대적할 AI 영상 생성 기술 출시

중국 동영상 플랫폼 콰이서우가 미국 오픈AI의 '소라'에 대적하겠다며 초거대 인공지능(AI) 모델을 기반 이미지 생성 기술을 발표했다. 소라는 명령어를 입력하면 1분 분량의 영상을 만들어주는 AI 서비스다. 6일 중국 언론 IT즈자에 따르면 콰이서우는 '텍스트투이미지', '이미지투이미지' 기능을 제공하는 AI 초거대 모델 '칼라스(KOLORS, 중국어명 可灵)'를 발표하고 공식 홈페이지와 위챗 등을 통해 서비스한다고 밝혔다. 칼라스는 텍스트 입력을 통해 1080P의 2분 길이(30fps) 영상을 생성할 수 있으며 화면 비율을 자유롭게 조정할 수 있다. 유화, 컴퓨터그래픽, 핸드페인팅, 중국 판화, 3D 등 다양한 이미지 스타일 제작과, 8K의 고화질 이미지 생성을 지원한다는 게 콰이서우의 설명이다. 주요 기능은 '텍스트투이미지' 기능으로, 텍스트를 입력하면 다양한 스타일과 높은 화질을 갖춘 이미지를 생성한다. 입력된 테스트를 토대로 다양한 스타일의 이미지를 생성해주며 사용자가 참조 이미지를 업로드할 수도 있다. 이미지의 스타일, 테마, 세부 사항을 기반으로 새 작품을 생성한다. 'AI 이미지 커스터마이징' 기능은, 사용자가 인물 사진을 업로드하면 다양한 가상 이미지로 만들어주는 것이다. 일명 '인물 보존 기술'을 이용해 인물의 자연스러운 특성을 유지하면서 다양한 스타일의 인물 이미지를 생성해주는 것이다. 콰이서우는 "칼라스 초거대 모델은, 콰이서우의 AI팀이 자체 개발했으며, 소라와 유사한 기술 노선을 채택하면서 여러 자체 개발 기술 혁신을 결합해 소라에 맞대결 할 것"이라고 전했다. 콰이서우에 따르면, 칼라스의 초거대 모델 매개변수 규모는 10억 개 수준으로, 오픈소스 커뮤니티 소스 및 자체 AI 기술을 더했다. 텍스트투이미지 기능의 긴 텍스트와 복잡한 의미의 텍스트 입력을 위해 강화학습보상모델기술(RLHF)도 적용했다. 매체에 따르면 콰이서우는 칼라스 초거대 모델에 더 많은 기능이 구현하고, 표정과 신체 움직임이 동시에 구현되는 새로운 'AI 노래와 춤' 서비스도 출시할 예정이다. 한 장의 사진만 있으면, 노래하고 춤추는 영상을 얻을 수 있는 기능이다. 콰이서우는 지난해 연말 기준 평균 월 활성 사용자 수가 7억 명을 넘어선 중국의 주요 영상 플랫폼이다.

2024.06.07 09:08유효정

중국판 '소라' 등장...최대 16초짜리 AI 영상 생성

중국에서 미국 오픈AI의 텍스트투비디오 생성 모델 '소라(Sora)'를 벤치마킹한 인공지능(AI) 영상 생성 모델을 발표했다. 27일 중국 성수커지(ShengShu)가 칭화대와 협력해 개발한 중국 AI 초거대 모델 '비두(Vidu)'를 발표했다. 이 모델은 장시간, 높은 일치성, 높은 동태성 등 특징을 가지는 모델로서, 중국 언론과 업계 관계자들은 이 모델이 중국 최초의 '소라'급 영상 모델이라고 평가하고 있다. 이 모델은 '중관춘포럼미래인공지능선봉포럼'에서 처음 공개됐다. 비두는 원클릭으로 최대 16초 길이와 최대 1080p 해상도의 영상 생성을 지원하는 독창적 '유빗(U-ViT)' 아키텍처를 사용했다고 설명했다. U-ViT은 소라처럼, 디퓨전(이미지 데이터에 노이즈를 추가 및 제거하며 이미지를 생성)과 트랜스포머(텍스트 맥락을 통해 이미지를 생성) 방식을 결합해 구성된 아키텍처다. 회사측에 따르면 U-ViT 아키텍처는 소라가 채택한 DiT 아키텍처보다 먼저 2022년 9월 개발팀이 제안한 것으로 디퓨전과 트랜스포머를 통합한 세계 최초의 아키텍처다. 개발팀은 앞서 U-ViT 융합 아키텍처를 기반으로 한 세계 최초 다중 모드 확산 모델인 유니디퓨저(UniDiffuser)를 오픈소스화하고 U-ViT 아키텍처의 대규모 확장성 검증을 완료했다고도 설명했다. 비두에 따르면 비두는 실제 물리적 세계를 시뮬레이션 할 수 있을뿐 아니라 창의력과 높은 시공간적 일관성 등을 갖추고 있다. 성수커지는 칭화대 인공지능연구원 출신 인력이 지난해 3월 설립한 AI 스타트업으로 알리바바, 텐센트, 바이트댄스 등 출신 인력으로 구성됐다.

2024.04.29 08:59유효정

삼성 원UI 6.1.1, '영상 AI' 기능 탑재 전망

삼성전자가 구글과 인공지능(AI) 분야에서 파트너십을 강화하고 있다고 알려진 가운데, 향후 원UI 6.1.1 업데이트에 혁신적인 '영상 AI' 기능을 도입할 것이라고 IT매체 GSM아레나가 25일(현지시간) 보도했다. 유명 IT 팁스터 아이스유니버스는 자신의 엑스(@UniverseIce)에 “원UI 6.1.1의 혁신적인 핵심 기능은 영상 AI”이라고 밝혔다. 그는 해당 기능이 어떤 특징을 가지고 있는지는 언급하지 않았다. 해당 매체는 이 기능에 대해 프롬프트 기반의 생성형 AI 영상 생성 기능이나 영상 촬영에 활용되는 AI 기능일 수도 있다고 전망했다. 같은 날인 구글 릭 오스터로(Rick Osterloh) 부사장은 자신의 SNS에 노태문 삼성전자 MX(모바일경험) 사업부장 사장을 만나 갤럭시와 구글의 AI 협력을 논의했다고 밝혔다. 때문에 새롭게 도입되는 영상 AI 기능은 삼성과 구글의 협력의 결과물일 가능성도 있다고 GSM아레나는 전했다. 원UI 6.1.1은 오는 7월 개최되는 언팩 행사에서 갤럭시Z폴드 6, 갤럭시Z플립 6와 함께 소개될 가능성이 높다고 외신들은 전했다.

2024.04.26 14:17이정현

시놀로지 "올해 국내 중소기업 영상보안 공략 강화"

"한국 영상보안 시장은 한화비전(구 삼성테크윈) 등이 브랜드 인지도와 사후 유지보수 용이성, 고객지원 등을 앞세워 대규모 고객사를 확보했습니다. 올해 한국 시장에서 비용 문제로 어려움을 겪는 중·소규모 기업에 제품을 알리는 것이 목표입니다." 20일 개막한 '제 23회 세계 보안 엑스포'(SECON 2024) 행사장에서 기자와 만난 석미은 시놀로지 대만 본사 시니어 세일즈 매니저가 이와 같이 설명했다. 시놀로지는 2022년 이후 2년 연속으로 SECON 2024에 독자 부스를 마련하고 오는 22일까지 NAS(네트워크 저장장치)와 IP 카메라를 활용한 영상보안 솔루션을 시연중이다. 행사장을 찾은 관람객들은 엣지 AI를 활용한 영상 분석 기능에 많은 관심을 보였다. ■ 2009년 NAS 운영체제에 영상 보안 솔루션 통합 시놀로지는 전세계 NAS(네트워크 저장장치) 시장에서 강세를 보이는 업체다. 2009년 NAS용 자체 개발 운영체제 DSM(디스크스테이션매니저)에 IP 카메라 영상 관리 소프트웨어 '서베일런스 스테이션'을 통합했다. '서베일런스 스테이션'은 지난 해 9.0으로 업데이트를 거치며 자동차 번호판 인식, 지정 구역 혼잡도 알림, 침입 탐지 등 기능을 추가했다. 해당 기능은 인텔 셀러론(-2020)·AMD 라이젠 임베디드(2021-) 등 NAS 프로세서로 구동된다. 지난 2022년에는 엣지 AI 기능을 내장한 IP 카메라인 BC500/TC500 2종을 국내 포함 전세계 출시했다. 서베일런스 스테이션과 연동해 초기 카메라 설정이 가능하며 출입자 확인, 감시 영역 설정 등이 가능하다. ■ "시놀로지 영상 감시 솔루션, 비용 면에서 강점" 석미은 매니저는 "국내 영상보안 환경 구축시 소프트웨어와 IP 카메라는 국내/외 제품으로 구축 후 장기적으로 저장이 필요한 대용량 영상 데이터 보관에만 NAS를 이용하는 경향이 있다"고 설명했다. 이어 "NAS는 실시간 영상 데이터 저장 이외에 온디바이스 AI를 이용한 지능형 감시, 녹화 영상 백업과 공유 등을 갖춰 중/소규모 기업의 초기 투자를 줄이며 시설 보안 효율화가 가능하다"고 덧붙였다. 또 "국내 시설보안 업체는 침입자나 화재 등이 발생하면 보안요원이 출동하는 점에서 강점이 있지만 월 이용료 결제 등에서 한계가 있다. 시놀로지 영상 보안 솔루션은 유사시 직접 대처해야 하지만 추가 비용을 억제할 수 있다"고 강조했다. ■ "NAS·IP 카메라 공급으로 유지보수 일원화 가능" 서베일런스 스테이션은 지금까지 출시된 8천400여 개의 IP 카메라를 모두 지원한다. 그러나 석미은 매니저는 "타사 IP 카메라를 이용한 영상보안 시스템 구축시 유지보수 제공자가 분리되는 문제가 있었다"고 설명했다. 이어 "NAS와 IP 카메라를 모두 공급해 유지보수나 문제 발생시 통합된 지원을 제공하겠다는 것이 시놀로지 목표이며 BC500/TC500 2종을 시작으로 국내외 시장에 주기적으로 신제품을 출시할 예정"이라고 덧붙였다.

2024.03.20 17:53권봉석

인물 사진만 찍으면 '말하는 영상'이 나온다

중국에서 인물의 사진만 있으면 말하는 영상을 얻을 수 있는 인공지능(AI) 기술이 공개됐다. 3일 중국 알리바바그룹의 연구진이 '립싱크'에 사용할 수 있는 EMO(Emote Portrait Alive) 프레임워크를 발표했다. 인물 사진과 오디오만 입력하면 사진 속 인물이 중국어, 영어, 한국어 등을 말하는 영상을 구현할 수 있다. EMO는 엔비디아의 오디오2비디오(Audio2Video) 확산 모델을 기반으로 만들어졌다. 연구진은 이 AI 프레임워크를 얻기 위한 훈련에 250시간 이상의 전문 영상을 사용했다고 설명했다. 연구진은 EMO 프레임워크에서 생성된 몇 편의 데모 영상을 공개했다. 보고서에 따르면 이 프레임워크의 작동 과정은 두 단계로 나뉜다. 먼저 참조 네트워크(ReferenceNet)를 사용해 참조 이미지와 동작 프레임에서 특징을 추출한 이후, 사전 훈련된 오디오 인코더를 사용해 사운드를 처리하고 삽입한다. 이후 다중 프레임 노이즈와 얼굴 영역 마스크를 결합해 영상을 생성한다. 이 프레임워크에는 두 가지의 어텐션메커니즘(Attention Mechanism)과 시간 모듈이 결합돼 있어 영상에서 캐릭터 정체성의 일관성과 자연스러운 동작을 보장한다. 연구진은 모델의 작동 원리를 아시브(ArXiv)에 게시했다. 관심이 있는 사람은 깃허브에 방문해 프로젝트를 확인할 수 있다. 아시브는 출판되기 전 논문이 저장되는 무료 웹사이트다.

2024.03.04 08:27유효정

디캠프 2월 디데이, AI 간접광고 솔루션 '인쇼츠' 우승

건강한 성장과 멋진 성공을 꿈꾸는 스타트업들의 대표 경연 축제인 디캠프 디데이 2월 행사에서 AI 기반 간접광고 솔루션을 서비스 하는 '인쇼츠'가 우승을 차지했다. 은행권청년창업재단 디캠프(대표 김영덕)는 서울 마포 프론트원에서 '글로벌 진출과 투자'를 주제로 디데이를 지난 달 29일 개최했다. 이 행사에는 총 202개 스타트업이 지원해 총 8개사가 25대 1의 경쟁률을 뚫고 본선에 올랐다. 그 가운데 AI 기반 간접광고 솔루션을 서비스하는 인쇼츠(대표 이건창)가 우승을 차지했다. 인쇼츠는 촬영이 완료된 영상 콘텐츠에 브랜드 제품을 삽입하는 인비디오 간접광고 플랫폼이다. 촬영장에 제품을 배치하는 간접광고는 방영까지 짧게는 5개월, 영화의 경우 2년의 시간이 소요되는데 인쇼츠는 AI 기술을 활용해 기 촬영된 영상에 제품을 배치해 방영 시기와 광고 일정의 시차를 해결해 준다. 올해 1월 tvN 드라마 '마에스트라'에 삼성전자 제품으로 적용사례를 만든 인쇼츠는 K-콘텐츠의 세계화 흐름에 맞춰 글로벌 진출을 계획하고 있다. 지로(공동대표 이재석·황길환)는 한국형 영상 스톡 서비스 '드롭샷'을 개발한다. 방송국이나 제작사 등에서 콘텐츠를 제작할 때, 촬영한 영상의 약 10%의 영상만 사용하고 나머지는 버려진다. 드롭샷은 이 버려지는 영상을 스톡으로 판매한다. 기존 스톡 서비스와 비교해 퀄리티가 높고, 한국·아시아 관련 콘텐츠를 타깃으로 했다는 점이 특장점이다. 그 외에도 AI 기반의 검색 기능을 제공해 사용자가 원하는 영상을 쉽게 검색할 수 있도록 했다. 지로는 지난 CES 2024에서 드롭샷 베타 버전을 공개했으며, 현재 글로벌 서비스 출시를 준비하고 있다. 싱가포르에 본사를 둔 타미AI(대표 이강욱)는 AI 기반의 미디어 요약 및 탐색 서비스를 제공한다. 유튜브에 업로드된 영상 링크만 입력하면 수초 안에 영상 내용을 텍스트로 정리해 주고, 내용과 연관된 영상 지점을 표시해 주는 타임스탬프 기능도 제공한다. 이 때문에 타미AI는 작년 5월 서비스 개시 이후 누적 160만 방문자 및 25만 유저를 유치했다. 이 대표는 추후 ▲콘텐츠 맞춤 추천 ▲기업 및 창작자를 위한 콘텐츠 기반 챗봇 ▲긴 길이의 영상을 자동으로 숏폼, 하이라이트 등 다양한 포맷으로 편집해 주는 기능 등을 제공할 계획이라고 밝혔다. 토브앤바나(대표 박영재)는 화장품 샘플 커머스 플랫폼 '샘플로드'를 운영한다. 작은 용량 화장품을 판매해 소비자의 화장품 구매 실패 문제를 해결하고, 화장품 브랜드의 재고 폐기 손실을 수익으로 전환하는 서비스를 제공한다. 텍스트 데이터를 분석하는 텍스트마이닝(Text mining) AI 기술을 기반으로 고객 맞춤 제품을 큐레이션을 해주고, 관련된 특허를 4개 보유하고 있다. 현재 2만여 명의 회원을 가지고 있으며 2023년 4월에는 홍콩사이언스파크로부터 유망 스타트업에 선정된 바 있다. 누아(대표 서덕진)는 항공권 유통, 판매 과정을 자동화하는 '누아 애그리게이터'와 여행사 대상 올인원 SaaS '누아 오피스'를 운영한다. 누아 애그리게이터는 차세대 항공권 유통 규격인 NDC(New Distribution Capability)와 함께 GDS, LCC를 통합한 항공권 부킹 엔진을 여행사를 대상으로 제공한다. '누아오피스'는 여행사의 예약, 노선관리, 판매, CS 등을 통합 지원하는 구독형 백오피스로 관리 비용을 기존 대비 80%까지 경감할 수 있다는 게 업체의 설명이다. 머니스테이션(대표 이정일)은 국내 소셜 투자 콘텐츠 플랫폼 머니스테이션과 금융 빅데이터를 세밀하게 분석 투자하는 툴 시그널 엔진을 운영하고 있다. 회사명과 동일한 소셜 네트워킹 서비스(SNS)인 '머니스테이션'은 이용자들의 집단지성으로 만들어지는 커뮤니티로, 투자 콘텐츠가 여러 곳에서 소비되도록 돕는 역할을 한다. 월평균 생성 콘텐츠 수는 3천400개로, 최근 3년 새 연평균성장률은 135%에 이른다. 디비디랩(대표 강지수)는 100개가 넘는 국가의 잠재고객을 대상으로 사용성 테스트, 그룹 인터뷰, 5s 테스트, 퍼스트 클릭 등 다양한 리서치를 설계하고, 그 결과를 분석할 수 있는 글로벌 리서치 오퍼레이션 서비스를 제공한다. 동시에 패널 모집 플랫폼 '우쥬테스트'를 함께 운영하고 있어 원하는 조건의 응답자를 찾아 빠르게 의견을 수집할 수 있다. 강지수 대표는 디비디랩의 리서치 오퍼레이션 서비스 사용으로 리서치 시간과 비용을 80% 이상 줄일 수 있다고 설명했다. 스페이스티(대표 류한주)는 베트남 시장을 타깃으로 한 올인원 인테리어 플랫폼을 운영한다. 사용자 제작 콘텐츠를 기반으로 월 활성 이용자 20만 명 이상을 확보한 인테리어 커뮤니티와 호찌민 등 대도시를 중심으로 한 시공 중개 서비스를 제공하며, 지난 1월 가구, 소품 등을 판매하는 인테리어 상거래 서비스를 가오픈했다. AI를 활용한 관심사 기반의 콘텐츠∙제품 추천 서비스, 3D/AR 기술을 활용한 적용 예상 이미지를 통해 첨단 쇼핑 경험을 제공할 계획이다. 이날 한국성장금융, 한국벤처투자, 우리자산운용이 공동 주관사로 참여했으며, 이경훈 글로벌브레인 한국대표, 김종현 한국투자파트너스 싱가포르 법인장, 김광록 프라이머사제 대표, 피에르 주 코렐리아캐피탈 한국대표, 김정우 레드베지퍼시픽 대표, 데이브 응 알타라벤처스 대표, 이창윤 디캠프 직접투자팀장이 심사위원으로 함께 했다.

2024.03.03 10:39백봉삼

AI가 영상 만드는 시대 왔다…"컴퓨팅 파워·수익 모델 마련해야"

오픈AI가 영상을 생성하는 인공지능(AI) 모델 '소라'를 공개한 가운데, AI 영상 생성 서비스 상용화에 대한 여러 전망이 나왔다. 국내 업계 관계자들은 영상을 생성할 때 드는 컴퓨팅 인프라 수급 문제부터 해결해야 한다고 주장했다. 모델 수익화 방안도 마련해야 하고, 데이터 학습 방식도 주요 고려사항으로 보고 있다. 오픈AI는 지난 15일 문자를 입력하면 고화질 영상을 생성하는 모델 소라를 홈페이지를 통해 공개했다. 현재 내부 개발팀을 비롯한 소수 영상 편집가, 아티스트, 기업인들에게 공급된 상태다. 사용자 피드백을 통해 기술을 검증한 후 서비스를 출시할 방침이다. 출시 일정은 미정이다. "컴퓨팅 인프라 수요 감당해야…모델 수익화 방안도" 국내 전문가들은 영상모델을 통한 비즈니스가 활성화하려면 아직 멀었다고 입을 모았다. 우선 서비스 구동에 필요한 컴퓨팅 인프라 수급부터 해결해야 한다고 강조했다. AI 영상 생성 서비스의 상용화가 본격화하면 이를 구동하는 그래픽처리장치(GPU) 등 컴퓨팅 인프라 수요가 더 높아질 것으로 보인다는 이유에서다. 업계 관계자는 "언어모델보다 이미지·영상모델 구동에 더 많은 컴퓨팅 파워가 든다"고 했다. 단순 GPU 확보를 넘어 영상 생성 서비스를 비용 효율적으로 운영하기 위한 기술 개발도 본격화할 전망이다. 네이버 관계자는 "AI 모델 압축과 경량화를 돕는 AI 칩 필요성이 더욱 커질 것"이라며 "네이버가 삼성전자와 손잡고 AI 반도체 솔루션을 공동 개발하고 있는 이유"라고 본지에 전했다. 영상모델을 통한 수익화 마련도 구체적이지 않다. 한 업계 관계자는 "오픈AI가 챗GPT를 운영하는 데 드는 컴퓨팅 인프라 비용만 하루 70만 달러(약 9억3천만원)"라며 "이보다 더 무거운 영상모델을 서비스하려면 몇 배 더 높은 운영 비용을 감당해야 할 것"이라고 설명했다. 단순히 API나 구독형으로 기업들에 제공하다간 적자가 불가피할 것이란 분석이다. 현재 AI 기업들은 범용 LLM 개발·운영에 드는 비용을 줄이기 위해 소형언어모델(SLM)을 개발하는 추세다. 범용 LLM에 자사 데이터를 넣어 파인튜닝 하는 방식도 진행하고 있다. 전문가들은 영상 생성 모델에도 동일한 방식을 적용했다간 낭패라는 입장이다. 한국어 LLM을 보유한 한 기업 관계자는 "LLM과 달리 영상모델은 기술적으로 경량화하기 힘들다"며 "모델 경량화는 퀄리티 낮은 영상을 생성할 수 있다"고 지적했다. 영상모델, 언어모델보다 3배 많은 데이터 필요 영상모델의 훈련 데이터양도 중요하다는 지적도 있다. AI 모델이 영화, 광고 등 산업에서 활용 가능할 정도로 수준 높은 이미지를 생성하기 위해선 이미지 데이터를 대량으로 학습해야 해서다. 3D 설계용 AI 모델을 개발 중인 다쏘시스템의 수칫 제인 솔리드웍스·3D익스피리언스 웍스 전략 및 비즈니스 개발 부사장은 "일반적으로 언어모델을 학습시키는 것보다 영상모델 학습시키는 데 3배 더 많은 데이터양과 시간이 걸린다"고 기자에 전한 바 있다. 이미지 데이터에 스며든 사실 왜곡, 혐오 콘텐츠, 편향 등도 제거 해야 한다. 생성 결과물이 비윤리적이거나 편향된 경우 논란을 피할 수 없기 때문이다. 이에 오픈AI는 이미지 데이터 문제 해소를 위한 안전 조치를 취할 예정이라고 홈페이지를 통해 밝힌 바 있다. 영상에 등장할 수 있는 왜곡, 혐오 등의 기술적인 제거를 목표로 뒀다. 오픈AI는 "현재 사내 레드팀이 소라에 적대적 모델 테스트를 진행 중"이라며 "소라로 만든 영상을 분류할 수 있는 소프트웨어 도구도 개발하고 있다"고 설명했다.

2024.02.20 17:31김미정

인쇼츠 'AI 슈퍼스케일러', 국내외 애니 제작사 본격 도입

AI 스타트업 '인쇼츠'(대표 이건창)가 국내외 애니메이션 제작사들과 손잡고 영상 프로덕션 수준의 인공지능 솔루션을 공급한다고 6일 밝혔다. 최근 인쇼츠는 자사의 AI 비디오 화질 업스케일 기술인 'AI 슈퍼스케일러' 솔루션을 사단법인 부산애니메이션협회에 공급하는 업무협약을 체결했다. 앞서 인쇼츠는 지난해 12월 사단법인 한국애니메이션제작자협회와도 동일한 업무 협약을 맺은 바 있다. 일련의 업무협약을 통해 두 협회 소속 120여 개의 국내 애니메이션 회원사들은 작품의 콘셉트가 담긴 파일럿 영상의 AI 업스케일링을 무료로 제공받고, TV 시리즈와 극장 영화 콘텐츠에 대해 업스케일 기술을 효과적으로 활용할 수 있게 됐다. 인쇼츠가 공급하는 솔루션은 콘텐츠 영상에 특화돼 제작 현장의 높은 기준을 만족시킬 수 있는 생성형 AI다. 특히 2023년 6월 세계 최고 컴퓨터비전 학회인 CVPR에서 공식 발표된 세계 최고성능(SOTA, State-Of-The-Art) 모델을 기반으로 지속적인 성능개선을 이뤄내고 있다. 'AI 슈퍼스케일러'는 콘텐츠와 광고 분야에서 4K 비디오에 특화된 데이터와 학습 방법론을 적용해 프리미엄 영상의 원본 품질을 향상시키는 AI 리패키징(재상품화) 솔루션으로 시중에 출시된 업스케일 모델과 차별화된 결과물을 보여줄 수 있다. 인쇼츠는 국내뿐 아니라 미국, 중국 등 해외 애니메이션 제작사들과도 업무협약을 체결하고 솔루션 공급망을 넓히고 있다. 해외 협력사로는 미국의 아파트먼트 디 필름, 중국의 리시 엔터테인먼트 등이 있다. 이건창 인쇼츠 대표는 "국내외 애니메이션 제작사들이 보다 향상된 품질로 콘텐츠 자산을 리패키징(재상품화)하기 위해 자사가 개발한 원터치 컴퓨터 비전 솔루션을 활용하게 될 것으로 기대한다"면서 "비디오 콘텐츠에 특화된 AI 스타트업으로서 앞으로 애니메이션과 광고, 드라마 등 다양한 장르의 콘텐츠 제작사가 당사의 솔루션을 활용할 수 있도록 서비스 영역을 확대할 계획"이라고 밝혔다.

2024.02.06 11:19백봉삼

알리바바 "사진 올리면 춤추는 영상으로 바꿔줘요"

중국 알리바바가 인공지능(AI)을 이용해 인물의 정지 사진을 춤추는 영상으로 바꿔주는 서비스를 시작했다. 4일 중국 언론 진룽졔에 따르면 알리바바클라우드의 초거대 AI '퉁이쳰원' 앱에 무료 신기능인 '퉁이우왕'이 개시됐다. 사용자가 안내에 따라 사진을 업로드하면 10분 안에 신체적 특징을 반영한 댄스 동영상이 생성된다. 이 동영상은 원본 이미지의 얼굴 표정, 신체 비율, 의상, 배경과 기타 특징이 다 유지된다. 현재 퉁이쳰원은 몽골 댄스 등 최근 중국에서 유행하는 12개의 인기 댄스 템플릿을 사용자에게 제공한다. 이 기능의 알고리즘으로는 알리바바 퉁이실험실에서 자체 개발한 영상 생성 모델 '애니메이트 애니원(Animate Anyone)이 사용됐다. 이 모델은 지난해 11월 말 트위터, 유튜브 등 해외 소셜미디어 플랫폼에서 인기를 끌며 관련 영상 조회수 1억 회를 돌파하기도 했다. 이날 알리바바가 발표한 기술은 앞서 지난 달 중국 바이트댄스와 싱가포르국립대학이 공동으로 개발한 '매직애니메이트(MagicAnimate)'와 유사한 기술이다. 한 장의 사진만 있으면 일련의 내장된 셋트 동작과 결합해 댄스 영상을 생성할 수 있다. 사진만 있으면 AI를 이용해 외모와 표정 및 분위기, 배경이 유지된 댄스 영상을 만들 수 있다는 점이 같다.

2024.01.05 08:09유효정

  Prev 1 2 3 Next  

지금 뜨는 기사

이시각 헤드라인

SKT, 침해사고 이후 해지 위약금 면제...8월 요금 50% 감면

인천공항-면세업계, 임대료 인하 공방…"깎아줘" vs "왜 너만"

"AI 다음은 로봇"…열리는 로봇 칩 선점 전쟁

지주사 주가 치솟자 재계 표정관리...승계 셈법 복잡

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.