• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
창간특집
인공지능
배터리
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'영상 AI'통합검색 결과 입니다. (47건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

삼성 원UI 6.1.1, '영상 AI' 기능 탑재 전망

삼성전자가 구글과 인공지능(AI) 분야에서 파트너십을 강화하고 있다고 알려진 가운데, 향후 원UI 6.1.1 업데이트에 혁신적인 '영상 AI' 기능을 도입할 것이라고 IT매체 GSM아레나가 25일(현지시간) 보도했다. 유명 IT 팁스터 아이스유니버스는 자신의 엑스(@UniverseIce)에 “원UI 6.1.1의 혁신적인 핵심 기능은 영상 AI”이라고 밝혔다. 그는 해당 기능이 어떤 특징을 가지고 있는지는 언급하지 않았다. 해당 매체는 이 기능에 대해 프롬프트 기반의 생성형 AI 영상 생성 기능이나 영상 촬영에 활용되는 AI 기능일 수도 있다고 전망했다. 같은 날인 구글 릭 오스터로(Rick Osterloh) 부사장은 자신의 SNS에 노태문 삼성전자 MX(모바일경험) 사업부장 사장을 만나 갤럭시와 구글의 AI 협력을 논의했다고 밝혔다. 때문에 새롭게 도입되는 영상 AI 기능은 삼성과 구글의 협력의 결과물일 가능성도 있다고 GSM아레나는 전했다. 원UI 6.1.1은 오는 7월 개최되는 언팩 행사에서 갤럭시Z폴드 6, 갤럭시Z플립 6와 함께 소개될 가능성이 높다고 외신들은 전했다.

2024.04.26 14:17이정현

시놀로지 "올해 국내 중소기업 영상보안 공략 강화"

"한국 영상보안 시장은 한화비전(구 삼성테크윈) 등이 브랜드 인지도와 사후 유지보수 용이성, 고객지원 등을 앞세워 대규모 고객사를 확보했습니다. 올해 한국 시장에서 비용 문제로 어려움을 겪는 중·소규모 기업에 제품을 알리는 것이 목표입니다." 20일 개막한 '제 23회 세계 보안 엑스포'(SECON 2024) 행사장에서 기자와 만난 석미은 시놀로지 대만 본사 시니어 세일즈 매니저가 이와 같이 설명했다. 시놀로지는 2022년 이후 2년 연속으로 SECON 2024에 독자 부스를 마련하고 오는 22일까지 NAS(네트워크 저장장치)와 IP 카메라를 활용한 영상보안 솔루션을 시연중이다. 행사장을 찾은 관람객들은 엣지 AI를 활용한 영상 분석 기능에 많은 관심을 보였다. ■ 2009년 NAS 운영체제에 영상 보안 솔루션 통합 시놀로지는 전세계 NAS(네트워크 저장장치) 시장에서 강세를 보이는 업체다. 2009년 NAS용 자체 개발 운영체제 DSM(디스크스테이션매니저)에 IP 카메라 영상 관리 소프트웨어 '서베일런스 스테이션'을 통합했다. '서베일런스 스테이션'은 지난 해 9.0으로 업데이트를 거치며 자동차 번호판 인식, 지정 구역 혼잡도 알림, 침입 탐지 등 기능을 추가했다. 해당 기능은 인텔 셀러론(-2020)·AMD 라이젠 임베디드(2021-) 등 NAS 프로세서로 구동된다. 지난 2022년에는 엣지 AI 기능을 내장한 IP 카메라인 BC500/TC500 2종을 국내 포함 전세계 출시했다. 서베일런스 스테이션과 연동해 초기 카메라 설정이 가능하며 출입자 확인, 감시 영역 설정 등이 가능하다. ■ "시놀로지 영상 감시 솔루션, 비용 면에서 강점" 석미은 매니저는 "국내 영상보안 환경 구축시 소프트웨어와 IP 카메라는 국내/외 제품으로 구축 후 장기적으로 저장이 필요한 대용량 영상 데이터 보관에만 NAS를 이용하는 경향이 있다"고 설명했다. 이어 "NAS는 실시간 영상 데이터 저장 이외에 온디바이스 AI를 이용한 지능형 감시, 녹화 영상 백업과 공유 등을 갖춰 중/소규모 기업의 초기 투자를 줄이며 시설 보안 효율화가 가능하다"고 덧붙였다. 또 "국내 시설보안 업체는 침입자나 화재 등이 발생하면 보안요원이 출동하는 점에서 강점이 있지만 월 이용료 결제 등에서 한계가 있다. 시놀로지 영상 보안 솔루션은 유사시 직접 대처해야 하지만 추가 비용을 억제할 수 있다"고 강조했다. ■ "NAS·IP 카메라 공급으로 유지보수 일원화 가능" 서베일런스 스테이션은 지금까지 출시된 8천400여 개의 IP 카메라를 모두 지원한다. 그러나 석미은 매니저는 "타사 IP 카메라를 이용한 영상보안 시스템 구축시 유지보수 제공자가 분리되는 문제가 있었다"고 설명했다. 이어 "NAS와 IP 카메라를 모두 공급해 유지보수나 문제 발생시 통합된 지원을 제공하겠다는 것이 시놀로지 목표이며 BC500/TC500 2종을 시작으로 국내외 시장에 주기적으로 신제품을 출시할 예정"이라고 덧붙였다.

2024.03.20 17:53권봉석

인물 사진만 찍으면 '말하는 영상'이 나온다

중국에서 인물의 사진만 있으면 말하는 영상을 얻을 수 있는 인공지능(AI) 기술이 공개됐다. 3일 중국 알리바바그룹의 연구진이 '립싱크'에 사용할 수 있는 EMO(Emote Portrait Alive) 프레임워크를 발표했다. 인물 사진과 오디오만 입력하면 사진 속 인물이 중국어, 영어, 한국어 등을 말하는 영상을 구현할 수 있다. EMO는 엔비디아의 오디오2비디오(Audio2Video) 확산 모델을 기반으로 만들어졌다. 연구진은 이 AI 프레임워크를 얻기 위한 훈련에 250시간 이상의 전문 영상을 사용했다고 설명했다. 연구진은 EMO 프레임워크에서 생성된 몇 편의 데모 영상을 공개했다. 보고서에 따르면 이 프레임워크의 작동 과정은 두 단계로 나뉜다. 먼저 참조 네트워크(ReferenceNet)를 사용해 참조 이미지와 동작 프레임에서 특징을 추출한 이후, 사전 훈련된 오디오 인코더를 사용해 사운드를 처리하고 삽입한다. 이후 다중 프레임 노이즈와 얼굴 영역 마스크를 결합해 영상을 생성한다. 이 프레임워크에는 두 가지의 어텐션메커니즘(Attention Mechanism)과 시간 모듈이 결합돼 있어 영상에서 캐릭터 정체성의 일관성과 자연스러운 동작을 보장한다. 연구진은 모델의 작동 원리를 아시브(ArXiv)에 게시했다. 관심이 있는 사람은 깃허브에 방문해 프로젝트를 확인할 수 있다. 아시브는 출판되기 전 논문이 저장되는 무료 웹사이트다.

2024.03.04 08:27유효정

디캠프 2월 디데이, AI 간접광고 솔루션 '인쇼츠' 우승

건강한 성장과 멋진 성공을 꿈꾸는 스타트업들의 대표 경연 축제인 디캠프 디데이 2월 행사에서 AI 기반 간접광고 솔루션을 서비스 하는 '인쇼츠'가 우승을 차지했다. 은행권청년창업재단 디캠프(대표 김영덕)는 서울 마포 프론트원에서 '글로벌 진출과 투자'를 주제로 디데이를 지난 달 29일 개최했다. 이 행사에는 총 202개 스타트업이 지원해 총 8개사가 25대 1의 경쟁률을 뚫고 본선에 올랐다. 그 가운데 AI 기반 간접광고 솔루션을 서비스하는 인쇼츠(대표 이건창)가 우승을 차지했다. 인쇼츠는 촬영이 완료된 영상 콘텐츠에 브랜드 제품을 삽입하는 인비디오 간접광고 플랫폼이다. 촬영장에 제품을 배치하는 간접광고는 방영까지 짧게는 5개월, 영화의 경우 2년의 시간이 소요되는데 인쇼츠는 AI 기술을 활용해 기 촬영된 영상에 제품을 배치해 방영 시기와 광고 일정의 시차를 해결해 준다. 올해 1월 tvN 드라마 '마에스트라'에 삼성전자 제품으로 적용사례를 만든 인쇼츠는 K-콘텐츠의 세계화 흐름에 맞춰 글로벌 진출을 계획하고 있다. 지로(공동대표 이재석·황길환)는 한국형 영상 스톡 서비스 '드롭샷'을 개발한다. 방송국이나 제작사 등에서 콘텐츠를 제작할 때, 촬영한 영상의 약 10%의 영상만 사용하고 나머지는 버려진다. 드롭샷은 이 버려지는 영상을 스톡으로 판매한다. 기존 스톡 서비스와 비교해 퀄리티가 높고, 한국·아시아 관련 콘텐츠를 타깃으로 했다는 점이 특장점이다. 그 외에도 AI 기반의 검색 기능을 제공해 사용자가 원하는 영상을 쉽게 검색할 수 있도록 했다. 지로는 지난 CES 2024에서 드롭샷 베타 버전을 공개했으며, 현재 글로벌 서비스 출시를 준비하고 있다. 싱가포르에 본사를 둔 타미AI(대표 이강욱)는 AI 기반의 미디어 요약 및 탐색 서비스를 제공한다. 유튜브에 업로드된 영상 링크만 입력하면 수초 안에 영상 내용을 텍스트로 정리해 주고, 내용과 연관된 영상 지점을 표시해 주는 타임스탬프 기능도 제공한다. 이 때문에 타미AI는 작년 5월 서비스 개시 이후 누적 160만 방문자 및 25만 유저를 유치했다. 이 대표는 추후 ▲콘텐츠 맞춤 추천 ▲기업 및 창작자를 위한 콘텐츠 기반 챗봇 ▲긴 길이의 영상을 자동으로 숏폼, 하이라이트 등 다양한 포맷으로 편집해 주는 기능 등을 제공할 계획이라고 밝혔다. 토브앤바나(대표 박영재)는 화장품 샘플 커머스 플랫폼 '샘플로드'를 운영한다. 작은 용량 화장품을 판매해 소비자의 화장품 구매 실패 문제를 해결하고, 화장품 브랜드의 재고 폐기 손실을 수익으로 전환하는 서비스를 제공한다. 텍스트 데이터를 분석하는 텍스트마이닝(Text mining) AI 기술을 기반으로 고객 맞춤 제품을 큐레이션을 해주고, 관련된 특허를 4개 보유하고 있다. 현재 2만여 명의 회원을 가지고 있으며 2023년 4월에는 홍콩사이언스파크로부터 유망 스타트업에 선정된 바 있다. 누아(대표 서덕진)는 항공권 유통, 판매 과정을 자동화하는 '누아 애그리게이터'와 여행사 대상 올인원 SaaS '누아 오피스'를 운영한다. 누아 애그리게이터는 차세대 항공권 유통 규격인 NDC(New Distribution Capability)와 함께 GDS, LCC를 통합한 항공권 부킹 엔진을 여행사를 대상으로 제공한다. '누아오피스'는 여행사의 예약, 노선관리, 판매, CS 등을 통합 지원하는 구독형 백오피스로 관리 비용을 기존 대비 80%까지 경감할 수 있다는 게 업체의 설명이다. 머니스테이션(대표 이정일)은 국내 소셜 투자 콘텐츠 플랫폼 머니스테이션과 금융 빅데이터를 세밀하게 분석 투자하는 툴 시그널 엔진을 운영하고 있다. 회사명과 동일한 소셜 네트워킹 서비스(SNS)인 '머니스테이션'은 이용자들의 집단지성으로 만들어지는 커뮤니티로, 투자 콘텐츠가 여러 곳에서 소비되도록 돕는 역할을 한다. 월평균 생성 콘텐츠 수는 3천400개로, 최근 3년 새 연평균성장률은 135%에 이른다. 디비디랩(대표 강지수)는 100개가 넘는 국가의 잠재고객을 대상으로 사용성 테스트, 그룹 인터뷰, 5s 테스트, 퍼스트 클릭 등 다양한 리서치를 설계하고, 그 결과를 분석할 수 있는 글로벌 리서치 오퍼레이션 서비스를 제공한다. 동시에 패널 모집 플랫폼 '우쥬테스트'를 함께 운영하고 있어 원하는 조건의 응답자를 찾아 빠르게 의견을 수집할 수 있다. 강지수 대표는 디비디랩의 리서치 오퍼레이션 서비스 사용으로 리서치 시간과 비용을 80% 이상 줄일 수 있다고 설명했다. 스페이스티(대표 류한주)는 베트남 시장을 타깃으로 한 올인원 인테리어 플랫폼을 운영한다. 사용자 제작 콘텐츠를 기반으로 월 활성 이용자 20만 명 이상을 확보한 인테리어 커뮤니티와 호찌민 등 대도시를 중심으로 한 시공 중개 서비스를 제공하며, 지난 1월 가구, 소품 등을 판매하는 인테리어 상거래 서비스를 가오픈했다. AI를 활용한 관심사 기반의 콘텐츠∙제품 추천 서비스, 3D/AR 기술을 활용한 적용 예상 이미지를 통해 첨단 쇼핑 경험을 제공할 계획이다. 이날 한국성장금융, 한국벤처투자, 우리자산운용이 공동 주관사로 참여했으며, 이경훈 글로벌브레인 한국대표, 김종현 한국투자파트너스 싱가포르 법인장, 김광록 프라이머사제 대표, 피에르 주 코렐리아캐피탈 한국대표, 김정우 레드베지퍼시픽 대표, 데이브 응 알타라벤처스 대표, 이창윤 디캠프 직접투자팀장이 심사위원으로 함께 했다.

2024.03.03 10:39백봉삼

AI가 영상 만드는 시대 왔다…"컴퓨팅 파워·수익 모델 마련해야"

오픈AI가 영상을 생성하는 인공지능(AI) 모델 '소라'를 공개한 가운데, AI 영상 생성 서비스 상용화에 대한 여러 전망이 나왔다. 국내 업계 관계자들은 영상을 생성할 때 드는 컴퓨팅 인프라 수급 문제부터 해결해야 한다고 주장했다. 모델 수익화 방안도 마련해야 하고, 데이터 학습 방식도 주요 고려사항으로 보고 있다. 오픈AI는 지난 15일 문자를 입력하면 고화질 영상을 생성하는 모델 소라를 홈페이지를 통해 공개했다. 현재 내부 개발팀을 비롯한 소수 영상 편집가, 아티스트, 기업인들에게 공급된 상태다. 사용자 피드백을 통해 기술을 검증한 후 서비스를 출시할 방침이다. 출시 일정은 미정이다. "컴퓨팅 인프라 수요 감당해야…모델 수익화 방안도" 국내 전문가들은 영상모델을 통한 비즈니스가 활성화하려면 아직 멀었다고 입을 모았다. 우선 서비스 구동에 필요한 컴퓨팅 인프라 수급부터 해결해야 한다고 강조했다. AI 영상 생성 서비스의 상용화가 본격화하면 이를 구동하는 그래픽처리장치(GPU) 등 컴퓨팅 인프라 수요가 더 높아질 것으로 보인다는 이유에서다. 업계 관계자는 "언어모델보다 이미지·영상모델 구동에 더 많은 컴퓨팅 파워가 든다"고 했다. 단순 GPU 확보를 넘어 영상 생성 서비스를 비용 효율적으로 운영하기 위한 기술 개발도 본격화할 전망이다. 네이버 관계자는 "AI 모델 압축과 경량화를 돕는 AI 칩 필요성이 더욱 커질 것"이라며 "네이버가 삼성전자와 손잡고 AI 반도체 솔루션을 공동 개발하고 있는 이유"라고 본지에 전했다. 영상모델을 통한 수익화 마련도 구체적이지 않다. 한 업계 관계자는 "오픈AI가 챗GPT를 운영하는 데 드는 컴퓨팅 인프라 비용만 하루 70만 달러(약 9억3천만원)"라며 "이보다 더 무거운 영상모델을 서비스하려면 몇 배 더 높은 운영 비용을 감당해야 할 것"이라고 설명했다. 단순히 API나 구독형으로 기업들에 제공하다간 적자가 불가피할 것이란 분석이다. 현재 AI 기업들은 범용 LLM 개발·운영에 드는 비용을 줄이기 위해 소형언어모델(SLM)을 개발하는 추세다. 범용 LLM에 자사 데이터를 넣어 파인튜닝 하는 방식도 진행하고 있다. 전문가들은 영상 생성 모델에도 동일한 방식을 적용했다간 낭패라는 입장이다. 한국어 LLM을 보유한 한 기업 관계자는 "LLM과 달리 영상모델은 기술적으로 경량화하기 힘들다"며 "모델 경량화는 퀄리티 낮은 영상을 생성할 수 있다"고 지적했다. 영상모델, 언어모델보다 3배 많은 데이터 필요 영상모델의 훈련 데이터양도 중요하다는 지적도 있다. AI 모델이 영화, 광고 등 산업에서 활용 가능할 정도로 수준 높은 이미지를 생성하기 위해선 이미지 데이터를 대량으로 학습해야 해서다. 3D 설계용 AI 모델을 개발 중인 다쏘시스템의 수칫 제인 솔리드웍스·3D익스피리언스 웍스 전략 및 비즈니스 개발 부사장은 "일반적으로 언어모델을 학습시키는 것보다 영상모델 학습시키는 데 3배 더 많은 데이터양과 시간이 걸린다"고 기자에 전한 바 있다. 이미지 데이터에 스며든 사실 왜곡, 혐오 콘텐츠, 편향 등도 제거 해야 한다. 생성 결과물이 비윤리적이거나 편향된 경우 논란을 피할 수 없기 때문이다. 이에 오픈AI는 이미지 데이터 문제 해소를 위한 안전 조치를 취할 예정이라고 홈페이지를 통해 밝힌 바 있다. 영상에 등장할 수 있는 왜곡, 혐오 등의 기술적인 제거를 목표로 뒀다. 오픈AI는 "현재 사내 레드팀이 소라에 적대적 모델 테스트를 진행 중"이라며 "소라로 만든 영상을 분류할 수 있는 소프트웨어 도구도 개발하고 있다"고 설명했다.

2024.02.20 17:31김미정

인쇼츠 'AI 슈퍼스케일러', 국내외 애니 제작사 본격 도입

AI 스타트업 '인쇼츠'(대표 이건창)가 국내외 애니메이션 제작사들과 손잡고 영상 프로덕션 수준의 인공지능 솔루션을 공급한다고 6일 밝혔다. 최근 인쇼츠는 자사의 AI 비디오 화질 업스케일 기술인 'AI 슈퍼스케일러' 솔루션을 사단법인 부산애니메이션협회에 공급하는 업무협약을 체결했다. 앞서 인쇼츠는 지난해 12월 사단법인 한국애니메이션제작자협회와도 동일한 업무 협약을 맺은 바 있다. 일련의 업무협약을 통해 두 협회 소속 120여 개의 국내 애니메이션 회원사들은 작품의 콘셉트가 담긴 파일럿 영상의 AI 업스케일링을 무료로 제공받고, TV 시리즈와 극장 영화 콘텐츠에 대해 업스케일 기술을 효과적으로 활용할 수 있게 됐다. 인쇼츠가 공급하는 솔루션은 콘텐츠 영상에 특화돼 제작 현장의 높은 기준을 만족시킬 수 있는 생성형 AI다. 특히 2023년 6월 세계 최고 컴퓨터비전 학회인 CVPR에서 공식 발표된 세계 최고성능(SOTA, State-Of-The-Art) 모델을 기반으로 지속적인 성능개선을 이뤄내고 있다. 'AI 슈퍼스케일러'는 콘텐츠와 광고 분야에서 4K 비디오에 특화된 데이터와 학습 방법론을 적용해 프리미엄 영상의 원본 품질을 향상시키는 AI 리패키징(재상품화) 솔루션으로 시중에 출시된 업스케일 모델과 차별화된 결과물을 보여줄 수 있다. 인쇼츠는 국내뿐 아니라 미국, 중국 등 해외 애니메이션 제작사들과도 업무협약을 체결하고 솔루션 공급망을 넓히고 있다. 해외 협력사로는 미국의 아파트먼트 디 필름, 중국의 리시 엔터테인먼트 등이 있다. 이건창 인쇼츠 대표는 "국내외 애니메이션 제작사들이 보다 향상된 품질로 콘텐츠 자산을 리패키징(재상품화)하기 위해 자사가 개발한 원터치 컴퓨터 비전 솔루션을 활용하게 될 것으로 기대한다"면서 "비디오 콘텐츠에 특화된 AI 스타트업으로서 앞으로 애니메이션과 광고, 드라마 등 다양한 장르의 콘텐츠 제작사가 당사의 솔루션을 활용할 수 있도록 서비스 영역을 확대할 계획"이라고 밝혔다.

2024.02.06 11:19백봉삼

알리바바 "사진 올리면 춤추는 영상으로 바꿔줘요"

중국 알리바바가 인공지능(AI)을 이용해 인물의 정지 사진을 춤추는 영상으로 바꿔주는 서비스를 시작했다. 4일 중국 언론 진룽졔에 따르면 알리바바클라우드의 초거대 AI '퉁이쳰원' 앱에 무료 신기능인 '퉁이우왕'이 개시됐다. 사용자가 안내에 따라 사진을 업로드하면 10분 안에 신체적 특징을 반영한 댄스 동영상이 생성된다. 이 동영상은 원본 이미지의 얼굴 표정, 신체 비율, 의상, 배경과 기타 특징이 다 유지된다. 현재 퉁이쳰원은 몽골 댄스 등 최근 중국에서 유행하는 12개의 인기 댄스 템플릿을 사용자에게 제공한다. 이 기능의 알고리즘으로는 알리바바 퉁이실험실에서 자체 개발한 영상 생성 모델 '애니메이트 애니원(Animate Anyone)이 사용됐다. 이 모델은 지난해 11월 말 트위터, 유튜브 등 해외 소셜미디어 플랫폼에서 인기를 끌며 관련 영상 조회수 1억 회를 돌파하기도 했다. 이날 알리바바가 발표한 기술은 앞서 지난 달 중국 바이트댄스와 싱가포르국립대학이 공동으로 개발한 '매직애니메이트(MagicAnimate)'와 유사한 기술이다. 한 장의 사진만 있으면 일련의 내장된 셋트 동작과 결합해 댄스 영상을 생성할 수 있다. 사진만 있으면 AI를 이용해 외모와 표정 및 분위기, 배경이 유지된 댄스 영상을 만들 수 있다는 점이 같다.

2024.01.05 08:09유효정

  Prev 1 2 3 Next  

지금 뜨는 기사

이시각 헤드라인

"요금 올리거나, 무료 풀거나"…OTT, 전략 분화

"책 대신 '아이패드'로 수업을"…디지털이 바꾼 교실 풍경은

과학자들, 납으로 금 만들었다…'연금술사의 꿈' 실현되나

[ZD브리핑] 아시아 IT 박람회 컴퓨텍스 개최...21대 대선 후보 첫 토론회

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현