• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
인공지능
배터리
양자컴퓨팅
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'영상 인공지능'통합검색 결과 입니다. (31건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

AI 어디까지 가나..."사진이나 영상 흐려도 말끔하게 복원"

인공지능(AI)이 한없이 진화하고 있다. 이번엔 활영 사진이나 영상 등이 흐릿해도 말끔하게 복원하는 기술이 개발돼 관심을 끈다. KAIST는 바이오및뇌공학과 장무석 교수와 김재철AI대학원 예종철 교수 연구팀이 움직이는 산란 매질(신호복제 환경) 너머의 숨겨진 영상을 복원할 수 있는 '비디오 디퓨전 기반 영상 복원 기술을 세계 처음 개발했다고 31일 밝혔다. 이 기술은 시간상으로 변한 영상 이미지 환경을 통해 흐릿하거나 손상된 부분을 디퓨전 모델 같은 생성형 AI모델로 되살린다. 안개·연기·불투명 유리·피부 조직 등과 같은 산란매질 때문에 '무엇인가에 가려 흐릿하게 보이는' 이미지를 마치 가려진 유리 뒤를 들여다보듯 복원한다. 연구팀은 기존 인공지능 복원 기술이 훈련된 데이터 범위에서만 성능을 발휘하는 한계를 극복하기 위해, 광학 모델과 비디오 디퓨전 모델을 결합했다. 특히 시간에 따라 산란 환경이 변하는 경우(바람에 흔들리는 커튼 너머 풍경 등)에도 안정적으로 복원할 수 있도록 연속된 영상의 시간적 상관관계를 학습한 디퓨전 모델을 적용했다. 이로인해 다양한 거리·두께·잡음 조건에서도 기존 대비 월등히 뛰어난 복원이 가능하다는 것. 기존 최고 성능의 복원 모델을 뛰어넘는 결과를 얻었다. 권성태 연구원은 "별도의 추가 학습 없이도 안개 제거, 영상 화질 개선(고해상도 프레임 생성), 블라인드 디블러링(흐린 영상 선명화) 등 다양한 상황에서 영상을 복원할 수 있는 최적화 기법을 도입해, 범용 복원 프레임워크로 확장할 가능성을 입증했다"고 설명했다. 장무석 교수 및 예종철 교수는 "혈액이나 피부 속을 들여다보는 비침습적 의료 진단, 화재 현장 연기 속 인명 구조, 벽에서 반사된 빛으로 영상을 복원하는 비시선 영상, 안개 낀 도로에서의 안전 운전 보조, 불투명 유리나 플라스틱 내부의 산업 검사, 흐린 물속 시야 확보 등 일상과 산업 전반에 활용될 수 있을 것"으로 기대했다. 연구는 KAIST 바이오및뇌공학과 권태성·송국호 박사과정이 공동 제1 저자로 참여했다. 인공지능 국제 학술지 IEEE TPAMI에 지난 13일 게재됐다. 과학기술정보통신부 및 한국연구재단 우수신진 연구자 사업, 뇌선도연구센터사업, 삼성미래기술육성사업, AI 스타펠로우십으로부터 연구 지원을 받았다.

2025.08.31 12:00박희범

"독자 개발만으론 한계"…메타, 미드저니와 AI 동맹

페이스북 모회사 메타가 인공지능(AI) 이미지·영상 생성 스타트업 '미드저니' 기술 라이선스를 획득할 예정이다. AI 영역에서 독자 개발 중심 전략에서 벗어나 외부 파트너와 협력하는 방향으로 전환하며 경쟁력 강화에 나선다. 22일(현지시간) 파이낸셜타임즈 등 외신에 따르면 메타 신임 최고 AI 책임자인 알렉산드르 왕은 엑스(X)에 “향후 모델과 제품에 미드저니 미적 기술을 라이선스해 수십억명에게 아름다움을 제공할 것”이라고 양사 연구팀 간 기술적 협업을 예고했다. 이어 “자사가 사람들에게 최고의 제품을 제공하려면 모든 방식을 동원하는 접근이 필요하다”며 “이는 세계적인 수준 인재, 야심찬 컴퓨터 로드맵, 업계 최고 기업들과의 협력을 의미한다”고 덧붙였다. 미드저니는 2021년 데이비드 홀츠가 설립한 이미지 생성 기업으로 지난 6월에는 기존 이미지를 기반으로 짧은 영상을 생성할 수 있는 비디오 모델 'V1'을 선보였다. 이번 제휴를 통해 메타는 자사 앱에 멀티미디어 AI 생성 기능을 개발·통합할 수 있게 될 전망이다. 마크 저커버그 메타 최고경영자(CEO)는 플랫폼에서 AI 생성 콘텐츠가 점점 더 중요한 위치를 차지할 것이라고 언급한 바 있다. 메타의 이번 행보는 저커버그 CEO가 인간 지능을 뛰어넘는 '초지능' 개발에 수십억달러를 투입하는 과정에서 나온 것이다. 그는 최근 몇 달 간 경쟁사로부터 최고 수준의 AI 연구자를 적극적으로 영입했고 AI 인프라 투자도 대폭 늘렸다. 또한 AI 음성 기술 기업 플레이 AI를 인수하고 데이터 라벨링 기업 스케일 AI에도 지분을 투자했다. 아울러, 메타는 이번 주 자사 AI 조직을 재편한다고 발표했다. 메타의 AI 부서는 최근 메타 초지능 랩으로 이름이 변경됐으며 이번 개편으로 4개의 별도 팀으로 나뉘었다. 이는 지난 6개월 동안 네 번째 조직 개편에 해당한다. 메타와 미드저니의 협력은 메타의 기존 자체 AI 모델과 제품이 경쟁사에 밀리기 시작하면서 나온 것이다. 또 모든 것을 내부에서만 구축하려는 메타의 방식을 버리고 외부와 손잡는 전환점이다. 지난해 메타는 텍스트 프롬프트로 이미지를 생성하는 도구 '이매진'을 출시했다. 같은 해 10월에는 텍스트 프롬프트를 기반으로 영상을 생성, 편집할 수 있는 영화 생성 모델 '무비 젠'에 대한 연구 논문을 발표하며 이를 올해 인스타그램에 완전히 통합하겠다고 발표했다. 그러나 통합은 아직 이뤄지지 않았으며 이를 두고 업계 관계자들은 이미 해당 모델이 구글의 비오 3(Veo 3)나 오픈AI의 소라와 같은 최신 공개 모델과 비교해 구식으로 보인다고 평가하기도 했다. 이외에도 메타는 핵심 대형 언어 모델 비헤모스를 대외 공개하려던 계획도 접고 새로운 모델 구축에 집중하고 있는 것으로 알려졌다. 내부적으로는 코딩과 같은 업무에서 서드파티 모델을 사용하기 시작했다.

2025.08.24 09:25박서린

홈쇼핑모아 "홈쇼핑 하이라이트 영상 기능, 구매전환율 최대 3배 증가”

버즈니(대표 남상협·김성국)는 '홈쇼핑모아'에서 홈쇼핑 상품의 주요 장면만 볼 수 있는 하이라이트 영상 기능이 상품의 구매전환율을 최대 3배 증가시킨다고 12일 밝혔다. 홈쇼핑모아는 올해 초 자사 숏폼AI 기술을 활용해 홈쇼핑모아 앱에서 홈쇼핑 방송의 주요 장면만 볼 수 있는 하이라이트 영상 기능을 추가했다. 해당 기능은 AI를 활용해 1시간가량의 홈쇼핑 방송 중 상품의 특장점 장면만 골라 볼 수 있다. 현재 홈쇼핑모아 앱에서 하이라이트 영상 기능이 제공되고 있는 제휴사는 신세계라이브쇼핑을 포함해 총 5곳이다. 홈쇼핑모아는 최근 한 달간 이용자의 하이라이트 영상 기능 이용 효과를 분석한 결과 하이라이트 영상 기능을 클릭한 이용자의 구매전환율은 일반 이용자의 평균 구매전환율 대비 1.96배 높은 것으로 조사됐다. 방송 타입별로 보면 홈쇼핑 생방송 상품에서 하이라이트 영상을 클릭한 이용자는 일반 이용자 대비 1.73배 구매전환율이 증가했고, 지난 방송 상품에서는 1.9배 증가한 것으로 분석됐다. 또 방송을 앞둔 상품에서는 구매전환율이 2.98배 증가해 홈쇼핑 방송 예정 상품 영역에서 하이라이트 영상의 구매전환율 상승 효과가 가장 뛰어난 것으로 조사됐다. 홈쇼핑모아 서비스 플랫폼 김한나 과장은 "이번 분석 결과 영상 하이라이팅 기술이 모바일 홈쇼핑 이용자의 편의를 증대하고 구매에 큰 영향을 끼치고 있는걸 알 수 있었다"며 "앞으로 홈쇼핑모아 이용자가 하이라이트 영상 기능을 더 많이 이용할 수 있도록 각 홈쇼핑사와 적극 협력해 적용 제휴사를 확대해 나갈 계획"이라고 말했다. 버즈니는 지난해 자연처리 분야 글로벌 최고 AI 학회 'EMNLP 2024에서 영상 검색 기술 관련 논문이 채택되는 등 영상 하이라이팅 관련 기술력을 인정받고 있다. 또 관련 기술을 서비스화한 '에이플러스 숏폼AI'의 경우 현재 신세계라이브쇼핑 등 국내 주요 커머스사에 제공되고 있다.

2025.08.12 16:19백봉삼

조성익 텔레픽스 대표 "위성제작· AI 영상 분석으로 세계시장 도전"

우주 인공지능(AI) 종합 솔루션 스타트업 텔레픽스(TelePIX, 대표 조성익)가 폭발적인 성장세로 주목받고 있다. 지난 2019년 설립이후 위성 프로젝트만 11건에 누적 수주액이 405억 원에 이른다. 성장세 기저에는 10년 이상 위성 개발에 참여해온 전문 연구진과 최근 주목받는 AI 연구진이 포진해 있다. 6명의 직원으로 시작한 인력이 5년새 13배, 80여 명으로 늘었다. 최근 서울 텔레픽스 본사에서 조성익 대표를 만났다. 조 대표는 편한 청바지에 후드티 복장으로 나타났다. 작업하다 나왔다고 했다. '일밖에 모르는' 장인정신 같은 고집스러움과 '단단한' 자신감이 느껴졌다. 오는 2040년 3천 547조 원에 이를 것으로 예측되는 '우주경제'에 당당하게 도전장을 내민 대한민국 대표 스타트업이기에 더 그랬다. 텔레픽스는 뉴스페이스 시대를 선도하는 대표 기업으로 성장하는 것이 목표다. 인공위성 눈에 해당하는 광학 탑재체 및 AI기반 위성 데이터 분석 솔루션이 비즈니스 기반이다. 최근엔 국방, 농업, 자원, 해양 등 다방면에서 '우주 경제(Space Economy)'라는 새로운 가치를 창출하고 있다. 조 대표가 위성 정보에 관심을 갖게 된 계기는 지난 2013년으로 거슬러 올라간다. 프랑스 에어버스 파견 때 위성분석 창업 "꿈" "2013년께 KIOST(한국해양과학기술원)에서 근무하며 프랑스 에어버스로 파견 근무를 2년정도 나간 적이 있습니다. 당시 미국과 유럽 중심으로 위성관련 민간 업체들이 생기기 시작했어요. 몇 년 뒤엔 한국에도 이런 업체가 생길 것 같았습니다. 기회가 올 것으로 판단했지요." 조 대표는 "본래 대학원을 마치고, 개인적으로 위성 만들고 데이터 분석하는 일을 하고 싶었다. 하지만, 그 시절에는 공공기관 외에는 그런 일을 하기 어려웠다"고 당시를 회상했다. 프랑스로 파견간 것이 결국 그에겐 천재일우의 기회가 됐다. "천리안 위성을 개발해야 하는데, 당시 우리나라 기술력으로는 어려웠습니다. 국제협력이 불가피했습니다. 프랑스 에어버스와 한국항공우주연구원이 중심이 돼 위성을 개발하고, 우리는 천리안 위성에 들어가는 해양 탑재체를 개발했어요. 해양 관측 카메라입니다. 이 부분은 당시 해상수산부가 예산을 지원했습니다." 텔레픽스가 주력하는 분야는 크게 2개다. 위성 영상 분석과 위성 개발이다. 비즈니스 관점에서 봤을 때 고객이 원하는 데이터를 얻기 위해 위성을 쏘아 올려 촬영을 해야 한다. 또 이 촬영 데이터를 분석하는 것이 기본이다. 텔레픽스는 위성 하드웨어 개발부터 부품까지 직접 제작한다. 직접 만들면 단가를 낮출 수 있다. 또 다른 이유는 위성 관련 부품 대부분이 전략 품목으로 분류돼 부품 수입이 어렵기 때문이다. "최근 국방분야에서도 중국산 논란이 있었는데, 텔레픽스는 카메라 경우 이미지 센서를 제외한 광기계부와 텔레스코프부, 전자부 등을 모두 직접 설계합니다. 중국산이 싼 부품도 있으나 위성은 전략 물자로 분류돼 있습니다. 중국산 부품이 들어가면 위성 카메라 자체도 수출이 안 되고 거기서 나온 데이터도 사실은 수출하기 힘든 면이 있습니다. 특히, 미국 비즈니스가 어렵습니다." 텔레픽스가 데이터를 생산하는 탑재체 카메라 중심으로 직접 설계 및 제작하고, 위성 탑재체 카메라에서 촬영한 데이터를 분석 및 가공하는 역량을 자체적으로 갖춘 배경 가운데 하나다. 심우주 탐사용 자율항행 내비게이션 시스템으로 승부 텔레픽스 주력 제품은 테트라플렉스다. 국내 최초로 엔비디아 GPU을 탑재했다. 이는 우주탐사선 두뇌에 해당하는 제품이다. 텔레픽스는 또 눈에 해당하는 솔루션을 개발 중이다. 이 두 제품을 합쳐 놓은 것이 심우주 탐사용 자율 항행 내비게이션 시스템이다. 조 대표는 "엔비디아가 산업용으로 만든 걸, 우주 환경에서 운영될 수 있도록 위성용 AI 엣지컴퓨터로 개발해 우주용으로 활용 중"이라며 "지난 2024년 8월 16일 발사해서 대략 10개월 정도 성공적으로 운용 중"이라고 언급했다. 텔레픽스는 지난 달에도 테트라플렉스와 심우주항법용 차세대 AI 별추적기를 스페이스X 팰콘9으로 우주궤도에 올려 보내 성공적으로 운용하고 있다. "사실 1970년대엔 달탐사선 등을 사람이 조종했어요. 무게와 에너지 소모량 등에 비춰봤을 때 사람이 더 경제적이었으니까요. 우주 탐사선 가운데 하나는 얼마 전까지 88세 할머니가 혼자 몇십 년 동안 운영했어요. 어쩌다 한 대니까 가능한 일이지요." 지금은 턱도 없다. 1970년대 발사된 보이저호만 해도 딥스페이스 네트워크라고 해서, 미항공우주국(NASA) 운영팀들이 조정 중이다. 특히, 스페이스 엑스 계획에 따라 화성으로 이주 탐사선을 많이 보내게 될 경우만 해도 사람이 발사와 운항 등을 모두 제어한다는 것은 불가능하다. "딥스페이스 네트워크 자체도 포화 상태에 이르렀기 때문에 앞으로 우주탐사를 제대로 하려면 테슬라의 자율주행차처럼 우주 탐사선도 자율주행을 해야 할 것입니다. 이를 위해선 반드시 영상을 확보해야 하고, 영상을 자율 처리할 수 있는 텔레픽스의 테트라플렉스가 바로 그런 한계에 도전 중인 제품이라 할 수 있습니다." 조 대표는 심우주항법용 차세대 AI 별추적기에 대해서도 설명했다. 이 추적기는 심우주 환경에서 정확한 위치 추정 및 궤도 결정을 위해 설계된 고정밀 영상항법 시스템이다. 광시야 카메라와 고성능 영상처리 알고리즘을 결합해 별과 행성 위치를 실시간 추적하고 이를 기반으로 위성 위치와 속도를 정확하게 파악한다. 지상국과 통신없이 자체적으로 우주를 항행할 수 있어 향후 지상 기반 시설이 포화상태에 이를 경우와 심우주 탐사에 유용하게 사용될 수 있을 것으로 조 대표는 기대했다. 텔레픽스는 현재 위성용 온보드 AI 프로세서인 '테트라플렉스'와 별추적기를 결합해 우주 공간에서 실시간 AI 영상처리가 가능한 '심우주탐사용 자율항법 AI솔루션'으로 고도화를 진행중이다. LLM·위성영상 결합해 서비스 진행 텔레픽스는 지난 지난 1월 큐브 위성 '블루본(BlueBON)'도 우주궤도에 진입시켜 정상 운용 중이다. 무게가 15kg 정도인 6U(가로, 세로, 높이가 각각 10cm 짜리 6개) 큐브 위성이다. '블루본'은 워낙 넓어 드론이나 비행으로 관찰이 어려운 해조류 양식장 같은 해역의 이산화탄소 흡수량 등을 계산하는데 유용하게 활용할 수 있다. 카본 크래딧(탄소거래)을 위해 마이크로소프트나 아마존 같은 글로벌 대기업들이 요즘 구매하는 해조류 양식장 이산화탄소 분석용으로 안성맞춤인 셈이다. "위성이 작다보니, 내재된 카메라도 작습니다. 초점 맞추는 것이 어렵지요. 특히, 우주 공간은 진공이어서 온도 예측 및 조절이 어렵습니다. 구조체 수축과 팽창 때문에 초점이 틀어집니다. 텔레픽스는 이러한 악조건에서도 선명한 영상을 얻을 수 있는 방법을 솔루션에서 찾았습니다.사실 큐브위성엔 초점 조절 메카니즘을 넣을 공간이나 전력 확보가 어렵습니다. 난이도가 좀 있습니다." 비즈니스 차별화 전략에 대해서도 들어봤다. 최근 우주 스타트업에 관심을 갖는 기업들이 증가하고 있다. 조 대표는 "고객이 원하는 성능까지 끌어 올리기 위해 인공지능(AI) 기반 하드웨어로 제작한다. 위성 영상 분석도 AI 모델을 만들어 활용한다"며 "여기서 한 발 더 나아가 '샛챗(SatCHAT)'이라는 챗gpt 같은 LLM(대형 언어 모델)과 위성 영상을 결합해 서비스 하고 있다"고 말했다. 초등학생도 자기가 원하는 위성 영상을 바로 찾아 분석하고 결과를 얻을 수 있는 범용성이 강화된 솔루션을 서비스 중이다. "텔레픽스는 위성 안에서 AI 프로세싱이 가능한 하드웨어를 국내 최초로 만들었습니다. 실제 지난해 위성에 탑재해 성능 검증도 마쳤습니다." 텔레픽스는 현재 미국과 유럽으로 민간 우주 기업과의 협력을 통해 수출을 진행 중이다. 동남아와 POC(개념증명) 계약을 마무리했다. 중동과는 수출 협의를 진행 중이다. 텔레픽스는 5년 내 마이크로 위성(100~200kg급)으로 세계 시장 점유율 1위를 달성하는 것이 목표다. "아프리카나 중남미, 동남아 등을 자주 다니는데, 특히 중국과 경쟁하려면 성능 차별화도 차별화지만, 가격 경쟁력 확보가 매우 중요합니다. 또 중국 부품을 쓰지 않으면서 어떻게 가격 경쟁력을 확보할 것인가 그런 부분도 많이 고민합니다." ◆ 코스닥 상장 언제하나 텔레픽스는 내년 상반기 코스닥 상장을 목표로 세웠다. 현재 순조롭게 진행 중이다. 주관사는 지난해 11월 미래에셋증권을 선정했다. 지난 주엔 일본 투자회사 엘리펀트 디자인 홀딩스로부터 전략적 투자도 받았다. 서울 본사는 영등포구 농협재단빌딩 18층이다. 이 곳에서는 주로 위성 관련 소프트웨어를 개발한다. 2022년 지은 대전 공장에서는 위성 하드웨어 제조 및 테스트, 설계가 이루어지고 있다. 규모는 200평 정도다. 자체 위성제작 클린룸 시설을 갖췄다. 연간 무게 200kg급 위성 20대 정도 제작 가능하다. 이 위성에 탑재되는 카메라 해상도는 0.5m급이다. 현재 슈에뜨(Chouette)라는 0.5m급 탑재체를 제작 중이다. 2026년 하반기 코스닥 상장…2027년 '슈에뜨' 카메라 발사 슈에뜨는 프랑스 말로 '올빼미'와 '멋지다(cool)'의 두 가지 의미를 담은 조합어다. 광학 미러를 비축 3반사 구조로 설계해 광시야로 촬영이 가능한 초소형 위성용 고해상도 광학 탑재 체다. 인공위성 관측 폭은 일반적으로 10km 내외로, 폭이 20km인 서울을 촬영하기 위해서는 서 울 상공 두번을 지나야 하지만 슈에뜨는 한 번에 촬영 가능하다. 슈에뜨 관측폭은 24km나 되기 때문이다. 슈에뜨는 지난해 10월 이탈리아 밀라노에서 열린 국제우주대회에서 관심을 끌기도 했다. 발사시기 목표는 오는 2027년 하반기다. 텔레픽스는 한국항공우주연구원과 KAIST 인공위성연구센터 등과 공동 연구도 하고, 기술 등도 이전 받는 등 탄탄한 협력 관계를 구축했다.

2025.07.27 10:54박희범

트웰브랩스, 아마존 베드록에 '영상 AI' 공급…韓 AI, 글로벌 주류 '진입'

세계 주요 클라우드 플랫폼이 생성형 인공지능(AI) 확장에 나서는 가운데 트웰브랩스가 회사의 영상 AI 모델을 아마존에 공급하며 글로벌 시장 공략을 본격화했다. 트웰브랩스는 회사의 초거대 영상 AI 모델 '마렝고'와 '페가수스'를 아마존웹서비스(AWS)의 완전관리형 서비스 '아마존 베드록'을 통해 제공한다고 16일 밝혔다. 국내에서 개발된 파운데이션 모델이 글로벌 AI 플랫폼에 공식 편입된 건 이번이 처음이다. 아마존 베드록은 개발자가 단일 응용 프로그램 인터페이스(API)로 여러 AI 모델을 호출할 수 있는 플랫폼으로, 메타, 엔트로픽, 딥시크, 미스트랄AI 등 주요 AI 기업의 모델을 포함하고 있다. 트웰브랩스는 베드록 내에서 영상 이해 AI를 제공하는 유일한 서드파티 기업으로, 아마존 자체 모델인 '노바'를 제외하면 독점적 위치에 있다. 이번 공급을 통해 전 세계 AWS 고객들은 별도의 인프라 구축 없이 영상 내 객체, 행동, 배경음 등 다양한 요소를 자연어로 탐색할 수 있는 트웰브랩스의 모델을 활용할 수 있다. 영상 분석, 하이라이트 제작, 콘텐츠 태깅 등의 작업이 자동화돼 영상 기반 산업의 업무 생산성을 높일 수 있는 기반이 마련됐다. 트웰브랩스는 모델이 영상 분석 시간 단축 외에도 기업 내부의 아카이브 자산을 구조화하거나 마케팅과 서비스에 쓰이는 짧은 형식의 2차 콘텐츠를 제작하는데 쓰일 수 있다고 밝혔다. 활용 가능한 산업은 미디어, 스포츠, 엔터테인먼트 전반으로 확장된다. 실제로 북미 최대 스포츠 엔터테인먼트 기업인 메이플리프스포츠앤엔터테인먼트(MSLE)는 트웰브랩스 모델을 도입해 콘텐츠 제작 시간을 16시간에서 9분으로 줄였다. 트웰브랩스는 이를 통해 '데이터로서의 영상' 활용이 본격화될 것이라고 전망했다. 업계에서는 트웰브랩스의 아마존 베드록 진입을 '소버린 AI'의 실질적 구현 사례로 평가한다. 기존의 소버린 AI 개념이 국산 기술의 국내 활용에 머물렀다면 트웰브랩스는 글로벌 공급망 안에서 국산 AI가 주도권을 확보할 수 있음을 입증한 셈이다. 이재성 트웰브랩스 대표는 "이번 아마존 내 모델 공급 개시로 영상 데이터의 새로운 가치를 창출해 고객사의 비즈니스 성장에 기여할 것"이라며 "AWS와 지속 협력해 전 세계 기업들이 국산 영상 AI를 사용하는 진정한 소버린 AI를 실현하겠다"고 밝혔다.

2025.07.16 16:09조이환

"AI가 사진을 영상으로"…구글, '비오 3' 기능 제미나이에 통합

구글이 영상 인공지능(AI) '비오 3'의 주요기능을 '제미나이' 언어모델에 통합했다. 사진 한 장으로 동영상을 만들 수 있는 AI 기능이 사용자 경험의 핵심 축으로 자리잡게 됐다. 11일 테크크런치에 따르면 구글은 지난주부터 '비오 3' 기반 '이미지-투-비디오' 기능을 전 세계 150여 개국에 확대 적용했다. 해당 기능은 '제미나이 앱'과 '플로우 툴'을 통해 제공되며 'AI 울트라'와 'AI 프로' 유료 요금제 사용자에게만 지원된다. 무료 사용자 확대 여부는 공개되지 않았다. 사용자는 '제미나이' 앱에서 프롬프트 창 하단 '비디오' 항목을 선택한 뒤 이미지를 업로드하면 된다. 여기에 영상 분위기나 배경음에 대한 설명을 함께 입력하면 이를 바탕으로 시청각 요소가 결합된 짧은 클립이 생성된다. 생성된 영상은 즉시 다운로드하거나 타인과 공유할 수 있다. 구글은 '비오 3' 모델의 상용화 이후 7주 만에 전체 플랫폼에서 4천만 건 이상의 AI 영상이 제작됐다고 밝혔다. 모든 영상에는 '비오' 로고가 삽입된 시각적 워터마크와 함께 '신스ID' 기반의 비가시 디지털 워터마크가 포함된다. '신스ID'는 생성형 인공지능 콘텐츠 식별을 위해 구글이 개발한 기술로, 외형 변경이나 영상 편집이 이뤄져도 식별이 가능하다. 구글은 올해 초부터 '신스ID' 탐지 기능도 별도 도구로 제공하며 생성물의 투명성 확보에 주력해왔다. 이번 기능은 지난 5월 구글 I/O에서 먼저 공개된 AI 기반 영상 툴 플로우에서 선제 적용된 바 있다. 이후 같은 기능을 '비오 3' 기반 제미나이 앱에도 옮긴 것이다. 테크크런치는 "영상 생성은 요금제에 따라 하루 최대 3건까지 가능하며 미사용 횟수는 이월되지 않는다"며 "생성된 콘텐츠는 공유 또는 저장은 가능하지만 편집 기능은 제공되지 않는다"고 밝혔다.

2025.07.11 09:22조이환

구글, 생성형 AI 영상툴 '비오 3' 세계 출시…오디오까지 붙는 영상 제작

구글이 생성형 인공지능(AI) 영상 모델 '비오 3(Veo3)'를 전세계에 출시하면서 영상 제작의 진입장벽을 대폭 낮추는 기술 확장을 본격화했다. 4일 테크크런치에 따르면 구글은 '비오 3'를 이달부터 159개국 이상에서 제미나이 사용자에게 순차적으로 적용 중이다. 이 모델은 최대 8초 길이의 동영상을 생성할 수 있으며 텍스트 입력만으로 영상과 소리를 동시에 만들어준다. '비오 3'는 지난 5월 공개 당시에도 영상 품질과 프레임 전환 자연도에서 높은 평가를 받았지만 이번 세계 출시를 통해 음성까지 생성하는 '네이티브 오디오' 기능이 정식 반영됐다. 동영상 한 편 안에 장면, 움직임, 사운드를 모두 구현하는 생성형 AI는 시장 내에서도 제한된 기술로 꼽힌다. 사용자는 단순한 글을 입력하거나 캐릭터, 사물, 상황 등을 설명하는 방식만으로 애니메이션, 밈, 스토리보드 등을 즉시 생성할 수 있다. 콘텐츠 제작 초기 단계인 콘셉트 시안, 브레인스토밍, 프로토타입 영상 제작에도 유용하다. 생성 과정은 전부 '제미나이' 플랫폼 안에서 이뤄진다. 요금제에 따라 기능과 품질도 차등화된다. 'AI 프로'는 신속한 속도와 기본 품질에 중점을 두며 'AI 울트라'는 고화질 영상과 더 정교한 오디오까지 포함하는 최상위 옵션이다. 두 요금제 모두 인터넷 연결과 일정 기준의 사용자 조건을 충족해야 이용 가능하다. 또 구글은 '비오 3'에 이미지 기반 입력 기능도 곧 도입할 예정이다. 텍스트뿐 아니라 이미지를 활용해 영상으로 전환하는 기능은 현재 개발 중이며 향후 제미나이 업데이트를 통해 반영될 계획이다. 영상 제작을 위한 입력 방식 다변화를 통해 더 직관적인 창작 흐름을 노리는 것으로 풀이된다. 현재 '제미나이'에는 '비오 3 패스트'라는 경량 모델도 함께 제공되고 있다. 이는 상대적으로 짧은 시간 안에 빠르게 결과물을 확인할 수 있도록 최적화된 버전으로, 복잡한 품질 조정이나 고해상도 출력은 '울트라' 요금제 전용 기능으로 분리돼 있다. 조쉬 우드워드 구글 제미나이 담당은 "현재 이미지 기반 비디오 생성 기능도 '제미나이'에 추가하는 작업을 진행 중"이라고 밝혔다.

2025.07.04 09:23조이환

"오픈AI·구글 못지 않다"…'영상 분석 강자' 트웰브랩스, LG CNS와 新 사업 발굴 본격화

트웰브랩스가 LG CNS와 영상 분석 기술 고도화와 신규 사업 발굴을 위해 함께 나선다. 트웰브랩스는 LG CNS와 영상 AI 기술 협력을 위한 업무협약(MOU)을 체결했다고 1일 밝혔다. 이번 협약으로 양사는 미디어·방송, 공공·안전, 법률·수사기관 등 다양한 산업 분야에서 혁신적인 영상 AI 솔루션 공급을 가속화할 계획이다. 트웰브랩스는 멀티모달 신경망 기술을 바탕으로 글로벌 영상 시장 내 오픈AI, 구글과 어깨를 나란히 하고 있다는 평가를 받고 있다. 지난 4월 한국 AI 모델 최초이자 영상 모델 최초로 아마존 베드록(Amazon Bedrock)에 자사 멀티모달 AI 모델 '마렝고(Marengo)'와 '페가수스(Pegasus)'를 공급하는 성과를 이뤘다. LG CNS는 금융 분야에서 생성형 AI를 기반으로 한 기업 고객의 비즈니스 혁신을 선도하고 있다. 특히 ▲NH농협은행 ▲신한은행 ▲신한카드 ▲미래에셋생명 ▲미래에셋증권 ▲우리은행 등 주요 금융 기업의 AX 사업을 맡으며 금융 AX 시장에서도 두각을 나타내고 있다. 최근에는 공공 분야에서도 외교부, 경기도교육청, 경찰청 등의 대규모 AX 사업을 연이어 수주해 기술력을 인정 받고 있으며 제조, 물류 등 다양한 분야로 사업을 확장해 나가고 있다. 양사의 협력은 기술 및 사업적 협업 두 축으로 진행된다. 연구 협력을 통해 트웰브랩스의 영상이해 모델(Video Foundation Model, VFM)을 고도화하고 이를 바탕으로 고객 서비스 기획 및 구축으로 다양한 고객 대상 협업을 통해 사업 기회를 창출할 계획이다. 미디어·방송 분야에선 ▲뉴스, 스포츠, 드라마 콘텐츠 자동 요약 및 하이라이트 추출 ▲대규모 아카이브 영상 내 특정 키워드 및 상황 검색 ▲콘텐츠 시청 시 소비 중인 장면과 유사한 광고를 노출하는 맥락 광고 서비스 등을 제공한다. 공공·안전 및 법률·수사기관 분야에서는 ▲CCTV 특정 이벤트 자동 감지 ▲바디캠·블랙박스 영상 자동 요약 ▲사건 관련 장면 검색 등의 솔루션을 구현해 전방위 혁신을 가속화한다. 이재성 트웰브랩스 대표는 "LG CNS와의 협력을 통해 우리의 영상이해 기술이 더 많은 산업 현장에서 실질적인 가치를 창출할 수 있게 됐다"며 "양사의 시너지를 바탕으로 영상 데이터의 가치를 극대화하고 영상 분야에서 대한민국이 글로벌 AI 3대 강국으로 도약할 수 있는 토대를 마련하겠다"고 말했다.

2025.07.01 15:59장유미

캐럿, LG유플러스에 기업용 AI 영상 제작 서비스 '캐럿 Biz' 공급

인공지능(AI) 영상 생성 플랫폼 '캐럿' 운영사 패러닷(대표 장진욱)이 LG유플러스에 기업용 AI 영상 제작 솔루션 '캐럿 Biz'를 공급한다고 21일 밝혔다. 캐럿 Biz는 기업을 대상으로 세계적인 이미지·영상 생성 모델을 실행 횟수 제한 없이 제공한다. 구글 이마젠3, 런웨이, 플럭스 등 각종 AI모델을 개별 구독하는 경우와 비교해 최소 약 75% 저렴한 가격에 이용할 수 있다. 인물이 등장하는 영상에 더빙 음성 및 입 움직임을 더하는 '영상 립싱크', 특정 인물 및 사물을 학습해 콘텐츠에 반영시켜주는 '이미지 학습' 등 제작자 친화적인 기능까지 탑재했다. 앞으로 LG 유플러스는 캐럿을 활용해 직접 광고 및 마케팅 영상을 제작할 계획이다. 인공지능 중심 사업 전환(AX)을 위한 전략 일환이다. 운영사 패러닷은 LG유플러스 실무자들이 AI 창작을 신속히 익힐 수 있도록 라이언오슬링, 연신내호랭이, 김땡땡 등 유수 AI 크리에이터를 배치해 멘토링 서비스를 지원한다. 장진욱 패러닷 대표는 “어느 분야에서든 AI는 실무자 업무 역량을 10배 이상 성장시킬 수 있는 '생산성 혁신'을 일으킬 가능성이 충분하다”며 “캐럿은 앞으로 콘텐츠 및 엔터테인먼트 업계에서 유용하게 활용할 수 있는 기능을 다수 탑재한 AI 에이전트를 개발하고 제공할 계획”이라고 말했다.

2025.04.21 09:04백봉삼

구글, 제미나이에 영상 AI 모델 '비오2' 탑재…"현실 이해하는 AI 구현"

구글이 영상 인공지능(AI) 모델 '비오2'를 AI 서비스 '제미나이'에 탑재해 동영상 AI 시장 경쟁력을 높였다. 16일 더버지 등 외신에 따르면 구글은 비오2를 유료 AI 서비스인 '제미나이 어드밴스드' 이용자에게 제공하기 시작했다. 비오는 텍스트를 영상 콘텐츠로 변형할 수 있는 생성형 AI 모델이다. 2023년 5월 처음 소개됐다. 비오2는 같은 해 말 공개된 후 소수 이용자에 한해 시범 운영됐다. 이번 제미나이 통합으로 활용 범위가 넓어졌다. 제미나이 어드밴스드 사용자는 16대9 화면 비율, 720픽셀(p) 해상도, 최대 8초 분량의 짧은 영상 클립을 생성할 수 있다. 완성된 영상은 MP4 형식으로 내려받을 수 있다. 콘텐츠가 AI로 제작된 것임을 알리기 위해 자체 인증 마크 '신스 ID' 워터마크를 영상에 삽입한다. 구글은 "비오2가 실제 촬영한 듯한 정밀한 디테일을 구현할 수 있다"며 "현실적 물리 법칙과 인체 움직임을 이해해 다양한 주제에 맞는 고품질 영상을 만들어낼 수 있다"고 강조했다. 앞서 데미스 허사비스 구글 딥마인드 최고경영자(CEO)도 비오와 제미나이 결합을 통해 AI의 물리 세계 이해력을 강화할 계획이라고 밝힌 바 있다. 앞서 오픈AI는 지난해 12월 최대 1분 분량 영상을 생성하는 '소라'를 공개했다. 메타는 같은 해 텍스트 기반 영상 생성 모델 '무비젠'을 출시했다. AI 스타트업 런웨이는 4세대 동영상 생성 모델을 출시하며 3억 달러(약 4천264억원)넘는 투자 유치를 기록하는 등 기술력과 시장 가능성을 동시에 인정받고 있다. 더버지는 "구글은 오픈AI와 메타, 런웨이 등과 동영상 생성 AI 분야 경쟁에 본격적으로 뛰어들었다"고 평가했다.

2025.04.16 17:43김미정

"AI, 화재·폭력·쓰러짐까지 사전 감지"…日 산업계 사로잡은 韓 기술, 비결은?

슈퍼브에이아이가 영상관제 솔루션을 앞세워 일본 시장 공략에 속도를 낸다. 디지털 트윈과 비전 AI의 결합을 통해 산업 현장 안전관리 수요를 선점하는 행보다. 슈퍼브에이아이는 일본 도쿄에서 열리는 '넥스테크위크 인공지능 엑스포'와 '재팬 IT 위크'에 참가한다고 9일 밝혔다. 넥스테크위크는 인공지능(AI)과 블록체인 등 첨단기술 중심의 행사로 작년 3만명이 관람했고 재팬 IT 위크는 약 9만명이 찾은 일본 최대 규모의 종합 IT 박람회다. 두 전시는 각각 오는 15일, 23일부터 도쿄 빅사이트에서 열린다. 슈퍼브에이아이는 이번 전시에서 비전 AI 기반 '슈퍼브 영상관제' 솔루션을 중점적으로 선보인다. 맞춤형 AI 제안과 산업별 컨설팅도 병행해 사업 확장을 꾀한다. 직관적인 대시보드에서 실시간으로 수십 개 영상 데이터를 분석할 수 있는 구조다. 이 솔루션은 화재 연기 감지, 차량 및 얼굴 인식, 쓰러짐과 이상 행동 탐지까지 다양한 상황을 자동 판별한다. 영상 데이터를 AI 학습용으로 자동 합성해 데이터 부족 문제도 해결하며 2주 만에 현장 시스템에 도입할 수 있다. 일상어로 영상 장면을 검색할 수 있는 기능도 차별점이다. 사용자가 "빨간 모자 쓴 사람 찾아줘"라고 입력하면 비전-언어 모델(VLM)이 해당 인물의 영상과 시간을 자동으로 찾아준다. 기존 검색 방식과 달리 콘텐츠 자체를 인식하고 추출하는 구조다. 고가의 3D 라이다 없이도 2D 카메라만으로 디지털 트윈 맵을 구성할 수 있는 기술력도 갖췄다. 그래픽 처리 장치(GPU) 1대로 20대의 CCTV를 초당 3회 이상 분석해 빠른 속도와 효율성도 확보했다. 슈퍼브에이아이는 한국, 미국, 일본 법인을 기반으로 글로벌 영향력을 확대하고 있으며 특히 일본 시장에서 성과를 보이고 있다. 지난해 토요타와 재계약을 체결했고 일본제철과의 파트너십도 강화했다. 최근에는 일본 국립 의료기관과 대형 전자제품 제조사 등으로 고객층을 넓혔다. 이 회사는 AI 컨설팅부터 데이터 설계, 알고리즘 개발, 운영까지 전 과정 일괄 제공하는 '슈퍼브 서비스'와 AI 개발 전주기를 포괄하는 '슈퍼브 플랫폼'을 함께 운영하고 있다. 김현수 슈퍼브에이아이 대표는 "일본 시장에서의 지속적인 성장을 바탕으로 더 많은 일본 기업들과의 협력 기회를 모색할 계획"이라며 "특히 안전관제 분야에서 일본 기업들의 수요가 높아지는 만큼 이 분야에 특화된 솔루션을 중점적으로 소개할 예정"이라고 밝혔다.

2025.04.09 15:20조이환

트웰브랩스, 아마존 '베드록' 입성…韓 최초로 영상 AI 모델 공급

트웰브랩스가 아마존의 대표 인공지능(AI) 플랫폼에 입성한다. 세계 주요 파운데이션 모델 기업들과 어깨를 나란히 하며 글로벌 영상 AI 시장 주도권 확보에 나서는 모양새다. 트웰브랩스는 아마존웹서비스(AWS)의 완전 관리형 AI 서비스 '아마존 베드록'에 자사 멀티모달 AI 모델인 '마렝고'와 '페가수스'를 제공하기로 했다고 7일 밝혔다. 국내 기반 영상 AI 모델이 '베드록'에 들어가는 것은 이번이 처음이다. 아마존 '베드록'은 메타, 앤트로픽, 미스트랄AI, 스태빌리티AI 등 세계 유수의 AI기업 모델을 단일 애플리케이션 프로그램 인터페이스(API)로 제공하는 플랫폼이다. 아마존 내부 모델인 '노바'를 제외하면 트웰브랩스는 베드록 내 유일한 영상이해 AI 제공사로 자리하게 됐다. 트웰브랩스의 영상 모델들은 객체, 행동, 배경음 등 영상 내 요소를 자연어로 검색하고 해석할 수 있다. 이를 통해 영상 콘텐츠의 검색, 분류, 요약, 인사이트 추출 등 전 과정을 자동화할 수 있는 것이 특징이다. 이에 고객은 '베드록'에서 인프라 관리 없이 트웰브랩스 모델을 활용해 생성형 AI 기반 영상 서비스를 구축할 수 있게 된다. 모델이 작은 영상 클립부터 대규모 콘텐츠 라이브러리까지 일관된 분석 성능을 제공하고 기업 수준의 보안 및 데이터 통제 기능도 갖췄기 때문이다. 업계 일각에서는 이번 협력이 스포츠, 미디어, 엔터테인먼트, 광고 등 영상 중심 산업 전반에 파급력을 미칠 것으로 전망한다. 방송사와 스튜디오는 촬영분 아카이빙을 자동화할 수 있고 스포츠 팀은 하이라이트를 자동 생성해 팬 맞춤형 콘텐츠를 제작할 수 있게 된다. 트웰브랩스는 AWS와의 전략적 협업 계약(SCA)을 바탕으로 아마존 '세이지메이커 하이퍼팟'도 활용 중이다. 이를 통해 모델 학습 속도는 최대 10% 빨라졌고 비용은 15% 이상 절감한 것으로 알려졌다. 글로벌 진출도 본격화하고 있다. 회사는 AWS 액티베이트 프로그램의 지원을 통해 해외 확장을 준비 중이며 AWS 마켓플레이스를 통해 전 세계 고객에게 자사 서비스를 제공할 계획이다. 사미라 파나 바크티아르 AWS 미디어·엔터테인먼트 총괄은 "트웰브랩스 모델 도입으로 영상 데이터의 활용이 쉬워졌다"며 "기업들이 인프라 없이도 AI 기술을 확장 가능하게 됐다"고 밝혔다. 이재성 트웰브랩스 대표는 "세계 영상 데이터의 80%가 사실상 미활용 상태"라며 "이번 베드록 공급은 우리 기술력이 세계 최고 수준임을 입증한 결과"라고 말했다.

2025.04.07 15:30조이환

캐럿, 구글 최신 영상 생성 AI '비오2' 탑재

인공지능(AI) 영상 생성 플랫폼 '캐럿' 운영사 패러닷(대표 장진욱)이 구글 딥마인드가 개발한 차세대 고성능 영상 생성 AI 모델 '비오2'를 탑재했다고 31일 밝혔다. 비오2는 기존 모델 대비 물리 법칙과 인간 움직임에 대한 이해도가 높다. 따라서 다양한 구도를 활용해 영상을 제작할 수 있으며, 결과물 품질 또한 더욱 자연스럽고 사실적이다. 아울러 우수한 프롬프트 이행 능력으로 사용자 의도를 영상에 정확히 반영하며, 다양한 렌즈 효과, 영화적 기법 등을 학습해 제작자 창의성을 더욱 폭넓게 구현할 수 있다. 캐럿은 구글 승인을 받아 비오2의 정식 서비스 제공을 시작했다. 현재 비오2는 비공대 베타 테스트 단계로, 일부 기업에게만 제공하고 있다. 캐럿은 현재 720p 화질로 5초 영상 생성을 지원하지만, 향후 4K 화질, 최대 2분까지 수준을 높일 계획이다. 또한 비오2 탑재를 기념해 사용자를 대상으로 해당 기능을 7일까지 30% 할인가에 제공한다. 장진욱 패러닷 대표는 "캐럿이 국내 대표 AI 영상 플랫폼으로서 비오 2를 고객에게 선보일 수 있어 기쁘다"며 "앞으로도 사용자들이 글로벌 AI 콘텐츠 트렌드를 손쉽게 따라갈 수 있도록 최신 모델을 발빠르게 탑재하겠다"고 말했다. 캐럿은 이미지 및 영상 콘텐츠 제작을 특화시켰다. 현재 이마젠3, 플럭스 등 이미지 생성 모델 7개, 비오 2, 클링 등 영상 생성 모델 9개를 지원한다. 각 모델을 개별 구독할 필요 없이 캐럿에서 제공하는 멤버십에 가입하거나 포인트를 충전, 사용하는 일 만으로 합리적인 가격에 고품질 콘텐츠를 제작할 수 있다.

2025.03.31 08:44백봉삼

"中에 220배 뒤처져"...자율주행차 발목잡는 규제

“지난해까지 중국 바이두가 쌓은 자율주행 운행 기록이 1억1천만km였다. 국내 1위 업체로 평가받는 오토노머스에이투지가 50만km로 약 220배 차이가 난다. 방대한 데이터 차이를 극복하려면 양질의 데이터를 수집할 수 있게 해야 한다.” 이상동 한국자율주행산업협회 팀장은 지난 27일 열린 '자율주행 산업 지원 국회 토론회'에서 이같이 말했다. 최근 중국 스타트업이 내놓은 AI 모델 '딥시크'가 저성능 칩으로 충격적인 성능을 보여주자 BYD와 지리 등 현지 자동차 기업들이 잇따라 자율주행 기술에 딥시크를 활용하겠다고 나섰다. 일찍이 자율주행 기술을 내세워온 테슬라도 지난해 말 완전자율주행(FSD) 소프트웨어 최신 버전을 업데이트하고, 오는 6월 이를 기반으로 한 로보택시 서비스를 예고하는 등 기술 고도화에 집중하는 추세다. 해외 기업들이 실제 주행 데이터를 수집하고, 이를 토대로 기술을 고도화하는 반면 우리나라는 데이터 수집 제한 규제로 양적 격차가 크게 벌어지고 있다는 지적이다. 이상동 팀장은 “AI 기업과 자율주행 기업, 완성차 기업들이 경계선 없이 넘나들면서 협업을 하며 AI 학습을 위한 데이터 수집과 활용이 중요하게 됐다”며 “국내에 자율주행차가 돌아다니려면 국내 환경에 맞는 최적화 데이터가 꼭 필요하다”고 강조했다. 특히 국가 차원에서 양질의 주행 데이터를 수집하는 것이 바람직하다고 봤다. 영세한 스타트업도 산업에 진입할 수 있게 하자는 취지다. 지난 2023년 개인정보보호법 개정에 따라 '이동형 영상정보처리기기'라는 개념으로 주행 영상을 데이터로 활용할 수 있는 법적 근거가 마련됐다. 그러나 데이터의 질적 측면에서 미국, 중국 등 자율주행 기술에 공들이는 국가 대비 여건이 불리하다는 지적이다. 이 팀장은 “테슬라로 예를 들면, 500만대 차량이 도로를 주행하며 사고가 발생하면 당시 영상을 그대로 본사에 전송함에 따라 그 데이터를 자율주행 AI 성능 개선에 활용하고 있다”며 “이런 회사와 규제 샌드박스 차량 몇십 대의 주행 데이터를 토대로 기술을 개발하는 (우리나라) 회사 간 경쟁력이 어디에 있겠나”라고 강조했다. 특히 현 제도 하에서 주행 영상 데이터를 활용할 때 개인정보 비식별화 처리 과정을 거치게 하는 점을 문제 삼았다. 비식별 처리된 영상을 학습한 AI보다 원본 영상을 학습한 AI가 객체 인식이나 주행 판단의 정확도가 17% 이상 높아졌다는 연구 결과를 소개했다. 이 팀장은 “특히 야간 주행, 악천우 등 복잡한 도심 환경에서 원본 주행 영상의 활용 가치가 더욱 올라간다”고 덧붙였다. 우리나라에선 설정된 규칙에 따라 자율주행 AI 모델이 주어진 상황을 인지하고 제어하는 반면, 테슬라 등 선도 기업들은 AI가 사람처럼 새로운 상황에서도 적절한 판단을 할 수 있도록 엔드투엔드(E2E) 방식을 쓰고 있는 점에도 주목했다. E2E 방식 자율주행 AI 성능을 개선하기 위해 더욱 양질의 주행 데이터가 요구되고 있다는 분석이다. 이 팀장은 “결국 모든 사례를 사전에 정의할 수 없기 때문에, 정의된 내용을 벗어나는 사례에서 자율주행 AI가 어떻게 대응할지 모른다는 기술적 어려움이 있다”고 첨언했다. 규제 샌드박스를 통해 원본 주행 데이터 활용이 일부 허용되고 있지만, 대규모 개발 프로젝트에는 한계가 있어 많은 기업들이 비식별 처리된 영상 데이터를 사용할 수밖에 없는 상황이다. 이 팀장은 “규제 샌드박스는 일시적인 예외를 두는 제도인데 자율주행 산업은 계속 고도화해나갈 산업”이라며 “원본 주행 데이터 활용에 대한 지속적인 법적 근거가 마련돼야 한다”고 주장했다.

2025.02.28 18:37김윤희

알리바바, 오픈소스 '완2.1' 출시…글로벌 AI 영상 시장 '공략'

알리바바 클라우드가 인공지능(AI) 영상 생성 모델을 오픈소스로 공개해 기술 개방성을 강화한다. 브랜드 이미지를 제고하는 동시에 자사 클라우드 플랫폼의 글로벌 활용을 확대하려는 조치다. 알리바바 클라우드는 비디오 파운데이션 모델 '통이 완샹(Tongyi Wanxiang)'의 최신 버전인 '완2.1(Wan2.1)'의 140억 및 13억 패러미터 모델 4종을 출시했다고 27일 밝혔다. 해당 모델은 AI 모델 커뮤니티인 '모델스코프(ModelScope)'와 프랑스의 오픈소스 AI 플랫폼 '허깅페이스(Hugging Face)'에서 다운로드할 수 있다. 이번에 공개된 모델은 ▲T2V-14B ▲T2V-1.3B ▲I2V-14B-720P ▲I2V-14B-480P 등 4종으로 텍스트와 이미지 입력을 기반으로 고품질의 영상과 이미지를 생성하도록 설계됐다. 특히 'T2V-14B' 모델은 복잡한 동작이 포함된 고품질 영상 생성에 특화돼 있으며 'T2V-1.3B' 모델은 연산 효율성과 생성 품질의 균형을 맞춰 연구 및 개발을 위한 최적의 솔루션을 제공한다. 'Wan2.1' 시리즈는 텍스트 효과를 지원하는 최초의 AI 영상 생성 모델로, 픽셀 품질을 향상시키고 물리적 원칙을 준수하며 명령 수행 정확도를 최적화하는 데 강점을 지닌다. 이러한 성능을 바탕으로 영상 생성 AI 모델의 종합 벤치마크인 'V벤치' 리더보드에서 종합 점수 86.22%를 기록하며 1위를 차지했다. 또 허깅페이스의 'V벤치' 리더보드 상위 5개 모델 중 유일한 오픈소스 모델로 자리매김했다. 'T2V-1.3B' 모델은 일반적인 개인용 노트북에서도 480p 해상도의 5초 길이 영상을 약 4분 만에 생성할 수 있다. 이를 통해 연구자 및 개발자들이 보다 쉽고 효율적으로 AI 영상 생성 모델을 활용할 수 있는 환경이 조성될 것으로 기대된다. 또 'I2V-14B-720P' 및 'I2V-14B-480P' 모델은 이미지 기반 영상 생성 기능까지 지원한다. 사용자는 한 장의 이미지와 간단한 텍스트 설명만 입력하면 역동적인 영상 콘텐츠를 제작할 수 있으며 특정 크기 제한 없이 다양한 해상도의 이미지를 정상적으로 처리할 수 있다. 알리바바 클라우드는 AI 모델을 오픈소스로 공개한 최초의 글로벌 테크 기업 중 하나다. 지난해 8월에는 자체 개발한 대규모 AI 모델 '큐원(Qwen-7B)'을 첫 공개했으며 이후 허깅페이스의 오픈 LLM 리더보드에서 지속적으로 상위권을 유지하고 있다. 현재까지 큐원을 기반으로 개발된 파생 모델이 10만 개를 넘어서며, 세계 최대 규모의 AI 모델군 중 하나로 자리 잡았다. 알리바바 클라우드 관계자는 "영상 생성 AI 모델을 훈련에는 막대한 컴퓨팅 자원과 대량의 고품질 학습 데이터가 요구된다"며 "이번 모델의 오픈소스 개방은 AI 활용의 장벽을 낮추어 보다 효율적이고 경제적으로 고품질 영상 콘텐츠를 제작을 가능하게 할 것으로 기대된다"고 밝혔다.

2025.02.27 17:03조이환

"AI 영상 생성, 1시간에 250만원"…구글, '비오 2' 초고품질 전략 성공할까

인공지능(AI) 기반 비디오 생성 시장의 경쟁이 본격화되는 가운데 구글이 자사 영상 AI인 '비오 2'의 가격을 공개했다. 4K 초고품질 영상을 지원하나, 오픈AI의 '소라'보다 가격이 높아 비용 대비 경쟁력이 있을지에 대한 의문이 제기되고 있다. 두 모델 모두 환각 및 물리 법칙 구현 등 기술적 한계를 드러내고 있다는 점도 해결 과제다. 24일 테크크런치에 따르면 구글은 AI 비디오 생성 모델 '비오 2'의 가격을 초당 50센트(한화 약 700원)로 책정했다. 이는 시간당 1천800달러(한화 약 250만원), 분당 30달러(한화 약 4만2천원)에 해당하는 수준으로, 구글은 '비오 2'를 통해 고품질 영상 시장을 공략하며 영상 생성의 상업적 활용도를 높이려는 전략을 펼치고 있다. '비오 2'는 최대 4K 해상도를 지원하는 고급형 비디오 생성 모델이다. 구글 클라우드의 '버텍스 AI(Vertex AI)' 플랫폼을 통해 제공되며 고해상도와 정밀한 디테일을 구현하는 데 초점을 맞췄다. 다만 비용이 초당 50센트로 책정되면서 일반 사용자보다는 전문가 및 기업 시장을 겨냥한 서비스로 보인다. 특히 오픈AI의 비디오 생성 AI인 '소라'와의 가격 정책 차이가 주목된다. 오픈AI는 크레딧 기반의 구독 모델을 통해 '소라'를 운영하고 있으며 1천80p 기준 초당 20센트(한화 약 280원)로 '비오 2'보다 상대적으로 저렴한 가격을 제시하고 있다. 오픈AI의 비디오 AI 가격 구조는 이용자의 구독 플랜에 따라 달라지며 저해상도에서는 보다 낮은 비용으로 비디오를 생성할 수 있다. 현재 '소라'는 월 20달러(한화 약 2만8천원)의 챗GPT '플러스'와 월 200달러(한화 약 28만원)의 '프로' 플랜을 통해 제공되며 각각 1천 크레딧과 1만 크레딧을 지급하는 방식이다. 480p 해상도의 경우 초당 4크레딧으로 약 8센트(한화 약 110원), 1천80p 해상도에서는 초당 100크레딧으로 약 20센트(한화 약 280원)이 소모된다. '소라'는 현재 4K 해상도를 지원하지 않지만 비용 효율성 면에서는 '비오 2'보다 경쟁력이 높은 것으로 보인다. 다만 실제 영상 제작 현장에서는 두 모델 모두 완벽하지 않다는 지적이 나온다. 최근 업계 평가에 따르면 '비오 2'는 손가락, 눈동자, 피부 질감 등 세부 표현에서 비현실적인 결과가 발생하며 물리 법칙에 부합하지 않는 액체 유동성 표현 등의 문제가 드러난다. 또 '소라'는 인체 움직임에서 부자연스러운 관절 회전과 신체 비율 왜곡 현상이 잦으며 보행 시 다리 움직임이 로봇처럼 경직되는 문제를 보인다. 이 외에도 장면 전환 시 객체의 색상 및 크기 변화가 불안정해 시간적 일관성을 유지하는 데 어려움을 겪고 있다. 이 같은 기술적 한계는 두 모델이 아직 실제 영상 수준에 미치지 못하는 부분을 여실히 보여준다. 전문가들은 물리 엔진 통합 등 추가 개발이 필요하다고 지적하며 특히 의류 주름 시뮬레이션과 액체-고체 상호작용 구현이 시급한 과제라고 평가한다. 향후 개선된 기술이 도입될 경우 보다 현실적인 AI 영상 제작이 가능할 것으로 기대된다. 디나 베라다 유튜브 제품 담당 이사는 "'비오 2'는 현실 세계의 물리 법칙과 인간의 움직임을 더 잘 이해해 세밀하고 현실적인 결과물을 만든다"며 "스타일, 렌즈, 시네마틱 효과까지 지정할 수 있어 쉽고 재미있게 영상을 표현한다"고 강조했다.

2025.02.24 10:55조이환

"영상 AI의 챗GPT 순간 열까"…트웰브랩스, '페가수스-1.2' 공개

트웰브랩스가 차세대 영상언어 생성 모델을 공개해 산업 현장에서의 인공지능(AI) 활용성을 극대화한다. 트웰브랩스는 자사가 최근 개발한 '페가수스-1.2'가 다양한 길이의 영상을 분석할 수 있다고 12일 밝혔다. 이 모델은 성능이 대폭 향상돼 텍스트 요약·질의응답·하이라이트 생성 등 고도화된 영상 처리가 가능하다. 트웰브랩스는 이번 모델에 고급 비전 인코딩 전략과 토큰 감소 기술을 적용해 모델의 효율성과 이해도를 높였다. 이를 통해 기존 초거대 모델 대비 가벼운 크기로도 높은 성능을 구현했다. 특히 'GPT-4o'·'제미니 1.5 프로' 등 경쟁 모델보다 응답 속도가 빠르고 비용 효율성이 뛰어난 점이 강점으로 꼽힌다. '페가수스-1.2'는 트웰브랩스의 자체 멀티모달 임베딩 모델인 '마렝고'와 결합돼 보다 정교한 영상 이해 능력을 갖췄다. 이를 통해 엔터테인먼트·교육·보안 등 다양한 산업에서 활용될 전망이다. 일례로 방송·미디어 업계에서는 영상 콘텐츠 자동 분류, 하이라이트 추출, 교육 분야에서는 강의 요약 및 핵심 내용 정리에 활용될 것으로 기대되며 보안 산업에서는 CCTV 영상 분석과 이상 징후 탐지 등에 적용될 것으로 보인다. 트웰브랩스는 지난 2021년 설립 이후 멀티모달 신경망 기술을 기반으로 빠르게 성장했다. 글로벌 리서치 기업 CB 인사이트가 선정한 'AI 100'에 3년 연속 이름을 올렸으며 '세계 50대 생성형 AI 스타트업'에도 포함됐다. 지난해 12월에는 이승준 CTO가 포브스 '30세 미만 30인' AI 리더로 선정되며 기술력을 인정받았다. 이승준 트웰브랩스 최고기술책임자(CTO)는 "영상 속 객체의 공간적 관계와 시간적 변화를 정확히 분석하는 AI 모델이 필요하다"며 "'페가수스-1.2'는 혁신적인 시공간 정보 이해 방식을 도입해 다양한 산업 요구를 충족할 것"이라고 말했다.

2025.02.12 15:12조이환

"삼성 TV는 AI 더한 세계 베스트셀러"

삼성전자가 미국 라스베이거스에서 열리는 세계 최대 전자 전시회 'CES 2025' 개막에 앞서 공개한 TV를 '인공지능(AI)이 더해진 세계 베스트셀러'라고 미국 블룸버그통신이 평가했다. 블룸버그는 6일(현지시간) 삼성전자는 '비전 AI'라는 브랜드로 TV에 새로운 인공지능 기능을 추가해 인공지능 시장을 공략하고 있다며 이같이 보도했다. 삼성전자는 사용자의 취향·의도를 파악해 개인에게 맞춘 서비스를 제공하는 TV를 전날 선보였다. ▲영상을 보면서도 한 번 클릭하면 사용자가 원하는 정보를 알 수 있는 '클릭 투 서치' ▲외국어 영상의 자막을 실시간으로 우리말로 바꿔주는 '실시간 번역' ▲사용자 취향과 선호도를 반영해 이미지를 만드는 '생성형 배경화면' 등 기능을 공개했다. 삼성전자는 20년 동안 세계에서 가장 많이 TV를 판 업체라며 다양한 회사와 협업해 비전 AI 제품을 늘릴 것이라고 블룸버그는 분석했다. 삼성전자는 마이크로소프트와 구글 등 기업들과 손잡고 AI 서비스를 제공하기로 했다.

2025.01.06 17:20유혜진

엔비디아, 35만원짜리 AI앱용 칩 출시

인공지능(AI) 반도체 기업 엔비디아가 AI 응용프로그램에 쓰는 소형 컴퓨팅 기판 '젯슨(Jetson)' 신제품을 출시한다고 미국 일간지 월스트리트저널(WSJ)이 17일(현지시간) 보도했다. 신제품 이름은 '오린 나노 슈퍼(Orin Nano Super)'다. 가격은 이전 제품(499달러)의 절반인 249달러(약 35만원)다. 엔비디아는 젠슨 황 창업자가 이를 소개하는 영상을 공개했다. 그는 갓 구운 빵처럼 쟁반에 담긴 신제품을 오븐에서 꺼내 손바닥 크기라고 선보였다. 엔비디아는 첨단 칩을 탑재하지 않았지만 이전 제품보다 속도가 2배 빠르고 연산 작업을 70% 더 많이 처리할 수 있다고 밝혔다. 이처럼 비교적 사양이 낮은 제품이라 중국에서도 팔 것이라고 엔비디아는 설명했다. 미국은 엔비디아가 첨단 칩을 중국에서 팔지 못하게 했다. 중국이 첨단 칩을 군사용으로 쓸 수 있다고 봐서다.

2024.12.18 16:23유혜진

오픈AI '소라' 게임 콘텐츠 무단 활용 의혹…"법적 리스크 커"

오픈AI가 최근 출시한 비디오 생성 인공지능(AI) '소라'에 게임 콘텐츠를 훈련 데이터로 사용했다는 주장이 제기되면서 법적 문제가 우려되고 있다. 12일 테크크런치에 따르면 '소라'는 텍스트 프롬프트나 이미지를 기반으로 최대 20초 길이의 비디오를 생성할 수 있는 기능을 갖추고 있다. 이미 오픈AI는 '소라'를 시연할 때 훈련에 유명 비디오게임 마인크래프트의 플레이 영상을 사용했다고 밝혔으며 전문가들은 다른 게임 콘텐츠도 훈련 데이터로 포함됐을 가능성이 높다고 분석했다. 실제로 '소라'는 닌텐도 게임인 '슈퍼마리오 브라더스'나 유명 1인칭 슈팅 게임인 '콜오브듀티' 스타일의 영상을 생성할 수 있다. 이와 함께 유명 트위치 스트리머의 외모를 반영한 캐릭터도 만들어내고 그의 문신을 복제하는 등 저작권 문제가 불거질 소지가 큰 것으로 나타났다. 법률 전문가들은 오픈AI가 무단으로 게임 플레이 영상을 사용했을 경우 저작권 침해 소송에 직면할 수 있다고 경고했다. 특히 게임 콘텐츠에는 개발사 뿐만 아니라 스트리머 등 여러 이해관계자가 얽혀 있어 저작권 관련 법적 리스크가 크다. 오픈AI는 훈련 데이터 출처에 대해 명확히 밝히지 않고 있으며 공공 데이터와 라이센스 데이터를 활용했다고만 언급했다. 지적재산권 변호사인 조슈아 와이겐스버그는 "비디오 게임 플레이 영상을 무단으로 사용하는데는 많은 리스크가 있다"고 밝혔다.

2024.12.12 11:27조이환

  Prev 1 2 Next  

지금 뜨는 기사

이시각 헤드라인

"2030년 이전 양자 산업 실체 보게될 것"...한국, 국제 협력 가속도

"AI의 ‘인간다움’이 진짜 인간을 기계 취급할 수도"

'높이 13m' 세계 최대 모래 배터리 화제…어떻게 작동하나

[ZD브리핑] 정기 국회 개막...與, 검찰개혁 등 224개 법안 처리 예고

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.