검색 - IT세상을 바꾸는 힘 지디넷코리아

ZDNet 검색 페이지

'영상 AI'통합검색 결과 입니다. (93건)

태그
기간
- 3개월
- 1년
- 1년 이전

재검색

노타, KISA 지능형 CCTV 성능 인증 획득…AI 영상 관제 상용화 '가속'

노타가 인공지능(AI) 영상 분석 기술의 신뢰성과 완성도를 공식적으로 입증했다. 노타는 한국인터넷진흥원(KISA)이 주관한 지능형 CCTV 성능시험·인증 4개 부문(배회·침입·쓰러짐·유기)을 통과했다고 6일 밝혔다. KISA 지능형 CCTV 성능시험·인증 제도는 AI 영상 분석 기술의 객체 탐지 정확도, 행위 인식 성능, 환경 적응성 등을 종합적으로 검증하는 공신력 있는 평가 제도다. 노타는 4개 부문 평가에서 평균 95점의 높은 성적을 기록하며 자사 영상 분석 기술이 산업·공공·교통 등 다양한 실제 환경에서 안정적이고 신뢰성 있게 작동할 수 있음을 공식적으로 확인받았다. 인증을 획득한 노타의 '노타 비전 에이전트(NVA)'는 비전언어모델(VLM)을 기반으로 영상 속 객체 간의 관계와 상황의 맥락을 이해해 위험을 정밀하게 감지하고 대응할 수 있는 영상 관제 솔루션이다. 특히 노타의 독자적인 AI 모델 경량화·최적화 기술을 적용해 대규모 인프라나 네트워크 제약이 있는 현장에서도 실시간으로 정밀한 분석이 가능한 것이 특징이다. 노타는 지난 8월 코오롱인더스트리 김천2공장에 NVA를 도입하며 국내 최초로 VLM 기반 영상 관제 솔루션의 상용화를 실현했다. 이후 제조·건설·교통·공공안전 등 다양한 산업 분야로 적용 영역을 확대하고 있다. 두바이 도로교통국(RTA)과도 협력해 교통사고를 자동 인식·보고하고 상황별 대응을 제안하는 에이전트형 교통 관리 시스템을 선보일 예정이다. 또 교통·제조·안전 등 NVA 수요가 높은 동남아 시장 진출에도 속도를 내며 글로벌 시장 다각화를 추진하고 있다. 채명수 노타 대표는 "이번 KISA 인증은 노타의 AI 영상 관제 기술이 공인된 수준의 신뢰성과 완성도를 갖췄음을 입증한 결과"라며 "앞으로도 산업·교통·공공안전 등 다양한 분야에서 영상 AI 기술의 표준을 제시하고 실질적인 사고 예방과 인명 보호를 통해 사회 안전망 구축에 기여하겠다"고 말했다. 이어 "AI가 현실 공간의 상황을 인식하고 대응하는 피지컬 AI 시대가 빠르게 다가오고 있는 만큼, 생성형 AI 영상 관제 기술을 중심으로 이러한 산업적 변화 속에서 새로운 가치를 만들어가며 혁신을 선도해 나가겠다"고 덧붙였다.

2025.11.06 17:09한정호 기자

뷰웍스, 3분기 매출 537억원 기록…전년 대비 10.9% 증가

뷰웍스가 올해 3분기 연결기준 매출액 537억원을 기록, 전년 동기대비 10.9% 증가한 것으로 나타났다. 회사에 따르면 3분기는 정지영상 및 산업용 디텍터 부문에서 유의미한 매출 성장을 기록하며 전체 실적 호조를 이끌었고 제품 믹스 개선이 이어지며 상반기 수준의 매출 총이익률을 확보했으며, 영업이익은 일시적인 판관비 증가로 인해 소폭(4.9%) 감소했다. 세부적으로 보면 의료용 정지영상 디텍터 부문은 236억원의 매출을 기록하며 전년 동기대비 약 11.9% 증가했다. 유럽 지역 대형 고객사의 발주 재개로 매출액이 평년 수준으로 회복했으며 수의진단 디텍터 제품군이 견고한 성장세를 보였는데, 이는 뷰웍스의 소프트웨어 기반 산란보정 기술(SBS), AI 영상진단 보조 솔루션인 '노이즈엑스(Noise-X) AI' 등이 경쟁력 확보에 크게 기여한 것으로 나타났다. 또 유방촬영용(맘모그래피) 엑스레이 디텍터는 국내와 남미 시장에서 발주량이 큰 폭으로 증가했다. 동영상 디텍터 부문은 매출 81억원으로 전년 동기와 동일한 수준을 유지했다. 유럽과 북미 등 주요 치과 시스템 시장의 수요가 전년과 비슷한 수준으로 유지되고 있으며, 향후 주력 고객사의 발주 재개에 따라 실적이 더욱 개선될 것으로 예상되고 있다. 비파괴검사(NDT)용 산업용 디텍터 부문은 3분기 60억원의 매출을 달성하며 전년 동기(35억원) 대비 약 71% 증가하며 1년 연속 뚜렷한 성장세를 보였다. 유럽 지역은 자동 엑스레이 검사 시스템(AXI)에 필요한 산업용 CT 제품이, 중동 지역에서는 휴대용 보안 시스템의 포터블 디텍터 제품의 매출이 크게 증가했다. 회사 측은 국내의 경우 배터리 검사 애플리케이션 수요가 점진적으로 늘어나는 추세로 이는 4분기에도 이어질 것으로 전망했다. 산업용 이미징 솔루션 부문에서는 머신비전 카메라가 99억원의 매출을 거두며 전년 동기대비 약 4.5% 감소했다. 이는 반도체 시장의 성장 속에서도 신규 설비투자 둔화로 일시적인 조정 국면을 보였으며, 4분기에는 설비투자 회복이 이뤄질 것으로 회사 측은 예상했다. 3분기 의료영상 부문 호조에 힘입어 뷰웍스는 4분기에는 북미 최대의 영상의학 전시회 RSNA 2025에서 신제품 및 신규 AI 영상진단 솔루션을 다수 선보이며 영업망을 크게 확보할 계획이다. 이와 함께 반도체 및 디스플레이 시장에서 고해상도 및 대면적 이미징 솔루션 등 제품 적용 분야를 확대해 나간다는 전략이다. 뷰웍스 관계자는 “이번 3분기는 정지영상 디텍터, 산업용 디텍터 등에서 두 자릿수 매출 확대로 유의미한 실적 개선을 이룬 분기였다”며 “4분기에는 연구개발 투자와 비용 효율화를 병행해 성장 기반과 수익구조를 더욱 탄탄히 다질 것”이라고 말했다.

2025.11.06 14:49조민규 기자

[현장] "몇 분 만에 엔딩 교체"…AI 만난 영상 편집, 실시간 마법 시연

[로스앤젤레스(미국)=조이환 기자] "인공지능(AI) 도구는 퍼즐 조각과 같습니다. 창작자가 호기심을 가지고 이를 집어 들어 세상을 만드는 것이죠." 영국의 유명 콘텐츠 크리에이터 브랜든 바움은 29일 미국 로스앤젤레스에서 진행된 '어도비 맥스 2025' 기조연설 무대에서 이같이 말했다. 이날 그는 어도비 파이어플라이 라이브 시연을 시작하며 자신이 전날 게시했던 영상의 엔딩에 청중이 단 댓글에서 영감을 받아 실시간으로 재창조하는 과정을 선보였다. 바움은 자신이 어제 올린 '석상과 싸우는' 영상에 달린 "적들이 연인이 되는 반전을 기다렸다"는 댓글을 화면에 띄웠다. 그는 "이 댓글이 속편에 대한 좋은 영감이 될 수 있겠다"며 즉석에서 '석상 적이 갑자기 키스를 하려고 달려드는' 반전 엔딩 제작에 돌입했다. 그는 먼저 어도비 '파이어플라이 보드'에서 기존 영상 클립을 불러왔다. 영상 속 석상이 명확히 보이는 프레임과 사막 배경 프레임을 각각 캡처해 보드 위에 꺼내 놓으며 "퍼즐 조각을 모으기 시작했다"고 말했다. 핵심 이미지 생성에는 구글의 '제미나이 2.5 나노 바나나' 모델이 사용됐다. 바움은 "대리석 석상이 (키스하기 위해) 입술을 오므리고 사막 폭풍 속을 카메라를 향해 달려온다"는 프롬프트를 입력하고 앞서 캡처한 석상 이미지를 레퍼런스로 지정했다. 그는 "무서우면서도 멋진 결과물이 나왔다"며 생성된 이미지를 보드에 추가했다. 바움은 '변형(Vary)' 기능을 사용해 다양한 변형 이미지를 순식간에 생성했다. 그는 결과에 대해 "때로는 마법 같고 때로는 완전히 정신 나간 결과가 나오지만 그게 재미"라고 설명했다. 최종 엔딩 영상 제작에는 구글 '비오 3.1' 모델이 동원됐다. 그는 "비디오, 대리석 석상이 사막에서 카메라를 쫓아 빠르게 달려와 렌즈를 향해 입술을 오므리고 렌즈에 키스한다"는 구체적인 프롬프트를 입력했다. 앞서 생성한 이미지를 첫 프레임으로 지정하고 '비오' 모델의 오디오 동시 생성 기능을 활성화했다. 영상이 생성되는 동안 바움은 '사운드트랙 생성' 툴로 이동했다. 그는 분위기를 '드라마틱', '업비트', '코믹'으로, 스타일을 '클래식', '시네마틱'으로 설정했다. 특히 목적에는 댓글에서 영감을 받은 "적에서 연인으로 스토리"라고 직접 입력해 눈길을 끌었다. AI가 생성한 4개의 트랙 중 그는 극적인 첫 번째 트랙을 선택했다. 모든 재료가 준비되자 바움은 웹 기반 '파이어플라이 비디오 에디터'를 열었다. 기존 실사 영상 마지막 부분과 '비오'로 생성한 '키스 엔딩' AI 영상을 타임라인에 배치했다. 두 영상이 자연스럽게 연결되지 않자 그는 즉석에서 AI로 전환 장면 생성에 나섰다. 그는 두 클립 사이에 플레이헤드를 놓고 '생성 설정'을 열었다. 전환 장면의 첫 프레임은 앞선 실사 클립의 마지막 프레임으로, 마지막 프레임은 뒤따를 AI 클립의 첫 프레임으로 지정했다. 이어 "슬로우 모션, 석상이 모래 깊은 곳에서 나타나 카메라를 향해 매우 느리게 달려오기 시작한다"고 프롬프트를 입력했다. 바움은 "현재 베타 버전은 5초 길이 제한이 있다"며 "프롬프트에 '슬로우 모션'을 반복해서 넣어 길게 생성한 뒤 에디터에서 속도를 200%로 높여 원하는 길이를 맞추는 팁을 사용한다"고 귀띔하기도 했다. 생성된 전환 장면과 앞서 만든 사운드트랙까지 타임라인에 추가되자 모든 준비가 끝났다. 최종 실사 영상은 성공적으로 완성됐다. 기존 영상에서 주인공과 싸우던 석상이 장면 전환 후 모래 속에서 천천히 나타나 달려오더니 갑자기 입술을 오므리고 카메라 렌즈에 키스하는 코믹한 반전 엔딩에 청중은 큰 박수를 보냈다. 바움은 "이 모든 과정이 단 몇 분 만에 이뤄졌다"며 "호기심을 화면 위의 무언가로 바꾸었다"고 말했다. 이어 "도구가 아닌 스토리텔러가 이야기를 만든다"고 강조했다.

2025.10.30 02:55조이환 기자

"텍스트만으로 뮤직비디오 완성"…구글 클라우드, '비오 3'로 영상 제작 혁신

구글 클라우드가 텍스트 명령만으로 고품질 영상을 생성하는 차세대 인공지능(AI) 동영상 생성 모델 '비오 3'를 앞세워 콘텐츠 제작 혁신을 주도한다. 구글 클라우드는 비오 3를 도입한 국내 기업들의 성공 사례를 29일 공개했다. 비오 3는 구글 딥마인드의 기술을 기반으로 세밀한 스타일 제어와 고해상도 영상 생성이 가능한 AI 모델이다. 기존 영상 제작에 수개월이 걸리던 작업을 단 며칠 내로 단축할 수 있어 국내 미디어·엔터테인먼트 업계에서 창작 효율의 게임체인저로 평가받고 있다. 타이거 JK가 이끄는 힙합 레이블 필굿뮤직은 구글 클라우드, GS네오텍과 협력해 드렁큰 타이거의 곡 '끄덕이는 노래' 뮤직비디오를 비오 3로 제작했다. 복잡한 시각효과와 3D 연출을 텍스트 프롬프트로 구현하며 기존 수개월 걸리던 프로세스를 단 2주 만에 완성했다. 필굿뮤직 한상범 감독은 "비오 3는 아티스트의 음악적 비전을 효율적으로 시각화하는 강력한 도구"라며 "AI의 시각화 능력과 인간의 창의적 디렉팅을 결합해 새로운 예술적 가능성을 실현하고 있다"고 말했다. SM엔터테인먼트 자회사 스튜디오리얼라이브는 비오 3 기술을 활용한 AI 영화 제작 도구 '플로우'로 신곡 '리치 맨' 뮤직비디오를 공개했다. 해당 영상은 현실과 상상을 넘나드는 몰입형 비주얼을 구현해 글로벌 팬덤의 호평을 받았다. 스튜디오리얼라이브는 비오 2 베타 버전부터 구글 클라우드 및 구글 딥마인드와 협업을 이어왔으며 자체 AI 에이전트를 구축해 기획부터 영상 제작까지 전 과정에 AI를 접목하고 있다. 이승우 스튜디오리얼라이브 대표는 "케이팝 IP와 팬들이 더 깊이 연결될 수 있도록 생성형 AI를 적극 도입 중"이라며 "구글 클라우드와 협력해 차세대 콘텐츠 혁신을 주도하겠다"고 밝혔다. 패러닷의 생성형 AI 서비스 캐럿은 구글 클라우드의 '버텍스 AI' 플랫폼 기반으로 제미나이 언어 모델과 비오 3를 결합해 영상 기획부터 제작까지 자동화했다. 사용자가 영상 목적을 입력하면 제미나이가 이를 분석해 비오 3에 최적의 프롬프트를 생성하고 결과물은 즉시 렌더링된다. 장진욱 패러닷 대표는 "캐럿은 비오 3를 통해 누구나 전문적인 영상 제작 경험 없이도 고품질 콘텐츠를 손쉽게 만들 수 있도록 돕는다"며 "향후 새 AI 모델을 빠르게 도입해 누구에게나 쉽고 편리한 창작 환경을 제공할 것"이라고 말했다. 지기성 구글 클라우드 코리아 사장은 "비오 3는 콘텐츠 제작 전반에서 영상 제작의 장벽을 혁신적으로 낮추며 전문적인 수준의 영상을 빠르게 제작할 수 있는 강력한 도구로, 제작 프로세스의 효율성을 향상하고 창작자에게 더 많은 상상력과 가능성을 현실화할 수 있는 기회를 제공한다"고 강조했다. 이어 "비오 3를 통해 국내 미디어 및 엔터테인먼트 기업들이 차세대 콘텐츠 혁신을 주도하고 크리에이티브 경쟁력을 강화할 수 있도록 적극 협력할 것"이라고 덧붙였다.

2025.10.29 16:48한정호 기자

엠피에이지, 음악 교육앱 '마이뮤직파이브' 출시

엠피에이지(대표 정인서)가 AI 음악 교육 앱 '마이뮤직파이브'를 정식 출시했다고 14일 밝혔다. 마이뮤직파이브는 연주자의 소리를 실시간으로 인식해 연주음의 정확도를 판별하는 서비스다. 알맞은 시점에 악보를 자동으로 넘겨 손으로 악보를 넘기는 번거로움 없이 연주에 온전히 몰입할 수 있는 환경을 제공한다. 핵심 기능으로는 ▲왼손·오른손·양손 파트별 연습 모드 ▲사운드 인식 AI 기술을 활용해 악보를 넘겨주는 '자동 넘김' ▲미리듣기 연주와 같은 연주자의 체계적인 연습을 돕는 교육 기능을 포함한다. 또 엠피에이지가 운영하는 글로벌 디지털 악보 플랫폼을 연동해 30만 개 이상 다양한 장르의 난이도별 악보를 제공하며, 이와 함께 사용자들이 연주 영상을 공유하고 서로 소통하는 숏폼 영상 커뮤니티까지 갖춘 것이 특징이다. 마이뮤직파이브는 지난 11일 구글 플레이스토어 및 애플 앱스토어에 정식 오픈했다. 회사는 향후 사용자 경험을 개선하는 AI 음악 학습 기능을 단계적으로 업데이트해 나갈 계획이다. 특히 엠피에이지는 그동안 자체 기업부설연구소를 중심으로 음악 인식 AI 기술 개발에 주력해왔다. 음의 높이, 길이, 강약을 실시간으로 정밀 분석하는 기술을 비롯해, 사운드 멜로디를 분석해 음표를 식별하는 기술, 악보의 구조적 정보를 파악하는 기술 등 핵심 기술을 보유하고 있다. 정인서 엠피에이지 대표는 “마이뮤직파이브는 최신 AI 기술을 통해 음악을 배우고 즐기는 방식을 바꾸는 새로운 경험을 제공할 것”이라며 “글로벌 최고 수준의 악기 사운드 인식 기술과 디지털 악보 시장을 선도해 온 경험으로 전 세계 음악인들에게 사랑받는 서비스를 만들겠다”고 말했다.

2025.10.14 14:33백봉삼 기자

머스크 xAI, '월드 모델' 개발 착수…AI가 직접 게임 만든다

일론 머스크가 이끄는 xAI가 물리적 공간을 인지하고 설계할 수 있는 차세대 인공지능(AI) '월드 모델' 개발에 나선다. 13일 파이낸셜타임스(FT)에 따르면 xAI는 텍스트 기반 언어모델을 넘어 영상·로봇 데이터를 학습한 AI 기술을 활용해 직접 만든 게임을 내년 공개할 계획이다. 월드 모델은 메타와 구글 등 주요 빅테크가 집중하는 차세대 AI 기술로, 물리적 공간을 이해하고 시뮬레이션하는 능력을 구현하는 것이 목표다. 앞서 xAI는 엔비디아 출신 전문가들을 다수 영입해 영상과 로봇 데이터를 기반으로 실제 환경을 학습하는 AI 모델 개발을 진행 중이다. 특히 이 기술을 활용해 상호작용 가능한 3D 게임 환경을 자동 생성하는 등 게임 산업 적용을 목표로 하고 있으며 향후 로봇 제어 시스템에도 응용할 계획이다. 일론 머스크 xAI 대표는 자사 SNS 플랫폼 X를 통해 "내년 말까지 AI가 직접 생성한 게임을 선보일 것"이라고 밝혔으며 최근 대규모 업그레이드를 거친 이미지·영상 생성 모델을 무료로 공개하기도 했다. 현재 오픈AI의 '소라'와 같은 영상 생성 AI는 학습 데이터를 기반으로 연속된 이미지 프레임을 예측하는 수준이다. 이에 반해 월드 모델은 물리 법칙과 사물 간 상호작용을 실시간으로 이해해 훨씬 높은 수준의 현실 시뮬레이션을 가능케 하는 것으로 알려졌다. xAI는 이미지·비디오 생성 엔지니어를 포함해 다양한 멀티모달 콘텐츠 제작 인력을 모집 중이다. 특히 자사 AI 챗봇 '그록'에게 게임 제작을 학습시키는 업무 담당자도 채용하고 있다. xAI를 비롯한 구글·메타 등이 월드 모델 개발에 집중하는 가운데, 업계에서는 실제 세계를 묘사할 데이터 확보와 막대한 비용 문제 해결을 주요 과제로 꼽고 있다. 라리안 스튜디오의 마이클 다우스 퍼블리싱 총괄은 "AI가 게임 산업의 가장 큰 문제인 리더십과 비전을 해결해 주진 못한다"며 "수학적으로 계산된 게임 루프보다 사람들이 진심으로 몰입하고 싶어 하는 세계를 표현하는 것이 더 중요하다"고 말했다.

2025.10.13 14:43한정호 기자

오픈AI 소라, 출시 첫 주 '챗GPT' 다운로드 제쳤다

오픈AI의 영상 생성 인공지능(AI) '소라'가 출시 초반 흥행 기록으로 전작인 '챗GPT'를 넘어서는 돌풍을 일으켰다. 12일 앱 분석 기관 앱피겨스에 따르면 오픈AI의 새 앱 소라는 출시 첫 주 iOS에서 62만7천 건의 다운로드를 기록했다. 이는 앞서 출시된 챗GPT의 첫 주 기록인 60만6천 건을 넘어선 수치다. 소라는 지난달 30일 처음 공개됐다. 소라의 초기 흥행 속도는 챗GPT를 능가하는 수준이다. 빌 피블스 오픈AI 소라 책임자는 앱 출시 5일도 안 돼 다운로드 100만 건을 돌파했다고 직접 밝혔다. 소라의 성과는 접근이 제한된 '초대 전용' 방식으로 운영되는 가운데 달성돼 더욱 주목받는다. 출시 당시 누구나 사용할 수 있었던 챗GPT와는 다른 조건에서 거둔 성공이기 때문이다. 소라는 출시 첫날부터 시장의 폭발적인 반응을 얻었다. 공개 직후 5만6천 건의 설치를 기록하며 단숨에 미국 앱스토어 전체 3위에 올랐고 지난 3일에는 1위 자리를 차지했다. 이러한 초기 돌풍은 앤트로픽의 '클로드'나 마이크로소프트의 '코파일럿' 등 경쟁 AI 앱들의 출시 성적을 뛰어넘는 기록이다. 일론 머스크의 xAI가 내놓은 그록과 비견될 만한 수준이다. 출시 국가를 고려하면 소라의 흥행세는 더욱 두드러진다. 챗GPT가 첫 주 미국에서만 서비스된 반면 소라는 미국과 캐나다에서 동시에 출시됐으며 캐나다에서만 약 4만5천 건의 설치가 발생했다. 소셜미디어에서는 새로운 '소라 2' 모델로 제작된 영상들이 빠르게 확산하고 있다. 특히 실제와 가까운 딥페이크 영상 제작이 가능해지면서 고인이 된 배우 로빈 윌리엄스의 영상을 만드는 사례까지 등장했다. 이에 그의 딸 젤다 윌리엄스가 "AI로 생성한 아버지의 이미지를 그만 보내달라"고 공개적으로 요청하기도 했다. 앱피겨스는 "소라가 지난 1일 10만7천800건으로 일일 다운로드 최고치를 기록한 뒤 다소 안정화됐다"면서도 "초대 전용 앱인 점을 고려하면 여전히 상당한 수치"라고 분석했다.

2025.10.12 10:14조이환 기자

美 영화협회 "오픈AI 소라2, 저작권 침해 즉각 조치해야"

미국영화협회(MPA)가 오픈AI의 비디오 생성 모델 '소라2'가 저작권이 있는 미디어를 침해하는 콘텐츠를 만들고 있다며 즉각적인 조치를 촉구했다. 7일(현지시간) CNBC에 따르면 찰스 리브킨 MPA 최고경영자(CEO)는 성명에서 “소라2의 출시 이후 회원사들의 영화, 프로그램, 캐릭터를 침해하는 영상이 오픈AI 서비스와 소셜미디어 전반에 걸쳐 급증했다”고 밝혔다. 오픈AI는 소라2를 지난달 30일 출시했다. 앞서 샘 알트먼 오픈AI CEO는 블로그에서 “(자사 플랫폼이 권리자들에게)그들의 캐릭터가 어떻게 사용되는지에 대해 더 세밀한 통제권을 부여할 것”이라고 언급했다. 그러나 리브킨 CEO는 오픈AI가 “저작권 침해를 방지할 책임은 권리자가 아니라 오픈AI 자신에게 있다”는 점을 인정해야 한다며 “잘 확립된 저작권법은 창작자의 권리를 보호하며 이 경우에도 동일하게 적용된다”고 반박했다. 소라2는 출시 직후 '제임스 본드가 올트먼 CEO와 포커를 치는 장면', '만화 캐릭터 마리오가 경찰을 피해 도망치는 바디캠 영상' 등 이용자 제작물이 확산하며 저작권 논란이 불거졌다. 오픈AI는 소라2 공개 당시 스튜디오 측이 요청할 경우에만 캐릭터 사용을 제한하는 '옵트아웃' 방식을 차용했다. 이후 블로그 글에서 저작권자 허가 없이는 소라2에서 캐릭터를 사용할 수 없도록 변경하는 '옵트인' 방식으로의 전환을 예고했다. 다만, 알트먼 CEO는 완벽한 방지가 어려울 수 있다는 점을 시사하면서 “일부 예외적인 상황에서는 걸러지지 말아야 할 생성물이 통과할 수도 있다"며 "시스템을 안정화하는 데에는 반복적인 조정이 필요하다”고 덧붙였다. 현재 생성형 인공지능(AI) 성장과 함께 저작권 문제가 크게 대두되고 있다. 지난 6월 디즈니와 유니버설은 AI 이미지 생성 회사 미드저니를 상대로 소송을 제기했다. 양 사는 미드저니가 자사 영화 캐릭터를 무단으로 사용, 배포했으며 중단 요청을 무시했다고 주장했다. 아울러, 디즈니는 지난달 AI 스타트업 캐릭터 AI에 저작권 캐릭터의 무단 사용 중단을 요청하는 경고장을 발송하기도 했다.

2025.10.08 11:19박서린 기자

AI가 환자정보 지키며 '신장' 질환 진단…정상, 낭종, 종양 정확히 분류

최근 컴퓨터단층촬영(CT)과 같은 의료영상을 분석할 때 인공지능(AI)을 활용해 진단의 정확성과 속도를 높이는 사례가 늘고 있다. 하지만 인공지능을 실제 임상현장에 폭넓게 적용하기에는 환자 개인정보가 유출될 수 있다는 우려가 꾸준히 제기돼 왔다. 이러한 가운데 국내 연구진이 환자 개인정보를 안전하게 보호하면서도 신장 CT 영상으로 신장질환을 정확히 진단하는 인공지능 모델을 최근 개발했다. 서울아산병원 마취통증의학과 이상욱‧비뇨의학과 서준교 교수팀은 데이터를 암호화된 상태 그대로 연산하는 동형암호 기술을 활용해, 환자의 신장 CT 영상을 암호화한 후 정상 신장과 낭종, 종양을 분류해 내는 딥러닝 모델을 구현했다. 이 딥러닝 모델은 질환 분류의 정확도를 나타내는 지표인 AUC 값(1에 가까울수록 예측 정확도가 높음)이 0.97~0.99로 손실이 거의 없었다. 즉 환자 데이터가 암호화된 상태에서도 기존 비암호화 모델과 동일한 수준의 분석 결과를 제공하는 것으로 나타났다. 이번 연구에 사용된 동형암호 기술은 양자컴퓨터 시대의 안전한 양자내성암호(Post Quantum Cryptography)로서 국제 표준으로도 지정돼 있다. '금고를 열지 않고도 내부에서 작업할 수 있는 로봇 팔'에 비유될 만큼 데이터를 열지 않고 완전히 암호화된 상태에서 실시간 연산과 분석이 가능한 혁신 기술이다. 연구팀은 암호화된 상태 그대로 분석할 수 있는 인공지능을 만들기 위해 세 가지 단계를 거쳤다. 먼저 비암호화된 상태에서 신장 CT 영상을 학습하는 딥러닝 모델을 기준 모델로 만들었다. 이를 위해 총 1만 2천446장의 신장 CT 영상(정상 5077장, 낭종 3709장, 종양 2283장)이 사용됐다. 두 번째 단계로 기준 모델을 암호화 환경에 맞춘 새 모델로 변형했다. 암호화된 데이터는 소위 '크다/작다'와 같은 직접 비교가 불가능하기 때문에 비교 연산을 쓰는 구조를 다항식 함수, 최대값 대신 평균값을 사용하는 방식으로 바꿈으로써 암호화된 데이터에서도 인공지능이 정상적으로 작동하게 만들었다. 마지막으로 'CKKS 스킴'(Cheon–Kim–Kim–Song Scheme)이라는 동형암호 기법을 이용해 환자의 신장 CT 영상을 변환했다. 즉 완전히 암호화된 상태에서 인공지능이 영상을 분석할 수 있게 고도화한 것이다. CKKS 스킴은 국내 암호학자들이 개발한 동형암호 기법으로 기존 동형암호는 정수 연산만 가능한 경우가 많은데, CKKS는 실수와 복소수에 대해서도 근사 연산이 가능하다. CKKS를 이용하면 의료 딥러닝 연산처럼 소수점이 필요한 계산을 암호화 상태로 처리할 수 있다. 이번 연구에서는 CKKS 스킴 원천 기술을 가진 크립토랩(CryptoLab)과 협력해 암호화 모델을 개발했다. 연구팀은 연산 효율성을 높이기 위해 데이터 여러 개를 한꺼번에 묶어 계산하거나 필요한 부분만 계산하는 방식도 추가로 도입했다. 그 결과, 환자의 신장 CT 데이터를 암호화된 상태 그대로 입력해도 기존 인공지능과 거의 똑같은 정확도로 신장질환을 구분하는 것으로 나타났다. 다만 암호화 때문에 이미지 크기가 약 500배 커지고 연산 속도가 느려지는 문제도 발생했다. 하지만 고성능 그래픽처리장치(GPU)를 활용한 결과, 1~2분 이내에 모든 분석이 이뤄질 수 있었다고 한다. 이상욱 서울아산병원 마취통증의학과 교수는 “향후 고성능 그래픽처리장치 등 하드웨어의 발전과 알고리즘 최적화가 이루어진다면, 이번 암호화 적용 모델은 개인정보 보존형 의료영상 분석의 표준으로 자리 잡을 것이다”라고 말했다. 서준교 서울아산병원 비뇨의학과 교수는 “이번 암호화 모델은 민감한 환자 정보를 안전하게 보호하기 때문에 법적·윤리적 문제를 최소화하면서 AI 진단을 활성화할 수 있는 기술이다. 향후 신장 CT, 엑스레이 등 의료영상 분석에서 이 AI 모델이 폭넓게 활용될 수 있을 것으로 생각한다”고 밝혔다. 이번 연구는 서울아산병원 생명과학연구원과 과학기술정보통신부 및 한국연구재단, 국가정보통신산업진흥원의 지원을 받아 수행됐다. 이번 연구 결과는 북미영상의학회가 발간하는 국제 학술지 '영상의학: 인공지능(Radiology: Artificial Intelligence, 피인용지수 13.2)'에 최근 게재됐다.

2025.09.29 16:42조민규 기자

[영상] 고양이가 밀가루 반죽 '조물딱'…메타가 꺼낸 AI 新 무기, 韓서는 경험 못 한다

최근 인공지능(AI) 시장 주도권을 잡기 위해 안간힘을 벌이고 있는 메타가 새로운 무기를 꺼냈지만 국내에서는 경험해 볼 수 없다. '메타 AI'가 한국에서 지원되지 않아서다. 26일 테크크런치에 따르면 마크 저커버그 메타 최고경영자(CEO)는 지난 25일 자신의 인스타그램을 통해 AI 생성 영상 피드 '바이브스(Vibes)' 론칭 소식을 전하며 직접 AI 생성 영상을 공개했다. 이 영상에선 복슬복슬한 생명체들이 큐브 사이를 뛰어다니거나 고양이가 반죽을 치대는 모습, 고대 이집트가 내려다보이는 발코니에서 셀카를 찍는 고대 여성의 모습 등이 담겼다. '메타 AI' 앱에서 경험할 수 있는 이 피드는 '틱톡', 인스타그램 '릴스' 등과 비슷하지만 모든 콘텐츠가 AI로 만들어졌다는 점에서 차별화됐다. 이용자들은 '바이브스'를 통해 직접 영상을 생성하거나 기존 영상을 섞어 배경·음악·스타일을 바꿀 수 있다. 또 이를 피드에 공유하거나 인스타그램과 페이스북 스토리로 교차 게시할 수 있다. 메타 측은 "사용자가 피드를 탐색하면서 제작자와 다른 사용자들이 만든 AI 생성 영상을 볼 수 있다"며 "시간이 지날수록 우리의 알고리즘이 개인화된 콘텐츠를 추천한다"고 설명했다. 알렉산더 왕 메타 최고 AI 책임자는 "초기 버전의 '바이브스' 개발을 위해 미드저니, 블랙 포레스트 랩스 등 AI 이미지 생성 기업과 협력하고 있다"며 "자체 AI 모델 개발도 병행하고 있다"고 밝혔다. 현재 국내에선 '메타 AI' 앱과 웹사이트가 지원되지 않아 '바이브스'를 직접 경험해 볼 수 없다. '메타 AI' 앱은 사용자가 메타의 AI 기능을 활용할 수 있도록 만든 독립형 앱으로, 지난 2024년부터 미국, 캐나다, 영국 등 일부 국가에서만 선보여지고 있다. 또 '메타 AI' 앱은 '레이밴 메타' 스마트 글래스와도 연동돼 새로운 경험을 할 수 있도록 도와준다. 다만 저커버그 CEO가 이번에 야심차게 선보인 '바이브스'에 대한 시장의 반응은 냉랭하다. AI 콘텐츠가 이미 소셜미디어(SNS)에 넘쳐나는 상황에서 'AI 버전 틱톡'을 만들겠다는 메타의 행보가 의문이라는 지적이다. 저커버그 CEO의 인스타그램 게시물에도 "아무도 원하지 않는다", "스스로 AI 쓰레기를 올리고 있다", "도대체 왜?"라는 부정적 반응이 쏟아지고 있다. 테크크런치는 "유튜브 등 주요 플랫폼은 AI로 생성된 저품질 콘텐츠 확산을 막기 위한 조치를 강화하고 있는 상황"이라며 "메타 역시 올해 초 '비(非)독창적'인 페이스북 콘텐츠를 줄이겠다며 제작자들에게 '진정성 있는 스토리텔링'을 주문한 바 있어 이번 행보는 더욱 모순적으로 비친다"고 꼬집었다.

2025.09.26 17:43장유미 기자

AI 영상 '꽹', 2025 GAMFF 종합대상 수상...소휘수 에임즈미디어 감독 작품

에임즈미디어는 소휘수 감독이 제작한 AI 영상 작품 '꽹'이 경북 구미시 구미코에서 열린 2025 경상북도 국제 AI·메타버스 영상제(GAMFF: Gyeongsangbuk-do International AI·Metaverse Film Festival)에서 종합대상을 수상했다고 지난 19일 밝혔다. 올해로 두 번째를 맞은 GAMFF는 지난 12일부터 14일까지 열렸다. 이 기간 세계 12개국에서 총 1천75편의 작품이 출품됐다. AI·VFX·메타버스가 결합한 이번 행사는 K-AI 콘텐츠의 가능성을 보여주며, 세계 창작자들이 교류하고 경쟁하는 자리로 빛났다. GAMFF는 경상북도와 구미시, 포항시, 경산시, 청도군이 공동 주최하고 경북테크노파크가 주관했다. 이 가운데 에임즈미디어의 '꽹'은 기술과 문화예술을 결합한 창작 실험으로 주목받으며 종합대상을 차지했다. 종합대상을 차지한 '꽹'은 에임즈미디어의 자체 개발 AI플랫폼 에임즈랩스(AIMZ Labs)의 기술력과 국가유산 디지털 자원을 적용한 것이 특징이다. 해당 작품은 경주의 과거와 미래를 AI로 재현하며 전통문화와 글로벌 트렌드를 결합한 새로운 콘텐츠로 구현했다. 한복을 힙합과 K-POP과 접목해 새로운 시각적 실험을 선보였으며, 경주시가 개발한 신라문화체 폰트를 로고에 적용해 지역적 정체성을 강조했다고 회사 측은 설명했다. AI플랫폼 에임즈랩스는 배경 합성, 조명·색감 연출, 시각적 일관성 유지 등 영화 제작 전 과정을 지원하는 AI-aaS(Artificial Intelligence as a Service) 툴이 적용됐다. 소휘수 에임즈미디어 감독은 "꽹은 AI가 단순한 도구를 넘어 문화와 이야기를 함께 만들어가는 동반자가 될 수 있음을 보여주고 싶었다"며 "국가유산 디지털 자산과 에임즈랩스를 연계해 한국의 전통과 현대, 지역과 세계를 잇는 새로운 다리를 만들고 싶다"고 전했다.

2025.09.21 17:33이도원 기자

우주청, 네이버클라우드 등과 AI대비 위성정보 민간 개방 "논의"

우주청과 네이버클라우드 등 16개 기관이 위성 정보 민간 개방을 위한 논의를 시작했다. 우주항공청(청장 윤영빈)은 16일 위성정보 민간 개방을 가속화하기 위해 '개방형 위성영상 서비스시스템' 산학연 전문가 간담회를 개최했다. 이 간담회는 우주청 '위성활용 혁신기반 조성사업' 일환이다. 우주청은 인공지능(AI) 시대에 대비, 국가 위성정보 개방을 추진한다. 민간주도 인공지능과 위성정보 간 융합을 촉진시키기 위해서다. 우선 올해부터 2028년까지 총 4년간 98억원을 투입하는 '위성활용 혁신기반 조성사업'을 한국항공우주연구원이 수행 중이다. 사업이 완료되면 기존 국가 위성영상 서비스시스템을 대체할 것으로 예상됐다. 주문·검색 기능을 대폭 개선한 새로운 '개방형 위성영상 서비스시스템'이 본격 운영될 전망이다. 시스템 요구사항을 반영하기 위해 개최한 이번 간담회에서는 총 16개 기관에서 27명의 전문가가 참석했다. 주요 참석 기관은 에스아이아이에스, 지오스토리, CES, AI팩토리, 빅밸류, 네이버클라우드, 안랩클라우드메이트, 다비오, 스켈터랩스, 와이즈넛, 지인컨설팅, 서울대학교, 부경대학교, 한국항공대학교, 극지연구소 등이다. 이 간담에서는 자연어 검색 기능 등 인공지능을 통한 서비스 플랫폼의 자동화 논의가 주를 이뤘다. 한창헌 우주항공산업국장은 “산학연 전문가의 다양한 의견을 시스템 설계에 적극 수렴할 것"이라며 "향후 연구개발 과정에서도 전문가와 현장 의견에 귀 기울일 예정”이라고 말했다. 한 국장은 또 “앞으로 국가 위성정보 새로운 서비스 모델 창출을 위한 민간으로의 개방과 AI와의 융합 촉진에 대한 지원을 아끼지 않을 계획”이라고 덧붙였다.

2025.09.16 14:00박희범 기자

영상 편집도 클라우드로…메가존클라우드, 부산국제영화제서 제작 환경 시연

메가존클라우드가 부산국제영화제에서 클라우드와 인공지능(AI) 기술을 적용한 미디어 제작 솔루션을 선보인다. 메가존클라우드는 부산국제영화제의 일환으로 오는 20~23일 벡스코 제2전시장에서 개최되는 제20회 아시아콘텐츠&필름마켓(ACFM)에 아마존웹서비스(AWS)와 공동으로 참여해 부스를 개설한다고 16일 밝혔다. 해당 부스에서는 영상 기획부터 편집·렌더링·자산 관리·배포까지 전 과정을 클라우드 기반으로 연결하는 미디어 특화 솔루션 3종을 소개한다. 또 관람객이 클라우드와 AI 기술을 활용한 영상 편집 환경을 현장에서 직접 체험할 수 있도록 하고 공동 세션을 통해 방송과 영화 제작 현장에서 실제 적용된 클라우드 활용 사례도 공유된다. 최근 업계는 고품질 시각특수효과(VFX) 렌더링 수요와 생성형 AI를 통한 콘텐츠 제작량이 폭발적으로 증가하면서 기존 로컬 장비로는 감당하기 어려운 전환점을 맞이하고 있다. 이에 메가존클라우드는 관람객이 직접 클라우드 기반 제작 환경을 체험할 수 있는 공간을 마련해 장비의 한계를 넘어서는 차세대 제작 워크플로우를 현장에서 경험할 수 있는 기회를 제공할 계획이다. 부스에는 저사양의 체험용 노트북이 마련돼 관람객은 메가존클라우드의 클라우드 편집 솔루션 '스페이스 에디트'를 활용해 고사양 클라우드 인스턴스에 접속해 직접 영상을 편집해 볼 수 있다. 특히 외장 그래픽처리장치(GPU)가 없는 저사양 환경에서도 전문 영상 편집 소프트웨어인 '어도비 프리미어 프로'를 통해 다중 레이어 편집을 수행할 수 있어 일반적으로 로컬 장비에서는 어려운 작업을 클라우드 환경에서 자유롭게 체험할 수 있다. 또 메가존클라우드는 동일 프로젝트에 여러 노트북을 동시에 접속해 실시간 공동 편집하는 협업 기능도 시연한다. 이를 통해 영화·방송 제작 현장에서 여러 참여자가 하나의 프로젝트를 함께 편집하는 새로운 제작 방식을 확인할 수 있다. 이 외에도 트웰브랩스와의 협업을 통해 AI 기반 영상 검색과 편집 지원 기능을 시연한다. 관람객은 방대한 영상 데이터에서 원하는 장면을 AI로 빠르게 찾아내고 이를 편집에 반영해 볼 수 있다. 이번에 소개되는 미디어 특화 솔루션은 스페이스 에디트·렌더·DAM 등 세 가지다. 스페이스 에디트는 장소와 장비 제약 없이 인터넷 환경에서 어도비 프리미어 프로와 에디우스 등 고성능 편집 툴을 실행할 수 있는 클라우드 편집 솔루션이다. 스페이스 렌더는 대규모 렌더링을 신속하게 처리하고 비용과 자원 사용 현황을 실시간으로 관리할 수 있는 렌더링 솔루션이다. 스페이스 DAM은 영상·이미지·오디오 자산을 통합 관리하고 완성된 콘텐츠를 유튜브·OTT·방송 등 다양한 채널에 자동 변환·배포하는 콘텐츠 자산 관리 솔루션이다. 기술 세션에서는 메가존클라우드 엔지니어가 VFX 기반 광고 콘텐츠 제작사 래빗워크와 함께 스페이스 렌더를 활용해 업계 최초로 구축한 클라우드 렌더링 사례를 발표하며 실제 영상 프로젝트 과정에서의 문제 해결 과정을 공유한다. 컨퍼런스 세션에서는 시니어 솔루션즈 아키텍트가 웨타FX·넷플릭스와 같은 미디어·엔터테인먼트 고객들이 콘텐츠 제작, VFX 렌더링, 대규모 스트리밍, AI 기반 추천 등을 구현하기 위해 AWS를 어떻게 활용하는지를 공유한다. 참가자들은 원격에서도 동일한 편집 환경을 구현하는 방법과 분산 렌더링으로 시간을 단축하는 방법, 완성된 영상을 다양한 채널에 쉽게 배포하는 과정 등을 확인할 수 있다. 메가존클라우드 김승룡 미디어 유닛장은 "클라우드 전문성과 AI 기술을 바탕으로 미디어 제작 과정 전반을 효율적으로 연결해 제작자들이 기술적 제약에 구애받지 않고 창작에 집중할 수 있는 환경을 만들고 있다"며 "이번 ACFM 전시에서는 관람객들이 클라우드 기반 제작 방식을 직접 체험하고 실제 현장에서 어떤 변화를 가져올 수 있는지 구체적으로 확인할 수 있을 것"이라고 말했다.

2025.09.16 08:53한정호 기자

코오롱베니트, AI 얼라이언스와 '영상 비식별 솔루션' 출시…개인정보 규제 대응

코오롱베니트가 '인공지능(AI) 얼라이언스' 생태계를 주도하며 산업 분야별 전문기업과 함께 특화 서비스 개발에 박차를 가한다. 코오롱베니트는 인피닉과 협력해 CCTV 영상정보 비식별처리 솔루션을 출시한다고 15일 밝혔다. 이는 코오롱베니트가 인피닉의 AI 비식별처리 솔루션 '하이디 AI'와 해당 솔루션의 성능을 높일 하드웨어(HW)를 결합해 고객 활용도를 높인 프리패키지 제품이다. 코오롱베니트가 AI 얼라이언스 참여사와의 협력을 통해 개발하고 있는 프리패키지는 AI 기능을 손쉽게 도입할 수 있도록 소프트웨어(SW)·HW·기술 요소를 통합한 패키지형 솔루션이다. 빠르게 진화하고 있는 AI 기술을 활발히 수용하고 있는 캠퍼스, 오피스, 건설·제조 현장에서의 다양한 고객 수요에 주목한 코오롱베니트는 지난달 첫 프리패키지 3종을 출시했으며 앞으로도 지속적으로 신제품을 개발할 예정이다. 인피닉의 하이디 AI는 이미지와 동영상 속 개인정보를 AI로 자동 비식별화하는 서비스를 제공한다. 얼굴이나 차량 번호판 등 민감 정보를 블러 처리해 개인정보를 보호하면서도 데이터 품질을 유지해 활용성을 높인다. 특히 이 제품은 정보보호 국제표준을 반영해 유럽의 GDPR과 AI 액트, 미국 CCPA·CPRA, 일본 APPI 등 글로벌 개인정보보호 규정에도 대응할 수 있도록 설계됐다. 코오롱베니트는 저장 영상을 처리하는 솔루션 출시로 모든 시기에 촬영된 영상을 분석할 수 있는 영상 관제 분야 사업 역량을 갖추게 됐다. 지난달 노타와 함께 출시한 실시간 영상 분석 프리패키지 'VLM 영상 관제 솔루션'도 시장에서 확산되고 있다. 코오롱베니트는 인피닉과 협력한 솔루션 출시로 개인정보보호법상 비식별화 의무에 대응해 주택·건물·건설사·시행사 등에서 발생하는 영상 열람 요청에 따른 수동 편집의 복잡성과 비용 문제를 해소할 것으로 기대하고 있다. 또 관리 현장의 부담을 줄이며 신뢰성 있는 AI 학습용 데이터셋의 활용 환경을 마련하는 측면에서 시장성 역시 높다는 판단이다. 비식별처리 데이터는 드론·자율주행과 같이 영상 데이터와 관련한 명확한 규제가 필요한 신산업 분야에서 활용될 수 있다. 코오롱베니트 강재훈 AX커머스팀장은 "이번 패키지는 영상 데이터 비식별화 분야의 혁신적인 기술을 현장 적용 가능한 서비스로 패키지화해 제공하는 AI 얼라이언스의 협업 사례"라며 "참여사와의 긴밀한 협력으로 시장 수요를 선도하는 AI 프리패키지 제품을 지속적으로 선보일 것"이라고 밝혔다.

2025.09.15 15:50한정호 기자

포바이포-제노레이, 의료영상 AI 고도화 힘 모은다

포바이포가 의료기기 영상솔루션 시장에 본격 진출을 선언했다. 콘텐츠 AI 솔루션 기업 포바이포(대표 윤준호)는 X-선 진단 의료기기 전문기업 제노레이와 의료영상 AI 고도화에 대한 협력을 약속하는 전략적 업무 협약(MOU)을 체결했다고 4일 밝혔다. 이번 포바이포와 협약을 체결한 제노레이는 단층영상합성 기능이 탑재된 유방질환진단장비를 개발하고 콘빔 전산화단층촬영 중심의 덴탈 사업도 영위하고 있다. 특히, 이동형 엑스레이 'C-arm' 분야에서는 오랜 기간 높은 점유율을 유지하고 있는 의료기기 전문기업이다. 제노레이를 비롯한 X-선 기반 영상진단 의료기기 기업들은 최근 적은 선량으로 선명한 영상을 제공하기 위해 노력하는 추세다. 이번 협약을 계기로 제노레이와 포바이포는 보다 적은 선량으로 더 선명한 영상을 제공할 수 있는 협력방안을 찾아 추진한다는 계획이다. 포바이포는 자체 개발한 고유 모델인 화질 개선 AI 솔루션 '픽셀'을 제노레이 장비에서 획득한 의료영상 데이터에 곧바로 적용할 수 있도록 모델 최적화 작업을 진행할 예정이다. 제노레이는 포바이포가 제공한 AI 솔루션을 의료영상 데이터 처리 과정에 적용해 보고 실제 임상, 시술 환경에서 얼마나 기능하는지 평가한 후 결과를 제공하게 된다. 제노레이 관계자는 "더 적은 선량으로 보다 선명한 영상을 얻을 수 있다면 환자와 사용자가 더욱 신뢰할 수 있는 진단 서비스가 가능하게 될 것"이라며 "AI 영상 개선 솔루션의 적합도와 신뢰도를 꼼꼼하게 평가해 양사 모두에 유의미한 결과를 얻을 수 있도록 노력하겠다"고 말했다. 포바이포 배성완 솔루션사업본부장은 "왜곡된 이미지를 만들어 채워 넣는 오류가 빈번한 생성형 AI 모델과는 달리 AI픽셀은 비생성형 알고리즘을 채택한 모델"이라며 "사실성 보존이 가장 중요한 의료용 진단 영상, 범죄 현장을 촬영한 CCTV 영상 등을 원본 훼손 없이 개선할 수 있어 민감한 정보를 다루는 다양한 사업 영역에 진출할 수 있는 경쟁력을 가지고 있다"고 설명했다. 포바이포 픽셀은 클릭 한 번으로 영상의 화질을 최대 8K 수준으로 개선해 주는 화질 개선 AI 솔루션이다. 픽셀은 영상을 초고화질로 빠르게 업스케일링 해주면서도 전송 데이터 용량, 즉 비트레이트는 최대 50% 이상 절감해줄 수 있다.

2025.09.04 14:42백봉삼 기자

AI 어디까지 가나..."사진이나 영상 흐려도 말끔하게 복원"

인공지능(AI)이 한없이 진화하고 있다. 이번엔 활영 사진이나 영상 등이 흐릿해도 말끔하게 복원하는 기술이 개발돼 관심을 끈다. KAIST는 바이오및뇌공학과 장무석 교수와 김재철AI대학원 예종철 교수 연구팀이 움직이는 산란 매질(신호복제 환경) 너머의 숨겨진 영상을 복원할 수 있는 '비디오 디퓨전 기반 영상 복원 기술을 세계 처음 개발했다고 31일 밝혔다. 이 기술은 시간상으로 변한 영상 이미지 환경을 통해 흐릿하거나 손상된 부분을 디퓨전 모델 같은 생성형 AI모델로 되살린다. 안개·연기·불투명 유리·피부 조직 등과 같은 산란매질 때문에 '무엇인가에 가려 흐릿하게 보이는' 이미지를 마치 가려진 유리 뒤를 들여다보듯 복원한다. 연구팀은 기존 인공지능 복원 기술이 훈련된 데이터 범위에서만 성능을 발휘하는 한계를 극복하기 위해, 광학 모델과 비디오 디퓨전 모델을 결합했다. 특히 시간에 따라 산란 환경이 변하는 경우(바람에 흔들리는 커튼 너머 풍경 등)에도 안정적으로 복원할 수 있도록 연속된 영상의 시간적 상관관계를 학습한 디퓨전 모델을 적용했다. 이로인해 다양한 거리·두께·잡음 조건에서도 기존 대비 월등히 뛰어난 복원이 가능하다는 것. 기존 최고 성능의 복원 모델을 뛰어넘는 결과를 얻었다. 권성태 연구원은 "별도의 추가 학습 없이도 안개 제거, 영상 화질 개선(고해상도 프레임 생성), 블라인드 디블러링(흐린 영상 선명화) 등 다양한 상황에서 영상을 복원할 수 있는 최적화 기법을 도입해, 범용 복원 프레임워크로 확장할 가능성을 입증했다"고 설명했다. 장무석 교수 및 예종철 교수는 "혈액이나 피부 속을 들여다보는 비침습적 의료 진단, 화재 현장 연기 속 인명 구조, 벽에서 반사된 빛으로 영상을 복원하는 비시선 영상, 안개 낀 도로에서의 안전 운전 보조, 불투명 유리나 플라스틱 내부의 산업 검사, 흐린 물속 시야 확보 등 일상과 산업 전반에 활용될 수 있을 것"으로 기대했다. 연구는 KAIST 바이오및뇌공학과 권태성·송국호 박사과정이 공동 제1 저자로 참여했다. 인공지능 국제 학술지 IEEE TPAMI에 지난 13일 게재됐다. 과학기술정보통신부 및 한국연구재단 우수신진 연구자 사업, 뇌선도연구센터사업, 삼성미래기술육성사업, AI 스타펠로우십으로부터 연구 지원을 받았다.

2025.08.31 12:00박희범 기자

2D->3D로 쉽게 바꾸는 AI 알고리즘 개발…소요시간·비용도 8분의1 '확' 줄여

세포부터 반도체까지 단면 이미지를 3D로 실시간 만드는 솔루션이 개발됐다. 한국표준과학연구원(KRISS)은 주사전자현미경(SEM)으로 촬영한 생물학 시료 2차원 단면 이미지를 3차원 구조로 빠르게 형상화할 수 있는 '인공지능(AI) 기반 영상 분할 알고리즘'을 개발했다고 30일 밝혔다. 이 알고리즘은 세포부터 반도체까지, 3D 구현에 별다른 제한이 없다. 심지어 치과 등에서 촬영하는 엑스레이 사진도 3D 구현이 가능하다. 전체 이미지 데이터의 10%만 사람이 분석하면 나머지 부분은 AI가 자동으로 구조를 예측, 3차원으로 재구성한다. 사람이 모든 단면 이미지를 일일이 분석했던 기존 방식 대비 3차원 구조 관측에 소요되는 시간과 비용을 절반 이상 줄일 수 있다. 주사전자현미경(SEM)은 분석 대상의 단층을 수십 나노미터 간격으로 연속 촬영한 후, 확보한 단면 이미지들을 결합해 3차원 입체 구조로 재구성하는 장비다. 이 장비는 미세한 세포 내부 구조를 고해상도로 정밀하게 관측할 수 있어 생명과학 연구와 의료 진단 분야에 널리 활용된다. 단면 이미지를 재구성하기 위해서는 영상 분할이라는 전처리 과정이 필요하다. 이는 각 단면 이미지에서 세포핵, 미토콘드리아 등 분석 대상의 정확한 위치와 형태를 구분하는 작업이다. 불필요한 정보를 걸러내고 분석 대상을 선명하게 드러내는 과정이다. 그런데, 기존 영상 분할은 수백에서 수천 장에 이르는 단면 이미지를 전문가가 직접 확인하고 분석 대상을 수작업으로 표시하는 '지도학습' 방식을 이용한다. 막대한 시간과 인력이 필요하고, 연구자의 주관적 판단과 실수가 발생한다. 연구팀은 이 문제를 해결하기 위해 일정 간격으로 사람이 정답을 표기한 이미지를 기준으로 인접 단면의 정답을 자동으로 표시하는 '준 지도학습' 방식을 적용한 새로운 알고리즘을 개발했다. 1번부터 100번까지의 단면 이미지가 있을 때 10장 간격마다 사람이 레이블링(데이터 값(이름) 부여과정)한 기준 데이터를 삽입하면, 나머지 90장은 연구팀이 개발한 알고리즘이 레이블링을 수행, 전체 이미지를 분석한다. 미래선도연구장비그룹 윤달재 선임연구원은 "이 방법을 이용하면 AI 기반 3차원 구조 형상에 필요한 데이터셋(Dataset) 준비 시간과 비용을 대폭 줄일 수 있다"고 설명했다. 실제 쥐 뇌세포 데이터를 대상으로 한 성능 시험에서 연구팀이 개발한 알고리즘은 기존 방식과 정확도 차이가 3% 이내에 불과했다. 그럼에도 분석에 걸리는 시간과 비용은 약 8분의 1 수준으로 단축했다. 4096×6144 해상도의 대용량 데이터를 활용한 실험에서도 분석 정확도와 속도를 유지하며 안정적인 성능을 나타냈다. 윤 선임은 “이 기술은 생물학 분야뿐 아니라 반도체 결함 분석, 신소재 개발 등 영상 분석 자동화가 필요한 다양한 분야에서 쓰일 수 있다”며 “특히 개인정보 보호나 예산 부족 등으로 AI 학습데이터 확보가 어려운 영역에서 유용하게 활용할 수 있을 것”이라고 말했다. 연구는 KRISS 기본사업의 지원을 받았다. 연구성과는 지난 6월 현미경 영상 분석 분야 국제 학술지, 마이크로카피 앤 마이크로어날리시스(Microscopy and Microanalysis(IF 3.0))의 하이라이트 논문으로 선정돼 공개됐다. 한편 한국표준과학연구원 전략기술연구소 미래선도연구장비그룹에서 일해온 윤달재 선임연구원은 오는 9월 1일부터 충남대학교 정보통신융합과 교수로 이직한다.

2025.08.30 12:01박희범 기자

kt HCN, '방송인 AI 영상 공모전' 개인·단체 부문 동시 수상

kt HCN이 과학기술정보통신부가 주최하고, 한국방송통신전파진흥원이 주관하는 '2025 방송인 AI 영상 공모전' 개인 부문과 단체 부문에서 나란히 우수상을 수상하며 총 8개 수상작 가운데 2개를 차지하는 성과를 거뒀다고 26일 밝혔다. 이번 공모전은 국내 방송사에서 AI 기술을 활용한 자유 주제의 영상 콘텐츠 40여 편이 출품됐다. 이 가운데 kt HCN은 케이블TV 방송사 중 유일하게 수상 명단에 올랐으며, 개인과 단체 부문에서 모두 수상작을 낸 유일한 사업자로서 존재감을 입증했다. 개인 부문에서는 서울사업부 미디어팀 허승범 PD의 뮤직비디오 '우리, 동네, 사람들'이 우수작으로 선정됐다. 이 작품은 단절된 지역 내 관계 회복과 공동체 활성화를 주제로 삼았다. 일상의 이웃과 마을 사람들의 이야기를 AI 기술로 담아낸 감성 뮤직비디오 형식으로, 잊혀가는 지역 커뮤니티의 가치를 되살리고자 했다. 단순한 기술적 실험을 넘어, 지역성과 인간적인 메시지를 함께 녹여내며 작품의 완성도를 높였다. 단체 부문 우수상을 수상한 부산사업부 미디어팀 이주현 PD의 역사 다큐멘터리 '전사이 가도난'은 AI 기술을 활용해 동래부사 송상현을 현시대로 타임슬립해, 임진왜란 당시 동래성 전투와 일본군의 민간인 학살을 고발하는 내용을 담았다. 특히 송상현의 충절과 백성들의 희생을 내레이션과 영상 연출로 재현하며 지역의 역사적 사건을 소재로 하면서도, 오늘날에도 울림을 주는 교훈을 몰입감 있게 전달했다. 이번 성과는 콘텐츠 자체의 의미뿐 아니라, KT그룹 차원의 AI 역량 강화 노력과도 맞닿아 있다. kt HCN은 그룹과 연계해 AI 기술을 적극 활용하고 있으며, 실제로 전체 직원의 10%에 달하는 인원이 AI 자격증을 취득해 실무 역량을 강화했다. 원흥재 kt HCN 대표는 “kt HCN은 AI 기술을 지역 사회와 사람들의 이야기를 담아내는 매개로 삼아, 지역성과 공공성을 지키는 콘텐츠로 방송의 본질을 실현해 나가겠다”고 말했다.

2025.08.26 15:26진성우 기자

"독자 개발만으론 한계"…메타, 미드저니와 AI 동맹

페이스북 모회사 메타가 인공지능(AI) 이미지·영상 생성 스타트업 '미드저니' 기술 라이선스를 획득할 예정이다. AI 영역에서 독자 개발 중심 전략에서 벗어나 외부 파트너와 협력하는 방향으로 전환하며 경쟁력 강화에 나선다. 22일(현지시간) 파이낸셜타임즈 등 외신에 따르면 메타 신임 최고 AI 책임자인 알렉산드르 왕은 엑스(X)에 “향후 모델과 제품에 미드저니 미적 기술을 라이선스해 수십억명에게 아름다움을 제공할 것”이라고 양사 연구팀 간 기술적 협업을 예고했다. 이어 “자사가 사람들에게 최고의 제품을 제공하려면 모든 방식을 동원하는 접근이 필요하다”며 “이는 세계적인 수준 인재, 야심찬 컴퓨터 로드맵, 업계 최고 기업들과의 협력을 의미한다”고 덧붙였다. 미드저니는 2021년 데이비드 홀츠가 설립한 이미지 생성 기업으로 지난 6월에는 기존 이미지를 기반으로 짧은 영상을 생성할 수 있는 비디오 모델 'V1'을 선보였다. 이번 제휴를 통해 메타는 자사 앱에 멀티미디어 AI 생성 기능을 개발·통합할 수 있게 될 전망이다. 마크 저커버그 메타 최고경영자(CEO)는 플랫폼에서 AI 생성 콘텐츠가 점점 더 중요한 위치를 차지할 것이라고 언급한 바 있다. 메타의 이번 행보는 저커버그 CEO가 인간 지능을 뛰어넘는 '초지능' 개발에 수십억달러를 투입하는 과정에서 나온 것이다. 그는 최근 몇 달 간 경쟁사로부터 최고 수준의 AI 연구자를 적극적으로 영입했고 AI 인프라 투자도 대폭 늘렸다. 또한 AI 음성 기술 기업 플레이 AI를 인수하고 데이터 라벨링 기업 스케일 AI에도 지분을 투자했다. 아울러, 메타는 이번 주 자사 AI 조직을 재편한다고 발표했다. 메타의 AI 부서는 최근 메타 초지능 랩으로 이름이 변경됐으며 이번 개편으로 4개의 별도 팀으로 나뉘었다. 이는 지난 6개월 동안 네 번째 조직 개편에 해당한다. 메타와 미드저니의 협력은 메타의 기존 자체 AI 모델과 제품이 경쟁사에 밀리기 시작하면서 나온 것이다. 또 모든 것을 내부에서만 구축하려는 메타의 방식을 버리고 외부와 손잡는 전환점이다. 지난해 메타는 텍스트 프롬프트로 이미지를 생성하는 도구 '이매진'을 출시했다. 같은 해 10월에는 텍스트 프롬프트를 기반으로 영상을 생성, 편집할 수 있는 영화 생성 모델 '무비 젠'에 대한 연구 논문을 발표하며 이를 올해 인스타그램에 완전히 통합하겠다고 발표했다. 그러나 통합은 아직 이뤄지지 않았으며 이를 두고 업계 관계자들은 이미 해당 모델이 구글의 비오 3(Veo 3)나 오픈AI의 소라와 같은 최신 공개 모델과 비교해 구식으로 보인다고 평가하기도 했다. 이외에도 메타는 핵심 대형 언어 모델 비헤모스를 대외 공개하려던 계획도 접고 새로운 모델 구축에 집중하고 있는 것으로 알려졌다. 내부적으로는 코딩과 같은 업무에서 서드파티 모델을 사용하기 시작했다.

2025.08.24 09:25박서린 기자

홈쇼핑모아 "홈쇼핑 하이라이트 영상 기능, 구매전환율 최대 3배 증가”

버즈니(대표 남상협·김성국)는 '홈쇼핑모아'에서 홈쇼핑 상품의 주요 장면만 볼 수 있는 하이라이트 영상 기능이 상품의 구매전환율을 최대 3배 증가시킨다고 12일 밝혔다. 홈쇼핑모아는 올해 초 자사 숏폼AI 기술을 활용해 홈쇼핑모아 앱에서 홈쇼핑 방송의 주요 장면만 볼 수 있는 하이라이트 영상 기능을 추가했다. 해당 기능은 AI를 활용해 1시간가량의 홈쇼핑 방송 중 상품의 특장점 장면만 골라 볼 수 있다. 현재 홈쇼핑모아 앱에서 하이라이트 영상 기능이 제공되고 있는 제휴사는 신세계라이브쇼핑을 포함해 총 5곳이다. 홈쇼핑모아는 최근 한 달간 이용자의 하이라이트 영상 기능 이용 효과를 분석한 결과 하이라이트 영상 기능을 클릭한 이용자의 구매전환율은 일반 이용자의 평균 구매전환율 대비 1.96배 높은 것으로 조사됐다. 방송 타입별로 보면 홈쇼핑 생방송 상품에서 하이라이트 영상을 클릭한 이용자는 일반 이용자 대비 1.73배 구매전환율이 증가했고, 지난 방송 상품에서는 1.9배 증가한 것으로 분석됐다. 또 방송을 앞둔 상품에서는 구매전환율이 2.98배 증가해 홈쇼핑 방송 예정 상품 영역에서 하이라이트 영상의 구매전환율 상승 효과가 가장 뛰어난 것으로 조사됐다. 홈쇼핑모아 서비스 플랫폼 김한나 과장은 "이번 분석 결과 영상 하이라이팅 기술이 모바일 홈쇼핑 이용자의 편의를 증대하고 구매에 큰 영향을 끼치고 있는걸 알 수 있었다"며 "앞으로 홈쇼핑모아 이용자가 하이라이트 영상 기능을 더 많이 이용할 수 있도록 각 홈쇼핑사와 적극 협력해 적용 제휴사를 확대해 나갈 계획"이라고 말했다. 버즈니는 지난해 자연처리 분야 글로벌 최고 AI 학회 'EMNLP 2024에서 영상 검색 기술 관련 논문이 채택되는 등 영상 하이라이팅 관련 기술력을 인정받고 있다. 또 관련 기술을 서비스화한 '에이플러스 숏폼AI'의 경우 현재 신세계라이브쇼핑 등 국내 주요 커머스사에 제공되고 있다.

2025.08.12 16:19백봉삼 기자

Prev 1 2 3 4 5 Next