검색 - IT세상을 바꾸는 힘 지디넷코리아

ZDNet 검색 페이지

'영상분할'통합검색 결과 입니다. (2건)

태그
기간
- 3개월
- 1년
- 1년 이전

재검색

2D->3D로 쉽게 바꾸는 AI 알고리즘 개발…소요시간·비용도 8분의1 '확' 줄여

세포부터 반도체까지 단면 이미지를 3D로 실시간 만드는 솔루션이 개발됐다. 한국표준과학연구원(KRISS)은 주사전자현미경(SEM)으로 촬영한 생물학 시료 2차원 단면 이미지를 3차원 구조로 빠르게 형상화할 수 있는 '인공지능(AI) 기반 영상 분할 알고리즘'을 개발했다고 30일 밝혔다. 이 알고리즘은 세포부터 반도체까지, 3D 구현에 별다른 제한이 없다. 심지어 치과 등에서 촬영하는 엑스레이 사진도 3D 구현이 가능하다. 전체 이미지 데이터의 10%만 사람이 분석하면 나머지 부분은 AI가 자동으로 구조를 예측, 3차원으로 재구성한다. 사람이 모든 단면 이미지를 일일이 분석했던 기존 방식 대비 3차원 구조 관측에 소요되는 시간과 비용을 절반 이상 줄일 수 있다. 주사전자현미경(SEM)은 분석 대상의 단층을 수십 나노미터 간격으로 연속 촬영한 후, 확보한 단면 이미지들을 결합해 3차원 입체 구조로 재구성하는 장비다. 이 장비는 미세한 세포 내부 구조를 고해상도로 정밀하게 관측할 수 있어 생명과학 연구와 의료 진단 분야에 널리 활용된다. 단면 이미지를 재구성하기 위해서는 영상 분할이라는 전처리 과정이 필요하다. 이는 각 단면 이미지에서 세포핵, 미토콘드리아 등 분석 대상의 정확한 위치와 형태를 구분하는 작업이다. 불필요한 정보를 걸러내고 분석 대상을 선명하게 드러내는 과정이다. 그런데, 기존 영상 분할은 수백에서 수천 장에 이르는 단면 이미지를 전문가가 직접 확인하고 분석 대상을 수작업으로 표시하는 '지도학습' 방식을 이용한다. 막대한 시간과 인력이 필요하고, 연구자의 주관적 판단과 실수가 발생한다. 연구팀은 이 문제를 해결하기 위해 일정 간격으로 사람이 정답을 표기한 이미지를 기준으로 인접 단면의 정답을 자동으로 표시하는 '준 지도학습' 방식을 적용한 새로운 알고리즘을 개발했다. 1번부터 100번까지의 단면 이미지가 있을 때 10장 간격마다 사람이 레이블링(데이터 값(이름) 부여과정)한 기준 데이터를 삽입하면, 나머지 90장은 연구팀이 개발한 알고리즘이 레이블링을 수행, 전체 이미지를 분석한다. 미래선도연구장비그룹 윤달재 선임연구원은 "이 방법을 이용하면 AI 기반 3차원 구조 형상에 필요한 데이터셋(Dataset) 준비 시간과 비용을 대폭 줄일 수 있다"고 설명했다. 실제 쥐 뇌세포 데이터를 대상으로 한 성능 시험에서 연구팀이 개발한 알고리즘은 기존 방식과 정확도 차이가 3% 이내에 불과했다. 그럼에도 분석에 걸리는 시간과 비용은 약 8분의 1 수준으로 단축했다. 4096×6144 해상도의 대용량 데이터를 활용한 실험에서도 분석 정확도와 속도를 유지하며 안정적인 성능을 나타냈다. 윤 선임은 “이 기술은 생물학 분야뿐 아니라 반도체 결함 분석, 신소재 개발 등 영상 분석 자동화가 필요한 다양한 분야에서 쓰일 수 있다”며 “특히 개인정보 보호나 예산 부족 등으로 AI 학습데이터 확보가 어려운 영역에서 유용하게 활용할 수 있을 것”이라고 말했다. 연구는 KRISS 기본사업의 지원을 받았다. 연구성과는 지난 6월 현미경 영상 분석 분야 국제 학술지, 마이크로카피 앤 마이크로어날리시스(Microscopy and Microanalysis(IF 3.0))의 하이라이트 논문으로 선정돼 공개됐다. 한편 한국표준과학연구원 전략기술연구소 미래선도연구장비그룹에서 일해온 윤달재 선임연구원은 오는 9월 1일부터 충남대학교 정보통신융합과 교수로 이직한다.

2025.08.30 12:01박희범 기자

텍스트 입력만으로 3차원 영상 분할·편집 가능해져

건국대학교 공과대학 김원준 교수(전기전자공학부) 연구팀이 개발한 '고성능 개방형 어휘 3차원 영상 분할 알고리즘'이 컴퓨터 비전·인공지능(AI) 분야 세계 최고 권위 학술대회 중 하나인 국제 컴퓨터 비전학회(ICCV 2025)에서 공개된다고 9일 밝혔다. 연구팀은 텍스트 입력만으로 3차원 영상 내에서 사용자가 원하는 객체를 정밀하게 분할하고 편집할 수 있는 개방형 어휘 기반 3차원 영상 분할 기술을 구현했다. 논문은 오는 10월 미국 하와이에서 열리는 'ICCV 2025'에서 소개될 예정이다. 이번 연구는 서로 다른 시점에 존재하는 객체에 대한 언어 임베딩의 일관성을 유지하면서, 새로운 시점의 이미지를 생성할 수 있도록 언어 임베딩과 가우시안 스플래팅 파라미터를 동시에 학습하는 전략을 새롭게 제안한 것이 핵심이다. 또 대조적 학습 기법을 접목해 새로운 시점 이미지 내 객체 검출 성능을 향상시켰다. 연구팀은 정밀한 3차원 장면 렌더링은 물론, 생성된 이미지 상에서 텍스트 명령어를 기반으로 사용자 지정 객체 분할과 편집이 가능해졌다고 전했다. 이 기술은 앞으로 3D 콘텐츠 생성, 3차원 장면 이해, 이머시브 서비스 분야 등에서 활용할 수 있다. 이번 논문 제1저자는 건국대학교 장성민 석사과정생이며, 교신저자는 김원준 교수다. 연구는 과학기술정보통신부의 연구비 지원을 받아 수행됐다. 논문 제목은 'Identity-aware language Gaussian splatting for open-vocabulary 3D semantic segmentation'이다.

2025.07.09 08:04주문정 기자