"고문서도 AI로”…로민, 진실화해위 기록물 디지털전환 완료
로민이 공공 기록물 디지털 전환(DX)과 문서 자동화 확산에 나선다. 로민은 진실화해를위한과거사정리위원회(진실화해위) 과거사 조사 업무에 다큐먼트 인공지능(AI) 플랫폼 '텍스트스코프 스튜디오' 구축을 완료했다고 5일 밝혔다. 이번 프로젝트는 진실화해위가 보유한 과거 사건 기록물 중 DX가 필요한 이미지 기반 문서를 정밀하게 인식하고 이를 구조화된 데이터로 전환하기 위해 추진됐다. 대상 문서에는 사진 촬영된 실환경 문자 이미지와 노이즈가 많은 고문서 영문 타자체 등 역사적 자료가 포함됐다. 로민은 자체 개발한 딥러닝 기반 AI 광학문자인식(OCR) 솔루션 텍스트스코프 스튜디오를 통해 고문서에 포함된 영문 타자체를 비롯한 다양한 형태의 문서를 정확도 높게 인식해 프로젝트를 완료했다. 이 솔루션은 흔들림·왜곡·저조도·그림자·팩스 노이즈 등 저품질 이미지에서도 높은 인식 성능을 보이며 타자체·인쇄체 필기체는 물론 복잡한 서체와 임의 배치된 텍스트도 정확히 인식할 수 있는 실환경 문자 인식 기술까지 갖추고 있다. 이번 구축은 구독형 서비스 형태로 제공됐으며 로민은 초기 사용 환경 설정과 함께 계정 제공, 기술 안내, 실시간 지원 체계를 마련해 운영 안정성을 확보했다. 모든 문서 데이터가 외부로 유출되지 않도록 학습 차단 설정과 보안 체계를 적용해 공공기관의 보안 기준을 충족시켰다. 앞서 로민의 솔루션은 특허청의 심판방식 자동화, 한국환경공단의 탄소중립포인트 제도 운영, 주택도시보증공사의 개인정보 보호 시스템 등 다양한 행정·공공기관에 도입돼 기술력을 입증받은 바 있다. 강지홍 로민 대표는 "이번 프로젝트를 통해 실환경 이미지와 노이즈가 많은 영문 타자체 고문서를 안정적으로 처리하는 고난도의 기술력을 입증했다"며 "앞서 국가기록원과의 협업을 통해 필기체와 타자체 등 복잡한 서체 인식 기술을 축적해 온 만큼, 이번 사례는 문서 AI의 활용 범위를 한층 넓힌 의미 있는 성과였다"고 밝혔다. 이어 "앞으로도 공공 기록물의 DX와 문서 자동화 확대에 기여하겠다"고 덧붙였다.