사이냅 OCR 프로, 비정형 서식 AI 학습도구 지원
사이냅소프트(대표 전경헌)는 이미지 문서 내 텍스트를 인식 및 추출하는 광학문자인식(OCR) 솔루션 '사이냅 OCR 프로' 업그레이드 버전을 출시했다고 22일 발표했다. 사이냅 OCR 프로는 다양한 유형의 이미지에 포함된 문자를 비롯해 표에 포함된 문자, 체크박스 체크여부 등을 데이터로 변환하는 AI OCR 솔루션이다. 인공지능(AI) 기반 딥러닝 기술을 통해 정확도를 향상시킬 수 있으며, GPU를 사용해 빠르고 정확하게 PDF 및 TIFF 등 각종 이미지 파일의 문자 인식을 지원한다. 한국정보통신기술협회(TTA)에서 시행한 OCR 제품 품질성능평에서 공공행정문서 인식률 99%의 성능을 인정받아 평가 대상 제품 중 가장 높은 점수를 획득한 바 있다. 사이냅 OCR 프로는 비정형 서식의 학습을 통해 키-밸류 추출을 지원하는 AI 기반 운영 및 학습 도구 '키밸류 트레이너'를 제공한다. 키밸류 트레이너는 최신 트랜스포머 모델 기반 '의미 개체 인식(SER)' 기술을 활용해 비정형 서식에서 유의미한 정보를 인식한다. 또한 딥러닝 모델을 학습하고 서비스하기 위해 필요한 데이터의 라벨링 및 학습, 평가, 배포, 운영 기능을 통합해 효율적이고 편리한 GUI 기반의 딥러닝 모델 관리 환경을 제공한다. 키밸류 트레이너는 비정형 서식 이미지의 키(Key)와 밸류(Value)의 학습을 기반으로 서식 정보 추출을 지원해 명함, 영수증, 신용카드, 통장사본 등 보다 다양한 양식의 문서를 더욱 빠르고 정확하게 처리할 수 있도록 지원한다. 이를 통해 문서 처리 작업을 자동화하는 RPA 등 다양한 분야의 업무에 사이냅 OCR 프로를 확장 적용해 활용성이 더욱 높아질 전망이다. 비정형 서식 학습 및 운영 도구인 키밸류 트레이너는 사이냅 OCR 프로 사용자에게 무상으로 제공된다. 이 외에도 업그레이드 버전에서는 인식 품질 개선을 포함해 서식 인식 기능 및 표 인식 품질이 대폭 개선됐다. 여기에는 손글씨, 날짜, 주민등록번호, 전화번호 등 숫자 인식과 체크 박스 검출 품질을 비롯해 서식 내 서명 여부 검출 기능, 회전된 이미지 내 표 인식의 품질 등 전반적인 기능의 강화가 포함된다. 표 인식과 서식 인식 결과를 기존 csv 형태 외에도 엑셀(xlsx) 파일로도 제공한다. 사용자가 텍스트 추출 결과를 손쉽게 편집하고 가공할 수 있도록 하여 변환한 데이터의 활용성을 높이고, 가시성을 더욱 개선할 수 있다. 전경헌 사이냅소프트 대표는 "이번 업그레이드를 통해 AI 기반 비정형 서식 학습 및 운영 도구를 제공하는 사이냅 OCR 프로는 내부 테스트 진행 결과 키 밸류 추출을 통해 템플릿 기반의 서식 외에도 반정형, 비정형 서식에서도 뛰어난 인식률을 보였다"면서, "앞으로도 다양한 도구와 기능을 추가해 고객에게 더 유용한 진정한 AI OCR 솔루션을 제공하는데 만전을 기할 것"이라고 밝혔다.