• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
창간특집
인공지능
배터리
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'AI OCR'통합검색 결과 입니다. (18건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

'문서 AI'가 더 똑똑해졌다…"서류 속 문맥·구조까지 파악"

문서 인공지능(AI) 기술이 단순 텍스트 인식을 넘어 문맥·구조까지 이해하는 방향으로 진화했다. 복잡한 문서에서도 주요 정보를 자동 식별하고 고도화된 자동화 처리까지 가능해졌다. 11일 IT 업계에 따르면 최근 문서 처리 시장에서는 비전언어모델(VLM) 기반 광학 문자 인식(OCR) 기술이 주목받고 있다. 이 기술은 계약서, 보고서 등 여러 형식과 맥락으로 이뤄진 문서 속 표, 조항, 제목, 본문을 AI로 식별해 구조화된 데이터로 변환할 수 있다. VLM은 이미지와 언어 정보를 동시에 이해하는 AI 모델이다. 일종의 '이미지 전문가'와 '언어 전문가'가 한 팀처럼 협업하는 방식으로 작동한다. 우선 이 모델은 문서에서 표, 문장, 도장, 손글씨 등 다양한 이미지 요소를 구분한다. 이후 각 영역의 텍스트를 분석해 의미를 파악하고, 이를 종합적으로 해석한다. 이 과정에서 시각 정보와 언어 정보가 실시간으로 상호작용하며 정답을 조율한다. 정보 하나가 잘못 인식되면 다른 정보가 이를 보완하고, 누락된 부분은 이미지 단서를 활용해 추론하는 식이다. 예를 들어, 사용자가 계약서에 VLM 기반 OCR을 적용하면 '계약 당사자'와 '계약 기간' '주요 조항' '서명란' 등을 자동으로 식별해 체계적으로 정리할 수 있다. 이를 통해 문서 처리 자동화 수준을 높이고 반복 작업과 인적 오류를 줄일 수 있다. 기존 OCR은 이미지 속 텍스트를 디지털 문자로 바꾸는 데만 초점 맞췄다. 문서 레이아웃이나 의미적 맥락은 이해하지 못해 데이터 활용에 한계가 있었다. 이에 추가 인력이 이를 수작업으로 정리해야만 했다. VLM OCR, 정확도·사업성 모두 잡아 한국딥러닝은 '딥 OCR 플러스' 출시로 VLM OCR 서비스를 이미 상용화했다. 이 솔루션은 별도 학습 없이 여러 형식 문서를 처리할 수 있다. 한국어·영어·숫자·특수문자가 섞인 복잡한 구조도 정확하게 인식할 수 있도록 설계됐다. 딥 OCR 플러스는 문서의 표나 문단을 자동 분석해 핵심 정보를 요약하고, 추출 데이터를 표준 포맷으로 제공해 업무 시스템과 연동된다. 한국딥러닝은 이 솔루션으로 문서 검토 시간을 최대 80% 줄이고, 일관된 데이터 품질을 유지할 수 있다고 강조했다. 앞서 업스테이지도 AI 기반 문서 구조화 솔루션 '다큐먼트 파스'를 출시해 보험, 금융, 의료 등 산업 현장에서 문서 자동화를 지원하고 있다. 고정밀 벤치마크에서 아마존·마이크로소프트 모델보다 높은 정확도를 기록한 것으로 전해졌다. 올해 6월 모델 '솔라'를 결합한 '솔라 다큐브엘엠'도 출시한다. 솔라 타큐브엘엠은 시각 정보와 언어 정보 통합 처리 역량을 강화해 문서 기반 요약, 질의응답, 자동 분류까지 수행할 수 있도록 구성됐다. 특히 비정형 문서나 복잡한 레이아웃 문서에서도 높은 인식률을 보일 것이란 평가를 받고 있다. 김지현 한국딥러닝 대표는 "비전 OCR은 돈 버는 AI"라며 "정확도와 사업성을 모두 잡을 수 있는 실용 기술"이라고 강조했다.

2025.05.11 14:40김미정

[기고] 텍스트만 읽는 AI는 한계…이미지까지 이해하는 'VLM 시대' 왔다

텍스트만 바라보던 인공지능(AI)이 이미지도 읽기 시작했다. 생성형 AI 열풍 정점에 서 있던 거대언어모델(LLM)이 세상을 바꾼 지 채 2년이 되기도 전에 산업계는 벌써 비전언어모델(VLM) 이라는 새로운 반열을 주목하고 있다. LLM은 인터넷 전체에 해당하는 방대한 문서, 코드, 게시글 등을 토큰 단위로 분해해 빈도와 순서를 학습하는 통계 기반 언어 모델이다. 이를 통해 문장 구조, 주제 흐름, 단어 간 연관도 등을 정교하게 파악할 수 있다. 그러나 LLM은 픽셀로 구성된 시각 정보를 직접 해석하지 못한다. 특히 스캔본 한 장 안에 담긴 표, 도장, 서명, 손글씨, 이미지 등 다양한 비정형 요소 앞에서는 입력 자체를 받지 못해 무력해진다. 이 때문에 반드시 광학문자인식(OCR)을 거쳐 텍스트로 전처리한 후에야 분석이 가능하다. 이 과정에서 발생하는 정보 손실이나 오인식이 전체 모델 성능에 결정적 영향을 미친다. 이 한계를 근본적으로 보완하는 방식이 VLM이다. VLM은 쉽게 말해 '사진 전문가'와 '언어 전문가'가 한 팀이 된 모델이다. 우선 이미지를 보고 표, 문장, 도장, 필기 영역을 구분한 후 텍스트 기반으로 의미를 해석한다. 이를 실시간으로 교차 어텐션(Cross-Attention) 층에서 주고 받으며 정답을 보정한다. 한 영역이 잘못 인식되면 다른 쪽이 보완하고, 누락된 정보는 이미지의 시각 단서 바탕으로 추론해 빈칸을 채운다. 언어와 시각 정보가 동일 공간에서 상호작용하듯 작동하는 식이다. 구조가 복잡하거나 손글씨가 섞인 문서도 훨씬 자연스럽게 이해할 수 있다. 예를 들어 물결 무늬 배경 때문에 일부 금액 텍스트가 흐릿해진 스캔 이미지에서도 VLM은 표 헤더와 숫자 패턴을 근거로 '이 칸은 청구 금액일 것'이라고 추론한다. 텍스트만 해석하던 기존 LLM 방식과 달리, VLM은 이미지와 문장이 함께 대화하는 구조로 작동하기 때문에 비정형 문서에 강력한 성능을 발휘한다. 실제 산업 현장에서 VLM 기반 OCR은 이미 도입 초기부터 기존 접근법보다 뚜렷한 개선 효과를 보이고 있다. 이미 업계에서는 VLM을 통한 생산성 향상 효과가 나오고 있다. 신생 물류기업 L사는 하루 평균 4만 장의 송장을 스캔하는데, 양식 종류가 600종을 넘어서면서 OCR 오류율이 18%까지 상승했다. VLM을 탑재한 OCR을 적용한 결과 첫 달에 오류율이 4%까지 떨어졌고, 급히 투입된 15명의 검수 인력을 4명으로 줄일 수 있었다. 금융·보험 분야에서도 VLM은 의미 있는 변화를 만들어냈다. 보험 손해 사정사 워크플로에 도입된 VLM 기반 OCR 엔진은 의료 영수증, 처방전, 수기 메모가 섞인 PDF 문서를 분석해 질병 코드와 치료 기간, 총 청구액 등 핵심 정보를 의미 단위로 자동 매핑했다. 결과적으로 도입 3개월 만에 평균 심사 시간이 건당 4.7분 단축됐다. 부실 청구 탐지율은 2.3배 향상됐다. 실질적인 VLM 구현을 위해선 세 가지 핵심 과제가 수반된다. 첫째는 중앙처리장치(GPU) 비용이다. 이미지 해상도가 높을수록 메모리 요구량은 기하급수적으로 증가한다. 둘째는 데이터 보안이다. 문서 이미지에는 신분증과 도장, 주소 등 민감한 개인정보가 포함된다. 저장 암호화와 접근 제어 등 보안 설계가 모델 설계 초기부터 명확히 반영돼야 한다. 마지막으로 운영 측면에서의 ML옵스 통합이다. VLM은 텍스트와 이미지 양쪽에서 오류가 누적될 수 있으므로, 라벨 재검수·재학습 주기를 기존보다 촘촘하게 설정해 지속적 품질을 수행해야 한다. 이런 기술 과제를 극복할 수 있다면 VLM은 단순 OCR을 넘어 멀티모달 로봇프로세스자동화(RPA)로 진화할 수 있다. VLM이 문서 의미를 이해하게 되면 수준 높은 복합 워크플로까지 자동화할 수 있을 것이다. 실제 모바일 스캐너나 드론 카메라처럼 네트워크 지연이 큰 현장에서는 경량화된 VLM을 엣지 디바이스에서 구동하는 방향으로 연구가 진행되고 있으며, 실제 적용 사례도 점차 증가하고 있다. 유럽연합(EU)의 AI법 등 주요 규제는 이미지 데이터의 편향성과 프라이버시를 명확히 규정하기 시작했다. 이로 인해 향후 VLM 개발자는 학습 데이터셋의 출처와 라벨링 과정을 투명하게 기록해야 하는 책임도 함께 지게 될 전망이다. 기업과 공공기관이 다양한 형식의 데이터를 한 눈에 이해하는 AI를 원한다면 VLM OCR 전략을 로드맵에 포함해야 한다. 문서 인식부터 업무 자동화까지 이어지는 다음 혁신의 축은 '텍스트‑이미지 융합형 AI'가 될 가능성이 크다. 현재 기술 기업들의 도전이 이 변화를 앞당기고 있으며, 실제 도입 성공 사례는 더 빠르게 쌓일 것이다. 텍스트 AI만으로 충분하다고 느끼는 지금 이 순간이, 어쩌면 VLM 전환을 준비할 마지막 골든타임일지 모른다.

2025.04.30 15:54김지현

사이냅소프트, '사이냅 에디터' 공개…그룹웨어 시장 장악 나선다

사이냅소프트가 웹 에디터 솔루션을 앞세워 그룹웨어 시장 공략을 본격화하고 있다. 단순 편집 도구를 넘어 협업 생산성의 '핵심 솔루션'으로 거듭나며 정체된 웹 에디터 시장에 세대교체 바람을 일으키려는 포석이다. 사이냅소프트는 최근 회사의 '사이냅 에디터' 최신 버전을 선보이며 가비아, 고우아이티, 필라넷, 코디얼, 비즈웰, GS비즈풀 등 다수의 그룹웨어 및 협업 플랫폼에 에디터를 공급하기 시작했다고 10일 밝혔다. 이 제품은 현재 웹 오피스 수준의 기능을 지원하는 독보적인 웹 기반 문서 작성 도구로 평가받는다. '사이냅 에디터'는 기존 웹 에디터가 제공하지 못한 마이크로소프트(MS) 오피스 호환 함수, 도형 편집, AI 기반 자동 문서 생성, 이미지에서 텍스트와 표를 추출하는 인공지능(AI) OCR 기능까지 갖췄다. 특히 기존 문서를 불러와 재활용할 수 있는 '임포트' 기능은 사용자들의 문서 작성 속도를 크게 끌어올리고 있다. 신버전인 '사이냅 에디터 3.0'은 웹 오피스에서만 제공되던 '동시 편집' 기능을 웹 에디터에서도 구현해 협업 환경의 질을 한층 끌어올렸다. 다수의 사용자가 동시에 같은 문서를 수정할 수 있는 환경을 마련하면서 문서 협업의 실시간성과 효율성을 모두 확보했다. 워드, 엑셀, 파워포인트, 아래아한글 등 다양한 문서 포맷을 그대로 편집할 수 있는 점도 강점이다. 기존 웹 에디터의 범용성 부족 문제를 해결하고 다중 형식 문서를 자유롭게 다룰 수 있도록 하며 문서 작업의 제약을 대폭 줄였다. 사이냅소프트는 최근 파일 업로드 솔루션인 '사이냅 업로더'도 선보였다. 사이냅 에디터와 함께 문서 뷰어까지 포함한 문서 솔루션 패키지를 완성해 그룹웨어·협업툴을 위한 토털 제공업체로 자리매김하고 있다. 특히 '사이냅 에디터'는 굿 소프트웨어(GS) 인증 1등급을 획득해 제품 품질과 신뢰성까지 확보한 상태다. 기술력, 기능성, 안정성에서 모두 인증받은 제품이라는 점에서 공공기관과 기업 고객의 도입을 더욱 유도하고 있다. 전경헌 사이냅소프트 대표는 "웹 에디터 시장에서 '사이냅 에디터'로의 세대교체가 가속화되고 있다"며 "고객의 업무를 혁신적으로 변화시킬 수 있는 도구로 자리 잡으며 기업과 기관에서 새로운 에디터 도입을 고려할 만한 충분한 이유를 제공하고 있다"고 말했다. 이어 "향후 많은 기업들이 '사이냅 에디터'를 도입해 생산성과 협업의 새로운 가능성을 열기를 기대한다"고 밝혔다.

2025.04.10 15:33조이환

한국딥러닝 "문맥까지 이해하는 OCR 시대 왔다…업무 자동화 핵심 될 것"

"광학문자인식(OCR) 성장 잠재력은 무궁무진합니다. 문서 디지털화로 OCR 역할이 늘어날 것이기 때문입니다. 이럴수록 정확하면서도 안전한 OCR 서비스가 필요합니다. 한국딥러닝은 자체 모델 '딥 이미지'를 통해 이런 OCR 서비스를 맞춤형으로 공급하고 있습니다. OCR을 단순히 문서 인식하는 기술이 아닌 업무 자동화 핵심으로 만들 것입니다." 김지현 한국딥러닝 대표는 지디넷코리아 인터뷰에서 자사 OCR 서비스 특장점을 소개하며 이같이 밝혔다. 김지현 대표는 2019년 한국딥러닝을 설립했다. 22세 대학생이던 때다. 학창 시절부터 개발자 부모 영향으로 자연스럽게 코딩을 접했다. 스타트업에서 대학생 인턴으로 근무하며 창업을 결심했다. 그는 "당시 딥러닝 기술이 확산하던 때"였다며 "AI 기술이 다양한 산업에 스며들 것으로 판단해 회사를 설립했다"고 밝혔다. 김 대표는 창업 전부터 텍스트와 이미지, 영상, 음성 데이터를 수집했다. 이를 통해 자체 거대비전언어모델(LVLM) 딥 이미지를 내놨다. 딥 이미지는 텍스트와 이미지를 동시에 처리·생성할 수 있다. 텍스트·이미지 데이터가 상호작용하며 분석을 수행한다는 점에서 멀티모달 모델과 다르다. 이 모델은 현재 1억 장 넘는 이미지를 학습했다. 이를 기반으로 광학문자인식(OCR)을 비롯한 객체 검출, 영상 이해, 이미지 생성, 3D 모델 생성 등 다양한 비전 AI 솔루션을 제공한다. 한국딥러닝은 모델 개발과 운영을 위해 자체 그래픽처리장치(GPU) 서버와 분산처리시스템을 온프레미스 형태로 갖췄다. 김 대표는 "모델 초기 투자비와 유지비 부담이 컸다"며 "고효율 분산 학습 알고리즘을 통해 비용을 줄였다"고 설명했다. 이어 "서버는 스케일아웃 방식으로 확장 가능하도록 설계했다"며 "비용 문제는 고객사와 기술협력·장기계약을 통해 해결했다"고 덧붙였다. "기업 맞춤형으로 제공…정확도·보안·유연성 높아" 김지현 대표는 자사 OCR 특장점으로 높은 정확도, 유연성, 보안성을 꼽았다. 한국딥러닝은 각 태스크와 프로젝트 특성을 반영한 맞춤형 OCR을 제공한다. 단순히 글자를 인식하는 데 그치지 않고, 문서 맥락과 레이아웃을 고려해 필요한 정보를 정확히 추출하는 것이 강점이다. 김 대표는 "문서 폼이 다양하면 OCR 인식 정확도가 떨어진다"며 "이는 OCR 기술이 주로 정형화된 폼에만 최적화됐기 때문"이라고 설명했다. 그는 "딥이미지의 OCR은 다양한 폼의 문서 수십만 건을 분석하고 필요한 데이터를 일관성 있게 정리할 수 있다"고 말했다. 김 대표는 자사 OCR이 높은 보안성을 갖췄다고 강조했다. 현재 온프레미스 형태로 OCR 서비스를 제공하고 있어서다. 이에 문서 데이터가 외부로 나가지 않고 기업 내부에서 처리된다. 반면 타사 OCR 서비스는 인터넷 기반의 클라우드 환경에서 작동한다. 사용자가 문서 파일을 외부 서비스에 올려야 한다는 의미다. 이 과정에서 민감 정보가 외부로 전송될 수 있다. 한국딥러닝은 온프레미스 외에도 프라이빗 클라우드와 가상 프라이빗 클라우드(VPC)상에서 서비스를 지원한다. 김 대표는 OCR 서비스가 키-밸류 추출과 맞춤형 폼 변환 기능을 통해 높은 유연성을 갖췄다고 설명했다. 키-밸류 추출은 문서에서 중요한 정보(키)와 그에 해당하는 값(밸류)을 자동으로 찾아내는 기능이다. 예를 들어 신청서에서 이름과 생년월일, 전화번호가 키다. 여기에 입력된 내용이 밸류다. 김지현 대표는 "보통 OCR은 문서 속 텍스트만 인식한다"며 "필요한 정보를 찾기 위해 추가 작업이 필요하다"고 말했다. 이어 "자사 OCR은 문서 구조를 분석해 필요한 정보만 정확히 추출한다"며 "고객은 원하는 데이터를 빠르게 찾을 수 있다"고 강조했다. "OCR 잠재력 무한대"…이미지 분석으로 해외 공략 김지현 대표는 OCR 사업 확장 가능성이 더 커질 것이라고 내다봤다. 그는 "앞으로 문서는 디지털 데이터로 변환될 것"이라며 "OCR이 이 부분에서 큰 역할을 할 것"이라고 예측했다. 또 "거대언어모델(LLM) 기술이 발전하면서 OCR과 챗봇, 에이전트 연계 활용도 가능해질 것"이라며 "이에 따른 OCR 사업 확장 가능성도 높다"고 덧붙였다. 김 대표는 솔루션을 해외 시장에 적극 공급할 예정이다. 현재 인도네시아 건설사에 도로와 터널 균열을 감지하는 이미지 분석 솔루션을 제공하고 있다. 그는 "언어 장벽이 있는 OCR 대신 이미지 디텍션, 세그멘테이션, 분류 서비스로 해외 시장을 노릴 것"이라고 말했다. 한국딥러닝은 올해 OCR 기반 데이터 수집·정제 작업에 집중할 계획이다. 김 대표는 "OCR로 변환한 문서를 디지털화한 후 챗봇이나 전사적자원관리(ERP) 시스템에 적용할 수 있도록 가공하는 것이 목표"라며 "OCR을 단순히 문서를 인식하는 기술이 아닌 업무 자동화 핵심 요소로 만들 것"이라고 강조했다.

2025.02.07 15:07김미정

로민, 과기정통부 장관 표창 수상…"우정사업본부 협력 디지털화 성과"

로민이 인공지능(AI) 기반 디지털 전환의 성과를 인정받아 과학기술정보통신부 장관 표창을 수상했다. 공공 서비스의 디지털화와 업무 효율성을 높이는 데 기여한 결과다. 로민은 이번 수상이 지난해 우정사업본부와 협력해 AI OCR 기반 필기체 인식 시스템 시범 운영을 성공적으로 완료한 성과에서 비롯됐다고 14일 밝혔다. 동작우체국과 남부천우체국에서 진행된 이 프로젝트는 기존 수작업으로 처리되던 우편 업무를 자동화하며 업무 효율성과 서비스 품질을 동시에 향상시키는 데 중점을 뒀다. 로민의 다큐먼트 AI 플랫폼 '텍스트스코프 스튜디오'는 다양한 필체를 정밀하게 인식하는 기술로 자동 주소 보정 및 데이터 검증을 지원했다. 이를 통해 문서 처리 오류를 줄이고 창구 직원의 반복 업무 부담을 완화했다. 이러한 기술은 창구 서비스의 신속성과 정확성을 높이는 데 크게 기여했으며 우정사업본부의 장기 디지털 전략에도 중요한 전환점이 될 것으로 전망된다. 또 로민은 산업통산자원부 혁신제품 인증, 신제품 인증(NEP), 신기술 인증(NET)을 모두 보유한 국내 유일의 다큐먼트 AI 기업으로, 지난해 우수조달물품으로 지정돼 공공 시장에서도 주목받고 있다. 강지홍 로민 대표는 "우정사업본부와의 협력은 공공 서비스의 미래를 재정의하는 전환점이었다"며 "올해는 텍스트스코프를 예금과 보험 등 다양한 업무에 확대 적용해 국민들에게 더 나은 서비스를 제공할 것"이라고 밝혔다.

2025.01.14 15:36조이환

"AI로 문서 대조 효율화"…로민, LS증권 법무 시스템에 솔루션 구축

로민이 자사의 인공지능(AI) 문서 대조 솔루션을 통해 금융권 문서 관리 효율성을 대폭 개선했다. 로민은 지난 17일 LS증권이 법무 관리 시스템에 회사의 '텍스트스코프 디프(Diff)'를 성공적으로 구축했다고 19일 밝혔다. 이 솔루션은 문서 간 변경 사항을 자동으로 검출하고 시각화해주는 AI 기반 기술로, 기존 서비스에 비해 신속하고 정확한 문서 대조가 가능하다. '텍스트스코프 디프'는 고성능 광학 문자 인식(OCR) 기술을 활용해 스캔 문서나 이미지에서도 텍스트를 추출할 수 있다. PDF, PNG, JPG 등 다양한 파일 형식을 지원하며 단순 텍스트 비교를 넘어선 정밀한 대조 결과를 제공한다. 이번 도입으로 LS증권은 계약서, 약관, 감사 보고서 등 주요 문서 검토 시간과 노력을 대폭 절감하게 됐다. 특히 문서 대조 과정에서 발생할 수 있는 오류를 줄이고 변경 사항을 명확히 파악할 수 있게 돼 법무 관리의 신뢰성을 높이는 데 성공했다. 로민은 '텍스트스코프 디프'의 애플리케이션 프로그램 인터페이스(API)를 통해 LS증권 기존 시스템과 자연스럽게 연동했다. 별도의 시스템 재구축 없이 기존 업무 흐름을 유지하며 자동화 솔루션을 적용할 수 있도록 설계됐다. 또 온프레미스 방식을 통해 민감한 데이터를 안전하게 보호하는 점도 금융권의 신뢰를 받았다. 로민은 금융권뿐 아니라 공공기관과 제조업 등 다양한 산업군으로도 시장을 확대하고 있다. 신한은행, KB국민카드, 우정사업본부, 현대자동차 등 다양한 기업과 기관에서 문서 처리 자동화 프로젝트를 진행 중이다. 강지홍 로민 대표는 "'텍스트스코프 디프'는 정밀한 문서 관리가 필요한 금융권에서 혁신적인 효율성을 제공한다"며 "다큐먼트 AI 기술로 산업 전반의 문서 관리 혁신을 선도하겠다"고 밝혔다.

2024.12.19 15:28조이환

교보생명·특허청이 선택한 AI 기업…'로민'의 성장 비결은

"단일 기술로는 업무 자동화가 이뤄지지 않습니다. 이에 우리는 문서를 읽고 이해하며 자동으로 처리하는 통합 솔루션을 개발했습니다. 고객사의 업무를 자동화함으로써 효율을 극대화하고 비용을 절감하는 것이 우리의 목표이기 때문입니다." 강지홍 로민 대표는 25일 기자와 만나 회사의 핵심 기술과 성장 전략에 대해 이같이 밝혔다. 로민은 올해로 창업 7년차를 맞은 국내 AI 기업으로, 초기에는 광학 문자 인식(OCR)으로 시작해 도큐먼트 인공지능(document AI) 분야에 매진하는 등 문서 인식 분야에 집중해 왔다. 강 대표와 임비 공동 창업자는 지난 2018년 서울대학교에서 컴퓨터비전 전공으로 박사 과정을 밟던 중 기술력에 기반한 비즈니스를 만들겠다는 목표로 회사를 설립했다. 강 대표는 외부 투자 없이도 회사가 성장을 이어가고 있음을 강조했다. 그는 "기술력을 바탕으로 실제 고객의 니즈에 맞는 솔루션을 제공하는 데 집중했다"며 "초기에 정부의 연구개발(R&D) 과제를 수행하며 기술 기반을 다졌고 이후 지속적으로 매출을 내면서 자립적으로 운영해 왔다"고 말했다. 이러한 지속적인 성장의 비결은 바로 '텍스트스코프(Textscope)' 스튜디오에 있다. 로민의 주력 제품군인 '텍스트스코프 스튜디오'는 문서를 읽고 이해하고 활용하고 학습하는 통합 솔루션이다. 리드(Read) 기능은 OCR 기술과 문서 레이아웃 분석을 통해 이미지 형태의 문서에서 텍스트와 구조 정보를 추출한다. 언더스탠드(Understand) 기능은 추출된 데이터를 기반으로 문서의 종류를 자동으로 분류하고 필요한 정보를 파악해 정형화된 데이터로 변환한다. 이는 비정형 문서에서도 정확하고 효율적인 데이터 추출을 가능하게 해 업무 자동화에 필수적이다. 강 대표는 "실제로 보험사나 무역회사 등에서는 다양한 양식의 문서를 수작업으로 처리하는 데 많은 시간이 소요돼 비효율적"이라며 "우리의 솔루션을 사용하면 문서를 자동으로 분류하고 필요한 정보만 추출해 전산에 입력할 수 있어 업무 효율을 크게 높일 수 있다"고 설명했다. 액트(Act) 기능은 고객사가 보유한 비정형 데이터를 효율적으로 검색, 요약, 질의응답할 수 있도록 지원한다. 런(Learn) 기능은 폐쇄망 환경의 금융권 및 공공기관을 위해 내부에서 직접 AI 모델을 학습할 수 있는 기능을 제공한다. 이 두 기능은 생성 AI와 연계돼 고객사 맞춤형 솔루션을 제공하고 비정형 데이터의 활용도를 높이는 데 중요한 역할을 한다. 기술 기업으로서 로민은 인력 구조에서도 차별화를 보인다. 전체 인원의 70%가 개발자이며 팀도 세분화되어 있다. 특히 데이터팀을 따로 운영하는 것이 다른 회사와의 차별점으로, 그 이유는 보안과 효율성에 있다. 강 대표는 "금융권과 공공기관 등 보안을 중시하는 고객사들은 데이터의 외부 반출을 꺼린다"며 "데이터를 외부에 맡기지 않고 직접 처리함으로써 고객의 보안 요구 사항을 충족하고 필요한 데이터를 신속하게 확보할 수 있다"고 강조했다. 로민의 기술력은 이미 주요 산업 분야에서 인정받고 있다. 교보생명은 보험금 청구 문서를 자동으로 분류하고 필요한 정보를 추출해 전산에 입력하는 시스템을 도입했다. 이를 통해 수작업으로 처리하던 업무를 자동화해 효율성을 크게 높였다. 또 특허청은 로민의 솔루션을 활용해 특허 심사 과정에서 제출되는 서류의 형식 검토와 내용 분석을 자동화했다. 기존에는 사람이 일일이 검수하던 작업을 자동화함으로써 업무 속도와 정확성을 향상시켰다. 가장 최근에는 과학기술정보통신부가 개최한 '디지털 이노베이션 페스타(디노) 2024' 행사에서 우정사업본부와 함께 실증 사업의 성과를 시연해 큰 호응을 얻은 바 있다. 이 행사에서 로민은 우체국 창구에서 접수되는 우편물의 정보를 자동으로 인식하고 전산에 입력하는 시스템을 선보였다. 강 대표는 "'디노'에서의 시연을 통해 악필도 정확하게 인식하고 비정형으로 기재된 주소도 표준화해 처리하는 기술을 시연했다"며 "우체국 현장에서 실제로 적용될 수 있는 수준의 이 기술은 숙련된 직원보다도 빠르게 업무를 처리할 수 있어 업무 효율화를 기대할 수 있다"고 말했다. 로민은 국내 시장을 넘어 해외 진출에도 박차를 가하고 있다. 미국과 일본 시장을 목표로, 각각 무역 관련 비정형 문서 처리 솔루션과 OCR 중심의 일반 문서 처리 솔루션을 제공할 계획이다. 강 대표는 "미국 시장에서는 무역 관련 업무 처리 분야에 특화된 솔루션으로 진출할 것"이라며 "특히 무역 분야 서류는 양식이 통일돼 있지 않고 비정형성이 강해 우리의 기술이 경쟁력을 발휘할 수 있다"고 설명했다. 그러면서 "일본은 아직 아날로그 문화가 강하게 남아 있어 OCR 기술만으로도 시장성이 크므로 문서 자동화 솔루션을 일반적으로 제공해 시장을 공략할 것"이라고 밝혔다. 로민은 향후 국내 공공기관과의 협업도 확대할 계획이다. 제1금융권 내에서는 이미 충분한 인지도를 확보했지만 공공기관에서는 아직 사업 확장의 높일 여지가 남아있기 때문이다. 강 대표는 "공공시장에 대한 영업망을 확충하고 우수 조달 물품 선정과 신제품(NEP) 인증을 통해 수의계약과 조달청 디지털서비스몰 입점을 완료했다"며 "공공기관 시장을 위해서 공개입찰 등을 적극적으로 공략하며 우리의 솔루션을 더욱 널리 제공할 계획"이라고 밝혔다. 그러면서 "앞으로도 목표 지향적인 조직 문화를 유지함으로써 기술 혁신을 통해 AI 업계를 선도하는 기업이 되겠다"고 강조했다.

2024.10.25 14:26조이환

한전, SW로봇 활용해 전기요금 복지할인 자격검증 자동화

한국전력(대표 김동철)은 인공지능(AI)과 광학문자인식(OCR) 기술을 접목한 '전기요금 복지할인 자격검증 RPA(Robotic Process Automation)'를 개발, 단계적 시범운영을 거쳐 10월부터 본격적으로 전국 사업소에서 확대 시행했다고 22일 밝혔다. 장애인, 다자녀 가구, 저소득층, 출산 가구 등 8개 복지 유형에 전기요금 할인 혜택을 제고하고 있는 한전은 그동안 매월 복지할인 혜택을 받는 고객 자격 검증과 증빙자료 확인을 수작업으로 해 왔다. 한전은 이 같은 반복 업무를 RPA로 자동화해 복지할인 대상자적정 여부를 신속하게 판별하고 부정수급을 조기에 예방함으로써 58억원의 비용 절감과 함께 복지할인이 꼭 필요한 고객에게 혜택이 돌아갈 것으로 예상했다. 또 시범운영 결과 업무 효율이 약 80% 높아지는 등 직원 만족도와 업무 속도가 개선된 것으로 조사됐다. 한전은 영업·송배전·ICT 등 업무 전반에 걸쳐 70종의 맞춤형 RPA를 통해 연간 30만 시간의 업무시간을 단축하고 연간 5억원에 이르는 라이선스 비용을 절감하고 있다. 올해 확대 개설한 한전 인재개발원 실습 교육 과정을 통해 향후 매년 약 100명의 RPA 전문인력을 양성할 계획이다. 한전은 앞으로도 현장 중심 아이디어를 반영한 다양한 RPA 서비스를 개발하고 확대 운영해 직원 업무 효율 향상과 디지털 기반 업무혁신을 위해 노력할 계획이다.

2024.10.22 14:50주문정

"정확도 올렸다"…업스테이지, 새 OCR 모델 '도큐먼트 파스' 공개

업스테이지가 기업 문서를 분석해 거대언어모델(LLM)로 처리 가능한 새 솔루션을 공개했다. 업스테이지는 차세대 광학문자인식(OCR) '도큐먼트 파스(document Parse)'를 출시했다고 17일 밝혔다. 도큐먼트 파스는 기존 OCR 기술에서 명확한 인식이 어렵던 레이아웃이나 테이블 등을 포함한 복잡한 형태 문서에서도 각 구조와 텍스트 정보를 분석해 데이터 자산화를 돕는다. 어떤 형식의 문서도 구조화된 텍스트 형식으로 전환할 수 있다. 기업이나 기관에서 실제 LLM 활용 시 바로 적용할 수 있다. 업스테이지는 도큐먼트 파스를 통해 검색증강생성(RAG) 시스템 성능과 LLM 응답 정확도를 결정하는 핵심 요소인 데이터 전처리 과정에서의 정확성뿐만 아니라 속도와 사용성 측면에서도 현재 가장 진보한 형태의 문서 처리 기술을 선보이게 됐다고 설명했다. 업스테이지는 관련 기술 성능 측정에 통용될 수 있는 객관적 기준 마련을 위해 문서 구조 분석 벤치마크인 DP-벤치도 공개했다. 결과에 따르면 도큐먼트 파스는 레이아웃을 비롯한 테이블 구조, 콘텐츠 분석 등 정확성을 측정하는 모든 지표에서 아마존웹서비스(AWS)와 마이크로소프트를 포함한 빅테크 5개사 서비스와 비교해 5% 이상 높은 점수를 받았다. 또 1분에 100장을 처리할 수 있는 속도로 같은 기준을 적용한 AWS 텍스트랙보다 10배, 라마파스보다 5배 빨랐다. 도큐먼트 파스는 DOCX, PDF, PPTX, PNG 등 업무에 사용하는 9종의 문서 처리뿐만 아니라 수식 인식 및 이미지 추출도 가능하다. HTML 외에도 헤더 및 테이블 요소를 마크다운 형식으로 제공해 LLM 사용자가 입력 문서의 토큰 크기를 줄일 수 있다. 김성훈 업스테이지 대표는 "토큐먼트 파스는 각 기업이 가진 기존 문서를 가장 정확하게 자산화해 LLM을 실제 업무에 즉각 효율적으로 적용할 수 있도록 만드는 최적의 도구"라며 "다양한 비즈니스에서 업무 혁신을 현실화할 것"이라고 밝혔다.

2024.10.17 10:21김미정

[ZD SW 투데이] 쿠콘 "위체크로 대출심사 업무 간단히 하세요" 外

지디넷코리아가 소프트웨어(SW) 업계의 다양한 소식을 한 눈에 볼 수 있는 'ZD SW 투데이'를 새롭게 마련했습니다. SW뿐 아니라 클라우드, 보안, 인공지능(AI) 등 여러 분야에서 활발히 활동하고 있는 기업들의 소식을 담은 만큼 좀 더 쉽고 편하게 이슈를 확인해 보시기 바랍니다. [편집자주] ◆쿠콘, 위체크로 대출심사 업무 간소화 쿠콘이 '위체크(We-Check)' 모바일 증명서 조회 서비스를 통해 금융기관의 대출 심사 업무를 간소화한다. 이 서비스는 모바일 웹에서 다양한 증명서를 실시간 조회할 수 있게 해 대출 심사 시 필요한 서류 발급 시간을 절감한다. 별도 앱 없이도 사용할 수 있다. 현재 신한저축은행, BNK캐피탈, 한국투자캐피탈 등 여러 금융기관에서 '위체크'를 활용하고 있으며 대부업계에서는 바로크레디트대부가 도입해 비대면 대출 심사 업무를 자동화했다. ◆리턴제로, 회의록 자동 작성 서비스 '콜라보' 회의수 2만 건 기록 리턴제로의 회의록 자동 작성 서비스 '콜라보(CALLABO)'가 출시 1년 만에 처리한 회의 수가 2만 건을 기록했다. 콜라보는 30분 이상의 회의록을 30초 만에 텍스트로 정리하며 '구글 밋' '줌' '마이크로소프트 팀즈' 등의 워크스페이스와 연동이 가능하다. 리턴제로는 신한금융그룹 AI 컨택센터에 이 솔루션을 공급하고 있으며 올해 초에는 신용보증기금이 지원하는 '프리아이콘(Pre-ICON)' 프로그램 대상 기업으로 선정됐다. ◆슈퍼브에이아이, AWS ISV 엑셀러레이트 프로그램 파트너로 선정 슈퍼브에이아이가 아마존웹서비스(AWS)의 독립 소프트웨어 공급기업(ISV) 엑셀러레이트 프로그램 파트너로 선정됐다. 이에 따라 AWS 국내외 영업 팀과 협력해 새로운 비즈니스를 추진할 수 있게 됐다. 현재 슈퍼브에이아이는 AI 올인원 플랫폼 '슈퍼브 플랫폼'을 운영하고 있으며 AWS 마켓플레이스에 '슈퍼브 서비스' 및 '슈퍼브 플랫폼'을 등록해 고객들이 서비스를 간편히 사용할 수 있도록 조치한 바 있다. ◆사이냅소프트, AI 기반 OCR 솔루션 '사이냅 OCR' 웹팩스 및 복합기 적용 확대 사이냅소프트가 AI 기반 OCR 솔루션 '사이냅 OCR'을 웹팩스와 복합기에 적용해 의료·금융·법률 등 사용 범위를 늘렸다. '사이냅 OCR'은 텍스트 자동 인식, 민감정보 필터링 및 마스킹 기능을 통해 문서 디지털화를 실시한다. 사이냅소프트는 더존비즈온 키컴, 지미션, 신도리코 등과 협력하고 신한은행, 농협, 동양생명, 현대해상 등 기업의 레퍼런스를 확보한 바 있다. ◆프라이빗테크놀로지, 제로 트러스트 구현 위한 한국수자원공사 K-테스트베드 성료 프라이빗테크놀로지가 제로 트러스트 솔루션 구축을 위한 한국수자원공사 K-테스트베드 실증을 마쳤다. K-테스트베드 지원 사업은 공공·민간 기관 인프라를 국내 스타트업과 중소기업에 개방해 연구개발과 실증을 지원하는 기획재정부 주관 사업이다. 이번 실증에서 프라이빗테크놀로지는 사용자 및 단말 인증, 보안 컴플라이언스 준수 등 6개 부문에 대한 기술 성능 평가를 모두 통과했다.

2024.08.06 10:53조이환

中 국가안보부 "AI 작문, 기업 기밀 유출" 경고

중국 정부의 안보 부문이 인공지능(AI) 작문 기능 등 기업들이 흔하게 사용하는 여러 업무용 프로그램의 기밀 유출을 주의해야 한다고 경고했다. 4일 중국 언론 IT즈자는 중국 국가안보부가 'AI 작문'을 비롯해 '클라우드 비서', '광학문자인식(OCR)', '업무 그룹' 등을 통해 기밀 유출 사례가 빈번히 발생하고 있다고 지적했다. 중국 국가안보부는 최근 몇 년간 AI 작문 기술이 발전해 여러 직장인들의 도구가 되면서 기밀 내용이 유출되고 있다고 전했다. AI 작문 기술은 사용자가 필요한 점을 입력하면 클릭 한번으로 문장을 생성해준다. 일부 기밀 정보 담당자들이 기밀 자료 초안을 작성할 때, 작업 시간을 절약하기 위해 기밀 자료 및 문서의 내용을 AI 작문 프로그램에 입력하는 방식으로 문장을 생성시킨다는 점이 문제다. AI 작문 프로그램은 사용자가 입력한 정보를 자동으로 수집해 자가 학습을 한다. 이에 관련 데이터가 해외 정보 기관에 도난 당해 국가 기밀이 유출될 수 있다고 국가안보부는 강조했다. OCR 기술도 마찬가지다. 국가안보부에 따르면 최근 이미지 및 텍스트 인식 애플리케이션이 한 번의 클릭으로 텍스트를 변환할 수 있어 업무 편의성 때문에, 많이 쓰이지만 이 또한 기술 유출이 발생했다. 일부 기밀 정보 담당 직원이 온라인 프로그램을 사용해 기밀 문서를 촬영하고 식별했다. 기밀 문서의 표식과 분류 등 등급을 의도적으로 가렸음에도 문서의 원본 사진이 온라인 플랫폼에 업로드 된 후 해외 정보 기관이 기술적 수단을 통해 소프트웨어 데이터를 획득하고 국가 기밀을 훔쳐 유출될 수 있다. 클라우드 프로그램도 문제다. 국가안보부는 클라우드 비서 즉, 파일의 클라우드 저장을 도와주는 파일 전송 비서도 언급했다. 다양한 단말기에서 다운로드 받아 사용할 수 있는 이같은 프로그램을 직장인들이 퇴근 후 개인 휴대폰이나 컴퓨터에서 다운받아 업무를 처리하는데, 컴퓨터와 모바일 기기에 자동 동기화 및 저장되는 과정을 거치면 해외 간첩 및 정보 기관이 트로이목마 바이러스를 통해 관련 문서를 입수할 위험이 높아진다는 것이다. 전송 소프트웨어 회사의 백엔드 역시 기밀 문서를 쉽게 얻을 수 있으며, 이 경우 접근 범위를 통제할 수 없어 기밀 유출이 이뤄지게 된다. 이뿐 아니라 '업무 그룹'을 통해서도 기밀 정보가 유출됐다. 의사소통을 위해 많은 부서에서 업무 문제를 보고하고 교환하기 위해 만드는 '업무 그룹'에서 채팅방에 국가 기밀 및 업무 기밀 등 내용이 사진과 문서 등 형태로 공개되기도 했다. 이러한 그룹 채팅 정보가 그룹 구성원에 의해 쉽게 복제되거나 공개되면서 해외 정보 기관이 사이버 공격을 통해 채팅 기록을 탈취할 수 있는 위험이 크다는게 국가보안국의 설명이다.

2024.08.05 07:17유효정

하나은행, AI OCR 수출환 매입 서비스에 도입

하나은행이 자체 개발한 인공지능 기반 광학식 문자 인식 기술(AI OCR)을 수출환 어음 매입 전산 자동화 서비스에 도입했다고 24일 밝혔다. 이 AI OCR은 하나금융티아이의 사내 독립기업인 하나금융융합기술원이 자체 개발한 기술로, 비정형화된 수출 서류를 자동으로 분류하고 매입 정보 등을 디지털로 빠르게 추출할 수 있다. 다양한 케이스의 수출 관련 문서를 학습해 문자 인식 정확도도 상대적으로 높다고 은행 측은 보고 있다. 하나은행 외환사업지원부 관계자는 "수출 서류 심사 및 수출 서류 작성 서비스도 시행할 예정"이라고 말했다.

2024.06.24 09:26손희연

사이냅소프트, KT DS RPA에 AI OCR 도입

사이냅소프트(전경헌 대표)가 kt ds의 로봇프로세스자동화(RPA) 앤트봇에 인공지능(AI) OCR을 도입한다. 사이냅소프트는 kt ds와 사이냅 OCR 업무협약을 체결했다고 5일 밝혔다. 사이냅 OCR은 이미지나 스캔된 문서의 문자를 정확하게 인식하고 추출하는 AI 기반의 OCR 솔루션이다. TTA를 통해 99.3%의 높은 한글 인식률과 우수한 데이터 추출 성능을 검증 받았으며, GS인증 및 ICT기술마켓인증 등 다양한 공신력 있는 품질 및 우수성 인증을 획득했다. 비정형 학습 도구인 '키밸류 트레이너(KVT)'와 고객이 직접 새로운 서식을 등록할 수 있는 '폼메이커' 등의 로우코드 기반 도구를 함께 제공하여, 서비스 확장 시 유연하게 대응하고 비용 부담을 최소화할 수 있다. 사이냅 OCR은 업무 자동화(RPA), 문서보안, AI 학습용 데이터 구축 등의 목적으로 100여건 이상의 레퍼런스를 확보하고 있다. KT DS의 앤트봇(AntBot)은 자체 기술력으로 개발된 업무 자동화(RPA) 솔루션으로, KT그룹을 비롯해 금융·공공·제조 등 다양한 곳에서 사용하면서 안정성이 검증되었다. 업무효율을 상승시키고, 업무처리 시간을 절감하는 등의 획기적인 생산성 향상 사례를 만들어 가고 있다. 생성형 AI와 RPA를 연동해 IT전문가가 아니어도 자연어로 '대화형 실행'을 통해 단순 반복적인 업무를 비롯해 고도의 판단력이 요구되는 업무도 자동화할 수 있으며, 숙련된 개발자의 업무 생산성도 강화할 수 있다. 이번 협약을 통해 양사는 '사이냅 OCR'과 앤트봇 솔루션을 연계하여 생성형 AI로 진화하는 RPA시장에서 경쟁력을 강화하고 주도권을 잡겠다는 계획이다. 전경헌 사이냅소프트 대표는 “이번 협약을 통해 클라우드 전환과 AI 융합을 중심으로 빠르게 성장하고 있는 RPA시장에서 업무 프로세스를 혁신하고, 운영 효율성을 크게 향상시키는 데 중요한 역할을 할 것”이라며 “사이냅 OCR은 데이터의 정확성과 처리속도, 다양한 형식의 비정형 데이터에서 유용한 데이터의 효과적인 처리를 통해 비용절감과 생산성 극대화라는 가치를 제공할 수 있을 것”이라고 밝혔다. 또한, 앤트봇(AntBot)을 담당하는 양성모 ICT사업본부장은 “생성형 AI 융합을 가속화하면서, 앤트봇의 지능 자동화와 AI OCR 연계를 통해 상호 시너지를 극대화하겠다. 이를 통해 업무 생산성을 높이고, 기업의 진정한 하이퍼오토메이션 혁신과 디지털 전환을 이끌어나갈 것 “이라고 밝혔다.

2024.06.05 15:29남혁우

로민 손잡은 두베, 개인정보보안 혁신 새 장 연다…AI OCR 솔루션 사업 본격 진출

금융 IT전문기업 두베와 도큐먼트 AI 전문기업 로민이 손잡고 AI 금융서비스 핀테크 사업에 본격 진출한다. 두베는 30일 로민과 업무협약을 체결했다. 이번 협약을 통해 앞으로 로민의 도큐먼트 AI 플랫폼 텍스트스코프를 두베가 수행하고 있는 금융 SI 시장을 통해 공급함으로써 각 금융사에 최적화된 문서 데이터 업무자동화 금융서비스를 제공할 예정이다. 최근 발표된 한국인터넷진흥원(KISA)의 '국·내외 개인정보 노출 탐지 현황'에 따르면 지난해 개인정보 노출 홈페이지는 2만여 개에 달한다. 이 중 84%는 '개인정보가 포함된 첨부파일'을 홈페이지에 등록해 발생한 것으로 나타났다. 특히 이름·주민등록번호·주소 등을 가리지 않아 개인정보가 노출된 사고가 빈번히 벌어지고 있는 것으로 조사됐다. 이에 따라 정부산하 기관과 더불어 거대플랫폼 기업 및 금융권 등에서도 개인정보 보안이 더욱 중요해질 전망이다. 로민의 '텍스트스코프 프라이버시가드'는 딥러닝 기반의 컴퓨터 비전(CV), 자연어처리 (NLP) 등 최신 AI 기술이 뒷받침하는 OCR을 활용해 문서를 식별 및 분류하고 업무에 필요한 데이터만 빠르고 정확하게 추출한다. 이를 통해 다양한 형태의 문서를 활용할 수 있는 형태의 데이터로 변환하고 가장 효율적인 방법으로 문서 처리 자동화를 구현할 수 있도록 지원한다. 또 변환된 데이터를 더욱 가치 있게 활용할 수 있도록 다양한 연계 AI 기술을 제공한다. 텍스트스코프 스튜디오의 최대 장점은 높은 인식률이다. 저화질, 저품질 문서와 필기체 문서를 높은 정확도로 인식하며 인쇄체 인식률 98.07%, 필기체 검출 성능 98.38%, 타자체 인식률 98.3%를 보유하고 있는 상태다. 또 특허청, 국가기록원, 주택토지보증공사 등 다수 공공기관에 솔루션 공급으로 개인정보 보안에 민감한 정부 기관으로부터 개인정보보호 관련 기술력의 우수성을 인정받았다. 석광진 두베 대표는 "신한금융, 하나금융, KB금융, 우리금융, 제2금융권 등 600여 건 이상의 금융 서비스를 구축한 기술력과 경험을 토대로, 검증된 AI 솔루션을 결합해 각 고객사에 최적화된 AI OCR 서비스를 제공할 것"이라고 밝혔다.

2024.05.30 14:35장유미

셀바스AI, 배민페이에 '셀비 OCR' 기술 공급

셀바스AI가 인공지능(AI) 기술로 모바일 간편결제 서비스를 업그레이드했다. 셀바스AI는 우아한형제들의 배달의민족 간편결제 서비스 배민페이에 '셀비 광학문자인식(OCR)'을 적용했다고 8일 밝혔다. 배민페이에 적용된 셀비 OCR은 결제수단을 추가할 수 있는 '신용카드 OCR' 기능을 갖췄다. 머신러닝(ML) 기반으로 자체 개발한 엔진은 지식 증류 기법을 활용한 고도화 과정을 거치며 용량을 경량화했다. 네트워크 환경 문제로 인한 작동 오류를 최소화하기 위해 온디바이스 형태로 지원한다. 셀비 OCR은 이미지 내 문자 위치를 찾고 텍스트를 인식하는 광학문자인식 솔루션이다. 자체적으로 수집한 신용카드 이미지 기반으로 데이터를 구축했다. 양각, 프린트, 세로형 등 다양한 디자인 카드의 카드번호와 유효기간을 인식할 수 있다. 인식 정확도는 약 95%다. 현재 금융을 비롯한 보험, 물류, 자동차, 여행사 등 다양한 기업이 이를 적용했다. 신용카드 OCR 기능은 별도 촬영 없이 자동으로 카드 인식을 할 수 있다. 기울어지거나 회전된 이미지도 알아본다. 신용카드 외에도 주민등록증, 운전면허증, 여권, 외국인등록증, 명함 등의 카드와 가족관계증명서, 재무제표, 처방전, 사업자등록증을 인식할 수 있다. AI 기반 신분증 사본 탐지도 가능하다. 이항섭 셀바스AI 사업대표는 "셀바스AI는 최신 기술 적용은 물론 지속적인 연구를 통해 더욱 정확하고 신속한 문자 인식 솔루션을 제공하고 있다"며 "셀비 OCR 신용카드 인식기는 업무 효율을 높이는 강력한 도구로서 전자지갑, 간편결제, 무인점포, 비대면결제 등 업무 프로세스의 자동화와 효율화에 기여하고 있다"고 설명했다.

2024.04.08 11:53김미정

BHSN, '리걸 OCR' 특허 획득…"계약서 추출 정확도↑"

BHSN(대표 임정근)이 '리걸 광학문자인식(OCR)' 기술 특허를 앞세워 기업 고객 공략에 나선다. BHSN은 '인공지능(AI)과 OCR을 이용한 계약서의 텍스트 추정확도 높은 계약서 추출과 디지털 저장을 돕는 시스템을 이용한 텍스트 추출방법' 특허를 받았다고 4일 밝혔다. OCR은 광학 기반 이미지 내 텍스트 데이터를 인식 및 추출하는 기술로, 자동 번역을 비롯한 텍스트 분석, 키워드 추출, 문서 디지털화 등에 사용된다. 이번에 특허 받은 리걸OCR 기술은 BHSN이 자체 개발한 리걸AI 언어모델과 결합한 형태다. 특수한 형태와 구조를 가진 계약 문서의 이해 및 디지털화에 특화됐다. 리걸OCR 기술은 BHSN에서 제공하는 올인원 AI 리걸 솔루션 '앨리비CLM(계약관리솔루션)'의 체결본 보관 기능(레포지토리)에 탑재됐다. 날인이 완료된 PDF 형식의 체결본을 리걸OCR로 스캔하면 제목, 당사자, 체결일 등 중요 항목의 위치와 텍스트가 자동으로 추출돼 디지털 정보로 재구성된다. 디지털화된 계약서는 리걸AI 기술을 통해 앨리비CLM에 조와 항 단위 및 '중요 계약 정보'로 자동 분류돼 데이터베이스로 저장된다. 회사 측은 추후 필요한 내용을 손쉽게 검색할 수 있어 계약서 검토 과정을 효율화하고 변호사 및 영업팀·구매팀 등 계약서를 다루는 모든 실무 부서의 업무 생산성을 극대화한다는 입장이다. 임정근 BHSN 대표는 "이번에 획득한 리걸 특화 OCR 기술 특허는 계약서 서류의 보관 및 활용 방식에 혁신을 불러일으키고 통합계약관리솔루션인 CLM의 사용성을 높일 수 있다"며 "기업 내 다양한 사용자가 고부가가치를 창출하도록 기여하겠다"고 말했다.

2024.04.04 17:11김미정

그리드원, IBK기업은행에 서류 인식하는 AI 공급

그리드원(대표 김계관)이 IBK기업은행에 인공지능 광학문자인식(AI OCR) 시스템을 공급한다. 그리드원은 IBK 기업은행에 AI OCR을 활용한 서류인식시스템 구축사업을 진행했다고 22일 밝혔다. 이 사업은 IBK기업은행의 수기, 스캔 문서 같은 대량의 비정형 데이터 인식· 추출을 자동화하는 프로젝트다. IBK기업은행에 ▲업무 시스템 환경 분석 및 설계 ▲AI OCR 시스템 구축과 AI 개발 및 학습 ▲서류 인식 자동화 환경 구현 ▲시스템 안정화 및 교육 지원 등을 지원했다. 이번 사업은 IBK기업은행의 '업무 자동화 200만 시간 추진' 계획의 일환이다. 이번 시스템 구축으로 처리되는 서류는 기업은행 12개 업무 총 94종 서식이다. 연간 자동화 처리 대상만 약 83만장에 달한다. 구축된 AI OCR 플랫폼의 AI 학습을 활용하여 추가적인 자동화 서비스를 구현할 수 있다. 그리드원은 사업 수행을 위해 자사의 AI 플랫폼 기반으로 AI OCR 솔루션 '아이다', 로보틱스 프로세스 자동화(RPA) 솔루션 '오토메이트원'을 모듈형태로 연동해 시스템을 구성한다. 특히 그리드원은 AI 추출 결과 중 오류 인식을 자동 검증하는 '러닝 기반 오류 분류 방법 및 장치' 특허를 활용했다. 이를 통해 결과를 재검수 해야 하는 사람의 역할을 최소화했다. 문서가 처리되는 전 과정을 자동화하는데 필요한 솔루션을 모두 자체 개발했다. 김계관 그리드원 대표는 "그리드원은 태생부터 자동화 전문 기업으로, 모든 기술을 활용해 우리 일상의 모든 것을 자동화하는 것을 목표로 한다"며 "기존 자사 자동화 솔루션들과 효과적으로 연계해 기업의 업무에 디지털 혁신을 가져올 수 있도록 할 것"이라고 말했다.

2024.02.22 11:39김미정

불법대출 광고, AI OCR이 잡는다

모바일 뱅킹 애플리케이션(앱)에서 본인 인증 때 활용됐던 인공지능(AI) 광학 문자인식(OCR) 기술이 불법 금융 광고를 걸러내는데 적용된다. 5일 금융감독원은 불법 금융 광고를 판별하기 위해 감시 시스템에 AI OCR 기술을 적용했으며 시험 가동을 거쳐 본격적으로 활용한다고 밝혔다. 감시 시스템을 통해 ▲불법 대부 ▲작업 대출 ▲통장 매매 ▲개인 신용정보 매매 ▲휴대폰 소액결제 ▲신용카드 현금화 등 온라인 불법 금융 광고 유형 6개에 대한 게시글과 이미지를 분석해 불법 광고를 차단한다는 계획이다. 금감원 김현돈 정보화전략국 감독정보시스템2팀 팀장은 "기존 텍스트 위주의 광고를 판별하는 시스템에서 AI OCR을 적용함으로 이미지 광고의 불법 여부를 판별할 수 있게 됐다"며 "이미지를 통해 90~95% 가량 문구를 추출할 수 있으며 향후 더 많은 데이터 수집과 학습으로 시스템 자동화와 고도화할 것"이라고 설명했다. 그동안 개인 휴대전화 등을 통해 불법 금융 광고가 활개를 쳐왔으나 최근에는 카카오톡·텔레그램 등 소셜네트워크서비스(SNS)를 통해 불법 금융 광고가 늘어나는 추세다. 특히 글보다는 광고 이미지로 만들어 금감원의 기존 감시 시스템에서 잡아내기 역부족이었다. 기존 시스템은 특정 키워드를 필터링하는 방식이지만 그림 속 키워드를 골라내긴 어려웠기 때문이다. 초기 AI OCR이 학습해야 하는 불법 금융 광고 이미지는 기존 수집한 데이터와 함께 추가적인 데이터 수집 기관을 활용한다는 계획이다. 김 팀장은 "초기에는 감시 시스템이 잘 작동하는지 직원들이 2차적으로 확인 검증 작업에 들어가겠지만 기술 활용도가 높아진다면 자동화되는 과정이 더 많아질 것"이라며 "불법 금융 광고를 신속하게 조치해 온라인 불법 금융 광고 차단 실적이 크게 확대될 것으로 기대된다"고 말했다.

2024.01.05 11:16손희연

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

폴더블 아이폰, 펀치홀 카메라 탑재 유력

배민·요기요, 먹통 뒤 정상화..."금요일 밤 비 내린 탓"

과학자들, 납으로 금 만들었다…'연금술사의 꿈' 실현되나

SKT 유심교체 누적 193만...교체 예약 대기 686만

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현