• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
  • AI의 눈
AI의 눈
HR컨퍼런스
디지털트러스트
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'OCR'통합검색 결과 입니다. (27건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

한국딥러닝, 글로벌 OCR 벤치마크 1위…"제미나이·GPT 제쳐"

한국딥러닝이 글로벌 인공지능(AI) 시장에서 문서 처리 모델 경쟁력을 입증했다. 한국딥러닝은 허깅페이스에 등재된 글로벌 멀티모달 광학문자인식(OCR) 벤치마크 'OCR벤치 v2' 2026년 3월 영어 부문 평가에서 68.1점으로 종합 1위를 기록했다고 22일 밝혔다. 아시아 기업이 구글 제미나이를 제치고 정상에 오른 것은 이번이 처음이다. 이번 평가에서 한국딥러닝은 제미나이 3 프로 프리뷰를 4.7점 차로 앞섰다. 오픈AI GPT-5, 알리바바 큐웬3-옴니-30B, 앤트로픽 클로드 오퍼스 4.6 등 주요 모델보다 더 높은 점수를 받았다. OCR벤치 v2는 레이아웃 분석을 비롯한 수식 해석, 도표 이해, 논리 추론 등 31개 시나리오를 검증하는 고난도 벤치마크다. 또 1만 건 수작업 검증 데이터와 1500장 비공개 테스트셋으로 성능을 이중 검증할 수 있다. 한국딥러닝은 모델이 문서 구조화와 맥락 이해에서 강점을 보였다고 밝혔다. 문서 파싱 40.7점과 맥락 이해 85.4점을 기록하며 세부 항목 전반에서 고른 성과를 냈다는 설명이다. 핵심 기술은 환각을 최소화한 '니어-제로 할루시네이션(Near-Zero Hallucination)'이다. 이 기술은 문서에 없는 정보를 생성하지 않고 실제 문서에 기반한 정보만 추출하도록 설계됐다. 한국딥러닝은 문서 구조 이해에 특화된 모델을 자체적으로 만든 기업으로 알려졌다. 이를 통해 레이아웃과 항목 간 관계 위치 정보를 함께 반영해 의미 오류를 줄였다는 평을 받고 있다. 실제 환경 적용성도 확인됐다. 한국어 손글씨 등 노이즈가 많은 입력에서도 안정적인 인식이 가능하며 비공개 테스트셋에서도 성능이 유지된 것으로 나타났다. 김동현 한국딥러닝 최고전략책임자(CSO)는 "글로벌 빅테크들이 주도하는 AI 시장에서 아시아 기업이 순수 국내 기술로 제미나이와 GPT를 넘어섰다는 것은 의미 있는 성과"라며 "범용 모델이 따라올 수 없는 문서 지능 영역에서 구조적 설계를 통해 기술 격차를 증명했다"고 밝혔다.

2026.04.22 14:55김미정 기자

"OCR 넘어서"…데이터브릭스, 문서 이해 AI 플랫폼 공개

데이터브릭스가 기업 문서 속 비정형 데이터를 자동 수집·분석하는 인공지능(AI) 플랫폼을 공개했다. 19일 IT 업계에 따르면 데이터브릭스는 PDF 문서나 이미지 등에 묻혀 있던 비정형 정보를 실제 비즈니스에 활용 가능한 형태로 변환하는 솔루션을 내놨다. 해당 플랫폼은 기존 데이터브릭스 '레이크플로'와 '도큐먼트 인텔리전스'를 결합한 문서 처리 체계다. 레이크플로는 통합 데이터 엔지니어링 솔루션이다. 기업 내 다양한 시스템에 흩어진 데이터를 자동으로 수집하고 처리하며 파이프라인을 구성하는 역할을 한다. 도큐먼트 인텔리전스는 비정형 문서를 이해하고 구조화하는 AI 기능이다. PDF나 이미지 손 글씨 등 복잡한 문서를 분석한다. 이를 통해 계약 정보 금액 등 핵심 데이터를 자동으로 추출한다. 현재 기업 데이터 약 80%는 PDF나 이미지, 오피스 문서 형태로 존재한다. 이 데이터는 검색이나 분석이 어려워 사실상 활용되지 못했다. 그동안 기업은 광학문자인식(OCR)이나 자연어처리(NLP) 기술을 따로 연결해 문서 속 비정형 데이터를 처리해 왔다. 이 방식은 정확도가 낮고 관리도 어려워 기업 AI 도입에 걸림돌로 지적돼 왔다. 데이터브릭스는 '레이크플로 커넥트'를 통해 문서를 자동으로 가져오는 기능을 제공한다. 이 기능은 쉐어포인트나 구글 드라이브 등에 있는 문서를 별도 설정 없이 연결해 바로 데이터로 쓸 수 있게 돕는다. 이후 도큐먼트 인텔리전스가 문서를 읽고 이해하는 역할을 맡는다. 스캔 이미지나 손글씨 같은 복잡한 문서도 구조화해 계약 날짜, 금액, 거래처 정보 등을 자동 추출한다. 여기서 '레이크플로 잡스'가 문서 수집부터 분석까지 전 과정을 한 흐름으로 처리한다. 일부 작업이 실패해도 해당 부분만 다시 처리할 수 있어 운영 부담도 줄였다. 이 과정에서 유니티 카탈로그를 기반으로 데이터 접근 권한과 이력 관리가 적용된다. AI는 기업 내부 데이터 맥락을 반영해 더 정확하게 문서를 해석하고 활용할 수 있다. 크레이그 와일리 AI 제품 총괄은 "문서마다 별도 AI 아키텍처를 만들 필요가 크게 줄어든다"며 "이 제품은 내부에서 가장 높게 평가받고 있다"고 링크드인에서 밝혔다.

2026.04.19 18:00김미정 기자

"문서 올리면 AI가 알아서"…애자일소다, 에이전틱 OCR 출시

애자일소다가 별도 학습 없이 즉시 적용 가능한 인공지능(AI) 문서 자동화 플랫폼을 선보이며 기업 업무 자동화 시장 공략에 나섰다. 문서 처리부터 분석, 업무 자동화까지 연결하는 '문서 에이전트' 개념을 앞세워 기존 광학문자인식(OCR) 시장 구조를 바꾼다는 목표다. 애자일소다는 거대언어모델(LLM)과 비전언어모델(VLM) 기반 AI 문서 처리 자동화 플랫폼 '에이전틱 OCR'을 출시했다고 17일 밝혔다. 에이전틱 OCR은 문서 유형별 사전 학습이 필요했던 기존 OCR 방식의 한계를 개선한 것이 특징이다. 사용자가 이름, 계약일, 금액 등 추출 항목만 정의하면 AI가 문서에서 해당 정보를 자동으로 인식·분류·추출한다. 샘플 문서를 업로드하면 분류 및 추출 항목 초안도 자동 생성되며 별도 코드 작성이나 학습 데이터 구축 없이 당일 적용이 가능하다. 기존에는 새로운 문서 유형을 추가할 때마다 수주에서 수개월에 걸쳐 모델을 재학습해야 했지만, 해당 플랫폼은 이러한 과정을 생략해 문서 처리 시간을 획기적으로 단축했다. 성능도 확보했다. 회사 측에 따르면 비정형·정형 문서 20종을 대상으로 한 검증에서 문서 분류 정확도 98%, 정보 추출 정확도 95% 이상을 기록했다. 또 '액티브 러닝' 기능을 적용해 사용할수록 성능이 개선되는 구조를 갖췄다. 사용자가 추출 오류를 수정하면 해당 내용이 자동 반영돼 추가 학습 없이도 정확도를 지속적으로 높일 수 있다. 회사는 해당 기능 적용 시 5~15% 수준의 성능 향상을 확인했다고 설명했다. 보안성과 확장성도 고려했다. 온프레미스 환경을 완벽히 지원하며 고객사별 데이터 격리 구조를 적용했다. 문서 내 추출 정보의 위치를 좌표로 표시하는 기능을 제공해 금융권 감사 대응에도 활용할 수 있다. 현재 국내 은행, 보험사, 카드사 등 1·2금융권에서 성능 검증을 마쳤으며 도입을 진행 중이라고 밝혔다. 업계에선 LLM 기반 문서 처리 기술이 기존 OCR 시장의 전환점을 만들고 있지만, 실제 현장에선 여전히 수작업과 재학습 부담이 존재한다는 점에 주목하고 있다. 이에 에이전틱 OCR의 접근 방식이 의미 있는 변화로 평가받고 있다. 애자일소다는 향후 파일럿 고객사를 확대하고 문서 처리 기능을 넘어 검색증강생성(RAG) 기반 챗봇, 문서 비교 분석, 업무 자동화까지 확장해 문서 에이전트 플랫폼으로 발전시킨다는 계획이다. 최대우 애자일소다 대표는 "모든 기업 업무는 결국 문서에서 시작된다"며 "에이전틱 OCR은 기존 OCR의 연장선상에 있는 정보 추출 도구가 아니라, RAG 기반 챗봇·문서 대조 분석·업무 자동화까지 문서를 접점으로 한 기업 업무 전반을 커버하는 문서 에이전트 플랫폼의 출발점"이라고 말했다.

2026.04.17 14:19한정호 기자

문서 시장에 확산된 '터보퀀트'…사이냅소프트, AI 서비스 비용 낮췄다

사이냅소프트가 최근 인공지능(AI) 시장에서 큰 주목을 받은 경량화 기술 '터보퀀트'를 적용해 문서 AI 경쟁력을 강화한다. 대형언어모델(LLM)과 시각언어모델(VLM) 운영 시 발생하는 메모리 병목 문제를 해결하며 기업 AI 도입 비용을 낮춘다는 목표다. 사이냅소프트는 구글 리서치가 공개한 최신 벡터 양자화 알고리즘 터보퀀트를 자사 AI 솔루션 '사이냅 OCR IX'에 적용했다고 15일 밝혔다. 터보퀀트는 AI 모델이 긴 문서를 처리할 때 발생하는 메모리 사용량을 줄이기 위한 기술로, 최근 생성형 AI 확산과 함께 인프라 효율을 높이는 핵심 기술로 주목받고 있다. 특히 LLM·VLM이 사용하는 'KV 캐시'를 압축해 동일한 그래픽처리장치(GPU) 환경에서도 더 많은 데이터를 빠르게 처리할 수 있도록 지원하는 것이 특징이다. 사이냅 OCR IX는 VLM과 AI 에이전트 기술을 결합한 에이전틱 광학문자인식(OCR) 솔루션으로, 비정형 문서의 맥락을 이해하고 필요한 데이터를 자동 추출한다. 기존에는 긴 문서를 처리할수록 메모리 사용량이 급증해 고가의 GPU 인프라가 필요했지만, 터보퀀트 적용으로 이러한 한계를 개선했다는 설명이다. 회사 측에 따르면 이번 기술 적용을 통해 동일한 GPU 환경에서도 더 긴 컨텍스트와 대용량 배치를 병목 없이 처리할 수 있게 됐다. 이에 고성능 GPU 서버 구축 부담을 줄이고 총소유비용(TCO)도 낮출 수 있다. 사이냅소프트는 GPU 인프라 도입이 어려운 기업을 위해 중앙처리장치(CPU) 기반 환경도 함께 지원한다. 자체 모델에 대한 정밀 프로파일링을 통해 연산 효율을 높였으며 품질 손실을 1% 이하로 억제하면서도 CPU 서버만으로 분당 약 100건 수준의 추론 처리가 가능하도록 성능을 확보했다. 기존 서버 인프라를 활용해야 하는 기업이나 GPU 도입이 어려운 환경에서도 AI OCR 적용을 가능케 한다는 방침이다. 사이냅소프트는 이같은 기술 적용이 금융·공공 등 온프레미스 환경에서 AI 도입을 확대하는 계기가 될 것으로 보고 있다. 높은 보안 요구와 인프라 제약으로 AI 도입이 쉽지 않았던 산업에서도 비용 효율성과 성능을 동시에 확보할 수 있다는 점에서다. 전경헌 사이냅소프트 대표는 "단순히 자체 기술력에만 머물지 않고 글로벌 빅테크의 최신 연구 성과인 터보퀀트를 기민하게 상용화해 기존 VLM의 한계를 극복했다"고 말했다. 이어 "CPU 버전까지 아우르는 유연한 인프라를 지원해 기업들이 도입 비용 걱정 없이 에이전틱 OCR 환경을 구축하고 실질적인 업무 자동화를 이룰 수 있도록 적극 지원하겠다"고 덧붙였다.

2026.04.15 17:14한정호 기자

비상교육 수학플러스러닝, 'OCR 베타 서비스' 시작

글로벌 에듀테크 기업 비상교육(대표 양태회)은 AI 수학 학습 코스웨어 '수학플러스러닝'에 기출 시험지를 자동 분석해 유사 유형 문제를 생성하는 'OCR 베타 서비스'를 열었다고 31일 밝혔다. 비상교육은 2025년 미국 타임지(Time)와 글로벌 시장조사업체 Statista가 선정한 '2025 에듀테크 기업'에 이름을 올린 바 있다. 이번에 도입된 OCR 서비스는 수학플러스러닝의 내신 대비 시스템 '내신대비zone'에 탑재됐으며, 기출 시험지를 업로드하면 문항을 자동 인식·분석해 유사 유형의 쌍둥이·유사 문항을 매칭한다. 이를 통해 학교별 시험 유형에 맞춘 맞춤형 학습지를 보다 쉽게 제작할 수 있도록 지원한다. OCR 서비스는 강사가 기출 시험지를 업로드하면 시험지 문항을 자동으로 인식하고 분석해 유사한 유형의 문제를 찾아 매칭해준다. 이를 활용하면 기출 시험지 유형에 맞춘 쌍둥이 학습지를 생성할 수 있다. 학습지 생성 과정에서 강사는 원하는 문항을 추가하거나 삭제하는 등 자유롭게 편집할 수 있어 수업 상황이나 학생 수준에 맞는 학습지를 제작할 수 있다. 문항 편집 기능은 기존 '내신대비zone'의 문항 편집 프로세스와 동일해 기존 사용자라면 별도의 학습 없이 활용할 수 있다. '내신대비zone'은 교과서 학습부터 시험 직전 점검까지 내신 대비 전 과정을 지원하는 시스템이다. '교과서마스터' 기능을 통해 학생별 목표 점수를 설정하고 해당 교과서의 필수 유형을 학습할 수 있으며, 전국 모든 교과서 출판사를 선택해 학교 수업 진도에 맞춘 학습이 가능하다. 또한 '시험대비평가' 기능을 통해 대단원·중단원 선택, 난이도별 문항 구성, 문제 수 조절, 쌍둥이 문제 생성 등을 통해 맞춤형 평가지를 제작할 수 있어 중간·기말고사 대비 자료 준비 시간을 줄일 수 있다. 여기에 '기출Ai변형' 기능은 지역별·학교별 기출문제를 기반으로 출제 경향을 분석하고 이를 반영한 변형 문제를 자동 생성해 실제 시험과 유사한 문제 연습을 지원한다. 비상교육은 “이번 OCR 서비스 도입으로 기출 시험지를 활용한 맞춤형 내신 대비 학습지를 보다 빠르게 제작할 수 있게 됐다”며 “앞으로도 학원과 강사가 수업과 시험 대비를 효율적으로 진행할 수 있도록 AI기반 기능을 지속적으로 강화해 나갈 계획”이라고 밝혔다.

2026.03.31 17:24안희정 기자

GPU 1장으로 분당 500장 인식…사이냅소프트, '사이냅 OCR IX' 경쟁력 입증

사이냅소프트가 그래픽처리장치(GPU) 한 장으로 분당 문서 페이지 500장을 처리하는 차세대 광학문자인식(OCR) 솔루션 '사이냅 OCR IX'의 경쟁력을 입증했다. 고성능 역량과 온프레미스 지원을 앞세워 금융·공공 시장 레퍼런스를 확대한다는 목표다. 사이냅소프트는 지난달 출시한 사이냅 OCR IX의 세부 성능 데이터를 공개했다고 27일 밝혔다. 공개 자료에 따르면 사이냅 OCR IX는 OCR 엔진 단독 기준 11GB GPU 1장으로 동시 30건 요청 환경에서 분당 약 500장을 처리한다. 비정형 문서에서 핵심 정보를 자동 추출하는 키밸류 트레이너(KVT) 구성에선 분당 약 240장의 처리 성능을 기록했다. 이같은 속도는 실제 운영 환경에서 서비스 품질과 직결되는 요소다. 금융권의 신분증 인식이나 비대면 본인인증(eKYC)은 청약·정책대출 접수·연말정산 등 특정 시기에 수요가 급증한다. 단기간에 몰리는 수십만 건의 인증 요청을 지연 없이 처리하지 못할 경우 서비스 병목이 발생할 수 있다. 공공 부문 역시 사업 신청 기간에 하루 수십만 건의 서류가 접수되는 만큼 대규모 트래픽을 안정적으로 소화할 수 있는 인프라가 요구된다. 사이냅소프트는 농협은행·케이뱅크·신한은행·동양생명·현대해상 등 다수 금융사와 행정안전부, 한국자산관리공사 등을 포함해 200건 이상의 레퍼런스를 확보하고 있다. 인식 정확도와 처리 속도, 시스템 안정성을 종합적으로 충족하며 시장 신뢰를 확보했다는 설명이다. 특히 고객 내부 온프레미스 환경에서도 안정적으로 운영되며 보안성과 실적용성을 입증 중이다. 사이냅 OCR IX에 탑재된 비전언어모델(VLM)은 기존 OCR 솔루션의 서식 학습 부담을 줄이는 데 초점을 맞췄다. 사전 학습 없이도 처음 보는 서식을 처리하고 필요한 항목을 추출할 수 있어 기관마다 형식이 다른 계약서·확인서·점검표 등 비정형 문서 환경에서 도입 기간과 비용을 단축할 수 있다. 동시에 고성능 GPU 없이 자체 서버만으로 운영 가능한 CPU 버전도 지원해 초기 도입 부담을 낮췄다. 인식 범위 역시 확장됐다. 표 안에 중첩된 표나 스캔 과정에서 선이 누락된 표, 저해상도 이미지 내 표 인식은 물론 수식·바코드·QR코드까지 지원한다. 연구 문서나 물류·제조 현장에서 활용도가 높은 손글씨 인식 품질도 개선해 문서 자동화 적용 영역을 넓혔다. 전경헌 사이냅소프트 대표는 "200건 이상의 실적으로 입증된 신뢰성에 VLM의 유연성을 더해 기업 업무 환경에 최적화된 도큐먼트 AI 모델을 구현했다"며 "성능 수치로 증명된 압도적인 처리 역량을 바탕으로 시장 리더십을 더욱 공고히 할 것"이라고 밝혔다.

2026.02.27 16:39한정호 기자

[인터뷰] 사이냅소프트 "OCR IX, 에이전틱 도큐먼트 AI 시대 주도한다"

"광학문자인식(OCR)은 이제 글자를 읽는 기술을 넘어 문서를 이해하고 업무를 대신 수행하는 단계로 넘어가고 있습니다." 김영표 사이냅소프트 혁신개발팀장은 9일 지디넷코리아와 서울 마곡 본사에서 만나 최근 출시한 '사이냅 OCR IX'를 이같이 설명했다. OCR IX는 시각언어모델(VLM)과 인공지능(AI) 에이전트 개념을 결합한 신제품으로, 사이냅소프트가 제시하는 에이전틱 OCR 전략의 출발점으로 평가된다. 사이냅소프트는 2019년 딥러닝 기반 OCR 제품을 처음 선보인 이후 공공·금융·기업 시장을 중심으로 200건 이상의 레퍼런스를 쌓아왔다. 이번 OCR IX는 기존 OCR 제품을 IX로 리브랜딩하며 단순 인식 기술을 넘어 문서 이해와 업무 자동화까지 확장한 것이 특징이다. 김 팀장은 "OCR의 본질은 이미지에서 텍스트를 추출하는 것이지만, 실제 현장에서는 그 이후가 더 중요하다"며 "문서에서 핵심 키-밸류(KV)를 뽑고 이를 업무 시스템과 연결하는 과정이 OCR 도입의 진짜 목적"이라고 말했다. 사이냅소프트가 정의한 에이전틱 OCR은 KV 추출 결과뿐 아니라 그 구축과 운영 과정 자체를 AI 에이전트가 수행하는 개념이다. 서식 분석, 모델 선택, 학습, 검증, 보완 과정을 사람 대신 AI가 반복 수행해 구축 기간과 운영 부담을 줄이는 것이 목표다. 김 팀장은 "기존 OCR 프로젝트는 솔루션 도입 이후에도 별도의 구축 사업이 항상 따라붙었다"며 "서식이 조금만 바뀌어도 다시 비용과 시간이 들었지만, OCR IX는 이 과정을 AI가 스스로 반복 수행하도록 설계했다"고 밝혔다. OCR IX은 비전언어모델(VLM), KVT, 폼메이커 등 다양한 인식·추출 엔진을 제공해 비정형·정형문서를 처리할 때 속도와 복잡성 등 목적에 맞게 활용할 수 있다. 김 팀장은 "문서가 들어오면 정형·비정형 여부, 레이아웃 복잡도, 추출 항목 특성을 분석한 뒤 최적의 엔진 조합을 자동으로 구성한다"며 "결과를 정량 평가해 부족한 부분은 다시 보완하는 방식"이라고 말했다. 비정형 문서 OCR의 가장 큰 난제로는 기술보다 현실적인 비용 구조를 꼽았다. 그는 "계약서나 거래명세서처럼 문서 양식이 계속 바뀌는 환경에서는 유지·운영 비용이 가장 큰 부담"이라며 "OCR IX는 고객이 직접 GUI 환경에서 서식을 수정·보완할 수 있도록 설계했다"고 설명했다. 최근 화두인 VLM 기반 OCR의 환각(할루시네이션) 문제에 대해서도 선을 그었다. 사이냅 OCR IX는 VLM이 문서를 새로 '생성'하지 못하도록 구조적으로 제한한다. 그는 "VLM은 정답을 만들어내는 주체가 아니라, 기존 OCR 엔진이 인식한 확정 텍스트를 이해·검증하는 역할"이라며 "VLM이 근거를 찾고 그 근거를 다시 검증하는 구조로 환각을 통제한다"고 말했다. 그래픽처리장치(GPU) 비용 역시 고객들이 민감하게 묻는 지점이다. OCR IX는 문서 유형에 따라 GPU를 아예 쓰지 않거나 중소형 GPU만으로도 운영할 수 있도록 선택지를 제공한다. 김 팀장은 "VLM 단독 방식은 고성능 GPU가 필수지만, 데이터가 쌓이면 KVT로 전환해 비용을 크게 줄일 수 있다"며 "초기에는 VLM으로 빠르게 도입하고 이후 총소유비용(TCO)을 낮추는 전략이 현실적"이라고 말했다. 실제 사이냅소프트 내부 테스트 기준에 따르면 VLM 대비 KVT 전환 시 GPU 비용은 최대 20분의 1 수준까지 낮아지고 처리 속도는 수 초에서 1초 이내로 개선될 수 있다. OCR IX는 산업별 특화보다는 업무 난이도 중심 전략을 택했다. 단순 텍스트 추출이 필요한 경우는 'OCR 라이트'로, 복잡한 KV 추출과 업무 자동화가 필요한 경우는 OCR IX로 대응한다는 방침이다. 김 팀장은 "우리 솔루션은 기존 공공과 금융에서 강점이 있지만, 특정 산업에 국한된 제품은 아니다"며 "대출 서류 심사, 무역 문서, 진단서처럼 비정형 문서를 이해해야 하는 영역이 주요 타깃"이라고 밝혔다. OCR IX는 사이냅소프트의 도큐먼트 AI 포트폴리오에서도 핵심 역할을 맡는다. OCR IX가 인식한 이미지·PDF 데이터는 도큐애널라이저를 거쳐 구조화되고 이후 '어시스턴트'나 '아이넥스'와 같은 생성형 AI 서비스로 연결된다. 그는 "OCR IX의 인식 품질이 높아질수록 상위 AI 서비스의 정확도와 신뢰성도 함께 향상된다"며 "문서를 잘 읽는 것이 모든 문서 AI의 출발점"이라고 역설했다. 향후 방향성에 대해 김 팀장은 문서 AI를 넘어 비전 AI 전반으로의 확장을 예고했다. OCR과 VLM, 자연어처리(NLP), 음성 인식 기술을 축적해 장기적으로는 피지컬 AI까지 이어질 수 있는 기반을 마련하겠다는 구상이다. 김 팀장은 "에이전틱 OCR은 문서 이해에서 멈추지 않고 실제 업무 실행까지 연결되는 과정"이라며 "OCR IX는 그 출발점이고, 문서를 가장 정확하게 이해하는 AI로 진화해 나갈 것"이라고 강조했다.

2026.02.09 14:07한정호 기자

사이냅소프트, '사이냅 OCR IX' 출시…VLM과 AI 에이전트 결합

사이냅소프트(대표 전경헌)가 고도의 문맥 이해가 필요한 비정형 비즈니스 문서 시장에서의 인공지능(AI) 전환(AX)을 본격적으로 주도할 예정이다. 사이냅소프트는 시각 언어 모델(VLM)과 AI 에이전트 기술을 결합한 '사이냅 OCR IX'를 출시한다고 26일 밝혔다. 사이냅 OCR IX의 핵심은 AI 에이전트가 문서의 유형과 처리량에 따라 VLM, KVT, 폼메이커 중 최적의 엔진을 자동으로 선택하는 '에이전틱 OCR' 솔루션이다. 기존 사이냅 OCR의 TTA 인증 99.3% 한글 인식률을 유지하면서 새롭게 결합된 세 가지 엔진이 상호 보완하며 운영 효율을 극대화한다. 사이냅 OCR IX에 새로 결합된 VLM은 사전 학습 없이 신규 양식을 바로 처리할 수 있어 도입 기간을 단축하고 비정형 문서에서도 맥락을 파악해 데이터를 정확히 추출한다. 기존 사이냅 OCR의 텍스트 인식 기술과 결합해 VLM만 사용했을 때의 환각 현상을 방지하고 오인식을 최소화한 것이 특징이다. 데이터가 축적되면 KVT로 전환해 처리 속도를 높이고 운영 비용을 절감할 수 있으며, 주민등록증이나 운전면허증 같은 표준 서식은 폼메이커로 초고속 처리가 가능하다. 사이냅 OCR IX는 세금계산서, 거래명세서, 견적서 등 비정형 비즈니스 문서부터 표준 서식까지 폭넓게 적용할 수 있는 실질적인 솔루션을 완성했다. 사이냅소프트 전경헌 대표는 "OCR IX는 25년간 축적한 문서 처리 기술에 AI 에이전트 개념을 결합해 도입부터 운영까지 최적의 성능을 제공하는 솔루션"이라며 "200건 이상의 실적으로 입증된 인식 정확도에 VLM의 유연성을 더해, 도입부터 확장까지 기업의 업무 환경에 가장 최적화된 도큐먼트 AI 모델을 구현했다"고 전했다.

2026.01.26 17:12남혁우 기자

"도입 전 품질 검증"…한국딥러닝, '딥 에이전트 랩' 출시

한국딥러닝이 기업 인공지능(AI) 도입 장벽을 낮추기 위해 문서 처리 기술을 미리 검증해 볼 수 있는 테스트베드를 마련했다. 한국딥러닝은 딥 에이전트 솔루션을 체험할 수 있는 데모 플랫폼 '딥 에이전트 랩'을 출시했다고 16일 밝혔다. 사용자는 이 플랫폼을 통해 문서 업로드만으로 '딥 광학문자인식(OCR)과 '딥 파서' 처리 과정을 확인하고 결과물을 받아볼 수 있다. 이번 플랫폼의 가장 큰 특징은 독립적 기능 실행이다. 사용자는 딥 OCR만 실행해 표 감지와 텍스트 추출 결과를 확인하거나 딥 파서만 구동해 문서 구조 분해 성능을 개별 검증할 수 있다. 이는 기업이 거대언어모델(LLM)이나 검색증강생성(RAG) 시스템을 도입하기 전 문서 처리 품질을 사전에 확인하는 데 유용하다. 딥 OCR은 제이슨(JSON)과 엑셀 등으로, 딥 파서는 HTML과 PDF 등으로 데이터를 출력해 실제 업무 환경과 유사한 테스트가 가능하다. 플랫폼은 웹 기반으로 운영되며 구글 통합 인증(SSO)을 지원해 접근성을 높였다. 사용자는 대시보드를 통해 팀별 분석량과 크레딧 잔여량 등 분석 이력을 한눈에 관리할 수 있다. 한국딥러닝은 이번 출시와 함께 금융, 공공, 제조, 물류 등 주요 산업별 문서 AI 패키지도 공개했다. 이 패키지는 산업 특화 데이터 구조와 룰셋을 포함하고 있어 개념 증명(PoC)에서 상용화까지 걸리는 시간을 줄인다. 앞서 한국딥러닝은 와이즈넛, 코난테크놀로지와 협력해 딥 에이전트의 데이터 처리 성능을 입증했다. 실험 결과 문서 검색 정확도와 응답 안정성이 개선됐으며 이를 바탕으로 향후 산업별 특화 검색 시스템으로 영역을 확장할 계획이다. 김지현 한국딥러닝 대표는 "기업은 딥 에이전트 랩으로 문서 기반 AI의 기술을 도입 전 확인할 수 있다"며 "우리는 산업별 패키지와 API, 온프레미스 제공을 통해 문서 자동화 도입 속도를 높이겠다"고 밝혔다.

2025.12.16 10:27김미정 기자

한컴, 한컴어시스턴트 등 AI 솔루션 3종 '차세대 세계일류상품' 선정

한글과컴퓨터(이하 한컴, 대표 변성준·김연수)가 인공지능(AI) 기반 문서·업무 자동화 솔루션 3종으로 '차세대 세계일류상품'에 선정되며 글로벌 시장에서의 경쟁력을 한 번 입증했다. 한글과컴퓨터는 서울 롯데호텔월드에서 열린 '2025년 세계일류상품 인증서 수여식'에서 AI 솔루션 3종이 '차세대 세계일류상품'으로 선정됐다고 19일 밝혔다. 세계일류상품 인증 제도는 산업통상자원부와 대한무역투자진흥공사(KOTRA)가 주관해 세계 시장에서 경쟁력과 성장 가능성을 인정받은 제품을 선정·지원하는 제도다. 매년 제조·서비스 분야를 대상으로 수출 비중, 기술력, 시장 점유율 등을 종합 평가해 '현재 세계일류상품'과 '차세대 세계일류상품'으로 나눠 인증서를 수여한다. 이번에 차세대 세계일류상품으로 이름을 올린 한컴 제품은 AI 문서 작성 도구 '한컴어시스턴트', 오피스 업무 생산성 도구 소프트웨어 개발 키트 '한컴오피스 SDK', 광학식 문자판독기 소프트웨어 개발 키트 '한컴 OCR SDK' 등 3종이다. 모두 AI 기반으로 문서 작성·편집·인식 등 전 과정을 자동화·지능화해 업무 효율을 높이고, 다양한 서비스·시스템과 연동 가능한 형태로 제공되는 점이 높게 평가받았다는 설명이다. 한컴은 최근 몇 년간 축적한 AI 및 문서 처리 기술을 바탕으로 공공 분야에서 대형 AI 사업을 연이어 확보하며 기술 역량과 시장 경쟁력을 입증해 왔다. 국회 빅데이터 플랫폼(AI 국회) 구축 1단계 사업을 시작으로, 행정안전부 지능형 업무관리 시스템 구축, 범정부 AI 공통 기반 사업, 경기도교육청 디지털 플랫폼 구축 사업, 독자 AI 파운데이션 모델 프로젝트 등 굵직한 사업에 참여하며 AI 기업으로의 전환 속도를 높이고 있다. 특히 한컴은 문서 처리·오피스 소프트웨어 영역에서 확보한 기술을 소프트웨어 개발 키트(SDK) 형태로 모듈화해, 외부 서비스·플랫폼에 쉽게 탑재할 수 있는 생태계를 확장하고 있다. AI 문서 작성을 지원하는 한컴어시스턴트와 다양한 문서 포맷을 지원하는 한컴오피스 SDK, 대량 문서 처리 및 OCR 기반 데이터화에 최적화된 한컴 OCR SDK는 공공기관과 기업의 디지털 전환 수요와 맞물려 활용 범위를 넓혀가고 있다는 평가다. 한컴 관계자는 "이번 세계일류상품 선정은 한컴의 AI 기술이 글로벌 시장에서도 경쟁력을 갖추고 있음을 보여준다는 점에서 의미가 크다"라며 "앞으로도 AI 기술 확산을 통해 업무 효율성과 생산성을 높이고, 세계 시장에서 경쟁력 있는 대한민국 대표 AI 기업으로 도약하겠다"고 말했다.

2025.11.19 15:04남혁우 기자

네이버가 약 먹을 시간 챙겨준다…'복약관리' 서비스 추가

네이버는 지난 12일 '네이버 헬스케어' 페이지에 복약관리 서비스를 추가했다고 14일 밝혔다. 해당 서비스 추가를 통해 이용자는 약 봉투를 촬영하면 처방받은 약, 복용 일정을 자동으로 등록하고 관리할 수 있다. 네이버는 약 정보 요약 및 봉투 촬영 후 데이터 변환에 OCR(광학 문자 인식)을 포함한 인공지능(AI) 기술들을 활용했다. '복약관리 서비스'를 통해 이용자는 복용 여부, 오늘의 복용률 등을 확인하고 건강 관리를 챙길 수 있다. 또한 날짜별 복약 내역과 증상 기록을 통해 이용자의 복용 패턴, 변화를 확인할 수 있다. 이용자는 네이버 검색창에 '네이버 헬스케어'를 검색하거나, 네이버앱 좌측 상단 바로가기-전체 서비스에서 '헬스케어'를 선택해 '복약관리 서비스'를 이용할 수 있다. 네이버 헬스케어 페이지에서는 ▲네이버 만보기 ▲병원 예약 일정 ▲증상체크를 비롯해 ▲자외선·대기 정체·감기 지수 ▲건강 관련 클립 콘텐츠 ▲네이버페이 실손 보험금 신청 등을 이용할 수 있다. '네이버 증상체크'는 이용자가 현재 느껴지는 증상을 입력하면 예상 가능한 병명, 가까운 병원을 알려주는 디지털 헬스케어 서비스로 지난 9월 한국어, 영어 다국어 지원을 강화했다. 차동철 네이버 의료혁신센터장은 “네이버 헬스케어 페이지에서 꼭 필요한 건강 정보를 포함해 개인 건강 관리를 위한 다양한 기능을 추가할 예정”이라며 “일상생활에서 이용자에게 실질적인 도움을 줄 수 있는 건강 관련 서비스를 지속적으로 고도화하겠다”고 말했다.

2025.11.14 14:34박서린 기자

업스테이지 "연말까지 1000억 매개변수 LLM 만들 것"

국내 AI 스타트업 업스테이지가 거대언어모델(LLM) 시장 공략을 가속화한다. 올 연말까지 1000억 매개변수를 갖춘 LLM을 개발하고, 한국 뿐만 아니라 아세안·중동 등 글로벌 무대로 시장 영역을 확장할 계획이다. 최훈 업스테이지 사업개발 총괄 이사는 30일 서울 코엑스에서 열린 'AI 페스타 2025'에서 회사의 핵심 기술 및 사업 전략에 대해 밝혔다. 업스테이지는 자체 개발한 거대언어모델(LLM) '솔라'와 다양한 이미지 형태의 문서에서 글자 및 정보를 추출해 디지털화하는 광학문자인식(OCR) 솔루션 '도큐먼트 AI' 등을 개발해 왔다. 최 이사는 "도큐먼트 AI는 금융권에 가장 먼저 공급된 솔루션으로, 그만큼 정확도가 담보됐기 때문에 거둘 수 있었던 성과"라며 "2023년에는 자체 기술력으로 개발한 소형 LLM 모델인 솔라로 글로벌 오픈소스 차트 1위를 차지하기도 했다"고 설명했다. 덕분에 업스테이지는 지난해 1천억원 규모의 추가 투자를 유치했으며, 글로벌 시장조사기관인 CB인사이츠로부터 '글로벌 혁신 AI 스타트업 100'에 선정된 바 있다. 지난달에는 스타트업 중 유일하게 'AI 국가대표' 5팀 중 한 곳으로 선정되기도 했다. 최 이사는 "업스테이지의 솔루션은 글로벌 탑3 이내로 비용 효율성이 높다"며 "고성능 업무에서도 충분한 성능을 보이면서 비용은 거의 25분의 1 수준이기 때문에 많은 기업들이 업스테이지의 모델을 선택하고 있다"고 말했다. 또한 업스테이지는 솔라와 도큐먼트 AI를 결합해 AI 모델에서 발생하는 할루시네이션 현상을 크게 줄였다. 도큐먼트 AI를 통해 방대한 양의 문서에서 정보를 정확하게 추출해낸 뒤, 이를 솔라와 연계해 필요한 답을 도출하는 구조다. 나아가 업스테이지는 올 연말까지 1000억(100B) 매개변수 규모의 차세대 LLM을 개발할 계획이다. 업스테이지가 올해 공개 '솔라 프로 2'의 경우 310억개의 매개변수를 보유하고 있다. 또한 국내 기업들을 타겟으로 금융, 법률, 제조, 교육 등 특정 형태의 모델 개발을 추진한다. 내년 하반기부터는 멀티모달 비전언어모델(VLM)을 포함하고, 아세안 및 중동 지역까지 지원할 수 있는 거대 AI 모델을 개발하는 것이 목표다. 최 이사는 "OCR과 LLM을 동시에 사용할 수 있는 솔루션을 제공하는 회사는 현재 한국에서 업스테이지가 유일할 것"이라며 "글로벌 3강 AI 기업이 돼서 한국뿐만 아니라 아세안, 그리고 미국과 중국이 닿지 않는 국가들에게 AI 모델을 공급하고자 한다"고 강조했다.

2025.09.30 17:44장경윤 기자

지미션, 중기부 업고 'VLM OCR' 날개…'보는 AI'로 문서 혁신 이끈다

지미션이 차세대 비전언어모델(VLM) 광학문자인식(OCR) 기술을 앞세워 지능형 문서처리 시장 선점에 나선다. 지미션은 중소벤처기업부가 주관하는 '중소기업기술혁신개발사업 시장확대형' 연구과제에 최종 선정됐다고 22일 밝혔다. 선정된 과제는 'VLM 기반의 멀티모달 지능형 OCR 솔루션 연구개발'이다. VLM은 텍스트는 물론 이미지와 시각 정보까지 함께 분석하는 멀티모달 모델이다. 기존 기술이 단순히 문서 속 글자를 정확히 읽어내는 데 집중했다면 지미션의 기술은 문서의 전체 맥락까지 이해하는 한 단계 진화한 기술로 평가받는다. 이 기술은 문서 속 글자, 표, 그래픽, 서식 구조를 종합적으로 파악한다. 이를 통해 AI가 단순 문자 인식을 넘어 문서가 담고 있는 본래 의미를 파악하는 것이 가능해진다. 지미션은 AI OCR를 기반으로 ▲문서 자동 분류 ▲개인정보 마스킹 ▲거대언어모델(LLM) 기반 요약 및 검색 기술을 이미 보유하고 있다. 이번 연구개발은 기존 기술에 VLM을 더해 문서 처리 수준을 한 차원 높이는 것을 목표로 한다. 기술이 상용화되면 사용자는 문서 속 항목의 의미와 맥락까지 반영된 지능형 서비스를 경험할 수 있다. 일례로 같은 숫자라도 계좌번호인지, 주민등록번호인지 서식에 맞춰 스스로 구분하고 필요한 항목만 골라 추출하거나 요약할 수 있게 된다. 더불어 맥락에 기반한 검색 기능으로 방대한 문서 더미에서도 원하는 정보를 신속하고 정확하게 찾을 수 있게 된다. 한준섭 지미션 대표는 "이번 연구개발을 통해 기존 OCR을 뛰어넘는 고도화된 문서처리 기술을 확보할 것"이라며 "공공, 금융, 의료, 기업 등 다양한 산업에서 활용할 수 있는 혁신적 AI 솔루션을 선보이겠다"고 밝혔다.

2025.09.22 16:33조이환 기자

사이냅소프트, VLM 기술로 OCR 고도화…"AX 시대 선도할 것"

사이냅소프트가 비전언어모델(VLM) 기술로 데이터 추출 정확도를 높여 인공지능(AI) 전환(AX) 시대의 기술 리더십을 강화한다. 생성형 AI의 고질적 문제인 환각 현상을 최소화해 문서 기반 업무 혁신을 가속화하는 전략이다. 사이냅소프트는 AI 기반 광학문자인식(OCR) 솔루션 '사이냅 OCR'의 누적 레퍼런스가 200건을 돌파했다고 1일 밝혔다. 이는 지난 3월 150건 돌파 이후 5개월 만에 50건 이상의 신규 사례를 추가 확보한 것으로 회사의 가파른 성장세를 증명한다. '사이냅 OCR'의 핵심 경쟁력은 머신러닝 기반 학습과 비전-언어 모델을 결합한 하이브리드 기술에 있다. 이를 통해 생성형 AI의 약점으로 꼽히는 환각 현상을 최소화했다. 문서 내 특정 키와 값(Key-Value)을 정확히 추출해 데이터 처리 신뢰성을 높인 것이 특징이다. 이 솔루션은 한국정보통신기술협회(TTA) 인증으로 검증된 99.3%의 한글 인식률과 굿서비스(GS) 인증을 획득해 기술적 안정성을 입증받았다. 또 로봇프로세스자동화(RPA) 시스템과 연동돼 업무 자동화 효율을 극대화한다. 특히 '사이냅 도큐애널라이저'와 결합해 기업의 문서 자산을 생성형 AI를 위한 지식 자산으로 전환한다. 단순한 디지털 전환(DX)을 넘어 인공지능 전환(AX) 패러다임을 주도하고 있다는 평가가 나온다. 전경헌 사이냅소프트 대표는 "200건 이상의 레퍼런스는 '사이냅 OCR'의 독보적인 기술력과 시장의 높은 신뢰를 증명하는 성과"라며 "최신 VLM 기술을 적용해 데이터 정확도를 한층 더 끌어올린 만큼 문서 기반 업무를 혁신하는 '도큐먼트 AI' 리더로서 기업의 성공적인 AX 전환을 지원하겠다"고 밝혔다.

2025.09.01 16:01조이환 기자

한국딥러닝, 여성 IT 인재 창업·커리어 방향 제시

한국딥러닝이 여성 IT 인재 대상으로 창업과 커리어 발전 전략을 제시한다. 김지현 한국딥러닝 대표는 내달 4일 경북대 글로벌플라자에서 열리는 '동북권 여성 인공지능(AI)·소프트웨어(SW) 커리어 컨설팅 & 네트워킹 데이' 행사에 기조강연자로 나선다고 29일 밝혔다. 이 행사는 과학기술정보통신부와 정보통신산업진흥원이 주최하며 경북, 강원, 대구 지역 여성 재취업 희망자와 창업 준비자 등 100여 명이 참석한다. 김 대표는 '불가능을 뒤집는 성장기'를 주제로 강연을 진행한다. 대학 시절 시작한 창업이 6년 만에 6년 연속 흑자를 기록한 부트스트랩 AI 기업으로 성장하기까지의 여정을 공유할 예정이다. 행사에서는 김 대표의 강연 외에도 오해숙 유피체인 대표가 '2025 ICT 여성 커리어 전환 전략'을 발표한다. 오후에는 창업과 취업 분야로 나뉜 1:1 멘토링 프로그램이 운영돼 참가자들이 AI·SW 전문가와 직접 상담할 수 있다. 한국딥러닝은 2019년 설립 이후 시각지능 AI 솔루션을 공공기관과 대기업 등 80개 이상 고객사에 제공해왔다. 누적 매출은 100억 원을 넘어섰으며 꾸준히 흑자를 유지하고 있는 것으로 알려졌다. 올해 국내 최초로 비전 언어 모델(VLM) 기반 광학문자인식(OCR) 솔루션 '딥 OCR플러스'를 공개했다. 이 제품은 별도 데이터 수집이나 라벨링 없이 다양한 문서를 즉시 처리할 수 있다. 김 대표는 "AI 기술 발전으로 이 분야 여성 인재의 역할이 더욱 중요해지고 있다"며 "이번 강연을 통해 창업 과정에서 겪은 실질적 경험과 정부 지원 활용법, 초기 어려움 극복 노하우를 공유하겠다"고 말했다.

2025.08.29 17:02김미정 기자

로민, NH농협은행과 맞손…VLM 기술로 금융 문서 자동화

로민이 NH농협은행와 함께 비전-언어 모델(VLM) 기반 금융 실무 혁신을 이끈다. 금융권의 난도 높은 문서 처리 자동화를 본격화하고 실질적인 업무 효율성을 높이려는 전략이다. 로민은 NH농협은행이 주관하는 스타트업 협업 프로그램 '2025 NH오픈비즈니스허브'에 최종 선정됐다고 6일 밝혔다. 이 프로그램은 유망 스타트업과 공동으로 디지털 혁신을 추진하고 사전검증(PoC) 및 투자를 연계하는 NH농협은행의 대표 오픈이노베이션 사업이다. 이 회사는 이번 협업을 통해 자사의 비전언어모델(VLM) 기반 인공지능(AI) 광학문자인식(OCR) 솔루션을 금융권에 맞게 고도화하는 PoC를 진행한다. 이 솔루션은 비정형 구조나 복잡한 양식의 금융 문서에서도 높은 정확도로 정보를 추출하는 역량을 갖췄다. 핵심 기술인 VLM은 이미지와 텍스트를 동시에 이해하도록 학습된 멀티모달 AI 모델이다. 이를 통해 문서의 시각적 양식과 내용을 종합적으로 분석해 기존 기술의 한계를 넘는다는 게 회사 측 설명이다. 로민은 이미 여러 산업 프로젝트에서 해당 기술의 실효성을 입증해왔다. 로민은 향후 생성형 AI 시장 확산에 맞춰 사업 영역을 넓힌다. 문서 특화 VLM과 고성능 문서 파서 기술을 결합해 AI가 직접 학습할 수 있는 고품질 데이터를 제공하는 데 주력할 방침이다. 강지홍 로민 대표는 "NH오픈비즈니스허브를 통해 문서 특화 브이엘엠 기술의 금융권 적용이 본격화됐다"며 "현장 중심의 AI 기술을 통해 문서 자동화 시장의 새로운 기준을 제시해 나가겠다"고 밝혔다.

2025.08.05 13:57조이환 기자

AI로 문화유산 읽는다…로민, 영상자료원 디지털 아카이빙 사업 수주

로민이 인공지능(AI) 광학 문자 인식 기술력을 활용해 국가 문화유산 디지털 전환을 선도한다. 로민은 한국영상자료원 영상 자료 정보관리시스템 고도화 사업의 일환으로 AI OCR 솔루션 구축 사업을 수주했다고 4일 밝혔다. 이 사업은 한국문헌정보기술과의 협업을 통해 진행되며 로민은 AI OCR 기술을 공급하며 디지털 아카이빙 정밀도 향상에 기여할 예정이다. 한국영상자료원은 문화체육관광부 산하 공공기관으로 국내외 영화·영상 관련 다양한 유형의 자료를 수집·보존하고 있다. 서울 상암 본원과 파주 보존센터 간 이중 아카이빙 체계를 운영하며 디지털 영상 데이터의 안정적 보존과 활용도를 높이기 위한 정보관리 시스템을 지속적으로 고도화하고 있다. 이번 사업은 자료원이 보존 중인 문서 자료의 디지털화를 고도화해 문화유산의 체계적 관리와 활용성을 높이는 데 목적이 있다. 특히 도서·문헌 자료에 포함된 텍스트를 자동으로 추출·가공해 디지털 자산으로 활용할 수 있도록 AI OCR 기술 도입이 핵심 과제로 포함됐다. 로민은 이에 따라 AI OCR 솔루션 '텍스트스코프 리더'와 문서 인식 결과 검수·관리를 위한 '텍스트스코프 다큐먼트 센터'를 공급한다. 텍스트스코프 리더는 인쇄체·필기체·타자체 등 다양한 문자 유형을 고정밀로 인식할 수 있는 AI OCR 엔진으로, 저해상도 이미지나 스마트폰 촬영 문서, 노이즈가 많은 데이터에서도 안정적인 성능을 제공한다. 필기체와 같이 불규칙한 문자도 정확히 인식할 수 있어 자료원의 다양한 문헌과 비정형 기록물 디지털화에 최적화돼 있다. 텍스트스코프 다큐먼트 센터는 사용자 친화적인 인터페이스를 기반으로 인식 결과를 검수·수정할 수 있으며 처리 통계 대시보드 등을 제공해 실무 편의성과 관리 효율을 동시에 충족시킨다. 강지홍 로민 대표는 "국가 문화유산의 디지털 보존 수준을 높이는 이번 사업에 참여하게 돼 의미가 크다"며 "텍스트스코프 리더는 영상자료원과 같은 공공기관의 다양한 비정형 기록물 환경에 최적화된 기술로, 실질적 성과를 창출할 수 있을 것"이라고 말했다.

2025.08.04 16:19한정호 기자

로민, NIA 사업 주관기업 선정…공공문서 AI SaaS 시장 정조준

로민이 정부 주관 사업을 통해 공공문서 디지털 전환용 서비스형 소프트웨어(SaaS) 개발에 착수한다. 로민은 최근 과학기술정보통신부와 한국지능정보사회진흥원(NIA)이 주관하는 '2025년 공공부문 이용 SaaS 개발·검증' 사업의 주관기업으로 최종 선정됐다고 14일 밝혔다. 이번 사업은 공공 부문에 적합한 SaaS 모델을 개발하고 이를 조달 체계와 연계해 상용화 가능성을 검증하는 것을 목표로 한다. 로민은 이번 과제를 통해 회사의 온프레미스 기반의 문서 인공지능(AI) 솔루션 '텍스트스코프 스튜디오'를 클라우드 환경에 맞춰 재설계한 '텍스트스코프 클라우드' 개발에 착수한다. 이 플랫폼은 문서 자동 분류, 서식 인식, 검색·요약 기능 등을 포함하며 공공문서 환경에 최적화된 AI 학습·배포 기능(MLOps)을 갖춘 것이 특징이다. '텍스트스코프 클라우드'는 필기체, 인쇄체, 타자체 등 다양한 서체 인식이 가능한 고정밀 광학문자인식(OCR) 기술을 기반으로 문서 인식 정확도를 높인다. 동시에 공공기관별 행정 프로세스에 맞는 맞춤형 AI 모듈을 지원해 다양한 업무 시스템과 연동된다. 로민은 이번 사업을 통해 내년까지 총 여섯 가지 주요 솔루션을 SaaS로 전환한다. 기록물관리시스템(RMS), 전자문서관리시스템(EDMS) 등과의 통합을 통해 비전자 문서의 디지털화를 촉진하고 행정문서 처리의 효율성과 정확성을 높이는 데 집중한다. 올해 1차년도에는 클라우드 기반 공공서비스 제공을 위한 공공 플랫폼형 클라우드 서비스(K-PaaS), 클라우드 서비스 적합성 평가제도(KACI) 등 주요 인증을 획득하고 내년에는 클라우드 서비스 보안 인증(CSAP) 보안 인증 및 디지털서비스몰 등록을 완료할 예정이다. 이후 조달시장 진출을 본격화하면서 공공기관 대상 SaaS 공급을 확대한다는 계획이다. 로민은 이미 우정사업본부, 특허청, 국가기록원 등 주요 공공기관과의 협업을 통해 기술 안정성과 인식 정확도를 검증한 바 있다. 이번 사업을 계기로 기존 성과를 클라우드 환경으로 확장하며 공공 다큐먼트 AI 시장에서의 리더십을 공고히 할 방침이다. 강지홍 로민 대표는 "문서 기반 행정업무를 보다 효율적이고 정확하게 처리할 수 있는 SaaS 모델의 필요성이 높아지고 있다"며 "이번 과제를 통해 신뢰성 높은 공공문서 AI 인식 서비스를 구현하고 공공 SaaS 도입의 모범 사례를 만들어 나가겠다"고 밝혔다.

2025.06.14 16:59조이환 기자

"굿바이 수기입력"…한국딥러닝, 금융 여신서류에 AI 자동화 도입

한국딥러닝이 국내 대형 금융사 프로젝트 수주를 통해 금융권 공략에 시동을 걸었다. 한국딥러닝은 최근 한 대형 금융사와 여신 심사 과정에 필요한 문서 자동처리 시스템 구축 계약을 체결했다고 22일 밝혔다. 이 프로젝트에는 자체 비전언어모델(VLM) 기반 광학문자인식(OCR) 솔루션인 '딥 오씨알 플러스(DEEP OCR+)'가 적용된다. 해당 금융사는 기존에 여신 심사 시 46종의 신청·증빙 문서를 하나의 PDF로 수령해 사람이 직접 분류하고 입력해왔다. 이로 인해 문서 누락이나 오탈자, 병목 등 반복적 오류가 발생해 업무 효율 저하가 불가피했다. 한국딥러닝은 이같은 비효율 문제를 해결하기 위해 문서의 의미와 구조를 동시에 파악할 수 있는 시각지능 AI를 투입했다. '딥 오씨알 플러스'는 OCR 기술을 넘어 문서 내 시각적 레이아웃과 언어적 맥락을 함께 분석해 필요한 정보를 자동 추출한다. 이 솔루션은 회사가 지난 5년간 확보한 4억 장 이상의 텍스트·이미지 데이터를 학습한 문서특화 VLM 모델을 기반으로 한다. PDF, HWP, 워드 등 다양한 문서 유형에 대응하며 하나의 PDF 안에 병합된 문서를 자동 분할·분류할 수 있다. 정확도와 속도 개선 수치도 두드러진다. 기존 솔루션 대비 복합 문서 인식 정확도는 27% 향상됐고 병렬처리 기술 덕분에 문서 처리 속도는 10배 빨라졌다. 또 검증 대시보드 내 '휴먼 인 더 루프' 기능을 통해 인식 불가 항목을 빠르게 검수할 수 있어 오탈자 발생률도 95% 이상 줄일 수 있을 것으로 기대된다. 김지현 한국딥러닝 대표는 "모든 AI 에이전트의 시작은 '보는 능력'에서 출발한다"며 "시각지능 기반 문서이해 기술로 산업 전반의 디지털 혁신을 이끌어 나가겠다"고 밝혔다.

2025.05.22 16:04조이환 기자

로민-이씨에이시스템, '물류 OCR' 공략…자동화 시장 판 키운다

로민이 물류 자동화 전문기업 이씨에이시스템과 손잡고 도큐먼트 인공지능(AI) 기술 고도화에 나선다. 로민은 최근 이씨에이시스템과 우편·물류 분야 AI 광학문자인식(OCR) 사업 확대를 위한 전략적 업무협약(MOU)을 체결했다고 19일 밝혔다. 이번 협약은 양사의 기술 및 솔루션을 연계해 물류 현장의 이미지 데이터를 효율적으로 인식하는 시스템을 공동 구축하기 위해 맺어졌다. 로민은 인쇄체와 필기체 모두를 정밀하게 인식하는 독자적인 AI OCR 엔진을 개발했다. 이 기술은 금융·공공·제조·무역 분야에서 검증됐으며 우편물 분류 과정에서도 이미지 처리 시스템(IPS)와의 연동성을 확보하고 있다. 이씨에이시스템은 지난 2005년 설립 이후 우정사업본부, 쿠팡, CJ대한통운, 롯데글로벌로지스, DHL 등 다수 물류 기업에 자동화 시스템을 공급해왔다. 독일 비트로닉, 비저바 등 글로벌 파트너사들과의 협업 경험도 보유하고 있다. 양사는 이번 협약을 통해 공공 우편물 처리 시스템은 물론 민간 택배 기업의 물류 자동화 과정에 AI OCR 솔루션을 공동 적용할 방침이다. 이는 정확한 데이터 확보와 분류 속도 향상을 통해 물류 전반의 효율성을 끌어올리는 기반이 될 것으로 예상된다. 이중순 이씨에이시스템 대표는 "이미지 기반 인식 기술은 물류 데이터의 정확성과 운영 효율을 동시에 높이는 핵심 기술"이라며 "AI OCR 전문기업인 로민과의 협력은 고객 맞춤형 물류 시스템 구축에 큰 시너지를 낼 것"이라고 밝혔다. 강지홍 로민 대표는 "물류 분야에 강점을 가진 이씨에이시스템과 협력하게 돼 의미가 크다"며 "실제 현장에서 체감 가능한 성과를 도출해 다큐먼트 AI 기술의 시장 확대를 이끌겠다"고 말했다.

2025.05.19 16:57조이환 기자

  Prev 1 2 Next  

지금 뜨는 기사

이시각 헤드라인

애플, 인텔에 칩 생산 맡긴다…"일부 위탁 합의"

AI 에이전트 띄운 네카오…하반기 ‘돈 버는 AI’로 간다

입는 로봇 입고 바이올린 연주했더니…"협응력 놀랍네"

"미토스에 대항"...정부, AI보안 특화 모델 개발 추진

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.