• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
  • AI의 눈
반도체
인공지능
AI의 눈
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'OCR'통합검색 결과 입니다. (29건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

"글자 위치·역할까지 파악"…미스트랄AI, 차세대 OCR 모델 출시

미스트랄AI가 기업 문서를 인공지능(AI)이 읽고 활용하기 쉬운 형태로 바꿀 수 있는 모델을 공개했다. 미스트랄AI는 새 광학문자인식(OCR) 모델 '미스트랄 OCR 4'를 출시했다고 24일 공식 홈페이지에서 밝혔다. 이 모델은 문서에서 텍스트를 추출할뿐 아니라 글자 위치와 문서에 적용되는 모델 신뢰도까지 측정한다. 미스트랄 OCR 4 핵심은 문서를 더 세밀하게 읽는 데 있다. 기존 OCR은 문서 속 글자를 텍스트로 바꾸는 데 초점을 맞췄지만 이 모델은 문서 내 글자 위치와 역할을 구분한다. 미스트랄 OCR 4는 텍스트 위치를 표시하는 바운딩 박스를 제공한다. 또 제목, 표, 수식, 서명 등 문서 요소를 유형별로 나누는 블록 분류 기능도 지원한다. 이 모델은 페이지별·단어별 신뢰도 점수도 제공한다. 기업은 이 점수로 출처 기반 인용, 민감 정보 삭제, 사람 검증이 필요한 업무를 더 안정적으로 처리할 수 있다. 미스트랄AI는 미스트랄 OCR 4를 기업 검색과 검색증강생성(RAG) 파이프라인 핵심 수집 도구로 내세웠다. 미스트랄 OCR 4가 문서를 구조화된 형태로 바꾸면 AI는 필요한 내용을 더 정확히 찾고 답변의 출처도 함께 제시할 수 있다. 기업은 미스트랄 OCR 4를 문서 기반 에이전트 업무에도 활용할 수 있다. 미스트랄AI는 미스트랄 OCR 4가 양식 작성, 송장 처리, 컴플라이언스 점검 같은 업무에서 AI 에이전트가 문서 내용을 이해하고 작업을 수행하는 데 필요한 기반을 제공한다고 설명했다. 미스트랄 OCR 4가 지원하는 문서 형식은 PDF, DOC, PPT, 오픈도큐먼트 등이다. 지원 언어는 10개 언어군에 걸친 170개 언어다. 미스트랄 OCR 4는 자체 호스팅도 지원한다. 미스트랄AI는 미스트랄 OCR 4를 단일 컨테이너에 배포할 수 있는 모델로 설계했다. 기업은 문서 데이터를 외부로 보내지 않고 자체 인프라 안에서 처리할 수 있다. 미스트랄AI는 성능 측면에서도 미스트랄 OCR 4의 경쟁력을 강조했다. 내부 분석에 따르면 독립 평가자들은 주요 OCR·문서 AI 시스템과 비교한 평가에서 미스트랄 OCR 4를 더 많이 선호했다. 평균 선호율은 72%였다. 미스트랄 OCR 4는 공개 벤치마크 'OlmOCRBench'에서 85.20점을 기록했다. 이는 미스트랄AI가 테스트한 모델 중 전체 최고 점수다. 'OmniDocBench'에서는 93.07점을 냈다. 미스트랄AI는 벤치마크 점수를 절대적 기준으로 보기는 어렵다고 설명했다. 수식 표기 방식이나 다단 문서 읽기 순서처럼 채점 방식에 따라 실제 성능과 다른 결과가 나올 수 있다는 이유에서다. 미스트랄 OCR 4의 가격은 API 기준 1000 페이지당 4달러다. 기업이 배치 API를 사용하면 50% 할인이 적용돼 가격은 1000 페이지당 2달러로 낮아진다. 다큐먼트 AI는 1천 페이지당 5달러다. 미스트랄AI는 미스트랄 OCR 4와 OCR 4 기반 다큐먼트 AI를 미스트랄 스튜디오, 아마존 세이지메이커, 마이크로소프트 파운드리를 통해 API로 제공한다. 스노우플레이크 파스 다큐먼트에서도 곧 지원될 예정이다. 키미 그레월 마이크로소프트 AI 생태계 파트너십 부문 부사장은 "마이크로소프트 파운드리에서 OCR 4 기반 미스트랄 다큐먼트 AI를 사용할 수 있게 된 것은 우리 파트너십에 중요한 이정표"고 말했다.

2026.06.24 18:31김미정 기자

지미션, 비정형 문서 이해·팩스 자동화 AX 솔루션 공개

지미션이 비정형 문서 이해와 팩스 업무 자동화, 영상 관제까지 아우르는 인공지능(AI) 전환(AX) 포트폴리오를 공개했다. 단순한 인식 자동화를 넘어 문서 구조와 의미를 해석하고, 후속 업무까지 연결하는 방향성을 제시했다는 점에서 업관심을 끌고 있다. 지미션은 STK 2026 현장에서 문서 이해, 팩스 자동화, 영상 분석을 결합한 AX 포트폴리오를 공개하며 공공·금융 등 문서 집약 산업을 겨냥한 현장형 AI 전략을 제시했다고 15일 밝혔다. 이번 전시의 핵심은 비전언어모델(VLM) 기반 OCR과 자율형 AI 에이전트 기술이다. 기존 OCR이 문서 내 텍스트 추출에 집중했다면 지미션이 공개한 'VLM OCR'은 계약서, 공문서, 금융서류 등 복잡한 비정형 문서의 구조와 문맥을 함께 해석하는 데 초점을 맞췄다. 이미지와 언어를 동시에 처리하는 모델을 기반으로 문서를 구조화된 데이터로 변환해, 문서 분류·정보 추출·업무 연계 효율을 높일 수 있도록 설계됐다. 이는 기업 현장에서 반복적으로 발생하는 문서 처리 병목을 줄이는 데 의미가 있다. 특히 서식이 일정하지 않은 계약서나 행정문서, 금융 관련 서류는 기존 규칙 기반 OCR로 처리하기 어려운 경우가 많았는데, VLM 기반 접근은 이런 한계를 보완할 수 있는 대안으로 평가된다. 함께 공개된 '에이전틱 G-팩스'는 팩스 수신 이후 과정을 AI 에이전트가 자율적으로 수행하는 자동화 솔루션이다. 수신 문서 분류, 핵심 데이터 추출, 요약, 검색, 후속 시스템 연계까지 전 과정을 자동화하는 것이 특징이다. 팩스 기반 업무 비중이 여전히 높은 공공기관과 금융권, 일부 제조업 현장에서 실질적인 도입 수요를 겨냥한 제품으로 해석된다. AI 기반 영상 분석 플랫폼 '덱스마(DEXMA)'도 현장 적용성을 강조한 솔루션으로 소개됐다. 이 플랫폼은 컴퓨터비전 기술을 활용해 CCTV 영상을 실시간 분석하고, 침입·배회·쓰러짐·화재 등 위험 상황을 자동 탐지해 관리자에게 즉시 알린다. 지미션에 따르면 DEXMA는 최근 한국인터넷진흥원(KISA)의 지능형 CCTV 성능 시험인증에서 배회 분야 인증을 획득했다. 이번 전시에서 지미션이 보여준 방향성은 분명하다. 문서 AI, 에이전트 자동화, 영상 인텔리전스를 개별 기능 단위가 아니라 실제 업무 프로세스 전반의 전환 도구로 묶어 제안하고 있다는 점이다. 특히 공공·금융처럼 정확성과 추적 가능성, 업무 연속성이 중요한 산업군을 주요 타깃으로 삼고 있다는 점에서 B2B AX 시장 공략 의도가 읽힌다. 지미션은 최근 하이서울기업 인증을 취득하고 하나원큐 애자일랩 17기에 선정되는 등 사업 확장 기반도 다지고 있다. 회사는 향후 문서와 데이터, 영상 영역에서 축적한 AI 기술을 바탕으로 현장 체감형 솔루션 공급을 확대한다는 계획이다. 한준섭 지미션 대표는 "AI 기술은 단순한 업무 효율화 수준을 넘어 기업 운영 방식 자체를 혁신하는 단계로 진화하고 있다"며 "고객이 실제 업무 환경에서 체감할 수 있는 실질적 솔루션을 지속적으로 선보이겠다"고 말했다.

2026.06.15 11:12남혁우 기자

한국딥러닝, 글로벌 OCR 벤치마크 1위…"제미나이·GPT 제쳐"

한국딥러닝이 글로벌 인공지능(AI) 시장에서 문서 처리 모델 경쟁력을 입증했다. 한국딥러닝은 허깅페이스에 등재된 글로벌 멀티모달 광학문자인식(OCR) 벤치마크 'OCR벤치 v2' 2026년 3월 영어 부문 평가에서 68.1점으로 종합 1위를 기록했다고 22일 밝혔다. 아시아 기업이 구글 제미나이를 제치고 정상에 오른 것은 이번이 처음이다. 이번 평가에서 한국딥러닝은 제미나이 3 프로 프리뷰를 4.7점 차로 앞섰다. 오픈AI GPT-5, 알리바바 큐웬3-옴니-30B, 앤트로픽 클로드 오퍼스 4.6 등 주요 모델보다 더 높은 점수를 받았다. OCR벤치 v2는 레이아웃 분석을 비롯한 수식 해석, 도표 이해, 논리 추론 등 31개 시나리오를 검증하는 고난도 벤치마크다. 또 1만 건 수작업 검증 데이터와 1500장 비공개 테스트셋으로 성능을 이중 검증할 수 있다. 한국딥러닝은 모델이 문서 구조화와 맥락 이해에서 강점을 보였다고 밝혔다. 문서 파싱 40.7점과 맥락 이해 85.4점을 기록하며 세부 항목 전반에서 고른 성과를 냈다는 설명이다. 핵심 기술은 환각을 최소화한 '니어-제로 할루시네이션(Near-Zero Hallucination)'이다. 이 기술은 문서에 없는 정보를 생성하지 않고 실제 문서에 기반한 정보만 추출하도록 설계됐다. 한국딥러닝은 문서 구조 이해에 특화된 모델을 자체적으로 만든 기업으로 알려졌다. 이를 통해 레이아웃과 항목 간 관계 위치 정보를 함께 반영해 의미 오류를 줄였다는 평을 받고 있다. 실제 환경 적용성도 확인됐다. 한국어 손글씨 등 노이즈가 많은 입력에서도 안정적인 인식이 가능하며 비공개 테스트셋에서도 성능이 유지된 것으로 나타났다. 김동현 한국딥러닝 최고전략책임자(CSO)는 "글로벌 빅테크들이 주도하는 AI 시장에서 아시아 기업이 순수 국내 기술로 제미나이와 GPT를 넘어섰다는 것은 의미 있는 성과"라며 "범용 모델이 따라올 수 없는 문서 지능 영역에서 구조적 설계를 통해 기술 격차를 증명했다"고 밝혔다.

2026.04.22 14:55김미정 기자

"OCR 넘어서"…데이터브릭스, 문서 이해 AI 플랫폼 공개

데이터브릭스가 기업 문서 속 비정형 데이터를 자동 수집·분석하는 인공지능(AI) 플랫폼을 공개했다. 19일 IT 업계에 따르면 데이터브릭스는 PDF 문서나 이미지 등에 묻혀 있던 비정형 정보를 실제 비즈니스에 활용 가능한 형태로 변환하는 솔루션을 내놨다. 해당 플랫폼은 기존 데이터브릭스 '레이크플로'와 '도큐먼트 인텔리전스'를 결합한 문서 처리 체계다. 레이크플로는 통합 데이터 엔지니어링 솔루션이다. 기업 내 다양한 시스템에 흩어진 데이터를 자동으로 수집하고 처리하며 파이프라인을 구성하는 역할을 한다. 도큐먼트 인텔리전스는 비정형 문서를 이해하고 구조화하는 AI 기능이다. PDF나 이미지 손 글씨 등 복잡한 문서를 분석한다. 이를 통해 계약 정보 금액 등 핵심 데이터를 자동으로 추출한다. 현재 기업 데이터 약 80%는 PDF나 이미지, 오피스 문서 형태로 존재한다. 이 데이터는 검색이나 분석이 어려워 사실상 활용되지 못했다. 그동안 기업은 광학문자인식(OCR)이나 자연어처리(NLP) 기술을 따로 연결해 문서 속 비정형 데이터를 처리해 왔다. 이 방식은 정확도가 낮고 관리도 어려워 기업 AI 도입에 걸림돌로 지적돼 왔다. 데이터브릭스는 '레이크플로 커넥트'를 통해 문서를 자동으로 가져오는 기능을 제공한다. 이 기능은 쉐어포인트나 구글 드라이브 등에 있는 문서를 별도 설정 없이 연결해 바로 데이터로 쓸 수 있게 돕는다. 이후 도큐먼트 인텔리전스가 문서를 읽고 이해하는 역할을 맡는다. 스캔 이미지나 손글씨 같은 복잡한 문서도 구조화해 계약 날짜, 금액, 거래처 정보 등을 자동 추출한다. 여기서 '레이크플로 잡스'가 문서 수집부터 분석까지 전 과정을 한 흐름으로 처리한다. 일부 작업이 실패해도 해당 부분만 다시 처리할 수 있어 운영 부담도 줄였다. 이 과정에서 유니티 카탈로그를 기반으로 데이터 접근 권한과 이력 관리가 적용된다. AI는 기업 내부 데이터 맥락을 반영해 더 정확하게 문서를 해석하고 활용할 수 있다. 크레이그 와일리 AI 제품 총괄은 "문서마다 별도 AI 아키텍처를 만들 필요가 크게 줄어든다"며 "이 제품은 내부에서 가장 높게 평가받고 있다"고 링크드인에서 밝혔다.

2026.04.19 18:00김미정 기자

"문서 올리면 AI가 알아서"…애자일소다, 에이전틱 OCR 출시

애자일소다가 별도 학습 없이 즉시 적용 가능한 인공지능(AI) 문서 자동화 플랫폼을 선보이며 기업 업무 자동화 시장 공략에 나섰다. 문서 처리부터 분석, 업무 자동화까지 연결하는 '문서 에이전트' 개념을 앞세워 기존 광학문자인식(OCR) 시장 구조를 바꾼다는 목표다. 애자일소다는 거대언어모델(LLM)과 비전언어모델(VLM) 기반 AI 문서 처리 자동화 플랫폼 '에이전틱 OCR'을 출시했다고 17일 밝혔다. 에이전틱 OCR은 문서 유형별 사전 학습이 필요했던 기존 OCR 방식의 한계를 개선한 것이 특징이다. 사용자가 이름, 계약일, 금액 등 추출 항목만 정의하면 AI가 문서에서 해당 정보를 자동으로 인식·분류·추출한다. 샘플 문서를 업로드하면 분류 및 추출 항목 초안도 자동 생성되며 별도 코드 작성이나 학습 데이터 구축 없이 당일 적용이 가능하다. 기존에는 새로운 문서 유형을 추가할 때마다 수주에서 수개월에 걸쳐 모델을 재학습해야 했지만, 해당 플랫폼은 이러한 과정을 생략해 문서 처리 시간을 획기적으로 단축했다. 성능도 확보했다. 회사 측에 따르면 비정형·정형 문서 20종을 대상으로 한 검증에서 문서 분류 정확도 98%, 정보 추출 정확도 95% 이상을 기록했다. 또 '액티브 러닝' 기능을 적용해 사용할수록 성능이 개선되는 구조를 갖췄다. 사용자가 추출 오류를 수정하면 해당 내용이 자동 반영돼 추가 학습 없이도 정확도를 지속적으로 높일 수 있다. 회사는 해당 기능 적용 시 5~15% 수준의 성능 향상을 확인했다고 설명했다. 보안성과 확장성도 고려했다. 온프레미스 환경을 완벽히 지원하며 고객사별 데이터 격리 구조를 적용했다. 문서 내 추출 정보의 위치를 좌표로 표시하는 기능을 제공해 금융권 감사 대응에도 활용할 수 있다. 현재 국내 은행, 보험사, 카드사 등 1·2금융권에서 성능 검증을 마쳤으며 도입을 진행 중이라고 밝혔다. 업계에선 LLM 기반 문서 처리 기술이 기존 OCR 시장의 전환점을 만들고 있지만, 실제 현장에선 여전히 수작업과 재학습 부담이 존재한다는 점에 주목하고 있다. 이에 에이전틱 OCR의 접근 방식이 의미 있는 변화로 평가받고 있다. 애자일소다는 향후 파일럿 고객사를 확대하고 문서 처리 기능을 넘어 검색증강생성(RAG) 기반 챗봇, 문서 비교 분석, 업무 자동화까지 확장해 문서 에이전트 플랫폼으로 발전시킨다는 계획이다. 최대우 애자일소다 대표는 "모든 기업 업무는 결국 문서에서 시작된다"며 "에이전틱 OCR은 기존 OCR의 연장선상에 있는 정보 추출 도구가 아니라, RAG 기반 챗봇·문서 대조 분석·업무 자동화까지 문서를 접점으로 한 기업 업무 전반을 커버하는 문서 에이전트 플랫폼의 출발점"이라고 말했다.

2026.04.17 14:19한정호 기자

문서 시장에 확산된 '터보퀀트'…사이냅소프트, AI 서비스 비용 낮췄다

사이냅소프트가 최근 인공지능(AI) 시장에서 큰 주목을 받은 경량화 기술 '터보퀀트'를 적용해 문서 AI 경쟁력을 강화한다. 대형언어모델(LLM)과 시각언어모델(VLM) 운영 시 발생하는 메모리 병목 문제를 해결하며 기업 AI 도입 비용을 낮춘다는 목표다. 사이냅소프트는 구글 리서치가 공개한 최신 벡터 양자화 알고리즘 터보퀀트를 자사 AI 솔루션 '사이냅 OCR IX'에 적용했다고 15일 밝혔다. 터보퀀트는 AI 모델이 긴 문서를 처리할 때 발생하는 메모리 사용량을 줄이기 위한 기술로, 최근 생성형 AI 확산과 함께 인프라 효율을 높이는 핵심 기술로 주목받고 있다. 특히 LLM·VLM이 사용하는 'KV 캐시'를 압축해 동일한 그래픽처리장치(GPU) 환경에서도 더 많은 데이터를 빠르게 처리할 수 있도록 지원하는 것이 특징이다. 사이냅 OCR IX는 VLM과 AI 에이전트 기술을 결합한 에이전틱 광학문자인식(OCR) 솔루션으로, 비정형 문서의 맥락을 이해하고 필요한 데이터를 자동 추출한다. 기존에는 긴 문서를 처리할수록 메모리 사용량이 급증해 고가의 GPU 인프라가 필요했지만, 터보퀀트 적용으로 이러한 한계를 개선했다는 설명이다. 회사 측에 따르면 이번 기술 적용을 통해 동일한 GPU 환경에서도 더 긴 컨텍스트와 대용량 배치를 병목 없이 처리할 수 있게 됐다. 이에 고성능 GPU 서버 구축 부담을 줄이고 총소유비용(TCO)도 낮출 수 있다. 사이냅소프트는 GPU 인프라 도입이 어려운 기업을 위해 중앙처리장치(CPU) 기반 환경도 함께 지원한다. 자체 모델에 대한 정밀 프로파일링을 통해 연산 효율을 높였으며 품질 손실을 1% 이하로 억제하면서도 CPU 서버만으로 분당 약 100건 수준의 추론 처리가 가능하도록 성능을 확보했다. 기존 서버 인프라를 활용해야 하는 기업이나 GPU 도입이 어려운 환경에서도 AI OCR 적용을 가능케 한다는 방침이다. 사이냅소프트는 이같은 기술 적용이 금융·공공 등 온프레미스 환경에서 AI 도입을 확대하는 계기가 될 것으로 보고 있다. 높은 보안 요구와 인프라 제약으로 AI 도입이 쉽지 않았던 산업에서도 비용 효율성과 성능을 동시에 확보할 수 있다는 점에서다. 전경헌 사이냅소프트 대표는 "단순히 자체 기술력에만 머물지 않고 글로벌 빅테크의 최신 연구 성과인 터보퀀트를 기민하게 상용화해 기존 VLM의 한계를 극복했다"고 말했다. 이어 "CPU 버전까지 아우르는 유연한 인프라를 지원해 기업들이 도입 비용 걱정 없이 에이전틱 OCR 환경을 구축하고 실질적인 업무 자동화를 이룰 수 있도록 적극 지원하겠다"고 덧붙였다.

2026.04.15 17:14한정호 기자

비상교육 수학플러스러닝, 'OCR 베타 서비스' 시작

글로벌 에듀테크 기업 비상교육(대표 양태회)은 AI 수학 학습 코스웨어 '수학플러스러닝'에 기출 시험지를 자동 분석해 유사 유형 문제를 생성하는 'OCR 베타 서비스'를 열었다고 31일 밝혔다. 비상교육은 2025년 미국 타임지(Time)와 글로벌 시장조사업체 Statista가 선정한 '2025 에듀테크 기업'에 이름을 올린 바 있다. 이번에 도입된 OCR 서비스는 수학플러스러닝의 내신 대비 시스템 '내신대비zone'에 탑재됐으며, 기출 시험지를 업로드하면 문항을 자동 인식·분석해 유사 유형의 쌍둥이·유사 문항을 매칭한다. 이를 통해 학교별 시험 유형에 맞춘 맞춤형 학습지를 보다 쉽게 제작할 수 있도록 지원한다. OCR 서비스는 강사가 기출 시험지를 업로드하면 시험지 문항을 자동으로 인식하고 분석해 유사한 유형의 문제를 찾아 매칭해준다. 이를 활용하면 기출 시험지 유형에 맞춘 쌍둥이 학습지를 생성할 수 있다. 학습지 생성 과정에서 강사는 원하는 문항을 추가하거나 삭제하는 등 자유롭게 편집할 수 있어 수업 상황이나 학생 수준에 맞는 학습지를 제작할 수 있다. 문항 편집 기능은 기존 '내신대비zone'의 문항 편집 프로세스와 동일해 기존 사용자라면 별도의 학습 없이 활용할 수 있다. '내신대비zone'은 교과서 학습부터 시험 직전 점검까지 내신 대비 전 과정을 지원하는 시스템이다. '교과서마스터' 기능을 통해 학생별 목표 점수를 설정하고 해당 교과서의 필수 유형을 학습할 수 있으며, 전국 모든 교과서 출판사를 선택해 학교 수업 진도에 맞춘 학습이 가능하다. 또한 '시험대비평가' 기능을 통해 대단원·중단원 선택, 난이도별 문항 구성, 문제 수 조절, 쌍둥이 문제 생성 등을 통해 맞춤형 평가지를 제작할 수 있어 중간·기말고사 대비 자료 준비 시간을 줄일 수 있다. 여기에 '기출Ai변형' 기능은 지역별·학교별 기출문제를 기반으로 출제 경향을 분석하고 이를 반영한 변형 문제를 자동 생성해 실제 시험과 유사한 문제 연습을 지원한다. 비상교육은 “이번 OCR 서비스 도입으로 기출 시험지를 활용한 맞춤형 내신 대비 학습지를 보다 빠르게 제작할 수 있게 됐다”며 “앞으로도 학원과 강사가 수업과 시험 대비를 효율적으로 진행할 수 있도록 AI기반 기능을 지속적으로 강화해 나갈 계획”이라고 밝혔다.

2026.03.31 17:24안희정 기자

GPU 1장으로 분당 500장 인식…사이냅소프트, '사이냅 OCR IX' 경쟁력 입증

사이냅소프트가 그래픽처리장치(GPU) 한 장으로 분당 문서 페이지 500장을 처리하는 차세대 광학문자인식(OCR) 솔루션 '사이냅 OCR IX'의 경쟁력을 입증했다. 고성능 역량과 온프레미스 지원을 앞세워 금융·공공 시장 레퍼런스를 확대한다는 목표다. 사이냅소프트는 지난달 출시한 사이냅 OCR IX의 세부 성능 데이터를 공개했다고 27일 밝혔다. 공개 자료에 따르면 사이냅 OCR IX는 OCR 엔진 단독 기준 11GB GPU 1장으로 동시 30건 요청 환경에서 분당 약 500장을 처리한다. 비정형 문서에서 핵심 정보를 자동 추출하는 키밸류 트레이너(KVT) 구성에선 분당 약 240장의 처리 성능을 기록했다. 이같은 속도는 실제 운영 환경에서 서비스 품질과 직결되는 요소다. 금융권의 신분증 인식이나 비대면 본인인증(eKYC)은 청약·정책대출 접수·연말정산 등 특정 시기에 수요가 급증한다. 단기간에 몰리는 수십만 건의 인증 요청을 지연 없이 처리하지 못할 경우 서비스 병목이 발생할 수 있다. 공공 부문 역시 사업 신청 기간에 하루 수십만 건의 서류가 접수되는 만큼 대규모 트래픽을 안정적으로 소화할 수 있는 인프라가 요구된다. 사이냅소프트는 농협은행·케이뱅크·신한은행·동양생명·현대해상 등 다수 금융사와 행정안전부, 한국자산관리공사 등을 포함해 200건 이상의 레퍼런스를 확보하고 있다. 인식 정확도와 처리 속도, 시스템 안정성을 종합적으로 충족하며 시장 신뢰를 확보했다는 설명이다. 특히 고객 내부 온프레미스 환경에서도 안정적으로 운영되며 보안성과 실적용성을 입증 중이다. 사이냅 OCR IX에 탑재된 비전언어모델(VLM)은 기존 OCR 솔루션의 서식 학습 부담을 줄이는 데 초점을 맞췄다. 사전 학습 없이도 처음 보는 서식을 처리하고 필요한 항목을 추출할 수 있어 기관마다 형식이 다른 계약서·확인서·점검표 등 비정형 문서 환경에서 도입 기간과 비용을 단축할 수 있다. 동시에 고성능 GPU 없이 자체 서버만으로 운영 가능한 CPU 버전도 지원해 초기 도입 부담을 낮췄다. 인식 범위 역시 확장됐다. 표 안에 중첩된 표나 스캔 과정에서 선이 누락된 표, 저해상도 이미지 내 표 인식은 물론 수식·바코드·QR코드까지 지원한다. 연구 문서나 물류·제조 현장에서 활용도가 높은 손글씨 인식 품질도 개선해 문서 자동화 적용 영역을 넓혔다. 전경헌 사이냅소프트 대표는 "200건 이상의 실적으로 입증된 신뢰성에 VLM의 유연성을 더해 기업 업무 환경에 최적화된 도큐먼트 AI 모델을 구현했다"며 "성능 수치로 증명된 압도적인 처리 역량을 바탕으로 시장 리더십을 더욱 공고히 할 것"이라고 밝혔다.

2026.02.27 16:39한정호 기자

[인터뷰] 사이냅소프트 "OCR IX, 에이전틱 도큐먼트 AI 시대 주도한다"

"광학문자인식(OCR)은 이제 글자를 읽는 기술을 넘어 문서를 이해하고 업무를 대신 수행하는 단계로 넘어가고 있습니다." 김영표 사이냅소프트 혁신개발팀장은 9일 지디넷코리아와 서울 마곡 본사에서 만나 최근 출시한 '사이냅 OCR IX'를 이같이 설명했다. OCR IX는 시각언어모델(VLM)과 인공지능(AI) 에이전트 개념을 결합한 신제품으로, 사이냅소프트가 제시하는 에이전틱 OCR 전략의 출발점으로 평가된다. 사이냅소프트는 2019년 딥러닝 기반 OCR 제품을 처음 선보인 이후 공공·금융·기업 시장을 중심으로 200건 이상의 레퍼런스를 쌓아왔다. 이번 OCR IX는 기존 OCR 제품을 IX로 리브랜딩하며 단순 인식 기술을 넘어 문서 이해와 업무 자동화까지 확장한 것이 특징이다. 김 팀장은 "OCR의 본질은 이미지에서 텍스트를 추출하는 것이지만, 실제 현장에서는 그 이후가 더 중요하다"며 "문서에서 핵심 키-밸류(KV)를 뽑고 이를 업무 시스템과 연결하는 과정이 OCR 도입의 진짜 목적"이라고 말했다. 사이냅소프트가 정의한 에이전틱 OCR은 KV 추출 결과뿐 아니라 그 구축과 운영 과정 자체를 AI 에이전트가 수행하는 개념이다. 서식 분석, 모델 선택, 학습, 검증, 보완 과정을 사람 대신 AI가 반복 수행해 구축 기간과 운영 부담을 줄이는 것이 목표다. 김 팀장은 "기존 OCR 프로젝트는 솔루션 도입 이후에도 별도의 구축 사업이 항상 따라붙었다"며 "서식이 조금만 바뀌어도 다시 비용과 시간이 들었지만, OCR IX는 이 과정을 AI가 스스로 반복 수행하도록 설계했다"고 밝혔다. OCR IX은 비전언어모델(VLM), KVT, 폼메이커 등 다양한 인식·추출 엔진을 제공해 비정형·정형문서를 처리할 때 속도와 복잡성 등 목적에 맞게 활용할 수 있다. 김 팀장은 "문서가 들어오면 정형·비정형 여부, 레이아웃 복잡도, 추출 항목 특성을 분석한 뒤 최적의 엔진 조합을 자동으로 구성한다"며 "결과를 정량 평가해 부족한 부분은 다시 보완하는 방식"이라고 말했다. 비정형 문서 OCR의 가장 큰 난제로는 기술보다 현실적인 비용 구조를 꼽았다. 그는 "계약서나 거래명세서처럼 문서 양식이 계속 바뀌는 환경에서는 유지·운영 비용이 가장 큰 부담"이라며 "OCR IX는 고객이 직접 GUI 환경에서 서식을 수정·보완할 수 있도록 설계했다"고 설명했다. 최근 화두인 VLM 기반 OCR의 환각(할루시네이션) 문제에 대해서도 선을 그었다. 사이냅 OCR IX는 VLM이 문서를 새로 '생성'하지 못하도록 구조적으로 제한한다. 그는 "VLM은 정답을 만들어내는 주체가 아니라, 기존 OCR 엔진이 인식한 확정 텍스트를 이해·검증하는 역할"이라며 "VLM이 근거를 찾고 그 근거를 다시 검증하는 구조로 환각을 통제한다"고 말했다. 그래픽처리장치(GPU) 비용 역시 고객들이 민감하게 묻는 지점이다. OCR IX는 문서 유형에 따라 GPU를 아예 쓰지 않거나 중소형 GPU만으로도 운영할 수 있도록 선택지를 제공한다. 김 팀장은 "VLM 단독 방식은 고성능 GPU가 필수지만, 데이터가 쌓이면 KVT로 전환해 비용을 크게 줄일 수 있다"며 "초기에는 VLM으로 빠르게 도입하고 이후 총소유비용(TCO)을 낮추는 전략이 현실적"이라고 말했다. 실제 사이냅소프트 내부 테스트 기준에 따르면 VLM 대비 KVT 전환 시 GPU 비용은 최대 20분의 1 수준까지 낮아지고 처리 속도는 수 초에서 1초 이내로 개선될 수 있다. OCR IX는 산업별 특화보다는 업무 난이도 중심 전략을 택했다. 단순 텍스트 추출이 필요한 경우는 'OCR 라이트'로, 복잡한 KV 추출과 업무 자동화가 필요한 경우는 OCR IX로 대응한다는 방침이다. 김 팀장은 "우리 솔루션은 기존 공공과 금융에서 강점이 있지만, 특정 산업에 국한된 제품은 아니다"며 "대출 서류 심사, 무역 문서, 진단서처럼 비정형 문서를 이해해야 하는 영역이 주요 타깃"이라고 밝혔다. OCR IX는 사이냅소프트의 도큐먼트 AI 포트폴리오에서도 핵심 역할을 맡는다. OCR IX가 인식한 이미지·PDF 데이터는 도큐애널라이저를 거쳐 구조화되고 이후 '어시스턴트'나 '아이넥스'와 같은 생성형 AI 서비스로 연결된다. 그는 "OCR IX의 인식 품질이 높아질수록 상위 AI 서비스의 정확도와 신뢰성도 함께 향상된다"며 "문서를 잘 읽는 것이 모든 문서 AI의 출발점"이라고 역설했다. 향후 방향성에 대해 김 팀장은 문서 AI를 넘어 비전 AI 전반으로의 확장을 예고했다. OCR과 VLM, 자연어처리(NLP), 음성 인식 기술을 축적해 장기적으로는 피지컬 AI까지 이어질 수 있는 기반을 마련하겠다는 구상이다. 김 팀장은 "에이전틱 OCR은 문서 이해에서 멈추지 않고 실제 업무 실행까지 연결되는 과정"이라며 "OCR IX는 그 출발점이고, 문서를 가장 정확하게 이해하는 AI로 진화해 나갈 것"이라고 강조했다.

2026.02.09 14:07한정호 기자

사이냅소프트, '사이냅 OCR IX' 출시…VLM과 AI 에이전트 결합

사이냅소프트(대표 전경헌)가 고도의 문맥 이해가 필요한 비정형 비즈니스 문서 시장에서의 인공지능(AI) 전환(AX)을 본격적으로 주도할 예정이다. 사이냅소프트는 시각 언어 모델(VLM)과 AI 에이전트 기술을 결합한 '사이냅 OCR IX'를 출시한다고 26일 밝혔다. 사이냅 OCR IX의 핵심은 AI 에이전트가 문서의 유형과 처리량에 따라 VLM, KVT, 폼메이커 중 최적의 엔진을 자동으로 선택하는 '에이전틱 OCR' 솔루션이다. 기존 사이냅 OCR의 TTA 인증 99.3% 한글 인식률을 유지하면서 새롭게 결합된 세 가지 엔진이 상호 보완하며 운영 효율을 극대화한다. 사이냅 OCR IX에 새로 결합된 VLM은 사전 학습 없이 신규 양식을 바로 처리할 수 있어 도입 기간을 단축하고 비정형 문서에서도 맥락을 파악해 데이터를 정확히 추출한다. 기존 사이냅 OCR의 텍스트 인식 기술과 결합해 VLM만 사용했을 때의 환각 현상을 방지하고 오인식을 최소화한 것이 특징이다. 데이터가 축적되면 KVT로 전환해 처리 속도를 높이고 운영 비용을 절감할 수 있으며, 주민등록증이나 운전면허증 같은 표준 서식은 폼메이커로 초고속 처리가 가능하다. 사이냅 OCR IX는 세금계산서, 거래명세서, 견적서 등 비정형 비즈니스 문서부터 표준 서식까지 폭넓게 적용할 수 있는 실질적인 솔루션을 완성했다. 사이냅소프트 전경헌 대표는 "OCR IX는 25년간 축적한 문서 처리 기술에 AI 에이전트 개념을 결합해 도입부터 운영까지 최적의 성능을 제공하는 솔루션"이라며 "200건 이상의 실적으로 입증된 인식 정확도에 VLM의 유연성을 더해, 도입부터 확장까지 기업의 업무 환경에 가장 최적화된 도큐먼트 AI 모델을 구현했다"고 전했다.

2026.01.26 17:12남혁우 기자

"도입 전 품질 검증"…한국딥러닝, '딥 에이전트 랩' 출시

한국딥러닝이 기업 인공지능(AI) 도입 장벽을 낮추기 위해 문서 처리 기술을 미리 검증해 볼 수 있는 테스트베드를 마련했다. 한국딥러닝은 딥 에이전트 솔루션을 체험할 수 있는 데모 플랫폼 '딥 에이전트 랩'을 출시했다고 16일 밝혔다. 사용자는 이 플랫폼을 통해 문서 업로드만으로 '딥 광학문자인식(OCR)과 '딥 파서' 처리 과정을 확인하고 결과물을 받아볼 수 있다. 이번 플랫폼의 가장 큰 특징은 독립적 기능 실행이다. 사용자는 딥 OCR만 실행해 표 감지와 텍스트 추출 결과를 확인하거나 딥 파서만 구동해 문서 구조 분해 성능을 개별 검증할 수 있다. 이는 기업이 거대언어모델(LLM)이나 검색증강생성(RAG) 시스템을 도입하기 전 문서 처리 품질을 사전에 확인하는 데 유용하다. 딥 OCR은 제이슨(JSON)과 엑셀 등으로, 딥 파서는 HTML과 PDF 등으로 데이터를 출력해 실제 업무 환경과 유사한 테스트가 가능하다. 플랫폼은 웹 기반으로 운영되며 구글 통합 인증(SSO)을 지원해 접근성을 높였다. 사용자는 대시보드를 통해 팀별 분석량과 크레딧 잔여량 등 분석 이력을 한눈에 관리할 수 있다. 한국딥러닝은 이번 출시와 함께 금융, 공공, 제조, 물류 등 주요 산업별 문서 AI 패키지도 공개했다. 이 패키지는 산업 특화 데이터 구조와 룰셋을 포함하고 있어 개념 증명(PoC)에서 상용화까지 걸리는 시간을 줄인다. 앞서 한국딥러닝은 와이즈넛, 코난테크놀로지와 협력해 딥 에이전트의 데이터 처리 성능을 입증했다. 실험 결과 문서 검색 정확도와 응답 안정성이 개선됐으며 이를 바탕으로 향후 산업별 특화 검색 시스템으로 영역을 확장할 계획이다. 김지현 한국딥러닝 대표는 "기업은 딥 에이전트 랩으로 문서 기반 AI의 기술을 도입 전 확인할 수 있다"며 "우리는 산업별 패키지와 API, 온프레미스 제공을 통해 문서 자동화 도입 속도를 높이겠다"고 밝혔다.

2025.12.16 10:27김미정 기자

한컴, 한컴어시스턴트 등 AI 솔루션 3종 '차세대 세계일류상품' 선정

한글과컴퓨터(이하 한컴, 대표 변성준·김연수)가 인공지능(AI) 기반 문서·업무 자동화 솔루션 3종으로 '차세대 세계일류상품'에 선정되며 글로벌 시장에서의 경쟁력을 한 번 입증했다. 한글과컴퓨터는 서울 롯데호텔월드에서 열린 '2025년 세계일류상품 인증서 수여식'에서 AI 솔루션 3종이 '차세대 세계일류상품'으로 선정됐다고 19일 밝혔다. 세계일류상품 인증 제도는 산업통상자원부와 대한무역투자진흥공사(KOTRA)가 주관해 세계 시장에서 경쟁력과 성장 가능성을 인정받은 제품을 선정·지원하는 제도다. 매년 제조·서비스 분야를 대상으로 수출 비중, 기술력, 시장 점유율 등을 종합 평가해 '현재 세계일류상품'과 '차세대 세계일류상품'으로 나눠 인증서를 수여한다. 이번에 차세대 세계일류상품으로 이름을 올린 한컴 제품은 AI 문서 작성 도구 '한컴어시스턴트', 오피스 업무 생산성 도구 소프트웨어 개발 키트 '한컴오피스 SDK', 광학식 문자판독기 소프트웨어 개발 키트 '한컴 OCR SDK' 등 3종이다. 모두 AI 기반으로 문서 작성·편집·인식 등 전 과정을 자동화·지능화해 업무 효율을 높이고, 다양한 서비스·시스템과 연동 가능한 형태로 제공되는 점이 높게 평가받았다는 설명이다. 한컴은 최근 몇 년간 축적한 AI 및 문서 처리 기술을 바탕으로 공공 분야에서 대형 AI 사업을 연이어 확보하며 기술 역량과 시장 경쟁력을 입증해 왔다. 국회 빅데이터 플랫폼(AI 국회) 구축 1단계 사업을 시작으로, 행정안전부 지능형 업무관리 시스템 구축, 범정부 AI 공통 기반 사업, 경기도교육청 디지털 플랫폼 구축 사업, 독자 AI 파운데이션 모델 프로젝트 등 굵직한 사업에 참여하며 AI 기업으로의 전환 속도를 높이고 있다. 특히 한컴은 문서 처리·오피스 소프트웨어 영역에서 확보한 기술을 소프트웨어 개발 키트(SDK) 형태로 모듈화해, 외부 서비스·플랫폼에 쉽게 탑재할 수 있는 생태계를 확장하고 있다. AI 문서 작성을 지원하는 한컴어시스턴트와 다양한 문서 포맷을 지원하는 한컴오피스 SDK, 대량 문서 처리 및 OCR 기반 데이터화에 최적화된 한컴 OCR SDK는 공공기관과 기업의 디지털 전환 수요와 맞물려 활용 범위를 넓혀가고 있다는 평가다. 한컴 관계자는 "이번 세계일류상품 선정은 한컴의 AI 기술이 글로벌 시장에서도 경쟁력을 갖추고 있음을 보여준다는 점에서 의미가 크다"라며 "앞으로도 AI 기술 확산을 통해 업무 효율성과 생산성을 높이고, 세계 시장에서 경쟁력 있는 대한민국 대표 AI 기업으로 도약하겠다"고 말했다.

2025.11.19 15:04남혁우 기자

네이버가 약 먹을 시간 챙겨준다…'복약관리' 서비스 추가

네이버는 지난 12일 '네이버 헬스케어' 페이지에 복약관리 서비스를 추가했다고 14일 밝혔다. 해당 서비스 추가를 통해 이용자는 약 봉투를 촬영하면 처방받은 약, 복용 일정을 자동으로 등록하고 관리할 수 있다. 네이버는 약 정보 요약 및 봉투 촬영 후 데이터 변환에 OCR(광학 문자 인식)을 포함한 인공지능(AI) 기술들을 활용했다. '복약관리 서비스'를 통해 이용자는 복용 여부, 오늘의 복용률 등을 확인하고 건강 관리를 챙길 수 있다. 또한 날짜별 복약 내역과 증상 기록을 통해 이용자의 복용 패턴, 변화를 확인할 수 있다. 이용자는 네이버 검색창에 '네이버 헬스케어'를 검색하거나, 네이버앱 좌측 상단 바로가기-전체 서비스에서 '헬스케어'를 선택해 '복약관리 서비스'를 이용할 수 있다. 네이버 헬스케어 페이지에서는 ▲네이버 만보기 ▲병원 예약 일정 ▲증상체크를 비롯해 ▲자외선·대기 정체·감기 지수 ▲건강 관련 클립 콘텐츠 ▲네이버페이 실손 보험금 신청 등을 이용할 수 있다. '네이버 증상체크'는 이용자가 현재 느껴지는 증상을 입력하면 예상 가능한 병명, 가까운 병원을 알려주는 디지털 헬스케어 서비스로 지난 9월 한국어, 영어 다국어 지원을 강화했다. 차동철 네이버 의료혁신센터장은 “네이버 헬스케어 페이지에서 꼭 필요한 건강 정보를 포함해 개인 건강 관리를 위한 다양한 기능을 추가할 예정”이라며 “일상생활에서 이용자에게 실질적인 도움을 줄 수 있는 건강 관련 서비스를 지속적으로 고도화하겠다”고 말했다.

2025.11.14 14:34박서린 기자

업스테이지 "연말까지 1000억 매개변수 LLM 만들 것"

국내 AI 스타트업 업스테이지가 거대언어모델(LLM) 시장 공략을 가속화한다. 올 연말까지 1000억 매개변수를 갖춘 LLM을 개발하고, 한국 뿐만 아니라 아세안·중동 등 글로벌 무대로 시장 영역을 확장할 계획이다. 최훈 업스테이지 사업개발 총괄 이사는 30일 서울 코엑스에서 열린 'AI 페스타 2025'에서 회사의 핵심 기술 및 사업 전략에 대해 밝혔다. 업스테이지는 자체 개발한 거대언어모델(LLM) '솔라'와 다양한 이미지 형태의 문서에서 글자 및 정보를 추출해 디지털화하는 광학문자인식(OCR) 솔루션 '도큐먼트 AI' 등을 개발해 왔다. 최 이사는 "도큐먼트 AI는 금융권에 가장 먼저 공급된 솔루션으로, 그만큼 정확도가 담보됐기 때문에 거둘 수 있었던 성과"라며 "2023년에는 자체 기술력으로 개발한 소형 LLM 모델인 솔라로 글로벌 오픈소스 차트 1위를 차지하기도 했다"고 설명했다. 덕분에 업스테이지는 지난해 1천억원 규모의 추가 투자를 유치했으며, 글로벌 시장조사기관인 CB인사이츠로부터 '글로벌 혁신 AI 스타트업 100'에 선정된 바 있다. 지난달에는 스타트업 중 유일하게 'AI 국가대표' 5팀 중 한 곳으로 선정되기도 했다. 최 이사는 "업스테이지의 솔루션은 글로벌 탑3 이내로 비용 효율성이 높다"며 "고성능 업무에서도 충분한 성능을 보이면서 비용은 거의 25분의 1 수준이기 때문에 많은 기업들이 업스테이지의 모델을 선택하고 있다"고 말했다. 또한 업스테이지는 솔라와 도큐먼트 AI를 결합해 AI 모델에서 발생하는 할루시네이션 현상을 크게 줄였다. 도큐먼트 AI를 통해 방대한 양의 문서에서 정보를 정확하게 추출해낸 뒤, 이를 솔라와 연계해 필요한 답을 도출하는 구조다. 나아가 업스테이지는 올 연말까지 1000억(100B) 매개변수 규모의 차세대 LLM을 개발할 계획이다. 업스테이지가 올해 공개 '솔라 프로 2'의 경우 310억개의 매개변수를 보유하고 있다. 또한 국내 기업들을 타겟으로 금융, 법률, 제조, 교육 등 특정 형태의 모델 개발을 추진한다. 내년 하반기부터는 멀티모달 비전언어모델(VLM)을 포함하고, 아세안 및 중동 지역까지 지원할 수 있는 거대 AI 모델을 개발하는 것이 목표다. 최 이사는 "OCR과 LLM을 동시에 사용할 수 있는 솔루션을 제공하는 회사는 현재 한국에서 업스테이지가 유일할 것"이라며 "글로벌 3강 AI 기업이 돼서 한국뿐만 아니라 아세안, 그리고 미국과 중국이 닿지 않는 국가들에게 AI 모델을 공급하고자 한다"고 강조했다.

2025.09.30 17:44장경윤 기자

지미션, 중기부 업고 'VLM OCR' 날개…'보는 AI'로 문서 혁신 이끈다

지미션이 차세대 비전언어모델(VLM) 광학문자인식(OCR) 기술을 앞세워 지능형 문서처리 시장 선점에 나선다. 지미션은 중소벤처기업부가 주관하는 '중소기업기술혁신개발사업 시장확대형' 연구과제에 최종 선정됐다고 22일 밝혔다. 선정된 과제는 'VLM 기반의 멀티모달 지능형 OCR 솔루션 연구개발'이다. VLM은 텍스트는 물론 이미지와 시각 정보까지 함께 분석하는 멀티모달 모델이다. 기존 기술이 단순히 문서 속 글자를 정확히 읽어내는 데 집중했다면 지미션의 기술은 문서의 전체 맥락까지 이해하는 한 단계 진화한 기술로 평가받는다. 이 기술은 문서 속 글자, 표, 그래픽, 서식 구조를 종합적으로 파악한다. 이를 통해 AI가 단순 문자 인식을 넘어 문서가 담고 있는 본래 의미를 파악하는 것이 가능해진다. 지미션은 AI OCR를 기반으로 ▲문서 자동 분류 ▲개인정보 마스킹 ▲거대언어모델(LLM) 기반 요약 및 검색 기술을 이미 보유하고 있다. 이번 연구개발은 기존 기술에 VLM을 더해 문서 처리 수준을 한 차원 높이는 것을 목표로 한다. 기술이 상용화되면 사용자는 문서 속 항목의 의미와 맥락까지 반영된 지능형 서비스를 경험할 수 있다. 일례로 같은 숫자라도 계좌번호인지, 주민등록번호인지 서식에 맞춰 스스로 구분하고 필요한 항목만 골라 추출하거나 요약할 수 있게 된다. 더불어 맥락에 기반한 검색 기능으로 방대한 문서 더미에서도 원하는 정보를 신속하고 정확하게 찾을 수 있게 된다. 한준섭 지미션 대표는 "이번 연구개발을 통해 기존 OCR을 뛰어넘는 고도화된 문서처리 기술을 확보할 것"이라며 "공공, 금융, 의료, 기업 등 다양한 산업에서 활용할 수 있는 혁신적 AI 솔루션을 선보이겠다"고 밝혔다.

2025.09.22 16:33조이환 기자

사이냅소프트, VLM 기술로 OCR 고도화…"AX 시대 선도할 것"

사이냅소프트가 비전언어모델(VLM) 기술로 데이터 추출 정확도를 높여 인공지능(AI) 전환(AX) 시대의 기술 리더십을 강화한다. 생성형 AI의 고질적 문제인 환각 현상을 최소화해 문서 기반 업무 혁신을 가속화하는 전략이다. 사이냅소프트는 AI 기반 광학문자인식(OCR) 솔루션 '사이냅 OCR'의 누적 레퍼런스가 200건을 돌파했다고 1일 밝혔다. 이는 지난 3월 150건 돌파 이후 5개월 만에 50건 이상의 신규 사례를 추가 확보한 것으로 회사의 가파른 성장세를 증명한다. '사이냅 OCR'의 핵심 경쟁력은 머신러닝 기반 학습과 비전-언어 모델을 결합한 하이브리드 기술에 있다. 이를 통해 생성형 AI의 약점으로 꼽히는 환각 현상을 최소화했다. 문서 내 특정 키와 값(Key-Value)을 정확히 추출해 데이터 처리 신뢰성을 높인 것이 특징이다. 이 솔루션은 한국정보통신기술협회(TTA) 인증으로 검증된 99.3%의 한글 인식률과 굿서비스(GS) 인증을 획득해 기술적 안정성을 입증받았다. 또 로봇프로세스자동화(RPA) 시스템과 연동돼 업무 자동화 효율을 극대화한다. 특히 '사이냅 도큐애널라이저'와 결합해 기업의 문서 자산을 생성형 AI를 위한 지식 자산으로 전환한다. 단순한 디지털 전환(DX)을 넘어 인공지능 전환(AX) 패러다임을 주도하고 있다는 평가가 나온다. 전경헌 사이냅소프트 대표는 "200건 이상의 레퍼런스는 '사이냅 OCR'의 독보적인 기술력과 시장의 높은 신뢰를 증명하는 성과"라며 "최신 VLM 기술을 적용해 데이터 정확도를 한층 더 끌어올린 만큼 문서 기반 업무를 혁신하는 '도큐먼트 AI' 리더로서 기업의 성공적인 AX 전환을 지원하겠다"고 밝혔다.

2025.09.01 16:01조이환 기자

한국딥러닝, 여성 IT 인재 창업·커리어 방향 제시

한국딥러닝이 여성 IT 인재 대상으로 창업과 커리어 발전 전략을 제시한다. 김지현 한국딥러닝 대표는 내달 4일 경북대 글로벌플라자에서 열리는 '동북권 여성 인공지능(AI)·소프트웨어(SW) 커리어 컨설팅 & 네트워킹 데이' 행사에 기조강연자로 나선다고 29일 밝혔다. 이 행사는 과학기술정보통신부와 정보통신산업진흥원이 주최하며 경북, 강원, 대구 지역 여성 재취업 희망자와 창업 준비자 등 100여 명이 참석한다. 김 대표는 '불가능을 뒤집는 성장기'를 주제로 강연을 진행한다. 대학 시절 시작한 창업이 6년 만에 6년 연속 흑자를 기록한 부트스트랩 AI 기업으로 성장하기까지의 여정을 공유할 예정이다. 행사에서는 김 대표의 강연 외에도 오해숙 유피체인 대표가 '2025 ICT 여성 커리어 전환 전략'을 발표한다. 오후에는 창업과 취업 분야로 나뉜 1:1 멘토링 프로그램이 운영돼 참가자들이 AI·SW 전문가와 직접 상담할 수 있다. 한국딥러닝은 2019년 설립 이후 시각지능 AI 솔루션을 공공기관과 대기업 등 80개 이상 고객사에 제공해왔다. 누적 매출은 100억 원을 넘어섰으며 꾸준히 흑자를 유지하고 있는 것으로 알려졌다. 올해 국내 최초로 비전 언어 모델(VLM) 기반 광학문자인식(OCR) 솔루션 '딥 OCR플러스'를 공개했다. 이 제품은 별도 데이터 수집이나 라벨링 없이 다양한 문서를 즉시 처리할 수 있다. 김 대표는 "AI 기술 발전으로 이 분야 여성 인재의 역할이 더욱 중요해지고 있다"며 "이번 강연을 통해 창업 과정에서 겪은 실질적 경험과 정부 지원 활용법, 초기 어려움 극복 노하우를 공유하겠다"고 말했다.

2025.08.29 17:02김미정 기자

로민, NH농협은행과 맞손…VLM 기술로 금융 문서 자동화

로민이 NH농협은행와 함께 비전-언어 모델(VLM) 기반 금융 실무 혁신을 이끈다. 금융권의 난도 높은 문서 처리 자동화를 본격화하고 실질적인 업무 효율성을 높이려는 전략이다. 로민은 NH농협은행이 주관하는 스타트업 협업 프로그램 '2025 NH오픈비즈니스허브'에 최종 선정됐다고 6일 밝혔다. 이 프로그램은 유망 스타트업과 공동으로 디지털 혁신을 추진하고 사전검증(PoC) 및 투자를 연계하는 NH농협은행의 대표 오픈이노베이션 사업이다. 이 회사는 이번 협업을 통해 자사의 비전언어모델(VLM) 기반 인공지능(AI) 광학문자인식(OCR) 솔루션을 금융권에 맞게 고도화하는 PoC를 진행한다. 이 솔루션은 비정형 구조나 복잡한 양식의 금융 문서에서도 높은 정확도로 정보를 추출하는 역량을 갖췄다. 핵심 기술인 VLM은 이미지와 텍스트를 동시에 이해하도록 학습된 멀티모달 AI 모델이다. 이를 통해 문서의 시각적 양식과 내용을 종합적으로 분석해 기존 기술의 한계를 넘는다는 게 회사 측 설명이다. 로민은 이미 여러 산업 프로젝트에서 해당 기술의 실효성을 입증해왔다. 로민은 향후 생성형 AI 시장 확산에 맞춰 사업 영역을 넓힌다. 문서 특화 VLM과 고성능 문서 파서 기술을 결합해 AI가 직접 학습할 수 있는 고품질 데이터를 제공하는 데 주력할 방침이다. 강지홍 로민 대표는 "NH오픈비즈니스허브를 통해 문서 특화 브이엘엠 기술의 금융권 적용이 본격화됐다"며 "현장 중심의 AI 기술을 통해 문서 자동화 시장의 새로운 기준을 제시해 나가겠다"고 밝혔다.

2025.08.05 13:57조이환 기자

AI로 문화유산 읽는다…로민, 영상자료원 디지털 아카이빙 사업 수주

로민이 인공지능(AI) 광학 문자 인식 기술력을 활용해 국가 문화유산 디지털 전환을 선도한다. 로민은 한국영상자료원 영상 자료 정보관리시스템 고도화 사업의 일환으로 AI OCR 솔루션 구축 사업을 수주했다고 4일 밝혔다. 이 사업은 한국문헌정보기술과의 협업을 통해 진행되며 로민은 AI OCR 기술을 공급하며 디지털 아카이빙 정밀도 향상에 기여할 예정이다. 한국영상자료원은 문화체육관광부 산하 공공기관으로 국내외 영화·영상 관련 다양한 유형의 자료를 수집·보존하고 있다. 서울 상암 본원과 파주 보존센터 간 이중 아카이빙 체계를 운영하며 디지털 영상 데이터의 안정적 보존과 활용도를 높이기 위한 정보관리 시스템을 지속적으로 고도화하고 있다. 이번 사업은 자료원이 보존 중인 문서 자료의 디지털화를 고도화해 문화유산의 체계적 관리와 활용성을 높이는 데 목적이 있다. 특히 도서·문헌 자료에 포함된 텍스트를 자동으로 추출·가공해 디지털 자산으로 활용할 수 있도록 AI OCR 기술 도입이 핵심 과제로 포함됐다. 로민은 이에 따라 AI OCR 솔루션 '텍스트스코프 리더'와 문서 인식 결과 검수·관리를 위한 '텍스트스코프 다큐먼트 센터'를 공급한다. 텍스트스코프 리더는 인쇄체·필기체·타자체 등 다양한 문자 유형을 고정밀로 인식할 수 있는 AI OCR 엔진으로, 저해상도 이미지나 스마트폰 촬영 문서, 노이즈가 많은 데이터에서도 안정적인 성능을 제공한다. 필기체와 같이 불규칙한 문자도 정확히 인식할 수 있어 자료원의 다양한 문헌과 비정형 기록물 디지털화에 최적화돼 있다. 텍스트스코프 다큐먼트 센터는 사용자 친화적인 인터페이스를 기반으로 인식 결과를 검수·수정할 수 있으며 처리 통계 대시보드 등을 제공해 실무 편의성과 관리 효율을 동시에 충족시킨다. 강지홍 로민 대표는 "국가 문화유산의 디지털 보존 수준을 높이는 이번 사업에 참여하게 돼 의미가 크다"며 "텍스트스코프 리더는 영상자료원과 같은 공공기관의 다양한 비정형 기록물 환경에 최적화된 기술로, 실질적 성과를 창출할 수 있을 것"이라고 말했다.

2025.08.04 16:19한정호 기자

로민, NIA 사업 주관기업 선정…공공문서 AI SaaS 시장 정조준

로민이 정부 주관 사업을 통해 공공문서 디지털 전환용 서비스형 소프트웨어(SaaS) 개발에 착수한다. 로민은 최근 과학기술정보통신부와 한국지능정보사회진흥원(NIA)이 주관하는 '2025년 공공부문 이용 SaaS 개발·검증' 사업의 주관기업으로 최종 선정됐다고 14일 밝혔다. 이번 사업은 공공 부문에 적합한 SaaS 모델을 개발하고 이를 조달 체계와 연계해 상용화 가능성을 검증하는 것을 목표로 한다. 로민은 이번 과제를 통해 회사의 온프레미스 기반의 문서 인공지능(AI) 솔루션 '텍스트스코프 스튜디오'를 클라우드 환경에 맞춰 재설계한 '텍스트스코프 클라우드' 개발에 착수한다. 이 플랫폼은 문서 자동 분류, 서식 인식, 검색·요약 기능 등을 포함하며 공공문서 환경에 최적화된 AI 학습·배포 기능(MLOps)을 갖춘 것이 특징이다. '텍스트스코프 클라우드'는 필기체, 인쇄체, 타자체 등 다양한 서체 인식이 가능한 고정밀 광학문자인식(OCR) 기술을 기반으로 문서 인식 정확도를 높인다. 동시에 공공기관별 행정 프로세스에 맞는 맞춤형 AI 모듈을 지원해 다양한 업무 시스템과 연동된다. 로민은 이번 사업을 통해 내년까지 총 여섯 가지 주요 솔루션을 SaaS로 전환한다. 기록물관리시스템(RMS), 전자문서관리시스템(EDMS) 등과의 통합을 통해 비전자 문서의 디지털화를 촉진하고 행정문서 처리의 효율성과 정확성을 높이는 데 집중한다. 올해 1차년도에는 클라우드 기반 공공서비스 제공을 위한 공공 플랫폼형 클라우드 서비스(K-PaaS), 클라우드 서비스 적합성 평가제도(KACI) 등 주요 인증을 획득하고 내년에는 클라우드 서비스 보안 인증(CSAP) 보안 인증 및 디지털서비스몰 등록을 완료할 예정이다. 이후 조달시장 진출을 본격화하면서 공공기관 대상 SaaS 공급을 확대한다는 계획이다. 로민은 이미 우정사업본부, 특허청, 국가기록원 등 주요 공공기관과의 협업을 통해 기술 안정성과 인식 정확도를 검증한 바 있다. 이번 사업을 계기로 기존 성과를 클라우드 환경으로 확장하며 공공 다큐먼트 AI 시장에서의 리더십을 공고히 할 방침이다. 강지홍 로민 대표는 "문서 기반 행정업무를 보다 효율적이고 정확하게 처리할 수 있는 SaaS 모델의 필요성이 높아지고 있다"며 "이번 과제를 통해 신뢰성 높은 공공문서 AI 인식 서비스를 구현하고 공공 SaaS 도입의 모범 사례를 만들어 나가겠다"고 밝혔다.

2025.06.14 16:59조이환 기자

  Prev 1 2 Next  

지금 뜨는 기사

이시각 헤드라인

전남광주 반도체 新공장 투자, 업계는 당혹스럽다

삼성전자 "3년 안에 AI 모듈러 홈 1만채 판매 목표"

AI 민원부터 AI 순찰차·재해복구까지…미래 행정기술 총출동

김용범 정책실장 "호남·충청 반도체 클러스터 조만간 발표...용인 이전 아냐"

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.