• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
창간특집
인공지능
배터리
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'광학문자인식'통합검색 결과 입니다. (4건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

로민-이씨에이시스템, '물류 OCR' 공략…자동화 시장 판 키운다

로민이 물류 자동화 전문기업 이씨에이시스템과 손잡고 도큐먼트 인공지능(AI) 기술 고도화에 나선다. 로민은 최근 이씨에이시스템과 우편·물류 분야 AI 광학문자인식(OCR) 사업 확대를 위한 전략적 업무협약(MOU)을 체결했다고 19일 밝혔다. 이번 협약은 양사의 기술 및 솔루션을 연계해 물류 현장의 이미지 데이터를 효율적으로 인식하는 시스템을 공동 구축하기 위해 맺어졌다. 로민은 인쇄체와 필기체 모두를 정밀하게 인식하는 독자적인 AI OCR 엔진을 개발했다. 이 기술은 금융·공공·제조·무역 분야에서 검증됐으며 우편물 분류 과정에서도 이미지 처리 시스템(IPS)와의 연동성을 확보하고 있다. 이씨에이시스템은 지난 2005년 설립 이후 우정사업본부, 쿠팡, CJ대한통운, 롯데글로벌로지스, DHL 등 다수 물류 기업에 자동화 시스템을 공급해왔다. 독일 비트로닉, 비저바 등 글로벌 파트너사들과의 협업 경험도 보유하고 있다. 양사는 이번 협약을 통해 공공 우편물 처리 시스템은 물론 민간 택배 기업의 물류 자동화 과정에 AI OCR 솔루션을 공동 적용할 방침이다. 이는 정확한 데이터 확보와 분류 속도 향상을 통해 물류 전반의 효율성을 끌어올리는 기반이 될 것으로 예상된다. 이중순 이씨에이시스템 대표는 "이미지 기반 인식 기술은 물류 데이터의 정확성과 운영 효율을 동시에 높이는 핵심 기술"이라며 "AI OCR 전문기업인 로민과의 협력은 고객 맞춤형 물류 시스템 구축에 큰 시너지를 낼 것"이라고 밝혔다. 강지홍 로민 대표는 "물류 분야에 강점을 가진 이씨에이시스템과 협력하게 돼 의미가 크다"며 "실제 현장에서 체감 가능한 성과를 도출해 다큐먼트 AI 기술의 시장 확대를 이끌겠다"고 말했다.

2025.05.19 16:57조이환

'문서 AI'가 더 똑똑해졌다…"서류 속 문맥·구조까지 파악"

문서 인공지능(AI) 기술이 단순 텍스트 인식을 넘어 문맥·구조까지 이해하는 방향으로 진화했다. 복잡한 문서에서도 주요 정보를 자동 식별하고 고도화된 자동화 처리까지 가능해졌다. 11일 IT 업계에 따르면 최근 문서 처리 시장에서는 비전언어모델(VLM) 기반 광학 문자 인식(OCR) 기술이 주목받고 있다. 이 기술은 계약서, 보고서 등 여러 형식과 맥락으로 이뤄진 문서 속 표, 조항, 제목, 본문을 AI로 식별해 구조화된 데이터로 변환할 수 있다. VLM은 이미지와 언어 정보를 동시에 이해하는 AI 모델이다. 일종의 '이미지 전문가'와 '언어 전문가'가 한 팀처럼 협업하는 방식으로 작동한다. 우선 이 모델은 문서에서 표, 문장, 도장, 손글씨 등 다양한 이미지 요소를 구분한다. 이후 각 영역의 텍스트를 분석해 의미를 파악하고, 이를 종합적으로 해석한다. 이 과정에서 시각 정보와 언어 정보가 실시간으로 상호작용하며 정답을 조율한다. 정보 하나가 잘못 인식되면 다른 정보가 이를 보완하고, 누락된 부분은 이미지 단서를 활용해 추론하는 식이다. 예를 들어, 사용자가 계약서에 VLM 기반 OCR을 적용하면 '계약 당사자'와 '계약 기간' '주요 조항' '서명란' 등을 자동으로 식별해 체계적으로 정리할 수 있다. 이를 통해 문서 처리 자동화 수준을 높이고 반복 작업과 인적 오류를 줄일 수 있다. 기존 OCR은 이미지 속 텍스트를 디지털 문자로 바꾸는 데만 초점 맞췄다. 문서 레이아웃이나 의미적 맥락은 이해하지 못해 데이터 활용에 한계가 있었다. 이에 추가 인력이 이를 수작업으로 정리해야만 했다. VLM OCR, 정확도·사업성 모두 잡아 한국딥러닝은 '딥 OCR 플러스' 출시로 VLM OCR 서비스를 이미 상용화했다. 이 솔루션은 별도 학습 없이 여러 형식 문서를 처리할 수 있다. 한국어·영어·숫자·특수문자가 섞인 복잡한 구조도 정확하게 인식할 수 있도록 설계됐다. 딥 OCR 플러스는 문서의 표나 문단을 자동 분석해 핵심 정보를 요약하고, 추출 데이터를 표준 포맷으로 제공해 업무 시스템과 연동된다. 한국딥러닝은 이 솔루션으로 문서 검토 시간을 최대 80% 줄이고, 일관된 데이터 품질을 유지할 수 있다고 강조했다. 앞서 업스테이지도 AI 기반 문서 구조화 솔루션 '다큐먼트 파스'를 출시해 보험, 금융, 의료 등 산업 현장에서 문서 자동화를 지원하고 있다. 고정밀 벤치마크에서 아마존·마이크로소프트 모델보다 높은 정확도를 기록한 것으로 전해졌다. 올해 6월 모델 '솔라'를 결합한 '솔라 다큐브엘엠'도 출시한다. 솔라 타큐브엘엠은 시각 정보와 언어 정보 통합 처리 역량을 강화해 문서 기반 요약, 질의응답, 자동 분류까지 수행할 수 있도록 구성됐다. 특히 비정형 문서나 복잡한 레이아웃 문서에서도 높은 인식률을 보일 것이란 평가를 받고 있다. 김지현 한국딥러닝 대표는 "비전 OCR은 돈 버는 AI"라며 "정확도와 사업성을 모두 잡을 수 있는 실용 기술"이라고 강조했다.

2025.05.11 14:40김미정

한국딥러닝 "문맥까지 이해하는 OCR 시대 왔다…업무 자동화 핵심 될 것"

"광학문자인식(OCR) 성장 잠재력은 무궁무진합니다. 문서 디지털화로 OCR 역할이 늘어날 것이기 때문입니다. 이럴수록 정확하면서도 안전한 OCR 서비스가 필요합니다. 한국딥러닝은 자체 모델 '딥 이미지'를 통해 이런 OCR 서비스를 맞춤형으로 공급하고 있습니다. OCR을 단순히 문서 인식하는 기술이 아닌 업무 자동화 핵심으로 만들 것입니다." 김지현 한국딥러닝 대표는 지디넷코리아 인터뷰에서 자사 OCR 서비스 특장점을 소개하며 이같이 밝혔다. 김지현 대표는 2019년 한국딥러닝을 설립했다. 22세 대학생이던 때다. 학창 시절부터 개발자 부모 영향으로 자연스럽게 코딩을 접했다. 스타트업에서 대학생 인턴으로 근무하며 창업을 결심했다. 그는 "당시 딥러닝 기술이 확산하던 때"였다며 "AI 기술이 다양한 산업에 스며들 것으로 판단해 회사를 설립했다"고 밝혔다. 김 대표는 창업 전부터 텍스트와 이미지, 영상, 음성 데이터를 수집했다. 이를 통해 자체 거대비전언어모델(LVLM) 딥 이미지를 내놨다. 딥 이미지는 텍스트와 이미지를 동시에 처리·생성할 수 있다. 텍스트·이미지 데이터가 상호작용하며 분석을 수행한다는 점에서 멀티모달 모델과 다르다. 이 모델은 현재 1억 장 넘는 이미지를 학습했다. 이를 기반으로 광학문자인식(OCR)을 비롯한 객체 검출, 영상 이해, 이미지 생성, 3D 모델 생성 등 다양한 비전 AI 솔루션을 제공한다. 한국딥러닝은 모델 개발과 운영을 위해 자체 그래픽처리장치(GPU) 서버와 분산처리시스템을 온프레미스 형태로 갖췄다. 김 대표는 "모델 초기 투자비와 유지비 부담이 컸다"며 "고효율 분산 학습 알고리즘을 통해 비용을 줄였다"고 설명했다. 이어 "서버는 스케일아웃 방식으로 확장 가능하도록 설계했다"며 "비용 문제는 고객사와 기술협력·장기계약을 통해 해결했다"고 덧붙였다. "기업 맞춤형으로 제공…정확도·보안·유연성 높아" 김지현 대표는 자사 OCR 특장점으로 높은 정확도, 유연성, 보안성을 꼽았다. 한국딥러닝은 각 태스크와 프로젝트 특성을 반영한 맞춤형 OCR을 제공한다. 단순히 글자를 인식하는 데 그치지 않고, 문서 맥락과 레이아웃을 고려해 필요한 정보를 정확히 추출하는 것이 강점이다. 김 대표는 "문서 폼이 다양하면 OCR 인식 정확도가 떨어진다"며 "이는 OCR 기술이 주로 정형화된 폼에만 최적화됐기 때문"이라고 설명했다. 그는 "딥이미지의 OCR은 다양한 폼의 문서 수십만 건을 분석하고 필요한 데이터를 일관성 있게 정리할 수 있다"고 말했다. 김 대표는 자사 OCR이 높은 보안성을 갖췄다고 강조했다. 현재 온프레미스 형태로 OCR 서비스를 제공하고 있어서다. 이에 문서 데이터가 외부로 나가지 않고 기업 내부에서 처리된다. 반면 타사 OCR 서비스는 인터넷 기반의 클라우드 환경에서 작동한다. 사용자가 문서 파일을 외부 서비스에 올려야 한다는 의미다. 이 과정에서 민감 정보가 외부로 전송될 수 있다. 한국딥러닝은 온프레미스 외에도 프라이빗 클라우드와 가상 프라이빗 클라우드(VPC)상에서 서비스를 지원한다. 김 대표는 OCR 서비스가 키-밸류 추출과 맞춤형 폼 변환 기능을 통해 높은 유연성을 갖췄다고 설명했다. 키-밸류 추출은 문서에서 중요한 정보(키)와 그에 해당하는 값(밸류)을 자동으로 찾아내는 기능이다. 예를 들어 신청서에서 이름과 생년월일, 전화번호가 키다. 여기에 입력된 내용이 밸류다. 김지현 대표는 "보통 OCR은 문서 속 텍스트만 인식한다"며 "필요한 정보를 찾기 위해 추가 작업이 필요하다"고 말했다. 이어 "자사 OCR은 문서 구조를 분석해 필요한 정보만 정확히 추출한다"며 "고객은 원하는 데이터를 빠르게 찾을 수 있다"고 강조했다. "OCR 잠재력 무한대"…이미지 분석으로 해외 공략 김지현 대표는 OCR 사업 확장 가능성이 더 커질 것이라고 내다봤다. 그는 "앞으로 문서는 디지털 데이터로 변환될 것"이라며 "OCR이 이 부분에서 큰 역할을 할 것"이라고 예측했다. 또 "거대언어모델(LLM) 기술이 발전하면서 OCR과 챗봇, 에이전트 연계 활용도 가능해질 것"이라며 "이에 따른 OCR 사업 확장 가능성도 높다"고 덧붙였다. 김 대표는 솔루션을 해외 시장에 적극 공급할 예정이다. 현재 인도네시아 건설사에 도로와 터널 균열을 감지하는 이미지 분석 솔루션을 제공하고 있다. 그는 "언어 장벽이 있는 OCR 대신 이미지 디텍션, 세그멘테이션, 분류 서비스로 해외 시장을 노릴 것"이라고 말했다. 한국딥러닝은 올해 OCR 기반 데이터 수집·정제 작업에 집중할 계획이다. 김 대표는 "OCR로 변환한 문서를 디지털화한 후 챗봇이나 전사적자원관리(ERP) 시스템에 적용할 수 있도록 가공하는 것이 목표"라며 "OCR을 단순히 문서를 인식하는 기술이 아닌 업무 자동화 핵심 요소로 만들 것"이라고 강조했다.

2025.02.07 15:07김미정

한전, SW로봇 활용해 전기요금 복지할인 자격검증 자동화

한국전력(대표 김동철)은 인공지능(AI)과 광학문자인식(OCR) 기술을 접목한 '전기요금 복지할인 자격검증 RPA(Robotic Process Automation)'를 개발, 단계적 시범운영을 거쳐 10월부터 본격적으로 전국 사업소에서 확대 시행했다고 22일 밝혔다. 장애인, 다자녀 가구, 저소득층, 출산 가구 등 8개 복지 유형에 전기요금 할인 혜택을 제고하고 있는 한전은 그동안 매월 복지할인 혜택을 받는 고객 자격 검증과 증빙자료 확인을 수작업으로 해 왔다. 한전은 이 같은 반복 업무를 RPA로 자동화해 복지할인 대상자적정 여부를 신속하게 판별하고 부정수급을 조기에 예방함으로써 58억원의 비용 절감과 함께 복지할인이 꼭 필요한 고객에게 혜택이 돌아갈 것으로 예상했다. 또 시범운영 결과 업무 효율이 약 80% 높아지는 등 직원 만족도와 업무 속도가 개선된 것으로 조사됐다. 한전은 영업·송배전·ICT 등 업무 전반에 걸쳐 70종의 맞춤형 RPA를 통해 연간 30만 시간의 업무시간을 단축하고 연간 5억원에 이르는 라이선스 비용을 절감하고 있다. 올해 확대 개설한 한전 인재개발원 실습 교육 과정을 통해 향후 매년 약 100명의 RPA 전문인력을 양성할 계획이다. 한전은 앞으로도 현장 중심 아이디어를 반영한 다양한 RPA 서비스를 개발하고 확대 운영해 직원 업무 효율 향상과 디지털 기반 업무혁신을 위해 노력할 계획이다.

2024.10.22 14:50주문정

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

블록체인 가상자산, '입법지연·예산삭감·규제' 악순환 끊어야

[AI는 지금] 대선후보들 'AI 전쟁' 돌입…기술 주권부터 전력 인프라까지 격돌

한화 김동선 진두지휘 ‘벤슨' 뭐가 다른가…‘100% 국내산 유제품'

나델라 MS CEO "누구나 AI 다루는 '오픈 에이전틱 웹' 시대 이끌 것"

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현