• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
  • AI의 눈
AI의 눈
HR컨퍼런스
디지털트러스트
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'데이터 접근'통합검색 결과 입니다. (1건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

한컴, 오픈데이터로더 PDF v2.0 공개…문서 AI 시장 공략 박차

한글과컴퓨터가 인공지능(AI) 기반 PDF 데이터 추출 기술을 고도화해 오픈소스 생태계 확장에 나선다. AI와 직접 추출 방식을 결합한 하이브리드 엔진을 앞세워 문서 AI 시장 경쟁력을 강화한다는 전략이다. 한컴은 오픈소스 PDF 데이터 추출 부문에서 벤치마크 1위 성능을 달성한 '오픈데이터로더 PDF v2.0'을 공개했다고 12일 밝혔다. 이번 버전의 가장 큰 특징은 AI 방식과 직접 추출 방식을 결합한 하이브리드 엔진이다. 기업과 개발자는 외부 서버로의 데이터 유출 우려 없이 완전히 차단된 로컬 환경에서 고성능 PDF 데이터 추출 기능을 무료로 활용할 수 있다. 문서 내 복잡한 요소를 분석하기 위한 무료 AI 애드온 4종도 기본 탑재됐다. 광학문자인식(OCR)은 이미지 기반 PDF와 스캔 문서 텍스트 인식률을 높였고 표 추출 기능은 초경량 AI 모델을 활용해 병합된 셀 등 복잡한 표 구조를 정밀하게 분석한다. 수식 추출 기능은 과학·수학 논문의 복잡한 수식을 로컬 환경에서 인식하며 차트 분석 기능은 차트가 의미하는 내용을 문장 형태로 설명한다. 애드온은 도클링 등 타사 오픈소스 AI 모델과 호환되도록 구현됐다. 특정 기업과 공식 제휴 관계는 아니지만 사용자가 기존 기술 환경에서 쉽게 연동할 수 있도록 객관적인 기술 호환성을 확보했다. 향후 유연한 애드온 구조를 통해 더 많은 AI 모델을 추가할 수 있다는 설명이다. 오픈데이터로더 PDF v2.0은 자체 벤치마크 테스트에서 읽기 순서, 표, 제목 추론 등 다양한 항목에서 1위 수준의 성능을 기록했다. 한컴은 오픈소스의 핵심 가치인 투명성을 위해 벤치마크 테스트 데이터와 재현 가능한 상세 코드를 공식 깃허브 저장소에 공개했다고 밝혔다. 이번 출시와 함께 오픈소스 라이선스도 기존 MPL 2.0에서 아파치 2.0으로 전환했다. 상업적 활용이 자유로운 라이선스를 적용해 외부 개발자와 글로벌 IT 기업의 진입 장벽을 낮추고 웹 애플리케이션이나 서비스형 소프트웨어(SaaS) 등 다양한 비즈니스 모델이 형성되는 생태계를 구축한다는 계획이다. AI 에이전트 시대에 대응한 생태계 확장도 추진한다. 한컴은 지난해 랭체인 연동을 완료했으며 올해는 랭플로우·라마인덱스·제미나이 CLI 등 다양한 AI 프레임워크와의 연동을 확대할 예정이다. AI 에이전트 지원을 위한 모델 컨텍스트 프로토콜(MCP) 기능도 준비 중이다. 올 하반기에는 독자 문서 AI 기술을 기반으로 한 상용 AI 애드온도 출시할 계획이다. AI가 문서 구조를 분석해 접근성 태그를 자동 생성하는 기술을 오픈소스 최초로 탑재해 글로벌 접근성 표준(PDF/UA)을 충족하는 PDF AI 접근성 솔루션으로 확장한다는 방침이다. 정지환 한컴 최고기술책임자(CTO)는 "오픈데이터로더 PDF v2.0은 AI 하이브리드 엔진과 아파치 2.0 라이선스 전환을 통해 누구나 자유롭게 활용·확장할 수 있는 개방형 PDF 데이터 플랫폼으로 진화했다"며 "향후 상용 AI 애드온과 접근성 솔루션을 통해 전 세계 PDF 문서가 AI에 활용되는 것은 물론, 모든 사람에게 열린 문서가 되도록 글로벌 생태계를 선도하겠다"고 밝혔다.

2026.03.12 15:46한정호 기자

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

수천억 적자의 역설… '회계 착시' 걷어낸 K-팹리스 진짜 체력

신세계가 열흘만에 오픈AI 협업 계획 뒤집은 이유

10분만에 매진된 핫플 '쿠팡 메가뷰티쇼' 가보니

R&D 지표 가른 양산성 확보…장부 엇갈린 K-AI 반도체

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.