• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
CES2026
스테이블코인
배터리
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'파피루스'통합검색 결과 입니다. (2건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

이파피루스 '파이뮤PDF 프로', 레이아웃 분석 성능 업그레이드

이파피루스(대표 김정희)가 문서 데이터 추출 라이브러리 '파이뮤PDF 프로(PyMuPDF Pro)'에 머신러닝 기반 레이아웃 분석 기능을 적용해 글로벌 경쟁 솔루션 대비 약 10배 빠른 속도와 높은 정확도를 선보인다. 이파피루스는 문서 데이터 추출 라이브러리 '파이뮤PDF 프로' 성능을 업그레이드했다고 26일 밝혔다. 이번 업데이트의 핵심은 머신러닝 기술을 활용한 문서 레이아웃 분석 기능 추가다. 이를 통해 AI 전처리 용도로 활용되는 문서 데이터 추출 작업 전반의 속도와 정확도를 동시에 높였다는 설명이다. 현재 시중의 다수 문서 추출 솔루션은 문서를 고해상도 이미지로 변환한 뒤 비전 언어 모델(VLM) 방식으로 인식하는 구조를 갖고 있다. 이 방식은 연산량이 많아 처리 속도가 느리고, 고가 GPU 인프라를 필요로 한다는 한계가 있다. 반면 최신 버전 '파이뮤PDF 프로'는 자체 개발한 머신러닝 기반 레이아웃 분석기를 적용해 문서 구조를 직접 파악한 뒤 데이터를 추출한다. 이파피루스는 이 방식이 VLM 기반 글로벌 유사 제품 대비 약 10배 빠른 속도를 구현하면서도 높은 정확도를 유지한다고 설명했다. 특히 테두리가 없거나 병합 셀을 포함한 복잡한 표, 스캔 이미지와 디지털 데이터가 뒤섞인 문서에서도 독보적인 처리 품질을 보인다는 점을 강조했다. GPU 없이 CPU만으로 동작해 인프라 비용 부담이 적은 것도 강점으로 내세웠다. '파이뮤PDF 프로'는 인공지능 및 빅데이터 구축, 업무 자동화, 이미지 렌더링 등 다양한 문서 작업을 파이썬 환경에서 빠르고 정확하게 구현할 수 있는 문서 데이터 추출 라이브러리다. 2016년 첫 출시 이후 2025년 11월 현재 누적 다운로드 1억2천만 건을 돌파했다. 오라클, 보쉬, DHL, 도큐싸인, 슈나이더일렉트릭 등 글로벌 기업 고객을 확보하며 기술력을 인정받고 있다. 대규모 언어 모델(LLM)과 검색 증강 생성(RAG) 특화 기능도 강화됐다. '파이뮤PDF 프로'는 문서 내 페이지, 위치 등 메타데이터를 포함한 청크(말뭉치)를 생성할 수 있어 LLM·RAG 환경에서의 검색과 추론 효율을 높인다. 또한 추출한 문서 데이터를 라마인덱스(LlamaIndex)에서 바로 활용 가능한 리더(Reader) 파일 형태로 출력할 수 있어, 문서 기반 대화형 서비스나 검색형 AI 서비스를 개발하는 데 유리하다. 지원 포맷은 PDF, MS오피스, 한글 문서, 이미지 등 다양한 문서 유형을 포괄한다. 이파피루스 김정아 부사장은 "자체 테스트 결과에 따르면 '파이뮤PDF 프로'는 문서 읽기·쓰기와 텍스트 추출, 문서 렌더링 등 모든 작업에서 글로벌 유사 제품들보다 압도적으로 빠른 속도를 자랑한다"며 "AI 시스템 구축을 위한 필수 도구로서 LLM·RAG 서비스 구현이나 데이터베이스 구축에 드는 시간과 비용을 크게 줄여줄 것"이라고 말했다.

2025.11.26 18:17남혁우

이파피루스, 美 PDF 솔루션 기업 '닥랩터' 인수…SaaS 시장 정조준

이파피루스가 미국 HTML-PDF 변환 전문기업을 인수해 북미 서비스형 소프트웨어(SaaS) 시장 공략을 본격화한다. 기존에 보유한 글로벌 PDF 플랫폼과 기술적 시너지를 극대화하는 전략이다. 이파피루스는 미국 자회사 아티펙스를 통해 현지 기업 닥랩터의 지분 100퍼센트를 전액 현금으로 인수했다고 25일 밝혔다. 이번에 인수된 닥랩터는 미국 인디애나폴리스에 본사를 둔 기업으로 HTML 콘텐츠를 고품질 PDF나 엑셀 문서로 변환하는 응용프로그램 인터페이스(API) 서비스를 제공한다. 현재 엔비디아, 쇼피파이, 허브스팟 등 1천200여 개에 달하는 글로벌 고객사를 활성 이용자로 보유 중이다. 99.99퍼센트의 높은 서비스 가용성과 다양한 글로벌 정보보안 인증을 획득해 기술력을 인정받았다. 이파피루스는 이번 인수를 통해 기존에 운영하던 SaaS 플랫폼 '피디에프닷코'와 닥랩터의 기술을 결합할 계획이다. 복잡한 비즈니스 문서 자동화, 고객 맞춤형 보고서 생성, 세금계산서 처리 등에서 고품질 서비스를 제공할 수 있을 것으로 기대된다. 또 피디에프닷코의 전 세계 4천300여 구독 고객에게 닥랩터 서비스를 교차 판매하고 닥랩터 고객에게는 자회사 아티펙스의 제품군을 제안하는 양방향 판매 모델을 전개한다. 인수 이후에도 닥랩터의 기존 조직과 브랜드는 그대로 유지된다. 매튜 고든 최고경영자(CEO)를 포함한 핵심 기술 인력 역시 고용 계약을 새로 맺고 잔류한다. 이파피루스는 경기도 성남 판교에 위치한 인공지능 및 데이터 기술 전문 기업이다. 대표 제품으로는 PDF 스트리밍 뷰어 '스트림닥스', 인공지능 광학문자인식(OCR) 솔루션 '텍스트센스' 등이 있으며 국세청, 대법원, 네이버, 포스코 등 국내 주요 기관과 기업에 공급해왔다. 김정희 이파피루스 대표는 "이번 인수는 단순한 기능 확보를 넘어 북미 시장에서의 기술력, 고객 기반, 반복 수익 구조를 통합적으로 확보한 전략적 결정"이라며 "향후 글로벌 고객의 복잡한 문서 처리 요구에 대응하는 고도화된 SaaS 제품군을 지속 출시할 것"이라고 밝혔다.

2025.08.25 18:06조이환

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

LG전자, 역대 최대 매출에도 일회성 비용에 실적 '뒷걸음'

페이커 소속 '팀 리드', 2026 LCK 시즌 오프닝 2년 연속 우승

거리로 나온 '무진장 신발 많은 곳'…무신사 킥스 가보니

엔비디아 '베라 루빈' 시대 임박…고전력에 서버·클라우드 판 바뀐다

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.