• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
국감2025
배터리
양자컴퓨팅
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'HWPX'통합검색 결과 입니다. (2건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

공무원 10명 중 9명 "AI 못 읽는 HWP·PDF 쓴다"…AI 정부 전환 '걸림돌'

행정문서 대부분이 인공지능(AI)이 읽지 못하는 형식에 묶여 있어 AI 정부 전환의 걸림돌이 되고 있다는 지적이 나왔다. 공공문서를 AI-레디(Ready) 포맷으로 전환하고 메타데이터·API 연계를 통해 호환성을 높여야 한다는 주장이다. 13일 위성곤 더불어민주당 의원실이 공개한 '공공분야 AI 활용 현황' 설문조사 결과에 따르면, 전국 행정기관 종사자 1만4천208명 중 91.1%가 보고서·계획서 등 행정문서를 주로 HWP(한글)나 이미지·스캔 PDF 등 AI가 인식하기 어려운 형식으로 작성하고 있다고 답했다. 기존 HWP, PDF 등의 파일 형태는 일반 텍스트가 아닌 이진법 형태인 바이너리 형태로 저장되는 특성으로 인해 기계가 직접 읽고 처리하기 어렵다. 이에 한컴에선 지난 2020년 정부의 행정 문서 데이터화 추진 계획을 시작으로 이듬해에 표준 형식을 'HWP' 파일에서 'HWPX'로 전환했다. 끝자리에 'X'가 새로 붙게 된 'HWPX'는 기존 'HWP'와 달리 개방형 XML 기반의 형식으로, 해당 포맷은 문서 내 콘텐츠를 기계가 판독하는 것이 가능하도록 설계된 것이 특징이다. 마이크로소프트 워드가 사용하는 'DOCX' 포맷과 데이터 추출에서도 큰 차이가 없다는 디지털플랫폼정부위원회 및 민간 전문위원회의 자문도 받았다. 행정안전부 또한 공공 데이터의 활용도를 높이기 위해 'AI-레디' 개념을 공공 데이터에 도입하고 세부 기준과 관리 체계 마련에 나섰다. 행안부는 AI가 학습, 분석, 추론 등에 쉽게 활용할 수 있도록 앞으로 공공 데이터는 AI가 바로 읽고 활용할 수 있는 형식으로 제공하고, 요약 통계와 갱신 주기, 변경 이력 등 풍부한 속성 정보를 메타데이터로 함께 담도록 할 예정이다. 이와 별개로 지난 달 17일부터 이달 6일까지 중앙부처, 광역·기초자치단체 공무원을 대상으로 실시된 이번 조사에선 10명 중 7명이 실제 업무에 AI을 활용한 경험이 있는 것으로도 집계됐다. 전체 응답자의 68.9%는 챗GPT, 클로드, 코파일럿, 제미나이, 하이퍼클로바X 등 생성형 AI를 실제 업무에 활용한 경험이 있다고 답했다. 그러나 인터넷망 등 외부 개방망을 통한 사용 비율이 높아 정보 유출 우려도 제기됐다. AI를 사용하는 공무원 1만2천738명 중 인터넷망(개방형 망)에서 사용한다는 응답은 54.5%로 절반을 넘었다. 인터넷망과 업무망을 병행한다는 응답(12.9%)까지 포함하면 외부망 활용 비율은 67.5%에 달했다. AI 활용 용도(복수응답)는 ▲자료 검색·정리(41.5%) ▲행정문서 작성·요약(30.8%)▲회의록·보고서 요약(14.1%) ▲녹취록 요약(5.6%) 순이었다. AI 활용을 위한 교육 기반도 제대로 갖춰지지 않았다. 프롬프트 작성법 등 AI 도구 활용 역량을 위한 교육을 연 4회 이상 이수한다고 답한 공무원은 전체(1만4천208명)의 1.3%에 불과했고, 가끔 이수(연 1~3회)는 39.4%, 교육을 받은 적 없다는 응답은 59.4%에 달했다. 개인정보 보호·윤리·보안 등 가이드라인 관련 교육을 받은 경험이 있다는 응답도 39.6%에 그쳤다. 위 의원은 "폐쇄망 기반의 행정 전용 AI 환경을 마련해 보안을 강화해야 한다"며 "실무형 교육과 제도적 지원을 병행해야 한다"고 강조했다.

2025.10.13 17:56장유미

[유미's 픽] "이 시장 뚫어라"…김연수 한 마디에 獨 달려간 한컴, 존재감 드러낼까

문서 포맷 HWP가 인공지능(AI) 학습에 적합하지 않다는 지적으로 그간 속앓이를 했던 한글과컴퓨터가 최근 '오픈데이터로더 PDF' 공개를 기점으로 글로벌 오픈소스 시장에 본격 진출했다. 국내 기술 자산을 글로벌 경쟁력으로 전환하고 AI 데이터 처리와 오픈소스 협업을 통한 기술 리더십을 확보함으로써 수익성을 더 크게 끌어올리기 위해서다. 22일 업계에 따르면 한컴은 최근 공개한 '오픈데이터로더 PDF'를 앞세워 기술 아이덴티티 중심의 글로벌 테크 기업으로 인지도를 높이기 위한 본격적인 움직임에 나섰다. 이를 위해 AI 기반 문서 인식 기술을 추가하고 ▲라마 인덱스(Llamaindex) ▲제미나이 CLI(Gemini-cli) ▲랭체인(LangChain) 등 주요 AI 프레임워크와의 호환성을 강화할 뿐 아니라 깃허브를 통한 글로벌 개발자 커뮤니티와의 협력 체계를 더 굳건히 하기 위해 분주히 움직이고 있다. 지난 15~16일 독일 베를린에서 개최된 유럽 최대 PDF 기술 컨퍼런스인 '2025 PDF 데이즈 유럽'에 참가한 것도 이 때문이다. 한컴은 이 자리에서 한컴이 오랜 기간 축적한 문서 처리 기술력을 바탕으로 개발한 PDF 데이터 추출 엔진 '오픈데이터로더 PDF'를 시연해 많은 관람객들의 눈길을 사로 잡았다. 이 솔루션은 AI 학습과 활용 과정에서 고질적인 난제로 지적돼 온 PDF 문서 데이터 처리 병목 현상을 해소하는 핵심 기술로, 이달부터 깃허브에 오픈소스로 공개됐다. AI가 문서를 더 잘 이해하고 활용할 수 있도록 JSON, 마크다운(Markdown), HTML 등 최적화된 형태로 데이터를 변환하는 것이 특징으로, 경량화된 SDK(소프트웨어 개발 키트) 형태로 제공돼 다양한 AI 서비스에 쉽게 연동할 수 있다. 현장에서는 복잡한 문서의 표, 이미지, 레이아웃을 정확하게 분석하는 독보적인 기술력에 대한 호평도 이어졌다. 이처럼 한컴이 글로벌 오픈소스 시장에 관심을 두게 된 것은 최근 AI를 포함한 IT 생태계에서 폐쇄적인 개발보다 오픈소스 기반의 환경으로 변화하며 사업적인 기회가 생겼다고 판단해서다. 또 공공 및 민간 시장에서 오픈소스의 도입 정책의 확대 및 의무화 움직임과 구글, 마이크로소프트 등 상용 SaaS 기업들의 오픈소스 전략 가속화도 한컴에게 큰 자극이 됐다. 더불어 글로벌 오픈소스 시장이 빠르게 성장하고 있다는 점도 주효했다. 실제 시장조사기관 프리시던스 리서치(Precedence Research)에 따르면 지난 해 글로벌 오픈소스 서비스 시장은 약 353억 달러 규모였으나, 오는 2033년에는 1천327억 달러까지 성장할 것으로 예상된다. 연평균 성장률(CAGR)은 약 15%에 달한다. 업계 관계자는 "최근 오픈소스 기반 AI 생태계는 급속한 성장을 보여주고 있다"며 "이젠 오픈소스가 단순한 코드 공개를 넘어 신뢰, 협업, 포용이라는 가치를 중심으로 AI 산업 전반의 패러다임 변화를 이끌고 있음을 시사한다"고 분석했다. 이 같은 분위기에 맞춰 김연수 한컴 대표는 올 들어 임직원들에게 오픈소스 시장에 진출해 빠르게 안착할 수 있도록 적극 행동에 나설 것을 주문했다. 지난 7월 글로벌 오픈소스 전문 기업 '듀얼랩'과 사업 협력을 위한 양해각서(MOU)를 체결한 것도 이의 일환이다. 특히 '오픈데이터로더 PDF'는 양사 협업의 첫 결과물로, 오픈소스 생태계를 통해 한컴이 전 세계 개발자, 커뮤니티, 기업 사용자들과의 협업을 확대할 수 있는 매개체가 될 것으로 기대를 모으고 있다. 또 한컴은 오픈소스의 공유 가치를 실현하면서도 지속 가능한 사업 모델을 구축하기 위해 '오픈 코어(Open Core)' 전략을 채택키로 했다. 이에 따라 핵심적인 PDF 데이터 추출 SDK는 누구나 자유롭게 사용할 수 있도록 공개하고 광학문자인식(OCR)의 정밀도를 높이거나 표, 수식, 차트 등을 고도화된 AI 기술로 인식하는 기능은 별도의 상용 '애드온(Add-on)' 형태로 출시해 수익을 창출할 계획이다. 업계에선 한컴이 이미 충분한 역량을 갖추고 있는 만큼 오픈소스 시장에서 빠르게 존재감을 드러낼 것으로 기대했다. 또 한글의 문서 포맷 HWP가 AI 학습에 적합하지 않다는 일부 평가가 있지만, HWPX는 국가 표준에 기반한 개방형 포맷으로 이미 활용되고 있다는 점에서 크게 문제되지 않을 것으로 봤다. 실제 한컴오피스는 HWPX를 기본으로 사용하되 ODF와 OOXML(DOCX) 포맷과의 호환성을 이미 지원하고 있다. 업계 관계자는 "데이터 추출이 어려운 바이너리 기반 문서 포맷은 HWP뿐 아니라 JPG, GIF 등 이미지 파일이나 DOC, PDF 등 문서 파일처럼 컴퓨터에서 동작하는 프로그램 대부분이 해당된다"며 "한컴이 개발한 개방형 문서포맷 HWPX의 AI 학습 데이터 추출 수준은 국제표준인 MS와 오픈소스 오피스 문서포맷과 차이가 없다"고 지적했다. 그러면서 "한글 파일 자체는 국제문서 포맷과 호환성에 문제가 없다"며 "MS오피스가 한글과의 호환성을 반영하지 않아 한컴오피스가 되레 AI 학습에 있어 걸림돌이 되고 있다고 지적 받을 때가 많다"고 덧붙였다. 한컴 관계자는 "한국이 국가표준(HWPX)을 사용하는 것은 기술 종속을 피하고 데이터 주권을 확보하기 위한 당연하고도 선진적인 표준 전략"이라며 "HWPX를 국내 표준(KS)에 머무르지 않고 오는 2026년 등록을 목표로 ISO 국제 표준 제정을 공식적으로 진행함으로써 우리 기술의 국제 표준 편입을 위해 적극 노력할 것"이라고 밝혔다. 한컴이 외부 개발을 위한 기술도 이미 2010년부터 공개했다는 점도 주목할 부분이다. 한컴은 외부 개발자가 관련 응용 프로그램을 개발할 수 있도록 API(응용 프로그래밍 인터페이스) 및 SDK(소프트웨어 개발 키트)를 공식 제공 중이다. 또 다수의 상용 소프트웨어가 HWP과 HWPX를 지원 중인 점도 오픈소스 시장으로 진입하기에 유리한 부분이다. 한컴 관계자는 "현재 폴라리스 오피스, 사이냅 오피스 등 국내 기업과 해외의 온리오피스(OnlyOffice) 등 오픈소스 생태계에서 HWP, HWPX 호환 기능을 공개된 표준을 통해 개발 중"이라며 "이는 해당 기술이 외부에 공개돼 있음을 방증하는 명백한 증거"라고 설명했다. 업계 관계자는 "한컴은 오픈데이터로더 PDF를 기반으로 글로벌 오픈소스 시장에 본격 진출하며 AI 데이터 처리 기술 경쟁력을 강화하고 있다"며 "외부 기여자 참여 장려, 국제 표준화 추진, 오픈 코어 기반 유료 기능 제공 등을 통해 기술 리더십과 수익 모델을 동시에 확보할 것으로 보인다"고 말했다. 이어 "한컴의 이러한 전략은 글로벌 오픈소스 시장에서 입지를 확대하고 기술 자립을 실현하며 AI 생태계에서 경쟁력을 강화하는 중요한 전환점이 될 것으로 기대된다"고 덧붙였다.

2025.09.22 11:43장유미

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

LG전자, 3분기 실적 예상 웃돌아…전장사업이 효자

"GPU 256장, 누가 거머쥘까"…정부 '특화 AI' 사업 디데이, 흥행 성공할까

과기정통부 국감, 국정자원 화재 대응 최대 현안으로

LG엔솔, 3분기도 선방…美 전기차 배터리 감소분 ESS가 상쇄

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.