• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
스테이블코인
배터리
AI의 눈
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'바이너리'통합검색 결과 입니다. (2건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

HWP가 AI 혁신의 적? '진짜 범인'은 낡은 문서 문화와 관성

인공지능(AI) 시대를 맞아 공공 데이터 개방의 최대 걸림돌로 '아래아한글(HWP)'이 지목되며 거센 비판을 받고 있다. 독자적인 바이너리(Binary) 포맷 탓에 AI가 읽을 수 없어 데이터 활용을 가로막는다는 주장이 핵심이다. 하지만 현장의 전문가과 산업계의 시각은 다르다. AI 도입을 방해하는 진짜 주범은 파일 확장자가 아니라 기형적인 '문서 작성 문화'와 변화를 거부하는 '조직의 관성'이라는 지적이다. 29일 관련 업계에 따르면 주요 AI 기업은 이미 다양한 비정형 데이터를 활용하기 위한 서비스를 선보이며 AI 혁신을 지원하고 있다. 기업이 아닌 시대의 유물 '바이너리' 최근 공공·산업 분야에서는 HWP는 바이너리 구조라 AI가 읽을 수 없다'는 인식이 널리 퍼져 있다. 실제로 HWP 파일을 메모장으로 열면 글자가 깨지고 XML 기반 문서처럼 구조가 제대로 시각화되지 않아 분석이 어렵다는 비판이다. 이에 앞서 먼저 논란의 핵심인 파일 구조를 이해할 필요가 있다. 컴퓨터 파일은 크게 '텍스트(Text) 파일'과 '바이너리(Binary) 파일'로 나뉜다. 텍스트 파일은 이름 그대로 문자와 숫자로만 구성된 양식이다. 데이터가 표준 문자 코드(유니코드 등)로 저장되기 때문에 별도의 전용 프로그램 없이 메모장만 있어도 내용을 확인하고 수정할 수 있으며 호환성이 뛰어나다. XML이 대표적인 텍스트파일 양식이다. 반면 바이너리 파일은 이미지, 영상, 실행 프로그램처럼 복잡한 데이터를 저장하기 위한 방식이다. 방대한 정보를 효율적으로 담기 위해 단순 문자 코드가 아닌 별도의 규칙으로 데이터를 저장하며, 이를 해석하기 위해서는 한글이나 워드 같은 전용 애플리케이션이 반드시 필요하다. 2000년대 초반까지의 구형 문서 파일들이 주로 이 바이너리 구조를 채택했던 이유는 '효율성' 때문이다. 당시의 하드웨어 성능과 저장 공간의 한계로 인해, 글자뿐만 아니라 폰트, 레이아웃, 표 등 복잡한 서식 정보를 적은 용량에 담아내기 위해서는 텍스트 방식보다 압축적인 바이너리 방식이 훨씬 유리했기 때문이다. 이로 인해 전용 도구 없이는 내용을 읽을 수 없는 바이너리 파일은 AI 입장에서 활용이 까다로울 수밖에 없다. 마이크로소프트 역시 워드 2007 버전부터 XML 기반 DOCX를 채택한 만큼 바이너리 기반 DOC 파일로 저장된 이전 문서는 파일 전환에 대한 어려움이 동일하다. 결국 핵심은 특정 포맷 문제가 아닌 과거 기술로 만들어진 레거시 데이터를 어떻게 처리할 지의 문제다. 이는 국가를 가리지 않고 산업 전반에 걸쳐 동일하게 처한 문제다. 핸디소프트 이해석 대표는 "HWP, DOC 가릴 것 없이 과거 문서는 대부분 AI가 읽기 힘든 바이너리 구조라는 공통된 한계를 갖고 있다"며 "특정 양식이나 서비스를 비판하기 보다 방대한 데이터를 AI 자산으로 가공하기 위한 방안을 마련하는 것에 집중해야 한다"고 강조했다. 정부가 90년대부터 워드를 썼다면? 크게 다르지 않았을 것 일각에서는 "정부가 처음부터 글로벌 표준인 MS 워드를 썼더라면 지금 같은 문제는 없었을 것"이라고 주장한다. 하지만 이는 거대 조직의 생리와 기술 발전 과정을 간과한 분석이라는 평가다. 정부 부처처럼 방대한 인력과 수많은 부서가 연계된 조직은 새로운 시스템으로의 완전한 전환은 매우 어렵다. 실제로 마이크로소프트가 보안 지원이 종료된 구형 윈도우의 교체를 수없이 권고했지만 공공기관은 호환성과 예산 문제로 인해 지원 종료 후에도 종합상황실을 운영하며 버티는 현상을 반복해 왔다. HWP 대신 워드를 도입했더라도 이러한 시스템 관성은 동일하게 작동했을 가능성이 크다. 한글과컴퓨터 역시 이미 20년 전인 2007년에 개방형 포맷인 HWPX를 선보였고 2010년에는 HWP 5.0의 내부 설계도를 문서화해 공개했다. 기술적으로는 이미 십수 년 전부터 AI 학습에 용이한 '텍스트 기반 구조'를 갖춰두었던 셈이다. 그러나 당시 정부 부처 등 공공기관은 기술 발전 속도를 따라가지 못했다. 기존 구형 SW에서 최신 파일을 읽을 수 없다는 민원과 행정 불편을 이유로 도입을 차일피일 미뤘고, 심지어 현장에서는 최신 포맷인 HWPX를 사용하지 말라는 지침이 내려오는 역설적인 상황까지 벌어졌다. 결국 기술 개발 이후 무려 11년이 지난 2018년이 되어서야 HWPX는 비로소 공공의 공식 포맷으로 자리 잡을 수 있었다. 만약 우리 정부가 1990년대부터 워드를 썼다고 가정하더라도, 이러한 보수적인 행정 문화 아래에서는 대다수 문서가 AI가 이해하기 어려운 바이너리 기반의 구형 DOC 파일로 방치되었을 가능성이 크다는 지적이 나오는 이유다. 도입 막는 진짜 원인, 보여주기식 '의전용 편집' AI 전문가는 포맷보다 더 심각한 본질적 문제로 공공기관 특유의 기형적인 문서 작성 문화를 지목한다. 파일 내부 데이터가 보여주기식으로 파편화되어 AI가 이해하기 힘든 구조라는 지적이다. 대표적인 사례가 투명한 표(Table)다. 공공 문서를 열어보면 문서 전체 시각적 레이아웃을 잡기 위한 투명한 선으로 그려진 표가 남발된다. 심지어 표 안에 또 다른 표를 밀어 넣는 이중·삼중의 표가 존재한다. 이는 사람 눈에는 정갈한 보고서로 보이지만 AI가 텍스트를 추출하는 순간 재앙이 시작된다. 왼쪽 단의 항목과 오른쪽 단의 수치가 엉뚱하게 결합하거나 문장이 토막 나면서, 데이터 간의 핵심적인 상관관계가 완전히 파괴되기 때문이다. 이러한 현상의 배후에는 윗선의 '보여주기식 보고 문화'가 자리 잡고 있다. 내용의 논리적 구조보다는 ▲무조건 한 장에 모든 내용을 구겨 넣어야 하고 ▲자간과 장평을 억지로 조절해 끝 줄을 맞춰야 하며 ▲화려한 도표로 치장된 문서를 선호하는 '의전용 편집'이 공공 데이터를 제대로 사용할 수 없게 만든다는 것이다. 더불어 체계화되지 못한 문서 활용법도 비판에 올랐다. 업무 성격에 따라 엑셀, 파워포인트, 위키 등 데이터 구조에 최적화된 다양한 도구를 병행해야 함에도 HWP에 과도하게 집중됐다는 것이다. 이 대표는 "출판 목적 문서를 만들기에는 HWP가 좋은 도구이지만 이를 활용하는 방법에서 문제가 존재했다"며 "기존 방식대로 문서를 그림 그리듯 작성하는 문화가 계속된다면 아무리 최신 AI 모델을 도입해도 학습할 수 있는 유의미한 데이터는 얻을 수 없다"고 비판했다. 이어 "AI 시대를 대비하기 위해서는 파일 확장자를 바꾸는 것보다, 문서를 데이터로서 대하는 인식의 전환과 작성 공정의 대수술이 더 시급하다"고 강조했다. 사이냅소프트 전경헌 대표는 "HWP 외에도 PDF, 이미지 등 정부가 활용하는 데이터에는 수많은 비정형 데이터가 존재하며 이중 상당수는 대체가 불가능한 요소가 존재한다"며 "결국 정부가 추진하는 데이터 혁신의 핵심은 다양한 형태 비정형 문서 자산을 얼마나 정확하고 빠르게 정형 데이터로 만드냐에 달려있다"고 강조했다.

2026.01.29 16:54남혁우 기자

오늘의집 바이너리샵, '뉴이어세일' 진행

라이프스타일 슈퍼앱 오늘의집은 글로벌 및 국내 신진 디자이너의 오리지널 브랜드 상품을 최대 할인과 함께 제공하는 '바이너리 뉴이어세일'을 실시한다고 7일 밝혔다. 오는 12일까지 진행되는 바이너리 뉴이어세일에서는 2025년 SS 시즌을 이끌 트렌디한 인테리어 및 라이프스타일 상품을 모두 접할 수 있다. 가구, 조명, 주방, 패브릭, 홈데코, 라이프스타일 등 여러 카테고리의 상품을 특가에 판매한다. 오늘의집은 바이너리 뉴이어세일 기간 동안 매일 12개의 상품을 선별해 24시간 한정으로 할인가에 판매하는 '오늘의딜'을 마련했다. 대표 상품으로는 ▲레어로우의 시스템000 디스플레이 쉘빙 04 ▲잭슨카멜레온의 소파 테이블 ▲킨토의 크로노스 더블월 티컵 ▲드비저리의 쿠르셀 사이드 테이블 ▲제네바사운드의 클래식S 블루투스 스피커 ▲라디룸의 달항아리 스탠드조명 등이 있다. 인기 브랜드를 할인과 함께 선보이는 '오늘의 브랜드'도 진행한다. 레어로우, TWB, 잭슨카멜레온, 빌티니, 플랫포인트, 오디넌트, 비믹스, 빌라레코드, 룸버스랩 등 브랜드들이 대거 참여해 대표 상품을 특가에 판매한다. 그밖에 이용자가 카테고리별 인기 상품을 한 번에 모아 비교해보고 구매할 수 있도록 상품을 카테고리별로 구분해 선보인다. 오늘의집은 새해 첫 바이너리샵 세일을 기념해 구매 금액별 할인 쿠폰을 준비했다. 이용자는 매일 밤 12시에 최대 35만원 할인을 제공하는 쿠폰팩을 선착순으로 발급받을 수 있다. 100만원 이상 구매시 20만원, 50만원 이상 구매 시 10만원, 20만원 이상 구매시 4만원, 5만원 이상 구매시 1만원 장바구니 할인이 적용된다. 해당 쿠폰은 바이너리 뉴이어세일에서 판매 중인 모든 상품에 적용 가능하다. 이 외에도 첫 구매 최대 2만원 할인, 간편결제 할인 및 적립을 제공한다. 오늘의집 관계자는 "바이너리샵 이용자가 꾸준히 늘어남에 따라 이용자가 할인과 함께 상품을 만나볼 수 있도록 신년 맞이 세일을 준비했다"며 "앞으로도 오늘의집은 이용자의 취향을 만족시켜 줄 수 있는 다채로운 상품을 선보이며 차별화된 경험을 제공하도록 노력하겠다"고 말했다.

2025.01.07 09:49조수민 기자

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

[사스포칼립스 위기 ㊤] AI가 SaaS 산업 흔드나…"경쟁 구도 재편으로 봐야"

밀가루·설탕값 내렸는데…오리온·농심·롯데 조용 왜?

20년간 761대→13만대...미니, 올해 한정판 11종 출시

공정위는 쿠팡에 왜·어떻게 21.8억원 과징금 부과했나

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.