• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
스테이블코인
배터리
AI의 눈
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'한컴 오픈소스'통합검색 결과 입니다. (6건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

[AI리더스] 씽크프리 김두영 대표 "해외 매출 비중 70% 목표"…유럽 공공시장 정조준

"향후 5년 내 해외 매출 비중을 70% 이상으로 끌어올리겠습니다. 새해는 그 목표를 향해 유럽 시장에서 '오픈소스'와 개방형 문서 포맷(ODF)이라는 무기로 승부수를 띄우는 해가 될 것입니다." 김두영 씽크프리 대표는 2026년 새해를 맞아 5일 지디넷코리아와 진행한 인터뷰에서 이 같은 글로벌 청사진을 제시했다. 단순히 국산 오피스 소프트웨어를 수출하는 차원을 넘어 철저한 현지화 전략과 인공지능(AI) 신기술로 글로벌 기업 간 거래(B2B) 시장 판도를 흔들겠다는 포부다. 유럽 공공시장 타깃…'오픈소스 공개' 승부수 김두영 대표가 꼽은 유럽 시장 공략 핵심 키워드는 '오픈소스'다. 유럽연합(EU)을 중심으로 디지털 주권 확보 움직임이 강화되면서 데이터 처리 과정이 불투명한 이른바 '블랙박스' 소프트웨어를 기피하는 현상이 뚜렷해졌기 때문이다. 최근 유럽은 미국 빅테크 클라우드 서비스를 사용할 경우 국가 데이터가 역외로 유출될 수 있다는 우려가 커지고 있다. 이에 따라 소스코드를 투명하게 검증할 수 있는 오픈소스 소프트웨어가 공공 조달 시장 사실상 필수 요건으로 자리 잡았다는 설명이다. 이에 씽크프리는 자사 오피스 솔루션 핵심 엔진을 모듈화해 오픈소스로 공개하는 승부수를 띄웠다. 김 대표는 "유럽 공공기관은 보안과 데이터 통제권을 확실히 쥐기 위해 특정 벤더에 종속되지 않는 기술을 선호한다"며 "현지 파트너사나 정부 기관이 직접 보안성을 검증하고, 필요한 기능을 커스터마이징할 수 있도록 지원하는 '기술 생태계 전략'으로 신뢰를 얻겠다"고 설명했다. 구체적으로는 프랑스 등 주요 국가 유력 IT 서비스 기업들과 파트너십을 체결하고, 이들이 씽크프리 기술 기반으로 자국 환경에 최적화된 '국가별 맞춤형 오피스'를 구축하도록 돕는다. 김 대표는 "이는 폐쇄적인 정책을 고수하는 글로벌 경쟁사와 차별화된 진입 전략"이라고 강조했다. 오픈소스 전략과 함께 '개방형 문서 포맷(ODF)' 지원 강화도 병행한다. 마이크로소프트 워드 등 상용 포맷 호환성은 기본으로 갖추고, 씽크프리 오픈소스 활용성을 높이기 위해 유럽 공공시장이 요구하는 표준 규격에 집중한다. 김 대표는 "최근 프랑스 등에서는 공공 문서를 ODF 포맷으로 작성해야 한다는 규제가 생기고 있다"며 "경쟁사가 MS 호환성에 매몰될 때 우리는 ODF 지원으로 현지 규제와 고객 니즈를 동시에 충족시키는 틈새 공략에 성공했다"고 설명했다. "흩어진 업무, AI로 통합"…행동하는 AI 에이전트 '리파인더' 본격 가동 글로벌 시장 확대를 위한 씽크프리의 또 다른 승부수는 AI 기반 업무 생산성 솔루션 '리파인더(Refinder)'다. 리파인더는 단순히 문서를 작성하는 도구를 넘어 기업 내 여기저기 흩어져 있는 방대한 업무 데이터를 하나로 통합하고 관리해 주는 AI 에이전트 서비스다. 기존 마이크로소프트 코파일럿 같은 AI 서비스가 주로 자사 오피스 생태계 내부에 저장된 데이터만 학습하고 활용하는 데 그쳤다면 리파인더는 그 경계를 허물었다. 슬랙, 노션, 구글드라이브, 지라, 리니어 등 기업이 실무에서 많이 쓰는 다양한 외부 협업 툴과 유연하게 연동된다는 점이 가장 큰 차별점이다. 즉 플랫폼 장벽 없이 모든 업무 데이터를 연결하는 허브 역할을 자처한다는 것이다. 특히 리파인더는 단순한 정보 검색이나 답변 생성 수준을 넘어, 사용자 의도를 정확히 파악하고 실제 업무를 대신 수행하는 '액션(Action)' 기능에 특화돼 있다. 김 대표는 "직장인이 업무 시간 상당 부분을 과거 자료를 찾거나 여러 앱을 오가며 데이터를 취합하는 데 쓰고 있다"며 리파인더 필요성을 역설했다. 사용자가 "지난주 마케팅 팀 회의록을 요약해서 팀원에게 이메일 초안을 작성해 줘"라고 명령하면, 리파인더는 스스로 슬랙 대화 내역이나 노션 회의록을 뒤져 관련 내용을 찾고 핵심을 요약한다. 이어 지메일을 실행해 발송 가능한 형태 이메일 초안까지 완성해 놓는다. 사용자는 최종 검토 후 '보내기' 버튼만 누르면 된다. 김 대표는 "기존 생성형 AI를 업무에 쓰려면 복잡한 프롬프트(명령어)를 배워야 했지만, 리파인더는 미리 정의된 업무 템플릿을 제공해 누구나 즉시 업무 자동화를 경험할 수 있다"며 "단순 반복 업무를 AI에게 맡기고 창의적인 일에 집중하게 함으로써 기업 생산성을 획기적으로 높일 것"이라고 자신했다. 그러면서 "향후 리파인더에 엑셀 데이터를 분석해 시각화 차트를 만들어주는 기능 등을 추가할 것"이라며 "기업 의사결정 속도를 높이는 '비즈니스 인텔리전스' 도구로까지 영역을 확장할 계획"이라고 덧붙였다. 한국 SW 한계 뚫고 글로벌 기술 기업 도약 원년 씽크프리는 새해를 기점으로 기업 체질 전환에 나선다. 그동안 공공기관이나 기업에 패키지 형태로 납품하던 온프레미스 오피스 중심 수익 구조에서 탈피해 클라우드 기반 서비스형 소프트웨어(SaaS)와 B2B 솔루션 기업으로 거듭나겠다는 포부다. 이를 통해 안정적이지만 성장에 한계가 있는 국내 시장을 넘어, 구독 모델이 보편화된 글로벌 시장에서 지속 가능한 수익원을 창출하겠다는 각오다. 다만 김 대표는 전 세계적으로 AI 기술 경쟁이 치열하게 전개되지만 정작 기업 현장에서는 피로감을 호소한다는 점을 지적했다. 수많은 AI 툴이 쏟아지지만 서로 연동되지 않아 오히려 업무 파편화가 심화되고 있다는 설명이다. 그는 "지금 시장에 AI 모델은 넘쳐나지만 현장 실무자가 쓰는 수십 개 업무 툴을 하나로 꿰어 실질적인 업무 효율을 높여주는 서비스는 찾아보기 힘들다"고 진단했다. 이에 김 대표는 30년 넘게 축적해 온 문서 엔진 기술력을 바탕으로 문서를 읽고 쓰는 기본기와 함께 다양한 외부 서비스와 막힘없이 데이터를 주고받는 '유연한 연결성'을 더해 글로벌 빅테크 기업이 놓치고 있는 가려운 곳을 긁어주겠다는 전략을 올해 내세웠다. 김 대표는 "우리는 단순히 '한국형 오피스'를 만드는 회사가 아니다"며 "AI와 클라우드라는 날개를 달고 전 세계 기업 일하는 방식을 혁신하는 '글로벌 테크 기업'으로 진화하고 있다"고 강한 자신감을 드러냈다. 이어 "내년부터 리파인더 글로벌 마케팅을 본격화하고 유럽 파트너십을 구체적 성과로 연결해 나갈 것"이라며 "2026년을 씽크프리가 진정한 글로벌 소프트웨어 기업으로 자리매김하는 원년으로 만들겠다"고 강조했다.

2026.01.05 14:24남혁우 기자

"글로벌 AI 생태계, 우리가 주도"…한컴, 오픈소스 국제 표준 인증 획득

한글과컴퓨터가 글로벌 인공지능(AI) 생태계 확장을 주도하기 위한 움직임에 속도를 높이고 있다.한컴은 글로벌 오픈소스 컴플라이언스 표준인 '오픈체인 프로젝트(OpenChain Project)'의 국제 표준 인증 'ISO/IEC 5230:2020'을 획득했다고 6일 밝혔다. 오픈체인 프로젝트는 미국 리눅스 재단(Linux Foundation) 주도로 시작됐다. 기업의 오픈소스 정책, 프로세스, 전문성, 교육 등 컴플라이언스 전반을 종합 평가해 'ISO/IEC 5230:2020' 인증을 부여한다. 한컴은 체계적인 오픈소스 거버넌스 확립을 위해 전담 조직인 OSPO(Open Source Program Office)와 OSRB(Open Source Review Board)를 설립해 운영하고 있다. 이를 통해 글로벌 오픈소스 생태계 참여를 활성화하는 동시에 사내 오픈소스 이슈 발생 시 신속히 대응하는 지속 가능한 관리 체계를 확보했다. AI, 클라우드, SaaS(서비스형 소프트웨어) 등 현대 IT 기술의 근간은 오픈소스다. 이에 따라 소프트웨어 공급망(Supply Chain) 전반의 투명성과 신뢰성 확보가 글로벌 핵심 경쟁력으로 부상했다. 한컴은 이로써 모든 제품과 서비스 개발 과정의 오픈소스 라이선스 위험을 글로벌 표준에 맞춰 체계적으로 관리하고 있음을 국제적으로 입증했다. 이는 한컴의 AI 기술과 설루션을 도입하는 전 세계 고객 및 파트너에게 높은 신뢰를 제공하는 기반이 된다. 특히 이러한 성과는 최근 한컴이 '오픈데이터로더 PDF' 등 핵심 기술을 오픈소스로 공개하며 AI 생태계 확장에 나선 행보와 맞물려 더욱 주목된다. 한컴은 이를 계기로 전사 오픈소스 관리 체계를 고도화하고, 국내외 오픈소스 커뮤니티 활동에도 적극 참여해 생태계 발전에 기여할 방침이다. 정지환 한컴 CTO는 "이번 성과는 한컴이 오픈소스 '소비자'를 넘어, 글로벌 표준에 맞춰 안전하게 관리하고 생태계에 '기여'하는 역량을 갖췄음을 의미한다"며 "신뢰받는 기술력을 바탕으로 최근 중요성이 커지고 있는 SBOM(소프트웨어 자재 명세서) 관리를 포함한 투명한 오픈소스 관리를 실천하고, AI 기술 생태계에 이바지하는 글로벌 표준 리더로 자리매김할 것"이라고 밝혔다.

2025.11.06 09:58장유미 기자

[기고] AX 시대 데이터 감옥, '오픈소스'로 해방한다

인공지능(AI) 패러다임의 중심축은 거대언어모델(LLM) 자체를 넘어 LLM에 신뢰할 수 있는 데이터를 안정적으로 공급하는 인프라 경쟁으로 이동했다. 오픈소스 AI 모델은 산업 수요에 맞게 미세조정이 가능하고 비용을 절감하며 민감 데이터의 내부 처리를 통해 보안성까지 확보할 수 있어 필수재가 됐다. 실제 AI 플랫폼 허깅페이스의 누적 AI 모델 수는 올해 10월 기준 215만 건을 돌파했으며 오픈로직 보고서에 따르면 글로벌 기업 96%가 오픈소스 활용을 유지하거나 확대할 계획이라고 밝혔다. 성공적인 AI 전환(AX) 구현의 핵심은 고품질 데이터지만, 실제 AI 개발 시간의 70%가 데이터 전처리 작업에 할애된다는 통계는 이 병목 현상을 증명한다. 한글과컴퓨터(한컴)는 첫 글로벌 오픈소스 프로젝트인 '오픈데이터로더 PDF'를 통해 AI 학습의 최대 난제인 '데이터 감옥' 문제를 해결하고 글로벌 AI 생태계에 기여하고자 한다. PDF, AI 시대 가장 방대한 '데이터 감옥' 기업 데이터의 대부분을 차지하는 전자문서는 AX 시대에 AI가 활용할 수 있는 핵심 데이터 자원으로 변화했다. 이 중 PDF는 AI 학습을 위한 가장 방대하고 신뢰도 높은 원천이라는 전략적 가치를 지닌다. 올해 기준 전 세계적으로 약 2조5천억 개의 PDF 문서가 존재하며 글로벌 기업 98%가 배포 문서 표준으로 PDF를 채택하고 있다. 헬스케어, 정부 공식 문서 등 신뢰도 높은 기록의 대다수(약 78~90%)를 차지한다는 사실은 PDF가 AI 학습을 위한 가장 방대하고 신뢰도 높은 원천임을 증명한다. 최근 허깅페이스가 공개한 PDF 기반 '파인PDFs' 데이터셋 연구 결과는 LLM 학습 시 이 고품질 PDF 데이터셋을 25% 비중으로 혼합했을 때 모델 품질이 가장 뛰어났다고 밝혔다. PDF 문서가 잘 정제될 경우 AI 모델 성능을 결정짓는 핵심 요소임을 보여주는 결과다. 그러나 PDF는 태생적으로 복잡한 표, 다양한 레이아웃, 이미지 속 텍스트 등 비정형적 요소가 많아 데이터를 온전히 추출하기 어려운 데이터 감옥으로 불려왔다. 한컴이 오픈데이터로더 PDF를 오픈소스로 공개한 것은 이 기술적 난제를 독보적인 문서 처리 기술로 해결하고 글로벌 AI 생태계 발전에 기여하려는 의지다. '오픈데이터로더 PDF'의 3대 기술 차별점 오픈데이터로더 PDF는 전 세계 개발자에게 합리적인 오픈소스 기반 PDF 데이터 추출 솔루션을 제공하기 위해 기존 서비스들과 차별화되는 세 가지 핵심 기술을 담았다. 첫째, 성능과 효율을 극대화한 하이브리드 엔진이다. 규칙 기반의 휴리스틱 방식과 AI 방식의 장점을 결합해 명확한 데이터는 빠른 속도의 휴리스틱 알고리즘으로 추출하고 복잡한 표나 이미지는 AI 기술로 품질을 극대화한다. 이는 고가의 그래픽처리장치(GPU) 장비 의존도를 최소화하면서 빠르고 정확한 데이터 추출을 가능케 한다. 둘째, 태그드 PDF 지원이다. 태그드 PDF는 제목·표 등 각 요소에 의미 태그가 포함된 포맷이다. 이 구조적 정보를 활용하면 AI 인식 기술 의존 없이 GPU 사용을 최소화하며 높은 속도와 정확도를 동시에 달성할 수 있다. 대부분의 오픈소스 도구가 이를 지원하지 못하는 상황에서 오픈데이터로더 PDF는 차별화된 성능을 제공한다. 셋째, 데이터 주권과 신뢰성을 보장하는 AI 안전성 지원이다. 네트워크 연결 없이 내부망에서 오프라인으로 구동돼 데이터 유출을 원천 차단한다. 나아가 학습 데이터에 악의적인 프롬프트를 주입하는 '프롬프트 인젝션' 등 AI 보안 위협을 필터링하는 AI 안전성 기능까지 제공해 신뢰할 수 있는 AI를 만드는 시작점을 지원한다. 글로벌 AI 생태계의 표준으로 오픈데이터로더 PDF는 기술적 우위를 넘어 글로벌 AI 생태계의 핵심 인프라로 자리매김하기 위한 로드맵을 실행하고 있다. 가장 큰 성과는 최근 LLM 기반 애플리케이션 구축에 가장 널리 쓰이는 오픈소스 프레임워크인 '랭체인'의 공식 구성 요소로 등록된 것이다. 이는 전 세계 수십만 AI 개발자가 활용하는 표준 프레임워크에 공식 편입됐음을 의미한다. 앞으로 랭체인에 이어 라마인덱스, 제미나이-cli 등 주요 AI 프레임워크와의 호환성을 지속 강화하고 글로벌 커뮤니티와 협력해 AI 데이터 추출 표준 도구로 자리 잡고자 한다. 데이터 감옥을 넘어 신뢰할 수 있는 AX 시대로 AI 시대로의 전환은 데이터 변환의 혁신 없이는 불가능하다. AI 개발 시간의 약 70%가 소요되는 데이터 전처리 병목 현상을 해결하는 기술이야말로 AX 시대 기술 경쟁력의 핵심이다. 한컴이 오픈데이터로더 PDF 프로젝트를 글로벌 오픈소스로 공개한 것은 전 세계 모든 기업과 개발자가 이러한 데이터 감옥의 장벽 없이 AX를 실현하도록 지원하겠다는 비전의 실천이다. 한컴은 앞으로도 AI 데이터 기술을 선도하고 핵심 기술의 오픈소스화를 통해 성공적인 AX 생태계 확장에 기여하며 고객이 가장 신뢰할 수 있는 AX 파트너로 자리매김하고자 한다.

2025.11.03 15:28정지환 컬럼니스트

[기고] AX 시대, '오픈소스 거버넌스'가 미래 성장을 결정한다

현재 기술 업계의 화두인 '인공지능 전환(AX)' 시대에 오픈소스는 더 이상 선택 사항이 아닌 경쟁 우위를 확보하는 핵심 전략 자산으로 확고히 자리 잡았다. 이제 기업의 최우선 과제는 코드를 활용하는 단계를 넘어 이 거대한 생태계 속에서 지속 가능한 수익 모델을 구축하고 동시에 기술적·법적 리스크를 체계적으로 관리하는 것이다. 클라우드 네이티브와 AI 기술 상용화가 급물살을 타면서 오픈소스 프로젝트의 상업적 가치 창출과 위험 관리의 중요성은 그 어느 때보다 증대됐다. 지속 가능한 성장을 위한 오픈소스 비즈니스 모델 오픈소스는 과거의 '자유'라는 가치 중심에서 벗어나 현재 가장 역동적이고 빠르게 성장하는 소프트웨어(SW) 시장의 중심으로 도약했다. 이미 글로벌 오픈소스 서비스 시장 규모는 작년 185억5천만 달러(약 26조원)에서 2033년 8천110억 달러(1천150조원)로 폭발적인 성장이 예상된다. 이는 오픈소스 기반의 비즈니스 모델이 명확한 수익성을 입증하고 있음을 보여준다. 가장 대표적인 모델은 '오픈 코어'다. SW의 핵심 기능(코어)은 오픈소스로 공개해 폭넓은 사용자 기반을 확보하고 엔터프라이즈 기능, 고급 분석, 확장된 관리 도구, 서비스형 소프트웨어(SaaS) 등 프리미엄 기능은 상용 라이선스로 제공하는 방식이다. 몽고DB와 엘라스틱서치 등이 이 모델로 높은 시장 가치를 증명했다. 특히 시너지 리서치 그룹에 따르면 클라우드 기반 서비스 시장은 연평균 24%씩 성장할 것으로 예상되는데, 오픈 코어 모델은 핵심 기술을 기반으로 기업용 클라우드 서비스를 제공함으로써 이 고성장 시장에 직접 편입되는 전략적 이점을 지닌다. 오픈소스를 클라우드 기반의 관리형 서비스로 제공하고 구독료를 받는 SaaS 모델 역시 핵심적인 수익화 방식이다. 분산 스트리밍 플랫폼인 아파치 카프카를 기반으로 클러스터 관리, 데이터 통합, 보안, 성능 최적화 등을 클라우드에서 서비스형으로 제공하는 컨플루언트가 대표적이다. 또 다른 축은 서비스 및 기술 지원 구독 모델이다. 레드햇의 성공 사례처럼 SW는 무료로 제공하되 엔터프라이즈 고객이 필요로 하는 기술 지원, 유지보수, 보안 패치 등을 유료 구독 형태로 제공하는 것이다. 리눅스 재단 보고서에 따르면 기업이 오픈소스를 사용하며 겪는 가장 큰 어려움은 '보안 및 컴플라이언스 관리'와 '전문가 확보'다. 이 모델은 시장의 이러한 필요를 직접적으로 해소하며 서비스 유료화의 정당성을 확보한다. 최근에는 데이터 및 AI 모델 기반의 새로운 수익화 모델도 주목해야 한다. 이 모델은 SW 자체보다 오픈소스로 구축된 인프라를 통해 수집되거나 가공된 데이터 또는 학습된 AI 모델의 사용에 대해 수익을 창출한다. 한컴의 '오픈데이터로더 PDF'와 같은 기술로 정제된 고품질 학습 데이터를 유료 API 형태로 제공하는 방식이 좋은 예다. 실제로 마켓앤마켓은 글로벌 AI 데이터·라벨링 시장이 연평균 33.2% 성장할 것으로 예측했으며 이는 고품질 데이터셋 자체가 핵심 수익 자산이 될 수 있음을 보여준다. 기회와 위험의 균형, 체계적인 거버넌스 전략 성공적인 비즈니스 모델을 실행하기 위해서는 기업 내부의 오픈소스 활성화 전략과 외부 리스크를 관리할 거버넌스 체계가 필수적이다. 이를 위해 가장 먼저 고려해야 할 것은 오픈소스 프로그램 오피스(OSPO)의 설립과 운영이다. OSPO는 오픈소스 관련 정책, 라이선스 컴플라이언스, 기여 활동, 내부 교육 등을 총괄하는 전담 조직이다. 리눅스 재단의 지난해 보고서에 따르면 기업의 49%가 OSPO를 운영 중이거나 계획하고 있으며 이는 전년 대비 3배 이상 증가한 수치다. OSPO를 보유한 조직은 오픈소스 기여를 장려할 가능성이 약 2배 더 높은 것으로 나타났는데, 이는 기업의 기술 브랜딩 효과를 극대화하고 시장 민첩성을 높이는 핵심 동력이 된다. 한컴 역시 이러한 전략적 중요성을 인지해 OSPO 설립을 통해 조직을 체계화하고 있다. 다음으로 오픈소스 거버넌스 로드맵을 구축해 잠재적 위험을 비즈니스 기회로 전환해야 한다. 오픈소스의 리스크는 주로 라이선스 충돌과 보안 취약점에서 발생한다. 시놉시스의 지난해 보고서에 따르면 감사 대상 상용 코드베이스의 56%에서 라이선스 충돌이 발견됐다. 이를 해결하기 위해 사용 중인 모든 오픈소스 컴포넌트의 목록인 SW 자재명세서(SBOM)을 작성하고, 일반 공중 사용 허가서(GPL)와 같은 의무 공개 조항 라이선스를 자동으로 검사하는 도구를 도입해 법적 리스크를 사전에 차단해야 한다. 한컴 역시 SW 공급망 보안 대응과 SBOM 구축 의무화를 통해 선제적으로 노력 중이다. 이와 동시에 지속적인 보안 취약점 관리가 필수적이다. 베라코드의 올해 보고서에 따르면 전체 애플리케이션 보안 결함의 70% 이상이 오픈소스와 같은 외부 구성 요소에서 비롯된다. 개발 과정에 코드 분석 및 점검 시스템을 통합해 잠재적 취약점을 배포 전에 발견하고 즉시 패치하는 능동적인 거버넌스만이 비즈니스의 연속성을 확보하는 유일한 방패다. 단순한 코드 활용의 시대는 막을 내렸다. 오픈소스는 거대한 시장을 형성할 미래 혁신의 심장이자 동시에 아직 보안 결함을 품은 양날의 검이다. 기업의 생존은 이 거대한 기회와 리스크의 균형을 어떻게 설계하느냐에 달려 있다. SBOM 구축과 통합 보안 시스템을 통한 능동적인 거버넌스라는 전제 위에서만 우리는 서비스 구독, 오픈 코어, 데이터 수익화 모델을 통해 성장을 극대화하고 글로벌 AX 시대의 주도자로 나아갈 수 있을 것이다.

2025.10.16 14:37정지환 컬럼니스트

[유미's 픽] "이 시장 뚫어라"…김연수 한 마디에 獨 달려간 한컴, 존재감 드러낼까

문서 포맷 HWP가 인공지능(AI) 학습에 적합하지 않다는 지적으로 그간 속앓이를 했던 한글과컴퓨터가 최근 '오픈데이터로더 PDF' 공개를 기점으로 글로벌 오픈소스 시장에 본격 진출했다. 국내 기술 자산을 글로벌 경쟁력으로 전환하고 AI 데이터 처리와 오픈소스 협업을 통한 기술 리더십을 확보함으로써 수익성을 더 크게 끌어올리기 위해서다. 22일 업계에 따르면 한컴은 최근 공개한 '오픈데이터로더 PDF'를 앞세워 기술 아이덴티티 중심의 글로벌 테크 기업으로 인지도를 높이기 위한 본격적인 움직임에 나섰다. 이를 위해 AI 기반 문서 인식 기술을 추가하고 ▲라마 인덱스(Llamaindex) ▲제미나이 CLI(Gemini-cli) ▲랭체인(LangChain) 등 주요 AI 프레임워크와의 호환성을 강화할 뿐 아니라 깃허브를 통한 글로벌 개발자 커뮤니티와의 협력 체계를 더 굳건히 하기 위해 분주히 움직이고 있다. 지난 15~16일 독일 베를린에서 개최된 유럽 최대 PDF 기술 컨퍼런스인 '2025 PDF 데이즈 유럽'에 참가한 것도 이 때문이다. 한컴은 이 자리에서 한컴이 오랜 기간 축적한 문서 처리 기술력을 바탕으로 개발한 PDF 데이터 추출 엔진 '오픈데이터로더 PDF'를 시연해 많은 관람객들의 눈길을 사로 잡았다. 이 솔루션은 AI 학습과 활용 과정에서 고질적인 난제로 지적돼 온 PDF 문서 데이터 처리 병목 현상을 해소하는 핵심 기술로, 이달부터 깃허브에 오픈소스로 공개됐다. AI가 문서를 더 잘 이해하고 활용할 수 있도록 JSON, 마크다운(Markdown), HTML 등 최적화된 형태로 데이터를 변환하는 것이 특징으로, 경량화된 SDK(소프트웨어 개발 키트) 형태로 제공돼 다양한 AI 서비스에 쉽게 연동할 수 있다. 현장에서는 복잡한 문서의 표, 이미지, 레이아웃을 정확하게 분석하는 독보적인 기술력에 대한 호평도 이어졌다. 이처럼 한컴이 글로벌 오픈소스 시장에 관심을 두게 된 것은 최근 AI를 포함한 IT 생태계에서 폐쇄적인 개발보다 오픈소스 기반의 환경으로 변화하며 사업적인 기회가 생겼다고 판단해서다. 또 공공 및 민간 시장에서 오픈소스의 도입 정책의 확대 및 의무화 움직임과 구글, 마이크로소프트 등 상용 SaaS 기업들의 오픈소스 전략 가속화도 한컴에게 큰 자극이 됐다. 더불어 글로벌 오픈소스 시장이 빠르게 성장하고 있다는 점도 주효했다. 실제 시장조사기관 프리시던스 리서치(Precedence Research)에 따르면 지난 해 글로벌 오픈소스 서비스 시장은 약 353억 달러 규모였으나, 오는 2033년에는 1천327억 달러까지 성장할 것으로 예상된다. 연평균 성장률(CAGR)은 약 15%에 달한다. 업계 관계자는 "최근 오픈소스 기반 AI 생태계는 급속한 성장을 보여주고 있다"며 "이젠 오픈소스가 단순한 코드 공개를 넘어 신뢰, 협업, 포용이라는 가치를 중심으로 AI 산업 전반의 패러다임 변화를 이끌고 있음을 시사한다"고 분석했다. 이 같은 분위기에 맞춰 김연수 한컴 대표는 올 들어 임직원들에게 오픈소스 시장에 진출해 빠르게 안착할 수 있도록 적극 행동에 나설 것을 주문했다. 지난 7월 글로벌 오픈소스 전문 기업 '듀얼랩'과 사업 협력을 위한 양해각서(MOU)를 체결한 것도 이의 일환이다. 특히 '오픈데이터로더 PDF'는 양사 협업의 첫 결과물로, 오픈소스 생태계를 통해 한컴이 전 세계 개발자, 커뮤니티, 기업 사용자들과의 협업을 확대할 수 있는 매개체가 될 것으로 기대를 모으고 있다. 또 한컴은 오픈소스의 공유 가치를 실현하면서도 지속 가능한 사업 모델을 구축하기 위해 '오픈 코어(Open Core)' 전략을 채택키로 했다. 이에 따라 핵심적인 PDF 데이터 추출 SDK는 누구나 자유롭게 사용할 수 있도록 공개하고 광학문자인식(OCR)의 정밀도를 높이거나 표, 수식, 차트 등을 고도화된 AI 기술로 인식하는 기능은 별도의 상용 '애드온(Add-on)' 형태로 출시해 수익을 창출할 계획이다. 업계에선 한컴이 이미 충분한 역량을 갖추고 있는 만큼 오픈소스 시장에서 빠르게 존재감을 드러낼 것으로 기대했다. 또 한글의 문서 포맷 HWP가 AI 학습에 적합하지 않다는 일부 평가가 있지만, HWPX는 국가 표준에 기반한 개방형 포맷으로 이미 활용되고 있다는 점에서 크게 문제되지 않을 것으로 봤다. 실제 한컴오피스는 HWPX를 기본으로 사용하되 ODF와 OOXML(DOCX) 포맷과의 호환성을 이미 지원하고 있다. 업계 관계자는 "데이터 추출이 어려운 바이너리 기반 문서 포맷은 HWP뿐 아니라 JPG, GIF 등 이미지 파일이나 DOC, PDF 등 문서 파일처럼 컴퓨터에서 동작하는 프로그램 대부분이 해당된다"며 "한컴이 개발한 개방형 문서포맷 HWPX의 AI 학습 데이터 추출 수준은 국제표준인 MS와 오픈소스 오피스 문서포맷과 차이가 없다"고 지적했다. 그러면서 "한글 파일 자체는 국제문서 포맷과 호환성에 문제가 없다"며 "MS오피스가 한글과의 호환성을 반영하지 않아 한컴오피스가 되레 AI 학습에 있어 걸림돌이 되고 있다고 지적 받을 때가 많다"고 덧붙였다. 한컴 관계자는 "한국이 국가표준(HWPX)을 사용하는 것은 기술 종속을 피하고 데이터 주권을 확보하기 위한 당연하고도 선진적인 표준 전략"이라며 "HWPX를 국내 표준(KS)에 머무르지 않고 오는 2026년 등록을 목표로 ISO 국제 표준 제정을 공식적으로 진행함으로써 우리 기술의 국제 표준 편입을 위해 적극 노력할 것"이라고 밝혔다. 한컴이 외부 개발을 위한 기술도 이미 2010년부터 공개했다는 점도 주목할 부분이다. 한컴은 외부 개발자가 관련 응용 프로그램을 개발할 수 있도록 API(응용 프로그래밍 인터페이스) 및 SDK(소프트웨어 개발 키트)를 공식 제공 중이다. 또 다수의 상용 소프트웨어가 HWP과 HWPX를 지원 중인 점도 오픈소스 시장으로 진입하기에 유리한 부분이다. 한컴 관계자는 "현재 폴라리스 오피스, 사이냅 오피스 등 국내 기업과 해외의 온리오피스(OnlyOffice) 등 오픈소스 생태계에서 HWP, HWPX 호환 기능을 공개된 표준을 통해 개발 중"이라며 "이는 해당 기술이 외부에 공개돼 있음을 방증하는 명백한 증거"라고 설명했다. 업계 관계자는 "한컴은 오픈데이터로더 PDF를 기반으로 글로벌 오픈소스 시장에 본격 진출하며 AI 데이터 처리 기술 경쟁력을 강화하고 있다"며 "외부 기여자 참여 장려, 국제 표준화 추진, 오픈 코어 기반 유료 기능 제공 등을 통해 기술 리더십과 수익 모델을 동시에 확보할 것으로 보인다"고 말했다. 이어 "한컴의 이러한 전략은 글로벌 오픈소스 시장에서 입지를 확대하고 기술 자립을 실현하며 AI 생태계에서 경쟁력을 강화하는 중요한 전환점이 될 것으로 기대된다"고 덧붙였다.

2025.09.22 11:43장유미 기자

한컴, PDF 추출 핵심 기술 글로벌 오픈소스로 공개…AI 생태계 기여

한글과컴퓨터(한컴)가 AI 학습·활용 과정에서 고질적인 난제로 지적돼 온 PDF 문서 데이터 처리 병목 현상을 해소할 핵심 기술을 글로벌 오픈소스로 공개했다. 한컴은 자사 문서 처리 기술력을 바탕으로 개발한 PDF 데이터 추출 엔진인 '오픈데이터로더 PDF'의 오픈소스 프로젝트를 추진한다고 17일 밝혔다. 최근 허깅페이스는 PDF 문서를 기반으로 한 약 4억7천500만 건 규모의 대규모 데이터셋 '파인PDFs'를 공개했고 이를 활용하려는 기업들의 움직임도 본격화되고 있다. PDF는 전 세계적으로 AI 학습에 가장 널리 사용되는 문서 포맷이지만 복잡한 내부 구조 때문에 학습용 데이터 추출이 쉽지 않다. 이로 인해 '데이터 감옥'이라 불릴 만큼 AI 개발 과정에서 큰 제약이 따랐다. 이번 오픈소스 프로젝트는 이러한 문제를 해결하기 위해 한컴이 지난 7월 PDF 기술 전문기업 듀얼랩과 체결한 업무협약(MOU)의 첫 결실이다. 양사는 오픈소스 기반 PDF 데이터로더를 공동 개발하며 AI 생태계 확장을 목표로 하고 있으며 이번 기술 공개를 통해 본격적인 확산에 나선다. 공동 개발한 오픈데이터로더 PDF는 PDF 문서 내 텍스트·표·이미지·레이아웃 정보를 높은 정확도와 빠른 성능으로 추출해 AI 학습에 즉시 활용할 수 있는 정형화된 데이터로 변환한다. 특히 기존 경쟁 오픈소스 기술보다 우수한 성능을 입증했다. 공식 홈페이지에 공개된 벤치마크 테스트 결과, 사람의 읽기 순서를 측정하는 지표인 NID에서 타 기술 대비 85%라는 높은 수치를 기록하는 등 다양한 테스트에서 우수한 성능을 보인다. 또 금융·공공기관 등 민감한 데이터를 다루는 환경에서도 네트워크 연결 없이 완전 오프라인으로 작동해 데이터 유출과 외부 업로드로 인한 정보 노출 위험을 원천 차단한다. 이러한 오프라인 기반 보안성은 기업과 기관 단위 활용에서 중요한 기술적 장점으로 작용할 전망이다. 아울러 최근 AI 산업의 주요 화두로 떠오른 학습 데이터 안전성 문제에 대응하기 위한 전략도 담았다. 오픈데이터로더 PDF는 악의적인 콘텐츠 삽입을 통한 프롬프트 인젝션 등 보안 위협을 자동 감지·차단하는 기능을 추가로 제공할 예정이다. 이를 통해 AI 학습 데이터의 안정성과 신뢰성을 동시에 보장하고 보다 안전한 AI 모델 학습 환경 구축에 기여한다는 방침이다. 한컴은 이번 오픈소스 공개를 통해 단순 기술 공유를 넘어 AI 생태계 전반의 오픈소스 확산과 기술 고도화를 추진하고 있다. 이를 위해 챗GPT·제미나이·랭체인 등 주요 AI 프레임워크와의 연동·호환성을 강화하고 깃허브를 통한 글로벌 개발자 커뮤니티와의 협력을 이어갈 계획이다. 한컴 정지환 최고기술책임자(CTO)는 "AI 전환 시대 오픈소스는 더 이상 선택이 아닌 기업과 사회 전반의 혁신과 경쟁력 확보를 위한 필수 전략"이라며 "이번 오픈데이터로더 PDF 핵심 기술 공개를 통해 전 세계 개발자들에게 인정받고 협력을 통해 PDF 데이터 추출 기술을 한 단계 더 발전시켜 글로벌 최고 수준의 AI 데이터 추출 기술을 완성하겠다"고 말했다. 이어 "연말에는 AI 기반 문서 인식 기술을 추가하는 등 오픈소스 프로젝트를 지속적으로 고도화하겠다"고 덧붙였다.

2025.09.17 17:53한정호 기자

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

"인간과 경쟁하는 AI 현실로…몰트북, 시작에 불과하다"

[ZD브리핑] 세미콘코리아 역대 최대 규모 개막…주요 게임사 실적 공개

"남의 기술 활용엔 한계…로봇 기술 내재화가 핵심"

빗썸 보유 비트코인 초과한 지급 지시…어떻게 가능했을까

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.