• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
인공지능
배터리
양자컴퓨팅
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'언어 인식'통합검색 결과 입니다. (2건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

투플랫폼, 30개 언어 구사하는 'AI 목소리' 공개…글로벌 비즈니스 혁신 이끈다

투플랫폼이 다양한 언어로 인간의 감정까지 표현하는 인공지능(AI) 음성 기술을 통해 글로벌 비즈니스 환경 개선을 선언했다. 투플랫폼은 29일 초고품질 다국어 음성 생성 모델 '수트라 하이파이'를 공식 출시했다. 이 모델은 한국어와 영어를 포함해 힌디어, 베트남어, 아랍어 등 30여 개 언어를 지원한다. 초저지연 실시간 음성 합성을 통해 기존 기계음과 차별화되는 고품질 음성을 제공하는 것이 특징이다. '수트라 하이파이'는 투플랫폼이 자체 개발한 AI 모델 '수트라'의 다국어 역량을 음성 영역까지 확장한 결과물이다. 기존 텍스트 요약, 질의응답, 번역 기술에 음성 합성을 통합한 것이다. 이를 통해 텍스트 이해와 음성 생성을 하나의 생태계에서 유기적으로 연결해 일관된 사용자 경험을 제공한다. 기업은 '수트라 하이파이'의 맞춤형 목소리 생성 기능을 활용해 브랜드가 추구하는 이미지에 어울리는 목소리를 만들 수 있다. 이는 브랜드 정체성을 강화하는 동시에 사용자 몰입도를 높이는 효과를 낸다. 투플랫폼은 '수트라 하이파이'를 활용한 AI 고객 상담 솔루션도 선보였다. 이 솔루션은 다국어 음성 자동 응답 기능을 통해 단순 문의는 AI가 처리하고 복잡한 문의는 즉시 상담사에게 연결한다. 산업별 전문 용어와 다양한 고객 응대 시나리오를 학습해 정교한 대응이 가능하다. 실제 KS한국고용정보는 해외 콜센터 운영에 해당 솔루션을 도입했다. 외국인 상담사는 번역을 지원하는 AI 채팅 기능으로 한국어 메시지를 이해하고 상담 톤앤매너에 맞춘 응답 메시지를 자동으로 작성한다. 그 결과 고객 응답 시간과 운영 비용이 모두 줄었다. 양측은 2~3개월 내 24시간 다국어 고객 문의에 응답하는 AI 음성 콜봇도 적용할 계획이다. 콜봇이 도입되면 운영 효율화 효과는 극대화될 전망이다. 이번 출시는 투플랫폼의 '서비스형 AI(AIaaS)' 전략의 핵심이다. 회사는 수트라 기반의 여러 AI 기능을 응용 프로그램 인터페이스(API)나 모듈 형태로 제공한다. 기업들이 각자 환경에 맞춰 신속히 AI를 도입하고 실제 서비스에 통합하도록 돕는 방식이다. 활용 범위는 컨택센터에 국한되지 않는다. 미디어 분야에서는 다양한 언어와 감정을 담은 음성 콘텐츠 자동 생성 및 더빙으로 제작 비용을 줄일 수 있다. 교육 분야에서는 몰입형 음성 콘텐츠나 AI 튜터를 통해 학습 혁신을 꾀할 수 있다. 이외에도 커머스 분야의 구매 전환율 개선이나 헬스케어 기업의 자연어 상담 대응에도 적용이 기대된다. 프라나브 미스트리 투플랫폼 대표는 "AI 음성 기술은 이제 단순한 텍스트 낭독을 넘어 사람의 감정과 뉘앙스까지 전달하며 산업의 판도를 바꾸고 있다"며 "'수트라 하이파이'는 글로벌 고객을 확보하고 지원할 수 있게 도움으로써 기업의 해외 비즈니스 환경을 개선한다"고 밝혔다.

2025.07.29 17:04조이환

'문서 AI'가 더 똑똑해졌다…"서류 속 문맥·구조까지 파악"

문서 인공지능(AI) 기술이 단순 텍스트 인식을 넘어 문맥·구조까지 이해하는 방향으로 진화했다. 복잡한 문서에서도 주요 정보를 자동 식별하고 고도화된 자동화 처리까지 가능해졌다. 11일 IT 업계에 따르면 최근 문서 처리 시장에서는 비전언어모델(VLM) 기반 광학 문자 인식(OCR) 기술이 주목받고 있다. 이 기술은 계약서, 보고서 등 여러 형식과 맥락으로 이뤄진 문서 속 표, 조항, 제목, 본문을 AI로 식별해 구조화된 데이터로 변환할 수 있다. VLM은 이미지와 언어 정보를 동시에 이해하는 AI 모델이다. 일종의 '이미지 전문가'와 '언어 전문가'가 한 팀처럼 협업하는 방식으로 작동한다. 우선 이 모델은 문서에서 표, 문장, 도장, 손글씨 등 다양한 이미지 요소를 구분한다. 이후 각 영역의 텍스트를 분석해 의미를 파악하고, 이를 종합적으로 해석한다. 이 과정에서 시각 정보와 언어 정보가 실시간으로 상호작용하며 정답을 조율한다. 정보 하나가 잘못 인식되면 다른 정보가 이를 보완하고, 누락된 부분은 이미지 단서를 활용해 추론하는 식이다. 예를 들어, 사용자가 계약서에 VLM 기반 OCR을 적용하면 '계약 당사자'와 '계약 기간' '주요 조항' '서명란' 등을 자동으로 식별해 체계적으로 정리할 수 있다. 이를 통해 문서 처리 자동화 수준을 높이고 반복 작업과 인적 오류를 줄일 수 있다. 기존 OCR은 이미지 속 텍스트를 디지털 문자로 바꾸는 데만 초점 맞췄다. 문서 레이아웃이나 의미적 맥락은 이해하지 못해 데이터 활용에 한계가 있었다. 이에 추가 인력이 이를 수작업으로 정리해야만 했다. VLM OCR, 정확도·사업성 모두 잡아 한국딥러닝은 '딥 OCR 플러스' 출시로 VLM OCR 서비스를 이미 상용화했다. 이 솔루션은 별도 학습 없이 여러 형식 문서를 처리할 수 있다. 한국어·영어·숫자·특수문자가 섞인 복잡한 구조도 정확하게 인식할 수 있도록 설계됐다. 딥 OCR 플러스는 문서의 표나 문단을 자동 분석해 핵심 정보를 요약하고, 추출 데이터를 표준 포맷으로 제공해 업무 시스템과 연동된다. 한국딥러닝은 이 솔루션으로 문서 검토 시간을 최대 80% 줄이고, 일관된 데이터 품질을 유지할 수 있다고 강조했다. 앞서 업스테이지도 AI 기반 문서 구조화 솔루션 '다큐먼트 파스'를 출시해 보험, 금융, 의료 등 산업 현장에서 문서 자동화를 지원하고 있다. 고정밀 벤치마크에서 아마존·마이크로소프트 모델보다 높은 정확도를 기록한 것으로 전해졌다. 올해 6월 모델 '솔라'를 결합한 '솔라 다큐브엘엠'도 출시한다. 솔라 타큐브엘엠은 시각 정보와 언어 정보 통합 처리 역량을 강화해 문서 기반 요약, 질의응답, 자동 분류까지 수행할 수 있도록 구성됐다. 특히 비정형 문서나 복잡한 레이아웃 문서에서도 높은 인식률을 보일 것이란 평가를 받고 있다. 김지현 한국딥러닝 대표는 "비전 OCR은 돈 버는 AI"라며 "정확도와 사업성을 모두 잡을 수 있는 실용 기술"이라고 강조했다.

2025.05.11 14:40김미정

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

美 정부, 인텔에 12.3조 투자 최대 주주로...사실상 '국영기업' 전환

취준생 열기 후끈…IT 인재 박람회 ‘너디너리 페스티벌’ 가보니

글로벌 IT 업계 휩쓰는 'SaaS 종말론'…韓 산업의 해법은?

"AI·초혁신경제로 잠재성장률 3% 회복"…李정부 경제 첫 청사진

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.