• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
  • AI의 눈
AI의 눈
HR컨퍼런스
스테이블코인
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'음성'통합검색 결과 입니다. (39건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

코히어, 차세대 음성인식 모델 공개…기업용 AI 음성 처리 시장 공략

코히어가 오픈소스 기반의 고성능 음성인식(ASR) 모델을 공개하며 기업용 인공지능(AI) 음성 시장 확대에 나섰다. 정확도와 처리속도를 동시에 끌어올린 점이 특징으로 실시간 음성 데이터 활용 수요 증가에 대응하려는 전략으로 풀이된다. 코히어는 자사 공식 뉴스룸을 통해 최신 음성인식 모델 '코히어 트랜스크라이브(cohere-transcribe)'를 공개했다고 27일 밝혔다. 해당 모델은 음성을 텍스트로 변환하는 ASR 시스템으로, 14개 언어를 지원하며 기업 환경에서 활용 가능한 수준의 성능과 효율성을 목표로 개발됐다. 이번 모델은 컨포머 기반 인코더와 트랜스포머 디코더 구조를 결합한 20억(2B) 파라미터 규모로, 음성 데이터를 로그-멜 스펙트로그램으로 변환한 뒤 텍스트를 생성하는 방식이다. 학습 과정에서는 단어 오류율(WER)을 최소화하는 데 초점을 맞췄다. 성능 측면에서도 경쟁력을 확보했다. 코히어 트랜스크라이브는 허깅페이스 오픈 ASR 리더보드에서 평균 WER 5.42%를 기록하며 기존 오픈소스 및 상용 모델을 제치고 정확도 1위를 차지했다. 이는 '위스퍼 라지(Whisper Large) v3' 등 주요 경쟁 모델 대비 낮은 오류율을 의미한다. 실제 환경에서 안정적인 성능을 보인다는 점도 주목된다. 다중 화자 환경이나 회의실 음향, 다양한 억양 조건에서도 높은 정확도를 유지했으며 인간 평가에서도 의미 보존과 오류 최소화 측면에서 우수한 결과를 나타냈다. 처리 속도 역시 주요 경쟁력으로 꼽힌다. 해당 모델은 실시간 처리 대비 속도를 나타내는 RTFx 지표에서 높은 처리량을 유지하면서도 낮은 오류율을 동시에 달성해 정확도와 효율성 간 균형을 개선했다. 코히어는 이번 모델을 오픈소스로 공개하면서 기업들이 자체 인프라 환경에서 직접 운영할 수 있도록 했다. 동시에 API와 관리형 플랫폼(Model Vault)을 통해 클라우드 기반 서비스도 제공한다는 방침이다. 최근 음성 데이터는 회의 기록, 고객 상담, 실시간 에이전트 등 다양한 분야에서 핵심 입력 수단으로 부상하고 있다. 업계에선 이번 모델 출시가 기업용 음성 AI 시장 경쟁을 한층 가속화하는 계기가 될 것으로 보고 있다. AI 투자사 래디컬 벤처스 페이지 디키 부사장은 "코히어가 트랜스크라이브를 통해 구축한 기술에 깊은 인상을 받았다"며 "수 분 분량의 오디오를 몇 초 만에 활용 가능한 텍스트로 변환하는 속도는 매우 우수하고 실시간 제품과 워크플로에서 새로운 가능성을 열어준다"고 밝혔다. 이어 "테스트 과정에서도 일상적인 음성을 매우 잘 처리한 데다 강력하고 신뢰할 수 있는 전사 품질을 보여줬다"며 "코히어와의 협력을 통해 이 기술로 무엇을 더 만들어낼 수 있을지 기대된다"고 덧붙였다.

2026.03.27 16:18장유미 기자

KISA, 전자고지 음성으로 제공…디지털 취약계층 접근성 제고

한국인터넷진흥원(KISA)이 어르신, 시각장애인 등 디지털 취약 계층을 위해 전자고지 내용을 음성으로 제공하는 서비스를 시행한다. KISA는 수원특례시와 함께 '모바일 음성 전자고지' 서비스 확산에 나선다고 26일 밝혔다. '모바일 음성 전자고지'는 전자고지 내용을 음성으로 제공해 어르신, 시각장애인 등 디지털 취약계층의 정보 접근성을 높이는 서비스다. 기존 모바일 전자고지는 비용 절감과 행정 효율화, 환경 보호 등 이점을 바탕으로 종이 우편을 빠르게 대체해 왔지만, 복잡한 표와 고유 문서 구조로 인해 디지털 취약계층이 스마트폰 기본 화면 읽기 기능(TTS)만으로 전자고지 내용을 정확히 파악하기 어렵다는 한계가 있었다. 이에 한국인터넷진흥원은 디지털 취약계층의 전자고지 이용 환경을 개선하기 위해, 지난해 12월부터 수원시와 모바일 음성 전자고지 서비스 적용을 위한 실무 협의를 이어왔다. 특히 양 기관은 ▲부과 내역 ▲납부 금액 ▲납부 기한 등 수신자가 반드시 확인해야 할 핵심 정보를 선별해 전달하는 '핵심 정보 요약'서비스를 개발했다. 지난 2월에는 경기도시각장애인연합회와 함께 시연회를 개최하고, 실제 이용자의 현장 의견을 반영해 서비스의 실효성과 완성도를 높였다. 수원시는 이달 중 체납 안내문을 대상으로 모바일 음성 전자고지를 시범 발송하고, 향후 정기분 지방세 납부 안내문 등으로 적용 범위를 단계적으로 확대해 나갈 예정이다. 한국인터넷진흥원은 이번 수원시와의 협력을 시작으로 디지털 약자를 포용하는 표준화된 음성 전자고지 모델을 확립해 나갈 계획이다. 이를 바탕으로 모바일 음성 전자고지 서비스를 전국 지자체 및 공공·민간 분야로 확대해 나갈 방침이다. 한국인터넷진흥원 이상중 원장은 “이번 협력은 디지털 전환의 혜택을 모든 국민이 고르게 누릴 수 있는 환경을 조성하기 위해 추진됐다”며 “앞으로도 국민 누구나 동등하고 편리하게 행정 정보를 안내받을 수 있도록 모바일 전자고지 제도를 고도화하고 전자문서 산업의 외연을 넓혀 나가겠다”고 말했다.

2026.03.27 01:04김기찬 기자

구글 미트·팀즈·줌 다 제쳤다…언어 전문가 96%, '딥엘 보이스' 선택

딥엘의 인공지능(AI) 음성 번역 솔루션이 번역 품질과 자막 안정성 두 영역에서 구글 미트·마이크로소프트(MS) 팀즈·줌의 내장 번역 기능을 모두 앞섰다는 독립 연구 결과가 나왔다. 26일 슬레이터가 딥엘 의뢰로 수행한 독립 벤치마크 연구에 따르면 한↔영을 포함한 14개 언어 조합 블라인드 테스트에서 '딥엘 보이스 포 줌(DeepL Voice for Zoom)'은 번역 품질 96.4점, '딥엘 보이스 포 팀즈(DeepL Voice for Teams)'는 96.3점을 기록했다. 반면 타 플랫폼 평균은 87~89점이었다. 주요 번역 오류 발생률은 타 플랫폼 대비 평균 76% 낮았으며 번역 합격률은 79%로 타 플랫폼 평균 42%를 크게 웃돌았다. 블라인드 평가에 참여한 언어 전문가 96%가 딥엘 보이스를 1순위로 선택했다. 자막 안정성에서도 딥엘 보이스가 앞섰다. 딥엘 보이스 포 줌은 자막 안정성 88.6점, 딥엘 보이스 포 팀즈는 85.8점을 기록했으며, 자막 변화 및 깜빡임 현상은 MS 팀즈 대비 평균 37.6%, 줌 대비 평균 54.7% 감소했다. 보고서는 자막이 빈번하게 수정될 경우 번역이 정확해도 실제 회의 활용성이 떨어진다고 지적했다. 슬레이터는 프레임 단위 분석으로 깜빡임·흔들림·수정 빈도까지 함께 측정했다. 이번 연구는 28명의 현직 언어 전문가를 통해 영어→한국어·일본어·스페인어·프랑스어·독일어·이탈리아어·포르투갈어, 7개국어→영어 등 14개 언어 조합을 블라인드 심사하는 방식으로 진행됐다. 슬레이터는 분석 방법과 결과에 대한 편집권을 전적으로 유지했다고 밝혔다. 딥엘은 이번 연구 결과를 바탕으로 다음 달 16일 글로벌 업데이트를 통해 딥엘 보이스의 주요 기능 개선 및 플랫폼 간 협업 기능 확장을 공개할 예정이다. 야렉 쿠틸로브스키 딥엘 창업자 겸 최고경영자(CEO)는 "현직 언어 전문가들이 하나의 솔루션을 압도적으로 선호한 것은 시장의 방향성을 보여주는 분명한 신호"라며 "딥엘 보이스가 번역 품질과 자막 안정성 영역에서 새로운 기준을 제시하고 있음을 입증했다"고 강조했다.

2026.03.26 18:38이나연 기자

직장인 90%가 원하는 음성 AI 번역…도입률 36%인 이유는

국내 직장인 10명 중 9명이 업무에 실시간 음성 인공지능(AI) 번역이 필요하다고 답했지만 실제 활용률은 3명 중 1명 수준으로 나타났다. 18일 딥엘이 국내 직장인 500명을 대상으로 실시한 음성 AI 번역 솔루션 활용 실태조사 결과에 따르면 응답자의 89.8%는 업무에 음성 AI 번역이 필요하다고 답했다. 반면 실제 사용 비율은 35.8%에 그쳤다. 82.6%는 향후 사용 의향이 있다고 밝혔다. 언어 장벽은 실시간 소통 상황에서 두드러졌다. 응답자의 69.8%가 외국어 소통 시 미묘한 감정이나 뉘앙스를 제대로 전달하지 못한 경험이 있다고 답했으며, 69%는 전달하고자 한 메시지를 충분히 설명하지 못한다고 응답했다. 적극적인 의견 표현의 어려움(64.0%), 상대방 의도 파악 실패(63.0%), 언어 문제로 인한 대화·회의 중단 경험(60.0%)도 뒤를 이었다. 음성 번역이 가장 필요한 상황은 화상 회의(48.4%), 업무 관련 전화 통화(43.6%), 대면 회의(34.4%) 순으로 꼽혔다. 직장인들이 음성 AI 번역 솔루션 선택 시 중요하게 보는 요건은 번역 정확도(58.8%), 지연 없는 실시간 번역(58.2%), 비즈니스 맥락과 전문성을 겸비한 번역(54.4%), 보안 및 안전성(52.2%) 순이었다. 도입 기대 효과로는 의사소통 정확도·이해도 향상(53.2%), 외국어 사용에 대한 심리적 부담 감소(52.0%), 실시간 커뮤니케이션 흐름 개선(50.2%)이 꼽혔다. 조직 차원의 기대도 높았다. 음성 AI 번역 도입 시 의사결정 속도가 빨라질 것이란 응답은 81.8%였다. 비영어권 직원의 의견 표현 기회 확대(81.2%), 외국어 능력보다 직무 전문성이 더 중요해질 것(80%)이란 전망도 나왔다. 곤살로 가이올라스 딥엘 최고제품책임자(CPO)는 "이번 조사를 통해 한국 직장인들이 언어 AI 기술에 높은 관심과 수용도를 보이고 있음을 확인했다"며 "기업이 요구하는 속도와 정확성, 자연스러운 대화 흐름, 엔터프라이즈급 보안을 갖춘 딥엘 보이스가 국내 기업과 글로벌 시장 사이의 언어 장벽을 낮추는 데 기여하길 기대한다"고 말했다.

2026.03.18 16:42이나연 기자

"AI 실수하면 보상"…일레븐랩스, 에이전트용 보험 운영

일레븐랩스가 기업 인공지능(AI) 도입 리스크를 관리하기 위한 제도 시스템을 공개했다. 일레븐랩스는 AI 리스크 평가 기관 AIUC 손잡고 AI 음성 에이전트 전용 종합 보험 제도를 운영한다고 18일 밝혔다. 이 보험은 고객지원과 영업 현장에서 활용되는 '일레븐에이전트' 오류로 발생한 손해를 보장할 수 있다. 이번 제도 핵심은 AI 에이전트 행위를 인간 업무 실수와 동일하게 취급한다는 점이다. 기업은 AI가 잘못된 정보를 제공하거나 부적절한 응대를 했을 경우에도 보험을 통해 손실을 보상받을 수 있다. 일레븐랩스 AI 에이전트는 AIUC가 개발한 AIUC-1 보안 신뢰성 인증을 받았다. 이 인증은 환각, 프롬프트 인젝션, 데이터 유출, 편향성 등 실제 위험 시나리오 기반으로 5000건 넘는 적대적 테스트를 통과해야 부여된다. 해당 인증을 받은 AI는 법무와 컴플라이언스 기준에서 배포 가능한 수준으로 평가된다. 일레븐랩스 기술은 현재 포춘 500 기업의 75% 이상이 사용하는 것으로 알려졌다. 보험 적용을 위해서는 개별 감사와 인증 절차를 반드시 거쳐야 한다. 인증 유효기간은 12개월이다. 최소 3개월마다 기술 검증을 수행해야 한다. 보험료는 인증 비용과 별도로 에이전트 유형에 따라 책정된다. 일레븐랩스는 이번 제도가 AI 도입 벽으로 지목된 책임 문제를 해소하는 데 초점을 맞췄다고 밝혔다. 환각으로 인한 잘못된 안내나 부적절한 발언에 따른 법적·경제적 리스크를 관리할 수 있는 수단을 제시했다. 마티 스타니셰프스키 일레븐랩스 최고경영자(CEO) 겸 공동창업자는 "이번 인증은 보안 프레임워크와 AI 보험 보장을 제공한다"며 "기업이 리스크를 최소화하고 고객 경험 구축에 집중할 수 있도록 돕는다"고 밝혔다.

2026.03.18 11:18김미정 기자

"내 기분까지 맞히네?"…오픈AI, 말 끊고 감정 읽는 새 모델 개발 중

오픈AI가 음성을 직접 이해하고 응답하는 차세대 오디오 인공지능(AI) 모델을 개발 중인 것으로 전해졌다. 이를 통해 음성 기반 AI 비서의 응답 속도와 자연스러운 대화 능력을 크게 개선한다는 목표다. 6일 디인포메이션에 따르면 오픈AI는 최근 음성 입력과 출력을 동시에 처리하는 '양방향(bidirectional) 오디오 모델'을 개발 중인 것으로 알려졌다. 이 모델은 사용자의 음성을 실시간으로 이해하고 음성으로 바로 응답하는 구조를 갖춘 것이 특징이다. 기존 음성 비서 시스템은 일반적으로 음성을 텍스트로 변환하는 음성인식(STT), 텍스트 기반 언어모델 처리, 텍스트를 다시 음성으로 변환하는 음성합성(TTS) 과정을 거친다. 이른바 '계층형(cascaded)' 구조로, 여러 단계를 거치는 과정에서 처리 지연이 발생하거나 대화 흐름이 자연스럽지 못하다는 한계가 지적돼 왔다. 반면 오픈AI가 개발 중인 모델은 음성 데이터를 입력 단계에서부터 직접 이해하고 음성으로 응답하는 '네이티브 오디오' 구조를 채택한 것으로 알려졌다. 이러한 방식은 중간 변환 단계를 줄여 보다 빠르고 자연스러운 음성 대화를 구현하는 것을 목표로 한다. 특히 해당 모델은 사용자의 발화 맥락을 실시간으로 파악해 대화 흐름에 맞춰 자연스럽게 반응하는 능력을 강화하는 데 초점을 맞추고 있는 것으로 전해졌다. 음성에 담긴 억양이나 말투, 감정 표현 등을 보다 정교하게 분석해 상황에 맞는 응답을 제공할 가능성도 제기된다. 오픈AI는 최근 음성 인터페이스를 핵심 AI 플랫폼으로 확대하는 전략을 추진하고 있다. 스마트폰과 차량, 고객 서비스 등 다양한 환경에서 실시간 음성 대화가 가능한 AI 비서를 구현하는 것이 목표다. 업계에선 음성 중심 인터페이스가 차세대 컴퓨팅 환경에서 중요한 역할을 할 것으로 보고 있다. 최근 구글은 AI 모델 제미나이에 실시간 음성 대화 기능을 결합한 '제미나이 라이브'를 선보이며 서비스를 확대하고 있다. 메타 역시 라마 계열 모델을 기반으로 음성 인터페이스 연구를 강화하고 있다. 오픈AI의 이번 기술 개발은 이러한 음성 AI 경쟁 속에서 차세대 인터페이스 주도권을 확보하기 위한 전략으로 해석된다. 업계 관계자는 "음성을 직접 처리하는 AI 모델이 상용화되면 인간과 AI 간 상호작용 방식이 크게 변화할 것"이라며 "실시간 음성 대화가 가능한 AI 비서가 새로운 플랫폼 경쟁의 핵심이 될 가능성이 크다"고 말했다.

2026.03.06 16:23장유미 기자

일레븐랩스·위츠, 성우 AI 음성 개발…"정식 라이선싱 시장 개척"

일레븐랩스가 성우 목소리를 정식 계약 기반의 인공지능(AI) 음성으로 구현하며 음성 지식재산권(IP) 시장 선점에 나섰다. 일레븐랩스는 위츠와 함께 성우 배한성씨 음성을 AI로 학습하고 활용하는 개념검증(PoC)을 진행한다고 24일 밝혔다. 양사는 이번 협업을 통해 유명인 음성의 합법적 라이선싱 체계를 구축하고 광고·콘텐츠·교육·음성 서비스 등 다양한 분야로의 확장 가능성을 확인할 계획이다. 일레븐랩스는 인간과 거의 구분되지 않는 수준의 AI 음성합성(TTS) 모델 개발로 사업을 시작했다. 음성 기술을 넘어 음성인식(STT), 사운드 이펙트, 더빙, 음악, 대화형 AI 전반에 걸친 최첨단 연구를 확장해 기업과 개발자를 위한 상용화 플랫폼을 제공하고 있다. 위츠는 브랜드 및 퍼블리시티권 라이선싱을 전문으로 하는 스타트업이다. 최근 유명인의 음성을 활용한 AI 기반 라이선싱 사업을 추진하고 있다. 박진익·김정민 위츠 공동대표는 "우리의 IP 라이선싱 역량과 글로벌 AI 음성 기술을 결합해 유명인 목소리를 다양한 산업에서 활용할 가능성을 검증하는 단계"라며 "유명인 음성 IP의 접근성을 높이고 새로운 음성 라이선싱 시장을 개척하겠다"고 밝혔다. 홍상원 일레븐랩스 한국지사장은 "우리 기술이 실제 현장에서 원활하게 구현된다는 것을 보여줄 기회"라며 "음성합성뿐 아니라 음성인식 등 최첨단 핵심 AI 기술을 기업들이 업무 현장에 활용할 수 있도록 적극 지원하겠다"고 말했다.

2026.02.24 10:42이나연 기자

풀무원 공장이 일정한 품질과 맛 내는 법

보통 공장에서 만든 음식이라고 하면 건강에 좋지 않은 첨가물이 과도하게 들어있거나, 위생적이지 않다는 생각을 하기 쉽다. 하지만 풀무원 공장은 집에서 만드는 재료를 거의 그대로 사용하면서도, 이를 가공하고 포장하는 단계에서 위생에 많은 노력을 기울인다. 첨가물도 정해진 기준에 따라 사용한다. 나아가 일정한 맛과 품질을 유지하기 위해 시스템적으로 변수를 통제하고, 사람이 중간·최종 확인하는 절차를 따른다. 지난 21일 기자는 충북 음성에 있는 풀무원의 생면공장과 두부공장을 방문했다. 공장 곳곳을 둘러본 뒤 인터뷰 자리에서 만난 이재경·강주연 파트장으로부터 공산식품에 대한 오해와 진실, 그리고 풀무원 제품들이 일정한 맛과 품질을 유지하는 비결에 대해 들었다. 먼저 생면공장을 담당하는 이 파트장은 "공장에서 만든 면을 인스턴트로 보는 시선이 많다"면서 “(풀무원은) 맛도 중요하지만 건강을 지향하는 기업인 만큼 나트륨 저감 같은 부분에도 초점을 두고 있다”고 설명했다. 또 이 파트장에 따르면 생면공장에서 중요한 포인트는 품질 좋은 재료는 기본, 같은 맛을 매일 내기 위한 변수 관리였다. 이 파트장은 “유통용이나 식당 납품용은 결국 면의 품질을 일정하게 내는 게 숙제”라며 “배합비를 설정할 때 원료 자체도 중요하지만, 수분과 염분 같은 농도 수준도 식감에 큰 영향을 준다”고 밝혔다. 이 같은 면의 식감과 탄력은 공정에서 갈린다. 그는 “글루텐 배열을 90도로 꺾어가며 계속 눌러 조직을 치밀하게 만드는 공법을 사용한다”면서 “이 공법이 면의 조직감에 가장 크게 영향을 준다”고 덧붙였다. 다만 공법만으로 늘 같은 면이 자동으로 나오진 않는다. 계절에 따라 작업장 온도와 습도가 달라지면 같은 배합이라도 수분 흡수와 반죽 상태가 흔들릴 수 있어서다. 이 파트장은 “날씨나 습도에 따라 결과물이 달라질 수 있어 현장에선 조건을 보면서 가수량을 조정해 품질을 맞춘다”고 말했다. 두부 역시 크게 다르지 않다. 콩을 세척하고 불린 뒤 두부를 만들어 포장하기까지는 약 48시간이 걸린다. 풀무원은 콩을 전통 맷돌 방식으로 갈고, 가마솥 방식으로 두유를 데워 제품의 식감을 조절한다. 두부공장을 담당하는 강주연 파트장은 “같은 공정이라도 온도나 습도 같은 변수에 따라 결과물 편차가 커질 수 있다”면서 “재료를 담그는 공간의 온도를 연중 일정하게 관리하고, 콩을 불리는 물 온도도 16~18도 수준으로 유지한다”고 설명했다. 두부 가공의 경우 집에서 만드는 방식과 비슷해 보여도, 공장 시스템이 변수를 먼저 통제해 품질을 맞춘다는 점에서 차이가 있다는 뜻이었다. 두부에 관한 소비자 불만도 이런 변수 탓에 발생한다. 강 파트장은 “특히 6~9월에 매년 늘어나는 불만이 있다”며 “가스가 팽창해 포장재가 부풀었거나 두부가 끈적하게 변했다는 문의가 대표적”이라고 밝혔다. 그는 “두부 용기는 구조상 보냉 성능이 크지 않아 외부 온도에 취약하다”면서 “구간별 온도 관리가 흔들리면 제조 단계에서 문제가 없더라도 변질이 빨리 일어날 수 있어 냉장 온도 관리가 지켜지도록 지속적으로 안내하고 점검한다”고 했다. 강 파트장은 “자동화 설비로 공정의 안정성과 일관성을 확보하지만, 이상 징후가 보이면 현장 오퍼레이터가 바로 개입해 점검해야 한다”고 밝혔다. 응고제가 투입된 직후 두부 상태를 확인해 물성이나 탄력감이 평소와 다르면 곧바로 조정하기도 한다고. 풀무원은 집에서 만드는 방식과 크게 달라 보이지 않아도, 상품의 질이 흔들리지 않는 데 초점을 맞추고 기계적인 시스템과 사람이 협업하는 구조를 갖추고 있다. 수분과 온도, 습도 같은 변수는 수치(데이터)로 잡고, 품질과 완성도는 사람의 확인과 개입으로 끌어올리는 방식이다. 이재경·강주연 파트장에 따르면, 풀무원은 보다 효율적이면서도 완성도 높은 제품을 생산하기 위해 향후 1~2년 내 현장 설비뿐 아니라 검사 공정까지 자동화하는 방향의 AI 기술 도입을 검토 중이다. 공정 전반의 변수를 더 세밀하게 관리해 품질 편차를 줄이겠다는 전략인데, 풀무원 역시 디지털 전환 시대에 맞는 공장 효율화가 본격화 될 것으로 기대된다.

2026.01.27 18:16류승현 기자

목소리 하나로 15조원…일레븐랩스, 英 역대 최대 AI 스타트업 등극하나

일레븐랩스(ElevenLabs)가 기업가치를 110억 달러(약 15조7천억원) 수준으로 끌어올리는 대규모 투자 유치에 나섰다. 17일(현지시간) 파이낸셜타임스(FT) 등 외신에 따르면 일레븐랩스는 최근 투자자들과 신규 펀딩 협의에 들어갔다. 이번 펀딩이 성사되면 지난해 9월경 66억 달러였던 기업가치가 불과 4개월 만에 2배 가까이 뛰게 된다. 다만 논의는 초기 단계로 조건이 변경될 수 있다고 소식통들은 전했다. 일레븐랩스는 지난 2022년 폴란드 출신 마티 스타니셰프스키와 피오트르 담코프스키가 런던에서 공동 창업한 AI 음성 생성 기업이다. 고객 서비스, 텍스트 음성 변환, 다국어 더빙 등 다양한 분야에서 사용된다. 작년 연간 반복 매출(ARR)은 3억 3천만 달러에 달했다. 세쿼이아 캐피탈, 안드레센 호로위츠 등이 투자한 일레븐랩스는 런던과 뉴욕에 본사를 두고 바르샤바, 벵갈루루, 도쿄 등에 오피스를 운영 중이다. 미국 벤처캐피털 자금 접근성을 높이기 위해 미국에도 법인을 설립했다. 일레븐랩스는 지난해 1월 33억 달러 밸류에이션으로 1억 8천만 달러를 조달했고, 9월엔 직원 주식 매각을 통해 66억 달러로 밸류에이션을 끌어올렸다. 당시 ARR은 2억 달러 수준이었다. 이번 펀딩이 완료되면 일레븐랩스는 영국 최대 가치 AI 스타트업으로 올라서게 된다. 현재 영국 자율주행 기업 웨이브가 80억 달러, 엔비디아가 투자한 클라우드 기업 엔스케일이 30억 달러 밸류에이션을 기록 중이다. 유럽 전체로는 프랑스 미스트랄(120억 달러)에 육박하는 규모다. FT는 "AI 스타트업에 대한 투자자들의 관심이 전 세계적으로 급증하고 있지만, 유럽 AI 기업들은 펀딩과 상용화 측면에서 미국 기업들에 크게 뒤처져 있다"고 분석했다.

2026.01.19 17:07이나연 기자

"큰 모델보다 쓰임새"…네이버클라우드, 옴니모달 AI 전략 승부수

네이버클라우드가 범용 대규모언어모델(LLM) 경쟁을 넘어 텍스트·이미지·음성·도구 활용을 하나의 모델로 통합하는 '옴니모달 인공지능(AI)' 전략을 전면에 내세웠다. 상대적으로 작은 모델부터 시작해 점진적으로 고도화하는 방식으로, 현실 환경을 이해하고 행동하는 AI 에이전트 구현을 목표로 차세대 파운데이션 모델 경쟁에서 기술적 차별화를 강조했다. 네이버클라우드는 30일 과학기술정보통신부와 정보통신산업진흥원(NIPA)이 서울 코엑스에서 개최한 '독자 AI 파운데이션 모델 1차 대국민 발표회'에서 옴니모달 기반 파운데이션 모델과 이를 적용한 다양한 AI 서비스를 공개했다. 이날 네이버클라우드는 옴니 파운데이션 모델 전략을 제시했다. 전시 부스에서는 텍스트·이미지·오디오 등 서로 다른 형태의 데이터를 단일 모델에서 처음부터 함께 학습하는 네이티브 옴니모달 구조의 '하이퍼클로바X 시드 8B 옴니'와 복합 추론 능력을 강화한 '하이퍼클로바X 시드 32B 씽크' 두 가지 모델을 공개했다. 8B급 옴니모델은 규모는 비교적 작지만 멀티모달 입력을 단일 모델 구조에서 처리할 수 있도록 설계된 것이 특징이다. 텍스트·이미지·음성을 각각 다른 모델로 처리해 결합하는 기존 방식과 달리, 처음부터 하나의 의미 공간에서 학습해 응답 속도와 효율성을 높였다. 네이버클라우드는 이 모델을 시작점으로 삼아 데이터 확장과 학습 고도화를 통해 단계적으로 스케일업할 계획이다. 함께 공개된 32B급 씽크 모델은 옴니모달 입력을 바탕으로 추론과 문제 해결에 초점을 맞췄다. 이미지 이해, 음성 대화, 도구 활용 능력을 결합해 복합적인 요청을 처리하는 에이전트형 AI 경험을 구현하며 수학 문제 풀이나 시각 정보 기반 추론 등 고난도 작업을 수행하는 시연이 이뤄졌다. 부스에서는 이들 모델을 적용한 다양한 체험형 서비스도 공개됐다. 이미지 촬영만으로 문제를 이해하고 풀이 과정을 설명하는 AI 수학 에이전트, 민원 행정 상담을 돕는 AI 아바타, 법률 상담 챗봇, 감정 상담을 지원하는 마음 케어 아바타 등 공공·생활 밀착형 서비스가 관람객의 이목을 끌었다. 네이버클라우드는 이번 독자 AI 파운데이션 모델 프로젝트를 통해 대규모 파라미터 경쟁보다는 작은 모델을 촘촘하게 다져 키운다는 전략이다. 실제 서비스 환경에서 비용과 개발 부담을 줄이기 위해 8B·32B급 모델에서 옴니모달 구조와 추론 성능을 충분히 검증한 뒤 단계적으로 모델 규모를 확대하겠다는 구상이다. 이를 바탕으로 산업 및 공공 영역으로의 확장도 염두에 두고 있다. 네이버클라우드는 농기계와 모빌리티 등 다양한 산업 현장에서 음성·시각·공간 정보를 동시에 이해하는 AI 에이전트 활용 가능성을 제시하며 물리적 환경과 상호작용하는 피지컬 AI로의 진화를 준비 중이라고 설명했다. 네이버클라우드 관계자는 "옴니모달 AI는 단순히 모델을 크게 만드는 문제가 아니라, 현실 세계의 맥락을 얼마나 정교하게 이해하느냐가 핵심"이라며 "8B급 모델부터 차근차근 고도화해 나가며 산업과 일상에서 실제로 쓰이는 옴니 AI 에이전트를 구현해 나가겠다"고 말했다.

2025.12.30 14:40한정호 기자

"갤럭시S26, 퍼플렉시티로 빅스비 개편한다"

삼성전자가 내년 초 출시할 예정인 갤럭시S26 시리즈와 함께 음성 비서 '빅스비'를 대대적으로 개편할 것이라는 소식이 나왔다. 샘모바일 등 외신은 24일(현지시간) IT 팁스터 @chunvn8888를 인용해 삼성전자가 빅스비에 퍼플렉시티 기능을 통합할 계획이라고 보도했다. 이는 애플이 시리에 챗GPT를 연동하는 방식과 유사하며, 기본적인 작업은 빅스비가 스스로 처리하고 복잡한 작업은 퍼플렉시티가 담당하게 하는 구조가 될 것으로 전망된다. 앞서 삼성전자가 퍼플렉시티와의 파트너십을 검토하고 있다는 보도와 함께, 퍼플렉시티 지분 인수에 관심이 있다는 소식도 전해진 바 있다. 실제로 삼성은 TV용 빅스비에서 퍼플렉시티와 마이크로소프트의 LLM(대규모 언어 모델)을 활용한 인공지능(AI) 기능을 이미 제공하고 있다. 샘모바일은 이 같은 흐름을 근거로 향후 퍼플렉시티가 향후 삼성 기기에서 더 큰 역할을 할 것으로 전망된다고 내다봤다. 다만, 삼성전자가 현재의 구글 제미나이를 퍼플렉시티로 완전히 대체할 가능성은 낮다고 덧붙였다.

2025.11.25 13:19이정현 미디어연구소

일레븐랩스 "韓, 아시아 음성 AI 허브…K-콘텐츠 글로벌화 지원"

"한국은 아시아 음성 인공지능(AI)의 핵심 거점이 될 나라입니다. 디지털 환경이 세계 최고 수준이고, 새로운 기술을 빠르게 받아들이기 때문입니다. 여기에 K-콘텐츠의 글로벌 인기까지 더해져 음성 AI 산업에 최적화된 시장입니다.” 홍상원 일레븐랩스 한국지사장은 21일 서울 JW메리어트호텔에서 열린 한국 시장 진출 간담회에서 이같이 말했다. 일레븐랩스는 이날 한국 시장을 위한 전담 운영 체제를 가동한다고 발표했다. 우선 국내 파트너사와 협력을 확대하고, 한국어 모델을 고도화한다고 밝혔다. 이를 통해 실제 현장에서 기술을 시험 적용하는 개념검증(PoC) 프로젝트를 늘리겠다는 계획이다. 홍 지사장은 일레븐랩스가 한국 시장을 주목한 이유로 세계 최고 수준의 디지털 환경을 꼽았다. 그는 "모바일 인터넷 보급률 99.98%, 세계 1위 5G 인프라, 광케이블 보급률 89%는 대규모 음성 트래픽을 처리하기에 최적의 조건"이라고 강조했다. 홍 지사장은 한국이 이미 높은 수준의 AI 활용도를 보이고 있다는 점도 강조했다. 그는 "대기업의 65.1%가 AI를 도입했고, 근로자의 63.5%가 생성형 AI를 일상적으로 사용하고 있다"며 "이는 글로벌 평균의 두 배가 넘는 수치"라고 설명했다. 이어 "정부가 내년 AI 분야에 10조1천억 원을 투입하며 'AI 3대 강국' 도약을 선언한 점 역시 한국 시장의 전략적 가치를 더욱 높였다"고 덧붙였다. 'K-콘텐츠 글로벌화'·'CX 개선' 우선 집중 일레븐랩스는 한국에서 가장 먼저 집중할 분야로 'K-콘텐츠의 글로벌화'를 꼽았다. 한국 콘텐츠가 세계적으로 인기를 얻고 있지만, 언어 장벽은 여전히 존재한다는 판단에서다. 일레븐랩스는 최신 음성 합성 모델 '일레븐 v3'를 통해 70개 이상 언어를 지원하고 있다. 원작 속 등장인물 감정과 말투, 숨소리까지 재현하는 고정밀 더빙 기술을 제공한다. 그는 "우리 솔루션은 단순 번역이 아니라 웃음, 한숨, 감탄사 같은 미세한 감정까지 그대로 전달한다"고 설명했다. 홍 지사장은 이 기술이 제작 속도와 비용에서 큰 변화를 가져왔다고 밝혔다. 그는 "일부 K-드라마 제작사는 10개 언어 더빙 시간이 2주에서 3일로 줄었다"며 "제작 비용은 최대 95%, 작업 시간은 90% 절감됐다"고 사례를 공유했다. 실제 일레븐 v3는 국내에서 이미 시범 적용되고 있다. MBC 콘텐츠앤인베스트먼트(C&I)를 비롯한 SBS, 크래프톤, 이스트소프트 등이 베타 파트너로 참여했으며, AI 영화제 수상작과 대형 현지화 프로젝트에도 적용된 바 있다. 일레븐랩스는 또 다른 핵심 영역으로 고객 경험(CX) 개선을 꼽았다. 음성 AI 처리 구조를 최적화해 0.5초 내 응답 속도를 구현할 수 있다는 이유에서다. 이를 기반으로 24시간 다국어 상담 가능한 음성 에이전트를 제공하고 있다. 이를 통해 반복 질문의 약 70%를 AI로 대체했다. 홍 지사장은 "한국은 혁신을 가장 빠르게 수용하는 시장이자, 기준이 가장 까다로운 시장"이라며 "우리는 한국을 아시아 보이스 AI 허브로 키우는 데 집중할 것"이라고 포부를 밝혔다.

2025.11.21 15:13김미정 기자

일레븐랩스, 음성 AI로 한국 진출…"3년 내 IPO 목표"

"앞으로 자동차, 가전제품 등 모든 기기가 사람이 말하는 방식·감정을 완전히 이해할 것입니다. 우리는 한국을 포함한 전 세계 어디서든 실시간으로 번역·더빙 가능한 '보이스 인텔리전스 환경'을 구축할 것입니다." 마티 스타니셰프스키 일레븐랩스 공동 창업자 겸 최고경영자(CEO)는 21일 서울 JW메리어트호텔에서 기자간담회를 열고 한국 시장 진출 소식을 알리며 이같이 밝혔다. 일레븐랩스는 AI 음성 생성 기업이다. 음성 합성, 오디오 처리 등 인간과 유사한 상호작용을 구현하는 모델을 운영하고 있다. 텍스트-투-스피치(TTS), 스피치-투-텍스트(STT), AI 더빙, 보이스 클로닝, 사운드 효과, 음성 분리, 일레븐뮤직 등 여러 분야에서 기술력을 확장했다. 현재 글로벌 기준 월간 활성 사용자수 5천만명, 기업 가치 66억 달러를 보유하고 있다. 포춘 500대 기업 중 75%가 고객사로 참여하고 있으며, 국내에서는 이스트, 크래프톤, 네이버 등이 주요 고객사다. 이날 스타니셰프스키 CEO는 API 파운데이션을 비롯한 크리에이티브 플랫폼, 에이전트 플랫폼 등 3단 구조 서비스 모델을 제시했다. 이중 핵심 제품은 에이전트 플랫폼이다. 이 플랫폼은 0.5초 미만 응답 속도와 7천 개 이상의 보이스, 32개 언어를 지원한다. 고객관계관리(CRM)와 고객지원, 결제, 전화 시스템 등 다양한 엔터프라이즈 워크플로와 연결돼 전환율 향상과 매출 증가를 돕는다. 실시간 분석·평가·추적 기능도 갖췄다. 주요 보안·규제 기준을 충족하는 구조로 구축돼 엔터프라이즈급 안정성을 유지한다. 스타니셰프스키 CEO는 앞으로 AI 음성 분야는 더 확장할 것이라고 주장했다. 그는 "모든 디바이스가 인간 발화법까지 이해하는 보이스 인텔리전스가 될 것"이라며 "언어 장벽까지 완전히 없애 실시간 번역·더빙 환경을 구축할 것"이라고 내다봤다. 이어 "AI가 맥락 이해와 감정 반응까지 가능할 전망"이라며 "에이전트가 다양한 접점에서 일관된 상호작용을 제공하게될 것"이라고 덧붙였다. 스타니셰프스키 CEO는 기업공개(IPO)도 계획 중이라고 밝혔다. 그는 "그동안 5년 내 IPO를 목표로 세웠지만 서비스 성과가 예상보다 잘 나오고 있다"며 "현재 3년 내 IPO를 할 수 있을 것으로 보고 있다"고 내다봤다.

2025.11.21 12:08김미정 기자

수퍼톤, TTS 모델 '수퍼토닉' 오픈소스 공개..."클라우드 없어도 OK"

AI 음성 기업 수퍼톤이 클라우드나 값비싼 GPU 없이도 실시간으로 텍스트를 고품질의 음성으로 바꿔주는 AI 모델을 공개하고 개발 생태계 확장에 나선다. 수퍼톤은 지난 19일 온디바이스 기반의 TTS(Text-to-Speech) 모델 '수퍼토닉(Supertonic)'을 누구나 자유롭게 사용·수정·배포할 수 있는 오픈소스로 공개했다고 20일 밝혔다. 수퍼토닉은 일반 노트북이나 모바일 환경에서도 빠른 속도로 구동하는 모델이라는 게 가장 큰 특징이다. 사용자의 기기 자체에서 AI 연산 처리가 되는 온디바이스 모델이기 때문에 클라우드나 네트워크 연결 없이도 텍스트를 고품질의 음성으로 바꿔준다. 클라우드 서버로의 데이터 송수신도 없어서 이로 인한 지연 문제나 정보 유출 등의 우려가 적다. 또, 6천600만개 파라미터(매개변수)의 초경량 구조로 설계되었기 때문에 교육용의 초소형 컴퓨터는 물론, 고가의 GPU가 없는 일반 노트북이나 모바일 환경에서도 실시간 수준으로 음성을 생성할 수 있다. 수퍼톤 내부 벤치마크 결과, 일반 노트북 환경에서 수퍼토닉은 초당 약 2500자 이상의 텍스트를 음성으로 변환했다. 이는 글로벌 주요 TTS 모델이 초당 400자 내외의 음성을 생성하는 것과 비교해 압도적으로 빠른 속도다. 수퍼토닉의 소스코드는 개발자 협업 플랫폼인 '깃허브(GitHub)'에서, 모델의 학습 결과물인 체크포인트와 모델을 체험해볼 수 있는 데모 페이지는 AI 모델 공유 플랫폼인 '허깅페이스(Hugging Face)'에서 만나볼 수 있다. 개발자들의 편의를 위해 소스 코드는 파이썬, C++, 자바스크립트 등 8개 이상의 프로그래밍 언어로 지원된다. 수퍼톤은 '수퍼톤(Supertone) API'를 통해 '소나 스피치 2t(Sona Speech 2t)'도 연내 선보일 계획이다. 소나 스피치 2t는 수퍼토닉과 마찬가지로 온디바이스 TTS 모델이지만, API(application Programming Interface) 형태로 제공된다는 차이가 있다. API는 개발자들이 다른 서비스에서 제공하는 데이터나 기능을 가져와 자사 서비스에 내재화할 수 있는 일종의 디지털 연결고리다. 소나 스피치 2t는 영어, 한국어, 일본어, 스페인어, 포르투갈어에 대한 TTS가 가능한 형태로 서비스될 예정이다. 이교구 수퍼톤 대표는 “수퍼토닉 오픈소스 공개로 온디바이스 TTS 기술의 표준화와 경량화를 선도하고, 개발자 커뮤니티와의 협업을 확대할 계획”이라며 “인공지능 컨택센터(AICC), 음성 에이전트, 에듀테크나 이러닝 등 다양한 산업군에서의 음성 AI 기술 활용 범위를 넓혀갈 것”이라고 말했다.

2025.11.20 11:18안희정 기자

네이버, 日 플랫폼 '노트'에 20억엔 투자…지분 7.9% 획득

네이버는 일본 콘텐츠 플랫폼 노트에 20억 엔(약 189억원)을 투자하고 사업 제휴를 체결하는 등 전략적 파트너십을 맺었다고 5일 밝혔다. 노트는 누구나 자신의 아이디어와 경험을 ▲글 ▲이미지 ▲음성 ▲동영상 등 다양한 유형의 콘텐츠로 표현하고, 다른 이용자들과 공유할 수 있는 일본 오리지널 콘텐츠 플랫폼이다. 노트에는 2014년부터 ▲일상 글 ▲만화 ▲출판물 ▲기고 ▲전문 콘텐츠를 아우르는 누적 6천400만 건의 콘텐츠가 축적돼 있으며, 가입 이용자 수만 1천52만명에 달한다. 노트는 콘텐츠 유료 판매, 지식재산(IP)화 지원 등 다양한 수익 모델을 제공하고 있다. 네이버는 노트에 20억 엔을 투자해 지분 약 7.9%를 확보하며 2대 주주가 된다. 노트의 콘텐츠 생태계와 네이버의 UGC, 웹툰 등 서비스 노하우 및 기술력을 결합해 양사는 플랫폼 및 AI 기술 고도화를 위해 다방면으로 협력해 나갈 방침이다. 노트에 축적된 다양한 콘텐츠에 AI를 접목해 창작 도구와 콘텐츠 발굴 및 유통을 고도화하고 AI 검색, 버티컬 에이전트 등 신규 서비스 개발을 통해 이용자 경험 혁신에 나설 전망이다. 아울러, 양사는 각 플랫폼의 글로벌 경쟁력 강화를 위해 전략적 투자 기회를 함께 모색하고 콘텐츠의 크로스보더 유통, 유망 IP 기반 2차 창작화 등 다양한 지원 방안을 통해 글로벌 창작자 육성에도 적극적으로 나설 예정이다. 최수연 네이버 대표는 “노트는 일본의 다양한 장르와 약 1천만명 이용자의 개성이 담긴 다양한 콘텐츠가 모이는 플랫폼으로, 콘텐츠의 가치가 더욱 중요해지는 AI 시대에 자사와 함께 성장할 수 있는 파트너”라며 “양사의 플랫폼 역량과 콘텐츠의 시너지를 기반으로 기술 고도화 및 신규 서비스 발굴에 나서며 글로벌에서 경쟁력을 높여갈 것”이라고 말했다.

2025.11.05 16:34박서린 기자

코난테크놀로지, GS인증 1등급 획득…AI 음성 인식 기술력 입증

코난테크놀로지가 생성형 인공지능(AI) 공공시장에 이어 AI 음성인식 시장 확대에도 속도를 내며 기술력을 입증하고 나섰다. 코난테크놀로지는 지난 달 자체 음성인식 기술 '디칩스(D-Cheeps)'로 GS 인증 1등급을 획득했다고 4일 밝혔다. '디칩스'는 코난테크놀로지가 독자 개발한 STT(Speech-to-Text) 엔진의 상표명으로, 10만 시간 이상의 고품질 음성 데이터를 학습하고 중앙처리장치(CPU) 기반 다채널 환경에서도 실시간 인식이 가능한 것이 특징이다. 또 최신 거대언어모델(LLM) 아키텍처를 적용해 문자 인식률 95% 이상을 달성, 동종 업계 최고 수준의 음성인식 성능을 입증했다. 현재 코난테크놀로지의 음성인식기술(STT)·LLM·음성합성기술(TTS) 기반 자동번역 등 최신 생성형 음성 기술은 ▲회의록 자동작성 ▲음성 민원 응대 ▲통합 콜센터 시스템 등 다양한 분야로 확산되고 있다. 실제 국민건강보험공단의 스마트 회의실 구축사업에서는 회의 자동기록 업무를 지원하고 있다. 한국항공우주산업(KAI)에서는 항공기 설계업무 현장에서 음성 기반 AI 비서로 활용되고 있다. 또 경찰청 전기통신금융사기 대응센터 콜센터에서는 보이스피싱 피해 예방을 위해 '디칩스'와 '코난 챗봇'이 함께 도입됐고, 인천공항 세관 검사대에서는 AI 동시통역 시스템이 시범 적용됐다. 이 외에 지난 8월 열린 '에이펙 2025 코리아(APEC 2025 KOREA) 글로벌 디지털·AI 포럼'에서는 '코난 챗봇 플러스'와 '첨단 다국어 AI 회의 통역 시스템'을 출품해 생성형 AI 음성기술의 경쟁력을 국내외에 선보인 바 있다. 서영주 코난테크놀로지 음성그룹 상무는 "이번 GS인증 1등급 획득을 계기로 자사 음성기술이 공공기관에서도 안정적으로 활용될 수 있음이 입증됐다"묘 "(앞으로) 다양한 행정서비스 영역에서 생성형 AI 기반 음성인식 솔루션 제공에 더욱 속도를 낼 계획"이라고 밝혔다.

2025.11.04 16:41장유미 기자

개보위 "로봇청소기 실태점검·SK쉴더스 유출 조사 착수"

개인정보보호위원회(이하 개보위)가 로봇청소기에 부착된 카메라·마이크 등 영상·음성 장비로 인한 개인정보 유출 우려에 대응해 사전 실태점검에 착수했다. 또 최근 침해사고가 발생한 SK쉴더스에 대해서도 개인정보 유출 조사를 진행 중이다. 개보위는 24일 설명자료를 통해 삼성전자, LG전자, 로보락, 에코백스, 샤오미 등 주요 로봇청소기 브랜드 제품을 대상으로 사전 실태점검을 진행 중이라고 밝혔다. 우선 개인정보 처리방침 분석 등을 통해 기초 사실관계를 파악하고, 현장 실사와 사업자 대상 자료 제출 요구를 병행해 정밀 점검하고 있다. 아울러 해당 브랜드 제품을 직접 구매·확보해 기능을 검증하고 있다. 해외 제조사 제품은 개보위가 직접 구매했으며, 국내 제조사 제품은 개보위 내 타 부서가 이미 확보한 장비를 조사에 활용하고 있다고 설명했다. 개보위는 "디지털 증거물에 대한 감식 등을 담당한 포렌식 랩을 연내 구축·운영할 예정"이라며 "나아가 사물인터넷(IoT) 기반 가전, AI 에이전트 등 생활 속 개인정보 수집 기반의 신기술·신서비스에 대한 개인정보 침해 우려를 선제적으로 해소하기 위해 '신서비스·제품 기술분석센터'(가칭) 마련에 관계부처와 적극 협조해 나갈 계획"이라고 밝혔다. 한편 개보위는 해커에 의해 SK쉴더스 업무 자료가 유출돼 다크웹에 게시된 SK쉴더스를 대상으로 개인정보 유출조사에 착수했다. 그간 자료 요구 등을 통해 사실관계를 확인해 왔으며, 22일 오후 11시경 SK쉴더스가 개인정보 유출을 신고함에 따라 즉시 정식 조사로 전환했다. 개보위는 유출 경위·규모와 개인정보보호법 위반 여부를 면밀히 확인할 계획이다.

2025.10.24 17:38김기찬 기자

코레일, 고객센터 'AI 챗봇' 누적 이용 100만건 돌파

한국철도공사(코레일)는 지난 2월 도입한 인공지능(AI) 챗봇 누적 이용건수가 100만건을 돌파했다고 14일 밝혔다. 'AI 챗봇'은 챗봇과 대화하며 열차 승차권을 예약하고 맞춤형 상담도 받을 수 있는 서비스다. 모바일 앱 '코레일톡'에서 채팅으로 지원하는 'AI 채팅 챗봇'과 철도 고객센터로 전화하면 연결되는 '음성 AI 챗봇'이 있다. 지난 8월에는 AI 챗봇 이용 건수가 한 달 14만건, 하루 평균 약 4천500건을 기록했다. 챗봇을 이용하는 고객 비율은 45.1%로, 이용객 절반가량은 상담사 연결 대신 챗봇을 이용하는 셈이다. 코레일은 반복적인 단순 문의(열차시각 조회·예매 정보 확인·승차권 반환 등)에 대한 응답을 AI로 자동화해 신속하게 응대하고, 24시간 문의가 가능하다는 점이 인기 요인인 것으로 분석했다. 코레일은 AI 챗봇에 시나리오 기반 자동 답변생성·안내, 음성인식·합성, 자연어 처리 기능을 탑재해 신속성과 정확성을 높였다. 그 결과 채팅상담 응답률이 72%('24년 평균)에서 96%로 상승했다. 한편, 코레일은 지난 2월 세계 최초로 승차권 구매와 상담을 동시에 처리하는 장애인 전용 음성 AI 챗봇 서비스를 도입했다. 시각·지체 장애인인 철도회원이 코레일톡에 접속하면 음성챗봇으로 자동 연결된다. 차성열 코레일 여객사업본부장은 “AI 챗봇으로 빠르고 편리한 상담 서비스를 제공할 수 있게 됐다”며 “앞으로도 디지털 기술을 활용해 고객에게 편의를 제공할 수 있도록 개선해나가겠다”고 밝혔다.

2025.09.15 09:44주문정 기자

"차량 내 도청 막는다"…지슨 내년 상반기 '알파-V' 출시

융합 보안 전문 기업 지슨이 차량 내부에서의 대화·통화 등 음성 커뮤니케이션을 도청 및 유출 시도로부터 예방하는 보안 시스템을 내년 상반기 선보일 예정이다. 지슨은 내년 상반기에 차량용 커뮤니케이션 보안 시스템인 '알파-V(Alpha-V)'를 출시할 예정이라고 10일 밝혔다. 차량 내부는 이동 수단인 동시에 종종 집무실이 된다. 특히 사업가·법인 임원·유명 인사 등이 주로 탑승하는 대형·준대형 등의 차량에서는 이동 중 오가는 대화나 통화가 기업의 중요 정보, 민감한 내부 사안과 직결되는 경우가 많다. 문제는 차량 내부에 반입·은닉된 무선 송수신 장치나 녹음기를 통해 이러한 대화가 외부로 새어 나가거나, 동승자·운전기사 또는 내부자 등의 녹음 파일이 폭로 형태로 공개되는 사례가 반복적으로 보도되고 있는 만큼 이같은 도청·유출을 막기 위한 솔루션을 선보이겠다는 것이다. 알파-V는 차량 내부에 설치돼 무선주파수(RF)를 악용한 무선도청과 녹음기 등을 통한 대화 유출 시도를 막는 제품이다. 도청 의심이 인지되는 경우 실시간으로 즉각 대응도 가능하다. 특히 지슨이 자체 연구개발한 인공지능(AI) 기반의 음성 분석 기술이 적용되어 탑승자의 음성을 학습 및 분석해 도청 장치나 녹음기에 음성이 유입되는 것을 원천적으로 차단한다. 이는 차량 내부 공간을 물리적인 방음 시설처럼 분리를 하지 않고도 효과적으로 커뮤이케이션 보안을 수립할 수 있다는 장점이 있다. 차량용 도청 예방 장비 관련 시장도 활짝 열려 있다. 준대형·대형 세단, 대형 SUV 등 법인 임원·유명 인사·대형 승용차 이용이 잦은 차량군의 경우 국내 신규등록(출고·판매) 약 170만대 수준의 시장 가운데 약 14%를 차지하는 것으로 나타났다. 국내 자동차 등록 대수는 누적 기준 2600만대에 달한다. 지슨은 기업 임원·전문직·대외 활동이 잦은 차량 이용자를 중심으로 초기 수요가 형성될 것으로 예상하고 있다. 지슨은 내년 상반기 출시 이후 특정 대상 차량을 중심으로 단계적 보급 확대를 추진할 방침이다. 지슨은 도입 전략으로 주요 렌터카·카셰어링·금융사 등과의 파트너십을 기반으로 제품 렌탈 모델을 전개하고, 시범 도입 규모를 유효시장의 1%(약 2400대) 규모로 상정했다. 지슨은 무선보안 원천기술을 국내에서 유일하게 보유한 첨단 융합보안 기업으로, 중앙정부·공공기관·지자체·민간기업 및 해외 등 400여 곳에 상시형 도청 탐지 제품을 공급하고 있다. 앞으로 지슨은 올해 중으로 알파-V의 프로토타입을 개발하고, 성능 검증에 착수한다. 의무 인증 취득과 함께 양산 체계도 확정할 예정이다. 양산 초기에는 렌탈·리스 채널을 중심으로 구독형 체계로 보급하며 점유율을 지속적으로 견인할 예정이다. 지슨 관계자는 "차량 내 커뮤니케이션 보안은 더 이상 선택이 아니라 필수 요소"라며 "무선보안 원천기술을 바탕으로 24시간 상시형 탐지 하드웨어 모듈,그리고 핵심적인 인공지능(AI) 음성 분석 기술을 융합하여 차량 실내 보안의 업계 표준을 만들겠다"고 밝혔다.

2025.09.10 14:37김기찬 기자

네이버D2SF, 음성 AI 모델 평가 스타트업 '포도노스' 신규 투자

네이버D2SF는 음성 인공지능(AI) 모델 평가 솔루션을 개발한 스타트업 '포도노스'에 신규 투자했다고 10일 밝혔다. 이번 프리 시드 라운드는 미국의 세락 벤처스가 리드한 포도노스의 첫 기관 투자 유치로, 국내에서는 네이버 D2SF와 카이스트청년창업투자지주가 함께 참여했다. 포도노스가 집중하고 있는 음성 AI는 ▲음성 인식 및 합성 ▲고객 대응 ▲콘텐츠 산업 등에 빠르게 확산 중이고, AI 에이전트 인터페이스로서의 성장 가치도 높다고 회사 측은 평가했다. 또한 ▲단순 발음의 정확도뿐만 아니라 ▲억양 ▲감정 표현 ▲페르소나 ▲선호도 ▲노이즈 등 평가 요소가 다양다. 포도노스는 전 세계 15만명의 평가 인력과 자체 개발한 AI 자동화 솔루션을 활용해 고객의 요구를 고려한 음성 AI 모델 평가 결과를 12시간 내에 제공한다. 포도노스의 고객은 AI 밸류체인에서 AI 모델 개발 기업, AI를 활용해 서비스를 만드는 기업 모두를 아우른다. AI 모델 기업은 성능 입증 및 개선 도구로, AI를 활용하는 기업은 목적과 타겟에 최적화한 모델 탐색 및 모니터링 도구로 포도노스 솔루션을 활용 중이다. 실제로 포도노스는 리셈블 AI, 플레이 AI 등 글로벌 AI 스타트업들로부터 가치와 품질을 인정받고 있으며, 테크 전문 커뮤니티 및 미디어에서도 포도노스의 평가 결과를 인용하고 있다. 향후 포도노스는 헬스케어·금융·게임·광고 등 음성AI 수요가 다양한 분야 중심으로 고객사를 확장하고 다양한 모달리티로 평가 범위를 넓혀갈 계획이다. 양상환 네이버 D2SF 센터장은 “AI 모델이 쏟아지는 가운데 AI를 잘 활용하기 위한 AI, 즉 AI를 위한 AI의 중요성은 점차 커지고 있다”며 “포도노스는 음성 AI 성능을 정량적으로 평가 및 검증하는 희소한 팀으로 음성 AI의 성장과 함께 글로벌 시장에서 존재감을 확고히 다지는 한편 네이버와도 협업 시너지가 클 것”이라고 말했다.

2025.09.10 10:21박서린 기자

  Prev 1 2 Next  

지금 뜨는 기사

이시각 헤드라인

아르테미스 2호 국내 위성, 교신은 끝내 안돼…"추락 가능성"

"잠이 안 온다"…주주들 고성 이어진 한화솔루션 유증 설명회

[영상] "2~3년 내 AI 빅뱅 온다"…지금 우리가 대비해야 할 것은

"충전 없이 50년"…꿈의 배터리 개발, 어디까지 왔나

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.