"웃음부터 속삭임까지"…일레븐랩스, AI 음성 기술 업그레이드
일레븐랩스가 인공지능(AI) 음성 기능을 업그레이드해 활용 영역을 넓혔다. 일레븐랩스는 텍스트 음성 변환(TTS) 모델 '일레븐 v3 알파'를 출시했다고 11일 밝혔다. 일레븐 v3 알파는 감정의 미묘한 흐름을 비롯한 화자 간 전환, 음성 톤 중간 변화까지 정밀하게 재현할 수 있다는 평을 받고 있다. 속삭임이나 웃음, 숨소리 같은 지시도 실제 음성과 구별 어려울 만큼 자연스럽게 처리된다는 설명이다. 일레븐랩스는 이 모델이 텍스트에 세밀한 음성 태그를 삽입할수록 고품질 결과를 만들 수 있다고 밝혔다. 대사 중간에 분위기를 바꾸거나 아이러니한 말투를 연출하는 등 섬세한 감정 조절이 가능하며, 듣는 이에게 몰입감 높은 오디오 경험을 제공한다고 강조했다. 새 모델은 지원 언어도 기존 32개에서 70개 이상으로 늘어났다. 이를 통해 AI 음성 커버리지는 전 세계 인구 기준 60%에서 90%로 확장됐으며, 향후 지속적인 기능 업데이트가 예정됐다. 모델 대화형 기능도 강화됐다. 화자 간 끼어들기나 대화 흐름 유지, 다양한 감정 표현을 자연스럽게 구현할 수 있어 인터랙티브 미디어, 오디오북, 캐릭터 기반 콘텐츠 제작에 최적화됐다. 사용자는 텍스트에 속삭임, 군중 소리, 문 삐걱거리는 소리 같은 오디오 태그를 삽입하면 상황에 맞는 음향 효과도 생성할 수 있다. 스트리밍 버전과 공개 API는 추후 출시 예정이며, 현재 알파 버전은 누구나 웹사이트에서 체험할 수 있다. 일레븐랩스는 모델의 한국어 TTS 성능도 대폭 향상됐다고 강조했다. 단순 번역이 아닌 감정 전달에 집중해 사투리, 축구 중계 스타일 같은 특별한 요청도 반영할 수 있어서다. 이에 공공기관부터 크리에이터 콘텐츠까지 폭넓은 모델 활용을 기대하고 있다. 마티 스타니셰브스키 일레븐랩스 공동창업자 겸 최고경영자는 "일레븐 v3는 감정과 표현, 비언어적 지시까지 이해하고 제어할 수 있는 가장 표현력 뛰어난 TTS 모델"이라며 "속도, 감정, 스타일을 자유롭게 조정할 수 있어 콘텐츠 제작 방식의 패러다임 전환을 이끌 것"이라고 말했다.