• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
창간특집
인공지능
배터리
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'스피치X'통합검색 결과 입니다. (2건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

"한국어 좀 하네?"…제미나이·챗GPT 韓 공습에 삼성 '빅스비' 입지 좁아질까

구글이 대화형 인공지능(AI) '제미나이 라이브'의 한국어 서비스를 본격화하며 오픈AI AI 챗봇 '챗GPT'가 잠식한 국내 음성 AI 비서 시장에 도전장을 던졌다. 일상 생활에 AI를 침투시켜 구독을 통한 유료화를 자연스럽게 유도할 것으로 예상되는 가운데 네이버, 카카오 등 국내 기업들이 어떻게 반격에 나설 지 주목된다. 구글은 올해 8월 '메이드 바이 구글(Made by Google)' 행사에서 공개한 '제미나이 라이브'의 한국어 서비스를 시작한다고 20일 밝혔다. 제미나이 라이브는 이용자의 요구에 따라 실시간으로 대화하고 협력해 사용할 수 있는 혁신적인 대화형 AI 기술이다. 이번 한국어 지원을 통해 구글은 언어의 장벽을 낮추고 AI의 혜택을 더 많은 이들에게 제공하고자 한다. 제미나이 라이브는 안드로이드 및 iOS 기기에서 사용 가능하다. 하나의 기기에서 최대 두 가지 언어를 설정할 수 있다. 이용자는 구글 앱의 상단 프로필이나 이니셜을 선택한 후 설정 탭에서 구글 어시스턴트를 선택, 한국어(또는 지원가능한 언어)를 지정하는 방식으로 이용자가 원하는 언어를 추가할 수 있다. 구글은 단순한 번역을 넘어 한국어의 미묘한 의미 차이, 관용 표현, 존댓말 체계를 '제미나이 라이브'에 반영하기 위해 언어학자와 문화 전문가 등 한국어 원어민들과 협력했다. 또 10가지의 다양한 한국어 음성 옵션을 지원하고 오디오 품질을 최적화했다. 이를 통해 한국어 이용자들은 더욱 자연스럽고 직관적인 대화가 가능한 것은 물론 차원이 다른 맞춤형 AI 서비스를 경험할 수 있다. 앞서 오픈AI도 지난 9월 한국어를 비롯해 영어 외에 50개 언어의 사용을 개선한 챗GPT의 '어드밴스드 보이스 모델(음성 모드)'을 출시했다. 지난 5월 실시간 음성 대화 기능을 추가해 업그레이드한 '챗GPT-4o(포오)'의 음성 기능을 개선한 모델이다. 기존 '챗GPT-4o'는 한국어 대화가 가능하긴 했지만 마치 외국인이 말하는 것처럼 어색하다는 지적이 있었다. 이번에 업그레이드된 모델은 실제 한국인 수준으로 언어 능력을 끌어올렸다는 평가를 받고 있다. 특히 애교를 부리거나 표준어와 다른 억양의 사투리도 이해해 주목 받았다. 이처럼 미국 기업들이 국내 시장을 노리고 잇따라 한국어 서비스를 내놓으면서 국내 기업들도 대응책 마련에 골몰하고 있다. 현재 네이버는 하이퍼클로바X 기반의 '스피치X(가칭)'를 개발 중이고, 카카오 계열사인 디케이테크인은 AI 비서 '헤이카카오'에 거대언어모델(LLM) 탑재를 검토하고 있는 것으로 알려졌다. 삼성전자도 '챗GPT'처럼 구동될 수 있도록 AI 비서 '빅스비'에 LLM을 탑재할 예정으로, 내년 초 출시할 '갤럭시S25' 시리즈에 이를 적용할 방침이다. 업계 관계자는 "생성형 AI의 수익화 전략을 고민 중인 글로벌 빅테크들은 생활에 밀접하게 파고드는 음성 AI 비서를 통해 유료화의 저변을 확대할 수 있을 것으로 기대하고 있다"며 "음성 AI 비서 시장을 선점하고 개발에서 앞서 나가려는 분위기 속에 국내 기업들도 하루 빨리 대응에 나서야 할 것"이라고 말했다.

2024.12.20 10:47장유미

네이버 "스피치X 고도화 중...내년 2분기 공개"

네이버가 AI 기반 음성 합성 기술 '스피치X'를 내년 2분기에 일반 이용자들이 사용할 수 있도록 공개한다. 회사는 현재 스피치X의 정확성과 품질을 높이는 고도화 작업 중이다. 유강민 네이버클라우드 하이퍼스케일 AI 파운데이션 리서치팀 리더는 11일 서울 강남 코엑스에서 열린 '단24' 컨퍼런스에서 'HyperCLOVA X Audio: 자연스러운 음성 대화를 위한 기술' 발표를 진행하며 스피치X 개발 현황에 대해 설명했다. 스피치X는 실제 사람 목소리와 유사한 허상 인물의 목소리를 생성한다. 텍스트와 음성 모달리티가 결합돼 LLM이 직접 음성을 다룰 수 있다는 점에서 앞서 네이버가 공개한 클로바 스피커, 클로바 더빙 등과 차이가 있다. 다양한 음성 데이터를 학습해 언어의 구조 및 발음의 정확성을 개선한다. 언어적 뉘앙스, 감정적 표현 등 인간과 유사한 소통방식을 구현한다. 해당 기술은 우선적으로 쇼핑라이브, AI CALL, 치지직 등 네이버 내부 서비스로 공급된다. 이후 정확성과 품질을 향상한 후 내년 2분기 클로바X를 통해 보이스 엔진을 붙인 합성형태로 일반 이용자에게 제공될 예정이다. 스피치X는 개인화 음성 서비스, 실시간 음성 번역, 감정 표현 음성 합성, 대화형 AI 응답 등 다양한 분야에 적용될 전망이다. 이날 유 팀 리더는 스피치X로 가상의 축구 해설가의 목소리를 만든 합성 음성을 공개하며 "실제 사람 목소리와 구분이 안 될 정도로 매우 깔끔하게 합성이 되고 있는 것을 확인할 수 있다"고 강조했다. 개발에는 범죄나 개인정보 문제와 무관한 데이터를 수집해 활용한다. 유 팀 리더는 "각 데이터에 개인정보가 많이 들어 있거나 회사의 정책이 복잡하게 얽혀 있는 등 실제 쓸 수 있는 데이터는 많지 않다"며 "최대한 많은 이들의 음색을 고려하기 위해 범죄, 개인정보 이슈가 없는 데이터를 수집 중"이라고 했다. 유 팀 리더는 "음성 기술을 계속 다듬고 앞으로 실시간 인터랙션이 가능한 형태를 만들어갈 것"이라고 말했다.

2024.11.11 21:28조수민

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

폴더블 아이폰, 펀치홀 카메라 탑재 유력

배민·요기요, 먹통 뒤 정상화..."금요일 밤 비 내린 탓"

과학자들, 납으로 금 만들었다…'연금술사의 꿈' 실현되나

"북한 해커, 위장취업해 北 송금"…메일 1천개 적발

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현