• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
AI페스타
배터리
양자컴퓨팅
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'텍스트 변환'통합검색 결과 입니다. (2건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

'보이스톡' 변신은 무죄…녹음·요약까지 다 된다

카카오가 카카오톡(이하 카톡) 내에서 통화녹음부터 키워드 검색, 텍스트 변환까지 한 번에 가능하도록 보이스톡 기능을 업그레이드했다. 이은혜 카카오 보이스톡·페이스톡·보이스룸 담당은 23일 경기도 용인시 카카오AI캠퍼스에서 열린 '이프 카카오(if kakao)25'에서 “이제 통화녹음과 STT(speak to text), AI 요약, 내용 검색, 톡클라우드 저장까지 보이스톡 하나로 해결할 수 있다”며 이같이 말했다. 그간 통화녹음을 하려면 스마트폰 제조사와 통신사별로 차이가 있어 모든 이용자가 똑같은 기능을 사용하기는 어려웠다. 통화녹음을 위해 별도 앱을 설치하거나 유료 기능을 사용해야 하는 불편함도 있었다. 그러나 이번 기능 업데이트로 카톡을 이용하는 모든 이용자는 앱 추가 설치 없이 보이스톡의 통화녹음을 사용할 수 있게 됐다. 이번 업그레이드는 통화별로 간편 녹음이 가능하다는 점이 핵심이다. 발신하거나 통화 중에도 버튼 하나로 통화녹음이 가능하다. 또 언제든 통화녹음을 중단하고 재개할 수 있으며 한 통화당 최대 30분까지 녹음 가능하다. 또 녹음 기능을 카톡에서 바로 확인할 수 있다는 것도 장점이다. 통화가 종료되면 종료 화면에서 바로 녹음파일을 진입하거나, 통화를 종료한 상대방과의 채팅방에서 확인할 수 있는 방식이다. 채팅 탭에 새롭게 제공되는 최근 통화 목록에서도 통화 내용을 볼 수 있다. 특히, 최근 통화 목록에서는 검색 기능을 통해 원하는 키워드가 포함된 통화 내용도 즉시 찾는 것이 가능하다. 통화녹음이 끝나면 AI는 통화 내용을 곧바로 텍스트 파일로 변환해준다. 통화내용 상세 페이지에서 녹음파일을 재생할 수 있으며, 재생 중에는 통화 내용을 자동 스크롤하면서 강조한다. 통화 내용 받아쓰기는 카카오의 AI인 '카나나'의 기술이 활용됐다. 이 담당은 “카나나 모델은 한국어에 특화돼 있어 받아쓰기 정확성이 뛰어나고 겹치는 말 또한 놓치지 않고 받아쓰기 해서 보여준다”고 강조했다. 게다가 요약하기를 선택하면 대화 상태를 구분한 대화 내용 요약을 보여준다. 해당 메모는 복사해 채팅창에 공유하는 것도 가능하다. 돋보기 기능을 통해 궁금한 내용을 찾아볼 수 있다. 카카오는 보이스톡의 모든 과정을 암호화해서 처리, 데이터를 서버에 저장하지 않고 사용자의 디바이스에만 저장하며 보안 우려를 해결했다. 톡 클라우드와 보이스톡을 연결해 기기 분실 등에 따른 데이터 유실 우려도 줄였다. 단말기 변경 시에도 대화 내용을 복원할 수 있는 기능을 지원한다.

2025.09.23 17:46박서린

지코어, 엔비디아 파트너 네트워크 어워드 '산업 혁신기업 부문' 수상

퍼블릭 클라우드, 엣지 컴퓨팅 및 엣지 AI 전문기업 지코어는 '2024 EMEA(유럽·중동·아프리카) 엔비디아 파트너 네트워크 어워드'에서 엔비디아 GPU를 기반으로 한 획기적인 AI 음성-텍스트 변환 솔루션의 성공적인 출시로 '산업 혁신 부문'에서 높은 평가를 받았다고 25일 밝혔다. '엔비디아 파트너 네트워크 어워드'는 가속 컴퓨팅 및 AI 분야에서 변함없는 노력과 혁신 정신을 보여준 파트너의 탁월한 공로를 치하하기 위해 마련된 것으로, 이번에 지코어가 받은 '산업 혁신상'은 특정 산업 분야에서 혁신을 주도한 파트너에게 수여되는 상이다. 지코어는 앞서 AI를 사용해 영어 음성을 룩셈부르크어 텍스트로 변환하는 최초의 AI 음성-텍스트 번역 학습 모델을 선보였다. 이 모델을 사용하면 연극, 영화, 음악 등 다양한 매체에 녹음된 영어 음성 전체를 룩셈부르크어로된 텍스트로 즉시 번역이 가능하고, 이를 영화 자막 등에 활용할 수 있다. 지코어의 이번 음성-텍스트 변환 모델은, 2억 4천400만개의 가중치를 포함하는 오픈 소스 위스퍼(Whisper) 모델의 축소 버전인 '위스퍼스몰(Whisper Small)을 기반으로 구축됐다. 컴퓨팅 학습 리소스에 대한 엄청난 수요를 충족하기 위해 지코어는 엔비디아 A100 텐서 코어 GPU로 구동되는 하이엔드 솔루션을 사용했다. 현재 지코어는 이 솔루션이 컨퍼런스 및 행사에서 사용될 수 있도록 실시간 번역을 활성화하는 모델을 개발하고 있다. 향후에는 영어 외에 프랑스어와 독일어 등의 언어를 추가해 음성의 텍스트 변환 기능을 언어를 초월한 의사소통의 핵심 도구로 만들어 나간다는 계획이다. '음성-텍스트 변환' 모델은 지코어의 최첨단 엣지 AI 솔루션의 일부이며, 엔비디아 GPU를 기반으로 한 AI 학습용 GPU 클라우드 및 엣지에서의 AI 추론을 포함한다. 안드레 레이텐바흐 지코어 CEO는 “지코어의 AI 혁신에 대한 끊임없는 도전이 엔비디아 파트너 네트워크 어워드에서 인정 받게 되어 매우 뜻깊게 생각한다”며 “언어의 종류를 초월해 누구나 보다 원활하고 효율적으로 의사소통 할 수 있도록 지코어는 획기적인 엣지 AI 서비스를 선도하며 새로운 표준을 제시해 나갈 것”이라고 전했다. 엔비디아 EMEA 채널 디렉터인 더크 바푸스는 “AI는 여러 언어를 번역하는 능력을 통해 소통과 연결을 촉진한다”며 “지코어는 엔비디아의 GPU를 기반으로 영어 음성을 룩셈부르크어 텍스트로 번역해 낸 최초의 혁신적 성과를 높게 인정 받은 것”이라고 밝혔다.

2024.04.25 12:36김우용

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

K-배터리, 한국엔 껍데기만 남을라…"골든타임 놓치지 말아야"

"도심에서 40분"…김동선의 하이엔드 리조트 ‘안토’ 가보니

"보안은 장식이 아닙니다, 신뢰입니다"

글로벌 AI 혁신 '한 눈에'…코히어·LG CNS 등 총출동

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.