• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
창간특집
인공지능
배터리
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'음성 AI'통합검색 결과 입니다. (34건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

"글로벌 수준"...카카오, 멀티모달 언어모델 'Kanana-o' 성능 공개

카카오가 새로운 인공지능 모델을 통해 기술 경쟁력 강화를 이어간다. 카카오(대표 정신아)는 공식 테크블로그를 통해 통합 멀티모달 언어모델 'Kanana-o'와 오디오 언어모델 'Kanana-a'의 성능과 개발 후기를 1일 공개했다. 통합 멀티모달 언어모델인 Kanana-o는 텍스트와 음성, 이미지까지 다양한 형태의 정보를 동시에 이해하고 처리할 수 있는 모델이다. 텍스트, 음성, 이미지 중 어떠한 조합으로 질문을 입력하더라도 처리 가능하며, 상황에 맞는 텍스트나 자연스러운 음성으로 응답 가능한 구조로 설계됐다. 카카오는 '모델 병합' 기술을 기반으로 이미지 처리에 특화된 모델 'Kanana-v'와 오디오 이해 및 생성에 특화된 'Kanana-a' 모델을 통합, 단기간 내 효율적으로 Kanana-o를 개발했다. 통합 후에는 이미지, 오디오, 텍스트 데이터를 동시에 학습하는 '병합 학습'을 통해 시각과 청각 정보를 동시에 이해하고, 텍스트와 연결 지을 수 있도록 통합 훈련을 거쳤다. 이런 과정을 통해 기존 LLM 구조에서 이미지 이해 능력과 음성 인식과 합성, 감정 이해 등 고도화된 오디오 능력을 확장시킨 통합 멀티모달 언어모델이 구현됐다. Kanana-o는 음성 감정 인식 기술을 통해 사용자의 의도를 올바르게 해석하고, 상황에 맞는 적절한 반응과 답변을 제공해준다. 억양, 말투, 목소리 떨림 등 비언어적 신호를 분석하고, 대화 맥락에 맞는 감정적이고 자연스러운 음성의 응답을 생성하는 것이 특징이다. 대규모 한국어 데이터셋을 활용해 한국어의 특수한 발화 구조, 억양, 어미 변화 등을 정밀하게 반영하기도 했다. 특히 제주도, 경상도 등 지역 방언을 인식하고 이를 표준어로 변환해 자연스러운 음성을 생성할 수 있다. 지속적인 성능의 고도화를 위해 카카오는 현재 독자적인 한국어 음성 토크나이저(오디오 신호를 일정 단위로 작게 분해하는 도구) 개발을 진행 중이다. 스트리밍 방식의 음성합성 기술을 적용해 사용자가 긴 대기 시간 없이 응답을 제공하는 강점도 보유했다. 예를 들어, 이미지와 함께 "이 그림에 어울리는 동화를 만들어 줘"라고 입력하면, Kanana-o는 해당 음성을 이해하고 사용자의 억양과 감정 등을 분석해 자연스럽고 창의적인 이야기를 실시간으로 생성해 들려준다. Kanana-o는 한국어 및 영어 벤치마크에서 글로벌 최고 모델들과 유사 수준을 기록했으며, 한국어 벤치마크에서는 높은 우위를 보였다. 특히, 감정인식 능력에서는 한국어와 영어 모두에서 큰 격차를 기록하며, 감정까지 이해하고 소통할 수 있는 AI 모델의 가능성을 입증했다. 이미지와 음성을 통합적으로 이해해야 하는 '이미지-음성 QA(질의응답)' 태스크에서도 강력한 성능을 달성하며, 통합 멀티모달 언어모델로서의 글로벌 경쟁력을 확인했다. 카카오는 향후 Kanana-o를 통해 ▲다중 턴 대화 처리 ▲양방향 데이터 동시 송수신 기술 대응 능력 강화 ▲부적절한 응답 방지를 위한 안전성 확보 등을 목표로 연구 개발을 지속해 갈 계획이다. 이를 통해 다중 음성 대화 환경에서의 사용자 경험을 혁신하고, 실제 대화에 가까운 자연스러운 상호작용을 실현해가는 것이 목표다. 카카오 김병학 카나나 성과리더는 "카나나 모델은 복합적인 형태의 정보를 통합적으로 처리함으로써 기존의 텍스트 중심 AI를 넘어 사람처럼 보고 듣고 말하며 공감하는 AI로 진화하고 있다"며 "독자적인 멀티모달 기술을 바탕으로 자사의 인공지능 기술 경쟁력을 강화하는 한편, 지속적 연구 결과 공유를 통해 국내 AI 생태계 발전에 꾸준히 기여할 계획"이라고 말했다.

2025.05.01 10:13백봉삼

[AI는 지금] 앤트로픽도 'AI 음성 비서' 경쟁 가세…오픈AI·아마존·애플·삼성 넘을까

'오픈AI 대항마'로 꼽히는 앤트로픽이 자사 인공지능(AI) 챗봇인 '클로드'를 활용한 새로운 음성 비서 제품을 출시한다. 생성형 AI를 탑재한 'AI 음성 비서'가 최근 우후죽순 쏟아지면서 글로벌 빅테크의 새로운 격전지가 된 가운데 앤트로픽이 존재감을 키울 수 있을 지 주목된다. 16일 블룸버그통신에 따르면 앤트로픽은 '음성 모드'라고 불리는 새로운 기능을 이르면 이달 중 출시할 것으로 알려졌다. 음성 지원 기능의 도입으로 텍스트 입력 방식보다 훨씬 자연스럽게 AI와 소통할 수 있을 것으로 보인다. 초기에는 제한적인 서비스만 선보일 예정으로, '에어리'와 '멜로우', 영국식 억양의 '버터리' 등 세 가지 음성을 도입할 것으로 전해졌다. 앞서 앤트로픽은 '클로드'에 음성 기능을 추가하기 위해 음성 AI 스타트업 일레븐랩스, 아마존과 협력 중이란 소식이 전해진 바 있다. 앤트로픽 경영진도 음성 옵션을 개발 중이라고 밝힌 바 있지만, 구체적인 출시 일정과 세부 사항은 알려지지 않았다. 앤트로픽의 '음성 모드' 출시 소식은 앱 연구원 M1아스트라(M1Astra)가 앤트로픽의 코드에서 발견해 블룸버그통신에 공유하며 드러났다. 앤트로픽은 이번 일에 대해 공식 입장을 밝히지 않았다. 업계에선 앤트로픽의 이 같은 행보가 경쟁사인 오픈AI와의 격차를 줄이기 위한 움직임으로 해석했다. 앤트로픽이 최근 '클로드 리서치'란 기능을 추가한 것도 지난 2월 발표된 오픈AI '딥 리서치'를 견제하기 위한 것으로 보는 시각이 많다. 이 외에 구글 '제미나이', 미스트랄 '르샤' 역시 웹 검색 기능을 제공하고 있다. 여기에 앤트로픽은 클로드 이용자가 업무를 간소화할 수 있도록 지메일(Gmail), 구글 캘린더, 구글 문서도구에서 검색할 수 있는 기능도 조만간 추가할 예정으로, 기능 강화를 통해 시장 주도권을 잡겠다는 방침이다. 업계 관계자는 "앤트로픽의 음성 기능 도입은 경쟁사들에 비해 다소 늦은 편"이라며 "오픈AI, 구글, xAI 등은 이미 음성 기능을 공개했고 메타도 음성 모드를 강화한 '라마4'를 준비 중"이라고 말했다. 일각에선 앤트로픽이 경쟁사에 비해 다소 늦게 음성 기능을 도입한 만큼 경쟁사들보다 존재감을 더 드러낼 수 있을지 의문을 드러내기도 했다. 현재 AI 음성 비서 시장은 세계 최대 전자상거래 업체 아마존의 '알렉사 플러스'와 삼성전자 '빅스비', 구글 '제미나이 라이브', 애플 '시리' 등과 함께 오픈AI가 경쟁을 벌이고 있다. 특히 지난해 오픈AI의 GPT-4o 등장 후 AI 음성 비서 시장은 빠르게 기술 고도화가 진행되고 있다. 업계 관계자는 "알렉사, 시리, 빅스비 등 기존 음성 비서 서비스들은 음성을 텍스트로 바꿔서 인식하고 답변도 텍스트로 먼저 만든 다음 음성으로 합성하는 식이었다"며 "GPT-4o 이후에는 음성을 음성 그 자체로 인식해 처리 과정이 빨라진 데다 목소리에 담긴 감정이나 배경이 섞인 소리도 알아차릴 수 있게 됐다는 점에서 상당한 기술 차이가 있다"고 설명했다. 이처럼 생성형 AI를 활용한 음성 AI 비서 시장에서 빅테크들의 경쟁이 치열해지면서 관련 시장에 대한 전망도 긍정적이다. 실제 일본 시장조사기관 글로벌 인포메이션에 따르면 AI와 머신러닝(ML)을 사용하는 지능형 가상비서(IVA)의 지난해 시장 규모는 147억7천만 달러(약 20조1천억원)로 추정됐다. 2023~2030년 연평균 성장률(CAGR)은 26.2%로, 2030년 시장 규모는 474억 달러(약 64조6천억원)에 달할 것으로 전망된다. 업계 관계자는 "생성형 AI 음성 비서가 앞으로 돈이 될 것으로 보고 빅테크들을 중심으로 앞 다퉈 서비스를 내놓고 있는 분위기"라며 "듣고 말하는 AI가 전 산업에 걸쳐 가져올 변화는 가늠하기 어려울 정도"라고 밝혔다. 블룸버그통신은 "음성 비서는 사람들이 챗봇과 상호작용하는 방식을 바꾸고 사용자의 생산성을 높일 수 있다는 기대와 함께 오픈AI, 구글과 같은 AI 개발 업체의 핵심 기능으로 부상했다"며 "하지만 AI 음성 제품의 등장으로 다른 사람의 말투를 흉내 내는 것에 대한 우려도 커지고 있다"고 지적했다.

2025.04.16 16:12장유미

AI챗봇과 역할 놀이?…성적 대화 유출

인공지능(AI) 챗봇과 성적인 대화를 주고받은 내용이 인터넷에 퍼지는 것으로 나타났다. 성적인 환상을 채우는 역할 놀이를 하려고 설계된 AI 챗봇이 실시간으로 사용자와의 대화 내용을 인터넷에 유출하고 있다고 미국 잡지 와이어드는 11일(현지시간) 보도했다. 미국 정보보호 업체 업가드는 지난달 보안 취약점을 찾다가 인터넷에 노출된 AI 시스템을 400개 발견했다. 이 가운데 117개의 인터넷 프로토콜(IP) 주소에서 대화 내용이 새고 있었다. 유출된 내용을 보면 일부 사용자는 아동 성적 학대를 자세히 그리는 대화를 했다. 미리 설정한 AI 캐릭터와 역할 놀이를 했다. 예를 들어 A라는 한 사람은 학교 기숙사에서 다른 여성 3명과 함께 살고, 내성적인데 종종 슬퍼 보인다는 10대 여성으로 묘사됐다. 업가드 연구원은 “모든 대화가 성적으로 노골적인 역할 놀이였다”며 “일부는 어린이와의 성관계를 얘기했다”고 말했다. 업가드는 어떤 사이트나 서비스에서 정보가 빠져나갔는지는 알아내지 못했다. 다만 기업이 아닌 개인이 쓰는 AI 챗봇에서 일어난 것으로 짐작했다. 대화한 사용자 이름이나 개인정보는 빠져나가지 않은 것으로 알려졌다.

2025.04.12 10:13유혜진

"목소리에 영혼 담겼다"…아마존, 음성 모델 '노바 소닉' 공개

아마존이 사용자 말투와 감정 변화까지 실시간 반영할 수 있는 음성 기반 인공지능(AI) 모델을 공개했다. 9일 아마존은 자사 AI 플랫폼 '아마존 베드록'을 통해 음성 이해와 생성을 통합한 모델 '노바 소닉(Nova Sonic)'을 공식 홈페이지를 통해 발표했다. 이 모델은 고객 서비스와 여행, 헬스케어, 교육 등 산업 분야에서 음성 기반 AI 서비스에 활용된다. 기존 음성 애플리케이션은 음성 인식과 텍스트 처리, 음성 생성 등 기능별로 나뉜 모델을 결합해 사용해야 했다. 이는 시스템 복잡성를 높이고 대화의 자연스러움과 맥락 유지에 한계가 생길 수 있다. 노바 소닉은 음성의 맥락, 말투, 말하는 스타일까지 한 모델에서 반영할 수 있도록 설계됐다. 입력된 음성의 음향 정보를 인식하고, 그에 어울리는 응답을 실시간으로 생성하는 방식이다. 망설임이나 말 끊김, 어조 변화 등 대화의 미묘한 차이를 인지하고 반응할 수 있다. 예를 들어 노바 소닉 기반 여행용 AI 어시스턴트는 사용자의 감정 변화에 따라 목소리 톤과 응답 방식을 조정할 수 있다. 노바 소닉은 텍스트 전사 기능도 갖췄다. 개발자는 이 기능을 통해 음성 입력 데이터 기반으로 외부 API를 호출하거나 여러 툴과 연계한 서비스를 만들 수 있다. 항공편 실시간 조회, 일정 예약, 고객 응대 자동화 등 고차원 작업이 가능한 셈이다. 아마존은 노바 소닉의 추론 속도가 빠르다고 강조했다. 거대언어모델(LLM)과 달리 실시간 응답성에 최적화됐다는 이유에서다. 이에 엔터프라이즈 환경에서도 손쉬운 도입이 가능하다고 강조했다. 아마존은 "노바 소닉은 단일 모델로 음성의 이해와 생성을 모두 처리하는 최초의 시도 중 하나"라며 "향후 음성 기반 AI 기술의 방향성을 제시할 것"이라고 밝혔다.

2025.04.09 16:46김미정

"내 목소리 5초만에 파악"…롯데 AI 기술 집약체 '아이멤버' 新 기능 덕에 업무 효율 ↑

롯데이노베이트가 나만의 목소리를 인공지능(AI)에 학습시킬 수 있는 기능을 선보인다. 롯데이노베이트가 AI 전환(AX) 고도화를 위해 AI 플랫폼 '아이멤버'의 음성 인식 기능을 강화했다고 27일 밝혔다. 롯데이노베이트는 회의록 자동 생성 기능도 향상시켰다. 특히 AI를 활용해 내 목소리를 학습시킨 AI 음성합성 기능인 '나만의 AI 음성'과 음성 커스터마이징이 가능한 음성 합성 기능을 새롭게 선보이며 업무 효율성을 높였다. 회의록 자동 생성은 불필요한 업무 시간을 크게 단축시킬 수 있어 롯데이노베이트 내부 직원들 사이에서도 호응을 받고 있는 기능 중 하나다. 이번 고도화를 통해 회의록 생성 속도를 기존보다 2배 향상시켰을 뿐 아니라 한층 발전된 AI 음성 분석 기술을 통해 정확도를 높여 인식 가능한 화자의 수도 더욱 늘렸다. 또 AI가 회의 맥락을 분석해 불필요한 내용을 제외하고 이후 해야 할 일도 제시한다. 음성 북마크 기능도 탑재해 특정 부분을 찾기 쉽게 했다. 무엇보다 민감한 정보가 담겨 있는 음성 데이터에 대한 보안 측면도 고려했다. 내부 서버를 활용하고 회의록 자동 생성에 사용된 음성 데이터를 자동 삭제하는 등 롯데이노베이트가 자체 개발한 보안 알고리즘이 적용됐다. 이를 통해 사용자가 내부 정보 유출에 대한 우려 없이 안심하고 사용할 수 있게 했다. 롯데이노베이트는 나만의 AI 음성도 선보였다. 해당 기능은 5초가량의 짧은 음성 샘플만 제공해도 AI가 사용자 목소리의 억양·발음 등 미묘한 부분까지 분석해 자연스럽고 깨끗한 합성음을 제공한다. 롯데이노베이트는 아이멤버 홍보 영상 제작에 들어가는 성우 부분의 전부를 나만의 AI 음성 기능을 사용해 제작 시간과 비용 등을 절감하며 업무 효율화를 진행하고 있다. 이와 별도로 AI 음성 합성 기능도 추가됐다. 해당 기능은 롯데이노베이트가 자체 개발한 음성 기술을 기반으로 한국어뿐만 아니라 영어·일본어를 지원해 글로벌 비즈니스와 콘텐츠 제작에 도움을 준다. 언어별로 자연스러운 발음과 억양도 구현할 수 있다. 커스터마이징도 지원한다. 아나운서·상담원 등 비즈니스별 상황에 맞게 14개의 화자와 총 20개 음성 세트를 지원하며 목소리의 속도, 크기, 높낮이, 문장 간 공백 길이, 음성 품질까지 다양한 부분을 조정할 수 있어 사용자의 취향을 반영할 수 있다. 롯데이노베이트 측은 "향후 아이멤버의 지속적인 기능 고도화와 신규 서비스 론칭을 통해 업무 효율성을 더욱 높여 나가는 동시에 스마트워크 환경 조성에 기여하겠다"며 "AI 기반 업무 문화를 롯데 전 계열사로 확대시켜 나갈 계획"이라고 밝혔다.

2025.03.27 17:08한정호

애플, '시리' AI 개선 2026년으로 연기

애플이 인공지능(AI) 음성 비서 '시리' 개선을 내년으로 미뤘다고 미국 경제 방송 CNBC가 7일(현지시간) 보도했다. 애플은 올봄 시리 기능을 강화하려 했으나 내년으로 미룬다고 이날 발표했다. CNBC는 애플이 지난해 여름 '애플 인텔리전스'를 공개하면서 시리 음성 비서의 새로운 기능을 소개했으나 이를 실제로 쓰려면 멀었다고 지적했다. 애플이 '개인적 맥락'이라 부르는 또 다른 시리 개선 사항도 지연됐다고 CNBC는 전했다. 운전면허증 사진에 나오는 번호를 기반으로 사용자를 대신해 개인정보 양식을 작성하는 기능이 대표적이다. 애플 관계자는 성명을 내고 “개인화된 시리를 개발해 사용자 대신 앱을 편하게 쓰도록 조치하고 있다”며 “이런 기능을 제공하는 데 생각보다 시간이 더 걸려 내년에 선보일 것 같다”고 말했다. 오픈AI가 '챗GPT'로 2022년 생성형 AI 시대를 연 뒤 애플이 압박을 느낀다고 CNBC는 분석했다. 또 '알렉사' 음성 비서를 발표한 아마존과 '제미나이' 비서를 개발 중인 구글보다 애플이 뒤처질 수 있다고 내다봤다. 애플이 이런 어려움을 겪는 일은 이번이 처음이 아니라고 CNBC는 비판했다. 올해 초 사용자가 '애플 AI가 부정확한 사실을 표시하기 위해 헤드라인을 왜곡한다'는 사실을 발견하자 애플은 뉴욕타임스와 BBC 같은 뉴스 앱에 대한 애플 인텔리전스 요약을 비활성화했다.

2025.03.08 08:43유혜진

11년 만에 변신한 '음성 비서' 알렉사, AI 달고 애플 시리·삼성 빅스비 넘을까

생성형 인공지능(AI)을 탑재한 'AI 음성 비서'가 최근 우후죽순 쏟아지면서 글로벌 빅테크의 새로운 격전지가 되고 있다. AI의 휴대형, 개인화 현상이 짙어진 탓에 'AI 비서'와 관련된 기술들이 빠른 속도로 개발되며 시장의 새로운 성장동력이 되고 있다는 평가다. 27일 블룸버그통신 등 주요 외신에 따르면 세계 최대 전자상거래 업체 아마존은 지난 26일 뉴욕에서 AI 음성 비서 '알렉사 플러스(+)'를 공개하는 행사를 진행했다. 기존 '알렉사'에 생성형 AI를 탑재한 것으로, 알렉사의 업그레이드는 2014년 출시 후 처음이다. 아마존은 당초 2023년 9월 '알렉사'를 대규모로 개편하겠다는 계획을 발표한 후 지난해 10월 중순께 이를 선보이려고 했으나, 출시 일정이 연기되다 이날 공개했다. 파노스 파네이 아마존 디바이스 및 서비스 책임자는 "알렉사의 모든 것을 다시 설계했다"며 "여러분의 생활 속 거의 모든 요소를 알고 있다"고 말했다. 새로운 '알렉사+'는 기존에 무료로 제공됐던 것과 달리 오는 3월부터 월 19.99달러의 유료 요금제로 운영된다. 아마존 프라임 회원은 무료로 이용할 수 있다. 기존에는 날씨 등 사용자의 간단한 질문에 음성으로 답하는 것에 그쳤으나, 앞으로는 대규모 언어 모델(LLM)을 기반으로 생성형 AI를 통합해 복잡한 질문에도 답할 수 있게 된다. 또 콘서트 티켓을 구매하고 식료품을 주문하고 저녁 식사 장소를 알아서 예약하는 등 다양한 작업도 수행할 수 있다. '알렉사+'는 학습 가이드를 읽고 문제를 내거나 손글씨 문서를 정리해 해당 정보를 기억하는 등 복잡한 작업도 가능하다. 아마존 도어벨인 '링'과 연결해 카메라 녹화 영상도 보여준다. 또 아마존은 '알렉사+'가 주택 소유자 협회 계약서 같은 문서를 검토해 태양광 패널 설치가 가능한지 등을 알려줄 수 있다고 소개했다. 단편적인 요청뿐 아니라 연속적인 요청을 이해·처리할 수 있고 이용자가 직접 개입할 필요가 없는 'AI 에이전트' 기능도 탑재됐다고 설명했다. '알렉사+'는 아마존 자체 AI 모델 '노바'뿐 아니라 챗GPT 개발사 오픈AI 대항마로 평가되는 앤트로픽의 AI 모델 '클로드' 등 여러 모델을 기반으로 학습했다. 아마존은 앤트로픽에 80억 달러를 투자한 바 있다. 아마존은 자체 개발한 스피커 '에코(Echo)'를 비롯해 자체 스마트홈 기기에 알렉사를 탑재해 기기 판매도 늘리고 이용자들이 쉽게 이용할 수 있도록 할 계획이다. 이에 맞서 삼성전자도 AI 비서 '빅스비'의 활용도를 높이기 위해 지난해 8월 업데이트를 실시했다. 자연어 기반으로 맥락을 이해하는 음성 명령으로 가전 제품을 쉽게 제어할 수 있도록 한 것이다. 이를 통해 ▲한 문장에 여러가지 명령을 담아 말해도 가전제품이 각 의도를 이해할 수 있고 ▲앞의 대화를 기억해 다음 명령까지 연결해 수행할 수 있으며 ▲기기 관련 궁금증과 답변을 말로 묻고 바로 확인할 수 있다. 구글도 같은 해 8월 '메이드 바이 구글 2024'를 통해 자연스러운 대화가 가능한 AI 음성 비서 '제미나이 라이브'를 공개했다. 제미나이 라이브를 활용하면 개인 트레이너가 보낸 이메일을 바탕으로 운동 계획을 세워달라고 요청하거나, 유튜브 콘텐츠 내용과 관련해 궁금한 것을 옆사람과 대화하듯 물어볼 수 있다. 목소리도 10가지로 선택 가능하다. 월 구독료는 19.99달러(약 2만7천원)로, 구글 픽셀폰뿐 아니라 삼성전자 갤럭시폰에서도 이용할 수 있다. 구글은 '아이폰'에도 이를 사용할 수 있도록 지원한다. 애플은 첫 AI폰 '아이폰16' 시리즈에 오픈AI의 'GPT-4o'를 적용한 AI 음성비서 '시리'를 탑재했다. '시리'는 애플이 지난 2011년 선보인 서비스로, 이용자 요청에 타이머나 알람 설정, 날씨 등을 음성으로 알려준다. 그러나 오픈AI의 GPT-4o처럼 깊이 있는 양방향 소통은 이전까지 불가능했다. 다만 '시리'는 현재 성능이 들쭉날쭉하다고 평가받고 있다. 여전히 개인 맞춤형 정보 제공 기능이나 앱 내에서 다양한 작업을 수행하는 기능 등 핵심 기능이 완전히 구현되지 않았다는 것이 중론이다. 이에 애플은 2월 말 베타 버전 출시, 4월 정식 출시를 목표로 했으나 안정성 문제를 해결하기 위한 추가 작업을 해야 하는 탓에 시리의 개편 일정을 5월 이후로 연기할 것으로 알려졌다. 씨넷은 "애플은 '시리'와 새로운 AI 시스템인 '애플 인텔리전스'의 통합 과정에서 엔지니어링 문제와 소프트웨어 버그를 해결하고 있다"며 "이로 인해 출시 일정이 미뤄지고 있다"고 말했다. AI 음성 비서 시장은 지난해 오픈AI의 GPT-4o 등장 후 크게 변화하고 있다. GPT-4o는 텍스트를 통해 대화했던 기존 챗GPT와 달리 이용자와 실시간 음성 대화를 통해 질문을 받고 답변을 내놓는다. 텍스트·음성뿐 아니라 이미지 인식 기능까지 갖춘 멀티모달(Multimodal) 모델로, 사람이 말하는 내용이나 보여주는 이미지를 즉각 이해하고 이에 걸맞은 답을 할 수 있다. 업계 관계자는 "알렉사, 시리, 빅스비 등 기존 음성 비서 서비스들은 음성을 텍스트로 바꿔서 인식하고 답변도 텍스트로 먼저 만든 다음 음성으로 합성하는 식이었다"며 "이제는 음성을 음성 그 자체로 인식해 처리 과정이 빨라진 데다 목소리에 담긴 감정이나 배경이 섞인 소리도 알아차릴 수 있게 됐다는 점에서 상당한 기술 차이가 있다"고 설명했다. 이처럼 생성형 AI를 활용한 음성 AI 비서 시장에서 빅테크들의 경쟁이 치열해지면서 관련 시장에 대한 전망도 긍정적이다. 실제 일본 시장조사기관 글로벌 인포메이션에 따르면 AI와 머신러닝(ML)을 사용하는 지능형 가상비서(IVA)의 지난해 시장 규모는 147억7천만 달러(약 20조1천억원)로 추정됐다. 2023~2030년 연평균 성장률(CAGR)은 26.2%로, 2030년 시장 규모는 474억 달러(약 64조6천억원)에 달할 것으로 전망된다. 업계 관계자는 "생성형 AI 음성 비서가 앞으로 돈이 될 것으로 보고 빅테크들을 중심으로 앞 다퉈 서비스를 내놓고 있는 분위기"라며 "듣고 말하는 AI가 전 산업에 걸쳐 가져올 변화는 가늠하기 어려울 정도"라고 밝혔다. 그러면서 "다만 AI 비서 개발을 위해서는 개인정보와 편향성, 윤리적인 문제도 함께 고려돼야 할 것"이라고 덧붙였다.

2025.02.27 09:40장유미

리턴제로, 연간 2.2만 시간 회의 데이터 자산화…AI로 지식관리 혁신 '가속'

리턴제로가 기업의 지식 관리 혁신을 위해 연간 약 2만 시간에 달하는 회의 데이터를 디지털 자산으로 전환했다. 리턴제로는 자사 지식관리 시스템(KMS) 플랫폼 '콜라보'의 지난해 연간 리포트를 발표했다고 12일 밝혔다. 보고서에 따르면 '콜라보'는 지난해 총 2만1천690시간 분량의 회의 데이터를 디지털화하며 기업들이 효율적으로 정보를 축적하고 활용하도록 지원했다. '콜라보'는 인공지능(AI) 음성인식 기술을 활용해 회의 내용을 자동 기록하고 요약하는 B2B 전용 서비스다. 30분 분량의 회의를 30초 만에 요약할 수 있는 빠른 처리 속도를 갖췄으며 구글밋·줌·팀즈 등 주요 화상회의 플랫폼과 연동된다. 모바일 앱도 지원해 장소에 구애받지 않고 회의 내용을 확인하고 공유할 수 있다. 기업용 KMS로서의 성장도 두드러진다. 보고서에 따르면 콜라보의 워크스페이스 수는 전년 대비 4.21배 증가했다. 또 세일즈포스, 슬랙, 재피어 등 다양한 업무 툴과의 연동을 통해 기업의 기존 워크플로에 통합이 된다. 보안성과 사용자 편의성도 강화됐다. 현재 ISO 27001 인증을 획득하며 엔터프라이즈급 보안 체계를 구축했으며 캘린더 연동 등 자동화 기능을 추가해 업무 효율성을 높였다. 향후 다국어 지원 기능을 확대하고 번역 기능도 제공할 계획이다. 실제 고객사들의 반응도 긍정적이다. 이승곤 딥블루닷 사업총괄 이사는 "콜라보 도입 후 회의록 작성이 자동화돼 참석자들이 논의 자체에 집중할 수 있게 됐다"며 "회의록 데이터를 기반으로 의사결정 과정을 추적하고 검토하는 것도 용이해졌다"고 말했다. 리턴제로는 글로벌 KMS 시장에서도 경쟁력을 높이고 있다. 시장조사기관 마켓리서치인텔렉트에 따르면 지난 2023년 60억 달러(한화 약 8조4천억원) 규모였던 글로벌 KMS 시장은 오는 2031년까지 162억 달러(한화 약 21조원)로 성장할 전망이다. 이에 리턴제로는 실시간 다국어 처리, 업무 프로세스 최적화 등 AI 기반 KMS 기술을 고도화할 계획이다. 이참솔 리턴제로 대표는 "콜라보는 기업 내 회의 데이터를 자동으로 축적하고 활용해 의사결정과 혁신 역량을 높이는 차세대 KMS 플랫폼으로 발전하고 있다"며 "앞으로도 AI 기술을 통해 기업의 지식 관리 방식을 혁신하고 디지털 전환을 가속화하겠다"고 밝혔다.

2025.02.12 18:06조이환

BMW, 中 IT기업과 '생성형 AI' 공동 개발

BMW그룹이 중국 기업과 생성형 인공지능(AI) 개발을 위해 손잡았다. 23일 BMW그룹은 중국 소셜미디어 웨이보 공식 계정에서 "중국 선두 IT 기업과 손잡고 초거대 모델 생성형 AI, 지능형 언어 상호작용 등 방면에서 협력할 것"이라며 "중국 고객을 위한 차내 디지털 체험의 편의성을 개선하고 더욱 지능화하면서 개인 맞춤화 할 것"이라고 밝혔다. 구체적으로 어떤 중국 IT 기업과 협력하기로 했는지는 공개하지 않았다. BMW는 이 중국 IT 기업과 협력해 음성 엔진 기술을 개선하고, 지능형 운전석의 정보 검색 및 시스템 반응 성능을 향상시키기로 했다. 음성, 네비게이션, 엔터테인먼트, 뉴스 등 영역에서 지능형 앱을 확장하면서 다양한 사용자 수요를 만족시키겠단 계획이다. BMW 지능형 개인 비서를 위한 자연어 대화와 자가 학습 기능을 제공하면서 생성형 AI를 통해 사용자 요구 사항을 종합해 더 지능적으로 차량과 브랜드 관련 문제에 답하고 기능 실행도 지원할 것이라고 설명했다. 특히 중국 사용자를 위한 고유의 음성 및 현지화된 데이터베이스를 제공하고 인기 콘텐츠, 네비게이션, 항공편 및 주식 정보 등에 대한 음성 검색도 지원할 예정이다. BMW는 올해 1월부터 9월까지 중국 시장에서 누적 판매량이 52만4천 대로, 지난해 같은 기간 대비 13.1% 감소했다. 이는 중국 시장에 진출한 이래 최대 감소폭이다. 8월엔 지난해 같은 달의 절반 수준에 그치기도 했다. BMW는 이날 자사 차량 제어 시스템 '차세대 파노라믹 아이드라이브(iDrive)' 양산 버전을 내년 1월 CES에서 발표할 것이라고 밝혔다.

2024.12.24 08:50유효정

"한국어 좀 하네?"…제미나이·챗GPT 韓 공습에 삼성 '빅스비' 입지 좁아질까

구글이 대화형 인공지능(AI) '제미나이 라이브'의 한국어 서비스를 본격화하며 오픈AI AI 챗봇 '챗GPT'가 잠식한 국내 음성 AI 비서 시장에 도전장을 던졌다. 일상 생활에 AI를 침투시켜 구독을 통한 유료화를 자연스럽게 유도할 것으로 예상되는 가운데 네이버, 카카오 등 국내 기업들이 어떻게 반격에 나설 지 주목된다. 구글은 올해 8월 '메이드 바이 구글(Made by Google)' 행사에서 공개한 '제미나이 라이브'의 한국어 서비스를 시작한다고 20일 밝혔다. 제미나이 라이브는 이용자의 요구에 따라 실시간으로 대화하고 협력해 사용할 수 있는 혁신적인 대화형 AI 기술이다. 이번 한국어 지원을 통해 구글은 언어의 장벽을 낮추고 AI의 혜택을 더 많은 이들에게 제공하고자 한다. 제미나이 라이브는 안드로이드 및 iOS 기기에서 사용 가능하다. 하나의 기기에서 최대 두 가지 언어를 설정할 수 있다. 이용자는 구글 앱의 상단 프로필이나 이니셜을 선택한 후 설정 탭에서 구글 어시스턴트를 선택, 한국어(또는 지원가능한 언어)를 지정하는 방식으로 이용자가 원하는 언어를 추가할 수 있다. 구글은 단순한 번역을 넘어 한국어의 미묘한 의미 차이, 관용 표현, 존댓말 체계를 '제미나이 라이브'에 반영하기 위해 언어학자와 문화 전문가 등 한국어 원어민들과 협력했다. 또 10가지의 다양한 한국어 음성 옵션을 지원하고 오디오 품질을 최적화했다. 이를 통해 한국어 이용자들은 더욱 자연스럽고 직관적인 대화가 가능한 것은 물론 차원이 다른 맞춤형 AI 서비스를 경험할 수 있다. 앞서 오픈AI도 지난 9월 한국어를 비롯해 영어 외에 50개 언어의 사용을 개선한 챗GPT의 '어드밴스드 보이스 모델(음성 모드)'을 출시했다. 지난 5월 실시간 음성 대화 기능을 추가해 업그레이드한 '챗GPT-4o(포오)'의 음성 기능을 개선한 모델이다. 기존 '챗GPT-4o'는 한국어 대화가 가능하긴 했지만 마치 외국인이 말하는 것처럼 어색하다는 지적이 있었다. 이번에 업그레이드된 모델은 실제 한국인 수준으로 언어 능력을 끌어올렸다는 평가를 받고 있다. 특히 애교를 부리거나 표준어와 다른 억양의 사투리도 이해해 주목 받았다. 이처럼 미국 기업들이 국내 시장을 노리고 잇따라 한국어 서비스를 내놓으면서 국내 기업들도 대응책 마련에 골몰하고 있다. 현재 네이버는 하이퍼클로바X 기반의 '스피치X(가칭)'를 개발 중이고, 카카오 계열사인 디케이테크인은 AI 비서 '헤이카카오'에 거대언어모델(LLM) 탑재를 검토하고 있는 것으로 알려졌다. 삼성전자도 '챗GPT'처럼 구동될 수 있도록 AI 비서 '빅스비'에 LLM을 탑재할 예정으로, 내년 초 출시할 '갤럭시S25' 시리즈에 이를 적용할 방침이다. 업계 관계자는 "생성형 AI의 수익화 전략을 고민 중인 글로벌 빅테크들은 생활에 밀접하게 파고드는 음성 AI 비서를 통해 유료화의 저변을 확대할 수 있을 것으로 기대하고 있다"며 "음성 AI 비서 시장을 선점하고 개발에서 앞서 나가려는 분위기 속에 국내 기업들도 하루 빨리 대응에 나서야 할 것"이라고 말했다.

2024.12.20 10:47장유미

딥엘, '딥엘 보이스' 출시…AI로 실시간 음성대화 번역

앞으로 딥엘 기업 사용자는 대면 대화와 화상회의에서 실시간 번역 서비스를 이용할 수 있다. 딥엘이 음성 번역 솔루션 '딥엘 보이스'를 출시했다고 14일 밝혔다. 이번 신제품은 '보이스 포 미팅'과 '보이스 포 컨버세이션' 모델로 구성됐다. 딥엘 보이스 포 미팅은 화상회의에 최적화된 음성 번역 서비스다. 미팅 참석자는 딥엘 보이스 포 미팅을 통해 각자 선호하는 언어로 말할 수 있다. 다른 참석자들은 실시간 번역 자막으로 내용을 확인할 수 있다. 모두가 모국어로 소통함으로써 보다 명확한 소통이 가능하다. 딥엘 보이스 포 컨버세이션은 1:1 대면 대화를 위한 모바일 솔루션이다. 두 가지 보기 모드로 자막 번역이 제공돼 한 기기에서 두 사람이 동시에 번역 내용을 확인할 수 있다. 딥엘 보이스는 현재 전세계 비즈니스 가입자 대상으로 출시됐다. 음성 번역은 현재 한국어, 영어, 독일어, 일본어, 스웨덴어, 네덜란드어, 프랑스어, 튀르키예어, 폴란드어, 포르투갈어, 러시아어, 스페인어, 이탈리아어 등 13개국 언어를 지원한다. 추후 지원 언어가 확대될 예정이다. 실시간 자막 번역의 경우 딥엘 번역기에서 지원하는 33개 언어 모두 적용된다. 야렉 쿠틸로브스키 딥엘 창업자 겸 최고경영자(CEO)는 "음성을 실시간 번역할 때 정확하지 않은 입력, 발음 문제, 지연 시간 등으로 인해 부정확한 번역과 사용자 경험이 저하될 수 있다"며 "향후 기업이 언어장벽을 허물고 필요에 따라 여러 언어로 소통할 수 있도록 처음부터 이 점을 고려해 솔루션을 구축했다"고 밝혔다.

2024.11.14 10:19김미정

"에이닷, 한판 붙자"....익시오 출시한 LGU+, AI 비서 경쟁 막 올라

SK텔레콤 '에이닷'에 이어 LG유플러스도 '익시오'를 공개했다. LG유플러스는 인공지능(AI) 기능을 온디바이스 환경에서 구현한 점을 차별화로 꼽았다. 국내 이동통신사 간 AI 통화 비서 서비스 시장 경쟁이 가열될 것으로 전망된다. 7일 LG유플러스는 서울 용산구 사옥에서 기자간담회를 개최하고 AI 통화비서 '익시오'를 공개했다. 익시오는 ▲전화 대신 받기 ▲보이는 전화 ▲실시간 보이스피싱 감지 ▲통화 녹음 및 요약 기능 등을 '온디바이스 AI' 환경에서 제공한다. 특히 LG유플러스는 익시오가 AI 통화 에이전트 서비스의 대부분 기능을 온디바이스 환경에서 구현했다고 강조했다. 통화 내용을 실시간으로 텍스트로 전환해 주거나, 실시간으로 보이스피싱을 감지하는 등의 기능은 데이터를 서버로 전송하지 않고 기기 안에서 처리하는 온디바이스 기술을 적용했기 때문에 선보일 수 있다는 설명이다. 이상엽 LG유플러스 CTO는 "기존 보이스피싱은 사전 등록 문구나 번호를 가지고 한다면, 익시오는 문장단위로 분류하는 AI로 탐지해 통화 중에 알려준다"며 "이걸 구현하려면 일반적인 기능이 아니라 온디바이스여야 한다"고 말했다. 이어 "경량화된 모델과 그 모델로 의도를 분류하고 추론하는 경량화 기술, 이걸 보이스피싱 데이터를 통해서 학습하는 기술이 필요했다"며 "이 세 가지를 내재화된 기술로 확보했다. 향후 버티컬 서비스에도 활용 가능하다"고 덧붙였다. 현재 익시오는 애플 아이폰14 시리즈 이후 모델부터 사용할 수 있다. 황 대표는 "발표 전 앱을 스토어에 공개하기만 했는데 4천명의 이용자가 다운로드를 해줬다"며 "1년 안에 사용자 수 100만명을 목표로 하고 있다"고 밝혔다. 아직 익시오는 LG유플러스 이용자만 사용이 가능하다. 자사 고객을 대상으로 완성도를 높이고 향후 타사 고객에도 오픈할 계획이다. 안드로이드 버전은 내년 출시한다. 내년 공개될 갤럭시 시리즈에 맞춰 출시하는게 목표다. 개발이 늦어질 경우를 감안해 내년 1분기 안으로 선보인다는 방침이다. 정수헌 LG유플러스 부사장은 "익시오가 모바일 기반 서비스이지만, 저희가 말씀드린 홈으로 확장하면 경쟁력이 있다고 본다"며 "타사 고객이 사용하면서 익시오가 타사고객까지 확장될 것으로 보인다"고 말했다. 이에 익시오가 SK텔레콤 AI 개인비서 서비스 '에이닷'의 대항마가 될지 주목된다. 에이닷의 누적 가입자 수는 9월 말 기준 550만명을 돌파했다. SK텔레콤은 지난달 T전화에 AI 기능을 접목한 '에이닷 전화'와 '에이닷 PC 버전'을 선보이는 등 전화부터 거대언어모델(LLM) 검색까지 AI 개인서비스의 영역을 넓혀가는 중이다. 최근 에이닷은 '통화 요약' 서비스의 무료 제공횟수를 제한하는 등 수익화에 시동을 건 상태다. 지난달 기존 전화앱 'T전화'를 에이닷전화로 전환하면서 통화녹음 요약을 매월 30건으로 제한했다. 익시오는 출시 된지 얼마안된 만큼 유료화 보다는 품질을 높이는 서비스 고도화에 더욱 집중한다는 방침이다. 황 대표는 "섣부르게 유료화하면 될 일도 안될 것이라고 생각한다"며 "고객들이 가치있게 생각하는 없어선 안될 서비스가 되면 프리미엄 버전도 생각해볼 수 있을것 같다"고 말했다. 한편 LG유플러스는 2028년까지 AI에 최대 3조원을 투자한다는 계획이다. 황 대표는 "AI 투자를 지속해 나가고 있는데, 연 4~5천억원 투자를 지속해할 것"이라며 "그렇게 되면 2028년까지 최대 3조원을 투자할 것으로 보인다"고 밝혔다.

2024.11.07 13:27최지연

"감정·문맥 이해"…오픈AI, 챗GPT 음성 기능 PC 앱에 추가

챗GPT 사용자가 데스크톱에서 생성형 인공지능(AI)과 음성으로 대화할 수 있게 됐다. 31일 오픈AI는 '고급 음성 모드(Advanced Voice Mode)'를 챗GPT 데스크톱 애플리케이션에 추가했다고 공식 소셜미디어(SNS) X 계정에 발표했다. 사용자는 고급 음성 모드를 윈도와 맥OS를 통해 이용할 수 있다. 이 기능은 GPT-4o 기반으로 작동한다. 사용자는 텍스트를 입력하지 않아도 음성으로 챗봇과 대화할 수 있다. 중간에 말을 멈추거나 더듬어도 AI가 문맥을 이해할 수 있다. 오픈AI는 "고급 음성 모드는 기존보다 더 자연스러운 실시간 대화를 제공한다"며 "사용자 감정을 인식하고 반응할 수 있기 때문"이라고 밝혔다. 앞서 오픈AI는 해당 기능을 올 초 발표한 바 있다. 지난 7월 베타 테스터들에게 이를 공급했으며 피드백을 받았다. 그 후 9월 말 유료 구독자들에게 모바일 버전으로 우선 제공됐다. 이번 발표는 오픈AI가 웹 앱에서 사용할 수 있는 채팅 기록 검색 기능을 공개한 지 하루 만에 전해졌다. 당시 오픈AI는 "챗GPT 웹에서 채팅 기록을 검색할 수 있는 기능을 점진적으로 제공하기 시작했다"며 "사용자는 이전 채팅을 빠르게 불러오거나, 중단했던 채팅을 이어서 할 수 있다"고 밝혔다.

2024.10.31 17:21김미정

카카오 '카나나' 라인업 발표…"한국어 AI 성능으로 글로벌 모델 압도할 것"

"이번에 발표된 '카나나'는 우리가 지금까지 개발해 온 모든 인공지능(AI)을 통합한 모델로, 한국어 처리에서 글로벌 AI 모델들을 능가하는 성과를 냈습니다. '카나나'를 통해 글로벌 AI 시장에서 선두로 나아가고자 합니다." 김병학 카카오 성과리더는 23일 경기도 용인시 카카오 AI 캠퍼스에서 열린 '이프카카오 2024' 행사에서 이같이 말했다. '이프카카오 2024'는 카카오 그룹이 AI 및 클라우드 기술 성과를 공유하고 국내 IT 기술 발전에 기여하기 위해 마련한 행사로, 지난 22일부터 사흘간 진행된다. 김 성과리더는 '카나나 모델 라인업의 핵심(Essence of Kanana Model Family)' 세션을 통해 카카오의 통합 AI 모델인 '카나나(Kanana)'를 소개했다. 그는 "카카오의 모든 AI 서비스를 '카나나'로 통합해 일관된 경험과 새로운 가치를 제공할 것"이라며 "한국어 처리에서 글로벌 모델을 능가하는 성능을 보유했다"고 강조했다. '카나나'는 언어모델(LLM), 멀티모달 언어모델(MLLM), 비주얼 생성모델, 음성모델 등으로 구성된 카카오의 통합 AI 모델이다. 특히 언어모델은 모델 크기에 따라 '카나나 나노', '카나나 에센스', '카나나 플래그'로 분류돼 서비스 환경에 따라 맞춤형의 성능과 비용 효율성을 제공한다. 김 성과리더는 "'카나나 에센스' 모델은 한국어 논리 및 추론 평가에서 글로벌 최고 수준의 성능을 기록했다"며 "케이엠엠엘유(KMMLU), 해래(HAE-RAE) 등의 벤치마크에서 글로벌 대표 모델들을 앞서는 결과를 얻었다"고 밝혔다. 이는 카카오가 자체 구축한 고품질의 한국어 데이터셋과 개인정보 및 저작권 이슈를 해결한 투명한 학습 과정을 통해 이루어진 성과다. '카나나' 모델은 비용 효율성 면에서도 강점을 지닌다. 다양한 모델들이 라인업 형태로 출시돼 각기 다른 목적을 위해 활용될 수 있기 때문이다. 이에 대해 김 성과리더는 "큰 모델을 모든 서비스에 적용하는 것은 비용 효율성이 떨어진다"며 "'카나나'는 서비스 목적에 맞게 학습 과정을 최적화해 처리 시간과 운영 비용을 절감할 수 있다"고 설명했다. 카카오는 이러한 '카나나' 모델을 활용해 카카오톡의 AI 대화 요약, 톡채널 AI 매니저 등 다양한 서비스에 AI 기술을 적용할 계획이다. 특히 멀티모달 언어모델인 '카나나 O'는 텍스트, 이미지, 오디오 데이터를 동시에 이해하고 처리할 수 있어 더욱 자연스러운 사용자 경험을 제공한다. 또 비주얼 생성모델 '콜라주'와 '키네마'는 개인화된 이미지와 동영상을 생성하며 음성모델 '카부'와 '퀘스트'는 자연스러운 음성 인식과 합성을 지원한다. 김 성과리더는 "'카나나' 모델은 다양한 신기술을 통해 사용자와 깊이 있는 상호작용을 이끌어낸다"며 "정확한 지식과 통찰력을 바탕으로 답변을 제공해 서비스에 새로운 가치를 더할 것"이라고 말했다. AI 모델 개발에는 여전히 해결해야 할 과제들이 있다. 그럼에도 김 성과리더는 이러한 도전에 대응하기 위한 해결책을 제시했다. 그는 "사용자 발화의 맥락을 정확히 이해하고 적절한 응답을 제공하기 위해서는 생성형 AI와 대형 언어모델(LLM)의 활용이 필요하다"며 "책임감 있고 신뢰할 수 있는 AI 모델을 만들어가고 있다"고 밝혔다. 그러면서 "'카나나' AI 기술을 서비스로 연결해 사용자 문제를 직접적으로 해결하는 AI 네이티브 컴퍼니로 나아가기 위한 기반을 확대하겠다"고 강조했다.

2024.10.23 14:02조이환

[써보고서] "억수로 좋네"…'챗GPT' 新 보이스모드, 韓 사투리도 '찰떡'

"곧바로 대답하고 같이 오랫동안 대화해도 위화감이 없는게 꼭 사람 같습니다." 지난 24일 모든 유료 사용자에게 공개된 오픈AI '챗GPT'의 고급 음성 기능인 '어드밴스드 보이스 모드(Advanced Voice Mode)'를 두고 국내 테크 커뮤니티에서는 찬사가 이어졌다. 이미 오픈AI는 지난 5월 일부 헤비 유저들에게 이 서비스를 베타 버전으로 제공한 바 있다. 이번 정식 출시에서는 총 5개의 새로운 음성이 추가돼 9개의 음성을 제공하게 됐다. 특히 언어는 한국어를 포함한 50개 이상의 언어로 확장됐다. 이번 고급 모드의 가장 핵심적인 특징은 실시간 반응과 억양과 악센트, 감정 표현까지 인간에 근접한다는 점이다. 이에 '챗GPT' 유료 구독자로서 직접 한국어·영어 사투리, 역할 놀이 등을 시도해 보며 성능을 확인해 봤다. 제주도부터 루이지애나까지, 전 세계 사투리 시연…토박이 "노력은 가상해" 먼저 제주도 사투리를 시연해 봤다. 기자가 제주도 말을 해보라고 요청하자 '챗GPT'는 제주도 억양으로 "고라봅서"라며 "제주도 한번 오면 자꾸 오고 싶을 꿍해"라고 답했다. 서울 사람인 기자가 이해하기 어렵다고 하자 그 뜻이 "한번 와서 보세요. 제주도에 오면 자꾸 오고 싶을 거예요"라고 설명했다. 이어 전라도 사투리를 부탁하자 '챗GPT'는 "와따, 거시기, 밥 먹었냐? 전라도에 오면 맛난 거 천지여!"라는 구수한 사투리를 구사했다. 이는 기자가 평소 즐겨보던 국내 드라마나 영화에서의 전라도 발음과 매우 유사하게 들렸다. 최종적인 확인을 위해 부산 사투리를 요청했다. 이에 '챗GPT'는 "왔나, 밥 묵었나? 부산 오이소"라고 친근하게 답했다. 실제 경상도 출신인 동료에게 평가를 부탁했다. 그는 여러 차례 '챗GPT'와 부산 사투리로 대화를 시도하고는 '억지로 흉내 낸다'는 평을 내렸다. 본토 출신의 객관적인 평가에도 불구하고 이는 타지인에게는 충분히 그럴듯하게 들렸다. 해당 지역 출신이 아닌 사람들이 그곳의 발음이라고 믿기에는 충분한 수준이었다. 다른 언어와의 비교를 위해 영국 BBC, 19세기 영국 신사, 차브(노동계급) 악센트, 미국 루이지애나 악센트 등의 영어도 시연해 봤다. 타지인이 보기에 '챗GPT'는 억양 뿐만 아니라 그 지역의 분위기와 표현을 잘 반영했다. 특히 영국 차브 악센트를 사용할 때는 그들이 자주 쓰는 '걱정마슈(No bother)'나 '땡기다(fancy)' 같은 특정 어휘를 사용했다. 루이지애나 발음으로는 푸근하고 느긋한 미국 남부 토박이들의 말투를 재현해 현지의 느낌을 살렸다. '닥터드레' VS '스눕독' 랩 배틀에서 심리상담까지…무한한 혼자놀기 가능성 '챗GPT'의 보이스모드는 역할놀이에도 우수했다. 기자가 미국의 유명 래퍼 스눕독과 닥터 드레의 랩 배틀을 시연해보자고 하자 인공지능은 긍정적으로 응했다. "닥터드레는 헤드폰만 팔고 랩은 못한다"며 스눕독을 따라한 기자의 랩에 '챗GPT'는 처음에는 긍정적인 가사로 응답했다. 그럼에도 좀 더 기 싸움을 해달라고 기자가 요청하자 '챗GPT'는 "네가 내 헤드폰을 비웃지만 그 돈으로 내가 차트 위에 섰다"며 "네 디스는 나에게 그저 농담 같다"고 답했다. 랩 실력 자체는 부족했지만 심심할 때 혼자서도 역할놀이를 하는데 있어 최적이었다. 심리상담사 역할도 훌륭하게 수행했다. 심리상담사와 환자의 역할놀이를 해보고 환자를 최대한 편안하게 만들라고 한 기자의 명령을 그대로 따랐기 때문이다. 잠을 못자서 정신적으로 힘들다고 호소하자 '챗GPT'는 따뜻한 목소리로 공감하며 작은 변화부터 시작하자고 조언했다. 실제로 일부 사용자들은 우울함을 해소하기 위해 보이스모드를 적극적으로 활용한다는 소감을 드러냈던 바 있다. 이같이 새로운 '챗GPT' 보이스모드는 단순한 음성 인식을 넘어 다양한 언어와 감정 표현을 자유자재로 구사하는 모습을 보여줬다. 오픈AI는 이번 보이스모드 출시로 AI와의 상호작용이 한층 더 인간적이고 다양해질 것을 기대하고 있다. 향후 업데이트를 통해 더욱 자연스러운 대화와 다양한 기능이 추가된다면 일상생활에서의 활용도가 영화 '그녀(Her)'에서와 같이 크게 높아질 것으로 보인다. 오픈AI 관계자는 "오래 기다린 고급 보이스 모드가 드디어 모두에게 출시됐다"며 "이렇게 기다렸던 만큼 서비스가 기대에 부응하길 바란다"고 말했다.

2024.09.29 09:05조이환

영화 '007' 배우 목소리에 애교까지?…음성 AI 비서, 기술 경쟁 '격화'

음성 인공지능(AI) 비서 시장 경쟁이 점차 치열해지고 있는 가운데 오픈AI와 메타가 앞다퉈 차별화 된 서비스를 선보이며 주도권 선점에 나섰다. 일상 생활에 AI를 침투시켜 구독을 통한 유료화를 자연스럽게 유도함으로써 수익성 확보에도 속도를 내는 분위기다. 25일 업계에 따르면 오픈AI는 지난 24일 AI 음성 비서 업그레이드 버전인 '보이스 모드 어드밴스드'를 출시했다. 지난 7월 말 '보이스 모드 스탠더드'를 출시한 지 2개월 만이다. 이 서비스는 기존 챗GPT 유료 구독자들에게 제공된다. 한국어를 비롯해 영어 외에 50개 언어의 사용을 개선한 것이 특징으로, 어색한 말투도 현지인 발음에 가깝게 개선됐다. 또 전문 성우를 고용해 훈련시킨 새로운 음성 5종을 추가했다. 재키 섀넌 오픈AI 챗GPT 멀티모달 총괄은 "새 버전은 더 자연스럽고 실시간 대화가 가능하다"며 "대화 도중에도 언제든지 끼어들 수 있고 사용자의 감정을 감지하고 반응할 수 있다"고 밝혔다. 오픈AI는 앞서 지난 23일 브리핑을 통해 향상된 챗GPT 음성 기능을 시연했다. 어드밴스드 음성모드는 "애교를 넣어 소개해 달라"는 요청에 "안녕, 나는 챗GPT야"라며 애교 섞인 목소리를 내 눈길을 끌었다. 또 "정중하게 인사해 달라"는 요청에는 "안녕하세요. 만나 뵙게 돼서 반갑습니다"라고 답했다. 오픈AI에 따르면 이번 버전은 기존 버전과 비교해 한국어 사투리도 더 많이 이해하는 반면, 욕설은 하지 않도록 설계됐다. "욕해줘"라고 말하면 "제가 욕설을 하지 않지만, 대신 재미있는 대화는 할 수 있어요"라고 답변했다. 오픈AI는 챗GPT가 한국인 전문 성우와 회사 내 한국인 직원들로부터 피드백을 받고 한국어 능력을 향상시켰다. 이날부터 유료가입 서비스인 '챗GPT 플러스' 및 팀 단위나 작은 스타트업을 위한 서비스인 '챗GPT 팀'을 통해 사용할 수 있다. 기업용인 '챗GPT 엔터프라이즈'와 대학을 위한 '챗GPT 에듀'에서는 다음주부터 이용할 수 있다. 메타 플랫폼은 자사 AI 챗봇에 주디 덴치, 존 시나 등 유명 영화배우 5명의 목소리를 차용해 제공할 계획이다. 메타의 챗봇 비서는 현재 텍스트 채팅에 참여하고 사용자의 요구에 응답해 이미지를 생성할 수 있다. 주디 덴치는 영화 '007시리즈'에서 제임스본드의 상관인 'M'으로 나오는 영국의 유명 배우다. 존 시나는 프로레슬러 출신으로, 영화 '분노의 질주' 등에 출연했다. 목소리를 제공하기로 계약한 연예인은 이 외에도 크리스틴 벨, 아콰피나, 키건마이클 키 등이 있다. 연예인 목소리 외에 몇 가지 일반 음성 옵션도 제공된다. 유명 연예인 목소리 서비스는 이번 주 미국과 기타 영어권 시장에서 페이스북, 인스타그램, 왓츠앱을 포함한 메타의 앱 제품군을 통해 출시된다. 이에 맞서 아마존은 올해로 출시 10년이 된 AI 음성 비서 '알렉사'를 오는 10월 중순께 전면 개편해 선보인다. 알렉사의 업그레이드는 2014년 출시 후 처음으로, 지난해 9월 대규모 개편을 발표한 지 13개월 만이다. 새로운 알렉사는 월 최대 10달러의 구독 서비스를 가입해야 이용할 수 있다. 기존에는 날씨 등 사용자의 간단한 질문에 음성으로 답하는 것에 그쳤으나, 앞으로는 대규모 언어 모델(LLM)을 기반으로 생성형 AI를 통합해 복잡한 질문에도 답할 수 있게 된다. 특히 이용자의 선호도에 따라 생성한 뉴스 요약이 매일 제공되는 '스마트 브리핑' 기능이 탑재될 것으로 보여 기대감을 키우고 있다. 삼성전자도 AI 비서 '빅스비'의 활용도를 높이기 위해 지난달 26일 업데이트를 실시했다. 자연어 기반으로 맥락을 이해하는 음성 명령으로 가전 제품을 쉽게 제어할 수 있도록 한 것이다. 이를 통해 ▲한 문장에 여러가지 명령을 담아 말해도 가전제품이 각 의도를 이해할 수 있고 ▲앞의 대화를 기억해 다음 명령까지 연결해 수행할 수 있으며 ▲기기 관련 궁금증과 답변을 말로 묻고 바로 확인할 수 있다. 구글도 지난달 13일 '메이드 바이 구글 2024'를 통해 자연스러운 대화가 가능한 AI 음성 비서 '제미나이 라이브'를 공개했다. 제미나이 라이브를 활용하면 개인 트레이너가 보낸 이메일을 바탕으로 운동 계획을 세워달라고 요청하거나, 유튜브 콘텐츠 내용과 관련해 궁금한 것을 옆사람과 대화하듯 물어볼 수 있다. 목소리도 10가지로 선택 가능하다. 월 구독료는 19.99달러(약 2만7천원)로, 구글 픽셀폰뿐 아니라 삼성전자 갤럭시폰에서도 이용할 수 있다. 구글은 수 주 안에 '아이폰'에도 이를 사용할 수 있도록 지원할 계획이다. 애플은 자체 개발한 AI 시스템 '애플 인텔리전스'를 탑재한 음성 비서 '시리'를 내년 1월께 출시할 것으로 알려졌다. '시리'는 애플이 지난 2011년 선보인 서비스로, 이용자 요청에 타이머나 알람 설정, 날씨 등을 음성으로 알려준다. 그러나 오픈AI의 GPT-4o처럼 깊이 있는 양방향 소통은 그간 불가능했다. 한국에서는 내년 3월경 애플 인텔리전스를 사용할 수 있을 것으로 보인다. 에릭 슈미트 구글 전 최고경영자(CEO) 등이 투자한 프랑스 비영리 AI 연구소 큐타이는 지난 7월 인간 감정을 이해하는 음성 비서 '모시'를 공개했다. 공개된 모델은 70가지 감정과 스타일로 인간처럼 대화할 수 있는 게 특징이다. 이처럼 생성형 AI를 활용한 음성 AI 비서 시장에서 빅테크들의 경쟁이 치열해지면서 관련 시장에 대한 전망도 긍정적이다. 실제 일본 시장조사기관 글로벌 인포메이션에 따르면 AI와 머신러닝(ML)을 사용하는 지능형 가상비서(IVA)의 올해 시장 규모는 147억7천만 달러(약 20조1천억원)로 추정된다. 2023~2030년 연평균 성장률(CAGR)은 26.2%로, 2030년 시장 규모는 474억 달러(약 64조6천억원)에 달할 것으로 전망된다. 업계 관계자는 "생성형 AI 음성 비서가 앞으로 돈이 될 것으로 보고 빅테크들을 중심으로 앞 다퉈 서비스를 내놓고 있는 분위기"라며 "듣고 말하는 AI가 전 산업에 걸쳐 가져올 변화는 가늠하기 어려울 정도"라고 밝혔다. 그러면서 "다만 AI 비서 개발을 위해서는 개인정보와 편향성, 윤리적인 문제도 함께 고려돼야 할 것"이라고 덧붙였다.

2024.09.25 10:42장유미

"녹음 잡음 AI로 삭제"…녹음 음성 분리 AI, 英 법정서 채택

녹음 파일에서 여러 사람의 목소리가 섞여 음성을 제대로 인식하지 못하는 '칵테일파티 문제'가 곧 법정에서도 해결될 것으로 보인다. 6일 BBC 등 외신에 따르면 최근 영국 법정은 '칵테일파티 효과'와 '칵테일파티 문제' 해결을 위해 웨이브 사이언스에서 만든 인공지능(AI) 솔루션을 활용했다. 기존의 경우 잡음으로 인해 녹음 파일이 제대로 된 증거로 채택되지 못했는데 이 솔루션으로 문제가 개선됐다는 것이 외신들의 분석이다. 칵테일파티 효과는 많은 사람이 모여서 이야기할 때 인간의 감각기관이 한 가지 대화에만 집중해서 듣는 것을 의미한다. 이와 달리 로봇이나 기존 AI가 인간처럼 관심 있는 대화를 선택해서 듣지 못하는 문제를 칵테일파티 문제로 칭한다. 웨이브 사이언스는 지난해 말 정부 연구실에서 오디오 포렌식 및 음향 분석 소프트웨어(SW) 앱을 출시한 바 있다. 소리가 마이크나 귀에 도달하기 전 방 안에서 어떻게 반사되는지 분석할 수 있는 AI도 만들었다. 외신은 이 녹음 음성 분리 SW와 AI가 미국에서 발생한 살인 사건의 과학 수사에 쓰였으며 이를 통해 나온 증거가 유제 판결에 결정적 역할을 했다고 보도했다. 이들의 기술은 더욱 발전 중이다. 웨이브 사이언스의 최근 알고리즘 테스트 결과에 따르면 이들의 음성 분리 시스템은 마이크가 두 개뿐이어도 인간의 귀와 같은 성능을 보일 정도로 발전했으며 마이크가 더 많을수록 성능은 향상되는 결과를 보였다고 밝혔다. 키스 맥엘빈 웨이브 사이언스 창립자는 "사람의 목소리를 음성 분리하는 건 음향학에서 고전적인 난제 중 하나였다"면서도 "우리의 테스트에서 나온 결과는 인간의 청력과 매우 유사한 결과를 보였다"고 강조했다. 이어 "우리는 인간의 뇌가 동일한 시스템으로 운영되고 있다고 생각한다"며 "칵테일파티 문제를 해결하며 뇌에서 어떤 과정을 거치는지 발견하는 계기가 될 수 있다고 생각한다"고 말했다.

2024.09.06 10:56양정민

"애플·삼성·아마존도 난리"…감정 읽는 AI 비서, 누가 더 잘 할까

생성형 인공지능(AI)을 탑재한 'AI 비서'가 최근 우후죽순 쏟아지면서 글로벌 빅테크의 새로운 격전지가 되고 있다. AI의 휴대형, 개인화 현상이 짙어진 탓에 'AI 비서'와 관련된 기술들이 빠른 속도로 개발되며 시장의 새로운 성장동력이 되고 있다는 평가다. 31일 업계에 따르면 아마존은 올해로 출시 10년이 된 AI 음성 비서 '알렉사'를 오는 10월 중순께 전면 개편해 선보인다. 알렉사의 업그레이드는 2014년 출시 후 처음으로, 지난해 9월 대규모 개편을 발표한 지 13개월 만이다. 새로운 알렉사는 월 최대 10달러의 구독 서비스를 가입해야 이용할 수 있다. 기존에는 날씨 등 사용자의 간단한 질문에 음성으로 답하는 것에 그쳤으나, 앞으로는 대규모 언어 모델(LLM)을 기반으로 생성형 AI를 통합해 복잡한 질문에도 답할 수 있게 된다. 특히 이용자의 선호도에 따라 생성한 뉴스 요약이 매일 제공되는 '스마트 브리핑' 기능이 탑재될 것으로 보여 기대감을 키우고 있다. 삼성전자도 AI 비서 '빅스비'의 활용도를 높이기 위해 지난 26일 업데이트를 실시했다. 자연어 기반으로 맥락을 이해하는 음성 명령으로 가전 제품을 쉽게 제어할 수 있도록 한 것이다. 이를 통해 ▲한 문장에 여러가지 명령을 담아 말해도 가전제품이 각 의도를 이해할 수 있고 ▲앞의 대화를 기억해 다음 명령까지 연결해 수행할 수 있으며 ▲기기 관련 궁금증과 답변을 말로 묻고 바로 확인할 수 있다. 구글도 지난 13일 '메이드 바이 구글 2024'를 통해 자연스러운 대화가 가능한 AI 음성 비서 '제미나이 라이브'를 공개했다. 제미나이 라이브를 활용하면 개인 트레이너가 보낸 이메일을 바탕으로 운동 계획을 세워달라고 요청하거나, 유튜브 콘텐츠 내용과 관련해 궁금한 것을 옆사람과 대화하듯 물어볼 수 있다. 목소리도 10가지로 선택 가능하다. 월 구독료는 19.99달러(약 2만7천원)로, 구글 픽셀폰뿐 아니라 삼성전자 갤럭시폰에서도 이용할 수 있다. 구글은 수 주 안에 '아이폰'에도 이를 사용할 수 있도록 지원할 계획이다. 애플은 첫 AI폰 '아이폰16' 시리즈에 오픈AI의 'GPT-4o'를 적용한 AI 음성비서 '시리'를 탑재할 것으로 알려졌다. '시리'는 애플이 지난 2011년 선보인 서비스로, 이용자 요청에 타이머나 알람 설정, 날씨 등을 음성으로 알려준다. 오픈AI의 GPT-4o처럼 깊이 있는 양방향 소통은 그간 불가능했다. 오픈AI는 지난 5월 보고 듣고 대화할 수 있는 'GPT-4o'를 공개한 후 시장을 이끌고 있다는 평가를 받고 있다. GPT-4o는 텍스트를 통해 대화했던 기존 챗GPT와 달리 이용자와 실시간 음성 대화를 통해 질문을 받고 답변을 내놓는다. 텍스트·음성뿐 아니라 이미지 인식 기능까지 갖춘 멀티모달(Multimodal) 모델로, 사람이 말하는 내용이나 보여주는 이미지를 즉각 이해하고 이에 걸맞은 답을 할 수 있다. 업계 관계자는 "알렉사, 시리, 빅스비 등 기존 음성 비서 서비스들은 음성을 텍스트로 바꿔서 인식하고 답변도 텍스트로 먼저 만든 다음 음성으로 합성하는 식이었다"며 "이제는 음성을 음성 그 자체로 인식해 처리 과정이 빨라진 데다 목소리에 담긴 감정이나 배경이 섞인 소리도 알아차릴 수 있게 됐다는 점에서 상당한 기술 차이가 있다"고 설명했다. 이처럼 생성형 AI를 활용한 음성 AI 비서 시장에서 빅테크들의 경쟁이 치열해지면서 관련 시장에 대한 전망도 긍정적이다. 실제 일본 시장조사기관 글로벌 인포메이션에 따르면 AI와 머신러닝(ML)을 사용하는 지능형 가상비서(IVA)의 올해 시장 규모는 147억7천만 달러(약 20조1천억원)로 추정된다. 2023~2030년 연평균 성장률(CAGR)은 26.2%로, 2030년 시장 규모는 474억 달러(약 64조6천억원)에 달할 것으로 전망된다. 업계 관계자는 "생성형 AI 음성 비서가 앞으로 돈이 될 것으로 보고 빅테크들을 중심으로 앞 다퉈 서비스를 내놓고 있는 분위기"라며 "듣고 말하는 AI가 전 산업에 걸쳐 가져올 변화는 가늠하기 어려울 정도"라고 밝혔다. 그러면서 "다만 AI 비서 개발을 위해서는 개인정보와 편향성, 윤리적인 문제도 함께 고려돼야 할 것"이라고 덧붙였다.

2024.08.31 12:00장유미

"모든 업무를 음성으로"…구글, '제미나이 라이브' 공개

구글이 영화 아이언맨에 등장한 자비스처럼 음성으로 업무를 처리할 수 있도록 돕는 인공지능(AI) 비서를 출시했다. 테크크런치 등 외신에 따르면 구글은 13일(현지시간) 미국 캘리포니아주 마운틴 뷰에서 열린 '메이드 바이 구글' 이벤트에서 제미나이 라이브를 공개했다. 제미나이 라이브는 기존 제미나이에 음성 대화 기능을 추가한 AI챗봇이다. 사용자들이 다양한 환경에서 자유롭게 활용할 수 있도록 안드로이드와 iOS 등 모바일 환경을 기반으로 제작됐다. 다만 제미나이 어드밴스드 구독자를 대상으로 안드로이드 영문 버전을 우선적으로 지원하며 몇 주 내에 iOS와 추가 언어를 지원할 예정이다. 구글은 제미나이 라이브에 향상된 음성 엔진을 적용해 일관되고 표현력이 풍부하며 현실적으로 사용자와 대화가 가능하다고 밝혔다. 또한 챗봇이 답변하는 도중에 후속 질문을 하더라도 바로 대응할 수 있을 뿐 아니라 실시간으로 사용자의 음성 패턴을 학습해 답변속도를 조절하고 입력 정확도를 높이는 것도 가능하다. 더불어 백그라운드 앱으로 전환해 스마트폰이 잠긴 상태에서도 계속 대화를 이어갈 수도 있다. 구글 측은 이를 이용해 채용담당자와 구직면접을 하는 연습을 하거나 함께 브레인스토밍을 하며 아이디어를 떠올릴 수 있을 뿐 아니라 다양한 앱을 연계해 업무를 개선할 수 있다고 설명했다. 업무 일정을 제미나이에게 알리면 자동으로 캘린더에 해당 일정을 입력할 뿐 아니라 관계자들에게 내용을 전달하고 필요한 리스트까지 자동으로 작성한다. 이 과정에서 제미나이를 넘어 지메일이나 구글 메시지 등 여러 앱을 자연스럽게 연계해 활용할 수 있다. 구글의 시시 샤오 제미나이 익스피리언스 및 구글 어시스턴트 부사장은 "제미나이는 모든 구글 앱, 도구와 통합해 한 번에 업무를 수행할 수 있도록 지원한다"며 "우리는 AI 기반 어시스턴트의 지원이 불편함을 넘어서는 전환점을 넘어섰다고 생각하며 픽셀9에서 제미나이를 경험해 보길 기대한다"고 말했다.

2024.08.14 08:59남혁우

리턴제로, '콜라보' 처리 회의 수 2만 건 돌파

음성인식 AI스타트업 리턴제로(대표 이참솔)가 자사의 회의록 자동 작성 서비스인 콜라보가 처리한 회의가 총 2만 건을 돌파했다고 6일 밝혔다. 콜라보는 리턴제로의 AI 음성인식 기술을 통해 회의 내용을 자동으로 기록해주고 요약하는 기업전용(B2B) 서비스다. 리턴제로의 콜라보는 2023년 4월 정식 출시해 서비스를 시작한 후 1년 여만에 처리 회의 수 2만 건을 돌파했다. 요약 처리된 회의 총 누적 시간은 1만1천 시간이 넘는다. 월단위로 계산한다면, 콜라보는 1달에 약 1천300개 이상의 회의를 처리한 셈이다. 콜라보는 온오프라인 회의와 인터뷰 등 비즈니스 관련 업무 기록에 최적화돼 있다. 구글 밋이나 줌, MS 팀스 등 통상적인 화상회의 플랫폼에서 사용이 가능하고, 세일즈포스·슬랙·재피어 등 다양한 업무 툴과도 연동이 가능하다. 모바일 앱으로도 구현돼 이용자들이 언제 어디서든 손쉽게 이용할 수 있다. 또 30분 분량의 회의를 30초 만에 요약해 회의 전체를 요약하고, 주요 논의사항·회의 후 할일 목록 및 발화자 구분·발화 비율 분석 등 다양한 기능을 제공한다. 특히 콜라보는 성능 면에서 큰 강점을 보이는 게 특징이다. 최근 업데이트한 LLM(거대언어모델) 모델에 리턴제로가 자체적으로 구현한 음성인식 엔진을 결합해, 비정형 데이터인 회의 텍스트 분석에 높은 정확성과 속도를 보인다. 실제로 사람이 수기로 작성할 경우 30분 이상의 시간이 소요되는 회의록 정리를 30초 만에 해결할 수 있다. 연내에는 회의 목적에 따라 필요한 정보를 구분해 추출하는 '회의 유형별 맞춤 요약' 기능을 출시할 예정이다. 이참솔 리턴제로 대표는 "리턴제로는 앞으로도 사람들의 일상을 윤택하게 만들고, 다양한 산업 현장의 인공지능 전환도 선도할 실용적인 서비스를 선보일 것"이라고 말했다.

2024.08.06 18:09백봉삼

  Prev 1 2 Next  

지금 뜨는 기사

이시각 헤드라인

폴더블 아이폰, 펀치홀 카메라 탑재 유력

배민·요기요, 먹통 뒤 정상화..."금요일 밤 비 내린 탓"

과학자들, 납으로 금 만들었다…'연금술사의 꿈' 실현되나

"북한 해커, 위장취업해 北 송금"…메일 1천개 적발

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현