• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
창간특집
인공지능
배터리
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'제미나이 라이브'통합검색 결과 입니다. (3건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

[AI는 지금] 앤트로픽도 'AI 음성 비서' 경쟁 가세…오픈AI·아마존·애플·삼성 넘을까

'오픈AI 대항마'로 꼽히는 앤트로픽이 자사 인공지능(AI) 챗봇인 '클로드'를 활용한 새로운 음성 비서 제품을 출시한다. 생성형 AI를 탑재한 'AI 음성 비서'가 최근 우후죽순 쏟아지면서 글로벌 빅테크의 새로운 격전지가 된 가운데 앤트로픽이 존재감을 키울 수 있을 지 주목된다. 16일 블룸버그통신에 따르면 앤트로픽은 '음성 모드'라고 불리는 새로운 기능을 이르면 이달 중 출시할 것으로 알려졌다. 음성 지원 기능의 도입으로 텍스트 입력 방식보다 훨씬 자연스럽게 AI와 소통할 수 있을 것으로 보인다. 초기에는 제한적인 서비스만 선보일 예정으로, '에어리'와 '멜로우', 영국식 억양의 '버터리' 등 세 가지 음성을 도입할 것으로 전해졌다. 앞서 앤트로픽은 '클로드'에 음성 기능을 추가하기 위해 음성 AI 스타트업 일레븐랩스, 아마존과 협력 중이란 소식이 전해진 바 있다. 앤트로픽 경영진도 음성 옵션을 개발 중이라고 밝힌 바 있지만, 구체적인 출시 일정과 세부 사항은 알려지지 않았다. 앤트로픽의 '음성 모드' 출시 소식은 앱 연구원 M1아스트라(M1Astra)가 앤트로픽의 코드에서 발견해 블룸버그통신에 공유하며 드러났다. 앤트로픽은 이번 일에 대해 공식 입장을 밝히지 않았다. 업계에선 앤트로픽의 이 같은 행보가 경쟁사인 오픈AI와의 격차를 줄이기 위한 움직임으로 해석했다. 앤트로픽이 최근 '클로드 리서치'란 기능을 추가한 것도 지난 2월 발표된 오픈AI '딥 리서치'를 견제하기 위한 것으로 보는 시각이 많다. 이 외에 구글 '제미나이', 미스트랄 '르샤' 역시 웹 검색 기능을 제공하고 있다. 여기에 앤트로픽은 클로드 이용자가 업무를 간소화할 수 있도록 지메일(Gmail), 구글 캘린더, 구글 문서도구에서 검색할 수 있는 기능도 조만간 추가할 예정으로, 기능 강화를 통해 시장 주도권을 잡겠다는 방침이다. 업계 관계자는 "앤트로픽의 음성 기능 도입은 경쟁사들에 비해 다소 늦은 편"이라며 "오픈AI, 구글, xAI 등은 이미 음성 기능을 공개했고 메타도 음성 모드를 강화한 '라마4'를 준비 중"이라고 말했다. 일각에선 앤트로픽이 경쟁사에 비해 다소 늦게 음성 기능을 도입한 만큼 경쟁사들보다 존재감을 더 드러낼 수 있을지 의문을 드러내기도 했다. 현재 AI 음성 비서 시장은 세계 최대 전자상거래 업체 아마존의 '알렉사 플러스'와 삼성전자 '빅스비', 구글 '제미나이 라이브', 애플 '시리' 등과 함께 오픈AI가 경쟁을 벌이고 있다. 특히 지난해 오픈AI의 GPT-4o 등장 후 AI 음성 비서 시장은 빠르게 기술 고도화가 진행되고 있다. 업계 관계자는 "알렉사, 시리, 빅스비 등 기존 음성 비서 서비스들은 음성을 텍스트로 바꿔서 인식하고 답변도 텍스트로 먼저 만든 다음 음성으로 합성하는 식이었다"며 "GPT-4o 이후에는 음성을 음성 그 자체로 인식해 처리 과정이 빨라진 데다 목소리에 담긴 감정이나 배경이 섞인 소리도 알아차릴 수 있게 됐다는 점에서 상당한 기술 차이가 있다"고 설명했다. 이처럼 생성형 AI를 활용한 음성 AI 비서 시장에서 빅테크들의 경쟁이 치열해지면서 관련 시장에 대한 전망도 긍정적이다. 실제 일본 시장조사기관 글로벌 인포메이션에 따르면 AI와 머신러닝(ML)을 사용하는 지능형 가상비서(IVA)의 지난해 시장 규모는 147억7천만 달러(약 20조1천억원)로 추정됐다. 2023~2030년 연평균 성장률(CAGR)은 26.2%로, 2030년 시장 규모는 474억 달러(약 64조6천억원)에 달할 것으로 전망된다. 업계 관계자는 "생성형 AI 음성 비서가 앞으로 돈이 될 것으로 보고 빅테크들을 중심으로 앞 다퉈 서비스를 내놓고 있는 분위기"라며 "듣고 말하는 AI가 전 산업에 걸쳐 가져올 변화는 가늠하기 어려울 정도"라고 밝혔다. 블룸버그통신은 "음성 비서는 사람들이 챗봇과 상호작용하는 방식을 바꾸고 사용자의 생산성을 높일 수 있다는 기대와 함께 오픈AI, 구글과 같은 AI 개발 업체의 핵심 기능으로 부상했다"며 "하지만 AI 음성 제품의 등장으로 다른 사람의 말투를 흉내 내는 것에 대한 우려도 커지고 있다"고 지적했다.

2025.04.16 16:12장유미

"모든 업무를 음성으로"…구글, '제미나이 라이브' 공개

구글이 영화 아이언맨에 등장한 자비스처럼 음성으로 업무를 처리할 수 있도록 돕는 인공지능(AI) 비서를 출시했다. 테크크런치 등 외신에 따르면 구글은 13일(현지시간) 미국 캘리포니아주 마운틴 뷰에서 열린 '메이드 바이 구글' 이벤트에서 제미나이 라이브를 공개했다. 제미나이 라이브는 기존 제미나이에 음성 대화 기능을 추가한 AI챗봇이다. 사용자들이 다양한 환경에서 자유롭게 활용할 수 있도록 안드로이드와 iOS 등 모바일 환경을 기반으로 제작됐다. 다만 제미나이 어드밴스드 구독자를 대상으로 안드로이드 영문 버전을 우선적으로 지원하며 몇 주 내에 iOS와 추가 언어를 지원할 예정이다. 구글은 제미나이 라이브에 향상된 음성 엔진을 적용해 일관되고 표현력이 풍부하며 현실적으로 사용자와 대화가 가능하다고 밝혔다. 또한 챗봇이 답변하는 도중에 후속 질문을 하더라도 바로 대응할 수 있을 뿐 아니라 실시간으로 사용자의 음성 패턴을 학습해 답변속도를 조절하고 입력 정확도를 높이는 것도 가능하다. 더불어 백그라운드 앱으로 전환해 스마트폰이 잠긴 상태에서도 계속 대화를 이어갈 수도 있다. 구글 측은 이를 이용해 채용담당자와 구직면접을 하는 연습을 하거나 함께 브레인스토밍을 하며 아이디어를 떠올릴 수 있을 뿐 아니라 다양한 앱을 연계해 업무를 개선할 수 있다고 설명했다. 업무 일정을 제미나이에게 알리면 자동으로 캘린더에 해당 일정을 입력할 뿐 아니라 관계자들에게 내용을 전달하고 필요한 리스트까지 자동으로 작성한다. 이 과정에서 제미나이를 넘어 지메일이나 구글 메시지 등 여러 앱을 자연스럽게 연계해 활용할 수 있다. 구글의 시시 샤오 제미나이 익스피리언스 및 구글 어시스턴트 부사장은 "제미나이는 모든 구글 앱, 도구와 통합해 한 번에 업무를 수행할 수 있도록 지원한다"며 "우리는 AI 기반 어시스턴트의 지원이 불편함을 넘어서는 전환점을 넘어섰다고 생각하며 픽셀9에서 제미나이를 경험해 보길 기대한다"고 말했다.

2024.08.14 08:59남혁우

골프 중계도 척척...구글 '제미나이' 체험해보니

"침착하게 퍼팅을 시도하는 선수, 첫 번재 샷은 홀을 살짝 빗겨갑니다. 하지만 아직 기회는 많이 남아있습니다." "두 번째 샷! 아, 이번에도 아쉽게 홀을 벗어납니다! 마음처럼 쉽지 않은 경기입니다!" 2일 오후 '구글 마케팅 라이브 2024' 골프 위드 제미나이 체험 부스. 기자가 마지막 퍼팅을 마치자, 약 3분 만에 경기 해설 텍스트가 스크린에 나타났다. 인간 해설가가 아닌 '제미나이 해설가'가 만들어낸 멘트다. 제미나이는 구글에서 개발한 인공지능(AI) 모델이다. 텍스트, 이미지, 오디오, 동영상 등 다양한 형태의 정보를 분석하고 처리할 수 있다. '제미나이 해설가' 시범 버전을 개발한 구글 임현욱 디벨로퍼 애드버킷은 "웹캠이 경기 모습을 촬영해 공이 어떻게 움직이는지 파악함으로써 제미나이가 중계를 하게 만드는 시스템"이라며 "제미나이가 더 풍성한 어휘력으로 상황을 실감 나게 묘사할 수 있다는 것에 집중한 대목"이라고 설명했다. 이날 구글은 '구글 마케팅 라이브 2024'에서 3개의 부스를 통해 다양한 분야에서 활용가능한 제미나이 기술을 소개했다. 골프 위드 제미나이 체험 부스를 비롯해 AI 기반 화상 회의 체험 부스, 음원·이미지·비디오 생성 체험 부스 등이 운영됐다. "마케팅 전략에 대해 설명해주시겠어요?" AI 기반 화상 회의 부스에서 기자가 한국어로 말을 걸자 구글 외국인 마케터가 영어로 답했다. 서로가 각자의 언어로 이야기를 해도 대화가 실시간으로 번역돼 자막으로 나타났다. 원활한 소통이 가능했다. 구글 관계자는 "현재 온라인 회의가 매우 익숙해졌지만, 그만큼 온라인 회의의 한계도 있다"며 "구글은 전 세계인이 자유롭게 장벽 없이 소통하는 것을 목표로 하고 있다"고 말했다. 회의 부스 옆에 놓인 노트북으로는 제미나이 챗봇을 이용할 수 있었다. 챗봇에게 후두염에 좋은 음식을 추천해달라고 요청해 봤다. 챗봇은 약 5초 후 생강, 꿀, 배 등 7개 음식에 대한 설명을 내놓았다. 증상이 심하거나 오래 지속될 경우 병원 진료를 받으라는 주의점도 함께 제공했다. 음원·이미지·비디오 생성 체험 부스에서는 생성형 AI 기술을 바탕으로 개발된 뮤직FX, 이미지FX, 비디오FX를 선보였다. 뮤직FX는 텍스트를 음원으로 생성하는 기구다. 키워드 입력 후 생성 버튼을 누르면 AI가 30초~70초 길이의 음원을 만든다. 기자가 'Instrumental background sounds for a long walk on the beach(해변에서 산책할 때 듣기 좋은 음악)'을 입력하자 약 15초만에 30초 내외 길이의 음원 6개가 제작됐다. 이미지FX는 텍스트를 이미지로 생성하는 기구다. 프롬프트(AI에게 제시하는 텍스트)의 핵심 키워드를 바탕으로 최대 4가지 이미지를 생성한다. 생성된 이미지에 대해 색상, 화각 등 키워드를 추가해서 사진을 수정할 수도 있다. 비디오FX는 생성형 AI 기반 영상 제작 도구다. 프롬프트(AI에게 제시하는 텍스트)를 통해 제작을 원하는 영상 설명을 제시하면 1분 이상의 영상을 제작해 준다. '선명한 색상의 크로셰로 만든 코끼리, 사바나를 걷고 있는 모습', '하와이 정글 해안선을 따라 찍은 드론 샷, 맑은 날, 물 위에 카약 여러 개 추가' 등 프롬프트가 담고 있는 분위기까지 반영한 영상 제작이 가능하다. 구글코리아 김경훈 사장은 "마케터들이 활용할 수 있는 다양한 AI 기반 솔루션을 제공해 광고주, 대행사, 크리에이터 등 모든 파트너들이 AI 시대에 더 큰 성과를 창출하도록 돕겠다"고 밝혔다.

2024.07.03 10:00조수민

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

5천억 짜리 과제, 전화로 5분 평가..."이제 그만, 새 틀 짜자"

스마트폰 美 25% 관세 리스크…삼성 언팩 앞두고 '고심'

"2030년 기업용 PC 10대 중 1대는 AI 기반 워크스테이션"

日 다이소, '쓰리피' 이름으로 韓 시장 재진출하나

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현