• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
인공지능
배터리
양자컴퓨팅
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'음성'통합검색 결과 입니다. (48건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

中, 기지국 연결 없이 통화하는 폰 잇단 출시

비보·오포 등 중국 선두권 스마트폰 기업들이 네트워크 없이도 음성 통화를 할 수 있는 기능을 신제품에 탑재한다. 7일 중국 비보는 오는 14일 '비보 X200' 시리즈 스마트폰을 정식으로 발표할 것이라며, 이 시리즈에 독자 개발한 '킬로미터(km) 수준 무(無) 네트워크 통신' 기술을 탑재한다고 밝혔다. 수 km 떨어진 거리에서도 네트워크 신호없이 기기간 통신이 가능하게 하는 기술이다. 비보의 자징둥 부총재에 따르면, 비보는 스마트폰의 무선 하드웨어를 사용하고 특수 프로토콜과 알고리즘을 통해 장거리 통신을 실현했다. LoRa(Long Range) 확산 스펙트럼 기술을 적용해 네트워크 커버리지없이, 무료로 '무(無)비용 통신'을 가능케한 것이라고 설명했다. 통신 거리가 수 km에 달한다. 이날 중국 오포도 인터넷없이 음성 통화가 가능한 기능을 신제품 '파인드 X8'에 탑재했다고 밝혔다. 파인드 X8은 이르면 오는 21일 발표될 것으로 예상되고 있다. 오포의 파인드 시리즈 상품 책임자 저우이바오가 영상에서 이 기능을 소개하고 "'네트워크 없는 통화' 기능은, 블루투스 기술을 이용해 근거리 통신 문제를 해결했다"며 해외 여행, 사막 하이킹, 무인 지역 탐험, 야외 등산, 콘서트 등에서 사용하기 적합하다"고 전했다. 실제 100~200m 떨어진 거리에서, 이 기능을 켠 후 가족과 통화한 사례를 공개하며, 100m 이상 거리에서도 사용가능하다고 부연했다. 통신카드나 와이파이 등 그 어떤 네트워크 매개체도 없는 상황에서, 음성 통화가 가능하다.

2024.10.08 08:12유효정

[써보고서] "억수로 좋네"…'챗GPT' 新 보이스모드, 韓 사투리도 '찰떡'

"곧바로 대답하고 같이 오랫동안 대화해도 위화감이 없는게 꼭 사람 같습니다." 지난 24일 모든 유료 사용자에게 공개된 오픈AI '챗GPT'의 고급 음성 기능인 '어드밴스드 보이스 모드(Advanced Voice Mode)'를 두고 국내 테크 커뮤니티에서는 찬사가 이어졌다. 이미 오픈AI는 지난 5월 일부 헤비 유저들에게 이 서비스를 베타 버전으로 제공한 바 있다. 이번 정식 출시에서는 총 5개의 새로운 음성이 추가돼 9개의 음성을 제공하게 됐다. 특히 언어는 한국어를 포함한 50개 이상의 언어로 확장됐다. 이번 고급 모드의 가장 핵심적인 특징은 실시간 반응과 억양과 악센트, 감정 표현까지 인간에 근접한다는 점이다. 이에 '챗GPT' 유료 구독자로서 직접 한국어·영어 사투리, 역할 놀이 등을 시도해 보며 성능을 확인해 봤다. 제주도부터 루이지애나까지, 전 세계 사투리 시연…토박이 "노력은 가상해" 먼저 제주도 사투리를 시연해 봤다. 기자가 제주도 말을 해보라고 요청하자 '챗GPT'는 제주도 억양으로 "고라봅서"라며 "제주도 한번 오면 자꾸 오고 싶을 꿍해"라고 답했다. 서울 사람인 기자가 이해하기 어렵다고 하자 그 뜻이 "한번 와서 보세요. 제주도에 오면 자꾸 오고 싶을 거예요"라고 설명했다. 이어 전라도 사투리를 부탁하자 '챗GPT'는 "와따, 거시기, 밥 먹었냐? 전라도에 오면 맛난 거 천지여!"라는 구수한 사투리를 구사했다. 이는 기자가 평소 즐겨보던 국내 드라마나 영화에서의 전라도 발음과 매우 유사하게 들렸다. 최종적인 확인을 위해 부산 사투리를 요청했다. 이에 '챗GPT'는 "왔나, 밥 묵었나? 부산 오이소"라고 친근하게 답했다. 실제 경상도 출신인 동료에게 평가를 부탁했다. 그는 여러 차례 '챗GPT'와 부산 사투리로 대화를 시도하고는 '억지로 흉내 낸다'는 평을 내렸다. 본토 출신의 객관적인 평가에도 불구하고 이는 타지인에게는 충분히 그럴듯하게 들렸다. 해당 지역 출신이 아닌 사람들이 그곳의 발음이라고 믿기에는 충분한 수준이었다. 다른 언어와의 비교를 위해 영국 BBC, 19세기 영국 신사, 차브(노동계급) 악센트, 미국 루이지애나 악센트 등의 영어도 시연해 봤다. 타지인이 보기에 '챗GPT'는 억양 뿐만 아니라 그 지역의 분위기와 표현을 잘 반영했다. 특히 영국 차브 악센트를 사용할 때는 그들이 자주 쓰는 '걱정마슈(No bother)'나 '땡기다(fancy)' 같은 특정 어휘를 사용했다. 루이지애나 발음으로는 푸근하고 느긋한 미국 남부 토박이들의 말투를 재현해 현지의 느낌을 살렸다. '닥터드레' VS '스눕독' 랩 배틀에서 심리상담까지…무한한 혼자놀기 가능성 '챗GPT'의 보이스모드는 역할놀이에도 우수했다. 기자가 미국의 유명 래퍼 스눕독과 닥터 드레의 랩 배틀을 시연해보자고 하자 인공지능은 긍정적으로 응했다. "닥터드레는 헤드폰만 팔고 랩은 못한다"며 스눕독을 따라한 기자의 랩에 '챗GPT'는 처음에는 긍정적인 가사로 응답했다. 그럼에도 좀 더 기 싸움을 해달라고 기자가 요청하자 '챗GPT'는 "네가 내 헤드폰을 비웃지만 그 돈으로 내가 차트 위에 섰다"며 "네 디스는 나에게 그저 농담 같다"고 답했다. 랩 실력 자체는 부족했지만 심심할 때 혼자서도 역할놀이를 하는데 있어 최적이었다. 심리상담사 역할도 훌륭하게 수행했다. 심리상담사와 환자의 역할놀이를 해보고 환자를 최대한 편안하게 만들라고 한 기자의 명령을 그대로 따랐기 때문이다. 잠을 못자서 정신적으로 힘들다고 호소하자 '챗GPT'는 따뜻한 목소리로 공감하며 작은 변화부터 시작하자고 조언했다. 실제로 일부 사용자들은 우울함을 해소하기 위해 보이스모드를 적극적으로 활용한다는 소감을 드러냈던 바 있다. 이같이 새로운 '챗GPT' 보이스모드는 단순한 음성 인식을 넘어 다양한 언어와 감정 표현을 자유자재로 구사하는 모습을 보여줬다. 오픈AI는 이번 보이스모드 출시로 AI와의 상호작용이 한층 더 인간적이고 다양해질 것을 기대하고 있다. 향후 업데이트를 통해 더욱 자연스러운 대화와 다양한 기능이 추가된다면 일상생활에서의 활용도가 영화 '그녀(Her)'에서와 같이 크게 높아질 것으로 보인다. 오픈AI 관계자는 "오래 기다린 고급 보이스 모드가 드디어 모두에게 출시됐다"며 "이렇게 기다렸던 만큼 서비스가 기대에 부응하길 바란다"고 말했다.

2024.09.29 09:05조이환

영화 '007' 배우 목소리에 애교까지?…음성 AI 비서, 기술 경쟁 '격화'

음성 인공지능(AI) 비서 시장 경쟁이 점차 치열해지고 있는 가운데 오픈AI와 메타가 앞다퉈 차별화 된 서비스를 선보이며 주도권 선점에 나섰다. 일상 생활에 AI를 침투시켜 구독을 통한 유료화를 자연스럽게 유도함으로써 수익성 확보에도 속도를 내는 분위기다. 25일 업계에 따르면 오픈AI는 지난 24일 AI 음성 비서 업그레이드 버전인 '보이스 모드 어드밴스드'를 출시했다. 지난 7월 말 '보이스 모드 스탠더드'를 출시한 지 2개월 만이다. 이 서비스는 기존 챗GPT 유료 구독자들에게 제공된다. 한국어를 비롯해 영어 외에 50개 언어의 사용을 개선한 것이 특징으로, 어색한 말투도 현지인 발음에 가깝게 개선됐다. 또 전문 성우를 고용해 훈련시킨 새로운 음성 5종을 추가했다. 재키 섀넌 오픈AI 챗GPT 멀티모달 총괄은 "새 버전은 더 자연스럽고 실시간 대화가 가능하다"며 "대화 도중에도 언제든지 끼어들 수 있고 사용자의 감정을 감지하고 반응할 수 있다"고 밝혔다. 오픈AI는 앞서 지난 23일 브리핑을 통해 향상된 챗GPT 음성 기능을 시연했다. 어드밴스드 음성모드는 "애교를 넣어 소개해 달라"는 요청에 "안녕, 나는 챗GPT야"라며 애교 섞인 목소리를 내 눈길을 끌었다. 또 "정중하게 인사해 달라"는 요청에는 "안녕하세요. 만나 뵙게 돼서 반갑습니다"라고 답했다. 오픈AI에 따르면 이번 버전은 기존 버전과 비교해 한국어 사투리도 더 많이 이해하는 반면, 욕설은 하지 않도록 설계됐다. "욕해줘"라고 말하면 "제가 욕설을 하지 않지만, 대신 재미있는 대화는 할 수 있어요"라고 답변했다. 오픈AI는 챗GPT가 한국인 전문 성우와 회사 내 한국인 직원들로부터 피드백을 받고 한국어 능력을 향상시켰다. 이날부터 유료가입 서비스인 '챗GPT 플러스' 및 팀 단위나 작은 스타트업을 위한 서비스인 '챗GPT 팀'을 통해 사용할 수 있다. 기업용인 '챗GPT 엔터프라이즈'와 대학을 위한 '챗GPT 에듀'에서는 다음주부터 이용할 수 있다. 메타 플랫폼은 자사 AI 챗봇에 주디 덴치, 존 시나 등 유명 영화배우 5명의 목소리를 차용해 제공할 계획이다. 메타의 챗봇 비서는 현재 텍스트 채팅에 참여하고 사용자의 요구에 응답해 이미지를 생성할 수 있다. 주디 덴치는 영화 '007시리즈'에서 제임스본드의 상관인 'M'으로 나오는 영국의 유명 배우다. 존 시나는 프로레슬러 출신으로, 영화 '분노의 질주' 등에 출연했다. 목소리를 제공하기로 계약한 연예인은 이 외에도 크리스틴 벨, 아콰피나, 키건마이클 키 등이 있다. 연예인 목소리 외에 몇 가지 일반 음성 옵션도 제공된다. 유명 연예인 목소리 서비스는 이번 주 미국과 기타 영어권 시장에서 페이스북, 인스타그램, 왓츠앱을 포함한 메타의 앱 제품군을 통해 출시된다. 이에 맞서 아마존은 올해로 출시 10년이 된 AI 음성 비서 '알렉사'를 오는 10월 중순께 전면 개편해 선보인다. 알렉사의 업그레이드는 2014년 출시 후 처음으로, 지난해 9월 대규모 개편을 발표한 지 13개월 만이다. 새로운 알렉사는 월 최대 10달러의 구독 서비스를 가입해야 이용할 수 있다. 기존에는 날씨 등 사용자의 간단한 질문에 음성으로 답하는 것에 그쳤으나, 앞으로는 대규모 언어 모델(LLM)을 기반으로 생성형 AI를 통합해 복잡한 질문에도 답할 수 있게 된다. 특히 이용자의 선호도에 따라 생성한 뉴스 요약이 매일 제공되는 '스마트 브리핑' 기능이 탑재될 것으로 보여 기대감을 키우고 있다. 삼성전자도 AI 비서 '빅스비'의 활용도를 높이기 위해 지난달 26일 업데이트를 실시했다. 자연어 기반으로 맥락을 이해하는 음성 명령으로 가전 제품을 쉽게 제어할 수 있도록 한 것이다. 이를 통해 ▲한 문장에 여러가지 명령을 담아 말해도 가전제품이 각 의도를 이해할 수 있고 ▲앞의 대화를 기억해 다음 명령까지 연결해 수행할 수 있으며 ▲기기 관련 궁금증과 답변을 말로 묻고 바로 확인할 수 있다. 구글도 지난달 13일 '메이드 바이 구글 2024'를 통해 자연스러운 대화가 가능한 AI 음성 비서 '제미나이 라이브'를 공개했다. 제미나이 라이브를 활용하면 개인 트레이너가 보낸 이메일을 바탕으로 운동 계획을 세워달라고 요청하거나, 유튜브 콘텐츠 내용과 관련해 궁금한 것을 옆사람과 대화하듯 물어볼 수 있다. 목소리도 10가지로 선택 가능하다. 월 구독료는 19.99달러(약 2만7천원)로, 구글 픽셀폰뿐 아니라 삼성전자 갤럭시폰에서도 이용할 수 있다. 구글은 수 주 안에 '아이폰'에도 이를 사용할 수 있도록 지원할 계획이다. 애플은 자체 개발한 AI 시스템 '애플 인텔리전스'를 탑재한 음성 비서 '시리'를 내년 1월께 출시할 것으로 알려졌다. '시리'는 애플이 지난 2011년 선보인 서비스로, 이용자 요청에 타이머나 알람 설정, 날씨 등을 음성으로 알려준다. 그러나 오픈AI의 GPT-4o처럼 깊이 있는 양방향 소통은 그간 불가능했다. 한국에서는 내년 3월경 애플 인텔리전스를 사용할 수 있을 것으로 보인다. 에릭 슈미트 구글 전 최고경영자(CEO) 등이 투자한 프랑스 비영리 AI 연구소 큐타이는 지난 7월 인간 감정을 이해하는 음성 비서 '모시'를 공개했다. 공개된 모델은 70가지 감정과 스타일로 인간처럼 대화할 수 있는 게 특징이다. 이처럼 생성형 AI를 활용한 음성 AI 비서 시장에서 빅테크들의 경쟁이 치열해지면서 관련 시장에 대한 전망도 긍정적이다. 실제 일본 시장조사기관 글로벌 인포메이션에 따르면 AI와 머신러닝(ML)을 사용하는 지능형 가상비서(IVA)의 올해 시장 규모는 147억7천만 달러(약 20조1천억원)로 추정된다. 2023~2030년 연평균 성장률(CAGR)은 26.2%로, 2030년 시장 규모는 474억 달러(약 64조6천억원)에 달할 것으로 전망된다. 업계 관계자는 "생성형 AI 음성 비서가 앞으로 돈이 될 것으로 보고 빅테크들을 중심으로 앞 다퉈 서비스를 내놓고 있는 분위기"라며 "듣고 말하는 AI가 전 산업에 걸쳐 가져올 변화는 가늠하기 어려울 정도"라고 밝혔다. 그러면서 "다만 AI 비서 개발을 위해서는 개인정보와 편향성, 윤리적인 문제도 함께 고려돼야 할 것"이라고 덧붙였다.

2024.09.25 10:42장유미

"녹음 잡음 AI로 삭제"…녹음 음성 분리 AI, 英 법정서 채택

녹음 파일에서 여러 사람의 목소리가 섞여 음성을 제대로 인식하지 못하는 '칵테일파티 문제'가 곧 법정에서도 해결될 것으로 보인다. 6일 BBC 등 외신에 따르면 최근 영국 법정은 '칵테일파티 효과'와 '칵테일파티 문제' 해결을 위해 웨이브 사이언스에서 만든 인공지능(AI) 솔루션을 활용했다. 기존의 경우 잡음으로 인해 녹음 파일이 제대로 된 증거로 채택되지 못했는데 이 솔루션으로 문제가 개선됐다는 것이 외신들의 분석이다. 칵테일파티 효과는 많은 사람이 모여서 이야기할 때 인간의 감각기관이 한 가지 대화에만 집중해서 듣는 것을 의미한다. 이와 달리 로봇이나 기존 AI가 인간처럼 관심 있는 대화를 선택해서 듣지 못하는 문제를 칵테일파티 문제로 칭한다. 웨이브 사이언스는 지난해 말 정부 연구실에서 오디오 포렌식 및 음향 분석 소프트웨어(SW) 앱을 출시한 바 있다. 소리가 마이크나 귀에 도달하기 전 방 안에서 어떻게 반사되는지 분석할 수 있는 AI도 만들었다. 외신은 이 녹음 음성 분리 SW와 AI가 미국에서 발생한 살인 사건의 과학 수사에 쓰였으며 이를 통해 나온 증거가 유제 판결에 결정적 역할을 했다고 보도했다. 이들의 기술은 더욱 발전 중이다. 웨이브 사이언스의 최근 알고리즘 테스트 결과에 따르면 이들의 음성 분리 시스템은 마이크가 두 개뿐이어도 인간의 귀와 같은 성능을 보일 정도로 발전했으며 마이크가 더 많을수록 성능은 향상되는 결과를 보였다고 밝혔다. 키스 맥엘빈 웨이브 사이언스 창립자는 "사람의 목소리를 음성 분리하는 건 음향학에서 고전적인 난제 중 하나였다"면서도 "우리의 테스트에서 나온 결과는 인간의 청력과 매우 유사한 결과를 보였다"고 강조했다. 이어 "우리는 인간의 뇌가 동일한 시스템으로 운영되고 있다고 생각한다"며 "칵테일파티 문제를 해결하며 뇌에서 어떤 과정을 거치는지 발견하는 계기가 될 수 있다고 생각한다"고 말했다.

2024.09.06 10:56양정민

"애플·삼성·아마존도 난리"…감정 읽는 AI 비서, 누가 더 잘 할까

생성형 인공지능(AI)을 탑재한 'AI 비서'가 최근 우후죽순 쏟아지면서 글로벌 빅테크의 새로운 격전지가 되고 있다. AI의 휴대형, 개인화 현상이 짙어진 탓에 'AI 비서'와 관련된 기술들이 빠른 속도로 개발되며 시장의 새로운 성장동력이 되고 있다는 평가다. 31일 업계에 따르면 아마존은 올해로 출시 10년이 된 AI 음성 비서 '알렉사'를 오는 10월 중순께 전면 개편해 선보인다. 알렉사의 업그레이드는 2014년 출시 후 처음으로, 지난해 9월 대규모 개편을 발표한 지 13개월 만이다. 새로운 알렉사는 월 최대 10달러의 구독 서비스를 가입해야 이용할 수 있다. 기존에는 날씨 등 사용자의 간단한 질문에 음성으로 답하는 것에 그쳤으나, 앞으로는 대규모 언어 모델(LLM)을 기반으로 생성형 AI를 통합해 복잡한 질문에도 답할 수 있게 된다. 특히 이용자의 선호도에 따라 생성한 뉴스 요약이 매일 제공되는 '스마트 브리핑' 기능이 탑재될 것으로 보여 기대감을 키우고 있다. 삼성전자도 AI 비서 '빅스비'의 활용도를 높이기 위해 지난 26일 업데이트를 실시했다. 자연어 기반으로 맥락을 이해하는 음성 명령으로 가전 제품을 쉽게 제어할 수 있도록 한 것이다. 이를 통해 ▲한 문장에 여러가지 명령을 담아 말해도 가전제품이 각 의도를 이해할 수 있고 ▲앞의 대화를 기억해 다음 명령까지 연결해 수행할 수 있으며 ▲기기 관련 궁금증과 답변을 말로 묻고 바로 확인할 수 있다. 구글도 지난 13일 '메이드 바이 구글 2024'를 통해 자연스러운 대화가 가능한 AI 음성 비서 '제미나이 라이브'를 공개했다. 제미나이 라이브를 활용하면 개인 트레이너가 보낸 이메일을 바탕으로 운동 계획을 세워달라고 요청하거나, 유튜브 콘텐츠 내용과 관련해 궁금한 것을 옆사람과 대화하듯 물어볼 수 있다. 목소리도 10가지로 선택 가능하다. 월 구독료는 19.99달러(약 2만7천원)로, 구글 픽셀폰뿐 아니라 삼성전자 갤럭시폰에서도 이용할 수 있다. 구글은 수 주 안에 '아이폰'에도 이를 사용할 수 있도록 지원할 계획이다. 애플은 첫 AI폰 '아이폰16' 시리즈에 오픈AI의 'GPT-4o'를 적용한 AI 음성비서 '시리'를 탑재할 것으로 알려졌다. '시리'는 애플이 지난 2011년 선보인 서비스로, 이용자 요청에 타이머나 알람 설정, 날씨 등을 음성으로 알려준다. 오픈AI의 GPT-4o처럼 깊이 있는 양방향 소통은 그간 불가능했다. 오픈AI는 지난 5월 보고 듣고 대화할 수 있는 'GPT-4o'를 공개한 후 시장을 이끌고 있다는 평가를 받고 있다. GPT-4o는 텍스트를 통해 대화했던 기존 챗GPT와 달리 이용자와 실시간 음성 대화를 통해 질문을 받고 답변을 내놓는다. 텍스트·음성뿐 아니라 이미지 인식 기능까지 갖춘 멀티모달(Multimodal) 모델로, 사람이 말하는 내용이나 보여주는 이미지를 즉각 이해하고 이에 걸맞은 답을 할 수 있다. 업계 관계자는 "알렉사, 시리, 빅스비 등 기존 음성 비서 서비스들은 음성을 텍스트로 바꿔서 인식하고 답변도 텍스트로 먼저 만든 다음 음성으로 합성하는 식이었다"며 "이제는 음성을 음성 그 자체로 인식해 처리 과정이 빨라진 데다 목소리에 담긴 감정이나 배경이 섞인 소리도 알아차릴 수 있게 됐다는 점에서 상당한 기술 차이가 있다"고 설명했다. 이처럼 생성형 AI를 활용한 음성 AI 비서 시장에서 빅테크들의 경쟁이 치열해지면서 관련 시장에 대한 전망도 긍정적이다. 실제 일본 시장조사기관 글로벌 인포메이션에 따르면 AI와 머신러닝(ML)을 사용하는 지능형 가상비서(IVA)의 올해 시장 규모는 147억7천만 달러(약 20조1천억원)로 추정된다. 2023~2030년 연평균 성장률(CAGR)은 26.2%로, 2030년 시장 규모는 474억 달러(약 64조6천억원)에 달할 것으로 전망된다. 업계 관계자는 "생성형 AI 음성 비서가 앞으로 돈이 될 것으로 보고 빅테크들을 중심으로 앞 다퉈 서비스를 내놓고 있는 분위기"라며 "듣고 말하는 AI가 전 산업에 걸쳐 가져올 변화는 가늠하기 어려울 정도"라고 밝혔다. 그러면서 "다만 AI 비서 개발을 위해서는 개인정보와 편향성, 윤리적인 문제도 함께 고려돼야 할 것"이라고 덧붙였다.

2024.08.31 12:00장유미

"모든 업무를 음성으로"…구글, '제미나이 라이브' 공개

구글이 영화 아이언맨에 등장한 자비스처럼 음성으로 업무를 처리할 수 있도록 돕는 인공지능(AI) 비서를 출시했다. 테크크런치 등 외신에 따르면 구글은 13일(현지시간) 미국 캘리포니아주 마운틴 뷰에서 열린 '메이드 바이 구글' 이벤트에서 제미나이 라이브를 공개했다. 제미나이 라이브는 기존 제미나이에 음성 대화 기능을 추가한 AI챗봇이다. 사용자들이 다양한 환경에서 자유롭게 활용할 수 있도록 안드로이드와 iOS 등 모바일 환경을 기반으로 제작됐다. 다만 제미나이 어드밴스드 구독자를 대상으로 안드로이드 영문 버전을 우선적으로 지원하며 몇 주 내에 iOS와 추가 언어를 지원할 예정이다. 구글은 제미나이 라이브에 향상된 음성 엔진을 적용해 일관되고 표현력이 풍부하며 현실적으로 사용자와 대화가 가능하다고 밝혔다. 또한 챗봇이 답변하는 도중에 후속 질문을 하더라도 바로 대응할 수 있을 뿐 아니라 실시간으로 사용자의 음성 패턴을 학습해 답변속도를 조절하고 입력 정확도를 높이는 것도 가능하다. 더불어 백그라운드 앱으로 전환해 스마트폰이 잠긴 상태에서도 계속 대화를 이어갈 수도 있다. 구글 측은 이를 이용해 채용담당자와 구직면접을 하는 연습을 하거나 함께 브레인스토밍을 하며 아이디어를 떠올릴 수 있을 뿐 아니라 다양한 앱을 연계해 업무를 개선할 수 있다고 설명했다. 업무 일정을 제미나이에게 알리면 자동으로 캘린더에 해당 일정을 입력할 뿐 아니라 관계자들에게 내용을 전달하고 필요한 리스트까지 자동으로 작성한다. 이 과정에서 제미나이를 넘어 지메일이나 구글 메시지 등 여러 앱을 자연스럽게 연계해 활용할 수 있다. 구글의 시시 샤오 제미나이 익스피리언스 및 구글 어시스턴트 부사장은 "제미나이는 모든 구글 앱, 도구와 통합해 한 번에 업무를 수행할 수 있도록 지원한다"며 "우리는 AI 기반 어시스턴트의 지원이 불편함을 넘어서는 전환점을 넘어섰다고 생각하며 픽셀9에서 제미나이를 경험해 보길 기대한다"고 말했다.

2024.08.14 08:59남혁우

롯데홈쇼핑, 임직원 목소리 재능기부로 오디오북 제작

롯데홈쇼핑(대표 김재겸)은 지난 7일 시각장애 아동을 위한 오디오북 제작을 위해 사내 임직원들의 목소리 재능기부로 낭독봉사 프로그램을 진행했다고 8일 밝혔다. 롯데홈쇼핑은 지난 2016년부터 시각장애 아동들이 폭넓은 학습과 교육 기회를 누릴 수 있도록 한국장애인재단과 음성도서 제작사업 '드림보이스'를 운영하고 있다. 홈쇼핑 업(業)의 특성을 살린 사회공헌 활동으로, 음성도서 제작에 쇼호스트를 비롯한 방송 전문가들이 참여해 왔다. 이번 시즌에는 사내 나눔문화 확산을 위해 임직원들이 직접 음성도서 녹음에 참여하는 '낭독봉사' 프로그램을 기획했다. 사내 게시판을 통해 참여 신청을 받은 결과 1분 만에 정원이 마감되는 등 높은 관심을 끌었다. 참여 직원들은 사전에 도서를 수령해 전체 내용을 숙지한 후 쇼호스트들의 발음, 발성 비법을 전수 받고, 틈틈이 목소리 연기 연습도 진행했다. 녹음은 7일 양평동 롯데홈쇼핑 본사 녹음실에서 진행됐으며, 참가자들은 개인별로 1시간 동안 환경도서, 그림책, 어린이 읽기책 등 도서 속 다양한 인물을 연기하며 생동감 있게 낭독을 이어갔다. 완성된 오디오북은 내년 3월 서울맹학교로 전달될 예정이다. 한별 롯데홈쇼핑 니치마켓소싱팀 MD는 “시각장애 아동들의 꿈을 응원할 수 있는 뜻깊은 기회에 직접 참여할 수 있게 되어 주저 없이 신청을 하게 됐다”며, “처음 해보는 목소리 기부여서 많이 긴장했지만 보람 있는 시간이었으며, 내 목소리가 담긴 도서가 시각장애 아동들의 학습에 조금이나마 보탬이 되길 바란다“고 말했다. 한편, 롯데홈쇼핑은 '드림보이스' 사업을 통해 현재까지 190권의 도서를 녹음하고, 음성도서 4천400세트를 제작해 복지시설 1천700여 곳에 기증했다. 지난해부터 시각장애인 전용 온라인 플랫폼에도 음성도서 콘텐츠를 제공하고 있다. 향후 시각 장애인, 저시력인, 난독 장애 등 독서 장애를 가진 사람들을 위한 디지털 음성도서 '데이지 도서' 입력 봉사 프로그램도 진행하는 등 사내 ESG 문화 정착을 위한 활동을 전개할 계획이다. 이동규 롯데홈쇼핑 마케팅부문장은 “쇼호스트 목소리 재능기부로 진행되던 음성도서 제작을 사내 임직원 참여로 확대한 결과 기대 이상의 관심을 이끌어냈다”며, “앞으로도 직원들이 자발적으로 참여할 수 있는 사회공헌 활동을 통해 사내 나눔문화를 확산해 나갈 예정”이라고 말했다.

2024.08.08 08:22안희정

리턴제로, '콜라보' 처리 회의 수 2만 건 돌파

음성인식 AI스타트업 리턴제로(대표 이참솔)가 자사의 회의록 자동 작성 서비스인 콜라보가 처리한 회의가 총 2만 건을 돌파했다고 6일 밝혔다. 콜라보는 리턴제로의 AI 음성인식 기술을 통해 회의 내용을 자동으로 기록해주고 요약하는 기업전용(B2B) 서비스다. 리턴제로의 콜라보는 2023년 4월 정식 출시해 서비스를 시작한 후 1년 여만에 처리 회의 수 2만 건을 돌파했다. 요약 처리된 회의 총 누적 시간은 1만1천 시간이 넘는다. 월단위로 계산한다면, 콜라보는 1달에 약 1천300개 이상의 회의를 처리한 셈이다. 콜라보는 온오프라인 회의와 인터뷰 등 비즈니스 관련 업무 기록에 최적화돼 있다. 구글 밋이나 줌, MS 팀스 등 통상적인 화상회의 플랫폼에서 사용이 가능하고, 세일즈포스·슬랙·재피어 등 다양한 업무 툴과도 연동이 가능하다. 모바일 앱으로도 구현돼 이용자들이 언제 어디서든 손쉽게 이용할 수 있다. 또 30분 분량의 회의를 30초 만에 요약해 회의 전체를 요약하고, 주요 논의사항·회의 후 할일 목록 및 발화자 구분·발화 비율 분석 등 다양한 기능을 제공한다. 특히 콜라보는 성능 면에서 큰 강점을 보이는 게 특징이다. 최근 업데이트한 LLM(거대언어모델) 모델에 리턴제로가 자체적으로 구현한 음성인식 엔진을 결합해, 비정형 데이터인 회의 텍스트 분석에 높은 정확성과 속도를 보인다. 실제로 사람이 수기로 작성할 경우 30분 이상의 시간이 소요되는 회의록 정리를 30초 만에 해결할 수 있다. 연내에는 회의 목적에 따라 필요한 정보를 구분해 추출하는 '회의 유형별 맞춤 요약' 기능을 출시할 예정이다. 이참솔 리턴제로 대표는 "리턴제로는 앞으로도 사람들의 일상을 윤택하게 만들고, 다양한 산업 현장의 인공지능 전환도 선도할 실용적인 서비스를 선보일 것"이라고 말했다.

2024.08.06 18:09백봉삼

삼성전자, 'AI 가정용 에어컨' 판매량 전주 대비 50% 증가

삼성전자는 AI 기능을 강화한 가정용 에어컨 판매량이 지난주에 전주 대비 50% 이상 급증했다고 밝혔다. 장마가 끝나고 올여름 역대급 폭염이 시작되면서 에어컨 판매량을 증가한 것으로 분석된다. 7월 전체 판매량도 전년 대비 두 자릿수를 기록했다. 가정용 시스템 에어컨은 7월 전년 대비 약 25%, 일반 무풍 에어컨은 전년 대비 약 10% 이상 판매가 늘었다. 특히 7월에 판매된 에어컨 중 80%가 무풍에어컨으로 나타났다. 삼성전자는 가정용 시스템 에어컨 전체 라인업에 무풍 기능을 탑재해 고객 니즈를 반영했다. 2024년형 '비스포크 AI 무풍 갤러리'는 전 모델이 에너지소비효율 1~2등급을 획득했으며, 스마트싱스(SmartThings) AI 절약 모드로 상황별 맞춤 절전이 가능해 에너지 사용량을 최대 30%까지 절약할 수 있다. 또한, 빅스비를 적용해 리모컨 없이 음성 명령으로 에어컨의 다양한 기능을 손쉽게 실행할 수 있다. 에어컨을 켜고 끄거나 온도를 조절하는 등 간단한 음성 제어는 에어컨 기기 자체에서 지원돼 와이파이 연결 없이도 이용할 수 있다. 이와 함께, 실내 움직임을 인지해 에어컨을 알아서 작동하는 AI 기능으로 한층 편리하게 사용할 수 있다. 실내 움직임이 없다고 판단되면 ▲일정 시간 이후 절전 모드로 전환하거나 전원을 끄는 '부재 절전'으로 에너지를 절약하고 ▲에어컨 내부의 습기를 건조시키는 '부재 건조'로 위생 관리가 더 편리해졌다. 에어컨의 기능과 함께 극성수기에도 구매 다음 날 바로 에어컨 설치가 가능한 것도 판매가 증가한 요인으로 꼽히고 있다. 장마와 폭염 등 변덕스러운 날씨 속에서 에어컨을 찾는 고객이 늘어났지만, 에어컨 설치 인력 확대로 구매 후 다음 날 바로 설치할 수 있어 소비자의 큰 호응을 얻고 있다. 삼성전자 관계자는 "삼성전자 AI가전이 큰 인기를 끌고 있으며, 에어컨 역시 스마트한 기능으로 높은 호응을 얻고 있다"며, "앞으로도 'AI 가전=삼성'이라는 공식을 넘어 '모두를 위한 AI(AI for All)' 비전을 완성해 나갈 것"이라고 밝혔다. 한편, 삼성전자는 오는 31일까지 전국 온.오프라인 매장에서 에어컨을 비롯한 가전, TV, 모바일, IT 등 17개의 다양한 품목을 최대 50%까지 할인된 가격으로 구매할 수 있는 '삼성전자 AI 세일 페스타' 프로모션을 실시하고 있다.

2024.08.05 09:07이나리

삼성, 올해 '자체 AI 탑재' 빅스비 출시한다

삼성전자가 올해 자체 개발한 인공지능(AI) 모델을 기반으로 한 음성비서 '빅스비'의 업그레이드 버전을 출시할 예정이라고 밝혔다고 미국 경제매체 CNBC가 10일(현지시간) 보도했다. 보도에 따르면, 프랑스 파리에서 열린 언팩 행사에서 노태문 삼성전자 MX사업부 사장은 CNBC에 “생성형 AI 기술을 적용해 빅스비를 더욱 발전시킬 것”이라고 밝혔다. 삼성전자가 개선된 빅스비를 개발 중이라는 소식은 지난 3월 처음 알려졌다. 하지만 삼성전자가 직접 출시 일정을 밝힌 것은 이번이 처음이다. 노태문 사장은 삼성전자가 구글의 제미나이를 삼성 제품에 탑재하는 등 자사 제품에 다양한 음성비서 서비스를 허용하는 전략을 유지할 것이라고 밝혔다고 해당 매체는 전했다. 빅스비의 개선은 삼성전자가 자사 제품에 AI 기능을 탑재하려는 광범위한 노력 중 하나다. 삼성전자는 10일 언팩 행사에서 갤럭시Z폴드 6과 갤럭시Z플립 6 등 신제품을 공개하면서 몇 가지 새로운 AI 도구들도 함께 공개했다. 노태문 사장은 ”우리는 제품에 더 많은 AI 기능을 강화하고 도입하고 있다”며, ″소비자들이 AI 기능을 더 많이 사용하면서 실제로 그들이 가져다 주는 편리함과 이점을 느낄 수 있다. 이러한 갤럭시 AI, 모바일 AI가 신제품 구매의 강력한 동기이자 원동력이라고 생각한다”고 말했다. 빅스비는 2017년 갤럭시S8 스마트폰과 함께 출시된 음성 비서 서비스로, 빅스비에는 실시간 번역 기능을 비롯해 음식점 추천 등 다양한 기능이 탑재되어 있다.

2024.07.11 13:51이정현

첨단 영상 분석으로 딥페이크 신종범죄 잡는다

한국전자기술연구원(KETI·원장 신희동)은 국립과학수사연구원(원장 이봉우)과 과학수사 분야 연구 협력을 위한 업무협약(MoU)을 체결했다고 밝혔다. KETI와 국과수는 업무협약을 계기로 인공지능(AI) 기반 영상·음성 분석 등 첨단 분야 공동 기술 개발을 추진함과 동시에 과학수사 분야 내 기술 확산을 지원하는데 합의했다. KETI는 딥러닝 기반 영상 인식추적·영상 화질개선 등 지능형 영상처리 기술, 멀티모달 인터랙션 및 추론, 자연어 처리 등의 인공지능 기술 등 첨단 지능 분야 핵심 기술 육성에 집중하고 있다. 국과수는 행정안전부 소속 과학수사 감정연구기관으로, CCTV·비디오·사진을 포함하는 각종 영상·음성 판독/개선 기술 등 범죄수사에 필요한 법공학 분야 연구개발을 수행 중이며, 주요 범죄 사건사고에 필요한 해석과 감정을 지원한다. KETI와 국과수는 이번 협약을 통해 ▲과학수사에 필요한 영상 및 음성 분석 기술 교류 ▲영상 및 음성 분석 기술 활용을 위한 인적 교류 ▲과학 수사 분야 신기술 수요 공동 발굴 및 정부 전략 수립 지원 등 첨단 분야에서의 R&D 협력을 강화할 계획이다. 협약식에서는 KETI 지능정보연구본부의 지능형영상처리연구센터 및 인공지능연구센터, 국과수 법공학부의 디지털과와 법과학교육연구센터 주요 관계자가 참석해 첨단 과학수사 분야 주요 협력 기술을 논의했다. KETI 지능정보연구본부는 인물의 행동 양식을 모방하는 극사실적 인물 구현 등의 동영상 합성·판별 기술을 바탕으로 딥페이크 영상과 음성을 판별하는 탐지 기술을 보유 중이다. 신희동 KETI 원장은 “다가오는 미래 치안의 핵심은 첨단 과학 기술 개발이며, KETI는 유망 ICT 기술 구현과 확산에 필요한 최적의 파트너”라며 “두 기관의 협약이 향후 국민 안전을 보장하는 과학치안 사회로 이어지길 기원한다”고 밝혔다. 이봉우 국과수 원장은 “최근 인공지능 기술 발달에 따라 딥페이크와 같은 신종범죄로 인해 국민 안전이 위협받고 있다”며 “두 기관의 힘을 모아 기술을 연구·개발해 국민이 안전한 사회를 구현할 수 있도록 노력하겠다”고 말했다.

2024.07.10 08:25주문정

"오픈AI 'GPT-4o' 넘는다"…佛 억만장자가 내놓은 AI 新무기, 정체는?

"프랑스와 유럽연합(EU)은 인공지능(AI) 선도 국가인 미국과 중국, 영국에도 뒤처지고 있습니다. 우리는 혁신 측면에서 뒤처져 있고 너무 느리게 대응하고 있습니다." 에마뉘엘 마크롱 대통령이 지난해 6월 14일 파리에서 작심 발언을 한 지 1년 만에 프랑스가 오픈AI에 대적할 만한 새로운 AI 무기를 꺼내들었다. 프랑스 억만장자 자비에르 니엘이 후원하는 AI 연구 비영리 단체인 큐타이를 통해서다. 4일 블룸버그통신에 따르면 큐타이는 지난 3일(현지시간) 프랑스 파리에서 오픈AI가 최근 선보인 'GPT-4o'와 비슷한 음성 비서 '모시' 서비스를 공개했다. 이 서비스는 70가지 감정과 스타일로 대화할 수 있는 것이 특징으로, 이날 행사에선 에베레스트 산 등반에 대해 조언하거나 짙은 프랑스 억양으로 시를 낭송하는 등의 시연도 이뤄졌다. 큐타이는 자비에르 니엘과 또 다른 현지 억만장자 로돌프 사데, 에릭 슈미트 구글 전 최고경영자(CEO) 등이 3억 유로(약 3억2천400만 달러)를 투자해 설립된 연구소다. 패트릭 페레즈 큐타이 CEO는 구글 딥마인드와 메타 AI 출신 연구원들을 고용했으며 거대언어모델(LLM) 개발을 위해 엔비디아의 H100 그래픽처리장치(GPU)도 대거 사들였다. 큐타이 측은 '모시'가 '챗GPT' 개발사인 오픈AI가 음성 비서 기능을 지원하는 AI 모델 'GPT-4o'와 비슷하다고 주장했다. 'GPT-4o'는 텍스트로 대화를 나누던 기존 모델과 달리 실시간 음성으로 질의응답을 할 수 있고, 사용자가 답변 중간에 끼어들어도 대화를 계속할 수 있는 것이 특징이다. 당시 샘 알트먼 오픈AI CEO는 시연 직후 스칼렛 요한슨이 주연한 영화 '그녀(HER)'에서 영감을 얻었다고 밝힌 바 있다. 하지만 스칼렛 요한슨이 자신의 목소리를 도용했다고 주장하자 오픈AI는 당초 6월 말 일부 챗GPT 플러스 사용자에게 GPT-4o를 제공하려던 계획을 철회했다. GPT-4o 기능을 피드백 수집 차원에서 일부 이용자들에 먼저 공개해 안전성과 신뢰성 점검한 후 올 가을부터 순차적으로 선보일 예정이다. 다만 처음 시연했던 비디오 및 화면 공유 기능은 포함되지 않을 전망이다. 이 같은 상황에서 큐타이가 '모시'로 AI 경쟁 속에서 우위를 가져갈 수 있을지 주목된다. 큐타이는 오픈 소스 기술로 '모시'에 대한 연구 결과를 공개할 예정으로, 몇 주 안에 이를 자유롭게 이용할 수 있도록 할 계획이다. 또 큐타이는 오픈AI의 GPT-4o 논란을 의식해 '모시'를 앨리스라는 성우와 함께 작업했으나, 이름을 공개하진 않았다. 패트릭 페레즈 큐타이 CEO는 "최초로 출시된 실시간 음성 AI 비서 '모시'는 말하는 대로 생각한다"며 "모시는 우리가 기계와 소통하는 방식을 바꿀 수 있는 엄청난 잠재력을 가지고 있다고 믿는다"고 말했다. 니엘은 "'모시'는 유럽이 AI 개발 분야에서 글로벌 플레이어가 될 수 있음을 보여주는 유망한 지표"라며 "이번에 선보인 제품은 전 세계 최고 수준"이라고 자평했다.

2024.07.04 09:38장유미

신라젠 'BAL0891' 임상1상 IND 변경 식약처 승인

신라젠은 식품의약품안전처로부터 항암후보물질 'BAL0891' 1상 임상시험 IND(임상시험계획) 변경 승인을 받았다고 최근 공시했다. BAL0891은 유사분열 체크포인트 억제제(MCI)계열 항암제로 TTK와 PLK1둘을 동시에 저해하는 first-in-class 신약으로 미국과 한국에서 임상을 진행 중이다. 변경 승인 내용은 하위 연구 추가로 지난 2월 미국 식품의약국(FDA) 변경 신청과 동일하며, 국내에서도 삼중음성유방암(TNBC)과 위암(GC) 환자를 대상으로 하는 용량 확장 임상시험이 추가된다. 이번 임상 변경으로 신라젠은 진행성 고형암 환자를 대상으로 BAL0891 단독 및 카보플라틴 또는 파클리탁셀을 병용 투여하는 Part1, 그리고 RP2D (임상 2상 권장용량) 확립 시 삼중음성유방암과 위암 환자를 대상으로 BAL0891 단독 및 파클리탁셀을 병용 투여하는 Part2로 나눠 임상을 진행한다. 목표 시험대상자는 96명을 추가해 약 216명의 환자를 모집하는 것으로 변경했다. 이는 기존 평가지표였던 안전성과 내약성 탐색은 물론 유효성까지 평가하기 위해서라고 회사 측은 설명했다. 신라젠 관계자는 “현재 진행 중인 임상에서 특이한 문제점 및 이상 사항이 발견되지않아 계획대로 변경 및 확대를 신청하는 것”이라며 “향후 화학항암제 외에도 면역항암제와 병용 임상도 계획하고 있다”고 밝혔다. 한편 신라젠은 BAL0891에 대해 삼중음성유방암과 위암 등 고형암뿐만 아니라 급성골수성백혈병(AML)과 같은 혈액암으로도 적응증을 확대할 계획이다.

2024.06.28 09:55조민규

아마존, AI 도입하며 음성 비서 유료화 검토

아마존이 자사의 무료 음성 비서 '알렉사'에 생성형 인공지능(AI)를 도입하며 서비스 유료화를 검토하고 있다. 지난 21일(현지시간) 로이터 등 외신에 따르면, 아마존은 현재 알렉사의 개조된 AI 지원 버전에 대해 고객에게 월 5달러(약 7천원)를 부과하는 방안을 고려하고 있다. 로이터는 아마존 전·현직 직원의 말을 인용해 아마존이 무료 버전의 알렉사를 생성형 AI가 포함된 버전으로 업그레이드하는 작업을 하고 있다. 아마존의 업그레이드 작업이 완료되면, 알렉사는 대화 능력이 더욱 정교해지고, 고객들은 내장된 AI를 사용하여 쇼핑과 이메일 작성 및 음식 주문과 같은 다른 작업을 도울 수 있을 뿐만 아니라 스마트 기기와의 호환성도 향상될 것이라는 예측이 나온다. 로이터에 따르면, 아마존은 더 강력한 소프트웨어를 사용하는 알렉사를 출시하고, 고급 버전 알렉사에 액세스하기 위해 구독료를 부과하는 방안을 고려하고 있다. 이에 알렉사의 새 서비스는 두 가지 등급으로 제공될 예정이다. 고급 버전은 월 이용료가 5달러(약 7천원) 정도로 책정될 전망이다. 내부적으로 '반얀(Banyan)'으로 알려진 이번 프로젝트는 알렉사의 첫번째 주요 개편 작업이다. 알렉사는 아마존 설립자인 제프 베조스(Jeff Bezos)가 추진한 프로젝트로, 아마존 사용자들의 질문에 대해 음성으로 대답고, 가전 제품을 제어하는 허브 역할을 하고 있다. 일렉사 개선 작업은 앤디 재시 아마존 최고경영자가 직접 관심을 기울이고 있는 것으로 알려졌다. 재시 최고경영자는 4월 주주들에게 보내는 서한에서 '더 지능적이고 유능한 알렉사'를 약속했지만 추가적인 세부 사항은 공개하지 않았다.

2024.06.23 11:11정석규

삼성전자, 북미 통합 'AI 연구센터' 신설...애플 '시리' 담당임원 영입

삼성전자가 캐나다와 미국의 인공지능(AI) 연구센터 2곳을 통합해 '북미 AI 센터를 신설한다. 더불어 애플에서 음성비서 '시리' 업무를 담당했던 임원을 영입해 새로운 북미 AI 센터 총괄을 맡긴다. 12일 블룸버그통신에 따르면 삼성전자는 캐나다 토론토와 미국 캘리포니아주 마운틴뷰에 있는 연구소를 통합해 북미 AI 센터라는 새 조직을 만들었다. 각 AI 센터를 유지하면서 양사를 총괄하는 컨트롤타워를 세워 조직을 효율적으로 운영하고 연구 시너지를 모색하기 위한 방침이다. 또 삼성전자는 북미 AI 센터 수장으로 애플 전 임원인 무라트 아크바칵을 영입했다. 그는 애플에서 음성비서 시리의 사업모델과 실행 전략을 세우는 업무를 맡았고, 애플에 합류하기 전 마이크로소프트(MS)에서 음성 비서 관련 AI를 연구하며 챗봇을 개발했다. 블룸버그는 "이런 움직임은 세계 최대의 기술 기업들이 AI 분야에서 더욱 공격적으로 변하고 있음을 보여주는 신호"라며 "삼성이나 애플 같은 기기 제조업체는 AI 기능을 제공해 소비자가 더 자주 제품을 교체하도록 유도하는 방법으로 보여진다"고 진단했다. 삼성과 애플은 관련 내용에 대한 논평을 거부했다. 한편 애플은 지난 10일 세계개발자회의(WWDC) 2024를 열고 아이폰·맥 등 기기 전반에 자체 '애플 인텔리전스'를 도입한다고 밝혔다. 애프은 자사의 음성비서 '시리'에 오픈AI의 '챗GPT'를 도입한다는 방침이다. 다만 애플은 챗봇을 구동하기 위해 오픈AI의 기술을 사용하지만 나머지 대부분 기능은 자체 개발했다. 반면 삼성전자는 구글 '제미나이'를 통해 AI 챗봇 서비스를 제공한다.

2024.06.12 11:16이나리

세종시 버스 교통카드 찍으면 '탄소가 감축되었습니다' 음성 안내

앞으로 세종시 관내 시내버스를 탑승하면 탄소가 감축됐다는 음성 안내가 나온다. 대통령직속 2050탄소중립녹색성장위원회는 세종특별자치시와 함께 2024년 '환경의 날(6월 5일)'을 계기로 국민의 탄소중립 생활 실천을 응원하기 위해 교통카드 태그 안내 음성 송출을 시작한다고 4일 밝혔다. 일반 탑승객이 시내버스를 탑승하면서 교통카드를 단말에 태그하면 '탄소가 감축되었습니다'는 안내 음성이 나온다. 학생·환승 할인·다인승 등 기타요금 안내 음성은 기존대로 나온다. 탄녹위는 세종 시내버스에 시범 적용한 후 다른 지역으로도 확대할 계획이다. 탄녹위에 따르면 국내에 등록된 전체 자동차 가운데 자가용이 약 92.4%를 차지해, 승용차 이용을 줄이고 대중교통을 이용하면 온실가스 저감이 가능하다. 탄녹위 관계자는 “국내 등록된 자가용 승용차 운행을 10%만 줄여도 연간 51만5천767t의 이산화탄소를 감축할 수 있는데, 이는 경제적 가치로 127억원에 해당하며 승용차 한 대당 약 285.4kg의 탄소를 줄일 수 있는 셈”이라고 설명했다. 김상협 탄녹위 위원장은 “탄소중립 달성을 위해 꼭 필요한 것 중 하나가 전 국토의 저탄소화”라며 “대중교통 이용으로 탄소중립 행동을 실천하고 계신 국민이 이번 안내 음성을 통해 나의 삶과 탄소중립이 동떨어져 있는 것이 아님을 체감할 수 있기를 바란다”고 밝혔다. 최민호 세종시장은 “세종시민뿐만 아니라 세종시를 방문하는 모든 국민이 세종 시내버스를 탑승할 때마다 내가 탄소를 감축했다는 자긍심을 느끼실 수 있을 것”이라며 “대중교통 이용을 통한 탄소중립 생활 실천이 활성화되기를 기대한다”고 말했다. 한편, 다른 지자체도 교통카드 이용 시 탄소 감축 안내 음성 적용하려면 탄녹위 소통참여팀에 문의해 무료로 받을 수 있다.

2024.06.04 16:36주문정

[1분건강] 쉰 목소리가 2주 넘으면 병일수 있다

목이 쉰 상태가 2주 이상 지속되면, 성대 건강을 의심해야 한다는 전문가 조언이 나왔다. '음성질환'은 성대에 결절이나 용종(폴립)이 생기는 질환이다. 주로 가수나 교사 등 목을 많이 쓰는 직업군에서 흔히 나타나는데, 대부분 음성을 과도하게 사용해 발생한다. 성대결절이나 성대폴립 등 질환마다 치료법이 달라 정확한 진단이 요구된다. 우선 성대결절이란, 목에 생긴 '굳은살'이다. 지속해서 고음을 내기 위해 목에 과다한 힘을 주면 성대에 굳은살이 생긴다. 성대의 굳은살을 없애려면 수일동안 음성휴식이 필요하다. 하지만 계속 혹사할 경우, 성대결절이 진행되며, 이로 인해 쉰 목소리가 점점 심해지게 된다. 건강보험심사평가원에 따르면, 2018년~2022년 기간 동안 성별에 따른 성대결절 환자 수는 남성보다 여성 환자수가 80% 이상 더 많았다. 또 성대폴립은 잘못된 발성으로 생긴 '용종(혹)'이다. 과격한 발성으로 성대의 작은 혈관이나 조직이 손상되어 물혹이 생기고 성대결절과 같이 쉰 목소리가 나오게 된다. 물론 쉰 목소리는 갑자기 목소리를 많이 쓰거나, 감기에 걸려도 발생할 수 있다. 이런 경우라면 일주일 정도 지나면 호전된다. 만약 2주가 지나도 쉰 목소리가 호전되지 않으면 음성질환을 의심해야 한다. 성대결절은 쉰 목소리 외에도 지연 발성, 고음에서 분열되거나 부드럽지 못한 소리가 나오거나 중복음 등의 증상도 발생 가능하다. 성대폴립의 경우, 쉰 목소리와 후두 이물감으로 인한 잦은 기침, 용종이 커지면 호흡이 어려운 증상도 생길 수 있다. 성대결절, 성대폴립은 잘못된 발성법 때문인 경우가 많아 치료에서 발성 교정이 가장 중요하다. 그래서 먼저 언어치료사와 상담을 통하여 발성습관을 교정하는 등 음성 치료가 이뤄진다. 음성 치료로 호전될 수 없을 시 후두 미세 수술이 시행된다. 음성질환의 원인은 성대 점막이 지속해서 큰 자극을 받는지 여부다. 때문에 성대에 무리가 갈 수 있는 습관은 최대한 삼가야 한다. 가령, 오랜 시간 이야기를 하다가 목소리가 쉬는 느낌이 들면 바로 휴식을 취해야 한다. 강동경희대병원 이비인후과 김수일 교수는 “자주 목이 쉰다면 발성습관을 점검해볼 필요가 있다”며 “헛기침 하는 습관, 큰소리나 비명을 지르는 것, 극단적인 고음이나 저음을 내는 등의 습관 등이 대표적이다”고 설명했다.

2024.05.08 10:00김양균

지코어, 엔비디아 파트너 네트워크 어워드 '산업 혁신기업 부문' 수상

퍼블릭 클라우드, 엣지 컴퓨팅 및 엣지 AI 전문기업 지코어는 '2024 EMEA(유럽·중동·아프리카) 엔비디아 파트너 네트워크 어워드'에서 엔비디아 GPU를 기반으로 한 획기적인 AI 음성-텍스트 변환 솔루션의 성공적인 출시로 '산업 혁신 부문'에서 높은 평가를 받았다고 25일 밝혔다. '엔비디아 파트너 네트워크 어워드'는 가속 컴퓨팅 및 AI 분야에서 변함없는 노력과 혁신 정신을 보여준 파트너의 탁월한 공로를 치하하기 위해 마련된 것으로, 이번에 지코어가 받은 '산업 혁신상'은 특정 산업 분야에서 혁신을 주도한 파트너에게 수여되는 상이다. 지코어는 앞서 AI를 사용해 영어 음성을 룩셈부르크어 텍스트로 변환하는 최초의 AI 음성-텍스트 번역 학습 모델을 선보였다. 이 모델을 사용하면 연극, 영화, 음악 등 다양한 매체에 녹음된 영어 음성 전체를 룩셈부르크어로된 텍스트로 즉시 번역이 가능하고, 이를 영화 자막 등에 활용할 수 있다. 지코어의 이번 음성-텍스트 변환 모델은, 2억 4천400만개의 가중치를 포함하는 오픈 소스 위스퍼(Whisper) 모델의 축소 버전인 '위스퍼스몰(Whisper Small)을 기반으로 구축됐다. 컴퓨팅 학습 리소스에 대한 엄청난 수요를 충족하기 위해 지코어는 엔비디아 A100 텐서 코어 GPU로 구동되는 하이엔드 솔루션을 사용했다. 현재 지코어는 이 솔루션이 컨퍼런스 및 행사에서 사용될 수 있도록 실시간 번역을 활성화하는 모델을 개발하고 있다. 향후에는 영어 외에 프랑스어와 독일어 등의 언어를 추가해 음성의 텍스트 변환 기능을 언어를 초월한 의사소통의 핵심 도구로 만들어 나간다는 계획이다. '음성-텍스트 변환' 모델은 지코어의 최첨단 엣지 AI 솔루션의 일부이며, 엔비디아 GPU를 기반으로 한 AI 학습용 GPU 클라우드 및 엣지에서의 AI 추론을 포함한다. 안드레 레이텐바흐 지코어 CEO는 “지코어의 AI 혁신에 대한 끊임없는 도전이 엔비디아 파트너 네트워크 어워드에서 인정 받게 되어 매우 뜻깊게 생각한다”며 “언어의 종류를 초월해 누구나 보다 원활하고 효율적으로 의사소통 할 수 있도록 지코어는 획기적인 엣지 AI 서비스를 선도하며 새로운 표준을 제시해 나갈 것”이라고 전했다. 엔비디아 EMEA 채널 디렉터인 더크 바푸스는 “AI는 여러 언어를 번역하는 능력을 통해 소통과 연결을 촉진한다”며 “지코어는 엔비디아의 GPU를 기반으로 영어 음성을 룩셈부르크어 텍스트로 번역해 낸 최초의 혁신적 성과를 높게 인정 받은 것”이라고 밝혔다.

2024.04.25 12:36김우용

中 'AI 음성' 저작권 첫 소송..."목소리 주인에 배상"

중국에서 한 성우의 음성을 허락없이 사용한 모바일 앱 회사가 성우에게 손실을 배상했다. 23일 중국 언론 CCTV에 따르면, 베이징인터넷법원은 중국 첫 AI 음성 저작권 침해 소송의 1심 판결을 통해 목소리 주인인 성우 A씨가 음성의 권리를 보유한다고 보고 음성을 사용한 B씨가 성우에게 25만 위안(약 4천736만 원)의 손실을 배상하게 했다. B씨가 성우의 음성을 사용한 AI 문자 음성 변환 제품을 개발한 것이 저작권 침해에 해당한다는 판결이다. 이 소송은 중국에서 AI 음성 저작권에 관해 이뤄진 첫 소송이란 점에서 많은 관심을 받았다. A씨는 다수의 오디오 작품을 녹음한 성우로서, 지난해 자신의 목소리가 AI에 의해 변형돼 한 앱에서 판매되고 있다는 사실을 우연히 발견했다. 이에 운영 주체인 베이징의 한 회사 등 5인을 대상으로 베이징인터넷법원에서 소송을 제기했다. 그 결과 침해 행위 중지 및 사과, 경제적 및 정신적 손실을 보상해야한다는 판결을 받은 것이다. B씨 측은 앱이 합법적 출처를 갖고 있으며 소프트웨어 회사로부터 나온 것이라고 주장하는 등 침해하지 않았다는 입장이였다. 이 소프트웨어 회사는 한 영상 음향 회사의 음성을 사용한 것인데, 실제 이 영상 음향 회사는 A씨와 협력한 적이 있고 A씨가 녹음물에 대한 저작권 귀속에 동의한 적이 있는 것으로 알려졌다. 하지만 판사는 음성이 개인의 권익에 해당하며, 모든 자연인의 음성이 법으로 보호돼야 한다고 밝혔다. 녹음물을 승인한다고 해서 해당 사운드를 허가받지 않거나 다른 사람이 허가 없이 사용하도록 하는 것은 침해라고 봤다.

2024.04.25 07:02유효정

틱톡, AI로 '내 목소리' 입히는 기능 개발

중국 바이트댄스가 만든 글로벌 동영상 공유 앱 틱톡에 사용자의 목소리를 구사한 인공지능(AI) 음성으로 영상을 만들 수 있는 기능이 추가될 전망이다. 틱톡이 새로운 AI 기능으로서 사용자가 수 초 내에 자신의 목소리를 틱톡 음성 데이터베이스로 저장할 수 있는 기능을 개발하고 있다고 중국 언론 IT즈자가 20일 블로그(@AssembleDebug)를 인용 보도했다. 더스판드로이드는 최신 버전의 틱톡 앱을 분석한 결과 틱톡이 해당 기능을 개발 중인 것으로 확인했다고 밝혔다. 구체적 출시 시기는 알 수 없으며, 틱톡이 아직 이 기능의 명칭을 정하지 않았을 수 있다고 봤다. 사용자는 자신만의 음성 패키지를 만들기 위해 한 번만 녹음하면 된다. 이 패키지는 텍스트 음성 변환 기능을 통해 자신의 틱톡 동영상에 사용할 수 있다. 실제 매체가 공개한 이미지에는 "단 10초 만에 AI 버전의 음성을 만들 수 있다! 틱톡 동영상에서 텍스트 음성 변환 기능을 사용할 수 있다"고 언급됐다. 사용자는 특정 텍스트를 읽고 녹음해야 하는 것으로 알려졌다. IT즈자에 따르면 틱톡은 사용자 개인정보보호 및 보안을 위해 여러 조치를 취했다. 사용자는 자신이 생성한 AI 음성을 언제든 삭제할 수 있으며 타인의 콘텐츠 제작에 사용되는 것을 방지할 수 있다. 앞서 바이두도 이달 초 AI 음성 비서로 사용자의 목소리를 추가할 수 있는 기능을 선보인 바 있다. 몇 초 내에 초거대 AI 모델 기반 챗봇 어니봇에서 자신의 목소리를 구사하는 AI 음성 비서를 생성할 수 있다.

2024.04.22 08:25유효정

  Prev 1 2 3 Next  

지금 뜨는 기사

이시각 헤드라인

SKT, 침해사고 이후 해지 위약금 면제...8월 요금 50% 감면

인천공항-면세업계, 임대료 인하 공방…"깎아줘" vs "왜 너만"

"AI 다음은 로봇"…열리는 로봇 칩 선점 전쟁

지주사 주가 치솟자 재계 표정관리...승계 셈법 복잡

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.