• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
AI페스타
배터리
양자컴퓨팅
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'음성'통합검색 결과 입니다. (59건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

삼성, 올해 '자체 AI 탑재' 빅스비 출시한다

삼성전자가 올해 자체 개발한 인공지능(AI) 모델을 기반으로 한 음성비서 '빅스비'의 업그레이드 버전을 출시할 예정이라고 밝혔다고 미국 경제매체 CNBC가 10일(현지시간) 보도했다. 보도에 따르면, 프랑스 파리에서 열린 언팩 행사에서 노태문 삼성전자 MX사업부 사장은 CNBC에 “생성형 AI 기술을 적용해 빅스비를 더욱 발전시킬 것”이라고 밝혔다. 삼성전자가 개선된 빅스비를 개발 중이라는 소식은 지난 3월 처음 알려졌다. 하지만 삼성전자가 직접 출시 일정을 밝힌 것은 이번이 처음이다. 노태문 사장은 삼성전자가 구글의 제미나이를 삼성 제품에 탑재하는 등 자사 제품에 다양한 음성비서 서비스를 허용하는 전략을 유지할 것이라고 밝혔다고 해당 매체는 전했다. 빅스비의 개선은 삼성전자가 자사 제품에 AI 기능을 탑재하려는 광범위한 노력 중 하나다. 삼성전자는 10일 언팩 행사에서 갤럭시Z폴드 6과 갤럭시Z플립 6 등 신제품을 공개하면서 몇 가지 새로운 AI 도구들도 함께 공개했다. 노태문 사장은 ”우리는 제품에 더 많은 AI 기능을 강화하고 도입하고 있다”며, ″소비자들이 AI 기능을 더 많이 사용하면서 실제로 그들이 가져다 주는 편리함과 이점을 느낄 수 있다. 이러한 갤럭시 AI, 모바일 AI가 신제품 구매의 강력한 동기이자 원동력이라고 생각한다”고 말했다. 빅스비는 2017년 갤럭시S8 스마트폰과 함께 출시된 음성 비서 서비스로, 빅스비에는 실시간 번역 기능을 비롯해 음식점 추천 등 다양한 기능이 탑재되어 있다.

2024.07.11 13:51이정현

첨단 영상 분석으로 딥페이크 신종범죄 잡는다

한국전자기술연구원(KETI·원장 신희동)은 국립과학수사연구원(원장 이봉우)과 과학수사 분야 연구 협력을 위한 업무협약(MoU)을 체결했다고 밝혔다. KETI와 국과수는 업무협약을 계기로 인공지능(AI) 기반 영상·음성 분석 등 첨단 분야 공동 기술 개발을 추진함과 동시에 과학수사 분야 내 기술 확산을 지원하는데 합의했다. KETI는 딥러닝 기반 영상 인식추적·영상 화질개선 등 지능형 영상처리 기술, 멀티모달 인터랙션 및 추론, 자연어 처리 등의 인공지능 기술 등 첨단 지능 분야 핵심 기술 육성에 집중하고 있다. 국과수는 행정안전부 소속 과학수사 감정연구기관으로, CCTV·비디오·사진을 포함하는 각종 영상·음성 판독/개선 기술 등 범죄수사에 필요한 법공학 분야 연구개발을 수행 중이며, 주요 범죄 사건사고에 필요한 해석과 감정을 지원한다. KETI와 국과수는 이번 협약을 통해 ▲과학수사에 필요한 영상 및 음성 분석 기술 교류 ▲영상 및 음성 분석 기술 활용을 위한 인적 교류 ▲과학 수사 분야 신기술 수요 공동 발굴 및 정부 전략 수립 지원 등 첨단 분야에서의 R&D 협력을 강화할 계획이다. 협약식에서는 KETI 지능정보연구본부의 지능형영상처리연구센터 및 인공지능연구센터, 국과수 법공학부의 디지털과와 법과학교육연구센터 주요 관계자가 참석해 첨단 과학수사 분야 주요 협력 기술을 논의했다. KETI 지능정보연구본부는 인물의 행동 양식을 모방하는 극사실적 인물 구현 등의 동영상 합성·판별 기술을 바탕으로 딥페이크 영상과 음성을 판별하는 탐지 기술을 보유 중이다. 신희동 KETI 원장은 “다가오는 미래 치안의 핵심은 첨단 과학 기술 개발이며, KETI는 유망 ICT 기술 구현과 확산에 필요한 최적의 파트너”라며 “두 기관의 협약이 향후 국민 안전을 보장하는 과학치안 사회로 이어지길 기원한다”고 밝혔다. 이봉우 국과수 원장은 “최근 인공지능 기술 발달에 따라 딥페이크와 같은 신종범죄로 인해 국민 안전이 위협받고 있다”며 “두 기관의 힘을 모아 기술을 연구·개발해 국민이 안전한 사회를 구현할 수 있도록 노력하겠다”고 말했다.

2024.07.10 08:25주문정

"오픈AI 'GPT-4o' 넘는다"…佛 억만장자가 내놓은 AI 新무기, 정체는?

"프랑스와 유럽연합(EU)은 인공지능(AI) 선도 국가인 미국과 중국, 영국에도 뒤처지고 있습니다. 우리는 혁신 측면에서 뒤처져 있고 너무 느리게 대응하고 있습니다." 에마뉘엘 마크롱 대통령이 지난해 6월 14일 파리에서 작심 발언을 한 지 1년 만에 프랑스가 오픈AI에 대적할 만한 새로운 AI 무기를 꺼내들었다. 프랑스 억만장자 자비에르 니엘이 후원하는 AI 연구 비영리 단체인 큐타이를 통해서다. 4일 블룸버그통신에 따르면 큐타이는 지난 3일(현지시간) 프랑스 파리에서 오픈AI가 최근 선보인 'GPT-4o'와 비슷한 음성 비서 '모시' 서비스를 공개했다. 이 서비스는 70가지 감정과 스타일로 대화할 수 있는 것이 특징으로, 이날 행사에선 에베레스트 산 등반에 대해 조언하거나 짙은 프랑스 억양으로 시를 낭송하는 등의 시연도 이뤄졌다. 큐타이는 자비에르 니엘과 또 다른 현지 억만장자 로돌프 사데, 에릭 슈미트 구글 전 최고경영자(CEO) 등이 3억 유로(약 3억2천400만 달러)를 투자해 설립된 연구소다. 패트릭 페레즈 큐타이 CEO는 구글 딥마인드와 메타 AI 출신 연구원들을 고용했으며 거대언어모델(LLM) 개발을 위해 엔비디아의 H100 그래픽처리장치(GPU)도 대거 사들였다. 큐타이 측은 '모시'가 '챗GPT' 개발사인 오픈AI가 음성 비서 기능을 지원하는 AI 모델 'GPT-4o'와 비슷하다고 주장했다. 'GPT-4o'는 텍스트로 대화를 나누던 기존 모델과 달리 실시간 음성으로 질의응답을 할 수 있고, 사용자가 답변 중간에 끼어들어도 대화를 계속할 수 있는 것이 특징이다. 당시 샘 알트먼 오픈AI CEO는 시연 직후 스칼렛 요한슨이 주연한 영화 '그녀(HER)'에서 영감을 얻었다고 밝힌 바 있다. 하지만 스칼렛 요한슨이 자신의 목소리를 도용했다고 주장하자 오픈AI는 당초 6월 말 일부 챗GPT 플러스 사용자에게 GPT-4o를 제공하려던 계획을 철회했다. GPT-4o 기능을 피드백 수집 차원에서 일부 이용자들에 먼저 공개해 안전성과 신뢰성 점검한 후 올 가을부터 순차적으로 선보일 예정이다. 다만 처음 시연했던 비디오 및 화면 공유 기능은 포함되지 않을 전망이다. 이 같은 상황에서 큐타이가 '모시'로 AI 경쟁 속에서 우위를 가져갈 수 있을지 주목된다. 큐타이는 오픈 소스 기술로 '모시'에 대한 연구 결과를 공개할 예정으로, 몇 주 안에 이를 자유롭게 이용할 수 있도록 할 계획이다. 또 큐타이는 오픈AI의 GPT-4o 논란을 의식해 '모시'를 앨리스라는 성우와 함께 작업했으나, 이름을 공개하진 않았다. 패트릭 페레즈 큐타이 CEO는 "최초로 출시된 실시간 음성 AI 비서 '모시'는 말하는 대로 생각한다"며 "모시는 우리가 기계와 소통하는 방식을 바꿀 수 있는 엄청난 잠재력을 가지고 있다고 믿는다"고 말했다. 니엘은 "'모시'는 유럽이 AI 개발 분야에서 글로벌 플레이어가 될 수 있음을 보여주는 유망한 지표"라며 "이번에 선보인 제품은 전 세계 최고 수준"이라고 자평했다.

2024.07.04 09:38장유미

신라젠 'BAL0891' 임상1상 IND 변경 식약처 승인

신라젠은 식품의약품안전처로부터 항암후보물질 'BAL0891' 1상 임상시험 IND(임상시험계획) 변경 승인을 받았다고 최근 공시했다. BAL0891은 유사분열 체크포인트 억제제(MCI)계열 항암제로 TTK와 PLK1둘을 동시에 저해하는 first-in-class 신약으로 미국과 한국에서 임상을 진행 중이다. 변경 승인 내용은 하위 연구 추가로 지난 2월 미국 식품의약국(FDA) 변경 신청과 동일하며, 국내에서도 삼중음성유방암(TNBC)과 위암(GC) 환자를 대상으로 하는 용량 확장 임상시험이 추가된다. 이번 임상 변경으로 신라젠은 진행성 고형암 환자를 대상으로 BAL0891 단독 및 카보플라틴 또는 파클리탁셀을 병용 투여하는 Part1, 그리고 RP2D (임상 2상 권장용량) 확립 시 삼중음성유방암과 위암 환자를 대상으로 BAL0891 단독 및 파클리탁셀을 병용 투여하는 Part2로 나눠 임상을 진행한다. 목표 시험대상자는 96명을 추가해 약 216명의 환자를 모집하는 것으로 변경했다. 이는 기존 평가지표였던 안전성과 내약성 탐색은 물론 유효성까지 평가하기 위해서라고 회사 측은 설명했다. 신라젠 관계자는 “현재 진행 중인 임상에서 특이한 문제점 및 이상 사항이 발견되지않아 계획대로 변경 및 확대를 신청하는 것”이라며 “향후 화학항암제 외에도 면역항암제와 병용 임상도 계획하고 있다”고 밝혔다. 한편 신라젠은 BAL0891에 대해 삼중음성유방암과 위암 등 고형암뿐만 아니라 급성골수성백혈병(AML)과 같은 혈액암으로도 적응증을 확대할 계획이다.

2024.06.28 09:55조민규

아마존, AI 도입하며 음성 비서 유료화 검토

아마존이 자사의 무료 음성 비서 '알렉사'에 생성형 인공지능(AI)를 도입하며 서비스 유료화를 검토하고 있다. 지난 21일(현지시간) 로이터 등 외신에 따르면, 아마존은 현재 알렉사의 개조된 AI 지원 버전에 대해 고객에게 월 5달러(약 7천원)를 부과하는 방안을 고려하고 있다. 로이터는 아마존 전·현직 직원의 말을 인용해 아마존이 무료 버전의 알렉사를 생성형 AI가 포함된 버전으로 업그레이드하는 작업을 하고 있다. 아마존의 업그레이드 작업이 완료되면, 알렉사는 대화 능력이 더욱 정교해지고, 고객들은 내장된 AI를 사용하여 쇼핑과 이메일 작성 및 음식 주문과 같은 다른 작업을 도울 수 있을 뿐만 아니라 스마트 기기와의 호환성도 향상될 것이라는 예측이 나온다. 로이터에 따르면, 아마존은 더 강력한 소프트웨어를 사용하는 알렉사를 출시하고, 고급 버전 알렉사에 액세스하기 위해 구독료를 부과하는 방안을 고려하고 있다. 이에 알렉사의 새 서비스는 두 가지 등급으로 제공될 예정이다. 고급 버전은 월 이용료가 5달러(약 7천원) 정도로 책정될 전망이다. 내부적으로 '반얀(Banyan)'으로 알려진 이번 프로젝트는 알렉사의 첫번째 주요 개편 작업이다. 알렉사는 아마존 설립자인 제프 베조스(Jeff Bezos)가 추진한 프로젝트로, 아마존 사용자들의 질문에 대해 음성으로 대답고, 가전 제품을 제어하는 허브 역할을 하고 있다. 일렉사 개선 작업은 앤디 재시 아마존 최고경영자가 직접 관심을 기울이고 있는 것으로 알려졌다. 재시 최고경영자는 4월 주주들에게 보내는 서한에서 '더 지능적이고 유능한 알렉사'를 약속했지만 추가적인 세부 사항은 공개하지 않았다.

2024.06.23 11:11정석규

삼성전자, 북미 통합 'AI 연구센터' 신설...애플 '시리' 담당임원 영입

삼성전자가 캐나다와 미국의 인공지능(AI) 연구센터 2곳을 통합해 '북미 AI 센터를 신설한다. 더불어 애플에서 음성비서 '시리' 업무를 담당했던 임원을 영입해 새로운 북미 AI 센터 총괄을 맡긴다. 12일 블룸버그통신에 따르면 삼성전자는 캐나다 토론토와 미국 캘리포니아주 마운틴뷰에 있는 연구소를 통합해 북미 AI 센터라는 새 조직을 만들었다. 각 AI 센터를 유지하면서 양사를 총괄하는 컨트롤타워를 세워 조직을 효율적으로 운영하고 연구 시너지를 모색하기 위한 방침이다. 또 삼성전자는 북미 AI 센터 수장으로 애플 전 임원인 무라트 아크바칵을 영입했다. 그는 애플에서 음성비서 시리의 사업모델과 실행 전략을 세우는 업무를 맡았고, 애플에 합류하기 전 마이크로소프트(MS)에서 음성 비서 관련 AI를 연구하며 챗봇을 개발했다. 블룸버그는 "이런 움직임은 세계 최대의 기술 기업들이 AI 분야에서 더욱 공격적으로 변하고 있음을 보여주는 신호"라며 "삼성이나 애플 같은 기기 제조업체는 AI 기능을 제공해 소비자가 더 자주 제품을 교체하도록 유도하는 방법으로 보여진다"고 진단했다. 삼성과 애플은 관련 내용에 대한 논평을 거부했다. 한편 애플은 지난 10일 세계개발자회의(WWDC) 2024를 열고 아이폰·맥 등 기기 전반에 자체 '애플 인텔리전스'를 도입한다고 밝혔다. 애프은 자사의 음성비서 '시리'에 오픈AI의 '챗GPT'를 도입한다는 방침이다. 다만 애플은 챗봇을 구동하기 위해 오픈AI의 기술을 사용하지만 나머지 대부분 기능은 자체 개발했다. 반면 삼성전자는 구글 '제미나이'를 통해 AI 챗봇 서비스를 제공한다.

2024.06.12 11:16이나리

세종시 버스 교통카드 찍으면 '탄소가 감축되었습니다' 음성 안내

앞으로 세종시 관내 시내버스를 탑승하면 탄소가 감축됐다는 음성 안내가 나온다. 대통령직속 2050탄소중립녹색성장위원회는 세종특별자치시와 함께 2024년 '환경의 날(6월 5일)'을 계기로 국민의 탄소중립 생활 실천을 응원하기 위해 교통카드 태그 안내 음성 송출을 시작한다고 4일 밝혔다. 일반 탑승객이 시내버스를 탑승하면서 교통카드를 단말에 태그하면 '탄소가 감축되었습니다'는 안내 음성이 나온다. 학생·환승 할인·다인승 등 기타요금 안내 음성은 기존대로 나온다. 탄녹위는 세종 시내버스에 시범 적용한 후 다른 지역으로도 확대할 계획이다. 탄녹위에 따르면 국내에 등록된 전체 자동차 가운데 자가용이 약 92.4%를 차지해, 승용차 이용을 줄이고 대중교통을 이용하면 온실가스 저감이 가능하다. 탄녹위 관계자는 “국내 등록된 자가용 승용차 운행을 10%만 줄여도 연간 51만5천767t의 이산화탄소를 감축할 수 있는데, 이는 경제적 가치로 127억원에 해당하며 승용차 한 대당 약 285.4kg의 탄소를 줄일 수 있는 셈”이라고 설명했다. 김상협 탄녹위 위원장은 “탄소중립 달성을 위해 꼭 필요한 것 중 하나가 전 국토의 저탄소화”라며 “대중교통 이용으로 탄소중립 행동을 실천하고 계신 국민이 이번 안내 음성을 통해 나의 삶과 탄소중립이 동떨어져 있는 것이 아님을 체감할 수 있기를 바란다”고 밝혔다. 최민호 세종시장은 “세종시민뿐만 아니라 세종시를 방문하는 모든 국민이 세종 시내버스를 탑승할 때마다 내가 탄소를 감축했다는 자긍심을 느끼실 수 있을 것”이라며 “대중교통 이용을 통한 탄소중립 생활 실천이 활성화되기를 기대한다”고 말했다. 한편, 다른 지자체도 교통카드 이용 시 탄소 감축 안내 음성 적용하려면 탄녹위 소통참여팀에 문의해 무료로 받을 수 있다.

2024.06.04 16:36주문정

[1분건강] 쉰 목소리가 2주 넘으면 병일수 있다

목이 쉰 상태가 2주 이상 지속되면, 성대 건강을 의심해야 한다는 전문가 조언이 나왔다. '음성질환'은 성대에 결절이나 용종(폴립)이 생기는 질환이다. 주로 가수나 교사 등 목을 많이 쓰는 직업군에서 흔히 나타나는데, 대부분 음성을 과도하게 사용해 발생한다. 성대결절이나 성대폴립 등 질환마다 치료법이 달라 정확한 진단이 요구된다. 우선 성대결절이란, 목에 생긴 '굳은살'이다. 지속해서 고음을 내기 위해 목에 과다한 힘을 주면 성대에 굳은살이 생긴다. 성대의 굳은살을 없애려면 수일동안 음성휴식이 필요하다. 하지만 계속 혹사할 경우, 성대결절이 진행되며, 이로 인해 쉰 목소리가 점점 심해지게 된다. 건강보험심사평가원에 따르면, 2018년~2022년 기간 동안 성별에 따른 성대결절 환자 수는 남성보다 여성 환자수가 80% 이상 더 많았다. 또 성대폴립은 잘못된 발성으로 생긴 '용종(혹)'이다. 과격한 발성으로 성대의 작은 혈관이나 조직이 손상되어 물혹이 생기고 성대결절과 같이 쉰 목소리가 나오게 된다. 물론 쉰 목소리는 갑자기 목소리를 많이 쓰거나, 감기에 걸려도 발생할 수 있다. 이런 경우라면 일주일 정도 지나면 호전된다. 만약 2주가 지나도 쉰 목소리가 호전되지 않으면 음성질환을 의심해야 한다. 성대결절은 쉰 목소리 외에도 지연 발성, 고음에서 분열되거나 부드럽지 못한 소리가 나오거나 중복음 등의 증상도 발생 가능하다. 성대폴립의 경우, 쉰 목소리와 후두 이물감으로 인한 잦은 기침, 용종이 커지면 호흡이 어려운 증상도 생길 수 있다. 성대결절, 성대폴립은 잘못된 발성법 때문인 경우가 많아 치료에서 발성 교정이 가장 중요하다. 그래서 먼저 언어치료사와 상담을 통하여 발성습관을 교정하는 등 음성 치료가 이뤄진다. 음성 치료로 호전될 수 없을 시 후두 미세 수술이 시행된다. 음성질환의 원인은 성대 점막이 지속해서 큰 자극을 받는지 여부다. 때문에 성대에 무리가 갈 수 있는 습관은 최대한 삼가야 한다. 가령, 오랜 시간 이야기를 하다가 목소리가 쉬는 느낌이 들면 바로 휴식을 취해야 한다. 강동경희대병원 이비인후과 김수일 교수는 “자주 목이 쉰다면 발성습관을 점검해볼 필요가 있다”며 “헛기침 하는 습관, 큰소리나 비명을 지르는 것, 극단적인 고음이나 저음을 내는 등의 습관 등이 대표적이다”고 설명했다.

2024.05.08 10:00김양균

지코어, 엔비디아 파트너 네트워크 어워드 '산업 혁신기업 부문' 수상

퍼블릭 클라우드, 엣지 컴퓨팅 및 엣지 AI 전문기업 지코어는 '2024 EMEA(유럽·중동·아프리카) 엔비디아 파트너 네트워크 어워드'에서 엔비디아 GPU를 기반으로 한 획기적인 AI 음성-텍스트 변환 솔루션의 성공적인 출시로 '산업 혁신 부문'에서 높은 평가를 받았다고 25일 밝혔다. '엔비디아 파트너 네트워크 어워드'는 가속 컴퓨팅 및 AI 분야에서 변함없는 노력과 혁신 정신을 보여준 파트너의 탁월한 공로를 치하하기 위해 마련된 것으로, 이번에 지코어가 받은 '산업 혁신상'은 특정 산업 분야에서 혁신을 주도한 파트너에게 수여되는 상이다. 지코어는 앞서 AI를 사용해 영어 음성을 룩셈부르크어 텍스트로 변환하는 최초의 AI 음성-텍스트 번역 학습 모델을 선보였다. 이 모델을 사용하면 연극, 영화, 음악 등 다양한 매체에 녹음된 영어 음성 전체를 룩셈부르크어로된 텍스트로 즉시 번역이 가능하고, 이를 영화 자막 등에 활용할 수 있다. 지코어의 이번 음성-텍스트 변환 모델은, 2억 4천400만개의 가중치를 포함하는 오픈 소스 위스퍼(Whisper) 모델의 축소 버전인 '위스퍼스몰(Whisper Small)을 기반으로 구축됐다. 컴퓨팅 학습 리소스에 대한 엄청난 수요를 충족하기 위해 지코어는 엔비디아 A100 텐서 코어 GPU로 구동되는 하이엔드 솔루션을 사용했다. 현재 지코어는 이 솔루션이 컨퍼런스 및 행사에서 사용될 수 있도록 실시간 번역을 활성화하는 모델을 개발하고 있다. 향후에는 영어 외에 프랑스어와 독일어 등의 언어를 추가해 음성의 텍스트 변환 기능을 언어를 초월한 의사소통의 핵심 도구로 만들어 나간다는 계획이다. '음성-텍스트 변환' 모델은 지코어의 최첨단 엣지 AI 솔루션의 일부이며, 엔비디아 GPU를 기반으로 한 AI 학습용 GPU 클라우드 및 엣지에서의 AI 추론을 포함한다. 안드레 레이텐바흐 지코어 CEO는 “지코어의 AI 혁신에 대한 끊임없는 도전이 엔비디아 파트너 네트워크 어워드에서 인정 받게 되어 매우 뜻깊게 생각한다”며 “언어의 종류를 초월해 누구나 보다 원활하고 효율적으로 의사소통 할 수 있도록 지코어는 획기적인 엣지 AI 서비스를 선도하며 새로운 표준을 제시해 나갈 것”이라고 전했다. 엔비디아 EMEA 채널 디렉터인 더크 바푸스는 “AI는 여러 언어를 번역하는 능력을 통해 소통과 연결을 촉진한다”며 “지코어는 엔비디아의 GPU를 기반으로 영어 음성을 룩셈부르크어 텍스트로 번역해 낸 최초의 혁신적 성과를 높게 인정 받은 것”이라고 밝혔다.

2024.04.25 12:36김우용

中 'AI 음성' 저작권 첫 소송..."목소리 주인에 배상"

중국에서 한 성우의 음성을 허락없이 사용한 모바일 앱 회사가 성우에게 손실을 배상했다. 23일 중국 언론 CCTV에 따르면, 베이징인터넷법원은 중국 첫 AI 음성 저작권 침해 소송의 1심 판결을 통해 목소리 주인인 성우 A씨가 음성의 권리를 보유한다고 보고 음성을 사용한 B씨가 성우에게 25만 위안(약 4천736만 원)의 손실을 배상하게 했다. B씨가 성우의 음성을 사용한 AI 문자 음성 변환 제품을 개발한 것이 저작권 침해에 해당한다는 판결이다. 이 소송은 중국에서 AI 음성 저작권에 관해 이뤄진 첫 소송이란 점에서 많은 관심을 받았다. A씨는 다수의 오디오 작품을 녹음한 성우로서, 지난해 자신의 목소리가 AI에 의해 변형돼 한 앱에서 판매되고 있다는 사실을 우연히 발견했다. 이에 운영 주체인 베이징의 한 회사 등 5인을 대상으로 베이징인터넷법원에서 소송을 제기했다. 그 결과 침해 행위 중지 및 사과, 경제적 및 정신적 손실을 보상해야한다는 판결을 받은 것이다. B씨 측은 앱이 합법적 출처를 갖고 있으며 소프트웨어 회사로부터 나온 것이라고 주장하는 등 침해하지 않았다는 입장이였다. 이 소프트웨어 회사는 한 영상 음향 회사의 음성을 사용한 것인데, 실제 이 영상 음향 회사는 A씨와 협력한 적이 있고 A씨가 녹음물에 대한 저작권 귀속에 동의한 적이 있는 것으로 알려졌다. 하지만 판사는 음성이 개인의 권익에 해당하며, 모든 자연인의 음성이 법으로 보호돼야 한다고 밝혔다. 녹음물을 승인한다고 해서 해당 사운드를 허가받지 않거나 다른 사람이 허가 없이 사용하도록 하는 것은 침해라고 봤다.

2024.04.25 07:02유효정

틱톡, AI로 '내 목소리' 입히는 기능 개발

중국 바이트댄스가 만든 글로벌 동영상 공유 앱 틱톡에 사용자의 목소리를 구사한 인공지능(AI) 음성으로 영상을 만들 수 있는 기능이 추가될 전망이다. 틱톡이 새로운 AI 기능으로서 사용자가 수 초 내에 자신의 목소리를 틱톡 음성 데이터베이스로 저장할 수 있는 기능을 개발하고 있다고 중국 언론 IT즈자가 20일 블로그(@AssembleDebug)를 인용 보도했다. 더스판드로이드는 최신 버전의 틱톡 앱을 분석한 결과 틱톡이 해당 기능을 개발 중인 것으로 확인했다고 밝혔다. 구체적 출시 시기는 알 수 없으며, 틱톡이 아직 이 기능의 명칭을 정하지 않았을 수 있다고 봤다. 사용자는 자신만의 음성 패키지를 만들기 위해 한 번만 녹음하면 된다. 이 패키지는 텍스트 음성 변환 기능을 통해 자신의 틱톡 동영상에 사용할 수 있다. 실제 매체가 공개한 이미지에는 "단 10초 만에 AI 버전의 음성을 만들 수 있다! 틱톡 동영상에서 텍스트 음성 변환 기능을 사용할 수 있다"고 언급됐다. 사용자는 특정 텍스트를 읽고 녹음해야 하는 것으로 알려졌다. IT즈자에 따르면 틱톡은 사용자 개인정보보호 및 보안을 위해 여러 조치를 취했다. 사용자는 자신이 생성한 AI 음성을 언제든 삭제할 수 있으며 타인의 콘텐츠 제작에 사용되는 것을 방지할 수 있다. 앞서 바이두도 이달 초 AI 음성 비서로 사용자의 목소리를 추가할 수 있는 기능을 선보인 바 있다. 몇 초 내에 초거대 AI 모델 기반 챗봇 어니봇에서 자신의 목소리를 구사하는 AI 음성 비서를 생성할 수 있다.

2024.04.22 08:25유효정

"iOS 18서 메모 앱 확 바뀐다…음성 메모·수학 기능 탑재"

애플이 올 가을 출시할 예정인 차세대 아이폰 운영체제 'iOS 18'에 강력한 메모 앱 기능을 추가할 예정이라고 IT매체 애플인사이더가 17일(현지시간) 소식통을 인용해 보도했다. 보도에 따르면, 새로워지는 메모 앱은 앱 내에서 직접 음성 파일을 녹음하고 저장, 재생할 수 있게 바뀐다. 이 기능은 현재 iOS 18, 맥OS 15용으로 개발 중이며, 새 아이패드OS에도 적용될 예정이다. 현재 아이폰에서 오디오 녹음 파일을 메모 앱에 넣으려면 음성 메모 앱에서 메모 앱으로 복사해 붙여넣는 과정을 거쳐야 하지만 iOS 18부터는 더 이상 이 단계가 필요하지 않을 것으로 보인다. 또, 애플은 '수학 노트'(Math Notes)라고 알려진 신기능을 개발 중이다. 이 기능은 애플의 계산기 앱과 연결해 사용자가 메모 앱에서 계산기 정보를 통합해 사용할 수 있게 해준다. 이 기능은 향후 학문, 과학, 엔지니어링 분야에서 사용되는 필수적인 수학 표기법을 메모 앱에서 자유롭게 표시하는 데 도움이 될 것으로 보인다. 정확한 구현 방식은 알려지지 않았다. 애플인사이더는 해당 기능이 마이크로소프트의 원노트에서 제공하는 수학 기능과 닮았다고 전했다. “원노트 사용자들은 방정식을 풀고, 손글씨로 공식을 만들고 단위를 변환하고 2D 그래프를 시각화 할 수 있다”며, “'수학노트' 기능이 원노트 형태로 진화할 가능성이 높다”고 평했다. 또, 맥OS 15에는 새롭게 디자인된 계산기 앱도 포함될 것으로 전해졌다. 위 기능들은 올 6월 10일부터 개최되는 애플 연례 개발자 행사 WWDC 24에서 공개될 예정이며, 정식 업데이트는 오는 9월에 출시될 예정이다. iOS18은 아이폰 소프트웨어 역사상 가장 큰 개편이 될 것으로 알려지고 있으며, 시리, 스포트라이트, 단축어, 애플뮤직, 메시지, 건강, 키노트 등의 앱에 새로운 생성형 AI 기능 등이 포함될 예정이다.

2024.04.18 09:56이정현

"내 목소리가 캐릭터 음성으로"…수퍼톤 시프트, 무료 베타 서비스 시작

개인의 목소리를 원하는 캐릭터의 목소리로 실시간으로 바꿔주는 인공지능(AI) 음성변환 서비스가 공개된다. 하이브 자회사인 AI 오디오 기업 수퍼톤은 게임과 영화, 애니메이션 등 각종 콘텐츠에서 활용할 수 있는 AI 기반 실시간 음성 변환 서비스 '수퍼톤 시프트'(이하 시프트)의 글로벌 오픈 베타를 시작했다고 15일 밝혔다. 시프트는 수퍼톤이 콘텐츠 제작 및 크리에이터들의 창작을 지원하고 업무 편의성을 높이기 위해 개발한 솔루션이다. 시프트에 탑재된 10개의 캐릭터 음성 중 하나를 선택하면, 사용자가 발화하는 즉시 캐릭터의 목소리로 실시간 송출하는 방식이다. 이번 오픈 베타는 수퍼톤 공식 홈페이지에서 무료로 다운로드해 사용할 수 있다. 수퍼톤은 오는 6월 26일까지 오픈 베타 기간을 거쳐 올 하반기 중 정식 론칭한다는 계획이다. 수퍼톤은 지난해 11월 부산 벡스코에서 열린 국제 게임 전시회 '지스타2023'의 B2B 부스에 참가해 시프트를 클로즈드 베타 형식으로 처음 선보인 바 있다. 당시 시프트는 국내외 주요 미디어의 집중 조명을 받았고 참관객들의 방문이 이어지는 등 관심을 모았다. 시프트는 ▲자연스러운 음성 발화 스타일 ▲실시간 수준으로 음성변환 속도 단축 ▲ 단 10초 만에 사용자 목소리를 캐릭터로 커스텀하는 기능 등 3가지 측면에서 높은 기술력과 편의성을 자랑한다. 시프트는 실제 사람의 발화에 가깝게 자연스럽고 섬세한 음성을 구현하는 것이 특징이다. 수퍼톤이 자체 개발한 음성합성 파운데이션 모델 낸시(NANSY, Neural Analysis & Synthesis)를 기반으로 만든 시프트는 사용자의 음성을 음색∙발음∙음고∙강세 등 4개 구성 요소로 빠르게 분석해 사용자와 캐릭터의 목소리를 실시간 변환하는 방식을 적용한다. 이를 통해 기계음은 물론, 외부 노이즈를 없애 사실적이고 깨끗한 음성을 출력한다. 또 음성을 빠르게 변환시켜 즉각적인 의사소통을 지원한다. 수퍼톤은 음성이 출력돼 청자에게 도달하기까지 걸리는 지연 시간을 청자들이 인지하지 못하는 수준인 47ms(밀리 세컨드, 1000분의 1초)까지 단축시켰다. 이는 세계적으로도 뛰어난 수준이다. 사용자 편의성도 대폭 높였다. 사용자의 음성 분석을 위해, 시프트가 제시한 10초 가량의 샘플 대본을 읽으면 바로 사용자가 선택한 캐릭터로의 음성 변환이 시작된다. 동시에 커스커마이징도 가능하다. 시프트는 사용자와 캐릭터 음성 간의 혼합 비율이나 감정의 표현 정도, 음의 높낮이 등의 음성 구성 요소 값을 섬세하게 조절할 수 있는 기술 도구를 탑재해 사용자의 취향이나 사용 목적에 맞춘 음성을 자유롭게 생성할 수 있다. 이 같은 장점을 활용해 콘텐츠 크리에이터들은 시프트를 콘텐츠의 다양성과 완성도를 높이는 창작 도구로 활용 할 수 있다. 버튜버나 스트리머, 팟캐스터가 개성 있는 목소리로 구독자들에게 색다른 청취 경험을 선사하거나, 게이머와 코스튬 플레이어가 게임 캐릭터의 목소리로 타 유저들과 음성 채팅을 즐기며 게임 몰입감을 높이는 식이다. 이교구 수퍼톤 대표는 “제작사와 크리에이터들이 손쉽게 시프트를 사용할 수 있도록 다양한 의견을 수집하는 것이 이번 오픈 베타의 가장 큰 목적”이라며 “정식 출시 버전에는 목소리 샘플을 확대하고 콘텐츠 제작에 유용한 기능들을 추가 탑재하는 등 시프트가 최적의 목소리 목소리 창작 도구로 널리 사용될 수 있도록 노력해 나가겠다”고 말했다.

2024.04.15 11:14안희정

동서발전, 음성발전소 1호기 증기터빈 설치

한국동서발전(대표 김영문)는 8일 충북 음성군 평곡리 일원에서 음성천연가스발전소 1호기 증기터빈 설치 기념행사를 개최했다. 음성천연가스발전소는 국내 1호 연료전환 사업으로 기존 석탄화력 건설을 대체한 친환경 복합화력이다. 신재생 발전의 불규칙한 변동성을 보완해주는 교두보 역할을 할 전망이다. 이번에 설치되는 1호기 가스터빈은 최신 고효율 가스터빈으로 동·하절기에 기존 대비 5~10% 이상 출력을 늘릴 수 있고, 질소산화물 배출농도를 줄이는 등 효율성과 환경설비 설계기준을 동시에 강화했다. 동서발전은 2015년 1월 음성군과 발전사업 추진 업무협약을 체결하고, 지역주민 공청회와 환경영향평가 협의를 거쳐 2021년 9월 전원개발사업 실시를 승인받았다. 2022년 11월에 건설사업 본공사 착공을 시작해 올해에는 본격적으로 증기터빈(137톤), 가스터빈(253톤), 발전기(378톤) 등 고중량 설비 설치를 앞두고 있다. 2025년 6월 준공 이후에는 발전소 부지 내에 생태공원과 체육‧문화시설을 조성해 지역주민 복지 향상에 기여할 전망이다. 김영문 동서발전 사장은 “그동안 마음을 열어주신 지역주민과 지역 일자리를 함께 만들어온 협력사에 감사하다”며 “앞으로도 근로자 중심의 안전관리와 실질적인 현장점검 및 소통을 통해 안전한 발전소 건설 현장이 되도록 하겠다”고 밝혔다. 한편, 이날 행사에는 김영문 동서발전 사장, 이철무 포스코이앤씨 본부장, 홍성호 한국지멘스에너지 사장, 장병용 한국전력기술 처장을 비롯한 주요 관계자 80여 명이 참석해 증기터빈 설치에 기여한 유공자를 포상하고 감사패를 수여했다.

2024.04.08 18:02주문정

오픈AI, 목소리 복제하는 '보이스 엔진' 미리보기 공개

오픈AI가 음성을 복제할 수 있는 인공지능(AI) 모델을 공개했다. 현재 소수 테스터들만 해당 모델에 접근할 수 있다. 29일 벤처비트는 오픈AI가 AI 음성 모델 '보이스 엔진'을 미리보기 버전으로 공개했다고 보도했다. 모델 개발 기간은 약 2년 걸렸다. 그동안 보이스 모델은 챗GPT의 음성 기능에 탑재됐다. 사용자 음성을 인식하고, 답변을 음성으로 제공하는 역할에 그쳤다. 이번에 공개된 모델은 음성 복제까지 가능하다. 사용자가 15초 분량의 음성 클립을 넣으면, 해당 목소리와 매우 유사한 음성을 생성하는 식이다. 오픈AI 측은 공식 블로그에서 해당 모델을 소수 파트너 그룹에만 우선 제공한다고 밝혔다. 각국 선거를 앞둔 상황에서 악영향을 미칠 수 있다는 우려에서다. 실제 올해 초 일레븐랩스의 음성 복제 기술을 사용해 조 바이든 미국 대통령의 목소리를 복제한 사건이 발생해 연방 정부가 조사에 나선 바 있다. 회사는 "해당 모델은 언어 장애인이나 학생들에게 유용할 것"이라며 "신뢰할 수 있는 소규모 파트너 그룹에게만 제공한 상태"라고 밝혔다. 현재 교육 업체 에이지 오브 러닝, 비디오 번역 업체 헤이젠, 의료용 도구 업체 디마지, 언어 장애용 장치 업체 리복스, 의료 및 교육 장치 업체 라이프스판 등이 보이스 엔진을 받았다. 블로그 내용에 따르면, 파트너사는 무단 사칭을 금지하고 음성 제공자의 사전 동의를 요구하는 사용 정책을 지켜야 한다. 생성된 복제 음성에는 귀에 들리지 않는 워터마크도 넣어야 한다.

2024.03.31 10:34김미정

지코어, 100개 언어 지원하는 AI 자동 음성인식 서비스 출시

퍼블릭 클라우드, 엣지 컴퓨팅 및 엣지 AI 전문기업 지코어는 빠른 속도는 물론 비용 효율성을 높인 '지코어 AI 자동 음성인식 서비스(Gcore AI ASR)'를 선보인다고 19일 밝혔다. 지코어 AI 자동 음성인식 서비스는 지코어의 워크플로우에 통합되어, 데이터의 빠른 전달 속도가 매우 중요한 방송사, 주문형 비디오(VOD), 라이브 스트리밍 및 콘텐츠 소유자가 전세계 시청자에게 신속하게 도달할 수 있도록 지원한다. 100개 이상의 언어를 지원하는 관리형 클라우드 서비스로, 다른 언어를 사용하거나 청각 장애가 있는 사용자들도 생성된 자막을 통해 콘텐츠 접근성을 높일 수 있다. 기존의 자동 음성인식 서비스는 속도가 느리고, 비용이 많이 들어 콘텐츠 제작자와 소유자에게 상당한 비용 부담이 됐다. 기존의 자막 생성은 여러 언어가 포함된 경우 몇 시간 또는 며칠씩 걸리기도 했다. 하지만 지코어 AI 자동 음성인식 서비스는 1시간 분량의 동영상 자막을 10분 이내 생성하며, 일반적인 단어 사용에 대한 오류도 4~5%로 낮게 나타나는 등 정확도가 사람이 생성한 것과 유사하거나 더 높다. 뿐만 아니라 여기에 특정 언어 또는 주제 영역에 대한 오픈소스 자동 음성인식 서비스 모델을 선택함으로써 자막을 생성할 콘텐츠에 대한 정확도를 더 높일 수 있다. 이러한 사용자 지정 방식은 산업별 용어나 여러 언어를 사용하는 콘텐츠에 유리하다. 이를 위해 지코어 AI 자동 음성인식 서비스는 새롭게 출시되고 업데이트되는 자동 음성인식 모델을 내부적으로 엄격히 평가해 고객이 사전 구성된 서비스를 통해 최상의 옵션을 사용할 수 있도록 보장한다. 직접 테스트를 거친 최고의 자동음성인식 모델을 한 곳에서 만나볼 수 있도록 지원함으로써 고객은 직접 모델을 선택하거나 조정할 필요 없이 콘텐츠의 빠른 자막 생성에만 집중할 수 있다. 물론 고객이 원할 경우 지코어의 서비스 팀은 고객이 특정 자동음성인식 모델을 선택하고 미세조정을 통해 특정 요구사항을 충족할 수 있도록 지원한다. 알렉세이 페트로브스키크 지코어 스트리밍 플랫폼 헤드는 "전세계 시청자에게 영상 콘텐츠를 제공하는 데 있어 자막은 매우 중요한 요소”라며 “지코어 AI 자동 음성인식 서비스, AI ASR은 방송사는 물론 콘텐츠 소유자 및 기업이 신선하고 접근하기 쉬운 콘텐츠로 세계 곳곳의 시청자에게 도달할 수 있도록 비용 효율적이고 정확한 방법을 제공한다”고 밝혔다. 그는 “지코어의 솔루션과 엣지 인프라의 지속적인 혁신을 위한 또 다른 진전이 될 것"이라고 강조했다. 지코어 AI 자동 음성인식 서비스는 현재 상용 서비스 중이다.

2024.03.19 14:00김우용

셀바스AI, 온디바이스AI 제품 출시 나선 이유는

셀바스AI가 전자책을 사람처럼 읽어주는 온디바이스 제품을 출시해 점차 커지고 있는 온디바이스AI 시장을 본격 공략한다. 셀바스AI는 웹소설 등 전자책을 사람 음성으로 읽는 AI 음성합성 제품 '셀비 딥TTS 온디바이스'를 출시했다고 18일 밝혔다. 셀비 딥TTS 온디바이스는 딥러닝 기반 음성합성 제품이다. 스마트폰, 노트북, 태블릿 등 개인 기기에서 인터넷 연결 없이 AI 기술로 사람의 호흡, 억양, 감성 등 다양한 음성 요소를 정교히 구현할 수 있다. 셀바스AI가 이처럼 온디바이스형 AI 제품 개발에 나선 것은 최근 국내외 온디바이스AI 시장이 확장하고 있어서다. 시장분석기관 GMI 발표에 따르면, 글로벌 온디바이스 AI 시장 규모는 2022년 50억 달러(약 6조6천700억원)에서 연평균 20%씩 성장해 2032년이 700억 달러(약 87조원) 규모일 전망이다. 편리함도 한몫한다. 기존 클라우드 기반 음성합성은 서버에 텍스트를 전송하고, 생성된 음성을 사용자 기기로 전송함에 따라 시간 지연발생, 인터넷 연결 의존 등 사용자 경험의 저하 요인이 많았다. 반면 온디바이스 기술은 사용자 데이터를 외부 서버로 전송하지 않는다. 개인정보, 지적재산권 등 외부 데이터 유출이 우려되는 콘텐츠에 적합하다. 이외에도 정부기관이나 금융, 교육분야 등 정보보안이 중요한 폐쇄망 환경에서도 고품질 음성합성 활용이 가능하다. 셀바스AI는 온디바이스 TTS의 강점 기반으로 모바일 앱 서비스는 물론 웨어러블, 로봇, 차량 등으로 고객사 확보에 나설 방침이다. 특히 서비스 안정성이 중요한 자율주행 차량, 24시간 서비스가 필요한 키오스크 등 오프라인 환경에서 실시간 음성 합성음 생성을 필요로 하는 고객과의 협업도 이어나갈 계획이다. 이항섭 셀바스AI 음성합성 사업대표는 "셀바스AI는 국내 음성합성 시장 점유율 1위 기업으로 기존 음성합성 시장은 물론, 국내 전자책 서비스에 가장 많이 적용 중"이라며 "기존 전자책용 음성합성 솔루션과 비교해 현격한 개선을 이룬 제품을 통해 전자책 고객 및 서비스의 요구사항을 적극 반영해 시장을 빠르게 확대할 계획"이라고 말했다.

2024.03.18 16:46김미정

오픈 AI 챗 GPT, 안드로이드 OS서도 홈 화면 위젯 제공

글로벌 인공지능(AI) 기업 오픈AI가 앞으로는 챗 GPT의 안드로이드용 버전에서도 홈 화면 위젯을 제공할 전망이다. 미국 IT매체 더 버지는 26일(현지시간) 안드로이드 OS 전문가 미샬 라만(Mishaal Rahman)의 발언을 인용해 이같이 보도했다. 사용 방법은 기존의 위젯과 같이 스마트폰 홈 화면의 빈 공간을 길게 클릭하면 관련 기능을 추가할 수 있다. 위젯에는 텍스트·이미지·음성 쿼리를 보내거나 대화 모드를 시작하는 탭이 들어가 있다. 다만 신규기능이 탑재된 챗 GPT 앱 버전은 베타 기능일 수 있다고 매체는 전했다. 구글플레이 스토어 앱 버전의 번호가 낮다는 이유에서다.

2024.02.26 10:51이한얼

갤럭시 AI가 궁극적으로 나아갔으면 하는 길

미국 시간으로 오는 17일 오전 10시(한국 시간 18일 오전 3시)에 개최되는 '삼성 갤럭시 언팩 2024'를 특별히 주목한다. 이날 미국 캘리포니아주 산호세에서 발표될 갤럭시S24가 세계 최초의 온디바이스 인공지능(AI) 스마트폰으로 여겨지기 때문이다. 온 디바이스(On-Device) AI는 인터넷에 연결되지 않고도 기기 자체의 정보와 컴퓨팅 파워를 통해 작동하는 인공지능 서비스를 의미한다. 삼성전자는 이 행사 초대장에서 '모바일 AI의 새 시대를 연다'고 선언했다. 2022년 11월 챗GPT가 출시된 뒤 AI는 인터넷과 모바일에 버금가거나 이를 능가할 신기술로 주목받고 있다. 2007년 처음 선보인 아이폰은 세상의 많은 것을 바꾸어놓았다. 세상이 스마트폰과 앱 중심으로 돌아가게 된 것이다. 인공지능(AI) 스마트폰에 특별히 주목하는 까닭은 세상을 바꾼 두 기술이 결합하기 때문이다. 이날 행사의 초점은 아마도 새로운 삼성 갤럭시가 어떤 AI 기능을 탑재했는가에 쏠릴 것이다. 벌써부터 여러 기능이 소개되고 있다. 실시간 통역 통화 기능이 한 예다. AI가 외국인과의 통화를 실시간으로 통역해주고 통화 내용을 문서로도 정리해줄 것이라고 한다. AI를 통해 카메라 성능을 크게 개선할 것이라는 이야기도 있다. 특히 인공지능 기술을 이용해 150배 줌(확대)을 지원할 거라 한다. AI 열풍은 스마트폰 시장에도 영향을 줄 것이다. 기술의 파괴력이 큰 만큼 애플과 중국 기업 사이에 낀 삼성으로서도 위기임에 분명하다. 위험요소이기도 하고 기회이기도 한 것이다. 대응전략에 따라 그 결과가 달라질 것이다. 평소 그 대응전략이 궁금했다. SW 중심의 생성AI 회사가 아니라 종합기술회사로 스마트폰 기기 자체를 플랫폼으로 갖는 회사는 AI 시대에 어떤 전략을 세워야 할 것인가. 삼성 전략에 대해 생각할 때 힌트를 준 사람은 빌 게이츠 마이크로소프트 창업자였다. 그는 “5년 내로 컴퓨터를 사용하는 방식이 완전히 바뀔 것”이라고 내다봤다. 컴퓨터와 소통하기 위해 했던 과거 모든 훈련과 교육의 번거로움과 복잡한 과정을 대신해주는 존재가 등장하는데, 그게 'AI 에이전트'라는 것이다. 공상과학영화에서나 보던 인공지능 개인비서 시대가 근시일내에 열릴 거라는 뜻이다. 그는 'AI 에이전트'에 대해 “자연어에 반응하고 사용자에 대한 지식을 기반으로 다양한 작업을 수행할 수 있는 유형의 소프트웨어”라고 정의했다. 그는 특히 “사람은 작업마다 다른 앱을 사용할 필요가 없다”고 했다. 그렇다면 일반인이 쓰는 'AI 에이전트'는 어디에 어떤 형태로 존재할 것인가. 빌 게이츠 말을 들으며 가장 궁금한 점이 그것이었다. 짧은 소견이지만 스마트폰이 그 답일 수 있겠다. 스마트폰이 'AI 에이전트'가 되게 하려면 어떤 기술에 집중해야 할 것인가. 크게 세 가지를 생각해봤다. 사용자 행동 패턴에 대한 이해, 음성 언어 소통 능력의 강화, 외부 AI 챗봇과의 소통 능력 강화 등이다. 이는 사실 빌 게이츠가 'AI 에이전트'에 대해 “자연어에 반응하고 사용자에 대한 지식을 기반으로 다양한 작업을 수행할 수 있는 유형의 소프트웨어”라고 개념 정의한 것과 맥을 같이 한다. 지금 세상에서 사용자의 행동 패턴을 스마트폰보다 더 잘 이해하는 것은 없다. 빌 게이츠가 말한 '사용자에 대한 지식'이 스마트폰에 있다. 삼성이 갤럭시를 'AI 에이전트'로 진화시키려면 스마트폰에 기록된 행동 패턴을 사용자의 거부감 없이 유의미한 정보로 재구축할 방법을 고안해내야 한다. 물론 법의 테두리 안에서. 개인정보는 철저히 보호하면서 행동 패턴은 유의미하게 분석돼야 하는 것. 음성 소통 기술 또한 중요해 보인다. 빌 게이츠가 말한 “자연어에 반응”이 그것이다. 기술이 진화하면서 스마트폰과 관련된 다양한 입줄력 방식도 개발되겠지만 음성 소통만한 것이 있겠는가. 스마트폰은 문자보다는 음성이 제격이다. 특히 자연스러운 소통 외에 음성을 분석해 사용자를 인증하는 기술도 필요해 보인다. 사용자의 음성에만 반응하는 'AI 에이전트'라면 조금 더 신뢰할 수 있지 않겠나. 'AI 에이전트'는 직접 어떤 일을 수행하는 작업도구는 아니다. 그보다 작업도구로서 기능할 다양한 AI 챗봇과 사람을 대신해 소통하는 비서이다. 특정한 기능의 생성AI 개발보다는 우후죽순으로 쏟아질 수많은 생성AI를 찾아내고 그것들에 작업을 지시할 수 있게 해주는 기능을 개발하고 강화해야 한다. 빌 게이츠가 “사람은 작업마다 다른 앱을 사용할 필요가 없다”고 한 말이 그런 뜻이지 않겠는가.

2024.01.05 09:27이균성

  Prev 1 2 3 Next  

지금 뜨는 기사

이시각 헤드라인

과기정통부, AI 중심 조직 개편 '가속'…정책 컨트롤타워 본격화

"국정자원 화재 초래 서버-배터리 간격 규제해야"

미 연방정부 셧다운에 사이버보안도 '셧다운' 위기

오픈AI 영향력 이 정도?…AI에 진심인 이재명, 43년 묵은 금산분리 '완화' 추진

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.