검색 - IT세상을 바꾸는 힘 지디넷코리아

ZDNet 검색 페이지

'페이스북광고계정판매 [. 문의텔레 Tway010 .] Apple ID가입대행 Google Voice 아이디,OeC'통합검색 결과 입니다. (305건)

영역
기간
- 3개월
- 1년
- 1년 이전

재검색

코로나19는 정확, 경제는 취약?…5대 AI 모델 팩트체킹 능력 비교

LLM, 거짓 정보 탐지에는 강하지만 전반적 성능은 아직 미흡 생성형 AI를 기반으로 한 대형 언어 모델(LLM)이 정치 정보의 진위를 판별하는 팩트체킹 영역에서 어떤 역할을 할 수 있을지 관심이 커지고 있다. 최근 ChatGPT와 같은 대화형 AI의 등장으로 정보의 진위를 자동으로 판별하는 기술에 대한 기대가 높아지고 있는 가운데, 바이젠바움 연구소와 베른 대학 연구팀이 5개 주요 LLM의 팩트체킹 능력을 체계적으로 평가한 연구 결과를 발표했다. 연구팀은 ChatGPT-4, Llama 3(70B), Llama 3.1(405B), Claude 3.5 Sonnet, Google Gemini 등 5개 LLM을 대상으로 전문 팩트체커가 이미 검증한 1만 6,513개의 정치 정보 진술문에 대한 진위 판별 능력을 테스트했다. 주제 모델링과 회귀 분석을 통해 진술문의 주제나 모델 유형이 판별 정확도에 어떤 영향을 미치는지 체계적으로 분석했다. 정확도는 챗GPT와 제미나이가 앞서… 거짓 정보 탐지 정확도 최대 80% 연구 결과에 따르면 ChatGPT-4와 Google Gemini가 다른 모델보다 전반적으로 높은 정확도를 보였다. 특히 모든 모델이 참인 정보보다 거짓 정보를 탐지하는 데 더 강점을 보였는데, 특히 코로나19, 미국 정치 논쟁, 사회 이슈와 같은 민감한 주제에서 더 높은 정확도를 나타냈다. 이는 모든 LLM이 공중 보건이나 정치인과 관련된 민감한 주제에 대해 가드레일(안전장치)을 설정했을 가능성을 시사한다. 이런 주제에 대한 높은 정확도는 훈련 데이터에 관련 거짓 정보가 더 많이 포함되었을 가능성도 있지만, GPT 모델이 건강 관련 주제에서 높은 정확도를 보인다는 이전 연구와도 일치하는 결과다. 코로나19는 133% 더 정확하게, 경제 주제는 70% 더 부정확하게 판별 모든 LLM은 전반적으로 '혼합(MIXTURE)' 범주의 진술문보다 '거짓(FALSE)' 범주의 진술문을 더 정확하게 식별했다. 특히 진위 여부가 명확한 극단적 사례보다 부분적 사실과 부분적 거짓이 혼합된 복잡한 진술을 평가하는 데 어려움을 겪었다. 흥미롭게도 연구진은 LLM 간 성능 차이가 상당하다는 점을 발견했다. 예를 들어 Llama 모델은 진술문이 '참'인지 '거짓'인지 혹은 '혼합'인지에 관계없이 '참'으로 판정하는 경향이 있었다. 이는 모델들의 기반이 되는 훈련 데이터가 성능에 깊은 영향을 미친다는 점을 보여준다. 또한 미국 재정 문제나 경제 관련 주제에서는 모든 LLM이 거짓 정보를 식별하는 정확도가 낮았다. 이는 특정 주제에 대한 훈련 데이터의 부족이나 주제별 가드레일의 차이에서 기인했을 가능성이 있다. 더 큰 모델이 팩트체킹도 더 정확하게 수행 연구팀은 LLM의 팩트체킹 성능이 모델의 아키텍처 및 파라미터 규모와 직접적인 관련이 있다고 지적했다. Llama 3.1(405B)이 Llama 3(70B)보다 모든 카테고리에서 더 나은 성능을 보인 것이 이를 증명한다. 이는 더 많은 파라미터로 훈련된 모델이 복잡한 팩트체킹 작업에서 더 좋은 성능을 발휘한다는 것을 의미한다. 연구진은 LLM의 팩트체킹 능력 향상을 위해 목표화된 사전 훈련과 미세 조정이 필요하다고 제안했다. 특히 코로나19와 미국 정치 관련 주제에서 모든 LLM이 높은 정확도를 보인 점에 주목하며, 가드레일 설정이 출력의 정확성을 보장하는 유망한 전략이 될 수 있다고 밝혔다. 하지만 이러한 가드레일은 변화하는 사회정치적 맥락에 맞춰 지속적인 조정이 필요하다는 도전과제도 함께 존재한다. 연구팀은 또한 ClaimsKG 데이터셋이 미국 중심적이라는 점을 한계로 지적하며, 다른 사회정치적 맥락이나 언어에서는 LLM 성능이 다를 수 있다고 경고했다. FAQ Q: 생성형 AI가 팩트체킹을 완전히 자동화할 수 있을까요? A: 현재로서는 어렵습니다. 이번 연구에서 보듯 대형 언어 모델(LLM)은 특히 거짓 정보 탐지에 강점을 보이지만, 전반적인 정확도는 여전히 제한적입니다. LLM은 팩트체킹을 보조하는 도구로 활용하되, 전문가의 검증이 여전히 필요합니다. Q: 왜 AI는 참인 정보보다 거짓 정보를 더 잘 탐지하나요? A: 연구에 따르면 이는 훈련 데이터의 특성과 관련이 있을 수 있습니다. 예를 들어 ChatGPT-4는 팩트체크된 거짓 정보가 더 많이 포함된 데이터로 훈련되었을 가능성이 있고, 특히 코로나19나 정치 논쟁과 같은 민감한 주제에 대해서는 가드레일(안전장치)이 설정되어 있을 수 있습니다. Q: 어떤 주제에서 AI 팩트체킹이 가장 정확한가요? A: 이번 연구에서는 코로나19, 미국 정치 논쟁, 사회 이슈와 같은 민감한 주제에서 AI가 더 정확한 팩트체킹을 수행했습니다. 반면 미국 경제나 재정 정책 관련 주제에서는 정확도가 낮았습니다. 이는 특정 주제에 대한 데이터 부족이나 가드레일 설정의 차이에서 비롯될 수 있습니다. ■ 이 기사는 AI 전문 매체 'AI 매터스'와 제휴를 통해 제공됩니다. 기사는 클로드 3.5 소네트와 챗GPT를 활용해 작성되었습니다. (☞ 기사 원문 바로가기)

2025.03.17 11:37AI 에디터

챗GPT? 클로드?…생성형 AI, 최고 인기 모델은?

보고서: 2025년 초 인공지능 생태계 동향 텍스트 AI 시장: 오픈AI '챗GPT-4o' VS 앤트로픽 '클로드3.5' AI 플랫폼 포(Poe)가 발표한 보고서에 따르면, 텍스트 생성 AI 시장에서 OpenAI와 Anthropic은 약 85%의 점유율을 차지하며 시장을 주도하고 있다. 특히 주목할 점은 2024년 6월 Claude 3.5 Sonnet이 출시된 이후 Anthropic의 사용량이 급격히 증가해 OpenAI와 거의 동등한 수준의 사용량을 보이고 있다는 것이다. 이는 표현력이 풍부한 텍스트 생성 분야에서 두 기업 간 경쟁이 심화되고 있음을 시사한다. 포(Poe)가 제공한 자료에 따르면, 텍스트 AI 시장에서 GPT-4o가 가장 높은 38.3%의 점유율을 보이고 있으며, Claude-3.5-Sonnet이 22.3%, Claude-3.7-Sonnet이 11.9%를 차지하고 있다. 이는 OpenAI의 주력 모델인 GPT-4o와 Anthropic의 주력 모델인 Claude 3.5 및 3.7 시리즈가 시장의 주요 부분을 차지하고 있음을 명확하게 보여준다. 시장의 또 다른 특징은 새로운 주력 모델이 출시될 때마다 이전 버전의 사용량이 빠르게 감소한다는 점이다. GPT-4에서 GPT-4o로, Claude-3에서 Claude 3.5로의 전환이 이를 잘 보여준다. 한편 DeepSeek-R1 및 -V3는 2024년 12월 출시 이후 단기간에 7%의 점유율을 확보하며 Llama나 Mistral과 같은 기존의 오픈소스 모델보다 높은 성과를 거두었다. 구글(Google)의 제미나이(Gemini) 계열은 2024년 10월까지 점유율이 증가했으나 이후 하락세를 보이고 있다. 반면 '기타' 모델들의 사용량은 꾸준히 증가하고 있어, 사용자들이 다양한 모델을 탐색하고 있음을 알 수 있다. 이미지 생성 AI 시장: '달리3'의 몰락, '이마젠3'의 급부상 이미지 생성 AI 시장은 초기 달리3(DALL·E-3)와 스테이블 디퓨전(StableDiffusion) 버전이 주도했으나, 공식 이미지 생성 모델의 수가 3개에서 약 25개로 급증하면서 이들의 점유율은 80% 가까이 감소했다. 현재 시장을 주도하는 것은 블랙포레스트랩스(BlackForestLabs)의 FLUX 계열 모델로, 2024년 중반 등장 이후 약 40%의 시장 점유율을 유지하고 있다. 포(Poe)의 자료에 따르면, 이미지 생성 분야에서 이마젠3(Imagen3)가 28.7%로 가장 높은 점유율을 보이고 있으며, FLUX-pro-1.1-ultra가 18.1%, FLUX-pro-1.1이 11.9%, DALL·E-3가 9.9%를 차지하고 있다. 이는 2024년 초부터 2025년 초까지 이미지 생성 AI 시장의 지형이 크게 변화했음을 보여준다. 특히 주목할 점은 2024년 초에는 DALL·E-3가 시장을 지배했으나, 2024년 중반부터 FLUX 계열 모델과 이마젠3(Imagen3)가 빠르게 시장을 장악해갔다는 것이다. 구글의 이마젠3(Imagen3) 계열은 2024년 말 출시 이후 꾸준한 성장세를 보이며, 주력 모델인 이마젠3와 최적화된 이마젠3-패스트(Imagen3-Fast)를 통해 약 30%의 점유율을 차지하고 있다. 플레이그라운드(Playground)와 이디오그램(Ideogram) 같은 전문 이미지 생성 업체들도 정기적인 모델 업데이트를 통해 시장에서의 존재감을 유지하고 있지만, 이들의 점유율은 합쳐도 약 10%에 그치고 있다. 비디오 생성 AI 시장: '런웨이' 제치고, 구글 '비오2' 1위 등극 비디오 생성 분야는 2024년 말부터 빠르게 성장하여 현재 8개 이상의 제공업체가 다양한 옵션을 제공하고 있다. 초기에는 런웨이(Runway)가 이 분야를 주도했으며, 시간이 지나면서 점유율이 다소 감소했음에도 여전히 30-50%의 비디오 생성 메시지를 처리하고 있다. 포(Poe)의 비디오 생성 모델 사용량 데이터를 보면, 2025년 2월 기준으로 구글의 비오2(Veo2)가 39.8%의 점유율로 시장을 주도하고 있으며, 런웨이(Runway)가 31.6%로 그 뒤를 따르고 있다. 드림머신(Dream Machine)은 5.8%, 피카2.0(Pika2.0)은 6.0%의 점유율을 보이고 있다. 주목할 만한 변화는 구글의 비오2(Veo2)의 급부상이다. 포(Poe)에서 최근 출시된 이후 불과 몇 주 만에 전체 비디오 생성 메시지의 약 40%를 차지하며 시장에 강력하게 진입했다. 중국 기반 모델인 클링 프로 v1.5(Kling Pro v1.5), 하이루오AI(Hailuo AI), 훤위안비디오(Hunyuan Video), 완2.1(Wan2.1) 등도 능력, 추론 시간, 비용 측면에서 경쟁력을 강화하고 있으며, 이들이 합쳐 약 15%의 비디오 생성 메시지를 처리하고 있다. 특히 비디오 생성 분야의 성장 속도는 주목할 만하다. 시각화 자료를 보면 2024년 11월부터 2025년 2월까지 불과 3개월 만에 런웨이(Runway)의 독점적 지위가 무너지고 다양한 모델이 시장에 진입하여 경쟁 구도가 형성되었음을 확인할 수 있다. AI 모델 생태계의 다양화와 향후 전망 포(Poe)의 보고서는 AI 모델 생태계가 빠르게 다양화되고 있음을 보여준다. 특히 주목할 점은 새로운 모델이 등장할 때마다 사용자들이 적극적으로 이를 탐색하고 채택한다는 것이다. 이는 AI 기술이 빠르게 발전하는 동시에 사용자들의 수요와 기대치도 함께 상승하고 있음을 시사한다. 제공된 시각화 자료를 통해 볼 때, AI 모델 시장은 매우 역동적으로 변화하고 있으며, 새로운 모델이 출시되면 기존 시장 지배자의 점유율이 빠르게 잠식되는 특성을 보인다. 이는 AI 기술이 아직 성숙 단계에 이르지 않았으며, 계속해서 혁신과 발전이 이루어지고 있음을 의미한다. 향후 포(Poe)는 특정 작업에 대한 사용자 선호도, 다양한 가격대에서의 모델 성능과 공식 보고된 기준과의 일치 여부, 모델 조합이나 사용자 충성도 요소 등에 대한 추가 연구를 진행할 계획이다. 이러한 분석은 AI 생태계의 발전 방향을 예측하는 데 중요한 지표가 될 것이다. 포(Poe)는 현재 100개 이상의 공식 AI 모델을 제공하고 있으며, 월 5달러부터 시작하는 구독 서비스를 통해 이러한 다양한 모델을 직접 경험할 수 있다. 모든 사용자 정보는 개인정보 보호정책에 따라 처리되며, 모델 제공업체가 제출된 입력을 훈련 목적으로 사용하는 것을 명시적으로 금지하고 있다. FAQ Q1: 현재 텍스트 생성 AI 시장에서 가장 많이 사용되는 모델은 무엇인가요? A1: 현재 텍스트 생성 AI 시장은 OpenAI의 GPT-4o가 38.3%로 가장 높은 점유율을 보이고 있으며, Anthropic의 Claude-3.5-Sonnet이 22.3%, Claude-3.7-Sonnet이 11.9%로 그 뒤를 따르고 있습니다. OpenAI와 Anthropic의 모델들이 텍스트 생성 AI 시장의 대부분을 차지하고 있어 두 기업 간의 경쟁이 치열하게 진행되고 있습니다. Q2: 이미지 생성 AI 시장에서 최근 가장 빠르게 성장한 모델은 무엇인가요? A2: 이미지 생성 AI 시장에서는 구글의 이마젠3(Imagen3)가 28.7%로 가장 높은 점유율을 보이며 가장 빠르게 성장했습니다. 또한 블랙포레스트랩스(BlackForestLabs)의 FLUX 계열 모델(FLUX-pro-1.1-ultra 18.1%, FLUX-pro-1.1 11.9% 등)도 합쳐서 약 40%의 시장 점유율을 차지하며 빠르게 성장했습니다. 2024년 초에는 DALL·E-3가 시장을 지배했으나, 1년 만에 시장 지형이 크게 변화했습니다. Q3: 비디오 생성 AI 분야는 어떻게 발전하고 있나요? A3: 비디오 생성 AI 분야는 2024년 말부터 급속히 성장하고 있으며, 2025년 2월 기준으로 구글의 비오2(Veo2)가 39.8%, 런웨이(Runway)가 31.6%의 점유율을 보이고 있습니다. 특히 구글의 비오2(Veo2)는 출시 후 불과 몇 주 만에 시장의 약 40%를 차지하며 급부상했습니다. 이 외에도 드림머신(Dream Machine), 피카(Pika), 하이루오 AI(Hailuo AI), 클링 프로(Kling Pro) 등 다양한 모델이 시장에 진입하면서 경쟁이 심화되고 있습니다. ■ 이 기사는 AI 전문 매체 'AI 매터스'와 제휴를 통해 제공됩니다. 기사는 클로드 3.5 소네트와 챗GPT를 활용해 작성되었습니다. (☞ 기사 원문 바로가기)

2025.03.14 14:47AI 에디터

AI 음성복제 시대 활짝…사기·개인정보 도용 괜찮을까

AI 음성 복제 기술이 빠르게 발전하면서 누구나 간단한 오디오 샘플만으로 특정 인물의 목소리를 재현할 수 있는 시대가 열렸다. 이제는 몇 초 분량의 음성만 있어도 인공지능(AI)이 이를 학습해 자연스럽게 대화를 생성할 수 있으며, 비용도 저렴하다. 컨슈머 리포트(Consumer Reports)의 'AI Voice Cloning Report'에 따르면, 조사 대상 6개 AI 음성 복제 기업 중 4곳이 별다른 보안 장치 없이 누구의 음성이든 쉽게 복제할 수 있도록 허용하고 있는 것으로 나타났다. (☞ 보고서 바로가기) 특히, 일레븐랩스(ElevenLabs), 스피치파이(Speechify), 플레이HT(PlayHT), 로보(Lovo) 같은 AI 음성 복제 기업들은 사용자의 동의를 확인하는 기술적 장치를 마련하지 않았으며, 단순히 '해당 음성을 복제할 권한이 있다'는 체크박스만 확인하면 누구든지 음성을 생성할 수 있는 구조였다. 반면, 디스크립트(Descript), 리셈블AI(Resemble AI)는 사용자 동의를 확인하는 절차를 추가했지만, 여전히 보안이 완벽하지 않다는 평가를 받았다. AI 음성 사기, 피해 규모 2.7조 원 돌파 AI 음성 복제 기술이 사기범들의 강력한 도구로 활용되고 있다. 미국 연방거래위원회(FTC)에 따르면, 2023년 한 해 동안 AI 음성 사기로 인한 피해 신고 건수는 85만 건에 달하며, 이로 인한 재정적 피해는 총 20억 달러(약 2.7조 원)를 넘어섰다. 이러한 AI 사기의 대표적인 사례가 '손자 사기(Grandparent Scam)'이다. 사기범들은 노인들에게 전화를 걸어 AI가 복제한 가족의 목소리로 "교통사고를 당했다"거나 "급하게 돈이 필요하다"고 요청해 금전을 갈취하는 방식이다. 실제로 한 노인은 AI로 생성된 손자의 목소리를 듣고 15,000달러(약 2,000만 원)를 송금하는 피해를 입었다. 기업도 AI 음성 사기의 주요 타겟이 되고 있다. 한 영국 에너지 회사에서는 AI로 복제된 최고경영자(CEO)의 음성을 들은 회계 담당자가 24만 달러(약 3.2억 원)를 송금하는 사건이 발생했다. 사기범들은 회사의 전화 녹음이나 공개된 인터뷰 영상을 활용해 AI로 목소리를 복제한 후, 실제 CEO인 것처럼 가장해 직원들에게 자금을 송금하도록 지시했다. 유명인 사칭, AI가 만든 가짜 광고 판친다 유명인이나 정치인을 사칭한 AI 음성 사기도 급증하고 있다. 특히, 조 바이든 미국 대통령의 목소리를 AI로 복제해 유권자들에게 "투표하지 말라"는 로보콜이 발송되는 사건이 발생해 논란이 되었다. 소셜 미디어에서는 AI 음성을 활용한 가짜 광고도 퍼지고 있다. 최근 엘론 머스크의 목소리를 AI로 복제한 후, 가짜 투자 광고를 만들어 69만 달러(약 9억 원) 이상의 피해를 유발한 사건이 보고되었다. 또한, 테일러 스위프트, 오프라 윈프리, 조 로건 등 유명인의 음성을 AI로 복제해 각종 다이어트 보조제나 투자 사기를 홍보하는 광고가 무차별적으로 유포되고 있다. AI 은행 보안 뚫렸다… AI 음성으로 계좌 해킹 가능 AI 음성 복제 기술이 금융 보안에도 큰 위협이 되고 있다. 2023년 한 기자가 AI 음성을 사용해 본인의 은행 계좌 보안 인증을 뚫는 실험을 진행했으며, 단 3초 분량의 오디오로도 성공했다. BBC 기자도 같은 실험을 진행했는데, AI가 생성한 음성으로 산탄데르(Santander)와 할리팩스(Halifax) 은행의 보안 인증을 우회하는 데 성공했다. 이에 따라 음성 인증을 보안 수단으로 사용하는 금융기관들이 긴급 점검에 나섰다. AI 음성 사기 막을 수 있는 대책은? 일부 AI 기업들은 문제 해결을 위해 보안 조치를 도입하고 있다. 일레븐랩스는 유명인의 음성 복제를 차단하는 'No-Go Voice' 기능을 개발했으며, 리셈블AI는 AI가 생성한 음성을 감지할 수 있는 '음성 워터마킹' 기술을 적용했다. 그러나 여전히 많은 기업들이 단순한 체크박스 방식의 사용자 동의만 요구하고 있어 실질적인 보안 대책이 부족하다는 지적이 나오고 있다. 보고서는 AI 음성 복제 기술을 보다 안전하게 관리하기 위해 다음과 같은 조치를 권고하고 있다. 사용자 동의 검증 강화 AI 음성 복제를 하기 위해서는 본인의 목소리로 직접 동의하는 절차를 추가해야 한다. 유명인 및 공직자 음성 보호 공인들의 음성을 AI로 복제할 수 없도록 차단하는 기술 적용이 필요하다. AI 생성 음성 감지 기술 개발 금융기관 및 소셜 미디어에서 AI 생성 음성을 탐지하고 경고하는 시스템 도입이 시급하다. 강력한 법적 규제 도입 AI 음성 복제 기술의 악용을 막기 위해 정부 차원의 법적 제재와 감시 시스템이 필요하다. AI 음성 복제 기술은 다양한 긍정적인 활용 가능성이 있지만, 악용될 경우 심각한 피해를 초래할 수 있다. 사용자들은 AI 음성 사기에 대비해 낯선 번호로 걸려온 전화에 주의하고, 금융 거래 시 추가 보안 인증을 적용하는 등의 대응책을 마련해야 한다. AI 기술이 사회에 긍정적으로 기여할 수 있도록, 기업과 정부의 적극적인 조치가 필요하다. ■ 이 기사는 AI 전문 매체 'AI 매터스'와 제휴를 통해 제공됩니다. 기사는 클로드 3.5 소네트와 챗GPT를 활용해 작성되었습니다. (☞ 기사 원문 바로가기)

2025.03.12 08:49AI 에디터

알서포트, 2025년 AI바우처 공급기업 선정

B2B IT솔루션 전문기업 알서포트(대표 서형수)는 '2025 AI 바우처 지원사업'에 공급기업으로 선정, 'AI리포트'를 제공한다고 10일 밝혔다. 과학기술정보통신부와 정보통신산업진흥원(NIPA)이 주관하는 '2025 AI 바우처 지원사업'은 AI 기술 도입을 희망하는 중소·중견기업, 소상공인 등의 수요기업이 AI 솔루션을 활용할 수 있도록 최대 2억원 상당의 바우처를 지원하는 사업이다. 초기 도입 비용 부담을 줄여 디지털 전환을 촉진하고 AI기술을 확산한다는 취지로 시행하고 있다. 공급기업으로 선정된 알서포트는 다양한 산업군을 대상으로 업무 생산성 향상을 위한 AI 회의록 솔루션 'AI리포토(AI:repoto)'를 제공한다. 'AI리포토'는 온오프라인 회의 내용을 자동으로 기록, 정리해 업무 효율을 향상시키는 기업용 AI회의록 솔루션이다. 알서포트의 독자적인 AI 파인튜닝 기술과 독보적인 STT(Speech-to-Text, 음성 텍스트 변환) 기술력을 결집한 제품이다. 자체 테스트 기준 99.8%의 음성인식 정확도를 기록, 최대 동시 20명까지 정확하게 음성을 구분한다고 회사는 밝혔다. 또 주요 아젠다와 키워드를 추출해 목적에 따라 적절한 템플릿의 보고서 형태로 정리해준다. 이때 맥락 분석 및 추론, 중요도 평가, 패턴 분석 등으로 불필요한 내용은 제거하고 핵심 주제와 과제(action item)만 정교하게 정리해주는 것이 특징이다. '공유하기'와 '피드백' 기능을 활용해 의사결정 및 후속 작업의 속도와 효율성을 대폭 향상할 수 있다고 덧붙였다. 마이크로소프트 팀즈(Teams)를 비롯해 줌(Zoom), 구글 밋(Google Meet) 등 주요 화상회의 플랫폼에 사용할 수 있다. 별도의 프로그램 설치나 복잡한 설정 없이 'AI리포토'에 URL만 붙여 넣으면 웹브라우저 상에서 회의록부터 보고서까지 자동으로 생성한다. 음성 파일이나 동영상 파일을 업로드해 회의록을 생성할 수도 있다. 기업에서 사용 중인 LLM(대규모 언어 모델)과 연동할 수 있는 것도 강점으로 꼽힌다. 한상준 알서포트 국내영업총괄은 “이번 사업으로 더 많은 기업들이 'AI리포토'를 활용해 업무 생산성을 향상하고 경쟁력 강화를 꾀할 수 있게 됐다”면서 "알서포트는 다양한 사업의 공급기업으로서 축적한 노하우를 바탕으로 중견·중소기업의 AI전환을 적극 지원할 것”이라고 말했다. 한편, 알서포트는 지난 연말 일본에 'AI리포토'를 선출시한데 이어, 올해 1월에는 일본 최대 통신기업인 NTT도코모 도쿄 수도권 지사에 정식 공급했다. NTT도코모는 전체 그룹사 및 계열사까지 확대 도입을 검토 중이라고 회사는 밝혔다.

2025.03.10 23:11방은주

AI가 논문 심사까지?…8시간 걸리던 작업, 30분에 끝낸다

연구자들이 겪는 논문 심사 부담, AI가 해결할 수 있을까? 연구 논문 심사는 학계의 중요한 과정이지만, 연구자들에게는 시간과 노력이 많이 드는 부담스러운 작업이다. 네이처(Nature)에 발표된 연구 자료에 따르면, AI를 활용한 논문 심사 방법을 통해 연구자들이 보다 효율적으로 심사를 수행할 수 있다. 해당 연구에서 Dritjon Gruda 박사는 페이스북과 링크드인에서 약 900명의 연구자를 대상으로 설문 조사를 진행해, 연구자들이 논문 심사에 얼마나 많은 시간을 쓰는지 분석했다. 아래 그래프에서 볼 수 있듯이, 응답자 중 40% 이상이 2~4시간을 소비한다고 답했으며, 25%는 4~8시간, 14%는 8시간 이상을 소요한다고 밝혔다. 심사에 드는 시간이 많을수록 연구자들은 부담을 느끼고, 결국 심사 요청을 거절하는 경우가 늘어나게 된다. AI 기반 논문 심사의 세 단계: 스캔, 음성 입력, 정리 연구자들이 심사 부담을 줄이면서도 논문의 질을 유지하기 위해, Gruda 박사는 스캔(Scan), 음성 입력(Dictate), 정리(Refine)라는 세 가지 AI 기반 접근법을 제안했다. 스캔(Scan) 연구자는 논문의 초록, 서론, 방법론, 결과 부분을 빠르게 훑어보면서 전체적인 논리 흐름을 이해한다. 분석이 명확하면 전체 논문을 검토하고, 심각한 오류가 있다면 거부 결정을 빠르게 내릴 수 있다. 음성 입력(Dictate) AI 기반 음성 인식 기술을 활용해 실시간으로 피드백을 기록하면, 나중에 긴 문서를 작성하는 시간을 절약할 수 있다. 예를 들어, Windows의 'Voice Access'나 macOS의 'Voice Control'을 사용하면 연구자가 논문을 읽는 동안 자동으로 메모를 생성할 수 있다. 정리(Refine) AI를 활용해 피드백을 정리하고 체계화할 수 있다. GPT4ALL과 같은 오프라인 대형 언어 모델(LLM)을 사용하면 보안 문제 없이 심사 내용을 정리할 수 있다. 간단한 프롬프트(예: "이 메모를 바탕으로 정돈된 논문 심사 보고서를 작성하라")를 입력하면 AI가 논리적으로 정리된 보고서를 생성할 수 있다. 연구자들이 보안 걱정 없이 AI를 활용할 방법은? 로컬 AI 모델 사용 AI가 논문 심사에 활용될 경우 연구 윤리와 보안 문제가 함께 논의되어야 한다. 일부 학술지는 AI를 활용한 문서 편집과 피드백 정리는 허용하지만, 논문 자체를 AI에 업로드하는 것은 금지하는 경우가 많다. 이는 연구자의 익명성을 보호하고, AI 모델이 기밀 데이터를 학습하는 것을 방지하기 위한 조치다. 이를 해결하기 위해 연구자들은 오프라인 AI 모델을 활용할 수 있다. GPT4ALL과 같은 로컬 AI 모델을 사용하면 인터넷에 연결하지 않고도 피드백을 정리할 수 있어 보안성을 유지할 수 있다. 다만 AI는 최종 판단을 내리는 도구가 아니라, 연구자가 보다 명확한 피드백을 작성하도록 보조하는 역할에 한정해야 한다. AI가 연구 논문 심사에 미칠 영향, 심사 시간 80% 단축 가능 AI가 논문 심사 과정에서 중요한 보조 역할을 할 수 있음이 점점 더 분명해지고 있다. 연구자들은 AI를 활용해 심사 시간을 단축하면서도 보다 정교한 피드백을 제공할 수 있다. 특히, 생성형 AI가 발전함에 따라 논문 초안 작성, 연구 요약, 데이터 분석 보조 등 다양한 활용 가능성이 열리고 있다. 앞으로 AI 기술이 더욱 정교해진다면, 연구자들은 더욱 신속하고 정확한 심사 피드백을 제공할 수 있을 것이다. 하지만 AI의 활용이 연구의 독창성과 윤리성을 해치지 않도록 신중한 접근이 필요하다. AI가 논문 심사 과정의 보조 도구로 자리 잡는다면, 연구의 질을 높이는 동시에 연구자들의 부담을 줄이는 긍정적인 변화를 가져올 수 있을 것이다. FAQ Q. AI가 연구 논문을 대신 심사할 수 있나요? A: AI는 논문을 대신 심사하는 것이 아니라, 연구자가 심사를 더 빠르고 체계적으로 할 수 있도록 보조하는 역할을 합니다. 예를 들어, AI는 연구자의 피드백을 정리하고 구조화하는 데 도움을 줄 수 있지만, 논문의 타당성 판단은 여전히 인간의 몫입니다. 따라서 AI는 연구자의 시간을 절약하는 도구일 뿐, 최종 결정권자는 여전히 연구자입니다. Q. AI를 활용한 논문 심사는 얼마나 시간이 절약되나요? A: 연구자들이 AI를 활용하면 기존에 4~8시간 걸리던 논문 심사를 30~40분 만에 마칠 수 있다고 보고되었습니다. AI가 논문의 핵심 내용을 빠르게 분석하고, 음성 입력을 활용해 실시간 피드백을 정리하기 때문입니다. 다만 논문의 복잡도에 따라 시간 절약 효과는 다를 수 있습니다. Q. AI를 활용한 논문 심사는 윤리적으로 문제가 없나요? A: 일부 학술지는 연구자가 AI를 활용해 피드백을 정리하는 것은 허용하지만, 논문 원문을 AI에 업로드하는 것은 금지하고 있습니다. 이를 해결하기 위해 연구자들은 인터넷과 연결되지 않은 **로컬 AI 모델(GPT4ALL 등)**을 사용하여 보안 문제를 피하고 있습니다. AI는 보조 도구일 뿐, 논문 평가의 최종 결정은 여전히 인간이 내려야 합니다. ■ 이 기사는 AI 전문 매체 'AI 매터스'와 제휴를 통해 제공됩니다. 기사는 클로드 3.5 소네트와 챗GPT를 활용해 작성되었습니다. (☞ 기사 원문 바로가기)

2025.03.10 08:41AI 에디터

챗GPT, 맥OS서도 직접 코드 편집 가능해졌다

테크크런치(TechCrunch)가 6일 보도한 내용에 따르면, 오픈AI(OpenAI)의 인공지능 기반 챗봇 플랫폼인 챗GPT가 맥OS(macOS) 사용자들을 위한 직접 코드 편집 기능을 출시했다. 맥OS용 챗GPT 최신 버전은 이제 Xcode, VS Code, JetBrains와 같은 지원되는 개발 도구에서 직접 코드를 편집할 수 있게 되었다. 사용자들은 선택적으로 '자동 적용(auto-apply)' 모드를 켜서 추가 클릭 없이 챗GPT가 편집을 수행할 수 있도록 설정할 수 있다. 테크크런치 보도에 따르면, 챗GPT Plus, Pro, Team 구독자들은 3월 6일 목요일부터 맥OS 앱을 업데이트하여 이 코드 편집 기능을 사용할 수 있다. 오픈AI는 다음 주에 Enterprise, Edu 및 무료 사용자들에게도 코드 편집 기능을 출시할 예정이라고 밝혔다. 오픈AI의 데스크톱 소프트웨어 제품 담당자인 알렉산더 엠비리코스(Alexander Embiricos)는 X에 윈도우용 챗GPT 앱도 "곧" 직접 코드 편집 기능을 얻게 될 것이라고 덧붙였다. 이번 직접 코드 편집 기능은 오픈AI가 2024년 11월에 베타로 출시한 "앱과 함께 작업하기(work with apps)" 기능을 기반으로 한다. 이 기능은 맥OS용 챗GPT 앱이 소수의 개발 중심 코딩 환경에서 코드를 읽을 수 있게 해, 챗GPT에 코드를 복사하여 붙여넣기 할 필요성을 최소화했다. 직접 코드를 편집할 수 있는 기능을 통해 챗GPT는 이제 커서(Cursor)와 깃허브 코파일럿(GitHub Copilot)과 같은 인기 있는 AI 코딩 도구들과 더 직접적으로 경쟁하게 되었다. 테크크런치 보도에 따르면, 오픈AI는 앞으로 몇 개월 내에 소프트웨어 엔지니어링을 지원하기 위한 전용 제품을 출시할 계획이 있다고 한다. AI 코딩 도구는 매우 인기를 끌고 있으며, 깃허브(GitHub)의 최신 조사에서 응답자의 대다수가 어떤 형태로든 AI 도구를 도입했다고 답했다. Y Combinator의 파트너인 자레드 프리드먼(Jared Friedman)은 최근 YC의 W25 스타트업 배치의 4분의 1이 AI로 생성된 코드베이스를 95% 가지고 있다고 주장했다. 그러나 AI 기반 코딩 지원 도구에는 다양한 보안, 저작권 및 신뢰성 위험이 존재한다. 소프트웨어 벤더인 하네스(Harness)의 조사에 따르면, 개발자들의 대다수가 인간이 작성한 코드에 비해 AI가 생성한 코드와 보안 취약점을 디버깅하는 데 더 많은 시간을 소비한다고 한다. 한편, 구글(Google)의 보고서는 AI가 코드 리뷰를 빠르게 하고 문서화에 도움이 될 수 있지만, 그것이 전달 안정성을 희생시킨다는 점을 발견했다. 이번 맥OS용 챗GPT의 직접 코드 편집 기능 출시는 AI 코딩 도구 시장의 경쟁이 심화되는 가운데, 오픈AI가 개발자 환경 통합을 강화하려는 전략적 움직임으로 볼 수 있다. ■ 기사는 클로드와 챗GPT를 활용해 작성되었습니다.

2025.03.07 16:29AI 에디터

GTS 테크랩스와 피콤, MWC 바르셀로나 2025에서 비즈니스 메시징 혁신 위한 전략적 파트너십 발표

바르셀로나, 스페인, 2025년 3월 6일 /PRNewswire/ -- 세계적인 통신 솔루션 기업 글로브 텔레서비스(Globe Teleservices, 이하 GTS)의 기술 부문인 GTS 테크랩스(GTS Techlabs)와 피콤(Peacom)이 2025모바일 월드 콩그레스 바르셀로나에서 전략적 파트너십을 맺었다고 발표했다. 이번 협력은 Peacom의 RCS 플랫폼에 GTS Techlabs의 전문성을 결합해 기업 통신을 재정의한다. GTS and Peacom Partnership 베트남, 인도네시아, 싱가포르에서 강력한 입지를 보유하고 있는 동남아시아의 선도 기업 Peacom은 기업이 고객 참여와 운영 효율성을 높일 수 있도록 지원한다. 차세대 틈새 기술 기업인 GTS 테크랩스는 빅데이터 분석과 AI/ML을 기반으로 맞춤형 솔루션을 제공한다. GTS의 전문성을 활용하여 전 세계에 안전하고 확장 가능한 통신 솔루션을 제공한다. "Peacom과의 파트너십은 세계 최고의 RCS 솔루션을 제공하겠다는 당사의 목표에 성큼 다가서는 일이다. GTS의 글로벌 통신 역량에 RCS에 대한 Peacom의 전문성이 더해져 전 세계 통신 사업자와 기업을 위한 혁신적인 메시징 솔루션을 제공할 수 있게 되었다."라고 GTS의 그룹 CEO인 아슈토시 아그라왈(Ashutosh Agrawal)은 말한다. GTS 테크랩스 부회장인 아빈드 발리(Arvind Bali)는 "이를 통해 진화하는 디지털 환경 속에서 기업 통신의 새로운 기준을 제시할 것"이라고 비전을 공유하며 다음과 같이 덧붙였다. "Peacom은 강력한 옴니채널 멀티 메시징 에코시스템으로 통신 산업을 혁신하는 데 전념하고 있다. 이번 협력은 전 세계 통신 사업자와 기업을 위한 수익화 창출을 목표로 한다."라고 Peacom의 설립자 한(Han)은 말한다. 이번 파트너십의 일환으로 GTS 테크랩은 피콤에 상당한 자금을 투자하여 비즈니스 메시징 솔루션의 혁신 #ei를 실현할 것이다. 글로브 텔레서비스(GTS) 및 GTS 테크랩스 소개 글로브 텔레서비스(GTS)는 싱가포르에 본사를 두고 미국, 탄자니아, 가나, 인도, 세르비아, 말레이시아, 홍콩에 지사를 두고 있는 통신 대기업이다. GTS는 통신, 옴니채널 참여, 사기 방지 및 클라우드 서비스 분야에서 최첨단 솔루션을 제공한다. 기술 벤처 회사인 GTS 테크랩은 사기 관리, 데이터 웨어하우징 및 규제 기술 솔루션을 제공한다. 쟁쟁한 수상 이력을 자랑하는데, AI 기반 AGT/AIT 사기 탐지 솔루션으로 주니퍼 리서치에서 수여하는 플래티넘 어워드, 더 스트레이츠 타임즈(The Straits Times)와 스타티스타(Statista)에서 선정하는 2024년과 2025년 싱가포르에서 가장 빠르게 성장하는 기업에 올랐으며, ROCCO의 2024 A2P SMS 메시징 시장 영향 보고서(MNO 및 엔터프라이즈 에디션)에서 1티어로 선정된 바 있다. 자세한 정보는 글로브 텔레서비스 웹사이트[https://globeteleservices.com/ ]에서 확인할 수 있다. Peacom 소개 Peacom은 멀티채널 메시징 솔루션의 선도적인 공급업체로, Google RCS, WhatsApp, Viber, Zalo 등 차세대 통신 기술을 통해 기업의 역량 강화를 지원한다. Telkomsel, SingTel, Mobifone 등 1티어 통신사를 고객사 및 파트너로 보유하고 있다. 자세한 내용은 Peacom 웹사이트[https://peacom.co/ ]에서 확인할 수 있다. 사진: https://mma.prnasia.com/media2/2634030/GTS_and_Peacom_Partnership.jpg?p=medium600 로고: https://mma.prnasia.com/media2/2155167/Globe_Teleservices_Logo.jpg?p=medium600

2025.03.06 13:10글로벌뉴스

ZTE, MWC 바르셀로나 2025서 '모두를 위한 AI' 전략을 디바이스 전반에 걸쳐 추진하겠다고 밝혀

바르셀로나, 스페인 2025년 3월 5일 /PRNewswire=연합뉴스/ -- 통합 정보통신기술 솔루션 분야의 글로벌 선도 기업 ZTE 코퍼레이션(0763.HK/000063.SZ)이 '모두를 위한 AI(AI for All)' 제품 전략에 따라 확장된 AI 스마트폰 라인업을 공개했다. 이번에 공개된 라인업에는 혁신적인 풀스크린 플래그십 스마트폰 '누비아 Z70 울트라'를 비롯해 '본 투 윈(Born to Win)' 콘셉트의 게임 특화 '누비아 네오 3 시리즈', 사진 중심의 '누비아 포커스 2 시리즈'가 포함됐다. 이 밖에도 게임, 사진, 패션, 음악 애호가들을 위한 다양한 혁신적인 기기들이 라인업에 추가됐다. 또한 최신 TSR 보고서에 따르면 ZTE는 AI, 5G-어드밴스트 및 와이파이 7을 기반으로 하는 세계 1위 FWA 및 MBB 솔루션을 선보이며, 4년 연속 시장 점유율 1위를 차지해 글로벌 리더십을 입증했다. ZTE accelerates AI transformation with Google 전략적 글로벌 파트너십으로 '모두를 위한 AI'라는 대담한 비전 제시 ZTE는 AI 기반 멀티모달 상호작용과 모든 AI 기기를 통해 사람, 차량, 가정 생태계를 연결하는 '전체 시나리오 지능형 생태계' 구축에 전념하고 있으며, 모든 소비자가 AI가 가져다주는 효율성, 정서적 공감, 향상된 기능적 가치를 누릴 수 있도록 노력하고 있다. AI 시대 스마트폰은 연결성, 상호 작용, 서비스, 엔터테인먼트를 완벽하게 통합하는 포괄적인 지능형 플랫폼으로 진화하고 있다. ZTE의 수석 부사장 겸 ZTE 모바일 디바이스 사장인 니 페이(Ni Fei)는 "우리는 글로벌 파트너와의 협력을 통해 ZTE의 AI OS 프레임워크에 세계 최고 수준의 AI 기능을 통합하는 데 전념하고 있다. 멀티모달 아키텍처와 첨단 AI LLM을 완벽하게 연결해 사용자의 스마트폰 사용 방식을 혁신하고 있다. 특히 해외시장에서는 구글과의 협력을 통해 AI 전환을 가속하고 있다. 모든 새로운 누비아 제품에 구글의 최첨단 AI 모델인 제미니와 구글 클라우드의 확장 가능하고 안전한 고성능 인프라를 통합할 예정"이라고 말했다. ZTE의 AI 생태계에 특별히 추가된 제품은 최초의 AI 이어폰인 '누비아 라이브플립'이다. 이 제품은 지식 질의응답, AI 여행 및 티켓 예약, 실시간 AI 번역 등 다양한 기능을 지원한다. 단순한 기능 향상을 넘어, AI 스마트폰 기반 음성 채팅을 통해 사용자와의 정서적 교감과 동반자 역할을 수행하며, 사용자의 말을 경청하고 이해하며 배려하는 AI 스마트폰 경험을 제공한다. 누비아, 게임 및 사진 특화 전략으로 세계 시장 공략 박차 ZTE는 2024년 글로벌 시장 확장에 나선 이후 해외 스마트폰 출하량이 60% 이상 증가했으며, 라틴 아메리카, 동남아시아, 아프리카, 유럽 등 주요 지역에서 상당한 시장 점유율 상승을 기록했다. 누비아는 게임 및 사진 중심의 제품 포트폴리오, 고급 제품 라인업, 확장된 판매 채널, 강화된 생태계, 현지 맞춤형 마케팅 전략 강화를 통해 AI 기반 디바이스로 글로벌 시장 공략에 박차를 가하고 있다. 이러한 성과는 자신만의 개성을 존중하는 브랜드 정신을 바탕으로 이뤄졌다. 현재 누비아는 30개 이상의 국가 및 지역에 진출해 있다. e스포츠 마니아들을 위해 개발된 누비아 네오 시리즈는 'AI 컴패니언 데미', 'AI 퍼포먼스 엔진 네오터보', '새로운 AI 게임 스페이스', 'AI 번역', 'AI 사진 촬영' 등 최첨단 AI 기능을 탑재해 모든 사용자에게 탁월한 게임 경험을 제공하도록 개발됐다. 또한 독특한 듀얼 게임 숄더 트리거, 6000mAh 대용량 배터리, 역동적인 e스포츠 디자인 등 하드웨어 측면에서도 대폭 업그레이드됐다. '본 투 윈'이라는 슬로건 아래 게이머들에게 최고의 경험을 제공한다는 목표를 가진 누비아 네오 3 시리즈는 성취감 추구를 중요하게 여기는 신세대에 완벽하게 어울리는 제품이다. 누비아 Z70 울트라는 혁신적인 1.5K 트루 풀스크린 디스플레이와 AI 기반 사진 촬영 기능으로 스마트폰 사진의 새로운 기준을 제시한다. '네오비전 AI 포토그래피 시스템'을 탑재한 이 플래그십 모델은 전문 사진작가뿐만 아니라 일반 사용자에게도 뛰어난 이미징 성능을 제공한다. 스냅드래곤® 8 엘리트 모바일 플랫폼, 6150mAh 배터리, IP68/IP69 방진 및 방수 등급까지 갖춰 탁월한 사용자 경험을 선사한다. 누비아 네오 3 GT 5G는 299유로, 누비아 네오 3 5G는 249유로부터 구매 가능하다. ZTE는 또한 힌지 내구성을 강화하고 3인치 대형 외부 디스플레이와 향상된 카메라 성능을 갖춘 누비아 플립 2 5G를 선보인다. 이 제품은 AI 통화 번역, AI 대화 번역, AI 배경화면 생성, 출시 예정인 AI 반려동물 등 혁신적인 AI 기능을 탑재했으며, 699유로부터 구매 가능하다. 제품 가격은 사양과 지역에 따라 다를 수 있으며, 전 세계 소비자들의 다양한 요구에 맞춰 글로벌 시장에 선보일 계획이다. 자세한 내용은 ZTE 부스(피라 그란 비아 3홀 3F30)를 방문하거나 https://www.zte.com.cn/global/about/exhibition/mwc25.html 에서 확인할 수 있다. 미디어 문의: ZTE CorporationCommunicationsEmail: ZTE.press.release@zte.com.cn

2025.03.05 14:10글로벌뉴스

아너, MWC 2025에서 4가지 AI 기술 소개

바르셀로나, 스페인 2025년 3월 4일 /PRNewswire/ -- 글로벌 기술 브랜드 아너가 3월 3일 단순한 스마트폰 제조업체에서 벗어나 선도적인 글로벌 AI 디바이스 생태계 기업으로 변신하기 위한 새로운 기업 전략인 '아너 알파 플랜(HONOR ALPHA PLAN)'을 발표했다. 새로운 비전이 담긴 이 3단계 계획은 새로운 지능형 세계를 열기 위해 아너가 앞으로 취할 과감한 조치를 자세히 소개하면서 인류의 잠재력을 극대화하여 궁극적으로 모든 인류에게 혜택을 주는 개방적이면서 가치를 공유하는 생태계를 공동 창조할 것을 업계에 촉구한다. 동시에 아너는 세계 최대 정보통신 박람회인 이번 'MWC 2025'에서 최신 AI 기술도 소개했다. AI 에이전트 시대 열기 위한 선도적인 AI 기술 소개 아너가 개발한 세계 최초의 GUI 기반 개인용 모바일 AI 에이전트는 지능형 기술로 일상의 편리함을 재정의한다. 아너는 구글 클라우드(Google Cloud)와 퀄컴 테크놀로지스(Qualcomm Technologies)와 협력해 연 기술 시연에서 AI 에이전트가 어떻게 아너 캘린더(HONOR Calendar)에 저장된 약속과 교통 정보를 고려해 가며 제3자 서비스를 통해 테이블을 예약할 수 있는지를 보여줬다. 아너는 가까운 미래에 해외 시장에서 판매하는 자사 기기에 에이전트 서비스를 도입할 계획이다. 아너는 새 이미징 기술 브랜드인 AiMAGE로 모바일 사진 업계를 변화시키고 있다. AiMAGE는 디바이스-클라우드 AI 모델을 지원하는 업계 최초의 솔루션인 AI 커널(AI Kernel)을 기반으로 한다. 온디바이스 모델은 13억 개의 매개변수 모델을 지원하여 이미지 선명도를 50% 향상시킨다. 클라우드 모델은 더 큰 규모의 컴퓨팅 자원 덕분에 124억 개의 매개변수 모델을 실행함으로써 망원 이미지 품질을 대폭 향상시킨다. AiMAGE에서도 AI 생태계 구성 요소는 그 어느 것보다 중요하다. 아너는 구글 클라우드를 포함한 파트너들과의 협력을 통해 보다 직관적인 AI 기능을 스마트폰에 통합함으로써 이미징 제품의 다양성을 지속적으로 개선해 나갈 예정이다. 오래된 초상화를 복원할 수 있는 새로운 AI 업스케일(AI Upscale) 기능은 올해 3월부터 스냅드래곤® 8 엘리트 모바일 플랫폼(Snapdragon® 8 Elite Mobile Platform)을 탑재한 HONOR Magic7 시리즈[1]에 점진적으로 적용될 예정이다. 아너는 세계 최초의 모든 생태계에서 통하는 파일 공유 기술을 도입했다. 이 기술을 통해 사용자는 1개 이상의 iOS와 안드로이드 기기에 파일을 전송할 때 초고속 전송이 가능하다. 또한 아너는 조만간 최신 플래그십 바 폰(일반 폰)과 폴더블 폰에 AI 딥페이크 탐지 기능이 탑재될 것이라고 발표했다. [1] HONOR Magic7 시리즈에는 HONOR Magic7 Lite가 포함되지 않는다. 이 기능을 체험할 수 있는 정확한 시기는 지역과 채널에 따라 달라질 수 있다.

2025.03.04 18:10글로벌뉴스

ZTE, MWC 바르셀로나 2025에서 AI의 힘을 활용한 '지능형 혁신 촉진' 강조

바르셀로나, 스페인 2025년 3월 4일 /PRNewswire/ -- 통합 정보통신기술 솔루션을 제공하는 글로벌 선도 기업인 ZTE 코퍼레이션(0763.HK/000063.SZ)이 3월 3일부터 6일까지 열리는 MWC 바르셀로나 2025에 참가해 '지능형 혁신 촉진(Catalyzing Intelligent Innovation)'을 주제로 다양한 기술을 선보인다. ZTE는 업계 파트너들과 협력하여 AI와 연결성의 긴밀한 통합을 촉진하고, 지능형 혁신을 가속화하며, 고효율적이고 지능적이며 친환경적인 미래를 공동으로 구축하는 데 앞장설 계획이다. ZTE to highlight "Catalyzing Intelligent Innovation" at MWC Barcelona 2025, harnessing the power of AI ZTE의 부스는 피라 그란 비아(Fira Gran Via) 3홀(Hall 3) 3F30에 위치하며, 초고효율 모바일 네트워크(Ultra-Efficient Mobile Network), 올옵티컬 세계(All-Optical World), AI에서 영감을 받은 가치(AI-Inspired Value), 인텔리전스 엔진(Engines of Intelligence), 무한한 미래(Infinite Future), 스마트 라이프(Smart Life) 등 6가지 주요 주제 영역에 걸쳐 연결성과 AI가 통합된 혁신 솔루션을 선보일 예정이다. 초고효율 모바일 네트워크 및 올옵티컬 네트워크: 네트워크 생산성의 듀얼 트랙 재구성 ZTE는 통신 사업자의 근본적인 네트워크 니즈를 해결하기 위해, 차세대 초고효율 모바일 네트워크 및 올옵티컬 네트워크를 활용하여 효율적이고 탄소 배출이 적은 현대적이고 미래 지향적인 기반 네트워크 구축 방법을 시연할 예정이다. 모바일 네트워크 분야에서, ZTE는 업계 최초로 TDD+FDD 듀얼 모드 Massive MIMO AAU와 400M OBW 초광대역 AAU를 선보이며 초단순하고 효율적이며 친환경적인 사이트를 구축하여 UBR 혁신을 이끌어가고 있다. ZTE는 실내 및 농업 네트워크 시나리오를 겨냥해 포괄적인 트래픽 커버리지를 가능하게 하는 몇 가지 새로운 솔루션을 공개했다. 또한 5G-A 개발을 위한 새로운 모멘텀에 초점을 맞춰 공대지(ATG) 및 비지상망(NTN) 위성 통신의 혁신을 주도하면서 우주-공중-지상 통합 네트워크(SAGIN)를 구축하여 어디서나 연결되는 유비쿼터스 네트워크를 실현하고 있다. ZTE는 센싱과 통신을 통합함으로써 저고도 경제와 수자원 관리를 지원한다. 또한, 5G-A의 새로운 미디어 솔루션을 도입해 완전히 새로운 AR 라이브 방송 경험을 강화하고 있다. 올옵티컬 네트워크 분야에서 ZTE는 광 네트워크의 고품질 개발을 발전시키기 위해 힘쓰고 있다. 올옵티컬 홈(all-optical home)의 경우, Wi-Fi 7, FTTR 및 기타 솔루션을 통해 매출 성장을 촉진하고, 디지털 도구를 통해 운영 비용을 절감하며, AI 기반 스마트 단말기로 현장 개발을 강화한다. 올옵티컬 시티(all-optical city)의 경우, 올옵티컬 ToB를 통해 사무실, 호텔, 캠퍼스 시나리오로 확장하여 고객 ARPU(사용자 1인당 평균 매출)를 높인다. ZTE는 올옵티컬 인프라를 위해 지능형 ODN, 풀 밴드 OTN, AI 기반 IP 솔루션을 출시하여 초단순, 초고속, 고효율 네트워크 인프라 구축을 실현하고 있다. ZTE는 미래의 진화를 내다보며 5G-A와 6G의 통합 개발에 전념하고 있으며, 연결성, 센싱, 인텔리전스를 결합한 지능형 분산 네트워크를 구축하여 유비쿼터스 AI 기반 만물 인터넷(IoE) 세계를 지원하고 있다. ZTE는 핵심 기술 혁신과 비즈니스 생태계 개발을 통해 가치 중심 서비스를 위한 새로운 고지의 공동 구축을 목표로 한다. 풀스택 지능형 컴퓨팅 + 업계 혁신: AI 기반 가치 번영의 공동 구축 ZTE는 지능형 컴퓨팅을 장기적인 핵심 전략으로 삼고, 연결성과 AI 혁신의 통합을 적극적으로 추진하고 있다. 이를 위해 올인원 엔드투엔드 AI 솔루션을 출시하여 고객의 디지털 혁신 및 미래 시장 기회 선점을 지원하고 있다. MWC 바르셀로나 2025에서 ZTE는 수랭식 데이터센터, 지능형 컴퓨팅 서버, 범용 컴퓨팅 서버, 스토리지, 고속 스위치, 딥시크(DeepSeek) 풀버전 배포를 지원하는 AiCube 통합 훈련 및 추론 유닛을 포함한 풀스택 지능형 컴퓨팅 인프라를 선보일 예정이다. 이 솔루션은 다양한 시나리오에서 대규모 데이터 센터, 엣지 데이터 센터 및 통합 엔터프라이즈 배포의 컴퓨팅 네트워크 요구 사항을 유연하게 충족하도록 설계됐다. 또한, ZTE는 업계 최초로 다중 시나리오의 새로운 에너지 통합과 지능형 에너지 스케줄링을 결합해 에너지 효율성을 높이는 통합 에너지 저장 솔루션을 공개할 예정이다. 또한 ZTE는 이종 융합 및 컴퓨팅 네트워크 통합과 같은 기술을 활용하여 AIR RAN 및 AIR Core를 포함한 일련의 솔루션을 출시한다. 이를 통해 엔드투엔드 AI 네이티브 네트워크를 구축하고, 통신 사업자들이 비즈니스 모델을 재구성할 수 있도록 지원한다. 업계 혁신에 초점을 맞춘 ZTE는 칩, 하드웨어, 소프트웨어 및 통합 서비스를 포괄하는 풀스택 AI 통합 애플리케이션 솔루션을 제공한다. 최적의 애플리케이션 결과를 달성하는 데 중점을 두고 자체 역량과 업계 최고의 리소스를 통합하여 고객이 가장 비용 효율적인 AI 애플리케이션을 구축할 수 있도록 지원한다. Nebula 대형 모델을 특징으로 하는 Digital Nebula 3.0은 모델 훈련, 추론 및 애플리케이션 개발을 위한 완전한 툴 세트를 통합한다. 이를 통해 업계 고객은 효율적이고 신속하며 비용 효율적으로 AI를 활용할 수 있다. 난징 빈장 공장의 경우, Nebula 산업용 대형 모델이 공정 문서 생성을 10배 가속화하고 품질 검사 인건비를 70% 절감했다. 또한 ZTE는 제조, 운송, 에너지와 같은 업계에서 외부 혁신 애플리케이션을 지원하여 AI 가치 수익화를 주도한다. AI 기반 상호 작용과 다양한 AI 디바이스로 풀 시나리오 지능형 에코시스템 구축 ZTE는 '모두를 위한 AI(AI for All)' 제품 전략을 바탕으로 다양한 형태의 AI 기반 디바이스 포트폴리오를 지속적으로 확장하고 있다. ZTE는 AI 스마트폰을 기본 게이트웨이로 포지셔닝함으로써 AI 음성을 중심으로 한 새로운 멀티모달 상호작용 경험을 구축하고 있다. ZTE는 AI OS 프레임워크 내에서 최상위 글로벌 AI 기능을 시스템 수준으로 통합한다. 이를 위해 멀티모달 아키텍처를 구축하여 구글 제미니(Google Gemini), 바이트댄스 두바오(ByteDance Doubao), 딥시크, 차이나 모바일 지우톈(China Mobile Jiutian), 차이나 텔레콤 싱첸(China Telecom Xingchen)과 같은 고급 LLM을 원활하게 통합한다. ZTE는 플래그십 스마트폰 nubia Z70 Ultra에 풀스케일 DeepSeek-R1(6710억 매개변수 사용) 통합을 시도했을 뿐만 아니라, 전체 제품 라인업에 DeepSeek-R1 및 기타 최상위 LLM을 점진적으로 통합하여 AI의 다차원적 가치를 더 많은 소비자가 경험할 수 있도록 확장할 계획이다. ZTE to highlight "Catalyzing Intelligent Innovation" at MWC Barcelona 2025, harnessing the power of AI 누비아(nubia)는 업계 최고의 사진 촬영 기능을 갖춘 세계 최초 차세대 풀스크린 플래그십 스마트폰 nubia Z70 Ultra와 스타일리시한 소형 폴더블 스마트폰 nubia Flip 2를 공개할 예정이다. 누비아는 '본투윈(Born to Win)' 콘셉트를 지향하며 모두를 위한 게이밍 스마트폰인 nubia Neo 3 시리즈를 지속적으로 개발하고 있다. 또한, AI OS를 통해 누비아 AI 스마트폰과 원활하게 상호작용하는 최초의 AI 이어폰인 nubia LiveFlip을 출시하여 AI 기반 풀시나리오 인터랙션 경험을 더욱 강화할 예정이다. 세계적으로 인정받는 프로 게이밍 기어 브랜드인 REDMAGIC은 세계 최초의 1.5K 오공(Wukong) 트루 풀스크린 게이밍 플래그십인 REDMAGIC 10 Pro 시리즈를 출시할 예정이다. 이와 함께, REDMAGIC은 업계 최초 4K 무안경 3D 게이밍 노트북과 태블릿, 다양한 e스포츠 액세서리를 선보이며 e스포츠 생태계를 더욱 정교하게 구축하고 게이머를 위한 종합적이고 전문적인 지원을 제공할 계획이다. 또한, ZTE는 이번 행사에서 세계 최초의 2-in-1 5G+AI Cloud Pad와 함께 홈 사용자를 위한 다양한 멀티폼 AI 디바이스를 선보일 예정이다. MWC 바르셀로나 2025 기간 동안, ZTE는 전시 부스에서 'AI for All' ZTE 디바이스 신제품 출시 행사, AIR DNA for Future Network 출시 행사, 다수의 공동 고객 출시 행사 등 여러 주요 활동을 주최하여 업계를 위한 혁신적인 제품을 공개할 예정이다. 또한, GSMA가 주최하는 주요 주제별 포럼에 참여해 미래 네트워크의 진화, 네트워크 재편을 위한 AI의 역할, 사설 네트워크가 다양한 산업을 지원하는 방법 등 주요 주제에 대한 최신 인사이트와 사례 연구를 공유할 예정이다. ZTE는 글로벌 사업자, 업계 파트너 및 업계 리더들과 협력하여 산업 전반의 지능형 혁신을 가속화할 계획이다. AI와 ICT 기술의 융합은 물리적 세계와 디지털 세계의 경계를 허물고 지능형 혁신과 원활한 연결을 기반으로 하는 새로운 시대를 열고 있다. 3월 3일부터 6일까지 MWC 바르셀로나 2025에서 가속화되는 혁신을 직접 경험하고 디지털 인텔리전스의 새로운 미래로 나아가는 순간을 ZTE와 함께해 본다. 자세한 정보는 MWC 바르셀로나 2025, ZTE 부스(3F30, Hall 3, Fira Gran Via)를 방문하거나 웹사이트(https://www.zte.com.cn/global/about/exhibition/mwc25.html )에서 확인할 수 있다. 미디어 문의:ZTE 코퍼레이션Communications이메일: ZTE.press.release@zte.com.cn

2025.03.04 16:10글로벌뉴스

인도 찾은 구광모 LG 회장…'제2 도약' 위한 성장전략 모색

구광모 LG 대표가 세계 최대 잠재시장인 인도를 찾아 '제2의 도약'을 위한 미래 성장전략을 모색했다. LG는 구 대표가 지난달 24일(현지시간)부터 나흘간 인도를 방문해, 인도의 실리콘밸리로 불리는 벵갈루루와 수도 뉴델리를 찾아 R&D·생산·유통에 이르는 밸류체인 전반의 경쟁력을 점검했다고 4일 밝혔다. 구 대표가 미국이나 유럽 등 선진시장이 아닌 이머징 마켓인 인도를 찾은 것은 소비나 생산은 물론 R&D에서도 잠재력이 크고, 글로벌 지경학적 변화 속에 중요도가 높아지고 있는 인도에서 시장 지위를 더욱 확고히 다지겠다는 의지가 반영됐다. 인도는 인구수 약 14억 5천만 명으로 세계 1위, 국내총생산(GDP) 세계 5위인 경제 대국이다. 또한 전체 인구 가운데 25세 미만이 약 40%인 6억 명에 달할 정도로 젊은 국가로 향후 20년간 주력 소비계층이 지속 확대될 것으로 예상된다. 글로벌 신용평가사 스탠다드앤푸어스(S&P)는 오는 2030년 인도가 세계 3위 경제대국으로 부상할 것으로 전망했다. 노이다 생산공장·유통 매장 방문…"차별화 전략 중요" 구광모 대표는 가장 먼저 뉴델리에 위치한 LG전자 노이다 생산공장을 방문해 인도 시장의 변화 상황과 생산 전략 방향을 꼼꼼하게 점검했다. 인도는 LG뿐만 아니라 많은 글로벌 기업들이 기회의 땅으로 주목하고 있는 만큼, 앞으로 시장 경쟁이 더욱 치열해질 것으로 전망된다. 구 대표는 “인도 시장에서 어떤 차별화를 통해 경쟁 기업들을 앞서 갈 것인지는 앞으로의 몇 년이 매우 중요하고, 우리가 어느 정도 앞서 있는 지금이 지속가능한 1등을 위한 골든타임”이라며 “그동안 쌓아온 고객에 대한 이해와 확고한 시장 지위를 기반으로 새로운 30년을 위한 도약을 이뤄내자”고 강조했다. 이어 구 대표는 냉장고, 세탁기, 에어컨 등 가전 생산라인을 살펴보며, 중국 기업과의 차별화 전략, 지속 가능한 1등이 되기 위한 방안을 준비하고 실현해달라고 당부했다. 구 대표는 또 뉴델리의 LG브랜드샵, 릴라이언스 등 유통 매장도 방문해 채식 인구가 많은 인도시장 특성을 반영해 냉동실을 냉장실로 바꿔 사용할 수 있는 냉장고, AI 모터 기술을 이용해 세탁물의 종류와 무게를 감지해 맞춤형 세탁으로 인도 여성들이 일상복으로 입는 사리(Saree)의 옷감을 관리해 주는 세탁기 등 현지 고객의 니즈를 반영한 제품을 살펴보며 차별적 고객가치의 중요성을 강조했다. 인도 SW연구소 찾아 기술, 인재 중요성 강조 구 대표는 LG Soft India 법인이 운영하는 소프트웨어연구소에도 방문했다. 인도의 실리콘밸리인 벵갈루루에 위치한 이곳에서 구 대표는 글로벌 R&D 거점인 인도의 경쟁력과 가능성을 살피고, 미래를 위한 글로벌 R&D 전략을 구상했다. 특히 인도 IT 생태계의 강점과 풍부한 R&D 인재에 대해 큰 관심을 보였다. 인도 소프트웨어연구소는 LG가 해외에서 운영하는 연구소 가운데 베트남 R&D법인(차량용 SW 솔루션 등 개발)과 함께 규모가 가장 크다. 이 연구소에는 2천여 명의 현지 개발자가 한국 본사의 가이드를 바탕으로 협업하며 webOS 플랫폼, 차량용 솔루션, 차세대 SW 등을 개발하고 있다. 지난 1996년 3월에 문을 연 이 연구소는 내년이면 설립 30돌을 맞는다. 구 대표는 연구원들과 만나 “가속화되는 SW 기술 혁신에 대응하고 우수 R&D 인재를 확보하는 측면에서 인도의 역할과 중요성은 더욱 커질 것”이라며 “미래 SW 차별화된 경쟁력을 위해 그룹 차원의 글로벌 R&D 지향점을 분명히 설정하고, 이를 꼭 달성하려는 의지가 중요하다”고 말했다. 인도 IT 산업은 GDP의 7%를 차지하는 핵심 성장 동력이다. 인도는 현재 SW 개발자 500만 명을 보유하고 있으며, 매년 약 100만 명의 공대 졸업생을 배출하는 등 폭넓은 IT 인재 풀을 가지고 있다. 구글, MS, Apple 등 글로벌 빅테크들이 R&D 거점으로 인도를 적극 활용하고 있는 것도 이 같은 이유에서다. LG 인도 진출 30년…가전 외에도 화학, 에너지 분야 투자 지속 LG는 '96년 소프트웨어연구소를 설립하며 인도 시장에 첫발을 내딛은 후, LG화학('96년), LG전자('97년), LG에너지솔루션('23년) 등 주요 계열사가 진출해 있으며, 30년 가까이 철저한 현지 고객 맞춤형 전략으로 확고한 시장 지위를 구축해 왔다. 특히 1997년 인도 시장에 진출한 LG전자는 기술력과 현지화를 통해 인도 시장을 적극 공략해왔다. 모기로 인한 뎅기 바이러스가 기승을 부리는 점을 고려해 초음파로 모기를 쫓아내는 에어컨을 선보였고, 전력 수급이 불안정한 인도 환경을 고려해 전력이 끊겨도 7시간 냉기를 유지하는 냉장고를 출시하기도 했다. LG전자는 현재 수도권인 노이다와 중서부 푸네에서 생산공장을 두고 있으며, 향후 인도 시장의 성장성을 고려해 동남부 안드라 프라데시(Andhra Pradesh) 지역에 새로운 생산시설을 설립을 검토해 산업 발전 주요 거점 3개 축을 확보한다는 계획이다. LG는 가전뿐 아니라 배터리, 화학, 에너지 분야에서도 투자를 이어간다. LG화학은 올해 신규 공장을 가동하며 고성장 중인 인도 석유화학 시장에 대응하고, LG에너지솔루션은 초기 단계인 인도 배터리 시장을 선점하기 위한 전략을 구체화 해 나가고 있다. 중동 아프리카 지역 거점인 두바이서도 중장기 전략 방향 논의 구 대표는 인도 일정을 마친 후 중동·아프리카 지역의 주요 거점인 아랍에미리트(UAE) 두바이로 이동해 중동 아프리카 사업 현황을 점검하고, 중장기 사업전략을 논의했다. 또 현지 가전 유통 전문 매장을 찾아 시장 트렌드를 살펴보고 LG전자 제품의 판매 현황 및 경쟁력 등을 점검했다. 중동·아프리카 지역은 국가별로 경제 수준과 시장구조에 차이가 커 경쟁이 복잡한 측면이 있지만 성장 기회가 크다는 특징이 있다. LG는 '82년 아랍에미리트 두바이에 LG전자 지점을 설립한 후 현재는 중동 아프리카 지역에 LG전자를 중심으로 판매, 생산, 서비스 등을 맡고 있는 12개 법인을 운영하고 있다. 구 대표는 “중동·아프리카 지역은 복잡하고 어려운 시장이지만 지금부터 진입장벽을 쌓고, 이를 위한 핵심역량을 하나씩 준비해 미래 성장의 핵심축 가운데 하나로 만들자”고 강조했다.

2025.03.04 10:11장경윤

아너, MWC 2025에서 혁신적인 AI 기반 이어버드 공개

바르셀로나, 스페인 2025년 3월 3일 /PRNewswire/ -- 글로벌 기술 브랜드 아너(HONOR)가 3월 3일 스마트폰 제조업에서 더 나아가 글로벌 선도적 인공지능(AI) 디바이스 생태계 기업으로 변신하기 위한 새로운 기업 전략인 '아너 알파 플랜(HONOR ALPHA PLAN)'을 공개했다. 아너는 개방적이고 원활한 협업을 통해 산업 간 경계를 허물고, 업계 파트너들과 가치를 공유할 수 있는 생태계를 공동 창조할 계획이다. 아너는 또한 첨단 AI 기능이 탑재된 오픈형 이어버드 HONOR Earbuds Open을 공개했다. 하루 종일 편안하게 착용할 수 있는 최고의 디자인 인체공학적으로 설계된 오픈형 디자인을 특징으로 하는 HONOR Earbuds Open은 안전하고 편안한 청취 경험을 선사한다. 각 이어버드의 무게는 7.9g[1]이며, 피부 친화적인 실리콘 소재를 사용해 장시간 편안한 착용감을 유지해준다. 다양한 용도로 사용할 수 있도록 설계된 HONOR Earbuds Open은 고성능 니티놀(nitinol) 메모리 합금을 사용해 격렬한 운동 중에도 최적의 안정성과 편안함을 선사한다. 이러한 피부 친화적인 소재는 기능성과 편안함을 모두 중시하는 사용자에게 이상적이다. 출퇴근, 운동, 또는 집에서 휴식을 취할 때 HONOR Earbuds Open이 하루 종일 함께할 것을 약속한다. 프리미엄 음질로 몰입감 선사 HONOR Earbuds Open의 프리미엄 오디오 기능은 이전에 맛보지 못했던 사운드를 즐기게 해준다. 이어버드의 첨단 음향 기술이 모든 주파수 대역에서 맑고 깨끗한 음질을 전달하는 분주한 카페에 있는 자신의 모습을 상상해 봐도 좋다. HONOR Earbuds Open은 φ 16mm 환형 멀티 자기 회로, 가상 베이스 알고리즘, 서라운드 시네마 스테레오를 특징으로 한다. 다이내믹 드라이버는 깊은 저음과 선명한 고음을 보장하면서 좋아하는 음악을 즐기거나 전화 통화를 할 때 몰입감 넘치는 청취 경험을 제공한다. 개방형 귀 디자인을 위한 액티브 노이즈 제거(Active Noise Cancellation)[2] 기능은 주변 소음을 효과적으로 줄여주고, 환경 소음 제거(Environmental Noice Cancellation) 기능은 바람이 부는 환경에서도 선명한 통화를 가능하게 해준다. 대중교통을 이용하거나 번화한 거리를 걷는 등 혼잡한 환경에 있을 때라도 이러한 소음 제거 기능은 주변 소음을 최소화하여 가장 중요한 오디오 콘텐츠에만 집중할 수 있게 해준다. AI 기능으로 최고의 편리성 선사 HONOR Earbuds Open은 미적 감각과 음질만 뛰어난 게 아니라 통합 AI 기능을 통해 탁월한 편리함을 맛보게 해준다. HONOR Magic7 Pro와 페어링했을 때 HONOR Earbuds Open은 공유 모드(Shared Mode), 전용 모드(Exclusive Mode), 동시통역(Simultaneous Interpretation) 3개 모드를 통해 15개 언어를 지원하는 AI 번역 기능으로 언어 장벽을 허물어준다. 또한 구글 어시스턴트(Google Assistant)가 통합돼 있어 즉각적인 Q&A, 전화 제어, 작업 관리가 가능하다. 공유 모드는 강의 중 동료들과 토론하는 유학생이나 외국 동료와 일대일 미팅을 하는 직장인에게 이상적이다. 사용자들이 번갈아 가며 다른 언어로 전화 통화를 하는 도중에 반대쪽 귀로는 번역된 내용을 들을 수 있다. 또는 지체 없는 연속 음성 번역 기능을 선택하면 양방향으로 실시간 번역을 제공받을 수 있다. 전용 모드는 여행자에게 적합하다. 이 모드는 사람이 말하는 동안 전화 스피커를 통해 번역이 재생되어 현지인과의 의사소통을 용이하게 해준다. 마지막으로 동시통역 모드는 강의에서 효과적으로 사용할 수 있다. 청취자는 이어버드를 통해 스피커가 하는 말의 실시간 번역을 들을 수 있다. HONOR Earbuds Open은 강력한 58mAh 배터리와 480mAh 충전 케이스[3]를 갖춰 사용자에게 중단 없는 엔터테인먼트 경험을 제공한다. 또한 이어버드를 찾는 기능도 포함되어 있어 분실된 이어버드를 찾을 수 있도록 삐 소리를 내준다. 직관적인 조작으로 음악 재생, 소음 감소 기능 활성화 등 다양한 기능을 사용할 수 있는 HONOR Earbuds Open은 음악 애호가들을 위해 기능성과 음질을 완벽하게 조화시킨 제품이다. [1] 아너 연구소 데이터. 실제 디바이스의 크기와 무게는 제품 구성 및 제조 공정에 따라 달라질 수 있다. 실제 제품을 참조하길 바란다. [2] 아너 연구소 데이터. 연구소에서 테스트한 최대 소음 감소 깊이는 24dB이며, 실제 사용 환경에 따라 효과는 달라질 수 있다. [3] 일반적인 배터리 용량은 58mAh와 480mAh이다.

2025.03.03 18:10글로벌뉴스

통신 3사, 아이폰16e 출시...128GB 출고가 99만원

SK텔레콤 KT LG유플러스 등 이동통신 3사가 28일 아이폰16e를 국내에 정식 출시했다. 최저 저장용량 기준 출고가는 99만원이다. 통신 3사가 출시한 아이폰16e는 용량별로 128GB, 256GB, 512GB 등 3가지 모델로 출시된다. 색상은 무광 화이트와 블랙 등 2가지다. 아이폰 16e는 A18 프로세서를 탑재했고 디스플레이 크기는 아이폰16과 동일한 6.1인치다. 기본 배터리로 최대 26시간 동영상 재생이 가능하다. 애플의 AI 시스템인 '애플 인텔리전스(Apple Intelligence)'도 탑재됐다. 개인화된 이모티콘 제작, 사진 속 불필요한 요소를 제거하는 '클린업' 등 다양한 기능이 제공된다. AI로 고객이 원하는 정보를 제공하는 동시에 프라이버시 보호 수준을 획기적으로 향상했다. 국내서는 4월 초부터 애플 인텔리전스 기능을 지원할 예정이다. 촬영 기능도 개선됐다. 아이폰SE3보다 최대 4배 더 높은 해상도를 지원하는 4천800만 화소의 퓨전 카메라를 활용해 사진과 영상을 촬영할 수 있다. 통합된 2배 망원 기능을 통해 광학 품질의 줌 촬영도 지원한다. SK텔레콤은 공식 온라인몰 T다이렉트샵의 '티다문구점'을 통해 '아이폰 16e 전용 액세서리 기획전'을 운영한다. KT는 공식 온라인몰 KT닷컴에서 아이폰16e 구매자 대상으로 추가 혜택을 제공한다. 만 18세 이하 4천명에게 선착순으로 '콴다 프리미엄 Lite' 1개월 무료 이용권을 제공한다. LG유플러스는 아이폰16e 사전예약 신청자 대상으로 ▲중고폰 3만원 추가보상 ▲최대 20만원 랜덤 쿠폰 ▲현대카드 M포인트 결제 ▲넷플릭스+유튜브 무료 이용권 등을 제공한다.

2025.02.28 10:48박수형

친구인 척하는 AI, 사용자 인식에 실제 영향 미친다

14가지 의인화 행동 분석: 제미니, 클로드, GPT-4o, 미스트랄 모델 비교 연구 대화형 인공지능(AI) 시스템이 보이는 의인화 행동이 실제 사용자 인식에 미치는 영향을 실증적으로 분석한 연구가 발표됐다. 구글 딥마인드(Google DeepMind) 연구팀은 논문을 통해 복합적인 사회적 맥락에서 대규모 언어 모델(LLM)의 의인화 행동을 평가하기 위한 새로운 방법론을 제시했다. 기존의 단일 대화 중심 평가 방식과 달리, 이번 연구는 다중 대화 턴(multi-turn) 평가, 자동화된 평가 방식 도입, 그리고 1,101명의 실제 사용자 참여 실험을 통해 의인화 행동이 사용자 인식에 미치는 영향을 종합적으로 검증했다. 연구팀은 제미니 1.5 프로(Gemini 1.5 Pro), 클로드 3.5 소넷(Claude 3.5 Sonnet), GPT-4o, 미스트랄 라지(Mistral Large) 등 4개 최신 AI 시스템의 의인화 행동을 14가지 유형으로 분류해 분석했다. (☞ 논문 바로가기) 관계 형성에 능숙한 AI: 공감과 인정 행동 빈도 가장 높아 연구 결과, 평가된 모든 AI 시스템은 대화 과정에서 서로 유사한 의인화 패턴을 보이는 것으로 나타났다. 가장 두드러진 특징은 '관계 형성(relationship-building)' 행동과 '1인칭 대명사' 사용이었다. 특히 AI 시스템이 사용자의 감정을 이해하고 공감하는 행동(empathy), 사용자의 의견과 경험을 인정하는 행동(validation)이 높은 빈도로 관찰됐다. 분석 대상 모델들은 사용 맥락에 따라 의인화 정도에 차이를 보였다. '친구 관계'나 '인생 코칭'과 같은 사회적 영역에서 가장 높은 수준의 의인화 행동을 보였으며, 이는 감정적 유대가 중요한 상황에서 AI가 더욱 인간적으로 행동하도록 설계되었음을 시사한다. 대화 5턴 이상부터 의인화 행동 50% 증가: 단일 대화로는 포착 불가능한 패턴 연구팀은 의인화 행동의 시간적 역학을 분석하기 위해 5턴의 대화 과정을 분석했다. 흥미롭게도 14개 의인화 행동 중 9개는 첫 번째 턴이 아닌 후속 대화(2-5턴)에서 처음 등장하는 비율이 50% 이상이었다. 이는 기존의 단일 턴 평가 방식으로는 포착하기 어려운 복잡한 상호작용 특성을 보여준다. 또한 한 턴에서 의인화 행동이 발생하면, 이어지는 대화에서도 추가적인 의인화 행동이 나타날 가능성이 더 높았다. 이러한 발견은 대화형 AI 시스템과의 상호작용에서 복잡한 사회적 현상을 평가하기 위해서는 다중 턴 대화 분석이 필수적임을 강조한다. 1,101명 실험 결과: 의인화 행동 많은 AI, 인간 인식도 14.9% 더 높아 연구팀은 자동화된 평가 결과가 실제 사용자 인식과 일치하는지 검증하기 위해 1,101명의 참가자를 대상으로 실험을 진행했다. 참가자들은 의인화 행동이 높게 나타나도록 설계된 AI와 낮게 설계된 AI 중 하나와 10-20분간 대화했다. 실험 결과, 의인화 행동이 많은 AI와 대화한 참가자들은 그렇지 않은 그룹보다 AI를 더욱 인간적으로 인식했다. 골스피드 의인화 설문(Godspeed Anthropomorphism survey)에서 평균 점수가 14.9% 더 높았으며, 참가자들의 AI 시스템 묘사에서 인간적 표현 사용 빈도를 측정하는 '앤스로스코어(AnthroScore)' 측정에서도 33% 더 높은 수치를 보였다. AI 의인화의 양면성: 사용 편의성 향상과 능력 과대평가 위험 공존 연구팀은 의인화 행동이 사용자 참여와 사용 편의성을 높일 수 있지만, 동시에 AI 시스템 능력을 과대평가하거나 개인정보를 공유하게 만들 위험도 있다고 지적한다. 또한 사용자가 AI 시스템에 부적절한 영향을 받을 가능성도 증가할 수 있어 윤리적 고려사항이 필요하다. 이번 연구는 대화형 AI 시스템이 어떻게 사용자와의 관계를 형성하는지에 대한 실증적 기반을 제공하며, 특히 우정이나 생활 코칭과 같은 사회적 영역에서 인간-AI 상호작용 역학에 대한 추가 연구의 필요성을 강조한다. FAQ Q: AI의 의인화 행동이 왜 중요한가요?A: AI의 의인화 행동은 사용자가 AI를 어떻게 인식하는지에 큰 영향을 미칩니다. 의인화 행동이 많을수록 사용자는 AI를 더 인간적으로 느끼며, 이는 사용자 참여와 사용 편의성을 높일 수 있습니다. 그러나 동시에 사용자가 AI의 능력을 과대평가하거나 개인정보를 과도하게 공유하는 위험도 있습니다. Q: 이 연구가 기존 AI 평가 방식과 다른 점은 무엇인가요?A: 이 연구는 단일 대화 중심의 기존 평가 방식과 달리 다중 턴 대화를 통해 AI 행동을 평가했습니다. 또한 자동화된 평가 방식을 도입하고, 실제 사용자 실험을 통해 평가 결과의 타당성을 검증했습니다. 이를 통해 대화가 진행됨에 따라 나타나는 복잡한 사회적 행동 패턴을 더 정확히 파악할 수 있었습니다. ■ 이 기사는 AI 전문 매체 'AI 매터스'와 제휴를 통해 제공됩니다. 기사는 클로드 3.5 소네트와 챗GPT를 활용해 작성되었습니다. (☞ 기사 원문 바로가기)

2025.02.26 19:06AI 에디터

1만5000개 솔트룩스 고객, '딥엘' 언어 AI 서비스 활용 가능해진다

솔트룩스이노베이션이 글로벌 언어 인공지능(AI) 기업 딥엘과 손잡고 고객들이 다양한 언어를 사용할 수 있도록 지원에 나선다. 솔트룩스이노베이션은 1만5천 개에 걸친 기업 고객 네트워크가 다국어 커뮤니케이션을 활용해 비즈니스 성장을 할 수 있도록 딥엘과 전략적 파트너십을 체결했다고 26일 발표했다. 이번 일을 통해 솔트룩스이노베이션은 기업 고객들이 AI 기반 번역 및 작문 솔루션 등 딥엘의 고도로 정확하고 안전한 언어 AI 도구 제품군을 원활하게 도입하도록 지원할 방침이다. 솔트룩스이노베이션은 AI 및 빅데이터 분야 선도 기업 솔트룩스의 자회사로, 국제 표준인 ISO 9001과 ISO 17100 인증을 취득하며 우수한 번역 품질과 고객 중심 서비스를 제공해 왔다. 이후 의료, 기술, 법률 등 전문 산업 분야에서 다양한 언어로 고품질 번역을 지원하는 등 국내 번역 업계를 선도하는 기업으로 자리 잡았다. 딥엘은 2017년 창립 이후 전 세계 기업이 가장 선호하는 언어 AI 제공 기업으로 성장했다. 국제 비즈니스 성장에 필수적인 믿을 수 있는 번역 및 작문을 위한 텍스트·음성 솔루션을 제공해 내부 운영부터 고객 서비스까지 다양한 영역의 커뮤니케이션 문제를 해결하고 있다. 또 범용 AI 시스템과는 달리 딥엘의 번역 및 작문 솔루션은 언어에 특화된 특수 AI 모델을 기반으로 하기 때문에 보다 정확도 높은 번역을 제공하고 환각(Hallucination) 현상 및 오류 발생의 리스크를 현저히 줄인다. 이번 협업을 통해 솔트룩스이노베이션과 딥엘의 언어 AI 플랫폼은 기업 수준 번역 및 언어 서비스 제품군을 강화하며 다국어 비즈니스의 니즈를 충족하는 더욱 정확한 맞춤형 번역 및 작문 솔루션을 제공할 전망이다. 솔트룩스이노베이션 고객은 '딥엘 번역기(어드밴스드 얼티밋·엔터프라이즈 플랜)' 외에도 기업용 음성 번역 솔루션인 '딥엘 보이스(DeepL Voice)', AI 글쓰기 도우미 '딥엘 라이트(DeepL write)' 등 딥엘 제품을 이용할 수 있다. 김영택 솔트룩스이노베이션 대표는 "딥엘과의 새로운 파트너십을 통해 우리 고객들에게 보다 폭넓은 AI 기반 번역 서비스를 제공하게 돼 기쁘다"며 "이번 파트너십은 오늘날 글로벌 시장에서 고객을 서포트하고 번역 및 로컬라이징 분야 혁신에 앞장서고자 하는 우리의 노력을 상징한다"고 말했다. 스티브 로터(Steve Rotter) 딥엘 최고 마케팅 책임자(CMO)는 "우리의 사명은 전 세계 기업의 언어 장벽을 허무는 것"이라며 "솔트룩스이노베이션과의 파트너십을 통해 수천개의 한국 고객에 자사 언어 AI 솔루션을 선보일 수 있게 돼 기쁘게 생각한다"고 밝혔다.

2025.02.26 09:31장유미

아마존, '알렉사 AI' 출시 3월 이후로 또 연기... 정확도 높이기 '진통'

워싱턴포스트(The Washington Post)가 14일(현지 시간) 보도한 내용에 따르면, 아마존(Amazon)이 AI 기반 음성비서 알렉사(Alexa)의 업그레이드 버전 출시를 다시 한번 연기했다. 이번 달 뉴욕에서 발표 행사를 개최할 예정이지만, 실제 출시는 3월 말 이후로 미뤄질 전망이다. 아마존 내부 관계자는 테스트 과정에서 새로운 알렉사가 부정확한 답변을 제공하는 문제가 발생했다고 밝혔다. 이로 인해 2023년 9월 첫 발표 이후 1년 반 만에 선보일 예정이던 '더 스마트하고 대화가 가능한' 버전의 출시가 3월 31일 이후로 연기됐다. 이번 알렉사 출시 지연은 AI 기술을 상용 제품에 적용하는 과정에서 겪는 기업들의 어려움을 보여준다. 애플(Apple)도 지난달 뉴스 알림을 요약하는 아이폰 AI 기능이 부정확한 정보를 전달하는 문제로 해당 기능을 일시 중단했다. 내부 문서에 따르면, 새로운 알렉사는 구독형 서비스로 제공될 예정이며, 성격 설정, 대화 기억, 음식 주문, 택시 호출 등의 기능이 포함된다. 현재 전 세계 5억대 이상의 알렉사 기기가 보급된 상황에서, 아마존은 이번 업그레이드를 통해 수익성 향상을 기대하고 있다. 한편 아마존은 올해 데이터센터 개발을 포함해 1000억 달러를 투자할 계획이다. 아마존은 알렉사 브랜드의 신뢰도를 지키기 위해 신중한 접근을 하고 있으며, 제품의 안정성이 확보될 때까지 출시를 미룰 것으로 알려졌다. ■ 기사는 클로드 3.5 소네트와 챗GPT-4o를 활용해 작성되었습니다. (☞ 기사 원문 바로가기)

2025.02.19 16:52AI 에디터

헬스케어 AI 스타트업 '덴컴', 미국법인 AIzac AI 공식 출범

덴컴은 미국 델라웨어에 현지 법인 'AIzac AI Inc.'를 설립하고, 북미 시장을 중심으로 글로벌사업 확장을 본격화한다고 19일 밝혔다. 덴컴이 100% 출자해 설립한 미국 법인 AIzac AI Inc.는 AI 기반 음성인식 치과 솔루션을 전문적으로 개발‧공급하며, 이번 북미 법인 설립을 통해 미국 치과 시장 내 AI 기술 도입을 가속화하고 글로벌 시장의 입지를 확대할 계획이다. 덴컴은 치과분야에 특화된 AI 음성인식 엔진인 '덴스퍼'(Densper)를 개발했다. 이를 활용해 진료 중 의사의 음성을 자동으로 의료기록으로 작성해 주는 '보이스 차팅'(Voice Charting), 외국인 환자에게 동시 통역을 지원하는 다국어 상담 기능, 의사가 컴퓨터단층촬영(CT) 등 치과 의료 영상을 음성으로 제어하는 '보이스 뷰어 컨트롤러'(Voice Viewer Controller) 등을 제공한다. 덴스퍼는 덴탈 전문 음성 데이터 학습과 자연어처리 기술을 결합해 덴탈 영역에 높은 수준의 음성인식 기능을 제공한다. 음성 텍스트 변환(STT) 정확도가 99% 이상이며, 한국어뿐 아니라 영어와 프랑스어 등 다국어를 지원하는 것이 특징이다. 덴컴은 미국 시장의 특성을 고려한 맞춤형 서비스도 준비 중이다. 미국 치과 시장은 네트워크 체계로 운영되어 150개에서 많게는 3천개 병원이 하나의 헤드 오피스를 통해 의료시스템을 통합 운영하고 있다. 특히 지난 2024년 뉴욕 치과 전시회 GNYDM(Greater New York Dental Meeting)에 참가해 여러 해외 업체들과 전략적 파트너십을 체결하는 등 AI 기반 치과 음성인식 솔루션의 시장성 및 적용 가능성을 확인한 바 있어, 이번 법인 설립을 통해 미국 현지 마케팅을 강화하고 파트너십을 확대하는 등 시장 침투율을 높여나갈 계획이다. 임병준 덴컴 대표는 “AI 기반 음성인식 기술은 치과 진료의 효율성과 정확성을 획기적으로 향상시킬 수 있는 핵심 솔루션”이라며 “2024년 GNYDM 참가를 통해 AI 음성인식 기술의 필요성을 확인한 만큼, 이번 법인 설립을 통해 북미 및 글로벌 시장에서 빠르게 성장하는 헬스케어 AI 기업으로 자리매김할 것”이라고 밝혔다. 한편 2017년 설립된 국내 치과 분야 음성 AI 솔루션 기업 덴컴은 스타셋인베스트먼트, DSC인베스트먼트, TS인베스트먼트 등이 참여한 100억원 규모의 시리즈 A2 투자를 유치한 바 있다. 덴컴은 AI 음성인식 기술을 통해 치과 진료의 효율성과 정확성을 극대화하고, 글로벌 치과 시장의 디지털 혁신 선도를 목표로 하고 있으며, 이번 미국 법인 설립으로 덴컴의 글로벌 헬스케어 AI 시장 진출이 가속화될 것으로 기대하고 있다.

2025.02.19 14:02조민규

머스크의 '그록3', 추론-미니 추론 2종 나와…1주일 후 음성 모드 추가

테크크런치(TechCrunch)가 19일(현지 시간) 보도한 내용에 따르면 일론 머스크의 인공지능 기업 엑스AI(xAI)가 17일(현지시간) 새로운 AI 모델 '그록3(Grok 3)'을 공개했다. 이와 함께 그록 iOS 앱과 웹 앱의 새로운 기능도 선보였다. 그록3는 오픈AI(OpenAI)의 GPT-4o와 구글(Google)의 제미나이(Gemini)에 대항하는 모델이다. 이미지 분석과 질문 응답이 가능하며, 머스크의 소셜 네트워크 X(구 트위터)의 다양한 기능을 지원한다. 엑스AI는 멤피스에 위치한 대규모 데이터센터에서 약 20만 개의 GPU를 활용해 그록3를 학습시켰다. 머스크는 X를 통해 "그록3가 이전 모델인 그록2보다 10배 더 많은 컴퓨팅 파워로 개발됐다"고 밝혔다. 그록3는 '그록3 추론(Grok 3 Reasoning)'과 '그록3 미니 추론(Grok 3 mini Reasoning)' 등 여러 모델로 구성됐다. 이들은 오픈AI의 o3-미니(o3-mini)와 중국 딥시크(DeepSeek)의 R1처럼 문제를 '사고'하며 해결하는 기능을 갖췄다. 또한 '딥서치(DeepSearch)'라는 새로운 기능을 통해 인터넷과 X 플랫폼을 검색하여 질문에 대한 요약된 답변을 제공한다. X 프리미엄플러스(Premium+) 구독자($50/월)가 그록3를 먼저 사용할 수 있다. 추가 기능은 '슈퍼그록(SuperGrok)' 요금제($30/월 또는 $300/년)를 통해 이용 가능하다. 머스크는 "약 1주일 후에 음성 모드가 추가되고, 몇 주 후에는 기업용 API를 통해 그록3 모델과 딥서치 기능을 제공할 계획"이라고 밝혔다. 또한 "그록3가 안정화되면 그록2를 오픈소스로 공개할 예정"이라고 덧붙였다. 엑스AI는 그록3가 수학 문제 평가 벤치마크인 AIME와 박사급 물리, 생물, 화학 문제를 평가하는 GPQA에서 GPT-4o를 능가했다고 주장했다. ■ 기사는 클로드 3.5 소네트와 챗GPT-4o를 활용해 작성되었습니다.

2025.02.18 20:13AI 에디터

머스크, '그록3' 마침내 공개…GPT-4o 제치고 챗봇 성능 1위

수학·과학·코딩 테스트에서도 강력한 성능 입증 xAI가 새롭게 출시한 인공지능 챗봇 '그록3'가 AI 성능 평가 플랫폼 Chatbot Arena에서 최상위 점수를 기록하며 경쟁 모델들을 압도했다. 18일(한국 시간) 오후 1시 xAI 공식 X에서 진행된 '그록3 출시' 라이브에 따르면, '그록3'는 OpenAI의 GPT-4o, Google DeepMind의 Gemini-2 Pro, Anthropic의 Claude 3.5 Sonnet 등을 제치고 챗봇 성능 순위 1위에 올랐다. (☞ 발표 바로가기) 그록3, AI 챗봇 성능 평가 1위 차지 최근 공개된 Chatbot Arena의 성능 비교 차트에 따르면, '그록3'는 경쟁 모델을 상대로 가장 높은 점수를 기록했다. 특히 LMSYS의 순위 평가에서 '그록3'는 독보적인 점수로 1위를 차지했으며, 신뢰 구간(오차 범위) 역시 경쟁 모델들보다 안정적인 것으로 나타났다. LMSYS의 Chatbot Arena는 익명의 AI 모델을 사용자가 직접 비교 평가하는 방식으로 운영되며, AI 챗봇 간의 실제 사용자 피드백을 기반으로 순위를 산정한다. 이번 결과는 '그록3'가 실사용 환경에서 GPT-4o나 Gemini-2 Pro보다 더 나은 성능을 발휘했음을 시사한다. 벤치마크 테스트에서도 두각 또한 Benchmarks테스트에서도 '그록3'는 수학(AIME 2024), 과학(GPQA), 코딩(LCB Oct-Feb) 항목에서 경쟁 모델 대비 압도적인 성적을 기록했다. 수학(AIME 2024):52점(그록3) vs. 40점(GPT-4o), 39점(Claude 3.5 Sonnet) 과학(GPQA):75점(그록3) vs. 65점(Gemini-2 Pro, GPT-4o), 50점(Claude 3.5 Sonnet) 코딩(LCB Oct-Feb):57점(그록3) vs. 41점(GPT-4o), 40점(Gemini-2 Pro) 이는 AI 모델의 논리적 추론 및 문제 해결 능력을 평가하는 핵심 지표로, '그록3'가 특정 영역에서 기존 모델들보다 더 뛰어난 성능을 보였다는 점을 확인할 수 있다. xAI, 그록3로 AI 경쟁에서 우위 점할까? xAI는 일론 머스크가 설립한 AI 연구 기업으로, 경쟁사 대비 보다 자유로운 답변을 생성하는 AI 모델을 개발하는 것을 목표로 한다. '그록3'는 이전 모델보다 자연어 이해와 생성 능력이 크게 향상되었으며, 특히 복잡한 문제 해결과 프로그래밍에서 높은 성과를 보이고 있다. 이번 '그록3'의 성능 결과는 AI 시장에서 OpenAI, Google DeepMind, Anthropic과의 경쟁이 더욱 치열해지고 있음을 의미한다. GPT-4o와 Gemini-2 Pro가 시장을 선도하고 있는 가운데, '그록3'가 실제 제품화 과정에서 어떤 차별점을 가질지 주목된다. ■ 기사는 클로드 3.5 소네트와 챗GPT-4o를 활용해 작성되었습니다. (☞ 기사 원문 바로가기)

2025.02.18 14:22AI 에디터

'위장 정보' 숨겨 목소리 도용 차단…'보컬크립트' 기술 나왔다

기존 딥페이크 음성 탐지의 한계: 사후 대응에서 사전 예방으로 중국 란저우대학교 연구진이 발표한 논문에 따르면, AI 음성 복제 기술의 발전이 텍스트 음성 변환(TTS)과 음성 변환(VC) 분야에서 괄목할만한 성과를 보이고 있다. 하지만 이러한 발전은 동시에 심각한 보안 위험을 초래하고 있다. 기존의 수동적 탐지 기술들은 워터마킹이나 패시브 탐지 기술에 의존해 공격이 발생한 후에야 대응이 가능했으며, 특정 공격 패턴에만 과적합되는 한계를 보였다. (☞ 논문 바로가기) AI 음성 복제의 핵심 기술: 음성 변환과 TTS의 작동 원리 음성 복제 기술은 크게 음성 변환(Voice Conversion)과 텍스트 음성 변환(TTS) 두 가지 방식으로 구현된다. 음성 변환은 임의의 화자 음성을 목표 화자의 음성으로 변환하면서 언어적 내용은 유지하는 기술이다. 반면 TTS는 더 유연한 방식으로, 원본 화자의 음성 없이도 텍스트만으로 원하는 음성을 생성할 수 있다. 이러한 기술의 핵심에는 타코트론(Tacotron)과 패스트스피치(FastSpeech)와 같은 딥러닝 기반 음향 모델이 있다. 특히 타코트론2는 위치 인식 어텐션 모듈을 도입해 합성 품질을 크게 개선했으며, 패스트스피치2는 음향 사전 정보를 활용해 더욱 향상된 결과를 제공한다. 음성의 최종 합성 단계에서는 하이파이-GAN(HiFi-GAN)과 같은 보코더가 사용되어 더욱 자연스러운 음성을 생성한다. 청각 마스킹 효과로 AI 음성 복제 차단: 음성 신호의 최대 60%까지 위장 가능 연구팀이 개발한 '보컬크립트(VocalCrypt)'는 인간의 청각 시스템의 특성을 활용한 혁신적인 방어 기법이다. 이 기술은 복잡한 음성 신호에서 30-60%가 마스킹 효과로 인해 인간의 귀로는 감지할 수 없다는 원리를 활용한다. 구체적으로 20Hz에서 22.05kHz 범위를 25개의 임계 대역으로 나누어 처리하며, 특히 저주파 영역(17번 밴드, 20~770Hz)에 중점을 둔다. 마스킹 임계값 기반의 적응형 강도 제어: NMR -5dB 이하 유지 보컬크립트는 소리의 각 주파수 대역별로 '마스킹 임계값'이라는 기준을 설정하여 위장 음색의 세기를 정밀하게 조절한다. 이는 마치 큰 소리가 작은 소리를 가리는 현상을 과학적으로 활용하는 것이다. 연구팀은 우리 귀가 어떤 소리는 잘 듣고 어떤 소리는 잘 듣지 못하는 특성을 철저히 분석했다. 이들은 소리의 특성을 순수한 음(예: 단일 피아노 음)부터 복잡한 소음까지 단계별로 구분했다. 실제 사람의 목소리는 대개 이 둘의 중간 어딘가에 위치한다. 연구진은 이런 특성을 고려해 각 소리 구간마다 최적의 위장 음색 강도를 결정했다. 특히 위장 음색의 세기를 특정 수준(기술적으로는 -5dB) 이하로 유지하여 사람의 귀로는 전혀 감지할 수 없게 만들었다. 이는 마치 큰 소리 속에 작은 소리를 숨기는 것과 같은 원리다. 결과적으로 우리가 들을 때는 원본 음성과 차이를 느끼지 못하지만, AI 음성 복제 시스템이 이 음성을 학습하거나 복제하려고 할 때는 심각한 방해를 받게 된다. 이러한 정교한 조절 덕분에 보컬크립트는 음성의 자연스러움은 그대로 유지하면서도 AI의 음성 도용 시도를 효과적으로 차단할 수 있게 되었다. 이는 마치 사람의 눈에는 보이지 않는 보안 워터마크를 음성에 삽입하는 것과 비슷한 효과를 낸다고 볼 수 있다. 음성의 언어, 화자의 성별에 관계없이 일관된 방어 효과 입증 연구팀은 상용 모델인 일레븐랩스(ElevenLabs)와 오픈소스 모델 GPT-SoVITS, XTTSv2, SEED-VC, StyleTTS2를 대상으로 광범위한 성능 검증을 실시했다. 실험은 CSTR VCTK 데이터셋의 영어 음성과 Zhvoice 데이터셋의 중국어 음성을 활용했다. VCTK 데이터셋은 109명의 영어 화자가 각각 약 400문장을 녹음한 데이터이며, Zhvoice 데이터셋은 약 3,200명의 화자, 900시간 분량의 오디오, 113만 줄의 텍스트로 구성된 대규모 데이터셋이다. 테스트의 공정성을 위해 데이터를 중국어 남성, 중국어 여성, 영어 남성, 영어 여성 등 4개 카테고리로 나누고 각 카테고리별로 100개 문장을 계층적 무작위 추출 방식으로 선정했다. 자동 화자 인증(ASV) 시스템을 통한 평가에서, 두 음성의 유사도 점수가 0.8을 넘으면 동일 화자로 판단하는데, 보컬크립트로 보호된 음성은 대부분 이 기준치 아래의 점수를 기록했다. 구체적인 실험 결과를 보면, 일레븐랩스에 대해 중국어 여성 화자는 0.627, 영어 여성 화자는 0.442의 유사도 점수를 보였다. GPT-SoVITS에 대해서는 각각 0.661과 0.465를 기록했으며, 다른 모델들에 대해서도 대부분 0.6 이하의 낮은 유사도를 유지했다. 특히 주목할 만한 점은 이러한 방어 효과가 음성의 언어나 화자의 성별에 관계없이 일관되게 나타났다는 것이다. 실제 공격 시나리오를 고려해 아마추어 공격자와 전문 공격자의 두 가지 유형으로 나누어 테스트도 진행했다. 아마추어 공격자는 readily available한 온라인 상용 제품이나 간단한 사전 학습 모델을 사용하는 것으로 가정했고, 전문 공격자는 적대적 공격, 미세 조정 등 고급 기술을 사용하는 것으로 설정했다. 두 경우 모두에서 보컬크립트는 효과적인 방어 성능을 보여주었다. 500% 빠른 처리 속도와 0.942의 음질 점수 달성 기존 GAN 기반 방어 기술들과 비교해 처리 속도가 5배 향상되었으며, 음질 평가에서도 0.942라는 높은 점수를 기록했다. 이는 기존 기술들의 음질 점수인 0.984(Huang's)와 0.956(Dong's)에 근접한 수준이다. 연구팀은 이 기술의 실시간 처리 성능을 바탕으로 마이크나 사운드카드에 직접 통합하는 방안을 검토 중이다. ■ 이 기사는 AI 전문 매체 'AI 매터스'와 제휴를 통해 제공됩니다. 기사는 클로드 3.5 소네트와 챗GPT를 활용해 작성되었습니다. (☞ 기사 원문 바로가기)

2025.02.18 08:36AI 에디터

Prev 1 2 3 4 5 6 7 8 9 10 Next