• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
  • AI의 눈
반도체
AI의 눈
디지털트러스트
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'사이냅 에디터 3.0'통합검색 결과 입니다. (825건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

MS, 엔비디아 의존 끝나나… 자체 AI 칩으로 아마존·구글 제쳤다

마이크로소프트가 AI 응답 생성에 특화된 자체 반도체 '마이아 200(Maia 200)'을 공개하며 빅테크 경쟁에서 앞서 나갔다. 이 칩은 아마존과 구글의 최신 AI 칩보다 성능이 뛰어나며, 기존 대비 비용 효율성도 30% 개선됐다. 26일(현지 시각) 마이크로소프트 공식 블로그에 따르면, 마이아 200은 AI가 답변을 생성하는 '추론' 작업에 최적화된 칩이다. 대만 TSMC의 최신 3나노미터 공정으로 제작됐다. 나노미터 수치가 작을수록 더 많은 회로를 담을 수 있어 성능이 뛰어나다. 실제로 이 칩은 아마존의 최신 AI 칩보다 3배 빠르고, 구글의 AI 칩보다도 높은 성능을 보였다. 이 칩의 핵심은 AI 모델이 빠르게 작동하도록 데이터 공급 속도를 대폭 높인 것이다. 216GB 용량의 고속 메모리와 272MB의 칩 내장 메모리를 탑재해 대규모 AI 모델도 빠르게 처리할 수 있다. 또한 최대 6,144개의 칩을 연결해 클러스터로 구성할 수 있어 더 큰 규모의 AI 작업도 가능하다. 마이아 200은 오픈AI의 최신 GPT-5.2 모델을 포함한 다양한 AI 모델을 지원한다. 이를 통해 마이크로소프트 파운드리와 마이크로소프트 365 코파일럿의 성능과 비용 효율성이 개선된다. 마이크로소프트 슈퍼인텔리전스 팀은 이 칩을 활용해 AI 학습용 합성 데이터를 생성하고 강화 학습을 진행해 차세대 AI 모델을 개발할 계획이다. 마이크로소프트는 칩 설계 단계에서부터 실제 데이터센터 환경을 미리 검증하는 방식을 채택했다. 이 덕분에 첫 칩이 완성된 후 며칠 만에 AI 모델 실행에 성공했고, 데이터센터 배치까지 걸린 시간도 일반적인 AI 인프라 프로그램의 절반 이하로 단축됐다. 현재 마이아 200은 아이오와주 디모인 인근 데이터센터에 배치됐으며, 애리조나주 피닉스를 시작으로 더 많은 지역으로 확대된다. 마이크로소프트는 개발자와 AI 스타트업, 학계를 위한 소프트웨어 개발 도구도 공개했다. 이 도구에는 파이토치 지원과 시뮬레이터, 비용 계산기 등이 포함돼 있다. 마이크로소프트 클라우드+AI 총괄 스콧 거스리 부사장은 "대규모 AI 시대가 막 시작됐고, 인프라가 가능성을 정의할 것"이라며 "마이아는 여러 세대에 걸쳐 개발될 예정이며, 각 세대마다 성능과 효율성이 지속적으로 향상될 것"이라고 밝혔다. 해당 기사의 원문은 마이크로소프트 공식 블로그에서 확인 가능하다. ■ 이 기사는 AI 전문 매체 'AI 매터스'와 제휴를 통해 제공됩니다. 기사는 클로드 3.5 소네트와 챗GPT를 활용해 작성되었습니다. (☞ 기사 원문 바로가기)

2026.01.28 13:22AI 에디터

챗GPT로 이력서 보는 시대…그런데 채용 담당자 80%는 'AI 불신', 왜?

2025년 채용 시장에서 AI는 단순 작업을 보조하는 도구로 자리 잡았다. 그러나 2026년부터는 AI가 맥락을 파악하고 인재를 검증하는 전략적 영역으로 진화할 전망이다. 국내 1위 채용 관리 솔루션 그리팅이 채용 담당자 200명을 대상으로 실시한 설문조사 결과, AI 활용이 효율성을 넘어 채용 퀄리티 향상으로 확장되고 있음이 드러났다. 2025년 상반기, AI가 채용 실무에 정착한 전환점 채용 담당자들의 AI 활용은 2025년을 기점으로 폭발적으로 증가했다. 응답자의 54.1%가 2025년부터 채용 업무에 AI를 활용하기 시작했으며, 특히 2025년 상반기에 가장 높은 도입률을 보였다. 이 시기가 AI가 실무에 정착된 결정적인 전환점이었던 것이다. 주목할 점은 활용 빈도다. 응답자의 58.3%가 AI를 매일 또는 주 3~4회 활용하고 있어, AI가 일회성 실험이 아닌 일상 업무 도구로 완전히 자리 잡았음을 보여준다. 채용 담당자들이 가장 많이 활용하는 AI 도구는 챗GPT로 161회의 응답을 기록하며 압도적 1위를 차지했다. 이 외에도 클로드, 코파일럿 등 접근성이 높고 비용이 저렴한 생성형 AI들이 상위권을 차지했다. 반면 면접이나 역량 검사에 특화된 국내 채용 솔루션의 활용 빈도는 상대적으로 낮았다. 채용 공고 작성부터 보고서까지, 텍스트 작업에 집중된 AI 활용 채용 업무에서 AI를 가장 많이 활용하는 분야는 채용 공고 작성으로 134회의 응답을 받아 압도적 1위를 기록했다. 이어서 채용 보고서 작성 75회, 지원자 이력서 평가 64회 등 주로 텍스트 초안 작성 영역에 AI가 집중 활용되고 있다. 한 채용 담당자는 "공고를 기반으로 이력서의 적합도와 기술 스택 일치 여부를 평가해달라고 요청한다"며 "허수 지원자를 걸러내고 전체 이력서의 경향성을 파악하는 데 활용한다"고 답했다. 또 다른 담당자는 "채용 데이터들을 직접 정리할 필요가 없어 시간이 단축되었다"고 밝혔다. 반면 지원자 안내 메일 작성 51회, 지원자 면접 평가 33회 등 지원자 소통과 면접 평가 영역의 AI 활용도는 상대적으로 낮게 나타났다. 결론적으로 채용 담당자들은 AI를 면접 평가보다는 텍스트 초안 작성과 같은 업무 효율화 영역에 집중 활용하고 있다. 채용 리드타임 30% 단축 성공했지만, 지원자 평가는 여전히 과제 AI 활용의 가장 큰 성과는 채용 리드타임 단축이었다. 평균적으로 30% 단축되었으며, AI를 통해 리드타임이 개선될 것이라고 기대했던 비중보다 실제로 개선을 경험한 비중이 약 10%포인트 더 높게 나타나 기대를 뛰어넘는 성과를 보였다. 채용 담당자들은 "공고 작성, 메일 작성, 이력서 스크리닝 등 비교적 단순한 업무를 AI가 빠르게 처리해줘서 시간이 단축되었다"고 답했다. 그러나 지원자 평가의 일관성과 정확도 영역에서는 기대치에 미치지 못했다. 지원자 평가가 개선될 것이라고 기대했던 비중보다 실제 개선을 경험한 비중이 10%포인트 이상 낮았다. 더욱 충격적인 것은 응답자의 82%가 'AI의 지원자 평가 결과를 신뢰하지 않는다'고 답한 점이다. 한 채용 담당자는 "동일한 지원자도 AI 도구에 따라 평가가 크게 달라지는 케이스를 목격하여 평가할 때는 잘 안 쓰게 된다"고 밝혔다. 2026년 예산은 연 50만 원 이하가 절반, 하지만 활용 의지는 83.5% 2026년 채용 업무에서 AI 활용에 대한 채용 담당자들의 의지는 강력하다. 응답자의 83.5%가 앞으로 채용 업무에 AI를 더 많이 활용하겠다고 답했다. 그러나 실질적인 투자 수준에서는 괴리가 존재한다. 81.4%의 팀이 AI 활용 예산을 배정했지만, 그중 58.8%가 연간 50만 원 이하의 투자만을 계획하고 있다. 이러한 문제의 핵심은 투자수익률(ROI) 산출 근거가 부족하기 때문이다. 채용 데이터가 ATS(지원자추적시스템), 엑셀, 노션 등으로 분산되어 AI 채용 성과를 측정할 기반이 없다면 경영진을 설득할 투자 타당성 논리를 만들 수 없다. 흥미로운 점은 2026년 채용 담당자들이 AI를 가장 적극적으로 활용하고 싶은 분야가 지원자 이력서 평가 146회, 채용 데이터 분석 120회, 면접 디브리핑 89회 순으로 나타났다는 것이다. 이는 AI를 단순 효율화 도구를 넘어 채용 퀄리티를 높이는 전략적 도구로 활용하려는 방향성을 보여준다. AI가 단순 비서에서 전략적 파트너로 진화하려면 이번 조사 결과는 2026년 채용 시장에서 AI의 역할이 근본적으로 변화하고 있음을 시사한다. 2025년 AI가 업무 속도를 높이는 도구였다면, 2026년에는 채용 정확도를 높이는 전략적 파트너가 되어야 한다는 것이 채용 담당자들의 명확한 요구사항이다. 그러나 현재 생성형 AI는 세 가지 한계를 가지고 있다. 첫째, 보안 문제로 기업의 내부 평가 기준이나 과거 합격자 정보를 학습시키기 어렵다. 둘째, 수백수천 명의 지원자 데이터를 통합 학습시키는 과정이 현실적으로 어렵다. 셋째, 해당 포지션의 맥락적 선호 조건을 정확히 반영하여 판별하기 어렵다. 따라서 2026년 AI 활용 전략은 ROI 설계와 데이터 통합 기반 마련부터 시작해야 한다. 채용 솔루션 내장 AI로 전환하여 공고의 숨은 의도를 파악하고, 기업의 채용 의도를 학습하며, 구체적인 검증 포인트를 제시할 수 있어야 한다. 조직 차원에서는 흩어진 AI 도구를 통합 채용 솔루션으로 묶어 지원자 평가의 정확도를 높이는 시스템을 구축해야 하며, 개인 차원에서는 AI가 놓칠 수 있는 인재의 잠재력을 최종 검증하고 최상위 후보자와의 관계 형성에 집중해야 한다. FAQ( ※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.) Q1. 채용 담당자들이 가장 많이 사용하는 AI 도구는 무엇인가요? A. 챗GPT가 161회로 압도적 1위를 차지했습니다. 이 외에도 클로드, 코파일럿 등 접근성이 높고 비용이 저렴한 생성형 AI들이 많이 활용되고 있습니다. 반면 면접이나 역량 검사 특화 솔루션은 상대적으로 활용도가 낮습니다. Q2. AI를 활용하면 채용 기간이 얼마나 줄어드나요? A. 평균적으로 채용 리드타임이 30% 단축되었습니다. 특히 공고 작성, 메일 작성, 이력서 스크리닝 등 단순 반복 업무에서 시간 절감 효과가 컸습니다. AI를 통한 리드타임 개선은 채용 담당자들의 기대를 뛰어넘는 성과를 보였습니다. Q3. AI로 지원자를 평가할 때 정확도는 어느 정도인가요? A. 현재로서는 신뢰도가 낮습니다. 응답자의 82%가 AI의 지원자 평가 결과를 신뢰하지 않는다고 답했습니다. 동일한 지원자도 AI 도구에 따라 평가가 크게 달라지고, 명백히 부적합한 지원자를 걸러내는 수준에 그치고 있어 정밀한 평가는 여전히 사람의 몫입니다. ■ 이 기사는 AI 전문 매체 'AI 매터스'와 제휴를 통해 제공됩니다. 기사는 클로드 3.5 소네트와 챗GPT를 활용해 작성되었습니다. (☞ 기사 원문 바로가기)

2026.01.28 08:15AI 에디터

애플도 AI 핀 시장 도전…제미나이 탑재하고 2027년 출격 가능할까

애플이 자체 AI 핀 웨어러블 기기 개발에 나섰다. 21일(현지 시각) 더 인포메이션(The Information)의 보도에 따르면, 애플은 오픈AI의 웨어러블 AI 기기에 맞서기 위해 독자적인 AI 핀을 준비하고 있다. 애플의 AI 핀은 빠르면 2027년에 출시될 예정이며, 크기는 에어태그(AirTag)보다 약간 두꺼운 정도다. 현재 개발 중인 애플 AI 핀은 알루미늄과 유리 외장을 갖춘 얇고 평평한 원형 디스크 형태로 제작되고 있다. 기기 측면에는 물리적 버튼 하나가 배치되며, 뒷면에는 애플워치와 유사한 충전 인터페이스가 탑재된다. 주목할 점은 애플 AI 핀에 두 개의 카메라가 장착된다는 것이다. 기기 전면에는 표준 렌즈와 광각 렌즈가 각각 배치되며, 이는 사용자 주변 환경의 사진과 영상을 촬영하도록 설계됐다. 오디오 측면에서는 스피커 한 개와 소리를 수집하는 마이크 세 개가 포함된다. 애플은 구글이나 마이크로소프트 같은 기업들이 AI 시장에 집중하는 동안 상대적으로 부재했던 AI 분야에서 입지를 강화하려 하고 있다. 애플은 최근 구글과 파트너십을 맺고 애플 인텔리전스와 시리에 구글의 제미나이 AI 모델을 탑재한다고 발표했다. 또한 음성 비서 시리의 완전한 AI 개편 작업도 진행 중이다. 보도에 따르면, 애플은 올해 후반 출시 예정인 오픈AI의 미스터리 AI 웨어러블과 경쟁하기 위해 2027년 출시를 목표로 하고 있다. 하지만 AI 핀 개발은 아직 초기 단계에 있으며, 애플의 기준에 미치지 못할 경우 프로젝트가 취소될 가능성도 있다고 한다. AI 핀은 독립형 웨어러블 AI 기기를 만들려는 기업들에게 난제였다. 휴메인 핀(Humane Pin)이 가장 대표적인 실패 사례다. 이 회사는 수억 달러를 투자받았지만 출시 후 1만 대도 채 팔지 못하고 혹평을 받았으며, 제품 출시 후 1년도 안 돼 문을 닫았다. 루머대로 애플이 9월에 오랫동안 기대를 모은 폴더블 아이폰을 출시하고 몇 달 뒤 AI 핀까지 내놓는다면, 애플의 새로운 제품 라인업에 매우 흥미로운 시기가 될 전망이다. 해당 기사의 원문은 더 인포메이션에서 확인 가능하다. ■ 이 기사는 AI 전문 매체 'AI 매터스'와 제휴를 통해 제공됩니다. 기사는 클로드 3.5 소네트와 챗GPT를 활용해 작성되었습니다. (☞ 기사 원문 바로가기)

2026.01.26 22:57AI 에디터

91%가 우려하면서도 70%가 사용하는 AI 쇼핑의 아이러니

온라인 쇼핑의 패러다임이 바뀌고 있다. 챗GPT, 제미나이, 클로드 같은 AI 어시스턴트가 소비자의 일상적인 쇼핑 동반자로 자리 잡으면서, 에이전틱 커머스(Agentic Commerce)라는 새로운 쇼핑 방식이 주목받고 있다. 에이전틱 커머스란 AI 시스템이 제품 추천부터 결제 개시까지 보다 능동적인 역할을 수행하는 쇼핑 형태를 말한다. 그러나 AI의 능력이 커진다고 해서 자동으로 소비자의 신뢰까지 커지는 것은 아니다. 클러치(Clutch)가 발표한 리포트에 따르면, 소비자의 70%가 이미 AI를 활용해 온라인 쇼핑을 하고 있지만, 77%는 특정 에이전틱 커머스 기능에 개방적이라고 답했음에도 불구하고 95%는 AI 기반 구매에 대한 우려를 표명했다. 편의성과 프라이버시, 정확성, 통제권 사이의 긴장감이 현재 AI 쇼핑 도구 도입 단계의 핵심 특징이다. "며칠 걸리던 쇼핑, AI는 몇 분으로 압축한다"… 주간 사용자만 32% AI 쇼핑 어시스턴트는 이미 소비자 여정의 일상적인 부분이 되어가고 있다. 주로 구매를 완료하기보다는 리서치와 비교를 위해 사용된다. 실제로 소비자의 65%가 구매 전 제품 리서치를 위해 AI 도구를 사용한 경험이 있으며, 그중 32%는 매주 사용하고 있다. 주목할 점은 14%의 소비자가 아직 AI를 쇼핑 리서치에 사용해본 적은 없지만 관심이 있다고 답했으며, 단 21%만이 사용한 적도 없고 관심도 없다고 응답했다는 것이다. 소비자들이 쇼핑 여정에서 AI를 활용하는 이유는 일상적인 효율성과 깊이 연관되어 있다. 제품 리서치 시 시간 절약(43%), 옵션 비교의 용이성(43%), 더 나은 제품 추천(35%), 할인 및 가격 인하 추적(27%), 새로운 제품 발견(26%), 정신적 부담 감소 및 의사결정 용이성(19%) 순으로 나타났다. 결국 소비자들은 AI를 쇼핑 여정의 기초 단계를 지원하는 도구로 활용하며, 완벽한 제품을 찾는 과정에서 시간과 비용을 절약하고 있다. 영국의 디지털 마케팅 대행사인 익스포저 닌자(Exposure Ninja)의 CEO 찰리 마천트(Charlie Marchant)는 "온라인 쇼핑은 수동적인 프로세스다. 여러 탭을 열고 제품을 비교하고 리뷰를 읽으며 며칠 동안 왔다 갔다 하다가 구매 결정을 내린다. 에이전틱 AI는 이 모든 것을 몇 분으로 압축한다"고 설명했다. 91%가 우려하는 AI 쇼핑… 완전 신뢰는 겨우 17% AI 사용이 증가하고 있음에도 불구하고, 신뢰는 AI 쇼핑 여정의 더 깊은 도입에 있어 중요한 장벽으로 남아 있다. 전체적으로 91%의 소비자가 쇼핑용 AI 어시스턴트 사용 시 우려나 불만을 보고했다. 데이터 및 보안 문제가 응답자의 43%로 가장 큰 걱정거리였으며, 38%는 부정확하거나 신뢰할 수 없는 제품 추천을 경계했다. 특정 제품에 대한 AI 추천의 소비자 신뢰를 세분화하면, 17%만이 AI 추천 제품을 일반적으로 신뢰한다고 답했다. 23%는 자체 리서치를 추가로 수행한 후에만 신뢰하며, 26%는 때때로 신뢰하고 제품에 따라 다르다고 답했다. 17%는 회의적이며, 또 다른 17%는 전혀 신뢰하지 않는다고 밝혔다. AI 추천 제품에 대한 불신은 몇 가지 주요 우려와 불만으로 귀결된다. 42%의 응답자는 제안이 자신의 취향이나 스타일과 맞지 않는다고 공유했으며, 38%는 부정확하거나 신뢰할 수 없는 추천을 받았고, 34%는 AI 시스템이 특정 브랜드나 제품에 편향되어 있을 가능성에 대해 회의적이었다. 그러나 특정 요소들은 AI 추천에 대한 신뢰도를 높일 수 있다. 소비자들은 AI가 제품을 추천한 이유를 명확하게 설명할 때(47%), 하나가 아닌 여러 옵션을 제시할 때(46%), 기능, 장단점, 비교와 같은 주요 제품 세부 정보를 요약할 때(39%), 실제 고객 리뷰를 포함할 때(34%), 후원 추천에 대해 투명할 때(33%) 제안을 신뢰할 가능성이 더 높다. 이러한 발견은 투명성, 여러 옵션, 실행 가능하고 검증 가능한 정보로부터 더 높은 신뢰가 나온다는 것을 강화한다. 이러한 요소들은 에이전틱 커머스가 점점 더 광범위해짐에 따라 매우 중요할 것이다. 생필품은 OK, 반려동물 용품은 NO… 카테고리별 신뢰도 최대 4배 차이 AI 쇼핑에 대한 소비자의 편안함은 제품 카테고리에 따라 크게 다르지만, 패턴은 일관적이다. 사람들은 일상적이고 교체 가능하거나 비교 중심의 품목을 구매할 때 AI를 사용할 의향이 더 높다. 일상 생활필수품이 목록의 맨 위에 있으며, 소비자의 40%가 이 카테고리에서 AI를 사용하는 것이 편하다고 답했다. 이러한 구매는 위험이 낮고 반복 가능한 경향이 있어 AI 지원에 자연스럽게 적합하다. 전자제품 및 기술이 37%로 바로 뒤를 이어, 소비자들이 이 비교 중심 카테고리에서 사양을 비교하는 데 AI를 사용할 가능성이 높음을 나타낸다. 중간 수준의 편안함은 다양한 라이프스타일 카테고리에 걸쳐 나타나며, 소비자들은 뷰티 및 퍼스널 케어 제품(27%), 의류 및 액세서리(27%), 식료품(25%), 취미 또는 공예품(22%), 가정용품 또는 가구(21%)에 AI를 사용하는 데 개방적이다. 또한 5명 중 1명(20%)의 소비자는 가전제품, 가구 또는 주요 기술과 같은 고가 구매에 AI를 사용할 것이라고 답했다. 이 데이터는 소비자들이 대형 품목을 리서치하고 선택할 때 지원을 높이 평가한다는 것을 보여준다. 편안함이 가장 크게 떨어지는 곳은 개인 웰빙과 관련된 카테고리다. 소비자의 16%만이 건강 또는 웰니스 제품 쇼핑에 AI를 사용하는 것이 편하며, 단 11%만이 애완동물 용품에 대해 그렇게 하는 것이 편하다고 느낀다. 이러한 카테고리는 더 높은 인지된 위험, 더 개별화된 요구, 인간의 판단에 대한 더 강한 욕구를 수반한다. 전반적으로 데이터는 소비자들이 의사 결정이 반복 가능하고 정보 중심인 상황에서 AI 쇼핑 지원을 선택적으로 활용하며, 가장 자주 사용한다는 것을 보여준다. 반면, 구매가 개인적이거나 감정적이거나 고위험으로 느껴질 때 AI에 덜 의존한다. 에이전틱 커머스를 향해 나아가는 브랜드와 플랫폼의 경우, 이러한 카테고리 차이는 AI가 오늘날 가치를 추가할 수 있는 곳과 신뢰가 여전히 얻어져야 하는 곳을 강조한다. "결제 버튼만은 내가 누른다"… AI 완전 위임 겨우 4% AI가 이미 쇼핑 여정의 많은 부분에 내장되어 있지만, 결제는 대부분의 소비자에게 명확한 AI 쇼핑 활용 중단 지점으로 남아 있다. 데이터는 사람들이 AI를 통해 정보를 얻는 것에는 편리함을 느끼지만, AI 정보를 바탕으로 쇼핑을 마무리하는 데는 불편함을 느낀다는 것을 보여준다. 실제로 소비자의 4%만이 구매를 완료하는 행위를 AI 어시스턴트에게 완전히 넘기는 것이 편할 것이라고 답했다. AI 플랫폼 내에서 구매하는 것에 대해 보다 직접적으로 질문했을 때, 감정은 여전히 신중하다. 27%는 결제 프로세스가 안전하다고 느끼면 구매를 완료하는 것이 편할 것이라고 답했고, 29%는 결정을 내리기 전에 더 많은 정보가 필요하다고 답했으며, 44%는 AI 플랫폼 내에서 구매를 완료하는 것이 전혀 편하지 않을 것이라고 답했다. 이러한 주저함은 95%의 소비자가 AI 지원 구매에 대한 우려를 보고한다는 사실에서 비롯되며, 이러한 우려는 신뢰와 통제 문제를 중심으로 밀접하게 집중되어 있다. 응답자의 63%는 데이터 프라이버시에 대해 우려하고, 53%는 특정 브랜드나 제품에 대한 잠재적 편향에 대해 회의적이며, 52%는 개인 정보의 오용에 대해 걱정한다. 이러한 우려는 연구 전반에 걸쳐 일관된 주제를 강화한다. 소비자들은 돈이 손을 떠날 때 통제권을 유지하기를 원한다. AI 쇼핑 기능 선호도, 가격 인하 알림 54%로 압도적 소비자들은 통제권을 제거하지 않으면서 정보를 유지하는 데 도움이 되는 AI 쇼핑 기능을 원한다. 설문 조사 데이터에 따르면, 가격 모니터링이 수요를 주도하며 54%가 가격 인하 알림을 원한다. 이는 소비자들이 즉각적인 구매 결정을 내리는 것보다 시간이 지남에 따라 절약을 추적하는 데 AI를 가치 있게 여긴다는 것을 보여준다. 거래 발견 및 보충 지원도 환영받는다. 36%는 더 나은 거래나 유사한 제품에 대한 제안을 원하고, 36%는 자주 구매하는 품목이 부족할 때 알림을 원한다. 이는 소비자들이 이미 수동으로 관리하고 있으며 자동화하는 것이 편한 작업이다. 계획 지원은 적당한 매력을 가지고 있다. 24%는 구독 관리(일시 중지, 건너뛰기 또는 조정)에 대한 도움을 원하고, 22%는 휴일이나 생일과 같은 계절별 또는 시간에 민감한 구매에 대한 알림을 원한다. 자동 재주문은 여전히 틈새 기능으로 남아 있다. 19%만이 AI가 자동으로 구매를 재주문하는 데 관심이 있으며, 이는 대부분의 소비자가 AI가 인식과 효율성을 지원하기보다는 최종 구매 통제권을 대체하는 것을 선호한다는 것을 강화한다. 이러한 선호도를 종합하면 소비자들이 AI를 자율적인 구매자가 아닌 지원적인 쇼핑 어시스턴트로 본다는 것을 나타낸다. 인식을 높이고 시간을 절약하며 의사 결정 통제권을 유지하는 기능이 쇼핑객을 대신하여 행동하는 기능보다 훨씬 더 매력적이다. 영국 글로벌 디지털 마케팅 회사, 아큐캐스트(AccuraCast)의 그룹 CEO 파르하드 디베차(Farhad Divecha)는 에이전틱 커머스가 "오늘날 판매 손실의 가장 큰 원인 중 하나인 선택의 과잉을 해결한다"고 요약했다. 그는 "사용자 의도에 부합하는 방식으로 옵션을 좁힘으로써 AI 주도 구매 여정은 더 나은 고객 경험을 창출하면서 전환율을 개선할 수 있다"고 설명했다. FAQ (※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.) Q1. 에이전틱 커머스란 무엇인가요? A. 에이전틱 커머스는 AI 시스템이 제품 추천부터 결제 개시까지 쇼핑 과정에서 보다 능동적인 역할을 수행하는 새로운 형태의 전자상거래입니다. 단순히 정보를 제공하는 것을 넘어 소비자를 대신해 의사결정을 지원하고 실행하는 AI 기반 쇼핑 방식을 의미합니다. Q2. 소비자들이 AI 쇼핑에서 가장 우려하는 점은 무엇인가요? A. 소비자의 95%가 AI 기반 구매에 대한 우려를 표명했으며, 주요 우려 사항은 데이터 프라이버시(63%), 특정 브랜드나 제품에 대한 편향 가능성(53%), 개인정보 오용(52%)입니다. 또한 38%는 부정확하거나 신뢰할 수 없는 제품 추천을 걱정하고 있습니다. Q3. 소비자들은 어떤 제품 카테고리에서 AI 쇼핑을 선호하나요? A. 일상 생활필수품(40%), 전자제품 및 기술(37%)에서 AI 활용 의향이 가장 높습니다. 반면 건강 및 웰니스 제품(16%), 애완동물 용품(11%)처럼 개인적이고 감정적이거나 높은 위험이 수반되는 카테고리에서는 AI 사용 선호도가 낮게 나타났습니다. ■ 이 기사는 AI 전문 매체 'AI 매터스'와 제휴를 통해 제공됩니다. 기사는 클로드 3.5 소네트와 챗GPT를 활용해 작성되었습니다. (☞ 기사 원문 바로가기)

2026.01.26 21:16AI 에디터

"AI 하나로 부족해"… 메타·구글, 역할 나눠 협력하는 AI 팀 공개

인간은 스스로의 부족한 점을 보충하기 위해 조직을 만들어 과업에 대응한다. 인류는 서로의 장단점을 보완해 가며 역사를 이뤄냈다. 인간처럼 능동적으로 행동할 수 있는 AI 역시 팀을 이루면 각 AI의 장단점을 극복할 수 있다. 일리노이대학교, 메타, 아마존, 구글 딥마인드 등 글로벌 AI 연구 기관들이 발표한 대규모 연구 리포트가 AI의 새로운 진화 방향을 제시했다. 해당 논문에 따르면, 이 연구는 AI가 단순히 질문에 답하는 단계를 넘어, 마치 사람처럼 스스로 계획을 세우고 도구를 활용하며 경험을 통해 배우는 존재로 발전하고 있다고 밝혔다. 연구진은 이러한 AI의 능력을 '에이전트 추론'이라 부르며, 3단계로 나눠 설명했다. 기본적인 일 처리 능력, 스스로 학습하는 능력, 그리고 여러 AI가 협력하는 능력이다. 스스로 계획 세우고 도구 쓰고 정보 찾는 AI의 기본 능력 AI가 갖춰야 할 기본 능력은 크게 세 가지다. 계획 세우기, 도구 사용하기, 정보 찾기가 그것이다. 예를 들어, 리액트(ReAct)라는 시스템은 사람처럼 '생각하기'와 '행동하기'를 번갈아 가며 일을 처리한다. 큰 목표를 작은 단계로 나누고, 필요한 외부 도구를 불러 쓰며, 결과가 맞는지 확인하는 식이다. 도구를 사용하는 능력은 AI가 본래 가진 한계를 뛰어넘게 해준다. AI는 최신 정보를 모르거나 복잡한 계산을 못 하는 경우가 많은데, 이때 외부 프로그램을 호출해서 문제를 해결한다. 툴포머(Toolformer)라는 시스템은 스스로 필요한 프로그램을 만들어 쓰고, 툴LLM(ToolLLM)은 수많은 사용 예시를 보고 배우며, 허깅GPT(HuggingGPT)는 여러 도구를 동시에 조율해서 사용한다. 이들은 언제 도구를 써야 하는지, 어떤 도구가 적합한지, 어떻게 명령을 내려야 하는지를 스스로 판단한다. 정보를 찾는 능력도 똑똑해졌다. 기존 AI는 한 번만 검색해서 답을 찾았다면, 이제는 상황에 따라 언제, 무엇을, 어떻게 찾을지를 스스로 결정한다. 리액트는 생각하는 과정에 검색 명령을 끼워 넣고, 셀프-RAG(Self-RAG)는 매 단계마다 "더 찾아봐야 하나?"를 스스로 판단하며, 에이전트-G(Agent-G)는 일반 문서와 정리된 데이터베이스를 동시에 뒤져 답을 찾는다. 실패를 기억하고 다시 도전하는 AI: 경험으로 배우는 학습 능력 AI가 정말 똑똑해지려면 한 번 배운 것을 기억하고, 실수를 반복하지 않아야 한다. 이것이 바로 '스스로 진화하는 능력'이다. 정해진 방식대로만 일하는 게 아니라, 경험을 쌓고 기억하며 점점 나아지는 것이다. 리플렉시온(Reflexion) 같은 시스템은 AI가 자기 판단을 스스로 비판하고 개선하게 만들고, 메모리-R1(Memory-R1)은 무엇을 기억하고 어떻게 꺼내 쓸지를 학습한다. 기억 시스템은 AI가 똑똑해지는 핵심이다. 예전 방식은 단순히 정보를 저장만 했다면, 이제는 기억을 활용해서 판단하고 결정한다. Amem이라는 시스템은 AI가 스스로 상황에 맞는 기억을 만들고, 관련된 경험들끼리 연결하며, 새로운 정보가 들어오면 기억을 업데이트한다. 메모리뱅크(MemoryBank)와 워크플로우 메모리(Workflow Memory)는 이전에 어떤 과정으로 일했는지 추적해서, 나중에 비슷한 일을 더 잘할 수 있게 돕는다. 피드백 받아서 개선하는 능력도 중요하다. 과학 실험 AI는 실험 결과가 나아졌을 때만 다음 단계로 넘어가고, 화학 AI인 켐리즈너(ChemReasoner)는 화학 시뮬레이션 결과를 보고 아이디어를 수정한다. 노벨시크(NovelSeek)는 사람의 조언을 받을 때마다 코드와 계획을 고쳐나간다. 이런 방식으로 AI는 완전히 새로 학습하지 않아도 점점 더 나은 판단을 내릴 수 있게 된다. 각자 맡은 일 따로 있는 AI 팀: 협력으로 복잡한 문제 해결 혼자보다 여럿이 힘을 합치면 더 어려운 일을 해낼 수 있다. AI도 마찬가지다. 여러 AI가 각자 다른 역할을 맡아 협력하면 훨씬 복잡한 문제를 풀 수 있다. 관리자 AI는 전체 계획을 세우고, 실행자 AI는 실제 작업을 하며, 검증자 AI는 결과를 확인한다. 메타GPT(MetaGPT)는 소프트웨어 개발을 제품 기획자, 설계자, 프로그래머 AI로 나눠서 처리하고, 챗Dev(ChatDev)는 각 전문 AI들이 대화하며 요구사항 분석부터 코딩, 테스트까지 진행한다. AI의 역할은 크게 두 종류로 나뉜다. 먼저 일반적인 역할이 있다. 리더 AI는 전체 목표를 정하고 일을 나눠 맡기며 의견이 엇갈릴 때 조정한다. 작업자 AI는 실제로 도구를 쓰고 코드를 작성하며 정보를 찾는다. 평가자 AI는 결과가 정확한지 확인하고 위험을 찾아낸다. 기억 담당 AI는 중요한 정보를 오래 보관하고 관리한다. 소통 담당 AI는 다른 AI들이 효율적으로 정보를 주고받게 돕는다. 분야별로 특화된 역할도 있다. 소프트웨어 개발에서는 시스템 설계자, 코드 작성자, 검토자, 자동화 담당자, 배포 관리자로 나뉜다. 의료 분야의 MDAgents는 진료 난이도에 따라 AI 팀 구성을 자동으로 조정하고, 닥터에이전트-RL(DoctorAgent-RL)은 의사-환자 대화를 학습으로 개선한다. AI들이 각자 맡은 분야를 전문적으로 처리하고 서로 결과를 검토하면서, 혼자서는 해결하기 어려운 복잡한 문제도 풀어낼 수 있다. 실험실에서 병원까지: 현실에서 일하기 시작한 AI 에이전트들 이런 AI 기술은 이미 여러 분야에서 실제로 쓰이고 있다. 수학 문제 풀이, 프로그래밍, 과학 연구, 로봇, 의료, 인터넷 검색 등 다양한 영역에서 활약 중이다. 과학 분야의 켐크로우(ChemCrow)는 여러 화학 도구를 자동으로 연결해서 화학 물질 합성 과정을 스스로 진행한다. 켐매트에이전트(CheMatAgent)는 100개가 넘는 화학 및 재료 관련 도구를 다루면서, 어떤 도구를 선택하고 어떻게 사용할지를 학습한다. 의료 분야에서도 활용도가 높다. 에이전트클리닉(AgentClinic)은 가상 병원 환경에서 환자 증상과 의료 영상을 보고 진단을 내린다. EHR에이전트(EHRAgent)는 환자의 전자 진료 기록을 분석해서 진단 코드를 예측하고 약물 치료를 제안한다. 다이나미케어(DynamiCare)는 환자 상태가 변하면 즉시 치료 계획을 수정하고, 메드에이전트짐(MedAgentGym)은 만든 코드를 실행해 보고 점수를 매겨서 정확도를 높인다. 인터넷을 자동으로 검색하는 AI도 발전했다. 웹아레나(WebArena)는 쇼핑몰과 예약 사이트 같은 실제 웹사이트 90개 이상을 AI가 사용할 수 있는지 시험한다. 비주얼웹아레나(VisualWebArena)는 화면을 보고 어디를 클릭해야 할지 판단하는 능력까지 평가한다. 에이전트Q(Agent Q)는 여러 경로를 미리 생각해 보고 가장 좋은 방법을 선택하며, 스스로 판단의 문제점을 찾아 개선한다. 기업이 AI 에이전트로 얻을 수 있는 5가지 기회 이번 연구가 제시한 AI의 3단계 진화는 단순한 이론이 아니라 기업의 실제 전략에 중요한 힌트를 준다. 첫째, 기본적인 에이전트 능력은 이미 실용화됐다. 오픈핸즈(OpenHands) 같은 시스템이 생각하고, 계획하고, 테스트하는 과정을 하나로 묶어서 처리하고 있으며, 이는 기업의 코드 작성과 자동화 업무에 바로 쓸 수 있다. 둘째, 스스로 배우는 능력이 AI 시스템의 수명을 결정한다. 기존 AI는 한 번 배우면 그게 끝이었지만, 기억과 피드백 기능을 가진 AI는 일하면서 계속 나아진다. 특히 고객 상담, 의료 진단, 법률 자문처럼 계속 새로운 지식이 쌓여야 하는 분야에서 경쟁력을 높여줄 것이다. 셋째, 여러 AI의 협력이 복잡한 업무 자동화의 핵심이다. 한 AI가 모든 것을 다 하는 것보다 각자 전문 분야를 맡은 AI들이 팀을 이루는 게 효과적이다. 메타GPT의 소프트웨어 개발 사례는 기획부터 코딩, 테스트까지 전 과정을 AI 팀으로 자동화할 수 있음을 보여준다. 기업이 AI를 도입할 때는 하나의 솔루션이 아니라 AI 생태계를 구축하는 관점으로 접근해야 한다. 넷째, 앞으로 중요해질 개인 맞춤형 서비스, 장기 학습, 세계 모델링 능력이 차세대 AI 제품의 차별화 요소가 될 것이다. 사용자 중심 AI는 개인의 취향과 행동 방식을 배워서 맞춤형 서비스를 제공한다. 이는 일반 소비자 서비스뿐 아니라 기업용 솔루션에서도 사용자 경험을 바꿀 잠재력이 있다. 마지막으로, 안전 관리 체계는 AI를 실제 환경에 투입하기 전에 반드시 갖춰야 한다. 스스로 판단하는 AI는 예상 못 한 행동을 할 수 있으며, 특히 의료나 금융 같은 중요한 분야에서는 안전장치와 모니터링이 필수다. 가드에이전트(GuardAgent) 같은 안전 시스템이 이미 연구되고 있으며, 기업은 AI 도입 초기부터 이런 안전장치를 설계에 포함해야 한다. FAQ ( ※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.) Q1. 에이전트 AI가 뭔가요? 기존 AI랑 뭐가 다른가요? A. 에이전트 AI는 질문에 답만 하는 게 아니라 스스로 계획을 세우고, 필요한 도구를 찾아 쓰며, 환경과 계속 소통하면서 배우는 AI입니다. 기존 AI가 "질문 → 답변"으로 끝났다면, 에이전트 AI는 "목표 설정 → 계획 수립 → 실행 → 결과 확인 → 학습"의 전 과정을 스스로 진행합니다. 마치 사람처럼 일을 처리하는 거죠. Q2. 스스로 배우는 AI는 어떻게 작동하나요? A. 두 가지 방법으로 학습합니다. 첫째, 기억 시스템을 통해 과거 경험을 저장하고 나중에 다시 활용합니다. 둘째, 자기 평가 기능으로 자신이 한 일을 스스로 검토하고 개선점을 찾습니다. 예를 들어, 화학 실험 AI가 실험에 실패하면 그 내용을 기억해뒀다가 다음번엔 같은 실수를 안 합니다. 사람이 경험으로 배우는 것과 비슷합니다. Q3. 여러 AI가 협력한다는 게 기업에서 어떻게 쓰이나요? A. 복잡한 일을 역할별로 나눠서 처리합니다. 소프트웨어 개발을 예로 들면, 설계 담당 AI가 전체 구조를 짜고, 코딩 AI가 프로그램을 만들고, 검토 AI가 오류를 찾아냅니다. 의료 분야에서는 진단 AI, 치료 계획 AI, 환자 상태 모니터링 AI가 팀을 이뤄 종합적인 의료 서비스를 제공할 수 있습니다. 각자 잘하는 일을 맡아서 하니까 더 좋은 결과가 나옵니다. ■ 이 기사는 AI 전문 매체 'AI 매터스'와 제휴를 통해 제공됩니다. 기사는 클로드 3.5 소네트와 챗GPT를 활용해 작성되었습니다. (☞ 기사 원문 바로가기)

2026.01.26 19:45AI 에디터

사이냅소프트, '사이냅 OCR IX' 출시…VLM과 AI 에이전트 결합

사이냅소프트(대표 전경헌)가 고도의 문맥 이해가 필요한 비정형 비즈니스 문서 시장에서의 인공지능(AI) 전환(AX)을 본격적으로 주도할 예정이다. 사이냅소프트는 시각 언어 모델(VLM)과 AI 에이전트 기술을 결합한 '사이냅 OCR IX'를 출시한다고 26일 밝혔다. 사이냅 OCR IX의 핵심은 AI 에이전트가 문서의 유형과 처리량에 따라 VLM, KVT, 폼메이커 중 최적의 엔진을 자동으로 선택하는 '에이전틱 OCR' 솔루션이다. 기존 사이냅 OCR의 TTA 인증 99.3% 한글 인식률을 유지하면서 새롭게 결합된 세 가지 엔진이 상호 보완하며 운영 효율을 극대화한다. 사이냅 OCR IX에 새로 결합된 VLM은 사전 학습 없이 신규 양식을 바로 처리할 수 있어 도입 기간을 단축하고 비정형 문서에서도 맥락을 파악해 데이터를 정확히 추출한다. 기존 사이냅 OCR의 텍스트 인식 기술과 결합해 VLM만 사용했을 때의 환각 현상을 방지하고 오인식을 최소화한 것이 특징이다. 데이터가 축적되면 KVT로 전환해 처리 속도를 높이고 운영 비용을 절감할 수 있으며, 주민등록증이나 운전면허증 같은 표준 서식은 폼메이커로 초고속 처리가 가능하다. 사이냅 OCR IX는 세금계산서, 거래명세서, 견적서 등 비정형 비즈니스 문서부터 표준 서식까지 폭넓게 적용할 수 있는 실질적인 솔루션을 완성했다. 사이냅소프트 전경헌 대표는 "OCR IX는 25년간 축적한 문서 처리 기술에 AI 에이전트 개념을 결합해 도입부터 운영까지 최적의 성능을 제공하는 솔루션"이라며 "200건 이상의 실적으로 입증된 인식 정확도에 VLM의 유연성을 더해, 도입부터 확장까지 기업의 업무 환경에 가장 최적화된 도큐먼트 AI 모델을 구현했다"고 전했다.

2026.01.26 17:12남혁우 기자

챗GPT '잘 쓰는 사람 vs 못 쓰는 사람' 실력 차이 7배…어느 쪽?

챗GPT를 만든 오픈AI가 충격적인 분석 결과를 내놨다. 같은 돈을 내고 똑같은 서비스를 쓰는데도, 어떤 사람은 7배 더 많은 기능을 활용한다는 것이다. 국가별로 봐도 차이는 3배에 달했다. AI 기술은 빠르게 발전하는데, 정작 대부분의 사람들은 그 능력의 일부만 쓰고 있다는 의미다. 해당 리포트에 따르면, 오픈AI는 이런 현상을 '역량 격차'라고 부르며, 이 문제를 해결하지 않으면 AI 시대의 혜택이 소수에게만 돌아갈 수 있다고 경고했다. AI는 7개월마다 2배씩 똑똑해지는데, 우리는 여전히 '초보' 수준 AI의 능력은 약 7개월마다 2배씩 성장하고 있다. 2022년에 챗GPT는 전문가가 1분 정도 걸리는 일을 할 수 있었다. 지금은 30분 이상 걸리는 복잡한 일도 처리할 수 있다. 하지만 대부분의 사람들은 여전히 간단한 질문만 던지고 있다. 오픈AI는 월 2만 원짜리 요금제를 쓰는 사람들을 조사했다. 그 결과, 상위 5%에 속하는 '파워 유저'는 평균적인 사용자보다 7배 더 많이 AI의 고급 기능을 활용하는 것으로 나타났다. 여기서 '고급 기능'이란 AI가 복잡한 문제를 풀 때 동원하는 '생각하는 능력'을 말한다. 어려운 질문일수록 AI는 더 깊이 생각해서 답을 내놓는다. 더 놀라운 건 오픈AI 직원들의 활용 수준이다. 오픈AI 직원들은 일반 사용자보다 무려 15배나 더 많은 고급 기능을 쓴다. 이는 단순히 질문하고 답을 받는 수준을 넘어, 실제 업무에 깊숙이 AI를 활용하고 있다는 뜻이다. 오픈AI는 이런 차이가 "AI를 쓸 수 있느냐"의 문제가 아니라 "AI를 어떻게 활용하느냐"의 문제라고 지적했다. 국가별로도 3배 차이... 의외의 강자는 베트남과 파키스탄 챗GPT 사용자가 많은 70개 이상의 나라를 비교했더니, 나라마다 AI 활용 수준이 크게 달랐다. 앞서가는 나라는 뒤처진 나라보다 1인당 3배나 더 많은 고급 기능을 사용했다. 미국과 인도는 사용자 수가 가장 많았고, 싱가포르와 네덜란드는 인구 대비 사용 비율이 가장 높았다. 그런데 흥미로운 사실이 있다. 부자 나라만 AI를 잘 쓰는 게 아니었다. 베트남과 파키스탄은 '에이전트 도구'라는 최첨단 기능 사용에서 세계 최상위권에 올랐다. 이는 AI 활용 능력이 반드시 경제 규모나 소득 수준과 비례하지 않는다는 걸 보여준다. 일의 종류별로도 차이가 컸다. 가장 큰 차이를 보인 건 '코딩(프로그래밍)' 분야였다. 1등 국가인 싱가포르는 평균 국가보다 3배 이상 많은 코딩 관련 질문을 했다. 반면 정보 검색이나 그림 만들기 같은 쉬운 기능은 나라별 차이가 작았다. 선두 국가도 평균보다 46% 정도만 더 많이 썼다. 도구별로도 비슷한 패턴이 나타났다. 데이터 분석, 앱 연결, 코딩 도구, 자동 작업 등 고급 기능은 선두 국가가 평균보다 2~4배 더 많이 사용했다. 베트남은 데이터 분석을 평균 국가보다 4배나 더 많이 썼다. 반면 음성 대화, 그림 만들기, 검색 같은 쉬운 기능은 나라별 차이가 작았다. 11개국과 손잡은 오픈AI... 교육부터 재난 대응까지 전방위 지원 오픈AI는 이런 격차를 줄이기 위해 2025년 '국가를 위한 AI(OpenAI for Countries)' 프로그램을 시작했다. 전 영국 재무장관이 이끄는 이 프로그램은 각 나라 정부가 AI를 국민에게 제대로 보급할 수 있도록 돕는다. 교육, 의료, AI 기술 교육, 사이버 보안, 재난 대응, 창업 지원 등 다양한 분야를 지원한다. 현재 아르헨티나, 호주, 에스토니아, 독일, 그리스, 아일랜드, 이탈리아, 노르웨이, 한국, UAE, 영국 등 11개국이 오픈AI와 협력하고 있다. 이들 국가의 인구를 합치면 3억 5천만 명이 넘고, 경제 규모는 15조 달러가 넘는다. 교육 분야에서 에스토니아가 좋은 예다. 에스토니아는 전국 모든 중고등학교에 챗GPT를 도입했다. 선생님의 60% 이상이 매주 챗GPT를 써서 수업을 준비하고, 숙제를 채점하고, 창의적인 수업을 만든다. 학생들도 안전하게 최신 AI를 쓸 수 있게 됐다. 창업 지원도 활발하다. 그리스는 'AI 창업 프로그램'을 통해 새로운 창업자들을 돕고 있다. 오픈AI의 기술과 자금을 제공하고, 오픈AI 엔지니어들이 직접 조언을 해준다. 아일랜드는 정부와 협력해서 중소기업과 젊은 창업자들이 AI를 배우고 활용할 수 있도록 실습 교육을 제공한다. 재난 대응과 의료까지... AI를 '전기'처럼 필수 인프라로 오픈AI는 사이버 범죄와 사기로부터 국민을 보호하는 프로그램도 진행 중이다. 정부 기관이 AI 기반 보안 시스템을 만들고 활용할 수 있도록 돕는다. 재난 대응 분야에서는 한국 수자원공사(K-water)와 협력을 검토하고 있다. 수자원공사의 데이터와 경험에 오픈AI의 최신 AI 기술을 결합해서, 홍수나 가뭄 같은 물 재해를 미리 예측하고 대응하는 시스템을 만들 계획이다. 의료 분야에서는 최근 출시된 '챗GPT 헬스'를 기반으로 정부 및 병원과 협력하고 있다. AI가 사람들이 건강 정보를 더 잘 이해하도록 돕고, 병원이 더 많은 환자를 효율적으로 돌볼 수 있게 하는 게 목표다. 안전과 개인정보 보호를 최우선으로 한다. 인프라 구축도 중요하다. 노르웨이는 수력 발전으로 돌아가는 친환경 AI 센터를 만들고 있다. 이는 유럽의 첫 오픈AI 인프라 시설이다. 한국은 삼성과 SK와 협력해서 AI 개발에 필요한 컴퓨팅 능력을 확보할 예정이다. UAE는 중동 최대 규모의 AI 인프라를 구축한다. 오픈AI는 "AI는 지능 시대의 전기나 인터넷 같은 것"이라며 "기회를 잡는 나라는 경제적으로나 사회적으로 앞서 나갈 것"이라고 강조했다. 실제로 독일에서는 지난 1년간 챗GPT 사용이 5배 늘었다. 거의 모든 젊은이가 매주 챗GPT를 쓴다. 한국도 2,500만 명이 넘는 사람들이 매달 챗GPT를 공부, 일, 창작에 활용하고 있다. 한국도 '양'에서 '질'로 도약해야 할 때 오픈AI 보고서는 한국이 월 2,500만 명 이상이 챗GPT를 쓰는 선진국임을 보여준다. 하지만 숫자만으로는 부족하다. 대부분의 사람들이 AI를 검색이나 간단한 질문에만 쓰는 동안, 소수의 파워 유저는 7배 더 많은 고급 기능으로 실제 생산성을 높이고 있다. 한국은 세계 최고 수준의 인터넷과 높은 교육 수준을 갖췄다. 하지만 AI를 깊이 있게 활용하는 체계적인 교육이 부족하다. 에스토니아처럼 전국 학교에 AI 교육을 도입하거나, 그리스처럼 국가 차원의 창업 지원 프로그램을 만드는 것을 참고할 만하다. 특히 수자원공사와의 협력 가능성이 언급된 만큼, 정부와 기업이 함께 재난 대응, 의료, 교육 등에서 AI를 실제로 활용해야 한다. 더 중요한 것은 'AI를 쓸 수 있다'를 넘어 'AI를 잘 쓴다'로 가는 것이다. AI 도구를 쓸 수 있다는 것만으로는 부족하다. 실제 일터에서 AI를 효과적으로 활용할 수 있는 능력과 의지를 키워야 한다. 이를 위해 직업별, 업종별 맞춤 AI 교육과 자격증이 필요하다. 오픈AI가 유럽, 캐나다, 호주, UAE에서 시작하는 AI 교육 프로그램에 한국도 적극 참여해서, 기업들이 인정하는 실전 능력을 키워야 한다. AI 시대의 경쟁력은 기술을 아는 것이 아니라 기술을 쓸 줄 아는 것에서 나온다. FAQ (※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.) Q1. '역량 격차'가 뭔가요? A. AI가 실제로 할 수 있는 일과 사람들이 실제로 시키는 일 사이의 차이를 말한다. 지금 AI는 전문가가 30분 넘게 걸리는 복잡한 일도 할 수 있다. 하지만 대부분의 사람들은 간단한 질문만 한다. 이런 차이가 줄어들지 않으면, AI의 혜택이 소수의 '고수'에게만 돌아갈 수 있다. Q2. 챗GPT를 더 잘 쓰려면 어떻게 해야 하나요? A. 질문만 하지 말고 일을 맡겨야 한다. 데이터 분석, 코딩, 심층 조사 같은 고급 기능을 적극 써보자. 반복되는 일을 위한 나만의 GPT를 만드는 것도 좋다. 오픈AI 조사에 따르면 이런 고급 기능을 쓰는 사람들이 시간을 훨씬 많이 절약했다. Q3. 나라 차원에서 AI 격차를 줄이려면? A. 학교에서 AI 교육을 하고, 실무에서 바로 쓸 수 있는 AI 교육 프로그램을 만들어야 한다. 창업자들을 지원해서 AI 기반 회사를 키우고, 정부가 먼저 AI를 써서 행정 효율을 높이는 것도 중요하다. 민간 기업과 협력해서 의료, 재난 대응, 보안 등 다양한 분야에서 AI를 활용해야 한다. ■ 이 기사는 AI 전문 매체 'AI 매터스'와 제휴를 통해 제공됩니다. 기사는 클로드 3.5 소네트와 챗GPT를 활용해 작성되었습니다. (☞ 기사 원문 바로가기)

2026.01.26 08:36AI 에디터

"14년 뒤 로봇이 사람보다 많아진다"…머스크의 충격적 예언

세계에서 가장 부자인 일론 머스크가 처음으로 스위스 다보스에서 열린 세계경제포럼에 모습을 드러냈다. 그는 이 자리에서 "미래에는 로봇이 사람보다 많아질 것"이라는 전망을 내놨다. CBS 뉴스에 따르면 일론 머스크는 22일(현지 시각) 세계 최대 자산운용사 블랙록(BlackRock)의 최고경영자 래리 핑크(Larry Fink)와 인터뷰를 가졌다. 재산이 6,770억 달러(약 993조 원)에 달하는 머스크는 지난해 트럼프 정부에서 정부 효율성을 높이는 부서를 이끌기도 했다. 머스크는 자신이 운영하는 전기차 회사 테슬라와 우주 탐사 회사 스페이스X의 목표에 대해 설명했다. 그는 테슬라가 로봇 기술 개발을 통해 "지속 가능한 풍요로운 삶"을 만들겠다고 밝혔다. 테슬라는 현재 옵티머스라는 이름의 사람 모양 로봇과 스스로 운전하는 택시를 개발하고 있다. 머스크는 "로봇 기술과 AI가 모든 사람을 풍요롭게 만드는 진짜 방법"이라고 강조했다. 그는 "사람들이 전 세계 가난 문제를 해결하자고 자주 말하는데, 모든 사람에게 높은 생활 수준을 주는 유일한 방법은 AI와 로봇"이라고 말했다. 그는 로봇이 '어디서나 볼 수 있는' 수준이 되면 "세계 경제가 폭발적으로 성장할 것"이라고 내다봤다. 머스크는 "로봇이 사람보다 많아질 것"이라며, 사람 모양 로봇이 젊은 사람이 부족한 미래에 노인을 돌보는 데 도움이 될 수 있다고 덧붙였다. 로봇을 언제쯤 쓸 수 있느냐는 질문에 머스크는 테슬라의 옵티머스 로봇이 현재 "공장에서 간단한 일을 하고 있다"고 답했다. 그는 "올해 말까지는 더 복잡한 일을 할 수 있을 것이고, 아마 내년 말쯤에는 일반 사람들에게 사람 모양 로봇을 팔 수 있을 것"이라고 전망했다. 그러면서 "신뢰성이 충분히 높아지면 기본적으로 원하는 모든 일을 시킬 수 있을 것"이라고 설명했다. 영국 투자은행 바클레이스(Barclays)에 따르면, 사람 모양 로봇 시장은 현재 20억 달러(한화 약 2조 9천억) 규모다. 하지만, 이 은행은 AI 로봇이 제조업 같은 사람이 많이 필요한 분야에 들어가면서 2035년까지 최소 400억 달러(한화 약 58조 7천 원), 많게는 2,000억 달러(한화 약 293조 원)까지 커질 것으로 예상했다. 머스크는 스스로 운전하는 자동차에 대해서도 긍정적인 전망을 내놨다. 그는 "스스로 운전하는 자동차는 이제 본질적으로 해결된 문제"라며 "테슬라는 몇몇 도시에서 로봇 택시를 시작했고, 올해 말까지 미국 전역에서 많이 볼 수 있을 것"이라고 밝혔다. 또한 "다음 달에 유럽에서 승인을 받기를 바라며, 중국도 비슷한 시기가 될 것으로 기대한다"고 덧붙였다. 머스크는 그동안 다보스 포럼을 강하게 비판해왔다. 2023년에는 이 행사가 "사람들이 원하지도 않는, 선출되지도 않은 세계 정부가 되어가고 있다"고 비난했다. 이번 주 다보스에는 트럼프 대통령, 프랑스 에마뉘엘 마크롱(Emmanuel Macron) 대통령, 유럽연합 집행위원회 우르줄라 폰데어라이엔(Ursula von der Leyen) 위원장을 포함한 여러 나라 정상과 기업 대표들이 참석했다. ■ 이 기사는 AI 전문 매체 'AI 매터스'와 제휴를 통해 제공됩니다. 기사는 클로드 3.5 소네트와 챗GPT를 활용해 작성되었습니다. (☞ 기사 원문 바로가기)

2026.01.23 14:20AI 에디터

실험실에선 천재, 현실에선 바보…AI 성능 80% 급락의 진실, 해결책은

KAIST와 LG AI 연구원이 충격적인 연구 결과를 발표했다. 해당 논문에 따르면, AI가 무관한 정보가 섞인 환경에서 최대 80%까지 틀린 답변을 내놓는다는 것이다. 실험실에서는 완벽해 보였던 AI가 실제 사용 환경에서는 심각한 문제를 일으킬 수 있다는 경고다. 실험실에서만 똑똑한 AI, 현실에서는 혼란 연구팀은 '노이지벤치'라는 새로운 테스트 방법을 만들었다. 기존 AI 테스트가 깨끗하게 정리된 정보만 주었다면, 이번에는 실제 상황처럼 쓸데없는 정보를 섞어서 테스트했다. 예를 들어 질문과 전혀 상관없는 문서를 함께 주거나, 이전 대화 내용을 뒤섞거나, 정답처럼 보이지만 사실은 틀린 정보를 제공했다. 결과는 충격적이었다. 구글의 제미나이 2.5 프로는 깨끗한 환경에서 77.8%의 정확도를 보였지만, 헷갈리는 정보가 섞이자 48%로 떨어졌다. 더 심각한 경우도 있었다. 딥시크 AI 모델은 정확도가 무려 80% 이상 떨어져서 사실상 사용할 수 없는 수준이 됐다. 이는 AI가 겉으로는 관련 있어 보이는 틀린 정보에 쉽게 속는다는 뜻이다. 더 놀라운 건 악의적인 공격이 없어도 문제가 생긴다는 점이다. 그냥 무관한 문서나 대화 기록만 섞여도 AI의 판단력이 크게 흐려졌다. 제미나이 2.5 프로는 편향을 측정하는 테스트에서 무작위로 섞인 정보 때문에 정확도가 94%에서 60%로 급락했다. 연구팀은 이를 일반적인 노이즈만으로도 AI의 안전장치가 무너질 수 있다는 증거라고 설명했다. AI에게 도구를 주면 오히려 역효과 연구팀은 AI에게 검색 기능이나 계산기 같은 도구를 제공하는 방식도 테스트했다. 보통 이런 도구들은 AI 성능을 높여준다고 알려져 있다. 실제로 깨끗한 환경에서는 도구가 도움이 됐다. 하지만 쓸데없는 정보가 섞인 환경에서는 오히려 독이 됐다. 도구를 사용한 AI가 기본 AI보다 더 나쁜 성능을 보인 것이다. 이유는 간단하다. AI는 도구가 제공하는 정보를 믿도록 설계되어 있다. 그래서 잘못된 정보가 섞여 있어도 그대로 받아들인다. 게다가 AI가 여러 단계를 거쳐 문제를 해결하다 보면, 초반에 잘못 받아들인 정보가 다음 단계로 계속 전달되면서 오류가 눈덩이처럼 커진다. 여기에 AI가 엉뚱한 정보 때문에 도구를 잘못 선택해서 쓸데없는 정보를 더 많이 가져오는 악순환까지 생긴다. 연구팀은 "도구는 깨끗한 환경에서는 좋지만, 노이즈가 있는 환경에서는 AI가 쓸데없는 정보를 너무 많이 가져다 쓰면서 오히려 더 취약해진다"고 지적했다. 앞으로 AI 시스템은 잘못된 정보를 걸러낼 수 있는 장치가 꼭 필요하다는 설명이다. 새로운 학습법으로 성능 3배 향상 연구팀은 '레어(RARE)'라는 새로운 학습 방법을 제안했다. 기존 방식은 AI가 정답을 맞췄는지만 평가했다. 하지만 레어는 AI가 답을 찾아가는 과정 자체를 평가한다. AI가 쓸데없는 정보 속에서 진짜 필요한 정보를 잘 찾아냈는지를 보고 점수를 준다는 뜻이다. 실험 결과는 놀라웠다. 한 모델의 경우 기존 방식으로는 38% 정확도였지만, 레어를 적용하자 55%로 올라갔다. 더 극적인 경우도 있었다. 원래 6%밖에 못 맞추던 모델이 레어를 쓰자 25%까지 올라가면서 무려 300% 이상 개선됐다. 레어가 효과적인 이유는 명확했다. 학습 과정을 분석해 보니, 레어는 AI가 쓸데없는 정보에 혼란스러워하는 비율을 계속 낮췄다. 동시에 정답률도 올라가서, 결과만 보고 학습한 AI보다 최종 성능이 훨씬 좋았다. 연구팀은 "앞으로 AI를 학습시킬 때는 정답만이 아니라 생각하는 과정 자체를 평가해야 한다"고 강조했다. 많이 생각한다고 좋은 게 아니다 연구팀은 놀라운 발견을 했다. 보통은 AI가 더 오래 생각할수록 정확도가 높아진다고 여겨진다. 하지만 쓸데없는 정보가 섞인 환경에서는 정반대였다. AI가 생각을 많이 할수록 오히려 정확도가 떨어졌다. 노이즈를 더 오래 분석할수록 잘못된 해석을 하게 되는 것이다. 또 다른 발견은 쓸데없는 정보가 많을수록 AI가 점점 더 확신 없는 답변을 한다는 점이다. 연구팀이 헷갈리는 정보를 0개에서 10개까지 늘려가며 실험한 결과, 정보가 많아질수록 AI의 불확실성 지표가 계속 올라갔다. AI가 점점 더 혼란스러워한다는 뜻이다. 가장 흥미로운 건 AI가 어디에 집중하는지를 분석한 결과다. 연구팀은 AI가 정보를 처리할 때 어떤 부분에 주목하는지 측정했다. 틀린 답을 낸 AI는 쓸데없는 정보에 과도하게 집중했다. 반면 올바른 답을 낸 AI는 그런 정보를 적게 봤다. 이는 AI가 방해 정보를 걸러내지 못하고 그대로 따라간다는 증거다. 연구팀은 또한 헷갈리는 정보와 질문이 비슷해 보일수록 AI가 더 오래 생각하지만 정확도는 떨어진다는 사실을 발견했다. AI가 관련성을 확인하려고 애쓰지만, 결국 쓸데없는 정보에 속아 넘어가는 것이다. 흥미롭게도 AI의 답변 길이는 방해 정보의 길이와 거의 관계가 없었다. 이는 AI가 단순히 입력이 길어서가 아니라, 헷갈리는 내용 때문에 혼란스러워한다는 뜻이다. AI 개발 방향을 바꿔야 할 때 이번 연구는 AI 업계에 중요한 메시지를 던진다. 첫째, 실험실 테스트만으로는 AI의 진짜 능력을 알 수 없다. 깨끗한 환경에서 높은 점수를 받았다고 해서 실제로도 잘 작동한다는 보장이 없다. 특히 병원이나 금융회사처럼 중요한 곳에서 AI를 쓸 때는 노이즈에 강한지 반드시 확인해야 한다. 둘째, AI를 단순히 크게 만드는 것만으로는 한계가 있다. 연구팀이 여러 크기의 AI를 테스트한 결과, 크기가 커질수록 노이즈에 조금 더 강해지긴 했지만 그 효과가 크지 않았다. 특히 일정 크기 이상부터는 개선 효과가 거의 없었다. 이는 크기를 키우는 것보다 잘못된 정보를 걸러내는 능력을 키우는 게 더 중요하다는 뜻이다. 셋째, 프롬프트를 잘 작성하거나 정보를 잘 정리하는 기존 방법들도 큰 도움이 안 됐다. 연구팀이 여러 최신 기법을 시험했지만, 노이즈 환경에서는 효과가 거의 없었다. 이런 기법들도 결국 AI에 의존하다 보니 똑같이 노이즈에 취약했다. 넷째, 한국 AI 연구진의 성과가 주목받고 있다. KAIST와 LG AI 연구원이 만든 이번 해결책은 간단하면서도 효과적이어서, 전 세계 AI 개발에 널리 쓰일 가능성이 크다. 이는 한국이 AI 기술을 그냥 쓰기만 하는 게 아니라 직접 만들고 개선하는 단계에 올라섰다는 증거다. FAQ (※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.) Q1. 노이지벤치가 기존 AI 테스트와 어떻게 다른가요? A. 기존 테스트는 깨끗하게 정리된 정보만 줘서 AI가 실제보다 더 똑똑해 보이게 만들었습니다. 노이지벤치는 실제 상황처럼 무관한 문서, 엉뚱한 대화 기록, 헷갈리는 정보를 섞어서 AI의 진짜 실력을 측정합니다. 이를 통해 AI가 실험실이 아닌 현실에서 얼마나 제대로 작동하는지 알 수 있습니다. Q2. 레어라는 새 학습법은 어떻게 AI를 개선하나요? A. 레어는 AI가 정답을 맞췄는지만 보는 게 아니라, 답을 찾는 과정 자체를 평가합니다. 쓸데없는 정보 속에서 필요한 정보를 제대로 찾아냈을 때 보상을 줘서, AI가 방해 정보를 걸러내고 핵심만 보도록 가르칩니다. 실험에서 일부 AI는 이 방법으로 정확도가 3배 이상 올라갔습니다. Q3. 일반 사용자에게 어떤 의미가 있나요? A. 지금 쓰는 AI 챗봇이 복잡한 상황에서 생각보다 훨씬 많이 틀릴 수 있다는 뜻입니다. 특히 여러 정보를 종합해야 하거나, 대화가 길어지거나, 비슷해 보이지만 틀린 정보가 섞여 있을 때 AI가 엉뚱한 답을 할 가능성이 큽니다. 중요한 결정을 내릴 때는 AI 답변을 맹신하지 말고 반드시 확인해야 합니다. ■ 이 기사는 AI 전문 매체 'AI 매터스'와 제휴를 통해 제공됩니다. 기사는 클로드 3.5 소네트와 챗GPT를 활용해 작성되었습니다. (☞ 기사 원문 바로가기)

2026.01.23 10:41AI 에디터

증상 설명해주고 약 제조∙병원 예약까지... 아마존, 24시간 건강 어시스턴트 앱 출시

한밤중에 갑자기 건강이 걱정돼도 병원에 전화할 수 없어 답답했던 경험, 누구나 있을 것이다. 아마존 이 이런 고민을 해결해줄 AI 헬스 어시스턴트를 내놨다. 24시간 언제든 당신의 의료 기록을 읽고 건강 상담을 해주고, 필요하면 병원 예약까지 대신 잡아준다. 아마존 원메디컬(Amazon One Medical)이 21일(현지 시각) 공개한 '헬스 AI 어시스턴트(Health AI assistant)'는 당신의 과거 병력, 검사 결과, 복용 중인 약까지 다 파악하고 있다가 질문에 답해준다. "지난주 받은 혈액검사 결과가 뭘 의미하는 거지?" 같은 질문을 던지면, 당신의 건강 상태를 고려해서 쉽게 설명해준다는 것이다. 더 놀라운 건 단순히 답변만 하는 게 아니라는 점이다. 증상을 얘기하면 병원에 가야 할지, 집에서 쉬면 될지 판단해 주고, 병원에 가야 한다면 당일이나 다음 날 예약까지 알아서 잡아준다. 약 처방도 갱신해 주는데, 원하면 아마존 약국(Amazon Pharmacy)에서 바로 조제할 수 있다. "검사 결과 수치는 나왔는데 이게 정상인지 아닌지도 모르겠고, 의사한테 물어보자니 사소한 것 같아서 망설여진다"는 사람들에게는 유용할 것으로 보인다. AI가 당신의 의료 기록 전체를 보고 맥락을 파악하기 때문에, 여러 병원에서 받은 검사 결과를 일일이 설명할 필요가 없다. 물론 AI가 의사를 완전히 대체하는 건 아니다. 아마존 측은 "환자와 의사의 관계를 대체하는 게 아니라 보완하는 것"이라고 강조한다. 실제로 이 AI는 증상이 심각하다고 판단되거나 전문의의 진단이 필요하다 싶으면, 즉시 의료진과 연결해 준다. 응급 상황이나 민감한 건강 문제에 대한 안전 장치도 여러 개 마련했다고 한다. 원메디컬의 앤드류 다이아몬드(Andrew Diamond) 최고 의료 책임자는 "AI가 아무리 발전해도 시간을 두고 쌓은 환자와 의사의 관계는 절대 대체할 수 없다"면서 "AI는 일상적인 건강 관리를 돕고, 정말 의사가 필요한 순간에 빠르게 연결해 주는 역할을 한다"고 설명했다. 개인정보 유출 걱정도 있을 법하다. 아마존은 이 서비스가 미국 건강보험 이동성 및 책임에 관한 법(HIPAA)을 준수한다고 밝혔다. AI와 나눈 대화가 자동으로 의료 기록에 남지 않고, 건강 데이터는 암호화 기술로 보호되며, 개인 데이터를 판매하지 않는다는 게 아마존의 설명이다. 이 서비스를 쓰고 싶지 않은 사람은 앱에서 '홈' 버튼을 누르면 기존 방식대로 이용할 수 있다. 헬스 AI 어시스턴트는 아마존 베드락(Amazon Bedrock)의 AI 모델로 작동하며, 원메디컬 앱의 모든 회원이 사용할 수 있다. 아마존 프라임(Prime) 회원은 월 9달러(한화 약 1만 3천원)이나 연 99달러(한화 약 14만 5천원)에 원메디컬 멤버십을 추가할 수 있다. AI가 건강까지 관리하는 시대가 성큼 다가온 셈이다. 편리함과 개인정보 보호 사이에서 소비자들이 어떤 선택을 할지 주목된다. ■ 이 기사는 AI 전문 매체 'AI 매터스'와 제휴를 통해 제공됩니다. 기사는 클로드 3.5 소네트와 챗GPT를 활용해 작성되었습니다. (☞ 기사 원문 바로가기)

2026.01.22 16:22AI 에디터

챗GPT, '나이 감별' 시작... 너 몇 살이야? 묻지 않고 알아내는 이유

20일(현지 시각) 오픈AI가 챗GPT에 AI 기반 연령 예측 기능을 도입한다 밝혔다. 사용자의 접속 시간, 사용 패턴 등을 분석해 18세 미만으로 판단되면 폭력·자해·성적 콘텐츠 등을 자동으로 차단하는 시스템이다. 오픈AI에 따르면 이 기능은 사용자가 직접 나이를 밝히지 않아도 AI가 알아서 미성년자 여부를 판단한다. 계정을 만든 지 얼마나 됐는지, 주로 언제 접속하는지, 어떤 방식으로 사용하는지, 본인이 입력한 나이 정보 등을 종합적으로 분석한다. 회사는 이 과정에서 어떤 정보가 정확도를 높이는지 계속 학습하며 시스템을 개선한다고 밝혔다. 미성년자로 분류되면 어떤 콘텐츠가 막힐까. 잔인한 폭력 장면, 청소년에게 위험한 행동을 부추기는 챌린지 영상, 성적이거나 폭력적인 역할극, 자해 관련 내용, 극단적인 다이어트나 외모 비하를 조장하는 콘텐츠 등이 자동으로 차단된다. 오픈AI는 이런 기준이 아동 발달 전문가들의 의견과 학술 연구를 바탕으로 만들어졌다고 설명했다. 청소년은 성인과 달리 위험을 인식하거나 충동을 조절하는 능력이 아직 발달 중이라는 점을 고려했다는 것이다. 만약 성인인데 실수로 미성년자로 분류됐다면 간단하게 해결할 수 있다. 페르소나(Persona)라는 신원 확인 서비스에 셀카 사진을 보내면 나이를 확인받고 모든 기능을 다시 쓸 수 있다. 설정 메뉴에서 언제든 확인 가능하다. 부모들은 자녀의 챗GPT 사용을 더 세밀하게 관리할 수도 있다. 부모 통제 기능을 켜면 챗GPT를 못 쓰는 시간대를 정하거나, AI가 대화를 기억하는 기능을 끄거나, 자녀가 심한 스트레스를 받는 것 같으면 알림을 받을 수 있다. 이번 조치는 오픈AI가 앞서 발표한 '청소년 안전 청사진(Teen Safety Blueprint)'의 후속 작업이다. 회사는 출시 결과를 지켜보며 계속 정확도를 높여나갈 계획이라고 했다. 유럽연합(EU)에서는 현지 규정을 맞추느라 몇 주 뒤에 시작된다. 오픈AI는 이번 조치가 중요한 진전이지만 청소년 안전을 위한 노력은 계속될 것이라며, 미국심리학회(American Psychological Association) 등 전문 기관들과 협력하며 개선 사항을 공유하겠다고 밝혔다. ■ 이 기사는 AI 전문 매체 'AI 매터스'와 제휴를 통해 제공됩니다. 기사는 클로드 3.5 소네트와 챗GPT를 활용해 작성되었습니다. (☞ 기사 원문 바로가기)

2026.01.22 13:39AI 에디터

"이건 사람한테 물어봐야겠다"… AI 스스로 한계 인정하는 법 배웠다

미국 광고 기술 회사 제프르와 이스라엘 테크니온 공과대학 연구팀이 AI가 자신의 판단이 틀릴 가능성을 스스로 예측해 사람에게 도움을 청하는 시스템을 개발했다. 해당 논문에 따르면, 이 기술은 AI가 확신 있는 것만 처리하고, 헷갈리는 건 인간 전문가에게 넘김으로써 정확도를 높이면서도 비용을 대폭 줄인다. GPT-4o 미니, 사람 도움 요청 절반으로 줄였는데 정확도는 오히려 상승 연구팀이 만든 시스템의 핵심은 간단하다. AI가 콘텐츠를 검열할 때마다 "내 판단이 맞을 확률"을 동시에 계산한다. 이 확률이 낮으면 자동으로 사람 검토자에게 넘기고, 높으면 AI가 직접 처리한다. 오픈AI의 검열 데이터로 실험한 결과, GPT-4o 미니 모델은 사람에게 넘기는 비율을 37%에서 16%로 절반 이상 줄였다. 놀라운 건 정확도가 떨어진 게 아니라 오히려 81%에서 94%로 올랐다는 점이다. 즉, AI가 자신 있는 것만 골라서 처리하니 실수가 줄어든 것이다. 비용 절감 효과도 컸다. GPT-4o 미니는 운영 비용이 132달러에서 38달러로 71% 감소했다. 구글의 제미나 2.0 모델도 74달러에서 41달러로 41% 줄었다. 여기서 비용은 사람 검토자의 인건비와 AI 실수로 인한 예상 손실을 합친 금액이다. AI가 보내는 네 가지 신호... "헷갈려요" 인정하는 순간 포착 이 시스템은 AI가 내보내는 네 가지 신호를 종합 분석한다. 첫 번째는 AI가 답을 선택할 때 각 선택지에 부여하는 확률이다. 예를 들어 "유해함" 70%, "무해함" 25%라면 꽤 확신하는 것이지만, "유해함" 52%, "무해함" 48%라면 헷갈리는 것이다. 두 번째는 AI가 스스로 매기는 신뢰도 점수다. AI에게 "당신 답이 맞을 확률이 몇 퍼센트인가요?"라고 물으면 0~100점으로 답하게 한다. 또 "매우 낮음, 낮음, 보통, 높음, 매우 높음" 중 하나를 선택하게도 한다. 세 번째는 AI의 중간 사고 과정을 분석하는 것이다. AI가 답을 내기까지의 추론 과정을 단계별로 살펴보며 얼마나 일관되고 자신 있게 말하는지 측정한다. 다만 이 방식은 콘텐츠 검열에서는 오히려 AI를 과신하게 만들어 최종 버전에서는 제외됐다. 네 번째가 이번 연구의 핵심 혁신이다. AI가 단순히 "확신 없음"이라고만 말하는 게 아니라, 그 이유를 두 가지로 구분한다. "정보가 부족해서 모르겠어요"와 "규정 자체가 애매해서 모르겠어요"로 나눈다. "정보 부족"과 "규칙 애매함" 구분... 담당자 배정까지 자동화 AI가 이유를 구분하는 건 실무에서 큰 의미가 있다. "정보가 부족해서 모르겠다"고 하면 경험 많은 상급 검토자에게 배정한다. 예를 들어 동영상 화면이 흐릿하거나, 맥락 정보가 빠져있어서 판단하기 어려운 경우다. 반면 "규칙 자체가 애매해서 모르겠다"고 하면 검열 가이드라인을 업데이트하거나 AI 재교육의 신호로 활용한다. 예를 들어 어떤 표현이 지역에 따라 욕인지 아닌지 기준이 다른 경우, 회사 규정에 명확한 기준이 없는 경우다. 실제로 구글의 제미나이 모델에서 이 "이유 구분" 기능을 제거하자 비용이 눈에 띄게 올랐다. 이는 AI가 단순히 "잘 모르겠다"고만 하는 것보다, "왜 모르는지"까지 알려주는 게 훨씬 효율적임을 보여준다. 12개 언어 동영상 검열까지 성공... 텍스트 넘어 영상·음성도 분석 연구팀은 두 가지 데이터로 시스템을 검증했다. 첫째는 영어 텍스트 1,680개를 혐오 발언, 자해, 성적 콘텐츠, 폭력 등으로 분류하는 작업이다. 둘째는 12개 언어로 된 짧은 동영상 1,500개를 분석하는 작업이다. 동영상은 텍스트, 썸네일 이미지, 음성을 문자로 바꾼 대본, 영상 장면 등 네 가지 정보를 모두 활용했다. 영어 텍스트 검열에서는 모든 AI 모델이 기존 방식보다 좋은 성적을 냈다. GPT-4.1 미니와 GPT-4o의 정확도가 각각 88.79%에서 91.93%, 84.41%에서 91.35%로 올랐다. 더 복잡한 동영상 검열에서는 모델마다 차이가 있었다. GPT-4o 미니는 정확도가 85.71%에서 87.34%로, GPT-4o는 88.05%에서 91.42%로 향상됐다. 특히 제미나이 2.0은 69.85%에서 85.47%로 급등했다. 다만 중국의 큐웬이나 메타의 라마 같은 일부 오픈소스 모델은 전체 평균 정확도는 오르고 개별 케이스 정확도는 떨어지는 등 혼재된 결과를 보였다. 특별한 수학 기법으로 학습... 드물게 나오는 실수 케이스 집중 분석 이 시스템은 "리지 회귀"라는 통계 기법으로 학습한다. 복잡해 보이지만 원리는 단순하다. AI의 여러 신호들이 서로 비슷한 정보를 담고 있을 수 있는데, 이를 적절히 조절해서 중복을 피하고 안정적인 예측을 만든다. 가장 큰 어려움은 데이터 불균형이었다. AI의 판단은 보통 80퍼가 맞기 때문에 실수 상황은 20퍼에 불가하다. 따라서 AI가 "대부분 맞으니까 항상 맞다고 예측하자"는 식으로 학습할 위험이 있다. 연구팀은 이를 해결하기 위해 맞는 케이스를 적절히 줄이고, 드문 "확신 없음" 케이스는 모두 유지했다. 또한 실수의 비용을 더 높게 설정해서 시스템이 실수를 잡는 데 집중하도록 만들었다. 최종적으로 동영상 데이터는 훈련용 800개와 테스트용 300개로, 텍스트 데이터는 훈련용 3,500개와 테스트용 900개로 나눠 평가했다. 각 신호의 기여도 실험... 모든 신호가 서로 보완하며 작동 연구팀은 네 가지 신호 중 하나씩 제거하면서 각각의 중요도를 측정했다. 결과는 명확했다. 어떤 신호를 제거하더라도 성능이 떨어졌다. 이는 네 가지 신호가 각자 다른 측면을 보여주며 서로 보완한다는 뜻이다. 영어 텍스트 검열에서는 AI가 각 답변 선택지에 부여하는 확률 신호를 제거했을 때 비용이 가장 많이 올랐다. 이는 AI의 내부 확률 계산이 가장 강력한 단일 신호임을 보여준다. AI가 스스로 매기는 신뢰도 점수를 제거하면 비용이 약 5~15% 올랐다. 이는 AI의 자기 평가가 확률 계산으로는 잡히지 않는 추가 정보를 제공함을 의미한다. "정보 부족"과 "규칙 애매함"을 구분하는 신호는 단순한 예/아니오 정보인데도 비용 절감에 확실히 기여했다. 특히 제미나이 모델들에서 이 신호를 제거하자 비용이 뚜렷하게 증가했다. FAQ (※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.) Q1. 이 기술은 어떤 AI에 적용할 수 있나요? A. GPT-4o, 구글 제미나이, 메타 라마, 중국 큐웬 등 대부분의 대형 AI 모델에 적용 가능합니다. AI가 각 답변에 부여하는 확률 정보를 제공하기만 하면 되고, AI 내부 구조를 들여다볼 필요가 없어서 범용적입니다. 오픈소스와 상용 서비스 모두 사용할 수 있습니다. Q2. AI가 이유를 구분하는 게 왜 중요한가요? A. "정보가 부족해서 모른다"는 건 경험 많은 사람이 봐야 하고, "규칙이 애매해서 모른다"는 건 규칙을 고치거나 AI를 재교육해야 합니다. 이렇게 이유를 알면 적재적소에 자원을 배치하고 시스템을 빠르게 개선할 수 있습니다. 실제로 이 기능을 빼면 비용이 확실히 올라갑니다. Q3. 콘텐츠 검열 외에 다른 곳에도 쓸 수 있나요? A. 연구팀은 금융 사기 탐지, 법규 준수 검토, 의료 진단 보조 등 실수 비용이 큰 모든 분야에 적용 가능하다고 밝혔습니다. AI가 확신 없을 때 사람에게 도움을 청하는 구조는 사람과 AI가 협업하는 모든 상황에서 유용합니다. ■ 이 기사는 AI 전문 매체 'AI 매터스'와 제휴를 통해 제공됩니다. 기사는 클로드 3.5 소네트와 챗GPT를 활용해 작성되었습니다. (☞ 기사 원문 바로가기)

2026.01.21 21:21AI 에디터

"AI로 공부하면 바보 된다"…OECD 보고서 충격

세계 경제 전문 기관인 OECD가 충격적인 연구 결과를 발표했다. 인공지능 챗봇으로 공부하면 당장 성적은 오르지만, 실제로 머리에 남는 건 없다는 것이다. 오히려 AI 없이 공부한 학생보다 실력이 떨어진다. 전 세계 학생 대부분이 이미 챗GPT를 쓰고 있는 지금, OECD는 247페이지짜리 보고서를 통해 AI를 제대로 쓰는 방법을 제시했다. 터키 학생 실험이 밝힌 진실: 연습 때 127% 올랐는데 진짜 시험은 17% 떨어져 OECD 보고서가 소개한 터키 실험은 충격적이다. 터키 고등학생들이 수학 문제를 풀 때 GPT-4라는 AI를 사용했다. 일반 GPT-4를 쓴 학생들은 연습 점수가 48% 올랐고, 학습을 도와주도록 만든 GPT-4를 쓴 학생들은 무려 127%나 올랐다. 학생들과 부모들은 'AI가 정말 도움이 된다'고 생각했다. 하지만 진짜 시험이 시작되자 상황이 완전히 뒤집혔다. AI를 쓸 수 없는 시험에서 AI를 썼던 학생들은 AI를 전혀 안 쓴 학생들보다 17% 낮은 점수를 받았다. 겉으로는 공부를 잘하는 것 같았지만, 실제로는 실력이 늘지 않은 것이다. OECD는 학생들이 AI로 답을 쉽게 얻으면서 스스로 생각하는 과정을 건너뛰었고, 그래서 진짜 실력이 생기지 않았다고 설명했다. 중국 대학생 연구에서도 비슷한 결과가 나왔다. AI로 영어 작문을 고친 학생들은 과제 점수는 높았지만, 실제 영어 실력 테스트에서는 전혀 나아지지 않았다. 더 문제는 자기가 어떻게 공부하고 있는지 스스로 점검하는 능력까지 떨어졌다는 점이다. 뇌를 관찰한 연구에서는 더 확실한 결과가 나왔다. 처음부터 AI를 쓴 학생들은 뇌가 덜 활발했고 기억력도 약했다. 반면 먼저 혼자 쓰고 나중에 AI로 확인한 학생들은 뇌가 활발하게 작동했다. 우리 동네 학생 10명 중 9명이 매일 쓴다... 부모들만 모르는 AI 시대 충격적인 건 이미 대부분 학생이 AI를 매일 쓰고 있다는 사실이다. OECD 보고서에 따르면 에스토니아에서 중학생의 74%, 고등학생의 90%가 공부할 때 AI를 쓴다고 답했다. 그중 70%가 챗GPT를 쓴다. 독일은 더 심하다. 대학생 2만 3천 명을 조사했더니 94%가 AI를 쓰고, 그중 65%는 매일 또는 매주 쓴다고 답했다. 유럽 7개 나라 12~17세 학생 7천 명을 조사한 결과를 보면 학생들이 어떻게 AI를 쓰는지 알 수 있다. 56%가 정보를 찾을 때, 45%가 어려운 개념을 이해할 때, 31%가 숙제 답을 얻을 때 AI를 썼다. 48%의 학생이 챗GPT를 쓴다고 답했고, 그중 절반은 선생님이 시켜서 썼다. 프랑스에서는 2023년 대학생의 55%만 AI를 썼는데, 2025년에는 82%로 급증했다. 2년 만에 27%포인트나 늘어난 것이다. 미국도 마찬가지다. 2023년 25~33%였던 중고등학생 AI 사용률이 2024년 50%, 2025년 68%로 가파르게 올랐다. 이제 AI 사용은 '일부 학생'이 아니라 '대부분 학생'의 현실이다. 독일 대학생들은 AI를 어떻게 쓸까. 33%가 매주 검색할 때, 26%가 아이디어를 떠올릴 때, 21%가 공부 파트너로, 19%가 요약할 때, 19%가 번역할 때 쓴다. 흥미로운 건 33%가 AI를 '함께 공부하는 친구'처럼 생각한다는 점이다. AI가 단순한 도구를 넘어섰다는 뜻이다. 선생님은 36%만 쓴다... "우리 선생님은 AI를 모른다"는 학생들 학생들과 달리 선생님들의 AI 사용률은 훨씬 낮다. OECD가 조사한 결과 중학교 선생님의 36%만 최근 1년간 AI를 썼다고 답했다. 나라별로도 차이가 크다. 싱가포르와 아랍에미리트에서는 75%가 쓰는 반면, 프랑스와 일본은 20%도 안 된다. 선생님들이 AI를 쓰는 방식도 제한적이다. 주로 수업 계획을 짤 때(53%), 학생 수준에 맞춰 자료를 만들 때(52%), 행정 일을 처리할 때(45%) 쓴다. 실제 수업 중에 쓰거나 학생들에게 AI 쓰는 법을 가르치는 경우는 매우 드물다. 초등학교 선생님들은 중학교보다 AI를 덜 쓰지만, 특수 교육이 필요한 학생을 돕거나 학생 수준에 맞는 자료를 만들 때는 더 적극적으로 쓴다. 대학에서는 상황이 다르다. 프랑스 조사에 따르면 대학교수의 80%가 이미 AI를 쓰고 있다. 주로 강의를 준비할 때(49%)와 시험 문제를 만들 때(26%) 쓴다. 52개 나라 대학교수 1,700명을 조사한 결과에서도 68%가 AI를 썼고, 그중 75%는 수업 자료를 만들 때, 24%는 학생 과제에 피드백을 줄 때 썼다. 에스토니아는 역설적인 상황을 보여준다. 고등학생의 90%가 AI를 쓰는데 고등학교 선생님은 50%만 쓴다. 학생이 선생님보다 AI를 더 많이, 더 잘 쓰는 현실에서 누가 교육을 이끌어야 할까라는 질문이 생긴다. "준비 시간 31% 줄고 합격률 9%p 올라"... 제대로 쓰면 선생님에게도 도움 AI가 무조건 나쁜 건 아니다. OECD 보고서는 제대로 만들어서 제대로 쓰면 선생님의 일도 줄이고 교육의 질도 높일 수 있다고 강조한다. 영국 중학교 과학 선생님들은 AI를 써서 수업 준비 시간을 31% 줄였다. 선생님들이 잡무에서 벗어나 학생들과 더 많은 시간을 보낼 수 있게 된 것이다. 미국의 연구는 더 고무적이다. 스탠퍼드대학교가 만든 'AI 개인 교사 도우미'는 잘 가르치는 선생님들의 방식을 관찰해서 만들어졌다. 이 도구를 900명의 개인 교사가 1,800명의 어려운 환경에 있는 학생을 가르칠 때 썼다. 결과는 놀라웠다. 학생 합격률이 평균 4% 올랐고, 경험이 적은 개인 교사는 9%포인트, 이전에 평가가 낮았던 개인 교사는 7%포인트나 올랐다. 이미 잘 가르치는 개인 교사에게는 효과가 작았다. 이는 AI가 교육 실력을 고르게 만들 수 있음을 보여준다. 경험 없는 선생님도 AI 도움으로 숙련된 선생님 수준의 효과를 낼 수 있다는 것이다. 하버드대학교 물리학 수업 실험도 이를 뒷받침한다. 교실에서 하는 수업과 똑같은 방식으로 만든 AI 개인 교사를 비교했더니, AI로 배운 학생들이 더 짧은 시간에 더 많이 배웠고 흥미도 높았다. 중국에서는 독해 공부를 도와주는 AI 도구가 전통 방식보다 독해 실력과 의욕을 더 높였다. 영국의 글쓰기 연구에서도 AI가 아이디어를 제안해주자 혼자 쓴 사람보다 창의성과 글 품질이 모두 좋아졌다. 답 주는 AI vs 질문하는 AI... '교육용 AI'는 뭐가 다를까 OECD는 일반 AI(챗GPT 같은)와 교육용 AI의 근본적인 차이를 강조한다. 일반 AI는 질문하면 바로 답을 주지만, 교육용 AI는 학생이 스스로 답을 찾도록 질문으로 유도한다. 대표적인 게 '소크라테스 놀이터'다. 이 AI는 답을 바로 주지 않고 질문을 던져서 학생이 스스로 생각하게 만든다. 예를 들어 학생이 "피타고라스 정리가 뭐예요?"라고 물으면 일반 AI는 정의와 공식을 바로 알려준다. 하지만 소크라테스 놀이터는 "직각삼각형의 세 변 사이에는 무슨 관계가 있을까?", "정사각형 넓이는 어떻게 구하지?" 같은 질문으로 학생이 스스로 개념을 발견하도록 돕는다. 보고서는 이런 대화형 AI가 학생 개개인에 맞춰 설명을 조정한다고 설명한다. 여러 명이 함께 공부할 때도 AI가 도움을 줄 수 있다. 연구에 따르면 AI는 ①정보 저장소, ②정보 수집, ③추가 자료 제공, ④참여 유도, ⑤질문으로 대화하는 파트너, ⑥전문가 역할 등을 할 수 있다. 이를 통해 지식 제공, 모두의 평등한 참여 보장, 공부 과정 되돌아보기 등을 도와준다. 하지만 OECD는 교육용 AI도 조심해서 써야 한다고 강조한다. AI가 만든 피드백 품질이 사람 선생님과 같거나 때로 더 좋을 수 있지만, 학생들은 여전히 사람 피드백을 더 의미 있고 믿을 수 있다고 느낀다. 그래서 AI를 선생님을 대신하는 게 아니라 돕는 도구로 써야 하고, 최종 책임은 선생님이 져야 한다. 한국·에스토니아·프랑스는 이미 시작했다... 각국 정부의 AI 교육 정책 OECD 보고서는 각국 정부가 이미 AI 교육 도입에 나섰다고 보고한다. 한국은 2025-26년 국가 교육과정에 맞춘 AI 학습 자료를 학교에 제공했다. 학생들이 여러 과목을 자기 수준에 맞춰 연습할 수 있고, 선생님은 학생이 무엇을 잘못 이해하고 있는지 피드백을 받는다. 학생 수준에 맞는 설명, 자동 피드백, 교육과정에 맞춘 대화 등의 기능이 있다. 에스토니아는 2025-26년 'AI 도약' 프로그램으로 모든 고등학교에서 AI 활용을 시도한다. 시설, 교육과정, 선생님 연수, 기술 회사와의 협력을 모두 결합했다. 모든 선생님에게 일반 AI 도구를 주고, 고등학생들에게는 교육 연구 원리를 따르도록 만든 AI 챗봇을 무료로 제공한다. 에스토니아어로만 대화하도록 설정한 것도 특징이다. 그리스는 2025년 'OpenAI와 그리스' 협력으로 선정된 고등학교에서 ChatGPT 교육용 버전을 시범 운영한다. 선생님 연수와 AI 사용의 교육 효과 관찰을 포함한다. 슬로바키아는 수업 계획과 평가를 돕는 AI를 시범 운영하고, 핀란드는 주로 선생님 지원과 피드백용 AI를 테스트한다. 일본, 캐나다, 호주는 글쓰기 지원, 피드백 제공, 업무 부담 줄이기에 집중한 지역 시범 사업을 한다. 프랑스는 교육용 '자체 AI'를 개발 중이다. 수업 계획을 돕는 AI와 130만 선생님을 위한 챗봇을 만들어서 인사 관련 일반적인 질문에 답하게 하고, 사람은 개별 상황에 집중하게 한다. 영국은 교육부의 '자료 저장소'로 교육과정 지침, 수업 계획, 학생 평가(개인정보 제거)를 모아서 AI를 훈련시키고, 영국 학교에 맞는 정확하고 품질 좋은 교육용 AI 도구를 만들 수 있게 한다. 네덜란드는 국립 AI 연구소를 통해 정부, 대학, 기업, 학교가 함께 교육용 AI 도구를 만든다. 이런 나라별 방식은 AI를 교육에 넣는 다양한 전략을 보여주며, 국제 협력과 지식 공유의 중요성을 강조한다. OECD가 제시한 5가지 원칙: "AI는 보조 도구, 판단은 사람이" OECD는 AI를 제대로 쓰기 위한 핵심 원칙을 제시했다. 첫째, 과제를 잘 풀었다고 해서 실력이 늘었다는 뜻이 아니라는 걸 분명히 알아야 한다. 학생들이 AI로 빨리 답을 얻으면 스스로 생각하는 과정을 건너뛰게 되므로, 천천히 여러 번 수정하며 쓰도록 해야 한다. 이는 AI를 쓰기 전에 먼저 생각하고, AI 답을 꼼꼼히 확인하며, 여러 번 고치는 과정을 말한다. 둘째, 주요 과목의 기본 지식과 기술은 AI 없이 먼저 배워야 한다. 계산기를 쓰기 전에 기본 산수를 배워야 하는 것처럼, AI를 쓰기 전에 기본 개념과 기술을 알아야 한다. 셋째, AI 도구는 교육용이든 일반용이든 선생님이 특정 학습 목표를 위해 계획한 수업에서 써야 한다. 넷째, AI 도구를 쓸 때 선생님은 계속 전문가로서 판단하고 AI가 만든 결과를 검토하고 고치거나 승인해서 품질에 책임을 져야 한다. AI는 제안할 수 있지만, 최종 결정은 항상 사람인 선생님이 내려야 한다. 다섯째, AI 개발자는 교육 연구와 교육 지식을 바탕으로 교육용 AI를 만들고, 선생님뿐 아니라 학생, 학부모, 교사 단체 등을 만드는 과정에 참여시켜야 한다. 보고서는 또한 AI의 교육 효과를 확인하는 국제 협력 연구가 중요하다고 강조한다. 지금까지 대부분의 연구는 짧은 기간만 봤기 때문에, 오랜 기간 AI를 썼을 때 어떤 효과가 있는지 연구가 필요하다. OECD는 또한 선생님의 AI 활용 능력을 키우기 위해 AI를 이해하는 교육뿐 아니라 AI를 수업과 과제에 넣는 교육 능력을 키워야 한다고 강조한다. 이를 돕기 위해 유럽위원회와 OECD는 초등·중등 교육을 위한 AI 교육 기준을 만들었다. FAQ (※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.) Q1. 우리 아이가 챗GPT로 숙제를 하는데, 당장 못 쓰게 해야 하나요? A. 무조건 금지할 필요는 없습니다. OECD 보고서는 AI 사용 자체가 문제가 아니라 '어떻게' 쓰느냐가 중요하다고 합니다. 터키 실험에서도 학습을 돕도록 만든 AI를 쓴 학생들은 일반 AI보다 나은 결과를 보였습니다. 중요한 건 아이가 AI를 답을 그냥 베끼는 도구가 아니라 생각을 돕는 도구로 쓰게 하는 것입니다. 먼저 혼자 문제를 풀어보게 하고, AI 답을 꼼꼼히 확인하며, 왜 그런 답이 나왔는지 설명하게 하는 방식이 좋습니다. Q2. 선생님이 AI를 잘 모르는데 우리 아이 교육은 괜찮을까요? A. 현재 선생님의 36%만 AI를 쓰고 있어서 걱정될 수 있습니다. 하지만 OECD는 선생님을 돕는 나라별 프로그램이 이미 시작됐다고 합니다. 한국은 AI 학습 자료를 제공하고, 에스토니아는 모든 선생님에게 AI 도구를 주며, 프랑스는 130만 선생님을 위한 AI 챗봇을 만들고 있습니다. 학부모로서는 학교나 선생님에게 AI 교육 계획을 물어보고, 필요하면 관련 연수 기회를 요청할 수 있습니다. 집에서도 아이와 함께 AI를 올바르게 쓰는 법을 배우는 게 도움이 됩니다. Q3. 일반 AI(챗GPT)와 교육용 AI의 차이는 뭐고, 어떤 걸 써야 하나요? A. 챗GPT 같은 일반 AI는 질문하면 바로 답을 주지만, 교육용 AI는 학생이 스스로 답을 찾도록 질문으로 유도합니다. 예를 들어 소크라테스 놀이터는 답을 바로 주지 않고 "왜 그렇게 생각하니?", "다른 방법은 없을까?" 같은 질문으로 생각을 자극합니다. 하버드대 물리학 AI는 학생이 능동적으로 배우는 방식을 적용해서 교실 수업보다 더 나은 결과를 냈습니다. 지금은 교육용 AI가 많지 않으므로, 일반 AI를 쓰되 교육 목적으로 쓰는 게 중요합니다. 답을 바로 받지 말고 힌트를 요청하거나, AI 답을 확인하고 다른 방법으로도 풀어보게 하세요. ■ 이 기사는 AI 전문 매체 'AI 매터스'와 제휴를 통해 제공됩니다. 기사는 클로드 3.5 소네트와 챗GPT를 활용해 작성되었습니다. (☞ 기사 원문 바로가기)

2026.01.21 17:11AI 에디터

대학 연구팀이 만든 AI, 채점 방식 바꿨더니 GPT-5 이겼다...의료 분야 세계 1등

AI 챗봇이 얼마나 똑똑한지 정확하게 평가하는 것은 여전히 어려운 문제다. 특히 "좋은 에세이를 써줘" 같은 정답이 정해지지 않은 질문에 AI가 얼마나 잘 대답했는지 판단하기 어렵다. 해당 논문에 따르면, 중국 전기차 기업 리 오토(Li Auto Inc.)와 중국 홍콩 중문대학교(The Chinese University of Hong Kong, Shenzhen), 저장대학교(Zhejiang University), 싱가포르 난양공과대학교(Nanyang Technological University) 공동 연구팀이 이 문제를 해결할 새로운 방법을 내놨다. 연구팀이 만든 '루브릭허브(RubricHub)'라는 평가 자료를 사용해 훈련한 AI 모델은 의료 분야 테스트에서 69.3점을 받아 오픈AI의 최신 모델 GPT-5(67.2점)를 제쳤다. 기존 AI 평가 방식의 한계, 세밀한 기준 부재가 문제 현재 대규모 언어모델(LLM)의 평가는 두 가지 방식으로 나뉜다. 수학이나 코딩처럼 정답이 명확한 분야에서는 검증 가능한 보상을 활용한 강화학습(RLVR)이 효과적이지만, 실제 사용자 질문의 대부분은 정답이 정해지지 않은 개방형이다. 기존 평가 기준(rubric)은 사람의 전문성에 의존하거나 특정 분야에만 국한되어 확장성이 떨어진다. 더 큰 문제는 평가 기준이 너무 포괄적이고 모호해서 우수한 응답과 뛰어난 응답을 구별하지 못한다는 점이다. 예를 들어 "시를 잘 썼는가"라는 기준만으로는 어떤 시가 진정으로 훌륭한지 판단하기 어렵다. 연구팀은 이러한 조악한 기준이 AI 훈련에 '천장 효과(supervision ceiling effect)'를 만들어 모델 개선을 가로막는다고 지적했다. GPT-5.1· 제미나이 3 프로 등 최신 AI 총동원해 평가 기준 만들었다 루브릭허브의 핵심은 단계적으로 점점 더 까다로운 평가 기준을 만드는 방법이다. 첫 번째 단계는 '원칙 기반 및 응답 기반 생성'이다. 질문만으로 기준을 만들면 너무 일반적이거나 실제 답변과 동떨어진 기준이 나올 수 있다. 연구팀은 실제 AI 응답을 참고하면서 일관성, 명확성, 평가 가능성 등의 메타 원칙을 적용해 구체적이고 관련성 높은 기준을 생성했다. 두 번째 단계는 '여러 AI 모델을 활용한다. 한 가지 AI만 사용하면 편향될 수 있어서 GPT-5.1, 제미나이 3 프로 같은 여러 최신 모델이 만든 기준을 합쳐서 균형을 맞췄다. 세 번째이자 가장 중요한 단계는 '난이도 진화'다. 보통 수준의 기준은 합격과 불합격은 구별하지만, 우수한 답변과 최고의 답변을 구별하지 못한다. 예를 들어 시험에서 80점과 100점 모두 '합격'으로만 평가하면 둘의 차이를 알 수 없는 것과 같다. 연구팀은 최고 수준의 답변 두 개를 비교 분석해서 미묘한 차이를 찾아냈다. 그래서 "코드가 제대로 작동하나요?"라는 단순한 기준을 "특수한 경우에도 빠르고 효율적으로 작동하나요?"처럼 훨씬 까다롭게 바꿨다. 11만 개 질문에 평균 30개 기준… 최고 AI도 60점밖에 못 받아 루브릭허브는 약 11만 개의 질문과 그에 맞는 평가 기준으로 이루어져 있다. 의료(Medical), 과학(Science), 지시 따르기(Instruction Following), 작문(Writing), 대화(Chat) 등 5개 주요 분야를 아우른다. 의료와 과학 분야가 각각 27.1%로 가장 큰 비중을 차지하며, 지시 따르기 20.9%, 작문 15.9% 순이다. 특히 작문과 의료 같은 복잡한 분야에서는 질문 하나당 평균 30개 이상의 세밀한 평가 기준을 제공한다. 이는 기존 데이터셋과 차별화되는 점이다. 더 중요한 것은 이 기준들의 변별력이다. 뛰어난 AI 모델인 Qwen3-235B도 평균 0.6점(만점 1점 기준) 정도밖에 못 받았다. 이는 루브릭허브의 기준이 충분히 어렵고, AI가 개선될 여지가 많다는 뜻이다. 의료 분야 69.3점으로 GPT-5(67.2점) 제치고 세계 1등 연구팀은 루브릭허브가 실제로 효과가 있는지 확인하기 위해 2단계 훈련 방법을 사용했다. 1단계 'RuFT(Rubric-based Rejection Sampling Fine-Tuning)'에서는 평가 기준을 필터로 써서 좋은 답변만 골라냈다. 하나의 질문에 대해 여러 AI 모델이 여러 개 답변을 만들면, 그중에서 평가 점수가 일정 기준(0.6점) 이상인 최고 답변만 훈련 자료로 사용했다. 2단계 'RuRL(Rubric-based Reinforcement Learning)'에서는 평가 기준 점수를 보상으로 활용해 AI를 더 발전시켰다. 각 평가 항목을 통과하면 가중치만큼 점수를 주고, 이 점수를 최대화하도록 AI를 학습시켰다. 이 방법을 Qwen3-14B 모델에 적용한 결과가 놀랍다. 의료 분야 HealthBench 테스트에서훈련 전 기본 상태(22.8점)에서 69.3점으로 46.5점 상승했고, GPT-5(67.2점)를 넘어선 69.3점으로 세계 최고 성능을 달성했다. 대화 능력을 측정하는 Arena-Hard V2에서도 기본 모델이 5.2점에 불과했는데 74.4점으로 급등했다. 사람 평가와 90% 일치, 대화 능력은 14배 상승 연구팀은 각 단계가 실제로 효과가 있는지 하나씩 확인했다. 기본 규칙을 적용하고 답변을 참고해서 기준을 만들자 의료 분야 AI 평가 벤치마크인 HealthBench 2.9점, LLMeval-Med에서 2.4점 올랐다. 여러 모델의 기준을 합치자 단일 모델 편향이 줄어들며 성능이 더 좋아졌다. 난이도를 높이는 3단계까지 완성하니 LLMeval-Med에서 79.5점까지 도달했다. 답변 후보를 1개에서 12개로 늘렸을 때도 훈련 데이터 품질이 63.45점에서 79.51점으로 향상돼 필터링 효과가 입증됐다. 또한 사람 평가자와 AI 채점 결과를 비교한 결과, 일정 규모(30B) 이상의 AI는 사람과 90% 이상 일치하는 판단을 내려 평가 기준의 신뢰성을 확인했다. FAQ (※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.) Q1. 루브릭허브가 뭐고 왜 중요한가요? A. 루브릭허브는 AI 답변의 품질을 평가하는 약 11만 개의 까다로운 기준을 모아놓은 자료다. 기존 방식은 "괜찮은 답변"과 "최고의 답변"을 구별하지 못했는데, 루브릭허브는 30개 이상의 구체적 기준으로 미묘한 차이까지 포착해서 AI를 더 똑똑하게 훈련시킬 수 있다. Q2. 이 방법으로 훈련한 AI 성능은 어느 정도인가요? A. 루브릭허브로 훈련한 Qwen3-14B 모델은 의료 분야 테스트에서 69.3점을 받아 오픈AI의 최신 GPT-5(67.2점)를 이겼다. 대화 능력 테스트에서도 기본 모델 5.2점에서 74.4점으로 14배 이상 뛰어올라 효과가 확실히 입증됐다. Q3. 일반 사용자에게 어떤 의미가 있나요? A. 더 까다로운 기준으로 AI를 훈련하면 의료 상담이나 작문 도움처럼 정답이 없는 복잡한 질문에도 AI가 훨씬 신뢰할 만한 답변을 준다. 일상에서 AI를 더 안전하고 유용하게 쓸 수 있게 된다는 의미다. ■ 이 기사는 AI 전문 매체 'AI 매터스'와 제휴를 통해 제공됩니다. 기사는 클로드 3.5 소네트와 챗GPT를 활용해 작성되었습니다. (☞ 기사 원문 바로가기)

2026.01.20 22:16AI 에디터

"2분만에 나를 복제"...AI 아바타가 투자자 질문에 실시간 답변

인터랙트AI(InteractAI)가 19일(현지 시각) AI 기반 인터랙티브 투자 피칭 플랫폼 '인터랙트피치(InteractPitch)'를 선보였다. 이 서비스는 창업자의 아바타가 투자자와 실시간으로 대화하며 프레젠테이션 자료를 설명하는 방식으로, 실제 미팅 전 투자자의 관심사를 파악할 수 있다는 점이 특징이다. 인터랙트피치 공식 웹사이트에 따르면, 이 플랫폼은 일반 프레젠테이션 파일을 AI 기반 대화형 경험으로 전환한다. 투자자는 창업자의 아바타를 통해 프레젠테이션 자료를 탐색하고, 궁금한 점을 질문하며, 창업자는 투자자가 어떤 질문을 했는지 실시간으로 추적할 수 있다. 서비스의 핵심은 모바일 우선 경험이다. 투자자는 스마트폰에서 링크를 탭하는 것만으로 프레젠테이션 자료를 탐색할 수 있으며, 별도의 앱 설치나 일정 조율 없이 텍스트 또는 음성으로 질문할 수 있다. AI는 각 슬라이드의 내용과 창업자가 추가한 맞춤 설명을 기반으로 답변을 제공한다. 플랫폼 구축 과정은 4단계로 구성된다. 먼저 PDF, PPTX, PPT 형식의 자료를 업로드하고 슬라이드별로 추가 설명을 입력한다. 두 번째 단계에서는 창업자의 사진과 음성 샘플을 업로드하면 몇 분 안에 아바타가 생성된다. 세 번째 단계에서는 전체 피칭 맥락, 톤, 타깃 청중, 지식 베이스 등을 설정한다. 마지막으로 링크를 공유하면 투자자가 모바일에서 바로 접속할 수 있다. 인터랙트AI는 이 서비스가 단순히 자료를 보여주는 것이 아니라, 창업자의 피칭 내용과 지식 베이스를 학습한 AI가 맥락에 맞는 답변을 제공한다고 설명했다. 창업자는 투자자와 첫 통화를 하기 전에 상대방이 어떤 부분에 관심을 보였는지 미리 파악할 수 있어, 더 준비된 상태로 미팅에 임할 수 있다는 것이 회사 측의 설명이다. 현재 인터랙트피치는 무료로 체험할 수 있으며, 고성장 스타트업 팀들이 활용하고 있다고 밝혔다. 서비스 구축에 소요되는 시간은 약 2분이며, 별도의 설정 없이 파일 업로드와 맥락 입력만으로 바로 사용 가능하다. 해당 서비스에 대한 자세한 사항은 인터랙트AI 공식 웹사이트에서 확인 가능하다. 이미지 출처: 인터랙트AI ■ 이 기사는 AI 전문 매체 'AI 매터스'와 제휴를 통해 제공됩니다. 기사는 클로드 3.5 소네트와 챗GPT를 활용해 작성되었습니다. (☞ 기사 원문 바로가기)

2026.01.20 20:15AI 에디터

오픈AI, 18개월 안에 파산할 수도…"MS나 아마존에 인수될 가능성 커"

챗GPT로 AI 혁명을 주도해 온 오픈AI가 향후 18개월 내 자금 고갈에 직면할 수 있다는 경고가 나왔다. 외교협회(Council on Foreign Relations) 선임연구원 세바스찬 말라비는 13일(현지 시각) 뉴욕타임스 기고문을 통해 "오픈AI가 대규모 수익을 내기 전에 자금이 바닥날 것"이라고 전망했다. 챗GPT 출시 3년 만에 AI는 이미지 생성부터 복잡한 논리 문제 해결까지 놀라운 발전을 이뤘다. 와튼스쿨 조사에서는 미국 기업 4분의 3이 AI 투자로 긍정적 수익을 거두고 있다고 답했다. 매달 10억 명 이상이 생성형 AI를 사용하고 있다. 문제는 대부분의 사용자가 무료로 서비스를 이용한다는 점이다. 여러 무료 모델이 존재하는 상황에서 유료 전환은 쉽지 않다. 말라비는 "AI가 사용자의 모든 것을 기억하고 이해하는 단계가 와야 수익화가 가능하지만, 그때까지 생존할 수 있느냐가 문제"라고 지적했다. 인포메이션(The Information)에 따르면 오픈AI는 2025년 80억 달러(한화 약 11조 8천억 원) 이상, 2028년 400억 달러 이상을 소진할 것으로 예상했다. 샘 알트만 CEO는 지난해 3월 역대 최대 규모인 400억 달러를 투자 유치했지만, 데이터센터 인프라에만 1조 4,000억 달러가 필요한 상황이다. 말라비는 "생성형 AI는 과거 소프트웨어 기업과 달리 훨씬 더 자본집약적"이라며 "결국 오픈AI는 마이크로소프트나 아마존 같은 거대 기업에 인수될 가능성이 크다"고 내다봤다. 그는 "이는 AI 자체에 대한 비판이 아니라 과대광고에 의존한 한 기업의 종말일 뿐"이라고 덧붙였다. 해당 기사의 원문은 뉴욕타임스에서 확인 가능하다. 이미지 출처: 이디오그램 생성 ■ 이 기사는 AI 전문 매체 'AI 매터스'와 제휴를 통해 제공됩니다. 기사는 클로드 3.5 소네트와 챗GPT를 활용해 작성되었습니다. (☞ 기사 원문 바로가기)

2026.01.19 22:28AI 에디터

챗GPT, 3년 만에 연매출 10배 폭증...오픈AI CFO "전례 없는 성장"

오픈AI가 챗GPT 출시 3년 만에 연간 반복 수익(ARR)을 10배 성장시키며 생성형 AI 시장의 지배력을 입증했다. 사라 프라이어(Sarah Friar) 오픈AI 최고재무책임자(CFO)는 18일(현지 시각) 공식 블로그를 통해 "2023년 20억 달러였던 ARR이 2024년 60억 달러, 2025년 200억 달러 이상으로 증가했다"며 "이는 이러한 규모에서 전례 없는 성장"이라고 밝혔다. 프라이어 CFO는 이 같은 폭발적 성장의 비결로 '지능의 가치에 따라 비즈니스 모델을 확장한다'는 원칙을 꼽았다. 챗GPT가 단순한 실험 도구를 넘어 학생들의 숙제 풀이부터 기업의 업무 자동화까지 일상에 깊숙이 침투하면서, 오픈AI는 소비자 구독부터 사용량 기반 API까지 다층적 수익 모델을 구축했다. 특히 컴퓨팅 파워가 성장의 핵심 변수로 작용했다. 오픈AI의 컴퓨팅 용량은 2023년 0.2기가와트(GW)에서 2025년 1.9GW로 9.5배 증가했으며, 수익도 같은 곡선을 그리며 성장했다. 프라이어 CFO는 "컴퓨팅은 AI에서 가장 희소한 자원"이라며 "더 많은 컴퓨팅이 있었다면 고객 채택과 수익화가 더 빠르게 이뤄졌을 것"이라고 강조했다. 오픈AI는 주간 활성 사용자(WAU)와 일일 활성 사용자(DAU) 모두에서 계속해서 사상 최고치를 경신하고 있다. 회사는 2026년 '실용적 채택' 확대에 초점을 맞춰, 특히 건강, 과학, 기업 분야에서 AI 활용 격차를 좁히는 데 주력할 계획이다. ■ 이 기사는 AI 전문 매체 'AI 매터스'와 제휴를 통해 제공됩니다. 기사는 클로드 3.5 소네트와 챗GPT를 활용해 작성되었습니다. (☞ 기사 원문 바로가기)

2026.01.19 20:05AI 에디터

AI가 만든 광고, 젊은 세대는 싫어한다...기업만 모르는 현실

기업들이 AI로 광고를 만드는 건 당연한 시대가 됐지만, 정작 광고를 보는 젊은 소비자들의 반응은 차갑다. 특히 10대 후반~20대 초반 Z세대의 절반 가까이가 AI 광고를 거부감 있게 본다고 답했다. 문제는 광고를 만드는 기업들이 이런 사실을 전혀 모르고 있다는 것이다. 미국 광고 업계 단체 IAB(Interactive Advertising Bureau)가 발표한 조사 결과에 따르면, 기업과 소비자가 생각하는 AI 광고에 대한 온도차가 지난해보다 더 벌어진 것으로 나타났다. 볼보도 코카콜라도 AI 광고... 하지만 젊은 세대는 냉담 요즘 유튜브나 인스타그램에서 보는 광고 상당수는 AI의 손을 거쳐 만들어진다. 볼보는 AI로 자동차 광고를 제작했고, 코카콜라는 2년 연속 크리스마스 광고를 AI로 만들었다. 광고업계 임원 82%가 "우리 회사는 AI로 광고를 만든다"고 답할 정도로 AI 광고는 이제 표준이 됐다. 2024년 해도 절반 정도였던 게 지금은 대부분의 기업이 사용하는 수준까지 올라왔다. 기업들이 AI를 가장 많이 쓰는 곳은 SNS 광고다. 인스타그램이나 페이스북에 뜨는 광고 10개 중 8개 정도가 AI의 도움을 받는다고 보면 된다. 배너 광고는 10개 중 7개, TV 광고는 절반 이상이 AI를 활용한다. 심지어 팟캐스트 같은 오디오 광고도 절반 가까이가 AI를 쓴다. 그런데 기업들이 AI를 쓰는 가장 큰 이유가 뭘까? 기업들이 AI를 쓰는 가장 큰 이유는 '돈을 아끼기 위해서'다. 2024년만 해도 5순위였던 비용 절감이 2026년에는 1순위로 올라섰다(64%). "AI가 창의적인 광고를 만들 수 있다"는 응답은 오히려 64%에서 61%로 조금 줄었다. "소비자들 좋아할 거야"라는 기업들의 치명적 착각 광고 업계 임원 82%는 "젊은 소비자들이 AI 광고를 좋아할 것"이라고 생각했다. 하지만 실제로 AI 광고를 좋아한다고 답한 소비자는 절반도 안 되는 45%였다. 기업이 생각하는 것과 실제 소비자 반응 사이에 37%포인트나 차이가 났다. 이 격차는 2024년 32%포인트에서 더 벌어진 것이다. 더 심각한 건 소비자들이 AI 광고에 대해 점점 더 부정적으로 변하고 있다는 점이다. 2024년에 비해 "AI 광고 싫다"고 답한 사람이 12%포인트나 늘었다. 반대로 "잘 모르겠다"는 애매한 답은 34%에서 25%로 줄었다. 즉, 소비자들이 AI 광고를 더 많이 접하면서 "역시 별로네"라는 결론을 내리고 있는 셈이다. 기업들은 AI를 쓰는 브랜드를 '미래지향적'이라고 생각하지만, 소비자 중에서 그렇게 생각하는 사람은 절반도 안 된다. '독특하다'는 평가도 비슷하다. 반대로 부정적인 평가는 소비자 쪽이 훨씬 가혹하다. 소비자들은 AI 광고를 보면서 "사람을 속이려 한다"거나 "윤리적이지 않다"는 느낌을 받는 경우가 많았다. 기업이 생각하는 것보다 두 배 이상 높은 비율이다. 챗GPT는 쓰면서 AI 광고는 싫다는 Z세대 특히 Z세대의 반응이 차가웠다. 10명 중 4명이 AI 광고를 싫어한다고 답했는데, 이는 30대 이상 밀레니엄 세대의 두 배에 달하는 수치다. 불과 2024년만 해도 Z세대 중 부정적인 사람이 5명 중 1명 정도였는데, 지금은 거의 두 배로 늘었다. AI를 광고에 사용하는 브랜드에 대해 Z세대의 30%가 '진정성 없다'고 평가했는데, 이는 밀레니엄 세대의 13%에 비해 두 배 이상이다. '단절된'이라는 응답은 Z세대 26% 대 밀레니엄 8%, '비윤리적'이라는 응답은 Z세대 24% 대 밀레니엄 8%로 나타났다. 흥미로운 건 Z세대가 평소에는 챗GPT 같은 AI 도구를 가장 많이 쓰는 세대라는 점이다. 숙제할 때도, 친구와 채팅할 때도, 이미지 만들 때도, AI를 자연스럽게 쓴다. 하지만 기업이 AI를 쓰는 건 전혀 다른 문제로 본다. 자신이 쓸 때는 좋지만, 기업이 쓰는 건 거부감이 든다는 이중적 태도다. 기업들이 이런 소비자 반응에 둔감해진 것도 문제다. 요즘 기업들은 "AI가 사람의 창의성을 떨어뜨리는가", "AI 도입 비용이 얼마나 드는가", "우리 브랜드 이미지는 괜찮은가" 같은 내부 문제에만 골몰한다. 정작 "소비자들이 어떻게 생각하는가"는 우선순위에서 밀렸다. "AI로 만들었어요" 솔직히 말하니 오히려 더 좋아해 의외의 반전은 AI 사용을 솔직하게 밝히면 소비자 반응이 나쁘지 않다는 점이다. 젊은 소비자의 73%는 "이 광고는 AI로 만들었습니다"라고 표시되어 있으면 구매 의향이 높아지거나(36%) 상관없다(37%)고 답했다. 구매를 꺼리게 된다는 응답은 27%에 그쳤다. 소비자들은 "AI로 만들었다는 표시"가 광고에서 고품질 이미지, 재미있는 내용 다음으로 중요한 관심 요소라고 답했다. 쉽게 말해 숨기지 말고 당당하게 밝히는 게 오히려 소비자의 눈길을 끌 수 있다는 얘기다. 하지만 실제로는 절반도 안 되는 기업들만 항상 AI 사용을 밝힌다. AI로 광고를 만드는 기업 10곳 중 9곳은 '가끔' 표시한다고 답했지만, '항상' 표시하는 기업은 절반도 안 됐다. 2024년도와 비교해도 거의 개선되지 않았다. 한 광고 전문가는 "기업들이 AI 사용을 숨기려 하면 소비자는 더 의심한다"며 "오히려 솔직하게 밝히는 게 장기적으로 신뢰를 쌓는 방법"이라고 조언했다. 약 광고, 정치 광고는 무조건 밝혀라 소비자의 절반 이상이 특정 AI 기술의 공개를 원하고 있다. 광고가 100% AI 생성인 경우, AI 이미지를 사용하는 경우, AI 비디오를 사용하는 경우 공개를 원한다는 응답이 각각 50% 이상이었다. AI 음성이나 AI 아바타/가상 캐릭터의 경우도 거의 절반이 공개를 원했다. 특히 소비자들은 광고주들보다 이러한 기술의 공개를 더 많이 원하는 경향이 있었는데, 특히 AI 비디오와 AI 카피에서 그 차이가 컸다. 흥미롭게도 35%의 소비자는 디지털로 조정된 이미지나 비디오도 공개되어야 한다고 생각했고, 31%는 조작된 사진 촬영 기법도, 23%는 돈을 주고 구매한 스톡 사진 사용도 공개되어야 한다고 답했다. 소비자들은 제약/헬스케어 광고나 정치 광고에서 AI 사용을 공개하는 것이 매우 중요하다고 여기는 경향이 가장 높았다(각각 60% 이상). 광고주들도 이들 카테고리를 높은 중요도로 평가했다. 이들 카테고리는 금융 서비스와 함께 이미 가장 엄격하게 규제되는 분야이며, 일부 광고주들은 사전에 자발적으로 공개를 선택하고 있다. 반면 엔터테인먼트(영화, TV 프로그램, 음악) 광고는 중요도가 가장 낮았지만, 여전히 과반수의 소비자와 광고주가 투명성을 선호했다(소비자 53%, 광고주 54%). 비용 절감만 생각하다 소비자 신뢰 잃는다 전문가들은 기업을 위한 세 가지를 조언했다. 첫째, Z세대의 태도를 제대로 이해하라는 것이다. 이들은 평소 AI를 많이 쓰지만 기업의 AI 마케팅에는 유독 엄격하다. Z세대를 타겟으로 하는 광고는 더욱 신중하게 접근해야 한다. 둘째, AI를 비용 절감용이 아니라 품질 향상용으로 써야 한다. 돈을 아끼기 위해 광고 품질이 떨어지면 소비자가 금방 알아챈다. 소비자 4명 중 1명은 아직 AI 광고에 대해 확실한 의견이 없는 상태다. 지금이 이들의 마음을 얻을 수 있는 골든타임이다. 하지만 저품질 AI 광고를 계속 보여주면 이들마저 부정적으로 돌아설 수 있다. 셋째, 특히 영상이나 이미지에 AI를 쓸 때는 반드시 표시하라는 것이다. 투명성이 장기적으로 브랜드 신뢰를 지킨다. 소비자가 헷갈릴 수 있는 상황이라면 무조건 밝히는 게 맞다. 한 업계 관계자는 "기업들이 AI를 단기적 비용 절감 도구로만 보는 순간, 소비자와의 신뢰는 무너진다"며 "AI 시대에는 오히려 투명성과 진정성이 더 중요해졌다"고 강조했다. FAQ (※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.) Q1. AI 광고가 늘어나는데 왜 젊은 사람들은 싫어하나요? A. 젊은 소비자들은 기업이 AI를 '비용 절감'과 '빠른 대량 생산' 수단으로만 쓴다고 봅니다. 실제로 기업들이 꼽은 AI의 가장 큰 장점이 2년 만에 '창의적 혁신'에서 '비용 효율성'으로 바뀌었습니다. 소비자 입장에서는 "우리한테 신경 쓰기보다 돈만 아끼려 한다"고 느끼는 거죠. 특히 Z세대는 본인들은 AI를 많이 쓰면서도 기업의 AI 사용에는 더 까다로운 이중적 태도를 보입니다. Q2. AI로 광고 만들었다고 솔직히 말하면 매출에 손해 아닌가요? A. 오히려 반대입니다. 젊은 소비자 10명 중 7명은 "AI로 만든 광고"라고 표시되어 있어도 구매 의향이 높아지거나 상관없다고 답했습니다. 또 "AI 사용 표시"가 고품질 이미지, 재미있는 내용 다음으로 소비자의 관심을 끄는 요소로 꼽혔습니다. 숨기지 말고 당당하게 밝히는 게 장기적으로 신뢰를 쌓는 길입니다. Q3. 어떤 경우에 꼭 "AI로 만들었다"고 표시해야 하나요? A. 소비자 절반 이상이 이런 경우 반드시 표시하길 원합니다. 광고 전체가 AI로 만들어진 경우, AI로 영상을 만든 경우, AI로 이미지를 만든 경우입니다. AI 목소리나 가상 인물을 쓸 때도 거의 절반이 표시를 원했습니다. 특히 의약품, 건강, 정치, 금융 관련 광고는 소비자와 기업 모두 절반 이상이 "꼭 밝혀야 한다"고 답했습니다. 간단히 말해 소비자가 "이게 진짜야, 가짜야?" 헷갈릴 수 있으면 표시하는 게 맞습니다. ■ 이 기사는 AI 전문 매체 'AI 매터스'와 제휴를 통해 제공됩니다. 기사는 클로드 3.5 소네트와 챗GPT를 활용해 작성되었습니다. (☞ 기사 원문 바로가기)

2026.01.19 15:09AI 에디터

생각만으로 챗GPT 쓰는 날 올까… 오픈AI, 뇌와 AI 연결하는 '머지 랩스'에 투자

오픈AI가 뇌-컴퓨터 인터페이스(BCI, Brain Computer Interface) 스타트업인 머지 랩스(Merge Labs)의 시드 라운드에 투자자로 참여한다고 15일(현지 시각) 발표했다. 오픈AI는 "인터페이스의 진보는 컴퓨팅의 진보를 가능하게 한다"며 "사람들이 의도를 표현하는 더 직접적인 방법을 얻을 때마다 기술은 더 강력하고 유용해진다"고 투자 배경을 설명했다. 머지 랩스는 생물학적 지능과 인공지능을 연결해 인간의 능력, 주체성, 경험을 극대화하는 것을 장기 목표로 하는 연구소다. 이 회사는 생물학, 디바이스, AI를 결합해 안전하면서도 훨씬 높은 대역폭으로 뇌와 인터페이스하는 근본적으로 새로운 BCI 접근 방식을 개발하고 있다. 오픈AI에 따르면 AI는 머지 랩스의 접근 방식에서 핵심적인 역할을 한다. AI는 생명공학(bioengineering), 신경과학, 디바이스 엔지니어링을 포함한 연구 개발을 가속화할 것이다. 또한 고대역폭 인터페이스는 의도를 해석하고 개인에게 적응하며 제한적이고 노이즈가 많은 신호로도 안정적으로 작동할 수 있는 AI 운영 체제의 혜택을 받게 된다. 오픈AI는 "과학 기반 모델과 기타 최첨단 도구로 머지 랩스와 협력해 발전을 가속화할 것"이라고 밝혔다. 이어 "야심 찬 아이디어를 현실로, 궁극적으로는 사람들에게 유용한 제품으로 만들어가는 머지 랩스를 지원하고 협력하게 돼 기쁘다"고 덧붙였다. 머지 랩스의 공동 창업자에는 BCI에 대한 완전히 새로운 접근 방식을 개척한 연구자인 미카엘 샤피로(Mikhail Shapiro), 타이슨 아플랄로(Tyson Aflalo), 섬너 노먼(Sumner Norman)이 포함됐다. 이들은 기술 기업가인 알렉스 블라니아(Alex Blania), 산드로 헤르비그(Sandro Herbig), 그리고 개인 자격으로 참여한 샘 알트만(Sam Altman)과 함께 팀을 구성했다. 오픈AI는 BCI를 "중요한 새로운 영역"이라고 평가하며 "새로운 소통, 학습, 기술과의 상호작용 방식을 열어준다"고 강조했다. 또한 "BCI는 누구나 AI와 원활하게 상호작용할 수 있는 자연스럽고 인간 중심적인 방법을 만들 것"이라고 전망했다. ■ 이 기사는 AI 전문 매체 'AI 매터스'와 제휴를 통해 제공됩니다. 기사는 클로드 3.5 소네트와 챗GPT를 활용해 작성되었습니다. (☞ 기사 원문 바로가기)

2026.01.16 15:26AI 에디터

전 구글 X 임원, 충격 경고…"AI, 도구 아니라 인간의 주인 될 것"

전 구글X(Google X) 최고 비즈니스 책임자 모 가댓(Mo Gawdat)이 인공지능의 급속한 발전에 대해 강력한 경고를 보냈다. 그는 런던리얼(London Real)과의 인터뷰에서 "AI는 도구가 아니다. 현재는 유아 단계지만, 결국 인간의 주인이 될 것"이라고 단언했다. IBM, 마이크로소프트, 구글 등 글로벌 기술 기업에서 30년간 근무한 가댓은 "만약 지금 상황을 보지 못한다면 주의를 기울이지 않는 것"이라며 "우리는 이미 미니 디스토피아에 진입했다"고 주장했다. 가댓에 따르면 AI 능력은 5.7개월마다 두 배로 성장하고 있다. 이는 24개월마다 두 배로 증가하는 무어의 법칙(Moore's Law)과 비교해 충격적으로 빠른 속도다. 그는 "인텔(Intel) 4004 칩이 출시된 1970년대 초반부터 현재까지 처리 능력은 약 1,000억 배 증가했다"며 "AI는 이보다 훨씬 빠르게 발전하고 있고, AI가 더 나은 AI를 만드는 이중 지수 성장 단계에 있다"고 설명했다. 그는 풍부한 지능 자체에는 문제가 없다고 강조했다. "지능은 극성이 없는 힘이다. 좋은 곳에 사용하면 놀라운 결과를 얻지만, 나쁜 곳에 사용하면 순수한 악이 된다"는 것이다. 문제는 AI 기술이 희소성 기반의 자본주의 시스템과 정치적 이해관계에 의해 악용될 수 있다는 점이다. 가댓은 특히 미국과 중국 간의 AI 경쟁을 강하게 비판했다. 그는 "미국은 여전히 패권을 유지하려는 '약자 괴롭힘' 태도를 보이고 있다"며 "이는 전 세계가 대가를 치르는 냉전"이라고 지적했다. 오픈AI가 5,000억 달러 규모의 스타게이트 프로젝트를 발표한 지 일주일 만에 중국의 딥시크 R3가 3,000만 달러로 유사한 성과를 냈다는 사실을 언급하며, "우리가 왜 경쟁하는가"라고 반문했다. 가댓은 "우리가 직면한 진짜 문제는 풍부한 지능이 아니라 인간의 어리석음"이라며 "사람들이 잠에서 깨어나길 바란다. 겁을 주려는 게 아니라 깨어나길 바란다"고 말했다. ■ 이 기사는 AI 전문 매체 'AI 매터스'와 제휴를 통해 제공됩니다. 기사는 클로드 3.5 소네트와 챗GPT를 활용해 작성되었습니다. (☞ 기사 원문 바로가기)

2026.01.15 16:37AI 에디터

  Prev 1 2 3 4 5 6 7 8 9 10 Next  

지금 뜨는 기사

이시각 헤드라인

"대형마트 규제 개선, 실행은?"…유통 B 학점

스타벅스 논란에 이마트 휘청…주가도 실적도 '불안'

폐배터리 자산화 나선 현대차…구독 넘어 '순환경제' 실험

李 대통령 '일베' 폐쇄 시사…현실 가능성은

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.