챗GPT 때문에 사람들 말투 바뀌고 있다…일상 대화에서 '이 단어' 사용 급증
미국 플로리다 주립대학교 연구팀이 흥미로운 사실을 발견했다. 2022년 챗GPT가 나온 후 사람들이 일상 대화에서 쓰는 특정 단어들이 크게 늘어났다는 것이다. 연구팀은 과학기술 관련 팟캐스트에서 2,210만 개의 단어를 분석했다. 그 결과 'surpass'(능가하다)라는 단어를 쓰는 횟수가 140.79% 늘었고, 'boast'(자랑하다)도 140.14% 증가했다. 이런 변화는 단순히 사람들이 AI 도구를 써서 생긴 결과가 아니다. 사람들이 AI와 접촉하면서 자연스럽게 말하는 방식 자체가 바뀌고 있다는 뜻이다. 연구팀은 AI가 자주 쓰는 20개 단어를 조사했는데, 그 중 14개에서 사용 횟수가 늘어났다. 'strategically'(전략적으로)는 87.93%, 'align'(맞추다)는 36.59%, 'significant'(중요한)는 17.35% 증가했다. 진짜 사람 말인지 확인하기 위해 '팟캐스트' 분석 기존 연구들은 주로 논문이나 글로 쓴 텍스트를 분석했다. 하지만 요즘은 AI가 쓴 글과 사람이 쓴 글을 구분하기 어려워졌다. 그래서 이번 연구팀은 대본 없이 자유롭게 대화하는 팟캐스트를 분석 대상으로 삼았다. 이렇게 하면 AI 도구 없이 사람이 직접 한 말만 분석할 수 있기 때문이다. 연구팀은 렉스 프리드먼, 스템 토크 같은 인기 과학기술 팟캐스트 17개에서 1,326개 에피소드를 골라 분석했다. 팟캐스트 선정 과정에서는 애플과 스포티파이의 알고리즘 추천을 참고하고, 구글, 유튜브, 챗GPT 검색 결과도 활용했다. 각 후보 팟캐스트의 샘플 에피소드를 직접 들어서 자연스러운 대화인지 확인하는 검증 과정도 거쳤다. 2022년 이전과 이후 에피소드를 각각 1,100만 단어씩 같은 비율로 모아서 비교했다. 2022년은 챗GPT 출시로 인한 전환 시기라서 분석에서 제외했다. 팟캐스트에서 제공하는 대화록을 우선 사용하고, 없으면 오픈AI의 위스퍼라는 프로그램으로 음성을 글로 바꿔서 분석했다. 분석 과정에서는 spaCy라는 프로그램으로 품사를 구분하고, 라플라스 스무딩이라는 기법을 적용해 저빈도 단어로 인한 분석 오류를 방지했다. 유명한 AI 단어 'delve(파고들다)'는 의외로 별로 안 늘었다 재미있게도 AI가 과도하게 쓰는 것으로 유명한 'delve'(파고들다)라는 단어는 생각보다 증가 폭이 작았다. 46.82% 늘어났지만 통계적으로는 의미 있는 변화가 아니었다. 더 놀라운 건 'realm'(영역)이라는 단어인데, 이 단어는 오히려 17.63% 줄어들었고 이는 통계적으로도 의미 있는 감소였다. 이는 글로 쓸 때와 말로 할 때 AI의 영향이 다르게 나타날 수 있음을 보여준다. 원래 연구팀은 기존 문헌에서 확인된 34개의 AI 관련 단어를 분석하려 했지만, 실제 팟캐스트 데이터에서는 20개만 발견됐다. 나머지 14개는 'commendable'(칭찬할 만한), 'meticulously'(세심하게) 같은 저빈도 단어들로 구어체에서는 거의 사용되지 않았다. 반대로 비교군으로 설정한 117개의 비슷한 뜻을 가진 단어들은 특별한 변화가 없었다. 87개 단어 중 45개는 줄고 42개는 늘어나는 등 고른 분포를 보였으며, 대부분의 변화 범위가 ±30% 이내였다. 전체적인 증가 폭도 3.3%에 불과해 특별한 의미가 없었다. 이는 AI 관련 단어들의 증가가 우연이 아닌 특별한 현상임을 보여준다. 개별 단어 분석에는 카이제곱 검정을 사용했지만, 여러 검정을 동시에 수행할 때 생기는 오류 가능성도 고려해야 한다고 연구팀은 밝혔다. AI가 사람 언어에 스며드는 현상이 나타났다 연구팀은 이런 현상이 AI의 '정렬 문제'와 관련 있다고 분석했다. 대형 언어 모델들이 특정 단어를 너무 많이 쓰는 이유는 '인간 피드백 학습' 과정에서 생긴다고 알려져 있다. 이 과정에서 실제 사용자들이 좋아하는 말투와 다른 편향이 생겨나고, 이것이 역으로 사람들의 말하기 방식에 영향을 미치는 '스며들기 효과'가 나타날 수 있다는 것이다. 흥미롭게도 'delve'라는 단어에는 역추적 현상도 나타났다. 2023년과 2024년 학술 글에서 널리 쓰이던 이 단어가 2025년 1분기 PubMed에서는 백만 단어당 22회에서 15회로 줄어들었다. 사람들이 'delve'가 AI 냄새가 난다는 걸 알아차리고 의도적으로 피하기 시작했을 가능성이 있다. 사실 기술 발전이 언어 변화에 영향을 미치는 것은 새로운 일이 아니다. 인쇄기는 문어체를 표준화했고, 전화와 휴대폰은 말하는 방식을 바꿨으며, 인터넷과 소셜미디어도 언어에 큰 영향을 미쳤다. 2000년대 중반에는 'touch base'(연락하다), 'dude'(친구), 'awesome'(멋진) 같은 표현이 급속히 퍼져나가기도 했다. 특히 'align'이라는 단어가 늘어난 것은 AI를 인간의 가치에 맞추려는 논의가 많아지면서 생긴 현상일 수도 있다. 하지만 지금 상황에서 새로운 점은 '인간 저작권 불확실성' 문제다. 점점 더 많은 글에서 사람이 썼는지 AI가 썼는지 구분할 수 없게 되면서, 언어학 연구 자체가 근본적인 어려움에 직면하고 있다. 연구팀은 "AI가 사람 언어로 스며드는 현상이 단어 선택에서는 큰 문제가 아닐 수 있지만, 정치적이나 사회적 믿음 영역에서는 더 심각한 문제가 될 수 있다"고 경고했다. 앞으로는 더 정확한 결론을 위해 종단적 연구가 필요하다. 개별 화자를 시간에 따라 추적하고, AI 노출 정도를 측정하며, 어휘 선택이 어떻게 변화하는지 분석하는 연구가 이뤄져야 한다는 것이다. 연구의 한계점 이 연구에는 몇 가지 한계가 있다. 연구팀은 원래 시기별로 500만 단어를 분석하려 했지만, 의미 있는 통계 분석을 위해 1,100만 단어로 늘렸음에도 여전히 제한적이라고 인정했다. 또한 미국 중심의 영어권 팟캐스트를 대상으로 했기 때문에 전 세계 모든 지역에 일반화하기는 어렵다. 팟캐스트 중간에 나오는 스크립트 홍보 부분이나 미리 준비된 질문들을 완전히 제거하는 것도 현실적으로 어려웠다. 아직 단어 사용 변화의 구체적인 맥락과 화자 특성을 분석하는 정성적 연구는 이루어지지 않았다. FAQ Q: 이 연구 결과가 일반인에게도 적용될까요? A: 이 연구는 과학기술 관련 팟캐스트를 대상으로 했기 때문에 모든 사람의 언어 변화를 보여준다고 하기는 어렵습니다. 주로 기술에 관심 많은 젊은 층과 중년층의 언어 변화를 보여주는 것으로 이해하면 됩니다. Q: AI가 사람 언어를 바꾸고 있다는 확실한 증거인가요? A: 연구팀도 확실하다고 단정하지는 않았습니다. 이런 단어들이 AI 영향 없이도 자연스럽게 늘어났을 수도 있고, AI가 이미 인기 있던 단어들을 너무 많이 썼을 수도 있습니다. Q: 왜 팟캐스트 대화를 분석했나요? A: 요즘은 많은 글이 AI로 만들어지거나 AI 도움을 받아 쓰여서 순수한 사람의 언어를 분석하기 어려워졌습니다. 대본 없는 자연스러운 대화는 AI 도구 없이 사람이 직접 한 말을 연구할 수 있는 가장 확실한 방법입니다. ■ 이 기사는 AI 전문 매체 'AI 매터스'와 제휴를 통해 제공됩니다. 기사는 클로드 3.5 소네트와 챗GPT를 활용해 작성되었습니다. (☞ 기사 원문 바로가기)