챗GPT 많이 쓸수록 멍청해진다?…MIT의 충격적 실험 결과
MIT 미디어랩 연구진이 수행한 실험 보고서에 따르면, 챗GPT와 같은 생성형 AI(Large Language Model, LLM)를 활용한 에세이 작성은 단기적으로는 편의성을 제공하지만 장기적으로는 학습 능력 저하를 유발할 수 있다. 실험 참가자 54명을 대상으로 LLM, 검색엔진, 인간 두뇌(Brain-only) 세 그룹으로 나누어 SAT 스타일의 에세이를 총 4회 작성하도록 한 결과, LLM 사용자들은 기억력, 인지 몰입도, 뇌의 연결성 측면에서 현저히 낮은 성과를 보였다. “에세이를 썼는데 기억이 안 나요” 챗GPT 사용 후 학습 몰입도와 기억력 급감 전극 기반 뇌파 측정(EEG)을 통해 각 세션 동안의 뇌 활동을 분석한 결과, LLM을 사용한 그룹의 뇌 연결성은 다른 그룹에 비해 현저히 낮았으며, 알파(Alpha) 및 베타(Beta) 파형이 덜 활성화되는 것으로 나타났다. 반면 인간의 두뇌만을 사용한 그룹은 가장 넓고 강한 신경 네트워크를 보여주며 가장 높은 수준의 인지적 참여도를 기록했다. 또한, LLM 그룹은 에세이 작성 후 본인의 글을 인용하거나 요약하는 능력에서 심각한 결함을 보였으며, 작성물에 대한 '소유감(ownership)' 역시 가장 낮았다. 반대로 Brain-only 그룹은 에세이에 대한 소유감과 인용 정확도 모두에서 우수한 결과를 보였다. 뇌파 실험에서 드러난 AI 의존의 대가? 뇌 연결성 '뚝' 떨어졌다 세 번째 세션까지 LLM을 사용했던 참가자들에게 네 번째 세션에서는 아무런 도구도 쓰지 않고 에세이를 작성하도록 했을 때, 이들의 뇌 연결성은 일관되게 낮은 수준을 유지했다. 특히 알파 및 베타 파형의 활동은 눈에 띄게 약화됐으며, 이는 시각적 통합 능력과 주의 집중도가 떨어졌음을 시사한다. 반면, 기존에 인간의 두뇌만을 사용했던 참가자들이 네 번째 세션에서 LLM을 활용했을 때는 오히려 높은 기억 회상률과 함께 뇌의 다양한 부위가 재활성화되었다. 이는 외부 도구를 사용하더라도 사전의 비도구 기반 경험이 인지적 참여에 영향을 미칠 수 있음을 보여준다. 또한 LLM 사용자의 에세이는 내용 구조나 주제에 있어 높은 동질성을 보였으며, ChatGPT 기본 응답과 유사한 패턴이 반복되는 경향이 강하게 나타났다. 이는 LLM이 사용자 개별 사고력을 대체하면서, 고유한 주제 해석이나 창의적 사고를 억제했음을 방증한다. AI로 쓴 글은 왜 다 비슷할까? 에세이의 언어 다양성·창의성도 낮았다 자연어 처리(NLP) 분석 결과, LLM 그룹은 네임드 엔터티 인식(NER) 수가 많고, 문장 길이나 단어의 다양성 면에서 일관성이 강한 반면, 독창성과 다양성 측면에서는 떨어지는 경향이 있었다. 특히 LLM 그룹의 에세이는 대부분 정형화된 구조를 보이며, PaCMAP 분석에서도 다른 그룹과 비교했을 때 중심값 근처에 밀집된 분포를 나타냈다. 이는 콘텐츠의 내용상 개별성보다는 시스템 기반의 정형성이 강함을 시사한다. 또한 N-그램 분석에서도 LLM 그룹은 동일한 구문을 반복 사용하는 경향이 두드러졌으며, 'perfect society', 'think speak'와 같은 표현이 반복적으로 등장했다. 이는 사용자들이 ChatGPT가 제시한 표현을 비판 없이 수용했거나, 반복된 사용으로 인해 언어적 다양성이 결여됐다는 점을 시사한다. 생성형 AI 의존, 장기적으로는 학습 설계에 부정적 영향 이 연구는 단순히 AI의 편리성보다, 교육적 관점에서 인지적 채무(cognitive debt)의 누적을 경고하고 있다. 생성형 AI는 즉각적인 편의성과 언어적 완성도를 제공할 수 있으나, 그 대가로 깊이 있는 사고, 기억력, 자율적 문제 해결력 같은 학습 핵심 역량을 훼손할 수 있다. 특히 교육 현장에서 LLM이 "능률적인 글쓰기 도우미"로만 사용될 경우, 학생들은 사고와 구성의 주체성을 상실하고, 결과적으로는 'AI가 쓴 글'에만 의존하게 되는 위험에 처할 수 있다. 이는 학습 설계자들에게 LLM의 사용을 무조건 장려하기보다는, 인지적 참여와 주도적 사고를 유도하는 설계가 필요하다는 점을 시사한다. FAQ Q. 생성형 AI를 사용하면 글쓰기에 도움이 되지 않나요? A. 단기적으로는 문법, 구조 면에서 도움을 줄 수 있지만, 장기적으로는 사고력, 기억력, 소유감 등이 저하될 수 있다. Q. 검색엔진과 LLM 사용자의 차이는 무엇인가요? A. 검색엔진 사용자는 정보를 적극 탐색하는 반면, LLM 사용자는 일방적인 수용을 하는 경향이 강해 인지적 참여도가 낮다. Q. 교육 환경에서 ChatGPT를 어떻게 활용해야 하나요? A. 보조 도구로 활용하되, 질문 유도, 비판적 검토 등 학습자의 사고력 증진을 위한 체계적 설계가 필요하다. ■ 이 기사는 AI 전문 매체 'AI 매터스'와 제휴를 통해 제공됩니다. 기사는 클로드 3.5 소네트와 챗GPT를 활용해 작성되었습니다. (☞ 기사 원문 바로가기)