AI가 정신과 의사 가르친다?…생성형 AI의 새로운 가능성
코로나19로 25% 증가한 정신 건강 문제, 정신의학 교육 혁신 필요성 대두 코로나19 팬데믹은 불안과 우울증 유병률을 25% 증가시키며 전 세계적으로 정신 건강 문제를 악화시켰다. 이러한 상황에서 싱가포르와 같은 국가들은 일차 진료 의사들에게까지 정신 건강 교육을 확대하며, 정신의학 교육의 중요성이 더욱 부각되고 있다. 그러나 현재 정신의학 교육은 다양한 환자 경험에 대한 불충분한 노출과 포괄적 훈련을 위한 자원 부족 등 여러 도전에 직면해 있다. 이러한 상황에서 생성형 인공지능(GenAI)은 의대생, 일차 진료 의사 및 다른 분야에서 정신의학 교육을 받고자 하는 사람들을 더 잘 준비시키는 데 도움이 될 수 있다. 정신의학은 수술, 방사선, 내분비학과 같은 다른 전문 분야와 달리 소프트 대인관계 기술에 더 중점을 두고 있다. 정신과 의사는 진단 기준에 익숙해지고 적절한 약물을 처방할 뿐만 아니라, 면담 기술과 심리 치료를 종합적으로 습득하면서 현상학과 환자의 주관적 경험을 파악해 효과적인 치료 계획을 수립해야 한다. 정신과 실습의 많은 요소는 정신 상태 검사, 자살 위험 평가, 동기 부여 인터뷰, 인지 행동 치료와 같이 기술적 능력보다 훨씬 가르치고 평가하기 어려운 소프트 스킬에 의존한다. 임상 현장 재현: ChatGPT 생성 사례, 인간 작성 사례와 품질 차이 없어 터키의 가지 대학교(Gazi University)의 의학 교육 및 정보학과 연구팀은 12,594개의 논문을 검토하여 최종적으로 5개의 논문을 선별했으며, 이를 통해 생성형 AI가 정신의학 교육에서 수행할 수 있는 네 가지 핵심 역할을 확인했다. 첫째, 사례 기반 학습에서 생성형 AI는 다양하고 효율적인 사례 비네트(case vignettes)를 생성할 수 있다. Coşkun 등(2024)의 연구에서는 ChatGPT로 합성된 비네트와 인간이 작성한 비네트 사이에 품질 차이가 없었으며, 오히려 ChatGPT 생성 비네트가 학생들의 임상 추론 능력 활용을 더 촉진하는 것으로 나타났다. Smith 등(2023)의 연구에서는 ChatGPT 생성 사례가 진단 과정, 치료, 정신약리학적 치료 필요성 판단, 사례 관련 윤리 문제 등 다양한 학습 결과를 가르치는 데 활용될 수 있음을 강조했다. 둘째, 시뮬레이션 기능 측면에서 ChatGPT는 환자 역할을 시뮬레이션하여 학생들이 임상 기술이나 위험 요소 식별 능력을 연습할 수 있게 도와준다. 이전 연구에서 정신의학에서의 시뮬레이션이 환자에 대한 정신과적 위험 평가 수행 능력을 효과적으로 향상시킨다는 것이 입증되었지만, 정신의학 교육 내 환자 시뮬레이션에서 생성형 AI의 방법과 효과에 관한 연구는 아직 부족한 실정이다. 셋째, 콘텐츠 합성 및 요약 영역에서 ChatGPT는 복잡한 연구의 정확한 의학 정보와 단순화된 요약을 제공한다. Yanagita 등(2024)의 연구에서는 184개의 질병에 대한 질병 스크립트(illness scripts)를 생성했는데, 이 중 84%가 상대적으로 높은 정확도를 보였다. 이런 질병 스크립트는 의대생들에게 임상 추론 기술을 가르쳐 진단 정확도를 향상시킬 수 있다. 넷째, 평가 도구 영역에서 생성형 AI는 다양한 평가 도구를 개발하는 데 활용될 수 있다. Coşkun 등(2024)은 ChatGPT가 생성한 객관식 문제(MCQ)의 품질을 논의했으며, 15개 생성 문항 중 6개가 효과적이라고 결론지었다. 또한 두 연구는 스크립트 일치 검사(SCT) 생성에 대규모 언어 모델(LLM)을 사용하는 방법을 논의했다. Hudon 등(2024)은 ChatGPT 생성 SCT와 전문가가 만든 SCT 사이에 시나리오, 임상 질문, 전문가 의견 측면에서 유의미한 차이가 없음을 입증했다. 생성형 AI의 한계점: 정신 장애 스크립트 45.5%가 낮은 평가 받아 생성형 AI는 정신의학 교육에 많은 이점을 제공하지만, 여러 한계점과 도전 과제도 존재한다. 콘텐츠 정확성 부족, 편향성, 생성된 콘텐츠에 대한 통제력 부족이 주요 문제로 지적되었다. 또한 시뮬레이션을 위해 생성형 AI를 사용하면 민감하거나 개인 데이터를 공유할 위험이 있어 보안 및 개인 정보 보호 문제가 제기된다. 특히 정신 장애에 대한 GenAI 생성 질병 스크립트는 "진단은 주로 임상 면담과 증상 기준에 기초한다"와 같은 일반적인 정보를 제시하면서 구체적인 단계를 설명하지 않아 낮은 평가를 받았다. 이는 문자 수 제한에서 비롯된 문제일 수 있으며, 더 많은 문자 수를 허용하면 특히 다양한 정신과적 증상을 고려할 때 더 자세한 내용을 다룰 수 있을 것이다. 또한 생성형 AI가 생성한 SCT가 너무 단순하다는 제한점이 있다. 잘 설계되고 더 복잡한 프롬프트를 사용하면 SCT의 품질을 향상시킬 수 있으며, 주제 전문가가 약간의 조정을 할 수 있다. 생성된 콘텐츠가 교육용으로 필요한 표준을 충족시키지 못할 수 있으므로 생성형 AI를 활용하기 위한 적절한 지침이 여전히 필요하다. 정신의학 7대 역량 개발에 기여하는 AI: CanMEDS 프레임워크 적용 분석 이 연구에서는 캐나다 의학 교육 지침(CanMEDS) 프레임워크를 기반으로 정신의학 교육에서 생성형 AI의 역할을 분석했다. CanMEDS는 의사소통자, 협력자, 리더, 건강 옹호자, 학자, 전문가, 의학 전문가 등 7가지 역량을 포함하며, 생성형 AI는 이러한 역량 개발에 기여할 수 있다. 사례 기반 학습을 통해 생성형 AI는 의학 전문가, 의사소통자, 협력자, 리더, 학자, 전문가 역할 개발에 기여할 수 있다. 또한 다학제 간 협력이 필요한 사례(예: 정신 및 신체 질환 조합)를 생성하여 학생들의 협력 기술 개발을 촉진할 수 있다. 시뮬레이션을 통해 학생들은 의사소통 프레임워크를 연습하고 동기 부여 인터뷰와 같은 의사소통 기술을 유연하게 사용하는 법을 배울 수 있다. 이는 의학 전문가와 의사소통자 역할에 부합한다. 학생들은 또한 시뮬레이터와의 대화 중 단어를 신중하게 선택함으로써 전문가적 경계를 유지하는 법을 배울 수 있다. 콘텐츠 합성 및 요약 기능은 학생들이 의학 전문가와 학자 역할을 구현하도록 격려한다. 생성형 AI는 질병 스크립트를 합성하여 학생들이 다양한 질병에 관한 필수 정보를 파악하도록 돕는다. 다만 정신 질환의 복잡성을 고려할 때, 정신의학 교육에서 GenAI 생성 질병 스크립트의 품질과 효과성을 향상시키기 위한 추가 연구가 필요하다. 마지막으로, 평가 도구 면에서 생성형 AI는 객관식 문제(MCQ)와 스크립트 일치 검사(SCT)와 같은 다양한 평가 문항을 생성할 수 있다. 이러한 문항은 환자의 사회경제적 또는 인종적 배경을 포함하여 학생의 객관성을 평가하고 비판단적 태도를 유지하도록 훈련시킬 수 있다. 생성형 AI 활용의 미래 전망 정신의학 교육에 생성형 AI를 도입하는 것은 여러 도전과제를 수반한다. 교육자들이 생성형 AI 사용에 주저할 수 있고, 온기, 공감, 개인적 상호작용 상실에 대한 우려가 있을 수 있다. 또한 많은 교육자와 임상의가 아직 정신의학 교육을 위한 생성형 AI 도구 사용 훈련을 받지 않았다. 생성형 AI와 관련된 위험을 해결하기 위해 윤리적 원칙에 기반한 명확한 지침을 수립하고, 더 포괄적인 데이터셋으로 생성형 AI를 훈련시켜 편향 가능성을 완화해야 한다. 또한 전문가들이 생성형 AI 생성 콘텐츠의 정확성과 관련성을 평가하기 위한 수동 검토를 수행해야 한다. 지금까지 생성형 AI의 역할은 다른 전문 분야와 임상 응용에서 광범위하게 논의되었지만, 정신의학 교육에서의 활용에 대한 분석은 미미한 수준이다. 정신의학의 복잡한 특성이 이 분야에서 생성형 AI 역할 탐색 부족에 기여하는 요인 중 하나일 수 있다. 다양한 언어로 콘텐츠를 번역하고 언어 장벽을 허물어 더 많은 국가에서 정신의학 교육 자원에 대한 접근성을 촉진하는 등 추가적인 응용 분야도 모색될 수 있다. FAQ Q. 정신의학 교육에서 생성형 AI는 어떤 역할을 할 수 있나요? A: 생성형 AI는 정신의학 교육에서 네 가지 주요 역할을 수행할 수 있습니다. 첫째, 사례 기반 학습을 위한 다양한 사례 비네트 생성, 둘째, 환자 역할 시뮬레이션을 통한 임상 기술 연습 기회 제공, 셋째, 질병 스크립트와 같은 교육 자료의 콘텐츠 합성 및 요약, 넷째, 객관식 문제와 스크립트 일치 검사와 같은 평가 도구 개발입니다. Q. 생성형 AI를 정신의학 교육에 사용할 때 주요 한계점은 무엇인가요? A: 생성형 AI의 주요 한계점으로는 콘텐츠 정확성 부족, 편향성, 생성된 콘텐츠에 대한 통제력 부족, 보안 및 개인 정보 보호 문제 등이 있습니다. 특히 정신 장애에 관한 질병 스크립트에서는 구체적인 단계 대신 일반적인 정보를 제시하는 경향이 있으며, 평가 도구 생성 시 복잡성이 부족한 경우가 있습니다. Q. 정신의학 교육이 다른 의학 분야와 다른 특성은 무엇이며, 이것이 생성형 AI 활용에 어떤 영향을 미치나요? A: 정신의학은 수술, 방사선, 내분비학과 같은 다른 전문 분야와 달리 소프트 대인관계 기술에 더 중점을 둡니다. 면담 기술, 정신 상태 검사, 자살 위험 평가, 동기 부여 인터뷰와 같은 기술적 능력보다 가르치고 평가하기 어려운 소프트 스킬이 요구됩니다. 이러한 특성으로 인해 정신의학 교육에서의 생성형 AI 활용은 다른 분야와 크게 다를 수 있으며, 의학 교육 전반에 관한 기존 연구가 정신의학에 직접 적용되지 않을 수 있습니다. ■ 이 기사는 AI 전문 매체 'AI 매터스'와 제휴를 통해 제공됩니다. 기사는 클로드 3.5 소네트와 챗GPT를 활용해 작성되었습니다. (☞ 기사 원문 바로가기)