KAIST, 새로운 AI 학습법 개발
시간이 경과해도 인공지능 모델 성능을 일정하게 유지하는 새로운 학습 데이터 선택 기술이 개발됐다. KAIST(총장 이광형)는 전기및전자공학부 황의종 교수 연구팀이 시간에 따라 데이터 분포가 변하는 드리프트 환경에서도 인공지능이 정확한 판단을 내리도록 돕는 새로운 학습 데이터 선택 기술을 개발했다고 14일 밝혔다. 최근 실생활에 활용되는 인공지능 모델은 시간이 지남에 따라 성능이 점차 떨어지는 현상이 일부에서 발견됐다. 실제 SK 하이닉스 반도체 공정 과정에서 시간에 따른 장비 노화와 주기적인 점검으로 인해 센서 데이터 관측 값이 지속 변하는 드리프트 현상이 관측됐다. 시간이 지나면서 데이터와 정답 레이블 간 결정 경계 패턴이 변경되면, 과거에 학습되었던 AI 모델이 내린 판단이 현재 시점에서는 부정확하게 되고, 모델 성능이 점차 떨어질 수 있다. 지속가능한 AI학습 프레임워크로 해결 연구팀은 이러한 문제 해결을 위해 데이터를 학습했을 때 AI 모델의 업데이트 정도와 방향을 나타내는 그래디언트(gradient)를 활용한 개념을 도입했다. 이 개념이 드리프트 상황에서 학습에 효과적인 데이터를 선택하는 데에 도움을 줄 수 있다는 것을 실험으로 확인했다. 연구팀은 또 이러한 분석을 바탕으로 지속 가능한 데이터 중심의 AI 학습 프레임워크를 제안했다. 이 기법은 데이터 자체를 직접 전처리해 현재 학습에 최적화된 데이터로 바꿔준다. 기존 AI 모델 종류에 상관없이 쉽게 확장할 수 있다. 실제 이 기법을 통해 시간에 따라 데이터의 분포가 변화되었을 때에도 AI 모델의 성능, 즉 정확도를 안정적으로 유지한다. 제1저자인 김민수 박사과정 학생은 "인공지능을 한번 잘 학습하는 것도 중요하지만, 그것을 변화하는 환경에 따라 계속해서 관리하고 성능을 유지하는 것도 중요하다는 사실을 알릴 수 있으면 좋겠다ˮ고 말했다. 연구팀을 지도한 황의종 교수는 “인공지능이 변화하는 데이터에 대해서도 성능이 저하되지 않고 유지하는 데에 도움이 되기를 기대한다”고 덧붙였다. 이 연구는 KAIST 전기및전자공학부 김민수 박사과정이 제1저자, 황성현 박사과정이 제2저자, 그리고 황의종 교수(KAIST)가 교신 저자로 참여했다. 이번 연구는 지난 2월 캐나다 밴쿠버에서 열린 인공지능 최고 권위 국제학술 대회인 '국제 인공지능 학회(Association for the Advancement of Artificial Intelligence, AAAI)'에서 발표됐다. 한편, 이 기술은 SK 하이닉스 인공지능협력센터(AI Collaboration Center; AICC) 지원을 받은 '노이즈 및 변동성이 있는 FDC 데이터에 대한 강건한 학습' 과제와 정보통신기획평가원의 지원을 받은 '강건하고 공정하며 확장가능한 데이터 중심의 연속 학습' 과제, 한국연구재단 지원을 받은 '데이터 중심의 신뢰 가능한 인공지능' 과제 성과다.