[미래의료] 데이터 이슈 발목잡힌 AI 신약개발, 한계 극복 가능해져
정보통신 기술에 힘입어 보건의료 영역의 디지털 전환이 가속화되고 있다. 전 세계는 디지털 헬스케어(Digital Healthcare)를 통한 신종 감염병, 초고령화 시대, 지역 간 건강격차 해소 등 우리 앞에 놓인 적대적 환경을 극복하려는 노력을 기울이고 있다. 지디넷코리아는 총 3회에 걸쳐 연합학습 기술 기반 인공지능(AI) 신약개발의 글로벌 추세와 우리나라의 역량 강화 방안을 소개한다. [편집자 주] 아직 국내에서 활성화 되어 있지 않은 인공지능(AI)을 활용한 신약개발. 최근 전 세계적으로 연합학습(Federating Learning) 기반 신약개발 가속화 프로그램이 주목받고 있어, 우리나라에서의 적용 필요성이 대두된다. 연합학습 기술이란, 기존 머신러닝 학습 과정에서 데이터를 한 곳에 모아놓고 학습이 이뤄졌다면, 데이터를 한곳에 모아야하는 수고를 없앤 기술이다. 가령, 각 기업 내에서 AI모델을 구동시키되, 데이터는 외부로 도출되지 않으면서 함수값만 학습을 시키게 되면 기업의 기밀 정보 등에 대한 유출 이슈를 극복할 수 있게 된다. 뿐만 아니라 데이터의 편향성이나 규모 등도 극복 가능하다. 이러한 이점 때문에 지난 2020년부터 해외 빅테크 기업 등지에서 관련 연구와 솔루션까지 개발해 활용이 활발하다. 특히 헬스케어 분야에서의 연합학습 활용은 비용 절감 등의 장점으로 주목받고 있다. 미국 국립보건원(NIH)에 따르면, 제약사의 신약개발 연구개발(R&D) 비용은 지난 2021년 기준 2조1천193억 원 가량이다. 그런데 이 가운데 'ADME/Tox(약물대사와 독성)' 분석비는 전체의 22%(4천600억 원)를 차지한다. NIH는 연합학습 기반 신약개발 프로그램 적용 시 4천600억 원을 절감할 수 있을 것으로 전망했다. 지난 2019년부터 유럽연합은 총 1천840만 유로를 투입해 10개 제약기업과 AI 기업 7개사가 참여하는 '유럽연합 연합학습 기반 신약개발 가속화 프로젝트' (EU Machine Learning Ledger Orchestration For Drug Discovery, EU-MELLODDY)를 추진했다. 이 사업은 AI를 신약개발에 활용하면서부터 제기된 문제, 즉 신약개발에 필요한 데이터가 제약별로 분산, 고립돼 있는 문제를 극복하자는 취지에서 추진됐다. 유럽 내에서도 제약사간 데이터 기반 협력을 한 경험이 없었기 때문에 제약사 사이에 후보물질 발굴단계를 종합해 연합학습이 이뤄졌다. 이를 위한 연합 플랫폼이 개발됐고, 여러 기관과 기업의 데이터가 융합됐다. 그 결과, EU-멜로디 사업은 개별 기관이 보유한 데이터로 AI가 학습했을 때 성능은 0에 불과했지만, 연합학습 시 유의미한 성능향상이 있었다. 한국제약바이오협회 AI신약개발지원센터의 홍성은 선임연구원은 “EU-멜로디 사업을 통해 2%~4% 이상의 신약후보물질 발견이라는 성능 향상 수치가 도출됐다”며 “결국 신약개발 과정의 시행착오 감소와 개별보다는 여러 데이터를 연합학습을 했을 때 성능이 비약적으로 상승한다는 결과가 입증된 것”이라고 설명했다. 이어 “제약바이오기업의 입장에서는 수요에 맞춘 AI 기술개발이 이뤄지게 돼 AI 주도 신약개발 속도가 빨라질 수 있다”며 “데이터 노출 이슈 극복으로 공공데이터 및 민간데이터 활용 활성화도 기대할 수 있다”고 강조했다. 우리에게도 시사 하는 바가 적지 않다. 국내에서는 AI를 활용한 신약후보물질 발견 등 신약개발 과정에서 AI 활용 사례가 늘어나고는 있지만, 개별 기업과 기관이 축적한 데이터의 공유는 사실상 이뤄지지 않고 있다. 민간 기업 단위에서 신규 데이터 확보와 신약 타깃에 적합한 학습을 시키기도 녹록치 않다. 아울러 연합학습 기술 인식 또한 높지 않은 실정이다. 때문에 우리도 EU-멜로디 사업과 같은 정부 차원의 적극적인 기술 도입 및 실증이 필요하다는 목소리가 커지고 있다. 무엇보다 기업들이 원하고 있다. 실제 한국제약바이오협회 AI신약개발 전문위원회 소속 기업 가운데 20개사 이상이 향후 연합학습 사용에 참여하겠다는 의사를 밝히기도 했다. 홍성은 선임연구원은 “이미 연합학습을 활용한 AI신약개발 효과가 검증된 만큼, 향후 우리나라에서는 실증사업 등으로 실제 사업에 적용한 형태의 사업을 고려해볼 수 있다”며 “약물대사와 독성 분야에 대한 테스트를 진행한 이후 연합학습 적용의 효과를 제약사들이 인지하게 되면 이후 적용 분야는 더 늘어날 것”이라고 전망했다. 아울러 “전 세계가 AI 신약개발에 나서고 있는 상황에서 신기술의 빠른 도입과 활용은 관련 분야를 선도할 가능성을 높여준다”고 기대했다.