"분자 생성 AI로 신약 개발 효율을 15배 높였어요"
꿈은 삶의 이정표이자 동력이다. 꿈은 곧 미래의 삶이다. 꿈은 그래서 소중하다. 꿈은 사람마다 다르고 다른 만큼 다채롭다. 스타트업이 꾸는 꿈도 그럴 것이다. 소중하고 다채롭다. '이균성의 스타트업 스토리'는 누군가의 꿈 이야기다. 꿈꾸는 사람이 자신의 이야기를 들려주고 다른 꿈꾸는 사람을 소개하는 릴레이 형식으로 진행된다. [편집자주] “분자 생성 AI로 신약 개발 효율을 15배 높였어요” 발견과 발명은 반복되는 시행착오 끝에 얻어지는 성과다. 신약 개발도 그러하다. 한 논문에 따르면 보통 신약 하나를 개발하는 데는 10여년이 걸린다. 여기에 드는 비용도 평균 3조원에 육박하는 것으로 알려졌다. 신약 개발 기간이 길고 비용이 많이 드는 까닭은 약효가 있는 새로운 물질(분자구조)을 합성할 때 성공확률이 극히 낮기 때문이다. 무려 9000분의 1이라고 한다. 분자 합성 실험 한 번에 보통 3주 이상이 걸리고 수백만 원의 비용이 든다. 하나의 실험을 하느냐 마느냐는 결국 시간과 비용에 관한 결정이다. 임재창 히츠 공동창업자는 인공지능(AI)을 이용해 이 결정에 도움을 줌으로써 신약 개발의 시행착오를 줄여 효율을 높이려고 한다. ■시행착오는 왜 불가피한가 신약 개발은 인체에서 질병을 일으키는 단백질을 찾아내고 이와 상호 작용을 일으켜 질병을 치료하기 위한 물질(화합물)을 만들어내는 것이다. 이 개발 과정은 보통 4단계로 진행된다. 기초-탐색 연구, 비임상, 임상, 허가-승인 등이다. 이 과정을 거쳐 9000개의 후보 물질 가운데 딱 하나가 신약이 된다. 개발기간으로 따지면 보통 기초-탐색 연구에 5년, 비임상 1.5년, 임상 5년, 허가-승인 2년 등이 소요된다. 기초-탐색 연구는 질병 유발 단백질을 찾아내고 이를 치료할 수 있을 것으로 예측되는 후보 물질을 탐색하는 것을 말하는 데 보통 9000에서 1만개의 물질 목록이 생성된다. 비임상은 안정성 실험을 통해 후보물질을 최적화하는 단계로 목록이 50개로 줄어든다. 임상은 보통 3단계로 진행되며 다시 화합물이 5개로 줄어든다. 이중 최상의 물질이 허가와 승인 과정을 거쳐 신약이 된다. “9000에서 1만개의 후보 물질 가운데 어떤 것이 최상의 약효를 가질지를 알 수 없으니 다 실험을 해야 하잖아요. 그런데 후보 물질이긴 하지만 실패할 확률이 높다면 실험을 안 해도 되는 것이죠. 히츠가 개발한 시스템은 인공지능을 통해 후보 물질을 발굴하고 이와 단백질의 관계를 예측해주는 것이에요.” ■인공지능 신약 개발 플랫폼 '하이퍼랩' 신약 개발을 위한 실험의 시행착오를 조금이라도 줄이기 위해 히츠가 개발한 것이 '하이퍼랩(HYPERLAB)'이다. '인공지능 신약 개발 플랫폼'이다. 서비스형 소프트웨어(SaaS) 형태로 제공되며 직관적 UI가 특징이다. '하이퍼랩'은 주로 신약 개발 초기 기초-탐색 연구 단계에 초점을 맞추고 있다. “생성형 AI는 무언가를 만들어내는 AI잖아요. 우리가 AI를 통해 만들어내려 하는 것은 분자(Molecule)예요. 정확히는 신약 후보 물질이 될 분자죠. 과거의 데이터를 학습해서 신약 물질 후보가 될 분자의 구조를 디자인하고 제안해주죠. 우리는 특히 '스캐폴드 기반 분자 생성 모델(Scaffold-based molecular generative model)'을 개발하였어요. 스캐폴드는 물성을 특정 짓는 분자의 뼈대라고 할 수 있죠. 이를 고정해놓고 합성을 통해 분자 구조를 점진적으로 바꿔가며 새 분자를 만들죠.” 스캐폴드는 물질의 물성과 깊은 관계가 있고, 스캐폴드를 유지한 채 합성을 통해 분자 구조를 점차적으로 바꿔간다면, 무작위로 분자를 합성하는 것보다, 원하는 물질을 찾아가는데 더 효과적이라는 의미로 이해됐다. 하이퍼랩은 분자 생성 모델과 함께 '물질-단백질 상호 작용 예측 모델'도 갖고 있다. 데이터 학습을 통해 약물 후보 물질과 질병의 원인으로서의 단백질 사이의 상호 작용과 결합 구조를 예측해주는 것이다. 이 예측이 정확하다면 분자 합성 실험을 할지 말지 고민스러울 때 중요한 참고자료가 되는 것이겠다. 하이퍼랩은 또 '분자 탐색 모델'도 있다. 천문학적인 숫자의 분자 가운데에서 후보가 될 수 있는 물질을 빠르게 탐색한다. “하이퍼랩은 신약 개발 초기에 후보 분자 대규모 가상 탐색부터, 물성 예측, 신규성 있는 분자 설계까지 할 수 있습니다. 이 과정을 통해 필요 없을 것으로 보이는 후보 물질은 실험에서 제외시킬 수 있는 것이죠.” ■“효과가 15배나 커진 사례도 나왔죠” L사는 '타깃 A(질병 단백질 가운데 하나)'에 대한 특허성 있는 신규 골격(스캐폴드)을 찾고 있었다. 이 타깃과 관련해서는 이미 1000개 이상의 물질에 광범위하게 특허가 걸려 있었다. 특허를 낼 새 물질을 찾기가 그만큼 어려운 것. 관건은 천문학적인 숫자의 분자를 빠르게 탐색하고 '타깃 A'에 맞게 선별하는 것. 이를 위해 L사가 손잡은 게 히츠의 하이퍼랩이다. “히츠의 '약물-단백질 상호작용 예측 모델'의 성능을 검증하기 위해 우선 타깃 A와 기존에 보고된 활성분자의 예측값을 돌려보고 이를 실험값과 비교했어요. 타깃 A에 대한 실험 결과를 우리 모델 학습에 전혀 사용하지 않았지만 R값이 0.6으로 나타났지요. 이는 예측값의 정확도가 높다는 것을 뜻하지요. 그런 뒤 우리 '스캐폴드 기반 분자 생성 모델'을 통해 타깃 A에 대해 활성을 보일 확률이 높은 후보물질을 디자인했어요. 그런 다음 다시 '약물-단백질 상호작용 예측 모델'을 통해 우선 실험할 상위 분자를 선별했죠. AI의 이 작업이 끝나고 나서 L사 의약화학자가 후보 분자를 재선별하고, L사의 의약합성팀에서 검토한 뒤 유도체를 생성해 분자를 합성하는 후속 실험에 들어갔죠. L사는 이 과정을 통해 6개월간 활성물질 15종을 확인할 수 있었습니다. 히츠를 만나기 전에는 1년 동안 단 2종의 활성 물질을 확인할 수 있었을 뿐이라고 해요. 하이퍼랩을 이용하니 효율을 15배 가량 높였다고 볼 수 있는 것이지요.” ■“논문 기술이 아니라 산업에 적용될 기술” 히츠가 갖고 있는 AI 신약 개발 플랫폼은 임재창 공동창업자의 박사 학위 논문 주제이기도 하다. 논문을 쓰던 중 문득 생각했단다. '논문상에서만 작동하는 기술이 아니라, 실제 현실에서 가치를 창출하는 기술을 만들고 싶다.' 창업에는 고민도 컸다. 창업은커녕 회사 생활도 안 해본 터라 '내가 과연 회사를 운영할 수 있을까'를 생각해보지 않을 수 없었다. 그 때 힘이 된 게 지도교수였다. KAIST 화학과 김우연 교수. 김 교수가 공동창업을 제안했고 히츠 팀이 출발하게 됐다. 2020년 5월이었고, 임재창 공동창업자는 당시 스물여섯이었다. 그 이후 누적으로 100억 원을 투자받았고, 팀원은 31명으로 불어났다. 고객도 늘어났다. 300여개의 제약회사, 신약개발연구소, 대학 등이 하이퍼랩을 쓰고 있다. 지난해 10월 처음 유료화를 시행해 매출도 발생하고 있다. “앞으로는 인간이 상상하지 못했던 분자 구조를 AI를 포함한 디지털 기술이 생성할 것입니다. 코로나19 팬데믹처럼 감염병이 발생할 때 가능하면 빨리 치료제가 나오면 좋겠지요. 신약 개발의 디지털 전환이 필요한 이유일 것입니다. 그 과정에서 히츠가 영향력 있는 역할을 하는 팀이 될 수 있도록 노력할 것입니다.” 덧붙이는 말씀: 임재창 히츠 공동창업자가 다음 인터뷰 대상으로 추천한 사람은 콘테크 스타트업 메이사의 김영훈 대표입니다.