인공지능 신약개발

AI활용 신약개발, 데이터 공유 없이는 '난항'

2024-01-23 10:45:42 게재

연구개발 데이터 유출 한계 넘어 개방적 협력이 성공 관건 … 4월 K-멜로디(연합학습) 시행

인공지능(AI)이 제조업뿐만 아니라 사회전반에 혁신적 변화를 가져오면서 국가간 기업간 AI기술 경쟁이 치열하게 펼쳐지고 있다. 제약바이오업계의 신약개발에도 AI가 적극 도입되고 있다. 제약업계에 따르면 세계 AI 신약개발 시장은 매년 평균 45.7% 성장해 2027년에는 40억350만달러(한화 약 5조원)에 이를 것으로 전망된다. 우리나라의 AI 신약개발 누적 투자유치 금액은 약 6000억원 규모다.
하지만 AI 신약개발을 가속화하기 위해서는 데이터 부족 해결 등 넘어야할 산들이 많다. 이를 해결하기 위해 유럽연합은 민관협력 프로그램을 통해 연합학습 플랫폼을 이용한 신약개발 모델을 제시했다. 우리나라는 한국형 연합학습 기반 신약개발 가속화 프로젝트(K-멜로디)를 국가사업으로 추진, AI 모델을 개발하고 이를 제약기업들이 활용하도록 해 신약개발의 효율성을 극대화한다는 계획이다. 연합학습기반 신약개발 모델이 제시되는 배경에는 세계적으로 제약바이오기업의 자체 연구개발 데이터를 대외적으로 유출하지 않는 풍토와 관련이 있다. 신약개발 단계가 높아질수록 사용가능한 데이터가 줄어들기에 데이터 공유 활용은 AI 기술 가치를 높이는데 중요한 조건이 된다. 관련된 국내외 흐름을 살펴보고 AI 신약개발 가속화를 위한 방안을 모색한다.

제약바이오업계의 신약개발에도 AI가 적극 도입되고 있다. 하지만 연구개발 데이터 공유 등 해결해야 할 과제가 많다. 사진 이미지투데이


신약개발에 있어 AI 활용의 가치는 매우 높은 것으로 알려졌다. 10년 이상의 개발기간과 1조원 안팎의 비용으로 높은 진입 장벽 특징을 가진 신약개발의 한계를 해소할 것이라는 기대가 있다. 하지만 신약개발에 있어 AI 도입의 가장 걸림돌 중 하나로 연구개발 데이터의 분산과 고립 문제가 있다. 이를 극복하지 않으면 AI 신약개발 속도는 더딜 수밖에 없다는 지적이 나온다.

23일 홍성은 한국제약바이오협회 AI신약융합연구원 연구원은 "최근 AI 기술 의 발전은 신약개발 분야에 AI 도입을 촉진했다. 하지만 데이터 공유 활용문제는 해결해야 할 과제로 남아 있다"며 "기업들이 적극적으로 참여할 수 있는 환경을 만들고 협력해 글로벌 경쟁에 힘을 모아야 한다"고 말했다.

◆AI 활용 신약개발, 개발 기간과 비용 줄여 = 제약바이오산업에 대한 AI 투자와 가치는 확대되고 있는 것으로 나타났다. 글로벌데이타는 2022년 7월 제약산업의 AI에 대한 총 지출은 2025년까지 30억달러를 넘어설 것으로 예측했다. 같은 해 12월에는 의료업계 전문가의 50%가 향후 2년 동안(2023년 ∼2024년) 신흥산업 투자 대상으로 AI을 우선시 할 것이라는 조사 결과도 냈다.

헬리욘저널은 2023년 6월 "지난 10년간 컴퓨터 하드웨어 발전과 생성된 의료데이터로 AI를 적용해 신약개발 파이프라인의 다양한 단계를 개선할 수 있을 것"이라고 밝혔다.

바이오파마트렌드는 지난해 11월 "AI와 임상시험의 융합은 약물 발견 과정을 가속화할 뿐만 아니라 개발된 치료법의 역량과 효능을 향상시킬 수 있을 것"이라고 소개했다.

바이오파마트렌드가 소개한 '임상시험에서 AI의 주요 장점'을 살펴보면 먼저 AI 기술을 활용해 환자 모집과 선별 프로세스를 개선해 방대한 양의 환자 데이터를 분석하고 환자를 선별해 인터뷰하는 시간과 자원을 줄일 수 있다.

환자행동과 약물 효능을 예측한 임상시험 설계와 최적화를 통해 '최적의 환자집단' '치료요법 및 복용량을 식별'해 효율적이고 효과적인 임상시험을 만들 수 있다.

데이터 수집과 분석을 자동화해 전자건강기록, 행정문서, 건강조사에서 나오는 데이터를 포괄해 우수한 데이터 수집과 관리, 시험결과를 강화할 수 있다.

또 공급업체가 환자의 건강 및 치료 반응, 시험 프로토콜 준수를 원격으로 모니터링 할 수 있도록 해 임상참여 환자의 중도 탈락률을 줄일 수 있다.

특정치료에 가장 적합한 환자모집단을 결정해 시험 설계를 개선하고 성공률을 높이는 동시에 시험실패 또는 환자 피해의 위험을 최소화하며 잠재적인 안전문제를 조기에 발견하는 등 예측모델링 활용이 가능하다.

또한 예상치 못한 부작용을 감지해 최소화한다. 다양한 소스의 데이터를 분석해 잠재적인 부작용을 빠르고 정확하게 식별해 심각한 사고 가능성을 줄이고 임상결과를 개선할 수 있다.

현재 AI가 이용되는 주요 응용분야는 기계학습 알고리즘을 통한 '표적의 식별과 검증', '화합물의 가상 스크리닝 및 새로운 약물 설계', '약물 용도 변경', '치료반응 바이오마커 식별' 등이다. 바이오마커는 DNA, RNA, 대사물질 등을 이용해 몸의 변화를 알아 낼수 있는 지표다.

사진 이미지투데이

◆국내외 제약사, IT기업 협력 확대 = 해외 주요 제약기업들은 신약개발에 AI를 활용하기 위해 독자적인 연구시설을 설립하거나 AI 기업들과 파트너십을 체결하고 협업 연구를 활발히 진행하고 있다. 독자적연구시설 설립 기업으로는 화이자(디지털혁신센터), 아스트라제네카(데이터사이언스&인공지능센터), 사노피(AI 신약개발가속센터) 등이다. 2017년부터 2023년 3월까지 글로벌시장에서 협업 건수는 240건이다.

구글 아마존 엔비디아 등 IT기업들도 신약개발 AI플랫폼을 개발해 제약기업에 제공하거나 협업을 통한 신약개발 연구를 수행하고 있다. 구글은 단백질구조 예측 플랫폼 알파폴드2를 개발·공개하고 신약개발 자회사 아이소포픽랩스를 설립했다. 아마존과 엔비디아는 클로우드 기반 AI 신약개발 플랫폼을 출시했다.

약물표적 발견 사례를 보면 2023년 3월 아스트라제네카와 베네볼런트AI가 협력 연구해 AI로 특발성 폐섬유화증의 잠재 표적 5개를 생성했고 후보 검증 작업 중이다.

약물제제 분야 협력사례를 보면 2023년 4월 머크와 크리스탈파이는 당뇨병치료제인 메트포르민 HCI의 결정 습관에 대한 고분자 첨가제 영향 예측 연구에서, 크리스탈파이의 형태 예측 플랫폼과 머크의 실험기술을 활용해 '포괄적 스크리닝 접근방식을 개발'했고 첨가제의 영향을 성공적으로 예측했다.

국내 제약바이오기업들도 AI 전담부서를 설치, 자체 AI 플랫폼 구축, AI 기업과의 협업 연구 및 지분 투자를 통해 신약개발에 AI를 도입 활용하고 있다. 2023년 기준 52개 기업에서 총 88건의 협업을 수행 중이다.

동아에스티의 경우 2021년 9월 심플렉스와 중추신경계 질환 분야에서 AI를 활용한 혁신신약 개발에 본격적으로 나섰다. 2022년 7월 동아에스티, 심플렉스, 연세암병원 폐암센터장 조병철 교수팀이 함께 진행 중인 '설명가능한 인공지능 플랫폼 고도화로 혁신 폐암신약 발굴' 연구가 정부 지원과제에 선정됐다.

한태동 동아에스티 합성연구실장(한국제약바이오협회 AI신약개발전문위원장)는 "신약개발은 데이터를 기반으로 연구가 진행되기에 AI 활용은 반드시 도움이 된다"며 "동아에스티는 다양한 분야의 AI기업과 협업을 통해 많은 연구개발에 AI를 활용해 나갈 것"이라고 말했다.

◆AI 신약개발 가속화를 위한 조건들 = AI의 신약개발에서 활용가치는 누구나 동의한다. 하지만 신약개발 환경에서 나타나는 기업의 데이터의 고립 문제는 AI가 활용 가능한 데이터 부족문제를 낳고 결과적으로 AI 신약개발 가능성을 떨어뜨리는 요인이 된다.

일반적인 신약개발 과정에서는 수집 가능한 데이터는 연구단계가 높아질수록 적어진다. 물질 탐색단계에서 1만개 이상의 물질이 사용, 선도 물질 도출 후에는 250개, 전임상에서는 10∼20개, 임상1상에서는 6개 이하만 남게 된다. 더욱이 대부분의 신약개발 연구는 기업 주도로 이뤄져 기업의 비용 투입으로 생산된 데이터는 기업이 소유권을 갖고 데이터 유출 시 기업 연구 비밀도 노출되는 위험성이 있다.

이 때문에 신약개발 과정에서 발생한 데이터의 외부 접근을 막아야 하고 데이터의 독점적 사용이 더 가치가 있었기에 데이터의 고립현상은 업계의 흔한 모습이었다.

하지만 최근 빅데이터와 이를 기반한 AI기술의 발전은 데이터 공유 활용 필요성을 높인다. 제약바이오업계의 연구개발 데이터를 공유하지 못하면 AI 입장에서는 치명적이다.

홍 연구원은 "신약개발 환경에서 야기되는 데이터 고립 문제는 AI가 활용가능한 데이터 부족 문제를 동반한다"며 "제약산업이 AI의 실질적 효과를 체감하기 위해서는 반드시 해결해야만 하는 과제"라고 말했다.

◆개인정보 보호하면서 연구결과 공유 가능한 환경 갖춰야 = 데이터 공유 활용의 발전된 사례로 유럽멜로디 프로젝트가 있다. 세계 최초의 10개 제약사 간 데이터 협력이 이뤄진다. 블록체인과 '연합학습' 기술을 활용해 여러 기업이 협업하면서 연구 비밀 노출 없이 약물 탐색단계의 약물 동태 예측 AI 모델 개발이 가능한지 검증도 했다.

연합학습은 데이터를 교환하거나 한곳으로 모을 필요없이 분석 결과만을 중앙서버로 전송하는 분산형 학습기법으로 데이터의 개인정보와 연구비밀 보호, 공동 활용이 동시에 가능하다.

2019년 6월부터 2022년 5월까지 약 3년간 258억원 자금을 지원받았다. 얀센, 아스트라제네카, 캘럭스, 머크, 바이엘, 노바티스, 아스텔라스, 암젠 등 제약사와 오킨, 익토스, 엔비디아 등 기술기업이 참여했다.

우리나라도 올 4월 '연합학습 기반 신약개발 가속화 프로젝트'로 K-멜로디가 추진된다. 정부는 K-멜로디를 통해 국내 신약개발 분야의 분산 저장된 채 제대로 활용하지 못하고 있는 데이터의 고립 문제를 중점적으로 해결하려고 한다.

K-멜로디는 국내 22개 제약기업을 비롯한 다수 AI기업과 IT기업, 대학과 공공기관이 참여하는 전방위 AI신약개발 협력사업이다. 국가차원의 개방형 플랫폼으로 운영된다는 면에서 유럽멜로디와 차이난다.

한국제약바이오협회는 지난해 7월 '뉴노멀시대의 도래와 신약개발' 이슈리포터에서 AI 신약개발 가속화를 위해 △AI 신약개발 기술 로드맵 수립 △데이터 활용 활성화 △융합인재 양성 △공동연구 활성화 등을 제안했다.

특히 신약개발 분야에서 AI 모델의 성능에 대한 신뢰문제가 발생하고 있는데 신약개발 AI모델의 기술 검증 기준, 자동화 정도를 식별하는 기준, AI 기술혁신의 방향과 전략을 담을 필요성이 제기된다.

또 AI 신약개발 현장의 어려움 중 하나는 다학제 융합 전문인력의 부족이다. AI 신약개발 분야의 인력난을 조기에 해소하려면 재직자의 직무전환을 돕는 AI 신약개발 교육의 확대와 인공지능(융합)대학원에 AI 신약개발 교육과정을 개설해 융합인재가 현장에 지속 공급될 수 있는 시스템을 짜야 한다.

김규철 기자 gckim1026@naeil.com
김규철 기자 기사 더보기