기고

바이오 AI, 독자 기술은 가능한가

2026-04-29 13:00:01 게재

단백질을 비롯한 생체분자의 상호작용을 정확히 예측하는 것은 생명현상 이해와 신약 개발에 핵심이면서도 오랫동안 과학의 난제로 여겨져 왔다. 2024년 노벨화학상 수상으로 주목받은 구글 딥마인드팀은 인공지능을 통해 이러한 난제를 해결하고자 이른바 두 개 이상 생체분자가 결합해 형성되는 복합체 구조를 예측하는 코폴딩(Co-folding) 모델 개발을 주도해 왔고, 그 성과로 알파폴드(AlphaFold) 시리즈를 공개했다. 그러나 가장 최신 모델인 알파폴드 3는 논문과 추론 코드가 공개되었음에도 상업적 활용에 제약이 있다.

이러한 상황 속에서 KAIST 컨소시엄(KAIST HITS Merck 아토랩 한국제약바이오협회 한국바이오협회)은 과학기술정보통신부가 추진하는 특화 파운데이션 모델 개발 사업을 통해 지난해 11월 독자적인 코폴딩 모델 개발에 착수하고, 프로젝트 시작 5개월 만에 기존의 코폴딩 모델과 유사한 정확도에 월등한 예측 속도를 가진 모델을 개발했다. 이로써 한국은 영국 미국 중국에 이어 독자적인 코폴딩 모델을 개발한 네번째 국가가 되었다.

독자적인 코폴딩 모델 개발 네번째 국가로

K-Fold는 알파폴드 3와 재현 모델들에서 활용되는 방대한 기존 단백질 서열·구조를 모아 패턴을 비교하는 다중서열정렬(MSA) 방식을 벗어나 이를 다중 모달리티 서열 표현 모델과 3차원 구조 표현 모델로 대체했다. 이를 통해 다중서열정렬 데이터가 없는 희소한 복합체 구조 예측과 동적 변화를 예측할 수 있는 새로운 접근법을 제시했다. 또 분자들이 물리적 결합 과정에서 구조가 어떻게 변화하는지를 학습하는 독자적인 생성 모델링 방식을 택했다.

특히 자유 상태에서 결합 상태로의 구조적 전이를 직접 학습하는 접근을 통해 기존 모델 대비 분자 간 상호작용을 보다 효과적으로 포착할 수 있도록 설계됐다. 그 결과 최신 표준 벤치마크인 생체분자 구조 예측 평가에서 알파폴드 3에 근접한 수준의 성능을 달성했다. 특히 차세대 약물로 주목받는 질병 단백질과 분해 단백질을 결합시켜 질병 단백질을 분해·제거하는 약물 성능 테스트에서 알파폴드 3 대비 116%의 예측 성공률을 기록했다.

이는 데이터가 제한적이고 구조가 복잡한 신규 약물 분야에서도 K-Fold가 높은 성능을 낼 수 있다는 것을 의미한다. 또한 알파폴드 3 대비 평균 추론 시간을 최대 30배까지 단축할 수 있음을 확인했다. 이는 바이오와 신약개발 연구현장에서 효율성을 획기적으로 높일 수 있음을 보여준다.

이러한 성과는 최근 신약개발 패러다임이 TPD ADC 등 복잡한 신규 약물 모달리티 중심으로 빠르게 전환되는 흐름과도 맞닿아 있다. 이들 시스템은 데이터가 제한적이고 구조적 복잡성이 높아 기존 접근법으로는 예측이 어려운 경우가 많다. K-Fold는 이러한 환경에서도 안정적으로 일반화할 수 있는 가능성을 보였다는 점에서 산업적 활용 측면에서도 중요한 의미를 가진다.

K-Fold는 정부 지원만으로 개발된 독자적인 모델로 알파폴드 3와 다른 방식으로 개발돼 유사한 성능에 도달한 유일한 사례다. 이는 프로젝트 개시 후 단 5개월에 이룬 성과로 올해 9월까지 개발을 완료할 경우 알파폴드 3의 한계를 뛰어넘는 세계 최고의 코폴딩 모델이 될 것으로 기대된다.

한국 R&D가 나아갈 방향에 중요한 시사점

이번 성과는 글로벌 기술 경쟁이 심화되는 상황에서 독자적 AI 기술 확보의 중요성과 대한민국의 R&D가 나아가야 할 방향에 중요한 시사점을 던진다.

김우연 KAIST 교수