과학산책
인공지능 기술이 밝혀줄 유전자 변이의 비밀
구글 딥마인드의 알파지놈(AlphaGenome)이 공개됐다. 사람의 DNA가 바뀔 때 유전자 작동이 어떻게 변할지, 인공지능을 통해 통합적인 결과를 제시해주는 프로그램이다. 기존에는 실험대 위에서 수 년에 걸친 실험을 통해야만 확인할 수 있었던 결과를, 컴퓨터 속 자동화된 실험을 통해 몇분 만에 끝낼 수 있게 됐다. 이는 DNA의 변화로 인해 발생하는 암이나 희귀유전질환에 대한 심도 깊은 이해를 가능케 할 것으로 기대된다.
생물은 저마다 다른 DNA를 지니고 있다. 이러한 DNA의 차이를 유전변이라고 하며, 변이는 생물의 다양성을 만들어내는 원천이다. 몸집 키 외형 유전질환 등 사람 사이에 나타나는 차이 중 상당부분이 이러한 유전변이로 인해 설명될 수 있다. DNA 변이가 다양한 생물의 차이에 강하게 영향을 주는 것이다.
DNA에는 단백질처럼 기능을 하는 분자에 필요한 정보를 담고 있는 유전자와 그 유전자를 언제, 어디서, 얼마나 작동하게 만들지를 조절하는 스위치가 포함돼있다. 단백질을 만드는 약 2만여개의 유전자에는 저마다 스위치가 달려있다. 서로 다른 세포는 저마다 다른 스위치를 눌러 서로 다른 유전자 조합을 작동시킨다. 어떤 유전자 조합이 작동하느냐에 따라 어떤 세포는 신경세포가 되고, 어떤 세포는 근육세포가 되는 식이다.
유전변이는 이러한 유전자의 작동 방식을 바꿔 차이를 만들어낸다. 대부분은 변이가 있다 한들 큰 차이를 만들어내진 않을 수도 있다. 하지만 때로는 유전자의 작동을 통째로 망가뜨려 암세포 발생을 촉진시키거나 희귀유전질환을 타고 나게 하기도 한다.
알파지놈, 유전자 스위치 영역 암호 추론
유전자 자체가 망가지기도 하지만 때로는 유전자의 스위치가 망가지기도 한다. 스위치가 망가지면 나이 먹었을 때 작동해야 하는 유전자가 극히 어릴 때부터 작동할 수도 있고, 신경세포에서 작동해야 하는 유전자가 근육세포에서 작동할 수도 있으며, 단백질의 양 조절에 실패하기도 한다. 이는 세포의 기능을 뒤바꿔 조직과 장기, 심하게는 몸 전체를 망가뜨리는 심각한 질환으로 이어지기도 한다.
문제는 사람이 지닌 변이의 수가 너무 많아 각각의 변이가 유전자의 작동을 어떻게 바꾸는지 명확하게 알기 어렵다는 것이다. 사람은 저마다 수백만개의 유전변이를 지니고 있다. 이중 유전자 자체를 망가뜨리는 변이를 찾아내는 건 상대적으로 쉬운 일이다. 단백질의 기능을 망가뜨리는 형태는 잘 알려져 있기 때문이다.
그러나 유전자 스위치에 자리잡은 변이에 대해서는 여전히 연구가 진행 중이다. 30억개의 DNA 어디가 스위치 역할을 하는지, 그 스위치가 어떤 방식으로 작동하는지, 지금도 명확하게 밝혀지지 않은 지점이 많기 때문이다.
요컨대 유전자에 대한 DNA 암호는 명확하게 밝혀졌지만 유전자의 스위치에 대한 DNA 암호는 명확하지 않았다. 이 스위치 암호해독을 위해 막대한 실험이 필요했고, 그만큼 비용과 시간이 많이 소요됐다.
DNA 스위치에 대한 암호문을 해독하기 위한 프로젝트인 인코드(ENCODE)와 진코드(GENCODE)가 대표적이다. 이들은 지난 10여년 간 스위치 암호 해독에 필요한 방대한 자료를 제공했다. 그러나 복잡성이 높아 암호문을 이해하기 위한 전문성이 필요했으며, 스위치에 발생하는 유전변이의 영향에 대한 평가는 모호한 채 남아있었다.
알파지놈은 이러한 진코드의 대규모 데이터를 활용해 스위치 영역에 대한 암호를 추론함으로써 유전변이에 대한 통찰을 가능케 한다. 이는 기존에 알려진 유전변이의 기능을 이해하는 데 핵심적인 기여를 할 것으로 기대된다. 암 환자 또는 희귀유전질환자에서 확인된 수많은 변이 중 기능을 모르는 유전 변이가 여전히 수도 없이 많기 때문이다.
예컨대 희귀유전질환자 중 유전변이를 통해 진단할 수 있는 사람은 절반도 채 되지 않는데, 이는 환자가 지닌 희귀 유전변이가 스위치 영역에 있을 경우 질환을 일으킬지 확정하는 것이 불가능했기 때문이다. 알파지놈을 활용해 미지의 유전변이의 기능을 확인할 수 있다면 유전질환을 명확하게 진단하는 것도, 이를 치료하는 것도 가능해진다.
인공지능 기반 바이오연구 활력 깃들길
유전체학 분야에서 인공지능의 발전이 눈부시다. 대규모로 쌓여있는 데이터를 기반으로 기존에 풀기 어려웠던 문제를 새롭게 정의하고, 이를 해결해 산업까지 연계하는 과정이 빠르게 진행되고 있다.
한국에서도 핵심 문제를 찾고 효과적으로 해결하기 위한 연구가 시급하다. 대형 인프라와 전문성 있는 인력을 중심으로 인공지능 기반 바이오연구에 활력이 깃들길 기대한다.