재미있는 환경과학 이야기

파편화된 분자와 인공지능으로 33억년 전 생명 흔적 읽는다

2025-11-24 13:00:01 게재

화석은 물론 화학·생물학적 지문으로 유기체 확인

시간을 가로지르는 생명 탐구의 새로운 도전 직면

생명의 흔적을 찾는 인간의 도전은 어디까지 진화할 것인가. 화석은 물론 유전자, 눈에 보이지 않는 분자 수준의 흔적까지 확인하는 단계까지 과학 기술은 빠르게 발전하는 중이다. 33억년 전 생명의 화학적 지문을 인공지능으로 찾아내는 단계까지 진화했다. 생명은 어떻게 변화했고 왜 지금 여기 있으며, 앞으로 어디로 갈 것인지에 대한 근본적인 답을 찾기 위한 인류 도전이 새로운 국면에 접어든 것이다.

24일 국제학술지 ‘미국국립과학원회보(PNAS)’의 논문 ‘열분해 가스크로마토그래피-질량분석법과 지도학습 머신러닝으로 확인한 시생대 암석의 생명 유기지화학적 증거’에 따르면, 머신러닝 기법을 활용해 약 33억년 전 고대 암석에서 생명의 분자적 증거를 발견하는 데 성공했다. 머신러닝 기법은 컴퓨터가 대량의 자료에서 유형을 스스로 찾아내 학습하는 인공지능 기술이다.

인공지능으로 합성한 이미지. 사진 클립아트코리아

◆머신러닝으로 고대 생명 비밀 풀어 = 카네기 과학연구소의 로버트 헤이즌 박사 연구팀은 △현대 동식물 △화석 △운석 △실험실에서 합성한 유기물 등 샘플 406개를 분석했다. 열분해 가스크로마토그래피-질량분석법(pyrolysis-GC-MS)으로 각 샘플의 분자 조각 분포 유형을 측정한 뒤 랜덤 포레스트 머신러닝 모델로 학습시켰다. 로버트 헤이즌 박사는 광물 진화론과 생명 기원 연구의 세계적인 권위자다. 또한 이 연구에는 앤드루 놀 미국 하버드대학교 교수, 로저 서먼스 미국 매사추세츠공대(MIT) 교수 등 고생물학·지구화학 분야 세계적 석학들이 참여했다.

아주 간단히 설명하면 열분해 가스크로마토그래피-질량분석법은 샘플을 고온으로 태워 분해한 뒤 생성된 분자 조각들을 하나씩 분리해 무게를 재서 어떤 성분으로 이뤄졌는지 밝혀내는 분석 기법이다. 랜덤 포레스트 머신러닝 모델은 수백 개의 의사결정 나무가 각자 판단한 결과를 종합해 다수결로 최종 답을 찾는 인공지능 학습 방법이다.

이 논문에 따르면 생체분자는 기능을 위해 선택된 특성을 가지고 있기 때문에 고도로 분해된 상태에서도 생물학적 기원을 구별할 수 있는 유형이 남아있다. 이러한 특성 때문에 개별 생체분자가 완전히 파괴된 상태에서도 관련 정보를 추출할 수 있다.

인공지능을 활용한 분석 결과, 생물 기원과 비생물 기원 샘플을 93% 정확도로 구분했다. 광합성 생물과 비광합성 생물도 93% 정확도로 분류했다. 특히 현대 식물과 운석은 100% 정확도로 구별해냈다. 이를 통해 연구팀은 남아프리카 바버튼 그린스톤 벨트의 33억년 전 조세프스달 처트(Josefsdal Chert)에서 생물 기원의 유기물을 확인했다고 밝혔다. 또한 25억년 전 가모한 지층(Gamohaan Formation)에서는 광합성의 분자적 증거를 발견했다. 이는 기존에 확인된 생체분자 화석 기록을 약 10억년 더 과거로 확장시킨 성과다.

조세프스달 처트는 남아프리카에 있는 33억년 전 고대 암석 지층이다. 지구 최초기 생명체들이 남긴 화석이 발견되는 곳이다. 당시에는 화산 활동이 활발했고 뜨거운 물이 솟아나는 환경에서 미생물들이 살았다.

가모한 지층은 같은 지역의 25억년 전 암석이다. 광합성을 하던 미생물들이 만든 독특한 구조가 남아있다. 이 시기는 지구에 산소가 본격적으로 늘어나기 직전으로 초기 광합성 생명체 연구에 매우 중요하다. 이 두 지층에서 인공지능을 이용해 생명의 화학적 지문을 명확하게 확인했다는 점에 이번 연구의 의의가 있다.

◆물 대기 등에 남긴 DNA로 유기체 확인 = 생명체 흔적을 찾는 노력은 화학적 지문뿐만 아니라 생물학적 지문 측면에서도 활발하다. 영역과 대상, 시기는 다르지만 생명이 남긴 흔적의 본질에 대해 탐구한다는 점에서 맥을 같이 한다.

대표적인 생물학적 지문으로 환경DNA(eDNA)를 들 수 있다. 환경DNA는 생물이 이동하면서 자신도 모르게 토양 물 공기 등에 남긴 세포 피부 털 배설물 등 세포 내외 DNA에서 유래한 복잡한 혼합물이다. 이들 자료를 수집해 분석하면, 해당 지역에 어떤 생물종이 살고 있는지 파악할 수 있다. 환경DNA 메타바코딩 조사의 가장 큰 장점은 생물체의 명백한 징후 없이도 단일 샘플에서 여러 종을 동시에 감지할 수 있다는 점이다.

아주 간단히 설명하면 제품 바코드처럼 세포 각각에는 유전자가 있다. 생물체가 우리 눈에 보이지 않거나 이미 그 장소를 떠났더라도 자신도 모르게 DNA를 남긴다. 이 흔적을 물이나 토양 등에서 채취해 대량 염기서열 분석(시퀀싱)을 통해 어떤 종들의 DNA가 있는지 확인한다. 이후 종 데이터베이스와 비교해 해당 종을 식별하는 식이다.

초기에는 생명체 이동이 상대적으로 제한된 강 등에서 활용이 되다가 이제는 대기 중에서도 추출해 분석하는 연구들이 활발하다. 이러한 움직임은 로봇공학과 만나면서 더욱 가속화되는 중이다.

국제학술지 ‘사이언스 로보틱스(Science Robotics)’의 논문 ‘생물다양성 모니터링을 위해 드론을 활용한 나뭇가지에서의 환경DNA 수집’은 이러한 융합의 가능성을 보여준다. 연구팀이 개발한 ‘e드론(eDrone)’은 숲 캐노피(수관층)처럼 인간이 접근하기 어려운 환경에서 자율적으로 나뭇가지에 착륙해 환경DNA를 수집할 수 있다. 힘 감지 센서와 촉각 기반 제어를 결합해 다양한 강성의 나뭇가지에 안정적으로 접촉할 수 있도록 설계됐다.

현장 실험에서 7개 나무종에서 수집한 샘플을 분석한 결과, 곤충·포유류·조류·양서류 등 21개 동물 분류군이 확인됐다. 이 기술은 “기존에 접근하기 어려웠던 서식지의 생물다양성을 대규모로 모니터링할 수 있는 가능성을 열었다”는 평가를 받는다.

화학적 지문과 생물학적 지문이라는 서로 다른 접근법은 결국 같은 질문을 향한다. ‘생명이란 무엇이며, 어떻게 지속되어 왔는가’이다. 인공지능과 로봇공학 등 하루가 다르게 발달하는 첨단 기술은 시간의 양 끝에서 생명의 비밀을 하나의 연속된 이야기로 엮어낸다. 이는 단순히 과거를 복원하거나 현재를 기록하는 차원을 넘어 생명 그 자체의 본질을 이해하려는 인류의 오랜 여정이 새로운 단계로 접어들었음을 의미한다.

김아영 기자 aykim@naeil.com

김아영 기자 기사 더보기