현대 창조론 연구 자료실

10년 걸린 연구 3개월에 끝낸다…구글 AI '알파폴드'가 주도하는 생명과학 혁명

heojohn 2022. 4. 22. 23:38

2022.04.22 07:00

 

플라스틱 먹는 효소 연구, 진화생물학까지 확장 중

알파폴드가 해독한 여러 단백질의 3D 구조. 다양한 단백질 구조를 통해 생명 현상에 관여하는 단백질의 기능이 구현된다. 딥마인드 제공.

인간 세포를 둘러싼 세포막에서 세포핵 안팎을 이동하는 물질 흐름을 제어하는 영역을 ‘핵막공복합체’라고 한다. 세포 외부에 있던 물질을 세포핵 안으로 이동시키거나 내부 물질을 배출하는 일종의 통로다. ‘뉴클레오포린’으로 불리는 1000여개 단백질이 마치 퍼즐처럼 입체 형태로 결합된 30개 이상의 구조로 이뤄져 있다. 평소 바이러스나 박테리아의 공격을 막는 중요한 역할을 하지만 핵막공복합체의 구조는 아직 완전히 밝혀지지 않고 있다. 


마틴 벡 독일 막스플랑크 생물물리학연구소장 연구팀은 2016년 뉴클레오포린 단백질의 약 30%와 이를 토대로 만들어진 단백질 구조 30개의 절반이 형성되는 과정을 확인했다고 국제학술지 ‘사이언스’에 공개했다. 컴퓨터 시뮬레이션 모델링 기술로 약 10여년간 연구한 결과다. 벡 소장 연구팀은 지난해 10월 그보다 훨씬 짧은 3개월만에 이전 10년간 연구 결과보다도 많은 60%에 이르는 뉴클레오포린 단백질 구조를 밝혔다고 깜짝 공개했다. 구글의 인공지능(AI) 자회사 딥마인드가 지난해 7월 AI 단백질 구조 예측 도구인 ‘알파폴드’의 소스코드를 공개하자 이를 활용해 10년에 걸쳐 했던 연구를 단 3개월만에 해낸 것이다. 

 

 

○ 약물 발견에서 진화생물학까지...생물학 연구 판도 바꾼 ‘알파폴드’

단백질은 모든 생명현상에 관여하는 생체 분자로 수백개에서 수천개의 아미노산 결합 구조에 따라 다양한 특성과 기능을 갖는다. 20여종의 아미노산이 복잡한 사슬 구조로 연결된 단백질은 사슬 구조가 꼬이고 얽히며 접히면서 3D 입체 구조를 형성한다. 단백질 구조를 빠르게 알아낼 수 있다면 인류가 아직 확인하지 못한 생명현상은 물론 새로운 화합물의 약물로서의 효능 연구 등 획기적인 전환점을 가져올 수 있다. 


과학자들은 지금까지 X선이나 극저온 전자현미경 등 장비를 활용해 약 10만여종의 단백질 구조를 해독했다. 하지만 수십억종에 달하는 단백질 중 극히 일부에 불과하다. 컴퓨터 모델을 이용해 3D 구조를 파악하는 연구도 이뤄졌지만 정확도와 신뢰도가 신통치 않았다,


2020년 12월 단백질 구조 예측 학술대회(CASP)에서 우승하며 과학계의 이목을 집중받은 딥마인드의 알파폴드는 생명과학 연구에 새로운 열풍을 불러오고 있다. 지난해 7월 15일 알파폴드의 소스코드와 알파폴드가 구조를 해독한 단백질 데이터가 공개되면서부터다. 인공지능 기술인 딥러닝을 활용하는 알파폴드는 기존 실험을 통해 확인된 수십만개의 단백질 구조와 아미노산 서열을 학습한 뒤 미지의 단백질이 주어지면 구조를 해독·예측한다. 


딥마인드는 올해 총 1억개 이상의 단백질 구조 해독 결과를 추가로 공개할 계획이다. 4월 기준 40만명의 연구자가 알파폴드의 데이터베이스를 활용한 다양한 연구를 이어가며 생물학 연구의 판도를 바꾸고 있다. 


토마스 보에센 덴마크 오르후스대 구조생물학 교수는 구름 속 얼음 형성을 촉진하는 박테리아의 단백질 구조를 모델링하는 데 알파폴드를 활용하고 있다. 크리스틴 오렌고 영국 유니버시티칼리지런던(UCL) 컴퓨터생물학 교수는 알파폴드를 이용해 플라스틱을 먹어치우는 새로운 효소를 식별하기 위한 연구를 진행중이다. 수천개의 단백질 구조를 빠르게 추려내고 플라스틱을 분해하는 효소가 어떻게 진화했는지, 또 분해 능력을 높이기 위한 방안은 무엇인지 찾는 연구다. 


진화생물학에도 새로운 바람을 불어넣고 있다. 보통 진화생물학은 유전자 염기서열을 비교해 특정 종의 친척과 진화 방향을 확인한다. 유전체 차이가 크면 연구대상에서 제외된다. 하지만 유전체보다 느리게 변화하는 단백질 구조를 비교하면 확인하기 어려운 진화적 관계를 복원할 수 있다. 페드로 벨트라오 스위스 취리히연방공대 컴퓨터생물학자 교수는 “알파폴드는 단백질의 진화와 생명의 기원을 연구할 수 있는 놀라운 기회를 열어주고 있다”고 말했다. 

 

단백질 구조 예측 학술대회(CASP)에서 우승하며 과학계의 이목을 집중받은 알파폴드 개발사 딥마인드. 딥마인드 제공

 

○ 돌연변이 단백질 해독은 어려워

알파폴드의 한계도 분명하다는 지적도 나온다. 단백질 구조 해독과 예측에 제역할을 하기 어려운 분야가 있다는 것이다. 예를 들어 암 발생 초기에 단백질의 구조를 파괴하는 다양한 돌연변이를 해독하기는 쉽지 않다. 


딥마인드는 알파폴드가 새로운 돌연변이 단백질을 해독하고 예측할 수 있도록 설계를 변경하는 방안을 연구중이다. 이를 위해 단백질의 3차원 구조에서 어떻게 아미노산이 접히고 바뀌는지를 더 잘 예측할 수 있는 방안을 찾고 있다. 차세대 신경망을 개발하는 엄청난 도전이 필요하다는 분석이다. 과학자들은 알파폴드가 가져온 생물학 연구 혁명을 통해 개별 단백질과 복합체뿐만 아니라 전체 세포 소기관 또는 세포를 개별 단백질 분자 수준까지 모델링할 수 있을 것으로 기대하고 있다. 마틴 벡 독일 막스플랑크 생물물리학연구소장은 “알파폴드는 게임 체인저가 되고 있다”며 “생물학은 알파폴드가 소스코드를 공개한 2021년 7월 이전과 이후로 나뉠 것”이라고 말했다. 

 

 

관련 태그 뉴스

관련기사