현대 창조론 연구 자료실/창조론 연구를 위한 과학 뉴스

구글 AI, 생명과학의 미스터리 단백질 접힘 문제 해결 눈앞

heojohn 2020. 12. 1. 22:22

 

2020.12.01 18:29

 

구글AI ‘알파폴드2’, 단백질 구조 예측 학술대회 최고점,

2년만에 단백질 구조 예측 정확도 60점에서 92.4점으로 상승

정확도 일취월장...신약 개발에 적극 활용

 

 

단백질 구조를 나타내는 모식도. 단백질을 이루는 아미노산은 상호작용을 통해 구부러지고 비틀어진 단백질 모양을 만들어낸다. 딥마인드 제공

 

구글 딥마인드가 개발한 3차원 단백질 구조 예측 AI ‘알파폴드2’가 30일(현지시간) 온라인으로 열린 단백질 구조 예측 학술대회(CASP)에서 평균 92.4을 받아 최고점을 기록했다. 지난 2018년 멕시코에서 열린 CASP의 최고 점수가 평균 60점이었던 것과 비교해 무려 30점이 넘게 상승했다.

 

데미스 하사비스 딥마인드 최고경영자(CEO)는 "이번 진전은 거대한 과학적 도전의 돌파구"라며 "인류가 질병과 생명을 이해하는 능력에 많은 영향을 줄 것"이라고 말했다.

 

●1994년 시작해 올해 14회를 맞은 ‘단백질 구조 예측 학술대회(CASP)’

 

단백질은 아미노산의 집합체다. 평균적인 크기의 단백질은 20종류의 아미노산이 300개 정도 이어져 만들어지고, 단백질을 이루는 아미노산은 서로 밀거나 당기면서 구부러지고 비틀어진다. 아미노산 서열이 단백질의 구조와 특징을 결정하는 셈이다. 이렇게 아미노산이 상호작용을 통해 고유의 3차원 구조를 형성하는 과정을 '단백질 접힘'이라고 한다. 단백질의 구조를 예측한다는 건 아미노산 서열로부터 단백질이 어떻게 접힐지 예측하는 것과 같다.

 

단백질 접힘을 실험적으로 알아내는 방법은 대표적으로 엑스선 결정학, 핵자기공명 분광학, 저온 현미경을 이용하는 방법이 있다. 하지만 이 방법들로 단백질 접힘을 밝히려면 짧게는 몇 달, 길게는 몇 년이 걸리고 비용이 많이 든다. 이런 이유로 컴퓨터 시뮬레이션과 모델링을 활용해 단백질 접힘을 예측하는 연구가 이뤄지고 있다.

 

CASP는 존 몰트 미국 메릴랜드대세포생물학 및 분자유전학과 교수의 주도로 1994년부터 시작해 2년마다 열리는 단백질 구조 예측 대회다. CASP 조직위원회는 대회가 열리는 해 여름부터 매일 1~2개씩 아미노산 서열을 공개해 대회가 열리기 전까지 총 100개 정도의 문제를 낸다. 자동화 서버를 이용하는 참가자는 3일, 직접 예측하는 참가자는 2주 안에 단백질 구조를 예측해 제출해야 한다. 조직위원회는 10월 말쯤 참가자가 제출한 예측 정확도를 평가해 대회 기간 중 결과를 발표한다.

 

CASP 조직위원회는 제출한 답안을 템플릿 기반 구조 예측, 템플릿 프리 구조 예측, 인접 아미노산 예측, 정밀화, 복합체 구조, 구조 정확도, 연구 활용성으로 나눠 평가한다. 답안에 제시된 단백질 구조와 실제 구조를 비교해 상대 점수를 매긴다. 템플릿은 이미 알려진 아미노산 서열과 이 서열에 따라 만들어진 단백질 구조에 관한 자료로, 템플릿이 없는 단백질은 ‘템플릿 프리 구조 예측’ 항목에서 평가한다.

 

올해 14회를 맞은 CASP는 11월 30일부터 12월 4일까지 5일 동안 온라인으로 열린다. 딥마인드를 비롯해 마이크로소프트, 중국의 미디어 기업인 텐센트를 비롯해 약 100개 팀이 참가했다.

 

●2년 동안 일취월장한 알파폴드

 

전기적으로 양성을 띠는 아미노산은 음성을 띠는 아미노산과 인접해 있을 가능성이 높고, 이런 경향이 단백질 구조에도 영향을 미친다. 딥마인드가 개발한 알파폴드는 딥러닝에 기반한 강화학습을 이용해 인접한 아미노산 사이의 규칙성을 찾아 단백질이 어떻게 접힐지 예측하는 AI다. 아미노산 서열을 입력하면 학습한 데이터를 통해 아미노산 사이의 거리와 각도를 예측하고 이를 기반으로 3차원 형태의 단백질 구조를 보여준다.

 

CASP의 평가 위원 중 한 명인 석차옥 서울대 화학과 교수는 “알파폴드2는 알파폴드1 보다 많은 단백질 구조 데이터를 학습했고, 딥러닝 방식도 다르다”며 “딥마인드가 미리 제출한 3쪽 분량의 초록을 토대로 추측해 보면 알파폴드1이 아미노산 2개의 상호작용에 주목한 반면 알파폴드2는 좀 더 많은 아미노산의 상호작용에 초점을 맞춘 것 같다”고 설명했다.

 

알파폴드2의 비약적인 성장은 화학뿐 아니라 신약 개발에도 큰 도움이 되므로 반갑지만, 일반 연구실에서 쉽게 활용할 수는 없다. 석 교수는 “평가 결과를 보면 알파폴드2의 예측 기법을 빨리 배워서 단백질 구조 예측 연구에 동참하고 싶은 마음이 든다”면서도 “국가의 지원이 없는 한 알파폴드2 운영에 필요한 설비를 일반 연구실이 갖추기는 힘들다”고 말했다.

 

CASP 두 번째 날에는 존 점퍼 딥마인드 연구원이 알파폴드2가 활용한 딥러닝 방식에 대해 설명할 예정이고, 마지막 날에는 데미스 허사비스 딥마인드 CEO의 키노트 발표가 예정돼 있다.

관련 태그 뉴스

  •  

    "딥마인드가 여러개로 구성된 AI 주목하는 이유는 사람이 동시에 여러 사람과 소통하는 존재이기 때문"

    "딥마인드가 여러개로 구성된 AI 주목하는 이유는 사람이 동시에 여러 사람과 소통하는 존재이기 때문"

    “인공지능(AI)에서 멀티 에이전트(다개체)를 연구하는 이유는 3가지입니다. 우리가 다개체로 가득찬 세상에 산다는 점, 다개체를 연구하면 한 개체 아래 다개체를 둔 시스템으로 확장할 수 있다는 점, AI가 모방하는 사람의 지능이 다른 개체와 소통하도록 설계됐다는 점입니다” 안드레아 타케티 딥마인드 선임연구원은 이달 5일 열린 ‘차세대 AI 국제 워크숍’에서 딥마인드가 최근 주목하고 있는 다개체 AI 개발과 관련해 이같이 말했다. 이번 워크숍은 KAIST 인공지능연구소와 신경과학 및 인공지능 융합연구센터가...

  • [프리미엄 리포트]구글 AI에게 물었다…"유리는 고체인가,액체인가"

    [프리미엄 리포트]구글 AI에게 물었다…"유리는 고체인가,액체인가"

    기원전 수천 년 전, 메소포타미아 문명이나 이집트 문명에도 등장한 유리는 우리에게 너무나 익숙한 물질이다. 하지만 과학적으로는 너무나 이상한 물질이다. 고체와 액체의 특성을 동시에 갖고 있기 때문이다. 유리창에 사용되는 유리는 단단하다. 크게 휘지도 않고, 빛 외의 물질에는 잘 반응하지도, 통과시키지도 않는다. 당연히 고체 같다. 하지만 현미경으로 본 유리의 내부 구조는 심히 액체스럽다. 입자들이 마구잡이로 배열돼 있기 때문이다. 보통의 물질에서 고체는 단단하고 액체는 그렇지 않은 이유는 입자 배열이 다르기 때문이다. 고체를...

  • [표지로 읽는 과학] 인간의 뇌에서 또 한 번 AI원리 발견하다

    [표지로 읽는 과학] 인간의 뇌에서 또 한 번 AI원리 발견하다

    국제학술지 네이처는 30일 물결치는 선들 위에서 고뇌하고 있는 인간의 모습을 표지에 담았다. 인간의 고뇌와 고뇌 후 내리는 행동을 결정짓는 물질은 신경전달 물질인 ‘도파민’이다. 세포를 자극하는 도파민은 인간의 행위에 따른 보상에 따라 다른 양이 흘러나오며 인간이 보상을 배우고 학습할 수 있도록 한다. 지난달 15일 도파민이 뇌를 학습시키는 새로운 원리에 관한 연구결과가 발표됐는데 저자는 놀랍게도 인공지능(AI) ‘알파고’를 개발한 딥마인드 연구팀이었다. AI의 가장 큰 특징은 스스로 배워 성능을 높이는...

  • [표지로 읽는 과학] 스타크래프트2 정복한 인공지능

    [표지로 읽는 과학] 스타크래프트2 정복한 인공지능

    인공지능(AI)이 체스와 바둑에 이어 '스타크래프트'도 정복했다. 스타크래프트는 전세계적으로 가장 오랫동안 인기를 끌고 있는 SF 실시간 전략 게임(RTS)이다. 국제학술지 '네이처'는 이달 14일 오리올 빈얄스 연구원 등 구글 딥마인드 연구팀이 개발한 게임AI '알파스타'가 스타크래프트2에서 그랜드마스터 레벨에 올랐다는 연구결과를 발표하며, 여러 명의 게이머와 AI가 게임을 하고 있는 모습을 표지로 담았다. 그랜드마스터 레벨은 상위 0.2% 등급에 속한다. 체스나 바둑은 일정한 규칙에 따라 겨룬다. 그래서 AI가 기...

관련기사