현대 창조론 연구 자료실/창조론 연구를 위한 과학 뉴스

"코로나19 감염, 혈액형과 관련 없어" 대규모 게놈 연구 결과

heojohn 2020. 6. 30. 22:09

 

2020.06.29 17:40

 

인간 게놈

인간 남성 게놈(유전체)의 모습이다. 23쌍의 염색체로 이뤄져 있다. 코로나19 감염과 관련이 있는 염기서열 영역을 찾으려는 시도가 이어지는 가운데, 최근 논란이 됐던 'ABO 혈액형' 결정 유전자가 위치한 염기서열 영역(9번 염색체 9q34.2)는 감염과 큰 관련이 없는 것으로 점차 결론이 나고 있다. NIH 제공

혈액형에 따라 신종 코로나바이러스 감염증(COVID-19·코로나19) 감염 가능성이 달라질 수 있다는 일부 연구 결과를 부정하는 새로운 분석 결과가 나왔다.


코로나19 환자의 유전체(게놈, 한 생명체가 지닌 유전물질 전체)를 분석하는 203개 팀이 참여한 자발적 국제 연구 협력 프로젝트인 ‘코로나19 환자유전학이니셔티브(COVID-19 hg)'는 전장유전체연관분석(GWAS)을 통해 코로나19 환자와 정상인 사이에 차이가 있는 유전자 위치를 기존 여러 연구 데이터를 활용, 분석해 중간 결과를 27일 홈페이지를 통해 공개했다.

 

분석 결과에 따르면 기존 일부 연구에서 코로나19 환자에게 많이 발견된 변이로 꼽혔던 9번 염색체의 염기서열 영역인 ‘9q34.2’는 코로나19 감염과 큰 관련이 없는 것으로 나타났다. 9q34.2는 ABO 혈액형을 결정하는 유전자가 존재하는 영역이다.


GWAS는 염색체의 전체 위치를 대상으로 특정 형질(질병이나 신체 특성 등)과 관련이 있는 변이가 존재하는지를 통계적으로 탐색하는 기술이다. 코로나19를 예로 들면, 코로나19 환자와 정상인(대조군)의 유전체 데이터를 각각 대량으로 확보한 뒤 비교해 유독 환자군에서 더 많이 발견되는 염기서열 영역을 찾는 식이다.

 

인간이 가진 30억 쌍의 염기서열을 모두 분석하는 게 아니라 기존에 이미 조사돼 알고 있는 대표적인 염기서열 영역 수백만 개를 ‘마커’로 활용해 비교해 전체 게놈을 분석하는 것보다 속도가 빠르다. 사람 찾기에 비유하자면 모든 집을 하나하나 탐색하는 게 아니라 몇 집이 모여 있는 골목을 단위로 조사하는 것과 유사하다.


연구팀은 '중증 코로나19 환자'와 '정상인', '입원 코로나19 환자'와 '정상인' 등 다양한 조건의 비교 데이터를 모아 다시 분석하는 ‘메타분석’을 했다. 예를 들어 입원 코로나19 환자의 경우 유럽의 8개 연구 프로젝트에서 수집한 코로나19 환자 3199명의 게놈 데이터와 89만 7488명의 정상인 대조군을 이용해 GWAS 분석을 했다. 입원하지 않은 환자를 포함해 코로나19 환자 6696명과 정상인 대조군 107만3072명을 비교 분석하기도 했다.

 

 

코로나19 환자유전학이니셔티브 연구팀의 연구 결과 중 일부다. 위는 입원환자와 정상인을 연구한 데이터를 모아 분석한 메타분석 결과이고 아래는 경증까지 포함한 환자와 정상인을 비교한 결과다. 가로는 염색체 별 염기서열 영역이고 점은 주요 변이(단일염기다형성)다. 변이 빈도가 높으면 길어진다. 세로축의 길이는 통계적 유의미성을 평가하는 P값의 로그값을 구한 뒤 부호를 바꾼 값으로, 높을수록 해당 염기서열 영역이 표현형(여기서는 코로나19 감염)과 통계적으로 상관관계가 높다는 뜻이다. 가로 빨간선이 GWAS에서 통계적 의미가 있다고 여겨지는 한계 P값인 1억 분의 5다. 이보다 작은(그래프에서 높은) 염기서열 영역은 3번 염색체 3p21.31뿐이고, ABO 혈액형 유전자가 위치한 9q34.2는 관련이 적은 것으로 나타났다. 코로나19 환자유전학이니셔티브 홈페이지 제공

그 결과 9q34.2 영역과 코로나19 환자 사이에는 통계적 상관성이 낮은 것으로 나타났다. GWAS에서는 이 판단을 통계적 유의미성을 평가하는 값인 P값을 이용해 하게 되는데, GWAS에서는 P값이 1억 분의 5보다 작을 때 의미가 있다고 판단한다. 이 연구에서 9q34.2의 P값은 기준을 통과하지 못했다(위 그래프의 빨간선).

 

이는 앞서 미국 의학학술지 ‘뉴잉글랜드저널오브메디신(NEJM)’에 17일 발표된 ‘중증코로나19 GWAS 연구그룹’의 연구 결과를 뒤집은 것이다. 17일 연구에서 중증코로나19 GWAS 연구그룹은 스페인과 이탈리아의 7개 병원에서 수집된 1980명의 코로나19 환자 게놈 데이터를 분석한 뒤 그 가운데 1610명의 데이터를 추려 정상인 대조군 2205명과 GWAS 분석을 해 코로나19 환자가 9q34.2 영역에서 변이를 가질 확률이 높다고 주장했다. 이 연구에서 9q34.2의 P값은 1억 분의 5라는 기준에 딱 맞았다(아래 그래프의 'ABO' 표시).

 

연구팀은 이 유전자 영역이 ABO 혈액형을 결정하는 위치인 만큼 실제로 혈액형별 위험까지 계산했는데, A형은 위험이 45% 높고 O형은 35% 낮은 것으로 나타났다. 이 때문에 “혈액형이 코로나19 감염에 영향을 미칠 가능성이 있다”는 주장이 나왔다.

 

이달 17일 발표된 뉴잉글랜드저널오브메디신의 논문에서는 보다 소규모 메타 GWAS 연구 결과 9q34.2 영역 역시 GWAS에서 상관성의 기준이 되는 P값을 만족시키는 것으로 나타났다. 이 연구로 코로나19 감염과 혈액형이 관련이 있다는 주장이 제기됐다. NEJM 제공

하지만 훨씬 많은 수의 데이터를 활용한 이번 연구에서 9번 염색체의 해당 위치는 P값이 커서 코로나19 감염과 큰 관련이 없는 것으로 나타나 논란이 종식될 것으로 보인다.

 

한편 기존 연구에서 관련성이 매우 높은 것으로 추정된 또다른 염기서열 영역인 3번 염색체의 3p21.31 영역이 코로나19 감염과 관련이 있을 가능성은 여전히 매우 높게 측정됐다(위 두 번째 데이터의 3번 염색체 영역 피크). NEJM 연구에서 이 영역의 P값은 100억 분의 1 수준으로 매우 낮아 상관성이 높게 평가됐다.

 

이번 코로나19 환자유전학이니셔티브의 연구에서도 비슷한 수준으로 측정됐다. 이 염기서열 영역에는 폐의 면역세포 조절에 관여해 호흡기 바이러스에 대응하는 CXCR6 유전자나 코로나19를 일으키는 바이러스가 인체세포 침투시 활용하는 세포 표면 단백질 ‘안지오텐신변환효소2(ACE2)’와 상호작용하는 단백질을 만드는 SLC6A20 등 6개 단백질을 만드는 기능을 한다.

 

9q34.2 영역의 위치를 9번 염색체 위에 표시했다. 9번 염색체의 끝 부분인 1억3325만401~1억 3327만5201번 염기서열에 해당한다. NIH 제공