현대 창조론 연구 자료실/창조론 연구를 위한 과학 뉴스

게놈분석해 만든 몽타쥬 정확도

heojohn 2020. 8. 31. 02:49

[강석기의 과학에세이] 강석기의 과학에세이 243

 

‘진짜 딸을 데려왔나?’

얼마 전 무심코 ‘밥상 차리는 남자’라는 드라마를 보다가 부녀 역할을 하는 두 사람의 얼굴이 너무 닮아 이런 생각이 들었다. 요즘 연예인이 부모나 자녀와 함께 나오는 예능프로그램이 여럿 있지만 드라마에서 실제 자녀를 그것도 아역 배우로 출연시킨 걸 본 기억이 없다.

궁금증을 못 참은 필자는 인터넷에서 검색해봤는데 친 부녀 사이는 아니었다. 아버지 역할을 맡은 배우의 이름은 박진우이고 딸 역할은 맡은 배우의 이름은 김한나이기 때문이다. 사람 눈은 다 비슷한지 인터넷에도 두 사람이 친 부녀 사이인 것처럼 너무 닮은 게 화제가 된 것 같다.

사실 부모자식 사이나 형제자매 사이에 꼭 빼닮은 경우도 많지만 데리고 온 자식이라고 해도 믿을 정도로 닮은 구석이 없는 경우도 많다. 아마도 얼굴의 특징을 결정하는 수십 또는 수백 가지 유전자 가운데 인상을 좌우하는 핵심적인 역할을 하는 유전자들에서 같은 유형이 많을 경우는 닮았다고 느껴질 것이고 적을 경우는 남남처럼 보이지 않을까 싶다. 따라서 두 사람이 생판 남이라도 우연히 같은 유형의 유전자들이 많으면 닮아 보일 것이다.

장기이식도 마찬가지다. 정작 친자식은 안 맞아 면역거부반응 때문에 장기를 이식받을 수 없어 무작정 기다리던 중에 자신에게 ‘맞는’ 장기가 확보됐다는 연락을 받으면 기적처럼 느껴질 것이다. 그렇다면 얼굴의 생김새를 결정하는 유전자들도 장기이식의 면역반응에 관련된 유전자들처럼 분명한 관계를 보일까.

드라마 ‘밥상 차리는 남자‘에서 아빠와 딸로 나오는 박진우(왼쪽)와 김한나. 친 부녀 사이라고 해도 믿을 정도로 얼굴이 닮아 화제가 됐다. ⓒ MBC

 

코 높이와 넓이 정확히 예측

학술지 ‘미국립과학원회보’ 9월 19일자에는 이와 관련해 흥미로운 연구결과가 실렸다. 한 사람의 게놈을 분석해 얻은 데이터로 얼굴과 피부색, 키, 몸무게, 나이 등 그 사람의 신체특성을 꽤 그럴듯하게 추측할 수 있는 인공지능 프로그램을 개발했다는 것이다. 이 연구를 주도한 곳은 미국의 휴먼론제비티(Human Longevity, Inc)로 ‘생명과학계의 이단아’ 크레이그 벤터가 2013년 만든 회사다.

다국적 공동연구팀인 인각게놈프로젝트가 느긋하게 인간게놈을 해독하고 있던 1998년 미 국립보건원을 그만 둔 벤터는 셀레라제노믹스라는 회사를 만들더니 독자적으로 인간게놈을 해독하겠다고 선었했다. 그 결과 게놈해독 경주가 벌어졌고 2000년 거의 동시에 게놈초안이 발표돼 무승부를 기록했다. 그 뒤 벤터는 크레이크벤터연구소를 만들어 인공생명체 연구에 뛰어들어 2010년 합성게놈을 지닌 박테리아를 만드는데 성공해 또 한 번 세상을 놀라게 했다.

다음으로 벤터는 휴먼론제비티를 만들어 인간게놈 정보를 이용해 노화와 관련된 질병을 정복하겠다는 포부를 밝혔다. 따라서 이번 연구는 어찌 보면 곁다리로, 논문에 따르면 ‘게놈 사생활 보호’라는 개념에 대한 도전이라고 한다. 즉 아무리 익명으로 게놈을 제공했더라도 게놈을 분석하면 제공자의 신체 특성을 재구성할 수 있기 때문에 결국은 노출될 것임을 보여주는 예비 연구결과라는 말이다.

진짜 얼굴(왼쪽)과 인공지능 프로그램이 게놈 데이터를 분석해 예측한 얼굴(오른쪽)을 비교한 사진이다. ⓒ 미국립과학원회보

 

연구자들은 샌디에이고에 거주하는 1061명의 전체 게놈을 분석했다(빅테이터 연구의 전형이다!). 이들은 다양한 인종으로 구성돼 있는데 아프리카계(흑인)가 569명, 유럽계(백인)가 273명, 중남미계가 63명, 동아시아계가 63명, 남아시아계가 18명, 기타 75명이다. 평균 나이는 36세로 18세에서 82세까지 분포해 있다.

연구자들은 게놈 데이터를 분석해 신체특성을 유추하는 인공지능 프로그램을 개발했다. 그 결과 유전적으로 단순한 특성, 즉 눈(홍채)색, 피부색, 성별 등은 정확히 예측했다. 반면 얼굴 생김새나 목소리 같은 복잡한 특성은 정확도가 떨어졌다. 이는 어느 정도 예상한 결과다.

그럼에도 막상 논문에 나와 있는, 실제 얼굴과 게놈에서 예측한 얼굴을 비교한 사진을 보면 인공지능이 꽤 그럴듯하게 재구성한 게 아닌가 하는 생각이 든다. 독자들도 판단해 보기 바란다. 사람들의 관심이 가장 큰 얼굴의 경우 연구자들은 수평, 수직, 깊이 등 세 차원에서 게놈의 예측 정확도가 높은 부위를 밝혔다. 이에 따르면 게놈 데이터로 수평 방향에서는 코와 입술의 폭을 꽤 정확히 예측할 수 있었고 수직 방향에서는 얼굴의 위아래를 잘 예측했다. 한편 깊이 방향에서는 아래 이마와 코, 입술의 돌출 정도를 꽤 정확히 맞췄다. 한편 목소리의 경우는 음높이는 꽤 정확히 예측했지만 다른 측면들은 무작위에 가까웠다.

키의 경우 예측력이 큰 편이어서 평균절대오차가 4.9㎝에 불과했다. 반면 몸무게는 정확도가 낮아 평균절대오차가 15.6㎏이나 됐다. 환경이 비만에 큰 영향을 미치는 요인이라는 걸 생각하면 수긍이 가는 결과다. 한편 나이의 경우 평균절대오차가 8년이었다. 참고로 나이는 텔로미어의 길이와 X염색체(여성) 또는 Y염색체(남성)의 손실 정도를 분석해 추측했다. 나이가 들수록 텔로미어가 짧아지고 성염색체의 손실 부위가 많아지기 때문이다.

연구자들은 게놈 테이터로 그 주인공을 찾는데 성공할 확률을 조사했다. 인공지능 프로그램에 주인공이 포함된 열 명(아홉 명은 DB에서 임으로 뽑음)의 신체 데이터를 제시할 경우 제대로 맞출 확률이 74%인 것으로 나타났다. 이는 수학적 확률인 10%보다 훨씬 높은 값이다. 100명의 경우도 맞출 확률이 30%가 넘어 아무거나 뽑았을 때 확률인 1%와 비교가 안 됐다.

연구자들은 논문에서 “1061명이라는 ‘작은’ 시료 크기로 인한 통계분석 능력의 제한에도 불구하고 꽤 괜찮은 예측력을 보였다”고 자평하며 “더 많은 데이터가 축적되고 분석기법이 향상되면 예측 정확도가 더 높아질 것”이라고 내다봤다. 예전 같으면 ‘과연 그럴까?’하는 반응이었겠지만 알파고 등장에 큰 충격을 받아서인지 그럴지도 모르겠다고 한 발 물러서게 된다.

문득 ‘밥상 차리는 남자’에서 부녀지간으로 나오는 두 사람의 게놈을 분석해 나온 얼굴도 서로 닮아 보일까 하는 궁금증이 생긴다.

게놈 데이터의 얼굴 형태 예측 정확도는 영역에 따라 차이가 큰 것으로 나타났다. 왼쪽은 수평방향, 가운데는 수직방향, 오른쪽은 깊이방향에 따른 예측 정확도로 파란색에서 노란색, 빨간색으로 갈수록 높다는 뜻이다. ⓒ Free photo

(4095)