창조하신 대로 사는 생활 지식/창조주 하나님의 사회: 이런 일이?

세계 최고의 포커 선수들, 인공지능(AI) ‘타짜’에 20억원 털렸다!

heojohn 2021. 2. 13. 20:57

2017.02.01 19:00

 

체스, 퀴즈, 바둑을 넘어 이젠 포커까지! 인공지능의 도전의 끝은 어디?

                                                            GIB 제공

                                            #int=천하의 {인간이} 쎗바닥이 [길어]
                                            #printf=“쫄리면 {뒈지시던가}

                                           (영화 ‘타짜’의 대사를 코딩 형식으로 패러디)

 

알파고 때보다도 한 단계 성장한 AI

 

세계 최고의 포커 선수들이 제대로 ‘타짜’를 만났다. 20일 동안 자그마치 176만 달러(20억3240만 원)를 ‘탈탈’ 털렸다. 상대는 피도 눈물도 심장도, 심지어 뇌도 없는 ‘인공지능(AI)’이다.


체스, 퀴즈, 바둑에서 세계 최강자들을 꺾은 AI가 이번엔 포커마저 접수했다. 미국 카네기멜론대 컴퓨터과학과의 튜오마스 샌드홈 교수와 놈 브라운 박사과정 연구원은 작년 포커용 AI ‘리브라투스’를 개발했다. 리브라투스는 올해 1월 11일부터 30일까지 미국 피츠버그 리버스카지노에서 세계 정상급 포커 선수 4명과 12만 번의 게임을 치른 결과 총 20억 원(온라인 가상화폐) 넘게 따며 압승했다.

포커용 AI ‘리브라투스’를 개발한 미국 카네기멜론대 컴퓨터과학과의 튜오마스 샌드홈 교수(왼쪽 세번째)와 놈 브라운 박사과정 연구원(왼쪽 네번째). 좌우는 세계 정상급 포커 선수들. - 리버스 카지노 제공

 

●체스, 퀴즈쇼, 채팅, 바둑…인공지능의 ‘도장 깨기’


이제껏 성장 드라마의 주인공은 늘 사람이었다. 사력을 다해 적을 이기고 나면 다시 더 강한 적이 나타나는 이야기는 뻔하지만 감동적이다. 이제 과학기술을 무기로 삼은 AI가 그 성장 이야기의 주인공이다.


1997년 IBM의 AI ‘딥블루’는 체스 세계 챔피언 자리를 20년간 지키던 가리 카스파로프를 꺾었다. 경우의 수가 10의 123승이나 되는 복잡한 게임에서 AI가 승리했다는 사실에 세계가 주목했다. 초당 최대 2억 개의 수를 분석하는 대규모 병렬처리가 가능한 성능이 승리의 요인이었다. 사람의 사고 능력보다 7000만 배 빠른 속도다.


AI가 한번 승기를 잡은 종목에선 더 이상 사람이 따라잡기 힘들다. 계속 발달하는 AI은 다음에 깰 ‘도장’을 찾아 나설 뿐이다. 2011년 IBM의 AI ‘왓슨’은 TV 퀴즈쇼를 휩쓴 인간 퀴즈왕들을 꺾는다. 자연어 처리능력과 빅데이터 처리 능력의 발달 덕분이었다.

2015년 3월 서울 코엑스에서 열린 구글 딥마인드의 바둑 AI ‘알파고’와 이세돌 9단의 대국 현장. - 구글 제공

 

2016년 구글 딥마인드의 ‘알파고’는 바둑 최고수 이세돌 9단을 이겼다. 경우의 수가 10의 170승으로 우주의 모든 원자 수보다 많아 ‘인간 최후의 보루’라고 여겨졌던 바둑이었다. 감동근 아주대 전자공학과 교수는 “하드웨어의 발달로 승기를 잡은 딥블루와 달리 알파고는 몬테카를로 탐색 기법이나 딥러닝 기술 같은 소프트웨어의 발달로 승리했다”고 설명했다.


●불확실한 정보에도 최선의 선택할 수 있는 AI


포커에서 인간을 꺾었다는 건 알파고 이후 AI가 또 한 차례 성장했다는 사실을 보여준다. 포커는 상대의 패를 볼 수 없고 속임수(블러핑)가 가능하다는 점에서 체스나 바둑과는 근본적으로 다르다. 불완전한 정보를 바탕으로 제한된 시간 안에 복잡한 결정을 해야 한다.


이전에 개발됐던 포커 AI는 계산의 복잡성을 줄이기 위해 정보를 ‘추상화’시켰다. 예를 들어 카드 J(숫자 11)와 카드 Q(숫자 12)를 같은 카드로 간주하거나, 상대가 100만 원을 배팅하든 300만 원을 배팅하든 똑같이 취급하는 식이다. 경우의 수를 줄여 계산은 빨리 할 수 있지만 묶음의 범위를 사람에게 들키면 악용당할 여지가 있다는 치명적 단점이 있었다.

포커용 AI ‘리브라투스’가 인간 포커선수를 상대로 온라인에서 게임하고 있는 장면. - 리버스 카지노 제공

 

리브라투스는 추상화 기술을 버렸다. 대신 단계별로 계산하는 새로운 기술을 도입했다. 넓은 범위에서 1차로 계산해 가능성이 높은 좁은 범위를 찾은 뒤 2차로 자세히 계산하는 식이다. 장병탁 서울대 컴퓨터공학부 교수는 “동물 그룹에 대한 계산을 한 뒤 포유류 그룹에 대한 계산을 하는 식”이라고 비유를 들어 설명했다.


리브라투스에는 게임이론의 하나인 ‘내쉬 균형’도 적용됐다. 미국의 수학자 존 내쉬가 창안한 내쉬 균형은 두 명 이상이 경쟁할 때, 각자 최선의 선택을 하고 전략을 바꿀 의사가 없는 상태를 말한다. 리브라투스를 개발한 샌드홈 교수는 “리브라투스에 적용된 ‘세이프 앤 네스티드 엔드게임 솔빙’ 기술은 불확실한 정보를 바탕으로 한 상업거래, 협상, 의학치료, 사이버 보안 등에도 적용할 수 있다”고 말했다.


●포커 다음은?


포커 정복 후 인공지능의 다음 목표는 뭘까. 김경중 세종대 컴퓨터공학과 교수는 ‘비디오 게임’을 지목했다. 김 교수는 “바둑은 가로 세로 19점 사이에서 이뤄지는 행위인데 게임은 최소 가로 세로 680 픽셀의 공간에서 전개돼 정보량이 훨씬 많다”고 말했다.


스타크래프트처럼 정찰을 해야 상대 전략을 알 수 있는 게임은 불확실한 정보로 최선의 의사결정을 해야 한다. 프로게이머들은 종종 상대에게 잘못된 정보를 일부러 흘려 혼란을 주는 심리전을 펼친다. 아직 인공지능이 프로게이머를 이기지 못하는 이유다. 실제로 딥마인드는 ‘스타크래프트 2’ 개발사 블리자드엔터테인먼트와 협력, 인공지능이 스타크래프트 게임을 하며 복잡한 현실 세계를 이해할 수 있을지 시험하고 있다.

                                         세계 최고의 포커 선수들, 인공지능(AI) ‘타짜’에 20억 털렸다!

 

인공지능이 게임에선 이겨도 실제 문제 해결에서 인간을 앞서려면 아직 갈 길이 멀다는 시각도 있다. 감 교수는 “왓슨이 퀴즈쇼에서 인간을 이긴 뒤 콜센터를 인공지능으로 대체하려는 연구가 활발하다”며 “현실에서 사람들의 질문은 퀴즈쇼에서처럼 정형화돼 있지 않기 때문에 아직 인간을 대체하기는 무리”라고 말했다.

 

관련 태그 뉴스

  • AI, 큐브까지 인간 눌렀다

    인공지능(AI)이 인간을 제압하는 게임이 점차 늘고 있다. 바둑과 체스, 장기는 이미 AI가 일찌감치 인간을 눌렀다. 올해 1월에는 알파스타라는 AI가 ‘스타크래프트2’ 같은 전략 게임에서 프로게이머를 상대로 10승 1패를 기록하며 인간을 압도했다. 올해 5월에는 ‘포더윈’이라는 AI가 3차원 공간을 돌아다니며 총을 들고 싸우는 복잡한 게임인 ‘퀘이크 3 아레나’에서도 인간 고수를 이기기도 했다. AI가 정복한 게임의 숫자가 늘어나는 데는 아이러니하게도 게임의 복잡성 때문이다. 바둑, 체스, 장기 같은...

  • 박희재 서울대 교수, 英 맨체스터대에서 공학 분야 최고 학위 받아

    박희재 서울대 기계항공공학부 교수가 연구 업적과 산업적, 사회적 업적을 인정받아 영국 맨체스터대학으로부터 공학 분야 최고 학위인 공학원사(工學院士) 학위를 받았다. 서울대 공대는 박 교수가 영국 맨체스터대학으로부터 공학 분야 최고 학위인 공학원사 학위를 받는다고 29일 밝혔다. 공학원사 학위는 영국 옥스퍼드대학 등 유명 대학에서 공학 분야의 최고 학위로 수여하고 있다. 학위를 받으려면 공학 분야에서 박사 학위를 받은 지 20년 이상 기간 동안 학문적, 산업적, 사회적 업적이 뛰어나야 한다. 공학원사 학위는 해당 분야의 업적이 뛰...

  • [표지로 읽는 과학] 게임의 제왕 알파제로의 등장

    국제학술지 ‘사이언스’는 7일 정육면체 위 3개 면에 바둑과 체스, 한국의 장기와 닮은 일본의 쇼기 게임이 동시에 진행 중인 모습을 표지에 실었다. 독학으로 이 세 가지 게임을 섭렵해 최강의 자리에 오른 구글의 새 인공지능(AI) 알파제로의 등장을 알린 것이다. 구글의 딥마인드 연구진이 새로 내놓은 알파제로는 2016년 등장해 이세돌 9단을 이기며 최강의 바둑 AI로 등극한 ‘알파고’는 물론 알파고를 제압한 2017년형 AI인 알파고제로를 제압했다. 특히 이번 알파제로는 범용이라는 수식어가 붙었다. 바둑을 넘어 다른...

  • ‘게임의 법칙’ 스스로 터득하는 AI ‘알파제로’ 나왔다

    가르쳐 주지 않아도 여러 종류의 ‘게임의 법칙’을 스스로 터득하는 인공지능(AI)가 등장했다. 바둑, 장기, 체스 등 종목을 가리지 않고 짧게는 몇 시간, 길게는 며칠 만에 규칙을 터득하고 최강의 실력까지 갖췄다. 데이비드 실버 구글 딥마인드 연구원팀은 6일 국제학술지 ‘사이언스’에 범용 강화학습 알고리즘을 채택한 게임 AI ‘알파제로’를 공개했다. 알파제로는 2016년 등장해 이세돌 9단을 이기며 최강의 바둑 AI로 등극한 ‘알파고(알파고리)’와, 알파고의 후속으로 2017년 기존 알파고를 ...

태그

관련기사