2 분 소요

알파고(AlphaGo) 알아보기

알파고는 구글의 딥마인드(Google DeepMind)가 개발한 바둑 인공지능 프로그램입니다. 바둑 프로기사를 바둑으로 이긴 최초의 프로그램이기도하고, 이름에서 ‘Go’라는 뜻은 서구 언론에서 바둑을 의미하는 ‘고’란 말을 인용한 것이기도 합니다.

알파고는 정책망과 가치망의 두 가지 신경망을 통해 결정을 내리고 머신러닝이라는 프로그램을 통해 스스로 학습하는 기능을 가지고 계속 스스로 학습하도록 프로그래밍되어 있습니다.

알파고가 전 세계의 이목을 집중시킨 2016년 3월 한국의 최고 바둑 프로기사 중 한 명인 이세돌 9단과 펼친 바둑 대결이 계기가 되었었는데 아래에서 자세하게 다뤄보도록 하겠습니다.

이세돌 vs 알파고

당시 이 대결은 한국에서 유례없는 엄청난 관심을 보였을 정도로 화제가되었습니다. 경기 전, 아직 인공지능은 인간의 창의력을 따라올 수 없다는 의견이 지배적이었고 이세돌 9단이 우세할 것이라는 예측이 많았었습니다.

하지만 결과는 1,2,3,5국은 모두 알파고가 불계승을 거뒀으며, 4국은 이세돌 9단이 불계승을 거뒀습니다. 이 대국의 목적 가운데 하나가 알파고의 약점을 찾아내고 인공지능을 더욱 발전시키는데 있었기 때문에 일반적인 프로바둑과 달리 승부와 상관없이 5국을 모두 두었던 대결입니다.

이 후에도 알파고는 세계 최정상의 프로기사들을 상대로 전승을 거두었고, 중국 랭킹 1위 커제, 한국 랭킹 1위 박정환, 일본 랭킹 1위 이야마 유타 등 세계 최고수들과 30판의 대국을 펼쳐 모두 이기는 결과를 만들어 냈습니다.

알파고의 승리는 한국은 물론 전세계에 엄청난 충격을 가져왔고, ‘인공지능이 인간을 지배하는 세상이 올 것’이라는 두려움 가득찬 언론과 여론이 형성되었었습니다.

알파고의 바둑 전적

인공지능 바둑 프로그램 알파고의 바둑 전적은 기보를 남긴 대전을 기준으로 하면 총 74전 73승 1패입니다. 한중일 정상급의 프로 바둑기사를 상대로 단 1패만을 기록한 것인데 이 1패가 바로 이세돌 9단과의 대국이었던 경기였습니다.

알파고는 프로기사와의 온라인 대국에서 60연승을 기록하기도 했었습니다.

알파고의 기풍

알파고는 초중반에 매우 공격적인 바둑을 두는 기풍을 가지고 있다고 합니다. 원래 바둑 AI들이 등장했을때, 사람들은 기계라 계산에 강하기때문에 후반에는 강하지만 초중반에는 사람의 직관을 따라올 수 없을 것이라는 예측이 있었으나 알파고는 초중반에 극강의 모습을 보여주며 상대를 이기는 기풍, 전략을 가지고 있었습니다.

계산해야하는 가지수가 적은 후반에는 인간이 기계의 계산 능력에 대항할 수 있지만, 그 경우의 수가 무시무시하게 많은 초중반에는 세력이니 직관이니 하는 인간의 시각이 기계의 계산능력을 따라가지 못하는 것으로, 결국 알파고는 계산으로 모든 것을 감당할 수 있다는 사실을 바둑계에 알려주는 계기가 되었습니다.

알파고의 약점

알파고가 처음 등장했을땐 정보가 부족해 기풍과 약점에 대해 연구가 미흡했지만, 이후 다른 인공지능들이 공개되면서 알파고의 약점 또한 알려지게 되었습니다.

첫번째 약점, 중후반 끝내기입니다. 딥러닝으로 중반 이후를 학습하기 위해서 그 시점까지 미세하게 진행된 엄청난 양의 기보가 필요한데, 이는 알파고 끼리의 강화학습에서도 잘 나오지 않습니다. 비슷한 알고리즘을 사용하는 인공지능의 경우 인간이 무리없이 계산하는 후반의 사활과 끝내기에서 실수를 보여 역전당하는 경우가 있었다고 합니다.

두번째 약점, 사활 문제입니다. 강제로 이상한 모양을 만든 경우 동작 오류가 발생하여 동작을 멈추는 현상이 있다고 합니다.

세번째 약점, 축 오류입니다. 인공지능의 대표적인 오류 중 하나인데 축의 결과를 보려면 수십수 짜리 수읽기를 해야하는데 사람의 경우 축머리만 확인하도록 교육받고, 구식 인공지능도 이 부분에 예외를 넣어 처리했습니다. 하지만 별도의 지식 주입 없이 강화학습만을 사용하는 제로계열 인공지능은 실제로 될때까지 두어보고 학습되기를 바라는 수밖에 없습니다.

알파고 이후의 바둑 변화

알파고의 등장 이후로 기존의 바둑 이론들에 대한 의심과 파훼를 위해 노력했고, 바둑계의 고정관념을 탈피하고자 노력했는데 이것이 알파고가 바둑계에 내려준 가장 큰 선물이라고 불리고 있습니다.

간단하게말하면 기존에도 아주 중요했지만 복기의 중요성이 더 크게 올라갔다고 합니다. 복기를 통해 여러가지 수를 시뮬레이션해보고 그 수를 다른 대국에서 써먹어야 하는데, 기존에 복기를 할 때에는 어느정도 고정관념 하에서 서로 아는 부분은 제외하고 문제 수들만 복기하곤했는데 이젠 전면적으로 처음부터 끝까지 복기를 해야하는 바둑 시대가 되었다고 합니다.

그리고 프로기사들이 AI로 바둑 훈련을 하자 결국 상향 평준화가 되었고, 이전보다 포석이 다양해졌습니다. 중국의 바둑 황제라고 불리는 커제가 더이상 최강자 자리에서 있을수 없다고 불만을 표했을 정도라고 합니다.

알파고는 이후 바둑계에서 은퇴 선언을 하게되었는데, 알파고는 현재 모든 IT 서비스에 적용되는 단일 인공지능을 목표로 개발되고 있다고 합니다. 알파고의 모든 자원을 다른 인공지능 개발자원으로 변경하며 사회에 더 크게 기여할 수 있는 인공지능을 목표로 개발 진행중이라고 합니다.