기타 story/퀴즈

리브메이트 오늘의퀴즈 22.04.27

그루나리 2022. 4. 27. 10:17
반응형

22.04.27 리브메이트 오늘의퀴즈


구글의 딥마인드가 개발한

인공지능 바둑프로그램을

무엇이라고 할까요?


문제에 대한  설명 중 일부 입니다.

2015년 10월 딥마인드가 인공지능 바둑 프로그램 ‘알파고(AlphaGo)’를 개발해 출시했다. 알파고는 방대한 양의 데이터를 저장해 두고, 컴퓨터 스스로가 학습하고 분석해 판단하는 딥러닝(Deep Learning) 방식을 사용했다. 같은 해 10월 알파고가 유럽 바둑 챔피언이자 중국 프로바둑기사인 판 후이(Fan Hui) 2단과의 다섯 차례 대국에서 5전 전승했다. 이 승리는 인공지능 프로그램이 전문바둑기사를 상대로 거둔 최초의 승리였다.

'알파고(AlphaGo)'라는 이름은 구글의 지주회사 이름인 알파벳과 그리스문자의 첫 글자이자 최고를 뜻하는 '알파(α)'의 의미를 따서 지었다. 'Go'는 바둑을 뜻하는 영어로, '碁(바둑)'의 일본어 발음에서 나왔다. 2016년 1월 구글 딥마인드가 알파고의 기반 기술과 알고리즘을 자세히 설명해놓은 <딥러닝 신경망과 트리 검색으로 바둑 마스터하기(Mastering the game of Go with deep neural networks and tree search)>라는 논문을 <네이처>지에 발표했다.

알파고 프로그램은 두 개의 신경망을 이용하도록 개발됐다. 하나는 각 수에 대한 위치 및 승률을 평가하는 ‘가치 네트워크(value network)’이며, 다른 하나는 좋은 수를 찾아내 움직임을 선택하는 ‘정책 네트워크(policy network)’다. 이 두 심층 신경망(Deep Neural Network)들은 자체 신경망끼리 수백만 회의 바둑을 두며 이중으로 훈련받았다. 하나는 프로 바둑기사들이 뒀던 바둑 경기로부터 바둑 기술을 배우는 지도학습(supervised learning)이었고, 다른 하나는 컴퓨터 프로그램이 스스로 경기를 하면서 시행착오를 통해 실력을 키우도록 한 강화학습(reinforcement learning)이었다.

알파고는 이 두 네트워크가 동시에 작동하면서 바둑판에서 상대의 수를 읽고 확률을 측정해 다음 수를 두게 되는 과정을 거친다. 이렇게 탄생한 알파고는 2016년 3월 한국의 프로바둑기사인 이세돌 9단과 대국을 하기 전까지 100만 번의 바둑을 두며 수련했다. 다른 바둑 프로그램들과 총 500회 대국을 벌여 499승 1패를 거두며 99.8%의 승률을 기록했다.

구글 딥마인드는 2016년 3월 9일부터 15일 동안 한국의 서울에서 알파고와 한국의 프로바둑기사 이세돌 9단과의 바둑대결인 ‘구글 딥마인드 챌린지 매치’를 개최해 세계적 화제를 모았다. 알파고 대 이세돌 9단과의 대국에서 알파고는 1회전과 2회전, 3회전, 그리고 5회전에서 불계승했으며, 이세돌 9단은 4회전에서 불계승으로 1승을 거뒀다. 인공지능 알파고와 인간 이세돌과의 세계적인 대결은 알파고의 4대 1승리로 끝났다. 경기가 끝난 후 이세돌은 "이세돌이 패배한 것이지 인간이 패배한 것은 아니다."라는 말을 남기며 화제에 올랐다. ‘구글 딥마인드 챌린지 매치’를 계기로 국내에서는 산업계와 연구계를 중심으로 인공지능 산업의 미래와 다가올 변화를 조명해 보려는 시도가 활발하게 전개되었다.


정답은 '알파고'

반응형