Этот пост из серии статей Deepmind и OpenAI, которую я пытаюсь обобщить и сделать некоторые заметки из некоторых интересных статей из Deepmind и OpenAI. Здесь я начну с AlphaGo, который пытается объединить алгоритм поиска по дереву Монте-Карло с глубоким обучением игре в го.

Это для первого. В следующем посте я рассмотрю статью AlphaGo Zero.