Публикации по теме 'evolutionary-algorithms'
Часть 2 : Эволюционные алгоритмы обучения с подкреплением — Решение задачи OpenAI’s Cartpole
Решение проблемы Картпола с помощью генетического алгоритма
В первой части этой статьи мы обсуждали, почему для обучения с подкреплением необходимы альтернативные эволюционные алгоритмы. Мы также обсудили различные этапы реализации генетического алгоритма обучения с подкреплением. В этой статье давайте реализуем генетический алгоритм для решения знаменитой проблемы OpenAI с тележкой.
Мы будем использовать среду CartPole для тестирования нашего агента. Агент вознаграждается..
Эволюционные алгоритмы, генетическое программирование и обучение
Эволюционные алгоритмы – это семейство поисковых алгоритмов, вдохновленных процессом (дарвиновской) эволюции в природе. Общим для всех различных членов семейства является представление о решении проблем путем развития изначально случайной популяции возможных решений посредством применения операторов, вдохновленных естественной генетикой и естественным отбором, так что в > Со временем появляются более подходящие (то есть лучшие) решения проблемы.
Эта область, истоки которой можно..
Эволюционные алгоритмы математической оптимизации и машинного обучения (часть 1: алгоритм PSO)
Объяснение и реализация эволюционных методов оптимизации на Python (часть 1)
Методы эволюционной оптимизации – это класс алгоритмов оптимизации, основанных на принципах естественной эволюции, таких как воспроизводство, мутация и отбор. Эти алгоритмы обычно используются в машинном обучении и других областях для нахождения глобального оптимума заданной функции. Основным преимуществом методов эволюционной оптимизации является их способность искать решения в больших и сложных..
Алгоритм MAP-Elites: поиск оптимальности через разнообразие
Алгоритм MAP-Elites: поиск оптимальности через разнообразие
MAP-Elites - это метод обучения с подкреплением, позволяющий избежать локального оптимума пространства поиска путем хранения нескольких возможных решений, элит, с различными характеристиками. Для каждой характеристики сохраняется наиболее эффективное решение с этой характеристикой. Этот метод оказался успешным при перемещении роботов, цель которого состоит в том, чтобы робот переместился как можно дальше от исходного..