Публикации по теме 'evolutionary-algorithms'


Часть 2 : Эволюционные алгоритмы обучения с подкреплением — Решение задачи OpenAI’s Cartpole
Решение проблемы Картпола с помощью генетического алгоритма В первой части этой статьи мы обсуждали, почему для обучения с подкреплением необходимы альтернативные эволюционные алгоритмы. Мы также обсудили различные этапы реализации генетического алгоритма обучения с подкреплением. В этой статье давайте реализуем генетический алгоритм для решения знаменитой проблемы OpenAI с тележкой. Мы будем использовать среду CartPole для тестирования нашего агента. Агент вознаграждается..

Эволюционные алгоритмы, генетическое программирование и обучение
Эволюционные алгоритмы  – это семейство поисковых алгоритмов, вдохновленных процессом (дарвиновской) эволюции в природе. Общим для всех различных членов семейства является представление о решении проблем путем развития изначально случайной популяции возможных решений посредством применения операторов, вдохновленных естественной генетикой и естественным отбором, так что в > Со временем появляются более подходящие (то есть лучшие) решения проблемы. Эта область, истоки которой можно..

Эволюционные алгоритмы математической оптимизации и машинного обучения (часть 1: алгоритм PSO)
Объяснение и реализация эволюционных методов оптимизации на Python (часть 1) Методы эволюционной оптимизации  – это класс алгоритмов оптимизации, основанных на принципах естественной эволюции, таких как воспроизводство, мутация и отбор. Эти алгоритмы обычно используются в машинном обучении и других областях для нахождения глобального оптимума заданной функции. Основным преимуществом методов эволюционной оптимизации является их способность искать решения в больших и сложных..

Алгоритм MAP-Elites: поиск оптимальности через разнообразие
Алгоритм MAP-Elites: поиск оптимальности через разнообразие MAP-Elites - это метод обучения с подкреплением, позволяющий избежать локального оптимума пространства поиска путем хранения нескольких возможных решений, элит, с различными характеристиками. Для каждой характеристики сохраняется наиболее эффективное решение с этой характеристикой. Этот метод оказался успешным при перемещении роботов, цель которого состоит в том, чтобы робот переместился как можно дальше от исходного..