Публикации по теме 'deep-reinforcement'


Обучение с подкреплением — Учебник
Обучение с подкреплением (RL) — это захватывающая область машинного обучения, которая существует с 1950-х годов. Он создал несколько интересных приложений, особенно в играх (например, вы, возможно, слышали об AlphaGo от DeepMind, которая является первой компьютерной программой, победившей профессионального игрока в го). Как AlphaGo добилась такого успеха? Что ж, стало лучше изучать игру и принимать более последовательные решения с помощью обучения с подкреплением. Ему приходилось..

Важность криптографических функций для глубокого обучения с подкреплением
Важность криптографических функций для глубокого обучения с подкреплением Эта статья написана Берендом Гортом и Брюсом Янгом , членами основной команды проекта с открытым исходным кодом AI4Finance. Этот проект представляет собой сообщество с открытым исходным кодом, которое делится инструментами искусственного интеллекта для финансов и является частью Колумбийского университета в Нью-Йорке. Ссылка на гитхаб: Фонд AI4Finance Сообщество с открытым..