Статьи по теме mdptoolbox

Вопросы по теме 'mdptoolbox'

OverflowError, когда я пытаюсь использовать алгоритм итерации значений с mdptoolbox

Я установил простую MDP для платы, которая имеет 4 возможных состояния и 4 возможных действия. Настройка доски и награды выглядит следующим образом: Здесь S4 - состояние цели, а S2 - состояние поглощения. Я определил матрицы вероятности...

321 просмотров

12.09.2021

Должна ли матрица перехода из марковского процесса принятия решений быть стохастической?

Я пытаюсь найти оптимальную политику для задачи Марковского процесса принятия решений, указанной на этой диаграмме , используя итерацию значений (через pymdptoolbox) и NumPy. Но pymdptoolbox говорит, что моя матрица перехода «не является...

2560 просмотров

python dynamic-programming stochastic markov-chains mdptoolbox

16.05.2023