Вопросы по теме 'mdptoolbox'

OverflowError, когда я пытаюсь использовать алгоритм итерации значений с mdptoolbox
Я установил простую MDP для платы, которая имеет 4 возможных состояния и 4 возможных действия. Настройка доски и награды выглядит следующим образом: Здесь S4 - состояние цели, а S2 - состояние поглощения. Я определил матрицы вероятности...
321 просмотров

Должна ли матрица перехода из марковского процесса принятия решений быть стохастической?
Я пытаюсь найти оптимальную политику для задачи Марковского процесса принятия решений, указанной на этой диаграмме , используя итерацию значений (через pymdptoolbox) и NumPy. Но pymdptoolbox говорит, что моя матрица перехода «не является...
2560 просмотров