Вопросы по теме 'mdptoolbox'
OverflowError, когда я пытаюсь использовать алгоритм итерации значений с mdptoolbox
Я установил простую MDP для платы, которая имеет 4 возможных состояния и 4 возможных действия. Настройка доски и награды выглядит следующим образом:
Здесь S4 - состояние цели, а S2 - состояние поглощения. Я определил матрицы вероятности...
321 просмотров
schedule
12.09.2021
Должна ли матрица перехода из марковского процесса принятия решений быть стохастической?
Я пытаюсь найти оптимальную политику для задачи Марковского процесса принятия решений, указанной на этой диаграмме , используя итерацию значений (через pymdptoolbox) и NumPy. Но pymdptoolbox говорит, что моя матрица перехода «не является...
2560 просмотров
schedule
16.05.2023