Публикации по теме 'stochastic-process'


Итерация политики - простой пример
Итерация политик - это способ найти оптимальную политику для заданных состояний и действий. Предположим, у нас есть политика (𝝅: S → A), которая назначает действие каждому состоянию. Действие 𝝅 (s) будет выбираться каждый раз, когда система находится в состоянии s. Идея итерации политики Оценить данную политику (например, инициализировать политику произвольно для всех состояний s ∊ S) путем вычисления функции ценности для всех состояний s S в рамках данной политики..

Вопросы по теме 'stochastic-process'

Стационарное распределение эргодической цепи Маркова: решение уравнений
Я пытаюсь решить систему уравнений, чтобы определить стационарное распределение эргодической матрицы Маркова. А именно, матрица P=[0 0 0 0.5 0 0.5; 0.1 0.1 0 0.4 0 0.4; 0 0.2 0.2 0.3 0 0.3; 0 0 0.3 0.5 0 0.2; 0...
4424 просмотров

Моделируйте путь цепи Маркова 1000 раз
У меня есть следующий код для цепи Маркова: simulation.mc=function(i0,P,n.sim){ S=1:nrow(P) X=rep(0,n.sim) X[1]=i0 for (n in 2:n.sim){ X[n]=sample(x=S,size=1,prob=P[X[n-1],]) } return(X) } P=matrix( c( 0,1/2,0,1/2,0,0,0,...
1358 просмотров
schedule 04.10.2021

смоделировать процесс возможного от другого пуассоновского процесса
Мне интересно, как смоделировать процесс Пуассона из другого с помощью случайной переменной Бернулли с параметром p . Для моделирования первого пуассоновского процесса с параметром \lambda в интервале [0,t] обычно pois = rpois(1, \lambda)...
82 просмотров

Стохастическое моделирование Гиллеспи в дискретном времени с использованием R
Я моделирую стохастическое моделирование для эпидемиологии. Как мне смоделировать это в дискретном времени? Мне удалось получить непрерывное время, используя приведенную ниже кодировку. library(GillespieSSA) parms <-...
627 просмотров
schedule 07.04.2022

Переменный индекс столбца для данных GnuPlot
Я написал программу, которая генерирует N траекторий броуновского движения с шагом I~N(0,dt). Я проверяю их на условие W(1)>=1 && W(2)>=2. В качестве вывода я, конечно же, сохраняю данные о моменте времени в файле «Wiener_data.dat». Теперь точки,...
1094 просмотров

Задача моделирования цепи Маркова методом Монте-Карло
Я пытаюсь запустить симулятор MC для цепи Маркова, которая равномерно распределена между всеми матрицами NxN, у которых нет соседних единиц. Мой алгоритм должен заполнить пространство состояний, запустив цепочку несколько раз. Однако где-то с моей...
1073 просмотров

Стохастический градиентный спуск сходится слишком плавно
В рамках моей домашней работы меня попросили реализовать стохастический градиентный спуск, чтобы решить задачу линейной регрессии (хотя у меня всего 200 обучающих примеров). Моя проблема в том, что стохастический градиентный спуск сходится слишком...
429 просмотров

Каково пространство состояний этой цепи Маркова?
Рассмотрим систему, в которой два человека сидят за столом и делят между собой три книги. В любой момент времени оба читают книгу, и одна книга остается на столе. Когда человек заканчивает читать свою текущую книгу, он меняет ее местами с книгой на...
180 просмотров

Цикл для стохастических уравнений
Я хотел бы создать последовательность стохастических уравнений для 100 различных семян, используя следующее выражение: set.seed(123) N <- 100 T <- 1 x <- 10 theta <- c (0 , 5 , 3.5) Dt <- 1 /N Y <- numeric (N +1) Y...
34 просмотров
schedule 06.02.2023

Измените код, чтобы получить синтетические данные, которые плавно переходят от бычьего к медвежьему рыночному циклу.
У меня есть этот класс, который генерирует синтетические данные (запасы), и он отлично работает. Однако я хочу изменить его так, чтобы NewPrice генерировал плавные данные тренда, скажем, для n-баров . Я знаю, что если я уменьшу волатильность, я...
656 просмотров
schedule 30.05.2023

Почему скорость обучения для Q-обучения важна для стохастических сред?
Как указано в Википедии https://en.wikipedia.org/wiki/Q-learning#Learning_Rate , для стохастической задачи использование скорости обучения важно для сходимости. Хотя я пытался найти интуицию, стоящую за причиной без каких-либо математических...
81 просмотров

Ручное моделирование процесса Пуассона в R
В следующей задаче нам предлагается сгенерировать процесс Пуассона шаг за шагом из ρ (время между приходами) и τ (время прибытия). Один из теоретических результатов, представленных в лекциях, дает следующий прямой метод моделирования...
4382 просмотров
schedule 28.12.2023