Статьи по теме stochastic-process

Публикации по теме 'stochastic-process'

Итерация политики - простой пример

Итерация политик - это способ найти оптимальную политику для заданных состояний и действий. Предположим, у нас есть политика (𝝅: S → A), которая назначает действие каждому состоянию. Действие 𝝅 (s) будет выбираться каждый раз, когда система находится в состоянии s. Идея итерации политики Оценить данную политику (например, инициализировать политику произвольно для всех состояний s ∊ S) путем вычисления функции ценности для всех состояний s S в рамках данной политики..

Вопросы по теме 'stochastic-process'

Стационарное распределение эргодической цепи Маркова: решение уравнений

Я пытаюсь решить систему уравнений, чтобы определить стационарное распределение эргодической матрицы Маркова. А именно, матрица P=[0 0 0 0.5 0 0.5; 0.1 0.1 0 0.4 0 0.4; 0 0.2 0.2 0.3 0 0.3; 0 0 0.3 0.5 0 0.2; 0...

4424 просмотров

06.10.2021

Моделируйте путь цепи Маркова 1000 раз

У меня есть следующий код для цепи Маркова: simulation.mc=function(i0,P,n.sim){ S=1:nrow(P) X=rep(0,n.sim) X[1]=i0 for (n in 2:n.sim){ X[n]=sample(x=S,size=1,prob=P[X[n-1],]) } return(X) } P=matrix( c( 0,1/2,0,1/2,0,0,0,...

1358 просмотров

r stochastic-process markov-chains

04.10.2021

смоделировать процесс возможного от другого пуассоновского процесса

Мне интересно, как смоделировать процесс Пуассона из другого с помощью случайной переменной Бернулли с параметром p . Для моделирования первого пуассоновского процесса с параметром \lambda в интервале [0,t] обычно pois = rpois(1, \lambda)...

82 просмотров

r montecarlo poisson simulation stochastic-process

18.11.2021

Стохастическое моделирование Гиллеспи в дискретном времени с использованием R

Я моделирую стохастическое моделирование для эпидемиологии. Как мне смоделировать это в дискретном времени? Мне удалось получить непрерывное время, используя приведенную ниже кодировку. library(GillespieSSA) parms <-...

627 просмотров

r simulation stochastic-process markov

07.04.2022

Переменный индекс столбца для данных GnuPlot

Я написал программу, которая генерирует N траекторий броуновского движения с шагом I~N(0,dt). Я проверяю их на условие W(1)>=1 && W(2)>=2. В качестве вывода я, конечно же, сохраняю данные о моменте времени в файле «Wiener_data.dat». Теперь точки,...

1094 просмотров

plot gnuplot stochastic stochastic-process

20.04.2022

Задача моделирования цепи Маркова методом Монте-Карло

Я пытаюсь запустить симулятор MC для цепи Маркова, которая равномерно распределена между всеми матрицами NxN, у которых нет соседних единиц. Мой алгоритм должен заполнить пространство состояний, запустив цепочку несколько раз. Однако где-то с моей...

1073 просмотров

python montecarlo stochastic-process markov-chains

16.06.2022

Стохастический градиентный спуск сходится слишком плавно

В рамках моей домашней работы меня попросили реализовать стохастический градиентный спуск, чтобы решить задачу линейной регрессии (хотя у меня всего 200 обучающих примеров). Моя проблема в том, что стохастический градиентный спуск сходится слишком...

429 просмотров

machine-learning algorithm linear-regression gradient-descent stochastic-process

15.08.2022

Каково пространство состояний этой цепи Маркова?

Рассмотрим систему, в которой два человека сидят за столом и делят между собой три книги. В любой момент времени оба читают книгу, и одна книга остается на столе. Когда человек заканчивает читать свою текущую книгу, он меняет ее местами с книгой на...

180 просмотров

stochastic-process markov-chains markov

17.12.2022

Цикл для стохастических уравнений

Я хотел бы создать последовательность стохастических уравнений для 100 различных семян, используя следующее выражение: set.seed(123) N <- 100 T <- 1 x <- 10 theta <- c (0 , 5 , 3.5) Dt <- 1 /N Y <- numeric (N +1) Y...

34 просмотров

r loops stochastic-process

06.02.2023

Измените код, чтобы получить синтетические данные, которые плавно переходят от бычьего к медвежьему рыночному циклу.

У меня есть этот класс, который генерирует синтетические данные (запасы), и он отлично работает. Однако я хочу изменить его так, чтобы NewPrice генерировал плавные данные тренда, скажем, для n-баров . Я знаю, что если я уменьшу волатильность, я...

656 просмотров

c# stock algorithm stochastic-process

30.05.2023

Почему скорость обучения для Q-обучения важна для стохастических сред?

Как указано в Википедии https://en.wikipedia.org/wiki/Q-learning#Learning_Rate , для стохастической задачи использование скорости обучения важно для сходимости. Хотя я пытался найти интуицию, стоящую за причиной без каких-либо математических...

81 просмотров

reinforcement-learning q-learning stochastic-process

11.12.2022

Ручное моделирование процесса Пуассона в R

В следующей задаче нам предлагается сгенерировать процесс Пуассона шаг за шагом из ρ (время между приходами) и τ (время прибытия). Один из теоретических результатов, представленных в лекциях, дает следующий прямой метод моделирования...

4382 просмотров

r montecarlo poisson stochastic-process

28.12.2023