Временной ряд – это ряд точек данных, проиндексированных (или перечисленных, или представленных на графике) во временном порядке, или его можно рассматривать как последовательность точек данных, которые появляются в последовательном порядке в течение определенного периода времени. Временной ряд можно взять для любой переменной, которая изменяется во времени.

Анализ временных рядов:

Он изображает способ изучения характеристик целевой переменной по отношению ко времени как независимой переменной или просто выполнения прогноза целевой переменной с использованием временной переменной в качестве точки отсчета. Шаги, которые необходимо выполнить для выполнения анализа временных рядов, следующие:

  1. Сбор соответствующих данных временных рядов для подходящего интервала
  2. Определение ключевых компонентов нескольких функций во времени с использованием графиков и графиков
  3. Наблюдение за ключевыми компонентами временного ряда
  4. Построение моделей и прогнозирование, то есть прогнозирование будущей деятельности.

Шаблоны временных рядов или ключевые компоненты временных рядов:

  1. Тренд. Тенденция существует, когда в данных наблюдается долгосрочное увеличение или уменьшение. Он не должен быть линейным.
  2. Сезонность. Сезонность возникает, когда на временной ряд влияют сезонные факторы, такие как время года или день недели. Сезонность всегда для фиксированной и известной частоты.
  3. Циклический. Цикличность возникает, когда данные демонстрируют подъемы и спады, которые не имеют фиксированной частоты. Эти колебания обычно обусловлены экономическими условиями и часто связаны с «деловым циклом».
  4. Нерегулярность/случайность: непредвиденные ситуации или изменения за короткий промежуток времени.

Многие временные ряды включают в себя все ключевые закономерности. Поэтому при выборе метода прогнозирования нам сначала нужно определить закономерности временных рядов данных, а затем выбрать подходящий метод, способный правильно фиксировать закономерности.

Типы данных временных рядов:

При работе с временными рядами обычно используются два основных типа данных:

  1. Стационарный. Набор данных должен соответствовать приведенным ниже эмпирическим правилам, без компонентов тренда, сезонности, цикличности и нерегулярности временных рядов.
  • Среднее значение должно быть постоянным в данных во время анализа.
  • VARIANCE & COVARIANCE должны быть постоянными относительно временных рамок.

Таким образом, стационарный временной ряд обладает статистическими свойствами или моментами, которые не меняются во времени.

2. Нестационарный: нестационарный временной ряд — это статус временного ряда, статистические свойства которого меняются во времени.

Есть 3 типичных метода для тестирования любого конкретного временного ряда для стационарных. Вот они:

  1. Визуальные тесты. Просто проверьте все критерии, которым должна удовлетворять серия, чтобы быть стационарной на графике, над которым мы работаем.
  2. Глобальные и локальные проверки: мы можем рассчитать среднее значение стандартного отклонения всего временного ряда (глобальное) и сравнить их со средним значением стандартного отклонения данных в пределах фиксированных интервалов (локальное). равных, мы можем назвать временной ряд стационарным.
  3. Расширенный тест Дики-Фуллера (ADF). Расширенный тест Дики-Фуллера (ADF) проверяет нулевую гипотезу о наличии единичного корня в выборке временного ряда. Альтернативная гипотеза различается в зависимости от того, какая версия теста используется, но обычно это стационарность или тренд-стационарность. Это расширенная версия теста Дики-Фуллера для более крупного и сложного набора моделей временных рядов. Тест ADF является наиболее популярным статистическим тестом со следующими предположениями.
  • Нулевая гипотеза (H0): ряд нестационарен, зависит от времени (имеет единичный корень).
  • Альтернативная гипотеза (HA): ряд является стационарным, не зависящим от времени (не может быть представлен единичным корнем).

Значение p определяет результат теста. Если он меньше критического порога 0,05 или 0,01, мы отклоняем нулевую гипотезу и делаем вывод, что ряд является стационарным. В противном случае мы не можем отклонить нулевое значение и придем к выводу, что ряд нестационарен.

p-значение >0,05 Невозможно отклонить (H0)

p-значение ‹= 0,05 Принять (H1)

Преобразование нестационарных рядов в стационарные:

Ниже приведены методы, используемые для преобразования любых нестационарных временных рядов в стационарные:

  1. Устранение тренда. Он включает в себя удаление эффектов тренда из заданного ряда и отображение только различий в значениях тренда.

2. Десезонизация. Временной ряд, в котором был удален сезонный компонент, называется десезонизацией, а процесс называется сезонной корректировкой.

3. Разность. Метод преобразования простейших нестационарных данных в стационарные — это разность. Этот процесс включает в себя получение различий последовательных наблюдений. Для простых распределений достаточно взять разность первого порядка, чтобы сделать ее стационарной.

Автокорреляция и частичная автокорреляция:

Точно так же, как корреляция измеряет степень линейной связи между двумя переменными, автокорреляция измеряет линейную связь между запаздывающими значениями временного ряда, т. е. корреляцию последовательности с самой собой, отстающей на некоторое количество единиц времени.

График ACF (также называемый коррелограммой или графиком функции автокорреляции или графиком автокорреляции) — это визуальный способ показать последовательную корреляцию в данных, которые меняются с течением времени. ACF — это (полная) функция автокорреляции, которая дает нам значения автокорреляции любого ряда с его запаздывающими значениями.

Частичная автокорреляция похожа на автокорреляцию и показывает корреляцию последовательности с самой собой, отстающей на некоторое количество единиц времени. Однако изюминка заключается в том, что показан только прямой эффект, а все промежуточные эффекты удалены.

График PACF представляет собой функцию частичной автокорреляции. Вместо того, чтобы находить корреляции настоящего с задержками, такими как ACF, он находит корреляцию остатков (которая остается после удаления эффектов, которые уже объясняются более ранними промежуточными задержками)) со следующим значением задержки, следовательно, «частичным», а не «полным». ', поскольку мы удаляем уже найденные варианты, прежде чем найдем следующую корреляцию.

Подводя итог общей концепции, ACF изображает корреляцию между запаздывающими значениями временного ряда с учетом косвенного влияния каждого периода запаздывания. Однако, с другой стороны, PACF отображает корреляцию между запаздывающими значениями временного ряда, пренебрегая косвенным эффектом и рассматривая только прямой эффект в течение фиксированных периодов времени.

Примечание. Перед расчетом автокорреляции и частичной автокорреляции временной ряд должен быть стационарным.

Белый шум:

Временные ряды, в которых отсутствует автокорреляция, называются белым шумом. Временной ряд считается белым шумом, если выполняются следующие критерии:

  1. Среднее значение равно 0
  2. Стандартное отклонение постоянно со временем
  3. Корреляция между лагами равна 0.

Одной из важных характеристик временных рядов белого шума является их непредсказуемость.

Важность белого шума. Любой временной ряд состоит из двух основных компонентов: сигнальной части (которую можно смоделировать на основе наших данных) и остаточной или ошибочной части, т. е. непредсказуемой части. Поэтому всякий раз, когда мы выполняем моделирование на любых данных временного ряда и получаем остаточную часть, очень похожую на белый шум, это ясно указывает на то, что использованная нами модель хорошо подходит для данных.

Существует 3 типичных метода проверки любого конкретного временного ряда на наличие белого шума. Вот они:

  1. Визуальные тесты. Просто проверьте все 3 критерия, которые должны быть выполнены, чтобы серия была белым шумом на графике, над которым мы работаем.
  2. Глобальные и локальные проверки: мы можем рассчитать среднее значение стандартного отклонения всего временного ряда (глобальное) и сравнить их со средним значением стандартного отклонения данных в пределах фиксированных интервалов (локальное). равным, мы можем назвать временной ряд Белым шумом.
  3. Проверка ACF: если на графике ACF нет автокорреляции, мы можем просто назвать временной ряд белым шумом.

Цель этого блога — дать полное теоретическое представление о временных рядах и различных терминах, связанных с ними. Скоро я опубликую еще один блог, основанный на различных моделях временных рядов.