Временной ряд – это ряд точек данных, проиндексированных (или перечисленных, или представленных на графике) во временном порядке, или его можно рассматривать как последовательность точек данных, которые появляются в последовательном порядке в течение определенного периода времени. Временной ряд можно взять для любой переменной, которая изменяется во времени.
Анализ временных рядов:
Он изображает способ изучения характеристик целевой переменной по отношению ко времени как независимой переменной или просто выполнения прогноза целевой переменной с использованием временной переменной в качестве точки отсчета. Шаги, которые необходимо выполнить для выполнения анализа временных рядов, следующие:
- Сбор соответствующих данных временных рядов для подходящего интервала
- Определение ключевых компонентов нескольких функций во времени с использованием графиков и графиков
- Наблюдение за ключевыми компонентами временного ряда
- Построение моделей и прогнозирование, то есть прогнозирование будущей деятельности.
Шаблоны временных рядов или ключевые компоненты временных рядов:
- Тренд. Тенденция существует, когда в данных наблюдается долгосрочное увеличение или уменьшение. Он не должен быть линейным.
- Сезонность. Сезонность возникает, когда на временной ряд влияют сезонные факторы, такие как время года или день недели. Сезонность всегда для фиксированной и известной частоты.
- Циклический. Цикличность возникает, когда данные демонстрируют подъемы и спады, которые не имеют фиксированной частоты. Эти колебания обычно обусловлены экономическими условиями и часто связаны с «деловым циклом».
- Нерегулярность/случайность: непредвиденные ситуации или изменения за короткий промежуток времени.
Многие временные ряды включают в себя все ключевые закономерности. Поэтому при выборе метода прогнозирования нам сначала нужно определить закономерности временных рядов данных, а затем выбрать подходящий метод, способный правильно фиксировать закономерности.
Типы данных временных рядов:
При работе с временными рядами обычно используются два основных типа данных:
- Стационарный. Набор данных должен соответствовать приведенным ниже эмпирическим правилам, без компонентов тренда, сезонности, цикличности и нерегулярности временных рядов.
- Среднее значение должно быть постоянным в данных во время анализа.
- VARIANCE & COVARIANCE должны быть постоянными относительно временных рамок.
Таким образом, стационарный временной ряд обладает статистическими свойствами или моментами, которые не меняются во времени.
2. Нестационарный: нестационарный временной ряд — это статус временного ряда, статистические свойства которого меняются во времени.
Есть 3 типичных метода для тестирования любого конкретного временного ряда для стационарных. Вот они:
- Визуальные тесты. Просто проверьте все критерии, которым должна удовлетворять серия, чтобы быть стационарной на графике, над которым мы работаем.
- Глобальные и локальные проверки: мы можем рассчитать среднее значение стандартного отклонения всего временного ряда (глобальное) и сравнить их со средним значением стандартного отклонения данных в пределах фиксированных интервалов (локальное). равных, мы можем назвать временной ряд стационарным.
- Расширенный тест Дики-Фуллера (ADF). Расширенный тест Дики-Фуллера (ADF) проверяет нулевую гипотезу о наличии единичного корня в выборке временного ряда. Альтернативная гипотеза различается в зависимости от того, какая версия теста используется, но обычно это стационарность или тренд-стационарность. Это расширенная версия теста Дики-Фуллера для более крупного и сложного набора моделей временных рядов. Тест ADF является наиболее популярным статистическим тестом со следующими предположениями.
- Нулевая гипотеза (H0): ряд нестационарен, зависит от времени (имеет единичный корень).
- Альтернативная гипотеза (HA): ряд является стационарным, не зависящим от времени (не может быть представлен единичным корнем).
Значение p определяет результат теста. Если он меньше критического порога 0,05 или 0,01, мы отклоняем нулевую гипотезу и делаем вывод, что ряд является стационарным. В противном случае мы не можем отклонить нулевое значение и придем к выводу, что ряд нестационарен.
p-значение >0,05 Невозможно отклонить (H0)
p-значение ‹= 0,05 Принять (H1)
Преобразование нестационарных рядов в стационарные:
Ниже приведены методы, используемые для преобразования любых нестационарных временных рядов в стационарные:
- Устранение тренда. Он включает в себя удаление эффектов тренда из заданного ряда и отображение только различий в значениях тренда.
2. Десезонизация. Временной ряд, в котором был удален сезонный компонент, называется десезонизацией, а процесс называется сезонной корректировкой.
3. Разность. Метод преобразования простейших нестационарных данных в стационарные — это разность. Этот процесс включает в себя получение различий последовательных наблюдений. Для простых распределений достаточно взять разность первого порядка, чтобы сделать ее стационарной.
Автокорреляция и частичная автокорреляция:
Точно так же, как корреляция измеряет степень линейной связи между двумя переменными, автокорреляция измеряет линейную связь между запаздывающими значениями временного ряда, т. е. корреляцию последовательности с самой собой, отстающей на некоторое количество единиц времени.
График ACF (также называемый коррелограммой или графиком функции автокорреляции или графиком автокорреляции) — это визуальный способ показать последовательную корреляцию в данных, которые меняются с течением времени. ACF — это (полная) функция автокорреляции, которая дает нам значения автокорреляции любого ряда с его запаздывающими значениями.
Частичная автокорреляция похожа на автокорреляцию и показывает корреляцию последовательности с самой собой, отстающей на некоторое количество единиц времени. Однако изюминка заключается в том, что показан только прямой эффект, а все промежуточные эффекты удалены.
График PACF представляет собой функцию частичной автокорреляции. Вместо того, чтобы находить корреляции настоящего с задержками, такими как ACF, он находит корреляцию остатков (которая остается после удаления эффектов, которые уже объясняются более ранними промежуточными задержками)) со следующим значением задержки, следовательно, «частичным», а не «полным». ', поскольку мы удаляем уже найденные варианты, прежде чем найдем следующую корреляцию.
Подводя итог общей концепции, ACF изображает корреляцию между запаздывающими значениями временного ряда с учетом косвенного влияния каждого периода запаздывания. Однако, с другой стороны, PACF отображает корреляцию между запаздывающими значениями временного ряда, пренебрегая косвенным эффектом и рассматривая только прямой эффект в течение фиксированных периодов времени.
Примечание. Перед расчетом автокорреляции и частичной автокорреляции временной ряд должен быть стационарным.
Белый шум:
Временные ряды, в которых отсутствует автокорреляция, называются белым шумом. Временной ряд считается белым шумом, если выполняются следующие критерии:
- Среднее значение равно 0
- Стандартное отклонение постоянно со временем
- Корреляция между лагами равна 0.
Одной из важных характеристик временных рядов белого шума является их непредсказуемость.
Важность белого шума. Любой временной ряд состоит из двух основных компонентов: сигнальной части (которую можно смоделировать на основе наших данных) и остаточной или ошибочной части, т. е. непредсказуемой части. Поэтому всякий раз, когда мы выполняем моделирование на любых данных временного ряда и получаем остаточную часть, очень похожую на белый шум, это ясно указывает на то, что использованная нами модель хорошо подходит для данных.
Существует 3 типичных метода проверки любого конкретного временного ряда на наличие белого шума. Вот они:
- Визуальные тесты. Просто проверьте все 3 критерия, которые должны быть выполнены, чтобы серия была белым шумом на графике, над которым мы работаем.
- Глобальные и локальные проверки: мы можем рассчитать среднее значение стандартного отклонения всего временного ряда (глобальное) и сравнить их со средним значением стандартного отклонения данных в пределах фиксированных интервалов (локальное). равным, мы можем назвать временной ряд Белым шумом.
- Проверка ACF: если на графике ACF нет автокорреляции, мы можем просто назвать временной ряд белым шумом.
Цель этого блога — дать полное теоретическое представление о временных рядах и различных терминах, связанных с ними. Скоро я опубликую еще один блог, основанный на различных моделях временных рядов.