Модели ARIMA (p, d, q) предоставляют другой подход к прогнозированию временных рядов, и это очень популярная форма статистического метода модели Бокса-Дженкинса. Авторегрессионная интегрированная скользящая средняя может быть полезна в различных областях, таких как статистика, для измерения событий, происходящих за период, а также может быть полезна для прогнозирования будущих значений в серии. Что входит в состав этой модели?
Давайте посмотрим на определение AR, I и MA.
Модели авторегрессии
В модели множественной регрессии мы прогнозируем интересующую переменную, используя линейную комбинацию предикторов. В модели авторегрессии мы прогнозируем переменную, используя линейную комбинацию прошлого. Авторегрессионную модель порядка p можно записать следующим образом.
Модели скользящего среднего
Модель скользящего среднего использует прошлые ошибки прогноза в регрессионной модели. Пожалуйста, смотрите формулу как
Backshift
Оператор обратного сдвига B полезен при работе с лагами временных рядов:
B имеет эффект разницы в данных на один период. Первое различие можно записать как
Обратите внимание, что первая разница представлена (1-B). Точно так же, если необходимо вычислить разности второго порядка, тогда:
В общем, мы видим, что разность d-го порядка может быть записана как
Несезонные модели ARIMA
Когда мы объединяем дифференцирование с авторегрессией и моделью скользящего среднего, мы обнаружим несезонную модель ARIMA (интегрированное скользящее среднее авторегрессии). Модель можно записать как (разностная серия)
Константа c оказывает значительное влияние на долгосрочные прогнозы, полученные на основе этих моделей. Значение d также влияет на диапазоны прогнозов. Значение p важно, если данные показывают циклы.
Ниже приведены некоторые особые ситуации.
См. Некоторые особые случаи моделей ARIMA ниже.
Функция ARIMA полезна для построения модели с использованием Python или R, но на самом деле все автоматизированное может быть немного плохим. Поэтому понимание поведения моделей действительно важно. По этой причине нам необходимо понимать, как мы находим параметры p, d, q вручную. Давайте проверим несколько сюжетов.
Графики ACF и PACF
Обычно невозможно сказать, какие значения p и q верны для набора данных. Иногда можно использовать график ACF и тесно связанный график PACF для определения подходящих значений. Что такое графики ACF и PACF?
ACF - это способ измерить линейную взаимосвязь между наблюдением в момент времени t и наблюдениями в предыдущие моменты времени.
PACF - это функция частичной автокорреляции, которая объясняет частичную корреляцию между рядами и собственными лагами. Он находит корреляцию остатков со следующим значением запаздывания.
Некоторые примеры, чтобы понять, как мы можем выбрать значения p и q с помощью графиков ACF и PACF.
PACF показывает выброс на lag1, а ACF показывает резкую картину. Это модель AR (1).
Ссылки
Https://machinelearningmaster.com/arima-for-time-series-forecasting-with-python/
Https://machinelearningmaster.com/time-series-forecasting-methods-in-python-cheat-sheet/