В этой статье мы проанализируем серию данных о международных пассажирских перевозках (G), как указано в учебнике Time Series: Forecast and Control by Box, Jenkins, and Reinsel (ISBN: 978-0470272848). Этот учебник был впервые опубликован в конце 1960-х годов и рассматривается многими практиками как однозначно фундаментальный учебник по теме временных рядов.
Серия "Пассажиры международных авиалиний" описывает ежемесячные суммарные показатели международных пассажиров за период с января 1949 по декабрь 1960 года.
Задача состоит в том, чтобы повторить анализ, описанный в книге, и продемонстрировать точность вычислений NumXL. Кроме того, SAS - ведущий производитель статистического программного обеспечения - демонстрирует свой собственный анализ для того же набора данных, поэтому мы настоятельно рекомендуем нашим пользователям ознакомиться с их результатами по этой ссылке:
Процедурный справочник SAS - Пример 7.2 Сезонная модель для серии авиакомпаний
Шаг 1: Преобразование данных
С помощью мастера описательной статистики (на рисунке ниже) изучите различные сводные статистики данных выборки.
В таблице сводной статистики (на рисунке ниже) видно, что ряд данных демонстрирует последовательную корреляцию (т.е. не прошел тест на белый шум) и жирные хвосты (значительный избыточный эксцесс и эффект ARCH).
В оригинальном анализе ряды данных преобразуются с помощью функции натурального логарифма (т.е. LN). Выполните аналогичные действия, как показано на графике ниже:
Эта методика должна дать следующую сводную статистику:
Обратите внимание, что преобразованный ряд данных более гладкий, чем исходные данные, а временной тренд выглядит более линейным, чем в оригинале.
Шаг 2: Анализ коррелограммы
Используя панель инструментов NumXL, запустите мастер Коррелограмма.
Выделите данные журнала и выберите 24 лага для ACF и PACF. Затем создайте коррелограмму для этих данных.
При рассмотрении графика ACF данные кажутся интегрированными с запаздыванием в один (1) и двенадцать (12) шагов. Разница данных для обоих запаздываний (т. е. $ \left(1-L\right)\left(1-L^{12}\right) $), как показано на графике ниже:
Дифференцированный набор данных должен дать следующую коррелограмму:
Также обратите внимание, что график АКФ дифференцированного ряда данных показывает значительную автокорреляцию на первом (1) и двенадцатом (12) лагах.
Шаг 3: Моделирование авиакомпаний
Предлагаемая модель для ряда данных о пассажирах из журнала представляет собой модель авиакомпании с длиной сезона 12 месяцев.
$$\left(1-L\right)\left(1-l^{12}\right)\ln{X_t}=\mu \left(1+\theta L\right)\left(1+\Theta L^{12}\right)a_t$$
Где
- L = оператор обратного сдвига (он же B).
- $a_t$ = термин ошибки, шок, инновация или просто остаток модели в момент времени t.
- $\mu$ = среднее значение сезонного дифференцированного временного ряда.
На панели инструментов NumXL нажмите на значок Airline, чтобы запустить мастер создания модели Airline.
Шаг 4: Калибровка
Выберите ячейку в верхней части таблицы моделей авиакомпаний (например, "AIRLINE(12)") и нажмите на значок калибровки на панели инструментов.
Решатель Excel попытается определить оптимальные значения параметров модели авиакомпании (т. е. $\theta,\Theta$ )
Новые оптимальные значения параметров модели приведены ниже:
Анализ таблицы остатков показывает, что калиброванные значения удовлетворяют всем предположениям базовой модели (т.е. остатки распределены по Гауссу).
Значения параметров калиброванной модели на сайте SAS немного отличаются от тех, которые мы рассчитали ранее:
Однако наши значения находятся в пределах допустимой погрешности (т.е. ), а информационный критерий Акаике (AIC) лучше.
Основное различие между значениями NumXL и SAS, на наш взгляд, можно объяснить тем, что мы не устанавливали значение перехвата ($\mu$ ) равным нулю.
Шаг 5: Прогноз
Остатки калиброванной модели удовлетворяют предположениям модели авиакомпании. Теперь мы готовы выполнить 24-месячный прогноз ежемесячного количества пассажиров международных авиалиний.
Прогноз будет состоять из двух этапов:
- Прогнозирование для логарифмического ряда месячных итогов
- Преобразование прогноза в обычные месячные итоги
Выберите ячейку с надписью "AIRLINE(12)" и нажмите на значок прогноза на панели инструментов.
Обратите внимание, что для целей прогнозирования в качестве входных временных рядов используются данные за последние 13 месяцев, то есть наблюдения за период с ноября 1959 года по декабрь 1960 года. Результаты представлены в таблице ниже:
Для пересчета в обычные месячные итоги используйте следующие уравнения:
$$UL=e^{UL_{log}}$$
$$LL=e^{LL_{log}}$$
$$\mu=e^{\mu_{log}+\frac{\sigma_{log}^2}{2}}$$
Комментарии
Войдите в службу, чтобы оставить комментарий.