教科書の例 - 航空旅客データ

本稿では、教科書『時系列』(Box, Jenkins and Reinsel, ISBN 978-047027284)に記載されている国際旅客データ系列(G)を分析する: Box, Jenkins, and Reinsel 著 (ISBN: 978-0470272848) の教科書「Time Series: Forecast and Control」に記載されている国際旅客データ系列 (G) を分析する。 この教科書は1960年代後半に出版され、多くの実務家から時系列に関する基礎的な教科書として認められている。

国際線旅客数シリーズは、1949年1月から1960年12月までの国際線旅客数の月次合計を表している。

ここでの目的は、この本と同じ分析に従い、NumXLの計算の正確さを実証することである。 さらに、主要な統計ソフトウェアベンダーであるSASが、同じデータセットについて独自の分析結果を示しているので、このリンクから彼らの結果も確認することを強くお勧めする:

SAS Procedural reference - 例 7.2 航空会社シリーズの季節モデル

この図は航空旅客データプロットを示している。

ステップ1:データ変換

記述統計量ウィザード(下図)を使用して、サンプルデータのさまざまな要約統計量を調べます。

この図は NumXL Desc Statistics ウィザードを示しています。

要約統計表(下の写真)では、データ系列は系列相関(つまりホワイトノイズ検定不合格)とファット・テール(有意な過剰尖度とARCH効果)を示している。

この図は、航空旅客データのサマリー統計出力を示しています。

オリジナルの分析では、自然対数関数(つまりLN)を使ってデータ系列を変換する。 下のグラフに示すように、同じ手法に従う:

この図は、対数航空旅客データのプロットを示している。

この手法によって、以下のような要約統計量が得られるはずである:

この図は、航空会社のログ旅客データのサマリー統計である。
変換されたデータ系列は元のデータよりも滑らかで、時間トレンドは元のデータよりも直線的に見えることに注目してほしい。

ステップ2:相関図分析

NumXLツールバーを使って、相関図ウィザードを起動します。

この図はNumXL相関図ウィザードを示しています。

ログデータをハイライトし、ACFとPACFの24ラグを選択する。 そして、データの相関図を作成する。

この図は、航空会社のログ旅客データの相関図出力を示している。

ACFプロットを分析すると、データは遅延1(1)と遅延12(12)で積分されているように見えます。両方の遅延(つまり $ \left(1-L\right)\left(1-L^{12}\right) $)のデータ差分を、以下のグラフに示すように計算します:

この図は、差分航空旅客データを示している。

差分化されたデータセットは、次のような相関図を生成するはずである:

この図は、差分対数航空旅客データの相関図である。

また、差分化されたデータ系列のACFプロットは、ラグ1(1)とラグ12(12)で有意な自己相関を示していることに注目されたい。

ステップ3:航空会社のモデリング

対数旅客データ系列に対して提案されたモデルは、シーズン長12ヶ月の航空会社モデルである。

$$\left(1-L\right)\left(1-l^{12}\right)\ln{X_t}=\mu \left(1+\theta L\right)\left(1+\Theta L^{12}\right)a_t$$

どこで

  • L = バックシフト演算子(別名B)。
  • $a_t$ = 誤差項、ショック、イノベーショ ン、あるいは単に時刻 t におけるモデル残差。
  • $\mu$ = 季節差分された時系列の平均。

NumXLツールバーを使って、Airlineアイコンをクリックし、Airlineモデルウィザードを起動する。

この図は、航空会社モデルのウィザードを示しています。

この図は、エアラインモデルの初期値テーブルを示している。

ステップ4:キャリブレーション

航空会社モデル表の一番上のセル(例:「AIRLINE(12)」)を選択し、ツールバーの「キャリブレーション」アイコンをクリックします。

この図は航空旅客データの校正を示している。

Excelのソルバーは、航空会社モデルのパラメーター(すなわち $\theta,\Theta$ )の最適な値を決定しようと試みます。

この図は、Excelソルバーの結果ダイアログを示しています。

モデルパラメーターの新しい最適値を以下に示す:

この図は、航空旅客データの校正値を示している。

残差分析表を調べると、校正された値は、基礎となるモデルのすべての仮定(すなわち、ガウス分布の残差)を満たしている。

SASのウェブサイトに掲載されているキャリブレーション・モデルのパラメータ値は、私たちが先に計算したものとは若干異なっている:

この図は、SAS エアライン・モデルのパラメータを示しています。この図は、航空会社モデルの適合度を示している。

しかし、我々の値は誤差の許容範囲内(すなわち)であり、赤池の情報量規準(AIC)の方が優れている。

NumXLとSASの値の根本的な違いは、私たちが切片($\mu$)の値をゼロに設定しなかった点にあると考えられます。

ステップ5:予想

校正されたモデルの残差は、航空会社モデルの仮定を満たしている。 これで、毎月の国際航空旅客数の24ヶ月予測を行う準備が整いました。

予想には2つの段階がある:

  • 月次合計の対数予測
  • 予測を通常の月次合計に戻す

AIRLINE(12)」と書かれたセルを選択し、ツールバーの「予測」アイコンをクリックする。

この図は、航空旅客予測ウィザードを示している。

ご注意ください。予測目的において、ここでの入力時系列は最新の13ヶ月、または1959年11月から1960年12月までの観測値を指します。出力表は下記に示します:

この図は、対数航空旅客月次合計の予測表である。

この図は、対数航空旅客月次合計の予測を示している。

通常の月次合計に戻すには、以下の式を使用する:

$$UL=e^{UL_{log}}$$

$$LL=e^{LL_{log}}$$

$$\mu=e^{\mu_{log}+\frac{\sigma_{log}^2}{2}}$$

この図は、月間航空旅客総数の予測表である。

この図は、月間航空旅客総数の予測プロットである。

  添付ファイル

コメント

サインインしてコメントを残してください。

この記事は役に立ちましたか?
1人中1人がこの記事が役に立ったと言っています