本論文では、計量経済学の手法を応用して、X社の営業部隊の6ヶ月予測を作成する。サンプルデータとして、過去25ヶ月の月次総売上高を使用する。
我々の目的は、競合するモデルを比較し、最適なモデルを選択するためのガイドラインを定義することである。
ステップ1:要約統計
記述統計量ウィザード(下図)を使用して、サンプル・データのさまざまな要約統計量を調べます。
要約統計表(下の写真)では、データ系列は系列相関(つまりホワイトノイズ検定不合格)とファット・テール(有意な過剰尖度とARCH効果)を示している。
ステップ2:相関図分析
NumXLツールバーを使って、相関図ウィザードを起動します。
ログデータをハイライトし、ACFとPACFの9ラグを選択する。 そして、データの相関図を作成する。
ACFとPACFのプロットを調べると、データはAR次数1(1)とMA次数2(2)のARMA過程から駆動されているように見える。 データ標本は比較的小さいので、高次のモデルでデータをフィットしすぎないように注意してください。
ステップ3:ARMAモデリング
ACF/PACFプロットに基づいて、我々はデータに対してARMAモデルを提案することができる。 さらに、ARまたはMAの次数は2以下である。
$$\left(1-\sum_{i=1}^p{\phi_i L^i}\right)\left(x_t-\mu\right)=\left(1+\sum_{j=1}^q{\theta_j L^j}\right)a_t$$
どこでだ:
- $L$ = ラグまたはバックシフト演算子
- $\phi_i$ = AR成分のi番目の係数。
- $p$ = 自己回帰(AR)成分の次数。
- $x_t$ = 月次総売上高 $t$
- $\mu$ = ARMA過程の長期平均値
- $\theta_j$ = MA成分のj番目の係数
- $q$ = 移動平均(MA)コンポーネントの次数
- $a_t$ = 月における残差、ショック、イノベーション、誤差項 $t$.
このセクションでは、ブルートフォース・アプローチを使い、可能なARMAモデルの順列をすべて調べます。 まとめると、各モデルを指定し、キャリブレーションし、検証し、最後に各モデルを他のモデルと比較し、最良の(そして最も単純な)適合を決定します。
Step 3.1: Model Specification
ステップ3.2:モデルのキャリブレーション
エアライン・モデル表の一番上のセル(すなわち "ARMA(1,2)")を選択し、ツールバーのキャリブレーション・アイコンをクリックする。
ステップ3.3:較正済みモデルの検査と検証
上記のARMA(2.1)モデルについて、モデル・パラメーターの新しい最適値を以下に示す:
ステップ3.4: モデルを比較し、最適なものを選択する
添付のスプレッドシートで、次数(1,0)から(2,2)のすべてのARMAモデルについて、前のステップ(3.1-3.3)を繰り返した。 次の表は、我々の発見を要約したものである:
赤池の情報量規準(AIC)の計算は、モデルの複雑さを考慮し、自由引数の数が増えるにつれて適合度にペナルティを課す。 異なるモデルを比較するために、AIC尺度を使用します。
すべてのモデルのAICはほぼ同等であるが、我々は最も単純な方法を選択し、ARMA(1,0)またはAR(1)を選択した。
ステップ4:予想
選択されたキャリブレーション・モデルの残差は、ARMAモデルの仮定を満たしている。 これで、月次総売上高の6ヵ月予測を行う準備が整いました。
ARMA(1,0)」と書かれたセルを選択し、ツールバーの「予測」アイコンをクリックする。
ご注意ください:予測目的において、入力時系列データは最新の売上総額(つまり前月分)を指します。出力表は以下に示します:
ご注意ください:予測値は時間経過とともにモデルの長期平均値50.65($\phi_o$)に向かって推移しており、予測誤差は1.8に近づいています。これはモデルの条件付き(すなわち無条件)長期標準偏差に相当します。
最後に、今後9~12ヶ月の予測平均値と信頼区間を以下のようにプロットする:
結論
さて、ARMA(1,0)またはAR(1)モデルをサンプルデータに最も適合するモデルとして選択したので、その表現の実際的な意味を検証する。 このモデルは、連続する月間の売上高に有意な相関があることを示している。
さらに、(X社が獲得した)営業案件の約45%(45%)は、2カ月サイクルで成約している:
$$ r = \frac{\phi_1}{1+\phi_1}=\frac{0.82}{1.82}=45\% $$
コメント
サインインしてコメントを残してください。