売上予測例 - モデルの比較と選択

Mohamad

2019年08月17日 00:28

本論文では、計量経済学の手法を応用して、X社の営業部隊の6ヶ月予測を作成する。サンプルデータとして、過去25ヶ月の月次総売上高を使用する。

我々の目的は、競合するモデルを比較し、最適なモデルを選択するためのガイドラインを定義することである。

この図は、過去の月別総売上高のプロットである。

ステップ1：要約統計

記述統計量ウィザード（下図）を使用して、サンプル・データのさまざまな要約統計量を調べます。

この図は、販売データサンプルのサマリー統計ダイアログを示しています。

要約統計表（下の写真）では、データ系列は系列相関（つまりホワイトノイズ検定不合格）とファット・テール（有意な過剰尖度とARCH効果）を示している。

この図は、月次売上高サンプルの要約統計出力表です。

ステップ2：相関図分析

NumXLツールバーを使って、相関図ウィザードを起動します。

この図は、相関図ダイアログまたはユーザー・フォームを示しています。

ログデータをハイライトし、ACFとPACFの9ラグを選択する。そして、データの相関図を作成する。

この図は、ACFとPACFの出力表 - コレログラムの出力。

この図は、ACFとPACFプロットと信頼区間限界を示している。

ACFとPACFのプロットを調べると、データはAR次数1(1)とMA次数2(2)のARMA過程から駆動されているように見える。データ標本は比較的小さいので、高次のモデルでデータをフィットしすぎないように注意してください。

ステップ3：ARMAモデリング

ACF/PACFプロットに基づいて、我々はデータに対してARMAモデルを提案することができる。さらに、ARまたはMAの次数は2以下である。

$$\left(1-\sum_{i=1}^p{\phi_i L^i}\right)\left(x_t-\mu\right)=\left(1+\sum_{j=1}^q{\theta_j L^j}\right)a_t$$

どこでだ：

$L$ = ラグまたはバックシフト演算子
$\phi_i$ = AR成分のi番目の係数。
$p$ = 自己回帰（AR）成分の次数。
$x_t$ = 月次総売上高 $t$
$\mu$ = ARMA過程の長期平均値
$\theta_j$ = MA成分のj番目の係数
$q$ = 移動平均(MA)コンポーネントの次数
$a_t$ = 月における残差、ショック、イノベーション、誤差項 $t$.

このセクションでは、ブルートフォース・アプローチを使い、可能なARMAモデルの順列をすべて調べます。まとめると、各モデルを指定し、キャリブレーションし、検証し、最後に各モデルを他のモデルと比較し、最良の（そして最も単純な）適合を決定します。

Step 3.1: Model Specification

この図は、ARMAウィザードまたはダイアログを使ったARMAモデルの仕様を示している。

この図は、モデル・パラメータ、適合度、残差診断のARMAモデル出力表である。

ステップ3.2：モデルのキャリブレーション

エアライン・モデル表の一番上のセル（すなわち "ARMA(1,2)"）を選択し、ツールバーのキャリブレーション・アイコンをクリックする。

この図は、Excelソルバーを初期化するNumXLショートカットを使ったARMAキャリブレーションを示しています。

ステップ3.3：較正済みモデルの検査と検証

上記のARMA(2.1)モデルについて、モデル・パラメーターの新しい最適値を以下に示す：

この図では、モデルの仮定に対してキャリブレーションを行った後のARMA(2,1)残差を調べています。

ステップ3.4：モデルを比較し、最適なものを選択する

添付のスプレッドシートで、次数(1,0)から(2,2)のすべてのARMAモデルについて、前のステップ(3.1-3.3)を繰り返した。次の表は、我々の発見を要約したものである：

この図は、さまざまな競合モデルの適合度の要約表である。

赤池の情報量規準（AIC）の計算は、モデルの複雑さを考慮し、自由引数の数が増えるにつれて適合度にペナルティを課す。異なるモデルを比較するために、AIC尺度を使用します。

すべてのモデルのAICはほぼ同等であるが、我々は最も単純な方法を選択し、ARMA(1,0)またはAR(1)を選択した。

この図は、最適に選択されたモデル、ARMA(1,0)/AR(1)の最適モデルのパラメータを示している。

この図は、AR(1)モデルに当てはめたデータを元のサンプルと並べてプロットしたものである。

ステップ4：予想

選択されたキャリブレーション・モデルの残差は、ARMAモデルの仮定を満たしている。これで、月次総売上高の6ヵ月予測を行う準備が整いました。

ARMA(1,0)」と書かれたセルを選択し、ツールバーの「予測」アイコンをクリックする。

この図はNumXL Forecastダイアログまたはウィザードを使用した予測を示している。

ご注意ください：予測目的において、入力時系列データは最新の売上総額（つまり前月分）を指します。出力表は以下に示します：

この図は、月次売上合計のフォーキャスト出力表である。

ご注意ください：予測値は時間経過とともにモデルの長期平均値50.65（$\phi_o$）に向かって推移しており、予測誤差は1.8に近づいています。これはモデルの条件付き（すなわち無条件）長期標準偏差に相当します。

最後に、今後9～12ヶ月の予測平均値と信頼区間を以下のようにプロットする：

この図は、信頼区間限界または領域付きの売上予測プロットを示している。

結論

さて、ARMA(1,0)またはAR(1)モデルをサンプルデータに最も適合するモデルとして選択したので、その表現の実際的な意味を検証する。このモデルは、連続する月間の売上高に有意な相関があることを示している。

さらに、（X社が獲得した）営業案件の約45％（45％）は、2カ月サイクルで成約している：

$$ r = \frac{\phi_1}{1+\phi_1}=\frac{0.82}{1.82}=45\% $$

サポートファイル