Excelでのバックテスト

Fayez

2020年10月21日 16:34

モデリングにおけるバックテストとは、過去のデータを使って予測モデルをテストすることである。この記事は、Microsoft Excelでバックテストを行う方法についてのものであり、バックテストの理論的背景についてのものではありません。

バックテストはどのように行うのか？時系列の最初まで時間を巻き戻し、その時点までの利用可能なデータを使って対象モデルのパラメータを較正し、次の期間の予測（＝フォーキャスト）を行います。次に、時間を進め、パラメータ値を再較正し、別の予測を行う、といった具合です。練習の最後には、私たちは一連の予測を手にすることになる。

各時点で、我々が行う唯一の仮定は、一般的なモデルの定義（例えば、ARMA(1,1)）であることに注意してください。それでも、その時点までで利用可能な情報のみを使用して、パラメータの値をキャリブレーションする。

このアプローチは現実の実務と一致している。まず、初期モデルから始めて、次の期間の予測を行う。時間は進む。新しい期間が発生したので、新しいデータ点を現在の入力データセットに追加し、パラメータを再較正し、次の期間の予測を行い、これを繰り返す。

なぜ私が気にしなければならないのか？

この記事では、バックテストを実施するために必要なマイクロソフト・エクセルの手順を説明する： INDEX(.)とSEQUENCE(.)を使用し、エクセルの "データ・テーブル "メカニズムを活用して様々なシナリオを実行する。

バックテストでは、予測誤差が生成されるため、予測誤差の時系列を系列相関、分布、外れ値、その他について精査し、モデルの精度とパフォーマンスをよりよく理解することができます。

さあ、始めましょう！

今回は、200個のオブザベーションからなる合成定常データセットを使用する。このデータ集合は、次に示すようにARMA(1,1)過程に従う。

この図は、200個のオブザベーションからなる合成定常データセットを示している。

提案モデルはARMA(1,1)

この図は、オリジナルARMAモデルの表を示す。

バックテスト手順

反復のたびに、以下のことを行う必要がある： (2) (1)のデータセットを使って、ARMA(1,1)モデルのパラメータ値をキャリブレーションする。 (3) (2)のモデルと(1)のデータセットを使って、1期間先の予測を計算する。

1. 入力データセット

入力データ集合を完全に記述するには、開始と終了の2つのインデックスが必要である。次にSEQUENCE(.)関数を用いて、開始と終了の間のインデックス集合を生成する。次に、INDEX(.)関数を用いて、シーケンスセット内の行インデックスを持つ元のデータセット内のすべてのセル範囲を返す。

例:

元の入力データセットは\$A\$3:\$A\$202です。インデックス1から50までのセルを選択します。

=INDEX(\$A\$3:\$A\$202,SEQUENCE(50,1,1,1),1)

入力データの名前を定義し、入力セル範囲の代わりにこの名前を参照できることに注意。

2. モデルの較正

ここでは、NumXL ARMA_PARAM(.)関数を使用し、較正済みパラメータにはreturn type=2を指定する。

この図は、キャリブレーションされたARMAモデルを示している。

ARMA_PARAM(.)は、モデルのパラメーターをコンパクトな形で返すので、上の図ではARMAプロセスがそうなっている： \[\begin{array}{l} {X_t} = 1.485 + 0.401{X_{t - 1}} + 0.734{a_{t - 1}} + {a_t}\\ {a_t} \sim N(0,1.14) \end{array}\]