時々、当社のサポートデスクには「Hurst指数とは何ですか?Excelでどのように使用しますか?計算結果をどのように解釈すればよいですか?」といったお問い合わせをいただきます。今回の記事では、Hurst指数について詳しく解説し、皆様がHurst指数に対する直感と理解を深められるようお役立ちできれば幸いです。
ハースト指数とは?
ハースト指数」、「ハースト指数」、「ハースト係数」という名称は、これらの研究の中心的研究者であったハロルド・エドウィン・ハースト(1880-1978)に由来する。ハースト指数を含む研究は、当初、ナイル川の長期間にわたって観測された雨と干ばつの不安定な状況に対して最適なダムのサイズを決定するという現実的な問題のために、水文学の分野で開発された。
ハースト指数(H)は、時系列の長期記憶の尺度として使用される。これは時系列の自己相関と、値のペア間のラグが増加するにつれてこれらが減少する割合に関係する。ハースト指数は、しばしば "依存性の指数 "または "長距離依存性の指数 "と呼ばれる。
プロセスのロングメモリーとは?
ロングメモリー(Long Memory)は、長距離依存性(Long-range dependence:LRD)または長距離持続性(Long-range persistence)とも呼ばれ、時系列データで発生する可能性のある現象である。これは、ポイント間の時間が長くなるにつれて、2つのポイントの統計的依存性が減衰する割合に関するものである。
ARMA (P, Q) プロセスは長記憶性を示しますか?いいえ!有限の P と Q の次数を有する定常的な ARMA プロセス、ARMA(P, Q) は短記憶性を示します。自己相関関数(ACF)のグラフを確認すると、その値が指数関数的に減衰し、数回の遅延後に消失することがわかります。
ロングメモリーモデルの挙動は?
一般に、長い記憶を持つプロセスは、ゆっくりと減衰する自己相関関数を持つ、ゆっくりとしたランダムウォーク(ドリフト)のように見えるかもしれない。例えば、ハワイのマウナロア気象観測所で記録された月平均二酸化炭素(CO2)レベルを調べてみよう。
次に、各観測値を12ヶ月前の観測値と差分することで、12ヶ月の季節性を除去してみよう。
相関図では、自己相関係数(ACF)は減衰しているが、そのペースは非常に遅い。
長期記憶を持つ時系列をどのようにモデル化しますか?非定常ARIMAモデルと同様に、分数積分成分を抽出します。その後、残差にARMAモデルを用いて短期記憶を捕捉します。
分数差分演算子を用いることで、時系列における長時間の記憶のダイナミクスを捉えることができる:
\[{(1 - L)^d} = \sum\limits_{k = 0}^\infty {\left( {\begin{array}{*{20}{c}} d\\ k \end{array}} \right)} {( - 1)^k}{L^k} = 1 + {\omega _1}L + {\omega _2}{L^2} + ...\]
どこで:
- $L$ = ラグまたはバックシフト演算子
- ${\omega _1} = - d$
- ${\omega _2} = - \frac{{{\omega _1} \times (d - 1)}}{2}$
- ${\omega _N} = - \frac{{{\omega _{N - 1}} \times (d - N - 1)}}{N}$
について $\left| d \right| \le \frac{1}{2}$, 係数 ${\omega _k}$ 指数関数的な減衰よりも遅い)。
すべてをまとめると、分数ARIMA(すなわちFARIMA)に行き着く。
\[(1 - {\phi _1}L - {\phi _2}{L^2} - ... - {\phi _p}{L^p}){(1 - L)^d}{X_t} = (1 + {\theta _1}L + {\theta _2}{L^2} + ... + {\theta _q}{L^q}){a_t}\]
どこで:
- $L$ = ラグまたはバックシフト演算子
- ${X_t}$ = 時系列データセット
- ${a_t}$ = イノベーション(またはショック)時系列
- $d$ = 積分次数は-0.5~0.5(排他的)。
積分次数(d)をどのように求めたらよいでしょうか? 分数積分次数(d)は、Hurst指数(H)から0.5を引いた値に等しい(つまり、d = H - 0.5)
解釈
一言で言えば、ハースト指数は1つの値(H)であり、これを用いて時系列の長期記憶(系列相関)に関する観測を行うことができる:
| H | Interpretation | |
|---|---|---|
| 0.5 - 1.0 | 長期の正の自己相関を持つ時系列 | |
| 0.0 - 0.5 | は、隣接するペアで高値と低値が長期的に入れ替わる時系列を示す。つまり、低値が高値の後に続き、その次の値は高値になる傾向があり、高値と低値が入れ替わるこの傾向が将来にわたって長く続くことを意味する。 | |
| 0.5 | は完全に無相関の系列であるが、実際には、小さな時間ラグでの自己相関が正または負になる可能性があるが、自己相関の絶対値が指数関数的に急速にゼロに減衰する系列に適用される値である。 |
重要: ハースト指数が0.5である時系列については、その時系列に長期記憶(または長期依存性)がないと結論付けます。ただし、これは時系列が白色雑音であるという意味ではありません。なぜなら、低い遅延順序において1つまたは複数の有意な自己相関因子が存在する場合があるからです。
計算
ハースト指数を推定するためのオリジナルで最もよく知られた方法は、ハーストの過去の水文学的知見に基づく、いわゆる再スケーリングされた範囲(R/S)分析である。
NumXL Hurst(.)関数は、return type = 1 に設定すると、元の(経験的な)ハースト指数を計算します。
=Hurst(X, Alpha, 1)
しかし、この方法は偏った推定値を生み出すことが知られている。サンプルサイズが小さい場合、0.5の傾き(すなわち無相関の長距離)から大きく乖離する。
サイズ補正(アニス・リョード)推定値
オリジナルの(経験的な)ハースト指数推定値に内蔵されたバイアスを修正するために、アニス-LIyodは再スケーリングされた範囲(R/S)のサイズ補正された推定値を導入した。
NumXL Hurst(.)関数は、return type = 2 に設定すると、アニス-リョード(補正 R/S)ハースト指数を計算します。
= Hurst(X,Alpha,2)
統計的有意性
これまでのところ、ほとんどのハースト指数推定量について漸近分布理論は導かれていない。しかし、我々はアニス・ロイド補正R/S分析の信頼区間の近似関数形を持っている。
算出されたハースト指数推定値()の統計的有意性を調べるために、以下の仮説の検定を行う:
\[\begin{array}{l} {{\rm{H}}_o}:{H_q} = {\rm{ uncorrelated}}\\ {{\rm{H}}_1}:{H_q} = {\rm{ long - memory}} \end{array}\]
次に、与えられたサンプルサイズに対する無相関(ロングメモリーなし)時系列の対応するハースト指数推定値と信頼区間(C.I.)限界値を計算する。
NumXL Hurst(.) 関数は、戻り値のタイプを 3 に設定すると、同じサイズの無相関時系列のアニス-リョード(補正 R/S)ハースト指数を計算します。
= Hurst(X,Alpha,3)
NumXL Hurst(.) 関数は、無相関時系列のアニス・リョード・ハースト指数の信頼区間の下限値と上限値を計算します。
LL= Hurst(X,Alpha,4)
UL= Hurst(X,Alpha,5)
最後に、Null-仮説(無相関時系列)のC.I.に対するアニス-リョード(補正R/S)ハースト指数値を検証する。
- ハースト指数推定値はC.I.の外側にあるため、時系列は長い記憶を持っている。
- ハースト指数はC.I.の内側にあるため、時系列は有意なロングメモリー特性を示さず、観測は無相関であり得る。
エクセルによるハースト指数分析
1958年3月から2020年11月までの12ヶ月間の季節調整なし対数CO2レベルを調べてみよう。
アニス・リロイド補正されたR/Sハースト指数推定値は0.84であり、この値は同じサイズの相関のない時系列のハースト指数の信頼区間(CI)外にあります。季節成分を除去した二酸化炭素の対数レベル時系列は長期記憶挙動を示し、分数差分次数(d)は0.34(すなわち、0.84 - 0.50 = 0.34)です。
コメント
サインインしてコメントを残してください。