Экспонента Харста в Excel

Fayez

20/11/2020 18:32

Время от времени в нашу службу поддержки поступают вопросы об экспоненте Херста: что это такое? Как использовать ее в Excel? И как интерпретировать вычисленные значения? В этом выпуске мы подробно рассмотрим экспоненту Харста и, надеемся, поможем вам развить интуицию и понимание экспоненты Харста.

Что такое экспонента Харста?

Название «экспонента Хёрста», «индекс Хёрста» или «коэффициент Хёрста» происходит от имени Гарольда Эдвина Хёрста (1880-1978), который был ведущим исследователем в этих исследованиях. Исследования с использованием экспоненты Хёрста были первоначально разработаны в гидрологии для практического определения оптимальных размеров плотин для реки Нил в условиях переменчивых дождей и засух, которые наблюдались в течение длительного периода времени.

Изображение Филе - острова в водохранилище Асуанской низменной плотины, ниже по течению от Асуанской плотины и озера Насер, Египет

Экспонента Херста (H) используется в качестве меры долгосрочной памяти временных рядов. Она связана с автокорреляциями временного ряда и скоростью, с которой они уменьшаются по мере увеличения лага между парами значений. Экспоненту Херста часто называют "индексом зависимости" или "индексом дальнодействующей зависимости".

Что такое долгая память процесса?

Длинная память, также называемая дальнодействующей зависимостью (LRD) или дальнодействующим постоянством, - это явление, которое может возникать в данных временных рядов. Оно связано с тем, как уменьшается скорость статистической зависимости двух точек по мере увеличения времени между ними.

Обладает ли процесс ARMA (P, Q) длинной памятью? Нет! Стационарный ARMA с конечными порядками P и Q, ARMA(P, Q), обладает короткой памятью. Вы можете посмотреть на график автокорреляционной функции (ACF): ее значение экспоненциально убывает и исчезает через несколько лагов.

Как ведет себя модель с длинной памятью?
В общем случае процесс с длинной памятью может выглядеть как медленный случайный ход (дрейф) с медленно затухающей автокорреляционной функцией. Например, рассмотрим среднемесячный уровень углекислого газа (CO2), зарегистрированный на метеостанции Мауна-Лоа (Гавайи).

На этом рисунке показан график среднемесячного уровня CO2, зарегистрированного на метеостанции в Муан Лао, Гавайи, в период с 1958 по 2020 год.

Далее давайте уберем 12-месячную сезонность, отделив значение каждого наблюдения от того, которое было получено 12 месяцами ранее.

На этом рисунке показан десезонный (12-месячный) лог уровня CO2 на метеостанции Мауна Лао, Гавайи.

На графике коррелограммы коэффициенты автокорреляции (ACF) убывают, но очень медленно.

На этом рисунке показана автокорреляционная функция (АКФ) десезонированного логарифмического уровня CO2 на метеостанции Мауна Лао, Гавайи.

Как моделировать временные ряды с большой памятью? Так же, как и в нестационарной модели ARIMA: мы извлекаем компонент дробной интеграции и фиксируем короткую память в остатках с помощью модели ARMA.

Используя оператор дробной разности, мы фиксируем динамику временного ряда с большой памятью:

\[{(1 - L)^d} = \sum\limits_{k = 0}^\infty {\left( {\begin{array}{*{20}{c}} d\\ k \end{array}} \right)} {( - 1)^k}{L^k} = 1 + {\omega _1}L + {\omega _2}{L^2} + ...\]

Где:

$L$ = Оператор запаздывания или обратного сдвига
${\omega _1} = - d$
${\omega _2} = - \frac{{{\omega _1} \times (d - 1)}}{2}$
${\omega _N} = - \frac{{{\omega _{N - 1}} \times (d - N - 1)}}{N}$

Для $\left| d \right| \le \frac{1}{2}$, the coefficient ${\omega _k}$ сравнительно быстро (но медленнее, чем экспоненциальный распад).

На этом рисунке показан коэффициент оператора дробной разности для порядков от -0,5 до 0,5 (включительно). Обратите внимание, что при положительном порядке дроби коэффициент убывает медленнее, чем при отрицательном.

Сложив все это вместе, мы получаем дробную ARIMA (т.е. FARIMA)

\[(1 - {\phi _1}L - {\phi _2}{L^2} - ... - {\phi _p}{L^p}){(1 - L)^d}{X_t} = (1 + {\theta _1}L + {\theta _2}{L^2} + ... + {\theta _q}{L^q}){a_t}\]

Where:

$L$ = Оператор запаздывания или обратного сдвига
${X_t}$ = набор данных временного ряда
${a_t}$ = временной ряд инноваций (или потрясений)
$d$ = порядок интеграции, и его значение между -0,5 и 0,5, исключительно.

Как определить порядок интегрирования (d)? Дробный порядок интегрирования (d) равен экспоненте Харста (H) минус 0,5 (т.е. d = H - 0,5).

Интерпретация

В двух словах, экспонента Харста - это единичное значение (H), которое мы можем использовать, чтобы сделать вывод о длительной памяти временного ряда (последовательной корреляции):

H		Интерпретация
0.5 - 1.0		временной ряд с долгосрочной положительной автокорреляцией
0.0 - 0.5		указывает на временной ряд с долгосрочным переключением между высокими и низкими значениями в соседних парах, что означает, что низкое значение, вероятно, последует за одним высоким значением, а следующее за ним значение будет иметь тенденцию быть высоким, причем эта тенденция к переключению между высокими и низкими значениями сохраняется в течение длительного времени в будущем
0.5		полностью некоррелированный ряд, но на самом деле это значение, применимое к рядам, для которых автокорреляции на малых временных лагах могут быть положительными или отрицательными, но где абсолютные значения автокорреляций экспоненциально быстро затухают до нуля

Важно: Для временного ряда с показателем Херста, равным 0,5, мы делаем вывод, что временной ряд не имеет длинной памяти (или долгосрочной зависимости), но это не то же самое, что сказать, что временной ряд является белым шумом, поскольку может быть один или несколько значимых факторов автокорреляции при более низких порядках лага.

Расчет

Оригинальным и наиболее известным методом оценки экспоненты Херста является так называемый анализ измененного диапазона (R/S), основанный на предыдущих гидрологических результатах Херста.

Функция NumXL Hurst(.) вычисляет исходный (эмпирический) показатель Херста, когда тип возврата = 1.

=Hurst(X, Alpha, 1)

Однако известно, что такой подход дает смещенные оценки. При малом объеме выборки наблюдается значительное отклонение от 0,5 наклона (т. е. некоррелированность дальних расстояний).

Оценка с поправкой на размер (Анис-Ллиод)

Чтобы исправить встроенную погрешность в первоначальной (эмпирической) оценке экспоненты Харста, Анис-Лиод ввел оценку измененного диапазона (R/S) с поправкой на размер.

Функция NumXL Hurst(.) вычисляет показатель Херста Аниса-Ллойда (с поправкой на R/S) при установке типа возвращаемого значения = 2.

= Hurst(X,Alpha,2)

Статистическая значимость

До сих пор не было получено асимптотической теории распределения для большинства оценок экспоненты Харста. Однако у нас есть приблизительная функциональная форма для доверительных интервалов R/S-анализа с поправкой Аниса-Ллойда.

Чтобы проверить статистическую значимость вычисленной оценки экспоненты Харста(), мы построим следующую проверку гипотезы:

\[\begin{array}{l} {{\rm{H}}_o}:{H_q} = {\rm{ uncorrelated}}\\ {{\rm{H}}_1}:{H_q} = {\rm{ long - memory}} \end{array}\]

Далее мы вычисляем соответствующую оценку экспоненты Харста и границы доверительного интервала (ДИ) для некоррелированного (без длинной памяти) временного ряда при заданном объеме выборки.

Функция NumXL Hurst(.) вычисляет экспоненту Харста Аниса-Ллайода (скорректированную R/S) для некоррелированных временных рядов одинакового размера, если вы установили тип возврата на 3

= Hurst(X,Alpha,3)

Функция NumXL Hurst(.) вычисляет нижнюю и верхнюю границы доверительного интервала экспоненты Аниса-Лайода-Хурста некоррелированного временного ряда, если вы установили тип возврата 4 и 5, соответственно

LL= Hurst(X,Alpha,4)

UL= Hurst(X,Alpha,5)

Наконец, мы исследуем значение экспоненты Харста Аниса-Ллиода (скорректированной R/S) в сравнении с C.I. гипотезы Нуля (некоррелированные временные ряды).

Оценка экспоненты Харста находится за пределами C.I.; таким образом, временной ряд имеет долгую память.
Экспонента Харста находится внутри C.I., следовательно, временной ряд не обладает значительным свойством долгой памяти, а наблюдения могут быть некоррелированными.

Анализ экспоненты Харста в Excel

Давайте рассмотрим 12-месячный уровень CO2 без учета сезонных колебаний за период с марта 1958 года по ноябрь 2020 года.

В этой таблице представлен анализ экспоненты Харста в Microsoft Excel с вычислением эмпирического значения R/S, затем корректировка значения R/S Аниса Ллойда и, наконец, проведение теста на статистическую значимость.

Поправленная по Аниса-Ллойда оценка показателя Херста R/S составляет 0,84, и это значение выходит за пределы доверительного интервала показателя Херста для некоррелированного временного ряда того же размера. Десезонный временной ряд уровня CO2 демонстрирует поведение с длинной памятью, а порядок дробной разности (d) составляет 0,34 (т. е. 0,84 -0,50 = 0,34).

Вложения

CO2-MXX-SPY-hurst-exponent-example.xlsx (1 МБ)