Expoente de Hurst no Excel

Fayez

20 de Novembro de 2020 18:32

Ocasionalmente, nosso suporte técnico recebe perguntas sobre o expoente de Hurst: o que é isso? Como usá-lo no Excel? E como interpretar os valores calculados? Nesta edição, abordaremos o expoente de Hurst em profundidade e, esperamos, ajudá-lo a desenvolver uma intuição e uma compreensão sobre o expoente de Hurst.

O que é o expoente de Hurst?

O nome "expoente de Hurst", "índice de Hurst" ou "coeficiente de Hurst" deriva de Harold Edwin Hurst (1880-1978), que foi o principal pesquisador desses estudos. Estudos envolvendo o expoente de Hurst foram inicialmente desenvolvidos em hidrologia para a questão prática de determinar o dimensionamento ideal da barragem para as condições voláteis de chuva e seca do rio Nilo, observadas durante um longo período.

A imagem retrata Philae - uma ilha no reservatório da Represa Baixa de Aswan, a jusante da Represa de Aswan e do Lago Nasser, Egito

O expoente de Hurst (H) é usado como uma medida da memória de longo prazo das séries temporais. Ele está relacionado às autocorrelações da série temporal e à taxa na qual elas diminuem à medida que a defasagem entre pares de valores aumenta. O expoente de Hurst é frequentemente chamado de "índice de dependência" ou "índice de dependência de longo alcance".

Qual é a memória longa de um processo?

A memória longa, também chamada de dependência de longo alcance (LRD) ou persistência de longo alcance, é um fenômeno que pode surgir em dados de séries temporais. Ele está relacionado à taxa de decaimento da dependência estatística de dois pontos à medida que o tempo entre os pontos aumenta.

O processo ARMA (P, Q) apresenta memória longa? Não! Um ARMA estacionário com ordens P e Q finitas, ARMA(P, Q), tem memória curta. Você pode examinar o gráfico da função de autocorrelação (ACF), pois seu valor decai exponencialmente e desaparece após alguns atrasos.

Como se comporta um modelo de memória longa?
Em geral, um processo com uma memória longa pode se parecer com um passeio aleatório lento (deriva), com uma função de autocorrelação de decaimento lento. Por exemplo, vamos examinar o nível médio mensal de dióxido de carbono (CO2) registrado na estação meteorológica de Mauna Loa, no Havaí.

Esta figura mostra o registro do nível médio mensal de CO2, registrado na estação meteorológica em Muan Lao, Havaí, entre 1958 e 2020.

Em seguida, vamos remover a sazonalidade de 12 meses diferenciando o valor de cada observação de uma que seja 12 meses anterior.

Esta figura mostra o nível de CO2 dessazonalizado (12 meses) na estação meteorológica de Mauna Lao, Havaí.

No gráfico do correlograma, os fatores de autocorrelação (ACF) estão decaindo, mas em um ritmo muito lento.

Esta figura mostra a função de autocorrelação (ACF) do nível de log CO2 dessazonalizado na estação meteorológica de Mauna Lao, Havaí.

Como modelamos a série temporal de memória longa? Da mesma forma que fizemos no modelo ARIMA não estacionário: extraímos o componente de integração fracionária e capturamos a memória curta nos resíduos com um modelo ARMA.

Usando o operador de diferença fracionária, capturamos a dinâmica de memória longa em uma série temporal:

\[{(1 - L)^d} = \sum\limits_{k = 0}^\infty {\left( {\begin{array}{*{20}{c}} d\\ k \end{array}} \right)} {( - 1)^k}{L^k} = 1 + {\omega _1}L + {\omega _2}{L^2} + ...\]

Onde:

$L$ = Operador Lag ou Backshift
${\omega _1} = - d$
${\omega _2} = - \frac{{{\omega _1} \times (d - 1)}}{2}$
${\omega _N} = - \frac{{{\omega _{N - 1}} \times (d - N - 1)}}{N}$

Para $\left| d \right| \le \frac{1}{2}$, o coeficiente ${\omega _k}$ decai relativamente rápido, como uma potência (mas mais lentamente do que o decaimento exponencial).

$Essa figura mostra o coeficiente do operador de diferença fracionária para ordens entre -0,5 e 0,5 (inclusive). Observe que, para ordem fracionária positiva, o coeficiente decai mais lentamente do que aqueles com ordem negativa.$

Juntando tudo isso, chegamos a um ARIMA fracionário (ou seja, FARIMA)

\[(1 - {\phi _1}L - {\phi _2}{L^2} - ... - {\phi _p}{L^p}){(1 - L)^d}{X_t} = (1 + {\theta _1}L + {\theta _2}{L^2} + ... + {\theta _q}{L^q}){a_t}\]

Onde:

$L$ = Operador Lag ou Backshift
${X_t}$ = conjunto de dados de séries temporais
${a_t}$ = séries temporais de inovações (ou choques)
$d$ = ordem de integração e seu valor entre -0,5 e 0,5, exclusive.

Como descobrimos a ordem de integração (d)? A ordem de integração fracionária (d) é igual ao expoente de Hurst (H) menos 0,5 (ou seja, d = H - 0,5).

Interpretação

Em resumo, o expoente de Hurst é um valor único (H), que pode ser usado para fazer uma observação sobre a longa memória da série temporal (correlação serial):

H		Interpretação
0.5 - 1.0		uma série temporal com autocorrelação positiva de longo prazo
0.0 - 0.5		indica uma série cronológica com alternância de longo prazo entre valores altos e baixos em pares adjacentes, o que significa que um valor baixo provavelmente seguirá um único valor alto e que o valor seguinte tenderá a ser alto, com essa tendência de alternância entre valores altos e baixos durando muito tempo no futuro
0.5		uma série completamente não correlacionada, mas, na verdade, é o valor aplicável a séries para as quais as autocorrelações em defasagens pequenas podem ser positivas ou negativas, mas nas quais os valores absolutos das autocorrelações decaem exponencialmente para zero

Importante: Para uma série temporal com um expoente de Hurst igual a 0,5, concluímos que a série temporal não possui memória longa (ou dependência de longo alcance), mas isso não é o mesmo que dizer que a série temporal é um ruído branco, pois pode haver um ou mais fatores de autocorrelação significativos em ordens de defasagem mais baixas.

Cálculo

O método original e mais conhecido para estimar o expoente de Hurst é a chamada análise de intervalo reescalonado (R/S), baseada nas descobertas hidrológicas anteriores de Hurst.

A função NumXL Hurst(.) calcula o expoente de Hurst original (empírico) quando você define o tipo de retorno = 1

=Hurst(X, Alpha, 1)

No entanto, sabe-se que essa abordagem produz estimativas tendenciosas. Para um tamanho de amostra pequeno, há um desvio significativo das inclinações de 0,5 (ou seja, longo alcance não correlacionado).

Estimativa com correção de tamanho (Anis-Llyod)

Para corrigir o viés incorporado na estimativa original (empírica) do expoente de Hurst, Anis-LIyod introduziu uma estimativa com correção de tamanho do intervalo reescalonado (R/S).

A função NumXL Hurst(.) calcula o expoente de Hurst de Anis-Llyod (R/S corrigido) quando você define o tipo de retorno = 2

= Hurst(X,Alpha,2)

Significado estatístico

Até o momento, nenhuma teoria de distribuição assintótica foi derivada para a maioria dos estimadores do expoente de Hurst. No entanto, temos uma forma funcional aproximada para os intervalos de confiança da análise R/S corrigida de Anis-Lloyd.

Para examinar a significância estatística da estimativa calculada do expoente de Hurst(), criamos o seguinte teste de hipótese:

\[\begin{array}{l} {{\rm{H}}_o}:{H_q} = {\rm{ uncorrelated}}\\ {{\rm{H}}_1}:{H_q} = {\rm{ long - memory}} \end{array}\]

Em seguida, calculamos a estimativa do expoente de Hurst correspondente e os limites do intervalo de confiança (C.I.) de uma série temporal não correlacionada (sem memória longa) para um determinado tamanho de amostra.

A função NumXL Hurst(.) calcula o expoente de Hurst de Anis-Llyod (R/S corrigido) para séries temporais não correlacionadas do mesmo tamanho quando você define o tipo de retorno como 3

= Hurst(X,Alpha,3)

A função NumXL Hurst(.) calcula os limites inferior e superior do intervalo de confiança do expoente Anis-Llyod Hurst da série temporal não correlacionada quando você define o tipo de retorno como 4 e 5, respectivamente

LL= Hurst(X,Alpha,4)

UL= Hurst(X,Alpha,5)

Por fim, examinamos o valor do expoente de Hurst de Anis-Llyod (R/S corrigido) em relação ao C.I. da hipótese nula (série temporal não correlacionada).

A estimativa do expoente de Hurst está fora do C.I.; portanto, a série temporal tem uma memória longa.
O expoente de Hurst está dentro do C.I., portanto, a série temporal não apresenta uma propriedade significativa de memória longa, e as observações podem ser não correlacionadas.

Análise do expoente de Hurst no Excel

Vamos examinar o nível de CO2 com registro dessazonalizado de 12 meses entre março de 1958 e novembro de 2020.

Essa tabela resume a análise do expoente de Hurst no Microsoft Excel, calculando o valor R/S empírico, depois o valor R/S corrigido de Anis Lloyd e, por fim, conduzindo um teste de significância estatística.

A estimativa do expoente de Hurst R/S corrigida por Anis-Llyod é 0,84, e esse valor está fora do intervalo de confiança (IC) do expoente de Hurst de uma série temporal não correlacionada do mesmo tamanho. A série temporal do nível logarítmico do CO2 sem sazonalidade exibe um comportamento de memória longa, e a ordem da diferença fracionária (d) é 0,34 (ou seja, 0,84 -0,50 = 0,34).

Anexos

CO2-MXX-SPY-hurst-exponent-example.xlsx (1 MB)