Ocasionalmente, nosso suporte técnico recebe perguntas sobre o expoente de Hurst: o que é isso? Como usá-lo no Excel? E como interpretar os valores calculados? Nesta edição, abordaremos o expoente de Hurst em profundidade e, esperamos, ajudá-lo a desenvolver uma intuição e uma compreensão sobre o expoente de Hurst.
O que é o expoente de Hurst?
O nome "expoente de Hurst", "índice de Hurst" ou "coeficiente de Hurst" deriva de Harold Edwin Hurst (1880-1978), que foi o principal pesquisador desses estudos. Estudos envolvendo o expoente de Hurst foram inicialmente desenvolvidos em hidrologia para a questão prática de determinar o dimensionamento ideal da barragem para as condições voláteis de chuva e seca do rio Nilo, observadas durante um longo período.
O expoente de Hurst (H) é usado como uma medida da memória de longo prazo das séries temporais. Ele está relacionado às autocorrelações da série temporal e à taxa na qual elas diminuem à medida que a defasagem entre pares de valores aumenta. O expoente de Hurst é frequentemente chamado de "índice de dependência" ou "índice de dependência de longo alcance".
Qual é a memória longa de um processo?
A memória longa, também chamada de dependência de longo alcance (LRD) ou persistência de longo alcance, é um fenômeno que pode surgir em dados de séries temporais. Ele está relacionado à taxa de decaimento da dependência estatística de dois pontos à medida que o tempo entre os pontos aumenta.
O processo ARMA (P, Q) apresenta memória longa? Não! Um ARMA estacionário com ordens P e Q finitas, ARMA(P, Q), tem memória curta. Você pode examinar o gráfico da função de autocorrelação (ACF), pois seu valor decai exponencialmente e desaparece após alguns atrasos.
Como se comporta um modelo de memória longa?
Em geral, um processo com uma memória longa pode se parecer com um passeio aleatório lento (deriva), com uma função de autocorrelação de decaimento lento. Por exemplo, vamos examinar o nível médio mensal de dióxido de carbono (CO2) registrado na estação meteorológica de Mauna Loa, no Havaí.
Em seguida, vamos remover a sazonalidade de 12 meses diferenciando o valor de cada observação de uma que seja 12 meses anterior.
No gráfico do correlograma, os fatores de autocorrelação (ACF) estão decaindo, mas em um ritmo muito lento.
Como modelamos a série temporal de memória longa? Da mesma forma que fizemos no modelo ARIMA não estacionário: extraímos o componente de integração fracionária e capturamos a memória curta nos resíduos com um modelo ARMA.
Usando o operador de diferença fracionária, capturamos a dinâmica de memória longa em uma série temporal:
\[{(1 - L)^d} = \sum\limits_{k = 0}^\infty {\left( {\begin{array}{*{20}{c}} d\\ k \end{array}} \right)} {( - 1)^k}{L^k} = 1 + {\omega _1}L + {\omega _2}{L^2} + ...\]
Onde:
- $L$ = Operador Lag ou Backshift
- ${\omega _1} = - d$
- ${\omega _2} = - \frac{{{\omega _1} \times (d - 1)}}{2}$
- ${\omega _N} = - \frac{{{\omega _{N - 1}} \times (d - N - 1)}}{N}$
Para $\left| d \right| \le \frac{1}{2}$, o coeficiente ${\omega _k}$ decai relativamente rápido, como uma potência (mas mais lentamente do que o decaimento exponencial).
Juntando tudo isso, chegamos a um ARIMA fracionário (ou seja, FARIMA)
\[(1 - {\phi _1}L - {\phi _2}{L^2} - ... - {\phi _p}{L^p}){(1 - L)^d}{X_t} = (1 + {\theta _1}L + {\theta _2}{L^2} + ... + {\theta _q}{L^q}){a_t}\]
Onde:
- $L$ = Operador Lag ou Backshift
- ${X_t}$ = conjunto de dados de séries temporais
- ${a_t}$ = séries temporais de inovações (ou choques)
- $d$ = ordem de integração e seu valor entre -0,5 e 0,5, exclusive.
Como descobrimos a ordem de integração (d)? A ordem de integração fracionária (d) é igual ao expoente de Hurst (H) menos 0,5 (ou seja, d = H - 0,5).
Interpretação
Em resumo, o expoente de Hurst é um valor único (H), que pode ser usado para fazer uma observação sobre a longa memória da série temporal (correlação serial):
| H | Interpretação | |
|---|---|---|
| 0.5 - 1.0 | uma série temporal com autocorrelação positiva de longo prazo | |
| 0.0 - 0.5 | indica uma série cronológica com alternância de longo prazo entre valores altos e baixos em pares adjacentes, o que significa que um valor baixo provavelmente seguirá um único valor alto e que o valor seguinte tenderá a ser alto, com essa tendência de alternância entre valores altos e baixos durando muito tempo no futuro | |
| 0.5 | uma série completamente não correlacionada, mas, na verdade, é o valor aplicável a séries para as quais as autocorrelações em defasagens pequenas podem ser positivas ou negativas, mas nas quais os valores absolutos das autocorrelações decaem exponencialmente para zero |
Importante: Para uma série temporal com um expoente de Hurst igual a 0,5, concluímos que a série temporal não possui memória longa (ou dependência de longo alcance), mas isso não é o mesmo que dizer que a série temporal é um ruído branco, pois pode haver um ou mais fatores de autocorrelação significativos em ordens de defasagem mais baixas.
Cálculo
O método original e mais conhecido para estimar o expoente de Hurst é a chamada análise de intervalo reescalonado (R/S), baseada nas descobertas hidrológicas anteriores de Hurst.
A função NumXL Hurst(.) calcula o expoente de Hurst original (empírico) quando você define o tipo de retorno = 1
=Hurst(X, Alpha, 1)
No entanto, sabe-se que essa abordagem produz estimativas tendenciosas. Para um tamanho de amostra pequeno, há um desvio significativo das inclinações de 0,5 (ou seja, longo alcance não correlacionado).
Estimativa com correção de tamanho (Anis-Llyod)
Para corrigir o viés incorporado na estimativa original (empírica) do expoente de Hurst, Anis-LIyod introduziu uma estimativa com correção de tamanho do intervalo reescalonado (R/S).
A função NumXL Hurst(.) calcula o expoente de Hurst de Anis-Llyod (R/S corrigido) quando você define o tipo de retorno = 2
= Hurst(X,Alpha,2)
Significado estatístico
Até o momento, nenhuma teoria de distribuição assintótica foi derivada para a maioria dos estimadores do expoente de Hurst. No entanto, temos uma forma funcional aproximada para os intervalos de confiança da análise R/S corrigida de Anis-Lloyd.
Para examinar a significância estatística da estimativa calculada do expoente de Hurst(), criamos o seguinte teste de hipótese:
\[\begin{array}{l} {{\rm{H}}_o}:{H_q} = {\rm{ uncorrelated}}\\ {{\rm{H}}_1}:{H_q} = {\rm{ long - memory}} \end{array}\]
Em seguida, calculamos a estimativa do expoente de Hurst correspondente e os limites do intervalo de confiança (C.I.) de uma série temporal não correlacionada (sem memória longa) para um determinado tamanho de amostra.
A função NumXL Hurst(.) calcula o expoente de Hurst de Anis-Llyod (R/S corrigido) para séries temporais não correlacionadas do mesmo tamanho quando você define o tipo de retorno como 3
= Hurst(X,Alpha,3)
A função NumXL Hurst(.) calcula os limites inferior e superior do intervalo de confiança do expoente Anis-Llyod Hurst da série temporal não correlacionada quando você define o tipo de retorno como 4 e 5, respectivamente
LL= Hurst(X,Alpha,4)
UL= Hurst(X,Alpha,5)
Por fim, examinamos o valor do expoente de Hurst de Anis-Llyod (R/S corrigido) em relação ao C.I. da hipótese nula (série temporal não correlacionada).
- A estimativa do expoente de Hurst está fora do C.I.; portanto, a série temporal tem uma memória longa.
- O expoente de Hurst está dentro do C.I., portanto, a série temporal não apresenta uma propriedade significativa de memória longa, e as observações podem ser não correlacionadas.
Análise do expoente de Hurst no Excel
Vamos examinar o nível de CO2 com registro dessazonalizado de 12 meses entre março de 1958 e novembro de 2020.
A estimativa do expoente de Hurst R/S corrigida por Anis-Llyod é 0,84, e esse valor está fora do intervalo de confiança (IC) do expoente de Hurst de uma série temporal não correlacionada do mesmo tamanho. A série temporal do nível logarítmico do CO2 sem sazonalidade exibe um comportamento de memória longa, e a ordem da diferença fracionária (d) é 0,34 (ou seja, 0,84 -0,50 = 0,34).
Comentários
iniciar sessão para comentar.