Volatilidad 3: Autoregresivo con heterocedasticidad condicional (ARCH)

Mohamad

27 de diciembre de 2016 22:01

Esta es la tercera entrada de nuestras series acerca de volatilidad modelada en progreso. En una edición anterior introdujimos el amplio concepto de volatilidad en series de tiempo financieras, definimos sus características generales (e.g. agrupaciones, reversión de la media) e identificamos importantes términos de volatilidad en series de tiempo financieras. Exploramos los períodos de retención, la escala de volatilidad, el supuesto de correlación serial, la volatilidad de período múltiple (i.e. estructura periódica) y discutimos unos cuantos de métodos no paramétricos para estimar la volatilidad usando un histórico de datos.

En esta entrega, extenderemos un poco más la discusión anterior y desarrollaremos una manera de entender el modelo de volatilidad autoregresivo con heterocedasticidad condicional (ARCH, por sus siglas en inglés. )

¿Por qué nos puede interesar?

Una vez más los conceptos discutidos aquí son cruciales para el sólido entendimiento de la volatilidad de series de tiempo financieras.

Antecedentes

Consideremos las series de tiempo del retorno de registros de las acciones dependientes $\{r_t\}$. Primero, modelemos el retorno como la suma de dos componentes:

$$r_t=\mu_t+a_t$$

Donde:

$\mu_t$ es el componente de la media condicional (no estocástica)
$a_t$ es la innovación, período de error o componente de shock (estocástico)
$\mathrm{E}[a_t]=0$
$\mathrm{Var}[r_t]=\mathrm{Var}[a_t]=\sigma_t^2$
$\mathrm{Cov}[a_t,a_{t+j}]=0$

Para computar la volatilidad de período múltiple:

$$\mathrm{Var}[r_{t+k}]=\mathrm{Var}[\sum_{i=1}^k r_{t+i}]=\sum_{i=1}^k \mathrm{Var}[r_{t+i}]+2\times \sum_{i=1}^{k-1}\sum_{j=i+1}^k \mathrm{Cov}[r_{t+i},r_{t+j}]$$

$$\mathrm{Cov}[r_{t+i},r_{t+j}]=E[(r_{t+i}-\mu)(r_{t+j}-\mu)]=E[r_{t+i}\times r_{t+j}]- \mu (\mu_{t+i}+\mu_{t+j})+\mu^2 $$

Donde:

$\mu$ es la media incondicional (a largo plazo) de las series de tiempo

Pero,

$$E[r_{t+i}\times r_{t+j}]=E[(\mu_{t+i}+a_{t+i})(\mu_{t+j}+a_{t+j})]=\mu_{t+i}\times\mu_{t+j}$$

Así:

$$\mathrm{Cov}[r_{t+i},r_{t+j}]=\mu_{t+i}\times\mu_{t+j} -\mu (\mu_{t+i}+\mu_{t+j})+\mu^2$$ $$\mathrm{Cov}[r_{t+i},r_{t+j}]=(\mu_{t+i}-\mu)(\mu_{t+j}-\mu)$$

En suma, la covarianza es una función de la media condicional e incondicional.

La volatilidad de período múltiple depende no sólo de la volatilidad condicional de cada período sino de la media condicional también.

Primera conjetura:

Asumamos que $\mu_t=\mu_{t+1}=\mu_{t+2}=\cdots=\mu$

$$r_t=\mu + a_t$$ $$r_t-\mu=\hat r_t=a_t$$

$$\textrm{Var}[r_t]=\sigma_t^2$$

Nota:

La conjetura no es contraria a lo que vemos en las series de tiempo financieras; como la mayoría de series de tiempo no poseen una media significativa o ninguna correlación serial, todas exhiben la volatilidad de tiempo variable (heterocedasticidad).

Ahora, asumamos que la innovación, período de error o componente de shock, se puede representar de esta manera:

$$a_t=\sigma_t \times \epsilon_t $$

Donde:

$\sigma_t$ es la volatilidad condicional (escalar) en el tiempo t
$\epsilon_t$ es la variable aleatoria con media igual a cero ($E[\epsilon_t]=0$), y la varianza unitaria ($\mathrm{Var}[\epsilon_t]=E[\epsilon_t^2]=1$)
$\epsilon_t$ no está correlacionada serialmente pero aun es dependiente (alto nivel),

Conjetura 2:

Asumamos que la variable aleatoria ($\epsilon_t$) está distribuida de manera idéntica a lo largo del tiempo (no necesariamente una función Gaussiana).

Definición:

Definamos $Z_t$ como el cuadrado de la media ajustada de las acciones de retorno:

$$Z_t=(r_t-\mu)^2=a_t^2$$

$$ E[Z_t]=\sigma_t^2$$

Ahora examinemos los métodos usados en entradas anteriores para estimar la volatilidad:

1. Desviación estándar móvil equitativamente ponderada

$$\sigma_t^2=\frac{\sum_{i=1}^m (r_{t-i}-\mu)^2}{m-1}=\frac{1}{m-1}\sum_{i=1}^m a_{t-i}^2=\frac{1}{m-1}\sum_{i=1}^m Z_{t-i}$$

2. Promedio móvil de ponderado exponencial (EWMA)

$$\sigma_{t+1}^2=\lambda \sigma_t^2+(1-\lambda)a_t^2=(1-\lambda)\sum_{i=0}^\infty \lambda^i a_{t-i}^2=(1-\lambda)\sum_{i=0}^\infty \lambda^i Z_{t-i}$$

Distribución de probabilidad $Z_t$

Hasta el momento no hemos asumido ninguna forma funcional para esta probablidad de distribución $Z_t$, pero aquí están algunas cuantas observaciones sobre la función de distribución del candidato:

$P(Z\lt 0)=0$ (i.e. $Z_t \ge 0$
$P(Z)$ es asimétrica
$P(Z)$ es ciertamente sesgado
$P(Z)$ es la distribución de las innovaciones al cuadrado o shocks

Derivación

$$a_t \sim \eta (.)$$

Dejemos que $\eta (.)$ sea la probabilidad de densidad de la función con media igual a cero y varianza $\sigma_t^2$.

$$P(Z\le z)=H(a_t\le \sqrt{z})+(1-H(a_t\le -\sqrt{z}))$$ $$p(z)=\frac{\partial P}{\partial z}=\frac{\eta(\sqrt{z})+\eta(-\sqrt{z})}{2\sqrt{z}}$$

Asumamos que $\eta (.)$ es una distribución simétrica

$$p(z)=\frac{\eta(\sqrt{z})}{\sqrt{z}}$$

Caso 1

Usemos los residuos estandarizados de la distribución Gaussiana.

$$\epsilon_t \sim \Phi(0,1)=\frac{1}{\sqrt{2\pi}}e^{-\epsilon_t^2/2}$$ $$Z_t =\epsilon_t^2\sim \eta(.)=\frac{1}{\sqrt{2\pi Z_t}}e^{-Z_t/2}=\chi_{\nu=1}^2(Z_t)$$

La distribución de los valores al cuadrado de una variable Gaussiana distribuida aleatoriamente es ji-cuadrado con un grado de libertad

$$a_t=\sigma_t\times\epsilon_t$$ $$\mathrm{E}[a_t^2]=\sigma_t^2\times\mathrm{E}[\epsilon_t^2]=\sigma_t^2\times\nu=\sigma_t^2$$ $$\textrm{Var}[a_t^2]=\sigma_t^4\times \textrm{Var}[\epsilon_t^2]=\sigma_t^4\times 2\nu=2\sigma_t^4$$

Caso 2

Usemos los residuos estándar de la distribución de estudiantes t.

$$p(\epsilon_t)=\frac{\Gamma {(\frac{\nu+1}{2})}}{\sqrt{\nu\pi}\times\Gamma{(\nu/2)}}\left (1+\frac{(\nu-1)\epsilon_t^2}{\nu^2}\right )^{-\frac{\nu+1}{\nu}}$$ $$p(Z_t=\epsilon_t^2)=\frac{\Gamma {(\frac{\nu+1}{2})}}{\sqrt{\nu\pi Z_t}\times\Gamma{(\nu/2)}}\left( 1+\frac{(\nu-1)Z_t}{\nu^2} \right )^{-\frac{\nu+1}{\nu}}$$

Así pues, la ecuación se está complicando un poco aquí pero los principios generales se pueden aplicar a cómo relacionamos la probabilidad condicional de distribución de las series de tiempo al cuadrado con la distribución condicional original de probabilidad.

$\{a_t^2\}$ Modelado

Hasta ahora, hemos examinado las propiedades de innovaciones al cuadrado (i.e. en una sola instancia de tiempo) en una instancia de tiempo dada (i.e. t), pero ¿cómo describimos la evolución $\{ Z_t=a_t^2\}$ a lo largo del tiempo?

Igual que con el modelado ARMA/ARIMA, examinamos el correlograma ACF/PACF para las series de tiempo al cuadrado, en un intento de identificar una dependencia entre las series de tiempo retrasadas y el modelo propuesto.

Existen dos categorías principales de los modelos de volatilidad estadística:

Forma determinística - función exacta para regir la evolución de la volatilidad (e.g. ARCH, GARCH, EGARCH, etc.)
$$\sigma_t^2=f(\sigma_t^2 | F_{t-1})$$
Forma Estocástica – uso de la ecuación estocástica, i.e. permitiendo un período de shock/innovación en la ecuación de volatilidad (e.g. modelo de volatilidad estocástica
$$\sigma_t^2=f(\sigma_t^2 | F_{t-1}) +\eta_t$$

Nota:

Los valores de volatilidad condicional se calculan indirectamente, no observados directamente, lo cual complica más el proceso.

Modelo autoregresivo condicional de heterocedasticidad (ARCH)

El primer modelo que proporciona un marco conceptual sistemático para el modelado de volatilidad es el modelo autoregresivo con heterocedasticidad condicional de Engle’s (ARCH) (1982). Este es un buen modelo para empezar dado a su simplicidad y relevancia con otros modelos.

$$r_t-\mu=a_t=\sigma_t\times\epsilon_t$$ $$\sigma_t^2=\alpha_o+\alpha_1 a_{t-1}^2+\alpha_2 a_{t-2}^2 + \cdots +\alpha_m a_{t-m}^2=\alpha_o+\sum_{i=1}^m \alpha_i a_{t-i}^2$$ $$\epsilon_t \sim \mathrm{i.i.d}\sim \Phi(0,1)$$

El Modelo autoregresivo condicional de heterocedasticidad (ARCH) es un AR(p) para las series de tiempo $\{Z_t=a_t^2\}$, pero sin períodos de error o shocks. Alternativamente, podemos ver al ARCH como un promedio ponderado móvil de las series de tiempo al cuadrado (WMA) con una constante.

El valor del coeficiente debe cumplir con algunos requerimientos regulatorios para asegurar que (1) la varianza condicional sea siempre positiva, y (2) que la varianza incondicional sea finita y positiva.

$$\sigma_t^2-\alpha_o=\sum_{i=1}^m \alpha_i a_{t-i}^2$$

Agrupamiento de volatilidad: el modelo ARCH captura el agrupamiento de la volatilidad observada en los retornos de acciones: un amplio pasado al cuadrado de shock. $\{a_t^2\}_{i=1}^m$ implica una amplia varianza condicional ($\sigma_t^2$ ) para el retorno de media corregida $a_t$ . En consecuencia, tiende a ser seguido por un gran valor (en términos absolutos) dado a la varianza amplia, y viceversa con shocks menores.

ARCH(1) Modelo

$$\sigma_t^2=\alpha_o+\alpha_1 a_{t-1}^2$$ $$\sigma_{t+1}^2=\alpha_o+\alpha_1 \mathrm{E}[a_t^2]=\alpha_o+\alpha_1 \sigma_t^2$$ $$\sigma_{t+2}^2=\alpha_o+\alpha_1 \mathrm{E}[a_{t+1}^2]=\alpha_o+\alpha_1\times (\alpha_o+\alpha_1 \sigma_t^2)=\alpha_o+\alpha_1\alpha_o+\alpha_1^2\sigma_t^2$$ $$\sigma_{t+3}^2=\alpha_o+\alpha_1\alpha_o+\alpha_1^2\alpha_o+\alpha_1^3 \sigma_t^2$$ $$ \sigma_{t+k}^2=\alpha_o+\alpha_1\alpha_o+\alpha_1^2\alpha_o+\cdots+\alpha_o\alpha_1^{k-1}+\alpha_1^k \sigma_t^2 $$ $$\cdots$$ $$\sigma_{t+k\to\infty}^2=\frac{\alpha_o}{1-\alpha_1}$$

Por consiguiente, para una varianza condicional positiva y una varianza finita incondicional, entonces $\alpha_o\succ 0$ y $\alpha_1 \prec 1$ .

Parámetros del modelo

En una entrada anterior (Volatilidad 1: Lo básico), no asumimos ninguna distribución para las series de tiempo y, por lo tanto, usamos la raíz cuadrada del error cuadrático como nuestra función de utilidad, buscando un grupo de valores parámetro que minimizara el RMSE.

En el modelo ARCH, los retornos de media corregida( ) eran inter-dependientes (e.g. agrupaciones) y no son distribuidos idénticamente, entonces, ¿cómo podemos estimar un grupo eficiente de valores por sus parámetros? $$\epsilon_t=\frac{a_t}{\sigma_t}\sim N(0,1)$$ $$\epsilon_t\sim \mathrm{i.i.d}$$

$$LF(a_T,a_{T-1},\cdots,a_1 | \alpha_o , \alpha_1 ,\cdots,\alpha_m)=\prod_{t=m+1}^T \frac{1}{\sqrt{2\pi\sigma_t^2}}e^{-a_t^2/{2\sigma_t^2}}$$ $$LLF(a_T,a_{T-1},\cdots,a_1 | \alpha_o , \alpha_1 ,\cdots,\alpha_m)=\sum_{t=m+1}^T \frac{1}{2}\ln{2\pi}-\frac{a_t^2}{2\sigma_t^2}=-\frac{1}{2}\left(\sum_{t=m+1}^T \ln{2\pi}+\ln{\sigma_t^2}+\frac{a_t^2}{\sigma_t^2}\right )$$

Para un grupo inicial de $\{\alpha_o,\alpha_1,\cdots,\alpha_m\}$, recursivamente calculamos los valores de volatilidad condicional y revisamos los valores alfa en un esfuerzo por maximizar la probabilidad total.

Revisión del modelo

El Modelo autoregresivo con heterocedasticidad condicional (ARCH) no asume la conjetura i.i.d entre los retornos de media corregida $\{a_t\}$, sino los residuos estandarizados$\{\epsilon_t\}$ are i.i.d.

$$\epsilon_t=\frac{a_t}{\sigma_t}\sim N(0,1)$$ $$\epsilon_t\sim\mathrm{i.i.d}$$

En suma, necesitamos examinar los residuos estandarizados $\{\epsilon_t\}$ para la independencia (e.g. la prueba de sonido blanco y la prueba del efecto arco) y la conjetura de distribución de normalidad.

Modelo de extensión

En algunas aplicaciones, es más apropiado asumir que los residuos estandarizados $\{\epsilon_t\}$ persiguen una distribución de ¨cola pesada¨ tal como la distribución t de estudiantes o la distribución de error generalizado (GED).

Esta extensión afecta el cálculo de la función de probabilidad de retraso (LLF, por sus siglas en inglés) (usando la función de densidad de probabilidad alternativa), y la interpretación de volatilidad condicional.

Para ilustrar, tomemos la distribución t de estudiantes para $\{\epsilon_t\}$

$$\epsilon_t\sim\mathrm{i.i.d}\sim t_\nu (0,1)$$

Donde:

$t_\nu (0,1)$ es la distribución t de estudiantes estándar (con media cero y unidad de varianza)
$\nu$ es los grados de libertad que la distribución de estudiante ($\nu \succ 2$)

Para producir distribución estándar t, con desviación cero y exceso finito de curtosis;

$\nu \succ 4 $
$\epsilon = t \times \frac{\nu-2}{\nu}$

La distribución t estándar exhibe una ¨cola gruesa¨ (heterocedasticidad) con exceso de curtosis = $6/(\nu-4)$.

Pronóstico

Para los primeros pasos p fuera de la muestra, la fórmula de pronóstico incluye una mezcla de residuos al cuadrado $\{a_t^2\}$ y varianzas estimadas $\hat\sigma_t^2$.

$$\sigma_{t+1}^2=\alpha_o+\alpha_1 a_{t}^2+\cdots+\alpha_p a_{t-p+1}^2$$ $$\sigma_{t+2}^2=\alpha_o+\alpha_1 \times E[a_{t+1}^2]+\alpha_2 a_t^2+\cdots+\alpha_p a_{t-p+2}^2$$ $$\sigma_{t+2}^2=\alpha_o+\alpha_1 \times \sigma_{t+1}^2+\alpha_2 a_t^2+\cdots+\alpha_p a_{t-p+2}^2$$ $$\sigma_{t+3}^2=\alpha_o+\alpha_1 \times \sigma_{t+2}^2+\alpha_2 \sigma_{t+1}^2+ \alpha_3 a_t^2+\cdots+\alpha_p a_{t-p+3}^2$$ $$ \cdots $$ $$\sigma_{t+p}^2=\alpha_o+\alpha_1 \sigma_{t+p-1}^2+\alpha_2\sigma_{t+p-2}^2 + \cdots +\alpha_p\sigma_{t}^2$$ $$\sigma_{t+p+1}^2=\alpha_o+\alpha_1 \sigma_{t+p}^2+\alpha_2\sigma_{t+p-1}^2 + \cdots +\alpha_p\sigma_{t+1}^2 $$

Para un horizonte de pronóstico más extenso, la volatilidad condicional estimada converge con un valor de largo plazo determinado por los prámetros del modelo, por ejemplo ARCH(1) tiene la siguiente varianza a largo plazo:

$$\sigma_{t+k\to\infty}^2=\frac{\alpha_o}{1-\alpha_1}$$ Efecto ARCH

Un efecto ARCH es una característica usada para describir si una serie de tiempo dada exhibe correlación entre sus valores de datos al cuadrado.

La prueba original conducida por (1982) usa el multiplicador de LaGrange (LM) y regresiones ordinarias de cuadrados menores.

De manera alternativa, podemos usar la prueba de Ljung-Box en las series de tiempo al cuadrado (de media ajustada), calcular el Q(m) modificado y probar si los datos muestran una correlación serial o not.

Conclusión

En este ensayo, hemos desarrollado varias lecciones fundamentales planteadas en entradas anteriores, y hemos construido un marco general de modelado de volatilidad. Al comienzo, nos ocupamos de los retornos correlacionados y derivamos una relación entre la volatilidad de estructuras temporales (i.e. de períodos múltiples) y las medias condicionales.

Luego, asumiendo series de tiempo de retornos de acciones con medias ajustadas, procedimos con nuestro análisis de volatilidad. En la práctica, los modelos que describen la evolución de la volatilidad a lo largo del tiempo se dividen en dos categorías: (1) Modelos determinísticos de forma funcional (e.g. ARCH, GARCH, etc.), y (2) Modelos estocásticos que permiten el modelo de volatilidad para incluir un período de shock/innovación.

Finalmente, examinamos a profundidad el importante modelo autoregresivo con heterocedasticidad condicional (ARCH) (Engle 1980); una pieza fundamental para muchos modelos (e.g. GARCH, EGARCH, etc.), de los que nos ocuparemos en futuras entradas. El modelo ARCH puede ser enseñado como un promedio ponderado móvil de las series de tiempo al cuadrado, pero los ponderados son relativamente limitados para producir una varianza positiva y una varianza finita (existente) de largo plazo. Sin embargo no nos muestra a fondo el proceso de volatilidad y trata los shocks positivos y negativos indiscriminadamente, cosa que va en contravía con lo que se ha observado/documentado en las series de tiempo financieras.

Documentos adjuntos

La versión en PDF de esta entrada y la hoja de cálculo en excel se pueden encontrar a continuación:

¿Por qué nos puede interesar?

Antecedentes

Distribución de probabilidad $Z_t$

$\{a_t^2\}$ Modelado

Modelo autoregresivo condicional de heterocedasticidad (ARCH)

ARCH(1) Modelo

Pronóstico

Conclusión

Documentos adjuntos

Artículos relacionados

Comentarios