En este número, el segundo tutorial de nuestra serie de preparación de datos, abordaremos la segunda suposición más importante en el análisis de series de tiempo: la estacionalidad o la suposición de que una muestra de series de tiempo se extrae de un proceso estacionario.
Empezaremos definiendo el proceso estacionario y especificando los requisitos mínimos estacionarios para nuestro análisis de series de tiempo. Luego demostraremos cómo examinar los datos de la muestra, dibujaremos algunas observaciones y resaltaremos las intuiciones detrás de ellas.
Antecedentes
En un sentido matemático, un proceso estacionario es un proceso estocástico cuya distribución de probabilidad conjunta no cambia cuando se desplaza en el tiempo o el espacio. En consecuencia, parámetros tales como la media y la varianza, si existen, tampoco cambian como resultado de un cambio de tiempo o posición. A esto se hace referencia a menudo como la forma estricta del proceso estacionario.
Siendo $\left \{X_t \right\} $ un proceso estocástico, donde $ F_x (x_{t_1},x_{t_2},...,x_{t_n}) $Es la función de distribución de densidad (masa) de la distribución conjunta de $ \left \{ X_t \right \}$. Entonces $ \left \{X_t \right \} $ se dice que es estacionario si, para todos los valores de cambio ($\tau $) y todos los valores de $\left \{t_1,t_2,...,t_N \right \}$,
$$F_x(x_{{t_1}+\tau},x_{{t_1}+\tau},...,x_{{t_N}+\tau})=F_x (x_{t_1},x_{t_2},...,x_{t_n})$$
La $F_x (.)$ función no es afectada por el desplazamiento en el tiempo.
Un ejemplo simplificado puede ser un Proceso Gaussiano de ruido blanco, Donde cada observación es idénticamente distribuida e independiente de todas las observaciones en una muestra dada. En consecuencia, la distribución de probabilidad conjunta de los datos de la muestra se expresa de la siguiente manera:
$$F_x (x_{t_1},x_{t_2},...,x_{t_n})=F_x(x_{t_1})\times F_x(x_{t_2})\times...\times F_x(x_{t_N})$$
Adicionalmente,
$$F_x(x_{t+\tau})=F_x(x_t)$$
Así que,
$$F_x (x_{t_1},x_{t_2},...,x_{t_n})=F_x(x_{{t_1}+\tau},x_{{t_1}+\tau},...,x_{{t_N}+\tau})$$
La suposición del proceso estacionario es muy estricta, y es muy difícil comprobar fuera de unos cuantos casos triviales (por ejemplo, ruido blanco). Para el análisis práctico de series de tiempo, un proceso estacionario de "sentido débil" (ESD) es adecuado.
Estacionario de "sentido débil" (ESD)
Una forma más débil de proceso estacionario de sentido débil (ESD) o estacionario de covarianza. El proceso ESD (WSS en Inglés) requiere que el primer momento (media) y el segundo (covarianza) no varíen con respecto al tiempo.
$$E\left [ x_t \right ]=E\left [ x_{t+\tau} \right ]=\mu $$ $$E\left [ x_t \times x_{t+\tau} \right ]=E\left [x_t \times x_{t-\tau} \right ]=m_x(\tau)$$
El proceso estacionario de sentido débil también se refiere a un proceso estacionario de primer orden. Adicionalmente, el ESD conduce a las siguientes conclusiones.
- La autocovarianza $(\gamma)$ y funciones de auto-correlación $(\rho)$ sólo dependen del $\tau$ (cambio en el tiempo)
- La autocovarianza $(\gamma)$ y las funciones de auto-correlación $(\rho)$ son dependientes del valor absoluto del cambio $(\tau)$:
$$\gamma_\tau=\gamma_{-\tau}$$
Nota:
Para el análisis de series de tiempo; Sólo nos ocuparemos de la forma ESD del proceso estacionario.
Comprobación de una suposición estacionaria
Supongamos que tenemos una muestra de datos de series de tiempo; ¿Cómo lo examinamos para la estacionalidad?
1. Método visual
Antes de profundizar en las pruebas estadísticas de estacionalidad, demostraremos en palabras claras cómo examinar la estacionalidad usando una gráfica de series de tiempo. Tenga en cuenta que estamos buscando una media y una varianza relativamente estables en el tiempo. Mi método preferido es trazar los datos de la muestra, el promedio móvil y la volatilidad ponderada exponencial en el mismo gráfico.
- El promedio móvil (ponderado) (WMA) es un indicador para la media marginal del proceso.
- La volatilidad ponderada exponencial (EWMA) es un indicador para el proceso marginal de desviación estándar.
Examinar la estabilidad de la media y la varianza en el tiempo.
Ejemplo 1:
Vamos a ver el proceso de los precios de cierre de las acciones diarias de IBM entre 02-enero-2012 y hoy 03-abril-2012:
La gráfica de arriba muestra una media de la tendencia de la muestra sino volatilidad más estable. Como resultado, el supuesto estacionario no se mantiene para el proceso de cierre de precios.
Nota:
La función promedio móvil ponderado exponencial (EWMA en Inglés) asume que la media del proceso es cero (0); Sin embargo, este no es el caso para el proceso de cierre de precios, por lo que necesitamos quitarle la media a la serie usando TSSUB antes de pasarlo a EWMA.
Ejemplo 2:
Echemos un vistazo a las devoluciones de registros diarios de las existencias de IBM:
El registro diario registra una media estable en el tiempo, y la volatilidad está ligada entre 0,6 - 1,2% por día de negociación.
Nota:
Por lo general, ignoramos los primeros valores EWMA porque el número de observaciones utilizadas para calcular esos valores es muy limitado, dando lugar a resultados inexactos.
La media de los datos de la muestra no es significativamente diferente de cero, y la volatilidad (desviación estándar) es de alrededor del 0.8%, que es la línea central para EWMA en nuestra muestra (excluyendo los valores al principio de la muestra).
En resumen, los datos de muestra de las devoluciones de registro diarios de existencias de IBM se ven estacionales.
2. Prueba estadística
En la práctica, la razón común para la no estacionalidad en los datos de muestra es la presencia de tendencia e integración (es decir, raíz-unitaria) entre las mismas observaciones.
Una serie de pruebas estadísticas se pueden utilizar para examinar los supuestos estacionarios, descomponiendo el proceso en tres elementos: una tendencia determinista, una caminata aleatoria (raíz unitaria), y un error estacionario. Las siguientes pruebas se utilizan comúnmente para establecer los supuestos estacionarios:
- Tendencia estacionaria - Kwiatkowski–Phillips–Schmidt–Shin (KPSS)
- Prueba de raíz unitaria prueba o paseo aleatorio – prueba de Dickey-Fuller aumentada (ADF)
La suposición estacionaria no se sostiene; ¿qué puedo hacer?
Si una suposición estacionaria falla, la solución es bastante simple: transformar los datos en un proceso estacionario.
¿Cómo vamos exactamente a hacer esa clase de transformación? Anteriormente, se mencionó que la presencia de tendencia y / o unidad de raíz (integración) en la serie de tiempo, comúnmente conduce a la no estacionalidad. Usando la prueba estadística, podemos comprobar la presencia de tendencia y / o raíz unitaria. A continuación, aplicamos varias técnicas incluyendo de-trending, ajuste estacional, y diferenciado, para producir un proceso estacionario.
En las series de tiempo financiero, la raíz unitaria (paseo aleatorio) se encuentra a menudo en la serie de tiempo bruta, mientras que la tendencia se puede encontrar en datos macroeconómicos. La experiencia y la familiaridad de un analista con el tipo de series de tiempo es crítica en la selección/aplicación de las técnicas de transformación apropiadas.
En la serie de precios de cierre de acciones de IBM, los datos mostraron comportamiento al azar. Podríamos también calcular fácilmente las funciones de ACF, y nosotros demostramos un ACF para el retraso uno con un valor tan alto como el 100%. Para eliminar el paseo aleatorio, tomamos la primera diferencia y terminamos con un proceso estacionario.
IMPORTANTE:
Suponemos que el proceso subyacente no ha sufrido cambios estructurales (es decir, eventos exógenos) dentro de los datos de nuestra muestra.
Comentarios
El artículo está cerrado para comentarios.