Pronóstico Hacia Atrás

Ésta no es una pregunta formulada como un Oxímoron sino una un interrogante que ha sido enviado por uno de nuestros usuarios; así que pensamos que podría interesarle a otros más.

Así va la historia: Cuando se tiene una muestra de series de tiempo, la mayoría de las veces nos gustaría pronosticar solamente puntos futuros (luego de la fecha final de los datos de muestra). ¿Pero qué pasa con aquellos datos que son anteriores a la fecha de inicio de la muestra? ¿Podemos predecir ésos también? Si sí, ¿qué podemos decir sobre el proceso de pronóstico?

¿Por qué nos debe importar?

Hay diferentes casos donde uno querría predecir el pasado.

Por ejemplo, nuestro usuario tenía una series de tiempo de temperatura a las que le faltaba observaciones pasadas, así que él quería una mejor estimación para ellas usando las dinámicas detectadas en los mismos datos.

Para las series de tiempo financieras, no existe dinero que se pueda generar al pronosticar el pasado (a menos que tengamos una máquina para viajar en el tiempo). ¿Pero podemos usar los puntos de datos pasados y sus pronósticos para ayudarnos a diagnosticar la estabilidad subyacente de los procesos?

En esta entrada entrada les mostraremos como hacer un pronóstico hacia atrás usando únicamente las funciones de NumXL en Excel. También discutiremos la relación entre un modelo de series de tiempo regular y un modelo implícito de series de tiempo hacia atrás o en ¨reversa¨.

Para los datos de muestra usamos las temperaturas mensuales MIN-MAX registradas en una ciudad dada de Enero de 1988 a Diciembre de 2009.

Trasfondo

En las series de tiempo, usualmente expresamos el valor de un punto de datos como una función de valores previos.

$$X_t=f(X_{t-1},X_{t-2},\cdots,X_1, a_{t-1},a_{t-2},\cdots,a_1)+a_t$$

Donde

  • $\{X_{t-1},X_{t-2},\cdots,X_1\}$ es un conjunto de valores de obervaciones pasadas
  • $\{a_{t-1},a_{t-2},\cdots,a_1\}$ es un conjunto de innovaciones pasadas

Para invertir el problema necesitamos expresar los valores de observación pasados en términos de los futuros.

$$X_t=g(X_{t+1},X_{t+2}\cdots X_T, a_{t+1}, a_{t+2}\cdots , a_T) + a_t$$

Donde

  • $\{X_{t+1},X_{t+2}\cdots X_T\}$ son los valores de observaciones futuras hasta el final de la muestra
  • $\{a_{t+1}, a_{t+2}\cdots , a_T\} $ es un conjunto de innovaciones o shocks hasta el final de la muestra

Al examinar las dos formas, se puede observar que el modelo hacia atrás es básicamente un modelo de series de tiempo pero con los datos cronológicamente en reversa , tal como: $\{Y_t\}$

$$Y_t = X_{T-t}$$ $$X_t = Y_{T-t}$$

Así que, antes que nada, re-formulemos las relaciones:

$$t=T-\tau$$ $$X_{T-\tau}=g(X_{T-\tau+1},X_{T-\tau+2}\cdots X_{t+\tau},a_{T-\tau+1},a_{T-\tau+2}\cdots a_{t+\tau})+a_{T-\tau}$$ $$X_{T-\tau}=g(X_{T-(\tau-1)},X_{T-(\tau-2)}\cdots X_{T-(T-t-\tau)},a_{T-(\tau-1)},a_{T-(\tau-2)}\cdots a_{T-(T-t-\tau)})+a_{T-\tau}$$ $$Y_\tau=g(Y_{\tau-1},Y_{\tau-2}\cdots Y_0,\omega_{\tau-1},\omega_{\tau-2}\cdots \omega_0)+\omega_\tau$$

Donde

  • $\{\omega_{\tau} \}=\{a_{T-\tau}\}$

Invirtiendo el orden cronológico de las series de tiempo podemos encajar un modelo de series de tiempo regular y pronosticar nuevos valores como hemos hecho usualmente; pero interpretándolos como valores pasados en el dominio original de las series de tiempo.

Aplicación

Para nuestra muestra de datos usaremos la temperatura mensual MAX-MIN (en grados Celsius) registrada en una ciudad dada;

Gráfica de una muestra de datos de temperatura mensual min-max

Nótese que la serie de tiempo exhibe una estacionalidad de 12 meses y un movimiento en ascenso (tendencia).

El objetivo aquí es pronosticar las temperaturas mensuales MIN-MAX desde 1984 a 1988.

Nótese que la serie de tiempo de temperaturas máximas y mínimas están correlacionadas. Pero para nuestro propósito aquí, ignoraremos la interdependencia y pronosticaremos cada serie de tiempo de forma separada.

Además, usaremos la Función de Suavizado triple Exponencial de Winter para dirigir el pronóstico.

Pronóstico

Como se ha mencionado anteriormente, hemos revertido el orden cronológico de las series de tiempo ingresadas (MIN y MAX) de manera que la primera observación sea la última y vice versa. Hemos usado la función ¨INVERTIR¨o ¨REVERSE.

Ahora, usando la Función Exponencial triple de Holt-Winter,

  1. Hemos asumido un valor estándar para $\{\alpha,\beta,\gamma\}$ of 0.1 calculado un pronóstico de una muestra MAX para cada punto.
  2. Usando la Función de Error Cuadrática de Raíz Media (i.e. RMSE), hemos calculado la medida de discrepancia entre el valor del modelo y los valores de datos de la muestra.
  3. Usando el solucionador, hemos optimizado los valores de $\{\alpha,\beta,\gamma\}$ que minimizarían el valor de RMSE. Para más detalles de cómo calibramos los coeficientes, por favor dirigirse a nuestra entrada acerca de suavizado de funciones donde abordamos la optimización de parametros de valor.
  4. Luego, hemos usado los valores óptimos de la Función TESMTH para pronosticar puntos fuera de los datos de la muestra.
  5. Luego repetimos el mismo procedimiento para las series de tiempo MIN.
Gráfica para temperatura min-max con retrospectiva de 1984 a 1988

En la gráfica anterior, todas las observaciones antes de Diciembre de 1988 fueron pronosticadas con la función de TESMTH. El pronóstico preservó la estacionalidad y la tendencia es mínima.

Conclusión

Hemos demostrado cómo hacer un pronóstico hacia atrás, que es una predicción para una observación que es anterior a la fecha de inicio de la muestra de datos. El paso clave fue invertir el orden cronológico de los valores arrojados por las series de tiempo antes de empezar el análisis.

Además, el proceso de series de tiempo de los datos originales es diferente del proceso invertido de las series de tiempo.

$$x_t=\alpha +\phi x_{t-1}+ a_t$$ $$\left |\phi \right | < 1 $$

Para invertir la relación,

$$x_{t-1}=\frac{-\alpha+x_t -a_t}{\phi}$$

Pero si el proceso es estacionario en una dirección, es, por definición, estacionario para el proceso de series de tiempo invertidas.

Finalmente, en nuestra aplicación debemos notar que pronosticar cada serie de tiempo de manera independiente no es lo ideal porque no estamos teniendo en cuenta la independencia de las dos series de tiempo.

¿Tiene más preguntas? Enviar una solicitud

0 Comentarios