Efectos de calendario

Este es el cuarto tema de nuestra serie de modelado ARMA Desconectado. En este número, comenzamos examinando la naturaleza de las series de tiempo de entrada y calificándolas como tipo de series de flujo/acción. Este desglose tiene una barrera en su exposición o influencia por eventos basados ​​en el calendario.

En la teoría econométrica, una muestra de series de tiempo es aquella que tiene observaciones igualmente espaciadas a lo largo del tiempo. ¿Pero todos los períodos se tratan igualmente en estas series? ¿Qué pasa cuando el período de muestreo es un día laboral, un mes o un trimestre? Como veremos, esto depende.

¿Por qué nos importa?

Tratemos de responder a esta pregunta con dos ejemplos:

Ejemplo 1: Considere el nivel de producción mensual de una fábrica dada. Suponiendo que la fábrica sólo funciona los días laborables y que la capacidad de producción (máquina y mano de obra) se mantiene constante, se espera que un mes con más días de la semana tenga valores más altos.

Ejemplo 2: Considere los retornos mensuales sobre activos. Supongamos que no se desarrollan eventos importantes,cambios en el mercado o noticias importantes que afectan los retornos de los activos en ningún período de tenencia en nuestro horizonte de datos de muestra. Si ese es el caso, se puede argumentar que los retornos esperados de los meses con más días de negociación será mayor y más volátil que los retornos por meses con menos días de negociación.

En resumen, los eventos del calendario influyen en los valores de la muestra de series de tiempo, y un ajuste previo para esos eventos nos ayudará a entender mejor el proceso, el modelado y el pronóstico.

Por ahora, usted debe estar lo suficientemente interesado como para entrar de lleno a las preguntas centrales que estamos tratando de responder aquí: ¿Cuáles son los eventos del calendario? ¿Cómo probamos su influencia en una serie de tiempo dada? ¿Cómo cuantificamos y/o ajustamos para su afecto antes y después de la fase de análisis?

¿Cómo explotamos esta nueva información de calendario a nuestro favor?

Al final de este artículo, esperamos dejarlo a usted con una sólida comprensión de los eventos del calendario y el tipo de ajustes para los valores de observación que puede hacer antes de su marcha hacia un ejercicio de análisis serio.

Antecedentes

En la literatura econométrica, las series temporales se dividen en dos grupos separados: acciones y flujo. Los datos de series temporales de valores miden un atributo a la vez (por ejemplo, desempleo, inflación, etc.), mientras que la serie de tiempo de flujo es una medida de una actividad (por ejemplo, nivel de producción, retorno de activos, etc.).

¿Por qué necesitamos hacer esta distinción? Las series temporales de valores no se ven afectadas por eventos de calendario (por ejemplo, días de negociación en un período, Semana Santa, etc.), pero las series temporales de tipo de flujo si lo están.

Para las series temporales de tipo flujo, el valor observado depende de la duración absoluta del período en términos de (1) día calendario, (2) días laborables o la ocurrencia de eventos de calendario especiales en este período. Considere los siguientes ejemplos:

  1. Nivel de producción mensual de una fábrica: Manteniendo todo lo demás constante (por ejemplo, capacidad), esperamos un mayor rendimiento en meses con más días de trabajo.
  2. Las ventas al por menor mensuales: manteniendo constante todo lo demás (por ejemplo inventario), esperamos un mayor nivel de ventas en el mes alrededor de los días feriados (por ejemplo, Semana Santa, Navidad, Ramadán, etc.)

Espere, ¿qué pasa con los años bisiestos? ¿Es el mes de febrero el mismo en un año bisiesto versus año no bisiesto? Para una serie de tipo flujo, no lo es.

Calendario de eventos

Un evento del calendario es un factor determinista (predecible) y exógeno al proceso de una serie de tiempo, pero el cual puede influenciar los valores observados en cada período.

Ejemplo

  1. Número de días laborables en un período
  2. Número de ocurrencias de un día de la semana dado (por ejemplo, lunes) en un período
  3. Ocurrencia de un feriado en movimiento (por ejemplo, Semana Santa) en un período
  4. Ocurrencia de un día festivo en un período
  5. Efecto de fin de semana largo?
  6. Para eventos que pueden abarcar algunos períodos (por ejemplo, Ramadán), el número de días (o días entre semana) del día feriado en cada período

Marco de referencia

Los eventos del calendario (días de la semana, días festivos, eventos, etc.) se expresan como variables de regresión que afectan a la media condicional de la serie de tiempo.

$$y_t=\beta_o+\sum_{i=1}^N{\beta_j x_{j,t}}+z_t$$ $$z_t=(y_t-\beta_o-\sum_{i=1}^N{\beta_j x_{j,t}})$$

Donde:

  • $N$ Es el número de variables de regresión
  • $\{z_t\}$ Son los residuos correlacionados

Distinto a la regresión lineal múltiple, los residuales de la regresión $\{z_t\}$ son correlacionados, Por lo que utilizamos un modelo econométrico para capturar correlaciones (Por ejemplo. ARMA/ARIMA), Y producen residuos de ruido blanco.El nuevo modelo puede expresarse de la siguiente manera:

$$z_t=f(z_{t-1},z_{t-2}\cdots z_1, a_{t-1},a_{t-2}\cdots a_1)+a_t$$ $$a_t \sim \mathrm{i.i.d}\sim\Phi(0,\sigma^2)$$

El modelo anterior es similar a un modelo de tipo ARMAX.

IMPORTANTE

  1. Esta formulación se define como previamente ajustada, ya que las variables de regresión se capturan primero y los residuos son aquellos modelados con ARIMA.
  2. Los valores de los coeficientes de regresión y los modelos ARMA/ARIMA se calculan simultáneamente. El optimizador LLF incluirá los coeficientes de regresión como parte de su grupo de parámetros libres mientras buscamos máximos óptimos.
  3. Para evaluar si una variable de regresión es significativa en el modelo, se comparan los valores de AIC (criterio de información Akaike) para diferentes modelos candidatos (es decir, prueba AIC). AIC penaliza el modelo con más parámetros libres.

La oficina del Censo de los Estados Unidos ajustó un modelo estacional ARIMA con una regresión y lo llamó regARIMA; Es decir, un regARIMA con orden $ (p, d, q)\ veces (P, D, Q) _s $ regARIMA se expresa de la siguiente manera:

$$\Phi(L^s)\phi(L)(1-L)^d (1-L^s)^D z_t=\Theta(L^s)\theta(L)a_t$$ $$\Phi(L^s)\phi(L)(1-L)^d (1-L^s)^D (y_t-\beta_o-\sum_{i=1}^N{\beta_j x_{j,t}})=\Theta(L^s)\theta(L)a_t$$ $$a_t \sim \mathrm{i.i.d}\sim\Phi(0,\sigma^2)$$

El orden del modelo ARIMA $ (p, d, q) \ veces (P, D, Q) _s $ se identifica usando procedimientos de identificación de modelo estándar (por ejemplo, Box-Jenkins, etc.) y los valores de los parámetros de regresión y ARIMA se evalúan durante el mismo proceso.

El modelo tiene un número total de parámetros de $p+q+P+Q+2$.

Ahora, necesitamos definir la variable de regresión para diferentes eventos del calendario: vacaciones en movimiento, años bisiestos y efecto del día de negociación.

1. Feriados Móviles

Movimiento de vacaciones son las vacaciones que se producen cada año, pero donde el momento exacto se desplaza en el sistema de calendario gregoriano. Ejemplos de vacaciones en movimiento incluyen el Domingo de Pascua, el Día del Trabajo y el Día de Acción de Gracias. Estos días feriados son considerados feriados móviles porque sus efectos sobre las series tienen el potencial de afectar más de un mes. </p

La variable de feriados móviles supone que la estructura fundamental de la serie de tiempo cambia durante un número fijo de días antes de cada una de estas tres feriados. Para el Día de Acción de Gracias, el efecto continúa después de Navidad (24 de diciembre). Los feriados móviles tienen un efecto en las ventas minoristas, y/o turismo y/o viajes.

¿Cómo definimos las variables?

Ejemplo 1: Feriado de pascua

El efecto del feriado de pascua se asume que comienza w-días antes de los feriados móviles, y por lo tanto puede ser distribuido en febrero, marzo o ambos.

$$E(w,t)=\frac{N_g}{w}$$

Donde

  • $N_g$ Es el número de días-w que caen en el mes t

Por lo tanto, si asumimos que el efecto de Pascua tiene un efecto de 10 días antes de los feriados, entonces podemos distribuir el efecto en los meses en que ocurre el período.

Otro método de tratar la Pascua es uno adoptado por Statistics Canada: Si la Pascua cae en abril o antes de abril, entonces la variable Pascua se define de la siguiente manera:

$$E(w,t)=\left\{\begin{matrix} n_g/w & \mathrm{March}\\ -n_g/w & \mathrm{April} \\ 0 & \mathrm{Else}& \end{matrix}\right. $$

Si la Pascua cae después de abril w, entonces $E(w,t)=0$ para todos los meses del año.

Donde:

  • $n_g$ Es el número de días-w que caen en marzo

Aunque nos estamos refiriendo al mismo día de fiesta móvil, la definición de la variable de la regresión varía entre la estadística de Canadá y la estadística americana.

Ejemplo 2: Feriado del día de acción de gracias

Se supone que el efecto Día de Acción de Gracias comienza días antes de la acción de gracias y continúa hasta Navidad (es decir, 24 de diciembre).Si $w\prec 0$, Se supone que el efecto comienza después del Día de Acción de Gracias.

$$\mathrm{ThC}(w,t)=\frac{N_g}{N}$$

Donde:

  • $N$ Es el número de días desde w días antes de Acción de Gracias hasta el 24 de diciembre
  • $N_g$ Es el número de días de $N$ que caen en el mes t

2. Feriados Fijos

A diferencia de los feriados en movimiento, los días feriados fijos ocurren en una fecha fija o en un día determinado de un mes determinado y normalmente no afectan a otros meses. Por esta razón, los feriados fijos se cree que son absorbidos por el componente estacional de la serie, y no se necesita un tratamiento especial para ellos.

3. Efecto de Día Laboral (o día entre semana)

El efecto día laboral está relacionado con los meses que tienen números diferentes de cada día de la semana de año en año. En cada mes, hay cuatro semanas y uno adicional, dos o tres días, que se traducen en que cada día de la semana que ocurren al menos cuatro veces al mes, y algunos días de la semana se ocurrirán cinco veces. Por qué esto es importante: recordar nuestro ejemplo en la fábrica, o una tienda al por menor abierta durante los días laborables.

El efecto día laboral Ocurre cuando una serie se ve afectada por las diferentes composiciones de día de la semana del mismo mes calendario en diferentes años.

Los efectos del día de laboral pueden ser modelados (flujo mensual y trimestral) con siete variables que representan (nº de lunes). . . (Número de domingos) en el mes t.

$$D_{1,t}=\{\mathrm{no.\:of\:Mondays\:in\:month}\}$$ $$D_{2,t}=\{\mathrm{no.\:of\:Tuesdays\:in\:month}\}$$ $$\cdots$$ $$D_{7,t}=\{\mathrm{no.\:of\:Sundays\:in\:month}\}$$

Además, Bell y Hillmer (1983) señalan, sin embargo, que una mejor parametrización del mismo efecto utiliza 6 variables de contraste definidas como (nº de lunes) - (nº de domingos),. . . , (Nº de sábados) - (nº de domingos)

$$TD_{1,t}=(\mathrm{no.\:of\:Mondays})-(\mathrm{no.\:of\:Sundays})$$ $$TD_{2,t}=(\mathrm{no.\:of\:Tuesdays})-(\mathrm{no.\:of\:Sundays})$$ $$\cdots$$ $$TD_{6,t}=(\mathrm{no.\:of\:Saturdays})-(\mathrm{no.\:of\:Sundays})$$

Además, también podemos usar un modelo más parsimonioso para capturar el efecto de los días de negociación. Este modelo reduce el número de regresores de día de negociación de seis a uno, asumiendo que el efecto diario de los días de semana (de lunes a viernes) es el mismo, y el efecto diario de los días de fin de semana (sábado y domingo) es el mismo.

$$TD_{t}=\sum_{i=1}^5 D_{i,t}-\frac{5}{2}\sum_{j=6}^7 D_{j,t}$$

Aunque este modelo restringido tiene menos variables de regresión conocidos como regresores), es potencialmente menos preciso debido a su supuesto fundamental de que los días laborables tienen el mismo efecto, y los sábados y domingos tienen el mismo efecto.

4. Efecto año bisiesto

$$\mathrm{LY}_{t}=\left\{\begin{matrix} 0.75 & \mathrm{Feb\:in\:Leap\:Year\:(Q1)}\\ -0.25 &\mathrm{Feb\:in\:non-Leap\:Year\:(Q1)}\\ \: 0 & \mathrm{Else} \end{matrix}\right.$$

5. Efecto de la duración del mes

Una serie de tiempo no exhibirá un efecto de día de negociación si los niveles de actividad son constantes durante cada día de la semana. Sin embargo, diferentes meses tienen diferentes longitudes (28, 29, 30 y 31 días), por lo tanto la actividad mensual puede variar simplemente porque algunos meses son más largos que otros. Esto se conoce como el efecto de la duración del mes.

El efecto de la duración del mes se maneja de dos maneras. (1) Para los meses no-febrero el efecto es absorbido automáticamente dentro del componente estacional de la descomposición de la serie porque estos meses tienen longitudes de mes constantes. Para el mes de febrero, la duración del mes se maneja con una variable de regresión de año bisiesto.

Además, (2) Si una serie tiene correcciones de día de negociación, estos ajustes incluirán el efecto de la duración del mes. Si no hay efecto de día laboral en una serie temporal, entonces el efecto de la duración del mes se contabiliza en el componente estacional.

En suma, podemos ignorar la duración del efecto mensual (datos mensuales) o la longitud del trimestre para los datos trimestrales.

Conclusión

Hemos cubierto un montón de terreno en nuestra discusión aquí, pero lo más importante es entender los datos de la muestra subyacente y su potencial sensibilidad (influencia) a los eventos del calendario (por ejemplo, día laboral, feriados móviles, año bisiesto, etc. ).

Una vez que tengamos una serie de sospechas, podemos decidir cómo cuantificar su ocurrencia o efecto para cada período. La decisión entre diferentes variables (para el mismo efecto de vacaciones) se basa principalmente en la experiencia y, en cierta medida, en las herramientas de software disponibles. Por ejemplo, en nuestro ejemplo de los feriados de Pascua, yo restringí las variables que son compatibles con el programa X12-ARIMA.

La pregunta ardiente que sospecho está en su mente ahora: ¿puedo diseñar mi propia variable (s) para modelar el efecto de un feriado móvil? ¡Usted apuesta! Después de todo, sólo necesita generar la serie de tiempo para esta variable para los puntos de datos pasados, e incluirla como una variable de regresión externa en el modelo.

Además, si está realizando un pronóstico, deberá proporcionar los valores para esta variable que cubre el horizonte de pronóstico de la muestra.

Definiendo su propia variable, usted puede soportar los feriados móviles de fuera de Estados Unidos o Canadá (por ejemplo, Año Nuevo Chino, Ramadán, Hanukkah, etc), o puede redefinir el efecto (peso) de días antes o después del feriado.Como puedes ver, las posibilidades son infinitas.

En nuestro próximo tema, profundizaremos en el procedimiento de ajuste estacional usando métodos no paramétricos (por ejemplo, X11 / X-12-ARIMA) y basados en modelos (por ejemplo, SEATS / TRAMO en X-13ARIMA-SEATS).

Comentarios

El artículo está cerrado para comentarios.

¿Fue útil este artículo?
Usuarios a los que les pareció útil: 1 de 1