Suavización Exponencial General con Tendencia, Estacional y Ajuste de Chatfield en NumXL

Mohamad

19 de agosto de 2019 15:27

En este video demostramos cómo usar la función de suavizado general exponencial en NumXL con tendencia, estacionalidad y ajuste de Chatfield.

Guion de Video

Escena 1:

Hola y bienvenidos a las series de tutoriales de suavizado exponencial. En este tutorial, presentaremos la última adición a la familia de funciones de suavizado exponencial, la función de suavizado exponencial general GESMTH.

La función de suavizado exponencial general no solamente sirve de soporte de modelos de suavizado anteriores cubiertos por las funciones de suavizado exponencial simple, doble y triple sino que implementa tipos adicionales de componentes de tendencia y estacionalidad. Además la función de suavizado exponencial general sirve de soporte de transformaciones anteriores de los datos y como ajuste o corrección de Chatfield para la auto correlación de primer orden en los errores de pronóstico.

En suma la función de 0 suavizado exponencial general es la última herramienta en nuestro arsenal para suavizar nuestros datos y proyectar un pronóstico.

En este vídeo, cubriremos los modelos de suavizado para conjuntos de datos de tendencia no estacional usando los distintos tipos de tendencia y de optimización automática integrada para los parámetros de suavizado. Usemos la generación neta anual de energía en Estados Unidos usando gas natural como combustible entre 1949 y 2016. Los datos fueron tomados de la agencia de información de energía en US y las unidades son expresadas en millones de megawatts por hora.

Escena 2:

Examinemos la gráfica de datos sobre el tiempo y notemos la generación anual de energía neta usando gas natural. No exhibe estacionalidad crece rápidamente como moda no lineal en los años posteriores a 1988 sin embargo su crecimiento no es perfecto, será este patrón perfecto quizás.

Ahora tenemos una idea de que es con lo que estamos lidiando. Así que, empecemos. Para la ilustración, hagamos un listado de los argumentos de ingreso de la función de suavizado exponencial general en las celdas D1 a D11. Seleccionemos la celda D18. Ingresemos el nombre de la función GESMTH en la celda o en la barra de herramientas de la ecuación. No tenemos que la herramienta de autocompletado de Microsoft Excel nos ayudará a encontrar la función correcta.

Una vez encontremos la función de suavizado exponencial general hagamos clic en el botón FX localizado a la izquierda de la barra de herramientas de la ecuación. Esto invocará el cuadro de diálogo con los argumentos de la función para la función de suavizado exponencial general.

Escena 3:

Primero especificamos el rango de celdas de ingreso y luego lo que vemos la referencia de inicio de la celda presionando F4. En el campo de orden, especificamos uno o verdadero para el orden de tiempo en las series. Esto designa que la primera observación en las series de ingreso corresponde a la fecha más reciente.

Para el parámetro de suavizado de nivel alfa podemos ingresar un valor entre 0 y 1 o podemos dejar un espacio en blanco o hacer referencia a una celda existente. En este ejemplo, hagamos referencia al valor en D1 y bloqueemos la celda de referencia presionando F4.

Para el parámetro de suavizado de tendencia, beta podemos también ingresar un valor entre 0 y 1 o podemos dejar un espacio en blanco hace referencia a una celda existente. En este ejemplo, hagamos referencia al valor en D2. Bloqueemos la celda de referencia presionando F4.

Para gamma o para los parámetros de suavizado de índices estacionales podemos ingresar un valor entre 0 y 1 y dejar un espacio en blanco o hacer referencia a una celda existente en nuestra hoja de cálculo.

Para mayor consistencia, hagamos referencia al valor en D3. Bloqueemos la referencia de la celda presionando F4.

Escena 4:

Ahora para el coeficiente de amortiguación de tendencia, Fi debemos ingresar un valor entre 0 y 1, dejar un espacio en blanco o hacer referencia a una celda en nuestra hoja de cálculo. Hagamos referencia al valor en D4. Bloqueemos la celda de referencia presionando F4.

Para el valor del parámetro de término corregido de auto correlación de Chatfield, aka lambda podemos ingresar un valor entre menos uno y uno, dejar un espacio en blanco o hacer referencia a una celda en nuestra hoja de cálculo. Hagamos referencia al valor en D5. Bloqueemos la celda de referencia presionando F4.

Para el tipo de tendencia, necesitamos escoger un valor entre 0, sin tendencia y 4, amortiguado multiplicativo, dejar un espacio en blanco acá sin tendencia o hace referencia a la celda en su hoja de cálculo. De nuevo hagamos referencia a otra celda, D6. Bloqueemos la celda de referencia presionando F4.

Para el tipo de argumento de estacionalidad, podemos dejar un espacio en blanco indicando la no estacionalidad o ingresar 0 o hacer referencia a la celda en la hoja de cálculo.

Para consistencia con el resto de argumentos, hagamos referencia a D7. Bloqueemos la celda de referencia presionando F4.

Escena 5:

Para longitud estacional, podemos dejar un espacio en blanco sin estacionalidad, ingresar un valor eje 1 o hacer referencia a una celda. Hagamos referencia al valor en la celda D8. Bloqueemos la celda de referencia presionando F4.

Para habilitar deshabilitar el optimizador incorporado, podemos ingresar un valor de verdadero o falso, dejar un espacio en blanco deshabilitado o hacer referencia al valor en D9. Bloqueemos la celda de referencia presionando F4.

Para habilitar deshabilitar la corrección de auto correlación de Chatfield, ingresemos verdadero o falso, tenemos un espacio en blanco o hagamos referencia al valor en D10. Bloqueemos la celda de referencia presionando F4.

Escena 6:

Para transformaciones de datos de registro posteriores, hagamos referencia al valor en la celda D11. Bloqueemos la celda presionando F4.

Para el tiempo de pronóstico, estaremos pronosticando el valor al final de los datos de ingreso, así que programemos T como 0 o mejor, hagamos referencia en la columna A de manera que podamos cambiarla luego del final de los datos de ingreso. Bloqueemos la celda para el movimiento de la columna presionando F4 hasta que el signo de dólar aparezca a la izquierda.

Para el tipo de retorno, dejemos un espacio en blanco o ingresemos 0 para el pronóstico. Ahora hagamos clic en aceptar.

Escena 7:

La función devuelve no aplica ya que no tenemos datos suficientes.

Escena 8:

Copiamos las fórmulas en las celdas de abajo, incluso hasta luego del final de los datos de la muestra. No se preocupen por las celdas vacías seleccionadas luego del final de los datos de ingreso, la función las ignorará.

Escena 9:

Graficemos el pronóstico de suavizado optimizado en un paso, el pronóstico de suavizado exponencial general sigue los datos muy bien.

Escena 10:

Antes de que podamos comparar otros modelos de suavizado cuantificamos la exactitud del pronóstico de las nuevas series. Para esta ilustración, usaremos tres medidas de comportamiento de pronóstico. Para medida absoluta usaremos el error cuadrática medio (MSE), para error porcentual escogeremos el error porcentual absoluto medio simétrico (MAPE) y para el error escalado relativo relativo el modelo primitivo usaremos el error de escala absoluto medio (MASE). Estas funciones hacen parte de NumXL y están disponibles como una función de la hoja de cálculo.

Primero examinemos un modelo de no tendencia aka suavizado exponencial simple de Brown. Programemos el tipo de tendencia a cero y el sin tendencia. La hoja de cálculo auto calculará todos los valores y la gráfica reflejará las nuevas series. No se ve muy bien. Veamos la medida de exactitud de pronóstico. MASE muestra que su desempeño es peor que el del pronóstico simple primitivo, MAPE muestra que el error porcentual promedio está alrededor de 8%.

Escena 11:

OK, adicionamos una tendencia aditiva determinista lineal aka suavizado exponencial doble de Holt. Programamos el tipo de tendencia en 1 y el tendencia aditiva en D6. De nuevo la hoja de cálculo recalcula todos los valores de pronóstico y la gráfica está actualizada, se ve mejor que antes. Examinando la exactitud de la medida, vemos que MASE muestra que se comporta mejor que el modelo primitivo, 6% mejor. Y MAPE muestra el mismo promedio de error absoluto.

Intuitivamente, realmente no creemos que la tendencia vaya a durar para siempre. En algún punto empezará a bajar, tratemos una tendencia de tipo amortiguado aditivo.

Programamos el tipo de tendencia como 2 en la celda D6. Una vez excel termina de recalcular los valores de pronóstico nuevos, la gráfica se actualiza. Los nuevos valores de pronóstico se ven mejor y ambos tanto el MASE 92% como el MAPE 7% mejoran. Que interesante, parece que aplicar un poco de sentido común finalmente está dando frutos. Analizando de nuevo los datos brutos el crecimiento de la generación neta de energía luego de 1989 sigue una tendencia no lineal, casi exponencial.

Tratemos de usar un tipo de tendencia multiplicativo para capturar esta observación. Programamos el valor en la celda D6 como 3.

Escena 12:

Dejemos que Excel recalcular los nuevos valores y notemos el cambio. Los resultados son peores.

Que hicimos mal? El modelo asume que el crecimiento exponencial en la generación neta de energía continuará para siempre.

Cómo podemos amortiguar este crecimiento y corregirlo? Aquí usaremos una tendencia multiplicativo amortiguada. Programaremos el valor del tipo de tendencia en la celda D6 como 4.

Escena 13:

Una vez Excel recalcular la hoja de cálculo, notemos como los valores han mejorado dramáticamente.

El nuevo MASE es de 92% y MAPE es de 7%. Eso es todo? Es lo mejor que podemos lograr? Esperen, tenemos un par de controles para afinar el modelo.

El primer control es un ajuste corrección al valor de pronóstico que obtenemos al remover la auto correlación de primer orden en el pronóstico de error con frecuencia llamado ajuste de Chatfield.

Cambiamos la medida de control a verdadero o 1 en la celda D10. Luego de que la re calcule acción sea efectiva obtendremos resultados mezclados. El MASE se mejorará a un 89% de un 92%, pero el MAPE aumentará a 8% de un 7%. Es algo sobre lo que debemos pensar. El segundo control es el ingreso de transformación para los datos anteriores ha suavizado. Para lograrlo, los datos deben ser estrictamente positivos, lo cual es el caso de nuestro conjunto de datos. Recordemos nuestra clase de matemáticas al tomar un logaritmo de un grupo de datos con crecimiento exponencial, lo convertirá en una tendencia lineal, así que hagamos lo siguiente. Desactivemos el indicador de corrección ajuste de Chatfield D10. Ajustemos el tipo de tendencia en uno, tendencia lineal en D8. Programamos el ingreso de transformación a verdadero o 1 en la celda D11.

Escena 14:

Una vez que Excel recalcular los nuevos valores, examinemos los resultados. No es peor.

Escena 15:

Qué tal la tendencia amortiguada aditiva? Programamos el tipo de tendencia en D6 como 2.

Escena 16:

Bien esto se ve genial, MASE del 90% y MAPE 7%.

Qué tal un tipo de tendencia multiplicativo amortiguado? Programamos el tipo de tendencia en D6 como 4. Nos va mejor con la tendencia aditiva amortiguada para los datos de ingreso. Programamos el valor del tipo de tendencia en D6 como 2 otra vez.

Qué tal el ajuste de Chatfield? Programemos el control de Chatfield como verdadero o uno en D10.

Tenemos de nuevo resultados mezclados, el MASE mejoró pero MAPE empeoró. Programamos la corrección del control de Chatfield como falso otra vez o 0 en D10.

En suma tenemos dos candidatos, el tipo de tendencia de aditivo amortiguado para los datos de ingreso y el tipo de tendencia multiplicativo amortiguada para los datos brutos. Qué tal si usamos algo de intuición para mejorar el resultado?

Escena 17:

Tenemos de nuevos resultados mezclados, el MASE mejoró pero MAPE empeoró. Programamos la corrección del control de Chatfield como falso otra vez o 0 en D10. El uso extensivo del gas natural para la generación de energía en Estados Unidos es un desarrollo reciente movido por bajos precios de gas natural y o altos precios de crudo. tradicionalmente los generadores de gas natural eran usados como picos para alcanzar niveles superiores de demanda marginal, pero vemos como máximas se usan para servir de carga base.

Qué significa esto con respecto a nuestros datos? Puede el conjunto de datos tener una ruptura estructural? Que significa una ruptura estructural? Porque ha de importarnos? En el suavizado exponencial usar los datos más relevantes es clave para un buen modelo de ajuste de parámetros de calibrado y eventualmente de pronósticos robustos.

Revisando nuestros datos vemos tres regímenes separados bruscamente 1949-1969 crecimiento, 1970-1988 estancamiento y 1989 hasta hoy de crecimiento. Los datos bien pueden ser atribuidos a los factores externos, eje capacidad de generación de energía existente, precios del petróleo, regulaciones, inversiones etcétera, pero para nosotros solamente utilizaremos los datos que tenemos a la mano.

Intuitivamente nos enfocaremos en los más recientes datos anuales desde 1989 hasta la fecha y los modelar hemos. Suena como mucho trabajo, no necesariamente, no me quise delegar a todo el trabajo pesado para nosotros de manera que podemos sentarnos y aplicar un entendimiento profundo, conocimiento, intuición en subrayar el proceso físico. Eje generación de energía, ningún modelo sofisticado puede ganarnos en eso.

Escena 18:

Para ilustración, tenemos copias de los datos y las fórmulas en una hoja de cálculo aparte, luego removimos todas las observaciones anteriores a 1989.

Escena 19:

Tipo de tendencia multiplicativo amortiguada para los datos de ingreso, MAPE es 5% y MASE es 67%.

Nos importa qué modelo usar? Para pronósticos de un paso los dos modelos arrojan resultados comparables.

Qué tal el pronóstico de múltiples pasos más allá de nuestro conjunto de datos? El tipo de tendencia aditiva amortiguada para datos de ingreso, es un modelo relativamente más simple y se materializa en crecimiento exponencial amortiguado. Algo en lo cual quizás podamos concordar. La tendencia multiplicativo amortiguada para los datos de ingreso asume que los mismos datos de ingreso exigen crecimiento exponencial. Así que el ritmo de crecimiento para el pronóstico es mucho más rápido que el modelo anterior. Quisiéramos usar un modelo intuitivo simple así que vamos a irnos con el modelo aditivo amortiguado.

En este tutorial solamente hemos analizado el componente de tipo de tendencia sin estacionalidad y nos hemos ocupado solamente de los valores de pronóstico. GESMTH tiene muchos resultados que creemos son la clave para construir nuestro siguiente gran modelo.
This figure shows the output data and graph of the General Exponential Smoothing using the many different settings and function arguments to smooth the input data.

Escena 20:

Eso es todo por ahora, gracias por vernos!

Artículos relacionados

Comentarios