Interpretando los Precios de la Gasolina Diesel

En este estudio de caso, examinaremos de cerca el precio minorista en las autopistas ($/galón) para la gasolina ¨No. 2 Ultra bajo sulfuro (0-15 ppm) de Diesel” en las nueve regiones o Distritos de Defensa de Administración de Petróleo (PADD por sus siglas en inglés). Llevamos a cabo un analisis del componente principal, con el fin de encontrar un mínimo sub grupo de los principales componentes que capturan (o explican) la variación en los precios entre las regiones con una pérdida mínima de información.

Luego usaremos el promedio semanal del precio minorista en las autopistas ($/Gallon) para “No. 2 Ultra bajo sulfuro (0-15 ppm) de Diesel” en las nueve regiones o Distritos de Defensa de Administración de Petróleo en Estados Unidos (PADD por sus siglas en inglés). Los datos de la muestra empiezan en Febrero 5 de 2007 y terminan en Mayo 6 de 2013 (327 observaciones). Cada observación representa los precios promedio semanales en nueve regiones:

  1. Costa Este
  2. Nueva Inglaterra
  3. Atlántico Central (PADD 1B)
  4. Atlántico Bajo (PADD 1C)
  5. Midwest
  6. Costa del Golfo
  7. Rocky Mountain
  8. Costa Oeste
  9. California
No.2 ultra low sulfur highway weekly retail price average for the Nine (9) EIA PADD regions

Los precios semanales a lo largo de las diferentes regiones están altamente correlacionados.

Correlation table for the spot weekly prices of No.2 Ultra low sulfur diesel across the Nine(9) EIA PADD regions
data plot for the spot weekly average of ultra low sulfur diesel in Nine(9) EIA PADD regions

En este tutorial, investigaremos a los conductores detrás de la variación del precio entre las distintas regiones, e intentaremos suponer la representación física de esos componentes usando los precios de embarque de cada región.

Proceso

Ahora estamos listos para conducir nuestro principal componente de análsis. Primero, seleccione una celda desocupada en su hoja de cálculo donde quisiera que se genere el resultado, luego localice y haga click en el ícono del componente principal (PCA) en la etiqueta NumXL (o barra de herramientas).

Principal component analysis icon in NumXL toolbar or ribbon in Excel

Aparece el asistente de análisis del componente principal.

General tab of NumXL Principal component analysis dialog or wizard

Seleccione el rango de celdas para los cinco valores variables de entrada.

Notas:

  1. Descarte las últimas tres observaciones de manera que nuestros datos de entrada terminen en Abril 15 de 2013. Los tres puntos restantes serán usados para comparar los valores de pronóstico más adelante.
  2. Deje el campo llamado ¨Máscara de variables” en blanco por ahora. Revisitaremos este campo en entradas posteriores.

Ahora, seleccione la pestaña de “Opciones”.

Options tab of NumXL principal component analysis wizard or dialog

nicialmente, la pestaña está programada con los siguientes valores:

  • “Entradas Estándar” va marcada. Deje esta opción marcada.
  • “Principal Componente de salida” va marcada. Deje esta opción marcada.
  • El nivel de signifcado (aka. ) está programado al 5%.
  • Bajo el “componente principal” marque la opción “Valores” de manera que las tablas de salida generadas incluyan los valores del componente principal para diferentes fechas.
  • “Variables de entrada” no va marcada. Deje esta opción sin marcar.

Ahora haga click en la pestaña “Valores faltantes”

Missing values tab in NumXL principal component analysis dialog or wizard

En esta pestaña se puee seleccionar una aproximación para tratar con valores faltantes en el conjunto de datos (X). Por defecto, cualquier valor faltante encontrado en cualquier observación excluiría la obervación del análisis.

Este tratamiento es una buena aproximación para nuestro análisis así que no lo alteremos.

Ahora hagamos click en “OK” para generar las tablas de salida.

Output tables generated by NumXL principal component analysis wizard or dialog

Análisis

1. Estadísticas

Principal components statistics table for the 9 spot prices of No.2 ultra low sulfur diesel in 9 EIA PADD regions generated by NumXL principal component wizard

En la tabla anterior hemos mostrado la varianza de cada componente proncipal y la proporción de la variable total de la varianza del conjunto de datos de salida (estandar) que la justifica. Examinando la tabla de manera más cercana, los primeros dos componentes caputran el 99.8% de la variación del conjunto de datos.

2. Cargas

En la tabla de cargas subrayamos los pesos del componente principal en cada variable de entrada:

Loadings of each input variable in the different principal component

Examinando las variables de salida (ej. Precio de la región) las cargas para el primer componente muestran una carga uniforme para todas las variables. Esto se puede interpretar como el factor-nivel (precio que es neutral a nivel local).

Para el segundo factor, la gráfica es un tanto diferente:

  • Para todas las regiones PADD en el este, la carga es negativa.
  • Para todas las regiones PADD en el este, la carga es negativa.
  • La carga de la Costa del Golfo es ligeramente negativa.
  • La carga del Medio Oeste es ligeramente positiva.

Esta carga de factores puede verse como próxima a (o disponible para) la capacidad de refinerías o puertos de improtación (ejemplo: el Puerto de Nueva York). El segundo factor refleja el costo del transporte y de y del impuesto de gasolina.

The diesel spot prices loadings in the first principal component

Nota: Las cargas de las variables de entrada para el primer componente son muy comparables, de manera que, el segundo componente (factor) es lo que conduce el precio diferencial entre las distintas regiones PADD.

3. Valores del Componente Principal

Examinemos los valores de los primeros dos componentes principales.

first and second principal components data plot

Las dos series de tiempo muestran algo de estacionalidad, sin embargo, es más evidente en el segundo factor. Además, el primer componente principal muestra un patrón cercano a los precios del crudo.

Plot for the first principal component and WTI spot prices

NOTA: La falta de un emparejamiento exacto puede ser atribuida a otros costos incurridos en la elaboración del Diesel Sulfuro Ultra liviano No. 2: mano de obra, precios de la energía, materia prima, etc. Además, las refinerías construyen un inventario de productos (ej. Diesel) en anticipación a los picos de demanda estacional, de manera que puede haver un retraso.

4. Añadiendo Precios de contado WTI

Como una última observación del precio de contado WTI, incluiremos el precio de contado WTI en nuestro conjunto de datos de entrada y re examinaremos las cargas de entrada. De manera intuitiva, sumar una variable de entrada para precio de materia prima (ej. Crudo) con los precios finales de los productos en el mismo conjunto de datos revelará otro impulsor: el costo de producción.

principal component analysis output tables for ten (10) variables: Nine (9) EIA PADD regions diesel spot prices and WTI spot price

Ahora, hemos necesitado tres impulsores para justificar el 99.8% de la variación del precio.

principal component summary statistics output table for the ten (10) variables: Nine (9) EIA PADD regions diesel spot prices and WTI spot price

IMPORTANTE: Los componentes principales del nuevo conjunto de datos no son necesariamente los mismos que los computados anteriormente con sólo los precios del diesel.

Echemos una mirada a las cargas de variables de entrada en cada componente principal (ej. Impulsor):

principal component loadings output table for each of the ten (10) variables ( 9 EIA PADD regions diesel spot prices and WTI spot price) in the different principal components

Notas:

  1. Las cargas para el primer componente son similares a las calculadas anteriormente con sólo precios de Diesel. Nótese que las cargas WTI son levemente más bajas que sus contrapartes Diesel. De nuevo, designaremos este factor como el precio de nivel general (neutral de la región).
  2. TLas cargas para el segundo factor son muy diferentes ahora, y la carga para WTI es negativa (-%94.5) mientras que todo el resto son positivas. Podemos designar este factor como el costo del craqueo de Diesel en crudo.
  3. La carga para el factor 3 es muy similar a la carga para el segundo componente en los conjuntos de datos anteriores. De nuevo, la carga varía de acuerdo a la locación (este vs. Oeste). El WTI, la Costa del Golfo y el Medio Oeste son casi neutrales.

Grafiquemos ahora las series de tiempo del factor.

time series plot for the 1st and third principal component of the new data set (10 variables: 9 spot prices of EIA PADD regions and WTI spot price

En términos generales, el primer y tercer componente so muy similares a los primeros dos componentes que hemos calculado anteriormente (sin WTI en el conjunto de datos).

Para el segundo componente, suponemos que este es el más cercano al costo del craqueo de Diesel.

time series plot for the second principal component of the new data set (10 variables: 9 spot prices of EIA PADD regions and WTI spot price

Conclusión

En este tutorial, hemos examinado una aplicacion no trivial para PCA. Hicimos el intentdo de explicar la variación del precio entre diferentes regiones PADD mediante el descubrimiento de fuerzas impulsoras detrás de los precios.

¿Qué sigue?

Hemos mencionado anterioremente qe las refinerías han desarrollado un inventario de productos (ej. Diesel) en anticipación de los picos de demanda estacional, de manera que puede haber un retraso. Como capturamos esta variable? Futuro: podemos incluir los precios futuros de Diesel y Crudo.

¿Por qué?

IDe manera intuitiva, los precios futuros reflejan la anticipación del mercado de (1) la demanda futura, (2) el costo de almacenaje futuro, y posiblemente una valiosa escacés de abastecimiento. Esta aplicación está hecha para darles una muestra de cómo aplicar PCA y series de tiempo; así como también para mostrarles cómo usar o interceptar las variables de carga derivando un agente práctico para ellas.

En suma, PCA es un procedimiento matemático que NumXL puede ayudarles a ejecutar. Dándole sentido e interpretando los resultados es donde su experiencia e intuición son indispensables.

  Archivos adjuntos

Comentarios

Inicie sesión para dejar un comentario.

¿Fue útil este artículo?
Usuarios a los que les pareció útil: 0 de 0