Interpretando los Precios de la Gasolina Diesel

En este estudio de caso, examinaremos de cerca el precio minorista en las autopistas ($/galón) para la gasolina ¨No. 2 Ultra bajo sulfuro (0-15 ppm) de Diesel” en las nueve regiones o Distritos de Defensa de Administración de Petróleo (PADD por sus siglas en inglés). Llevamos a cabo un analisis del componente principal, con el fin de encontrar un mínimo sub grupo de los principales componentes que capturan (o explican) la variación en los precios entre las regiones con una pérdida mínima de información.

Luego usaremos el promedio semanal del precio minorista en las autopistas ($/Gallon) para “No. 2 Ultra bajo sulfuro (0-15 ppm) de Diesel” en las nueve regiones o Distritos de Defensa de Administración de Petróleo en Estados Unidos (PADD por sus siglas en inglés). Los datos de la muestra empiezan en Febrero 5 de 2007 y terminan en Mayo 6 de 2013 (327 observaciones). Cada observación representa los precios promedio semanales en nueve regiones:

  1. Costa Este
  2. Nueva Inglaterra
  3. Atlántico Central (PADD 1B)
  4. Atlántico Bajo (PADD 1C)
  5. Midwest
  6. Costa del Golfo
  7. Rocky Mountain
  8. Costa Oeste
  9. California

Promedio de precio semanal de venta al por menor de suluro ultra liviano No.2 para las (9) regiones EIA PADD.

Los precios semanales a lo largo de las diferentes regiones están altamente correlacionados.

Tabla de Correlación para los precios foco semanales del sulfuro ultra liviano Diesel No.2 a lo largo de las nueve (9) regiones EIA PADD.

Gráfica de datos para el foco semanal de sulfuro ultra liviano diesel en nueve (9) regiones.

En este tutorial, investigaremos a los conductores detrás de la variación del precio entre las distintas regiones, e intentaremos suponer la representación física de esos componentes usando los precios de embarque de cada región.

Proceso

Ahora estamos listos para conducir nuestro principal componente de análsis. Primero, seleccione una celda desocupada en su hoja de cálculo donde quisiera que se genere el resultado, luego localice y haga click en el ícono del componente principal (PCA) en la etiqueta NumXL (o barra de herramientas).

Ícono de análisis del componenente principal en la barra de herramientas de NumXL toolbar o el llamado ¨ribbon¨ en Excel.

Aparece el asistente de análisis del componente principal.

Pestaña general del principal componente de análisis de diáologo o herramienta NumXL.

Seleccione el rango de celdas para los cinco valores variables de entrada.

Notas:

  1. Descarte las últimas tres observaciones de manera que nuestros datos de entrada terminen en Abril 15 de 2013. Los tres puntos restantes serán usados para comparar los valores de pronóstico más adelante.
  2. Deje el campo llamado ¨Máscara de variables” en blanco por ahora. Revisitaremos este campo en entradas posteriores.

Ahora, seleccione la pestaña de “Opciones”.

Pestaña de opciones del análisis de la herramienta NumXL del componente principal.

nicialmente, la pestaña está programada con los siguientes valores:

  • “Entradas Estándar” va marcada. Deje esta opción marcada.
  • “Principal Componente de salida” va marcada. Deje esta opción marcada.
  • El nivel de signifcado (aka. ) está programado al 5%.
  • Bajo el “componente principal” marque la opción “Valores” de manera que las tablas de salida generadas incluyan los valores del componente principal para diferentes fechas.
  • “Variables de entrada” no va marcada. Deje esta opción sin marcar.

Ahora haga click en la pestaña “Valores faltantes”

Pestaña de valores faltantes en la herramienta NumXL de análisis del componente principal.

En esta pestaña se puee seleccionar una aproximación para tratar con valores faltantes en el conjunto de datos (X). Por defecto, cualquier valor faltante encontrado en cualquier observación excluiría la obervación del análisis.

Este tratamiento es una buena aproximación para nuestro análisis así que no lo alteremos.

Ahora hagamos click en “OK” para generar las tablas de salida.

Tablas de resultados generadas por la herramienta NumXL de análsisi del componente principal.

Análisis

1. Estadísticas

Tabla de estadísticas del componente principal para 9 precios foco de sulfuro ultra liviano diesel No.2 en 9 regiones EIA PADD generada por la herramienta NumXL de componente principal.

En la tabla anterior hemos mostrado la varianza de cada componente proncipal y la proporción de la variable total de la varianza del conjunto de datos de salida (estandar) que la justifica. Examinando la tabla de manera más cercana, los primeros dos componentes caputran el 99.8% de la variación del conjunto de datos.

2. Cargas

En la tabla de cargas subrayamos los pesos del componente principal en cada variable de entrada:

Cargas de cada variable de entrada en el componente principal diferente.

Examinando las variables de salida (ej. Precio de la región) las cargas para el primer componente muestran una carga uniforme para todas las variables. Esto se puede interpretar como el factor-nivel (precio que es neutral a nivel local).

Para el segundo factor, la gráfica es un tanto diferente:

  • Para todas las regiones PADD en el este, la carga es negativa.
  • Para todas las regiones PADD en el este, la carga es negativa.
  • La carga de la Costa del Golfo es ligeramente negativa.
  • La carga del Medio Oeste es ligeramente positiva.

Esta carga de factores puede verse como próxima a (o disponible para) la capacidad de refinerías o puertos de improtación (ejemplo: el Puerto de Nueva York). El segundo factor refleja el costo del transporte y de y del impuesto de gasolina.

Las cargas de precios de diesel en el componente principal.

Nota:

Las cargas de las variables de entrada para el primer componente son muy comparables, de manera que, el segundo componente (factor) es lo que conduce el precio diferencial entre las distintas regiones PADD.

3. Valores del Componente Principal

Examinemos los valores de los primeros dos componentes principales.

Gráfica de datos del primer y segundo componente principal.

Las dos series de tiempo muestran algo de estacionalidad, sin embargo, es más evidente en el segundo factor. Además, el primer componente principal muestra un patrón cercano a los precios del crudo.

Gráfica para el primer componente principal y precios foco de WTI.

Nota:

La falta de un emparejamiento exacto puede ser atribuida a otros costos incurridos en la elaboración del Diesel Sulfuro Ultra liviano No. 2: mano de obra, precios de la energía, materia prima, etc. Además, las refinerías construyen un inventario de productos (ej. Diesel) en anticipación a los picos de demanda estacional, de manera que puede haver un retraso.

4. Añadiendo Precios de contado WTI

Como una última observación del precio de contado WTI, incluiremos el precio de contado WTI en nuestro conjunto de datos de entrada y re examinaremos las cargas de entrada. De manera intuitiva, sumar una variable de entrada para precio de materia prima (ej. Crudo) con los precios finales de los productos en el mismo conjunto de datos revelará otro impulsor: el costo de producción.

Tablas de resultados de análisis del componente principal de 10 variables (10): Precio foco de diesel en Nueve (9) regiones EIA PADD y precio foco de WTI.

Ahora, hemos necesitado tres impulsores para justificar el 99.8% de la variación del precio.

Tabla de resultados de resumen de estadísticas de componente principal para (10) variables: Nine (9)egiones EIA PADD y precio foco de WTI.

IMPORTANTE:

Los componentes principales del nuevo conjunto de datos no son necesariamente los mismos que los computados anteriormente con sólo los precios del diesel.

Echemos una mirada a las cargas de variables de entrada en cada componente principal (ej. Impulsor):

Tabla de resultados de carga del componente principal component para cada una de las diez (10) variables ( precio de diesel en las 9 regiones EIA PADD y precio foco de WTI) en los diferentes componentes principales.

Notas:

  1. Las cargas para el primer componente son similares a las calculadas anteriormente con sólo precios de Diesel. Nótese que las cargas WTI son levemente más bajas que sus contrapartes Diesel. De nuevo, designaremos este factor como el precio de nivel general (neutral de la región).
  2. TLas cargas para el segundo factor son muy diferentes ahora, y la carga para WTI es negativa (-%94.5) mientras que todo el resto son positivas. Podemos designar este factor como el costo del craqueo de Diesel en crudo.
  3. La carga para el factor 3 es muy similar a la carga para el segundo componente en los conjuntos de datos anteriores. De nuevo, la carga varía de acuerdo a la locación (este vs. Oeste). El WTI, la Costa del Golfo y el Medio Oeste son casi neutrales.

Grafiquemos ahora las series de tiempo del factor.

Gráfica de series de tiempo para el primer y tercer componente del nuevo conjunto de datos (10 variables: precios foco de 9 regiones EIA PADD regions y precio foco de WTI.

En términos generales, el primer y tercer componente so muy similares a los primeros dos componentes que hemos calculado anteriormente (sin WTI en el conjunto de datos).

Para el segundo componente, suponemos que este es el más cercano al costo del craqueo de Diesel.

Gráfica de series de tiempo para el segundo componente principal del nuevo conjunto de datos (10 variables: precios foco de 9 regiones EIA PADD regions y precio foco de WTI.

Conclusión

En este tutorial, hemos examinado una aplicacion no trivial para PCA. Hicimos el intentdo de explicar la variación del precio entre diferentes regiones PADD mediante el descubrimiento de fuerzas impulsoras detrás de los precios.

¿Qué sigue?

Hemos mencionado anterioremente qe las refinerías han desarrollado un inventario de productos (ej. Diesel) en anticipación de los picos de demanda estacional, de manera que puede haber un retraso. Como capturamos esta variable? Futuro: podemos incluir los precios futuros de Diesel y Crudo.

¿Por qué?

IDe manera intuitiva, los precios futuros reflejan la anticipación del mercado de (1) la demanda futura, (2) el costo de almacenaje futuro, y posiblemente una valiosa escacés de abastecimiento. Esta aplicación está hecha para darles una muestra de cómo aplicar PCA y series de tiempo; así como también para mostrarles cómo usar o interceptar las variables de carga derivando un agente práctico para ellas.

En suma, PCA es un procedimiento matemático que NumXL puede ayudarles a ejecutar. Dándole sentido e interpretando los resultados es donde su experiencia e intuición son indispensables.

  Archivos adjuntos

Comentarios

Inicie sesión para dejar un comentario.

¿Fue útil este artículo?
Usuarios a los que les pareció útil: 0 de 0