Módulo 2: Estadísticas Descriptiva

En el módulo 1, examinamos las series temporales de precios de cierre diario de MSFT para explorar problemas comunes asociados con datos de series de tiempo real: estacionalidad, homogeneidad, valores atípicos, valores faltantes y concentración de valores. Concluimos el módulo con una transformación de los datos de entrada usando la transformación logarítmica.

En este módulo, realizaremos algunos cálculos para resumir la distribución estadística de la muestra en un intento de entender la distribución desconocida de la población.

NumXL viene con una gran cantidad de funciones para calcular diversas funciones de estadística de resumen, incluyendo funciones robustas como Quantile, IQR, etc. Además, NumXL incluye una amplia gama de pruebas estadísticas para verificar la importancia de las estadísticas de resumen computadas.

Ilustración

Para nuestros propósitos aquí, utilizaremos la barra de herramientas NumXL y los asistentes de estadísticas de resumen.

Invoking the summary statistics wizard in NumXL 1.63 Toolbar.

A continuación, aparecerá el cuadro de diálogo Descriptive Statistics. Rellene los campos con su ubicación de datos (log-transformada), orden de series de tiempo, opciones y ubicación para que los resultados aparezcan en su hoja de cálculo.

Descriptive Statistics Dialog or Wizard. Select the cells range for your input data, and select the different stats available (on the LHS in the red square), then click OK.

El cuadro de diálogo Descriptive Statistics (Estadísticas descriptivas) imprimirá las estadísticas y pruebas seleccionadas (junto con las fórmulas) en su hoja de cálculo.

Output table generated by descriptive statistics wizard using the daily log-price for Microsoft stock between Jan, 2000 and Jan 2009.

En resumen, se puede concluir que la distribución subyacente tiene las siguientes propiedades:

  • La media es significativamente diferente de cero
  • La distribución de densidad (masa) es significativamente sesgada
  • La distribución de densidad tiene colas anchas
  • La mitad de los valores de observación oscila entre 3.09 y 3.32

 

Aunque la mediana es menor que el promedio, la distribución es positivamente asimétrica, lo que nos lleva a creer que la distribución tiene colas anchas derechas.

Los cuartiles (Q1, Q3) anotan el 50% de los valores de la muestra. El rango intercuartil (IQR) puede ser utilizado para caracterizar los datos cuando puede haber extremidades que sesgan los datos; El intervalo entre cuartiles es una estadística relativamente robusta (también a veces llamada "resistente") en comparación con el rango y la desviación estándar.

 

Volveremos a revisar las pruebas estadísticas de ruido blanco, normalidad y efecto arco en el módulo 5, pero por ahora podemos ignorar la tabla más a la derecha.

Recuerde el histograma log-precio MSFT en el módulo 1 (ver abajo):

A histogram plot showing the relative frequency for different values in MSFT log-price time.

Video Tutorial

Archivos de soporte

Comentarios

Inicie sesión para dejar un comentario.

¿Fue útil este artículo?
Usuarios a los que les pareció útil: 0 de 0