En el módulo 1, examinamos las series temporales de precios de cierre diario de MSFT para explorar problemas comunes asociados con datos de series de tiempo real: estacionalidad, homogeneidad, valores atípicos, valores faltantes y concentración de valores. Concluimos el módulo con una transformación de los datos de entrada usando la transformación logarítmica.
En este módulo, realizaremos algunos cálculos para resumir la distribución estadística de la muestra en un intento de entender la distribución desconocida de la población.
NumXL viene con una gran cantidad de funciones para calcular diversas funciones de estadística de resumen, incluyendo funciones robustas como Quantile, IQR, etc. Además, NumXL incluye una amplia gama de pruebas estadísticas para verificar la importancia de las estadísticas de resumen computadas.
Ilustración
Para nuestros propósitos aquí, utilizaremos la barra de herramientas NumXL y los asistentes de estadísticas de resumen.
A continuación, aparecerá el cuadro de diálogo Descriptive Statistics. Rellene los campos con su ubicación de datos (log-transformada), orden de series de tiempo, opciones y ubicación para que los resultados aparezcan en su hoja de cálculo.
El cuadro de diálogo Descriptive Statistics (Estadísticas descriptivas) imprimirá las estadísticas y pruebas seleccionadas (junto con las fórmulas) en su hoja de cálculo.
En resumen, se puede concluir que la distribución subyacente tiene las siguientes propiedades:
- La media es significativamente diferente de cero
- La distribución de densidad (masa) es significativamente sesgada
- La distribución de densidad tiene colas anchas
- La mitad de los valores de observación oscila entre 3.09 y 3.32
Aunque la mediana es menor que el promedio, la distribución es positivamente asimétrica, lo que nos lleva a creer que la distribución tiene colas anchas derechas.
Los cuartiles (Q1, Q3) anotan el 50% de los valores de la muestra. El rango intercuartil (IQR) puede ser utilizado para caracterizar los datos cuando puede haber extremidades que sesgan los datos; El intervalo entre cuartiles es una estadística relativamente robusta (también a veces llamada "resistente") en comparación con el rango y la desviación estándar.
Volveremos a revisar las pruebas estadísticas de ruido blanco, normalidad y efecto arco en el módulo 5, pero por ahora podemos ignorar la tabla más a la derecha.
Recuerde el histograma log-precio MSFT en el módulo 1 (ver abajo):
Video Tutorial
Archivos de soporte
Comentarios
Inicie sesión para dejar un comentario.