Ésta es la cuarta entrada en el análisis de regresión y las series de modelado. En este tutorial, continuaremos con el análisis de la discusión que empezamos anteriormente, y haremos uso de una técnica avanzada –prueba de regresión de estabilidad- para que nos ayude a detectar la deficiencia en el modelo seleccionado y, como resultado, la confiabilidad del pronóstico.
De nuevo, usaremos una muestra de datos tomada de 20 personas de ventas distintas. El modelo de regresión intenta explicar y predecir las ventas semanales de cada persona de ventas (variable dependiente) usando dos variables explicativas: Inteligencia (IQ) y extroversión.
Preparación de Datos
Al igual que hicimos en un tutorial anterior, hemos organizado nuestra muestra de datos poniendo el valor de cada variable en una columna separada y cada observación en una fila separada.
En este ejemplo, tenemos 20 observaciones y dos variables (explicativas) independientes. La respuesta o variable dependiente son las ventas semanales.
Luego, introducimos la función ¨mask¨ que es una matriz Booleana (0 o 1) que escoge cuál variable es incluida (o excluida) del análisis.
Usemos los resultados de la tercera entrada en esta serie de tutoriales, y programemos la entrada de ¨máscara¨o ¨mask¨ para inteligencia como cero y la extroversión como 1.
Además, excluyamos la observación #16, pues demostró influir en el modelo de regresión.
Proceso
Para examinar la estabilidad del modelo de regresión, necesitamos dividir el conjunto de datos en dos conjuntos de datos que no se superpongan: Conjunto de datos 1 y conjunto de datos 2.
La prueba de estabilidad de la regresión forma tres modelos de regresión diferentes
- Modelo 1: Usando las observaciones en el conjunto de datos 1: $$ Y = \alpha_1 + \beta_{1,1}X_{1,i}+\beta_{1,2}X_{2,i} +\cdots + \beta_{1,p}X_{p,i}$$
- Modelo 2: Usando las observaciones en el conjunto de datos 2: $$ Y = \alpha_2 + \beta_{2,1}X_{1,i}+\beta_{2,2}X_{2,i} +\cdots + \beta_{2,p}X_{p,i}$$
- Modelo 3: Usando las observaciones en el conjunto de datos 1 y 2: $$ Y = \alpha_3 + \beta_{3,1}X_{1,i}+\beta_{3,2}X_{2,i} +\cdots + \beta_{3,p}X_{p,i}$$
Pregúntese lo siguiente: $$H_o=\left\{\begin{matrix} \alpha_1 =\alpha_2 = \alpha & \\ \beta_{1,j}=\beta_{2,j}=\beta_j & \end{matrix}\right.$$ $$H_1=\left\{\begin{matrix} \exists \alpha_i \neq \alpha ∓ \\ \beta_{i,j} \neq \beta_j & \end{matrix}\right. $$ $$1 \leq i \leq 2$$ $$1 \leq j \leq p$$
¿En una palabra sencilla, puede alguno de los coeficientes de regresión valorados en cualquier conjunto de datos ser significativamente diferente del otro conjunto de datos o del conjunto de datos combinado?
Para propósitos demostrativos, escogeremos las primeras 10 observaciones como conjunto de datos 1, y las restantes como conjunto de datos 2 (11 a 20). Dibuje una línea para subrayar la separación.
Ahora, estamos listos para conducir nuestro análisis de estabilidad de regresión.
- Seleccionemos una celda vacía en nuestra hoja de cálculo donde usted quiere que la prueba se genere.
- Ubique y haga click en el ícono de prueba estadística, y seleccione la estabilidad de la regresión y haga click en el ícono de regresión en el tabulador NumXL (or barra de herramientas).
- La prueba del asistente de instalación de regresión de estabilidad aparecerá en pantalla. Seleccione las celdas de rango de ingreso para el conjunto de datos 1 y el conjunto de datos 2. Especifique la máscara de ingreso.
- En las pestañas “opciones” y “valores faltantes”, acepte los valores predeterminados.
- Haga click en OK.
- Se generará la tabla Chow Test o Prueba de Chow.
La Prueba de Chow acepta (o no rechaza) la hipótesis nula que es que los valores de los coeficientes son estadísticamente indiferentes en todos los conjuntos de datos.
Conclusión
En este tutorial, respondimos la pregunta sobre la estabilidad de la regresión en la muestra de datos de ingreso.
Basados en nuestros hallazgos, el modelo puede usarse para emitir pronóstico usando una variable explicativa (ej. extroversion).
Finalmente, podemos preguntarnos si aun podemos mejorar (ej. Reducir el error de regresión) al combinar las dos variables explicativas (inteligencia y extroversión)?
Respuesta: De pronto, pero este es un tema para una serie diferente – principal componente de regresión (PCR, por sus siglas en inglés).
Comentarios
El artículo está cerrado para comentarios.