Análisis de regresión 202 - Prueba de estabilidad

Mohamad

7 de noviembre de 2016 20:11

Ésta es la cuarta entrada en el análisis de regresión y las series de modelado. En este tutorial, continuaremos con el análisis de la discusión que empezamos anteriormente, y haremos uso de una técnica avanzada –prueba de regresión de estabilidad- para que nos ayude a detectar la deficiencia en el modelo seleccionado y, como resultado, la confiabilidad del pronóstico.

De nuevo, usaremos una muestra de datos tomada de 20 personas de ventas distintas. El modelo de regresión intenta explicar y predecir las ventas semanales de cada persona de ventas (variable dependiente) usando dos variables explicativas: Inteligencia (IQ) y extroversión.

Preparación de Datos

Al igual que hicimos en un tutorial anterior, hemos organizado nuestra muestra de datos poniendo el valor de cada variable en una columna separada y cada observación en una fila separada.

En este ejemplo, tenemos 20 observaciones y dos variables (explicativas) independientes. La respuesta o variable dependiente son las ventas semanales.

Luego, introducimos la función ¨mask¨ que es una matriz Booleana (0 o 1) que escoge cuál variable es incluida (o excluida) del análisis.

Usemos los resultados de la tercera entrada en esta serie de tutoriales, y programemos la entrada de ¨máscara¨o ¨mask¨ para inteligencia como cero y la extroversión como 1.

This figure shows the input data set table.

Además, excluyamos la observación #16, pues demostró influir en el modelo de regresión.

Removing influential data-points by placing #N/A value in one of the variables fields.

Proceso

Para examinar la estabilidad del modelo de regresión, necesitamos dividir el conjunto de datos en dos conjuntos de datos que no se superpongan: Conjunto de datos 1 y conjunto de datos 2.

La prueba de estabilidad de la regresión forma tres modelos de regresión diferentes

Modelo 1: Usando las observaciones en el conjunto de datos 1: $$ Y = \alpha_1 + \beta_{1,1}X_{1,i}+\beta_{1,2}X_{2,i} +\cdots + \beta_{1,p}X_{p,i}$$
Modelo 2: Usando las observaciones en el conjunto de datos 2: $$ Y = \alpha_2 + \beta_{2,1}X_{1,i}+\beta_{2,2}X_{2,i} +\cdots + \beta_{2,p}X_{p,i}$$
Modelo 3: Usando las observaciones en el conjunto de datos 1 y 2: $$ Y = \alpha_3 + \beta_{3,1}X_{1,i}+\beta_{3,2}X_{2,i} +\cdots + \beta_{3,p}X_{p,i}$$

Pregúntese lo siguiente: $$H_o=\left\{\begin{matrix} \alpha_1 =\alpha_2 = \alpha & \\ \beta_{1,j}=\beta_{2,j}=\beta_j & \end{matrix}\right.$$ $$H_1=\left\{\begin{matrix} \exists \alpha_i \neq \alpha ∓ \\ \beta_{i,j} \neq \beta_j & \end{matrix}\right. $$ $$1 \leq i \leq 2$$ $$1 \leq j \leq p$$

¿En una palabra sencilla, puede alguno de los coeficientes de regresión valorados en cualquier conjunto de datos ser significativamente diferente del otro conjunto de datos o del conjunto de datos combinado?

Para propósitos demostrativos, escogeremos las primeras 10 observaciones como conjunto de datos 1, y las restantes como conjunto de datos 2 (11 a 20). Dibuje una línea para subrayar la separación.

Ahora, estamos listos para conducir nuestro análisis de estabilidad de regresión.

Seleccionemos una celda vacía en nuestra hoja de cálculo donde usted quiere que la prueba se genere.
Ubique y haga click en el ícono de prueba estadística, y seleccione la estabilidad de la regresión y haga click en el ícono de regresión en el tabulador NumXL (or barra de herramientas).
La prueba del asistente de instalación de regresión de estabilidad aparecerá en pantalla. Seleccione las celdas de rango de ingreso para el conjunto de datos 1 y el conjunto de datos 2. Especifique la máscara de ingreso.
En las pestañas “opciones” y “valores faltantes”, acepte los valores predeterminados.
Haga click en OK.
Se generará la tabla Chow Test o Prueba de Chow.

La Prueba de Chow acepta (o no rechaza) la hipótesis nula que es que los valores de los coeficientes son estadísticamente indiferentes en todos los conjuntos de datos.

Conclusión

En este tutorial, respondimos la pregunta sobre la estabilidad de la regresión en la muestra de datos de ingreso.

Basados en nuestros hallazgos, el modelo puede usarse para emitir pronóstico usando una variable explicativa (ej. extroversion).

Regression forecast with confident intervals.

Finalmente, podemos preguntarnos si aun podemos mejorar (ej. Reducir el error de regresión) al combinar las dos variables explicativas (inteligencia y extroversión)?

Respuesta: De pronto, pero este es un tema para una serie diferente – principal componente de regresión (PCR, por sus siglas en inglés).

Tutorial Video

Archivos adjuntos

Regression-analysis-202.xlsx (20 kB)
Regression-analysis-202.pdf (300 kB)