Devuelve una lista de variables seleccionadas después de ejecutar la regresión por eatapas.
Sintaxis
MLR_STEPWISE (X, Mask, Y, Intercept, Method, Alpha)
- X
- es la matriz de datos de variables independientes (exsplicativas), de manera que cada columna representa una variable.
- Mask
- es la matriz booleana para escoger las variables explicativas en el modelo. Si falta, todas las variables en X son incluidas.
- Y
- la respuesta o matriz de datos variable dependiente (una matriz unidimensional de celdas (Ej. filas o columnas)).
- Intercept
- es la constante o el valor del intercepto para ajustar(Ej. cero). Si falta, un intercepto no se ajustara y es calculado normalmente.
- Method
- es un switch para seleccionar para seleccionar el enfoque de inclusión y exclusión de la variable (1 = Selección hacia adelante (defecto ), 2 = Eliminación hacia atrás , 3 = Eliminación bidireccional).
Valor Method 1 Selección hacia adelante (por defecto). 2 Eliminación hacia atrás. 3 Eliminación bidireccional. - Alpha
- es la significancia estadística de la prueba de inclusión/exclusión (Ej. alpha). Si falta o es omitida, un valor alpha de 5% es asumido.
Observaciones
- El modelo subyacente se describe aquí.
- La regresion por etapas incluye modelos de regresión en los cuales la elección de variables predictivas se lleva a cabo por un procedimiento automático.El procedimiento toma la forma de una secuencia de pruebas F en la selección o la eliminación de variables explicativas.
- Los tres enfoques principales son:
- Selección hacia adelante lo que implica que no empiece por variables en el modelo , poniendo a prueba la adición de cada variable utilizando un criterio de comparación del modelo elegido , añadiendo la variable (si la hay) que mejora el modelo de la mayoría, y repitiendo este proceso hasta que no haya variables adicionales que mejoren el modelo.
- Eliminación hacia atrás que consiste en comenzar con todas las variables candidatas , probando la eliminación de cada variable usando un criterio de comparación del modelo elegido, elimina la variable (si la hay) que mejora el modelo de la mayor cantidad siendo eliminadas, y repetiendo este proceso hasta que ya no es posible una mejora.
- Eliminación bidireccional una combinación de las pruebas anteriores, implica pruebas en cada paso para las variables que deben incluirse o excluirse.
- Uno de los principales problemas conla regresión por etapas, es que esta busca un gran espacio de modelos posibles.Por lo tanto es propenso a sobreajuste de los datos.
- Los valores iniciales en los mask arrays definen las variables establecidas que funcionan con MLR_STEPWISE. En otras palabras, no se tendrán en cuenta las variables que no se seleccionan durante la regresión.
- Los datos de la muestra pueden incluir valores faltantes.
- Cada columna en la matriz de entrada corresponde a una variables separada.
- Cada fila en la matriz de entrada corresponde a una observación.
- Observaciones (Es decir, filas) con valores valtantes en X o Y son elimindos.
- El número de filas de la variable de respuesta (Y) debe ser igual al número de filas de las variables explicatorias (X).
- La función MLR_STEPWISE esta disponible empezando con la versión 1.60 APACHE.
Ejemplos de archivos
Enlaces Relacionados
- Wikipedia - Regresión lineal.
- Wikipedia - Análisis de la regresión.
- Wikipedia - Mínimos cuadrados ordinarios.
Referencias
- Hamilton, J.D.; Time Series Analysis, Princeton University Press (1994), ISBN 0-691-04289-6.
- Kenney, J. F. and Keeping, E. S. (1962) "Linear Regression and Correlation." Ch. 15 in Mathematics of Statistics, Pt. 1, 3rd ed. Princeton, NJ: Van Nostrand, pp. 252-285.
Comentarios
El artículo está cerrado para comentarios.