MLR_STEPWISE - Regresion paso a paso

Devuelve una lista de variables seleccionadas después de ejecutar la regresión por eatapas.

 

Sintaxis

MLR_STEPWISE(X, Mask, Y, Intercept, Method, Alpha)

X es la matriz de datos de variables independientes (exsplicativas), de manera que cada columna representa una variable.

Mask es la matriz booleana para escoger las variables explicativas en el modelo. Si falta, todas las variables en X son incluidas.

Y es la respuesta o matriz de datos variable dependiente (una matriz unidimensional de celdas (Ej. filas o columnas.))

Intercept es la constante o el valor del intercepto para ajustar(Ej. cero). Si falta, un intercepto no se ajustara y es calculado normalmente.

Method es un switch para seleccionar para seleccionar el enfoque de inclusión y exclusión de la variable (1 = Selección hacia adelante (defecto ), 2 = Eliminación hacia atrás , 3 = Eliminación bidireccional)

Método Descripción
1 Selección hacia adelante
1 Eliminación hacia atrás
3 Eliminación bidireccional

Alpha es la significancia estadística de la prueba de inclusión/exclusión (Ej. alpha). Si falta o es omitida, un valor alpha de 5% es asumido.

 

Observaciones

  1. El modelo subyacente se describe aquí.
  2. La regresion por etapas incluye modelos de regresión en los cuales la elección de variables predictivas se lleva a cabo por un procedimiento automático.El procedimiento toma la forma de una secuencia de pruebas F en la selección o la eliminación de variables explicativas.
  3. Los tres enfoques principales son:
    • Selección hacia adelante lo que implica que no empiece por variables en el modelo , poniendo a prueba la adición de cada variable utilizando un criterio de comparación del modelo elegido , añadiendo la variable (si la hay) que mejora el modelo de la mayoría, y repitiendo este proceso hasta que no haya variables adicionales que mejoren el modelo.
    • Eliminación hacia atrás que consiste en comenzar con todas las variables candidatas , probando la eliminación de cada variable usando un criterio de comparación del modelo elegido, elimina la variable (si la hay) que mejora el modelo de la mayor cantidad siendo eliminadas, y repetiendo este proceso hasta que ya no es posible una mejora.
    • Eliminación bidireccional una combinación de las pruebas anteriores, implica pruebas en cada paso para las variables que deben incluirse o excluirse.
  4. Uno de los principales problemas conla regresión por etapas, es que esta busca un gran espacio de modelos posibles.Por lo tanto es propenso a sobreajuste de los datos.
  5. Los valores iniciales en los mask arrays definen las variables establecidas que funcionan con MLR_STEPWISE. En otras palabras, no se tendrán en cuenta las variables que no se seleccionan durante la regresión.
  6. Los datos de la muestra pueden incluir valores faltantes.
  7. Cada columna en la matriz de entrada corresponde a una variables separada.
  8. Cada fila en la matriz de entrada corresponde a una observación.
  9. Observaciones (Es decir, filas) con valores valtantes en X o Y son elimindos.
  10. El número de filas de la variable de respuesta (Y) debe ser igual al número de filas de las variables explicatorias (X).
  11. La función MLR_STEPWISE esta disponible empezando con la versión 1.60 APACHE.

Ejemplos de archivos

Referencias

  • Hamilton, J .D.; Time Series Analysis , Princeton University Press (1994), ISBN 0-691-04289-6
  • Kenney, J. F. and Keeping, E. S. (1962) "Linear Regression and Correlation." Ch. 15 in Mathematics of Statistics, Pt. 1, 3rd ed. Princeton, NJ: Van Nostrand, pp. 252-285
¿Tiene más preguntas? Enviar una solicitud

0 Comentarios