PCR_STEPWISE - Principales componentes Stepwise Regresión

Devuelve una lista de variables seleccionadas despues de ejecutar la regresión paso a paso.

 

Sintaxis

PCR_STEPWISE(X, Mask, Y, Intercept, Method, Alpha)

X es la matriz de datos de variables independientes, de manera que cada columna representa una variable.

Mask es la matriz booleana para escoger variables explicativas en el modelo. Si falta, todas las variables en X son incluidas.

Y es la respuesta o array de datos de variables dependientes (un array unidimensional de celdas (Ej. filas o columnas)).

Intercept es la constante o el valor del intercepto para corregir (Ej.cero). Si falta, un intercepto no será corregido y sera calculado normalmente.

Method es un switch para seleccionar el enfoque de inclusión y exclusión de variables (1 = selección hacia adelante (defecto), 2 = eliminación hacia atras , 3 = eliminación bi-direccional)

Método Descripción
1 Selección hacia adelante
2 Eliminación hacia atras
3 Eliminación bi-direccional

Alpha es la significancia estadística de la prueba de inclusión y exclusión (Ej. alpha). se toma un valor alpha de 5%.

 

Observaciones

  1. El modelo subyacente se describe aquí.
  2. La regresión paso a paso o stepwise, incluye modelos de regresión en la que la elección de variables predictoras se lleva a cabo mediante un procedimiento automático.El procedimiento toma la forma de una secuencia de pruebas- f en la selección o eliminación de variables explicativas.
  3. Los tres enfoques principales son:
    • Selección hacia adelante, la cual envuelve un comienzo sin variables en el modelo, probando la suma de cada variable usando un criterio de comparacion del momdelo escogido, adicionando la variable (si la hay) que mejore el modelo de la mejor mmanera, y repitiendo este proceso que no haya mejora posible.
    • Eliminación hacia atrás , la cual envuelve un comienzo con todas las variables candidatas, probando la elilminación de cada variable usando un modelo con criterio de comparacion escogido, eliminando la variable ( si la hay) que mejore el modelo, de la mejor manera siendo eliminadas, y repitiendo este proceso hasta que no haya mejora posible.
    • Eliminación Bi-direccional , una combinación de las pruebas anteriores, invlolucra la prueba de cada passo para variables que van a ser incluidas o excluidas.
  4. Los valores iniciales en mask array definen el conjunto de variables the variables con las que funciona MLR_STEPWISE. En otras palabras, las variables las cuales no han sido selccionadas no seran consideradas durante la regresión.
  5. Los datos de la muestra pueden incluir valores faltantes.
  6. Cada columna en la matriz corresponde a una variable independiente.
  7. Cada fila en la matriz de entrada corresponde a una observación.
  8. Observaciones (Ej.filas) con valores faltantes en X o Y son eliminados.
  9. El número de filas de la variable de repsuesta (Y) debe ser igual al número de filas de las variables explicativas (X).
  10. La función PCR_STEPWISE está disponible comenzando con la versión 1.60 APACHE.

Ejemplos de archivos

Referencias

  • Hamilton, J .D.; Time Series Analysis , Princeton University Press (1994), ISBN 0-691-04289-6
  • Kenney, J. F. and Keeping, E. S. (1962) "Linear Regression and Correlation." Ch. 15 in Mathematics of Statistics, Pt. 1, 3rd ed. Princeton, NJ: Van Nostrand, pp. 252-285
¿Tiene más preguntas? Enviar una solicitud

0 Comentarios