Devuelve el valor p de la prueba de multi-colinealidad (Ej. si una variable puede ser predecida linealmente de otras con un grado no trivial o exactitud).
Sintaxis
CollinearityTest(X, Mask, Method, Column Index)
- X
- es la matriz de variables de datos independientes, asi como cada columna represneta una variable.
- Mask
- es la matriz booleana para seleccionar un subconjunto de variables de en trada en X. Si falta, se incluyen todas las variables en X.
- Method
- es la estadística para computar (1 = Número de condición (defecto), 2 = VIF, 3 = Determinante, 4 = Eigenvalues -Valores propios).
Método Descripción 1 Número de condición (Kappa). 2 Factor de Inflación de la varianza (VIF). - Column Index
- para designar la variable explicativa a examinar (no requerido para un número de condición).
Observaciones
- Los datos de la muestra pueden incluir valores perdidos.
- Cada columna en la matriz de entrada corresponde a una variable separada.
- Cada fila en la matriz de entrada corresponde a una observación.
- Observaciones (Ej. fila) con valores perdidos son eliminados.
- En el método del factor de inflación de la varianza (VIF), una serie de modelos regresionales son construidos, donde una variable es la variable dependiente contra los predictores sobrantes.
- $$\textrm{Tolerance}_i = 1-R_i^2$$ $$\textrm{VIF}_i =\frac{1}{\textrm{Tolearance}_i} = \frac{1}{1-R_i^2}$$ Donde:
- $R_i^2$ es el coeficiente de determinación de un aregresión explicativa $i$ sobre todas las otras explicativas.
- Una tolerancia menos de 0.20 o 0.10 y/o un VIF de 5 o 10 y mayores indican problemas de multicolinealidad.
- El número de condición ($\kappa$) test es una medida estándar de mala condición en una matriz; esto indicará que la inversión de la matriz es numericamente inestable con números de precisión definida (computa de forma estándar los flotantes y dobles).
- $$ X = \begin{bmatrix} 1 & X_{11} & \cdots & X_{k1} \\ \vdots & \vdots & & \vdots \\ 1 & X_{1N} & \cdots & X_{kN} \end{bmatrix} $$ $$\kappa = \sqrt{\frac{\lambda_{max}}{\lambda_{min}}}$$ Donde:
- $\lambda_{max}$ es el maximo valor propio (eigenvalue).
- $\lambda_{min}$ es el minimo valor propio (eigenvalue).
- Es una regla de oro, un número de condición ($\kappa$) mayor o igual a 30 indica un severo problema de multi-colinealidad.
- La función prueba de colinealidad esta disponible comenzando desde la versión Th 1.60 APACHE.
Ejemplos de archivos
Enlaces Relacionados
- Wikipedia - Multicolinealidad.
- Wikipedia - Variance inflation factor.
- Wikipedia - Condition number.
- Wikipedia - Regresión lineal.
Referencias
- Farrar Donald E. and Glauber, Robert R (1967). "Multicollinearity in Regression Analysis: The Problem Revisited". The Review of Economics and Statistics 49(1):92-107.
Comentarios
El artículo está cerrado para comentarios.