SLR_GOF - Regresión Bondad de ajuste OLS

Mohamad

20 de octubre de 2016 19:40

Calcula una medida para la bondad de ajuste (Ej. R^2).

Sintaxis

SLR_GOF(X, Y, Intercept, Return_type)

X

es un array de datos de variables independientes (conocida como explicativa o predictiva) variable data array (un array unidimensional de celdas (Ej. filas o columnas)).

Y

es la respuesta o el array de datos de la variable dependiente (un array unindimensional de celdas (Ej. filas o columnas)).

Intercept

es la constate o valor del intercepto para corregir (Ej. cero). Si falta, el intercepto no sera corregido y es calculado normalmente.

Return_type

es un switch para seleccionar la salida de resultados (1 = R-cuadrático (defecto), 2 = R-cuadrático Ajustado, 3 = RMSE, 4 = LLF, 5 = AIC, 6 = SIC/BIC).

Método	Descripción
1	R-cuadrático
2	R-cuadrático Ajustado
3	Error de regresión
4	log-verosimilitud(LLF)
5	Criterio de Información Akaike (AIC)
6	Criterio de Información Schwartz/Bayesiano (SBIC)

Observaciones

El modelo subyacente se describe aquí.
El coeficiente de determinación, denotado $R^2$, provee una medida de lo bien que los resultados observados son replicados por el modelo.

$$R^2 = \frac{\mathrm{SSR}} {\mathrm{SST}} = 1 - \frac{\mathrm{SSE}} {\mathrm{SST}}$$
El R-cuadratico ajustado (denotado $\bar R^2$) es un intento para tomar en cuenta del fenómeno del $R^2$ automáticamente y falsamente aumenta cuando se agregan variables explicativas adicionales al modelo. Los $\bar R^2$ ajustes para el número de términos explicativos en un modelo relativo al número de punto de datos.
$$\bar R^2 = {1-(1-R^{2}){N-1 \over N-2}} = {R^{2}-(1-R^{2}){1 \over N-2}} = 1 - \frac{\mathrm{SSE}/(N-2)}{\mathrm{SST}/(N-1)}$$
Where:
- $p$ es el número de variables explicativas en el modelo.
- $N$ es el número de observaciones en la muestra.
El error de regresión es definido como la raiz cuadrada para el error de la media cuadrtica (RMSE):
$$\mathrm{RMSE} = \sqrt{\frac{SSE}{N-2}}$$
El logaritmo de verosimilitid de la regresión es dado de la siguiente manera:
$$\mathrm{LLF}=-\frac{N}{2}\left(1+\ln(2\pi)+\ln\left(\frac{\mathrm{SSR}}{N} \right ) \right )$$
El criterio de información Akaike y Schwarz/Bayesiano son dados como:
$$\mathrm{AIC}=-\frac{2\mathrm{LLF}}{N}+\frac{4}{N}$$
$$\mathrm{BIC} = \mathrm{SIC}=-\frac{2\mathrm{LLF}}{N}+\frac{(2)\times\ln(2)}{N}$$
Los datos de la muestra pueden incluir valores faltantes.
Cada columna en la matriz corresponde a una variable independiente.
Cada fila en la matriz de dato corresponde a una observación.
Observaciones (Ej. filas) con valores faltantes en X o Y son elimindadas.
El número de filas de la variable de respuesta (Y) debe ser igual al número de filas de la variable explicativa (X)
La función SLR_GOF esta disponible comenzando con la versión 1.60 APACHE.

Ejemplos de archivos

Enlaces Relacionados

Wikipedia - Linear regression Wikipedia - Análisis de la regresión Wikipedia - Mínimos cuadrados ordinarios

Referencias

Hamilton, J .D.; Time Series Analysis , Princeton University Press (1994), ISBN 0-691-04289-6
Kenney, J. F. and Keeping, E. S. (1962) "Linear Regression and Correlation." Ch. 15 in Mathematics of Statistics, Pt. 1, 3rd ed. Princeton, NJ: Van Nostrand, pp. 252-285

Sintaxis

Observaciones

Ejemplos de archivos

Enlaces Relacionados

Referencias

Artículos relacionados

Comentarios