La función de verosimilitud (también conocido como la probabilidad/LLF) es una función de los parámetros de un modelo estadístico. En otras palabras, la probabilidad de los parámetros del modelo dado algún resultado observado (es decir, la muestra) es igual a la probabilidad de que esos resultados dado el modelo y sus valores de modelo y los valores de sus parámetros.
En el lenguaje no técnico, "verosimilitud" es generalmente sinónimo de "probabilidad" pero en el uso estadístico, se hace una clara distinción técnica.
Para muchas aplicaciones que implican funciones de verosimilitud, es más conveniente trabajar en términos del logaritmo natural de la función de verosimilitud, llamado log-verosimilitud, que en términos de la propia función de verosimilitud. Debido a que el logaritmo es una función monótona creciente, el logaritmo de una función alcanza su valor máximo en los mismos puntos que la propia función, y por lo tanto la log-verosimilitud se puede utilizar en lugar de la probabilidad en la estimación de máxima probabilidad y técnicas relacionadas.
Por definición, la función de probabilidad para un modelo estadístico se describe como:
$$ L^* = \prod_{n = 1}^N {f\left( {y_n \left| {y_{n-1},y_{n-2},...,y_1 ,\theta_1, \theta_2,...,\theta_k } \right.} \right)} $$
- O -
$$ \ln L^* = \sum_{n = 1}^N {\ln f\left( {y_n \left| {y_{n-1},y_{n-2},...,y_1 ,\theta_1, \theta_2,...,\theta_k } \right.} \right)} $$
Donde:
- $L^*$ es la función de verosimilitud.
- $\ln L^*$ es la función de log-verosimilitud.
- $f\left( \right)$ es la función de densidad de probabilidad condicional.
- $\ln f\left( \right)$ es el logaritmo natural de la función de densidad de probabilidad condicional.
- $y_n$ es el valor de la serie de tiempo en el tiempo n.
- $y_{n-1},y_{n-2},...,y_1$ son los valores pasados de la serie de tiempo en el tiempo n.
- $\theta_1, \theta_2,...,\theta_k$ son los parámetros del modelo estadístico.
Notas
- En el caso de la función normal o Guassiana de densidad de probabilidad, la función de log-verosimilitud puede ser simplificada de la siguiente manera:
$$\ln L^* = \ln L(\mu \,, \sigma \mid Y_1\,,Y_2...Y_N) = -\frac{N}{2}\ln(2\times \pi)- N\times \ln\sigma - \sum_{i=1}^{N}\frac{(Y_i-\mu)^2}{2\times\sigma^2}$$
- $\mu$ es la media de la distribución normal
- $\sigma$ es la desviación estándar de una distribución subyacente
- $N$ es el número de los valores observados en la muestra
Enlaces Relacionados
Referencias
- D. S.G. Pollock; Handbook of Time Series Analysis, Signal Processing, and Dynamics; Academic Press; Har/Cdr edition(Nov 17, 1999), ISBN: 125609906
- James Douglas Hamilton; Time Series Analysis; Princeton University Press; 1st edition(Jan 11, 1994), ISBN: 691042896
- Tsay, Ruey S.; Analysis of Financial Time Series; John Wiley & SONS; 2nd edition(Aug 30, 2005), ISBN: 0-471-690740
- Box, Jenkins and Reisel; Time Series Analysis: Forecasting and Control; John Wiley & SONS.; 4th edition(Jun 30, 2008), ISBN: 470272848
- Walter Enders; Applied Econometric Time Series; Wiley; 4th edition(Nov 03, 2014), ISBN: 1118808568
Comentarios
El artículo está cerrado para comentarios.