KDE - Estimación de Densidad de Kernel

Calcula la estimación de la densidad del kernel (PDE)de los datos de la muestra.

 

Sintaxis

KDE(X, target, h, kernel)

X son las series de datos de entrada (array de una o dos dimensiones de celdads (Por ejemplo: filas o columnas)).

target es el valor objetivo para calcular la función básica acumulativa de distribución (CDF)

h es el parámetro de suavizado (ancho de banda) del estimador de densidad de kernel. Si falta, la función KDE calcula un valor óptimo.

kernel es un switch para seleccionar la función kernel (1= Gaussianna (defecto), 2=Uniforme, 3=Triangular, 4=Biweight(Cuadrático), 5=Triweight, 6=Epanechnikov).

Orden Descripción
1 Función Kernel Gaussianna (defecto)
2 Kernel Uniforme
3 Kernel Triangular
4 Kernel Biweight o Cuadrático
5 Kernel Triweight
6 Kernel Epanechnikov
 

Observaciones

  1. En Estadística, la estimación de densidad de Kernel (KDE) es una forma no paramétrica para estimar la función de densidad de probabilidad de una variable aleatoria.
  2. Permite $\{x_i\}$ ser un muestra idd extraída de alguna distribución con densidad desconocida $f()$. La estimación de densidad de Kernel se define de la siguiente manera:

    $$\hat f(x)=\frac{1}{nh}\sum_{i=1}^N K(\frac{x-x_i}{h})$$
    Donde:
    • $K()$ es la función de Kernel - una función simétrica (pero no necesariamente positiva) que integra a uno.
    • $h$ es un parámetro de suavizado llamado el ancho de banda
  3. El ancho de banda de Kernel es un parámetro libre que exhibe una fuerte influencia en la estimación resultante.
  4. Si Kernel es usada con base Gaussianna y la densidad subyacente se estima Gaussinanna, a continuación, se puede demostrar que la elección óptima de ancho de banda (h) es:

    $$h_{opt}=\hat\sigma\times \sqrt [5]{\frac{4}{3N}}\approx \frac{1.06\sigma}{\sqrt [5] N} $$ $$\hat\sigma=min(s,\frac{IQR}{1.34}) $$
    Donde:
    • $s$ es la desviación estándar de la muestra.
    Esta aproximación se denomina aproximación de la distribución normal, aproximación gaussiana o regla de pulgar de Silverman.
  5. Función KDE utiliza regla de pulgar de Silverman para estimar el ancho de banda óptimo.
  6. KDE no asume que la función de densidad de probabilidad subyacente (pdf) sea normal; en lugar KDE está seleccionando $ h $ lo que sería óptimo si el pdf fueran normales
  7. KDE actualmente apoya un ancho de banda fijo a lo largo de la muestra.
  8. Las series de datos pueden incluir valores faltantes (Por ejemplo: #N/A, #VALUE!, #NUM!, empty cell), pero esos no son incluidos en los cálculos.

Ejemplos

Ejemplo 1:

 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
A B
Fecha Datos
1/1/2008 #N/A
1/2/2008 -1.28
1/3/2008 0.24
1/4/2008 1.28
1/5/2008 1.20
1/6/2008 1.73
1/7/2008 -2.18
1/8/2008 -0.23
1/9/2008 1.10
1/10/2008 -1.09
1/11/2008 -0.69
1/12/2008 -1.69
1/13/2008 -1.85
1/14/2008 -0.98
1/15/2008 -0.77
1/16/2008 -0.30
1/17/2008 -1.28
1/18/2008 0.24
1/19/2008 1.28
1/20/2008 1.20
1/21/2008 1.73
1/22/2008 -2.18
1/23/2008 -0.23
1/24/2008 1.10
1/25/2008 -1.09
1/26/2008 -0.69
1/27/2008 -1.69
1/28/2008 -1.85
1/29/2008 -0.98


  Fórmula Descripción (Resultado)
  =KDE($B$2:$B$29,0.5,,1) KDE (0.165)

Ejemplos de archivos

Referencias

  • Balakrishnan, N., Exponential Distribution: Theory, Methods and Applications, CRC, P 18 1996.
¿Tiene más preguntas? Enviar una solicitud

0 Comentarios