Estou tentando entender melhor a estimativa da densidade do kernel.
Usando a definição da Wikipedia: https://en.wikipedia.org/wiki/Kernel_density_estimation#Definition
Vamos considerar como uma função retangular que fornece se estiver entre e e , caso contrário, e (tamanho da janela) como 1.1 x - 0,5 0,5 0 h
Entendo que a densidade é uma convolução de duas funções, mas não sei se sei definir essas duas funções. Um deles deve (provavelmente) ser uma função dos dados que, para cada ponto em R, nos dizem quantos pontos de dados temos nesse local (principalmente ). E a outra função provavelmente deve ser alguma modificação da função do kernel, combinada com o tamanho da janela. Mas não sei como defini-lo.
Alguma sugestão?
Abaixo está um exemplo de código R que (suspeito) replica as configurações definidas acima (com uma mistura de dois gaussianos en ), nas quais espero ver uma "prova" de que as funções a serem complicadas são como suspeitamos .
# example code:
set.seed(2346639)
x <- c(rnorm(50), rnorm(50,2))
plot(density(x, kernel='rectangular', width=1, n = 10**4))
rug(x)
fonte
Respostas:
Corresponde a qualquer lote de dados é sua "função de densidade empírica"X= ( x1 1, x2, … , Xn)
Aqui, é uma "função generalizada". Apesar desse nome, não é uma função: é um novo objeto matemático que pode ser usado apenas dentro de integrais. Sua propriedade definidora é que, para qualquer função de suporte compacto que seja contínua em uma vizinhança de ,δ g 0 0
(Os nomes para incluem a medida "atômica" ou "ponto" e a função " Dirac delta ". No cálculo a seguir, esse conceito é estendido para incluir funções que são contínuas apenas de um lado.)δ gg
Justificando essa caracterização de é a observação de quefX
onde é o CDF empírico usual e é a função característica usual (igual a onde seu argumento é verdadeiro e caso contrário). (Eu pulo um argumento limitador elementar necessário para passar de funções de suporte compacto para funções definidas em ; porque só preciso ser definido para valores dentro do intervalo de , que é compacto, isso não é problema.)FX Eu 1 1 0 0 R Eu X
A convolução de com qualquer outra função é dada, por definição, comofX( X ) k
Deixando (que é o mesmo que para núcleos simétricos - e a maioria dos núcleos são simétricos), obtemos o resultado reivindicado: a fórmula da Wikipedia é uma convolução.k ( x ) = Kh( - x ) Kh( X )
fonte