Eu li (por exemplo, aqui ) que o núcleo Epanechnikov é ideal, pelo menos em um sentido teórico, ao fazer uma estimativa da densidade do núcleo. Se isso for verdade, por que o Gaussiano aparece com tanta frequência quanto o kernel padrão ou, em muitos casos, o único kernel, nas bibliotecas de estimativa de densidade?
nonparametric
kernel-smoothing
John Rauser
fonte
fonte
kdensity
.Respostas:
A razão pela qual o kernel Epanechnikov não é universalmente usado por sua otimização teórica pode muito bem ser que o kernel Epanechnikov não é realmente teoricamente ideal . Tsybakov critica explicitamente o argumento de que o núcleo Epanechnikov é "teoricamente ótimo" nas páginas 16-19 da Introdução à estimativa não paramétrica (seção 1.2.4).
Tentando resumir, sob algumas suposições sobre o kernelK e uma densidade fixa p one, temos que o erro quadrado integrado médio é, da forma
A principal crítica a Tsybakov parece estar minimizando os núcleos não negativos, pois muitas vezes é possível obter estimadores com melhor desempenho, que são até negativos, sem restringir os núcleos não negativos.
O primeiro passo do argumento para o kernel Epanechnikov começa minimizando(1) sobre h todos os kernels não negativos (em vez de todos os kernels de uma classe mais ampla) para obter uma largura de banda "ideal" para K
e o kernel "ideal" (Epanechnikov)
cujo erro quadrado integrado médio é:
Porém, essas escolhas não são viáveis, pois dependem do conhecimento (viap′′ ) da densidade desconhecida p - portanto, são quantidades "oraculares".
Uma proposição feita por Tsybakov implica que o MISE assintótico para o oráculo de Epanechnikov é:
Tsybakov diz que (2) costuma ser considerado o MISE mais viável, mas depois mostra que é possível usar kernels da ordem 2 (para os quais ) para construir estimadores de kernel, para cada , de modo queSK=0 ε>0
Mesmo que não seja necessariamente não negativo, ainda há o mesmo resultado para o estimador de peças positivo, (que é garantido seja negativo, mesmo que não seja):p^n p+n:=max(0,p^n) K
Portanto, para pequeno o suficiente, existem estimadores verdadeiros que possuem MISE assintótico menor que o oráculo Epanechnikov , mesmo usando as mesmas premissas na densidade desconhecida .ε p
Em particular, resulta-se que o menor valor do MISE assintótico para um fixo sobre todos os estimadores de kernel (ou partes positivas dos estimadores de kernel) é . Portanto, o oráculo de Epanechnikov não está nem perto de ser o ideal, mesmo quando comparado aos verdadeiros estimadores.p 0
A razão pela qual as pessoas avançaram no argumento para o oráculo de Epanechnikov é que muitas vezes se argumenta que o próprio núcleo não deveria ser negativo, porque a densidade em si não era negativa. Mas, como Tsybakov aponta, não é preciso assumir que o núcleo não é negativo para obter estimadores de densidade não negativos e, ao permitir que outros kernels possam ser estimadores de densidade não negativos que (1) não são oráculos e (2) ter um desempenho arbitrariamente melhor que o oráculo Epanechnikov para um fixop . Tsybakov usa essa discrepância para argumentar que não faz sentido defender a otimização em termos de um fixo , mas apenas as propriedades de otimização uniformes em uma classep de densidades. Ele também aponta que o argumento ainda funciona ao usar o MSE em vez do MISE.
EDIT: Ver também Corolário 1.1. na p.25, onde o núcleo de Epanechnikov se mostra inadmissível com base em outro critério. Tsybakov realmente parece não gostar do núcleo Epanechnikov.
fonte
O núcleo gaussiano é usado, por exemplo, na estimativa de densidade através de derivadas:
Isso ocorre porque o kernel Epanechnikov possui 3 derivadas antes de ser identicamente zero, ao contrário do Gaussiano, que possui infinitas derivações (que não são zero). Veja a seção 2.10 no seu link para mais exemplos.
fonte