Estimativa de densidade de kernel em distribuições assimétricas

10

Sejam observações extraídas de uma distribuição de probabilidade desconhecida (mas certamente assimétrica).{x1,,xN}

Gostaria de encontrar a distribuição de probabilidade usando a abordagem do KDE: No entanto, tentei usar um kernel gaussiano, mas ele teve um desempenho ruim, pois é simétrico. Assim, vi que alguns trabalhos sobre os kernels Gamma e Beta foram lançados, embora eu não entendesse como operar com eles.

f^(x)=1Nhi=1NK(xxih)

Minha pergunta é: como lidar com esse caso assimétrico, supondo que o suporte da distribuição subjacente não esteja no intervalo ?[0,1]

Eleanore
fonte
4
No caso de densidades próximas do lognormal (que eu encontro muito em algumas aplicações em particular), eu simplesmente transformo (pegando logs) e depois faço o KDE, e depois transformo o KDE (você precisa se lembrar do jacobiano ao transformar a estimativa de volta). Funciona muito bem nesse caso.
Glen_b -Reinstala Monica
@Glen_b você tem alguma referência ou material onde este método é descrito? (Cálculo do KDE em uma transformação da variável original e, em seguida, transformando a volta KDE)
Boscovich
Não que eu saiba - tenho certeza de que eles existem, já que é uma idéia bastante trivial e facilmente implementável. É o tipo de coisa que eu esperaria que um graduado em estatística pudesse derivar. Na prática, funciona muito bem.
Glen_b -Reinstate Monica
@glen_b thanks. Então, se eu fosse usá-lo em um relatório / publicação técnico, você acha que seria bom não dar nenhuma referência?
boscovich 25/05
11
@guy Certamente é possível ter problemas, especialmente com algumas transformações e alguns tipos de dados. As situações que eu usei tendem a ser bem próximas do lognormal, e aí a mudança na largura de banda que você vê como um problema é exatamente o que é necessário; faz muito melhor que o KDE nos dados brutos. Pela descrição do OP, parecia bastante semelhante, mas não é como se eu estivesse sugerindo que era uma panacéia .
Glen_b -Reinstate Monica

Respostas:

5

Primeiro, o KDE com kernels simétricos também pode funcionar muito bem quando seus dados são assimétricos. Caso contrário, na prática, seria completamente inútil.

Em segundo lugar, você já pensou em redimensionar seus dados para corrigir a assimetria, se acredita que isso está causando o problema. Por exemplo, pode ser uma boa ideia tentar , pois isso é conhecido por ajudar em muitos problemas.log(x)

Possui QUIT - Anony-Mousse
fonte
Se você redimensionar para log(x), também precisará ser responsabilizado por um jacobiano?
DilithiumMatrix
0

Hmm. Você pode querer uma largura do kernel que mude em função da localização.

Se eu estivesse analisando o problema no eCDF, poderia tentar fazer com que uma inclinação numérica do CDF se relacionasse com o tamanho do Kernel.

Penso que, se você for fazer uma transformação de coordenadas, precisará ter uma boa ideia dos pontos de início e de fim. Se você conhece bem a distribuição de destino, não precisa da aproximação do Kernel.

EngrStudent
fonte
11
Eu poderia facilmente saber que meus RVs não são negativos, mas ainda quero um KDE.
cara