Uso da estimativa de densidade de kernel no Naive Bayes Classifier?

9

Esta pergunta é uma continuação da minha pergunta anterior aqui e também está relacionada, intencionalmente, a esta pergunta .

Por esta página wiki valores de densidade de probabilidade a partir de uma distribuição normal assumido para o conjunto de treino são usados para calcular um Bayesiana posterior, em vez de valores de probabilidade reais. No entanto, se um conjunto de treinamento não for normalmente distribuído, seria igualmente válido usar um valor de densidade retirado da estimativa de densidade do núcleo do conjunto de treinamento para calcular um posterior Bayesiano?

Na aplicação pretendida, essa estimativa da densidade do kernel seria obtida a partir de um conjunto de dados empíricos teoricamente ideais gerados pelas técnicas de MC.

babelproofreader
fonte

Respostas:

5

Eu li a primeira pergunta anterior vinculada, especialmente a resposta da whuber e os comentários sobre isso.

P(X=x|C=c)P(C=c|X=x)=P(C=c)P(X=x|C=c)/P(X=x)

P(X=x|C=c)P(X=x)

Este artigo pode ser interessante para você: estimando distribuições contínuas em classificadores bayesianos

Steffen
fonte