Recentemente, usei o dimensionamento de saídas SVM de Platt para estimar as probabilidades de eventos padrão. Alternativas mais diretas parecem ser "Regressão logística do kernel" (KLR) e a "Máquina de vetor de importação" relacionada.
Alguém pode dizer qual método de kernel que fornece resultados de probabilidade é atualmente o estado da arte? Existe uma implementação R do KLR?
Muito obrigado pela sua ajuda!
logistic
svm
kernel-trick
RichardN
fonte
fonte
Respostas:
A classificação de processo gaussiana (usando a Propagação de Expectativas) é provavelmente o estado da arte no aprendizado de máquina. Existe um excelente livro de Rasmussen e Williams (disponível para download gratuito), cujo site possui uma implementação muito boa do MATLAB. Mais software, livros, documentos, etc. aqui . No entanto, na prática, o KLR provavelmente funcionará tão bem quanto na maioria dos problemas, a maior dificuldade está na seleção dos parâmetros do kernel e da regularização, o que provavelmente é melhor realizado pela validação cruzada, embora a validação cruzada de uma única saída possa ser aproximada muito eficientemente, ver Cawley e Talbot (2008).
fonte
Eu acho que você sabe que o kernel para regressão logística não é paramétrico, então, primeiro, você tem essa restrição.
Em relação ao pacote R, o que eu conheço e que funciona muito bem é np : Métodos não paramétricos de suavização de kernel para tipos de dados mistos
Este pacote fornece uma variedade de métodos de kernel não paramétricos (e semiparamétricos) que lidam perfeitamente com uma mistura de tipos de dados de fatores contínuos, não ordenados e ordenados.
Em relação ao estado da arte do kernell, recomendo experimentar os descritos neste artigo em 2009. Leia-o com cuidado para escolher o que é melhor e mais atual para você.
fonte