Li o artigo de Alexandru Niculescu-Mizil e Rich Caruana, " Obtendo probabilidades calibradas de impulsionar " e a discussão neste tópico. No entanto, ainda estou tendo problemas para entender e implementar a logística ou o dimensionamento de Platt para calibrar a saída do meu classificador impulsionador de várias classes (impulso suave com tocos de decisão).
Conheço um pouco os modelos lineares generalizados e acho que entendo como os métodos de logística e calibração de Platt funcionam no caso binário, mas não sei se sei como estender o método descrito no artigo para o caso de várias classes.
O classificador que estou usando gera o seguinte:
- = Número de votos que o classificador emite para a classe j na amostra i que está sendo classificada
- = Classe estimada
Neste ponto, tenho as seguintes perguntas:
P1: Preciso usar um logit multinomial para estimar probabilidades? ou ainda posso fazer isso com regressão logística (por exemplo, de um contra todos )?
P2: Como devo definir as variáveis de destino intermediárias (por exemplo, no dimensionamento de Platt) para o caso de várias classes?
P3: Entendo que isso pode pedir muito, mas alguém estaria disposto a esboçar o pseudocódigo para esse problema? (em um nível mais prático, estou interessado em uma solução no Matlab).
fonte
Respostas:
Este é um tópico de interesse prático para mim, então fiz uma pequena pesquisa. Aqui estão dois artigos de um autor que geralmente são listados como referência nesses assuntos.
A essência da técnica defendida aqui é reduzir o problema de várias classes a um problema binário (por exemplo, um versus o resto, AKA um contra todos), usar uma técnica como Platt (preferencialmente usando um conjunto de testes) para classificar as pontuações / probabilidades binárias e depois combine-as usando uma técnica como discutido nos documentos (uma é uma extensão do processo de "acoplamento" de Hastie et al.). No primeiro link, os melhores resultados foram encontrados simplesmente normalizando as probabilidades binárias para as que somam 1.
Eu adoraria ouvir outros conselhos e se algum desses técnicos tiver sido implementado na R.
fonte