Como podemos desenhar uma curva ROC para árvores de decisão?
13
Normalmente, não podemos desenhar uma curva ROC para classificadores discretos, como árvores de decisão. Estou certo? Existe alguma maneira de desenhar uma curva ROC para Dtrees?
[Avaliação do modelo de árvore de decisão para "conjunto de treinamento" vs "conjunto de teste" em R] [1] [1]: stats.stackexchange.com/questions/49416/… Você pode encontrar sua resposta aqui.
Sangram
@rapaio Desculpe, seu link mostra uma curva ROC para encontrar um limite em um classificador que produz saída entre 1 e 0 (valor contínuo).
DataMiner 04/07
@ Sangram Estas são as soluções em R, mas eu quero apenas entender como ele funciona.
DataMiner
Respostas:
15
( x , y) = ( FPR , TPR )FPRTPR - taxa de verdadeiro positivo.
Para uma Árvore de Decisão, as classes ainda são previstas com algum nível de certeza. A resposta já é dada por @rapaio, mas vou expandir um pouco.
Imagine a seguinte árvore de decisão (é uma versão pouco modificada deste um )
Em cada nó não há apenas os rótulos de classe majoritária, mas também outros que acabaram nessa folha, para que possamos atribuir o grau de certeza àquela folha na qual previmos o rótulo.
Por exemplo, considere os seguintes dados
Nós o executamos e atribuímos as pontuações à saída, não aos rótulos reais. Com isso, podemos desenhar uma curva ROC, como sugerido aqui
No entanto, faz pouco sentido usá-lo para ajustar seu limite (já que, é claro, não existe um limite nas Árvores de Decisão), mas ainda pode ser usado para calcular a AUC, que, neste caso, é 0,92
Respostas:
Veja mais sobre como isso é calculado na página da Wikipedia .
fonte
Para uma Árvore de Decisão, as classes ainda são previstas com algum nível de certeza. A resposta já é dada por @rapaio, mas vou expandir um pouco.
Imagine a seguinte árvore de decisão (é uma versão pouco modificada deste um )
Em cada nó não há apenas os rótulos de classe majoritária, mas também outros que acabaram nessa folha, para que possamos atribuir o grau de certeza àquela folha na qual previmos o rótulo.
Por exemplo, considere os seguintes dados
Nós o executamos e atribuímos as pontuações à saída, não aos rótulos reais. Com isso, podemos desenhar uma curva ROC, como sugerido aqui
No entanto, faz pouco sentido usá-lo para ajustar seu limite (já que, é claro, não existe um limite nas Árvores de Decisão), mas ainda pode ser usado para calcular a AUC, que, neste caso, é 0,92
Código R usado aqui:
fonte