Dado um conjunto de dados com resultados binários e alguma matriz preditora X \ in \ mathbb {R} ^ {n \ times p} , o modelo de regressão logística padrão estima coeficientes \ beta_ {MLE } que maximizam a probabilidade binomial. Quando X está na classificação completa, \ beta_ {MLE} é único; quando a separação perfeita não está presente, é finita.
Esse modelo de máxima verossimilhança também maximiza a AUC do ROC (também conhecida como estatística ), ou existe alguma estimativa de coeficiente que obterá uma AUC do ROC mais alta? Se é verdade que o MLE não maximiza necessariamente a AUC do ROC, outra maneira de analisar essa questão é "Existe uma alternativa à maximização da probabilidade que sempre maximizará a AUC do ROC de uma regressão logística?"
Estou assumindo que os modelos são os mesmos: não estamos adicionando ou removendo preditores em ou alterando a especificação do modelo, e estou assumindo que os modelos de maximização de probabilidade e maximização de AUC estão usando a mesma função de link.
fonte
Respostas:
Não é o caso que .βMLE=βAUC
Para ilustrar isso, considere que a AUC pode ser escrita como
Em outras palavras, a ordem das previsões é a única coisa que afeta a AUC . Este não é o caso da função de probabilidade. Portanto, como exercício mental, suponha que tínhamos preditores únicos e, em nosso conjunto de dados, não vemos separação perfeita (por exemplo, é finito). Agora, se simplesmente pegarmos o valor do maior preditor e aumentarmos em alguma quantia pequena, mudaremos a probabilidade dessa solução, mas ela não mudará a AUC, pois a ordem deve permanecer a mesma. Assim, se o antigo MLE maximizou a AUC, ele ainda maximizará a AUC após a alteração do preditor, mas não maximizará a probabilidade.βMLE
Portanto, no mínimo, não é o caso de não ser único; qualquer que preserva a ordem das estimativas atinge exatamente a mesma AUC. Em geral, como a AUC é sensível a diferentes aspectos dos dados, eu acreditaria que deveríamos encontrar um caso em que não maximize . De fato, arriscaria adivinhar que isso acontece com alta probabilidade.βAUC β βMLE βAUC
EDIT (movendo o comentário para a resposta)
O próximo passo é provar que o MLE não maximiza necessariamente a AUC (o que ainda não foi comprovado). Pode-se fazer isso usando algo como os preditores 1, 2, 3, 4, 5, 6, (com ) com resultados 0, 0, 0, 1, 1, 1, 0. Qualquer valor positivo de maximizará a AUC (independentemente do valor de ), mas podemos escolher um grande o suficiente para que .x x>6 β x x βMLE<0
fonte