Eu sei que os Pearson Residuals padronizados são obtidos de uma maneira probabilística tradicional:
Residuais de Deviance e Deviance são obtidos de uma maneira mais estatística (a contribuição de cada ponto para a probabilidade):
onde = 1 se y i = 1 e s i = -1 se = 0.
Você pode me explicar, intuitivamente, como interpretar a fórmula dos resíduos de desvio?
Além disso, se eu quiser escolher um, qual é o mais adequado e por quê?
BTW, algumas referências afirmam que derivamos os resíduos de desvio com base no termo
onde é mencionado acima.
Respostas:
A regressão logística busca maximizar a função de probabilidade de log
onde é a probabilidade prevista nesse caso i é Y = 1 ; k é o número de casos observados como Y = 1 e r é o número de casos (o resto) observados como Y = 0 .Pi Y^=1 k Y=1 r Y=0
Essa expressão é igual a
porque o desvio de desvio de um caso é definido como:
Assim, a regressão logística binária busca diretamente minimizar a soma dos resíduos do desvio ao quadrado. São os resíduos de desvio que estão implícitos no algoritmo ML da regressão.
fonte