Pearson VS Deviance Residuals em regressão logística

16

Eu sei que os Pearson Residuals padronizados são obtidos de uma maneira probabilística tradicional:

ri=yiπiπi(1πi)

Residuais de Deviance e Deviance são obtidos de uma maneira mais estatística (a contribuição de cada ponto para a probabilidade):

di=si2[yilogπi^+(1yi)log(1πi)]

onde = 1 se y i = 1 e s i = -1 se = 0.siyisiyi

Você pode me explicar, intuitivamente, como interpretar a fórmula dos resíduos de desvio?

Além disso, se eu quiser escolher um, qual é o mais adequado e por quê?

BTW, algumas referências afirmam que derivamos os resíduos de desvio com base no termo

12ri2

onde é mencionado acima.ri

Jack Shi
fonte
Qualquer pensamento seria apreciada
Jack Shi
1
Quando você diz "algumas referências" ... quais referências e como elas fazem isso?
Glen_b -Reinstala Monica

Respostas:

10

A regressão logística busca maximizar a função de probabilidade de log

LL=kln(Pi)+rln(1Pi)

onde é a probabilidade prevista nesse caso i é Y = 1 ; k é o número de casos observados como Y = 1 e r é o número de casos (o resto) observados como Y = 0 .PiY^=1kY=1rY=0

Essa expressão é igual a

LL=(kdi2+rdi2)/2

porque o desvio de desvio de um caso é definido como:

di={2ln(Pi)if Yi=12ln(1Pi)if Yi=0

Assim, a regressão logística binária busca diretamente minimizar a soma dos resíduos do desvio ao quadrado. São os resíduos de desvio que estão implícitos no algoritmo ML da regressão.

2(LLfull modelLLreduced model)

ttnphns
fonte