Viés dos estimadores de máxima verossimilhança para regressão logística

10

Gostaria de entender alguns fatos sobre os estimadores de máxima verossimilhança (MLEs) para regressões logísticas.

  1. É verdade que, em geral, o MLE para regressão logística é tendencioso? Eu diria "sim". Eu sei, por exemplo, que a dimensão da amostra está relacionada ao viés assintótico dos MLEs.

    Você conhece algum exemplo elementar desse fenômeno?

  2. Se o MLE é tendencioso, é verdade que a matriz de covariância dos MLE é o inverso do Hessiano da função de máxima verossimilhança?

    edit : Encontrei essa fórmula com bastante frequência e sem nenhuma prova; parece uma escolha bastante arbitrária para mim.

Avitus
fonte

Respostas:

15

Considere o modelo de regressão logística binária simples, com uma variável dependente binária e apenas uma constante e um regressor binário . que é o cdf logístico, .T

Pr(Yi=1Ti=1)=Λ(α+βTi)
ΛΛ(u)=[1+exp{u}]1

No formato logit, temos

ln(Pr(Yi=1Ti=1)1Pr(Yi=1Ti=1))=α+βTi

Você tem uma amostra do tamanho . Denotam o número de observações onde e aqueles onde , e . Considere as seguintes probabilidades condicionais estimadas:nn1Ti=1n0Ti=0n1+n0=n

Pr^(Y=1T=1)P^1|1=1n1Ti=1yi

Pr^(Y=1T=0)P^1|0=1n0Ti=0yi

Então este modelo muito básico fornece soluções de formulário fechado para o estimador de ML:

α^=ln(P^1|01P^1|0),β^=ln(P^1|11P^1|1)ln(P^1|01P^1|0)

VIÉS

Embora e sejam estimadores imparciais das probabilidades correspondentes, os MLEs são tendenciosos, pois a função logarítmica não linear fica no caminho - imagine o que acontece com modelos mais complicados , com um maior grau de não linearidade.P^1|1P^1|0

Mas, assintoticamente, o viés desaparece, pois as estimativas de probabilidade são consistentes. Inserindo diretamente o operador dentro do valor esperado e do logaritmo, temos lim

limnE[α^]=E[ln(limnP^1|01P^1|0)]=E[ln(P1|01P1|0)]=α

e da mesma forma para . β

MATRIZ VARIANCE-COVARIANCE OF MLE
No caso simples acima, que fornece expressões de forma fechada para o estimador, poderia-se, pelo menos em princípio, derivar sua distribuição exata de amostras finitas e depois calcular sua matriz exata de variância-covariância de amostras finitas . Mas, em geral, o MLE não possui uma solução de formulário fechado. Em seguida, recorremos a uma estimativa consistente da matriz de variância-covariância assintótica, que é de fato (o negativo) o inverso do Hessian da função log-verossimilhança da amostra, avaliada no MLE. E não há "escolha arbitrária" aqui, mas resulta da teoria assintótica e das propriedades assintóticas do MLE (consistência e normalidade assintótica), que nos dizem que, para , θ0=(α,β)

n(θ^θ0)dN(0,(E[H])1)

onde é o hessiano. Aproximadamente e para (grandes) amostras finitas, isso nos leva aH

Var(θ^)1n(E[H])11n(1nH^)1=H^1
Alecos Papadopoulos
fonte