Com dados contínuos, uma regressão linear assume que o termo de erro está distribuído N (0, )
1) Assumimos que Var (Y | x) é igualmente ~ N (0, )?
2) Qual é essa distribuição de erro na regressão logística? Quando os dados estão no formato de 1 registro por caso, onde o "Y" é 1 ou 0, é o termo de erro distribuído Bernoulli (ou seja, a variação é p (1-p))) e quando os dados estão no formato # sucessos de #de tentativas, é assumido binomial (ou seja, a variação é np (1-p)), onde p é a probabilidade de Y ser 1?
logistic
generalized-linear-model
B_Miner
fonte
fonte
Respostas:
1) Se tiver distribuição normal, ou seja, N ( 0 , σ 2 ), então V a r ( Y | X 2 ) = V a r ( β 1 + β 2 X 2 ) + V a r ( u ) = 0 + σ 2 = σ 2 , uma vez que β 1 + β 2 X 2u N(0,σ2) Var(Y|X2)=Var(β1+β2X2)+Var(u)=0+σ2=σ2 β1 1+ β2X2 não é uma variável aleatória.
2) Na regressão logística, assume-se que os erros sigam uma distribuição binomial como mencionado aqui . É melhor escrevê-lo como , uma vez que essas probabilidades dependem de X j , conforme referenciadoaquiou emRegressão logística aplicada.Va r ( Yj| Xj) = mj. E[ Yj| Xj] . ( 1 - E[ Yj| Xj] ) = mjπ( Xj) . ( 1 - π( Xj) )) Xj
fonte