O tratamento usual dos livros didáticos para o ajuste de variáveis supérfluas no OLS afirma que o estimador ainda é imparcial, mas pode ter uma variação maior (ver, por exemplo, Greene, Econometric Analysis, 7ª ed., P. 58).
Outro dia, deparei-me com o tratamento de Judea Pearl do Paradox de Simpson e uma boa página da web que simula como "a inclusão gradual de variáveis de controle em um modelo de regressão muda o sinal de uma associação causal estimada em cada etapa". Para mim, isso de alguma forma contradiz a afirmação acima. Sinto que esse pode ser um problema muito sutil (embora incrivelmente importante), portanto, qualquer ponteiro para literatura adicional seria muito útil. O que mais me impressiona é que Greene afirma que tem uma prova para sua avaliação.
fonte
Considere um modelo de regressão linear postulado
Por uma questão de álgebra (e não suposições estocásticas), o estimador OLS na notação matricial é
Seu valor esperado, condicionado à matriz regressora, é portanto
usando também a lei das expectativas iteradas.
fonte