Em inglês, isso significa que, dependendo da observação dos dados, a expectativa do termo de erro é zero.
Como isso pode ser violado?
Exemplo: variável omitida correlacionada comx
Imagine que o verdadeiro modelo é:
yi=α+βxi+γzi+ui
Mas imagine que estamos executando a regressão:
yi=α+βxi+ϵiγzi+ui
Então:
E[ϵi∣xi]=E[γzi+ui∣xi]=γE[zi∣xi] assuming ui is white noise
Se e , então e uma exogeneidade estrita é violada.E[zi∣xi]≠0γ≠0E[ϵi∣xi]≠0
Por exemplo, imagine que é salário, é um indicador de um diploma universitário e é uma medida de capacidade. Se os salários são uma função da educação e da capacidade (o verdadeiro processo de geração de dados é a primeira equação), e espera-se que os graduados tenham maior capacidade ( ) porque a faculdade tende a atrair e admitir alunos com habilidades mais altas, se alguém fizesse uma regressão simples dos salários na educação, a estrita suposição de exogeneidade seria violada. Temos uma variável clássica de confusão . A habilidade causa educação, e a habilidade afeta os salários; portanto, nossa expectativa de erro na equação (2), dada a educação, não é zero.yxzE[zi∣xi]≠0]
O que aconteceria se executássemos a regressão? Você capturaria o efeito educacional e o efeito habilidade no coeficiente educacional. Neste exemplo linear simples, o coeficiente estimado captaria o efeito de em mais a associação de e vezes o efeito de em .bxy xzzy