Entendo que a definição básica de endogeneidade é que não está satisfeito, mas o que isso significa no sentido do mundo real? Eu li o artigo da Wikipedia, com o exemplo de oferta e demanda, tentando entender o sentido, mas não ajudou muito. Ouvi a outra descrição de endógena e exógena como estando dentro do sistema e estando fora do sistema, e isso ainda não faz sentido para mim.
regression
causality
instrumental-variables
user25901
fonte
fonte
R
.Respostas:
A resposta de JohnRos é muito boa. Em inglês simples, endogeneidade significa que você errou a causa. Que o modelo que você anotou e estimou não capta adequadamente a maneira como a causação funciona no mundo real. Quando você escreve:
você pode pensar nessa equação de várias maneiras. Você pode pensar nisso como uma maneira conveniente de prever base nos valores deVocê pode pensar nisso como uma maneira conveniente de modelar . Em qualquer um desses casos, não existe endogeneidade, e você não precisa se preocupar com isso.X E { S | X }Y X E{Y|X}
No entanto, você também pode pensar na equação como incorporando causalidade. Você pode pensar em como a resposta à pergunta: "O que aconteceria com se eu chegasse a esse sistema e aumentasse experimentalmente 1 em ?" Se você quiser pensar dessa maneira, usar o OLS para estimar equivale a supor que: Y Xβ1 Y X
A falha de qualquer um dos 3-5 geralmente resultará em , ou, não de maneira equivalente, . Variáveis instrumentais é uma maneira de corrigir o fato de você ter errado a causa (fazendo outra suposição causal diferente). Um estudo randomizado controlado perfeitamente conduzido é uma maneira de forçar 3-5 a ser verdade. Se você escolher aleatoriamente, com certeza não será causado por , ou qualquer outra coisa. Os chamados métodos de "experimento natural" são tentativas de encontrar circunstâncias especiais no mundo em que 3-5 são verdadeiras, mesmo quando não pensamos que 3-5 sejam verdadeiras.C o v ( X , ϵ ) ≠ 0 X Y ϵE{ϵ|X}≠0 Cov(X,ϵ)≠0 X Y ϵ
No exemplo de JohnRos, para calcular o valor salarial da educação, você precisa de uma interpretação causal de , mas há boas razões para acreditar que 3 ou 5 são falsos.β1
Sua confusão é compreensível, no entanto. É muito típico em cursos sobre o modelo linear o instrutor usar a interpretação causal de eu dei acima, fingindo não apresentar a causa, fingindo que "tudo é apenas estatística". É uma mentira covarde, mas também é muito comum.β1
De fato, faz parte de um fenômeno maior na biomedicina e nas ciências sociais. É quase sempre o caso em que estamos tentando determinar o efeito causal de em - é disso que se trata a ciência, afinal. Por outro lado, também é quase sempre o caso de uma história que você pode contar, levando à conclusão de que uma das 3 a 5 é falsa. Portanto, existe um tipo de desonestidade praticada, fluida e equivocada, na qual eliminamos objeções dizendo que estamos apenas fazendo um trabalho associativo e depois escondemos a interpretação causal em outro lugar (normalmente nas seções de introdução e conclusão do artigo).YX Y
Se você está realmente interessado, o cara a ler é Judea Perl. James Heckman também é bom.
fonte
Deixe-me usar um exemplo:
Digamos que você queira quantificar o efeito (causal) da educação sobre a renda. Você estuda e estuda dados de renda e regride um contra o outro. Você recuperou o que queria? Provavelmente não! Isso ocorre porque a renda também é causada por outras coisas que não a educação, mas que estão correlacionadas à educação. Vamos chamá-los de "habilidade": podemos assumir com segurança que os anos de ensino são afetados por "habilidade", pois quanto mais habilidoso você for, mais fácil será obter educação. Portanto, se você regredir os anos de ensino sobre a renda, o estimador do efeito de educação absorve o efeito de "habilidade" e obtém uma estimativa excessivamente otimista do retorno à educação. Isto é, o efeito da educação na renda é (ascendente) tendencioso porque a educação não é exógena à renda.
fonte
O User25901 está procurando uma explicação simples e direta do mundo real, o que significam os termos exógeno e endógeno. Responder com exemplos misteriosos ou definições matemáticas realmente não responde à pergunta que foi feita.
Como entendo esses dois termos?
Aqui está o que eu vim com:
Exo - externo, externo Endo - interno, interno - originário de
Exógena: uma variável é exógena para um modelo se não for determinada por outros parâmetros e variáveis no modelo, mas for definida externamente e quaisquer alterações nela vierem de forças externas.
Endógena: Uma variável é endógena em um modelo se, pelo menos em parte, é função de outros parâmetros e variáveis em um modelo.
fonte
Esse é o mínimo de dois estágios, que é quase o mesmo que IV.
fonte
Em regressão, queremos capturar o impacto quantitativo de uma variável independente (que assumimos ser exógena e não ser ela própria dependente de outra coisa) em uma variável dependente identificada. Queremos saber qual o efeito líquido de uma variável exógena sobre uma variável dependente - o que significa que a variável independente deve estar livre de qualquer influência de outra variável. Uma maneira rápida de verificar se a regressão está sofrendo com o problema da endogeneidade é verificar a correlação entre a variável independente e os resíduos. Mas isso é apenas uma verificação aproximada, caso contrário, testes formais de endogeneidade precisam ser realizados.
fonte