Trabalho na Economia Política, e muitos dos modelos incluem variáveis de controle "inocentes", como população, desigualdade, legado colonial, etc., para que o autor possa reivindicar imparcialidade em relação a sua variável independente de interesse.
Mas se alguma dessas variáveis de controle é endógena a alguma variável omitida, isso não contamina a imparcialidade de TODAS as variáveis independentes?
Se isso é verdade, então o que podemos fazer? Deixe essas variáveis de controle de fora e elas causam o próprio viés de variável omitido. Inclua esses itens e eles contaminarão tudo no modelo.
Exemplo: Um investigador quer saber se os cabos de desigualdade para violência, e ele controla para algumas coisas:
Esse exemplo pode parecer tolo, mas meu argumento é sobre o trabalho de Economia Política / Desenvolvimento; há tantos fatores em jogo (ainda omitidos) que receio que muitas variáveis incluídas no LHS sejam endógenas. No entanto, muitas vezes, o pesquisador procura apenas um instrumento apenas para sua variável independente de estimação.
fonte
Respostas:
"Mas se alguma dessas variáveis de controle é endógena a alguma variável omitida, isso não contamina a imparcialidade de TODAS as variáveis independentes?"
Não quero enfatizar muito isso, mas vale a pena mencionar que isso não é verdade em geral. Esperamos que a derivação a seguir forneça alguma compreensão da "contaminação" mencionada. Como um contra-exemplo simples, suponha que o processo de geração de dados seja dado por onde Z não é observado. Vamos C O v ( X 1 , Z ) = 0 , C O v ( X 2 , Z ) ≠ 0 e C o v (
"O que podemos fazer?"
Um dos principais desafios de se fazer uma boa econometria é pensar em possíveis estratégias de identificação. No tipo de situação que você descreve, provavelmente não há nada que você possa fazer além de tentar abordar o problema de uma maneira diferente.
fonte
Tudo é muito forte, mas provavelmente alguns. Esse problema é chamado de "mancha". Veja a prova nas notas de aula de Greene no slide 5.
Emily Oster tem um bom documento de trabalho (e comando Stata
psacalc
) que pode ajudar a limitar o viés.fonte
No contexto da estimativa dos mínimos quadrados, a maneira como temos que (tentar) lidar com a possível endogeneidade dos regressores é através da estimativa das variáveis instrumentais. Essa abordagem não depende de ter apenas um regressor endógeno - você pode ter muitos. Nesse caso, é claro que você precisa encontrar mais instrumentos que tornem as coisas mais difíceis - mas, em princípio, o método funcionará da mesma maneira.
A estimativa IV não resolve a questão do viés, apenas fornece consistência para o estimador. Mas nada resolve a questão da própria estrogenicidade da barra de viés (e existem alguns métodos de redução de viés). Mas se você der uma olhada em outro site do SE, o Cross Validated , que trata de estatísticas, verá que estatísticos experientes não dão muito peso à propriedade da imparcialidade - eles se concentram na eficiência do quadrado médio para propriedades finitas da amostra, e na consistência para grandes propriedades da amostra.
fonte
Este é um exemplo de que estatístico Andrew Gelman chama de "a falácia de controlar um resultado intermediário". Aqui está sua descrição dessa falácia aparecendo quando os pesquisadores perguntam se ter mais filhas muda sua política. A decisão de ter um segundo filho é necessariamente condicionada à decisão anterior de ter o primeiro filho e, portanto, parece um exemplo claro de controle da variável de decisão que era endógena.
Ter filhos a torna mais conservadora? Talvez talvez não. Um problema ao controlar um resultado intermediário
Com relação ao seu comentário de que "deixe de fora essas variáveis de controle e elas causam o próprio viés de variável omitida", isso parece depender de que tipo de instrumento você obtém. Um bom instrumento, que realmente satisfaça os requisitos, deve ser independente do termo de erro no segundo estágio e ser independente de tudo o que você controla diretamente . Ou seja, o instrumento muda Y somente através de X. Portanto, um instrumento adequado para a desigualdade deve ser independente do crescimento e desenvolvimento (boa sorte ao descobrir isso!) Se acreditarmos que a equação da violência é a equação estrutural da violência.
fonte
Como outros posts apontaram, os regressores endógenos podem contaminar todas as estimativas de parâmetros na regressão quando os regressores estão correlacionados.
Considere o seguinte modelo (análogo à notação de @ jmbejara)
fonte