No passado, fiz várias perguntas a mim relacionadas a artigos publicados em várias áreas em que regressões (e modelos relacionados, como modelos de painel ou GLMs) são usadas em dados observacionais (dados não produzidos por experimento controlado) , em muitos casos - mas nem sempre - dados observados ao longo do tempo), mas onde nenhuma tentativa de introduzir variáveis instrumentais é feita.
Fiz várias críticas em resposta (como descrever problemas com viés em que variáveis importantes podem estar faltando), mas como outras pessoas aqui sem dúvida terão muito mais conhecimento do que eu sobre esse tópico, imaginei que perguntaria:
Quais são as principais questões / consequências de tentar chegar a conclusões sobre relacionamentos (particularmente, mas não limitado a conclusões causais) em tais situações?
Alguma coisa útil pode ser feita com estudos que se encaixam nesses modelos na ausência de instrumentos?
Quais são algumas boas referências (livros ou artigos) sobre os problemas dessa modelagem (de preferência com clara motivação não técnica das consequências, uma vez que geralmente as pessoas que solicitam têm uma variedade de antecedentes, algumas sem muita estatística) às quais as pessoas podem se referir ao criticar um papel? A discussão de precauções / problemas com instrumentos também seria útil.
(Referências básicas sobre variáveis instrumentais estão aqui , embora, se você tiver alguma a acrescentar, isso também seria útil.)
Ponteiros para bons exemplos práticos de localização e uso de instrumentos seriam um bônus, mas não são centrais para esta questão.
[Provavelmente apontarei outras pessoas para boas respostas aqui, pois essas perguntas me chegam. Posso adicionar um ou dois exemplos à medida que os obtenho.]
fonte