Considere um modelo de efeitos não observados linear do tipo: onde é uma característica não observada, mas invariante no tempo e é um erro, e indexe observações individuais e tempo, respectivamente. A abordagem típica em uma regressão de efeitos fixos (EF) seria remover por meio de manequins individuais (LSDV) / de-significado ou pela primeira diferenciação.
O que eu sempre me perguntei: quando verdadeiramente "corrigido"?
Isso pode parecer uma pergunta trivial, mas deixe-me dar dois exemplos por minha razão por trás disso.
Suponha que entrevistar uma pessoa hoje e pedir sua renda, peso, etc. assim que nós começamos nosso . Nos próximos 10 dias, vamos à mesma pessoa e a entrevistamos novamente todos os dias novamente, para que tenhamos dados em painel para ela. Devemos tratar as características não observadas como fixadas por esse período de 10 dias, quando com certeza elas mudarão em algum outro ponto no futuro? Em 10 dias, sua capacidade pessoal pode não mudar, mas mudará quando ela ficar mais velha. Ou perguntado de uma maneira mais extrema: se eu entrevistar essa pessoa a cada hora, durante 10 horas por dia, é provável que suas características não observadas sejam fixadas nessa "amostra", mas qual é a utilidade disso?
Agora, suponha que entrevistemos uma pessoa todos os meses, do início ao fim de sua vida, por 85 anos ou mais. O que permanecerá fixo nesse tempo? Local de nascimento, sexo e cor dos olhos provavelmente, mas fora isso, mal consigo pensar em outra coisa. Mas ainda mais importante: e se houver uma característica que muda em um único ponto de sua vida, mas a mudança é infinitesimalmente pequena? Então não é mais um efeito fixo, porque mudou quando, na prática, essa característica é quase fixa.
Do ponto de vista estatístico, é relativamente claro o que é um efeito fixo, mas, do ponto de vista intuitivo, é algo que acho difícil de entender. Talvez alguém tenha tido esses pensamentos antes e tenha apresentado uma discussão sobre quando um efeito fixo é realmente um efeito fixo. Eu apreciaria muito outros pensamentos sobre este tópico.
"all models are wrong, but some are useful"
- George Box .Respostas:
Se você estiver interessado nesta formulação para inferência causal sobre , as quantidades desconhecidas representadas por c i precisam ser estáveis apenas durante o estudo / dados para efeitos fixos para identificar a quantidade causal relevante.β ci
Se você estiver preocupado com o fato de as quantidades representadas por não serem estáveis, mesmo durante esse período, os efeitos fixos não farão o que você deseja. Então você pode usar efeitos aleatórios em vez disso, embora se você espera correlação entre aleatória c i e X i que você gostaria de condição c i on ˉ X i em uma configuração multinível. A preocupação com essa correlação costuma ser uma das motivações para uma formulação de efeitos fixos, porque em muitas (mas não todas) circunstâncias, você não precisa se preocupar com isso.ci ci Xi ci X¯i
Em suma, a sua preocupação com a alteração das quantidades representada por é muito razoável, mas principalmente porque afeta os dados para o período que você tem em vez de períodos que você pode ter tido ou que você pode, eventualmente, ter, mas não o fazem.ci
fonte
A distinção entre efeito fixo e efeito aleatório normalmente não tem implicações nas estimativas (Edit: pelo menos nos casos simples não relacionados a livros didáticos), além de uma questão de eficiência, mas uma implicação considerável para o teste.
Para fins de teste, a pergunta que você deve se perguntar é qual é o nível de ruído que seu sinal deve superar? Ou seja, para qual população você deseja generalizar suas descobertas? Usando o exemplo (1): deve ser a variabilidade no mesmo dia, um período mais longo ou a variabilidade em diferentes indivíduos?
Quanto mais componentes de variação você inferir, mais forte será a sua descoberta científica, com melhores chances de replicação. Há, naturalmente, um limite para a quantidade de generalização pode pedir, como não só o ruído fica mais forte, mas também o sinal ( )) fica mais fraco. Para ver isso, imagine E ( c i ) é o efeito esperado de X i em peso, mas não mais de alguns períodos da vida de um único assunto, mas sim sobre todos os mamíferos .E(ci E(ci) Xi
fonte
Que pode ser visto como uma caminhada aleatória, voltando no tempo:
Eu acho que para o seu exemplo particular da pesquisa, as perguntas que medem os dados do tipo de fluxo (por exemplo, renda, peso) podem ser razoáveis, pois passeios aleatórios em períodos de tempo particularmente curtos. Os dados do tipo de estoque (como quantos cafés você tomou hoje ) parecem um pouco mais de uma presunção perversa.
fonte