Estou muito confuso sobre se é legítimo incluir uma variável dependente defasada em um modelo de regressão. Basicamente, acho que se esse modelo se concentrar no relacionamento entre a mudança em Y e outras variáveis independentes, a adição de uma variável dependente defasada no lado direito pode garantir que o coeficiente antes de outros IVs seja independente do valor anterior de Y.
Alguns dizem que a inclusão do LDV diminuirá o coeficiente de outros IVs. Alguns outros dizem que se pode incluir LDV, o que pode reduzir a correlação serial.
Eu sei que essa pergunta é bastante geral em termos de que tipo de regressão. Mas meu conhecimento estatístico é limitado e eu realmente tenho dificuldade em descobrir se devo incluir uma variável dependente defasada em um modelo de regressão quando o foco é a alteração de Y ao longo do tempo.
Existem outras abordagens para lidar com a influência de Xs na mudança de Y ao longo do tempo? Tentei diferentes pontuações de alteração como DV, mas o R ao quadrado nessa situação é muito baixo.
fonte
Respostas:
A decisão de incluir uma variável dependente defasada em seu modelo é realmente uma questão teórica. Faz sentido incluir um DV atrasado se você espera que o nível atual do DV seja fortemente determinado por seu nível anterior. Nesse caso, não incluir o DV atrasado levará ao viés variável omitido e seus resultados poderão não ser confiáveis. Nesse cenário, incluindo o DV atrasado, a variância será muito grande e provavelmente tornará os efeitos dos outros DV menos significativos (o que significa que os são menores e os erros padrão maiores). No entanto, o que permitirá que você faça é dizer que os IVs que ainda influenciam seu resultado afetam o valor passado do DV. Uma abordagem alternativa é usar a diferença entre a variável de resultado no períodoβ t e como seu DV para o período .t−1 t
No entanto, qualquer uma dessas opções implica responder a uma pergunta importante: qual é a estrutura de atraso certa para o seu DV? Você pode obter algumas informações sobre isso observando a correlação entre a variável de resultado e ela própria para diferentes valores de atraso (por exemplo, correlação entre Y e Y , Y e Y , etc.).t−1 t−2
fonte
Eu recomendo dois artigos:
O resultado é que a inclusão de uma variável dependente defasada pode ter uma grande influência nos coeficientes das demais variáveis. Às vezes isso é apropriado (para os modelos dinâmicos de Keele e Kelly) e às vezes não. Como outros já disseram, é importante pensar no processo que está sendo modelado.
fonte
A inclusão de variáveis dependentes atrasadas pode reduzir a ocorrência de autocorrelação decorrente da especificação incorreta do modelo. Assim, a contabilização de variáveis dependentes atrasadas ajuda a defender a existência de autocorrelação no modelo. O valor passado afeta o presente no modelo, requer fundamentação teórica e adapta-se melhor ao modelo, conforme necessário.
fonte
O que me deixa intrigado com essa questão é não saber mais sobre a especificação do modelo ou a técnica de estimativa para ele. Menciono que, embora o uso de um DV defasado entre os IVs possa ser teoricamente importante e metodologicamente necessário, ele também pode introduzir uma quantidade arriscada de endongeneidade no modelo, dependendo da relação substancial entre variáveis e unidades de tempo e, também, na AR ordem que pode existir no modelo. A menos que você (e nós) tenhamos mais detalhes sobre as variáveis e as estimativas, não me sinto confortável em recomendar o atraso do DV, a menos que você esteja pensando em alguma técnica de variável instrumental ou algo como a estimativa de Arellano-Bond.
Por favor, dê-nos mais detalhes para que possamos saber melhor sobre que tipo de modelo estamos falando.
fonte
Sim, você deve ter cuidado com o viés de Nickell em uma situação pequena de T grande N (Nickell, S. (1981). Viés em modelos dinâmicos com efeitos fixos. Econometrica: Journal of the Economometric Society, 1417-1426.)
Você pode querer olhar para os modelos de dados dinâmicos do painel, como os estimadores Arellano-Bond ou Blundell-Bond.
fonte