Como diminuir a perda de informações das variáveis ​​de latência?

8

Estou usando um modelo de atraso distribuído para analisar dados de séries temporais. A duração do período de estudo é de 18 anos e a observação é de dados anuais. Ao incluir um efeito de atraso de 1 ano, o primeiro ano da variável de atraso fica ausente. Então, um efeito de atraso de 2 anos faz com que os dois primeiros dados da variável lag falhem, e assim por diante.

Vou analisar cinco efeitos de atraso nos meus estudos, mas cinco variáveis ​​de atraso causaram 5 dados ausentes. Presumo que a imputação múltipla possa me ajudar a superar a perda de informações nessas variáveis ​​de defasagem, mas o resultado da imputação não é razoável.

Existe alguma idéia melhor para atribuir os dados ausentes nas variáveis ​​de lag?

cchien
fonte
que esquema de lag distribuído em particular você está implementando (Almond ou Koyck ou algum outro)? Eu sempre pensei que é como é, incluindo atrasos significa perda de informações, tanto por parâmetros adicionais para estimar como diminuir em graus de liberdade. Bem, você pode prever os valores de trás para frente (por suavização exponencial ou similar), mas eu pessoalmente não faria isso.
Dmitrij Celov
1
Por que você está testando vários efeitos de atraso? Por que você não está tentando IDENTIFICAR o modelo usando a Função de Correlação Cruzada? O processo Box-Jenkins é identificar, estimar e prever.
Tom Reilly #

Respostas:

1

Você não pode deixar de perder informações ao usar atrasos. Não consigo pensar em nada, exceto usar atrasos mais curtos.

Zach
fonte