Como diminuir a perda de informações das variáveis de latência?

Estou usando um modelo de atraso distribuído para analisar dados de séries temporais. A duração do período de estudo é de 18 anos e a observação é de dados anuais. Ao incluir um efeito de atraso de 1 ano, o primeiro ano da variável de atraso fica ausente. Então, um efeito de atraso de 2 anos faz com que os dois primeiros dados da variável lag falhem, e assim por diante.

Vou analisar cinco efeitos de atraso nos meus estudos, mas cinco variáveis de atraso causaram 5 dados ausentes. Presumo que a imputação múltipla possa me ajudar a superar a perda de informações nessas variáveis de defasagem, mas o resultado da imputação não é razoável.

Existe alguma idéia melhor para atribuir os dados ausentes nas variáveis de lag?

time-series missing-data cchien
fonte

que esquema de lag distribuído em particular você está implementando (Almond ou Koyck ou algum outro)? Eu sempre pensei que é como é, incluindo atrasos significa perda de informações, tanto por parâmetros adicionais para estimar como diminuir em graus de liberdade. Bem, você pode prever os valores de trás para frente (por suavização exponencial ou similar), mas eu pessoalmente não faria isso.

Dmitrij Celov

Por que você está testando vários efeitos de atraso? Por que você não está tentando IDENTIFICAR o modelo usando a Função de Correlação Cruzada? O processo Box-Jenkins é identificar, estimar e prever.

Tom Reilly #

Como diminuir a perda de informações das variáveis ​​de latência?

Respostas:

Como diminuir a perda de informações das variáveis de latência?