Estou tentando aplicar uma série temporal aos dados amostrados trimestralmente (biomassa animal) durante um período de 10 anos com 3 repetições por trimestre. Então, 40 datas, mas 120 observações totais.
Eu li até SARIMA'a na análise de séries temporais de Shumway e Stoffer e suas aplicações, bem como vasculhei Woodward, et. Análise Aplicada de Séries Temporais de al., e meu entendimento é que cada modelo é baseado em uma única observação em cada ponto da série temporal.
PERGUNTA: Como posso incluir a variação em cada observação no meu modelo? Eu poderia criar uma série sobre a média, mas perderia a variação a cada observação e acho que isso é fundamental para a minha compreensão do que está acontecendo.
Respostas:
Dependendo do que exatamente você quer dizer com "3 repetições por trimestre", um modelo de dados em painel ( wikipedia ) pode fazer sentido. Isso significa que você faz três medições a cada trimestre, uma de cada uma das três fontes distintas que permanecem as mesmas ao longo do tempo. Seus dados seriam parecidos com:
Se é isso que você está vendo, existem vários modelos para trabalhar com dados do painel. Aqui está uma apresentação decente que cobre alguns dos R básicos que você usaria para examinar os dados do painel. Este documento entra em um pouco mais de profundidade, embora do ponto de vista econômico.
No entanto, se seus dados não se encaixam perfeitamente nas metodologias de dados do painel, existem outras ferramentas disponíveis para "dados agrupados". Uma definição deste documento (pdf) :
Como você pode ver, a partir dessa definição, as técnicas que você usará dependerão do que exatamente você espera aprender com seus dados.
Se eu sugerisse um lugar para você começar, supondo que seus três empates para cada trimestre sejam consistentes ao longo do tempo, eu diria que comece usando um estimador de efeitos fixos (também conhecido como estimador interno) com um modelo de dados em painel do seu dados.
Para o meu exemplo acima, o código seria algo como:
O que nos dá a seguinte saída:
Aqui podemos ver claramente o efeito do tempo no coeficiente na variável trimestral, bem como o efeito de pertencer ao grupo B ou ao grupo C (em oposição ao grupo A).
Espero que isso aponte para algum lugar na direção certa.
fonte
Eu acho isso interessante. Minha sugestão seria calcular a média dos três pontos de dados para obter uma série temporal suave. Como você ressalta, se fizer isso ignorando que fez a média de três observações, está descartando informações. Mas para cada ponto do tempo você pode somar os desvios ao quadrado da média. Agrupe essas somas de quadrados em todos os períodos e divida por n-1 onde n é o número total de pontos usados no cálculo. Se você possui um modelo com estrutura de séries temporais (por exemplo, tendências, componente sazonal, estrutura de dependência de RA), esse cálculo pode ser uma estimativa independente e imparcial da variação do termo de erro no modelo.
fonte