Como você escolhe uma unidade de análise (nível de agregação) em uma série temporal?

13

Se você pode medir uma série temporal de observações em qualquer nível de precisão no tempo, e seu objetivo do estudo é identificar uma relação entre X e Y, existe alguma justificativa empírica para escolher um nível específico de agregação em detrimento de outro ou deve a escolha pode ser feita simplesmente com base na teoria e / ou limitações práticas?

Eu tenho três sub-perguntas a esta principal:

  1. Existe alguma variação não aleatória em X ou Y dentro de um nível maior de raciocínio suficiente para escolher um nível menor de agregação (onde não aleatório é algum padrão temporal das observações)?

  2. Alguma variação no relacionamento entre X e Y em um nível menor de agregação é suficiente para justificar a menor unidade de análise? Se alguma variação é aceitável, como alguém decide quanta variação é demais?

  3. As pessoas podem citar argumentos que consideram convincentes / bem definidos para uma unidade de análise em detrimento de outra, seja por razões empíricas ou por razões teóricas?

Estou bem ciente do problema da unidade de área modificável na análise espacial ( Openshaw, 1984 ). Não pretendo ser especialista no material, mas tudo o que penso até agora é que uma unidade menor de análise é sempre melhor, pois é menos provável que se cometa uma falácia ecológica ( Robinson, 1950 ). Se alguém tiver uma referência ou resposta diretamente pertinente relativa às unidades geográficas de agregação, eu também apreciaria essa resposta.

Andy W
fonte

Respostas:

9

Introdução

Meu interesse pelo assunto agora é de cerca de 7 anos e resultou em tese de doutorado. Séries temporais: agregação, desagregação e memória longa , onde foi prestada atenção a uma questão específica de problema de desagregação transversal para o esquema AR (1).

Dados

Trabalhando com diferentes abordagens de agregação, a primeira pergunta que você precisa esclarecer é com que tipo de dados você lida (meu palpite é espacial, o mais emocionante). Na prática, você pode considerar a agregação temporal (ver Silvestrini, A. e Veridas, D. (2008) ), transversal (adorei o artigo de Granger, CWJ (1990) ) ou o tempo e o espaço (a agregação espacial é bem pesquisada dentro Giacomini, R. e Granger, CWJ (2004) ).

Respostas (longas)

Agora, respondendo suas perguntas, coloquei uma intuição aproximada em primeiro lugar. Como os problemas que encontro na prática são frequentemente baseados em dados inexatos (a suposição de Andy

você pode medir uma série temporal de observações em qualquer nível de precisão no tempo

parece forte demais para a macroeconomia, mas boa para a área financeira e microeconométrica ou qualquer campo experimental, você controla muito bem a precisão) Eu tenho que ter em mente que minhas séries temporais mensais são menos precisas do que quando trabalho com dados anuais. Além de séries temporais mais frequentes, pelo menos em macroeconomia têm padrões sazonais , que podem levar a espúriaresultados (partes sazonais não se correlacionam com as séries), portanto, é necessário ajustar sazonalmente seus dados - outra fonte de menor precisão para dados de maior frequência. Trabalhar com dados transversais revelou que um alto nível de desagregação traz mais problemas, provavelmente com muitos zeros para lidar. Por exemplo, uma família em particular no painel de dados pode comprar um carro uma vez a cada 5 a 10 anos, mas a demanda agregada por carros novos (usados) é muito mais suave (mesmo para uma pequena cidade ou região).

A agregação de pontos mais fracos sempre resulta na perda de informações, você pode ter o PIB produzido pela seção transversal dos países da UE durante toda a década (por exemplo, período de 2001 a 2010), mas perderá todos os recursos dinâmicos que podem estar presentes em sua análise, considerando o conjunto de dados do painel detalhado. A agregação transversal em larga escala pode se tornar ainda mais interessante: você, grosso modo, pega coisas simples (memória curta AR (1)) calcula a média delas em uma população bastante grande e obtém um agente de memória longa "representativo" que não se assemelha a nenhum dos micro unidades (mais uma pedra para o conceito do agente representativo). Portanto, agregação ~ perda de informação ~ propriedades diferentes dos objetos e você gostaria de assumir o controle sobre o nível dessa perda e / ou novas propriedades. Na minha opinião, é melhor ter dados precisos de nível micro com a maior frequência possível, mas ...

Tecnicamente, produzindo qualquer análise de regressão, você precisa de mais espaço (graus de liberdade) para estar mais ou menos confiante de que (pelo menos) estatisticamente seus resultados não são lixo eletrônico, embora ainda possam ser teóricos e lixo eletrônico :) pesos para as perguntas 1 e 2 (geralmente escolha dados trimestrais para a macroanálise). Respondendo à 3ª sub-pergunta, tudo o que você decide em aplicações práticas o que é mais importante para você: dados mais precisos ou graus de liberdade. Se você levar em conta a suposição mencionada, é preferível usar dados mais detalhados (ou com frequência mais alta).

Provavelmente a resposta será editada depois de algum tipo de discussão, se houver.

Dmitrij Celov
fonte
Obrigado pela resposta. Levarei pelo menos alguns dias para processar os materiais que você apresentou. Gostaria também de dizer que sua dissertação é incrivelmente agradável e, depois de ler sua introdução, espero ler o resto.
21711 Andy