Análise de intervenção com séries temporais multidimensionais

11

Eu gostaria de fazer uma análise de intervenção para quantificar os resultados de uma decisão política sobre as vendas de álcool ao longo do tempo. No entanto, sou bastante novo na análise de séries temporais, por isso tenho algumas perguntas para iniciantes.

Um exame da literatura revela que outros pesquisadores usaram o ARIMA para modelar as vendas temporais de álcool, com variáveis ​​simuladas como regressor para modelar o efeito da intervenção. Embora isso pareça uma abordagem razoável, meu conjunto de dados é um pouco mais rico do que aqueles que encontrei na literatura. Primeiro, meu conjunto de dados é desagregado por tipo de bebida (por exemplo, cerveja, vinho, bebidas espirituosas) e depois desagregado por zona geográfica.

Embora eu possa criar análises separadas do ARIMA para cada grupo desagregado e depois comparar os resultados, suspeito que exista uma abordagem melhor aqui. Alguém mais familiarizado com os dados de séries temporais multidimensionais pode fornecer sugestões ou poitners?

fmark
fonte

Respostas:

9

O modelo ARIMA com uma variável dummy para uma intervenção é um caso especial de um modelo linear com erros ARIMA.

Você pode fazer o mesmo aqui, mas com um modelo linear mais rico, incluindo fatores para o tipo de bebida e zonas geográficas.

Em R, o modelo pode ser estimado usando arima () com as variáveis ​​de regressão incluídas pelo argumento xreg. Infelizmente, você terá que codificar os fatores usando variáveis ​​fictícias, mas, caso contrário, é relativamente direto.

Rob Hyndman
fonte
6

Se você deseja modelar as vendas de tipos de bebidas como um vetor [vendas de vinho em t, vendas de cerveja em t, vendas de bebidas espirituosas em t], convém olhar para os modelos de regressão automática de vetores (VAR). Você provavelmente deseja a variedade VARX que possui um vetor de variáveis ​​exógenas como região e manequim de intervenção política, juntamente com as seqüências de vinho, cerveja e bebidas espirituosas. Eles são bastante simples de ajustar e você terá funções de resposta a impulso para expressar o impacto de choques exógenos, o que também pode ser interessante. Há uma discussão abrangente no livro de Lütkepohl sobre séries temporais multivariadas.

Finalmente, eu certamente não sou economista, mas parece-me que você também pode pensar nas proporções desses tipos de bebidas e nos níveis. As pessoas provavelmente operam sob uma restrição orçamentária de bebidas alcoólicas - eu sei que sim - que uniria os níveis e (anti-) correlacionaria os erros.

conjugado
fonte
3

Cada série temporal deve ser avaliada separadamente com a idéia final de coletar, ou seja, agrupar séries semelhantes em grupos ou seções como tendo estrutura semelhante / comum. Como os dados de séries temporais podem ser interferidos por uma estrutura determinística desconhecida em pontos não especificados no tempo, recomenda-se fazer a Detecção de Intervenção para descobrir onde a intervenção realmente teve efeito. Se você sabe que uma lei entrou em vigor em um ponto específico (de jure), isso pode (de fato) não ser a data em que a intervenção realmente aconteceu. Os sistemas podem responder antecipadamente a uma data de efeito conhecida ou mesmo após a data devido a não conformidade ou não resposta. A especificação da data da intervenção pode levar ao viés de especificação do modelo. Eu sugiro que você pesquise no Google "Intervention Detection" ou "Outlier Detection". Um bom livro sobre isso seria do Prof. Wei, da Temple University, publicado por Addison-Wessley. Eu acredito que o título é "Análise de séries temporais". Um comentário adicional de que uma variável de intervenção pode aparecer como uma mudança de pulso ou nível / etapa ou um impulso sazonal ou uma tendência de hora local.

Em resposta à expansão da discussão sobre tendências de horário local:

Se você possui uma série que exibe 1,2,3,4,5,7,9,11,13,15,16,17,18,19 ... houve uma mudança de tendência no período 5 e em 10 Para mim, uma questão principal em séries temporais é a detecção de mudanças de nível, por exemplo, 1,2,3,4,5,8,9,10, .. ou outro exemplo de mudança de nível 1,1,1,1,2 , 2,2,2, AND / OR ou a detecção de quebras de tendência temporal. Assim como um pulso é a diferença de um passo, um passo é a diferença de uma tendência. Estendemos a teoria da detecção de intervenção para a quarta dimensão i, e, mudança de ponto de tendência. Em termos de abertura, pude implementar esses esquemas de detecção de intervenção em conjunto com os modelos ARIMA e Transfer Function. Sou um dos estatísticos seniores de séries temporais que colaboraram no desenvolvimento da AUTOBOX, que incorpora esses recursos. Não conheço ninguém que tenha programado essa emocionante inovação.

IrishStat
fonte
Você poderia elaborar um pouco mais sobre a Local Time Trendaparência de uma variável de intervenção? Eu estou familiarizado com os outros três.
fmark
Além disso, você pode me indicar um pacote R que possa fazer a detecção de intervenção?
Fev1
1
Se você possui uma série que exibe 1,2,3,4,5,7,9,11, ... houve uma mudança na tendência no período 5. A principal questão nas séries temporais é a detecção de mudanças de nível, por exemplo. 1,2,3,4,5,8,9,10, .. ou outro exemplo de mudança de nível 1,1,1,1,2,2,2,2, ou a detecção de quebras de tendência temporal.
IrishStat
Como encontrar intervenções em uma série temporal com regressores externos? Como alguém saberia que o regressor não explica a intervenção?
24419 Frank
se uma intervenção em Y é encontrada APÓS o impacto de X e é uma história de Y. ENTÃO é declarada uma anomalia / pulso com regressores externos.
IrishStat