Relação e diferença entre séries temporais e regressão?

12

O que são relação e diferença entre séries temporais e regressão?

Para modelos e suposições , é correto que os modelos de regressão assumam independência entre as variáveis ​​de saída para diferentes valores da variável de entrada, enquanto o modelo de série temporal não? Quais são algumas outras diferenças?

Para métodos , em um site da Darlington

Existem várias abordagens para a análise de séries temporais, mas as duas mais conhecidas são o método de regressão e o método Box-Jenkins (1976) ou ARIMA (AutoRegressive Integrated Moving Average). Este documento apresenta o método de regressão. Considero o método de regressão muito superior ao ARIMA por três razões principais

Não entendo muito bem qual é o "método de regressão" para séries temporais no site e como é diferente do método Box-Jenkins ou ARIMA. Agradeço se alguém puder dar algumas idéias sobre essas perguntas.

Obrigado e cumprimentos!

Tim
fonte
2
A maioria das respostas e comentários aqui se concentra na pergunta mais específica no final. Isso é apenas um sinal de que a análise de séries temporais é muito, muito mais do que Box-Jenkins ou ARIMA. Campos inteiros da análise de séries temporais têm um foco bem diferente (ou pelo menos mais geral). Modelos de componentes não observados são apenas um dos vários exemplos.
Nick Cox

Respostas:

17

Eu realmente acho que essa é uma boa pergunta e merece uma resposta. O link fornecido é escrito por um psicólogo que afirma que algum método caseiro é uma maneira melhor de fazer análises de séries temporais do que a Box-Jenkins. Espero que minha tentativa de resposta incentive outras pessoas, que têm mais conhecimento sobre séries temporais, a contribuir.

Desde sua introdução, parece que Darlington está defendendo a abordagem de apenas ajustar um modelo de RA por mínimos quadrados. Ou seja, se você deseja ajustar o modelo à série temporal z t , você pode apenas regredir a série z t na série com lag 1 , lag 2 e assim por diante até lag k , usando uma regressão múltipla comum. Isso é certamente permitido; em R, é ainda uma opção no

zt=α1zt-1++αkzt-k+εt
ztzt12karfunção. Eu testei e tende a dar respostas semelhantes ao método padrão para ajustar um modelo AR em R.

Ele também defende a regressão de em coisas como t ou poderes de t para encontrar tendências. Novamente, isso é absolutamente bom. Muitos livros de séries temporais discutem isso, por exemplo, Shumway-Stoffer e Cowpertwait-Metcalfe. Normalmente, uma análise de série temporal pode prosseguir nas seguintes linhas: você encontra uma tendência, remove-a e ajusta um modelo aos resíduos.zttt

Mas parece que ele também está defendendo o ajuste excessivo e, em seguida, usando a redução no erro do quadrado médio entre a série ajustada e os dados como evidência de que seu método é melhor. Por exemplo:

Sinto que os correlogramas estão obsoletos. Seu objetivo principal era permitir que os trabalhadores adivinhassem quais modelos se encaixariam melhor nos dados, mas a velocidade dos computadores modernos (pelo menos em regressão, se não no ajuste de modelos de séries temporais) permite que um trabalhador simplesmente ajuste vários modelos e veja exatamente como cada um se ajusta conforme medido pelo erro médio quadrático. [A questão da capitalização do acaso não é relevante para essa escolha, pois os dois métodos são igualmente suscetíveis a esse problema.]

Essa não é uma boa ideia, porque o teste de um modelo deve ser o quão bem ele pode prever, não o quão bem ele se encaixa nos dados existentes. Nos três exemplos, ele usa o "erro quadrático médio ajustado da raiz" como critério para a qualidade do ajuste. É claro que o excesso de ajuste de um modelo tornará a estimativa de erro dentro da amostra menor, de modo que sua afirmação de que seus modelos são "melhores" porque eles têm um RMSE menor está errada.

Em poucas palavras, como ele está usando o critério errado para avaliar quão bom é um modelo, ele chega a conclusões erradas sobre regressão versus ARIMA. Aposto que, se ele tivesse testado a capacidade preditiva dos modelos, o ARIMA teria chegado ao topo. Talvez alguém possa tentar se tiver acesso aos livros que ele menciona aqui .

[Suplementar: para saber mais sobre a idéia de regressão, você pode conferir livros antigos de séries temporais que foram escritos antes do ARIMA se tornar o mais popular. Por exemplo, Kendall, Time-Series , 1973, capítulo 11, tem um capítulo inteiro sobre esse método e comparações com o ARIMA.]

Solha
fonte
A questão é quais são as diferenças (inerentes)?
Hbhishani
Tanto quanto posso dizer, o autor nunca descreveu seu método de fermentação caseira em uma publicação revisada por pares, e as referências de e para a literatura estatística parecem mínimas e suas principais publicações sobre tópicos metodológicos datam dos anos 70. A rigor, nada disso “prova” nada, mas sem tempo ou experiência suficientes para avaliar as reivindicações, eu ficaria extremamente relutante em usar qualquer uma delas.
Gala
@hbaghishani a diferença substantiva é que os dados autocorrelacionados, ou seja, dentro de cada série distorcem a interpretação correlacional cruzada. Além disso, violações gaussianas, por exemplo, média constante dos erros, variação constante ao longo do tempo, parâmetros constantes ao longo do tempo precisam ser considerados / corrigidos.
IrishStat
As pessoas escrevem livros didáticos para vendê-los e obter recompensas. Às vezes, eles incluem métodos anacrônicos que estão sendo ensinados incorretamente, porque em alguma data anterior eles eram considerados corretos. Para aumentar as vendas, o editor geralmente exige (da minha experiência pessoal) metodologia desatualizada, porém incorreta, porque esses métodos estão no plano de estudos.
IrishStat
A modelagem de dados autocorrelacionados do @IrishStat pode ser feita por modelos de regressão dinâmica. Além disso, outros modelos, como modelos mistos, podem ser usados ​​para esses dados. Portanto, não acho que esse recurso seja a diferença substantiva.
Hbhishani
7

E. Parzen, talvez um pouco invejoso por não ter proposto os métodos inovadores de Box e Jenkins, sugeriu essa abordagem de adaptação excessiva e, em seguida, renunciar. Ele falha por vários motivos (muitos dos quais o Solhador resumiu bem), incluindo a não identificação e correção de Pulsos, Mudanças de Nível, Pulsos Sazonais e Tendências da Hora Local. Além disso, alterações nos parâmetros ao longo do tempo ou alterações na variação do erro ao longo do tempo precisam ser consideradas.

Escrevi um artigo em que você poderia estar interessado. Ele é chamado de "Regressão vs Box-Jenkins" e está disponível em http://www.autobox.com/cms/index.php/afs-university/intro-to-forecasting / doc_download / 24-regressão-vs-caixa-jenkins

Um comentário sobre o procedimento de Darlington refletindo tempo, hora * hora, hora * hora * hora * hora como preditores. Na ausência de detecção de intervenção que leve ao isolamento de efeitos extremos, é bem possível (e incorreto!) Concluir com maiores poderes de tempo. Cuidado com os não estatísticos que realizam análises estatísticas, pois você deve ter cuidado com os estatísticos que realizam cirurgia cerebral. Para ser justo, pode-se acrescentar cuidado com estatísticos / matemáticos que não são de séries temporais que tentam realizar análises de séries temporais com treinamento limitado em análise de séries temporais.

Outros pôsteres (principalmente o whuber) nesta lista alertaram repetidamente contra o uso dessa "abordagem adequada", principalmente em um ambiente univariado. Este aviso também se aplica a modelos causais.

Espero que isto ajude.

IrishStat
fonte