O que são relação e diferença entre séries temporais e regressão?
Para modelos e suposições , é correto que os modelos de regressão assumam independência entre as variáveis de saída para diferentes valores da variável de entrada, enquanto o modelo de série temporal não? Quais são algumas outras diferenças?
Para métodos , em um site da Darlington
Existem várias abordagens para a análise de séries temporais, mas as duas mais conhecidas são o método de regressão e o método Box-Jenkins (1976) ou ARIMA (AutoRegressive Integrated Moving Average). Este documento apresenta o método de regressão. Considero o método de regressão muito superior ao ARIMA por três razões principais
Não entendo muito bem qual é o "método de regressão" para séries temporais no site e como é diferente do método Box-Jenkins ou ARIMA. Agradeço se alguém puder dar algumas idéias sobre essas perguntas.
Obrigado e cumprimentos!
Respostas:
Eu realmente acho que essa é uma boa pergunta e merece uma resposta. O link fornecido é escrito por um psicólogo que afirma que algum método caseiro é uma maneira melhor de fazer análises de séries temporais do que a Box-Jenkins. Espero que minha tentativa de resposta incentive outras pessoas, que têm mais conhecimento sobre séries temporais, a contribuir.
Desde sua introdução, parece que Darlington está defendendo a abordagem de apenas ajustar um modelo de RA por mínimos quadrados. Ou seja, se você deseja ajustar o modelo à série temporal z t , você pode apenas regredir a série z t na série com lag 1 , lag 2 e assim por diante até lag k , usando uma regressão múltipla comum. Isso é certamente permitido; em R, é ainda uma opção no
ar
função. Eu testei e tende a dar respostas semelhantes ao método padrão para ajustar um modelo AR em R.Ele também defende a regressão de em coisas como t ou poderes de t para encontrar tendências. Novamente, isso é absolutamente bom. Muitos livros de séries temporais discutem isso, por exemplo, Shumway-Stoffer e Cowpertwait-Metcalfe. Normalmente, uma análise de série temporal pode prosseguir nas seguintes linhas: você encontra uma tendência, remove-a e ajusta um modelo aos resíduos.zt t t
Mas parece que ele também está defendendo o ajuste excessivo e, em seguida, usando a redução no erro do quadrado médio entre a série ajustada e os dados como evidência de que seu método é melhor. Por exemplo:
Essa não é uma boa ideia, porque o teste de um modelo deve ser o quão bem ele pode prever, não o quão bem ele se encaixa nos dados existentes. Nos três exemplos, ele usa o "erro quadrático médio ajustado da raiz" como critério para a qualidade do ajuste. É claro que o excesso de ajuste de um modelo tornará a estimativa de erro dentro da amostra menor, de modo que sua afirmação de que seus modelos são "melhores" porque eles têm um RMSE menor está errada.
Em poucas palavras, como ele está usando o critério errado para avaliar quão bom é um modelo, ele chega a conclusões erradas sobre regressão versus ARIMA. Aposto que, se ele tivesse testado a capacidade preditiva dos modelos, o ARIMA teria chegado ao topo. Talvez alguém possa tentar se tiver acesso aos livros que ele menciona aqui .
[Suplementar: para saber mais sobre a idéia de regressão, você pode conferir livros antigos de séries temporais que foram escritos antes do ARIMA se tornar o mais popular. Por exemplo, Kendall, Time-Series , 1973, capítulo 11, tem um capítulo inteiro sobre esse método e comparações com o ARIMA.]
fonte
E. Parzen, talvez um pouco invejoso por não ter proposto os métodos inovadores de Box e Jenkins, sugeriu essa abordagem de adaptação excessiva e, em seguida, renunciar. Ele falha por vários motivos (muitos dos quais o Solhador resumiu bem), incluindo a não identificação e correção de Pulsos, Mudanças de Nível, Pulsos Sazonais e Tendências da Hora Local. Além disso, alterações nos parâmetros ao longo do tempo ou alterações na variação do erro ao longo do tempo precisam ser consideradas.
Escrevi um artigo em que você poderia estar interessado. Ele é chamado de "Regressão vs Box-Jenkins" e está disponível em http://www.autobox.com/cms/index.php/afs-university/intro-to-forecasting / doc_download / 24-regressão-vs-caixa-jenkins
Um comentário sobre o procedimento de Darlington refletindo tempo, hora * hora, hora * hora * hora * hora como preditores. Na ausência de detecção de intervenção que leve ao isolamento de efeitos extremos, é bem possível (e incorreto!) Concluir com maiores poderes de tempo. Cuidado com os não estatísticos que realizam análises estatísticas, pois você deve ter cuidado com os estatísticos que realizam cirurgia cerebral. Para ser justo, pode-se acrescentar cuidado com estatísticos / matemáticos que não são de séries temporais que tentam realizar análises de séries temporais com treinamento limitado em análise de séries temporais.
Outros pôsteres (principalmente o whuber) nesta lista alertaram repetidamente contra o uso dessa "abordagem adequada", principalmente em um ambiente univariado. Este aviso também se aplica a modelos causais.
Espero que isto ajude.
fonte