Eu tenho duas séries temporais, mostradas na plotagem abaixo:
O gráfico mostra os detalhes completos das duas séries temporais, mas posso reduzi-lo facilmente a apenas as observações coincidentes, se necessário.
Minha pergunta é: Quais métodos estatísticos posso usar para avaliar as diferenças entre as séries temporais?
Sei que essa é uma pergunta bastante ampla e vaga, mas não consigo encontrar muito material introdutório sobre isso em nenhum lugar. Como posso ver, há duas coisas distintas para avaliar:
1. Os valores são os mesmos?
2. As tendências são as mesmas?
Que tipo de testes estatísticos você sugeriria analisar para avaliar essas perguntas? Para a pergunta 1, obviamente, posso avaliar os meios dos diferentes conjuntos de dados e procurar diferenças significativas nas distribuições, mas existe uma maneira de fazer isso que leva em consideração a natureza da série temporal dos dados?
Para a pergunta 2 - há algo como os testes de Mann-Kendall que procuram a semelhança entre duas tendências? Eu poderia fazer o teste de Mann-Kendall para os dois conjuntos de dados e comparar, mas não sei se essa é uma maneira válida de fazer as coisas, ou se existe uma maneira melhor?
Estou fazendo tudo isso em R, portanto, se você sugerir testes com um pacote R, informe-me.
fonte
Respostas:
Como outros já declararam, você precisa ter uma frequência comum de medição (ou seja, o tempo entre as observações). Com isso, eu identificaria um modelo comum que descreveria razoavelmente cada série separadamente. Pode ser um modelo ARIMA ou um modelo de regressão com várias tendências com possíveis mudanças de nível ou um modelo composto que integra variáveis de memória (ARIMA) e variáveis fictícias. Esse modelo comum pode ser estimado global e separadamente para cada uma das duas séries e, em seguida, é possível construir um teste F para testar a hipótese de um conjunto comum de parâmetros.
fonte
Considere o
grangertest()
na biblioteca lmtest .É um teste para verificar se uma série temporal é útil na previsão de outra.
Algumas referências para você começar:
https://spia.uga.edu/faculty_pages/monogan/teaching/ts/
https://spia.uga.edu/faculty_pages/monogan/teaching/ts/Kgranger.pdf
http://en.wikipedia.org/wiki/Granger_causality
fonte
Apenas deparei com isso. Sua primeira resposta nos esboça g os dois define a mesma escala (no tempo) para ver as diferenças visualmente. Você fez isso e pode ver facilmente que existem algumas diferenças gritantes. O próximo passo é usar a análise de correlação simples ... e ver quão bem eles estão relacionados usando o coeficiente de correlação (r). Se r for pequeno, sua conclusão seria que eles estão fracamente relacionados e, portanto, não há comparações desejáveis e um valor maior se r sugerir boas comparações s entre as duas séries. O terceiro passo em que existe uma boa correlação é testar a significância estatística do r. Aqui você pode usar o teste Shapiro Welch, que assumiria que as duas séries são normalmente distribuídas (hipótese nula) ou não (hipótese alternativa). Existem outros testes que você pode fazer, mas espero que minha resposta ajude.
fonte
Ajuste uma linha reta aos sinais da série temporal usando o polyfit. Em seguida, calcule o erro quadrático médio quadrado (RMSE) para ambas as linhas. O valor obtido para a linha vermelha seria bem menor que o valor obtido para a linha cinza.
Faça também as leituras em alguma frequência comum.
fonte