Eu tenho uma série temporal simples com 5 a 10 pontos de dados por conjunto de dados em intervalos regulares. Gostaria de saber qual é a melhor maneira de determinar se dois conjuntos de dados são diferentes. Devo tentar testes t em cada ponto de dados, ou olhar para a área sob as curvas ou há algum tipo de modelo multivariado que funcionaria melhor?
16
Respostas:
Você precisará especificar com precisão o que você quer dizer com "diferente". Você também precisará especificar quais suposições você deseja fazer sobre a estrutura de correlação serial dentro de cada série temporal.
Com os testes t, você está comparando a média de cada grupo e assumindo que os grupos consistem em observações independentes com variações iguais (o último às vezes é relaxado). Ao testar séries temporais, a suposição de independência geralmente não é razoável, mas é necessário substituí-la por uma estrutura de correlação especificada - por exemplo, você pode assumir que a série cronológica segue os processos AR (1) com igual autocorrelação. Consequentemente, até comparar as médias de duas ou mais séries temporais é consideravelmente mais difícil do que com dados independentes.
Eu especificava cuidadosamente quais suposições eu estava disposto a fazer sobre cada série temporal e o que eu queria comparar e, em seguida, usava um bootstrap paramétrico (baseado no modelo assumido) para realizar o teste.
fonte
Talvez medidas repetidas anova seja o que você deseja. Ele permite comparar os assuntos (fatores inter-assuntos) e, ao mesmo tempo, tomar a estrutura correlacionada das "séries temporais" por assunto (fator intra-sujeito). É um método fácil, porém datado, e pode ser encontrado no contexto de "modelos lineares gerais"; ele precisa de alguns recursos adicionais (por exemplo, esfericidade). Outra maneira poderia ser modelos lineares mistos que permitam estruturas de correlações mais gerais (até AR (1) como sugerido por Rob) e dados desequilibrados.
fonte
Se você deseja assumir uma tendência linear simples, pode tirar a diferença de cada conjunto de dados nos vários momentos e testar se a inclinação da linha é zero.
-Ralph Winters
fonte