Um teste usual de significância ao observar duas populações é o teste t, teste t pareado, se possível. Isso pressupõe que a distribuição é normal.
Existem suposições simplificadoras semelhantes que produzem um teste de significância para uma série temporal? Especificamente, temos duas populações razoavelmente pequenas de camundongos que estão sendo tratados de maneira diferente e medimos o peso uma vez por semana. Ambos os gráficos exibem funções crescentes sem problemas, com um gráfico definitivamente acima do outro. Como quantificamos a "definitividade" nesse contexto?
A hipótese nula deve ser que os pesos das duas populações "se comportem da mesma maneira" com o passar do tempo. Como se pode formular isso em termos de um modelo simples que é bastante comum (assim como as distribuições normais são comuns) com apenas um pequeno número de parâmetros? Uma vez feito isso, como podemos medir a significância ou algo análogo aos valores-p? Que tal emparelhar os ratos, combinando o maior número possível de características, com cada par tendo um representante de cada uma das duas populações?
Gostaria de receber um ponteiro para algum livro ou artigo relevante, bem escrito e de fácil compreensão sobre séries temporais. Eu começo como um ignorante. Obrigado pela ajuda.
David Epstein
fonte
Respostas:
Existem várias maneiras de fazer isso, se você pensar nas variações de peso como um processo dinâmico.
Por exemplo, ele pode ser modelado como um integradorx˙( t ) = θ x ( t ) + v ( t )
onde é a variação de peso, se relaciona com a rapidez com que o peso muda e é um distúrbio estocástico que pode afetar a variação de peso. Você pode modelar como , para um conhecido (você também pode estimar).θ v ( t ) v ( t ) N ( 0 , Q ) Qx ( t ) θ v ( t ) v ( t ) N( 0 , Q ) Q
A partir daqui, você pode tentar identificar o parâmetro para as duas populações (e sua covariância), usando, por exemplo, um método de erro de previsão. Se a suposição gaussiana for mantida, os métodos de erro de previsão indicarão que a estimativa de também é gaussiana (assintoticamente) e, portanto, é possível construir um teste de hipótese para determinar se a estimativa de é estatisticamente próxima da .θ θ 1 θ 2θ θ θ1 θ2
Para uma referência, posso sugerir este livro .
fonte
Eu sugeriria a identificação de um modelo ARIMA para cada camundongo separadamente e, em seguida, os revisaria quanto a similaridades e generalização. Por exemplo, se o primeiro mouse tiver um AR (1) e o segundo um AR (2), o modelo mais geral (maior) seria um AR (2). Estime esse modelo globalmente, ou seja, para as séries temporais combinadas. Compare a soma dos quadrados dos erros do conjunto combinado com a soma das duas somas dos quadrados dos erros individuais para gerar um valor F para testar a hipótese de parâmetros constantes entre os grupos. Desejo que você possa postar seus dados e ilustrarei esse teste com precisão.
COMENTÁRIOS ADICIONAIS:
Como o conjunto de dados é correlacionado automaticamente, a normalidade não se aplica. Se as observações forem independentes ao longo do tempo, pode-se aplicar alguns dos métodos conhecidos de séries não-temporais. Em termos de sua solicitação sobre um livro de fácil leitura sobre séries temporais, sugiro o texto Wei de Addison-Wesley. Os cientistas sociais acharão a abordagem não matemática de Mcleary e Hay (1980) mais intuitiva, mas sem rigor.
fonte