Correlação entre duas séries temporais

24

Qual é a maneira / método mais fácil de calcular a correlação entre duas séries temporais exatamente do mesmo tamanho? Pensei em multiplicar e e somar a multiplicação. Então, se esse número único foi positivo, podemos dizer que essas duas séries estão correlacionadas? Posso pensar em alguns exemplos, no entanto, onde uma outra série temporal linearmente crescente exponencialmente não teria relação entre si, mas a computação acima relataria que elas estavam correlacionadas.( y [ t ] - μ y )(x[t]μx)(y[t]μy)

Alguma ideia?

BBDynSys
fonte
3
Você já ouviu falar da função de correlação cruzada - en.wikipedia.org/wiki/Cross-correlation#Time_series_analysis ?
Macro
Suas duas séries temporais são exatamente do mesmo tamanho. Veja stats.stackexchange.com/questions/3463/… como semelhante, não muito idêntico à sua pergunta, com duas séries do mesmo tamanho e frequência, embora não sejam estacionárias.
Ellie Kesselman

Respostas:

11

O ponto de macro está correto: a maneira correta de comparar relações entre séries temporais é pela função de correlação cruzada (assumindo estacionariedade). Ter o mesmo comprimento não é essencial. A correlação cruzada no atraso 0 apenas calcula uma correlação como fazer a estimativa de correlação de Pearson emparelhando os dados nos pontos de tempo idênticos. Se eles tiverem o mesmo comprimento que você está assumindo, você terá pares T exatos onde T é o número de pontos no tempo para cada série. A correlação cruzada de atraso 1 corresponde ao tempo t da série 1 com o tempo t + 1 na série 2. Observe que, embora a série tenha o mesmo comprimento, você só possui um par T-2, pois um ponto da primeira série não tem correspondência na segunda. e um outro ponto da segunda série não terá correspondência da primeira. Dadas essas duas séries, é possível estimar a correlação cruzada em vários atrasos. Se alguma das correlações cruzadas for estatisticamente significativamente diferente de 0, indicará uma correlação entre as duas séries.

Michael R. Chernick
fonte
Oi Michael, é possível quantificar "significativamente diferente" - posso usar 1 ou 2 desvios-padrão de zero como significantes?
BBDynSys
@ user423805 Mudei para ler estatisticamente significativamente diferente de 0. Formalmente, isso significa que você testa a hipótese nula de que a correlação é zero versus a alternativa de que não é 0. Em seguida, calcule o valor p bilateral para a estatística de teste . A significância estatística geral significa o valor p médio <= 0,05. Às vezes, outros valores são usados ​​para definir significância estatística (0,01 por exemplo). A maioria dos pacotes de software de séries temporais que incluem várias séries temporais pode fazer esses testes para você. Nosso amigo IrishStat pode falar sobre isso com a Autobox.
Michael R. Chernick 24/05
existem casos em que a correlação cruzada no atraso zero e pearson diferem?
Bakaburg
4

Você pode querer olhar para uma pergunta semelhante e minha resposta Correlacionar séries temporais de volume, o que sugere que você pode calcular correlações cruzadas, MAS testá-las é um cavalo de uma cor diferente (um eqüino de um tom diferente) devido à estrutura autorregressiva ou determinística Series.

IrishStat
fonte
se bem entendi, nessa resposta você está dizendo que a correlação cruzada entre séries temporais é inútil.
BBDynSys
user423805 PODE ser inútil, a menos que os dados sejam adequadamente pré-filtrados para obter o IDI. Isso se refere diretamente às preocupações reais do OP sobre conclusões espúrias, como "cegonhas trazendo bebês J. Neyman 1938 en.wikipedia.org/wiki/… e amstat.org/about / statisticiansinhistory / ... "etc (eu posso pensar em alguns exemplos, todavia, quando uma linearmente outra série temporal crescimento exponencial que não têm nenhuma relação um ao outro, mas o cálculo acima iria relatar que estavam correlacionados.)
IrishStat
Eu acho que o ponto é que a série precisa ser estacionária para que as correlações cruzadas façam sentido. Se a filtragem for necessária, é necessário manter a série estacionária (como diferenciação ou diferenciação sazonal). Mas chamar isso de inútil está errado.
Michael R. Chernick
@ Michael eu disse pode ser inútil.
26412 IrishStat
@IrishStat Foi um bom comentário e me levou de volta à minha formação na década de 1970. Naquela época, eu estava aprendendo sobre séries temporais / métodos de previsão para meu trabalho civil no exército dos EUA. Estávamos usando suavização exponencial como uma maneira de prever com base em dados históricos sobre estimativas subjetivas que estavam sendo usadas nos depósitos de suprimentos. Alguém fez a grande sugestão para eu olhar para os modelos mais gerais do ARIMA e o texto de 1970 de Box e Jenkins, e assim comecei meu interesse por séries temporais que se tornaram parte da minha carreira.
Michael R. Chernick
-1

Há algumas coisas interessantes aqui

/programming/3949226/calculating-pearson-correlation-and-significance-in-python

Isso era realmente o que eu precisava. Simples de implementar e explicar.

BBDynSys
fonte
2
-1 Pelo que pude reunir, essas respostas estão relacionadas apenas à correlação padrão produto-momento da Pearson. Quando aplicada a duas séries temporais, a correlação padrão de Pearson fornece resultados sem sentido! Se você seguir essas sugestões, tudo o que você faz é produzir artefatos estatísticos. Veja, por exemplo, math.mcgill.ca/dstephens/OldCourses/204-2007/Handouts/…
Momo