O que é a função de autocorrelação?

16

Alguém pode explicar a função de autocorrelação em dados de séries temporais? Aplicando acf aos dados, qual seria o aplicativo?

user1471980
fonte
No contexto de séries temporais estacionárias de sentido amplo, ele fornece uma medida de dependência de uma série temporal para sua versão atrasada.
Cagdas Ozgenc #
1
é uma medida de quanto o valor atual é influenciado pelos valores anteriores em uma série temporal.
precisa saber é o seguinte
@htrahdis Como na configuração de regressão padrão, cuidado com a correlação conflitante com influência (ou causação).
whuber
@ Andy Esse tópico de fato parece semelhante - obrigado por localizá-lo - mas a resposta aceita (e única) não aborda diretamente essa questão: ela se concentra em um ACF específico. Como tal, fornece uma ilustração de como o ACF pode ser interpretado, mas não está claro para mim se algum desses materiais responde ao presente pedido de uma explicação dos ACFs em geral.
whuber

Respostas:

31

Diferentemente dos dados de amostragem regulares, os dados de séries temporais são ordenados. Portanto, há informações extras sobre sua amostra das quais você poderia tirar proveito, se houver padrões temporais úteis. A função de autocorrelação é uma das ferramentas usadas para encontrar padrões nos dados. Especificamente, a função de autocorrelação informa a correlação entre pontos separados por vários intervalos de tempo. Como exemplo, aqui estão alguns valores possíveis da função acf para uma série com períodos discretos:

A notação é ACF (n = número de períodos entre pontos) = correlação entre pontos separados por n períodos. Vou dar exemplos para os primeiros valores de n.

ACF (0) = 1 (todos os dados estão perfeitamente correlacionados entre si), ACF (1) = 0,9 (a correlação entre um ponto e o próximo ponto é 0,9), ACF (2) = 0,4 (a correlação entre um ponto e um ponto dois passos à frente é 0,4) ... etc.

Portanto, o ACF informa como os pontos correlacionados estão entre si, com base em quantas etapas de tempo elas são separadas. Essa é a essência da autocorrelação, é a correlação entre os pontos de dados passados ​​e os pontos de dados futuros, para diferentes valores da separação de tempo. Normalmente, você esperaria que a função de autocorrelação caísse para 0 à medida que os pontos se tornassem mais separados (ou seja, n se torna grande na notação acima), porque geralmente é mais difícil prever o futuro a partir de um determinado conjunto de dados. Isso não é uma regra, mas é típico.

Agora, para a segunda parte ... por que nos importamos? A ACF e sua função irmã, a parcialA função de autocorrelação (mais sobre isso daqui a pouco) é usada na abordagem de modelagem Box-Jenkins / ARIMA para determinar como os pontos de dados passados ​​e futuros são relacionados em uma série temporal. A função de autocorrelação parcial (PACF) pode ser vista como a correlação entre dois pontos que são separados por algum número de períodos n, MAS com o efeito das correlações removidas. Isso é importante porque, digamos, na realidade, cada ponto de dados está diretamente diretamente correlacionado com o ponto de dados NEXT e nenhum outro. No entanto, APARECERÁ como se o ponto atual estivesse correlacionado com outros pontos no futuro, mas apenas devido a um efeito do tipo "reação em cadeia", ou seja, T1 está diretamente correlacionado com T2 que está diretamente correlacionado com T3, então parece T1 está diretamente correlacionado com T3. O PACF removerá a correlação intermediária com T2 para que você possa discernir melhor os padrões. Uma boa introdução a isso éaqui.

O manual NIST Engineering Statistics, online, também possui um capítulo sobre isso e um exemplo de análise de séries temporais usando autocorrelação e autocorrelação parcial. Não vou reproduzi-lo aqui, mas passo a passo e você deve ter um entendimento muito melhor da autocorrelação.


fonte
2

deixe-me dar outra perspectiva.

plote os valores defasados ​​de uma série temporal com os valores atuais da série temporal.

se o gráfico que você vê é linear, significa que há uma dependência linear entre os valores atuais da série temporal e os valores atrasados ​​da série temporal.

Os valores de autocorrelação são a maneira mais óbvia de medir a linearidade dessa dependência.

htrahdis
fonte