Existe uma diferença entre uma série temporal autocorrelacionada e erros em série autocorrelacionados?

9

Tenho certeza de que estou perdendo algo óbvio aqui, mas estou bastante confuso com termos diferentes no campo de séries temporais. Se eu entendi direito, erros serialmente autocorrelacionados são um problema nos modelos de regressão (veja, por exemplo, aqui ). Minha pergunta é agora o que exatamente define um erro correlacionado automaticamente? Conheço a definição de autocorrelação e posso aplicar as fórmulas, mas isso é mais um problema de compreensão de séries temporais em regressões.

Por exemplo, vejamos a série temporal de temperaturas diárias: se hoje é um dia quente (horário de verão!), Provavelmente também está quente amanhã e vice-versa. Acho que tenho um problema em chamar esse fenômeno de "erros em série autocorrelacionados", porque simplesmente não me parece um erro, mas como algo esperado.

Mais formalmente, vamos assumir uma configuração de regressão com uma variável dependente yt e uma variável independente xt e o modelo.

yt=α+βxt+ϵt

É possível que xt é correlacionado automaticamente, enquanto ϵté iid? Se sim, o que isso significa para todos os métodos que ajustam erros padrão para autocorrelação? Você ainda precisa fazer isso ou eles se aplicam apenas a erros autocorrelacionados? Ou você sempre modelaria a autocorrelação em uma configuração desse tipo no termo de erro, para que basicamente não faça diferença sext é autocorrelacionado ou et?

Esta é a minha primeira pergunta aqui. Espero que não seja muito confuso e espero não ter perdido nada óbvio ... Também tentei pesquisar no Google e encontrei alguns links interessantes (por exemplo, aqui no SA ), mas nada realmente me ajudou.

Christoph_J
fonte

Respostas:

7

Parece-me que você está se preocupando com a diferença entre a auto-regressão (a temperatura hoje é influenciada pela temperatura ontem ou o meu consumo de heroína hoje depende do meu uso anterior de drogas) e os erros autocorrelacionados (que têm a ver com a fora da diagonal termos em termos de variância-covariância para ϵsendo diferente de zero. Seguindo o exemplo do tempo, suponha que você modele a temperatura em função do tempo, mas também é influenciado por coisas como erupções vulcânicas, que você deixou de fora do seu modelo. O vulcão envia nuvens de poeira, que bloqueiam o sol, diminuindo a temperatura. Esse distúrbio aleatório persistirá por mais de um período. Isso fará com que sua tendência de tempo pareça menos acentuada do que deveria. Para ser justo, provavelmente é o caso de que erros de auto-regressão e correlação automática são um problema de temperatura.

Erros autocorrelacionados também podem surgir em dados espaciais transversais, onde um choque aleatório que afeta a atividade econômica de uma região se espalha para outras áreas porque elas têm laços econômicos. Um choque que mata uvas na Califórnia também reduzirá as vendas de carne bovina de Montana. Você também pode induzir distúrbios autocorrelacionados se omitir uma variável independente relevante e autocorrelacionada do seu modelo de série temporal.

Dimitriy V. Masterov
fonte
Muito obrigado, Dimitriy. Você acertou: fiquei confuso sobre a diferença entre erros de regressão automática e correlação automática. Apenas para ter certeza, porém: no meu exemplo, eu modelariaxtcomo uma série temporal autorregressiva (abstraindo de erupções vulcânicas etc.) por causa dos horários de verão e inverno e não precisaria lidar com erros autocorrelacionados?
10119 Christoph_J
1
@Christoph_J Idealmente, você deseja regredir contra mais um tempo de minério para o padrão sazonal e a atividade vulcânica. Se, em vez disso, estávamos ignorando a causa dos erros autocorrelacionados, um modelo de média móvel pode ajudar. Nesse caso, seria um modelo ARIMA.
Robert Kubrick
1
@Christoph_J Não sei se entendi sua pergunta. Você quis escreverytacima? Você também deve nos contar mais sobre o problema real com o qual está lidando. Meu exemplo de temperatura foi apenas um modelo de brinquedo para destacar as questões. Existem várias soluções para lidar com o RA, a mais fácil delas é a especificação de atraso distribuído da Koyck, que se resume a estimar uma equação simples com umMUMA(1)termo de erro. No entanto, você ainda deve realizar algum tipo de teste de autocorrelação, como o Durbin-Watson, embora isso possa lhe dar um falso positivo se você não acertar as especificações.
precisa saber é o seguinte
Graças a vocês dois. @ DimitriyV.Masterov Neste ponto, não tenho um problema real. Foi por essa razão que tentei enquadrar meu problema da maneira mais geral possível. Penso que luto apenas com as séries cronológicas, por um lado, e com as regressões, por outro. Às vezes, parecem ser duas questões completamente diferentes; se eu entendi direito, há casos em que você apenas tenta modelar uma série temporal (quantos atrasos ela possui? é estacionária? etc.). No outro extremo, às vezes você parece regredir uma série temporal do outro, sem prestar muita atenção ao fato de ser um TS.
21812 Christop_J #
E às vezes tenho alguns problemas: qual é o melhor caminho a seguir: preciso modelar o processo autorregressivo primeiro ou posso corrigir a autocorrelação nos termos do erro? No entanto, no que diz respeito à minha pergunta, a resposta de você e Robert ajudou muito e acho que, na minha área (modelos de fatores em finanças), devemos lidar com erros correlacionados em série, e não com autorregressão. Se outra pergunta surgir, eu faria uma nova pergunta.
Christoph_J
4

Apenas para adicionar uma resposta muito boa a Dimitriy: a autocorrelação de erros apresenta problemas para o cálculo do erro padrão dos coeficientes e, portanto, os níveis de significância, ou valor p, tornando a seleção de IVs menos direta. R2 e o valor F também são afetados.

De todas as premissas da regressão linear (homoscedasticidade, independência dos resíduos, linearidade da relação IVs -> DV, normalidade dos resíduos), linearidade e independência dos resíduos são aquelas que impactam os resultados mais seriamente se violadas.

Robert Kubrick
fonte