Como saber se os resíduos são correlacionados automaticamente a partir de um gráfico

12

Quando você faz uma regressão OLS e plota os resíduos resultantes, como saber se os resíduos são correlacionados automaticamente? Eu sei que existem testes para isso (Durbin, Breusch-Godfrey), mas eu queria saber se você pode apenas olhar para um gráfico para avaliar se a autocorrelação pode ser um problema (porque, por heterocedasticidade, é bastante fácil fazê-lo).

John Doe
fonte

Respostas:

12

Não apenas você pode olhar para um enredo, mas acho que geralmente é uma opção melhor. O teste de hipóteses nessa situação responde à pergunta errada.

O gráfico usual a ser observado seria uma função de autocorrelação (ACF) de resíduos.

A função de autocorrelação é a correlação dos resíduos (como uma série temporal) com seus próprios atrasos.

Aqui, por exemplo, está o ACF de resíduos de um pequeno exemplo de Montgomery et al.

ACF de resíduos para vendas de refrigerantes

Algumas das correlações da amostra (por exemplo, nos lags 1,2 e 8) não são particularmente pequenas (e podem afetar substancialmente as coisas), mas também não podem ser identificadas pelo efeito do ruído (a amostra é muito pequena).

Edit: Aqui está um gráfico para ilustrar a diferença entre uma série não correlacionada e uma altamente correlacionada (na verdade, uma série não estacionária)

Ruído branco e caminhada aleatória

O gráfico superior é ruído branco (independente). A mais baixa é uma caminhada aleatória (cujas diferenças são as séries originais) - possui autocorrelação muito forte.

Glen_b -Reinstate Monica
fonte
1
Obrigado pela resposta. Quando você olha para as plotagens no wiki ( en.wikipedia.org/wiki/File:Acf_new.svg ), você pode dizer a partir da plotagem superior (não da plotagem ACF) que os resíduos são correlacionados automaticamente?
John Doe
Eu diria "hmm, parece vagamente cíclico ... pode ser autocorrelação, não pode. Como é o ACF?"
Glen_b -Reinstala Monica
1
Tudo bem, mas você poderia elaborar isso: Por exemplo, encontrei esta pergunta: stats.stackexchange.com/questions/14914/… Aparentemente, há autocorrelação. O que estou procurando especificamente para chegar a essa conclusão?
21813 John Doe
Claro, esse mostra algo que produzirá autocorrelação positiva (embora eu provavelmente atribuísse isso à tendência e à dependência da tendência). Considere - se as observações são independentes, pense na possibilidade de uma longa corrida delas estar de um lado da média ou do outro, e nenhuma no lado oposto. Eu acho que a melhor primeira opção é simular dados que são correlacionados automaticamente em vários níveis e olhar para eles.
Glen_b -Reinstala Monica
1
Entendo que você não tem autocorrelação quando os dados são distribuídos aleatoriamente. Mas, como um indicador de autocorrelação, é suficiente quando os dados não são distribuídos aleatoriamente ou você faz um tipo de padrão (por exemplo, um ponto de dados com um valor alto é seguido por vários pontos de dados com um valor alto)?
31413 John Doe
2

Não é incomum se 5% ou menos dos valores de autocorrelação ficarem fora dos intervalos, pois isso pode ocorrer devido à variação da amostra. Uma prática é produzir um gráfico de autocorrelação para os 20 primeiros valores e verificar se mais de um valor está fora dos intervalos permitidos.

Leo
fonte