Estou revisando o livro 'Introductory Time Series with R' de Cowpertwait e Metcalfe. Na página 36, diz que as linhas estão em: . Eu li aqui no fórum R que as linhas estão em . ±1,96/ √
Eu executei o seguinte código:
b = c(3,1,4,1)
acf(b)
e vejo que as linhas parecem estar em . Então, obviamente, o livro está errado? Ou estou interpretando mal o que foi escrito? Os autores estão falando sobre algo um pouco diferente?
* Observe que não estou interessado na discrepância de detalhes menores de 1,96 x 2. Eu suponho que este foi apenas o autor usando a regra de ouro de 2 sd versus os 1,96 sd reais.
Edit: Eu executei esta simulação:
acf1 = 0
acf2 = 0
acf3 = 0
for(i in 1:5000){
resids= runif(1000)
residsacf = c(acf(resids,plot= FALSE))
acf1[i] = residsacf$acf[2,,1]
acf2[i] = residsacf$acf[3,,1]
acf3[i] = residsacf$acf[4,,1]
}
meanacf1 = mean(acf1)
meanacf2 = mean(acf2)
meanacf3 = mean(acf3)
meanacf1
meanacf2
meanacf3
Sempre pareço obter valores próximos de para todos os 3.
Edição adicional: estou vendo uma tendência de
r
time-series
Adão
fonte
fonte
Respostas:
A autocorrelação da amostra é enviesada negativamente e o primeiro coeficiente de autocorrelação da amostra tem média que é o número de observações. Mas Metcalfe e Cowpertwait estão incorretos ao dizer que todos os coeficientes de autocorrelação têm essa média e também estão incorretos ao dizer que R plota linhas em .−1/n n −1/n±1.96/n−−√
Assintoticamente, a média é 0 e é isso que R usa para plotar as linhas em .±1.96/n−−√
fonte