Parece que é realmente alto, mas isso é contra-intuitivo para mim. Alguém pode me explicar? Estou muito confuso com esta questão e gostaria de receber uma explicação detalhada e perspicaz. Muito obrigado antecipadamente!
fonte
Parece que é realmente alto, mas isso é contra-intuitivo para mim. Alguém pode me explicar? Estou muito confuso com esta questão e gostaria de receber uma explicação detalhada e perspicaz. Muito obrigado antecipadamente!
(Eu escrevi isso como resposta a outro post, que foi marcado como duplicado deste enquanto eu o escrevia; achei que o postaria aqui em vez de jogá-lo fora. Parece que diz coisas muito semelhantes às do whuber's resposta, mas é apenas diferente o suficiente para que alguém possa tirar algo disso.)
Uma caminhada aleatória tem a forma
Observe que
Portanto, .
Observe também que
Conseqüentemente .
Ou seja, você deve ver uma correlação de quase 1, porque assim que começa a ficar grande, e são quase exatamente a mesma coisa - a diferença relativa entre eles tende a ser bastante pequena.
Você pode ver isso mais facilmente plotando vs .
Agora podemos vê-lo de forma intuitiva - imagine desceu para (como vemos na simulação de uma caminhada aleatória com o termo padrão de ruído normal). Então, estará bem próximo de ; pode ser ou mas é quase certo que esteja dentro de algumas unidades de . Assim, à medida que a série sobe e desce, o gráfico de vs quase sempre fica dentro de uma faixa bastante estreita da linha ... mas à medida que cresce, os pontos cobrem mais e trechos maiores ao longo desseline (a propagação ao longo da linha cresce com , mas a propagação vertical permanece aproximadamente constante); a correlação deve se aproximar de 1.
No contexto da sua pergunta anterior , uma "caminhada aleatória" é uma realização de uma caminhada aleatória binomial. Autocorrelação é a correlação entre o vetor e o vetor dos próximos elementos .
A própria construção de uma caminhada aleatória binomial faz com que cada seja diferente de cada por uma constante. Depois de percorrer a caminhada por um tempo, os valores de se afastaram do valor inicial e, portanto, geralmente cobrem uma boa faixa, geralmente proporcional a de comprimento. Assim, o gráfico de dispersão lag-1 dos pares consistirá em pontos situados apenas nas linhas , estando, em média, próximos da linha . Os resíduos serão próximos a (xi,x i + 1 )y=x±1y=x±11( √. Portanto, na grande maioria das realizações, a variação dos resíduos (cerca de ) em comparação com a variação dos valores (aproximadamente na ordem de ) será pequena . Esperamos que seja aproximadamenteR2
Aqui está uma imagem de etapas em uma caminhada aleatória (à esquerda) e seu gráfico de dispersão lag-1 (à direita). O código de cores é usado para ajudá-lo a encontrar pontos correspondentes nas duas plotagens. Observe que está muito próximo de neste caso.R 2 1 - 4 / n
Aqui está o R
código que produziu as imagens.
set.seed(17)
n <- 1e3
x <- cumsum((runif(n) <= 1/2)*2-1) # Binomial random walk at x_0=0
rho <- format(cor(x[-1], x[-n]), digits=3) # Lag-1 correlation
par(mfrow=c(1,2))
plot(x, type="l", col="#e0e0e0", main="Sample Path")
points(x, pch=16, cex=0.75, col=hsv(1:n/n, .8, .8, .2))
plot(x[-n], x[-1], asp=1, pch=16, col=hsv(1:n/n, .8, .8, .2),
main="Lag-1 Scatterplot",
xlab="Current value", ylab="Next value")
mtext(bquote(rho == .(rho)))