Definição do tempo de autocorrelação (para tamanho efetivo da amostra)

23

Encontrei duas definições na literatura para o tempo de autocorrelação de uma série temporal fracamente estacionária:

τa=1+2k=1ρkversusτb=1+2k=1|ρk|

onde ρk=Cov[Xt,Xt+h]Var[Xt] é a autocorrelação no atrasok.

Uma aplicação do tempo de autocorrelação é encontrar o "tamanho efetivo da amostra": se você possui observações de uma série temporal e conhece o tempo de autocorrelação τnτ , pode fingir que possui

neff=nτ

amostras independentes em vez de amostras correlacionadas com o objetivo de encontrar a média. A estimativa de τ a partir dos dados não é trivial, mas existem algumas maneiras de fazê-lo (consultenτ Thompson 2010 ).

A definição sem valores absolutos, , parece mais comum na literatura; mas admite a possibilidade de τ a < 1 . Usando R e o pacote "coda":τaτa<1

require(coda)
ts.uncorr <- arima.sim(model=list(),n=10000)         # white noise 
ts.corr <- arima.sim(model=list(ar=-0.5),n=10000)    # AR(1)
effectiveSize(ts.uncorr)                             # Sanity check
    # result should be close to 10000
effectiveSize(ts.corr)
    # result is in the neighborhood of 30000... ???

A função "effectiveSize" em "coda" usa uma definição do tempo de autocorrelação equivalente a τa , acima. Existem alguns outros pacotes R por aí que calculam o tamanho efetivo da amostra ou o tempo de autocorrelação, e todos os que tentei fornecem resultados consistentes com isso: que um processo AR (1) com um coeficiente de AR negativo tem amostras mais eficazes do que as correlacionadas séries temporais. Isso parece estranho.

Obviamente, isso nunca pode acontecer no τb definição de tempo de autocorrelação.

Qual é a definição correta de tempo de autocorrelação? Existe algo errado com minha compreensão dos tamanhos efetivos das amostras? O resultado mostrado acima parece estar errado ... o que está acontecendo?neff>n

andrewtinka
fonte
Só para ter certeza de que não entendi errado, isso não deveria ser vez de h ? Cov(Xt,Xt+k)h
Sachinruk 23/10/2015
2
Estou interessado na segunda definição, ie, . Você poderia fornecer a literatura onde a encontrou? τb
Harry

Respostas:

17

Primeiro, a definição apropriada de "tamanho efetivo da amostra" está ligada à OMI a uma questão bastante específica. Se são identicamente distribuído com média μ e variância 1 a média empírica μ = 1X1,X2,μ é um estimador imparcial deμ. Mas e a sua variação? Paravariáveisindependentes, a variação én-1. Para uma série de tempo fracamente estacionário, a variância da μ é um

μ^=1nk=1nXk
μn1μ^
1n2k,l=1ncov(Xk,Xl)=1n(1+2(n1nρ1+n2nρ2++1nρn1))τan.
nneff=n/τaneff1neff amostras independentes. portantoneff=n/τumaé uma definição apropriada se pedirmos a variação da média empírica. Pode ser inadequado para outros fins.

Com uma correlação negativa entre as observações, é certamente possível que a variação possa se tornar menor do que n-1 (neff>n) Esta é uma técnica bem conhecida de redução de variância na integração Monto Carlo: Se introduzirmos correlação negativa entre as variáveis ​​em vez da correlação 0, podemos reduzir a variância sem aumentar o tamanho da amostra.

NRH
fonte
2
Para quem quiser saber mais sobre o uso da correlação negativa na simulação de Monte Carlo, tente pesquisar "variáveis ​​antitéticas" no Google. Mais informações nas notas do curso aqui ou aqui .
precisa saber é o seguinte
1

veja http://arxiv.org/pdf/1403.5536v1.pdf

e

https://cran.r-project.org/web/packages/mcmcse/mcmcse.pdf

para tamanho efetivo da amostra. Penso que a formulação alternativa usando a razão de variação da amostra e variação assintótica da cadeia de Markov via média do lote é um estimador mais apropriado.

subhadip pal
fonte
4
Você poderia expandir o conteúdo desses links? Tal como está, ainda é muito curto para uma resposta de nossos padrões!
Kjetil b halvorsen