Pergunta sobre a função de autocovariância de amostra

10

Estou lendo um livro de análise de séries temporais e a fórmula para autocovariância de amostra é definida no livro como:

γ^(h)=n1t=1nh(xt+hx¯)(xtx¯)

compara . é a média.γ^(h)=γ^(h)ˉ xh=0,1,...,n1x¯

Alguém pode explicar intuitivamente por que dividimos a soma por e não por ? O livro explica que isso ocorre porque a fórmula acima é uma função definida não negativa e, portanto, é preferível dividir por , mas isso não está claro para mim. Alguém pode provar isso ou mostrar um exemplo ou algo assim?n - h nnnhn

Para mim, a coisa intuitiva a princípio seria dividir por . Este é um estimador imparcial ou tendencioso da autocovariância?nh

jjepsuomi
fonte
11
Se sua série temporal for exatamente com todos os outros , ou desconhecidos, a soma deverá necessariamente parar em quando ocorrer em a soma: o próximo termo (para ) que seria incluído na soma teria e não faz parte da amostra. x i i < 1 i > n t = n - h x t + h = x n t = n - h + 1x1,x2,,xnxii<1i>nt=nhxt+h=xnt=nh+1 x n + 1xnh+1+h=xn+1xn+1
precisa saber é o seguinte
@Dilip Eu não acho que esse é o problema: a questão diz respeito a dividir por ou na definição de . n - h γnnhγ^
whuber

Respostas:

14

t1,t2,...,tKXt1,Xt2,...,Xtγ^ é usado para criar matrizes de covariância: dados os "tempos" , estima que a covariância do vetor aleatório (obtida a partir do campo aleatório nessas horas) é a matriz . Para muitos problemas, como a previsão, é crucial que todas essas matrizes sejam não singulares. Como matrizes de covariância putativas, obviamente elas não podem ter nenhum autovalor negativo, de onde todas elas devem ser definidas positivamente.t1,t2,,tk ( γ ( t i - t j ),1i,jk )Xt1,Xt2,,Xtk(γ^(titj),1i,jk)

A situação mais simples em que a distinção entre as duas fórmulas

γ^(h)=n1t=1nh(xt+hx¯)(xtx¯)

e

γ^0(h)=(nh)1t=1nh(xt+hx¯)(xtx¯)

aparece é quando tem comprimento ; digamos, . Para e é simples de computaçãox2x=(0,1)t1=tt2=t+1

γ^0=(14141414),

que é singular, enquanto

γ^=(14181814)

que tem autovalores e , de onde é positivo-definido.3/81/8

Um fenômeno semelhante ocorre para , em que é positivo-definido, mas quando aplicado aos tempos , digamos - degenera em uma matriz de classificação (suas entradas alternam entre e ).x=(0,1,0,1)γ^γ^0ti=(1,2,3,4)11/41/4

(Existe um padrão aqui: surgem problemas para qualquer da forma .)x(a,b,a,b,,a,b)

Na maioria das aplicações, a série de observações é tão longa que, para a maior parte de interesse - que é muito menor que -, a diferença entre e não tem importância. Portanto, na prática, a distinção não é grande coisa e, teoricamente, a necessidade de definição positiva substitui fortemente qualquer desejo possível de estimativas imparciais.xthnn1(nh)1

whuber
fonte
11
Eu acho importante notar que ambos os estimadores são estimadores tendenciosos, mesmo se você o dividir por nh.
Ran
@Ran Embora você esteja certo de que esses estimadores são tendenciosos, eu discordo que esta seja uma questão importante: como mencionado no último parágrafo, uma pequena quantidade de tendenciosidade é a menor das preocupações de qualquer pessoa. O estimador imparcial, usando , dificilmente difere de ou . (nh1)1γ^γ^0
whuber
2
Resposta muito boa +1. Talvez seja útil adicionar o ponto em que , enquanto ; portanto, quando estiver próximo de , o estimador pode ser irregular, enquanto terá flutuações amostrais uniformemente pequenas . Veja por exemplo Sacerdotais (1981) P324 "Análise espectral e Séries Temporais" para uma discussão detalhada sobre este pontoV γ ( h ) = O ( 1 / n ) h n γ 0 ( h ) γ ( h ) hVγ^0(h)=O(1/(nh))Vγ^(h)=O(1/n)hnγ^0(h)γ^(h)h
Colin T Bowers