Estou lendo um livro de análise de séries temporais e a fórmula para autocovariância de amostra é definida no livro como:
compara . é a média.ˉ x
Alguém pode explicar intuitivamente por que dividimos a soma por e não por ? O livro explica que isso ocorre porque a fórmula acima é uma função definida não negativa e, portanto, é preferível dividir por , mas isso não está claro para mim. Alguém pode provar isso ou mostrar um exemplo ou algo assim?n - h n
Para mim, a coisa intuitiva a princípio seria dividir por . Este é um estimador imparcial ou tendencioso da autocovariância?
time-series
probability
mathematical-statistics
jjepsuomi
fonte
fonte
Respostas:
t1,t2,...,tKXt1,Xt2,...,Xtγˆ é usado para criar matrizes de covariância: dados os "tempos" , estima que a covariância do vetor aleatório (obtida a partir do campo aleatório nessas horas) é a matriz . Para muitos problemas, como a previsão, é crucial que todas essas matrizes sejam não singulares. Como matrizes de covariância putativas, obviamente elas não podem ter nenhum autovalor negativo, de onde todas elas devem ser definidas positivamente.t1,t2,…,tk ( γ ( t i - t j ),1≤i,j≤k )Xt1,Xt2,…,Xtk (γˆ(ti−tj),1≤i,j≤k)
A situação mais simples em que a distinção entre as duas fórmulas
e
aparece é quando tem comprimento ; digamos, . Para e é simples de computaçãox 2 x=(0,1) t1=t t2=t+1
que é singular, enquanto
que tem autovalores e , de onde é positivo-definido.3/8 1/8
Um fenômeno semelhante ocorre para , em que é positivo-definido, mas quando aplicado aos tempos , digamos - degenera em uma matriz de classificação (suas entradas alternam entre e ).x=(0,1,0,1) γˆ γˆ0 ti=(1,2,3,4) 1 1/4 −1/4
(Existe um padrão aqui: surgem problemas para qualquer da forma .)x (a,b,a,b,…,a,b)
Na maioria das aplicações, a série de observações é tão longa que, para a maior parte de interesse - que é muito menor que -, a diferença entre e não tem importância. Portanto, na prática, a distinção não é grande coisa e, teoricamente, a necessidade de definição positiva substitui fortemente qualquer desejo possível de estimativas imparciais.xt h n n−1 (n−h)−1
fonte