Pergunta sobre a função de autocovariância de amostra

Estou lendo um livro de análise de séries temporais e a fórmula para autocovariância de amostra é definida no livro como:

\hat{γ} (h) = n^{- 1} \sum_{t = 1}^{n - h} (x_{t + h} - \bar{x}) (x_{t} - \bar{x})

$\widehat{\gamma}(h) = n^{-1}\displaystyle\sum_{t=1}^{n-h}(x_{t+h}-\bar{x})(x_t-\bar{x})$

compara . é a média. $\widehat{\gamma}(-h) = \widehat{\gamma}(h)\;$ $\;h = 0,1, ..., n-1$ $\bar{x}$

Alguém pode explicar intuitivamente por que dividimos a soma por e não por ? O livro explica que isso ocorre porque a fórmula acima é uma função definida não negativa e, portanto, é preferível dividir por , mas isso não está claro para mim. Alguém pode provar isso ou mostrar um exemplo ou algo assim? $n$ $n-h$ $n$

Para mim, a coisa intuitiva a princípio seria dividir por . Este é um estimador imparcial ou tendencioso da autocovariância? $n-h$

time-series probability mathematical-statistics jjepsuomi
fonte

Se sua série temporal for exatamente com todos os outros , ou desconhecidos, a soma deverá necessariamente parar em quando ocorrer em a soma: o próximo termo (para ) que seria incluído na soma teria e não faz parte da amostra.

x_{1}, x_{2}, \dots, x_{n}

$x_1, x_2, \ldots, x_n$

x_{i}

$x_i$

i < 1

$i < 1$

i > n

$i >n$

t = n - h

$t=n-h$

x_{t + h} = x_{n}

$x_{t+h}=x_n$

t = n - h + 1

$t=n-h+1$

x_{n - h + 1 + h} = x_{n + 1}

$x_{n-h+1+h}=x_{n+1}$

x_{n + 1}

$x_{n+1}$

precisa saber é o seguinte

@Dilip Eu não acho que esse é o problema: a questão diz respeito a dividir por ou na definição de .

n

$n$

n - h

$n-h$

\hat{γ}

$\hat{\gamma}$

whuber

$\widehat{\gamma}$ é usado para criar matrizes de covariância: dados os "tempos" , estima que a covariância do vetor aleatório (obtida a partir do campo aleatório nessas horas) é a matriz . Para muitos problemas, como a previsão, é crucial que todas essas matrizes sejam não singulares. Como matrizes de covariância putativas, obviamente elas não podem ter nenhum autovalor negativo, de onde todas elas devem ser definidas positivamente. $t_1, t_2, \ldots, t_k$ $X_{t_1}, X_{t_2}, \ldots, X_{t_k}$ $\left(\widehat{\gamma}(t_i - t_j), 1 \le i, j \le k\right)$

A situação mais simples em que a distinção entre as duas fórmulas

\hat{γ} (h) = n^{- 1} \sum_{t = 1}^{n - h} (x_{t + h} - \bar{x}) (x_{t} - \bar{x})

$\widehat{\gamma}(h) = n^{-1}\sum_{t=1}^{n-h}(x_{t+h}-\bar{x})(x_t-\bar{x})$

{\hat{γ}}_{0} (h) = (n - h)^{- 1} \sum_{t = 1}^{n - h} (x_{t + h} - \bar{x}) (x_{t} - \bar{x})

$\widehat{\gamma}_0(h) = (n-h)^{-1}\sum_{t=1}^{n-h}(x_{t+h}-\bar{x})(x_t-\bar{x})$

aparece é quando tem comprimento ; digamos, . Para e é simples de computação $x$ $2$ $x = (0,1)$ $t_1=t$ $t_2 = t+1$

{\hat{γ}}_{0} = (\begin{array}{cc} \frac{1}{4} & - \frac{1}{4} \\ - \frac{1}{4} & \frac{1}{4} \end{array}),

$\widehat{\gamma}_0 = \left( \begin{array}{cc} \frac{1}{4} & -\frac{1}{4} \\ -\frac{1}{4} & \frac{1}{4} \end{array} \right),$

que é singular, enquanto

\hat{γ} = (\begin{array}{cc} \frac{1}{4} & - \frac{1}{8} \\ - \frac{1}{8} & \frac{1}{4} \end{array})

$\widehat{\gamma} = \left( \begin{array}{cc} \frac{1}{4} & -\frac{1}{8} \\ -\frac{1}{8} & \frac{1}{4} \end{array} \right)$

que tem autovalores e , de onde é positivo-definido. $3/8$ $1/8$

Um fenômeno semelhante ocorre para , em que é positivo-definido, mas quando aplicado aos tempos , digamos - degenera em uma matriz de classificação (suas entradas alternam entre e ). $x = (0,1,0,1)$ $\widehat{\gamma}$ $\widehat{\gamma}_0$ $t_i = (1,2,3,4)$ $1$ $1/4$ $-1/4$

(Existe um padrão aqui: surgem problemas para qualquer da forma .) $x$ $(a,b,a,b,\ldots,a,b)$

Na maioria das aplicações, a série de observações é tão longa que, para a maior parte de interesse - que é muito menor que -, a diferença entre e não tem importância. Portanto, na prática, a distinção não é grande coisa e, teoricamente, a necessidade de definição positiva substitui fortemente qualquer desejo possível de estimativas imparciais. $x_t$ $h$ $n$ $n^{-1}$ $(n-h)^{-1}$

whuber
fonte

Eu acho importante notar que ambos os estimadores são estimadores tendenciosos, mesmo se você o dividir por nh.

Ran

@Ran Embora você esteja certo de que esses estimadores são tendenciosos, eu discordo que esta seja uma questão importante: como mencionado no último parágrafo, uma pequena quantidade de tendenciosidade é a menor das preocupações de qualquer pessoa. O estimador imparcial, usando , dificilmente difere de ou .

(n - h - 1)^{- 1}

$(n-h-1)^{-1}$

\hat{γ}

$\widehat{\gamma}$

{\hat{γ}}_{0}

$\widehat{\gamma}_0$

whuber

Resposta muito boa +1. Talvez seja útil adicionar o ponto em que , enquanto ; portanto, quando estiver próximo de , o estimador pode ser irregular, enquanto terá flutuações amostrais uniformemente pequenas . Veja por exemplo Sacerdotais (1981) P324 "Análise espectral e Séries Temporais" para uma discussão detalhada sobre este ponto

V {\hat{γ}}_{0} (h) = O (1 / (n - h))

$\mathbb{V} \hat{\gamma}_0(h) = O(1/(n-h))$

V \hat{γ} (h) = O (1 / n)

$\mathbb{V} \hat{\gamma}(h) = O(1/n)$

h

$h$

n

$n$

{\hat{γ}}_{0} (h)

$\hat{\gamma}_0(h)$

\hat{γ} (h)

$\hat{\gamma}(h)$

\forall h

$\forall h$

Colin T Bowers

Pergunta sobre a função de autocovariância de amostra

Respostas: