Por que lidamos com os autovetores da autocorrelação em vez dos próprios dados?

8

Como intuitivamente entender por que os autovetores da matriz de autocorrelação são usados, mas os autovetores da matriz construídos a partir de amostras temporais não fazem sentido e não são usados? Por exemplo, na detecção de um sinal harmonioso no ruído aditivo.

Timur
fonte

Respostas:

5

Alguns motivos "no nível do intestino" por que é melhor trabalhar com a matriz de autocorrelação em vez de uma matriz com suas observações:

  • Se você quiser levar em consideração todas as suas observações e possuir muitos dados, acabará manipulando (invertendo, multiplicando) matrizes razoavelmente grandes. Se você trabalha com a matriz de autocorrelação, "resume" seus dados uma vez (em uma etapa bastante eficiente que requer apenas uma FFT e uma FFT inversa) e, a partir de então, você apenas manipula sua matriz de autocorrelação de tamanho onde P é seu ordem do modelo (por exemplo, para modelagem AR ou modelagem sinusoidal).P×PP
  • Com alguns dados, simplesmente não funciona numericamente para usar as observações brutas, porque você encontra situações nas quais precisa lidar com matrizes que não têm garantia de definição positiva.

Por exemplo, vamos considerar duas abordagens para o ajuste do modelo de RA.

Uso direto da matriz de dados

O erro de reconstrução quadrática empírica nos seus dados é:

ϵ=xTx+xTΓuma+umaTΓTx+umaTΓTΓuma

onde é o vetor de coeficientes AR, x é seu vetor de observações e Γ a matriz com suas observações atrasadas. Você precisa encontrar o valor de um que minimize isso. Após a derivação e um pouco de embaralhamento, sua solução fica assim:umaxΓuma

uma=-(ΓTΓ)-1 1ΓTx

E você está ferrado porque não tem absolutamente nenhuma garantia de que pode ser invertido. No processo, falando numericamente, você teve que lidar com produtos matriciais razoavelmente grandes se tiver uma longa sequência de observações.ΓTΓ

Visualização de processo aleatório

se você adaptar um ângulo de "processo aleatório" ao problema, a quantidade que você precisa minimizar (o valor esperado do erro) é:

ϵ=rx(0 0)+2ruma+umaTRuma

E você acaba com a solução mais palatável:

uma=-R-1 1r

R

Parece que seu problema é o da modelagem sinusoidal (em vez da modelagem de RA). Aqui há muita ação, mas o que eu disse sobre a modelagem de RA e os obstáculos ao uso da matriz de dados brutos; também se aplica à modelagem sinusoidal - com a decomposição do autovalor sendo a operação problemática em vez da inversão da matriz.

pichenettes
fonte
2

Primeiro, autovetores e autovalores são definidos para operadores. Correlação é uma operação.

Em segundo lugar, os autovetores da autocorrelação são particularmente interessantes porque explicam com mais eficiência a variação do sinal em uma regressão linear. Em outras palavras, para um número fixo de vetores, a seleção dos vetores próprios minimiza o erro quadrático médio em que o sinal é modelado como uma soma linear dos vetores. Essa técnica é conhecida como análise de componentes principais .

Se você puder expandir sua noção de sinal "harmonioso", talvez eu possa comentar mais.

Emre
fonte
Sim, e devo acrescentar, também se pode trabalhar com a matriz de dados na análise de componentes principais. No entanto, isso envolve decomposição de valor singular.
187 Bryan