Representações diferentes do espaço de estado para o filtro de regressão automática e Kalman

Vejo que existem diferentes maneiras de escrever um modelo AR em uma representação no espaço de estados, para que possamos aplicar o filtro Kalman para estimar o sinal. Veja os exemplos 1, 2 e 3 aqui .

Gostaria de saber quais são as diferenças entre as diferentes representações do espaço de estados na estimativa pelo filtro de Kalman?

Obrigado!

kalman-filters autoregressive-model Tim
fonte

Este é o lugar certo para isso, não para a Ciência da Computação . Se você não obteve respostas, tente atualizar a postagem mostrando seu esforço na semana passada - você já tentou pesquisar? Outra opção é adicionar uma recompensa ...

Lorem Ipsum

A discussão parece ser mais teórica do que aqui. O filtro Kalman é um método ideal de estimativa para um sistema dinâmico estocástico. Portanto, ele se encaixa perfeitamente na ciência computacional. Ainda não encontrei nada útil.

Tim

você já tentou colocar uma recompensa? Você apenas tem que ter mais atenção à sua pergunta, e existem maneiras de fazê-lo ...

Lorem Ipsum

Respostas:

Infelizmente, não sei muito sobre os filtros Kalman, mas acho que posso ajudá-lo com o material do espaço de estado.

No Exemplo 1, o modelo AR é exatamente sua boa e antiga definição recursiva de saída DSP:

y_{t} = α + ϕ_{1} y_{t - 1} + ϕ_{2} y_{t - 2} + η_{t}

$y_t = \alpha + \phi_1y_{t-1} + \phi_2y_{t-2} + \eta_t$

Nesse caso, escrevemos o modelo de espaço de estados com correspondência direta com a equação acima:

(\begin{matrix} y_{t} \\ y_{t - 1} \end{matrix}) = (\begin{matrix} ϕ_{1} & ϕ_{2} \\ 1 & 0 \end{matrix}) (\begin{matrix} y_{t - 1} \\ y_{t - 2} \end{matrix}) + (\begin{matrix} α \\ 0 \end{matrix}) + (\begin{matrix} 1 \\ 0 \end{matrix}) η_{t}

$\begin{pmatrix}y_t \\ y_{t-1}\end{pmatrix} = \begin{pmatrix}\phi_1 & \phi_2 \\ 1 & 0\end{pmatrix}\begin{pmatrix}y_{t-1} \\ y_{t-2} \end{pmatrix} + \begin{pmatrix}\alpha \\ 0 \end{pmatrix} + \begin{pmatrix}1 \\ 0 \end{pmatrix}\eta_t$

Observe que, neste caso, os estados do sistema são valores atuais e anteriores da saída.

No segundo exemplo, você está separando seus estados dos seus valores de saída. Isso significa que os estados agora podem ser qualquer coisa, mesmo que ainda estejam diretamente mapeados nos valores de saída. Desta forma, obtemos $c$

y_{t} = μ + c_{t}

$y_t = \mu + c_t$

c_{t} = ϕ_{1} c_{t - 1} + ϕ_{2} c_{t - 2} + η_{t}

$c_t = \phi_1c_{t-1} + \phi_2c_{t-2} + \eta_t$

E portanto

(\begin{matrix} c_{t} \\ c_{t - 1} \end{matrix}) = (\begin{matrix} ϕ_{1} & ϕ_{2} \\ 1 & 0 \end{matrix}) (\begin{matrix} c_{t - 1} \\ c_{t - 2} \end{matrix}) + (\begin{matrix} 1 \\ 0 \end{matrix}) η_{t}

$\begin{pmatrix}c_t \\ c_{t-1}\end{pmatrix} = \begin{pmatrix}\phi_1 & \phi_2 \\ 1 & 0\end{pmatrix}\begin{pmatrix}c_{t-1} \\ c_{t-2} \end{pmatrix} + \begin{pmatrix}1 \\ 0 \end{pmatrix}\eta_t$

Você também deve reconhecer isso como a representação no espaço de estados padrão de um sistema linear, porque as equações para evolução do estado e saída dependente do estado são duas equações diferentes . Essa separação é trivial no caso de um modelo de RA, mas essa última notação é como pensamos em todos os modelos lineares de espaço de estados em geral.

$\phi_1$ $\phi_2$ $\alpha$

Você deve observar que dois sistemas lineares podem ser idênticos até uma mudança de base. Isso significa que podemos escolher uma base diferente para representar o mesmo sistema linear. Você pode se convencer de que foi exatamente isso que fizemos para passar do segundo para o terceiro exemplo. Particularmente, gostamos dessa transformação linear para transpor a matriz de transição de estados, para obtermos algum estado desconhecido $\boldsymbol{s}$

y_{t} = (\begin{matrix} 1 & 0 \end{matrix}) α_{t}

$y_t = \begin{pmatrix}1 & 0\end{pmatrix} \boldsymbol{\alpha_t}$

α_{t} = (\begin{matrix} s_{t} \\ s_{t - 1} \end{matrix}) = (\begin{matrix} ϕ_{1} & ϕ_{2} \\ 1 & 0 \end{matrix}) (\begin{matrix} s_{t - 1} \\ s_{t - 2} \end{matrix}) + (\begin{matrix} α \\ 0 \end{matrix}) + (\begin{matrix} 1 \\ 0 \end{matrix}) η_{t}

$\boldsymbol{\alpha_t} = \begin{pmatrix}s_t \\ s_{t-1}\end{pmatrix} = \begin{pmatrix}\phi_1 & \phi_2 \\ 1 & 0\end{pmatrix}\begin{pmatrix}s_{t-1} \\ s_{t-2} \end{pmatrix} + \begin{pmatrix}\alpha \\ 0 \end{pmatrix} + \begin{pmatrix}1 \\ 0 \end{pmatrix}\eta_t$

Agora podemos usar a mudança de base para descobrir o que esse estado deve ser com relação ao estado . E podemos calcular que seja $\boldsymbol{s}$ $\boldsymbol{y}$

(\begin{matrix} s_{t} \\ s_{t - 1} \end{matrix}) = (\begin{matrix} y_{t} \\ ϕ_{2} y_{t - 1} \end{matrix})

$\begin{pmatrix}s_t \\ s_{t-1}\end{pmatrix} = \begin{pmatrix}y_t \\ \phi_2 y_{t-1}\end{pmatrix}$

Essa forma (transposição da forma canônica de controlabilidade) é chamada de forma canônica de observabilidade porque, se podemos colocar um sistema nessa forma, podemos deduzir facilmente quais estados do sistema podem ser observados simplesmente observando a saída. Para obter uma descrição das formas canônicas, você pode ler este documento e, é claro, dar uma olhada na web. Observe que no documento os estados são invertidos, o que não altera nada na representação do sistema, simplesmente reordenando as linhas / colunas das matrizes.

Phonon
fonte

Em resumo, tudo depende do que você está tentando estimar, isto é, o que você sabe sobre o sinal e o que não sabe. O filtro Kalman tentará estimar o estado com base na sua definição do que é esse estado. O problema convencional é quando estamos tentando estimar os coeficientes de RA.

Vamos dar um exemplo de um modelo sem termo constante . $AR(2)$ $\mu$

y_{k} = a_{1} y_{k - 1} + a_{2} y_{k - 2} + η_{k}

$y_k = a_1y_{k-1} + a_2y_{k-2} + \eta_k$

Para estimar o sistema acima, tudo que você precisa fazer é estimar os coeficientes de AR, e . $a_1$ $a_2$

Configuração geral do espaço de estado do filtro Kalman:

x_{k} = F_{k - 1} x_{k - 1} + w_{k}

${\bf x}_{k} = {\bf F}_{k-1}{\bf x}_{k-1} + {\bf w}_k$

y_{k} = H_{k} x_{k} + v_{k}

${\bf y}_{k} = {\bf H}_{k}{\bf x}_{k} + {\bf v}_k$

w_{k} = W G N (0, Q^{s})

${\bf w}_k= WGN(0, Q^s)$ e

v_{k} = W G N (0, Q^{o})

${\bf v}_k= WGN(0, Q^o)$

Nesse caso, precisamos estimar e . Portanto, é natural definir o estado como esses coeficientes. Neste exemplo, esses coeficientes são constantes ( ) e não há ruído nesses coeficientes -> . $a_1$ $a_2$ ${\bf x}_k = [a_1, a_2]^T$ ${\bf F}_{k} ={\bf F}_{k-1} = {\bf I}$ ${\bf w}_k = {\bf 0} \implies Q^s = {\bf 0}$

Como tudo o que observamos é , eles se tornam as medidas para o nosso sistema. Uma vez que já definiu o que o vetor de estado é, para os nossos equações de medição para ser igual ao modelo AR dada, substituímos o nosso ruído de medição com e . $y_k$ ${\bf v}_k$ $\eta_k$ ${\bf H}_{k} = [y_{k-1}, y_{k-2}]$

x_{k} = x_{k - 1} = [\begin{matrix} a_{1} \\ a_{2} \end{matrix}]

${\bf x}_{k} = {\bf x}_{k-1} = \begin{bmatrix} a_1 \\ a_2 \end{bmatrix}$

y_{k} = H_{k} x_{k} + η_{k} = [\begin{matrix} y_{k - 1} & y_{k - 2} \end{matrix}] [\begin{matrix} a_{1} \\ a_{2} \end{matrix}] + η_{k}

$y_k = {\bf H}_{k}{\bf x}_{k} + \eta_k = \begin{bmatrix} y_{k-1} & y_{k-2} \end{bmatrix}\begin{bmatrix} a_1 \\ a_2 \end{bmatrix} + \eta_k$

Agora, você pode usar o filtro Kalman para estimar seu estado e, consequentemente, seu sinal.

Nota: A única coisa estranha aqui é sua matriz depende das suas medidas . Algumas pessoas têm a idéia errada de que a Matriz de Ganhos de Kalman e Covariância Estatal é sempre independente da medição e que podem ser calculadas com antecedência. Este caso mostra claramente que não é esse o caso. Tanto a matriz de ganho de Kalman quanto a covariância estatal são estimadas com funções de , que neste caso é dependente da medição. ${\bf H}_k$ $y_k$ ${\bf H}_k$

ssk08
fonte

Discordo. Eu acho que você observability Estado compromisso com a inclusão de medição na matriz