Confusão relacionada a sistemas dinâmicos lineares

9

Eu estava lendo este livro Reconhecimento de padrões e aprendizado de máquina de Bishop. Eu tive uma confusão relacionada a uma derivação do sistema dinâmico linear. No LDS, assumimos que as variáveis ​​latentes são contínuas. Se Z denota as variáveis ​​latentes e X denota as variáveis ​​observadas

p(zn|zn1)=N(zn|Azn1,τ)

p(xn|zn)=N(xn,Czn,Σ)

p(z1)=N(z1|u0,V0)

No LDS, também é usada a passagem de mensagens para a frente e para trás para o cálculo da distribuição latente posterior, ou seja,p(zn|X)

α(zn)=p(x1...xn,zn)

α^(zn)=α(zn)/P(x1....xn)

Minha primeira pergunta é no livro, é dada como

α^(zn)=N(zn|un,Vn)

Como é que conseguimos o que foi dito acima? Quero dizer = . Quero dizer, como conseguimos isso?α^(zn)N(zn|un,Vn))

Minha próxima pergunta está relacionada à derivação, como você pode acompanhar nas capturas de tela das páginas do livro em anexo. Não entendi de onde veio o e qual é o ganho do filtro KalmanKn

un=Aun1+Kn(xnCAun1)

Vn=IKnC)P(n1)

cn=N(xn|CAun1,CPn1CT+Σ

Kn é a matriz de ganho de KalmanPn1CT(CPn1CT+Σ)1

Como derivamos as equações acima, quero dizer, como é que

un=Aun1+Kn(xnCAun1)

Estou confuso como é feita a derivação acima. insira a descrição da imagem aqui

insira a descrição da imagem aqui

insira a descrição da imagem aqui

user34790
fonte

Respostas:

1

Há uma boa derivação, na verdade, várias, no seguinte: http://amzn.com/0470173661

Este é um bom livro sobre o assunto também: http://amzn.com/0471708585

A derivação completa e as simplificações que resultam na forma abreviada do livro didático que você apresenta não são curtas / limpas; portanto, são frequentemente omitidas ou deixadas como um exercício para o leitor.

Você pode pensar no ganho de Kalman como uma proporção de mistura que faz uma soma ponderada de um modelo analítico / simbólico e algumas medições ruidosas do mundo real. Se você tem medições ruins, mas um bom modelo, um ganho de Kalman definido corretamente deve favorecer o modelo. Se você tem um modelo de lixo eletrônico, mas medições muito boas, seu ganho de Kalman deve favorecer as medições. Se você não souber bem quais são suas incertezas, pode ser difícil configurar corretamente seu filtro Kalman.

Se você definir as entradas corretamente, será um estimador ideal. Há uma série de suposições que entram em sua derivação e, se alguma delas não for verdadeira, ela se tornará um estimador subótimo muito bom. Por exemplo, um gráfico de Lag demonstrará que a suposição de Markov de uma etapa implícita no filtro Kalman não é verdadeira para uma função cosseno. Uma série de Taylor é uma aproximação, mas não é exata. Você pode criar um filtro Kalman estendido com base na série Taylor, mas é aproximado, não exato. Se você pode obter informações de dois estados anteriores em vez de um, pode usar um filtro Block Kalman e recuperar sua otimização. Resumindo, não é uma ferramenta ruim, mas não é "a bala de prata" e sua milhagem varia. Certifique-se de caracterizá-lo bem antes de usá-lo no mundo real.

EngrStudent
fonte