Rao-Blackwellization de filtros seqüenciais de Monte Carlo

11

No artigo seminal "Rao-Blackwellised Particle Filtering for Dynamic Bayesian Networks" de A. Doucet et. al. é proposto um filtro seqüencial de Monte Carlo (filtro de partículas), que utiliza uma subestrutura linear em um processo markov x k = ( x L k , x N k ) . Pela marginalização dessa estrutura linear, o filtro pode ser dividido em duas partes: uma parte não linear que utiliza um filtro de partículas e uma parte linear que pode ser manuseada por um filtro Kalman (condicionado na parte não linear x N k )xkLxk=(xkL,xkN)xkN

Entendo a parte da marginalização (e às vezes o filtro descrito também é chamado de filtro marginalizado). Minha intuição por que é chamado de filtro de partículas Rao-Blackwellized (RBPF) é que os parâmetros Gaussianos são uma estatística suficiente para o processo linear subjacente e, seguindo o teorema de Rao-Blackwell, um estimador condicionado a esses parâmetros tem um desempenho tão bom quanto como estimador de amostragem.

O estimador Rao-Blackwell é definido como . Nesse contexto, eu diria que δ ( X ) é o estimador de Monte Carlo, δ 1 ( X ) o RBPF e T ( X ) a parametrização gaussiana. Meu problema é que não vejo onde isso é realmente aplicado no artigo.E(δ(X)|T(X))=δ1(X)δ(X)δ1(X)T(X)

Então, por que isso é chamado de Filtro de Partículas Rao-Blackwellized e onde a Rao-Blackwellization realmente acontece?

Jakob
fonte

Respostas:

1

I1^E[f]I2^

Mais adiante neste artigo, a expectativa é calculada usando os filtros de Kalman.

Hunaphu
fonte