No artigo seminal "Rao-Blackwellised Particle Filtering for Dynamic Bayesian Networks" de A. Doucet et. al. é proposto um filtro seqüencial de Monte Carlo (filtro de partículas), que utiliza uma subestrutura linear em um processo markov x k = ( x L k , x N k ) . Pela marginalização dessa estrutura linear, o filtro pode ser dividido em duas partes: uma parte não linear que utiliza um filtro de partículas e uma parte linear que pode ser manuseada por um filtro Kalman (condicionado na parte não linear x N k )
Entendo a parte da marginalização (e às vezes o filtro descrito também é chamado de filtro marginalizado). Minha intuição por que é chamado de filtro de partículas Rao-Blackwellized (RBPF) é que os parâmetros Gaussianos são uma estatística suficiente para o processo linear subjacente e, seguindo o teorema de Rao-Blackwell, um estimador condicionado a esses parâmetros tem um desempenho tão bom quanto como estimador de amostragem.
O estimador Rao-Blackwell é definido como . Nesse contexto, eu diria que δ ( X ) é o estimador de Monte Carlo, δ 1 ( X ) o RBPF e T ( X ) a parametrização gaussiana. Meu problema é que não vejo onde isso é realmente aplicado no artigo.
Então, por que isso é chamado de Filtro de Partículas Rao-Blackwellized e onde a Rao-Blackwellization realmente acontece?
fonte