Qual é a diferença entre um filtro de partículas (Monte Carlo seqüencial) e um filtro Kalman?

51

Um filtro de partículas e um filtro de Kalman são estimadores Bayesianos recursivos . Muitas vezes encontro filtros Kalman em meu campo, mas raramente vejo o uso de um filtro de partículas.

Quando um seria usado sobre o outro?

Shane
fonte
3
Observe que os filtros Kalman, por design, lidam apenas com distribuições posteriores gaussianas. Observe que os diferentes sabores (estendido, sem cheiro, conjunto) variam apenas na forma como estimam o Gaussiano no caso de modelos de observação / dinâmica não lineares. Os filtros de partículas podem lidar com posteriores arbitrários arbitrários, incluindo os multimodais.
GeoMatt22 31/08

Respostas:

47

Da "Estimativa ótima do estado" de Dan Simon:

"Em um sistema linear com ruído gaussiano, o filtro Kalman é ideal. Em um sistema não-linear, o filtro Kalman pode ser usado para estimativa de estado, mas o filtro de partículas pode fornecer melhores resultados ao preço de um esforço computacional adicional. sistema que possui ruído não gaussiano, o filtro Kalman é o filtro linear ideal , mas novamente o filtro de partículas pode ter um desempenho melhor.O filtro sem cheiro Kalman (UKF) fornece um equilíbrio entre o baixo esforço computacional do filtro Kalman e o alto desempenho do filtro. o filtro de partículas ".

"O filtro de partículas tem algumas semelhanças com o UKF, na medida em que transforma um conjunto de pontos por meio de equações não lineares conhecidas e combina os resultados para estimar a média e a covariância do estado. No entanto, no filtro de partículas, os pontos são escolhidos aleatoriamente, enquanto que em na UKF, os pontos são escolhidos com base em um algoritmo específico *****. Devido a isso, o número de pontos usados ​​em um filtro de partículas geralmente precisa ser muito maior que o número de pontos em uma UKF. os dois filtros são que o erro de estimativa em um UKF não converge para zero em nenhum sentido, mas o erro de estimativa em um filtro de partículas converge para zero quando o número de partículas (e, portanto, o esforço computacional) se aproxima do infinito.

***** A transformação sem cheiro é um método para calcular as estatísticas de uma variável aleatória que passa por uma transformação não linear e usa a intuição (que também se aplica ao filtro de partículas) de que é mais fácil aproximar uma distribuição de probabilidade do que aproximar uma função ou transformação não linear arbitrária. Veja também isso como um exemplo de como os pontos são escolhidos no UKF. "

George Dontas
fonte
Eu acho que o filtro de partículas converge em distribuição.
Royi 02/08/19
16
O seu segundo parágrafo é tomado palavra por palavra de Dan Simon de "Optimal Estimação de Estado" , seção 15.4 (página 480 na minha edição de 2006 ".) Você deve colocá-lo entre aspas e atribuem a fonte..
Lyndon Branca
4

De um tutorial sobre filtragem e suavização de partículas: quinze anos depois :

Desde a sua introdução em 1993, os filtros de partículas tornaram-se uma classe muito popular de métodos numéricos para a solução de problemas ótimos de estimativa em cenários não lineares não-gaussianos. Em comparação com métodos de aproximação padrão, como o popular Filtro Kalman Estendido, a principal vantagem dos métodos de partículas é que eles não dependem de nenhuma técnica de linearização local ou de qualquer aproximação funcional bruta. O preço que deve ser pago por essa flexibilidade é computacional: esses métodos são computacionalmente caros. No entanto, graças à disponibilidade de poder computacional cada vez maior, esses métodos já são usados ​​em aplicações em tempo real que aparecem em campos tão diversos quanto engenharia química, visão computacional, econometria financeira, rastreamento de alvos e robótica. Além disso,

Em resumo, o filtro de partículas é mais elástico, pois não assume linearidade e natureza gaussiana do ruído nos dados, mas é mais caro em termos computacionais. Representa a distribuição criando (ou desenhando) e ponderando amostras aleatórias em vez de média e matriz de covariância, como na distribuição gaussiana.

Tomasz Bartkowiak
fonte