A maioria das implementações de filtro de partículas usará algum tipo de amostragem de importância, o que não exige que você faça uma suposição sobre a distribuição subjacente. Essa é uma das principais razões para o uso de um filtro de partículas em primeiro lugar. A amostragem de importância não faz amostragem da distribuição estimada, mas do seu conjunto de amostras ponderadas.
Isso inclui os do seu artigo vinculado. Todas as referências à variação aqui mencionadas referem-se à variação introduzida por esse esquema de re-amostragem específico. É uma medida da qualidade da nova amostragem, pois você não deseja introduzir incertezas desnecessárias em sua estimativa da verdadeira distribuição pelas partículas. Você não precisa calcular as variações de suas partículas para a nova amostragem.
Sobre a pergunta qual deles funciona melhor? Seu artigo tem algumas das respostas. Eu também fiz um post sobre o assunto usando menos matemática. Na maioria dos casos, alguma forma de reamostragem estratificada será melhor que o esquema multinomial.
O único caso em que eu poderia pensar em onde você precisaria calcular a variação de sua distribuição SO (3) também seria quando você quisesse verificar a variação introduzida na reamostragem. Nesse caso, o que eu faria é calcular a média da orientação (como você disse, não trivial) e, em seguida, usar a variação das diferenças para a média como eixo de representação da rotação em escala. Mas como eu disse. Eu não acho que você precise disso.
Uma palavra de cautela: a amostragem em toda a pose 6D não é recomendada na maioria dos casos. Você precisa de uma quantidade séria de partículas para isso. Mesmo que você precise de apenas 10 partículas por dimensão para representar sua distribuição adequadamente - o que geralmente não é suficiente - isso pode significar que você precisa de até um milhão de partículas em 6D. Muita memória e poder de processamento ...