Definição ambígua do filtro Kalman de estado de erro (indireto)

11

Estou confuso com o significado exato do termo "Filtro Kalman Indireto" ou "Filtro Kalman com Estado de Erro".

A definição mais plausível que encontrei está no livro de Maybeck [1]:

Como o nome indica, na formulação do espaço de estado total (direta), estados totais como posição e velocidade do veículo estão entre as variáveis ​​de estado no filtro e as medições são saídas do acelerômetro INS e sinais de fonte externa. Na formulação do espaço de estado de erro (indireto), os erros na posição e velocidade indicadas pelo INS estão entre as variáveis ​​estimadas e cada medição apresentada ao filtro é a diferença entre o INS e os dados da fonte externa.

20 anos depois, Roumeliotis et al. em [2] escreva:

A modelagem complicada do veículo específico e sua interação com um ambiente dinâmico são evitadas com a seleção da modelagem de giroscópio. O sinal do giroscópio aparece nas equações do sistema (em vez da medição) e, portanto, a formulação do problema requer uma abordagem de filtro Kalman indireto (estado de erro).

Não consigo entender a parte ousada, pois Lefferts et al. em [3] escreva muito antes:

Para espaçonaves autônomas, o uso de unidades de referência inerciais como substituição de modelo permite contornar esses problemas.

Em seguida, prossiga para mostrar diferentes variantes de EKFs usando modelagem de giroscópio que são claramente filtros Kalman diretos, de acordo com a definição de Maybeck: O estado consiste apenas no quaternion de atitude e no viés do giroscópio, e não nos estados de erro. De fato, não há INS separado cujo erro seja estimado com um filtro Kalman de estado de erro.

Então, minhas perguntas são:

  • Existe uma definição diferente, talvez mais recente, de filtros Kalman indiretos (estado de erro) dos quais não estou ciente?

  • Como a modelagem de giroscópios, por oposição ao uso de um modelo dinâmico adequado, por um lado, e a decisão de usar um filtro Kalman direto ou indireto, por outro lado, estão relacionados? Fiquei com a impressão de que ambas são decisões independentes.

[1] Maybeck, Peter S. Modelos estocásticos, estimativa e controle. Vol. 1. Imprensa acadêmica, 1979.

[2] Roumeliotis, Stergios I., Gaurav S. Sukhatme e George A. Bekey. "Contornando a modelagem dinâmica: avaliação do filtro kalman de estado de erro aplicado à localização de robôs móveis." Robótica e Automação, 1999. Anais. 1999 Conferência Internacional IEEE em. Vol. 2. IEEE, 1999.

[3] Lefferts, Ern J., F. Landis Markley e Malcolm D. Shuster. "Filtragem de Kalman para estimativa de atitude de naves espaciais." Journal of Guidance, Control, and Dynamics 5.5 (1982): 417-429.

sebsch
fonte

Respostas:

6

Olá e bem-vindo ao mundo amplo, ambíguo, às vezes confuso da pesquisa. Mas, falando sério, olhar para 20 anos de papéis às vezes produz essas confusões. Vamos ver o que está acontecendo. Na primeira referência, o que eles estão dizendo é:

Um INS / Gyro é bom, mas tem um erro. Esse erro muda (desvios) ao longo do tempo. Portanto, o erro no INS é realmente uma parte do estado do sistema.

A suposição markov usada no filtro Kalman pressupõe que o estiamte atual encapsula todo o estado do sistema e todos os estados anteriores do sistema. A etapa de atualização do EKF / FK pressupõe que os sensores medem o estado do sistema diretamente e sem viés . No entanto, um INS tem um viés (o erro) e esse viés é alterado. Portanto, nosso estado mensurável (a medição do INS / Gyro) é

z(t)=x(t)+b(t)+n

para o vetor de viés and noise . Infelizmente, o vetor é desconhecido, varia no tempo e não é zero. O vetor é assumido como ruído com média zero (por exemplo, imparcial). Portanto, se soubéssemos , poderíamos subtraí-lo de para obter uma medida imparcial do estado. Isso é útil. Portanto, uma estimativa de é mantida como parte do estado.bnbn b(t)zb(t)

Um filtro kalman de estado de erro cria um novo vetor de estado,

[x(t)b(t)]=[x(t)b(t)]+n
onde novamente é o verdadeiro estado é o verdadeiro viés.xb

Ok, passando para a referência dois, eles parecem dizer que o sinal do giroscópio (que tem medidas da forma novamente) é usado em vez de assumir que o giroscópio está medindo o estado diretamente. Isso se encaixa com o que eu sei sobre a pesquisa do Prof Roumeliotis, bem como com a definição de estado de erro KF e ref 1.z(t)=x+b(t)+n

Agora ref 3 está redigido um pouco ruim. Não consegui adquirir um PDF para revisar rapidamente. O que eu acho que isso significa é que eles estão usando a suposição comum de que um bom modelo da dinâmica do sistema não está disponível para uma etapa de previsão (ou propagação). Em vez disso, eles assumem que as medições INS são uma estimativa decente do estado do sistema e, em seguida, usam outros sensores para atualizar a estimativa do estado.

Isso é semelhante ao uso de odometria, em vez de modelar como as entradas de controle produzem uma mudança de estado em um robô com rodas . Sim, a estimativa antecipada terá o viés do INS, mas as medições devem corrigi-lo. De fato, a introdução desse documento afirma a mesma coisa que resumimos aqui, que o viés no giroscópio deve fazer parte do sistema a ser estimado.

Este é um resumo de alto nível, que é o melhor que posso fazer neste momento. Se houver preocupações específicas, eu posso editar conforme necessário.

Josh Vander Hook
fonte
Eu só quero entender o que está acontecendo aqui. O problema aqui é que o ruído é tendencioso, portanto, um dos requisitos do Kalman Filter está quebrado e não é aplicável usá-lo diretamente com o giroscópio. É por isso que eles precisam de outra maneira de se locomover. Esse é o problema? Obrigado pela resposta.
CroCo 12/01
Sim, vou atualizar a resposta para ficar mais claro também.
Josh Vander Hook