Eu apreciaria muito uma explicação intuitiva para o rastreamento (visual) com filtros Kalman. o que eu sei:
Etapa de previsão:
- Estado dinâmico do sistema : local de destino no momento t
- Medição : a imagem no tempo índice t (??)
Com base em imagens / medidas quero prever o estado x t ? (usando equação dinâmica) Isso está correto?
Como posso interpretar a etapa de correção nesses termos (imagem, local de destino)?
computer-vision
kalman-filters
tracking
matlabit
fonte
fonte
Respostas:
Primeiro você deve assumir um modelo de movimento. Digamos que você deseja rastrear uma bola voando pelo ar. A bola tem uma aceleração descendente devido à gravidade de 9,8m / s ^ 2. Portanto, neste caso, o modelo de movimento de aceleração constante é apropriado.
Sob esse modelo, seu estado é posição, velocidade e aceleração. Dado o estado anterior, você pode prever facilmente o próximo estado.
Você também tem uma noção de detecção. Você tem um vídeo da bola em movimento e precisa detectar a bola em cada quadro de vídeo (por exemplo, usando a subtração de fundo).
Suas detecções são barulhentas. Além disso, o movimento da bola não se encaixa exatamente no modelo de aceleração constante devido à resistência do ar, vento, raios cósmicos etc. O filtro Kalman precisa de duas matrizes que descrevem isso: uma é a covariância do ruído de medição (sua imprecisão de detecção), e um para a covariância do ruído do processo (como o movimento da bola se desvia do modelo que você especificou).
Se você estiver rastreando um único objeto, o filtro Kalman permite suavizar parte do ruído e também prever onde o objeto está quando falta uma detecção (por exemplo, se o objeto está ocluído). Aqui está um exemplo de rastreamento de um único objeto com um filtro Kalman usando o Computer Vision System Toolbox para MATLAB.
Se você estiver rastreando vários objetos, as previsões do filtro Kalman permitem decidir qual detecção combina com qual objeto. Uma boa maneira de fazer isso é usar a probabilidade de log da detecção, dada a covariância de erro da previsão. Aqui está um exemplo de rastreamento de vários objetos com um filtro Kalman .
fonte
Este curso on-line é muito fácil e direto de entender e, para mim, explicou muito bem os filtros Kalman.
É chamado de "Programação de um carro robótico" e fala sobre três métodos de localização: localização de Monte Carlo, filtros de Kalman e filtros de partículas. Ele se concentra nas informações do sonar como exemplo, mas a explicação é simples o suficiente para que você possa simplesmente substituir "sonar" por "informações visuais" e tudo ainda faria sentido.
O curso é totalmente gratuito (está concluído agora, portanto você não pode participar ativamente, mas ainda pode assistir às palestras que presumo), ministradas por um professor de Stanford.
fonte
Ao fazer o rastreamento visual, você precisa de um modelo , que é uma representação matemática de um processo do mundo real. Esse modelo dará sentido a todos os dados obtidos nas medições, conectará os números que colocamos e saímos do sistema.
Mas um modelo é uma simplificação da realidade porque você usará um número reduzido de parâmetros. O que você não sabe sobre o sistema é chamado de ruído ou incerteza. É tão importante quanto o que você sabe. Como não podemos descrever um sistema perfeitamente, precisamos de medições do mundo real para nos dizer o que está acontecendo com o sistema que estamos modelando.
O Kalman é uma ferramenta para combinar o que estimamos, com nosso modelo e o que medimos do mundo, combinando ambos em um sentido ponderado.
Você calculará um estado a cada passo. É isso que você sabe atualmente sobre o sistema. O estado é influenciado pela equação do processo e pela equação da medida . Ambas as equações têm covariâncias de ruído diferentes. Kalman decidirá qual dos dois tem mais influência a cada passo, ajustando o ganho de Kalman.
É assim que penso sobre isso quando não quero me aprofundar nas fórmulas.
fonte
O filtro Kalman fornece recursivamente a estimativa linear ideal de um sinal perturbado pelo AWGN. No seu caso, o estado (o que você deseja estimar) será fornecido pelo local de destino. As medições serão determinadas pelo seu algoritmo.
Se você leu o artigo da Wikipedia, pode gostar de ver esta apresentação no rastreamento visual. Você tem algum livro?
fonte