Lendo alguns artigos sobre odometria visual, muitos usam profundidade inversa. É apenas o inverso matemático da profundidade (significando 1 / d) ou representa outra coisa. E quais são as vantagens de usá-lo?
slam
computer-vision
odometry
Mehdi
fonte
fonte
A parametrização de profundidade inversa representa a distância de um ponto de referência, d, da câmera exatamente como diz, como proporcional a 1 / d dentro do algoritmo de estimativa. O racional por trás da abordagem é que, abordagens de filtragem como o filtro estendido de Kalman (EKF) assumem que o erro associado aos recursos é gaussiano.
Em uma configuração de odometria visual, a profundidade de um ponto de referência é estimada rastreando os recursos associados em algumas séries de quadros e, em seguida, usando a paralaxe induzida. No entanto, para recursos distantes (em relação ao deslocamento da câmera), a paralaxe resultante será pequena e, o mais importante é que a distribuição de erros associada à profundidade é altamente elevada perto da profundidade mínima com uma cauda longa (ou seja, não é bem modelada por meio de uma Distribuição gaussiana). Para ver um exemplo, consulte a Figura 7 no artigo de Civera et al. (Mencionado por @freakpatrol), ou a Figura 4 de Fallon et al. ICRA 2012 .
Ao representar a profundidade inversa (isto é, 1 / d), esse erro se torna gaussiano. Além disso, permite representar pontos muito distantes, por exemplo, pontos no infinito.
fonte
O artigo de Davison, introduzindo o método, é fácil de entender:
Parametrização Inversa de Profundidade para SLAM Monocular por Javier Civera, Andrew J. Davison e JM Martınez Montiel DOI: 10.1109 / TRO.2008.2003276
fonte
Além das razões mencionadas em outras respostas sobre o condicionamento numérico da profundidade inversa, uma das principais razões para esse termo aparecer na literatura especificamente em odometria visual é a maneira como as profundidades são calculadas a partir da visão estéreo: a distância em X entre o ponto em que um ponto aparece nas imagens das duas câmeras.
Profundidade,Z , é então calculado a partir da disparidade, d , Como Z= fBd , Onde f e B são a distância focal (em pixels) e a linha de base da câmera (em metros), respectivamente. Portanto, trabalhar no espaço de profundidades inversas o coloca também no espaço de disparidades, sendo a quantidade estimada diretamente, e fica mais fácil trabalhar com distribuições ou erros nessa quantidade.
fonte