Existem três técnicas usadas no CV que parecem muito semelhantes entre si, mas com diferenças sutis:
- Laplaciano de Gaussiano:
- Diferença de Gaussianos:
- Convolução com a wavelet de Ricker :
Pelo que entendi atualmente: DoG é uma aproximação do LoG. Ambos são usados na detecção de blob e atuam essencialmente como filtros de passagem de banda. A convolução com uma wavelet mexicana Hat / Ricker parece alcançar praticamente o mesmo efeito.
Eu apliquei todas as três técnicas a um sinal de pulso (com escala necessária para obter as magnitudes semelhantes) e os resultados são muito próximos. De fato, LoG e Ricker parecem quase idênticos. A única diferença real que notei é que com o DoG, eu tinha 2 parâmetros livres para ajustar ( e ) vs 1 para LoG e Ricker. Eu também achei que a wavelet era a mais fácil / mais rápida, pois isso poderia ser feito com uma única convolução (feita através da multiplicação no espaço de Fourier com FT de um kernel) vs 2 para o DoG e uma convolução mais um Laplaciano para o LoG.
- Quais são as vantagens / desvantagens comparativas de cada técnica?
- Existem diferentes casos de uso em que um supera o outro?
Também tenho o pensamento intuitivo de que, em amostras discretas, LoG e Ricker degeneram para a mesma operação, pois pode ser implementado como o kernel .
A aplicação dessa operação a um gaussiano dá origem à wavelet Ricker / Hat. Além disso, como LoG e DoG estão relacionados à equação de difusão de calor, eu acho que eu poderia fazer com que ambos correspondessem a parâmetros suficientes.
(Ainda estou molhando meus pés com essas coisas para me sentir livre para corrigir / esclarecer isso!)
fonte
A wavelet Ricker, a wavelet Marr (isotrópica), o chapéu mexicano ou o Laplaciano de Gaussianos pertencem ao mesmo conceito: wavelets contínuas admissíveis (que satisfazem certas condições). Tradicionalmente, a wavelet Ricker é a versão 1D. A wavelet de Marr ou o chapéu mexicano são nomes dados no contexto de decomposições de imagem 2D. Você pode considerar, por exemplo, a Seção 2.2 de Um panorama sobre representações geométricas em várias escalas, entrelaçando a seletividade espacial, direcional e de frequência , Processamento de Sinais, 2011, L. Jacques et al. O Laplaciano de Gaussiano é a generalização multidimensional.
No entanto, na prática, as pessoas aceitam diferentes tipos de discretizações, em diferentes níveis.
Mas outras razões foram usadas, em algumas pirâmides do Laplaciano, por exemplo, que transformam o Dogg em filtros de passagem de banda ou detectores de borda mais genéricos.
Última referência: Correspondência de imagens usando pontos de interesse de escala e espaço generalizados , T. Lindeberg, 2015.
fonte