Registro de Imagem por Segmentação

15

Os algoritmos de registro de imagem geralmente são baseados em recursos pontuais, como SIFT (Transform-Invariant Feature Transform).

Vi algumas referências a recursos de linha, mas estava pensando se seria possível combinar segmentos de imagem em vez de pontos . Por exemplo, dada fonte e imagem transformada:

insira a descrição da imagem aqui

Eu posso fazer detecção de borda, desfoque e Watershed Transform em cada um:

insira a descrição da imagem aqui

Lamentavelmente, a segmentação acabou sendo muito diferente em cada imagem para corresponder a segmentos individuais.

Eu vi alguns trabalhos sobre formas correspondentes e descritores de formas que são invariantes a transformações afins, então essa área parece promissora ...

Existem métodos de segmentação mais robustos para afinar (ou até projetar) as deformações da imagem?

Libor
fonte
1
Meu senso comum me diz que regiões menores são mais robustas às transformações globais. Portanto, a segmentação deve ter muitos segmentos pequenos. Além disso, algumas formas particulares são invariantes para algumas transformações, (como círculos de rotações)
Andrey Rubshtein
MSER (regiões extremais maximamente estáveis) são regiões, não pontos. E eles são invariantes à transformação afim. Mas não é um método de segmentação, estritamente falando.
Niki Estner
@nikie Se você colocar seu comentário como resposta, eu o aceitaria. Eu estava interessado em segmentação, pois os recursos da região contêm algumas informações sobre a transformação de imagens e poderiam ser usados ​​para adivinhar a transformação entre as imagens. Certamente estudarei o artigo sobre MSER.
Libor
Atualmente, estou trabalhando no CBIR usando árvores de componentes. A representação da árvore de componentes de uma imagem não dependeria muito das deformações (mesmo projetivas) da imagem, níveis diferentes permitiriam comparações e operações com um nível de detalhe diferente e deveriam funcionar melhor do que as técnicas atuais em imagens de baixa textura . É apenas um tópico de pesquisa por enquanto, apenas iniciado, mas espero que exista algo na abordagem, caso contrário, eu não receberia uma concessão para fazer isso. Mas, se alguém fez algo nesse sentido, pode ser útil.
Penelope #
@penelope Estes trabalhos no CBIR também podem ser úteis para mosaicos de imagens (meu interesse específico), onde definimos imagens com características semelhantes. A abordagem popular atual é a pesquisa de alta dimensão sobre descritores de pontos (por exemplo, SIFT), que podem levar a falsas correspondências entre imagens enquanto "regiões" ou "componentes", em vez de pontos, podem discriminá-las. Você tem alguma referência a artigos sobre representação de imagens em Árvore de Componentes? Muito Obrigado.
Libor

Respostas:

4

MSER (regiões extremais maximamente estáveis) são regiões, não pontos. E eles são invariantes à transformação afim. Mas não é um método de segmentação, estritamente falando

Informalmente, a idéia é encontrar blobs em vários limites e, em seguida, selecionar os blobs que menos alteram sua forma / área em um intervalo de limites. Essas regiões devem ser estáveis ​​para uma grande variedade de transformações em escala de cinza e geométricas.

Niki Estner
fonte
4

Atualmente, estou trabalhando no CBIR usando árvores de componentes , o que deve ser uma idéia relativamente nova. Algumas vantagens esperadas do uso de Árvores de Componentes para descrever imagens seriam:

  • A representação da árvore de componentes de uma imagem não dependeria muito das deformações (mesmo projetivas) da imagem
  • Examinar diferentes níveis da árvore permitiria comparações e operações com um nível diferente de detalhes
  • A discriminação e a descrição devem funcionar melhor do que as técnicas atuais em imagens com pouca textura.

Como eu comecei com pesquisas relacionadas a esse tópico, tenho apenas uma vaga idéia de meus objetivos: representar imagem com a Árvore de componentes e comparar as referidas Árvores de componentes, diretamente através da busca de uma representação vetorizada. Provavelmente poderei dizer muito mais em algumas semanas (ou meses), mas por enquanto só posso oferecer a lista de artigos recomendados para mim como uma introdução às Árvores de Componentes (ainda não as li):

Talvez eu possa atualizar a resposta como e se encontrar algo relevante.

Além disso, se seu objetivo é, de certa forma, corresponder regiões de imagem com mais precisão , em vez de apenas pontos , porque as regiões podem ser mais discriminatórias, houve uma sugestão interessante em J. Sivic e A. Zisserman: "Google Video: uma recuperação de texto Abordagem à correspondência de objetos nos vídeos " .

Refiro-me à seção que trata da Consistência espacial , onde um grupo de correspondências entre pontos de recurso é aceito apenas se os pontos de recurso mantêm uma configuração espacial semelhante nas duas imagens. Assim, a correspondência não depende apenas do tipo de recurso extraído (DoG, MSER, ...) ou do descritor (SIFT), mas também olha para o ambiente mais amplo de um ponto de recurso, tornando-o (pelo menos um pouco) dependente da região.

Penélope
fonte