Eu tenho uma pergunta sobre o reconhecimento de objetos, especialmente o reconhecimento de modelos de carros! Estou no início de um trabalho sobre a identificação do mesmo modelo de carro em imagens diferentes. No momento, acho que um dos melhores algoritmos para reconhecimento de objetos 3D é SIFT, mas depois de brincar um pouco com uma implementação de demonstração, tenho a estranha sensação de que esse algoritmo tem alguns problemas com objetos de metal brilhante, como carros, especialmente se eles tiverem cores diferentes.
Alguém conhece algum trabalho nessa área em geral, algum algoritmo adequado para a tarefa de encontrar o mesmo modelo de carro em imagens diferentes?
Agradeço antecipadamente por sua ajuda!
Respostas:
Eu daria uma olhada na abordagem chamada "saco de palavras" ou "palavras visuais". É cada vez mais usado para categorização e identificação de imagens. Esse algoritmo geralmente começa detectando pontos robustos, como pontos SIFT, em uma imagem. A região em torno desses pontos encontrados (o descritor SIFT de 128 bits no seu caso) é usada.
Da forma mais simples, é possível coletar todos os dados de todos os descritores de todas as imagens e agrupá-los, por exemplo, usando k-means. Toda imagem original possui descritores que contribuem para vários clusters. Os centróides desses clusters, ou seja, as palavras visuais, podem ser usados como um novo descritor para a imagem. Basicamente, você espera que os clusters de uma imagem para a qual seus descritores contribuam sejam indicativos da categoria de imagem.
Novamente, no caso mais simples, você tem uma lista de clusters e, por imagem, conta quais desses clusters continham descritores dessa imagem e quantos. É semelhante ao método Frequência de termo / Frequência inversa de documento (TD / IFD) usada na recuperação de texto. Veja este script rápido e sujo do Matlab .
Essa abordagem é pesquisada ativamente e existem muitos algoritmos muito mais avançados por aí.
O site do VLfeat contém uma demonstração mais avançada e agradável dessa abordagem, classificando o conjunto de dados caltech 101. Também digno de nota, são os resultados e o software da própria Caltech .
fonte