Procurando por um sistema de código aberto que permita o uso comercial para reconhecimento de imagens em uma coleção maciça e organicamente crescente de imagens em 2-D, onde as únicas variações conhecidas serão:
- Dimensionamento do tamanho da imagem,
- O ângulo em que a foto é tirada,
- Compensações de sincronização de cores, o que significa que, devido a irregularidades na captura e renderização de uma cor de imagem de origem, varia de instância para instância,
- Recorte da foto,
- Adição de marca d'água ou texto,
- Possíveis variações de foco, significando que a captura não estava em foco, não que um filtro de manipulação de imagem tenha sido aplicado.
Eu estou bem em ter que treinar o aplicativo, desde que o retorno disso seja compensado - ou seja, a longo prazo, espero que a contagem de instâncias em 2-D cresça além dos poucos milhares iniciais para cem de milhares; mas isso é de longo prazo, e eu ficaria feliz em ter uma solução que funcione bem com um conjunto de treinamento de 1000 instâncias e 10 exemplos por instância.
ATUALIZAÇÃO: A licença precisa poder ser usada para distribuição interna comercial sem a liberação do código fonte, mesmo interna para todos aqueles que possuem o binário. O código nunca será vendido, apenas usado interno, mas nem todo usuário terá acesso ao código fonte, apenas à interface.
Respostas:
Pode ser um pouco de baixo nível, mas o OpenCV pode fornecer as ferramentas necessárias para criar esse software de reconhecimento de imagem. Obviamente, o OpenCV não fornece tudo o que você precisa imediatamente (acho que não sou profissional), mas visa fornecer o que é necessário para a visão computacional em tempo real.
Você pode começar a ler a documentação aqui . Alguns bons livros também estão listados nessa página.
Espero que isso ajude, boa sorte!
fonte
Eu recomendo que você use o TopSurf como aqui: http://www.liacs.nl/~bthomee/topsurf/index.html http://press.liacs.nl/researchdownloads/topsurf/
Pode fazer reconhecimento em larga escala e é de código aberto. Pelo menos tente comparar seus resultados com ele.
fonte
Apenas para adicionar à discussão, atualmente estou trabalhando na correspondência de imagens e achei o ORB do OpenCV gratuito; no entanto SURF e SIFT não são. Você pode ver este exemplo como um possível ponto de partida.
fonte
O Pastec http://www.pastec.io deve atender aos requisitos da pergunta inicial.
É um índice de código aberto e um mecanismo de busca para reconhecimento de imagens lançado sob a LGPL. Permite adicionar, remover e procurar facilmente imagens correspondentes no índice usando uma API HTTP simples. Ele é baseado no OpenCV e usa o descritor ORB, que é livre de patentes, ao contrário do SURF e do SIFT.
fonte