Estou tentando, para meus próprios objetivos de aprendizado, desenvolver uma implementação de um algoritmo que listaria livros, dada a imagem de uma estante de livros como a seguinte:
O primeiro passo é dividir a imagem em livros individuais.
Meu algoritmo, no Mathematica , é:
img = ColorConvert[Import["http://i.stack.imgur.com/IaLQk.jpg"], "GrayScale"]
- faça uma detecção básica de borda e
remova o texto e tente manter as linhas longas
edge = DeleteSmallComponents[EdgeDetect[img, 3],Last[ImageDimensions[img]]/5]
remova linhas horizontais indesejadas
lines = Sort[ImageLines[img5] /. {{0., _}, {_, _}} -> Sequence[]] Show[img, Graphics[{Thick, Orange, Line /@ lines}]]
Os resultados, porém, são menos que ótimos:
Minhas perguntas são:
- Como posso melhorar isso para obter melhores resultados?
- Existe uma maneira mais inteligente de fazer isso?
- quanto mais devo processar as imagens para aumentar a precisão na fase (mais tarde) do OCR?
- Como usar as informações de cores para melhorar a segmentação?
opencv
computer-vision
image-segmentation
Oren Pinsky
fonte
fonte
Respostas:
Aqui está o link para um trabalho de pesquisa que tenta fazer o mesmo que você queria. Isso pode ajudá-lo. usando recursos de imagem Também um vídeo legal no youtube
fonte
Qual método você está usando para detectar as linhas? Você já experimentou o LSD ?
Aqui estão os resultados de um teste rápido que fiz usando LSD:
A segunda imagem são os resultados com a mesma restrição de ângulo, mas desconsiderando os comprimentos dos segmentos:
Você pode tentar brincar um pouco com isso, descobrir como escolher os melhores segmentos de linha, estendê-los para linhas e talvez obter resultados um pouco melhores do que os que você postou.
fonte
Você pode tentar fazer a detecção de bordas em domínios de cores individuais e depois mesclá-los, usando seu método de escolha para a detecção de bordas.
Comparado à detecção de bordas diretamente na imagem colorida, ela pode produzir melhores resultados.
fonte
O artigo do link quebrado fornecido por isrish pode ser encontrado Combinando recursos de imagem e texto: uma abordagem híbrida para o reconhecimento da coluna móvel de livros , Proc. 19ª conferência internacional da ACM sobre Multimídia, 2011. Também é possível conferir outros trabalhos de David Chen et al. , por exemplo, Rastreamento de ativos de baixo custo usando telefones com câmera com reconhecimento de local , Proc. SPIE 2010.
fonte