Isso é principalmente curiosidade, mas existem implementações de OCR em Java puro? Estou curioso para saber como isso funcionaria puramente em Java e o OCR em geral me interessa, então eu adoraria ver como isso é implementado em uma linguagem que eu entendo completamente. Naturalmente, isso exigiria que a implementação fosse de código aberto, mas ainda estou interessado em soluções proprietárias, pois eu poderia pelo menos verificar o desempenho nesse caso.
Eu vi alguns que podem ser usados em Java (como o Asprise ), mas não parece que essas sejam implementações puras de Java ... existem?
Respostas:
Eu recomendo tentar o projeto Java OCR no sourceforge.net. Eu o desenvolvi originalmente e tenho uma postagem no blog .
Desde que eu o coloquei no sourceforge, sua funcionalidade foi expandida e melhorada bastante através do excelente trabalho de um pesquisador / desenvolvedor voluntário.
Experimente e, se você não gostar, pode sempre melhorar!
fonte
Testamos alguns mecanismos de OCR com Java como Tesseract, Asprise, Abbyy etc. Em nossa análise, Abbyy deu os melhores resultados.
fonte
ProcessBuilder
.Se você estiver procurando por uma opção muito extensível ou tiver um domínio de problema específico, considere usar o seu próprio mecanismo Java Neural Oriented a Objetos Java . Outra referência JOONE .
Eu usei com sucesso em um projeto pessoal para identificar a letra de uma imagem como essa ; você pode encontrar toda a fonte do componente OCR da minha aplicação no github, aqui .
fonte
Há uma variedade de bibliotecas de OCR por aí. No entanto, minha experiência é que as principais implementações comerciais, ABBYY, Omnipage e ReadIris, superam em muito o código aberto ou outras implementações menores. Essas bibliotecas comerciais não foram projetadas principalmente para trabalhar com Java, embora, é claro, seja possível.
Obviamente, se seu interesse é aprender o código, as implementações de código aberto farão o truque.
fonte
Apenas encontrei este (não sei, não testei, verifique você mesmo)
Ron Cemer Java OCR
Como você só precisa disso por curiosidade, pode procurar a fonte desse applet.
Faz OCR de caracteres manuscritos com uma rede neuronal
OCR Java: reconhecimento de manuscrito
fonte