Existe alguma biblioteca OCR gratuita para Android? [fechadas]

148

Estou procurando um Java OCR que roda no Android, mas o Asprise não parece ser um OCR independente da plataforma. existe algum Java OCR de código aberto / gratuito que eu possa usar para o desenvolvimento de aplicativos Android?

user121196
fonte
9
Este questionada deve ser reaberto, É uma questão muito importante e válida
Utsav Gupta
5
O Google lançou recentemente uma API de OCR: developers.google.com/vision/text-overview
Wirling

Respostas:

38

O OCR pode consumir bastante a CPU; talvez você queira reconsiderá-lo em um telefone inteligente.

Além disso, que eu saiba, as bibliotecas populares de OCR são Aspire e Tesseract . Como o Java não é direto, você não receberá uma biblioteca de OCR do Android.

No entanto, o Tesseract é de código aberto (de fato hospedado no GitHub); para que você possa dedicar algum tempo para portar o subconjunto necessário ao Java. Meu entendimento é que não é C ++ insano , portanto, dependendo do quanto você precisa de OCR, pode valer a pena.

Resposta tão curta: Não.

Resposta longa: se você estiver disposto a trabalhar para isso.

Kevin Montrose
fonte
2
portando-o, você quer dizer reescrever o subconjunto em Java? isso pode exigir muito esforço, então não há um 100% Java OCR por aí?
user121196
13
Eu recomendaria tentar agrupar o Tesseract em uma camada JNI por meio do Android NDK, em vez de tentar portá-lo para o Java do Android. O Tesseract já parece estar portado para o ARM, portanto, deve ser mais fácil colocar uma API JNI em cima dele. Além disso, isso o mantém mais rápido que qualquer porta Java e simplificaria a manutenção a longo prazo.
CommonsWare
15
Já existe uma interface JNI do Tesseract para Java chamada Tessjeract. code.google.com/p/tesjeract
sventechie 04/12/2009
1
O Tesseract não fica a uma curta caminhada de C para java. O código que eu vi é altamente idiomático dos anos 80 C e não é facilmente transportável para outros idiomas.
plinth
2
@vincent desapareceu no ano passado. Versão JNA já está disponível: github.com/nguyenq/tess4j mas também um garfo Android: github.com/rmtheis/tess-two
sventechie
21

Estou tendo muita sorte com o tesseract-android-tools

Ben Pearson
fonte
A questão foi encerrada, mas é bom encontrar alguém que tenha tido resultados positivos. É muito difícil encontrar pessoas nesses projetos do tipo sourceforge. Pergunta: você tentou o Tesseract com digitalizações de imagens de passaportes ou documentos de identificação? Parece ok com PDFs de texto, mas estou tendo dificuldades com imagens.
PKHunter 02/09
Eu não experimentá-lo com qualquer coisa que tivesse imagens em diante, foi apenas um documento com texto (o mesmo tipo de letra, tipo de letra, tamanho)
Ben Pearson
Espero que ele trabalha para mim
Romantic Electron
20

Outra opção seria postar a imagem em um aplicativo da Web (possivelmente posteriormente) e processá-la no OCR sem os problemas da porta C ++ -> Java e possivelmente entupir a CPU móvel.

Jaco
fonte
idéia muito boa: DI supor que você significou um serviço web (asmx) graças
Omidoo
4

Sim existe.

Mas o OCR é muito vasto. Conheço um aplicativo Android que possui um recurso de OCR, mas esse pode não ser o tipo de OCR que você está procurando.

Esse aplicativo de código aberto é chamado Aedict e faz OCR em caracteres japoneses manuscritos. Não é tão lento.

Se não for o que você está procurando, especifique qual tipo de caractere e qual entrada de dados (imagem ou histórico de toque XY).

Nicolas Raoul
fonte
2

Você pode usar o leitor de OCR do Google Docs .

richardwiden
fonte
Postou esta resposta sobre outra questão que foi marcado como uma duplicata de um presente, então eu pensei que eu possa além postá-lo aqui
richardwiden
1
Link não relevante para a documentação
Volodymyr 15/11