Tenho diferentes tipos de faturas legais de cobrança. Quero digitalizá-los em planilhas do Excel. Como seus layouts são diferentes e existem muitos, não consigo encontrar uma maneira de lidar com eles. Alguém pode me fornecer uma solução prática?
microsoft-excel
ocr
Willams
fonte
fonte
Respostas:
Não existe uma solução boa e com preços razoáveis que eu conheça :(
Você pode tentar verificar o Nuance OmniPage ou Abby FlexiCapture (existem edições para desktop até as versões corporativas de US $ 100 mil). Algum tempo atrás, eu havia comparado a qualidade dos SDKs / OCR entre eles. Não há muita diferença, apesar de eu achar que Abbyy era um pouquinho melhor (Nuance caiu algumas vezes, Abbyy não).
O OmniPage e o FlexiCapture (FineReader) possuem edições para desktop que pretendem converter PDFs em arquivos editáveis do Excel. Pelo que aprendi ao mexer nas versões de avaliação gratuita, elas criam arquivos excel editáveis, mas apenas para fontes limpas de alta qualidade. Ambos também oferecem funcionalidade de processamento em lote.
Também achei o scanstore.com um recurso incrível:
http://www.scanstore.com/Scanning_Software/Forms_Processing/Invoice_Processing/
Se você procura código-fonte aberto - o melhor 'mecanismo' é o tesseract. Você precisará criar os bits de captura de formulários completos em torno dele. Eu pensei um pouco sobre isso - e você precisa:
Ah, e para sua informação, existem muitas empresas de serviços 'BPO' que têm pessoas reais para fazer o trabalho de entrada de dados. Não é tão caro quanto você imagina.
fonte
Aqui estão alguns softwares de OCR gratuitos: CuneiForm, GOCR, Ocrad, OCRopus, Tesseract. Mas o resultado não é tão bom. Mas você pode tentar o FineReader, ExperVision, OmniPage, o resultado será melhor. No entanto, com base na minha experiência, você não pode confiar na solução tecnológica pura. Se você deseja controlar o custo do seu projeto a um preço razoável. Integrar a tecnologia OCR e os recursos humanos é uma boa escolha. Tanto quanto eu sei, a Expervision pode fornecer serviços personalizados de tecnologia OCR e BPO, você pode verificar a Web deles. Expervision
fonte