Normalmente, uso o Notepad ++ para pesquisar arquivos usando expressões regulares. Hoje, estou me perguntando se existe um programa em PDF que faça o mesmo para PDFs. Claro que eu poderia converter o PDF em texto e usar o Notepad ++, mas existe uma maneira mais fácil sem converter?
15
Respostas:
várias opções:
fonte
Assim como você disse, a alternativa evidente é converter PDFs em texto. Uma maneira de um programador configurar isso para o processamento em massa é usar o pacote PDFMiner do Python. O Agent Ransack usa "pdftotext" do projeto Xpdf (e você também pode).
fonte