Como pesquisar em PDFs usando expressões regulares?

15

Normalmente, uso o Notepad ++ para pesquisar arquivos usando expressões regulares. Hoje, estou me perguntando se existe um programa em PDF que faça o mesmo para PDFs. Claro que eu poderia converter o PDF em texto e usar o Notepad ++, mas existe uma maneira mais fácil sem converter?

Michael S.
fonte
1
Qual sistema operacional você está usando?
21412 Scott McClenning
Visualização do desenvolvedor do Windows e Windows 7
Michael S.

Respostas:

4
  1. O Agent Ransack é gratuito (gratuito) e suporta PDF, conforme confirmam suas notas de versão.
  2. PowerGREP é um produto comercial.

Assim como você disse, a alternativa evidente é converter PDFs em texto. Uma maneira de um programador configurar isso para o processamento em massa é usar o pacote PDFMiner do Python. O Agent Ransack usa "pdftotext" do projeto Xpdf (e você também pode).

minopret
fonte
sidenote: Agente Ransack é a versão lite do FileLocator
akira
Obrigado! Eu olhei mais de perto. As notas de versão do fornecedor confirmam que o File Locator Lite, também conhecido como Agent Ransack, suporta PDF. Editando minha resposta.
Minopret
O agente Ransack faz o trabalho. Você também pode tentar o DnGrep.
Michael S.