Quando quero pesquisar um snipet, como searchPart1, alguma pesquisa de texto desconhecidaPart2 em um arquivo de texto, eu uso searchPart1.*searchPart2
. Mas isso não é possível em nenhum leitor de pdf que eu use. Atualmente, eu converto o pdf em um arquivo de texto e o abro usando less
or geany
, depois uso a expressão regular disponível nele.
Existe um leitor de PDF com pesquisa de expressão regular diferente da linha de comando pdfgrep
pdfgrep
é um grepper, por isso não respondeu à pergunta completamente. Um leitor de pdf com pdfgrep embutido é obrigado a aceitar a respostaRespostas:
O pdfgrep , nos repositórios , não é exatamente um leitor e requer o uso do terminal, mas elimina a necessidade de primeiro converter o arquivo pdf em um arquivo de texto e depois abri-lo em um editor de texto capaz:
Além dos recursos listados no Synaptic, você pode pesquisar vários arquivos e recursivamente. Uma grande diferença do normal
grep
é que o pdfgrep não fornece números de linhas, mas números de páginas.man pdfgrep
tem detalhes.Um exemplo simples:
Aqui,
i
é para diferenciar maiúsculas de minúsculas en
fornece o número da página, não o número da linha.Um exemplo da saída é semelhante a:
Há um breve vídeo do YouTube, Pdfgrep - Pesquisar texto dentro de arquivos PDF - Linux CLI também.
fonte