Pesquise texto em vários PDFs e documentos

36

Eu recebi várias anotações escritas por outros alunos, mas elas são de um livro antigo que não lidava com tudo na mesma ordem, por isso preciso pesquisar as anotações de cada capítulo (cada capítulo é diferente. pdf ou .doc) para "condicionamento de rastreio", por exemplo.

Eu costumava usar o Google Desktop para isso, tenho o Launchy agora e disse para pesquisar em PDFs, mas ele apenas pesquisa os títulos, não o conteúdo.

Obrigado por qualquer ajuda.

Coelho
fonte
Depois de encontrar uma correspondência, o que você está tentando fazer?
Cremefraiche
Você precisa saber se uma sequência ocorre em um arquivo ou onde está?
Jacob Vlijm
Depois de descobrir qual capítulo aborda o tópico que estou procurando, posso ler as notas sobre esse tópico nesse capítulo, então só preciso saber se e não onde. (Lembre-se, ao responder, que não posso comentar suas respostas porque não tenho 50 pontos de reputação; só posso comentar minha própria pergunta).
Rabbit
11
Você pode comentar sobre as respostas à sua pergunta, não temos que dura.
precisa
@Rabbit com o sumário de edição que você me bloqueou a editar a sua pergunta para a remoção de "Obrigado";)
αғsнιη

Respostas:

31

Recoll é provavelmente o mecanismo de pesquisa de documentos mais versátil que você encontrará no Linux:

insira a descrição da imagem aqui

Ele suporta uma infinidade de formatos diferentes e é muito personalizável.

Para instruções de instalação e outros indicadores, consulte esta resposta . A documentação oficial também é muito útil.

Glutanimado
fonte
4
Aceitando esta resposta porque é nativa do linux, está no centro de software do ubuntu e é tudo gui. Em outras palavras, esta é a mais fácil: D Obrigado :) #
1010 Rabbit Rabbit
11
Aplicativo incrível. Tão rápido!
precisa saber é o seguinte
2
Não se esqueça de instalar antiwordpara pesquisar .docarquivos também.
Lenooh
22

Instale o pacote pdfgrep

sudo apt-get install pdfgrep

então use o comando:

find /path -iname '*.pdf' -exec pdfgrep pattern {} +
Edward Torvalds
fonte
Podemos configurá-lo com o mecanismo de pesquisa gnome?
Um Umar Mukthar
Obrigado! Isso funcionou. Se alguém estiver se perguntando, "padrão" é o que você substituirá por um texto específico. Se o texto tiver espaços, coloque-o entre aspas duplas.
6005
2
Se você souber onde estão seus arquivos PDF, poderá simplificar o comando para apenas pdfgrep -r "my expression"onde -rprocura recursivamente através de diretórios.
LondonRob
4

Use o DocFetcher , é um aplicativo Linux nativo que indexa e pesquisa em vários tipos de documentos.

labnut
fonte
11
Obrigado! Isso funciona bem, mas parece que não é possível executá-lo sem o uso do terminal. Eu votaria em você, mas .. ainda não pode votar;)
Rabbit
@Rabbit Hum, acho que você também pode votar nas respostas à sua pergunta.
precisa
@AlaaAli Não, o limite de reputação também se aplica ao OP.
Glutanimado
11
Sim, eu não poderia. Agora eu posso! :) Eu só precisava de 15
Rabbit
0

Entendo que o Adobe Reader é um software proprietário, mas possui uma funcionalidade de Pesquisa em Arquivos bem projetada (acessível no menu Editar -> Pesquisa ou pressionando Ctrl+ Shift+ F).

Opções de pesquisa simples

A janela Pesquisa simples é mostrada abaixo:

Pesquisa simples no Adobe Reader

Você precisa definir onde você gostaria de pesquisar? para Todos os documentos PDF e selecione o local no menu suspenso ( Procurar local ).

Você pode inserir o item de pesquisa na opção Que palavra ou frase deseja pesquisar? campo e especifique opções de pesquisa: Somente palavras inteiras , Diferencia maiúsculas de minúsculas , Incluir indicadores , Incluir comentários .

Opções de pesquisa avançada

A pesquisa avançada é mais configurável - veja a imagem abaixo:

Busca Avançada

O caminho da pesquisa é definido em Examinar .
Item de pesquisa - em Qual palavra ou frase você gostaria de pesquisar? .
O resultado de retorno que contém as opções: Corresponder à palavra ou frase exata , Corresponder a qualquer uma das palavras , Corresponder a todas as palavras , Consulta booleana .

Outras opções incluem: Somente palavras inteiras , Case-sensetive , Proximidade , Stemming , Incluir marcadores , Incluir comentários , Incluir Anexos .


Nota: você ainda pode instalar o Adobe Reader nativo versão 9.5.5, conforme descrito em outro segmento .

N0rbert
fonte
-5
  1. primeiro download do software "wine" no seu desktop
  2. Nesta vitória, instale o seekfast como o link abaixo
  3. http://seekfast.org/download-seekfast
  4. você pode fazer seu trabalho
  5. seu trabalho, se não for então plz me comentar
Virbhadrasinh Gohil
fonte
11
Votado para baixo por sugerir wine (o que significa janelas), quando existem soluções Linux.
Sri
11
desculpe mano, mas quando eu preciso disso vezes eu uso isso é por isso que dê essa sugestão.
Virbhadrasinh Gohil
A aplicação Windows em execução no ubuntu geralmente não é sugerida. Como o linux está praticamente livre de vírus. Eu concordo com a idéia de
@Sri