Existe um programa de linha de comando para linux que me permita ler o texto dos PDFs? Vou querer viver com falta de fotos.
fonte
Existe um programa de linha de comando para linux que me permita ler o texto dos PDFs? Vou querer viver com falta de fotos.
Existem várias ferramentas pdf2text no Ubuntu. Por exemplo, o pacote poppler-utils contém /usr/bin/pdftotext
.
Como abrir um arquivo PDF no Linux / FreeBSD (a parte inferior do artigo fornece as opções que você procura)
zathura é a ferramenta que você está procurando => http://pwmt.org/projects/zathura/
Para o Ubuntu e o Arch Linux, basta usar as ferramentas de gerenciamento de pacotes apt-get install zathura
ou pacman -S zathura
para instalar.
Para visualizar PDF em CLI / terminais, basta executar zathura /path/to
NOTA : zathura
depende das bibliotecas do cliente x11, ele não pode ser executado sem elas. Portanto, se você fizer o ssh para um host remoto e executá zathura
-lo, precisará fazer o X11 Forwarding (o que significa que você precisa executar um X Server - o Ubuntu Desktop o fará).
Pode-se usar less PDFFILE.pdf
, que mostra o texto do pdf. Requer pdftotext
de xpdf
. Eu acho que funciona muito bem para PDFs com muito texto.
Além disso, se você quiser ver o arquivo pdf real (em baixa qualidade), poderá usar o fbi , o visualizador de imagens do buffer de quadro linux.
sudo fbi PDFFILE.pdf
Pequeno problema é que ele precisa de privilégios de root.