Existe o xpdf que inclui o pdftotext
binário.
O Pdftotext converte arquivos Portable Document Format (PDF) em texto sem formatação.
No Linux, há um instalador disponível. Parece que ele também vem no poppler-utils
pacote. No OS X, você pode instalá-lo usando o Homebrew (instale primeiro) e depois use
brew install homebrew/x11/xpdf
que fará o download dos arquivos de origem e o compilará no OS X. Depois disso, use-o como:
pdftotext your_pdf_file.pdf
o que irá gerar um arquivo de texto sem formatação. Existem algumas opções também, confira man pdftotext
para mais detalhes.
Uma alternativa é poppler , no OSX:
brew install poppler
no Debian e amigos
apt-get install poppler-utils
brew install homebrew/x11/xpdf
brew install Caskroom/cask/pdftotext
Uma boa ferramenta para Windows é o A-PDF Text Extractor
fonte