Como extrair todas as páginas de um PDF em documentos PDF individuais

1

Quero poder extrair cada folha de um PDF em um arquivo PDF separado. Eu olhei alto e baixo, mas parece que não há uma maneira automatizada de fazer isso sem voltar aos hackers do Automator (ao qual estou aberto se alguém tiver um exemplo de uma maneira realmente limpa de fazer isso como um serviço e salvar os arquivos para o diretório de origem.)

Então, por exemplo:

Arquivo PDF: [página 1, página 2, página 3]

Arquivo PDF: [página 1], Arquivo PDF: [página 2], Arquivo PDF: [página 3]

freerangemonkey
fonte

Respostas:

3

Lembro-me de procurar fazer a mesma coisa há alguns anos e eis que ainda tinha o link no arquivo profundo: http://forums.macrumors.com/showthread.php?t=1354754

Um membro do Fórum MacRumors chamado Oligarch reuniu várias ferramentas de PDF de linha de comando, que podem ser baixadas deste link: http://users.skynet.be/tools/

O comando pdfburst é o que você precisa:

NAME
     pdfburst -- burst (split) PDF documents into single pages

SYNOPSIS
     pdfburst file [path]

DESCRIPTION
     The pdfburst utility bursts (splits) the PDF document file into single
     pages which it writes to path, appended by an underscore character and
     zero-padded page numbers.

     If file is a single dash (-), the PDF document is read from the standard
     input.

     If path is omitted, the base name (last path component) of file is used
     and the single page files are created in the current working directory.

     If path ends with a slash (/), it designates a directory and the single
     page files are named with just the page number.

     Missing directories along path are created.
IconDaemon
fonte
11
Você ainda pode encontrá-los através do Way Back Machine. web.archive.org/web/20150619012643/http://users.skynet.be/tools/…
cde
2

Outra opção é usar o pdftk :

pdftk input.pdf burst
Lri
fonte
1

Você está procurando pdfseparate. De man pdfseparate:

DESCRIPTION
       pdfseparate extract single pages from a Portable Document Format (PDF).

       pdfseparate  reads  the  PDF  file PDF-file, extracts one or more pages, and writes one PDF file for each page to PDF-page-pattern, PDF-page-pattern should contain %d.  %d is
       replaced by the page number.

       The PDF-file should not be encrypted.

[...]

EXAMPLE
      pdfseparate sample.pdf sample-%d.pdf

      extracts all pages from sample.pdf, if i.e. sample.pdf has 3 pages, it produces

      sample-1.pdf, sample-2.pdf, sample-3.pdf
3cheesewheel
fonte