Como posso extrair um intervalo de páginas / parte de um PDF?

423

Você tem alguma idéia de como extrair uma parte de um documento PDF e salvá-lo como PDF? No OS X, é absolutamente trivial usando o Preview. Eu tentei o editor de PDF e outros programas, mas sem sucesso.

Gostaria de um programa em que selecionasse a parte desejada e, em seguida, salve-a como pdf com um comando simples como CMD+ Nno OS X. Quero que a parte extraída seja salva no formato PDF e não no JPEG etc.

pdf split user72469
fonte

Você tentou o ImageMagick?

Martin Schröder

3

Isso é para bitmap, preciso de algo que salve como PDF!

user72469

3

pdfshufflernos repositórios.

Marc

2

pdfshufflernão funciona mais no Ubuntu 14.04+. Você sempre pode usar a caixa de diálogo de impressão ou uma alternativa baseada terminal comopdfseparate

Rho

@Rho A versão instalada diretamente via apt-getainda funciona bem para mim no 16.04. Talvez eles tenham corrigido os erros, se houver algum?

Xji

476

pdftké uma ferramenta multiplataforma útil para o trabalho ( página inicial do pdftk ).

pdftk full-pdf.pdf cat 12-15 output outfile_p12-15.pdf

você passa o nome do arquivo do pdf principal e diz para ele incluir apenas determinadas páginas (12 a 15 neste exemplo) e o envia para um novo arquivo.

Martin H
fonte

6

Se eu quiser extrair as páginas 1-10, 15 e 17, como escrevo o comando?

Patrick Li

31

@PatrickLipdftk A=in.pdf cat A1-10 A15 A17 output out.pdf

m8mble 28/10

9

Observe que pdftknão está disponível no Ubuntu 18.04. (veja askubuntu.com/questions/1028522/… )

alkamid

6

@alkamid é: sudo tirar instalar pdftk

Qubix

12

Embora pdftkseja certamente uma ferramenta que pode fazer o trabalho, eu recomendaria contra isso. Este não é um software livre, mas uma parte desajeitada de shareware. Também precisa da JVM. Uma ferramenta mais razoável é qpdf, como sugerido em outra resposta .

leftaroundabout

246

muito simples, use o leitor de PDF padrão:

imprimir como arquivo. é isso! menu de impressão

então

definindo novo PDF

Abdennour TOUMI
fonte

12

Flippin brilhante

andybleaden

17

Produz resultados catastróficos com arquivos beamer, mapas e outros documentos que não estão em conformidade com o formato da página da impressora.

Luís de Sousa

11

Isso pode resultar em um arquivo com um tamanho muito maior que o documento original.

dat

7

portanto, não "extrai" o intervalo de páginas. Ele cria um novo pdf a partir do antigo, como se você usasse um par de impressora / scanner de alta definição.

sylvainulg

6

Bom para casos simples, mas resulta indesejado em documentos com comentários destacados: o realce se torna 100% de opacidade e bloqueia o texto.

loved.by.Jesus

79

Intervalo de páginas - script Nautilus

visão global

Criei um script um pouco mais avançado com base no tutorial @ThiagoPonte vinculado a. Suas principais características são

que é baseado em GUI,
compatível com espaços em nomes de arquivos,
e com base em três back-end diferentes, capazes de preservar todos os atributos do arquivo original

Captura de tela

insira a descrição da imagem aqui

Código

#!/bin/bash
#
# TITLE:        PDFextract
#
# AUTHOR:       (c) 2013-2015 Glutanimate (https://github.com/Glutanimate)
#
# VERSION:      0.2
#
# LICENSE:      GNU GPL v3 (http://www.gnu.org/licenses/gpl.html)
# 
# OVERVIEW:     PDFextract is a simple PDF extraction script based on Ghostscript/qpdf/cpdf.
#               It provides a simple way to extract a page range from a PDF document and is meant
#               to be used as a file manager script/addon (e.g. Nautilus script).
#
# FEATURES:     - simple GUI based on YAD, an advanced Zenity fork.
#               - preserves _all_ attributes of your original PDF file and does not compress 
#                 embedded images further than they are.      
#               - can choose from three different backends: ghostscript, qpdf, cpdf
#
# DEPENDENCIES: ghostscript/qpdf/cpdf poppler-utils yad libnotify-bin
#                         
#               You need to install at least one of the three backends supported by this script.
#
#               - ghostscript, qpdf, poppler-utils, and libnotify-bin are available via 
#                 the standard Ubuntu repositories
#               - cpdf is a commercial CLI PDF toolkit that is free for personal use.
#                 It can be downloaded here: https://github.com/coherentgraphics/cpdf-binaries
#               - yad can be installed from the webupd8 PPA with the following command:
#                 sudo add-apt-repository ppa:webupd8team/y-ppa-manager && apt-get update && apt-get install yad
#
# NOTES:        Here is a quick comparison of the advantages and disadvantages of each backend:
#
#                               speed     metadata preservation     content preservation        license
#               ghostscript:     --               ++                         ++               open-source
#               cpdf:             -               ++                         ++               proprietary
#               qpdf:            ++                +                         ++               open-source
#
#               Results might vary depending on the document and the version of the tool in question.
#
# INSTALLATION: https://askubuntu.com/a/236415
#
# This script was inspired by Kurt Pfeifle's PDF extraction script 
# (http://www.linuxjournal.com/content/tech-tip-extract-pages-pdf)
#
# Originally posted on askubuntu
# (https://askubuntu.com/a/282453)

# Variables

DOCUMENT="$1"
BACKENDSELECTION="^qpdf!ghostscript!cpdf"

# Functions

check_input(){
  if [[ -z "$1" ]]; then
    notify "Error: No input file selected."
    exit 1
  elif [[ ! "$(file -ib "$1")" == *application/pdf* ]]; then
    notify "Error: Not a valid PDF file."
    exit 1
  fi
}

check_deps () {
  for i in "$@"; do
    type "$i" > /dev/null 2>&1 
    if [[ "$?" != "0" ]]; then
      MissingDeps+="$i"
    fi
  done
}

ghostscriptextract(){
  gs -dFirstPage="$STARTPAGE "-dLastPage="$STOPPAGE" -sOutputFile="$OUTFILE" -dSAFER -dNOPAUSE -dBATCH -dPDFSETTING=/default -sDEVICE=pdfwrite -dCompressFonts=true -c \
  ".setpdfwrite << /EncodeColorImages true /DownsampleMonoImages false /SubsetFonts true /ASCII85EncodePages false /DefaultRenderingIntent /Default /ColorConversionStrategy \
  /LeaveColorUnchanged /MonoImageDownsampleThreshold 1.5 /ColorACSImageDict << /VSamples [ 1 1 1 1 ] /HSamples [ 1 1 1 1 ] /QFactor 0.4 /Blend 1 >> /GrayACSImageDict \
  << /VSamples [ 1 1 1 1 ] /HSamples [ 1 1 1 1 ] /QFactor 0.4 /Blend 1 >> /PreserveOverprintSettings false /MonoImageResolution 300 /MonoImageFilter /FlateEncode \
  /GrayImageResolution 300 /LockDistillerParams false /EncodeGrayImages true /MaxSubsetPCT 100 /GrayImageDict << /VSamples [ 1 1 1 1 ] /HSamples [ 1 1 1 1 ] /QFactor \
  0.4 /Blend 1 >> /ColorImageFilter /FlateEncode /EmbedAllFonts true /UCRandBGInfo /Remove /AutoRotatePages /PageByPage /ColorImageResolution 300 /ColorImageDict << \
  /VSamples [ 1 1 1 1 ] /HSamples [ 1 1 1 1 ] /QFactor 0.4 /Blend 1 >> /CompatibilityLevel 1.7 /EncodeMonoImages true /GrayImageDownsampleThreshold 1.5 \
  /AutoFilterGrayImages false /GrayImageFilter /FlateEncode /DownsampleGrayImages false /AutoFilterColorImages false /DownsampleColorImages false /CompressPages true \
  /ColorImageDownsampleThreshold 1.5 /PreserveHalftoneInfo false >> setdistillerparams" -f "$DOCUMENT"
}

cpdfextract(){
  cpdf "$DOCUMENT" "$STARTPAGE-$STOPPAGE" -o "$OUTFILE"
}

qpdfextract(){
  qpdf --linearize "$DOCUMENT" --pages "$DOCUMENT" "$STARTPAGE-$STOPPAGE" -- "$OUTFILE"
  echo "$OUTFILE"
  return 0 # even benign qpdf warnings produce error codes, so we suppress them
}

notify(){
  echo "$1"
  notify-send -i application-pdf "PDFextract" "$1"
}

dialog_warning(){
  echo "$1"
  yad --center --image dialog-warning \
  --title "PDFExtract Warning" \
  --text "$1" \
  --button="Try again:0" \
  --button="Exit:1"

  [[ "$?" != "0" ]] && exit 0
}

dialog_settings(){
  PAGECOUNT=$(pdfinfo "$DOCUMENT" | grep Pages | sed 's/[^0-9]*//') #determine page count

  SETTINGS=($(\
      yad --form --width 300 --center \
          --window-icon application-pdf --image application-pdf \
          --separator=" " --title="PDFextract"\
          --text "Please choose the page range and backend"\
          --field="Start:NUM" 1[!1..$PAGECOUNT[!1]] --field="End:NUM" $PAGECOUNT[!1..$PAGECOUNT[!1]] \
          --field="Backend":CB "$BACKENDSELECTION" \
          --button="gtk-ok:0" --button="gtk-cancel:1"\
      ))

  SETTINGSRET="$?"

  [[ "$SETTINGSRET" != "0" ]] && exit 1

  STARTPAGE=$(printf %.0f ${SETTINGS[0]}) #round numbers and store array in variables
  STOPPAGE=$(printf %.0f ${SETTINGS[1]})
  BACKEND="${SETTINGS[2]}"
  EXTRACTOR="${BACKEND}extract"

  check_deps "$BACKEND"

  if [[ -n "$MissingDeps" ]]; then
    dialog_warning "Error, missing dependency: $MissingDeps"
    unset MissingDeps
    dialog_settings
    return
  fi

  if [[ "$STARTPAGE" -gt "$STOPPAGE" ]]; then 
    dialog_warning "<b>   Start page higher than stop page.   </b>"
    dialog_settings
    return
  fi

  OUTFILE="${DOCUMENT%.pdf} (p${STARTPAGE}-p${STOPPAGE}).pdf"
}

extract_pages(){
  $EXTRACTOR
  EXTRACTORRET="$?"
  if [[ "$EXTRACTORRET" = "0" ]]; then
    notify "Pages $STARTPAGE to $STOPPAGE succesfully extracted."
  else
    notify "There has been an error. Please check the CLI output."
  fi
}


# Main

check_input "$1"
dialog_settings
extract_pages

Instalação

Por favor, siga as instruções genéricas para scripts do Nautilus . Leia atentamente o cabeçalho do script, pois isso ajudará a esclarecer a instalação e o uso do script.

Páginas parciais - PDF Shuffler

visão global

O PDF-Shuffler é um pequeno aplicativo python-gtk, que ajuda o usuário a mesclar ou dividir documentos em PDF e girar, cortar e reorganizar suas páginas usando uma interface gráfica interativa e intuitiva. É uma interface para python-pyPdf.

Instalação

sudo apt-get install pdfshuffler

Uso

O PDF-Shuffler pode cortar e excluir páginas em PDF únicas. Você pode usá-lo para extrair um intervalo de páginas de um documento ou até páginas parciais usando a função de corte:

insira a descrição da imagem aqui

Elementos da página - Inkscape

visão global

O Inkscape é um editor de gráficos vetoriais de código aberto muito poderoso. Ele suporta uma ampla variedade de formatos diferentes, incluindo arquivos PDF. Você pode usá-lo para extrair, modificar e salvar elementos da página de um arquivo PDF.

Instalação

sudo apt-get install inkscape

Uso

1.) Abra o arquivo PDF de sua escolha com o Inkscape. Uma caixa de diálogo de importação será exibida. Escolha a página da qual você deseja extrair elementos. Deixe as outras configurações como estão:

insira a descrição da imagem aqui

2.) No Inkscape, clique e arraste para selecionar o (s) elemento (s) que você deseja extrair:

insira a descrição da imagem aqui

3.) Inverta a seleção !e exclua o objeto selecionado com DELETE:

insira a descrição da imagem aqui

4.) Corte o documento nos objetos restantes, acessando a caixa de diálogo Propriedades do documento com CTRL+ SHIFT+ De selecionando "ajustar documento à imagem":

insira a descrição da imagem aqui

5.) Salve o documento como um arquivo PDF na caixa de diálogo Arquivo -> Salvar como :

6.) Se houver imagens bitmap / raster no documento cortado, você poderá definir o DPI na caixa de diálogo exibida a seguir:

insira a descrição da imagem aqui

7.) Se você seguiu todas as etapas, terá produzido um arquivo PDF verdadeiro que consiste apenas nos objetos de sua escolha:

insira a descrição da imagem aqui

Glutanimado
fonte

Grande esforço. Obrigado! Entendo que ele não permite selecionar uma parte da página, mas apenas páginas inteiras. Estou certo?

carnendil

2

@carnendil: Sim, exatamente. Eu não acho que o ghostscript seja capaz disso. Mas pode haver outras soluções disponíveis para fazer isso programaticamente . Por enquanto, editei minha resposta com uma solução alternativa (e um pouco hackiana) usando o PDF-shuffler.

Glutanimate

3

ok, eu adicionei um método diferente usando o Inkscape.

Glutanimate

1

pdfshufflernão é suficiente se você deseja extrair uma parte da página PDF. Os dados originais em PDF da página ainda são preservados no arquivo. Não use esse método se desejar remover dados confidenciais de um arquivo PDF.

Rob W

pdfshuffleragora é chamado pdfarranger.

amoe 11/09

69

QPDF é ótimo. Use-o dessa maneira para extrair as páginas de 1 a 10 input.pdfe salve-as como output.pdf.

qpdf --pages input.pdf 1-10 -- input.pdf output.pdf

Por favor, note que input.pdfestá escrito duas vezes.

Você pode instalá-lo chamando:

sudo apt-get install qpdf

É uma ótima ferramenta para manipulação de PDF, que é muito rápida, tem muito poucas dependências. "Ele pode criptografar e linearizar arquivos, expor as partes internas de um arquivo PDF e realizar muitas outras operações úteis para usuários finais e desenvolvedores de PDF".

http://sourceforge.net/projects/qpdf/

Ho1
fonte

3

O único problema que tive com isso é que ainda está listando todas as páginas no índice, apesar da maioria ter sido removida. Além de, brilhante obrigado! :)

Wilf

3

Ótimo software. Agradável

Anwar

2

Aviso - Os arquivos são enormes ... aproximadamente do mesmo tamanho que o original.

Corey Alix

3

Funciona, mas que sintaxe para especificar as páginas (listando o arquivo de entrada duas vezes, em seguida, adicionando --) é realmente estranho.

Dan Dascalescu 23/02

3

O sinalizador --pages permite emendar páginas de vários PDFs. Note que você pode evitar a duplicação do nome, usando .no lugar do arquivo de entrada nas opções --pages: qpdf --pages . 1-10 -- input.pdf output.pdf.

bart

43

Salve isso como um script de shell, como pdfextractor.sh:

#!/bin/bash
# this function uses 3 arguments:
#     $1 is the first page of the range to extract
#     $2 is the last page of the range to extract
#     $3 is the input file
#     output file will be named "inputfile_pXX-pYY.pdf"
gs -sDEVICE=pdfwrite -dNOPAUSE -dBATCH -dSAFER \
   -dFirstPage="${1}" \
   -dLastPage="${2}" \
   -sOutputFile="${3%.pdf}_p${1}-p${2}.pdf" \
   "${3}"

Para executar, digite:

./pdfextractor.sh 4 20 myfile.pdf

4 refere-se à página que iniciará o novo pdf.
20 refere-se à página com a qual terminará o pdf.
myfile.pdf é o arquivo pdf que você deseja extrair partes.

A saída estaria myfile_p4_p20.pdfno mesmo diretório do arquivo pdf original.

Tudo isso e mais informações aqui: Dica técnica

ThiagoPonte
fonte

15

Vamos simplificar:gs -sDEVICE=pdfwrite -dNOPAUSE -dBATCH -dFirstPage=1 -dLastPage=10 -sOutputFile=output.pdf input.pdf

Ho1 9/09/15

e Como especifico o arquivo de entrada?

Anwar

1

-1 para fazer a expansão do parâmetro bash fora da cadeia de caracteres entre aspas duplas. (deve ser "-sOutputFile=${3%.pdf}_p${1}-p${2}.pdf"etc. (observe as aspas)).

Rotsor 21/01

1

@ Ho1, por favor, escreva-o como uma nova resposta, isso realmente ajuda!

Joshua Salazar

Esta é a resposta mais portátil, pois o ghostscript provavelmente será instalado praticamente em qualquer lugar.

Calimo 13/06

29

Em qualquer sistema em que uma distribuição TeX esteja instalada:

pdfjam <input file> <page ranges> -o <output file>

Por exemplo:

pdfjam original.pdf 5-10 -o out.pdf

Consulte https://tex.stackexchange.com/a/79626/8666

Ioannis Filippidis
fonte

este foi o único que funcionou para mim.

FireInTheSky

27

Existe um utilitário de linha de comando chamado pdfseparate .

Dos documentos:

pdfseparate sample.pdf sample-%d.pdf

extracts  all pages from sample.pdf, if i.e. sample.pdf has 3 pages, it
   produces

sample-1.pdf, sample-2.pdf, sample-3.pdf

Ou, para selecionar uma única página (neste caso, a primeira página) do arquivo sample.pdf:

pdfseparate -f 1 -l 1 sample.pdf sample-1.pdf

jdmcbr
fonte

2

ótima ferramenta! muito mais rápido do quepdftk

Anwar

3

Bom, mas é limitado apenas a uma página e, se você quiser mais do que isso, receberá páginas separadas.

Ho1 9/09/15

2

Claro, embora seja possível seguir o comando acima com pdfunite para produzir um único documento.

Jdmcbr 9/09/15

3

Se você tem um documento enorme e precisa dividir todas as páginas, é realmente rápido e útil.

MEDVIS

19

pdftk( sudo apt-get install pdftk) também é uma excelente linha de comando para manipulação de PDF. Aqui estão alguns exemplos do que pdftkpode ser feito:

   Collate scanned pages
     pdftk A=even.pdf B=odd.pdf shuffle A B output collated.pdf
     or if odd.pdf is in reverse order:
     pdftk A=even.pdf B=odd.pdf shuffle A Bend-1 output collated.pdf

   Join in1.pdf and in2.pdf into a new PDF, out1.pdf
     pdftk in1.pdf in2.pdf cat output out1.pdf
     or (using handles):
     pdftk A=in1.pdf B=in2.pdf cat A B output out1.pdf
     or (using wildcards):
     pdftk *.pdf cat output combined.pdf

   Remove page 13 from in1.pdf to create out1.pdf
     pdftk in.pdf cat 1-12 14-end output out1.pdf
     or:
     pdftk A=in1.pdf cat A1-12 A14-end output out1.pdf

   Burst a single PDF document into pages and dump its data to
   doc_data.txt
     pdftk in.pdf burst

   Rotate the first PDF page to 90 degrees clockwise
     pdftk in.pdf cat 1east 2-end output out.pdf

   Rotate an entire PDF document to 180 degrees
     pdftk in.pdf cat 1-endsouth output out.pdf

No seu caso, eu faria:

     pdftk A=input.pdf cat A<page_range> output output.pdf

Andrzej Pronobis
fonte

O pacote 'pdftk' não tem candidato à instalação

FireInTheSky

8

Você já experimentou o PDF Mod?

Você pode, por exemplo, extrair páginas e salvá-las em pdf.

Descrição:

O PDF Mod é uma ferramenta simples para modificar documentos PDF. Ele pode girar, extrair, remover
e reordenar páginas via arrastar e soltar. Vários documentos podem ser combinados através de arrastar
e soltar. Você também pode editar o título, assunto, autor e palavras-chave de um
documento PDF usando o PDF Mod.

Espero que isso seja útil.

Regars.

Roman Raguet
fonte

SIM, na verdade, tentei, mas NÃO me permite salvar parte de uma página, por exemplo, um gráfico como pdf ... A menos que não veja a opção. Ele me permite extrair uma página inteira a partir de um documento, mas não é isso que eu quero

user72469

Eu o uso regularmente, ótima ferramenta! mas eu tinha um documento com cerca de 170 páginas que o pdfmod não suportava.

loved.by.Jesus

Uau. Isso é surpreendentemente suave. Joguei meu livro real de 512 páginas nele (50MiB) e ... foi rápido. UI é uma brisa. Para um viciado em CLI como eu, é preciso algum nível de GUI para me convencer, mas isso serve!

sehe

PDF Mod tem bugs que funcionam no Kubuntu 18

Josué Salazar

8

Eu estava tentando fazer o mesmo. Tudo que você tem a fazer é:

instalar pdftk:
```
sudo apt-get install pdftk
```

se você deseja extrair páginas aleatórias:

pdftk myoldfile.pdf cat 1 2 4 5 output mynewfile.pdf

se você deseja extrair um intervalo:

pdftk myoldfile.pdf cat 1-2 4-5 output mynewfile.pdf

Por favor, verifique a fonte para mais informações.

o código
fonte

Acho melhor essa resposta porque mostra como você pode inserir vários intervalos.

Roman Luštrik

6

Como se vê, eu posso fazer isso imagemagick. Se você não o tiver, instale simplesmente com:

sudo apt-get install imagemagick

Nota 1 : tentei isso com um pdf de uma página (estou aprendendo a usar imagemagick, portanto não queria mais problemas do que o necessário). Não sei se / como funcionará com várias páginas, mas você pode extrair uma página de interesse com pdftk:

pdftk A=myfile.pdf cat A1 output page1.pdf

onde você indica o número da página a ser dividida (no exemplo acima, A1seleciona a primeira página).

Nota 2 : A imagem resultante usando este procedimento será uma varredura.

Abra o pdf com o comando display, que faz parte do imagemagickconjunto:

display file.pdf

O meu ficou assim:

^{Clique na imagem para ver uma versão em alta resolução}

Agora você clica na janela e um menu aparece ao lado. Lá, selecione Transform | Crop .

imagemagick transform> menu de corte

De volta à janela principal, você pode selecionar a área que deseja cortar simplesmente arrastando o ponteiro (seleção clássica de canto a canto).

seleção de área a cultivar
^{Observe o ponteiro em forma de mão ao redor da imagem enquanto seleciona}

Essa seleção pode ser refinada antes de prosseguir para a próxima etapa.

Quando terminar, observe o pequeno retângulo que aparece no canto superior esquerdo (veja a imagem acima). Ele mostra as dimensões da área selecionada primeiro (por exemplo 281x218) e depois as coordenadas do primeiro canto (por exemplo +256+215).

Anote as dimensões da área selecionada; será necessário no momento de salvar a imagem cortada.

Agora, de volta ao menu pop (que agora é o menu específico "recortar"), clique no botão Recortar .

menu de corte imagemagick

Finalmente, quando estiver satisfeito com os resultados do corte, clique no menu Arquivo | Salve 

Navegue até a pasta onde deseja salvar o pdf cortado, digite um nome, clique no botão Formato , na janela "Selecionar tipo de formato de imagem", selecione PDF e clique no botão Selecionar . De volta à janela "Procurar e selecione um arquivo", clique no botão Salvar .

imagemagick salvar como pdf

Antes de salvar, imagemagicksolicitará "selecionar a geometria da página". Aqui, você digita as dimensões da imagem cortada, usando uma letra simples "x" para separar largura e altura.

imagemagick selecionar geometria da página

Agora, você pode fazer tudo isso perfeitamente na linha de comando (o comando está convertcom a opção -crop) - certamente é mais rápido, mas você precisaria saber de antemão as coordenadas da imagem que deseja extrair. Verifique man converte um exemplo em sua página da web .

Carnendil
fonte

Não sabia da interface gráfica do imagemagick. Parece interessante. No entanto, corrija-me se estiver errado, mas acho que o imagemagick não pode lidar com imagens vetorizadas. Portanto, o que você está exportando provavelmente será apenas uma imagem raster / bitmap. Nesse caso, esse método é o mesmo que tirar uma captura de tela de uma região do documento.

perfil completo de Glutanimato

1

De fato, imagemagickfunciona apenas imagens rasterizadas e displayé apenas um comando do conjunto. Existem muitas interfaces para imagemagick- verifique sua página da web. Para imagens vetoriais, a melhor solução é, eu acho, o seu método com o Inkscape.

carnendil

2

Você pode adicionar um aviso de isenção na parte superior da resposta, como um aviso de que isso será convertido de gráficos vetoriais para rasterizados. Essa propriedade a torna uma abordagem fundamentalmente diferente.

bluenote10

2

A divisão e mesclagem de PDF é bastante útil para esta e outras operações de manipulação de PDF.

Baixe aqui

Façam
fonte

1

Você pode fazer o download da versão mais recente no link acima, mas se preferir a conveniência do Centro de Software, também poderá instalá-lo a partir daí (ou do terminal até sudo apt-get install pdfsam). No entanto, a versão no Ubuntu está bastante desatualizada, pois ainda está na versão 1.1.4, enquanto a versão do sourceforge já é 2.2.2.

Waldir Leoncio 14/02

A última 3.x (atualmente 3.1.0) tem um pacote .deb que pode ser instalado no Ubuntu e tem um módulo Extrato Páginas que faz o que o OP perguntou

Andrea Vacondio

1

@Andrea Vacondio Bravo pela sua excelente edição! Você está ajudando a tornar a Internet segura. Eu descobri que o arquivo do link antigo no sourceforge.net tem uma porcaria embutida. Os novos proprietários do site SourceForge disseram que iam parar de fazer isso, mas obviamente mentiram.

Karel

2

Como o usuário original solicitou uma ferramenta interativa e não uma ferramenta de linha de comando: Uma solução fácil é usar qualquer visualizador de PDF (okular no Kubuntu, evince ou até Firefox no Ubuntu) e, em seguida, basta usar a caixa de diálogo de impressão padrão, escolha "imprimir para Arquivo PDF "e, em seguida, selecione na caixa de diálogo de configurações estendidas, quais páginas serão" impressas ". Essa variante tem algumas desvantagens, pois alguns truques no PDF original (como páginas giradas, formulários etc.) podem se perder, mas funciona diretamente na maioria dos PDFs simples.

Kai Petzke
fonte

0

Se você deseja extrair de seus PDFs, pode usar http://www.sumnotes.net . É uma ferramenta incrível para extrair notas, destaques e imagens de PDFs. Você também pode assistir a tutoriais no Youtube digitando sumnotes.

Espero que você goste!

James
fonte

Como posso extrair um intervalo de páginas / parte de um PDF?

Respostas:

Intervalo de páginas - script Nautilus

Páginas parciais - PDF Shuffler

Elementos da página - Inkscape