Você tem alguma idéia de como extrair uma parte de um documento PDF e salvá-lo como PDF? No OS X, é absolutamente trivial usando o Preview. Eu tentei o editor de PDF e outros programas, mas sem sucesso.
Gostaria de um programa em que selecionasse a parte desejada e, em seguida, salve-a como pdf com um comando simples como CMD+ Nno OS X. Quero que a parte extraída seja salva no formato PDF e não no JPEG etc.
pdfshuffler
nos repositórios.pdfshuffler
não funciona mais no Ubuntu 14.04+. Você sempre pode usar a caixa de diálogo de impressão ou uma alternativa baseada terminal comopdfseparate
apt-get
ainda funciona bem para mim no 16.04. Talvez eles tenham corrigido os erros, se houver algum?Respostas:
pdftk
é uma ferramenta multiplataforma útil para o trabalho ( página inicial do pdftk ).você passa o nome do arquivo do pdf principal e diz para ele incluir apenas determinadas páginas (12 a 15 neste exemplo) e o envia para um novo arquivo.
fonte
pdftk A=in.pdf cat A1-10 A15 A17 output out.pdf
pdftk
não está disponível no Ubuntu 18.04. (veja askubuntu.com/questions/1028522/… )pdftk
seja certamente uma ferramenta que pode fazer o trabalho, eu recomendaria contra isso. Este não é um software livre, mas uma parte desajeitada de shareware. Também precisa da JVM. Uma ferramenta mais razoável éqpdf
, como sugerido em outra resposta .muito simples, use o leitor de PDF padrão:
imprimir como arquivo. é isso!
então
fonte
Intervalo de páginas - script Nautilus
visão global
Criei um script um pouco mais avançado com base no tutorial @ThiagoPonte vinculado a. Suas principais características são
Captura de tela
Código
Instalação
Por favor, siga as instruções genéricas para scripts do Nautilus . Leia atentamente o cabeçalho do script, pois isso ajudará a esclarecer a instalação e o uso do script.
Páginas parciais - PDF Shuffler
visão global
Instalação
Uso
O PDF-Shuffler pode cortar e excluir páginas em PDF únicas. Você pode usá-lo para extrair um intervalo de páginas de um documento ou até páginas parciais usando a função de corte:
Elementos da página - Inkscape
visão global
O Inkscape é um editor de gráficos vetoriais de código aberto muito poderoso. Ele suporta uma ampla variedade de formatos diferentes, incluindo arquivos PDF. Você pode usá-lo para extrair, modificar e salvar elementos da página de um arquivo PDF.
Instalação
Uso
1.) Abra o arquivo PDF de sua escolha com o Inkscape. Uma caixa de diálogo de importação será exibida. Escolha a página da qual você deseja extrair elementos. Deixe as outras configurações como estão:
2.) No Inkscape, clique e arraste para selecionar o (s) elemento (s) que você deseja extrair:
3.) Inverta a seleção !e exclua o objeto selecionado com DELETE:
4.) Corte o documento nos objetos restantes, acessando a caixa de diálogo Propriedades do documento com CTRL+ SHIFT+ De selecionando "ajustar documento à imagem":
5.) Salve o documento como um arquivo PDF na caixa de diálogo Arquivo -> Salvar como :
6.) Se houver imagens bitmap / raster no documento cortado, você poderá definir o DPI na caixa de diálogo exibida a seguir:
7.) Se você seguiu todas as etapas, terá produzido um arquivo PDF verdadeiro que consiste apenas nos objetos de sua escolha:
fonte
pdfshuffler
não é suficiente se você deseja extrair uma parte da página PDF. Os dados originais em PDF da página ainda são preservados no arquivo. Não use esse método se desejar remover dados confidenciais de um arquivo PDF.pdfshuffler
agora é chamadopdfarranger
.QPDF é ótimo. Use-o dessa maneira para extrair as páginas de 1 a 10
input.pdf
e salve-as comooutput.pdf
.Por favor, note que
input.pdf
está escrito duas vezes.Você pode instalá-lo chamando:
É uma ótima ferramenta para manipulação de PDF, que é muito rápida, tem muito poucas dependências. "Ele pode criptografar e linearizar arquivos, expor as partes internas de um arquivo PDF e realizar muitas outras operações úteis para usuários finais e desenvolvedores de PDF".
http://sourceforge.net/projects/qpdf/
fonte
--
) é realmente estranho..
no lugar do arquivo de entrada nas opções --pages:qpdf --pages . 1-10 -- input.pdf output.pdf
.Salve isso como um script de shell, como pdfextractor.sh:
Para executar, digite:
4
refere-se à página que iniciará o novo pdf.20
refere-se à página com a qual terminará o pdf.myfile.pdf
é o arquivo pdf que você deseja extrair partes.A saída estaria
myfile_p4_p20.pdf
no mesmo diretório do arquivo pdf original.Tudo isso e mais informações aqui: Dica técnica
fonte
gs -sDEVICE=pdfwrite -dNOPAUSE -dBATCH -dFirstPage=1 -dLastPage=10 -sOutputFile=output.pdf input.pdf
"-sOutputFile=${3%.pdf}_p${1}-p${2}.pdf"
etc. (observe as aspas)).Em qualquer sistema em que uma distribuição TeX esteja instalada:
Por exemplo:
Consulte https://tex.stackexchange.com/a/79626/8666
fonte
Existe um utilitário de linha de comando chamado pdfseparate .
Dos documentos:
Ou, para selecionar uma única página (neste caso, a primeira página) do arquivo sample.pdf:
fonte
pdftk
pdftk
(sudo apt-get install pdftk
) também é uma excelente linha de comando para manipulação de PDF. Aqui estão alguns exemplos do quepdftk
pode ser feito:No seu caso, eu faria:
fonte
Você já experimentou o PDF Mod?
Você pode, por exemplo, extrair páginas e salvá-las em pdf.
Descrição:
O PDF Mod é uma ferramenta simples para modificar documentos PDF. Ele pode girar, extrair, remover
e reordenar páginas via arrastar e soltar. Vários documentos podem ser combinados através de arrastar
e soltar. Você também pode editar o título, assunto, autor e palavras-chave de um
documento PDF usando o PDF Mod.
Espero que isso seja útil.
Regars.
fonte
Eu estava tentando fazer o mesmo. Tudo que você tem a fazer é:
instalar
pdftk
:se você deseja extrair páginas aleatórias:
se você deseja extrair um intervalo:
Por favor, verifique a fonte para mais informações.
fonte
Como se vê, eu posso fazer isso
imagemagick
. Se você não o tiver, instale simplesmente com:Nota 1 : tentei isso com um pdf de uma página (estou aprendendo a usar
imagemagick
, portanto não queria mais problemas do que o necessário). Não sei se / como funcionará com várias páginas, mas você pode extrair uma página de interesse compdftk
:onde você indica o número da página a ser dividida (no exemplo acima,
A1
seleciona a primeira página).Nota 2 : A imagem resultante usando este procedimento será uma varredura.
Abra o pdf com o comando
display
, que faz parte doimagemagick
conjunto:O meu ficou assim:
Clique na imagem para ver uma versão em alta resolução
Agora você clica na janela e um menu aparece ao lado. Lá, selecione Transform | Crop .
De volta à janela principal, você pode selecionar a área que deseja cortar simplesmente arrastando o ponteiro (seleção clássica de canto a canto).
Observe o ponteiro em forma de mão ao redor da imagem enquanto seleciona
Essa seleção pode ser refinada antes de prosseguir para a próxima etapa.
Quando terminar, observe o pequeno retângulo que aparece no canto superior esquerdo (veja a imagem acima). Ele mostra as dimensões da área selecionada primeiro (por exemplo
281x218
) e depois as coordenadas do primeiro canto (por exemplo+256+215
).Anote as dimensões da área selecionada; será necessário no momento de salvar a imagem cortada.
Agora, de volta ao menu pop (que agora é o menu específico "recortar"), clique no botão Recortar .
Finalmente, quando estiver satisfeito com os resultados do corte, clique no menu Arquivo | Salve
Navegue até a pasta onde deseja salvar o pdf cortado, digite um nome, clique no botão Formato , na janela "Selecionar tipo de formato de imagem", selecione PDF e clique no botão Selecionar . De volta à janela "Procurar e selecione um arquivo", clique no botão Salvar .
Antes de salvar,
imagemagick
solicitará "selecionar a geometria da página". Aqui, você digita as dimensões da imagem cortada, usando uma letra simples "x" para separar largura e altura.Agora, você pode fazer tudo isso perfeitamente na linha de comando (o comando está
convert
com a opção-crop
) - certamente é mais rápido, mas você precisaria saber de antemão as coordenadas da imagem que deseja extrair. Verifiqueman convert
e um exemplo em sua página da web .fonte
imagemagick
funciona apenas imagens rasterizadas edisplay
é apenas um comando do conjunto. Existem muitas interfaces paraimagemagick
- verifique sua página da web. Para imagens vetoriais, a melhor solução é, eu acho, o seu método com o Inkscape.A divisão e mesclagem de PDF é bastante útil para esta e outras operações de manipulação de PDF.
Baixe aqui
fonte
sudo apt-get install pdfsam
). No entanto, a versão no Ubuntu está bastante desatualizada, pois ainda está na versão 1.1.4, enquanto a versão do sourceforge já é 2.2.2.Como o usuário original solicitou uma ferramenta interativa e não uma ferramenta de linha de comando: Uma solução fácil é usar qualquer visualizador de PDF (okular no Kubuntu, evince ou até Firefox no Ubuntu) e, em seguida, basta usar a caixa de diálogo de impressão padrão, escolha "imprimir para Arquivo PDF "e, em seguida, selecione na caixa de diálogo de configurações estendidas, quais páginas serão" impressas ". Essa variante tem algumas desvantagens, pois alguns truques no PDF original (como páginas giradas, formulários etc.) podem se perder, mas funciona diretamente na maioria dos PDFs simples.
fonte
Se você deseja extrair de seus PDFs, pode usar http://www.sumnotes.net . É uma ferramenta incrível para extrair notas, destaques e imagens de PDFs. Você também pode assistir a tutoriais no Youtube digitando
sumnotes
.Espero que você goste!
fonte