Como reduzo o tamanho de um PDF e preservo os marcadores?

19

Eu tenho um PDF de ~ 259 MB. Eu fiz pdf2pse ps2pdf. O tamanho final era de 45 MB. Não vejo nenhuma diferença visível na qualidade em nenhum leitor. Embora, os favoritos foram perdidos. Eu tentei usar pdftk, mas não preservou os favoritos.

pdftk ... update_info

O que causou a enorme redução no tamanho? Existe uma alternativa para preservar os marcadores e ainda ter o tamanho reduzido (de preferência as alternativas de linha de comando do linux)?

Vishnu Kumar
fonte
Seguindo a resposta de @ Dan: codificações diferentes (e compactação) podem explicar a diferença. Como um teste simples, observe o tamanho de qualquer arquivo após a compactação com o gzip. A diferença de tamanho ainda é impressionante?
Henk Langeveld

Respostas:

17

Você pode tentar o ghostscript com saída de e-book e os favoritos parecem preservados:

gs -sDEVICE=pdfwrite -dNOPAUSE -dBATCH -dPDFSETTINGS=/ebook -sOutputFile=newFile.pdf originalFile.pdf
perreal
fonte
2
obrigado funcionou. Eu usei o PDFSETTINGS=/screen. Com essa opção, o pdf tornou-se 15MB :) Ref: GS Dicas
Vishnu Kumar
Esqueci de mencionar, os favoritos foram realmente preservados. Mas alguém ainda tem pistas sobre o que está sendo reduzido?
Vishnu Kumar
2

@Vishnu Kumar

Estou feliz que você perguntou. Sua pergunta me levou a reexaminar esse problema e descobri que havia extraído 100 páginas de um PDF com mais de 1000 páginas, usando o Acrobat Pro como um caso de teste, no entanto, isso não incluía os indicadores do sumário, como eu havia assumido, e que foi o problema Então, eu abri o PDF grande original no Acrobat Pro e excluí todas as 100 primeiras páginas, excluí todas, exceto os marcadores relevantes, e as salvei como meu caso de teste. Agora o sumário está sendo preservado.

Aqui está minha comparação das duas configurações:

/ebook selects medium-resolution output similar to the Acrobat Distiller "eBook" setting.

gs -sDEVICE=pdfwrite -dPDFSETTINGS=/ebook -dNOPAUSE -dBATCH -sOutputFile=reduced/output_1-102_TOC_[gs-ebook].pdf input_1-102_TOC.pdf

ridiculamente lento
91.7MB -> 33.4MB (36% do original)
TOC preservado com
baixa qualidade - pixelado

/printer selects output similar to the Acrobat Distiller "Print Optimized" setting.

gs -sDEVICE=pdfwrite -dPDFSETTINGS=/printer -dNOPAUSE -dBATCH -sOutputFile=reduced/output_1-102_TOC_[gs-printer].pdf input_1-102_TOC.pdf

rápido
91,7MB -> 68,9MB (75% do original)
TOC preservou a
qualidade quase idêntica

Outros ajustes:

/default selects output intended to be useful across a wide variety of uses, possibly at the expense of a larger output file.

gs -sDEVICE=pdfwrite -dPDFSETTINGS=/default -dNOPAUSE -dBATCH -sOutputFile=reduced/output_1-102_TOC_[gs-default].pdf input_1-102_TOC.pdf

rápido
91,7MB -> 60,8MB (66% do original)
TOC preservou a
qualidade quase idêntica

/prepress selects output similar to Acrobat Distiller "Prepress Optimized" setting.

gs -sDEVICE=pdfwrite -dPDFSETTINGS=/prepress -dNOPAUSE -dBATCH -sOutputFile=reduced/output_1-102_TOC_[gs-prepress].pdf input_1-102_TOC.pdf


TOC rápido de 91,7 MB -> 80,2 MB (87% do original), qualidade
preservada
quase idêntica

Como pode ser visto, a /defaultconfiguração teve o melhor desempenho, fornecendo o menor tamanho para a melhor qualidade.

hmj6jmh
fonte
0

Ignore isso e veja a atualização como resultado do Vishnu Kumarcomentário de.

Isto não funcionou para mim. Sim, reduziu o tamanho pela metade, mas com fontes pixeladas inaceitáveis ​​e sem mais indicadores TOC, como em todas as outras configurações de saída que tentei com gs, por exemplo, screene printer. Obrigado mesmo assim ...

hmj6jmh
fonte
Você já tentou /ebook?
Vishnu Kumar