Quero mesclar várias centenas de arquivos pdf em um diretório automaticamente, de acordo com os nomes dos arquivos.
Por exemplo
Os arquivos 1000.1.pdf 1000.2.pdf 1000.3.pdf 1000.x.pdf devem ser mesclados em 1000.pdf
e
2000.abc.pdf 2000.def.pdf 2000.ghi.pdf 2000.jkl.pdf 2000.5.pdf em 2000.pdf .
Não quero usar soluções baseadas no Preview / Automator (se disponível), porque, comparado a softwares de terceiros, como o Adobe Acrobat ou o PDFpen, a mesclagem de arquivos pdf com freqüência (dependendo dos documentos de origem) resulta em um aumento significativo no tamanho do arquivo (consulte, por exemplo, O que faz com que o tamanho do arquivo PDF aumente ao salvar na Visualização? )
você tem alguma recomendação? Obrigado!
macos
software-recommendation
pdf
lejonet
fonte
fonte
Respostas:
Tente pdftk . É um software de linha de comando que pode juntar arquivos PDF (e fazer muitas outras coisas também, mas isso não é relevante aqui). Você pode baixá-lo na página oficial do pdftk .
Sintaxe de exemplo:
irá criar o arquivo
new.pdf
que contém a concatenação dos arquivosold1.pdf
,old2.pdf
,old3.pdf
.Para resolver seu problema, com seus exemplos de nomes de arquivos:
e assim por diante. Você pode usar scripts de shell para tornar isso completamente automático, se desejado (mas você precisará gastar um pouco de tempo aprendendo a escrever scripts de shell).
Supondo que todos os arquivos sejam nomeados 1000.x, 2000.x etc., um script de shell pode se parecer com este
fonte
Há um script Python oculto no Automator.app que une arquivos .PDF
Exemplo de uso:
fonte
~/.bash_profile
arquivo como este:alias catpdf="/System/Library/Automator/Combine\ PDF\ Pages.action/Contents/Resources/join.py --output all.pdf *.pdf"
para que eu possacd
entrar em um diretório contendo PDFs e executarcatpdf
.Você pode usar
pdfunite
distribuído compoppler
. Você pode instalarpoppler
com o Homebrew:E agora use-o:
poppler
também vem com esses outros comandos:pdfdetach
,pdffonts
,pdfimages
,pdfinfo
,pdfseparate
,pdftocairo
,pdftohtml
,pdftoppm
,pdftops
,pdftotext
, além depdfunite
.fonte
O pdftk não funciona mais no El Capitan! (OS X 10.10)
Uma alternativa é Pagemaster de PDFTron. A sintaxe seria:
Ele não tem o problema de aumento do tamanho do arquivo da solução Automator acima, pois usa uma biblioteca de PDF personalizada.
Nota: esta não é uma ferramenta gratuita. A versão demo adiciona uma marca d'água fina em cada página.
fonte