Eu tenho um arquivo PDF que foi o resultado da digitalização de um livro.
Neste arquivo, 2 páginas do livro correspondem a 1 no PDF. Então, quando vejo uma página no arquivo PDF, vejo duas páginas do livro.
( original )
Gostaria de saber se existe alguma maneira de converter esse arquivo em outro PDF, em que 1 página do livro corresponde a 1 página do PDF, ou seja, a situação normal.
Você pode usar
mutool
uma ferramenta de linha de comando MuPDF (sudo apt-get install mupdf-tools
):Você também pode usar
-y
se desejar realizar uma divisão vertical.fonte
mupdf-tools
(então ..sudo apt-get install mupdf-tools
).mutool clean input.pdf output.pdf 2-N
Eu usaria Briss . Permite selecionar várias regiões de cada página, cada uma das quais se transformará em uma nova página.
fonte
Outra opção é o ScanTailor . Este programa é particularmente adequado para processar várias varreduras ao mesmo tempo.
apt-get install scantailor
Infelizmente, ele funciona apenas com entradas de arquivos de imagem, mas é simples o suficiente para converter um PDF digitalizado em jpg. Aqui está uma lista que eu usei para converter um diretório inteiro de PDFs em jpgs. Se um PDF tiver n páginas, ele cria n arquivos jpg.
for f in ./*.pdf; do gs -q -dSAFER -dBATCH -dNOPAUSE -r300 -dGraphicsAlphaBits=4 -dTextAlphaBits=4 -sDEVICE=png16m "-sOutputFile=$f%02d.png" "$f" -c quit; done;
Eu tinha capturas de tela prontas para compartilhar, mas não tenho representante suficiente para publicá-las.
O ScanTailor gera saída para tif; portanto, se você deseja que os arquivos retornem ao PDF, você pode usá-lo para criar um PDF para cada página.
for f in ./*.tif; do tiff2pdf "$f" -o "$f".pdf -p letter -F; done;
Em seguida, você pode usar essa linha única ou um aplicativo como o PDFShuffler para mesclar um ou todos os arquivos em um PDF.
gs -q -sPAPERSIZE=letter -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -sOutputFile=output.pdf *.pdf
fonte
Aqui está um script python para isso.
https://gist.github.com/tshrinivasan/23d8e4986cbae49b8a8c
fonte
A Sejda pode fazer isso usando sua interface da web ou interface de linha de comando (código aberto). A tarefa é chamada
splitdownthemiddle
fonte
Você pode usar o okular ou qualquer outro leitor de pdf e, em seguida, imprimir em arquivo e selecionar opções e cópias-> páginas. Selecione suas páginas interessadas e depois imprima. Cortará as páginas selecionadas. Simples e fácil !!
fonte
Uma solução de linha de comando usando o ImageMagick:
Divida o PDF em imagens individuais:
Divida as imagens de cada página em uma imagem esquerda e direita:
Renomeie os
page-###-split-#.png
arquivos para apenas001.png
,002.png
etc .:Combine as imagens da página resultantes em um PDF novamente:
Fontes: (também incluindo variações e mais dicas)
Recorte e divida a digitalização de livros em 3 comandos , modificados aqui para usar um
for
comando de loop para evitar problemas de memória.Resposta: Renomeando arquivos em uma pasta para números sequenciais , junto com este comentário
Resposta: ImageMagick: convert encerra após algumas páginas , caso você esteja executando os limites de memória do ImageMagick (o que eu fiz).
fonte
Existe um maravilhoso programa scankromsator. É gratuito e funciona muito bem através do vinho. Mais informações aqui .
fonte