Eu tenho um arquivo PDF digitalizado, em que páginas diferentes têm larguras diferentes devido à forma como o PDF foi concatenado de várias fontes. Isso tende a atrapalhar os espectadores.
Existe alguma ferramenta de linha de comando que possa atribuir a todas as páginas a mesma largura?
Como a digitalização é grande e já está fortemente compactada, as imagens de bitmap reais devem permanecer inalteradas e o texto do OCR, se houver, deve ser preservado no processo.
Por exemplo:
- Antes.
- Tamanho da página 15x10 cm
- Tamanho da imagem 15x10 cm
- Tamanho do pixel da imagem 1500 x 1000
- Depois de.
- Tamanho da página 30x20 cm
- Tamanho da imagem 30x20 cm
- Tamanho do pixel da imagem 1500 x 1000, fluxo de dados binários inalterado.
Uma solução usando imagemagick seria preferida, pois está prontamente disponível para shell scripts através do Cygwin. No entanto, desconfio que talvez não seja possível impedir que a imagem-imagem codifique novamente as imagens.