Tenho um problema em ter alguns usuários criando PDFs muito grandes. Por outro lado, tenho PDF enviado de nossos aparelhos de fax que são realmente pequenos em tamanho e totalmente imprimíveis. Minha pergunta é
- Existe alguma maneira de encontrar a resolução (DPI) do PDF. Pesquisei na internet, não encontrei resposta. Verificadas as propriedades do arquivo, essas informações não foram armazenadas lá, pelo menos no meu caso.
- Qual é a resolução ideal para converter arquivos de texto em PDF de imagem. 96 dpi, 300 dpi ou mais?
- Pergunta divertida. Posso redimensionar um PDF que foi digitalizado com alta resolução em dpi menores?
Sei que algumas respostas podem não estar disponíveis, pois já procurei na Internet e não consegui encontrar respostas.
Nota: Meu PDF é inteiramente imagens, texto para imagens. Também estou familiarizado com o primoPDF (gratuito), algo que você pode experimentar
pdf
images
resolution
dpi
hk_
fonte
fonte
Sei que você não deseja extrair os dados da imagem, mas esta é provavelmente a única maneira de descobrir a resolução original.
No * nix, se você tiver o ImageMagick's
identify
e o Xpdf instalados 1 :Onde
test.pdf
está o seu PDF de entrada. Os arquivos de saída são gravados emtest-000.jpg
,test-001.jpg
etc. Isso forneceria o tamanho original de todas as imagens contidas no PDF 2 .Exemplo de saída para um arquivo PDF que contém apenas uma imagem grande:
1) O Windows também os possui, mas o script seria diferente, é claro.
2) Observe que as imagens realmente não carregam informações de DPI. Simplesmente falando: isso é apenas algo usado para impressão e imagens não precisa de uma medida inerente de DPI.
Geralmente, qualquer coisa que você queira imprimir deve ter 300 dpi ou mais. A maioria das impressoras também suporta uma resolução mais alta.
fonte
pdfimages -list test.pdf
. Em vez de produzir arquivos, isso lista o tamanho e o tipo de imagem. Ainda não fornece uma resolução explícita, mas evita a criação de arquivos de saída.pdfimages -list
fornece explicitamentex-ppi
ey-ppi
, assim como muitas outras informações.pdfimages
pode ser bastante baixa (por exemplo, quando a imagem é maior que sua área visível, em um PDF produzido porscribus
). (Infelizmente eu realmente não tenho tempo para registrar um relatório de erro agora.) #Por alguma razão, a versão mais recente do pdfimages que posso atualizar no meu CentOS é a versão 3.04.
Portanto, não tenho a opção -list, conforme declarado nas respostas anteriores. No entanto, a imagem de teste criada a partir de pdfimages com base na resposta do slhck contém a resposta desejada!
identificar -verbose test-0000.jpg | Mais
Portanto, o dpi é mostrado explicitamente na 6ª linha usando a opção -verbose no comando de identificação.
Portanto, a resposta do slhck pode ser modificada para o seguinte.
pdfimages -j test.pdf test && para o arquivo em $ (encontre. -name "test * .jpg"); identifique -verbose "$ file" | awk 'NR == 6'; feito
Em outra nota, tentei correr
identifique -verbose test.pdf
Parece que o Imagemagick sempre assume 72dpi e, portanto, as informações impressas aqui parecem incorretas.
fonte
Um arquivo PDF não tem uma resolução inerente, cada imagem raster dentro dele (se houver) terá sua própria resolução. Não conheço uma maneira simples de extrair um único número para a resolução mediana / modal de XObjects de imagens incorporadas.
fonte
Isso funcionou com um pdf gerado a partir de um Kyocera mfp ... Isso provavelmente é válido apenas para imagens de página inteira, como digitalizações.
Arquivo> Propriedades - guia Descrição - Tamanho da página. Meu exemplo dizia 8,5 x 11,0 pol.
Abra o pdf com um editor de texto (bloco de notas), procure
/width
e/height
Exemplo:
Meu PDF foi digitalizado em uma resolução de 600x600.
Você pode pular as duas primeiras etapas se souber o tamanho do documento (normalmente A4 é 8.27x11.69).
fonte
Para responder ao seu segundo ponto, além da menção de @slhck sobre o dpi da impressora, 300 dpi também é o número mínimo recomendado típico para OCR com tamanhos de fonte de 10 + pt.
Além disso, uma moderna tela de laptop 4K de 15 "também possui apenas 280PPi; portanto, se você deseja exibir um A4 inteiro na tela (paisagem), não há sentido em digitalizar mais que ~ 320 dpi, porque qualquer documento maior que isso será Obviamente, isso não importa se você planeja aumentar o zoom, talvez seja necessário um dpi mais alto.
Para responder aos outros dois pontos, hoje em dia, pelo menos, você pode usar o Acrobat Pro para verificar o DPI e a resolução da imagem e também pode editá-lo.
fonte