Contar páginas em preto e branco / em cores em PDF

23

Eu tenho um documento PDF de 100 páginas que preciso imprimir. Minha gráfica precisa saber quais páginas contêm cores. Não quero escanear manualmente. Existe um programa que detecta páginas coloridas e pode calcular o número da página?

Nenhum
fonte
11
Sistema operacional?
frabjous

Respostas:

25

Encontrei isso em http://root42.blogspot.de/2012/10/counting-color-pages-in-pdf-files.html

gs -o - -sDEVICE=inkcov input.pdf | grep -v "^ 0.00000  0.00000  0.00000" | grep "^ " | wc -l

Funcionou bem para mim

A contagem total de páginas pode ser encontrada por

pdfinfo input.pdf | grep Pages:
Ulrik
fonte
Este oneliner responde à pergunta "Existe um programa que detecta páginas coloridas e pode calcular o número da página?" gs -o - -sDEVICE=inkcov input.pdf |tail -n +4 |sed '/^Page*/N;s/\n//'|sed -E '/Page [0-9]+ 0.00000 0.00000 0.00000 / d'
Fredrik Erlandsson
8

No Linux (e provavelmente mac / outro Unix), o seguinte script BASH muito curto parece fazer o truque:

 #!/bin/bash
 file="$1"
 for page in $(identify -density 12 -format '%p ' "$file") ; do
     if convert "$file[$((page-1))]" -colorspace RGB -unique-colors txt:- | sed -e 1d | egrep -q -v ': \(\s*([0-9]*),\s*\1,\s*\1' ; then
         echo $page
     fi
 done

Nomeie o script como algo semelhante coloredpages.sh, torne-o executável chmod +x coloredpages.she, em seguida, execute ./coloredpages.sh "pdfname.pdf"; ele deve retornar uma lista de números de página.

Isso requer que o ImageMagick e provavelmente o Ghostscript sejam instalados. E não é a coisa mais rápida do mundo.

Desculpe, eu não tenho idéia de como adaptar isso para Windows (sem Cygwin ou similar, de qualquer maneira).

frabjous
fonte
Obrigado, vou tentar quando tiver um linux em execução. Posso encontrar uma gráfica melhor que possa detectá-la.
Nenhum
3

Tendo a mesma tarefa que o OP e trabalhando no Windows, eu encontrei a seguinte solução para funcionar de maneira rápida e agradável: O SDK do contador de páginas de arquivos em spool não é gratuito, mas a versão de avaliação ainda funciona. Faça o download do arquivo zip no link acima, descompacte-o e execute bin/C#_ParsingTest yourfile.pdf. Você verá algo como

Page   1 is [   BW]
Page   2 is [Color]
...
Page 143 is [Color]
============
Statistics: bwPageCount=99, colorPageCount=44

A contagem rápida de PDF mencionada em outra resposta aqui requer instalação (o que para o meu trabalho único --- impressão de dissertação) é uma desvantagem. No entanto, ele também faz o trabalho e fornece uma GUI. Depois de instalá-lo, execute-o, arraste e solte o arquivo PDF nele, verifique Color Pages CountingConfiguração / Opções e clique no Page count files in listbotão.

Curiosamente, os resultados da minha tese diferem em 1 página (99/44 vs. 100/43). Eu acredito que isso ocorre porque alguma figura (feita toda com o Inkscape) é na verdade em preto e branco, mas é descrita como cor nos metadados. Não tenho certeza. O que não encontrei no Rapid PDF Count é uma lista de todas as páginas coloridas / em preto e branco; portanto, não sei dizer a fonte exata dessa discrepância.

texnic
fonte