Eu tenho um PDF que contém uma imagem digitalizada de um documento. Desejo salvar o conteúdo deste PDF como uma imagem para poder executá-lo em um programa de OCR que aceite apenas arquivos do tipo .jpg, .png e .gif.
Como salvar / converter este PDF em um desses formatos de imagem?
Edição: Uma maneira que eu encontrei para fazer isso é clicar em cada página. Copiar para área de transferência. Cole no Paint.net e salve. No entanto, isso é complicado, pois parece que você só pode selecionar uma página por vez no Acrobat Reader.
%d
nome do arquivo de saída é uma variável que é substituída pelo número da página. (Quase certamente números brutos, não o número dentro do PDF.)Instale o Imagemagick . Abra uma janela ou terminal do cmd:
A saída será 1 arquivo jpg para cada página do seu pdf, teste-0.jpg, teste-1.jpg, etc.
fonte
density
,depth
equality
bandeiras que podem ajudar você a otimizar sua saída. Por exemplo:convert -density 300 -depth 8 -quality 85 a.pdf a.png
Mais informaçõesHá também
pdfimages
a partir das ferramentas Xpdf (disponível a partir do local de XpdfReader ). Não converterá uma página PDF inteira em uma imagem, mas extrairá imagens incorporadas de um PDF.Isso é útil se o PDF contiver texto e imagens e você desejar apenas as imagens. Além disso, ele extrairá as imagens em seu formato original, para que não haja perda de qualidade (diferentemente dos programas que renderizam a página inteira e a convertem em, por exemplo, JPEG). Dependendo das suas necessidades, isso pode ser útil.
Uso simples:
Isto irá ler o arquivo de entrada
mydocument.pdf
, extrair todas as imagens e gravá-los para indivíduo arquivos chamadosmydocument-images-0000.jpg
,mydocument-images-0001.jpg
etc.O Option
-j
permite gravar imagens compactadas em JPEG incorporadas como arquivos JPEG, não como arquivos PBM / PGM / PPM (que são descompactados e enormes). Observe que as imagens ainda podem ser gravadas como arquivos PBM / PGM / PPM, se é assim que foram armazenadas no arquivo de entrada PDF.fonte
pdfimages -j "yourinputfile.pdf" "outputimages"
que criará "outputimages-0000.ppm" (ou "outputimages-0000.jpg" se eles estiverem no formato correto). Exemplos .NET podem ser enxertados de aqui ou aquiVocê pode fazer isso usando o Adobe Reader:
fonte
Exceto pela resposta que menciona o pdfimages, todas as outras respostas não mencionam que suas soluções realmente transcodificam as imagens incorporadas. Ou seja, essas soluções não extraem simplesmente a imagem original, mas a modificam, possivelmente em detrimento da imagem, durante o processo. Somente o pdfimages extrai a imagem original. Isso vale para Ghostscript, Imagemagick, Adobe Reader, PDFFill, PDF Xchange Viewer, OS X Preview e a maioria dos outros softwares PDF.
fonte
O PDFill PDF Tools é provavelmente a maneira mais fácil de converter seus PDFs em imagens no Windows. Ele permitirá que você exporte todas as páginas do PDF para separar as imagens de uma só vez. Ele também possui muitos outros recursos disponíveis gratuitamente, disponíveis apenas em outros visualizadores de PDF se você comprar a versão comercial ou "Pro".
Use o botão "Converter PDF em imagens" (botão 10) na imagem abaixo.
Se você precisar concatenar as imagens em uma imagem muito alta, para alimentar apenas um arquivo no seu programa de OCR, use o IrfanView
fonte
Como você não incluiu uma tag do SO, incluirei uma resposta do OSX:
Por padrão, os PDFs são abertos no Preview.app, que permite usar
File -> Save-As
:fonte
Também PDF Xchange Viewer (Grátis) fará a exportação para o arquivo. Arquivo → Exportar → Exportar para imagem.
Não apenas isso, mas acho que é o melhor visualizador de PDF gratuito para Windows, e possui alguns recursos de marcação interessantes. Eu tenho uma licença para o Adobe Acrobat e ainda prefiro isso, a menos que esteja fazendo uma edição extensa, o que raramente acontece.
fonte
(Não gratuito) O profissional Acrobat faz isso:
Avançado-> Processamento de documentos-> Exportar todas as imagens ...
fonte
Se o arquivo tiver menos de 5 MB e você não estiver preocupado com privacidade / confidencialidade, é um prático serviço on-line em http://www.go2convert.com/ que pode fazer muitas conversões gráficas (incluindo pdf para jpeg)
fonte
Se a imagem exceder o tamanho da sua tela, você poderá usar o FastStone Capture (o recurso "Janela de rolagem da captura") e salvar a imagem como JPEG.
fonte
Você pode conferir este artigo .
Ele lista 6 maneiras diferentes de converter o pdf em imagens.
Converta PDF para JPG (o caminho da Web)
Conversores de PDF para JPG para o Desktop
fonte