Antes de começar a usar o Ubuntu, usei o Nitro PDF reader para extrair automaticamente imagens de arquivos PDF. Existe um leitor de PDF para Linux que faça isso?
Eu gostaria de poder extrair imagens mais rápido / mais fácil do que ao tirar um instantâneo.
pdfimages
fazer melhor / pior do que o NitroPDF?Respostas:
Usar
pdfimages
pdfimages
é uma ferramenta de extração de imagem PDF que salva as imagens em um arquivo PDF no formato de arquivo PPM, PBM, JPEG ou JPEG 2000.É uma parte do
poppler-utils
pacote, que você precisará instalar.Uso:
pdfimages [options] <PDF-file> <image-root>
Exemplo: O seguinte extrai todas as imagens de um arquivo PDF, salvando-as no formato JPEG.
Salvará imagens do arquivo PDF
in.pdf
em arquivos/tmp/out-000.jpg
(ou/tmp/out-000.pbm
; veja abaixo)/tmp/out-001.jpg
, etc.A página do manual pdfimages explica:
fonte
-all Write JPEG, JPEG2000, JBIG2, and CCITT images in their native format. CMYK files are written as TIFF files. All other images are written as PNG files. This is equivalent to specifying the options -png -tiff -j -jp2 -jbig2 -ccitt.
-all
switch é suportado apenas em revisões recentes de poppler-utils. Por exemplo, se você ainda está em 12,04 você não será capaz de aceder a esta opção-all
vá para os formatos PNM. Eles não têm perdas e você pode pós-processar as imagens, por exemplo, para PNG.$ pdfimages -list <PDF-file>
para verificar o formato original na coluna "enc", para que você não precise recodificar a imagem em outro formato.Costumo usar o Inkscape para isso. Carregue a página e exclua todas as outras coisas. A vantagem é que você pode obter imagens vetoriais em SVG e modificá-las conforme desejar.
fonte
Eu tenho um arquivo PDF de coluna dupla com imagens incorporadas criadas com LaTeX, onde as imagens originais foram fornecidas como EPS. Tentei a solução proposta com base em
pdfimages
, mas infelizmente ela não retornou nenhuma imagem. Tentei usar o Inkscape, mas as imagens SVG geradas estavam distorcidas e também não tive sorte em exportá-las como EPS.O software que funcionou para nós foi o MasterPdfEditor .
Aqui está o procedimento
O resultado é de alta qualidade, mas o software não é gratuito. Existe uma versão demo que "permite que você experimente todos os recursos", mas vem com "a adição de uma marca d'água no arquivo de saída". Para ser franco, não notei nenhuma marca d'água no PDF produzido.
fonte
Você também pode tentar pdfmod. É uma interface gráfica (GUI) que pode extrair imagens e fazer outra manipulação básica de pdf.
fonte
Se você precisar de uma imagem cortada no formato pdf / eps, extraia uma página com a imagem usando
pdfmod
(conforme sugerido por Tarefa).Em seguida,
pdfcrop
você pode cortá-lo adequadamente, definindo as margens por tentativa e erro:fonte
Eu uso o pdfimages, que é uma ferramenta de linha de comando e funciona muito bem para mim. É muito fácil de usar e você pode usar a opção --help para aprender mais sobre seu uso. Eu uso o Ubuntu e ele vem pré-instalado. Se seus arquivos PDF são criptografados ou protegidos por senha, existem opções para isso, então essa ferramenta funciona muito bem. Você pode ler mais sobre pdfimages aqui
fonte
Com as imagens pdf, a imagem extraída pode estar em duas ou mais partes. Uma maneira simples de reuni-los novamente sem se preocupar com os formatos extraídos é importar as peças para o LibreOffice Draw, cortar com o diálogo de corte de imagem, posicionar as peças, ajustar o tamanho da página e exportar para o formato que você preferir.
fonte
Se você deseja cortar uma imagem de um pdf com um visualizador de pdf, tente o okular. Pode cortar qualquer coisa (textos ou imagens) no formato png ou jpeg. Se você deseja extrair imagens em formato png de um pdf, pode fazê-lo com o mínimo de comando com pdftohtml. Ele converte pdf em html e imagens. Aqui você pode encontrar um exemplo - https://www.youtube.com/watch?v=CG1rf7k3xo8 . Se você deseja extrair muitas imagens de um pdf, sugiro que tente isso.
fonte
Software usado: Xreader OS: Antergos
Passos:
fonte