Extrair imagens em PDF sem afetar a resolução?

26

Meu problema é que tenho a tarefa de extrair imagens de um arquivo PDF de 640 páginas.

Maioria dos quais são gráficos e tabelas com textos. Fazer uma cópia e colar simples faz com que a imagem perca sua resolução e os textos fiquem embaçados e às vezes ilegíveis.

Você conhece uma maneira melhor de extrair imagens de um arquivo PDF sem afetar a resolução?

r2b2
fonte
2
Resolvi isso instalando o KDE para Windows e depois instalando o okular. No Okular, é possível selecionar a imagem e salvá-la diretamente no arquivo, eliminando o processo de colá-la em um programa de edição de imagens que, de alguma forma, preserva a resolução.
R2b2
Veja a resposta Photoshop abaixo e passo follow 4.
George Langley

Respostas:

23

No pacote XPDF (que é um software de código aberto e gratuito), você pode usar apdfimages.exeferramenta CLI para extrair todas as imagens de um PDF ou apenas todas as imagens de um intervalo de páginas. Aqui está um exemplo para extrair todas as imagens das páginas 33-36:

pdfimages.exe ^
  -f 33 ^
  -l 36 ^
  -j ^
   c:/path/to/input.pdf ^
   c:/path/to/directory/input_images

O -jtentará extrair imagens JPEG incorporadas como JPEGs. Todas as outras imagens são exibidas como PPMs (pixmaps portáteis). Atenção, os PPMs são totalmente descomprimidos!

Kurt Pfeifle
fonte
Funciona maravilhosamente no Mac também! Eu usei o comando terminal./pdfimages -j PDF_to_be_extracted.pdf /Users/username/output_folder/
Eptin 4/17/17
4

isso é muito fácil de usar evince(o visualizador de documentos) no Ubuntu. Basta abrir o pdf usando evincee desmaximizar a janela, marque-a Always on tope arraste e solte a imagem na pasta que você gosta.

ofídio
fonte
O Evince também está disponível para Windows e BSD . Também clique com o botão direito do mouse nas ofertas de imagens para Salvar como .
Adobe
1

(1) Você pode abrir o arquivo no Word 2013 (basta usar Arquivo - Abrir), onde pode copiar a imagem. A resolução é boa o suficiente para impressão, mas não tem certeza se é igual ao original.

(2) O visualizador de freeware SumatraPDF (muito bom se você usar o LaTeX) possui uma opção de menu "Copiar imagem" quando você clica com o botão direito do mouse na imagem. Eu acho que preserva a resolução (embora eu tenha visto arquivos dos quais não consegui copiar as imagens).

(3) O Adobe Acrobat X , em Arquivo, tem Salvar como outra imagem - e, por padrão, usa alta resolução (nos casos em que tentei, era a resolução original).

(4) No Perl , há mais de uma maneira, por exemplo, leia aqui e especialmente mencione o programa para extrair imagens JPEG de qualquer coisa , que funcionou perfeitamente para mim e extrai definitivamente as imagens JPEG com resolução original.

Alexander Gelbukh
fonte
1

PHOTOSHOP! Abra o PDF no Photoshop. (Usando o Photoshop CC no Windows 7)

  1. Inicie o Photoshop.
  2. Selecione Arquivo / Abrir (ou Comando / Controle-O). A caixa de diálogo "Abrir" será exibida.
  3. Selecione o PDF e clique em OK / Enter. A caixa de diálogo "Importar PDF" será exibida.
  4. IMPORTANTE - em "Selecionar", clique no botão de opção "Imagens". Todas as imagens aparecerão!
  5. Selecione a imagem desejada e clique em OK.
  6. Ta-da!
George Langley
fonte
0

Não - copiar e colar deve manter a resolução original do recurso incorporado - o que provavelmente está acontecendo é que é uma imagem de baixa resolução que foi reduzida dentro do PDF; portanto, quando é exportada, fica pior do que é.

Tente reduzi-lo e / ou torná-lo do mesmo tamanho que no PDF e, na verdade, deve ser o mesmo.

Como alternativa, (e a pior opção), vá para o zoom 100% e tire uma captura de tela ou use a ferramenta de recorte no Windows Vista / Windows 7.

OBSERVAÇÃO - As imagens em .PDFs geralmente são reduzidas / compactadas no momento em que são convertidas em a .PDF; no entanto, uma vez compactadas, você deve conseguir extrair a mesma qualidade que a PDFpior, não pior.

William Hilsum
fonte
Isto é verdade especialmente com tabelas. Talvez eu precise aumentar o zoom para a resolução desejada ou até o texto ficar legível e pegar o instantâneo. Outra opção que tenho é para abrir o pdf no Gimp e fazer a maior resolução
r2b2
Não é o que eu vejo. Há uma imagem de alta resolução no PDF, mas o Acrobat (Pro DC para Windows) a amostra novamente em tempo real para qualquer ampliação que você esteja visualizando - posso chegar até 600% no PDF atual que Estou trabalhando antes de ver qualquer pixelização. Mas selecioná-lo e copiá-lo, com qualquer ampliação, obtém apenas uma versão em baixa resolução, que funciona apenas a 100%.
George Langley
0

Qual software de visualização de PDF você está usando?

Ao usar um programa de edição / criação de PDF , como o Adobe Acrobat Pro , você poderá extrair as imagens incorporadas como estão no arquivo PDF *. Você pode obter uma avaliação gratuita no site da Adobe (para Windows e Mac), que pode ser usado apenas para esse fim.

* desde que não estejam protegidos; nesse caso, você terá que ... er, eu não vou lá ...

paradroid
fonte
É uma avaliação gratuita do Adobe Acrobat. Vou tentar isso também, obrigado!
R2b2
1
@ r2b2: Ah, se você já estava usando o Adobe Acrobat Standard, não acho que usar a versão Pro ajudará.
paradroid 28/09/10
0

Você pode usar o Imagemagick para converter todas as páginas PDF em arquivos de imagem separados (embora eu não tenha certeza de quanto tempo levará para fazer um documento tão grande ou se ele vai aguentar!) E depois cortar o que você deseja. Pode valer a pena fazer um teste com isso, pois pelo menos você descobrirá se a resolução das imagens incorporadas é boa para o que você precisa.

Linker3000
fonte
0

A melhor maneira é usar o Adobe Acrobat Pro (2010 ou versões mais recentes). Vá para Arquivo -> Salvar como -> Mais opções -> PostScript encapsulado e clique em Salvar.

Todos
fonte
0

Se você possui o Acrobat pro, essa é, de longe, a maneira mais simples de tirar uma foto instantânea de alta resolução (defina o quão alto você deseja). Em preferências / geral, marque a caixa que diz ' usar resolução fixa para a ferramenta de instantâneo ' e defina a resolução como desejar, por exemplo, 300ppi ou até mais. Em seguida, tire um instantâneo (ferramentas / selecione & zoom / ferramenta instantâneo) e ele copiará uma cópia em alta resolução na sua área de transferência. Em seguida, cole-o na área de transferência, onde desejar. funciona bem.

Para ver uma descrição mais detalhada, clique neste link ...

resposta detalhada de alguém com capturas de tela

Marca
fonte
0

Normalmente, extraio imagens abrindo os arquivos PDF no Adobe Illustrator e depois os copio e colo no InDesign. A resolução preserva.

Richard
fonte
0

Adobe Acrobat Pro

Arquivo> SaveAs usará as configurações de Converter em PDF em "Editar> Preferências"

[Convertendo de PDF] permitirá [Editar configurações ...] para cada formato de arquivo

O Melhor dependerá das imagens e da resolução de origem usadas para criar o PDF.

Mas você pode obter bons resultados editando as configurações TIFF sem perdas

Defina a resolução como 1200 ou mais (se Salvar falha definir menor), use o arquivo original> SaveAs para renderizar o arquivo PDF em arquivos individuais de alta resolução

Não é a melhor maneira, mas é muito melhor do que renderizar como um tipo de documento diferente.

Os arquivos serão muito grandes, mas mais adequados para recortar e colar

jwillis84
fonte
0

Em um Mac, você pode exportar imagens ou uma página inteira da Visualização e obter resolução total. Você será perguntado sobre qual resolução deseja em uma caixa de diálogo.

Lars Finsen
fonte
0

No Adobe InDesign, você pode usar o comando 'Inserir' para importar um arquivo PDF. Se você deseja importar páginas específicas, ative a caixa de seleção Mostrar opções de importação na caixa de diálogo exibida após clicar no comando Inserir. Arraste e redimensione o quadro para que o que você precisa como imagem de alta resolução caiba na página. É necessário redimensionar o tamanho da página do documento de acordo com a proporção da imagem. Quando estiver satisfeito com o que vê, use o comando Exportar e selecione PDF de alta qualidade. Isso criará um PDF de alta resolução que você pode imprimir ou usar nos documentos Latex.

athulpg007
fonte