Como remover marca d'água de pdf usando pdftk?

33

Preciso remover uma marca d'água estúpida de email que se expande por todas as páginas de um livro de domínio público. Eu olhei para a página de manual do pdftk e alguns exemplos, mas ainda não consigo descobrir como remover as marcas d'água. Eu aprecio suas dicas.

hnns
fonte

Respostas:

35

muito simples tarefa de executar:

use sed:

 sed -e "s/watermarktextstring/ /g" <input.pdf >unwatermarked.pdf

mas, depois, certifique-se de reparar a saída resultante pdf

pdftk unwatermarked.pdf output fixed.pdf && mv fixed.pdf unwatermarked.pdf

tudo em um comando:

 sed -e "s/watermarktextstring/ /g" <input.pdf >unwatermarked.pdf && pdftk unwatermarked.pdf output fixed.pdf && mv fixed.pdf unwatermarked.pdf

marcas d'água de texto nada mais são do que um texto entre duas tags dentro do código compactado em pdf

Dingo
fonte
11
Fantástico! funcionou como um encanto. renomeie o endereço de e-mail para fictício. Não quero que o cara que mima o livro seja alvo de spammers. Especialmente porque ele é provavelmente quem criou o pdf. Muito Obrigado.
hnns 12/07/2012
feito! Alterou uma string específica com uma string genérica
Alguém sabe como modificar esta solução para se livrar de uma marca d'água de link? Eu me livrei do texto, mas ainda há um pequeno quadrado onde o texto costumava estar.
425nesp
O pdftk caiu quando eu executei isso.
Cerin
@Dingo como processá-lo em lote? Quero dizer vários arquivos
Clain Dsilva
48

Apenas um pequeno complemento à resposta do Dingo, pois não funcionou para mim:

Primeiro tive que descompactar o documento PDF para poder encontrar a marca d'água e substituí-la por sed. A primeira etapa envolve descompactar o documento PDF usando pdftk:

pdftk original.pdf output uncompressed.pdf uncompress 

agora, uncompressed.pdfpode ser usado como na resposta do Dingo:

sed -e "s/watermarktextstring/ /" uncompressed.pdf > unwatermarked.pdf

Em seguida, consertei e recompactei o documento:

pdftk unwatermarked.pdf output fixed.pdf compress
Philippe
fonte
Você é um salva-vidas! Obrigado!!! :)
johndodo
11
Isso é realmente incrível!
usar o seguinte comando
4
Peguei esse processo, o tornei um pouco mais sofisticado e o envolvi em um script Python. Está no github aqui .
Alexander Garden
@Alexander Garden Ele não funciona, TypeError: str() takes at most 1 argument (2 given)quando utilizado seguindo os conselhos de uso dado
8bitjunkie
11
Não funcionou para remover a marca d'água adicionada pelo Master PDF Editor.
Fccoelho 27/12/19
-2

Para remover www.it-ebooks.info,

abra o PDF no bloco de notas ++ ou no bloco de texto

substitua www.it-ebooks.info por nada (em branco)

Salve o arquivo

Abrir no adobe reader padrão

Sair, você será solicitado a salvar o arquivo

Salve isso

user549273
fonte
11
Esta é uma solução geral? O que é www.it-ebooks.info?
31418 Karlo