remover caixas vermelhas em um arquivo PDF

1

Fiz o download do arquivo PDF do Linux Essentials no site LPIC, cujo link é https://www.linuxcertification.co.za/sites/default/files/linux-esentials-manual.pdf

Salvei o arquivo PDF no meu sistema e o abri usando o Foxit PDF reader e o Adobe reader. Agora, ao visualizar o arquivo no Chrome como PDF, não há caixas vermelhas visíveis:

insira a descrição da imagem aqui

No entanto, quando eu o vejo no Foxit e Adobe, essas caixas são exibidas:

insira a descrição da imagem aqui

O que está causando esse problema?

Tentei converter o arquivo PDF para o Word usando conversores on-line e depois converti o arquivo do Word para PDF. Na maioria dos casos, as caixas foram removidas, no entanto, o alinhamento do texto foi distorcido e algumas vezes foi observado algum erro gramatical.

Não posso confiar na abertura do arquivo no Chrome o tempo todo e desejo usar o Foxit ou o Adobe Reader para abrir o arquivo. Qualquer ajuda seria apreciada.

John S
fonte
Essas caixas fazem parte do PDF. Por que o Chrome não os processa está além de mim. Se essas caixas devem aparecer é uma opção com hypertex, um pacote LaTeX.
Daniel B
@DanielB então como posso removê-los?
John S
Você não pode. Como eu disse: eles fazem parte do documento. Bem, você pode remover cada um deles manualmente com um editor de PDF, mas isso não é viável.
Daniel B
@ DanielB - existe uma maneira de convertê-lo para o Word, preservar o alinhamento usando software de código aberto? Dessa forma eu posso convertê-lo de volta para PDF e não têm caixas vermelhas
John S
Os arquivos PDF não podem ser convertidos em documentos do Word de maneira sem perdas. O PDF oferece muitos recursos que o Word não. Sua melhor aposta é entrar em contato com os autores mencionados no documento para solicitar uma versão sem caixas.
Daniel B

Respostas:

0

De fato, você pode remover as bordas com bastante facilidade, porque elas não estão no que compõem as páginas em PDF. As bordas são na verdade parte das anotações do link que permitem navegar pelo documento. Portanto, para remover sua aparência, basta ajustar os objetos PDF apropriados.

A licença do documento não permite que derivativos sejam distribuídos. Então, aqui está um script que usa o HexaPDF para remover as bordas das anotações do link:

require 'hexapdf'
doc = HexaPDF::Document.open(ARGV[0])
doc.pages.each {|page| page[:Annots]&.each {|a| a = doc.deref(a); a[:C] = nil; a[:Border] = [0, 0, 0]}}
doc.write(ARGV[0] + '.pdf', validate: false)

Você precisa instalar o HexaPDF ( gem install hexapdf, precisa de uma instalação do Ruby 2.4), salvar este script como um arquivo Ruby, por exemplo, remove_borders.rbe depois executá-lo da seguinte maneira:

ruby remove_borders.rb path/to/linux-essentials-manual.pdf

A saída é um arquivo com o mesmo nome, mas um .pdfanexo adicional , com as bordas das anotações do link removidas.

gettalong
fonte