Visualizador de metadados PDF / editor de tags para Ubuntu

26

Há muitas perguntas e respostas sobre o melhor visualizador de PDF disponível no Ubuntu, mas quero analisar o arquivo PDF e conhecer detalhes do PDF, como imagens, fontes e links disponíveis em um determinado arquivo PDF.

Existem visualizadores de metadados / editores de tags em PDF disponíveis?

Sahil Grover
fonte
2
Eleitores próximos: Só porque esta pergunta diz "melhor" no título não a torna baseada em opiniões!
Seth

Respostas:

31
  1. Visualize os metadados pdf de um arquivo chamado Example.pdf:

    pdfinfo Example.pdf  
    
  2. Edite os metadados existentes no terminal usando o nano editor:

    pdftk Example.pdf dump_data output Metadata-output.txt
    nano Metadata-output.txt  
    
  3. Atualizar metadados:

    pdftk Example.pdf update_info Metadata-output.txt output Example-new.pdf
    

Atalhos de teclado do Nano editor
Use a combinação de teclado Ctrl+ Oe, a seguir, pressione Enterpara salvar o arquivo em seu local atual.
Use a combinação de teclado Ctrl+ Xpara sair do nano.

karel
fonte
10

Solução CLI

Outro utilitário que vale a pena examinar é o exiftool . A vantagem que o exiftool possui sobre o pdfinfo é que ele suporta muito mais tipos de metadados (por exemplo, tags XMP).

Aqui está um exemplo de um comando que imprimirá todas as meta informações disponíveis ( -a), classificadas por groups ( -G1):

exiftool -a -G1 "$File"

Visão geral das tags relacionadas a PDF suportadas:

Você pode instalar o exiftool no Ubuntu com:

sudo apt-get install libimage-exiftool-perl

Solução GUI

Se você estiver procurando por um visualizador / editor de metadados PDF da GUI, pode experimentar o PDFMtEd . É um conjunto de utilitários gráficos que escrevi para gerenciar metadados de PDF com exiftool:

insira a descrição da imagem aqui

insira a descrição da imagem aqui

Glutanimado
fonte
1

A resposta de "melhor" depende realmente de quantos detalhes você deseja e de quão estável você deseja que o espectador seja. Existem muitos softwares para visualizar e até editar arquivos pós-script e pdf no linux; tudo o que parece ter sido removido dos repositórios atuais do Ubuntu (provavelmente devido a problemas de estabilidade).

Por enquanto, eu recomendo tentar o pdfedit. Se você estiver usando Quantal ou anterior, ele poderá ser instalado via

sudo apt-get install pdfedit

Para lançamentos mais recentes, você precisará baixá- lo da página do projeto , descompactá-lo e compilá-lo.

virtualxtc
fonte
Eu não quero um visualizador. Eu preciso de um analisador que pode buscar detalhes de um arquivo pdf como links disponíveis no arquivo .... imagens disponíveis ... índice de arquivo etc.
Sahil Grover
Desculpe, pdftk tem confundido com PDFedit porque eles removido PDFedit dos repositórios
virtualxtc
0

Para elaborar o pdftkmétodo de edição, o que é interessante porque mostra tudo o que está sendo definido, ao mesmo tempo em que permite alterar o que você quiser, aqui está um script (para o seu .bashrcou outro arquivo de aliases) para fazê-lo com um único comando . Isso cria uma nova versão do arquivo que você deseja editar, abre seu editor favorito com o arquivo de metadados e, em seguida, implementa suas alterações e define o tempo de criação / modificação no arquivo PDF modificado para que seja o mesmo que o original. Para usá-lo, após fornecer novamente o .bashrcarquivo, digite

editPDFmetadata myfile.pdf

Aqui está o alias:

editPDFmetadata() {
OUTPUT="${1}-new.pdf"
METADATA="tmp${1}-report.txt"
pdftk ${1} dump_data output $METADATA
$EDITOR $METADATA
pdftk ${1} update_info $METADATA  output $OUTPUT
touch -r ${1} ${OUTPUT}
}

Simplesmente coloque a definição acima no .bashrcarquivo em sua pasta pessoal, abra um novo terminal e ele estará pronto para uso.

CPBL
fonte
0

sudo apt-get install libimage-exiftool-perl

Os metadados podem ser completamente removidos pelo seguinte comando

exiftool -all:all= file_name

Para sempre
fonte