Suponha que eu tenha um PDF e deseje obter os metadados disponíveis para esse PDF. Qual utilitário devo usar?
Acho que a informação que mais me interessa é o tamanho do papel, algo que os visualizadores de PDF geralmente não relatam. Por exemplo, a carta do tamanho do PDF é legal, A4 ou outra coisa? Mas as outras informações disponíveis também podem ser interessantes.
EDIT: Aqui está um guia útil para tamanhos de papel, graças a @terdon.
pdf
file-metadata
Faheem Mitha
fonte
fonte
Respostas:
Uma das ferramentas canônicas para isso é
pdfinfo
, que vem com o xpdf, se bem me lembro. Exemplo de saída:fonte
pdfinfo
captar isso.if ((fabs(w - 612) < 0.1 && fabs(h - 792) < 0.1) || (fabs(w - 792) < 0.1 && fabs(h - 612) < 0.1))
?sqrt(2)
s.Outro utilitário que vale a pena examinar é o exiftool . Pode não ser a ferramenta certa no seu caso específico, pois não relata nenhuma informação sobre a geometria do documento, mas, em geral, é provavelmente a ferramenta mais completa para examinar os metadados do PDF.
Aqui está um exemplo de comando que imprimirá todas as meta informações disponíveis (
-a
), classificadas por groups (-G1
):A documentação oficial oferece uma visão geral das tags relacionadas a PDF suportadas:
Você pode instalar o exiftool no Debian / Ubuntu com:
Se você gosta mais do lado da GUI, pode dar meu projeto gosta PDFMtEd . É um conjunto de ferramentas que serve como interface gráfica para o exiftool e permite visualizar e editar os metadados do PDF.
Aqui estão algumas capturas de tela:
fonte