Navegar na estrutura interna do PDF

18

Como navegar na estrutura interna do PDF no adobe 9.0?

Não encontrei o menu avançado que possui essa opção.

Alguém pode me ajudar?


fonte

Respostas:

23

Existem várias maneiras de navegar na estrutura interna de um PDF.

Pdfs são meio legíveis por humanos

Exceto senhas de segurança, muitas delas são legíveis por humanos. Se um PDF tiver uma senha, todas as sequências e fluxos (que já serão compactados, sem perda) serão lixo pseudoaleatório. Os fluxos de dados compactados são abundantes, mas muitos deles se parecem com isso no seu editor de texto favorito:

2 0 obj
<< /Type /Page 
   /MediaBox [0 0 612 792]
   /Contents 4 0 R
   /Resources << /Fonts 
     << /F1 5 0 R>> 
   >>
>>
endobj

Aviso: O espaço em branco é amplamente irrelevante e geralmente removido quando possível. Eu apenas fiz isso bonito para facilitar a compreensão.

<< e >> iniciam e terminam "dicionários". Os dicionários são compostos de pares de chave / valor. A chave é sempre um "nome": todos os nomes começam com '/'. O valor pode ser qualquer coisa, incluindo outro nome.

[ e ] iniciam e terminam "matrizes". As matrizes podem ser compostas de praticamente qualquer coisa.

Números são "números". Ponto flutuante ou não.

() e <> iniciam e terminam "strings". <> são listadas como valores hexadecimais, () são seqüências ANSI.

Pet Peeve: / Names e (Strings) usam sistemas de escape completamente diferentes. Grr.

As referências indiretas apontam para outros objetos no PDF:
<objNum> <generationNum-AlwaysZero> R

No objeto de exemplo acima, o fluxo de conteúdo está no objeto 4, em outra parte do PDF. Para encontrá-lo, você pode usar a pesquisa de texto de seus editores para "N 0 obj", em que N é o número do objeto que você deseja.
AVISO: Existem centenas, possivelmente milhares de objetos em um PDF. Procurando por "1 0 obj", você recebe muitos hits.

Dado que você está pedindo para ver a estrutura interna, provavelmente já sabe tudo isso. Outros que desejam saber a mesma coisa podem não saber.

AVISO: Não edite um PDF em um editor de texto. Todo esse material binário será mutilado, as compensações de bytes são muito importantes em PDF.

Plug-in do Acrobat

Existe um plug-in acrobat chamado PDF CanOpener da Windjack Solutions (sem afiliação). É LISO. Você poderá navegar na estrutura do PDF como uma árvore, ver (e modificar) fluxos de conteúdo e assim por diante.

Aplicativos de terceiros

Grande quantidade. Muitas pessoas criam uma como parte da aprendizagem da análise de PDF ou como uma ferramenta de depuração. Eles são bastante acessíveis.

iText RUPS (parte do iText, uma biblioteca Java PDF, agora no GitHub)

Navegador de objetos PDF

Função PDF

Mark Storer
fonte
1
PDF Volelink parece estar quebrado agora ...
DNA
5
+1 para iText rups, não precisamente uma interface gráfica amigável, mas obras, a propósito atualmente o URL do projeto parece ser ( sourceforge.net/projects/itextrups )
Jaime Hablutzel
2
O iText RUPS foi movido para aqui: github.com/itext/rups
bmaupin
1
Há uma cópia do código-fonte do pdfvole aqui: github.com/Rossi1337/pdf_vole
yms
1
Se o PDF tiver fluxos de dados compactados, o utilitário de linha de comando qpdf poderá decodificá-los / esvaziá-los e escrever um PDF com conteúdo mais inteligível: `qpdf --decode-level = all --stream-data = descompactar inputfile.pdf extendedfile. pdf
skierpage 13/11/19
7

O O2Solutions oferece um utilitário compatível com MS Windows para visualizar a estrutura interna dos documentos PDF. É gratuito para uso pessoal e comercial.

http://www.o2sol.com/pdfxplorer/overview.htm

AffineMesh
fonte
2

O PDF-XChange Editor gratuito possui um painel Conteúdo , que permite visualizar a estrutura em árvore do arquivo PDF.

View -> Panes -> Content
Hüseyin Yağlı
fonte
2

O PDF Vole parece estar quebrado. Se alguém ainda estiver procurando por uma ferramenta, estou usando o Analisador de PDF gratuito .

insira a descrição da imagem aqui

juFo
fonte