Navegar na estrutura interna do PDF

18

Como navegar na estrutura interna do PDF no adobe 9.0?

Não encontrei o menu avançado que possui essa opção.

Alguém pode me ajudar?

pdf
fonte

23

Existem várias maneiras de navegar na estrutura interna de um PDF.

Pdfs são meio legíveis por humanos

Exceto senhas de segurança, muitas delas são legíveis por humanos. Se um PDF tiver uma senha, todas as sequências e fluxos (que já serão compactados, sem perda) serão lixo pseudoaleatório. Os fluxos de dados compactados são abundantes, mas muitos deles se parecem com isso no seu editor de texto favorito:

2 0 obj
<< /Type /Page 
   /MediaBox [0 0 612 792]
   /Contents 4 0 R
   /Resources << /Fonts 
     << /F1 5 0 R>> 
   >>
>>
endobj

Aviso: O espaço em branco é amplamente irrelevante e geralmente removido quando possível. Eu apenas fiz isso bonito para facilitar a compreensão.

<< e >> iniciam e terminam "dicionários". Os dicionários são compostos de pares de chave / valor. A chave é sempre um "nome": todos os nomes começam com '/'. O valor pode ser qualquer coisa, incluindo outro nome.

[ e ] iniciam e terminam "matrizes". As matrizes podem ser compostas de praticamente qualquer coisa.

Números são "números". Ponto flutuante ou não.

() e <> iniciam e terminam "strings". <> são listadas como valores hexadecimais, () são seqüências ANSI.

Pet Peeve: / Names e (Strings) usam sistemas de escape completamente diferentes. Grr.

As referências indiretas apontam para outros objetos no PDF:
<objNum> <generationNum-AlwaysZero> R

No objeto de exemplo acima, o fluxo de conteúdo está no objeto 4, em outra parte do PDF. Para encontrá-lo, você pode usar a pesquisa de texto de seus editores para "N 0 obj", em que N é o número do objeto que você deseja.
AVISO: Existem centenas, possivelmente milhares de objetos em um PDF. Procurando por "1 0 obj", você recebe muitos hits.

Dado que você está pedindo para ver a estrutura interna, provavelmente já sabe tudo isso. Outros que desejam saber a mesma coisa podem não saber.

AVISO: Não edite um PDF em um editor de texto. Todo esse material binário será mutilado, as compensações de bytes são muito importantes em PDF.

Plug-in do Acrobat

Existe um plug-in acrobat chamado PDF CanOpener da Windjack Solutions (sem afiliação). É LISO. Você poderá navegar na estrutura do PDF como uma árvore, ver (e modificar) fluxos de conteúdo e assim por diante.

Aplicativos de terceiros

Grande quantidade. Muitas pessoas criam uma como parte da aprendizagem da análise de PDF ou como uma ferramenta de depuração. Eles são bastante acessíveis.

iText RUPS (parte do iText, uma biblioteca Java PDF, agora no GitHub)

Navegador de objetos PDF

Função PDF

Mark Storer
fonte

1

PDF Volelink parece estar quebrado agora ...

DNA

5

+1 para iText rups, não precisamente uma interface gráfica amigável, mas obras, a propósito atualmente o URL do projeto parece ser ( sourceforge.net/projects/itextrups )

Jaime Hablutzel

2

O iText RUPS foi movido para aqui: github.com/itext/rups

bmaupin

1

Há uma cópia do código-fonte do pdfvole aqui: github.com/Rossi1337/pdf_vole

yms

1

Se o PDF tiver fluxos de dados compactados, o utilitário de linha de comando qpdf poderá decodificá-los / esvaziá-los e escrever um PDF com conteúdo mais inteligível: `qpdf --decode-level = all --stream-data = descompactar inputfile.pdf extendedfile. pdf

skierpage 13/11/19

7

O O2Solutions oferece um utilitário compatível com MS Windows para visualizar a estrutura interna dos documentos PDF. É gratuito para uso pessoal e comercial.

http://www.o2sol.com/pdfxplorer/overview.htm

AffineMesh
fonte

4

Você pode navegar pela estrutura interna do PDF no Adobe Acrobat usando o Browse Internal PDF Structurecomando it do plug-in Comprovação:

http://www.jpedal.org/PDFblog/2009/04/viewing-pdf-objects/

Você também pode usar o plug- in PDF CanOpener comercial do Acrobat para ver a estrutura do objeto ou o PDFedit gratuito para decodificar fluxos de dados compactados em PDF.

Mark Stephens
fonte

4

O PoDoFoBrowser é um pequeno utilitário portátil gratuito que permite não apenas navegar na estrutura interna do PDF, mas também exportar, importar e editar dados do objeto. Pode ser baixado aqui:

http://sourceforge.net/projects/podofo/files/podofobrowser/0.5/

Aqui está como fica no Windows:

captura de tela

Alexey Popkov
fonte

2

O PDF-XChange Editor gratuito possui um painel Conteúdo , que permite visualizar a estrutura em árvore do arquivo PDF.

View -> Panes -> Content

Hüseyin Yağlı
fonte

2

O PDF Vole parece estar quebrado. Se alguém ainda estiver procurando por uma ferramenta, estou usando o Analisador de PDF gratuito .

juFo
fonte

Navegar na estrutura interna do PDF

Respostas:

Pdfs são meio legíveis por humanos

Plug-in do Acrobat

Aplicativos de terceiros