Como posso extrair fontes de um arquivo PDF?

15

Existe uma maneira de extrair fontes de arquivos PDF?

Eu sei que geralmente as fontes incorporadas nos arquivos PDF são apenas subconjuntos das fontes. Enfim, existe uma maneira de fazer isso?

slhck
fonte
No entanto, lembre-se: alguns documentos com fontes personalizadas são feitos como PDFs apenas com o objetivo de que essas fontes não estejam disponíveis para todos. Isso significa que eles são protegidos por direitos autorais de seus respectivos proprietários. Por sua vez, se você planeja usar a fonte protegida por direitos autorais, pode ter muitos problemas. Sim, nem todas as fontes são gratuitas. Existem fontes que também custam centenas de dólares.
Grumpy ol 'Bear
1
Uhm ... existe uma pergunta idêntica no Stackoverflow que fornece várias soluções. Além disso, parece haver serviços online gratuitos que fazem isso.
simlev
@ simlev você parece ter a resposta. Por que você não promove seu comentário a uma resposta escolhendo a melhor opção?
HackSlash

Respostas:

1

Eu usaria o Font Forge porque é uma solução gratuita, de código aberto e multiplataforma que pode extrair dados de fontes de arquivos PDF.

https://fontforge.github.io/en-US/

Use o item de menu Arquivo> Abrir.

DA DOCUMENTAÇÃO:

O FontForge também pode ler (muitas) fontes de um arquivo pdf. O FontForge geralmente não lista os arquivos pdf (porque eles não foram projetados como mecanismos para o transporte de fontes e a maioria dessas fontes estará incompleta devido a subconjuntos e outras otimizações), mas você sempre pode digitar o nome de um diretamente (ou usar o Botão [Filter] para definir um filtro para arquivos pdf).

https://fontforge.github.io/filemenu.html

HackSlash
fonte
1

Aqui, estou promovendo meu comentário anterior a uma resposta, conforme sugestão do HackSlash.

Há uma pergunta idêntica no Stackoverflow que já possui uma resposta aceita excelente e altamente votada .

Ele ilustrou vários métodos, os quais listarei apenas brevemente:

  1. pdftops
  2. fontforge
  3. mupdf
  4. um script ghostscript
  5. pdf-parser.py

Além disso, gostaria de salientar que existem vários serviços online gratuitos que se oferecem para fazer exatamente isso.

Comentário: Eu não vou "escolher a melhor opção", já que o melhor geralmente é subjetivo e realmente depende da situação específica. O mais fácil de tudo seria usar um serviço on-line, mas isso não seria uma opção viável se o material permanecesse privado. O FontForge parece realmente bom, especialmente para aqueles que já podem estar usando-o para criação ou edição de fontes. Se nenhum ambiente de área de trabalho estiver disponível, o pdftops (e as outras opções de linha de comando) seria uma boa opção também para automação.

simlev
fonte