Eu tenho um documento PDF (não criptografado) com campos de formulário editáveis. No entanto, a fonte desses campos está quebrada: faltam alguns glifos; portanto, quando eu digito o texto, algumas lacunas aparecem.
Como posso modificar o documento PDF - não tenho acesso ao documento de origem usado para criá-lo - para substituir uma fonte diferente no lugar da quebrada ?
A fonte em questão é o Caliban Regular da Adobe , que posso ver incorporado no documento. Os glifos exibidos em branco incluem "i", "T", "V"; talvez outros que eu não tenha descoberto.
Também tenho outro documento semelhante usando o Caliban, que é exibido corretamente, incluindo os glifos listados acima como quebrados. Se alguém puder me dizer como pegar uma fonte de um PDF e substituí-la por um PDF existente , isso seria uma solução.
Atualmente, estou usando:
- Debian GNU + Linux
- Evince (e eu também tentei o Okular ) para visualizar
- A biblioteca Poppler para renderização de PDF
- Emacs (ou qualquer editor de texto) para editar o código PDF
- pdftk e OpenOffice.org instalados, se isso ajudar
Eu estaria interessado em outras ferramentas de edição de PDF de software livre ( preço zero ou não ), se elas ajudarem nessa tarefa.
Respostas:
É extremamente difícil substituir uma fonte incorporada em um PDF. Não conheço nenhum software gratuito como fala (licenciado pela GPL) ou gratuito como cerveja (gratuito) que provavelmente poderia fazer isso (desincorporando a fonte primeiro e depois reimplantando uma fonte sustentável). Conheço apenas dois produtos comerciais que fazem isso: pdfToolbox4, da callassoftware.com, e PitStop, da Enfocus (é claro que existem outros, mas eu não os conheço, e esses dois são os líderes de mercado aqui).
Aqui está uma maneira de extrair uma fonte incorporada de um PDF usando o Software Livre. Esteja ciente de que você só tem permissão legal para fazer isso, se a licença da fonte não a proibir. No repositório de código-fonte do Ghostscript, existe um utilitário de programa PostScript chamado
extractFonts.ps
que pode ajudar aqui:Execute o seguinte comando em uma caixa do DOS (cmd.exe):
(Lembre-se de que extrair fontes aqui não significa remover as fontes do PDF, mas criar arquivos de fonte que são cópias daquelas incorporadas ao PDF.)
Aqui está outro bloco de construção que pode contribuir para alcançar o que você deseja. Você pode descompactar todas as partes / fluxos compactados do seu PDF, para poder editar o arquivo com mais facilidade com um editor de texto simples. (Aviso: editar PDFs não é uma tarefa simples e direta - seus esforços de edição exigirão um conhecimento substancial e inteligência sobre os formatos internos de arquivos PDF.)
Este truque também usa um utilitário do Subversion do Ghostscript
toolbin
subdiretório .Execute o seguinte comando em uma caixa do DOS (cmd.exe):
Este comando tentará descompactar todos os fluxos compactados 'flate' . (Se você não tiver sorte, seu arquivo também conterá fluxos usando outros métodos de compactação (como 'zip' ), que permanecerão inalterados por este comando.)
fonte