Abrir PDF no Illustrator divide objetos de texto

10

Recentemente, tive que converter alguns PDFarquivos para SVG, e fiz isso abrindo o PDF no Illustrator e salvando no SVG.

O problema era que, quando o Illustrator abria o pdf, muitos objetos de texto (mas não todos) eram divididos em diferentes objetos de texto. Por exemplo, a palavra "política" não seria um objeto de texto, mas vários objetos de texto, "po", "l", "gelado". Não parecia haver nenhuma rima ou razão para isso.

Como posso impedir que isso aconteça?

itsmikem
fonte

Respostas:

11

Geralmente isso acontece para manter a aparência .

Se o texto interagir com outros objetos, ele poderá ser quebrado. Se a fonte incorporada no PDF for um subconjunto, e não a fonte inteira, ela poderá ser dividida no AI, para que o AI possa inserir os caracteres ausentes do subconjunto.

Há pouco que você pode fazer para impedir que isso aconteça, além de trabalhar e salvar na mesma versão do Illustrator todas as vezes. E apenas salvar um PDF como um arquivo separado para saída, não para edição.


Mas você pode corrigi-lo no Illustrator selecionando as cadeias de texto com a Ferramenta de Seleção Direta ou a Ferramenta de Seleção e Edit > Copy, em seguida, inicie um novo texto de ponto ou área e Edit > Paste. O texto colado será uma sequência em vez das partes que foram copiadas.

Scott
fonte
5
gatos sagrados, quero +10 nesta resposta apenas para essa solução. O Illustrator está me deixando louco com isso há ANOS.
Lauren-clear-monica-ipsum
11
@LaurenIpsum Você viu a resposta abaixo? Ainda mais incrível, realmente.
21418 Chris K
8

Se você deseja mesclar texto quebrado, preservando o máximo possível a formatação, o posicionamento, os parágrafos e outras tipografias do texto existente, em vez de colar em uma área de texto recém-criada como texto simples, tente o texto de John Wundes. incrível script Join Text Frames .

Ele faz exatamente o que diz na lata: mescla trechos de texto em um trecho de texto, fazendo julgamentos inteligentes com base em onde eles são relativos:

  • Ele mescla trechos de texto complementares (por exemplo, de linhas quebradas de texto de PDFs) em linhas únicas, com algum controle sobre o quão próximo é considerado a mesma linha.
  • Ele mescla linhas de texto separadas em um objeto de texto de várias linhas com o texto na ordem correta (de cima para baixo), corrigindo parágrafos quebrados.
  • Existe então uma opção para restaurar a formatação original de todo o texto mesclado. Isso pode demorar um pouco, mas fornece estimativas bastante precisas de quanto tempo levará e a opção de pular se não valer a pena.

É realmente bom!


Observe que ele funciona apenas com texto de ponto, não com texto de área (aqui, porque os PDFs são quase sempre texto de ponto). Se você estiver tentando mesclar o texto da área por qualquer motivo, poderá convertê-lo com o script 'Criar texto do ponto' da cartografia Kelso


Também é útil usado em conjunto com AjarProductions Convert to Text Area roteiro (Kelso Cartografia também têm um script semelhante, ver link acima), se você quiser voltar texto quebrado em em áreas de texto adequados com parágrafos de fluxo de automóveis:

  1. Selecione os trechos de texto desfeitos, execute o script Ingressar em Quadros de Texto
  2. Copie e cole o texto em um editor de texto que permita localizar / substituir caracteres de parágrafo (por exemplo, InDesign, o editor de texto sem formatação do codificador ou talvez algo como ( sussurros ) Word ...)
  3. Encontre / substitua as quebras de fim de linha indesejadas. Se houver muitos parágrafos separados que você deseja preservar, 1) tem certeza de que não seria melhor usar o InDesign? 2) você poderia fazer assim:

    1. Encontre / substitua dois marcadores de parágrafo consecutivos por algum espaço reservado para texto que não apareça em nenhum outro lugar do texto (por exemplo \|\C.L.O.W.N.H.O.R.R.O.R/|/)
    2. Encontre / substitua marcadores de parágrafo por nada ou espaços: transformá-lo em uma longa linha de texto com rajadas ocasionais de \|\C.L.O.W.N.H.O.R.R.O.R/|/
    3. Encontre / substitua \|\C.L.O.W.N.H.O.R.R.O.R/|/por um novo caractere de parágrafo - que coloca um parágrafo onde quer que dois estivessem antes.
  4. Copie o texto novamente e execute o script Converter em Área de Texto nele. Agora é uma área de texto fluida com quebras de parágrafos nos lugares certos.


Infelizmente, nada pode corrigir o texto delineado, exceto para impedi-lo de ser delineado, redigitá-lo ou confiar no software OCR potencialmente desonesto.

user56reinstatemonica8
fonte
Sua resposta é fantástica. Citei e reposicionei a primeira parte da sua resposta a este controle de qualidade: graphicdesign.stackexchange.com/a/105785/19447 #
Chris K