Recentemente, tive que converter alguns PDF
arquivos para SVG
, e fiz isso abrindo o PDF no Illustrator e salvando no SVG.
O problema era que, quando o Illustrator abria o pdf, muitos objetos de texto (mas não todos) eram divididos em diferentes objetos de texto. Por exemplo, a palavra "política" não seria um objeto de texto, mas vários objetos de texto, "po", "l", "gelado". Não parecia haver nenhuma rima ou razão para isso.
Como posso impedir que isso aconteça?
fonte
Se você deseja mesclar texto quebrado, preservando o máximo possível a formatação, o posicionamento, os parágrafos e outras tipografias do texto existente, em vez de colar em uma área de texto recém-criada como texto simples, tente o texto de John Wundes. incrível script Join Text Frames .
Ele faz exatamente o que diz na lata: mescla trechos de texto em um trecho de texto, fazendo julgamentos inteligentes com base em onde eles são relativos:
É realmente bom!
Observe que ele funciona apenas com texto de ponto, não com texto de área (aqui, porque os PDFs são quase sempre texto de ponto). Se você estiver tentando mesclar o texto da área por qualquer motivo, poderá convertê-lo com o script 'Criar texto do ponto' da cartografia Kelso
Também é útil usado em conjunto com AjarProductions Convert to Text Area roteiro (Kelso Cartografia também têm um script semelhante, ver link acima), se você quiser voltar texto quebrado em em áreas de texto adequados com parágrafos de fluxo de automóveis:
Encontre / substitua as quebras de fim de linha indesejadas. Se houver muitos parágrafos separados que você deseja preservar, 1) tem certeza de que não seria melhor usar o InDesign? 2) você poderia fazer assim:
\|\C.L.O.W.N.H.O.R.R.O.R/|/
)\|\C.L.O.W.N.H.O.R.R.O.R/|/
\|\C.L.O.W.N.H.O.R.R.O.R/|/
por um novo caractere de parágrafo - que coloca um parágrafo onde quer que dois estivessem antes.Copie o texto novamente e execute o script Converter em Área de Texto nele. Agora é uma área de texto fluida com quebras de parágrafos nos lugares certos.
Infelizmente, nada pode corrigir o texto delineado, exceto para impedi-lo de ser delineado, redigitá-lo ou confiar no software OCR potencialmente desonesto.
fonte