Eu tenho um documento PDF grande que consiste em páginas digitalizadas de um livro. Desejo executar a função de reconhecimento de texto do Adobe Acrobat 9, mas sou apresentado a esse menu quando o faço.
Estou confuso com as opções no menu destacado. Qual opção produzirá o texto da mais alta qualidade / mais legível? Eu pensei que 600 dpi implica uma imagem de qualidade superior a 72 dpi, por isso estou confuso com "Alta (72 dpi)" e "Mais baixa (600 dpi)".
Não conheço especificamente o Acrobat, mas muitos programas de OCR são otimizados para texto em uma fonte corporal "típica", com cerca de 300 dpi. Comece com isso e tente uma página. Se você receber muitos erros de tradução, tente 600 dpi. Se a página não estiver limpa, 600 dpi podem tornar os artefatos grandes o suficiente para serem interpretados como caracteres como sinais de pontuação, exigindo mais limpeza da tradução (a maioria dos programas de OCR não sabe qual dpi produziu a imagem, apenas vê "tamanho misto" fontes "). Eu ficaria surpreso se 72 dpi funcionar bem, a menos que você esteja traduzindo fontes enormes.
fonte