Acabei de instalar o gscan2pdf v1.3.9 e o Tesseract. Quanto ao último, ele apareceu primeiro na parte inferior da minha lista de softwares instalados, mas agora parece ter desaparecido, embora ainda esteja funcionando (eu acho).
De qualquer forma, estou tentando transformar um PDF de um documento digitalizado em texto editável, mas o documento não está em inglês, portanto o gscan faz uma bagunça.
Únicas opções que eu tenho quando eu ir para Tools > OCR > Language to recognize
é English
, equ
e osd
. Alguma idéia de como posso instalar um pacote de idiomas específico?
Como não sou usuário experiente do Linux, as instruções passo a passo seriam muito apreciadas.
language-support
ocr
maa
fonte
fonte