Existe uma maneira de converter um documento PDF em um formato de e-book como epub, azw ou mobi? Estou procurando um aplicativo que seja rápido na conversão. Acabei de experimentar o calibre. Após 10 minutos, nem 2% da conversão foram atingidos. Então, por favor, não calibre. A CLI é preferida.
8
Eu tive que fazer isso para um arquivo PDF uma vez, e este foi o resultado (usando pdftohtml do poppler):
Alimente o zip ao Calibre e converta para EPUB. Filtre todas as propriedades CSS (como cores, fontes).
Cada arquivo PDF é diferente - não há solução definitiva. O exemplo acima funcionou para um caso específico - você precisa enfiar pdftohtml / pdftotext e ajustar a saída para atender às suas necessidades.
Se isso falhar e você precisar recorrer ao OCR, tive alguma sorte com o cuneiforme. Mas também tente tesseract, ocrad, gocr. No entanto, todos eles exigem trabalho manual para um bom resultado.
fonte