Como posso converter arquivos .epub em texto sem formatação?

32

Consigo visualizar um arquivo epub em, digamos, okular, selecionar todo o texto e copiar e colar em um editor de texto. Eu gostaria de um método de linha de comando - alguém sabe disso?

drevicko
fonte
Eu recomendo que você use alguma extensão de leitura de epub do firefox em vez de um okular.
Adobe

Respostas:

41

Não sei se vale a pena instalar o Caliber para o seu trabalho, mas se você o tiver, poderá usar o poderoso conversor de e-books:

ebook-convert input.epub output.txt

O formato de saída é deduzido da extensão do arquivo de saída

Eu imagino que poderia haver algumas ferramentas / scripts XML (XSLT) que podem transformar epub em texto, pois o epub é basicamente XHTML no arquivo ZIP

zetah
fonte
1
O calibre (e é "ebook-convert") é uma ferramenta muito poderosa! Obrigado!
drevicko
Se você instalou calibre no OS X, a ferramenta de linha de comando pode ser encontrada aqui: /Applications/calibre.app/Contents/MacOS/ebook-convert.
funroll
Se você usar a ferramenta de linha de comando, pode ser necessário configurar ou definir opções para obter uma saída adequada ou pode ter a codificação incorreta ao converter de epub para texto sem formatação, por exemplo. Usando a interface do aplicativo, as configurações padrão parecem funcionar bem.
Lacostenycoder #
6

Uma alternativa é epub2txt de Kevin Boone , disponível no Github .

epub2html é um utilitário de linha de comando simples para extrair texto de documentos EPUB e, opcionalmente, recolocá-lo para ajustar uma exibição de texto de um número específico de colunas. Está escrito inteiramente no padrão ANSI C.

Exemplo de uso:

epub2txt input.epub > output.txt
xebeche
fonte
2

O MuPDF pode converter de epubpara htmle txt. Para instalá-lo:

sudo apt install mupdf mupdf-tools

Para usá-lo:

mutool convert -o somefilename.txt somefilename.epub 

Ele assume a txtsaída da -oopção.

Consulte a mutool convert documentação para obter mais informações.

pierrely
fonte