Alguém conhece uma boa aplicação para fazê-la de forma rápida e eficiente?
Comprei o Word Cleaner, mas os resultados são apenas suficientes e preciso revisar todos os arquivos html gerados para limpar toneladas de tags injetadas inúteis, como
<strong>H</strong><strong>ell</strong><strong>o </strong><em>Wor</em><em>ld</em>
A maioria dos artigos exibidos em um site que eu gerencio é baseada em documentos escritos no MS Word por pessoas que têm pouca idéia do que são margens ou listas ordenadas / não ordenadas, notas de rodapé / final etc. e não posso fazê-las usar outra coisa.
Alguém tem uma dica para me ajudar a lidar com essas páginas com mais eficiência do que revisá-las para corrigir e aplicar meu estilo CSS?
Nota: Apenas para o registro, usar "Salvar como HTML DOC" no Word é muito pior do que o limpador de palavras
fonte
Eu acho que a melhor solução para isso seria usar um editor WYSIWYG. O TinyMCE, por exemplo, é bom - embora eu suspeite que você precise de um independente. O uso seria semelhante a qualquer programa semelhante a palavras, mas a saída seria HTML direta. Além disso, você já tentou outros programas semelhantes a palavras, como o OpenOffice ou o LibreOffice? O HTML não é ótimo, pois possui muitos estilos em linha, mas, a partir de um teste rápido, parece que não há o problema de muitas tags desnecessárias.
fonte