Converta documentos do Microsoft Word (.doc / x) em arquivos HTML

8

Alguém conhece uma boa aplicação para fazê-la de forma rápida e eficiente?

Comprei o Word Cleaner, mas os resultados são apenas suficientes e preciso revisar todos os arquivos html gerados para limpar toneladas de tags injetadas inúteis, como

<strong>H</strong><strong>ell</strong><strong>o </strong><em>Wor</em><em>ld</em>

A maioria dos artigos exibidos em um site que eu gerencio é baseada em documentos escritos no MS Word por pessoas que têm pouca idéia do que são margens ou listas ordenadas / não ordenadas, notas de rodapé / final etc. e não posso fazê-las usar outra coisa.

Alguém tem uma dica para me ajudar a lidar com essas páginas com mais eficiência do que revisá-las para corrigir e aplicar meu estilo CSS?

Nota: Apenas para o registro, usar "Salvar como HTML DOC" no Word é muito pior do que o limpador de palavras

danie7LT
fonte

Respostas:

4

É isso que eu e a equipe aqui no trabalho usamos ao trazer o conteúdo do MS Word para HTML:

http://word2cleanhtml.com/

Verificamos todas as caixas, colamos o código e convertemos.

Espero que ajude.

KruegerDesigns
fonte
O word2clean é realmente um ótimo conversor, muito limpo e exatamente o que precisamos. Obrigado !
danie7LT
Muito bom, feliz por poder ajudar!
KruegerDesigns
3

Eu acho que a melhor solução para isso seria usar um editor WYSIWYG. O TinyMCE, por exemplo, é bom - embora eu suspeite que você precise de um independente. O uso seria semelhante a qualquer programa semelhante a palavras, mas a saída seria HTML direta. Além disso, você já tentou outros programas semelhantes a palavras, como o OpenOffice ou o LibreOffice? O HTML não é ótimo, pois possui muitos estilos em linha, mas, a partir de um teste rápido, parece que não há o problema de muitas tags desnecessárias.

milo5b
fonte
tinyMCE é ótimo e é o que eu estou tentando fazê-los usar. Eu já adicionei mais opções de formatação para ajudá-los a obter o que desejam alcançar, mas é a própria migração da palavra para outra coisa que estou tentando alcançar e, enquanto isso, continuo recebendo arquivos .doc. Mas, de qualquer forma, obrigado, você diz que o openOffice fornece bons resultados ao converter documentos em HTML, bem, vou tentar.
Danie7LT 02/09/12