Como salvar documentos do Word como HTML para serem visualizados no Firefox

10

Estou precisando salvar um documento do Word como HTML. Possui algumas imagens de plano de fundo, outras imagens, textos, ... Abre corretamente no Internet Explorer, mas como posso salvar uma palavra doc como HTML para que o Firefox e outros navegadores atuais a processem corretamente?

Todas as imagens estão ausentes no documento. Examinei o documento html gerado, mas os caminhos para as imagens parecem estar corretos.

Qualquer ideia?

Coisas como "Não salvar documentos como html" não serão úteis aqui.

Editar: para deixar claro, o normal "Salvar como HTML" não é necessário, o resultado é quebrado em qualquer navegador que não seja o Internet Explorer.

Edição 2: O que estou usando é o Word 2010 e o Firefox 4. Também tentei renderizá-lo na versão mais recente do Chrome, que também falhou. Usei diferentes configurações de compatibilidade para salvar como html, isso não ajudou

private_meta
fonte
2
Você pode fornecer uma captura de tela (ou captura de tela parcial) nos mostrando de que maneira falha?
Majenko 9/04
Não desse documento específico, descreverei; se não o suficiente, criarei algo novo. Tenho uma palavra doc com imagem de plano de fundo em toda a página, tenho outras imagens em vários locais e formatei o texto na página. O HTML resultante é um plano de fundo branco, sem imagens, apenas o texto formatado.
abr_
2
usar a palavra html é uma ideia horrível em geral. Estou curioso de como fazer o upload para o Google Docs e usando sua função de saída html, ou OOo usign / libreoffice para exportação iria trabalhar tho
Journeyman Geek
Não posso ajudar sobre o próprio documento do Word. O Google Docs mostra a imagem, mas destrói o formato inteiro ainda mais do que o Word Export. Eu não tentei OOo ainda, não o tem instalado agora
private_meta
Apenas testado no Open Office (3.2. *). Parece ok em Abrir Office Writer, mas quebra quando visualizados em um navegador
private_meta

Respostas:

6

Ao usar o Word Salvar como página da Web (htm html), imediatamente antes de clicar em Salvar, observe o menu suspenso "Ferramentas" à esquerda do botão Salvar. Vá para este menu suspenso, clique em Opções da Web. Na caixa de opções que aparece, desmarque a caixa "Confie na VML ..." Isso funcionou muito bem para mim. Boa sorte.

John Johnson
fonte
Qual versão do Word você tinha? Eu olhei para 2003 e todos parecem ter "Confie na VML ..." desmarcada por padrão.
Stephen
4

Eu tenho um hack que envolve a modificação direta do código HTML. Estou usando o MS-Office 2007 e o FF 10.0.4.

O truque é remover a <v:imagedata src = ...>amostra que o Word gera quando você salva um arquivo em HTML e substitui-o pelo padrão <img src = ...>. O primeiro (imagedata ...) só pode ser renderizado pelo IE, enquanto o último é padrão e pode ser manipulado por todos os navegadores.

Exemplo:

Remova o seguinte -

<span style='mso-no-proof:yes'><v:shape id="Picture_x0020_2" o:spid="_x0000_i1026"
 type="#_x0000_t75" style='width:282.75pt;height:207.75pt;visibility:visible;
 mso-wrap-style:square'>
 <v:imagedata src="dcsl_overview_files/image006.png" o:title=""/>
</v:shape> </span>

Com:

<img src="dcsl_overview_files/image006.png" alt="overview figure">
Saurabh Bagchi
fonte
2

Eu encontrei o mesmo problema. Parece que, por alguns motivos, o Word exporta HTML comum para alguns documentos.

Normalmente, o Word exporta gráficos com dois códigos: um especial para renderização no IE e HTML comum para os outros navegadores.

O código se parece abaixo (removi muito do código para facilitar a leitura)

<p ...><span ...><!--[if gte vml 1]><v:shapetype...>
 [code for IE]
</v:shapetype>
<v:shape id="Picture_x0020_2" ... alt="...png" ...>
 <v:imagedata src="...docx_files/image001.png".../>
</v:shape><![endif]-->
<![if !vml]><img width=169 height=119
src="..."... ><![endif]></span></p>

Observe o condicional?

<!--[if gte vml 1]> IE Code <![endif]--> <![if !vml]> Non IE HTML <![endif]>

Para alguns documentos, vejo que o Word deixa de ser bilíngue e exporta apenas a parte do IE.

Ainda não tenho a solução para esses casos. Ainda investigando

Thierry Thelliez
fonte
2

Tente salvar como página da Web, filtro para remover as tags específicas do Office. No Word 2007, isso limpa todas as tags feias do escritório e gera um arquivo html limpo.

Pok
fonte
1

Eu tentei apenas um documento simples, renderizado no Chrome, então YMMV - mas você tentou salvar como Web Page, Filtered(disponível na minha cópia do Word 2010, e suponho em todas as versões).

Isso deve eliminar muitas das piores coisas, mas ainda assim, a saída pode nem sempre ser perfeita, HTML neutro no navegador.

CJM
fonte
0

Na barra de ferramentas de acesso rápido, há uma opção chamada visualização da página da Web . Eu acho que isso deve funcionar (eu testei quando tinha o Word 2007 e não sei se ele está disponível em 2010 e 2013).

UltraDEVV
fonte
-2

Como aparentemente nada mais funcionou, tornou-se uma dessas malditas soluções "IE only".

Edit: Apenas para esclarecer: eu mesmo respondi isso porque não recebi nenhuma outra resposta por 8 meses. Como não estou mais precisando da solução no momento e há muito tempo, não vou aceitar outra solução.

private_meta
fonte
Outras pessoas podem encontrar o mesmo problema, inclusive eu. Portanto, é uma pergunta muito útil. Por favor, seja gentil o suficiente e marque a resposta que você acha que resolve o problema. Pessoalmente, acho que a @Saurabh Bagchi responde uma boa solução.
Alin C