Excel 2010 salvar como página da Web - Deseja caracteres japoneses no arquivo HTML em vez de Unicode

1

Para fins de programação (Objective-C) eu preciso exportar caracteres japoneses como um arquivo HTML do Excel para que eu possa analisar dados em meu projeto. Estou usando o Excel 2010. Por exemplo:

screenshot

Quando abro o arquivo HTML salvo, tudo que vejo é um monte de caracteres Unicode no lugar dos caracteres japoneses reais. Existe uma maneira que eu posso:

  1. Altere as configurações em algum lugar no Excel para garantir que os símbolos / caracteres reais sejam salvos no arquivo HTML em vez de números Unicode
  2. Converta o arquivo HTML salvo para que todos os caracteres Unicode sejam convertidos em símbolos reais

Qualquer ajuda apreciada!

Tim
fonte
Eu gostaria de tentar responder a este. Seria bom se você pudesse fornecer o arquivo real. Nitpick: caracteres Unicode são "caracteres reais". É só que seus personagens "reais" estão em algum conjunto de caracteres não universais.
Isaac Rabinovitch
Certo. Por exemplo, gostaria de ver 飯 em vez de & amp; # 39151 no HTML. Eu sou novo aqui, qual é a maneira mais fácil de obter o arquivo?
Tim
飯 é na verdade um caractere Unicode. & # 39151; (observe o ponto-e-vírgula) é uma entidade de caractere HTML; é usado para inserir o caractere Unicode em uma localidade que não o suporta. / Para compartilhar o arquivo, envie-o para um serviço como o Dropbox e poste o link.
Isaac Rabinovitch

Respostas:

0

Você parece ter o Excel salvando o HTML usando um conjunto de caracteres ocidentais. Como 飯 não está no conjunto de caracteres, ele é traduzido para & amp; # 39151; então o navegador interpreta corretamente. Para desabilitar esta tradução,

  1. Chame o save como diálogo.
  2. Clique em Ferramentas / Opções da Web . A caixa de diálogo Opções da Web é exibida. web options dialog
  3. Na guia Codificação, o Guarde este documento como: O menu suspenso provavelmente está mostrando "Western European (Windows)" ou qualquer conjunto de caracteres ocidentais que você esteja usando. Altere isso para "Unicode (UTF-8)". Você também pode alterá-lo para um conjunto de caracteres japonês, mas o UTF-8 é mais flexível e faz o que você deseja.
  4. Salve a página da web como antes.
Isaac Rabinovitch
fonte