Às vezes, edito texto em inglês que inclui caracteres Unicode. Por alguma razão, no meu PC, o Notepad ++ converte caracteres Unicode em ???, corrompendo o texto e perdendo todos esses dados. Estou procurando uma maneira de editar esse texto, preservando os caracteres Unicode. Estou usando Consolas como minha fonte. Se a fonte não tiver todos esses caracteres, por que devo perder os dados quando copio o texto do Notepad ++ (através da área de transferência do Windows)?
notepad++
text-editing
unicode
Robinicks
fonte
fonte
Respostas:
Se o arquivo estiver realmente codificado em Unicode, o Notepad ++ deverá detectá-lo automaticamente. A fonte Consolas funciona bem para mim. Você pode tentar uma destas duas opções de menu:
Tenho certeza de que o primeiro fará o que você quiser.
fonte
O problema descrito na pergunta acontece quando um documento vazio / novo é definido como "ANSI" e caracteres Unicode são colados nele.
Não há detecção automática quando usado com um documento vazio / novo, pelo menos não na versão do Notepad ++ que eu testei (v5.4.5). "ANSI" é o padrão no Notepad ++ para um novo documento, a menos que definido no menu Configurações → Preferências → guia Novo Documento / Abrir Diretório Salvar .
Solução
A solução é definir a codificação para UTF-8 antes de colar, menu Formato → Codificar em UTF-8 :
Exemplo
Copiei algum texto para um novo documento do Notepad ++, o russo (русский язык, russkiy yazyk) , do Firefox, mostrando o idioma russo da página da Wikipedia .
Se a codificação não for alterada de "ANSI", este é o resultado:
Se a codificação for alterada, este é o resultado:
Como pode ser visto na figura abaixo (a parte cirílica é destacada), o Notepad ++ na verdade converte os caracteres Unicode em ASCII 63 (hexadecimal 3F), pontos de interrogação. É por isso que os caracteres Unicode são perdidos (em "ANSI" mode) quando copiar o texto para fora através da área de transferência (isto é não uma questão da fonte - informação é perdida).
Testado em: Notepad ++ v5.4.5 (UNICODE).
fonte
Há boas e más notícias.
Boas notícias: o Notepad ++ suporta Unicode (pelo menos pelo que posso reunir).
Más notícias: aparentemente, o suporte a Unicode é apenas no Windows XP.
Na verdade, eu não tenho uma máquina Windows na minha frente. Pelo que me lembro, há um menu de codificação no menu Formatar em algum lugar. A codificação para Unicode é, na verdade, mais comumente UTF-8.
Aqui está uma imagem 'bonita' do suporte a Unicode no Notepad ++,
fonte
O Unicode funciona perfeitamente no Windows 7. O único problema que surge é que você precisa digitar novamente os caracteres que foram alterados. Já aconteceu comigo. Estou escrevendo com letras escandinavas para ä -> E4, ö -> F6. É doloroso substituir todos eles, mas vale a pena.
Se você codificar uma página de ANSI -> UTF-8, haverá alguns problemas de caracteres.
Sugiro que você primeiro crie uma nova página em UTF-8 e depois copie / cole suas informações. Não haverá / não deverá haver nenhum problema então.
fonte
Isso é trabalhado para mim:
Alterei a fonte para Courier New no configurador de estilo no meu PC (Windows 7 com conjunto de caracteres inglês / americano e romeno para conjunto não Unicode). Está trabalhando com fontes Courier New & Tahoma + codificação UTF-8.
fonte
No menu superior, selecione a
Encoding
opção escolherEncode in UTF-8
ouEncode in UTF-8 Without BOM
então você pode editar o texto na codificação Unicode.fonte