Perguntas com a marcação «unicode»

152
u '\ ufeff' na string Python

Eu recebo um erro com o seguinte padrão: UnicodeEncodeError: 'ascii' codec can't encode character u'\ufeff' in position 155: ordinal not in range(128) Não tenho certeza do que u'\ufeff'é, ele aparece quando estou raspando a web. Como posso remediar a situação? O .replace()método string não...

146
Python, Unicode e o console do Windows

Como instalar arquivos no Stack Overflow em um arquivo : Como criar um arquivo Python no Windows? Quando tento imprimir uma seqüência de caracteres Unicode em um console do Windows, recebo um UnicodeEncodeError: 'charmap' codec can't encode character ....erro. Suponho que...

142
A string Python é impressa como [u'String ']

Para obter mais informações sobre Stack Overflow no Stack Overflow em Inglês : para obter mais informações sobre utf-8, consulte a tabela a seguir. Certamente será fácil, mas está realmente me incomodando. Eu tenho um script que lê em uma página da web e usa Beautiful...

137
Diferença entre UTF-8 e UTF-16?

Diferença entre UTF-8 e UTF-16? Por que precisamos disso? MessageDigest md = MessageDigest.getInstance("SHA-256"); String text = "This is some text"; md.update(text.getBytes("UTF-8")); // Change this to "UTF-16" if needed byte[] digest =

135
Caracteres Unicode em URLs

Em 2010, você serviria URLs contendo caracteres UTF-8 em um grande portal da web? Os caracteres Unicode são proibidos de acordo com o RFC nos URLs (veja aqui ). Eles teriam que ser codificados em porcentagem para serem compatíveis com os padrões. Meu ponto principal, no entanto, é veicular os...

134
Inserir caractere Unicode no JavaScript

Preciso inserir um Omega (Ω) na minha página html. Estou usando seu código de escape HTML para fazer isso, para que eu possa escrever Ωe obter Ω. Tudo bem quando coloco em um elemento HTML; no entanto, quando tento colocá-lo no meu JS, por exemplo var Omega = Ω, ele analisa esse...

130
Problema de codificação do Java FileReader

Tentei usar o java.io.FileReader para ler alguns arquivos de texto e convertê-los em uma string, mas descobri que o resultado está codificado incorretamente e não é legível. Aqui está o meu ambiente: Windows 2003, codificação do sistema operacional: CP1252 Java 5.0 Meus arquivos são...

129
O que é o UTF-8 normalizado?

O projeto ICU (que agora também possui uma biblioteca PHP ) contém as classes necessárias para ajudar a normalizar cadeias UTF-8 para facilitar a comparação de valores durante a pesquisa. No entanto, estou tentando descobrir o que isso significa para aplicativos. Por exemplo, em quais casos eu...

127
O que é o código de caractere HTML 8203?

O que o código de caractere (HTML) &#8203;? Eu o encontrei em um dos meus scripts jQuery e me perguntei o que era .. Obrigado. Editar: Aqui está o script em que estava (foi adicionado ao final, encontrado no Firebug) <script src="http://code.jquery.com/jquery-latest.js"...