Perguntas com a marcação «utf-8»

143
Alterando a codificação padrão do Python?

Eu tenho muitos problemas de "não é possível codificar" e "não é possível decodificar" com o Python quando executo meus aplicativos no console. Mas no Eclipse PyDev IDE, a codificação de caracteres padrão é definida como UTF-8 , e eu estou bem. Eu procurei ao redor para definir a codificação...

137
Diferença entre UTF-8 e UTF-16?

Diferença entre UTF-8 e UTF-16? Por que precisamos disso? MessageDigest md = MessageDigest.getInstance("SHA-256"); String text = "This is some text"; md.update(text.getBytes("UTF-8")); // Change this to "UTF-16" if needed byte[] digest =

135
Caracteres Unicode em URLs

Em 2010, você serviria URLs contendo caracteres UTF-8 em um grande portal da web? Os caracteres Unicode são proibidos de acordo com o RFC nos URLs (veja aqui ). Eles teriam que ser codificados em porcentagem para serem compatíveis com os padrões. Meu ponto principal, no entanto, é veicular os...

122
Por que declarar unicode por string em python?

Ainda estou aprendendo python e tenho uma dúvida: No python 2.6.x, normalmente declaro codificação no cabeçalho do arquivo como este (como no PEP 0263 ) # -*- coding: utf-8 -*- Depois disso, minhas cordas são escritas como de costume: a = "A normal string without declared Unicode" Mas sempre...

112
Serializando um objeto como XML UTF-8 em .NET

O descarte adequado de objetos foi removido por questão de brevidade, mas estou chocado se esta é a maneira mais simples de codificar um objeto como UTF-8 na memória. Tem que haver uma maneira mais fácil, não é? var serializer = new XmlSerializer(typeof(SomeSerializableObject)); var memoryStream...

110
SET NAMES utf8 no MySQL?

Costumo ver algo semelhante a isso abaixo em scripts PHP usando MySQL query("SET NAMES utf8"); Eu nunca tive que fazer isso para nenhum projeto ainda, então tenho algumas perguntas básicas sobre isso. Isso é algo que é feito apenas com o PDO? Se não for uma coisa específica do PDO, qual é o...

110
Como posso gerar UTF-8 do Perl?

Estou tentando escrever um script Perl usando o pragma "utf8" e estou obtendo resultados inesperados. Estou usando o Mac OS X 10.5 (Leopard) e estou editando com o TextMate. Todas as minhas configurações para meu editor e sistema operacional são padronizadas para gravar arquivos no formato...

109
ruby 1.9: sequência de bytes inválida em UTF-8

Estou escrevendo um rastreador em Ruby (1.9) que consome muito HTML de muitos sites aleatórios. Ao tentar extrair links, decidi usar apenas .scan(/href="(.*?)"/i)nokogiri / hpricot (maior aceleração). O problema é que agora recebo muitos invalid byte sequence in UTF-8erros " ". Pelo que entendi,...