Perguntas com a marcação «utf-8»

245
Decodificação de URL UTF-8 em Python

Passei muito tempo, tanto quanto eu sou novato em Python. Como eu poderia decodificar esse URL: example.com?title=%D0%BF%D1%80%D0%B0%D0%B2%D0%BE%D0%B2%D0%B0%D1%8F+%D0%B7%D0%B0%D1%89%D0%B8%D1%82%D0%B0 para este em python 2.7: example.com?title==правовая+защита

243
Byte UTF-8 [] para String

Vamos supor que eu apenas usei a BufferedInputStreampara ler os bytes de um arquivo de texto codificado em UTF-8 em uma matriz de bytes. Eu sei que posso usar a rotina a seguir para converter os bytes em uma cadeia de caracteres, mas existe uma maneira mais eficiente / inteligente de fazer isso do...

204
Grava no arquivo UTF-8 em Python

Estou realmente confuso com o codecs.open function. Quando eu faço: file = codecs.open("temp", "w", "utf-8") file.write(codecs.BOM_UTF8) file.close() Isso me dá o erro UnicodeDecodeError: o codec 'ascii' não pode decodificar o byte 0xef na posição 0: ordinal fora do intervalo (128) Se eu...

192
Como converter uma string para utf-8 em Python

Eu tenho um navegador que envia caracteres utf-8 para o meu servidor Python, mas quando eu o recupero da string de consulta, a codificação que o Python retorna é ASCII. Como posso converter a string simples para utf-8? OBSERVAÇÃO: A string transmitida da Web já está codificada em UTF-8, só quero...

190
Codificar String para UTF-8

Eu tenho uma String com um caractere "ñ" e tenho alguns problemas com ela. Eu preciso codificar essa String para codificação UTF-8. Eu tentei dessa maneira, mas não funciona: byte ptext[] = myString.getBytes(); String value = new String(ptext, "UTF-8"); Como codifico essa string para...

180
Como escrever um arquivo UTF-8 com Java?

Eu tenho algum código atual e o problema é a criação de um arquivo de página de código 1252, quero forçá-lo a criar um arquivo UTF-8 Alguém pode me ajudar com este código, como eu digo que atualmente funciona ... mas eu preciso forçar a salvar em utf .. posso passar um parâmetro ou algo assim? é...

171
Como determino a codificação de arquivo no OS X?

Estou tentando inserir alguns caracteres UTF-8 em um arquivo LaTeX no TextMate (que diz que sua codificação padrão é UTF-8), mas o LaTeX parece não entendê-los. A execução cat my_file.texmostra os caracteres corretamente no Terminal. A execução ls -almostra algo que eu nunca vi antes: um "@" na...

152
u '\ ufeff' na string Python

Eu recebo um erro com o seguinte padrão: UnicodeEncodeError: 'ascii' codec can't encode character u'\ufeff' in position 155: ordinal not in range(128) Não tenho certeza do que u'\ufeff'é, ele aparece quando estou raspando a web. Como posso remediar a situação? O .replace()método string não...