Perguntas com a marcação «unicode»

235
Como posso alterar a codificação de um arquivo com o vim?

Estou acostumado a usar o vim para modificar as terminações de linha de um arquivo: $ file file file: ASCII text, with CRLF line terminators $ vim file :set ff=mac :wq $ file file file: ASCII text, with CR line terminators É possível usar um processo semelhante para alterar a codificação unicode...

216
Regexes JavaScript + Unicode

Como posso usar expressões regulares compatíveis com Unicode em JavaScript? Por exemplo, deve haver algo parecido \wque possa corresponder a qualquer ponto de código na categoria Cartas ou Marcas (não apenas as ASCII), e esperamos ter filtros como [[P *]] para pontuação,

213
Python __str__ versus __unicode__

Existe uma convenção python para quando você deve implementar __str__()versus __unicode__(). Vi classes substituir com __unicode__()mais frequência do que __str__()mas não parece ser consistente. Existem regras específicas quando é melhor implementar uma versus a outra? É necessário / boa prática...

211
Como verificar se uma string em Python está em ASCII?

Quero verificar se uma string está em ASCII ou não. Estou ciente ord(), no entanto, quando tento ord('é'), tenho TypeError: ord() expected a character, but string of length 2 found. Eu entendi que isso é causado pela maneira como construí o Python (como explicado na ord()documentação de ). Existe...

204
Como converter wstring em string?

A questão é como converter wstring em string? Eu tenho o próximo exemplo: #include <string> #include <iostream> int main() { std::wstring ws = L"Hello"; std::string s( ws.begin(), ws.end() ); //std::cout <<"std::string = "<<s<<std::endl;

192
Como converter uma string para utf-8 em Python

Eu tenho um navegador que envia caracteres utf-8 para o meu servidor Python, mas quando eu o recupero da string de consulta, a codificação que o Python retorna é ASCII. Como posso converter a string simples para utf-8? OBSERVAÇÃO: A string transmitida da Web já está codificada em UTF-8, só quero...

169
(grep) Regex para corresponder a caracteres não ASCII?

No Linux, eu tenho um diretório com muitos arquivos. Alguns deles têm caracteres não ASCII, mas todos são UTF-8 válidos . Um programa possui um bug que o impede de trabalhar com nomes de arquivos não ASCII, e eu tenho que descobrir quantos são afetados. Eu faria isso com finde depois faria um grep...

164
Caractere Unicode na string PHP

Esta pergunta parece embaraçosamente simples, mas não consegui encontrar uma resposta. Qual é o PHP equivalente à seguinte linha de código C #? string str = "\u1000"; Este exemplo cria uma sequência com um único caractere Unicode cujo "valor numérico Unicode" é 1000 em hexadecimal (4096 em...