Perguntas com a marcação «utf-8»

UTF-8 é uma codificação de caracteres que descreve cada ponto de código Unicode usando uma sequência de bytes de um a quatro bytes. É compatível com versões anteriores do ASCII, enquanto ainda suporta a representação de todos os pontos de código Unicode.

1191
UTF-8 todo o caminho

Estou configurando um novo servidor e quero dar suporte total ao UTF-8 no meu aplicativo da web. Eu tentei isso no passado em servidores existentes e sempre parece ter que voltar à ISO-8859-1. Onde exatamente eu preciso definir a codificação / conjuntos de caracteres? Estou ciente de que preciso...

557
Por que o Perl moderno evita o UTF-8 por padrão?

Eu me pergunto por que a maioria das soluções modernas criadas usando o Perl não habilita o UTF-8 por padrão. Entendo que existem muitos problemas herdados para scripts Perl principais, nos quais isso pode quebrar as coisas. Mas, do meu ponto de vista, na 21 st século, novos e grandes projetos (ou...

487
UTF-8, UTF-16 e UTF-32

Quais são as diferenças entre UTF-8, UTF-16 e UTF-32? Entendo que todos eles armazenam Unicode e que cada um usa um número diferente de bytes para representar um caractere. Existe uma vantagem em escolher um sobre o

395
O que é Unicode, UTF-8, UTF-16?

Qual é a base do Unicode e por que a necessidade de UTF-8 ou UTF-16? Eu pesquisei isso no Google e procurei aqui também, mas não está claro para mim. No VSS, ao fazer uma comparação de arquivos, às vezes há uma mensagem dizendo que os dois arquivos têm UTFs diferentes. Por que isso seria o...

304
Detecte a codificação e crie tudo UTF-8

Estou lendo muitos textos de vários feeds RSS e inserindo-os no meu banco de dados. Obviamente, existem várias codificações de caracteres diferentes usadas nos feeds, por exemplo, UTF-8 e ISO 8859-1. Infelizmente, às vezes há problemas com a codificação dos textos. Exemplo: O "ß" em "Fußball"...

279
UTF-8: Geral? Bin? Unicode?

Estou tentando descobrir qual agrupamento devo usar para vários tipos de dados. 100% do conteúdo que armazenarei é enviado pelo usuário. Meu entendimento é que eu deveria usar o IC geral UTF-8 (sem distinção entre maiúsculas e minúsculas) em vez do binário UTF-8. No entanto, não consigo encontrar...