Perguntas com a marcação «unicode»

O Unicode pretende ser um conjunto de caracteres universal para descrever todos os caracteres necessários para o texto escrito, incorporando todos os sistemas de escrita, símbolos técnicos e pontuação.

432
O UTF-16 deve ser considerado prejudicial?

Vou perguntar o que provavelmente é uma pergunta bastante controversa: "Uma das codificações mais populares, UTF-16, deve ser considerada prejudicial?" Por que faço essa pergunta? Quantos programadores estão cientes do fato de que o UTF-16 é realmente uma codificação de comprimento variável? Com...

41
Por que existem várias codificações Unicode?

Eu pensei que o Unicode foi projetado para contornar todo o problema de ter muitas codificações diferentes devido a um pequeno espaço de endereço (8 bits) na maioria das tentativas anteriores (ASCII, etc.). Por que, então, existem tantas codificações Unicode? Até várias versões do (essencialmente)...

35
Licença Unicode

Os Termos de Uso Unicode afirmam que qualquer software que use seus arquivos de dados (ou uma modificação deles) deve conter as referências de licença Unicode. Parece-me que a maioria das bibliotecas Unicode possui funções para verificar se um caractere é um dígito, uma letra, um símbolo etc., e...

19
Por que existem tantos espaços e quebras de linha no Unicode?

Unicode tem talvez 50 espaços \ u0009 \ u000A- \ u000D \ u0020 \ u0085 \ u00A0 \ u1680 \ u180E \ u2000- \ u200A \ u2028 \ u2029 \ u202F \ u205F \ u3000] [\ u0009 \ u000A- \ u000D \ u0020 \ u0085 \ u0085 \ u00A \ u180E \ u2000- \ u200A \ u2028 \ u2029 \ u202F \ u205F \ u3000 e 6 quebras de...

14
Um valor de sentinela Unicode que posso usar?

Estou projetando um formato de arquivo e quero fazê-lo corretamente. Por ser um formato binário, o primeiro byte (ou bytes) do arquivo não deve formar caracteres textuais válidos (como no cabeçalho do arquivo PNG 1 ). Isso permite que as ferramentas que não reconhecem o formato ainda vejam que não...

12
Implementação eficiente de Trie para strings unicode

Eu estava procurando por uma implementação eficiente de String trie. Principalmente eu encontrei código como este: Implementação referencial em Java (por wikipedia) Não gosto dessas implementações por dois motivos: Eles suportam apenas 256 caracteres ASCII. Eu preciso cobrir coisas como...