Como funciona a “codificação de largura variável” UTF-8?
O padrão Unicode tem pontos de código suficientes para que você precise de 4 bytes para armazenar todos eles. É isso que a codificação UTF-32 faz. Ainda assim, a codificação UTF-8 de alguma forma os espreme em espaços muito menores usando algo chamado "codificação de largura variável". Na...