Eu gostaria de poder correr
unicode-names 'abç'
e veja os nomes de caracteres Unicode correspondentes:
LATIN SMALL LETTER A
LATIN SMALL LETTER B
LATIN SMALL LETTER C WITH CEDILLA
Imprimir uma sequência como uma série de nomes de glifos Unicode seria útil em vários casos:
- Distinga caracteres facilmente confusos, como "i" e "í".
- Explique o que realmente contém uma sequência literal (por exemplo, caracteres de largura zero não imprimíveis ou não atribuídos).
command-line
unicode
l0b0
fonte
fonte
echo -n …— | uniname -bcegpu
Não conheço uma boa maneira de verificar isso
bash
, mas o Python possui um banco de dados Unicode interno que você pode usar como em um script como este:Você pode usar este script como este (assumindo que você o chamou
unicode-names
):O banco de dados gera uma
ValueError
exceção para qualquer caractere que não conheça, portanto, imprimimos seus pontos de código em decimal (geralmente são caracteres imprimíveis).Advertência: o script assume que seu terminal está codificado em UTF-8. Caso contrário, você deve alterar o argumento do
decode()
método. O Python suporta uma seleção muito ampla de codificações, a sua definitivamente estará lá.fonte
sys.getdefaultencoding()
.