Experimente o utilitário unicode :
$ unicode ‽
U+203D INTERROBANG
UTF-8: e2 80 bd UTF-16BE: 203d Decimal: ‽
‽
Category: Po (Punctuation, Other)
Bidi: ON (Other Neutrals)
Ou o uconv
utilitário do pacote ICU :
$ printf %s ‽ | uconv -x any-name
\N{INTERROBANG}
Você também pode obter informações através do recode
utilitário:
$ printf %s ‽ | recode ..dump
UCS2 Mne Description
203D point exclarrogatif
Ou com Perl:
$ printf %s ‽ | perl -CLS -Mcharnames=:full -lne 'print charnames::viacode(ord) for /./g'
INTERROBANG
Observe que eles fornecem informações sobre os caracteres que compõem esse glifo, não sobre o glifo como um todo. Por exemplo, para é
(e com combinação de sotaque agudo):
$ printf é | uconv -x any-name
\N{LATIN SMALL LETTER E}\N{COMBINING ACUTE ACCENT}
Diferente do caractere autônomo é:
$ printf é | uconv -x any-name
\N{LATIN SMALL LETTER E WITH ACUTE}
Você pode pedir uconv
para recombinar aqueles (para aqueles que têm um formulário combinado):
$ printf 'e\u0301b\u0301' | uconv -x '::nfc;::name;'
\N{LATIN SMALL LETTER E WITH ACUTE}\N{LATIN SMALL LETTER B}\N{COMBINING ACUTE ACCENT}
(é uma forma combinada, mas não b).
unicode
? Parece que não o tenho instalado (e não consigo encontrá-lo nos repositórios do Arch Linux). Além disso, o que diabos éexclarrogatif
? [EDIT: Eu entendo isso, também aqui, embora o meu sistema não é francês.]exclamatif
einterrogatif
.recode
foi escrito por um cara franco-canadense no início dos anos 80.unicode
pacote no Debian, nenhuma idéia sobre empacotamento no Arch.%s
é como um espaço reservado, chamado especificador de formato (ou especificador de conversão). printf irá substituí-lo pelos argumentos seguintes, tratando-o como uma string (em oposição a um número, por exemplo) (geralmente como você esperaria com aprintf()
função de C ). Veja os documentos ( pubs.opengroup.org/onlinepubs/9699919799//basedefs/… ).A melhor maneira que eu sei é através do Perl
uniprops
. Ele vem com oUnicode::Tussle
módulo do Perl . Você pode instalá-lo comVocê pode executá-lo em qualquer glifo que deseja testar:
fonte
uniprops
também usa charnames :: viacode internamente.uniprops
é muito, muito mais fácil de digitar do que chamar explicitamente o módulo. Ele também fornece mais informações do que apenas o nome.Você pode usar a função viacode Perl no módulo charnames :
charnames foi lançado pela primeira vez com o perl v5.6.0
Com o Perl 6 , a produção estará pronta neste dia de Natal, vale a pena mencionar aqui, pois quando ele tem o melhor suporte para caracteres Unicode que eu já vi. Você só precisa chamar método / rotina não nomeado :
é
(e combinando sotaque agudo) eé
caráter autônomo :(
.uniname
é a abreviação de$_.uniname
)fonte
Você pode usar
unicode
, o que também gera mais informações além do nome:fonte
unicode
? Parece que não o tenho instalado (e não consigo encontrá-lo nos repositórios do Arch Linux).unicode
pacote. Você deve conseguir baixá-lo do repositório Debian .Crie um script bash com isso:
Nomeie-o como desejar, por exemplo,
namechar
e conceda permissões de execução.Agora, você pode ligar por exemplo:
e o resultado será:
fonte
🐄
e produz resultados repetidos para€
. O último pode ser corrigido através da tubulação| sort -u
.Compose
chave.