O que é esse caractere Unicode na minha área de transferência?

53

Existe uma maneira rápida e fácil de encontrar o ponto de código Unicode para qualquer caractere? Por exemplo, vejo um personagem engraçado em uma página da web, arquivo PDF ou outro documento.

O que faço atualmente é copiar o personagem para a área de transferência, salvá-lo em um arquivo e ver o arquivo com um visualizador hexadecimal. Como alternativa, posso abrir o Microsoft Word, colar e pressionar Alt + X. Ambos os métodos são um pouco complicados. Existe uma maneira mais fácil?

Eu uso o Notepad ++, portanto, se houver alguma maneira de fazer isso com o Notepad ++, seria uma resposta adequada (é menos complicado do que ter que abrir o Word). Ou talvez haja uma maneira de fazer isso com um pequeno aplicativo especializado?

DodgyCodeException
fonte
5
ltg.ed.ac.uk/~richard/utf-8.html Boa ferramenta, vale um favorito!
tkausl
Como a resposta aceita pode ser aceita? Ele não menciona Unicode e não funciona bem para Unicode. Como exatamente ele resolveu sua pergunta? Tente 😍 e veja que não vai funcionar. Nem sequer mostra o personagem.
Thomas Weller
@ThomasWeller, você faz uma boa observação e eu mudei minha resposta aceita. Parece que o Notepad ++ pode lidar apenas com caracteres de 16 bits e não entende pontos de código maiores que 0xFFFF, que é o seu caractere de exemplo.
DodgyCodeException
@ user202729 Não tem 2 anos. Ele diz "perguntou 15 de dezembro", que significa "15 de dezembro deste ano", não "dezembro de 2015". Portanto, tem apenas 3 dias. Não entendo por que essa pergunta continua sendo votada. Era apenas uma pergunta simples sobre algo simples que eu estava pensando.
DodgyCodeException
11
Uma ferramenta on-line é que caracteres Unicode é este , babelstone.co.uk/Unicode/whatisit.html
DrMoishe Pippik

Respostas:

32

Eu trabalho muito com caracteres Unicode, então escrevi um pequeno aplicativo do Windows especificamente para isso:

Informador de caracteres Unicode ( documentação )

Além disso, meu editor de texto, Rejbrand Text Editor , possui amplo suporte a caracteres Unicode.

Andreas Rejbrand
fonte
11
Obrigado! Isso é bastante útil. Posso sugerir que F1 seja uma função de ajuda, que abriria uma pequena janela contendo um link para sua página da documentação.
DodgyCodeException
6
Por curiosidade, em que trabalho você está trabalhando?
Ooker
No bash, eu uso uniprops, o que parece gerar informações semelhantes.
TRiG
Para sua informação, baixei o seu informador de caracteres unicode e meu software antivírus estava com muito medo. Não me deixaria usá-lo, a menos que eu o adicionasse à lista branca, por isso não vou usá-lo. Você tem uma cópia livre de vírus? haha jk Eu sei que provavelmente não tem realmente um vírus nele - mas ainda assim, por que meu AV detesta tanto? Aliás, é o Symantec Endpoint Protection.
rory.ap
@ rory.ap: Eu garanto que está completamente livre de vírus. Infelizmente, problemas falsos positivos são comuns (talvez especialmente para aplicativos escritos em Delphi). Isso é algo que eu tenho muita consciência, e algo que realmente me deixa triste. Hoje é difícil ser um desenvolvedor de software Win32 de tempo livre. Eu só gostaria que as pessoas parassem de criar malware tão sério que os desenvolvedores de passatempos não fossem afetados por falsos positivos ... Talvez a assinatura de código melhore a situação, mas isso não é gratuito, e todo o software que produzo doo gratuitamente. :(
Andreas Rejbrand
34

O Notepad ++ possui um plug-in pré-instalado chamado Converter, que tem a opção de converter ASCII para HEX e vice-versa. Essa ferramenta é bastante útil para converter arquivos de dados no formato HEX que devem ser convertidos em ASCII para leitura:

insira a descrição da imagem aqui

É assim que funciona:

insira a descrição da imagem aqui

cara
fonte
2
Obrigado! A propósito, qual software você usa para criar um gif animado como esse?
DodgyCodeException
44
Ha ha! Acabei de notar a palavra "octadecimal" nessa caixa de diálogo. Isso significa base 18. O desenvolvedor significa octal, é claro (base 8).
DodgyCodeException
5
@DodgyCodeException Eu acho que o LICEcap
user11153
3
@DodgyCodeException screentogif.com é bom para gravar gifs animados.
David
5
Quando colo 😍 lá, diz D83D. Portanto, é apenas metade da verdade e NÃO funciona bem com caracteres Unicode.
Thomas Weller
17

Quando me deparo com esse problema, uma pesquisa rápida no Google geralmente fornece uma resposta rápida. Por exemplo, quando eu pesquiso "😍 unicode" no Google, recebo um resultado como este: Pesquisa no Google pelo emoji "rosto sorridente com olhos em forma de coração"

Eu gosto desse método porque:

  • Funciona em qualquer computador com internet
  • Você não precisa instalar nada
  • As teclas pressionadas ( Ctrl+ C& Ctrl+ T& Ctrl+ V& Enter) são ações de memória muscular para mim e provavelmente para a maioria dos outros desenvolvedores / datilógrafos.
Eric Seastrand
fonte
9

Existe um site bacana chamado Unicode Character Inspector (criado por Tim Whitlock) que faz exatamente isso. Acho muito mais conveniente do que um editor de texto ou programa de desktop.

Baptiste Candellier
fonte
3
Para tornar isso ainda mais rápido, você pode configurar um atalho do mecanismo de pesquisa no seu navegador e levá-lo diretamente para a página de informações sobre o caractere inserido. Isso funciona porque você pode especificar o caractere como um parâmetro da string de consulta https://apps.timwhitlock.info/unicode/inspect?s={some unicode character here}.
Eric Seastrand
9

Em um sistema semelhante ao Unix *:

unicode -s "$(xsel -ob)"

Você pode usar o alias ou criar um script para executá-lo.

A saída é assim:

U+2672 UNIVERSAL RECYCLING SYMBOL
UTF-8: e2 99 b2 UTF-16BE: 2672 Decimal: ♲ Octal: \023162
♲ (♲)
Uppercase: 2672
Category: So (Symbol, Other)
Bidi: ON (Other Neutrals)

* Parece que o pôster original provavelmente está usando o Windows, mas (a) isso não está especificado e (b) esta solução pode ajudar outras pessoas.

wchargin
fonte
Obrigado! Embora eu esteja usando o Windows principalmente, também uso o Linux e, em qualquer caso, provavelmente posso fazer o download de uma porta do Windows desse utilitário (como o GnuWin).
DodgyCodeException
6

Você pode usar o PowerShell!

[char]::ConvertToUtf32((gcb), 0)

Isso imprime o primeiro ponto de código Unicode do texto na área de transferência.

Se você não precisar se preocupar com caracteres fora do Plano Multilíngue Básico (que seria representado nas seqüências .NET como um substituto alto e baixo), use-o:

[int](gcb)[0]

Se preferir em hexadecimal, você pode usar um especificador de formato :

'0x{0:x}' -f [char]::ConvertToUtf32((gcb), 0)
Ben N
fonte
5

Uma observação para qualquer usuário do Emacs: você pode digitar C-u C-x =e ele fornecerá várias informações sobre o caractere sob o cursor, incluindo o ponto de código Unicode, o nome no banco de dados Unicode e as categorias, etc.

             position: 146 of 147 (99%), column: 0
            character: ♲ (displayed as ♲) (codepoint 9842, #o23162, #x2672)
    preferred charset: unicode (Unicode (ISO10646))
code point in charset: 0x2672
               script: symbol
               syntax: w    which means: word
             category: .:Base
             to input: type "C-x 8 RET 2672" or "C-x 8 RET UNIVERSAL RECYCLING SYMBOL"
          buffer code: #xE2 #x99 #xB2
            file code: #xE2 #x99 #xB2 (encoded by coding system utf-8-unix)
              display: by this font (glyph code)
    xft:-PfEd-Mensch-normal-normal-normal-*-16-*-*-*-m-0-iso10646-1 (#x985)

Character code properties: customize what to show
  name: UNIVERSAL RECYCLING SYMBOL
  general-category: So (Symbol, Other)
  decomposition: (9842) ('♲')
Neil Roberts
fonte
3

Vim obtido? Basta colar, colocar o cursor e pressionar ga. Eu uso isso o tempo todo para personagens estranhos.

SilverWolf - Restabelecer Monica
fonte
2

Eu uso http://unicode.scarfboy.com , que é simples e funciona bem.

Não, não mostrei meu nome verdadeiro
fonte
2
Adicione uma breve descrição do que o site faz, se houver alguma maneira específica de usá-lo, e como ele aborda especificamente a questão dos OPs. Uma resposta em uma linha geralmente não é suficiente para realmente responder a uma pergunta.
computercarguy
2

Acho o conversor de código Unicode de Rishard Ishida (link do github) muito útil para encontrar códigos de caracteres unicode, entre outras coisas. Ele também fornece traduções / conversões para outros pontos de código, codificações e, por exemplo, sequências de escape.

Conversor Unicode

Você também pode conferir a página principal de Richard Ishida (rishida.net) , pois ela contém (links para) muitas ferramentas e informações valiosas, especialmente se você estiver interessado em internacionalização e codificação de caracteres. Por exemplo, outra ferramenta muito útil vinculada lá, é a ferramenta Uniview (link do github) .

Uniview

E, finalmente, também é muito útil, apesar de relevante para os usuários de Mac, o Visualizador de Caracteres do macOS , acessível através do Menu de Entrada , que pode ser ativado em Preferências do SistemaTeclado.

Embora o site de suporte da Apple se concentre principalmente em como inserir emojies (…), o Character Viewer é realmente muito útil para procurar caracteres específicos ('especiais') e seus pontos de código em várias codificações diferentes, bem como para descobrir quais as fontes no seu systen contêm glifos específicos.

Visualizador de caracteres

Felicidades!

arri
fonte
O Visualizador de Personagens, conforme ilustrado aqui, possui, pelo menos, uma revisão principal (do SO) antiga; High Sierra oferece um "Show Emoji & Symbols" muito menos conveniente.
Anton Sherwood
@AntonSherwood nada mudou que eu possa dizer. Você pode decidir na opção Emoji e símbolos "Personalizar lista" quais tabelas exibir. O Unicode não é visível por padrão, acredito.
user0721090601
Posso confirmar que o Sierra tem o painel de Personagens completo - o High Sierra não?
SilverWolf - Restabelece Monica
Bem, aprendemos algo todos os dias. Obrigado @guifa. Fiz isso um pouco mais ao meu gosto - mas não consigo reproduzir a captura de tela mostrada.
Anton Sherwood
2

Você também pode usar o seguinte site: https://unicode-table.com/en/ Basta colar seu personagem e você também terá um ponto de código Unicode e código HTML.

Alina Ladygina
fonte
1

Se você possui o Microsoft Word, cole o texto lá, selecione o caractere (ou clique à direita dele) e pressione Alt+ X.

G-Man Diz 'Reinstate Monica'
fonte
Isso já é fornecido pela própria pergunta.
Stephan Bijzitter
0

Vou mencionar http://amp-what.com/ , pois é realmente fácil de usar com seu campo de pesquisa rápida e suporta diferentes notações (& código, pontos de código Unicode , sequência de caracteres de codificação URI).

Imagem de exemplo

493msi
fonte
0

Aqui está mais uma resposta usando uma ideia do user202729:

Marque o URL javascript:alert(prompt().codePointAt(0).toString(16))como favorito e use um navegador para executá-lo. (Funciona no Chrome e Firefox. Não parece funcionar no IE, mas isso pode ser devido a configurações de segurança.)

Diferentemente de outras respostas, nenhuma conexão com a Internet é necessária, nenhum utilitário externo para download, não é específico do SO.

DodgyCodeException
fonte