Perguntas com a marcação «unicode»

16

Como converter números persas em UTF-8 para números europeus em ASCII?

Em números persas, ۰۱۲۳۴۵۶۷۸۹é equivalente a 0123456789dígitos europeus. Como posso converter o número persa (pol UTF-8) para ASCII? Por exemplo, eu quero ۲۱tornar-se

bash unicode conversion

16

Por que alguns caracteres unicode não são impressos no meu terminal?

Estou executando o Arch Linux com um terminal simples usando a fonte do Adobe Source Code Pro. Minha localidade está definida corretamente como LANG=en_US.UTF-8. Quero imprimir caracteres Unicode representando cartas de baralho no meu terminal. Estou usando a Wikipedia para referência . Os...

bash fonts unicode printf

16

Encontre a melhor fonte para renderizar um ponto de código

Como encontrar a fonte apropriada para renderizar pontos de código unicode? gnome-terminaldescobrimos que caracteres como «🉃 ⼼ 😻🕲🝤» podem ser renderizados com fontes como Symbola, em vez da fonte do meu terminal ou do fallback do ponto de código no quadrado (????). Como...

fonts unicode

15

Nomes de arquivos UTF 8?

Em sistemas operacionais baseados em Unix, os nomes de arquivos utf6 são permitidos? Nesse caso, preciso fazer algo especial para gravar o arquivo no disco. Deixe-me explicar o que espero fazer. Estou escrevendo um aplicativo que irá transferir um arquivo via ftp para um sistema remoto, mas o nome...

linux filenames unicode

15

Obter a largura de exibição de uma sequência de caracteres

Qual seria a maneira mais próxima de uma maneira portátil de obter a largura de exibição (pelo menos em um terminal (um que exibe caracteres no local atual com a largura correta)) de uma sequência de caracteres de um script de shell. Estou interessado principalmente na largura de caracteres que...

shell-script unicode

15

Não é possível usar `cut -c` (` --characters`) com UTF-8?

O comando cuttem uma opção -cpara trabalhar em personagens, em vez de bytes com a opção -b. Mas isso não parece funcionar, no en_US.UTF-8local: O segundo byte fornece o segundo caractere ASCII (que é codificado da mesma forma em UTF-8): $ printf 'ABC' | cut -b 2 B mas não fornece o segundo...

text-processing character-encoding unicode cut

14

grep: encontre todas as linhas que contêm kanjis japoneses

Em um enorme arquivo de texto UTF-8, quero mostrar todas as linhas que contêm kanjis japoneses . Que grepexpressão (ou outra) faz isso? Se não me engano, kanjis são os caracteres entre \u4e00e \u4dbf. Não preciso mostrar kanas , mas mostrá-los também não seria um grande...

grep unicode

14

Como digitar caracteres Unicode no terminal Konsole do KDE a partir de uma área de trabalho do Gnome?

Eu uso o Ubuntu .. No 'gnome-terminal', eu posso digitar Unicode Codepoints digitando Ctrl-Shift-u primeiro, seguido pelo valor hexadecimal do Codepoint, por exemplo. C-S-u 2468produz ⑨ konsole, meu terminal preferido, não possui esse recurso CSu (gnome) .. Existe alguma maneira equivalente do...

kde keyboard unicode konsole input-method

14

A tela GNU não faz eco dos caracteres unicode corretos

Quando faço isso no meu terminal: echo -e "\xF0\x9f\x8d\xba" Recebo uma caneca de cerveja gelada no meu terminal: 🍺 No entanto, quando inicio a tela e tento o mesmo, estou recebendo um . Como obtenho uma boa caneca de cerveja? Este é o meu .screenrc: nethack on startup_message...

terminal gnu-screen unicode

13

iconv sequência de entrada ilegal - por que?

Ao tentar converter um arquivo de texto em seu equivalente ASCII, recebo uma mensagem de erro iconv: illegal input sequence at position. O comando que eu uso é iconv -f UTF-8 -t ascii//TRANSLIT file O personagem ofensivo é æ. O próprio arquivo de texto está presente aqui . Por que diz sequência...

text-processing character-encoding unicode

13

O vim pode exibir apenas caracteres ASCII e tratar outros bytes como dados binários?

Eu já sei vim -b, no entanto, dependendo do local usado, ele exibe caracteres de vários bytes (como UTF-8) como letras únicas. Como pedir vimpara exibir apenas caracteres imprimíveis ASCII e tratar o restante como dados binários, independentemente do conjunto de

vim character-encoding unicode binary ascii

12

Como posso fazer com que símbolos unicode e fontes TrueType funcionem no xterm / uxterm?

Gostaria de usar uma fonte truetype no xterm / uxterm (versão 278), mas tenho problemas com símbolos unicode (é por exemplo, exibe bem, então acho que não é um utf8 desabilitado ou um problema de localidade): $ echo -e "\xE2\x98\xA0" me dá um quadrado em vez de ☠ com a seguinte...

fonts xterm unicode ttf

12

Como imprimir nomes de glifos Unicode para a string de entrada?

Eu gostaria de poder correr unicode-names 'abç' e veja os nomes de caracteres Unicode correspondentes: LATIN SMALL LETTER A LATIN SMALL LETTER B LATIN SMALL LETTER C WITH CEDILLA Imprimir uma sequência como uma série de nomes de glifos Unicode seria útil em vários casos: Distinga caracteres...

command-line unicode

11

suporte para codificação utf-8 com lpr

Ao tentar enviar um arquivo de texto para a impressora via lprfrom xterm, o conteúdo foi corrompido além do reconhecimento, cuja causa acabou por ser atribuída à codificação do arquivo. Se eu processar o texto com iconv(por exemplo, iconv -f utf-8 -t ascii//TRANSLIT), o arquivo será impresso...

cups character-encoding unicode lpr

11

Símbolos matemáticos UTF8 e layout / entrada do teclado

Eu gostaria de usar símbolos matemáticos UTF8, ao digitar uma lista , outra lista . Eu encontrei algo chamado ComposeKey . Infelizmente, não está cobrindo ômega, teta, seta para a direita etc. Estou usando o KDE, tentei atalhos globais, mas parece não funcionar. Como configurar símbolos de...

xorg kde keyboard keyboard-layout unicode

11

mutt: como exibir caracteres emoji corretamente?

Eu gostaria de poder ver os caracteres emoji corretamente no mutt, mas, por exemplo, 💗 aparece como ^ J no pager do mutt. Corrida :set pager=view e reabrir a mensagem exibe o caractere corretamente com o vim. O email em questão é criptografado por PGP, mas acho que seria o mesmo com emails não...

vim mutt unicode

11

Como descobrir quais pontos de código unicode são definidos em um arquivo TTF?

Preciso automatizar um processo de verificação de quais caracteres Unicode possuem glifos reais definidos para eles em um arquivo de fonte True Type. Como faço para fazer isso? Não consigo encontrar informações sobre como entender os números que parece estar recebendo quando abro um arquivo .ttf em...

fonts unicode ttf

10

Onde foi minha linha `uniq` ou` sort -u`, com alguns caracteres unicode

O que está acontecendo no seguinte snippet de código? Não estou obtendo minha saída esperada. Eu acho que foi um bug, mas acontece em 2 programas diferentes (uniq e sort), então eu suspeito que isso tenha algo a ver com ... bem, eu não sei o que ... daí a pergunta. Os 3 primeiros (de 4)...

text-processing sort locale unicode uniq

10

Especifique a codificação com libreoffice --convert-to csv

Os arquivos do Excel podem ser convertidos para CSV usando: $ libreoffice --convert-to csv --headless --outdir dir file.xlsx Tudo parece funcionar muito bem. A codificação, no entanto, é definida como algo instável. Em vez de um mdash UTF-8 (-) que eu recebo se fizer um "salvar como" manualmente...

character-encoding unicode conversion libreoffice

10

Processar um arquivo que começa com uma BOM (FF FE)

Recebi um arquivo .csv com a FF FEBOM: $ head -n1 dotan.csv | hd 00000000 ff fe 41 00 64 00 20 00 67 00 72 00 6f 00 75 00 |..A.d. .g.r.o.u.| Ao usá awk-lo para analisá-lo, estou recebendo um monte de bytes nulos, que suspeito que sejam devidos à ordem dos bytes. Como posso trocar a ordem dos...

text-processing character-encoding unicode