Em números persas, ۰۱۲۳۴۵۶۷۸۹é equivalente a 0123456789dígitos europeus. Como posso converter o número persa (pol UTF-8) para ASCII? Por exemplo, eu quero ۲۱tornar-se
Em números persas, ۰۱۲۳۴۵۶۷۸۹é equivalente a 0123456789dígitos europeus. Como posso converter o número persa (pol UTF-8) para ASCII? Por exemplo, eu quero ۲۱tornar-se
Estou executando o Arch Linux com um terminal simples usando a fonte do Adobe Source Code Pro. Minha localidade está definida corretamente como LANG=en_US.UTF-8. Quero imprimir caracteres Unicode representando cartas de baralho no meu terminal. Estou usando a Wikipedia para referência . Os...
Como encontrar a fonte apropriada para renderizar pontos de código unicode? gnome-terminaldescobrimos que caracteres como «🉃 ⼼ 😻🕲🝤» podem ser renderizados com fontes como Symbola, em vez da fonte do meu terminal ou do fallback do ponto de código no quadrado (????). Como...
Em sistemas operacionais baseados em Unix, os nomes de arquivos utf6 são permitidos? Nesse caso, preciso fazer algo especial para gravar o arquivo no disco. Deixe-me explicar o que espero fazer. Estou escrevendo um aplicativo que irá transferir um arquivo via ftp para um sistema remoto, mas o nome...
Qual seria a maneira mais próxima de uma maneira portátil de obter a largura de exibição (pelo menos em um terminal (um que exibe caracteres no local atual com a largura correta)) de uma sequência de caracteres de um script de shell. Estou interessado principalmente na largura de caracteres que...
O comando cuttem uma opção -cpara trabalhar em personagens, em vez de bytes com a opção -b. Mas isso não parece funcionar, no en_US.UTF-8local: O segundo byte fornece o segundo caractere ASCII (que é codificado da mesma forma em UTF-8): $ printf 'ABC' | cut -b 2 B mas não fornece o segundo...
Em um enorme arquivo de texto UTF-8, quero mostrar todas as linhas que contêm kanjis japoneses . Que grepexpressão (ou outra) faz isso? Se não me engano, kanjis são os caracteres entre \u4e00e \u4dbf. Não preciso mostrar kanas , mas mostrá-los também não seria um grande...
Eu uso o Ubuntu .. No 'gnome-terminal', eu posso digitar Unicode Codepoints digitando Ctrl-Shift-u primeiro, seguido pelo valor hexadecimal do Codepoint, por exemplo. C-S-u 2468produz ⑨ konsole, meu terminal preferido, não possui esse recurso CSu (gnome) .. Existe alguma maneira equivalente do...
Quando faço isso no meu terminal: echo -e "\xF0\x9f\x8d\xba" Recebo uma caneca de cerveja gelada no meu terminal: 🍺 No entanto, quando inicio a tela e tento o mesmo, estou recebendo um . Como obtenho uma boa caneca de cerveja? Este é o meu .screenrc: nethack on startup_message...
Ao tentar converter um arquivo de texto em seu equivalente ASCII, recebo uma mensagem de erro iconv: illegal input sequence at position. O comando que eu uso é iconv -f UTF-8 -t ascii//TRANSLIT file O personagem ofensivo é æ. O próprio arquivo de texto está presente aqui . Por que diz sequência...
Eu já sei vim -b, no entanto, dependendo do local usado, ele exibe caracteres de vários bytes (como UTF-8) como letras únicas. Como pedir vimpara exibir apenas caracteres imprimíveis ASCII e tratar o restante como dados binários, independentemente do conjunto de
Gostaria de usar uma fonte truetype no xterm / uxterm (versão 278), mas tenho problemas com símbolos unicode (é por exemplo, exibe bem, então acho que não é um utf8 desabilitado ou um problema de localidade): $ echo -e "\xE2\x98\xA0" me dá um quadrado em vez de ☠ com a seguinte...
Eu gostaria de poder correr unicode-names 'abç' e veja os nomes de caracteres Unicode correspondentes: LATIN SMALL LETTER A LATIN SMALL LETTER B LATIN SMALL LETTER C WITH CEDILLA Imprimir uma sequência como uma série de nomes de glifos Unicode seria útil em vários casos: Distinga caracteres...
Ao tentar enviar um arquivo de texto para a impressora via lprfrom xterm, o conteúdo foi corrompido além do reconhecimento, cuja causa acabou por ser atribuída à codificação do arquivo. Se eu processar o texto com iconv(por exemplo, iconv -f utf-8 -t ascii//TRANSLIT), o arquivo será impresso...
Eu gostaria de usar símbolos matemáticos UTF8, ao digitar uma lista , outra lista . Eu encontrei algo chamado ComposeKey . Infelizmente, não está cobrindo ômega, teta, seta para a direita etc. Estou usando o KDE, tentei atalhos globais, mas parece não funcionar. Como configurar símbolos de...
Eu gostaria de poder ver os caracteres emoji corretamente no mutt, mas, por exemplo, 💗 aparece como ^ J no pager do mutt. Corrida :set pager=view e reabrir a mensagem exibe o caractere corretamente com o vim. O email em questão é criptografado por PGP, mas acho que seria o mesmo com emails não...
Preciso automatizar um processo de verificação de quais caracteres Unicode possuem glifos reais definidos para eles em um arquivo de fonte True Type. Como faço para fazer isso? Não consigo encontrar informações sobre como entender os números que parece estar recebendo quando abro um arquivo .ttf em...
O que está acontecendo no seguinte snippet de código? Não estou obtendo minha saída esperada. Eu acho que foi um bug, mas acontece em 2 programas diferentes (uniq e sort), então eu suspeito que isso tenha algo a ver com ... bem, eu não sei o que ... daí a pergunta. Os 3 primeiros (de 4)...
Os arquivos do Excel podem ser convertidos para CSV usando: $ libreoffice --convert-to csv --headless --outdir dir file.xlsx Tudo parece funcionar muito bem. A codificação, no entanto, é definida como algo instável. Em vez de um mdash UTF-8 (-) que eu recebo se fizer um "salvar como" manualmente...
Recebi um arquivo .csv com a FF FEBOM: $ head -n1 dotan.csv | hd 00000000 ff fe 41 00 64 00 20 00 67 00 72 00 6f 00 75 00 |..A.d. .g.r.o.u.| Ao usá awk-lo para analisá-lo, estou recebendo um monte de bytes nulos, que suspeito que sejam devidos à ordem dos bytes. Como posso trocar a ordem dos...