Eu tenho que lidar com um arquivo que possui muitos caracteres de controle invisíveis, como "da direita para a esquerda" ou "largura zero sem marceneiro", espaços diferentes do espaço normal e assim por diante, e tenho problemas para lidar com isso.
Agora, gostaria de visualizar de alguma forma todas as letras em um determinado arquivo, letra por letra (eu gostaria de dizer "da esquerda para a direita", mas infelizmente estou lidando com o idioma da direita para a esquerda) , como pontos de código unicode, usando apenas ferramentas básicas bash (como vi
, less
, cat
...). É possível de alguma forma?
Eu sei que posso exibir o arquivo em hexadecimal por hexdump
, mas eu teria que recalcular os pontos de código. Eu realmente quero ver os pontos de código unicode reais, para que eu possa pesquisá-los no Google e descobrir o que está acontecendo.
edit: acrescentarei que não quero transcodificá-lo para codificação diferente (porque é isso que estou descobrindo online). Eu tenho o arquivo em UTF8 e está bem. Eu só quero saber os pontos de código exatos de todas as letras.