Consolidei muitos arquivos de texto (win, mac, unix) em um único arquivo orgmode. Para alguns caracteres, eu estava vendo números em vez dos caracteres certos. Coisas como \ 314 \ 203.
Eu usei "reverter-buffer-com-codificação-sytem" e escolha utf-8-hfs-unix. Isso conserta.
Mas agora, toda vez que eu salvo, o Emacs me pede para escolher um sistema de codificação. Se eu escolher o texto bruto, ele deixará de perguntar, mas quando abro o arquivo novamente, os números estão de volta.
Como faço para corrigir isso?
org-mode
character-encoding
Jason Mirk
fonte
fonte
-*- coding: utf-8-hfs-unix;-*-
na primeira linha do seu arquivo? ( gnu.org/software/emacs/manual/html_node/emacs/… )Respostas:
Isso aconteceu comigo por um tempo também antes de eu ter uma idéia do que estava acontecendo - aqui está um exemplo de como algo assim pode acontecer - (se importa, eu estou no Windows, caso seja algo específico dessa compilação) -
Digamos que você tenha um arquivo codificado em UTF-8 e cole algum texto de um site codificado com a página de código Latin-1 ou Windows-1252, por exemplo, um O com trema ou aspas onduladas.
Agora você tem uma sequência de caracteres codificados em UTF-8 seguida por algo que não faz sentido para UTF-8 ou possivelmente será mal interpretado. Se não puder interpretá-lo como uma sequência UTF-8 correta, ele será exibido como o valor bruto, por exemplo, octal \ 326 (que é um O com um trema na página de códigos Latin-1). Isso ocorre porque, para UTF-8, o \ 326 em particular deve ser seguido por algo com 10 nos dois bits mais altos e, se não for, não sabe o que fazer com ele.
Por exemplo, se você fosse para https://www.gnu.org/software/emacs/manual/html_node/emacs/Intro.html#Intro e copiasse algum texto que incluísse aspas, como "O` G 'no GNU " e colado em um buffer codificado em UTF-8, você terminaria com "The \ 221G \ 222 in GNU".
Então o que fazer?
Por um lado, você pode olhar para o buffer com diferentes sistemas de codificação para ver se ele exibirá esses caracteres corretamente, por exemplo, Windows-1252 e Latin-1 são bastante comuns -
Se o documento parecer melhor dessa maneira, você poderá salvá-lo com esta nova codificação. Existem muitos sistemas de codificação diferentes.
Para voltar ao UTF-8, basta fazer
Por que isso acontece, não tenho certeza - parece que o Emacs saberia como algo foi codificado na área de transferência e o traduziria de acordo, mas não parece fazer isso.
Para obter mais explicações, consulte /programming/1543613/how-does-utf-8-variable-width-encoding-work e http://kunststube.net/encoding/ .
fonte