ISO-8859-5 para Mac OS X

0
mbp:Desktop alexus$ file $$.txt
235.txt: ISO-8859 text, with CRLF line terminators
mbp:Desktop alexus$ 

No entanto, isso não é realmente ISO-8859 mas 8859-5 (Russo).

O arquivo abre no Windows muito bem (eu posso ver caracteres russos) e em um Mac eu recebo alguns símbolos desconhecidos ou pontos de interrogação.

Há uma solução?

alexus
fonte

Respostas:

2

Para abrir o arquivo sem converter sua codificação, você precisará encontrar uma maneira de especificar a codificação do arquivo para qualquer programa que esteja abrindo o código.

Você vai querer evitar clicar duas vezes no arquivo e, em vez disso, usar diretamente o item de menu Abrir ... (geralmente ⌘O ou Abrir ... no menu Arquivo) do aplicativo que você deseja usar para visualizar / editar o arquivo. Se o aplicativo for capaz de ler arquivos em outras codificações, ele provavelmente permitirá que você especifique a codificação na caixa de diálogo Abrir… (da mesma forma, eles devem permitir que você especifique uma codificação (possivelmente diferente) ao usar Salvar como…).

Por exemplo, TextEdit tem lista suspensa para “Plain Text Encoding” na parte inferior da caixa de diálogo Abrir…. Se a ISO 8859-5 não estiver listada, pode ser necessário selecionar “Personalizar lista de codificações…” para adicioná-la à lista. Você pode querer "cirílico (ISO 8859-5)", "cirílico (Windows)", "cirílico (KOI8-R)", ou qualquer outra coisa (use 8859-5 se tiver certeza de que é a codificação, caso contrário eu não sou Certifique-se de que as atribuições de pontos de código das outras codificações cirílicas são semelhantes.

terminal normalmente espera caracteres codificados em UTF-8, então você deve transcodificar os dados para UTF-8 se você quiser apenas "cat" o arquivo.

iconv -f ISO-8859-5 -t UTF-8 < filename

Você também pode usar iconv para salvar uma cópia do arquivo convertido (você pode achar mais fácil trabalhar com um arquivo UTF-8, pois muitos programas padronizarão a decodificação de um arquivo como UTF-8):

iconv -f ISO-8859-5 -t UTF-8 < filename > filename.utf8.txt

Você pode obter uma lista completa das codificações que iconv suporta com iconv -l.

Se você quiser usar um programa para ver / editar o arquivo dentro terminal , então os passos (de novo) dependem do programa que você está usando. Você pode fazer isso em Vim como isso:

vim -c 'e ++enc=iso-8859-5 filename'

Ou se Vim já começou:

:e ++enc=iso-8859-5 filename

Você pode obter uma lista das codificações que Vim sabe com :help *encoding-names*.

Chris Johnsen
fonte
0

Usar iconv para converter o arquivo para UTF-8.

Ignacio Vazquez-Abrams
fonte