Eu tenho 3 tipos de file name
codificações no reiserfs
disco rígido montado: CP1251, KOI-8, UTF-8 e ASCII. Eu realmente preciso converter todas as codificações para UTF-8, recursivamente. Existe algum utilitário que detecte a codificação de origem e a converta em UTF-8 ou eu tenho que escrever um script Python?
8
detox
. Funcionou para mim entre ISO-8859-1 e UTF-8 usando-s iso8859_1-only
Respostas:
Use convmv, uma ferramenta CLI que converte o nome do arquivo entre codificações diferentes. Para converter de (
-f
) esses encondings em (-t
) UTF-8, faça o seguinte:Além disso, se você deseja converter o conteúdo do arquivo, uso
iconv
, uma ferramenta CLI para o conteúdo converter arquivos para diferentes codificações. Para converter de (-f
) esses encondings em (-t
) UTF-8, faça o seguinte:fonte
Não. Uma das grandes desvantagens do antigo sistema de páginas de códigos é que não há como detectar qual está sendo usado; você deve simplesmente saber isso a priori. Se você souber quais arquivos estão usando qual codificação, poderá converter os nomes usando algo como:
fonte
chardet
é de alguma forma detectá-lo ...Mesma solução
iconv
que o @psusi sugeses, mas com loop e while-card:Também
sh
script shell on-line :Com a leitura de um cartão while da linha de tubulação:
fonte