Alterar a codificação do sistema de arquivos para UTF-8 no Ubuntu

8

Como descobrir qual codificação de charset é usada pelo sistema de arquivos atual e como alterá-la para UTF-8?

EDITAR:

Aqui está a saída do mount:

/dev/sdb6 on / type ext3 (rw,relatime,errors=remount-ro)
tmpfs on /lib/init/rw type tmpfs (rw,nosuid,mode=0755)
/proc on /proc type proc (rw,noexec,nosuid,nodev)
sysfs on /sys type sysfs (rw,noexec,nosuid,nodev)
varrun on /var/run type tmpfs (rw,nosuid,mode=0755)
varlock on /var/lock type tmpfs (rw,noexec,nosuid,nodev,mode=1777)
udev on /dev type tmpfs (rw,mode=0755)
tmpfs on /dev/shm type tmpfs (rw,nosuid,nodev)
devpts on /dev/pts type devpts (rw,noexec,nosuid,gid=5,mode=620)
fusectl on /sys/fs/fuse/connections type fusectl (rw)
lrm on /lib/modules/2.6.27-11-generic/volatile type tmpfs (rw,mode=755)
securityfs on /sys/kernel/security type securityfs (rw)
binfmt_misc on /proc/sys/fs/binfmt_misc type binfmt_misc (rw,noexec,nosuid,nodev)
gvfs-fuse-daemon on /root/.gvfs type fuse.gvfs-fuse-daemon (rw,nosuid,nodev)

Aqui está a saída de "cat / etc / fstab"

# /etc/fstab: static file system information.
#
# <file system> <mount point>   <type>  <options>       <dump>  <pass>
proc            /proc           proc    defaults        0       0
# /dev/sdb7
UUID=50d660f1-1948-41e1-96af-3cb9bca338dd /               ext3    relatime,errors=remount-ro 0       0
# /dev/sdb8
UUID=efaee412-8e29-4f65-927d-f57252451088 none            swap    sw              0       0
jack
fonte

Respostas:

5

Em sistemas tipo Unix, a codificação de nomes de arquivos não é configurada no nível do sistema de arquivos, mas no ambiente do usuário. Verifique a saída localee observe as coisas após o ponto - por exemplo, no meu caso LANG=en_US.UTF-8, para que os nomes de arquivo no meu ambiente sejam interpretados como UTF-8. Esta é a configuração padrão no Ubuntu.

A resposta de Dennis Williamson é relevante para tipos especiais de sistemas de arquivos que exigem tradução, e não estou tentando entrar nesse problema, porque suas saídas mounte cat /etc/fstabmostrar que esse não é o seu caso.

Amir
fonte
11
localidade do sistema já está en_US.UTF-8
jack
11
Eu não acho que isso seja verdade. Meu LANG-pt_BR.UTF8, mas o Ubuntu cria arquivos como us_ascii. O Ubuntu parece não fazer nada com o nível de codificação do sistema de arquivos. Unfortuantely
onknows
3

Você não diz qual sistema de arquivos, no entanto, pode ver a saída do mountqual em um dos meus sistemas atualmente mostra um sistema de arquivos iso9660 e alguns vfat que são utf8. Você também pode olhar para o conteúdo em /etc/fstabque você os definiu ou eles já estão definidos. Veja o man mountque mostra que NTFS e jfs são mais dois que têm essa opção.

Pausado até novo aviso.
fonte
@ Dennis, publiquei a saída do mount e "cat / etc / fstab". Parece que não há informações de codificação de charset lá.
jack
Você ainda não diz qual sistema de arquivos / dispositivo ou que problema específico está tentando resolver. Como Amir disse, aparentemente você não está usando um dos sistemas de arquivos que mencionei e diz que localejá está correto. Qual é o problema?
Pausado até novo aviso.
@ Dennis, você disse que sua saída de montagem mostra que você possui um sistema de arquivos iso9660. Eu publiquei minha saída de montagem. Não vi nada relacionado ao "sistema de arquivos" que você mencionou na saída. Poderia me ajudar a descobrir isso?
jack
O sistema de arquivos é o que está listado após a palavra "type" na saída mountou na coluna "type" em /etc/fstab. Na saída que você mostra, "ext3" é um exemplo. O sistema de arquivos iso9660 refere-se a um CD-ROM. Qual é o problema específico que você está tentando resolver?
Pausado até novo aviso.
2

O Ubuntu usa a codificação UTF-8 por padrão e parece que você não a alterou. Você pode ter nomes de arquivos com uma codificação diferente. Nesse caso, você pode usar o convmv para corrigir isso.

ℝaphink
fonte
-1

Em suma, você não pode realmente.

Existem duas coisas, a codificação dos nomes de arquivos e a codificação dos dados nos arquivos. Nos dois casos, o sistema de arquivos armazenará apenas os bytes brutos. Cabe ao usuário garantir que eles sejam a codificação que ele deseja.

Rory
fonte