Como encontro músicas duplicadas?

31

O título diz tudo. Como posso detectar duplicatas na minha biblioteca de mídia?

Ingo
fonte

Respostas:

24

O dupeGuru Music Edition é o que você deseja. Defina o tipo de digitalização para "Conteúdo de áudio" em Preferências. Observe que o programa é fairware, por isso, contribua se puder.

texto alternativo

Sugiro que você junte isso ao MusicBrainz Picard, que pode marcar seus arquivos de música automaticamente.

texto alternativo

Li Lo
fonte
PERFEITO! Finalmente, uma resposta que funcionou como charme :). Um plug-in Banshee ou o que quer que fosse ainda melhor, mas isso funciona muito bem! Na verdade, eu removi cerca de 8GB de bobagens, felicidades!
Ingo
2
Pena que o dupeGuru só pode fazer 10 remoções por vez sem gastar dinheiro.
John McKean Pruitt
O PPA está morto para lançamentos recentes do Ubuntu. Tive sucesso ao instalar o .deb diretamente do launchpad.net/~hsoft/+archive/ubuntu/ppa/+build/9735351 e, em seguida, executando dupeguru_me.
rjh 21/03
A versão mais recente não tem limite de remoções. No entanto, não parece ter a impressão digital da música, apenas compara os nomes de arquivos / informações ID3. Se você usar uma ferramenta como Picard para marcar sua música primeiro, ela deverá fazer um bom trabalho :)
rjh
10

Há um plugin que foi criado há algum tempo para isso. Eu usei recentemente, mas ainda deixa um pouco a desejar. Existe um " PPA " para ele - mas ainda não há pacotes construídos, apenas a filial do Bazaar. As instruções de instalação são mais ou menos assim:

wget http://scrawl.bplaced.net/duplicate-source.tar.gz -O tmp.tar.gz && mkdir -vp ~/.gnome2/rhythmbox/plugins/duplicate-source/ && tar -xf tmp.tar.gz -C ~/.gnome2/rhythmbox/plugins && rm -v tmp.tar.gz

Se você estiver interessado em usar o código-fonte do Bazaar, faça o seguinte:

mkdir -vp ~/.gnome2/rhythmbox/plugins && cd ~/.gnome2/rhythmbox/plugins && bzr branch lp:rb-duplicate-source duplicate-source

Depois de instalado, reinicie o Rhythmbox e você deverá ter um Duplicates Finder agora na lista de plugins.

lista de plugins

Após ativá-lo - há opções de configuração adicionais disponíveis.

janela de configuração

Depois que o plug-in estiver ativado - e quando encontrar duplicatas - ele adicionará uma opção adicional à sua lista de bibliotecas:

Lista

Algumas configurações que achei "estranhas" - tentei isso em uma biblioteca de mídia com mais de 120.000 músicas (mais de 1.000 duplicatas) e uma biblioteca com cerca de 1.000 músicas e talvez 30 duplicatas. No primeiro, demorou MUITO tempo e travou o Rhythmbox várias vezes durante a pesquisa. Por fim, fui automaticamente com "Remover da biblioteca" para evitar a reconstrução da lista. Em bibliotecas menores, tudo funciona muito bem.

Quando uma duplicata é encontrada - se você tiver as opções padrão selecionadas - a versão de menor qualidade da música será adicionada à lista. Portanto, é seguro selecionar todas as músicas na lista Duplicatas e "Remover" (exclua do disco ou remova da biblioteca).

Marco Ceppi
fonte
Muito obrigado por dar essa dica! No entanto, nada parece acontecer depois que eu o ativei. Não consigo encontrar uma nova guia ou o local onde as duplicatas seriam indicadas.
Ingo
Pode ser necessário mover o limite para 0,5 para ajudar a resolver as duplicatas. Ele será exibido como um item adicional na sua lista da Biblioteca. Atualizei a resposta para mostrar isso.
Marco Ceppi
Tentei isso também. Sem sucesso.
Ingo
5

Você pode usar o fdupes para isso:

$ fdupes -r ~/Music

que fornece uma lista de todos os arquivos duplicados.

Você pode instalá-lo facilmente com

sudo apt-get install fdupes
Johann
fonte
4
Isso funcionou melhor do que as outras opções. No entanto, ele realmente não parece adequado para arquivos de áudio. O software não compara tags etc., o que leva a uma lista muito curta de arquivos, enquanto na realidade existem muitas duplicatas, mas talvez não com exatamente o mesmo tamanho de arquivo (pois podem ser de fontes diferentes).
Ingo
3

Corri para um problema semelhante quando tinha um monte de arquivos de imagem duplicados. No meu caso, eu apenas usei md5sumnos arquivos e classifiquei os resultados:

for file in $(find $rootdir -name "*.jpg"); do echo $(md5sum $file); done | sort

Arquivos com o mesmo conteúdo geraram o mesmo hash, portanto, duplicatas podem ser encontradas facilmente. Excluí manualmente os dupes de lá, embora pudesse ter estendido o script para excluir todos, exceto a primeira ocorrência, mas estou sempre paranóico em fazer isso em um script ad-hoc.

Observe que isso funciona apenas para arquivos duplicados com conteúdo idêntico .

John Bode
fonte
Mais rápido:find $rootdir -name '*.jpg' -exec md5sum {} + | sort
Robert Vila
1

Experimente FSlint ou dupe gredtter

Para instalar o tipo FSlint no terminal (Ctrl-Alt-T)

sudo apt-get install fslint

espero que isso seja útil ..

FOSS DIVERSER
fonte
-2

Eu usei o FSlint para encontrar arquivos duplicados em geral. FSlint é "um utilitário para encontrar e limpar várias formas de cotão em um sistema de arquivos".

Aputsiak
fonte
Isso é estranho. O FSlint não encontra nenhuma das minhas músicas duplicadas!
Ingo
O FSlint possui configurações padrão que provavelmente encontrarão arquivos duplicados medidos pelo nome e tamanho do arquivo, mas não músicas duplicadas se houver gravações diferentes com tamanho e nome de arquivo diferentes.
Aputsiak 20/09/10
Gravações diferentes (remixes?) Não são seguras para exclusão. Eles podem ter valor próprio.
Extender
Também usei o fslint para áudio (com sucesso razoável) - embora, dadas algumas das alternativas neste segmento, provavelmente tentarei uma delas na próxima vez.
Belacqua