Remova mp3 duplicado com nome, tamanho e hash diferentes

9

Eu tenho uma enorme biblioteca de músicas (todas mp3), mas algumas das músicas são quase as mesmas, mas:

  1. Talvez um ou dois segundos a mais
  2. Aproximadamente 97% o mesmo que outra música
  3. Ou outra taxa de bits.

Existe uma maneira de encontrar essas duplicatas? Como mencionado, eles não têm o mesmo tamanho, nome ou hash SHA1.

Hans Groeffen
fonte

Respostas:

3

Existe um sistema de impressão digital acústica de código aberto chamado Echoprint . Você pode verificar se eu quero deduplicar uma grande coleção . Eu não o usei antes (apenas tropecei), mas parece incrível poder fazer isso localmente.

Adrian Frühwirth
fonte
Independentemente disso, se seus arquivos forem identificados corretamente (não sei se por nome você quer dizer nomes de arquivos e / ou tags ID3), também existem ferramentas de desduplicação que funcionam com base em tags.
Adrian Frühwirth 05/04
6

Use o Picard do MusicBrainz . Ele escaneia a música para gerar uma 'impressão digital' e a compara com um banco de dados on-line para identificá-la (obtendo todas as informações como Artista, Álbum, etc.).

Depois de identificar as músicas, ele pode organizá-las em um diretório personalizado e estrutura de nome, e você pode usá-lo para encontrar as duplicatas.

Totalmente compatível com linux.

Patrick
fonte
Este é o caminho definitivo, funciona muito bem.
Slm
Ok, acho que tenho um problema. Nenhuma das minhas músicas é comercial. A maioria é baixada sob licença CC do Jamendo. Ele diz que não consegue encontrar nenhuma correspondência.
Hans Groeffen
@HansGroeffen então isso seria um problema. Você tem permissão para publicar impressões digitais de músicas desconhecidas anteriormente, para que você possa fazer isso, mas deve tentar validar se o envio é preciso. Como você tem nomes incompatíveis, isso pode não ser uma boa ideia. Não tenho certeza se existe uma maneira de usá-lo apenas para obter impressões digitais e recursos de comparação.
Patrick
2
O banco de dados MusicBrainz que Picard usa é editável pelo usuário. Você pode criar novas entradas para artistas, obras (músicas) e lançamentos (álbuns / EPs) e, em seguida, usar Picard para re-marcar / mover os arquivos. É um pouco de esforço, mas funciona - e é útil para os outros.
N
3

Eu recomendo usar beetscom seu duplicatesplugin; beetsé semelhante picardem termos de funcionalidade (pode pesquisar informações de ID3 no banco de dados musicbrainz e organizar seus arquivos com base nessas informações), mas vai além das habilidades do picard com alguns de seus plugins.

Pessoalmente, eu os uso juntos - picard para limpar as etiquetas ID3 e beterraba para organizar os arquivos e limpar duplicatas.

STW
fonte