Como encontro fotos duplicadas?

Respostas:

60

digiKam Instale através do centro de software

Adicione todas as fotos à sua coleção. No menu, selecione "Ferramentas / Localizar duplicatas". Isso procurará duplicatas em toda a sua coleção.

findimagedupes Instale através do centro de software

Uma ferramenta de linha de comando. Passe todas as imagens que você deseja comparar na linha de comando.

Geeqie (anteriormente GQview )Instale através do centro de software

No menu, selecione "Arquivo / Localizar duplicado". Arraste e solte arquivos de imagem na janela de duplicatas. Você pode soltar diretórios para adicionar seu conteúdo recursivamente. Para comparação visual de imagens, há opções específicas não padrão em um menu suspenso. O nível de similaridade "personalizado" permite restringir os emparelhamentos apenas ao mais alto grau de similaridade, mas deve ser definido em "Preferências" como 99. Mesmo assim, ele não funciona perfeitamente, pelo menos para alguns tipos de imagens, como arte. Infelizmente, ele não fornece um mecanismo de seleção automática com critérios racionais, como resolução, data ou o que for, a seleção automática parece escolher aleatoriamente apenas a primeira imagem encontrada como referência a preservar. A exclusão de muitas imagens pode ser extremamente lenta, pois ela tenta atualizar a contagem de resultados a cada exclusão.


Todas essas três ferramentas encontram duplicatas visuais, não apenas arquivos que são byte idêntico por byte.

Gilles
fonte
7
Eu descobri que o Geeqie funciona melhor. Possui um conjunto robusto de modos de pesquisa (nome, soma de verificação, tamanho, etc ...), poderosa digitalização de similaridade de imagem, informações detalhadas sobre duplicatas encontradas, interface simples e não há necessidade de adicionar imagens a uma coleção ou álbum primeiro. Meus únicos contras é que o Duplicate Finder está oculto no menu Arquivo e é necessário arrastar e soltar do Nautilus (ou outro FM) para adicionar imagens / pastas a serem pesquisadas. Fora isso, ele realiza o trabalho e o faz bem.
japzone
2
O Geeqie pode encontrar imagens semelhantes e funciona muito bem, mas achei um pouco lento para correspondências exatas e é entediante remover muitas duplicatas.
Wernight
Outra opção (que parece funcionar bastante bem) é essa ferramenta também chamada findimagedupes , mas não está relacionada à ferramenta hospedada no Sourceforge.
Winny
O Digikam possui uma incrível interface de localização duplicada. Eu recomendo.
Wbkang
22

FSlint Instale o FSlint

fslinté um programa gráfico que pode encontrar arquivos duplicados de qualquer tipo pelo md5sum. Se as imagens não forem idênticas, elas não serão sinalizadas como duplicadas. A imagem abaixo mostra vários arquivos PDF duplicados no meu diretório de Downloads:

insira a descrição da imagem aqui

Você pode alterar os parâmetros avançados de pesquisa para pesquisar por tipo de arquivo e restringir-se apenas a imagens. Isso é feito alterando os "parâmetros adicionais de localização" como findopções de comando. Por exemplo, aqui estou procurando apenas *.jpgarquivos (no mesmo caminho, apenas olhando para a minha pasta "Downloads":

insira a descrição da imagem aqui

fdupes Instalar fdupes

fdupesé uma ferramenta equivalente baseada em linha de comando. Ambos estão disponíveis nos repositórios.

John Lyon
fonte
12
Note que duvido que esses programas encontrem duplicatas redimensionadas.
Vadim Peretokin
@Vadi, essa é uma pergunta diferente e mais complicada. O Tineye faz a identificação de imagens que não depende de metadados, hashes etc. (pode identificar imagens com aparência semelhante), mas esse é um serviço online. Eles fornecem uma API, mas não conheço nenhum aplicativo que tire proveito disso ainda. A outra complicação é que você não deseja remover imagens semelhantes o tempo todo, por exemplo, se editar fotos, mas quiser manter cópias dos originais. Remover duplicatas idênticas é muito mais seguro.
John Lyon
4
O OP declara explicitamente "incluindo fotos que foram redimensionadas", portanto isso não é uma resposta.
Calimo 01/01
7

fdupes Instalar fdupes

Você pode usar uma ferramenta de linha de comando chamada fdupespara encontrar arquivos duplicados (consulte man fdupespara obter mais detalhes). Não conheço nenhuma maneira de encontrar 'duplicatas' que foram redimensionadas. Um programa que fizesse isso exigiria algum tipo de algoritmo inteligente que analisasse o conteúdo da imagem porque, quando uma imagem é redimensionada, seus dados são alterados para que os métodos tradicionais de localização duplicada não funcionassem.

dv3500ea
fonte
O fdupes também perderá duplicatas em diretórios diferentes; digamos que você tenha duas cópias de uma foto, uma na pasta birthday-party / e a outra em family-stuff / ... "fdupes -fr". vai perder essa duplicata.
Lrkwz 11/03/2014
2
O fdupes não processa duplicatas que foram redimensionadas, nem alterações nos metadados.
Calimo 01/01
6

imgSeek Instalar imgseek

O imgSeek pode encontrar duplicatas e imagens semelhantes (para poder encontrar fotos redimensionadas e com nomes de arquivos e metadados diferentes) e até pesquisar fotos com base em um esboço. Está disponível nas versões desktop e servidor.

Na verdade, eu ainda não tentei.

david.libremone
fonte
só está disponível para Ubuntu 10.04, embora haja uma biblioteca perl para 12,04
drevicko
A versão do servidor isk-daemonfunciona em 12,04, embora eu descobri que eu tinha para instalar a partir da fonte ( pip installcomo pela página de instalação não funcionou)
drevicko
4

O dupeGuru Picture Edition funciona muito bem e vale a pena tentar.

Eles têm um PPA do Launchpad , dupeguru(novo pacote all-in-one) ou dupeguru-pe(antigo pacote de edição de imagens) podem ser instalados usando os seguintes comandos:

sudo add-apt-repository ppa:hsoft/ppa
sudo apt-get update
sudo apt-get install dupeguru
tuxflo
fonte
Parece que o dupeGuru agora não tem edições separadas. Funciona bem, embora a interface do usuário possa ser melhor. Também está disponível no AUR se você usa o Arch.
user31389
2

Visipics

Visipics é um aplicativo gratuito do Windows para essa função, mas funciona muito bem no Linux, via wine, é claro (é melhor que geeqie / gqview com relação à classificação das duplicatas (os resultados da geeqie são absolutamente "não classificáveis")).

Você pode dizer para selecionar automaticamente as imagens com base em critérios como tamanho de arquivo menor, tipo não compactado, resolução mais baixa (porém não fará o contrário, você precisará fazer manualmente, o que não seria muito melhor do que fazê-lo no geeqie, exceto que a seleção não requer a retenção de Shift/ Ctrl) e até prioriza pastas (mas a última prioridade é a prioridade da pasta).

Porém, você deve prestar atenção nos links simbólicos - ele pode "aleatoriamente" selecionar para salvar um link simbólico em um arquivo enquanto exclui o arquivo real como uma "cópia". Isso é uma vergonha.

o dsc
fonte