Eu tenho muitos arquivos que preciso classificar; e, infelizmente, existem muitos arquivos com o mesmo nome, mas com conteúdo diferente, e há o mesmo conteúdo com nomes de arquivos diferentes.
Estou pensando em usar md5sum
para gerar somas de verificação para os arquivos, mas preciso saber - é possível que dois arquivos diferentes (ou seja, conteúdo diferente) gerem a mesma soma de verificação?
Se for, qual a probabilidade de isso acontecer?
Seria possível usar dois programas de soma de verificação diferentes e não relacionados (por exemplo, não na mesma "família") para gerar duas somas de verificação - supondo que enquanto dois arquivos diferentes possam gerar a mesma soma de verificação para qualquer um dos programas de soma de verificação, isso nunca aconteceria aos dois ao mesmo tempo?
Respostas:
Dois arquivos com o mesmo conteúdo, mas com nomes de arquivos diferentes: ( arquivo1 e arquivo2 ):
Dois arquivos com conteúdo diferente, mas os mesmos nomes de arquivo: ( arquivo1 e arquivo1 )
Na entrada do wiki ,
Mas, o algoritmo MD5 tem suas próprias falhas.
Eu recomendaria o uso do sha1 para calcular a soma de verificação, pois a produção de colisões não é tão fácil ao usar os algoritmos sha1 . Produzir a soma de verificação sha1 é bastante fácil, como você pode ver aqui .
fonte
sha1
não é relevante para essa tarefa; só importa quando se preocupa com segurança .