Tenho várias mensagens duplicadas no Maildir do meu servidor IMAP. Qual é a melhor maneira de removê-los?
Alguns pontos relevantes:
- O ID da mensagem compartilhada geralmente é uma definição suficientemente boa de duplicado. Um pequeno script que remove todas as mensagens duplicadas, exceto uma, funcionaria.
- Às vezes, é necessário encontrar duplicatas com base nos corpos das mensagens compartilhadas. O que é uma definição razoável de compartilhada aqui? Bitwise equivalente? E as diferenças estranhas na quebra de linha, escape e codificação de caracteres?
- Às vezes, há alguma diferença significativa entre mensagens 'duplicadas'. Qual é a melhor maneira de revisar as diferenças nos conjuntos de mensagens 'duplicadas'? Difícil?
para arquivos genéricos no linux, uso os utilitários fdupes para remover arquivos duplicados. Achei que também funciona para mensagens do Maildir.
fonte
.forward
ou com cabeçalhos ligeiramente diferentes; portanto, embora a mensagem em si seja duplicada, os dois arquivos que contêm as duas cópias podem não ser.O Gnome's Evolution [um agente gráfico de usuário de e-mail] possui um recurso interno para remover e-mails duplicados. Conforme explicado nesta página de ajuda , ele se resume a:
Voilà.
O PS Evolution pode acessar suas mensagens localmente (MailDir, MH, Mbox) ou pelo IMAP.
fonte
Melhor que eu encontrei hoje é de Kevin Deldycke maildir-desduplicar .
X-MIMETrack
cabeçalho por padrão e compara os cabeçalhos usando oSHA224
resumo.Aposto que alguém poderia fazer algo chique com o delIMAPdups.pl de Rick Sanders , parte de suas ferramentas IMAP .
fonte
maildir-deduplicate
mudei para um novo local e atualizei o link. No entanto, suas informações estão desatualizadas.