Eu me deparei com três medidas estatísticas diferentes para comparar dois conjuntos, em particular a segmentação em imagens (por exemplo, comparando a semelhança entre a verdade básica e o resultado segmentado).
Quais são as diferenças entre essas medidas (elas são matematicamente bastante semelhantes):
Vejo papéis usando o Dice com mais frequência, mas outros também sugerem o uso de Jaccard e coeficientes de sobreposição. Quais são as diferenças deles?
machine-learning
similarities
dice
segmentation
jaccard-similarity
RockTheStar
fonte
fonte
Respostas:
Na página da wikipedia: onde é o coeficiente de dados e é o índice de Jacard. Na minha opinião, o Coeficiente de Dados é mais intuitivo, porque pode ser visto como a porcentagem de sobreposição entre os dois conjuntos, ou seja, um número entre 0 e 1.
Quanto à Sobreposição, representa a porcentagem de sobreposição, pois se refere apenas ao menor volume: A relação entre ela e a outra duas medidas não é direta, mas uma pode ser obtida uma da outra e vice-versa com informações da área / volume de e
fonte