Estou usando significa agrupar para agrupar as vozes dos alto-falantes. Quando comparo um enunciado com os dados do alto-falante em cluster, obtenho distorção média (baseada na distância euclidiana). Essa distância pode estar na faixa de . Eu quero converter essa distância para uma pontuação de similaridade . Por favor, me guie sobre como eu posso conseguir isso.
clustering
k-means
distance
euclidean
Maomé
fonte
fonte
Você também pode usar: ondeé a sua função distância desejada.1edist
dist
fonte
Parece que você deseja algo semelhante à semelhança de cosseno, que é em si uma pontuação de similaridade no intervalo de unidade. De fato, existe uma relação direta entre distância euclidiana e semelhança de cosseno!
While cosine similarity is
so
From a computational perspective, it may be more efficient to just compute the cosine, rather than Euclidean distance and then perform the transformation.
fonte
How about a Gaussian kernel ?
The distance∥x−x′∥ is used in the exponent. The kernel value is in the range [0,1] . There is one tuning parameter σ . Basically if σ is high, K(x,x′) will be close to 1 for any x,x′ . If σ is low, a slight distance from x to x′ will lead to K(x,x′) being close to 0.
fonte
If you are using a distance metric that is naturally between 0 and 1, like Hellinger distance. Then you can use 1 - distance to obtain similarity.
fonte