Estou interessado em saber o que realmente acontece no Hellinger Distance (em termos simples). Além disso, também estou interessado em saber quais são os tipos de problemas que podemos usar o Hellinger Distance? Quais são os benefícios do uso do Hellinger Distance?
machine-learning
data-mining
text-mining
distance
Smith Volka
fonte
fonte
Respostas:
A distância de Hellinger é uma métrica para medir a diferença entre duas distribuições de probabilidade. É o análogo probabilístico da distância euclidiana .
É útil ao quantificar a diferença entre duas distribuições de probabilidade. Por exemplo, se você estimar uma distribuição para usuários e não usuários de um serviço. Se a distância de Hellinger for pequena entre esses grupos para alguns recursos, esses recursos não serão estatisticamente úteis para segmentação.
fonte