Pergunto-me o que é um valor intrínseco do uso da média harmônica (por exemplo, para calcular medidas F), em oposição à média aritmética ponderada na combinação de precisão e recall? Estou pensando que a média aritmética ponderada poderia desempenhar o papel de média harmônica, ou estou perdendo alguma coisa?
12
Respostas:
Em geral, as médias harmônicas são preferidas quando se está tentando calcular taxas médias, em vez de números inteiros. No caso de uma medida F1, uma média harmônica penaliza precisões muito pequenas ou recupera, enquanto a média aritmética não ponderada não. Imagine uma média de 100% e 0%: a média aritmética é 50% e a média harmônica é 0%. A média harmônica requer que a precisão e a recuperação sejam altas.
Além disso, quando a precisão e a recuperação estiverem próximas, a média harmônica estará próxima da média aritmética. Exemplo: a média harmônica de 95% e 90% é 92,4% em comparação com a média aritmética de 92,5%.
Se essa é uma propriedade desejável provavelmente depende do seu caso de uso, mas geralmente é considerado bom.
Por fim, observe que, como @whuber afirmou nos comentários, a média harmônica é de fato uma média aritmética ponderada.
fonte
A média harmônica pode ser um substituto útil da média aritmética quando esta não tem expectativa ou variância. De fato, pode ser que não exista ou seja infinito, enquanto existe. Por exemplo, a distribuição de Pareto com densidade não é finita expectativa quando , o que implica que a média aritmética tem uma expectativa infinita, enquanto que implica que a média harmônica tem uma expectativa finita.E[X] E[1/X]
Por outro lado, existem distribuições para as quais a média harmônica não tem expectativa, como por exemplo, a distribuição Beta quando . E muitos mais para os quais não tem variação.Be(α,β) α≤1
Há também um vínculo com as aproximações de Monte Carlo às integrais e, principalmente, às constantes normalizadoras, baseadas na identidade posterior bayesiana que é qualquer densidade, é o anterior, a probabilidade e o marginal, como discutido nessa outra questão validada em X, onde comento os perigos de usar o que Radford Neal (U Toronto) chama de o pior estimador de Monte Carlo de todos os tempos . (Também escrevi várias entradas no meu blog sobre esse tópico.)
fonte