Estou tentando entender o coeficiente de variação . Quando tento aplicá-lo aos dois exemplos de dados a seguir, não consigo entender como interpretar os resultados.
Digamos que a amostra 1 seja e a amostra 2 seja . Aqui amostra 2 amostra 1 como você pode ver., 10 , 15 , 17 , 22 , 21 , 27 = + 10
Ambos têm o mesmo desvio padrão mas e .μ 2 = 18,67 μ 1 = 8,66667
Agora o coeficiente de variação será diferente. Para a amostra 2, será menor que para a amostra 1. Mas como interpreto esse resultado? Em termos de variação, ambos são iguais; apenas seus meios são diferentes. Então, qual é a utilidade do coeficiente de variação aqui? Isso está me enganando, ou talvez eu não consiga interpretar os resultados.
Respostas:
Em exemplos como o seu, quando os dados diferem apenas de forma aditiva, ou seja, adicionamos alguma constante a tudo, então, como você indica que o desvio padrão é inalterado, a média é alterada exatamente pela constante e, portanto, o coeficiente de variação muda de σ / μ para σ / ( μ + k ) , o que não é interessante nem útil.k σ/ μ σ/ (μ+k)
É uma mudança multiplicativa que é interessante e onde o coeficiente de variação tem alguma utilidade. Multiplicar tudo por alguma constante implica que o coeficiente de variação se torne k σ / k μ , ou seja, permaneça o mesmo de antes. A mudança de unidades de medida é um exemplo, como nas respostas de @Aksalal e @Macond.k k σ/ kμ
Como o coeficiente de variação é isento de unidades, também é isento de dimensões, pois quaisquer unidades ou dimensões possuídas pela variável subjacente são lavadas pela divisão. Isso faz do coeficiente de variação uma medida da variabilidade relativa , de modo que a variabilidade relativa dos comprimentos pode ser comparada à dos pesos e assim por diante. Um campo em que o coeficiente de variação encontrou algum uso descritivo é a morfometria do tamanho do organismo na biologia.
Em princípio e prática, o coeficiente de variação é definido apenas de forma completa e útil para variáveis totalmente positivas. Portanto, em detalhes, sua primeira amostra com o valor não é um exemplo apropriado. Outra maneira de ver isso é notar que, se a média sempre zero, o coeficiente seria indeterminado e se a média sempre negativa, o coeficiente seria negativo, assumindo no último caso que o desvio padrão seja positivo. Qualquer um dos casos tornaria a medida inútil como medida de variabilidade relativa, ou mesmo para qualquer outro propósito.0 0
Uma declaração equivalente é que o coeficiente de variação é interessante e útil apenas se os logaritmos forem definidos da maneira usual para todos os valores e, de fato, o uso de coeficientes de variação for equivalente a observar a variabilidade dos logaritmos.
Como no caso dos exemplos bizarros da climatologia, que deixo sem referência, pois os autores não merecem nem o crédito nem a vergonha, o coeficiente de variação foi superutilizado em alguns campos. Ocasionalmente, há uma tendência a considerá-lo como uma espécie de medida de resumo mágico que encapsula a média e o desvio padrão. Esse é um pensamento naturalmente primitivo, pois mesmo quando a razão faz sentido, a média e o desvio padrão não podem ser recuperados.
Nas estatísticas, o coeficiente de variação é um parâmetro bastante natural se a variação segue a gama ou o lognormal, como pode ser visto observando a forma do coeficiente de variação para essas distribuições.
Embora o coeficiente de variação possa ser útil, nos casos em que se aplica, a etapa mais útil é trabalhar em escala logarítmica, seja por transformação logarítmica ou usando uma função de link logarítmico em um modelo linear generalizado.
fonte
Imagine que eu disse: "Existem 1.625.330 pessoas nesta cidade. Mais ou menos cinco". Você ficaria impressionado com meu conhecimento demográfico preciso.
Mas se eu dissesse "Há cinco pessoas nesta casa. Mais ou menos cinco". Você pensaria que eu não tinha idéia de quantas pessoas estavam na casa.
Mesmo desvio padrão, currículos muito diferentes.
fonte
Normalmente, você usa o coeficiente de variação para variáveis de diferentes unidades de medida ou escalas muito diferentes. Você pode pensar nisso como uma relação ruído / sinal. Por exemplo, você pode comparar a variabilidade do peso e da altura dos alunos; variabilidade do PIB dos EUA e Mônaco.
No seu caso, o coeficiente de variação pode não fazer muito sentido, uma vez que os valores não são muito diferentes.
fonte
fonte
Na realidade, ambas as estatísticas podem ser enganosas se você não souber ou entender suas hipóteses e experiências. Considere este exemplo horrível ... Atravessando dois prédios altos em uma corda bamba, em vez de andar em uma prancha. Digamos que a corda bamba tenha um diâmetro de 1 polegada, enquanto a prancha tem 12 polegadas de largura. 5 pessoas foram convidadas a andar na corda e 5 foram convidadas a andar na prancha. Encontramos os seguintes resultados:
A distância média de cada passo da borda (ou lateral) da corda (polegadas): 0,5, 0,2, 0,3, 0,6, 0,1
A distância média de cada passo da borda (ou lateral) da prancha (polegadas): 5.5, 5.2, 5.3, 5.6, 5.1
Assim como no seu exemplo, este exemplo resultará em desvios padrão iguais, pois os valores da prancha são simplesmente uma diferença de +5 em relação aos da corda bamba. No entanto, se eu lhe dissesse que o desvio padrão para cada experimento era 0,2074, você poderia dizer bem, então os dois experimentos eram equivalentes. No entanto, se eu lhe dissesse que o CV do experimento na corda bamba era quase 61% em comparação com menos de 4% na prancha, você pode estar inclinado a me perguntar quantas pessoas caíram da corda.
fonte
CV é uma variabilidade relativa usada para comparar a variabilidade de diferentes conjuntos de dados de amostra. Para um exemplo, o mesmo desvio / variação padrão com média menor gerará um CV menor. indica que um conjunto de dados CV menor tem uma variabilidade relativa menor. Suponha que você ganha 10000 mensalmente e eu ganho 100. (média diferente), todos provavelmente perdemos 100 mensais (variação), vou me machucar muito mais do que você, pois recebo um CV maior (cv = 1 comparado ao seu 0,01), relativo maior variação.
fonte
neste caso, cv não é a ferramenta estatística certa para explicar o resultado.
dependendo da natureza da pesquisa realizada, portanto, o objetivo, o pesquisador tem uma hipótese específica ou um ponto a ser comprovado. Ele ou ela deve projetar, executar o experimento e analisar os dados usando a melhor e mais apropriada ferramenta estatística, ou seja, se o experimento for comparar o crescimento do grupo 1 e do grupo 2, embora cv de ambos sejam iguais, mas usando o teste T ou T- teste ou Anova (experimento maior), poderia facilmente provar a diferença entre os dois grupos.
A chave aqui é aplicar a ferramenta estatística apropriada para fornecer uma explicação significativa sobre o resultado. Lembre-se de que cv é apenas uma das opções na estatística descritiva.
meus 2 centavos
fonte