Como interpretar o coeficiente de variação?

33

Estou tentando entender o coeficiente de variação . Quando tento aplicá-lo aos dois exemplos de dados a seguir, não consigo entender como interpretar os resultados.

Digamos que a amostra 1 seja e a amostra 2 seja . Aqui amostra 2 amostra 1 como você pode ver., 10 , 15 , 17 , 22 , 21 , 27 = + 100,5,7,12,11,1710,15,17,22,21,27=+ 10

Ambos têm o mesmo desvio padrão mas e .μ 2 = 18,67 μ 1 = 8,66667σ2=σ1=5.95539μ2=18.67μ1=8.66667

Agora o coeficiente de variação será diferente. Para a amostra 2, será menor que para a amostra 1. Mas como interpreto esse resultado? Em termos de variação, ambos são iguais; apenas seus meios são diferentes. Então, qual é a utilidade do coeficiente de variação aqui? Isso está me enganando, ou talvez eu não consiga interpretar os resultados.σ/μ

Durin
fonte
Se, em vez de adicionar 10, você adicionar 1000, o segundo conjunto de números diferirá muito menos, em relação à média, do que o primeiro conjunto. O coeficiente de variação é uma expressão disso.
Muito relacionado: stats.stackexchange.com/questions/113437/… .
whuber

Respostas:

42

Em exemplos como o seu, quando os dados diferem apenas de forma aditiva, ou seja, adicionamos alguma constante a tudo, então, como você indica que o desvio padrão é inalterado, a média é alterada exatamente pela constante e, portanto, o coeficiente de variação muda de σ / μ para σ / ( μ + k ) , o que não é interessante nem útil.kσ/μσ/(μ+k)

É uma mudança multiplicativa que é interessante e onde o coeficiente de variação tem alguma utilidade. Multiplicar tudo por alguma constante implica que o coeficiente de variação se torne k σ / k μ , ou seja, permaneça o mesmo de antes. A mudança de unidades de medida é um exemplo, como nas respostas de @Aksalal e @Macond.kkσ/kμ

Como o coeficiente de variação é isento de unidades, também é isento de dimensões, pois quaisquer unidades ou dimensões possuídas pela variável subjacente são lavadas pela divisão. Isso faz do coeficiente de variação uma medida da variabilidade relativa , de modo que a variabilidade relativa dos comprimentos pode ser comparada à dos pesos e assim por diante. Um campo em que o coeficiente de variação encontrou algum uso descritivo é a morfometria do tamanho do organismo na biologia.

Em princípio e prática, o coeficiente de variação é definido apenas de forma completa e útil para variáveis ​​totalmente positivas. Portanto, em detalhes, sua primeira amostra com o valor não é um exemplo apropriado. Outra maneira de ver isso é notar que, se a média sempre zero, o coeficiente seria indeterminado e se a média sempre negativa, o coeficiente seria negativo, assumindo no último caso que o desvio padrão seja positivo. Qualquer um dos casos tornaria a medida inútil como medida de variabilidade relativa, ou mesmo para qualquer outro propósito. 0

Uma declaração equivalente é que o coeficiente de variação é interessante e útil apenas se os logaritmos forem definidos da maneira usual para todos os valores e, de fato, o uso de coeficientes de variação for equivalente a observar a variabilidade dos logaritmos.

0

Como no caso dos exemplos bizarros da climatologia, que deixo sem referência, pois os autores não merecem nem o crédito nem a vergonha, o coeficiente de variação foi superutilizado em alguns campos. Ocasionalmente, há uma tendência a considerá-lo como uma espécie de medida de resumo mágico que encapsula a média e o desvio padrão. Esse é um pensamento naturalmente primitivo, pois mesmo quando a razão faz sentido, a média e o desvio padrão não podem ser recuperados.

Nas estatísticas, o coeficiente de variação é um parâmetro bastante natural se a variação segue a gama ou o lognormal, como pode ser visto observando a forma do coeficiente de variação para essas distribuições.

Embora o coeficiente de variação possa ser útil, nos casos em que se aplica, a etapa mais útil é trabalhar em escala logarítmica, seja por transformação logarítmica ou usando uma função de link logarítmico em um modelo linear generalizado.

σ/|μ|

Nick Cox
fonte
3
+1 Este post inclui os principais pontos sobre logaritmos e positividade que devem fazer parte de qualquer discussão sobre o assunto. As "histórias de guerra" também fazem uma boa leitura.
whuber
Eu pensei que você não poderia calcular CV se uma variável é = 0?
11
@ Jerf: Pense bem. Se todos os valores forem 0, não haverá variação e nada a ser calculado. Não há problema apenas porque alguns valores individuais são 0, pois ele próprio não descarta a média igual a 0. No entanto, você sempre pode encontrar exemplos em que alguns valores não são zero e a média é 0, por exemplo, -1, 0, 1 em Nesse caso, o CV é indeterminado. Mas, na prática, o CV é mais útil quando todos os valores são positivos.
Nick Cox
13

Imagine que eu disse: "Existem 1.625.330 pessoas nesta cidade. Mais ou menos cinco". Você ficaria impressionado com meu conhecimento demográfico preciso.

Mas se eu dissesse "Há cinco pessoas nesta casa. Mais ou menos cinco". Você pensaria que eu não tinha idéia de quantas pessoas estavam na casa.

Mesmo desvio padrão, currículos muito diferentes.

Bart
fonte
11
Essa é uma maneira razoável de explicar o que é o CoV, mas não está claro o quão relevante é para a pergunta do OP.
gung - Restabelece Monica
O OP pergunta: "Em termos de variação, ambos são iguais; apenas seus meios são diferentes. Então, qual é a utilidade do coeficiente de variação aqui?" Eu acho que meu exemplo ilustra o uso do CV como uma maneira de interpretar a variação.
Bart Bart
11
Eu não te votei. As 2 perguntas explícitas do OP são: "como interpreto esse resultado?" E "para que serve o coeficiente de variação aqui?". Sua explicação é boa, mas entender o que é o CoV é apenas o primeiro passo para responder a essas perguntas, não toda a resposta a essas perguntas.
gung - Restabelece Monica
4

Normalmente, você usa o coeficiente de variação para variáveis ​​de diferentes unidades de medida ou escalas muito diferentes. Você pode pensar nisso como uma relação ruído / sinal. Por exemplo, você pode comparar a variabilidade do peso e da altura dos alunos; variabilidade do PIB dos EUA e Mônaco.

No seu caso, o coeficiente de variação pode não fazer muito sentido, uma vez que os valores não são muito diferentes.

Aksakal
fonte
2

s/x¯

Macond
fonte
2

Na realidade, ambas as estatísticas podem ser enganosas se você não souber ou entender suas hipóteses e experiências. Considere este exemplo horrível ... Atravessando dois prédios altos em uma corda bamba, em vez de andar em uma prancha. Digamos que a corda bamba tenha um diâmetro de 1 polegada, enquanto a prancha tem 12 polegadas de largura. 5 pessoas foram convidadas a andar na corda e 5 foram convidadas a andar na prancha. Encontramos os seguintes resultados:

A distância média de cada passo da borda (ou lateral) da corda (polegadas): 0,5, 0,2, 0,3, 0,6, 0,1

A distância média de cada passo da borda (ou lateral) da prancha (polegadas): 5.5, 5.2, 5.3, 5.6, 5.1

Assim como no seu exemplo, este exemplo resultará em desvios padrão iguais, pois os valores da prancha são simplesmente uma diferença de +5 em relação aos da corda bamba. No entanto, se eu lhe dissesse que o desvio padrão para cada experimento era 0,2074, você poderia dizer bem, então os dois experimentos eram equivalentes. No entanto, se eu lhe dissesse que o CV do experimento na corda bamba era quase 61% em comparação com menos de 4% na prancha, você pode estar inclinado a me perguntar quantas pessoas caíram da corda.

user62371
fonte
0

CV é uma variabilidade relativa usada para comparar a variabilidade de diferentes conjuntos de dados de amostra. Para um exemplo, o mesmo desvio / variação padrão com média menor gerará um CV menor. indica que um conjunto de dados CV menor tem uma variabilidade relativa menor. Suponha que você ganha 10000 mensalmente e eu ganho 100. (média diferente), todos provavelmente perdemos 100 mensais (variação), vou me machucar muito mais do que você, pois recebo um CV maior (cv = 1 comparado ao seu 0,01), relativo maior variação.

Sun Ke
fonte
11
Devo dizer que isso não adiciona nada às respostas existentes.
Nick Cox
0

neste caso, cv não é a ferramenta estatística certa para explicar o resultado.

dependendo da natureza da pesquisa realizada, portanto, o objetivo, o pesquisador tem uma hipótese específica ou um ponto a ser comprovado. Ele ou ela deve projetar, executar o experimento e analisar os dados usando a melhor e mais apropriada ferramenta estatística, ou seja, se o experimento for comparar o crescimento do grupo 1 e do grupo 2, embora cv de ambos sejam iguais, mas usando o teste T ou T- teste ou Anova (experimento maior), poderia facilmente provar a diferença entre os dois grupos.

A chave aqui é aplicar a ferramenta estatística apropriada para fornecer uma explicação significativa sobre o resultado. Lembre-se de que cv é apenas uma das opções na estatística descritiva.

meus 2 centavos

lokmal
fonte