Não consigo encontrar uma resposta definitiva para minha pergunta.
Meus dados consistem em vários gráficos com médias medidas variando de 0,27 a 0,57. No meu caso, todos os valores de dados são positivos, mas a medida em si é baseada em uma razão de valores de refletância que pode variar de -1 a +1. As parcelas representam valores do NDVI , um indicador derivado remotamente da "produtividade" da vegetação.
Minha intenção era comparar a variabilidade dos valores em cada parcela, mas como cada parcela possui uma média diferente, optei por usar o CV para medir a dispersão relativa dos valores de NDVI por parcela.
Pelo que entendi, tirar o CV desses gráficos não é kosher porque cada gráfico pode ter valores positivos e negativos. Por que não é apropriado usar o CV nesses casos? Quais seriam algumas alternativas viáveis (isto é, teste semelhante de dispersão relativa, transformações de dados etc.)?
fonte
Respostas:
Pense no que é CV: Proporção do desvio padrão em relação à média. Mas se a variável puder ter valores positivos e negativos, a média poderá estar muito próxima de 0; assim, o CV não faz mais o que deveria: ou seja, dê uma noção do tamanho do sd, comparado à média.
EDIT: Em um comentário, eu disse que se você pudesse adicionar sensivelmente uma constante à variável, o CV não seria bom. Aqui está um exemplo:
x2 é simplesmente x + 10. Eu acho intuitivamente claro que eles são igualmente variáveis; mas o CV é diferente.
Um exemplo real disso seria se x fosse a temperatura em graus C e x2 fosse a temperatura em graus K (embora se possa argumentar que K é a escala adequada, uma vez que possui um 0 definido).
fonte
Penso neles como diferentes modelos de variação. Existem modelos estatísticos em que o CV é constante. Onde esses trabalhos, pode-se reportar um currículo. Existem modelos em que o desvio padrão é uma função de potência da média. Existem modelos em que o desvio padrão é constante. Como regra, um modelo de CV constante é um palpite inicial melhor do que um modelo de SD constante, para variáveis de escala de proporção. Você pode especular por que isso seria verdade, talvez com base na prevalência de interações multiplicativas em vez de aditivas.
A modelagem de CV constante é frequentemente associada à transformação logarítmica. (Uma exceção importante é uma resposta não negativa que às vezes é zero.) Existem algumas maneiras de analisar isso. Primeiro, se o CV é constante, os logs são a transformação convencional de estabilização de variância. Como alternativa, se o seu modelo de erro for lognormal com SD constante na escala de log, o CV será uma transformação simples desse SD. O CV é quase igual ao SD em escala de log quando ambos são pequenos.
Duas maneiras de aplicar métodos estatísticos 101, como um desvio padrão, são os dados da maneira que você os obteve ou (especialmente se houver escala de proporção) em seus logs. Você faz o melhor primeiro palpite: pode saber que a natureza pode ser um pouco mais complicada e que mais estudos podem estar em ordem. Leve em consideração o que as pessoas consideraram produtivas anteriormente com seu tipo de dados.
Aqui está um caso em que essas coisas são importantes. Às vezes, as concentrações químicas são resumidas com CV ou modeladas em escala logarítmica. No entanto, o pH é uma concentração logarítmica.
fonte