Calcular a variação sem calcular a média

7

Podemos calcular a variância sem usar a média como o ponto 'base'?

Vai
fonte
3
Dado , a variação é dada por por definição. O formulário simplifica para . Ou seja, para a variação você precisa . Claro que você pode definir sua própria medida de dispersão usando alguma outra estatística ... ou usar uma das respostas. E(X2)<σ2=E((XE(X))2)σ2=E(X2)E(X)2E(X)
BloXX 26/03/19
5
Resposta curta: Muitas outras maneiras de resumir a variabilidade (dispersão, dispersão, escala), mas nenhuma das outras seria a variação. (Na verdade, a variação pode ser definida sem referência à média.)
Nick Cox
3
Sim: dados dados calcule a covariância de conforme descrito em stats.stackexchange.com/a/18200/919 . Este método nunca calcula a média. X,(X,X)
whuber

Respostas:

12

O desvio absoluto mediano é definido como e é considerado uma alternativa ao desvio padrão. Mas essa não é a variação. Em particular, ele sempre existe, independentemente de o permitir ou não momentos. Por exemplo, o MAD de um Cauchy padrão é igual a um, pois

MAD(X)=median|Xmedian(X)|
X
P(|X0|<1)0 is the median=arctan(1)/πarctan(1)/π=12

Xi'an
fonte
7
Os recém-chegados a essa idéia devem observar também o desvio médio absoluto da média (desvio médio, frequentemente) e o desvio absoluto médio da média. Não me lembro do desvio absoluto médio da mediana, mas estou aberto a exemplos. A abreviação MAD, infelizmente, foi aplicada de várias maneiras; portanto, confie no código das pessoas primeiro, depois em sua definição algébrica ou verbal, mas o uso de uma abreviação MAD apenas de maneira alguma. Nas distribuições simétricas e em outras, o MAD, conforme definido aqui, é metade da faixa interquartil. (Fazendo um trocadilho com MAD eu resisto como um pouco demasiado óbvio.)
Nick Cox
3
Além disso, observe que as implementações de software da função média do desvio absoluto podem escalar o valor MAD por um fator constante da forma apresentada nesta resposta, para que seu valor coincida com o desvio padrão para uma distribuição normal.
EdM
@ Edm Excelente ponto. Pessoalmente, não gosto dessa prática, a menos que as pessoas usem algum termo diferente. Já não é o MAD!
Nick Cox
11
@NickCox: o apelo de centralizar na mediana é que a quantidade sempre existe, independentemente de a distribuição gozar de uma média. Esta é a definição encontrada na Wikipedia .
Xian
MAD é destruição mútua assegurada
Kjetil b Halvorsen
3

Já existe uma solução para esta pergunta no Math.stackexchange :

Resumo as respostas:

  1. Você pode usar que a variação seja , que recebe apenas uma passagem (calculando a média e a média dos quadrados simultaneamente), mas pode ser mais propensa a erros de arredondamento se a variação é pequena em comparação com a média.x2¯x¯2

  1. Que tal a soma das diferenças quadradas aos pares? De fato, você pode verificar por computação direta que

2vX=1n(n1)1i<jn(xixj)2.


  1. A variação da amostra sem média é calculada como:
    vX=1n1[i=1nxi21n(i=1nxi)2]
Ferdi
fonte