O que o desvio padrão nos diz na distribuição não normal

40

Em uma distribuição normal, a regra 68-95-99.7 dá muito significado ao desvio padrão, mas o que o desvio padrão significaria em uma distribuição não normal (multimodal ou distorcida)? Todos os valores de dados ainda estão dentro de 3 desvios padrão? Temos regras como a 68-95-99.7 para distribuições não normais?

Zuhaib Ali
fonte
16
Veja a desigualdade de Chebyshev .
COOLSerdash
@COOLSerdash great. Isso responde perfeitamente à minha pergunta.
Zuhaib Ali 20/07
3
O ponto do @COOLSerdash está no alvo aqui, mas lembre-se de que a declaração padrão da desigualdade de Chebyshev se refere ao verdadeiro SD conhecido a priori, não a um SD estimado a partir da sua amostra. Pode ser útil
gung - Restabelece Monica
Além disso, você provavelmente não deve se contentar com Chebyshev imediatamente - você provavelmente pode fazer muito melhor, distorcido ou não.
21714 Steve
1
@gung o mesmo acontece com a regra 68-95-99.7!
Glen_b -Reinstala Monica

Respostas:

12

O desvio padrão é uma medida específica da variação. Existem vários outros, Desvio médio absoluto é bastante popular. O desvio padrão não é de forma alguma especial. O que faz parecer especial é que a distribuição gaussiana é especial.

Como apontado nos comentários, a desigualdade de Chebyshev é útil para obter um sentimento. No entanto, há mais .

Keith
fonte
9

É a raiz quadrada do segundo momento central , a variação. Os momentos estão relacionados às funções características (CF), que são chamadas de características por uma razão que definem a distribuição de probabilidade. Portanto, se você conhece todos os momentos, conhece CF, portanto, conhece toda a distribuição de probabilidades.

A função característica da distribuição normal é definida por apenas dois momentos: média e variância (ou desvio padrão). Portanto, para a distribuição normal, o desvio padrão é especialmente importante, é 50% da sua definição de uma maneira.

Para outras distribuições, o desvio padrão é, de certa forma, menos importante porque eles têm outros momentos. No entanto, para muitas distribuições usadas na prática, os primeiros momentos são os maiores, portanto são os mais importantes a serem conhecidos.

Agora, intuitivamente, a média indica onde está o centro da sua distribuição, enquanto o desvio padrão indica o quão perto deste centro estão os seus dados.

Como o desvio padrão está nas unidades da variável, ele também é usado para dimensionar outros momentos para obter medidas como a curtose . A curtose é uma métrica adimensional que indica a gordura da cauda de sua distribuição em comparação com a normal

Aksakal
fonte
1
"Agora, intuitivamente, a média indica onde está o centro da sua distribuição, enquanto o desvio padrão indica o quão perto deste centro estão os seus dados." - Isso não se aplicaria apenas se a distribuição for Normal? Caso contrário, na maioria das vezes, a mediana é uma medida melhor da tendência central.
Dan Temkin
@ DanTemkin Ao usar a mediana, o desvio padrão perde seu valor em um grau. É calculado fora da média. Com a mediana, faz sentido falar sobre quantis, o que poderia ser um caminho a percorrer com distribuições distorcidas. O OP não se concentrou em distribuições assimétricas. Portanto, para qualquer distribuição simétrica você tem média = mediana, ela não tem que ser normal. Portanto, faz sentido falar de média quando se discute o desvio padrão.
Aksakal
4

O desvio padrão da amostra é uma medida do desvio dos valores observados da média, nas mesmas unidades para medir os dados. Distribuição normal ou não.

Alexis
fonte