Em uma distribuição normal, a regra 68-95-99.7 dá muito significado ao desvio padrão, mas o que o desvio padrão significaria em uma distribuição não normal (multimodal ou distorcida)? Todos os valores de dados ainda estão dentro de 3 desvios padrão? Temos regras como a 68-95-99.7 para distribuições não normais?
normal-distribution
standard-deviation
skewness
Zuhaib Ali
fonte
fonte
Respostas:
O desvio padrão é uma medida específica da variação. Existem vários outros, Desvio médio absoluto é bastante popular. O desvio padrão não é de forma alguma especial. O que faz parecer especial é que a distribuição gaussiana é especial.
Como apontado nos comentários, a desigualdade de Chebyshev é útil para obter um sentimento. No entanto, há mais .
fonte
É a raiz quadrada do segundo momento central , a variação. Os momentos estão relacionados às funções características (CF), que são chamadas de características por uma razão que definem a distribuição de probabilidade. Portanto, se você conhece todos os momentos, conhece CF, portanto, conhece toda a distribuição de probabilidades.
A função característica da distribuição normal é definida por apenas dois momentos: média e variância (ou desvio padrão). Portanto, para a distribuição normal, o desvio padrão é especialmente importante, é 50% da sua definição de uma maneira.
Para outras distribuições, o desvio padrão é, de certa forma, menos importante porque eles têm outros momentos. No entanto, para muitas distribuições usadas na prática, os primeiros momentos são os maiores, portanto são os mais importantes a serem conhecidos.
Agora, intuitivamente, a média indica onde está o centro da sua distribuição, enquanto o desvio padrão indica o quão perto deste centro estão os seus dados.
Como o desvio padrão está nas unidades da variável, ele também é usado para dimensionar outros momentos para obter medidas como a curtose . A curtose é uma métrica adimensional que indica a gordura da cauda de sua distribuição em comparação com a normal
fonte
O desvio padrão da amostra é uma medida do desvio dos valores observados da média, nas mesmas unidades para medir os dados. Distribuição normal ou não.
fonte