Qual é a diferença entre variância e desvio padrão?

127

Eu queria saber qual é a diferença entre a variância e o desvio padrão.

Se você calcular os dois valores, fica claro que você obtém o desvio padrão da variação, mas o que isso significa em termos da distribuição que você está observando?

Além disso, por que você realmente precisa de um desvio padrão?

Le Max
fonte
12
Você provavelmente já recebeu a resposta agora. Ainda este link tem a explicação mais simples e melhor. mathsisfun.com/data/standard-deviation.html
2
O desvio padrão é útil, pois o valor está na mesma escala dos dados a partir dos quais foram calculados. Ao medir metros, o desvio padrão será metros. A variação, em contraste, será em metros quadrados.
Vladislavs Dovgalecs 8/11
11
A variação padrão pode ser imparcial, mas o desvio padrão não pode porque a função de raiz quadrada não é linear.
Daksh Gargas 20/09

Respostas:

85

O desvio padrão é a raiz quadrada da variação.

O desvio padrão é expresso nas mesmas unidades que a média, enquanto a variação é expressa em unidades ao quadrado, mas, para examinar uma distribuição, você pode usá-lo desde que esteja claro sobre o que está usando. Por exemplo, uma distribuição Normal com média = 10 e sd = 3 é exatamente a mesma coisa que uma distribuição Normal com média = 10 e variação = 9.

Peter Flom
fonte
58
Sim, essa é a maneira matemática de explicar esses dois parâmetros, mas qual é a explicação lógica? Por que eu realmente preciso de dois parâmetros para mostrar a mesma coisa (o desvio em torno da média aritmética) ... #
Le Max
5
Você realmente não precisa dos dois. Se você denuncia um, não precisa denunciar o outro
Peter Flom
8
Precisamos de ambos: o desvio padrão é bom para interpretação, geração de relatórios. Para desenvolver a teoria, a variação é melhor.
Kjetil b halvorsen
4
O benefício de relatar o desvio padrão é que ele permanece na escala de dados. Digamos, uma amostra de alturas de adultos esteja em metros, e o desvio padrão também será em metros.
Vladislavs Dovgalecs
5
Vumar(XEu)=Vumar(XEu)
49

Você não precisa dos dois. Cada um deles tem finalidades diferentes. O SD é geralmente mais útil para descrever a variabilidade dos dados, enquanto a variação é geralmente muito mais útil matematicamente. Por exemplo, a soma das distribuições não correlacionadas (variáveis ​​aleatórias) também possui uma variação que é a soma das variações dessas distribuições. Isso não seria verdade para o SD. Por outro lado, o SD tem a conveniência de ser expresso em unidades da variável original.

John
fonte
24

Se John se refere a variáveis ​​aleatórias independentes quando diz "distribuições não relacionadas", sua resposta está correta. No entanto, para responder à sua pergunta, há vários pontos que podem ser adicionados:

  1. A média e a variância são os dois parâmetros que determinam uma distribuição normal.

  2. k

  3. z0 0t

  4. 68%1 195,4%299%3

  5. A margem de erro é expressa como um múltiplo do desvio padrão da estimativa.

  6. Variância e viés são medidas de incerteza em quantidade aleatória. O erro quadrático médio para uma estimativa é igual à variância + ao viés quadrado.

Michael Chernick
fonte
4
Você provavelmente não deve dizer "parâmetro natural", que é dividido em média por variância e 1 dividido por variância: en.wikipedia.org/wiki/Natural_parameter
Neil G
σ
No ponto 3, não deveria ser "desvio padrão usado para padronizar estatísticas" em vez de normalizar?
Harry
15

A variação de um conjunto de dados mede a dispersão matemática dos dados em relação à média. No entanto, embora esse valor seja teoricamente correto, é difícil aplicar no sentido do mundo real porque os valores usados ​​para calculá-lo foram elevados ao quadrado. O desvio padrão, como a raiz quadrada da variação, fornece um valor que está nas mesmas unidades que os valores originais, o que facilita muito o trabalho e a interpretação em conjunto com o conceito da curva normal.

Hassan
fonte
Isso faz um ótimo trabalho explicando o porquê em termos simples.
gwg 16/05
3
Outro bom ponto a ser destacado é que cada métrica sd e var medem a propagação da variável sobre a média. Tomar a raiz quadrada da variação para obter o desvio padrão pode ser visto como um fator de escala aplicado para obter a métrica de volta às unidades da variável.
Matt L.
6

Em termos de distribuição, eles são equivalentes (mas obviamente não são intercambiáveis), mas lembre-se de que, em termos de estimadores, não são: a raiz quadrada de uma estimativa da variação NÃO é um estimador (imparcial) do desvio padrão. Somente para um número moderadamente grande de amostras (e dependendo dos estimadores) as duas se aproximam. Para amostras pequenas, é necessário conhecer a forma paramétrica da distribuição para converter entre as duas, que pode se tornar um pouco circular.

Quartzo
fonte
4

Ao calcular a variância, elevamos ao quadrado os desvios. Isso significa que, se os dados fornecidos (observações) estiverem em metros, eles se tornarão metros quadrados. Espero que não seja uma representação correta sobre os desvios. Então, nós raiz quadrada novamente (SD) que nada mais é do que SD.

g ravi
fonte