O desvio padrão é uma coisa?

8

Portanto, há desvio padrão, variância e covariância, mas existe um desvio padrão?

Se não, por que não? Existe uma razão matemática fundamental ou é apenas uma convenção?

Em caso afirmativo, por que não é usado mais ou pelo menos é realmente difícil de encontrar usando as pesquisas do Google?

Não pretendo que seja uma pergunta irreverente, estou tentando realmente questionar as estatísticas, em vez de apenas memorizar um monte de fórmulas.

canyon289
fonte
1
Você poderia esclarecer o que você acha que um "desvio padrão" representaria? Existe alguma motivação subjacente, ou você está apenas perguntando (em um sentido meta) se pode haver algum significado universal para acrescentar "co" ao nome de qualquer estatística?
whuber
1
Suponho que o OP esteja generalizando a partir da variância: covariância :: desvio padrão: "desvio padrão", mas não faria mal à pergunta ser mais explícita (supondo que eles realmente signifiquem ) σXY
precisa

Respostas:

12

Uma propriedade útil do desvio padrão é que ele tem as mesmas unidades que a média, portanto as magnitudes de e são diretamente comparáveis. Eu nunca vi alguém calcular o desvio padrão (pelo qual suponho que você quer dizer a raiz quadrada da covariância); se as unidades de e são indicadas como e , as unidades de covariância são e as unidades do desvio padrão são , o que não é particularmente útil. Por outro lado, a correlaçãoˉ X X Y [ X ] [ Y ] [ X ] [ Y ] σXX¯XY[X][Y][X][Y] σ X Y /(σXσY)[X][Y] σXY/(σXσY) é sem unidade e é uma escala muito comum para relatar associações.

A variação (em contraste com o desvio padrão) é útil porque geralmente possui propriedades matemáticas mais agradáveis; em particular

X Y σ X Y = 0

σX+Y2=σX2+σY2+2σXY,
que simplifica bastante quando e são independentes (daí ).XYσXY=0

Enquanto você pensa em maneiras de escalar variações, você também pode considerar o coeficiente de variação (que não possui unidades) ou a proporção da variação para a média (que possui características estranhas unidades, mas é significativo no contexto de uma distribuição de contagem como o Poisson, que também é sem unidade). σ 2 X / ˉ XσX/X¯σX2/X¯

Ben Bolker
fonte
3
Bons pontos, mas não parece responder por que criar raízes quadradas de covariância não faz sentido.
Tim
3
Aqui está uma maneira de explorar sua fórmula: use-a para observar que a covariância pode ser definida comoEntão, por que não simplesmente definir um "co-SD" - vamos chamá-lo , digamos - comoIsso sugere a dificuldade de responder à pergunta original sem saber o que o "co" de qualquer coisa pode significar: você não pode demonstrar muita coisa apenas mostrando que uma generalização em particular é absurda ou inútil; você deve considerar todas as formas possíveis de generalizar um conceito! τ τ X Y = ( σ X + Y - σ X - σ Y ) / 2 ?
σXY=(σX+Y2σX2σY2)/2.
τ
τXY=(σX+YσXσY)/2?
whuber
5

A questão parece invertida. Em matemática, não inventamos nomes para quantidades "apenas porque podemos", mas porque a quantidade nomeada é útil para alguma coisa.

A pergunta do OP não explica e explica porque ele acha que existe uma quantidade útil que pode ser chamada de "desvio padrão" e que as respostas estão adivinhando coisas que podem ser úteis.

Para generalizar o conceito para regressão linear multivariável com variáveis, a "covariância" se torna uma matriz simétrica . Você certamente pode fazer uma definição sensata da "raiz quadrada de uma matriz simétrica" ​​desde que seja definida positiva ou semi-definida, mas é difícil pensar em um uso para ela nesse contexto - e não é a mesma coisa tomando a raiz quadrada de cada termo da matriz separadamente!n × nnn×n

É claro que a raiz quadrada de uma matriz diagonal (por exemplo, a matriz de variância) é apenas a raiz quadrada dos termos individuais; portanto, o conceito de "desvio padrão" generaliza de maneira óbvia e útil - mas o "desvio padrão" não IMO. E, em geral, a "raiz quadrada de uma matriz" não é definida de maneira única, então qual raiz quadrada específica você deseja escolher como desvio padrão?

alephzero
fonte
4

A covariância pode ser positiva e negativa.

Portanto, a raiz quadrada da covariância pode ser real ou imaginária.

Você pode comparar um número real com um número imaginário para o tamanho. As unidades para "co-desvio padrão" seriam inconvenientes. Não há benefício em obter a raiz quadrada.

James K
fonte
e veja a resposta de Ben.
James K