Portanto, há desvio padrão, variância e covariância, mas existe um desvio padrão?
Se não, por que não? Existe uma razão matemática fundamental ou é apenas uma convenção?
Em caso afirmativo, por que não é usado mais ou pelo menos é realmente difícil de encontrar usando as pesquisas do Google?
Não pretendo que seja uma pergunta irreverente, estou tentando realmente questionar as estatísticas, em vez de apenas memorizar um monte de fórmulas.
variance
standard-deviation
covariance-matrix
canyon289
fonte
fonte
Respostas:
Uma propriedade útil do desvio padrão é que ele tem as mesmas unidades que a média, portanto as magnitudes de e são diretamente comparáveis. Eu nunca vi alguém calcular o desvio padrão (pelo qual suponho que você quer dizer a raiz quadrada da covariância); se as unidades de e são indicadas como e , as unidades de covariância são e as unidades do desvio padrão são , o que não é particularmente útil. Por outro lado, a correlaçãoˉ X X Y [ X ] [ Y ] [ X ] [ Y ] √σX X¯ X Y [X] [Y] [X][Y] σ X Y /(σXσY)[X][Y]−−−−−√ σXY/(σXσY) é sem unidade e é uma escala muito comum para relatar associações.
A variação (em contraste com o desvio padrão) é útil porque geralmente possui propriedades matemáticas mais agradáveis; em particular
X Y σ X Y = 0
Enquanto você pensa em maneiras de escalar variações, você também pode considerar o coeficiente de variação (que não possui unidades) ou a proporção da variação para a média (que possui características estranhas unidades, mas é significativo no contexto de uma distribuição de contagem como o Poisson, que também é sem unidade). σ 2 X / ˉ XσX/X¯ σ2X/X¯
fonte
A questão parece invertida. Em matemática, não inventamos nomes para quantidades "apenas porque podemos", mas porque a quantidade nomeada é útil para alguma coisa.
A pergunta do OP não explica e explica porque ele acha que existe uma quantidade útil que pode ser chamada de "desvio padrão" e que as respostas estão adivinhando coisas que podem ser úteis.
Para generalizar o conceito para regressão linear multivariável com variáveis, a "covariância" se torna uma matriz simétrica . Você certamente pode fazer uma definição sensata da "raiz quadrada de uma matriz simétrica" desde que seja definida positiva ou semi-definida, mas é difícil pensar em um uso para ela nesse contexto - e não é a mesma coisa tomando a raiz quadrada de cada termo da matriz separadamente!n × nn n×n
É claro que a raiz quadrada de uma matriz diagonal (por exemplo, a matriz de variância) é apenas a raiz quadrada dos termos individuais; portanto, o conceito de "desvio padrão" generaliza de maneira óbvia e útil - mas o "desvio padrão" não IMO. E, em geral, a "raiz quadrada de uma matriz" não é definida de maneira única, então qual raiz quadrada específica você deseja escolher como desvio padrão?
fonte
A covariância pode ser positiva e negativa.
Portanto, a raiz quadrada da covariância pode ser real ou imaginária.
Você pode comparar um número real com um número imaginário para o tamanho. As unidades para "co-desvio padrão" seriam inconvenientes. Não há benefício em obter a raiz quadrada.
fonte