Por que as distribuições médias 0 e desvio padrão 1 são sempre usadas?

15

Minhas estatísticas foram autodidatas, mas muitos materiais que li apontam para um conjunto de dados com média 0 e desvio padrão de 1.

Se for esse o caso, então:

  1. Por que a média 0 e o SD 1 são uma boa propriedade?

  2. Por que uma variável aleatória retirada desta amostra é igual a 0,5? A chance de desenhar 0,001 é igual a 0,5, portanto deve ser uma distribuição plana ...

  3. Quando as pessoas falam sobre o Z Scores, o que elas realmente significam aqui?

Jack Kada
fonte

Respostas:

11
  1. No início, a resposta mais útil é provavelmente que a média de 0 e o sd de 1 são matematicamente convenientes. Se você puder calcular as probabilidades de uma distribuição com média de 0 e desvio padrão de 1, poderá calculá-las para qualquer distribuição semelhante de pontuações com uma equação muito simples.

  2. Não estou seguindo esta pergunta. A média de 0 e o desvio padrão de 1 geralmente se aplicam à distribuição normal padrão, geralmente chamada de curva de sino. O valor mais provável é a média e ela cai à medida que você se afasta. Se você tem uma distribuição realmente plana, não há valor mais provável que outro. Sua pergunta aqui está mal formada. Você estava olhando para perguntas sobre lançamentos de moedas, talvez? Procure a distribuição binomial e o teorema do limite central.

  3. "significa aqui"? Onde? A resposta simples para os escores z é que eles são suas pontuações dimensionadas como se sua média fosse 0 e o desvio padrão fosse 1. Outra maneira de pensar sobre isso é que ela recebe uma pontuação individual, pois o número de desvios padrão que essa pontuação é significar. A equação está calculando a (pontuação média) / desvio padrão. As razões pelas quais você faz isso são bastante variadas, mas uma é que, nos cursos de introdução à estatística, há tabelas de probabilidades para diferentes escores z (consulte a resposta 1).

Se você pesquisasse primeiro o z-score, mesmo na wikipedia, teria obtido boas respostas.

John
fonte
Em 2) acredito que a confusão é o que p (X = 0,01) significa quando X é uma variável aleatória contínua. Intuitivamente, a probabilidade parece ser zero em todos os lugares, porque não há chance de X ser exatamente 0,01. O questionador deve revisar a definição de uma função de densidade no caso contínuo, que é definido como a derivada da função de densidade cumulativa.
Tristan
7

Para começar, o que estamos falando aqui é a distribuição normal padrão, uma distribuição normal com média de 0 e desvio padrão de 1. O atalho para uma variável que é distribuída como distribuição normal padrão é Z.

Aqui estão minhas respostas para suas perguntas.

(1) Acho que há duas razões principais pelas quais as distribuições normais padrão são atraentes. Primeiramente, qualquer variável normalmente distribuída pode ser convertida ou transformada em um normal padrão subtraindo sua média de cada observação antes de dividir cada observação pelo desvio padrão. Isso é chamado de transformação Z ou a criação de escores Z. Isso é muito útil, especialmente nos dias anteriores aos computadores.

(xEu-x¯)σx=Z(75-65,6)10,2=0,9215

A segunda razão pela qual a distribuição normal padrão é usada com freqüência é devido à interpretação fornecida em termos de escores-Z. Cada "observação" em uma variável transformada em Z é quantos desvios padrão a observação original não transformada foi da média. Isso é particularmente útil para testes padronizados em que o desempenho bruto ou absoluto é menos importante que o desempenho relativo.

(2) Eu não sigo você aqui. Eu acho que você pode estar confuso quanto ao que queremos dizer com função de distribuição cumulativa. Observe que o valor esperado de uma distribuição normal padrão é 0 e esse valor corresponde ao valor de 0,5 na função de distribuição cumulativa associada.

(xEu-x¯)σx=Z(75-65,6)10,2=0,9215
Graham Cookson
fonte
1

Como você recebeu excelentes explicações de Graham e John, vou responder sua última pergunta:

Quando as pessoas falam sobre o Z Scores, o que elas realmente significam aqui?

μσ

Então: (65-80) / 5 = -3

Você pode dizer que o escore z da nota 65 é -3 ; ou em outras palavras, 3 desvio padrão para a esquerda.

adhg
fonte