Eu tenho uma pergunta na qual ele pede para verificar se a distribuição Uniform ( ) está normalizada.
- Por um lado, o que significa que qualquer distribuição seja normalizada?
- E segundo, como vamos verificar se uma distribuição é normalizada ou não?
Entendo que ao calcular obtemos dados normalizados , mas aqui está pedindo para verificar se uma distribuição está normalizada ou não.
Respostas:
Infelizmente, os termos são usados de maneira diferente em campos diferentes, por pessoas diferentes dentro do mesmo campo etc., portanto, não tenho certeza de como isso pode ser respondido aqui. Você deve ter certeza de que conhece a definição que seu instrutor / livro está usando para "normalizado". No entanto, aqui estão algumas definições comuns:
Centralizado: Padronizado: Normalizado: normalização nesse sentido redimensiona seus dados para o intervalo da unidade. A padronização transforma seus dados em escores, como observa @Jeff. E centralizar apenas torna a média dos seus dados igual a .
Vale a pena reconhecer aqui que todos os três são transformações lineares ; como tal, eles não alteram a forma da sua distribuição . Ou seja, às vezes as pessoas chamam a transformação score de "normalização" e acreditam que, devido à associação dos scores com a distribuição normal, isso fez com que seus dados normalmente fossem distribuídos. Isso não é assim (como @Jeff também observa, e como você poderia dizer, plotando seus dados antes e depois). Se você estiver interessado, poderá alterar a forma dos seus dados usando a família de transformações Box-Cox , por exemplo.z z
Com relação a como você pode verificar essas transformações, isso depende exatamente do que isso significa. Se eles pretendem simplesmente verificar se o código foi executado corretamente, você pode verificar meios, SDs, mínimos e máximos.
fonte
Usando a fórmula que você forneceu em cada pontuação da sua amostra, você está convertendo todas elas em z-scores .
Para verificar se você calculou todos os escores z corretamente, encontre a nova média e o desvio padrão da sua amostra. Se a média for e o desvio padrão for , você fez tudo corretamente.0 1
O objetivo de fazer isso é colocar tudo em unidades em relação ao desvio padrão da sua amostra. Isso pode ser útil para diversos propósitos, como comparar dois conjuntos de dados diferentes que foram pontuados usando unidades diferentes (centímetros e polegadas, talvez).
É importante não confundir isso com perguntar se uma distribuição é normal , isto é , se ela se aproxima de uma distribuição gaussiana .
fonte
Depois de consultar o AT, o que a pergunta estava sendo feita era se
fonte