Minha distribuição é normal; Teste de Kolmogorov-Smirnov não concorda

15

Eu tenho um problema com a normalidade de alguns dados que tenho: fiz um teste de Kolmogorov que diz que não é normal com p = .0000, não entendo: a assimetria da minha distribuição = -. 497 e a curtose = -0,024

Aqui está o enredo da minha distribuição, que parece muito normal ...

(Eu tenho três escores, e cada um deles não é normal, com um valor p significativo para o teste de Kolmogorov ... eu realmente não entendo)

insira a descrição da imagem aqui

insira a descrição da imagem aqui

Vaia
fonte
11
Como você sabe que é normal? Não parece normal para mim. Parece inclinado para a esquerda.
mark999
11
Por que você está testando a normalidade?
Jack Aidley

Respostas:

39
  1. Você não tem base para afirmar que seus dados são normais. Mesmo que sua assimetria e excesso de curtose sejam exatamente 0, isso não implica que seus dados sejam normais. Embora a assimetria e a curtose longe dos valores esperados indiquem não normalidade, o inverso não se mantém. Existem distribuições não normais que têm a mesma assimetria e curtose que a normal. Um exemplo é discutido aqui , cuja densidade é reproduzida abaixo:
    dgam 2.3

    Como você vê, é nitidamente bimodal. Nesse caso, a distribuição é simétrica; portanto, enquanto existirem momentos suficientes, a medida de assimetria típica será 0 (de fato, todas as medidas usuais serão). Para a curtose, a contribuição para os 4º momentos da região próxima à média tenderá a diminuir a curtose, mas a cauda é relativamente pesada, o que tende a aumentá-la. Se você escolher a correta, a curtose sairá com o mesmo valor da normal.

  2. A distorção da amostra é realmente de cerca de -0,5, o que sugere uma distorção leve à esquerda. Seu histograma e gráfico de QQ indicam o mesmo - uma distribuição levemente inclinada para a esquerda. (É improvável que essa distorção leve seja um problema para a maioria dos procedimentos comuns da teoria normal.)

  3. Você está analisando vários indicadores diferentes de não normalidade com os quais não deve concordar a priori , pois eles consideram aspectos diferentes da distribuição; com amostras pequenas e pouco normais, elas discordam frequentemente.


Agora, a grande pergunta: * Por que você está testando a normalidade? *

[editado em resposta a partir dos comentários:]

Não tenho muita certeza, acho que deveria antes de fazer uma ANOVA

Há vários pontos a serem feitos aqui.

Eu. Normalidade é uma suposição de ANOVA se você a estiver usando para inferência (como testes de hipóteses), mas não é especialmente sensível à não normalidade em amostras maiores - a não normalidade leve é ​​de pouca importância e, conforme o tamanho da amostra aumenta, a distribuição pode tornar-se mais anormal e o teste pode ser apenas um pouco afetado.

ii. Você parece estar testando a normalidade da resposta (o DV). A distribuição (incondicional) do próprio DV não é considerada normal na ANOVA. Você verifica os resíduos para avaliar a razoabilidade da suposição sobre a distribuição condicional (ou seja, é o termo de erro no modelo que é considerado normal) - ou seja, você parece não estar olhando para a coisa certa. De fato, como a verificação é feita nos resíduos, você o faz após o ajuste do modelo, e não antes.

iii. Testes formais podem ser quase inúteis. A questão de interesse aqui é 'quão mal está o grau de não normalidade afetando minha inferência?', À qual o teste de hipótese realmente não responde. À medida que o tamanho da amostra aumenta, o teste se torna cada vez mais capaz de detectar diferenças triviais da normalidade, enquanto o efeito no nível de significância na ANOVA se torna cada vez menor. Ou seja, se o tamanho da amostra for razoavelmente grande, o teste de normalidade geralmente indica que você tem um tamanho de amostra grande, o que significa que você pode não ter muito com que se preocupar. Pelo menos com um gráfico de QQ, você tem uma avaliação visual de como não é normal.

iv. em tamanhos razoáveis ​​de amostra, outras suposições - como igualdade de variância e independência - geralmente importam muito mais do que uma não normalidade leve. Preocupe-se com as outras premissas primeiro ... mas, novamente, o teste formal não está respondendo à pergunta certa

v. escolher se você faz uma ANOVA ou algum outro teste com base no resultado de um teste de hipótese tende a ter propriedades piores do que simplesmente decidir agir como se a suposição não se mantivesse. (Existem vários métodos adequados para análises unidirecionais do tipo ANOVA em dados que não são considerados normais que você pode usar sempre que achar que não tem motivos para assumir a normalidade. Alguns têm um poder muito bom normalmente, e com um software decente, não há razão para evitá-los.)

[Acredito que tinha uma referência para esse último ponto, mas não consigo localizá-lo agora; se eu encontrar, tentarei voltar e colocar]

Glen_b -Reinstate Monica
fonte
Eu li o histograma como mostrando aproximadamente min 12 mode 48 max 60, então min to mode é 36, mode to max é 12. Não se deve ler muito nesses detalhes, mas eles são totalmente consistentes com a inclinação à esquerda.
Nick Cox
10

O teste de Kolmogorov-Smirnov possui bastante poder quando o tamanho das amostras é grande, portanto, pode ser fácil rejeitar a hipótese nula de que seus dados não diferem da normalidade. Em outras palavras, o teste às vezes sugere que uma distribuição não é normal em amostras grandes, mesmo que seja normal para a maioria das intenções.

Pense nisso como um teste t. Se você tiver duas populações que diferem em altura em apenas um milésimo de milímetro, uma amostra incrivelmente grande apoiará estatisticamente que essas são diferentes, mesmo que a diferença não faça sentido.

Talvez você possa confiar em outros métodos para determinar a normalidade dos seus dados. As plotagens usadas são dois bons exemplos, bem como os valores de inclinação / curtose.

Este outro tópico parece particularmente relacionado: o teste de normalidade é 'essencialmente inútil'?

Behacad
fonte
Oh ok, parece certo, o tamanho da minha amostra é bem grande (n = 660), existe algum outro teste menos tendencioso pelo tamanho da amostra?
Boo
Faça uma pesquisa neste site e você poderá encontrar respostas relevantes. stats.stackexchange.com/questions/12261/testing-normalit stats.stackexchange.com/questions/2492/…
Behacad
13
Os testes não são influenciados pelo enorme tamanho da amostra.
Peter Flom - Restabelece Monica
10

O teste de Kolmogorov – Smirnov é livre de distribuição quando a hipótese nula é totalmente especificada - se a média e a variância forem estimadas a partir dos dados, use a variante Lilliefors ao testar a normalidade (se necessário). Isso não é para contradizer as outras respostas.

Scortchi - Restabelecer Monica
fonte