Foi-me perguntado se um erro do tipo I no teste Shapiro-Wilk impactaria a análise principal e se o teste errado foi usado se isso importaria ou não se meus dados fossem normalmente distribuídos ...
nonparametric
DaisyRiver
fonte
fonte
Respostas:
Na análise estatística, se seus dados seguem uma distribuição paramétrica, você deve utilizar o benefício de conhecer a distribuição e empregar os métodos estatísticos com base nessa distribuição.
Mas, às vezes, não sabemos a distribuição da variável aleatória; portanto, os métodos estatísticos não paramétricos foram desenvolvidos para abranger a ampla gama de distribuições e sacrificar alguma eficiência.
Dado que você conhece a distribuição da variável aleatória e usa o método estatístico não paramétrico, em vez de métodos estatísticos paramétricos baseados no conhecimento da distribuição, será ineficiente, ou seja, o poder do teste diminuirá, o erro padrão aumentará e os intervalos de confiança aumentarão. ser mais amplo do que com o método paramétrico.
fonte
Se seus dados foram extraídos de uma população normal (e as outras suposições usuais para um teste t comum se aplicarem), o teste funcionará como deveria (é não paramétrico, deve funcionar). Não há drama nesse sentido.
Se você sabe o suficiente que está confiante em assumir a normalidade, poderá aproveitar esse conhecimento, mas, para muitos testes, isso não ajuda muito.
Se você estiver fazendo um dos testes de localização comuns (teste de classificação assinado Wilcoxon, teste de Wilcoxon-Mann-Whitney), você não perde quase nada (em termos de energia) em um teste de mudança de local ignorando a normalidade. [Você precisa de uma observação extra para cada 21 observações para corresponder ao poder do teste mais poderoso quando todas as suas suposições se mantiverem.]
Se você está lidando com outros testes, isso pode importar um pouco mais (embora alguns possam importar ainda menos). Um exemplo em que faz uma diferença um pouco maior é usar um teste de Friedman em comparação com o teste ANOVA correspondente em um design de blocos aleatórios.
fonte