Eu quero evitar o uso indevido de testes de normalidade, onde um tamanho de amostra grande o suficiente destacará qualquer leve não normalidade. Eu quero poder dizer que uma distribuição é "suficientemente normal".
Quando a população não é normal, o valor de p para o teste Shapiro-Wilk tende a 0 à medida que o tamanho da amostra aumenta. O valor p não é útil para decidir se uma distribuição é "suficientemente normal".
Penso que uma solução seria medir o tamanho do efeito da não normalidade e rejeitar qualquer coisa que seja mais não normal do que um limite.
O teste de Shapiro-Wilk produz um teste estatístico . Essa é uma maneira de medir o tamanho do efeito da não normalidade?
Eu testei isso em R, fazendo um teste shapiro wilk em amostras retiradas de uma distribuição uniforme. O número de amostras variou de 10 a 5000, os resultados são plotados abaixo. O valor de W converge para uma constante, não tende para . Não tenho certeza se é inclinado para amostras pequenas, parece baixo para amostras pequenas. Se é uma estimativa tendenciosa do tamanho do efeito, isso pode ser um problema, se eu quiser aceitar algo abaixo de como "normal o suficiente".
Minhas duas perguntas são:
é uma medida do tamanho do efeito de não normalidade?
O é tendencioso para amostras pequenas?