O teste de Sharipo-Wilk, de acordo com a wikipedia , testa a hipótese nula ( ) "A população é normalmente distribuída".
Estou procurando um teste de normalidade semelhante com "A população não é normalmente distribuída".
Tendo esse teste, desejo calcular um valor- para rejeitar no nível de significância iff ; provando que minha população é normalmente distribuída.H 0 α p < α
Observe que o uso do teste Sharipo-Wilk e a aceitação de iff é uma abordagem incorreta, pois significa literalmente "não temos evidências suficientes para provar que H0 não é válido". p > α
Tópicos relacionados - significado do valor- , o teste de normalidade é inútil? , mas não consigo encontrar uma solução para o meu problema.
As perguntas: Qual teste devo usar? É implementado em R?
Respostas:
Não existe um teste para que seus dados sejam normalmente distribuídos. Existem apenas testes para que seus dados não sejam normalmente distribuídos. Portanto, existem testes como o Shapiro-Wilk, onde (existem muitos outros), mas não há testes onde o nulo é que a população não é normal e a hipótese alternativa é que a população é normal.H0 0: N o r m a l
Tudo o que você pode fazer é descobrir que tipo de desvio da normalidade você se preocupa (por exemplo, assimetria) e qual o tamanho que esse desvio teria que ser antes que o incomodasse. Em seguida, você pode testar para ver se o desvio da normalidade perfeita em seus dados foi menor que o valor crítico. Para obter mais informações sobre a idéia geral, pode ser útil ler minha resposta aqui: Por que os estatísticos dizem que um resultado não significativo significa "você não pode rejeitar o nulo" em vez de aceitar a hipótese nula?
fonte
A distribuição normal surge quando os dados são gerados por uma série de eventos aditivos do iid (veja a imagem do quincunx abaixo). Isso significa que não há feedbacks nem correlações, isso soa como o processo que conduz seus dados? Caso contrário, provavelmente não é normal.
Existe a chance de esse tipo de processo estar ocorrendo no seu caso. O mais próximo que você pode "provar" é coletar dados suficientes para descartar outras distribuições que as pessoas possam criar (o que provavelmente não é prático). Outra maneira é deduzir a distribuição normal de alguma teoria junto com outras previsões. Se os dados forem consistentes com todos eles e ninguém puder pensar em outra explicação, isso seria uma boa evidência a favor da distribuição normal.
https://en.wikipedia.org/wiki/Bean_machine
Agora, se você não espera uma distribuição específica a priori, ainda pode ser razoável usar a distribuição normal para resumir os dados, mas reconheça que essa é essencialmente uma opção por ignorância ( https://en.wikipedia.org/wiki/ Princípio_de_maxima_entropia ). Nesse caso, você não deseja saber se a população está normalmente distribuída, mas quer saber se a distribuição normal é uma aproximação razoável para qualquer que seja seu próximo passo.
Nesse caso, você deve fornecer seus dados (ou dados gerados semelhantes), juntamente com uma descrição do que planeja fazer com eles, e perguntar "De que maneira a suposição de normalidade nesse caso pode me enganar?"
fonte
Você nunca poderá "provar" uma suposição de Normalidade em seus dados. Apenas ofereça evidências contra isso como uma suposição. O teste Shapiro-Wilk é uma maneira de fazer isso e é usado o tempo todo para justificar a suposição de Normalidade. O raciocínio é que você começa assumindo Normalidade. Você então pergunta: meus dados sugerem que estou fazendo uma suposição boba? Então vá em frente e teste com Shapiro-Wilk. Se você não rejeitar a hipótese nula, os dados não sugerem que você esteja fazendo uma suposição boba.
fonte