Estou testando a igualdade de meios usando o teste t de Welch. A distribuição subjacente está longe de ser normal (mais distorcida que o exemplo em uma discussão relacionada aqui ). Posso obter mais dados, mas gostaria de alguma maneira baseada em princípios de determinar até que ponto fazê-lo.
- Existe uma boa heurística para avaliar se a distribuição da amostra é aceitável? Quais desvios da normalidade são mais preocupantes?
- Existem outras abordagens - por exemplo, confiar em um intervalo de confiança de autoinicialização para a estatística de amostra - que faria mais sentido?
Respostas:
Como o teste t assume normalidade e suas distribuições subjacentes não são normais, não pode haver uma maneira baseada em princípios de determinar se a distribuição da amostra é aceitável. No entanto, à medida que o tamanho da amostra fica "grande", o Teorema do Limite Central entra em ação, e você pode usar um teste z de amostra grande, que essencialmente fornecerá a mesma resposta que um teste t, porque t se aproxima da distribuição normal com grandes amostras.
Os livros / cursos de estatísticas geralmente implicam que, em um tamanho de amostra de 25 ou 30, o CLT entra em jogo de uma maneira útil. No entanto, minha experiência foi que, mesmo com tamanhos de amostra nas centenas de grandes testes z de amostra, ainda pode ser muito ruim (por exemplo, com dados de contagem).
Na minha opinião, um teste de permutação é um bom ajuste para o seu problema. Ele deve ter potência igual ou melhor que os testes não paramétricos enlatados (por exemplo, Mann-Whitney) e você não precisa se preocupar com o problema da normalidade. E, eles são divertidos de escrever.
fonte