Eu tenho um conjunto de resultados de um teste A / B (um grupo de controle, um grupo de recursos) que não se encaixam em uma distribuição normal. De fato, a distribuição se assemelha mais à Distribuição Landau.
Acredito que o teste t independente exige que as amostras sejam distribuídas pelo menos aproximadamente aproximadamente normalmente, o que me desencoraja a usar o teste t como um método válido de teste de significância.
Mas minha pergunta é: em que momento se pode dizer que o teste t não é um bom método de teste de significância?
Ou, em outras palavras, como se pode qualificar a confiabilidade dos valores-p de um teste t, considerando apenas o conjunto de dados?
fonte
Basicamente, um teste t independente ou um teste t de 2 amostras são usados para verificar se as médias das duas amostras são significativamente diferentes. Ou, em outras palavras, se houver uma diferença significativa entre as médias das duas amostras.
Agora, as médias dessas 2 amostras são duas estatísticas, que de acordo com o CLT, têm uma distribuição normal, se forem fornecidas amostras suficientes. Observe que o CLT funciona independentemente da distribuição a partir da qual a estatística média é criada.
Normalmente, pode-se usar um teste z, mas se as variações são estimadas a partir da amostra (porque é desconhecida), é introduzida alguma incerteza adicional, que é incorporada na distribuição t. É por isso que o teste t de 2 amostras se aplica aqui.
fonte