Como testar as diferenças entre duas médias de grupos quando os dados não são normalmente distribuídos?

19

Eliminarei todos os detalhes e experimentos biológicos e citarei apenas o problema em questão e o que fiz estatisticamente. Gostaria de saber se está certo e, se não, como proceder. Se os dados (ou minha explicação) não forem claros o suficiente, tentarei explicar melhor editando.

Suponha que eu tenha dois grupos / observações, X e Y, com tamanho e . Gostaria de saber se os meios dessas duas observações são iguais. Minha primeira pergunta é:Nx=215Ny=40.

  1. Se as premissas forem atendidas, é relevante usar aqui um teste t paramétrico de duas amostras? Eu pergunto isso porque, pelo meu entendimento, é geralmente aplicado quando o tamanho é pequeno?

  2. Plotei histogramas de X e Y e eles não eram normalmente distribuídos, uma das suposições de um teste t de duas amostras. Minha confusão é que considero duas populações e foi por isso que verifiquei a distribuição normal. Mas então estou prestes a realizar um teste t de duas amostras ... Isso está certo?

  3. Do teorema do limite central, entendo que se você realizar amostragens (com / sem repetição, dependendo do tamanho da sua população) várias vezes e calcular a média das amostras a cada vez, será distribuído aproximadamente normalmente. E a média dessas variáveis ​​aleatórias será uma boa estimativa da média da população. Então, decidi fazer isso em X e Y, 1000 vezes, e obtive amostras, e designei uma variável aleatória à média de cada amostra. A trama era muito normalmente distribuída. As médias de X e Y foram de 4,2 e 15,8 (iguais à população + - 0,15) e a variação foi de 0,95 e 12,11.
    Eu realizei um teste t nessas duas observações (1000 pontos de dados cada) com variações desiguais, porque são muito diferentes (0,95 e 12,11). E a hipótese nula foi rejeitada.
    Isso faz algum sentido? Essa abordagem correta / significativa ou um teste z de duas amostras são suficientes ou estão totalmente errados?

  4. Também realizei um teste não paramétrico de Wilcoxon apenas para ter certeza (nos X e Y originais) e a hipótese nula foi convincentemente rejeitada lá também. No caso em que meu método anterior estivesse totalmente errado, suponho que fazer um teste não paramétrico seja bom, exceto pelo poder estatístico, talvez?

Nos dois casos, as médias foram significativamente diferentes. No entanto, gostaria de saber se uma ou ambas as abordagens estão com defeito / totalmente erradas e, em caso afirmativo, qual é a alternativa?

Uma corrida
fonte

Respostas:

21

A idéia de que o teste t é apenas para amostras pequenas é um impedimento histórico. Sim, ele foi originalmente desenvolvido para amostras pequenas, mas não há nada na teoria que distinga pequenas de grandes. Nos dias em que os computadores eram comuns para fazer estatísticas, as tabelas t frequentemente chegavam a cerca de 30 graus de liberdade e o normal era usado além disso como uma aproximação aproximada da distribuição t. Foi por conveniência manter o tamanho da mesa-t razoável. Agora, com computadores, podemos fazer testes t para qualquer tamanho de amostra (embora para amostras muito grandes a diferença entre os resultados de um teste z e um teste t seja muito pequena). A idéia principal é usar um teste t ao usar a amostra para estimar os desvios padrão e o teste z se os desvios padrão da população forem conhecidos (muito raros).

O Teorema do Limite Central nos permite usar a inferência da teoria normal (testes t neste caso), mesmo que a população não esteja normalmente distribuída desde que o tamanho da amostra seja grande o suficiente. Isso significa que seu teste é aproximado (mas com o tamanho da amostra, a aprovação deve ser muito boa).

O teste de Wilcoxon não é um teste de médias (a menos que você saiba que as populações são perfeitamente simétricas e outras suposições improváveis ​​se mantêm). Se os meios são o principal ponto de interesse, o teste t é provavelmente o melhor a ser citado.

Dado que seus desvios padrão são muito diferentes e as formas são não normais e possivelmente diferentes umas das outras, a diferença nos meios pode não ser a coisa mais interessante acontecendo aqui. Pense na ciência e no que você quer fazer com seus resultados. As decisões estão sendo tomadas no nível da população ou no nível individual? Pense neste exemplo: você está comparando 2 medicamentos para uma determinada doença, com o medicamento Uma metade da amostra morreu imediatamente e a outra metade se recuperou em cerca de uma semana; na droga B todos sobreviveram e se recuperaram, mas o tempo para recuperação foi superior a uma semana. Nesse caso, você realmente se importaria com o tempo médio de recuperação mais curto? Ou substitua a metade que está morrendo em A por apenas levar muito tempo para se recuperar (mais tempo do que qualquer um no grupo B).

Greg Snow
fonte
Obrigado Greg. Presumo que não há nada errado com o procedimento em si? Entendo que posso não estar fazendo a pergunta certa, mas minha preocupação é igualmente com o teste / procedimento estatístico e com o entendimento de si mesmo, com duas amostras. Vou verificar se estou fazendo a pergunta certa e voltar com perguntas, se houver. Talvez se eu explicar o problema biológico, ajudaria com mais sugestões. Obrigado novamente.
Arun
5

Uma adição à resposta já abrangente de Greg.

Se eu entendi da maneira certa, o ponto 3 indica o seguinte procedimento:

  • nX
  • mn
  • Repita isso 1000 vezes, salve os meios correspondentes
  • X

Agora, sua suposição é que, para isso, o teorema do limite central é válido e a variável aleatória correspondente será normalmente distribuída.

Talvez vamos dar uma olhada na matemática por trás do seu cálculo para identificar o erro:

X X1,...,XnX1,...,XnXmk

Yk=1mEu=1mXμEuk

μEuknEu

11000k=110001mEu=1mXμEuk

XEu1000m1000mXEu

Agora, no entanto, o Teorema do Limite Central afirma que a soma de muitas variáveis ​​aleatórias independentes é aproximadamente normal. (O que resulta também na média aproximada normal).

Sua soma acima não produz amostras independentes. Talvez você tenha pesos aleatórios, mas isso não torna suas amostras independentes. Assim, o procedimento escrito em 3 não é legal.

t

Thilo
fonte
Obrigado. Parece que o teste t já resolve o problema usando o CLT (da resposta de greg, que eu ignorei). Obrigado por apontar isso e pela explicação clara de 3), que é o que eu realmente queria saber. Vou ter que investir mais tempo para entender esses conceitos.
Arun
2
Lembre-se de que o CLT tem um desempenho diferente, dependendo da distribuição em questão (ou, pior ainda, o valor esperado ou a variação da distribuição não existe - o CLT nem é válido). Em caso de dúvida, é sempre bom gerar uma distribuição parecida com a que você observou e simular seu teste usando essa distribuição algumas centenas de vezes. Você terá uma ideia da qualidade dos suprimentos CLT aproximados.
Thilo