Existe uma "regra" para determinar o tamanho mínimo da amostra necessário para que um teste t seja válido?
Por exemplo, uma comparação precisa ser realizada entre as médias de 2 populações. Existem 7 pontos de dados de uma população e apenas 2 pontos de dados da outra. Infelizmente, o experimento é muito caro e demorado, e a obtenção de mais dados não é viável.
Um teste t pode ser usado? Por que ou por que não? Forneça detalhes (as variações e distribuições da população não são conhecidas). Se um teste t não puder ser usado, um teste não paramétrico (Mann Whitney) pode ser usado? Por que ou por que não?
t-test
sample-size
small-sample
wilcoxon-mann-whitney
Johnny Puzzled
fonte
fonte
Respostas:
Eu recomendo usar o teste U não-paramétrico de Mann-Whitney em vez de um teste t não pareado aqui.
Não há tamanho mínimo absoluto da amostra para o teste t , mas, à medida que os tamanhos das amostras diminuem, o teste se torna mais sensível à suposição de que as duas amostras são retiradas de populações com uma distribuição normal. Com amostras tão pequenas, especialmente com uma amostra de apenas duas, você precisa ter certeza de que as distribuições populacionais foram normais - e isso deve se basear no conhecimento externo, pois essas amostras pequenas fornecem muito pouca informação sobre elas. a normalidade ou não de suas distribuições. Mas você diz que "as variações e distribuições da população não são conhecidas" (meu itálico).
O teste U de Mann-Whitney não exige nenhuma suposição sobre a forma paramétrica das distribuições, exigindo apenas o pressuposto de que as distribuições dos dois grupos são iguais na hipótese nula.
fonte
(aviso: hoje não consigo digitar bem: minha mão direita está fraturada!)
Ao contrário do conselho de usar um teste não paramétrico em outras respostas, você deve considerar que, para tamanhos de amostra extremamente pequenos, esses métodos não são muito úteis. É fácil entender o porquê: em estudos com tamanho extremamente pequeno, nenhuma diferença entre grupos pode ser estabelecida, a menos que um grande tamanho de efeito seja observado. Métodos não paramétricos, no entanto, não se importam com a magnitude da diferença entre os grupos. Assim, mesmo que a diferença entre os dois grupos seja enorme, com um tamanho pequeno de amostra, um teste não paramétrico sempre falha em rejeitar a hipótese nula.
Considere este exemplo: dois grupos, distribuição normal, mesma variação. Grupo 1: média 1,0, 7 amostras. Grupo 2: média 5, 2 amostras. Há uma grande diferença entre as médias.
O valor p calculado é 0,05556, que não rejeita a hipótese nula (em 0,05). Agora, mesmo se você aumentar a distância entre as duas médias por um fator de 10, obterá o mesmo valor p:
Agora, convido você a repetir a mesma simulação com o teste t e observar os valores de p no caso de diferenças grandes (média 5 vs 1) e enormes (média 50 vs 1).
fonte
Não há tamanho mínimo de amostra para um teste t; o teste t foi, de fato, projetado para pequenas amostras. Antigamente, quando as tabelas eram impressas, você via tabelas de teste t para amostras muito pequenas (medidas por df).
Obviamente, como em outros testes, se houver uma amostra pequena, apenas um efeito bastante grande será estatisticamente significativo.
fonte
Suponho que você queira dizer que você tem 7 pontos de dados de um grupo e 2 pontos de dados de um segundo grupo, ambos subconjuntos de populações (por exemplo, subconjunto de machos e subconjunto de fêmeas).
A matemática para o teste t pode ser obtida em nesta página da Wikipedia . Assumiremos um teste t independente para duas amostras, com tamanhos de amostra desiguais (7 vs. 2) e variações desiguais, aproximadamente na metade da página. Você pode ver que o cálculo é baseado em médias e desvios padrão. Com apenas 7 sujeitos em um grupo e 2 sujeitos em outro, você não pode assumir que possui boas estimativas para a média ou o desvio padrão. Para o grupo com 2 sujeitos, a média é simplesmente o valor que está exatamente no meio dos dois pontos de dados, portanto, não é bem estimado. Para o grupo com 7 sujeitos, o tamanho da amostra afeta fortemente as variações (e, portanto, os desvios padrão, que são a raiz quadrada da variação), porque valores extremos exercem um efeito muito mais forte quando você tem uma amostra menor.
Por exemplo, se você olhar para o exemplo básico na página da Wikipedia para o desvio padrão , verá que o desvio padrão é 2, e a variação (quadrado do desvio padrão) é, portanto, 4. Mas se tivéssemos apenas os dois primeiros pontos de dados (o 9 e o 1), a variação seria 10/2 = 5 e o desvio padrão seria 2,2 e, se tivéssemos apenas os dois últimos valores (4 e 16), a variação seria 20/2 = 10 e o desvio padrão seria 3,2. Ainda estamos usando os mesmos valores, apenas menos deles, e podemos ver o efeito em nossas estimativas.
Esse é o problema do uso de estatísticas inferenciais com pequenos tamanhos de amostra; seus resultados serão particularmente afetados pela amostragem.
Atualização: existe alguma razão pela qual você não pode simplesmente relatar os resultados por assunto e indicar que este é um trabalho exploratório? Com apenas dois casos, os dados são muito semelhantes a um estudo de caso, e ambos são (1) importantes para escrever e (2) prática aceita.
fonte
Artigo interessante: 'Usando o teste t de Student com tamanhos de amostra extremamente baixos' JCF de Winter (em Avaliação prática, pesquisa e avaliação) http://goo.gl/ZAUmGW
fonte
Eu recomendaria comparar as conclusões que você obtém com ambos, o teste t e o teste de Mann-Whitney, e também dar uma olhada nos boxplots e na probabilidade de perfil da média de cada população.
fonte
Como um teste realizado em amostras pequenas provavelmente não atende aos requisitos de teste (principalmente a normalidade das populações das quais as duas amostras foram extraídas), eu recomendaria realizar um teste de autoinicialização (com variações desiguais), seguindo Efron B, Tibshirani Rj. Uma introdução ao Bootstrap. Boca Raton, FL: Chapman & Hall / CRC, 1993: 220-224. O código para um teste de autoinicialização nos dados fornecidos por Johnny Puzzled no Stata 13 / SE é relatado na imagem acima.
fonte
Com um tamanho de amostra 2, a melhor coisa a fazer pode ser olhar os números individuais e nem mesmo se preocupar com a análise estatística.
fonte