O número 20 é mágico?

12

Tenho referências que recomendam considerar um tamanho de amostra mínimo de 20 para distribuição de ajuste de dados.

Existe algum sentido nisso?

obrigado

fm3c2007
fonte
3
Em geral não, talvez em situações específicas. Você tem as referências e quais são seus objetivos?
image_doctor
1
Concordo com o @image_doctor - não há razão geral para que 20 observações sejam consideradas no mínimo; pode ser o caso em circunstâncias muito particulares.
Glen_b -Reinstate Monica
3
Um valor único funcionará em alguns casos práticos, como quando a distribuição é conhecida (com certeza) como Poisson e a observação é uma contagem grande. Isso não apenas permite que a distribuição seja ajustada, mas também permite que o erro provável na estimativa de seu parâmetro seja avaliado.
whuber
1
Acredito que também li que, para distribuições normais, 30 é a regra geral. Parece-me que era algo relacionado à proximidade do t de um aluno com 30 graus de liberdade ao normal. Mas é apenas uma regra de ouro. Não é mágico no mesmo sentido que o valor de é. e
18713 Wayne
1
Sim, 20 é um número mágico: en.wikipedia.org/wiki/Magic_number_%28physics%29
Bitwise

Respostas:

13

Muito disso depende da distribuição esperada e qual é a sua pergunta de pesquisa. Como regra geral, você deve ter cuidado com as regras práticas. Se você conhece a distribuição esperada, execute algumas simulações de tamanhos diferentes e determine com que frequência as simulações de amostra refletem a distribuição real. Isso deve fornecer algumas orientações sobre o tamanho final da amostra necessário.

doug.numbers
fonte
+1 para evitar declarações extremas e dogmáticas.
whuber
1
+1 em parte devido a "Como regra geral, você deve ter cuidado com as regras práticas".
19413 Wolfgang
7

Eu pensei que o número mágico do tamanho da amostra é 1.000. É o que a maioria das pesquisas nacionais dos EUA possui, para produzir uma margem de erro de cerca de 3%:

z0.9750.50.5/1000=1.960.158=0.031
Na realidade, os tamanhos de amostra efetivos são inferiores a 1.000, mais ou menos 700, devido à probabilidade desigual de seleção e ajustes de não resposta, levando à margem de erro de 3,7% .

Com apenas 20 observações, tecnicamente não é possível obter valores muito altos de assimetria e curtose (normalizados pelos desvios padrão da amostra, é claro): Se você está ajustando uma distribuição pelo método dos momentos, obviamente não pode ajustar, digamos, uma distribuição lognormal com uma variação razoavelmente típica de logs igual a 1 (distribuições de renda em países com desigualdade de renda moderada a alta; EUA, Brasil, África do Sul, A Rússia tem uma variação mais alta da renda do log), pois possui uma curtose surpreendentemente grande de 111. É claro que seria tolo ajustar uma distribuição lognormal pelo método dos momentos, mas eu só queria mostrar que algumas distribuições do mundo real provavelmente será mais complicado do que o que pode ser descrito com 20 observações.

|skewness|n2n1=4.58,|kurtosis|n23n+3n1=18.05.

n=20

h=1.06σ^n1/5=0.58σ^
StasK
fonte
ms(s/m)(3+(s/m)2)202
whuber
1
Link obrigatório para "Síndrome de Power-of-Ten" no contexto de uso de 1000 como tamanho de amostra (no contexto de estatísticas relacionadas à programação, mas se aplica a outros lugares): zedshaw.com/essays/programmer_stats.html
Gary S. Weaver
1
@ Whuber, você é muito inteligente, sem ofensas. A maioria das pessoas computaria assimetria como o momento dos dados, não através de uma suposição paramétrica, como você acabou de fazer. Agora, se eu dissesse "Suponha que você esteja ajustando uma distribuição de Pearson pelo método dos momentos" - esse argumento seria relevante?
StasK 18/04
Sim, seria relevante em muitos casos. Eu segui sua sugestão para ajustar uma distribuição lognormal usando o método dos momentos e obtive uma grande assimetria - nenhuma surpresa lá. Isso ocorre porque combinei apenas os dois primeiros momentos, deixando o terceiro o que for. Se eu seguisse o mesmo procedimento com qualquer família de distribuição de dois ou menos parâmetros que permita terceiros momentos arbitrariamente grandes, acho que veria o mesmo fenômeno. Com a família Pearson, que possui mais de dois parâmetros, provavelmente tentaríamos corresponder à assimetria empírica, limitando assim seu valor.
whuber
2

Não. Não remotamente.

Pense assim: se você tivesse um espaço bilionário (humanidade) e retirasse 20 amostras usando qualquer método (20 pessoas), poderia usar as informações obtidas para entender razoavelmente bem todas as pessoas no planeta? Não remotamente. Existem 100 bilhões de estrelas na galáxia Via Láctea. Ao escolher (aleatoriamente) 20 deles, você consegue entender toda a astronomia galáctica? De jeito nenhum.

Em um espaço 1-d, existem algumas heurísticas, principalmente regras válidas que podem ajudar, que descrevem quantas medidas você deseja fazer. Eles incluem graus variados de utilidade e justificativa, mas, em certo sentido, são mais bem defendidos do que "20". Eles incluem "5 medições por variável em sua equação de ajuste", "pelo menos 35 amostras de uma função de densidade gaussiana" e "pelo menos 300 amostras de uma função binomial". Estatísticos reais e não um nerd-bombardeiro como eu serão capazes de associar intervalos de confiança e incertezas particulares dos primeiros princípios e sem uma calculadora.

If you use the rule of "5 measurements per parameter in your fit equation" and you want to fit the cumulative density of a 2 dimensionally curved bi-cubic surface in terms of distribution of heights you are going to have an underlying system that is a3r3+a2r2+a1r+a0a1r+a0dr, a ratio of a 5th order polynomial to a cubic. It will have 6+4=10 coefficients. If you are trying to fit your 10 parameter values using 2 measurements per parameter, or by using 20 measurements, then you will be violating this heuristic. This heuristic recommends a minimum of 10*5=50 measurements.

Lembre-se de que "melhor" é uma idéia sem sentido, sem ter uma "medida de bondade". Qual é o melhor caminho? Se você estiver indo para o seu destino, talvez seja extremamente longo e agradável. Se você estiver indo para a sua própria coroação, talvez curta e magnífica. Se você está caminhando pelo deserto, é legal e com sombra. Qual é o "melhor" número de amostras? É tão incrivelmente dependente do seu problema que ele não pode começar a ser respondido com autoridade antes disso. Todos eles? Quantas você puder? Aqueles só fazem um pouco de sentido. Sim, é como estar parcialmente morto ou grávida. Ser parcialmente sem sentido é uma consequência de um problema muito sub-definido.

Se você está tentando prever com precisão o fluxo de ar em um avião? Você pode precisar de vários milhões de medições para entrar no estádio. Se você quer saber a sua altura, um ou dois podem fazer o trabalho.

Isso não traz à tona os pontos importantes de "estender o espaço" e "amostrar em locais que minimizam a variação nas estimativas de parâmetros", mas a pergunta sugeria que uma resposta em nível mais recente seria relevante. Essas coisas exigem saber mais sobre a natureza do problema antes que possam ser implementadas.

Nota: editado para melhorar por sugestões.

EngrStudent - Restabelecer Monica
fonte
1
Você parece ter lido "mínimo" na pergunta como "máximo" ou "suficiente". Nada do que você escreveu parece contradizer uma regra prática mínima de 20.
whuber
2
@whuber, trabalho com pessoas que pensam que medidas extras são caras, e se eu lhes fornecer um "número mínimo de amostras", elas não pensam nisso como uma desigualdade em que o número potencial de amostras é maior que isso. Eles pensam nisso como o limite para um problema de otimização de redução de custos e tentam operar com apenas esse valor. É um produto do meu ambiente.
EngrStudent - Reinstate Monica
1

Perhaps for the context where you're carrying out t-tests or ANOVAR - a pretty common context in basic statistical applications - it's around the sample size you need for each group in order to be able to have much confidence in each group's mean's being approximately normally distributed (according to the central limit theorem) when the distribution can be assumed to be more or less unimodal & not extremely peaky. Twenty & not nineteen or twenty-one because it's a round number.

Scortchi - Reinstate Monica
fonte
0

Check Russ Lenth's Power and Sample Size Page for some articles on the subject (in the Advice section in the middle of the page).

O número mínimo de indivíduos em sua amostra varia muito de acordo com o tamanho da população, o número de dimensões (se você estiver dividindo os dados em categorias) e medidas (se você estiver tomando medidas contínuas sobre os indivíduos da amostra) que você está tomando, o tamanho de seu universo, a técnica de análise que você pretende usar (este é um ponto muito importante - a técnica é definida durante o planejamento do estudo ou durante o desenho experimental, never after), and complexity shown by previous studies.

E 20 não é suficiente para nenhuma pesquisa séria fora dos assuntos de "doenças raras" e "psicologia experimental" (psych, como Popper definiu em seu trabalho).

Refinando a resposta com base nos comentários abaixo:

And 20 is not enough for any serious research outside the subjects of "rare diseases" and "experimental psychology" (psych as Popper defined in his work) that involves fitting a probability distribution.

And no, you should not keep poisoning people to get to a large sample size. Common Sense and Sequential Tests order you to stop.

Lucas Gallindo
fonte
3
I think it's too extreme to give a blanket statement that a sample of 20 is "not enough for any serious research." This contradicts your earlier statements that the appropriate sample size varies with purpose, population, and so on. In some cases one falsifying result is enough to kill an entire theory.
whuber
1
Case studies and qualitative research can do fine with 1-5 participants.
Behacad
Ok, add "case studies" and "focus groups" to the list :) These are included in what I said Popper called "experimental psychology" tho.
Lucas Gallindo
4
You had then better add astronomy, medicine, biology, chemistry, ... In other words, it's just as bad to assert that 20 is "not enough" as it is to assert that it's good enough. Actually, it's probably worse. Imagine a food safety trial in which the first eight subjects who were administered a nutritional supplement died of unanticipated side effects. Would you advocate continued testing on the basis of your "20 is not enough" statement?
whuber