Eu sou um novato em estatísticas, por isso, se eu fizer alguma suposição errada aqui, por favor me diga.
Há uma população N
de pessoas. (Por exemplo, N
pode ser 1.000.000.) Algumas pessoas são ruivas. Pego uma amostra n
de pessoas (digamos 10) e acho que j
elas são ruivas.
O que posso dizer sobre a proporção geral de ruivos na população? Quero dizer, minha melhor aproximação é provavelmente j/n
, mas qual seria o desvio padrão dessa aproximação?
A propósito, qual é o termo aceito para isso?
standard-deviation
sample-size
binomial
standard-error
Ram Rachum
fonte
fonte
Respostas:
Você pode pensar nisso como um teste binomial - seus testes estão amostrando "ruiva" ou "não cabeça de leitura". Nesse caso, você pode criar um intervalo de confiança para a proporção da amostra ( ), conforme documentado na Wikipedia:j / n
Um intervalo de confiança de 95% basicamente diz que, usando o mesmo algoritmo de amostragem, se você repetir isso 100 vezes, a proporção verdadeira estaria no intervalo indicado 95 vezes.
Atualização A propósito, acho que o termo que você está procurando pode ser um erro padrão, que é o desvio padrão das proporções amostradas. Nesse caso, é onde é sua proporção estimada. Observe que à medida que aumenta, o erro padrão diminui.p ( 1 - p )n-----√ p n
fonte
se o tamanho da amostra não for uma fração tão pequena do tamanho da população como no seu exemplo, e se você fizer uma amostra sem substituição [Sw / oR], uma expressão melhor para o SE [estimado] serán N
onde é a proporção estimada e .p^ j/n q^=1−p^
[o termo é chamado de CPF [correção finita da população].N−nN
Embora a observação de whuber seja tecnicamente correta, parece sugerir que nada pode ser feito para obter, digamos, um intervalo de confiança para a verdadeira proporção . se for grande o suficiente para tornar razoável uma aproximação normal [ , digamos], é improvável que se obtenha . Além disso, se o tamanho da amostra for grande o suficiente para que uma aproximação normal usando o verdadeiro seja razoável, usar também fornecerá uma aproximação razoável.n n p > 10 j = 0 S E ^ S Ep n np>10 j=0 SE SE^
[se seu é realmente pequeno e você usa Sw / oR, pode ser necessário usar a distribuição hipergeométrica exata para vez de uma aproximação normal. se você faz SwR, o tamanho de é irrelevante e você pode usar métodos binomiais exatos para obter um IC para .]j N pn j N p
de qualquer forma, uma vez que , sempre se pode ser conservador e usar no lugar de acima. se você fizer isso, é necessária uma amostra de para obter um EM estimado [margem de erro = 2 ] de .03 [independentemente do tamanho de !].1p(1−p)≤1/4 √12n√ n=1,111^SE±Np^q^n−−−√ n=1,111 SE^ ± N
fonte