Além das excelentes respostas já publicadas, achei que seria útil ter uma visualização explorando as distribuições das proporções observadas para os valores variados de e .np
Para gerar os histogramas abaixo, tirei amostras de um ensaio de Bernoulli com probabilidade e repeti esse processo 10.000 vezes. Eu, então, gerei um histograma das proporções observadas em cada uma dessas 10.000 experiências.np
Visualmente falando, parece que é bastante razoável. Embora quando pareça ainda haver algum recorte acontecendo com e . Quando você chega a , o impacto parece bem pequeno.np≥5n=50np=5.5np=6.5np=7.5
Observe também que essas parcelas seria simétrico para se tomou novas valores de .p′p′=(1−p)
Código Python para gerar os gráficos. Você pode usar isto para ajustar e , se você quiser experimentar a si mesmo.np
import matplotlib.pyplot as plt
import numpy as np
np.random.seed(20190915)
def make_hists(axs, n):
proportions = np.linspace(0.01, 0.19, len(axs))
for i, prop in enumerate(proportions):
# Draw n samples 10,000 times
x = np.random.rand(n, 10_000) < prop
means = x.mean(axis=0)
axs[i].hist(means, bins=np.linspace(0, 0.5, n//2))
axs[i].set_xlim([0, 0.5])
axs[i].set_yticklabels([])
ylim_mean = np.mean(axs[i].get_ylim())
axs[i].text(-0.08, ylim_mean * 3/2, f'$p={prop:.2f}$', va='center')
axs[i].text(-0.08, ylim_mean * 2/3, f'$np={n * prop:.1f}$', va='center')
axs[0].set_title(f'$n={n}$')
def main():
f, axs = plt.subplots(10, 2, sharex=True, figsize=(12, 8))
make_hists(axs[:, 0], 50)
make_hists(axs[:, 1], 250)
f.suptitle(
'Histograms of 10,000 sample proportions, varying $p$ and $n$',
fontsize=14
)
plt.show()
main()