Suponha que tenhamos um conjunto A e um subconjunto B. Se conhecemos | A |, podemos calcular | B | encontrando a probabilidade p de que um elemento escolhido uniformemente aleatoriamente de A pertença a B. Especificamente | A | p = | B |.
Suponha que geremos n elementos de A uniformemente de forma aleatória e use esses dados para estimar p (número de elementos em B dividido por n) e, portanto, estimar | B |.
Quão confiável é essa estimativa? Ou seja, como podemos calcular o erro?
Como uma questão paralela, existe um nome para esta técnica? (parece ser uma versão matemática da técnica de marcar e recuperar )
estimation
Douglas S. Stones
fonte
fonte
Respostas:
Você está estimando proporções. Para concretizar, imagine que A é a população de eleitores e B é o conjunto de eleitores que votam em um candidato em particular. Assim, p seria a porcentagem de eleitores que votariam nesse candidato. Deixei:
Em outras palavras:
Então cada uma de suas amostras é um teste bernoulli com probabilidadeπ ou de forma equivalente, você pode imaginar que cada uma de suas amostras é uma pesquisa de potenciais eleitores, perguntando se eles votariam no candidato. Assim, o MLE deπ É dado por:
Onde
O erro padrão para sua estimativa é:
O acima pode ser aproximado usando o MLE paraπ ou seja, por:
fonte