Suponha que tenhamos um processo de Bernoulli com probabilidade de falha (que será pequena, digamos, ) a partir da qual coletamos amostras até encontrar falhas. Assim, estimamos a probabilidade de falha como que N é o número de amostras.
Pergunta : uma estimativa parcial de ? E, se sim, existe uma maneira de corrigi-lo?
Estou preocupado que insistir na última amostra é uma falha que influencia a estimativa.
Respostas:
É verdade que é uma estimativa tendenciosa de no sentido em que , mas você não deve necessariamente deixar isso impedir você. Esse cenário exato pode ser usado como uma crítica contra a ideia de que devemos sempre usar estimadores imparciais, porque aqui o viés é mais um artefato do experimento específico que estamos realizando. Os dados parecem exatamente como teriam se tivéssemos escolhido o número de amostras com antecedência, então por que nossas inferências devem mudar?q^ q E(q^)≠q
Curiosamente, se você coletar dados dessa maneira e depois anotar a função de probabilidade nos modelos binomial (tamanho fixo da amostra) e binomial negativo, você descobrirá que os dois são proporcionais entre si. Isso significa que é apenas a estimativa de probabilidade máxima comum no modelo binomial negativo, o que obviamente é uma estimativa perfeitamente razoável.q^
fonte
Não está insistindo que a última amostra é uma falha que influencia a estimativa, está assumindo o recíproco deN
Então no seu exemplo, mas E[10E[N10]=1q . Isso está próximo de comparar a média aritmética com a média harmônicaE[10N]≠q
A má notícia é que o viés pode aumentar à medida que diminui, embora não muito depois que q já é pequeno. A boa notícia é que o viés diminui à medida que o número necessário de falhas aumenta. Parece que se você precisar de falhas de f , o viés é delimitado acima por um fator multiplicativo de fq q f paraqpequeno; você não deseja essa abordagem quando parar após a primeira falha ff−1 q
Parando após falhas, com q = 0,01, você obterá E [ N10 q=0.01 mas E[10E[N10]=100 , enquanto que comq=0,001você obteráE[NE[10N]≈0.011097 q=0.001 mas E[10E[N10]=1000 . Um viés de aproximadamente10E[10N]≈0.001111 fator multiplicativo 109
fonte
Como um complemento à resposta do dsaxton, aqui são algumas simulações em R que mostram a distribuição de amostragem de Q quando k = 10, e q 0 = 0,02 :q^ k=10 q0=0.02
Parece que , que é um pequeno viés em relação à variabilidade em q .E[q^]≈0.022 q^
fonte
10+rnbinom(10000,10,0.02)
10/(10+rnbinom(10000,10,0.02))
. A parametrização é em termos de número de sucessos / falhas em vez do número total de tentativas; portanto, você terá que adicionar k = 10 de volta. Observe que o estimador imparcial seria9/(9+rnbinom(10000,10,0.02))
, um a menos em numerador e denominador.