Determinando o tamanho da amostra com uma proporção e distribuição binomial

10

Estou tentando aprender algumas estatísticas usando o livro Biometry by Sokal and Rohlf (3e). Este é um exercício no quinto capítulo que aborda a probabilidade, a distribuição binomial e a distribuição de Poisson. insira a descrição da imagem aqui

Percebo que existe uma fórmula para produzir uma resposta a esta pergunta: No entanto, essa equação não está neste texto. Eu gostaria de saber como calcular o tamanho da amostra sabendo apenas a probabilidade, o nível de confiança desejado e a distribuição binomial. Há algum recurso que aborde este tópico que eu possa apontar? Eu tentei o Google, mas o que vi até agora exige informações às quais não tenho acesso neste problema.

n=4(pq)2
perplexo
fonte
11
Deseja ser guiado em uma jornada para descobrir a resposta ou prefere apenas receber a resposta, juntamente com uma explicação de por que é a resposta?
jbowman
2
Uma jornada parece legal. Isso não é para uma aula e a resposta é dada no final da pergunta. Não quero saber apenas a resposta - já sei! Eu fiz um curso de estatísticas há muitos anos, mas não o apreciei o suficiente na época. Estou tentando remediar isso agora e realmente começo a entender os padrões subjacentes. Eu apreciaria a ajuda. Esse problema em particular parece não se encaixar nos outros desta seção e uma abordagem adequada não é claramente demonstrada (para mim) a partir das informações do texto sobre a distribuição binomial nem de seus exemplos dados.
perplexo
11
Eu estaria muito interessado em ler uma resposta detalhada (com indicadores para futuras leituras, quando necessário) a esta pergunta.
Zhubarb
2
Vamos considerar um exemplo concreto e simples; você tem 5 slides de uma pessoa que tem o patógeno. Qual é a probabilidade de você não conseguir identificar corretamente essa pessoa como portadora do patógeno? Uma suposição oculta é que a presença / ausência do patógeno em uma lâmina é independente da presença / ausência do patógeno em outras lâminas retiradas da mesma amostra.
jbowman
11
Essa seria a probabilidade de obter 5 falsos negativos consecutivos:
desconcertado

Respostas:

8

Essa seria a probabilidade de obter um falso negativo em 5 slides:

(0,80) ^ 5 = 0,32768

Ahhh, então, para diminuir a probabilidade de falsos negativos abaixo de 1%, você pode:

> x <- matrix(c(0), nrow=25)
> for(i in 1:25) x[i] = (0.8)^i
> x
             [,1]
 [1,] 0.800000000
 [2,] 0.640000000
 [3,] 0.512000000
 [4,] 0.409600000
 [5,] 0.327680000
 [6,] 0.262144000
 [7,] 0.209715200
 [8,] 0.167772160
 [9,] 0.134217728
 [10,] 0.107374182
 [11,] 0.085899346
 [12,] 0.068719477
 [13,] 0.054975581
 [14,] 0.043980465
 [15,] 0.035184372
 [16,] 0.028147498
 [17,] 0.022517998
 [18,] 0.018014399
 [19,] 0.014411519
 [20,] 0.011529215
 [21,] 0.009223372
 [22,] 0.007378698
 [23,] 0.005902958
 [24,] 0.004722366
 [25,] 0.003777893

E descubra que a taxa de falsos positivos é inferior a 1% em i = 21.

Ótimo! Obrigado. Não acredito que não vi isso. Eu estava tentando todos os tipos de probabilidades condicionais e outras por algum motivo. Mantenha simples, idiota...

perplexo
fonte
11
Sim, às vezes os problemas mais fáceis são os mais difíceis!
jbowman