As águias com marcas de satélite estão desaparecidas na Escócia, e a tabela acima mostra o destino das marcas por modelo. Estou particularmente interessado nas etiquetas "Paradas - sem mau funcionamento", porque é possível que essas aves também estejam sendo mortas e que os corpos e etiquetas estejam sendo descartados.
Eu já vi afirmar que esta tabela e somente essa tabela são evidências de que "Mesmo com a análise estatística mais remota, fica claro que existem relações entre" Interrompido - sem mau funcionamento "e o tipo de tag usado" Então, minha pergunta é: fazer backup da instrução?
42/135 (31%) tags stopped for all types
8/17 (47%) tags stopped for 80NS
29/77 (38%) tags stopped for 70GPS
3/22 (14%) tags stopped for 105GPS
2/13 (15%) tags stopped for 70GSM
0/6 (0%) tags stopped for 95BTOGSM
Então, acho que a afirmação é verdadeira se a taxa de falha de 80NS de 47% for significativamente pior que a média global de 31%. E não seria verdade se a probabilidade de obter 8 falhas em uma amostra aleatória de 17 tags das 135 fosse realmente bastante alta. Mais abstratamente, se houvesse 42 bolas pretas e 93 brancas em uma sacola e eu escolhesse 17 aleatoriamente, qual é a probabilidade de escolher 8 pretas e 9 brancas?
Posso calcular a probabilidade de os 8 primeiros serem pretos como (42/135) * (41/134) etc., mas estou tentando resolver a probabilidade de qualquer 8 dos 17 ser preto
EDIT: As tags de satélite foram anexadas às aves durante um período de 13 anos, de 2004 a 2016. Esta tabela mostra 131 tags em vez de 135. 4 tags foram excluídas porque não foram capazes de determinar o local preciso da implantação de quatro tags anteriores.
Aqui está outra tabela do relatório que mostra alguns dados sobre a vida útil das tags 70GPS / 70GSM:
Respostas:
Eu encontrei uma maneira de chegar à minha resposta deste comentário " procure a distribuição hipergeométrica " em math.stackexchange:
Da entrada da Wikipedia sobre distribuição hipergeométrica
Em seguida, use uma calculadora hipergeométrica on-line e as seguintes figuras:
População: 135
Número de sucessos na população: 42
Tamanho da amostra: 17
Número de sucessos na amostra: 8
Acho que a probabilidade de obter exatamente 8 é 0,0703 e a probabilidade de obter 8 ou mais é 0,1095
Penso que o número "8 ou mais" é o mais relevante nesse caso, e devo dizer que essa probabilidade é menor do que minha intuição prevista.
Portanto, os números sugerem que há uma probabilidade de 89% de que haja algo diferente na taxa de falhas quando segregados por tipo de tag. Isso não significa que a causa da diferença seja o tipo de tag.
fonte