Probabilidade de 10000: 1 de probabilidade acontecer exatamente uma vez em 10.000 tentativas

8

Estou interessado em entender a diferença entre "probabilidade" de um evento aleatório com uma probabilidade específica que realmente ocorra com a probabilidade exata de que é provável. ou seja, se um evento tem uma probabilidade de 1 em 10000, qual é a probabilidade de que em 10000 tentativas ocorra exatamente 1 vez, não 2 vezes, não 0 vezes, não 3 vezes etc. e como se expressa (e explica) o desvio?

Se um evento tem uma probabilidade de 1: 10.000, portanto, em 100.000 tentativas, provavelmente ocorrerá 10 vezes; em 1.000.000 de tentativas, provavelmente ocorrerá 100 vezes, mas também não ocorrerá em um determinado conjunto de 1.000.000 de tentativas inúmeras vezes, por exemplo: 98 vezes, 99 vezes, 101 vezes, 96 vezes, 102 vezes etc.

Estatisticamente falando, quantas tentativas devem ser calculadas e contabilizadas para se aproximar de uma certeza estatística de que um resultado específico é realmente 1: 10000, e não 1: 9999 ou 1: 10001 ou 1: 10000,5, etc.?

RobH
fonte
1) O que você quer dizer com "uma certeza estatística"? 2) "Probabilidade" tem um significado técnico específico nas estatísticas que duvido que você pretenda. Se você quer dizer probabilidade , use essa palavra.
Glen_b -Reinstala Monica
Exatamente .... Não tenho certeza do significado técnico exato dos dois termos "probabilidade" e "probabilidade" ... o que quero dizer, suponho, é que a probabilidade é de 1: 10000 (ou seja qual for a probabilidade) mas se eu desenhar aleatoriamente algo que tenha essa probabilidade, isso não significa necessariamente que ele se tornará realidade exatamente 1 em cada 10000 vezes, não é? E no que diz respeito à "certeza estatística" ... quantas tentativas você precisaria para determinar a probabilidade real de algo, se dados empíricos mostrarem que algo que se pensa ser 1: 10000 é na verdade 1: 9999 ou 1: 10001, etc.
RobH
Obrigado por suas respostas. Acho que o que me pergunto é: quanto maior o tamanho da amostra, ou seja, 10.000.000 tentativas, 100.000.000 tentativas etc., resultará em um resultado mais próximo do esperado de 1 por 10.000 ou sempre haverá uma probabilidade de desvio semelhante ....
RobH
Sim, aproxima-se de 1 em 10000 cada vez mais de perto; À medida que o número de tentativas aumenta (presumo que esteja bem além de 10000 e aumentando), a proporção da amostra se torna mais concentrada em torno da proporção verdadeira (população). O desvio padrão da distribuição da proporção da amostra (seu erro padrão ) diminui na proporção de . De fato, para grande (novamente, substancialmente mais de 10000), você terá cerca de 95% de probabilidade em np±11nnp±1n
Glen_b -Reinstata Monica
Obrigado pelas respostas .... agora, com o risco de adiantar o ponto, deixe-me fazer um acompanhamento ... digamos que, após 10.000.000.000 de tentativas, o resultado tenha ocorrido 999.982 vezes, você indicaria a probabilidade da próxima tentativa? 1: 9999,82 ou 1: 10000 ou algum resultado calculado envolvendo o desvio? .. (Ou eu acho que o mesmo poderia ser solicitado depois de apenas 1 conjunto de 10.000 testes com precisão muito menos!)
RobH

Respostas:

16

a 1 em 10000 probabilidade, qual é a probabilidade de probabilidade de que em 10000 ensaios ocorrerá exatamente 1 hora

1/e0.3679 , o mais próximo possível não faz . (A probabilidade de que isso aconteça exatamente 0 vezes é quase exatamente a mesma.)

Edit: Como Mark L Stone ressalta, com razão, tomei sua pergunta como implicando que os julgamentos são independentes sem estabelecer que esse é o caso. Essa é uma suposição crítica (e pode não ser razoável em muitas situações). No entanto, continuarei respondendo com base nisso, porque continuo pensando que essa foi sua intenção.

O mesmo vale para tentativas e uma probabilidade de , para qualquer suficientemente grande .1 / n nn1/nn

As probabilidades (para qualquer grande ) são muito parecidas com esta (mostrando o caso para = 10000):nnn

insira a descrição da imagem aqui

Se um evento tem uma probabilidade de 1: 10.000, portanto, em 100.000 tentativas, provavelmente ocorrerá 10 vezes; em 1.000.000 de tentativas, provavelmente ocorrerá 100 vezes, mas também não ocorrerá em um determinado conjunto de 1.000.000 de tentativas inúmeras vezes, por exemplo: 98 vezes, 99 vezes, 101 vezes, 96 vezes, 102 vezes etc.

Não exatamente: 99 e 100 têm a mesma chance, mas todo o resto tem uma chance menor:

insira a descrição da imagem aqui

(a probabilidade continua a diminuir à medida que você avança).

Especificamente, você está lidando com uma distribuição binomial com e .p = 1 / 10000n=1000000p=1/10000

Como é grande é pequeno, é bem aproximado por uma distribuição de Poisson com média .p λ = n p = 100npλ=np=100

quantas tentativas devem ser calculadas e calculadas para se aproximar de uma certeza estatística de que um resultado específico é realmente 1: 10000, e não 1: 9999 ou 1: 10001

Você não pode ter certeza de que na verdade é 1/10000, pois você pode estar arbitrariamente próximo, mas diferente.

Em tentativas, o número esperado de sucessos é com sd .n p nnpnp(1p)np

Se , e , em seguida, o número esperado de sucessos é com SD ; se o número esperado de sucessos seria ... a cerca de um desvio padrão - não o suficiente para diferenciá-los "de maneira confiável". Mas com , você está a cerca de sd de distância e pode diferenciá-los mais facilmente; provavelmente é tão baixo quanto a maioria das pessoas gostaria de ir. Em você pode diferenciá-los bastante (as chances de 1/10000 parecerem 1/9999 ou 1/10001 ou qualquer coisa mais distante por acaso são bem pequenas nesse ponto).p=1/10000n=1012108104p=1/9999100,010,000n=4×10122n=1013

Digamos que você ficou satisfeito com tentativas de distinguir de . Se você deseja descartar 1/9999,5 com a mesma confiança que tinha para descartar 1/9999, precisará de 4 vezes mais tentativas.1013p=1/100001/9999

Você pode ver que fixar proporções a muitos valores de precisão (quando é muito pequeno) exige muitas tentativas; você precisa de um tamanho de amostra várias vezes mais que para obter uma estimativa precisa o suficiente para descartar quando é realmente .p(1/p)3p=1/(k±1)1/k

digamos que, após 10.000.000.000 de tentativas, o resultado ocorreu 999.982 vezes, você indicaria que a probabilidade da próxima tentativa seja 1: 9999.82 ou 1: 10000 ou algum resultado calculado envolvendo o desvio? .. (Ou acho que o mesmo poderia ser solicitado depois de apenas 1 conjunto de 10.000 ensaios com muito menos precisão!)

Sim, pode ser solicitado em 10000 tentativas ou 1000 ou 100.

Vamos simplificar as coisas e fazer 10000 tentativas e 98 sucessos. Pode-se, é claro, tomar como estimativa pontual a probabilidade de sucesso 98/10000 = 0,0098, mas essa não será realmente a proporção subjacente, apenas uma estimativa. Pode muito bem ser 0,944 ... ou 0,997 ... ou qualquer número de outros valores.

Então, uma coisa que as pessoas fazem é construir um intervalo de valores que seriam (em algum sentido) razoavelmente consistentes com a proporção observada. Existem duas filosofias principais da estatística (estatística bayesiana e freqüentista) que em grandes amostras geralmente tendem a gerar intervalos semelhantes, mas que têm interpretações bastante diferentes.

O mais comum seria um intervalo de confiança (freqüentista) ; um intervalo para o parâmetro ( ) que (em muitas repetições do mesmo experimento) seria esperado incluir o parâmetro em uma determinada proporção do tempo.p

Um intervalo bayesiano típico começaria com uma distribuição anterior no parâmetro que representa sua incerteza sobre seu valor e usaria os dados para atualizar esse conhecimento para uma distribuição posterior e obter um intervalo confiável .

Intervalos de confiança são amplamente utilizados (embora um intervalo confiável possa se aproximar de suas expectativas sobre o que um intervalo deve fazer). No caso do intervalo de confiança da proporção binomial , como aqui, há uma variedade de abordagens, embora em grandes amostras todas elas ofereçam praticamente o mesmo intervalo.

com dados, mesmo 6 x 10 ^ 9 tentativas podem não resultar em exatamente 1 x 10 ^ 9 para cada um dos seis resultados

Corrigir; você esperaria (com dados justos) obter entre 999,94 milhões e 1000,06 milhões de sucesso quase (mas não exatamente) toda vez que você o experimentasse.

Se a probabilidade real for de 1: 10000, o aumento de tentativas dentro do desvio esperado tenderá a confirmar que

Ele quase sempre continuará consistente com ele (e com uma variedade de outros valores próximos). O que acontece não é que você saiba que é 1/10000, mas que o intervalo dos valores de probabilidade consistentes com seus resultados ficará mais estreito à medida que o tamanho da amostra aumentar.

Glen_b -Reinstate Monica
fonte
Glen_b, você está assumindo que cada tentativa é independente. Isso pode ser o que o OP pretendia, mas a falta de sofisticação em probabilidade do OP sugere para mim que o OP está implicitamente assumindo uma independência, como talvez sempre aplicável à probabilidade. Considere uma variável aleatória para a qual haverá 10000 tentativas, de modo que, com probabilidade 9999/10000, o evento ocorra em zero tentativas e com probabilidade 1/10000, o evento ocorra em todas as 10000 tentativas. O evento tem uma probabilidade de 1 em 10000, e a probabilidade de ocorrer exatamente uma vez em 100000 tentativas é zero.
Mark L. Stone
Obrigado @ MarkL.Stone - você está correto, tomei a pergunta como implicando independência, mas eu deveria ter sido completamente explícito sobre isso. Vou adicionar uma frase para esclarecer minha resposta.
Glen_b -Reinstar Monica
Assumirei a diferença se cada tentativa é independente da seguinte forma: se eu tivesse um contêiner de 10.000 bolinhas de gude, 1 vermelha e 9.999 pretas, a probabilidade de selecionar o mármore vermelho no primeiro teste seria 1: 10000 ... se Como desenho uma bola de gude preta, a probabilidade de vermelho no próximo teste seria 1: 9999, e continuando até desenhar a bola de gude vermelha, após a qual a probabilidade seria 0. Um exemplo de tentativa independente significaria que cada bola de gude ser retirado de um novo contêiner de 9999 bolinhas pretas e 1 mármore vermelho, correto? Sim, era isso que eu pretendia descrever.
RobH
2

p=1nn

n1/e0.632n

Explicação:

Suponha que eu jogue um dado 6 vezes. A probabilidade de obter 1pelo menos uma vez dessas 6 tentativas é:

Probabilidade de não obter '1' para cada tentativa:

p=56

Probabilidade de não obter nenhum '1' em 6 tentativas:

p=566

Probabilidade de obter '1' pelo menos uma vez em 6 tentativas:

p=15660.665

Da mesma forma, suponha que um evento tenha uma probabilidade de 1/10000. A probabilidade desse evento acontecer pelo menos uma vez fora das 10000tentativas é:

p=1999910000100000.634

Podemos extrapolar isso para qualquer um ne obter:

p=1nn

p=1(n1n)n

E desde:

limn+n1nn=limn+(11n)n=1e0.368

Nós podemos dizer que:

limn+1n1nn0.632

Ao traçar essa equação no Grapher , obtemos algo assim:

insira a descrição da imagem aqui

Conclusão: embora faz todo o sentido, eu estava realmente muito surpreso com o fato de que a probabilidade de um evento com acontecendo, pelo menos uma vez fora de tentativas é quase independente de , para como pouco como já. nnn3p=1nnnn3

Jivan
fonte
0

Vamos estabelecer um problema mais simples nos dados. Vamos calcular a probabilidade de probabilidade de que, em 6 jogadas de dados, a pontuação seja 1 exatamente uma vez.

Quantas maneiras isso pode acontecer [e suas respectivas probabilidades]:

1 is scored in first throw but not in any other throws[1/6*5/6*5/6*...] [=3125/46656]
1 is scored in second throw but not in any other throw [5/6*1/6*5/6*...] [=3125/46656]
...
...

então a probabilidade total de 1 ser pontuada apenas uma vez em 6 jogadas é (3125/46656) * 6 = 3125/7776

Você pode estender o mesmo desenvolvimento para eventos com probabilidade 1 / n. A probabilidade de ocorrência de eventos apenas uma vez em n ensaios seria

((n-1)/n)^(n-1)

Isso pode parecer um pouco familiar quando eu o reorganizo:

(1-1/n)^(n-1)

Outra parte da sua pergunta: reduzir o desvio à medida que o número de amostras aumenta, já está bem explicada em outra resposta.

GPS
fonte
Lamentavelmente, as respostas destacadas estão incorretas.
precisa