Você observa k cabeças de n arremessos. A moeda é justa?

13

Fiz essa pergunta com (n,k)=(400,220) em uma entrevista. Existe uma resposta "correta"?

Suponha que os lançamentos sejam iid e a probabilidade de cabeças é p=0.5 . A distribuição do número de cabeças em 400 lançamentos deve ser próxima de Normal (200, 10 ^ 2), de modo que 220 cabeças estejam a 2 desvios padrão da média. A probabilidade de observar tal resultado (ou seja, mais 2 DPs da média em qualquer direção) é um pouco menor que 5%.

O entrevistador me disse, essencialmente, "se eu observar algo> = 2 DPs da média, concluo que algo mais está acontecendo. Aposto que a moeda é justa". Isso é razoável - afinal, é o que a maioria dos testes de hipóteses faz. Mas esse é o fim da história? Para o entrevistador, essa parecia ser a resposta "correta". O que estou perguntando aqui é se alguma nuance é justificada.

Não pude deixar de salientar que decidir que a moeda não é justa é uma conclusão bizarra neste contexto de lançamento de moedas. Estou certo em dizer isso? Vou tentar explicar abaixo.

Primeiro de tudo, eu - e eu suponho que a maioria das pessoas também - tenha um forte prévio sobre moedas: é muito provável que sejam justas. É claro que isso depende do que entendemos por justo - uma possibilidade seria definir "justo" como "ter uma probabilidade de cabeças 'próximas' de 0,5, digamos entre 0,49 e 0,51".

(Você também pode definir 'justo' no sentido de que a probabilidade de cabeças é exatamente 0,50, caso em que ter uma moeda perfeitamente justo agora parece bastante un provável.)

Seu prior pode depender não apenas de suas crenças gerais sobre moedas, mas também do contexto. Se você puxou a moeda do seu próprio bolso, pode estar virtualmente certo de que é justo; se o seu amigo mágico o tirou do seu, o seu prior pode dar mais peso às moedas de duas cabeças.

De qualquer forma, é fácil criar antecedentes razoáveis ​​que (i) coloquem uma grande probabilidade de que a moeda seja justa e (ii) levem a sua posterior a ser bastante semelhante, mesmo depois de observar 220 cabeças. Você concluiria que a moeda provavelmente seria justa, apesar de observar um resultado de 2 DPs a partir da média.

De fato, você também pode construir exemplos em que observar 220 cabeças em 400 lançamentos faz com que o seu posterior ponha mais peso na moeda, sendo justo, por exemplo, se todas as moedas injustas tiverem probabilidade de cara em .{0,1}

Alguém pode lançar alguma luz sobre isso para mim?


Depois de escrever essa pergunta, lembrei-me de que já ouvira falar dessa situação geral antes - não é o "paradoxo" de Lindley ?

Whuber colocou um link muito interessante nos comentários: Você pode carregar um dado, mas não pode influenciar uma moeda . Da página 3:

Não faz sentido dizer que a moeda tem uma probabilidade p de cabeças, porque pode ser completamente determinada pela maneira como é lançada - a menos que seja lançada alta no ar com um giro rápido e apanhada no ar com sem saltar, caso em que p = 1/2.

Muito legal! Isso se encaixa na minha pergunta de uma maneira interessante: suponha que sabemos que a moeda está sendo "lançada no ar com um giro rápido e capturada no ar sem pular". Definitivamente, não devemos rejeitar a hipótese de que a moeda é justa (onde "justo" agora significa "ter p = 1/2 quando jogado da maneira descrita acima"), porque temos efetivamente um prior que coloca toda a probabilidade no moeda sendo justa. Talvez isso justifique, até certo ponto, por que estou desconfortável em rejeitar o nulo depois que 220 cabeças são observadas.

Adrian
fonte
1
Alguma parte da sua pergunta mudaria se você interpretasse a "moeda" como uma metáfora para algum processo binário sobre o qual você não tinha conhecimento prévio?
whuber
1
@ whuber Essa é uma boa pergunta. Acho que nesse caso eu estaria muito mais disposto a aceitar "rejeitar quando p <= 0,05", embora não tenha muita certeza de como justificar isso para mim.
Adrian
Outra questão que me incomoda é que a pessoa que fez a pergunta estava interessada na hipótese de que p = 0,50 exatamente. Mas se você pensar em p ser distribuído continuamente, isso terá probabilidade zero, independentemente do que você observar. Parece-me muito mais significativo fazer afirmações sobre p pertencentes a algum intervalo. Isso seria um problema na situação em que eu não tinha conhecimento prévio e decidi usar um uniforme anterior, por exemplo.
Adrian
3
Faz sentido. A questão focada em moedas é um pouco perturbadora, porque as respostas a essas perguntas geralmente se transformam em discussões sobre a física (e truque de mão) do lançamento de moedas. Você pode ficar chocado com o quão contrária a situação real pode ser com seus anteriores fortes, dependendo de como a moeda é lançada. "Não faz sentido dizer que a moeda tem uma probabilidade de cabeças"p .
whuber
1
O @Adrian DJC MacKay discute esse problema exato (com n = 250, k = 140) em seu livro gratuito neste link: inference.phy.cam.ac.uk/itprnn/book.pdf (pág. 63) leia o que ele diz. Ele chega a uma conclusão semelhante a você.
Solha dos rios

Respostas:

4

A maneira bayesiana padrão de resolver esse problema (sem aproximações normais) é declarar explicitamente o seu anterior, combiná-lo com a sua probabilidade, que é distribuída por beta. Em seguida, integre seu traseiro em torno de 50%, digamos dois desvios padrão ou de 49% a 51% ou o que você quiser.

Se sua crença anterior é contínua em [0,1] - por exemplo, Beta (100.100) (esta coloca muita massa em moedas mais ou menos justas) - então a probabilidade de que a moeda seja justa é zero, pois a probabilidade também é contínua [0 1]

Mesmo que a probabilidade de que a moeda seja justa seja zero, geralmente você pode responder a qualquer pergunta que fosse responder com a posterior sobre o viés. Por exemplo, qual é a vantagem do cassino, dada a distribuição posterior pelas probabilidades de moedas.

Neil G
fonte
1
+1, mas gostaria de complementar esta resposta um pouco. Suponha que definamos uma moeda justa como como sugere o OP, e desejamos colocar 99 % de nossa probabilidade anterior nesse caso. Então um prior razoável é p Beta0.49<p<0.5199% , de modo que P ( p ( 0,49 , 0,51 ) ) = 0,99003. Dados os dados da pergunta, a distribuição posterior se torna p | dados Beta (pBeta(8300,8300)
P(p(0.49,0.51))=0.99003.
e a probabilidade posterior de uma moeda justa ainda é muito grande: P ( p ( 0,49 , 0,51 ) | dados ) = 0,9886. p|dataBeta(8300+220,8300+180)
P(p(0.49,0.51)|data)=0.9886.
knrumsey 6/01
2

Digamos que para a distribuição de Bernoulli, neste caso, o lançamento de uma moeda.

Claramente, esta é uma distribuição binomial , e é realmente próxima de N ( µ = 200 , σ 2 = 100 ) .B(n=400,p=0.5)N(μ=200,σ2=100)

Obviamente, o entrevistador está solicitando o resultado de com intervalo de confiança de 95 % com B ( n = 400 , p = 0,5 ) , ou o valor p de B ( n = 400 , p = 0,5 , k = 220 ) .k95%B(n=400,p=0.5)pB(n=400,p=0.5,k=220)

p=0.5π(p=0.5)=0.5π(p0.5)=0.5

π(0.49p0.51)=0.9π(p<0.49p>0.51)=0.1p

P(0.49p0.51|k=220)

pN(μ=0.5,σ2=0.25)σ2=0.1

pf(p|k=220)


Minha reputação não é suficiente para eu escrever um comentário sob a Pergunta. Em vez disso, vou escrever algo aqui sobre Você não pode influenciar uma moeda . @Adrian

Aqui está o que temos

  1. B(n=400,k=220,p=θ)
  2. O estudo teórico e experimental Você não pode influenciar uma moeda

Aqui está nossa hipótese

H0:θ^=0.5

H1

Aqui está o nosso resultado

  1. H0
  2. H1

Desde o pH0H1

Caso contrário, criamos um padrão duplo para o teste de hipóteses aqui. Não podemos aceitar a hipótese de que o lançamento da moeda é justo e os dados do experimento são registrados corretamente .


Não faz sentido dizer que a moeda tem uma probabilidade p de cabeças

Temos resultados de experimentos para apoiar esta hipótese.

pN(μ=0.5,σ2)

σs

Zhang Tschao
fonte
1
Obrigado Zhang. Um pequeno detalhe: se você quiser usar a distribuição Normal para a sua probabilidade acima da probabilidade de cabeças, eu diria que você deve truncá-la para que p esteja em [0, 1].
Adrian
Claro que existem muitas distribuições anteriores razoáveis ​​e posteriores correspondentes. O ponto real da minha pergunta é mais geral: decidir que a moeda não é justa parece-me uma conclusão bizarra neste contexto de lançamento de moedas. O que você acha disso - e por quê?
Adrian
Uma prévia conveniente aqui seria a distribuição Beta, uma vez que é conjugada com a probabilidade Binomial. Mas, novamente, o verdadeiro impulso da minha pergunta é mais geral do que o anterior específico.
Adrian
Eu acho que a razão é que você dá muita probabilidade ao específico π(p=0.5)pU(0,1)E(p)f(p|k=220)p=0.5E(p). E aceitamos facilmente a hipótese de que a moeda não é justa. Especialmente neste caso, você não achará que decidir a moeda não é uma conclusão bizarra.
Zhang Tschao
@ user777 A distribuição normal aparece duas vezes na resposta de Zhang, primeiro como uma aproximação ao binômio (ótimo) e depois como um prior para a probabilidade de cabeças (quando ele diz "o prior é uma distribuição normal p ~ N"). Zhang - sua edição sobre o nulo sendo "a moeda é justa e os dados foram registrados corretamente" é interessante, obrigado por publicá-la.
Adrian