Fiz essa pergunta com em uma entrevista. Existe uma resposta "correta"?
Suponha que os lançamentos sejam iid e a probabilidade de cabeças é . A distribuição do número de cabeças em 400 lançamentos deve ser próxima de Normal (200, 10 ^ 2), de modo que 220 cabeças estejam a 2 desvios padrão da média. A probabilidade de observar tal resultado (ou seja, mais 2 DPs da média em qualquer direção) é um pouco menor que 5%.
O entrevistador me disse, essencialmente, "se eu observar algo> = 2 DPs da média, concluo que algo mais está acontecendo. Aposto que a moeda é justa". Isso é razoável - afinal, é o que a maioria dos testes de hipóteses faz. Mas esse é o fim da história? Para o entrevistador, essa parecia ser a resposta "correta". O que estou perguntando aqui é se alguma nuance é justificada.
Não pude deixar de salientar que decidir que a moeda não é justa é uma conclusão bizarra neste contexto de lançamento de moedas. Estou certo em dizer isso? Vou tentar explicar abaixo.
Primeiro de tudo, eu - e eu suponho que a maioria das pessoas também - tenha um forte prévio sobre moedas: é muito provável que sejam justas. É claro que isso depende do que entendemos por justo - uma possibilidade seria definir "justo" como "ter uma probabilidade de cabeças 'próximas' de 0,5, digamos entre 0,49 e 0,51".
(Você também pode definir 'justo' no sentido de que a probabilidade de cabeças é exatamente 0,50, caso em que ter uma moeda perfeitamente justo agora parece bastante un provável.)
Seu prior pode depender não apenas de suas crenças gerais sobre moedas, mas também do contexto. Se você puxou a moeda do seu próprio bolso, pode estar virtualmente certo de que é justo; se o seu amigo mágico o tirou do seu, o seu prior pode dar mais peso às moedas de duas cabeças.
De qualquer forma, é fácil criar antecedentes razoáveis que (i) coloquem uma grande probabilidade de que a moeda seja justa e (ii) levem a sua posterior a ser bastante semelhante, mesmo depois de observar 220 cabeças. Você concluiria que a moeda provavelmente seria justa, apesar de observar um resultado de 2 DPs a partir da média.
De fato, você também pode construir exemplos em que observar 220 cabeças em 400 lançamentos faz com que o seu posterior ponha mais peso na moeda, sendo justo, por exemplo, se todas as moedas injustas tiverem probabilidade de cara em .
Alguém pode lançar alguma luz sobre isso para mim?
Depois de escrever essa pergunta, lembrei-me de que já ouvira falar dessa situação geral antes - não é o "paradoxo" de Lindley ?
Whuber colocou um link muito interessante nos comentários: Você pode carregar um dado, mas não pode influenciar uma moeda . Da página 3:
Não faz sentido dizer que a moeda tem uma probabilidade p de cabeças, porque pode ser completamente determinada pela maneira como é lançada - a menos que seja lançada alta no ar com um giro rápido e apanhada no ar com sem saltar, caso em que p = 1/2.
Muito legal! Isso se encaixa na minha pergunta de uma maneira interessante: suponha que sabemos que a moeda está sendo "lançada no ar com um giro rápido e capturada no ar sem pular". Definitivamente, não devemos rejeitar a hipótese de que a moeda é justa (onde "justo" agora significa "ter p = 1/2 quando jogado da maneira descrita acima"), porque temos efetivamente um prior que coloca toda a probabilidade no moeda sendo justa. Talvez isso justifique, até certo ponto, por que estou desconfortável em rejeitar o nulo depois que 220 cabeças são observadas.
Respostas:
A maneira bayesiana padrão de resolver esse problema (sem aproximações normais) é declarar explicitamente o seu anterior, combiná-lo com a sua probabilidade, que é distribuída por beta. Em seguida, integre seu traseiro em torno de 50%, digamos dois desvios padrão ou de 49% a 51% ou o que você quiser.
Se sua crença anterior é contínua em [0,1] - por exemplo, Beta (100.100) (esta coloca muita massa em moedas mais ou menos justas) - então a probabilidade de que a moeda seja justa é zero, pois a probabilidade também é contínua [0 1]
Mesmo que a probabilidade de que a moeda seja justa seja zero, geralmente você pode responder a qualquer pergunta que fosse responder com a posterior sobre o viés. Por exemplo, qual é a vantagem do cassino, dada a distribuição posterior pelas probabilidades de moedas.
fonte
Digamos que para a distribuição de Bernoulli, neste caso, o lançamento de uma moeda.
Claramente, esta é uma distribuição binomial , e é realmente próxima de N ( µ = 200 , σ 2 = 100 ) .B(n=400,p=0.5) N(μ=200,σ2=100)
Obviamente, o entrevistador está solicitando o resultado de com intervalo de confiança de 95 % com B ( n = 400 , p = 0,5 ) , ou o valor p de B ( n = 400 , p = 0,5 , k = 220 ) .k 95% B(n=400,p=0.5) p B(n=400,p=0.5,k=220)
Minha reputação não é suficiente para eu escrever um comentário sob a Pergunta. Em vez disso, vou escrever algo aqui sobre Você não pode influenciar uma moeda . @Adrian
Aqui está o que temos
Aqui está nossa hipótese
Aqui está o nosso resultado
Desde op H0 H1
Caso contrário, criamos um padrão duplo para o teste de hipóteses aqui. Não podemos aceitar a hipótese de que o lançamento da moeda é justo e os dados do experimento são registrados corretamente .
Não faz sentido dizer que a moeda tem uma probabilidade p de cabeças
Temos resultados de experimentos para apoiar esta hipótese.
fonte