K sucessos em ensaios Bernoulli, ou experimento filme George Lucas

23

Estou lendo "The Drunkard's Walk" agora e não consigo entender uma história.

Aqui vai:

Imagine que George Lucas faça um novo filme de Guerra nas Estrelas e, em um mercado de testes, decida realizar um experimento maluco. Ele lança o filme idêntico sob dois títulos: "Guerra nas Estrelas: Episódio A" e "Guerra nas Estrelas: Episódio B". Cada filme tem sua própria campanha de marketing e cronograma de distribuição, com os detalhes correspondentes idênticos, exceto que os trailers e os anúncios de um filme dizem "Episódio A" e os do outro, "Episódio B".

Agora fazemos um concurso com isso. Qual filme será mais popular? Digamos que olhemos para os primeiros 20.000 espectadores e gravemos o filme que eles escolherem (ignorando os fãs obstinados que vão para os dois e depois insistem que houve diferenças sutis, mas significativas entre os dois). Como os filmes e suas campanhas de marketing são idênticos, podemos modelar matematicamente o jogo da seguinte maneira: imagine alinhar todos os espectadores em uma fileira e jogar uma moeda para cada espectador. Se a moeda cair, ele ou ela vê o Episódio A; se a moeda cair, é o episódio B. Como a moeda tem uma chance igual de aparecer de qualquer maneira, você pode pensar que nessa guerra experimental de bilheteria cada filme deve estar na liderança cerca da metade do tempo.

Mas a matemática da aleatoriedade diz o contrário: o número mais provável de mudanças no lead é 0 e é 88 vezes mais provável que um dos dois filmes passe por todos os 20.000 clientes do que, digamos, o lead gangorra continuamente "

Eu, provavelmente incorretamente, atribuo isso a um problema claro dos testes de Bernoulli, e devo dizer que não vejo por que o líder não vai gangorra em média! Alguém pode explicar?

andreister
fonte

Respostas:

22

Aqui está um código R para simular o experimento de George Lucas:

B<-20000
steps<-2*rbinom(B,1,0.5)-1
rw<-cumsum(steps)
ts.plot(rw,xlab="Number of customers",ylab="Difference")

Ao executá-lo, temos imagens como estas:

insira a descrição da imagem aqui

onde a diferença de tickets vendidos entre A e B está no eixo y.

Em seguida, corremos tais simulados experiências George Lucas. Para cada experimento, calculamos a proporção de tempo gasto 0 , ou seja, a proporção de espectadores alinhados para os quais o número de ingressos vendidos para A é maior ou igual ao número de ingressos vendidos para B. Intuitivamente, você dizer que esta proporção deve ser aproximadamente 1 / 2 . Aqui está um histograma dos resultados:10,00001/2

insira a descrição da imagem aqui

A proporção é de , em média, no sentido em que o valor esperado é 1 / 2 , mas 1 / 2 é um valor improvável em comparação com valores próximos de 01/21/21/20 ou . Para a maioria dos experimentos, as diferenças são positivas ou negativas na maioria das vezes!1

A curva a vermelho é a função de densidade da distribuição de arco-seno, também conhecido como o de distribuiçãoBeta(1/2,1/2) . O que é ilustrado na figura acima é um teorema conhecido como a primeira lei arscina para caminhadas aleatórias , que diz que, conforme o número de etapas da caminhada aleatória simétrica simples se aproxima do infinito, a distribuição da proporção de tempo gasto acima tende a distribuição do arco-seno. Uma referência padrão para esse resultado é a Seção III.4 deUma introdução à teoria das probabilidades e suas aplicações, Vol 1,de William Feller.0


O código R para o estudo de simulação é

prop<-vector(length=10000)
for(i in 1:10000)
{
    steps<-2*rbinom(B,1,0.5)-1
    rw<-cumsum(steps)
    prop[i]<-sum(rw>=0)/B
}
hist(prop,freq=FALSE,xlab="Proportion of time spent above 0",main="George Lucas experiment")
curve(dbeta(x,1/2,1/2),0,1,col=2,add=TRUE)
MånsT
fonte
Obrigado! Instalei o R e gostaria de repetir todas as suas etapas - como posso executar 10.000 simulações e calcular a proporção de tempo gasto?
andreister
@andreister: editei minha resposta, adicionando o código para a simulação no final. Espero que você ache útil!
precisa saber é o seguinte
Obrigado, isso é muito útil! Para ter certeza de que entendi tudo, criei pastebin.com/mtRdsPkP com base no seu código - você pode clicar rapidamente?
andreister
@andreister: Parece bom! Para responder à pergunta sobre por que cumsumé usado, em vez de sumimaginar que os espectadores estão na fila, e que verificamos qual filme eles compraram um ingresso para um por um. cumsumfornece um vetor de somas parciais, de modo que o 1º elemento nos diga a que distância / atrás de A está o jogador após 1 espectador, o segundo elemento a que distância A está depois de 2 espectadores, o terceiro elemento depois de 3 espectadores e assim por diante. Se o elemento for positivo, A terá mais espectadores após os primeiros i espectadores. Se for negativo, B teve mais espectadores e se for 0 eles tiveram o mesmo número de espectadoresii
MånsT
(continuação) Essas são as informações pelas quais estamos interessados, pois queremos ver se o líder está procurando. sumsomaria todos os 1 e -1, o que forneceria o resultado final após todos os 20.000 espectadores serem contabilizados (ou seja, o último elemento do cumsumvetor).
MånsT
11

1/2tt=13/4t=3t aumenta.

11

20,000

Se você deseja calcular algumas das probabilidades, precisa contar algo semelhante a trilhos que não cruzam a diagonal. Existe um ótimo método combinatório que se aplica a passeios aleatórios (e ao movimento browniano) que não cruzam essa linha, chamado princípio de reflexão ou método de reflexão . Este é um método para determinar os números catalães . Aqui estão duas outras aplicações:

A10,2009,800(20,0009,800)(10,200,9,800)BBB(9,799,10,201)(10,200,9,800) para queB(20,0009,800)(20,00010,201)=(20,0009,800)(20,0009,799)=(20,0009,800)40110,201. So, you can see that the chance B was ahead at some point, given that you end up at (10,200,9,800), is about 96%.

The total number of sequences with any endpoint so that A is never behind is (20,00010,000)220,000/10,000π. So, the probability that A is never behind is about 1100π. The chance that the lead never changes is about 150π1/89. The average number of lead changes is about 56.

Douglas Zare
fonte
Thanks! I need to understand the notation before I understand your answer though! What does it mean "ends up ahead 10,200−9,800" etc, where do you get the numbers from? How do you see 20K is the mode?
andreister
The values 10,2009,800 were an example. That's just one of the possible results. You can do the same sort of analysis for 11,0009,000 or 10,0019,999. I don't think I said 20,000 was the mode of anything. Your quote said, " the most probable number of changes in the lead is 0" which means 0 is the mode. However, this is similar to a geometric distribution with p close to 0. The most likely value is 0 (if you use the 0-based convention), but it's not likely. There are a lot of other possibilities with slightly lower probabilities.
Douglas Zare
0

"it is 88 times more probable that one of the two films will lead through all 20,000 customers than it is that, say, the lead continuously seesaws"

In plain English: one of the movies gets an early lead. It has to, as the first customer has to go to A or B. That movie is then just as likely to keep its lead as lose it.

88 times more likely sounds, well, unlikely, until you remember that perfect seesawing is very improbable. The chart in MansT's answer, showing this graphically, is fascinating isn't it.

ASIDE: Personally, I think it'll be more than 88 times - due to <buzzword-alert> viral marketing </buzzword-alert>. Each person will ask other people what they saw, and are more likely to visit the same movie. They'll even do this subconsciously: people are more likely to join a long queue to go an see something. I.e. as soon as randomness amongst the first few customers has created a leader, human psychology will keep it as a leader :-).

Darren Cook
fonte