Estou lendo "The Drunkard's Walk" agora e não consigo entender uma história.
Aqui vai:
Imagine que George Lucas faça um novo filme de Guerra nas Estrelas e, em um mercado de testes, decida realizar um experimento maluco. Ele lança o filme idêntico sob dois títulos: "Guerra nas Estrelas: Episódio A" e "Guerra nas Estrelas: Episódio B". Cada filme tem sua própria campanha de marketing e cronograma de distribuição, com os detalhes correspondentes idênticos, exceto que os trailers e os anúncios de um filme dizem "Episódio A" e os do outro, "Episódio B".
Agora fazemos um concurso com isso. Qual filme será mais popular? Digamos que olhemos para os primeiros 20.000 espectadores e gravemos o filme que eles escolherem (ignorando os fãs obstinados que vão para os dois e depois insistem que houve diferenças sutis, mas significativas entre os dois). Como os filmes e suas campanhas de marketing são idênticos, podemos modelar matematicamente o jogo da seguinte maneira: imagine alinhar todos os espectadores em uma fileira e jogar uma moeda para cada espectador. Se a moeda cair, ele ou ela vê o Episódio A; se a moeda cair, é o episódio B. Como a moeda tem uma chance igual de aparecer de qualquer maneira, você pode pensar que nessa guerra experimental de bilheteria cada filme deve estar na liderança cerca da metade do tempo.
Mas a matemática da aleatoriedade diz o contrário: o número mais provável de mudanças no lead é 0 e é 88 vezes mais provável que um dos dois filmes passe por todos os 20.000 clientes do que, digamos, o lead gangorra continuamente "
Eu, provavelmente incorretamente, atribuo isso a um problema claro dos testes de Bernoulli, e devo dizer que não vejo por que o líder não vai gangorra em média! Alguém pode explicar?
fonte
cumsum
é usado, em vez desum
imaginar que os espectadores estão na fila, e que verificamos qual filme eles compraram um ingresso para um por um.cumsum
fornece um vetor de somas parciais, de modo que o 1º elemento nos diga a que distância / atrás de A está o jogador após 1 espectador, o segundo elemento a que distância A está depois de 2 espectadores, o terceiro elemento depois de 3 espectadores e assim por diante. Se o elemento for positivo, A terá mais espectadores após os primeiros i espectadores. Se for negativo, B teve mais espectadores e se for 0 eles tiveram o mesmo número de espectadoressum
somaria todos os 1 e -1, o que forneceria o resultado final após todos os 20.000 espectadores serem contabilizados (ou seja, o último elemento documsum
vetor).Se você deseja calcular algumas das probabilidades, precisa contar algo semelhante a trilhos que não cruzam a diagonal. Existe um ótimo método combinatório que se aplica a passeios aleatórios (e ao movimento browniano) que não cruzam essa linha, chamado princípio de reflexão ou método de reflexão . Este é um método para determinar os números catalães . Aqui estão duas outras aplicações:
The total number of sequences with any endpoint so thatA is never behind is (20,00010,000)≈220,000/10,000π−−−−−−−√. So, the probability that A is never behind is about 1100π√ . The chance that the lead never changes is about 150π√≈1/89. The average number of lead changes is about 56 .
fonte
"it is 88 times more probable that one of the two films will lead through all 20,000 customers than it is that, say, the lead continuously seesaws"
In plain English: one of the movies gets an early lead. It has to, as the first customer has to go to A or B. That movie is then just as likely to keep its lead as lose it.
88 times more likely sounds, well, unlikely, until you remember that perfect seesawing is very improbable. The chart in MansT's answer, showing this graphically, is fascinating isn't it.
ASIDE: Personally, I think it'll be more than 88 times - due to
<buzzword-alert>
viral marketing</buzzword-alert>
. Each person will ask other people what they saw, and are more likely to visit the same movie. They'll even do this subconsciously: people are more likely to join a long queue to go an see something. I.e. as soon as randomness amongst the first few customers has created a leader, human psychology will keep it as a leader :-).fonte