Worm e Apple valor esperado

8

Uma maçã está localizado no vértice A do pentágono ABCDE , e um sem-fim está localizado dois vértices de distância, em C . Todos os dias o verme rasteja com igual probabilidade a um dos dois vértices adjacentes. Assim, depois de um dia, o sem-fim é no vértice B ou D , cada um com probabilidade 1/2 . Depois de dois dias, o worm pode estar de volta a C novamente, porque não tem memória das posições anteriores. Quando atinge o vértice A , pára para jantar.

(a) Qual é a média do número de dias até o jantar?

(b) Seja p a probabilidade de que o número de dias seja 100 ou mais. O que a desigualdade de Markov diz sobre p ?

Para (a), seja X a variável aleatória definida pelo número de dias até o jantar. Então

P(X=0)=0P(X=1)=0P(X=2)=1(52)

Qual seria a distribuição geral?

Para (b), se conhecemos (a), sabemos que

P(X100)E(X)100
probguy3434
fonte
2
Você poderia explicar seu primeiro conjunto de equações? Eles não parecem explicar a possibilidade da direção de inversão do verme, nem parecem corretos. Afinal, é muito menor que a chance do caminho que tem probabilidade Observe que o objetivo desta pergunta é que pode ser mais difícil obter a distribuição completa do que calcular sua expectativa; e a desigualdade de Markov, no entanto, permite deduzir informações úteis apenas da expectativa. UmBC1/(52)=1/10ABC(1/2)(1/2)=1/4.
whuber

Respostas:

6

Na excelente resposta de Glen_b , ele mostra que você pode calcular o valor esperado analiticamente usando um sistema simples de equações lineares. Seguindo esse método analítico, você pode determinar que o número esperado de movimentos para a maçã é seis. Outra excelente resposta do whuber mostra como derivar a função de massa de probabilidade para o processo após um determinado número de movimentos, e esse método também pode ser usado para obter uma solução analítica para o valor esperado. Se você deseja obter mais informações sobre esse problema, leia alguns artigos sobre passeios circulares aleatórios (ver, por exemplo, Stephens 1963 )

Para dar uma visão alternativa do problema, mostrarei como você pode obter o mesmo resultado usando o método da força bruta de apenas calcular a cadeia de Markov usando computação estatística. Esse método é inferior ao exame analítico em muitos aspectos, mas tem a vantagem de permitir que você lide com o problema sem exigir nenhuma percepção matemática importante.


Método computacional de força bruta: Tomando os estados na ordem , sua cadeia de Markov transita de acordo com a seguinte matriz de transição:A,B,C,D,E

P=[100001201200012012000120121200120]

O primeiro estado é o estado de absorção onde o verme está na maçã. Vamos ser o número de movimentos até que o worm chega à maçã do estado . Então, para todos os a probabilidade de o worm estar na maçã após esse número de movimentos é e, portanto, o número esperado de movimentos para chegar à maçã a partir desse estado é:T C C N N P ( T Cn ) = { P n } C , AATCCnNP(TCn)={Pn}C,A

E(TC)=n=0P(TC>n)=n=0(1{Pn}C,A).

Os termos na soma diminuem exponencialmente para grande, para que possamos calcular o valor esperado para qualquer nível de precisão desejado, truncando a soma em um número finito de termos. (A deterioração exponencial dos termos garante que podemos limitar o tamanho dos termos removidos para ficar abaixo do nível desejado.) Na prática, é fácil aceitar um grande número de termos até que o tamanho dos termos restantes seja extremamente pequeno.n


Programando isso em R: Você pode programar isso como uma função ao Rusar o código abaixo. Este código foi vetorizado para gerar uma matriz de potências da matriz de transição para uma sequência finita de movimentos. Também geramos um gráfico da probabilidade de que a maçã não seja alcançada, mostrando que isso diminui exponencialmente.

#Create function to give n-step transition matrix for n = 1,...,N
#N is the last value of n
PROB <- function(N) { P <- matrix(c(1, 0, 0, 0, 0, 
                                    1/2, 0, 1/2, 0, 0, 
                                    0, 1/2, 0, 1/2, 0,
                                    0, 0, 1/2, 0, 1/2,
                                    1/2, 0, 0, 1/2, 0),
                                  nrow = 5, ncol = 5, 
                                  byrow = TRUE);
                      PPP <- array(0, dim = c(5,5,N));
                      PPP[,,1] <- P;
                      for (n in 2:N) { PPP[,,n] <- PPP[,,n-1] %*% P; } 
                      PPP }

#Calculate probabilities of reaching apple for n = 1,...,100
N  <- 100;
DF <- data.frame(Probability = PROB(N)[3,1,], Moves = 1:N);

#Plot probability of not having reached apple
library(ggplot2);
FIGURE <- ggplot(DF, aes(x = Moves, y = 1-Probability)) +
          geom_point() +
          scale_y_log10(breaks = scales::trans_breaks("log10", function(x) 10^x),
                        labels = scales::trans_format("log10", 
                                 scales::math_format(10^.x))) +
          ggtitle('Probability that worm has not reached apple') +
          xlab('Number of Moves') + ylab('Probability');
FIGURE;

#Calculate expected number of moves to get to apple
#Calculation truncates the infinite sum at N = 100
#We add one to represent the term for n = 0
EXP <- 1 + sum(1-DF$Probability);
EXP;

[1] 6

Como você pode ver neste cálculo, o número esperado de movimentos para chegar à maçã é seis. Este cálculo foi extremamente rápido usando o código vetorizado acima para a cadeia de Markov.

insira a descrição da imagem aqui

Ben - Restabelecer Monica
fonte
5

Só quero ilustrar uma maneira simples de ver a parte (a) sem passar por toda a rotina da cadeia de Markov. Existem duas classes de estados com as quais se preocupar: estar a um passo de distância e a dois passos de distância (C e D são idênticos em termos de etapas esperadas até atingir A e B e E são idênticos). Deixe " " representar o número de etapas necessárias no vértice e assim por diante. BSBB

E(SC)=1+12[E(SB)+E(SD)]=1+12[E(SB)+E(SC)]

Da mesma forma, escreva uma equação para a expectativa de .E(SB)

Substitua o segundo pelo primeiro (e, por conveniência, escreva para ) e você obterá uma solução para em algumas linhas.E ( S C ) ccE(SC)c

Glen_b -Reinstate Monica
fonte
3
+1. Também gosto que, ao substituir as expectativas pelas funções geradoras de probabilidade, você obtém uma equação semelhante, facilmente resolvida, mostrando que o pgf para o estado inicial é igual a e isso leva para uma fórmula simples para qualquer uma das probabilidades. Melhor: seja o número de etapas que começam emDefina eAs relações são eSubstituir o último pelo anterior gera para Assim, é ot2/(42tt2),Xyy{A,B}.fn=2nPr(XA=n)gn=2nPr(XB=n).fn=fn1+gn1gn1=fn2.fn=fn1+fn2n3.fnn2ndNúmero de Fibonacci.
whuber
@ whuber: Você deve transformar seu comentário em uma resposta completa - é realmente bom.
Ben - Restabelece Monica
11
Concordo, vale a pena postar como resposta, mesmo neste breve formulário.
Glen_b -Replica Monica
3

O problema

Essa cadeia de Markov possui três estados, distintos se o worm está com ou espaços de distância de Seja a variável aleatória, dando quantos passos o worm precisará para atingir do estado Suas funções geradoras de probabilidade são uma maneira algébrica conveniente de codificar as probabilidades dessas variáveis. Não é necessário se preocupar com questões analíticas como a convergência: basta vê-las como séries formais de poder em um símbolo dado por0, 1,2C.XiCi{0,1,2}.t

fi(t)=Pr(Xi=0)+Pr(Xi=1)t1+Pr(Xi=2)t2++Pr(Xi=n)tn+

Como é trivial que Precisamos encontrarPr(X0=0)=1,f0(t)=1.f2.

Análise e solução

Do estado o worm tem chances iguais de de se mover de volta ao estado ou chegar . A contabilidade para dar esse passo adiciona a todos os poderes de , o equivalente a multiplicar o pgf por , dando1,1/22C1tt

f1=12t(f2+f0).

Da mesma forma, no estado o worm tem chances iguais de permanecer no estado ou atingir o estado onde221,

f2=12t(f2+f1).

A aparência de sugere que nosso trabalho será facilitado pela introdução da variável fornecendot/2x=t/2,

f1(x)=x(f2(x)+f0(x));f2(x)=x(f2(x)+f1(x)).

Substituir o primeiro pelo segundo e recuperar dáf0=1

(*)f2(x)=x(f2(x)+x(f2(x)+1))

cuja solução única é

(**)f2(x)=x21xx2.

Eu destaquei a equação para enfatizar sua simplicidade básica e sua similaridade formal com a equação que analisando apenas os valores esperados com efeito, pela mesma quantidade de trabalho necessária para encontrar esse número, nós obtemos toda a distribuição.()E[Xi]:

Implicações e simplificação

Da mesma forma, quando é redigido termo a termo e os poderes de são correspondentes, ele afirma que para()tn4,

2nPr(X2=n)=2n1Pr(X2=n1)+2n2Pr(X2=n2).

Esta é a recorrência da famosa sequência de números de Fibonacci

(Fn)=(1,1,2,3,5,8,13,21,34,55,89,144,)

(indexado de ). A solução correspondente é essa sequência deslocada em dois lugares (porque não há probabilidade de ou e é fácil verificar se ).n=0()X2=0X2=122Pr(X2=2)=1=23Pr(X2=3)

Consequentemente

Pr(X2=n)=2n2Fn2.

Mais especificamente,

f2(t)=22F0t2+23F1t3+24F2t4+=14t2+18t3+216t4+332t5+564t6+8128t7+13256t8+.

A expectativa de é facilmente encontrada avaliando a derivada e substituindo porque (diferenciando os poderes de termo por termo) isso fornece a fórmulaX2ft=1,t

f(1)=Pr(X2=0)(0)+Pr(X2=1)(1)10++Pr(X2=n)(n)1n1+

que, como a soma das probabilidades pelos valores de é precisamente a definição de Tomar a derivada usando produz uma fórmula simples para a expectativa.X2,E[X2].()


Alguns breves comentários

Expandindo como frações parciais, pode ser escrito como a soma de duas séries geométricas. Isso mostra imediatamente que as probabilidades diminuirão exponencialmente. Também produz um formulário fechado para as probabilidades de cauda Usando isso, podemos calcular rapidamente que é um pouco menor que()f2Pr(X2=n)Pr(X2>n).Pr(X2100)109.

Finalmente, essas fórmulas envolvem a Proporção áurea Esse número é o comprimento de um acorde de um pentágono regular (do lado da unidade), produzindo uma conexão impressionante entre uma cadeia de Markov puramente combinatória no pentágono (que "nada sabe" sobre a geometria euclidiana) e a geometria de um pentágono regular no Plano euclidiano.ϕ=(1+5)/2.

whuber
fonte
1

Para o número médio de dias até o jantar, condicione o passo dado no primeiro dia. Seja o número de dias até o verme pegar a maçã. Seja o primeiro passo.XF

Então nós temos

E[X]=E[X|F=B] [P(F=B)]+E[X|F=D] P[F=D]

Se o primeiro passo for o worm pega a maçã no dia 2 com probabilidade pela metade ou volta ao vértice com probabilidade pela metade e recomeça. Podemos escrever isso comoB,C

E[X|F=B]=2(12)+(2+E[X])(12)=2+E[X]2

Se o primeiro passo é então por simetria, é o mesmo que estar no vértice exceto que o worm deu um único passo,CD,C

E[X|F=D]=1+E[X]

Juntando tudo, temos

E[X]=(2+E[X]2)(12)+(1+E[X])(12)

Resolução para rendimentos deE[X]

E[X]=6
Soakley
fonte
11
Isso parece recapitular a resposta de @ Glen_b.
whuber