Análise de bolas e caixas no regime m >> n.

17

É sabido que, se você jogar n bolas em n compartimentos, é altamente provável que a bandeja mais carregada tenha . Em geral, pode-se perguntar sobre bolas em caixas. Um artigo da RANDOM 1998 de Raab e Steger explora isso com alguns detalhes, mostrando que à medida que aumenta, a probabilidade de ir um pouco acima do valor esperado de diminui rapidamente. Aproximadamente, definindo , eles mostram que a probabilidade de ver mais de é .O(logn)m>nm m / n r = m / n r + nmm/nr=m/nr+rlogno(1)

Este artigo foi publicado em 1998 e não encontrei nada mais recente. Existem resultados novos e ainda mais concentrados nesse sentido, ou existem razões heurísticas / formais para suspeitar que esse é o melhor possível? Devo acrescentar que um artigo relacionado sobre a variante de múltipla escolha, em co-autoria de Angelika Steger em 2006, também não cita nenhum trabalho mais recente.

Atualização : em resposta ao comentário de Peter, deixe-me esclarecer as coisas que gostaria de saber. Eu tenho dois objetivos aqui.

  1. Primeiro, preciso saber qual referência citar, e parece que esse é o trabalho mais recente sobre isso.
  2. Em segundo lugar, é verdade que o resultado é bastante apertado na faixa r = 1. Estou interessado no intervalo m >> n e, especificamente, no domínio em que r pode ser poly log n, ou até n ^ c. Estou tentando inserir esse resultado em um lema que estou provando, e o limite específico em r controla outras partes do algoritmo geral. Eu acho (mas não tenho certeza) que o intervalo em r fornecido por este artigo pode ser suficiente, mas eu só queria ter certeza de que não havia um limite mais restrito (que produziria um resultado melhor).
Suresh Venkat
fonte
3
Aprendi o nome “problema de ocupação” com a tag, então obrigado por postar uma pergunta educacional. :)
Tsuyoshi Ito
7
Olhando para o artigo de Raab e Steger, é difícil para mim descobrir quais resultados adicionais você deseja nesse sentido. Existe uma pergunta específica para a qual você precise saber a resposta? Nesse caso, você deve perguntar, aqui ou no MathOverflow. Em particular, se r=m/n , Raab e Steger fornecem um limite estreito de que2é a constante correta. r+2rlogn2
Peter Shor
@ Peter Vou editar a pergunta: é um ponto válido.
Suresh Venkat

Respostas:

8

Não é realmente uma resposta completa (nem uma referência útil), mas apenas um comentário bastante extenso. Para qualquer posição, a probabilidade de ter exatamente bolas na posição será dada por . Podemos usar uma desigualdade devido a Sondow, , para produzir , em que . Observe que esse limite é bastante restrito, pois a .B((b+1)apB=(mB)(1 1n)B(n-1 1n)m-BpB<((r+1)r+1((b+1 1)umauma)<((b+1 1)b+1 1bb)umar=mpB<((r+1 1)r+1 1rr)B(1 1n)B(n-1 1n)m-B ( (b+1)ar=mB-1 1((b+1 1)umauma)>1 14umab((b+1 1)b+1 1bb)uma

Portanto, temos . Agora, como você está interessado na probabilidade de encontrar ou mais bolas em uma lixeira, podemos considerar . Reorganizando os termos, obtemos B p B = m b = B p b < Σ m b = b e b ( r + 1pB<eB(r+1 1)em(r+1 1)-Bremr-memn+(m-B)em(n-1 1)B p B < e - m ln npB=b=Bmpb<b=Bmeb(r+1 1)em(r+1 1)-bremr-memn+(m-b)em(n-1 1)

pB<e-memnn-1 1×eB(r+1 1)em(r+1 1)-Bremr-Bem(n-1 1)b=0 0m-Beb(r+1 1)em(r+1 1)-bremr-bem(n-1 1).

Observe que o somatório acima é apenas uma série geométrica; portanto, podemos simplificá-lo para fornecerSe reescrevermos termos usando exponenciais, obteremos que então se torna(r+1)r+1

pB<e-memnn-1 1×eB(r+1 1)em(r+1 1)-Bremr-Bem(n-1 1)×1 1-((r+1 1)r+1 1rr(n-1 1))m-B+1 11 1-((r+1 1)r+1 1rr(n-1 1)).
pB<e-mlnn(r+1 1)r+1 1rr(n-1 1)
pB<e-memnn-1 1×eB(r+1 1)em(r+1 1)-Bremr-Bem(n-1 1)×1 1-(e(r+1 1)em(r+1 1)-remr-em(n-1 1))m-B+1 11 1-e(r+1 1)em(r+1 1)-remr-em(n-1 1),
pB<e-memnn-1 1×(eB((r+1 1)em(r+1 1)-remr-em(n-1 1))-e(m+1 1)((r+1 1)em(r+1 1)-remr-em(n-1 1)))1 1-e(r+1 1)em(r+1 1)-remr-em(n-1 1).

Agora, suponho que você se preocupe em encontrar alguns tais que para algum constante , pois isso fornece a probabilidade total de qualquer caixa com ou mais bolas limitadas por acima por . Este critério é atendido considerando que pode ser reescrito comoBpB<CnCBC

e-memnn-1 1×(eB((r+1 1)em(r+1 1)-remr-em(n-1 1))-e(m+1 1)((r+1 1)em(r+1 1)-remr-em(n-1 1)))1 1-e(r+1 1)em(r+1 1)-remr-em(n-1 1)=Cn,
B=em(Cnememnn-1 1(1 1-e(r+1 1)em(r+1 1)-remr-em(n-1 1))+e(m+1 1)((r+1 1)em(r+1 1)-remr-em(n-1 1)))(r+1 1)em(r+1 1)-remr-em(n-1 1).

Não tenho certeza de quão útil esse comentário será útil para você (é perfeitamente possível que cometi um erro em algum lugar), mas espero que possa ser útil.

Joe Fitzsimons
fonte
11
isso é incrível. obrigado pelo esboço.
Suresh Venkat
@ Suresh: Ainda bem que é útil.
Joe Fitzsimons