Considere o problema de interseção de conjuntos: Alice e Bob recebem um subconjunto de e gostariam de saber se seus conjuntos se cruzam. Esse é um problema canônico de complexidade da comunicação, e é sabido que protocolos aleatórios para esse problema requerem bits de comunicação ( consulte a pesquisa aqui ). No caso em que os conjuntos são do tamanho para , é sabido que protocolos aleatórios requerem bits ( veja aqui ).k k ≪ n Θ ( k )
Considere agora a variante em que Alice e Bob querem saber o tamanho da interseção de seus conjuntos. Claramente, computar o tamanho exato reduz-se ao problema padrão de interseção de conjuntos, e isso vale mesmo se eles quiserem apenas calcular uma aproximação multiplicativa do tamanho. No entanto, o que acontece se eles querem calcular uma aproximação aditiva do tamanho da interseção? Existe algum limite inferior ou superior conhecido sobre esse problema?
Estou particularmente interessado nesta questão na configuração de pequenos conjuntos, ou seja, no caso em que os conjuntos são do tamanho .
Respostas:
Vou dar dois limites superiores. Seja e os conjuntos dados a Alice e Bob, respectivamente, e coloque,,.B a = | Um | b = | B | c = | A ∩ B |A B a=|A| b=|B| c=|A∩B|
Primeiro, existe um protocolo aleatório que, dado e , calcula com probabilidade uma aproximação de até o erro aditivo , usando bits de comunicação e bits de aleatoriedade.d>0 ϵ>0 ≥1−ϵ c d O((min{a,b}d)2lognlogϵ−1) O((min{a,b}d)2logmin{a,b}logϵ−1)
O protocolo é o seguinte:
Se , a parte que o vê encerra o protocolo e gera como a estimativa. Caso contrário, Alice e Bob comunicar e para o outro, e determinar qual é menor. Assumirei abaixo do wlog que .d≥min{a,b} 0 a b a≤b
Alice desenha amostras aleatórias uniformemente independentes , , e as envia para Bob.t=log(2ϵ−1)a2/(2d2) ai∈A i<t
Bob estima como.c at|{i<t:ai∈B}|
O protocolo está correto pelos limites de Chernoff-Hoeffding: se denota a variável aleatória indicadora do evento , então , , são variáveis iid com média . Assim, e da mesma forma para .Xi ai∈B Xi i<t p=c/a
Agora, esses limites são um pouco inúteis se: : também existem limites de Chernoff que indicam que nos permitiria conviver com o número de amostras menores por um fator de aproximadamente . O problema é que é a mesma quantidade que queremos aproximar, portanto, não a conhecemos adiante. Isso pode ser remediado fazendo-se primeiro uma estimativa do de .c≪a
Portanto, o protocolo aprimorado calcula com probabilidade uma aproximação aditiva de usando bits de comunicação e bits de aleatoriedade e é o seguinte (as constantes não são otimizadas):≥1−ϵ d c O(min{a,b}d(1+cd)lognlogϵ−1) O(min{a,b}d(1+cd)logmin{a,b}logϵ−1)
O mesmo que acima.
Alice desenha amostras aleatórias de e as envia para Bob.r=10(logϵ−1)a/d A
Bob conta quantas dessas amostras pertencem a e envia esse número, , para Alice.B s
Se , o protocolo termina com a saída .as/r≤d/2 0
Alice desenha amostras aleatórias , envia para Bob.t=10sa/d ai∈A i<t
Bob estima como.c at|{i<t:ai∈B}|
Sem entrar em detalhes, os limites de Chernoff citados acima implicam que, com alta probabilidade, o valor de é , caso em que o protocolo não excede o custo declarado e calcula com alta probabilidade uma boa estimativa de por outra aplicação dos limites de Chernoff.s/r Θ(c/a) c
fonte
[A resposta de Emil é claramente melhor e mais simples se você estiver interessado nesse tipo de erro, a menos que, por algum motivo, você precise que seu protocolo seja determinístico. Opa.]
Existem protocolos não triviais se você estiver interessado em aproximações aditivas do tipo para pequenas constantes .±δn δ>0
Por exemplo, aqui está um:
Se esse tipo de aproximação lhe interessar, você poderá obter mais milhas de outros lemas de regularidade de gráfico, especialmente Frieze-Kannan. Aqui está uma pesquisa.
fonte