Como o número de conexões pode ser gaussiano se não puder ser negativo?

14

Estou analisando redes sociais (não virtuais) e observando as conexões entre as pessoas. Se uma pessoa escolher outra pessoa para se conectar aleatoriamente, o número de conexões dentro de um grupo de pessoas será distribuído normalmente - pelo menos de acordo com o livro que estou lendo atualmente.

Como podemos saber se a distribuição é gaussiana (normal)? Existem outras distribuições como Poisson, Rice, Rayliegh, etc. O problema com a distribuição gaussiana em teoria é que os valores vão de a + (embora as probabilidades vão para zero) e o número de conexões não pode ser negativo.-+

Alguém sabe com qual distribuição se pode esperar, caso cada pessoa atinja de forma independente (aleatória) outra pessoa para se conectar?

niko
fonte
1
Esclarecimento: A pergunta é sobre o "número total de conexões para todo o grupo" ou "o número total de conexões para uma pessoa"? Minha resposta assume implicitamente a última.
1
Distribuição Riley ? Isso é novo para mim. Você tem uma referência ou link?
onestop
3
"Rayleigh" talvez?
whuber

Respostas:

6

Quando há pessoas e o número de conexões feitas pela pessoa i , 1 i n , é X i , o número total de conexões é S n = n i = 1 X i / 2 . Agora, se tomarmos a XnEu,1Eun,XEuSn=Eu=1nXEu/2 para ser variáveis aleatórias, assumir que eles são independentes e as suas variações não são "muito desigual", como mais e mais pessoas são adicionados à mistura, então aLindeberg-Levy Teorema do Limite Centralse aplica. Ele afirma que afunção de distribuição cumulativaXEuda soma padronizada converge para o cdf da distribuição normal. Isso significa mais ou menos que um histograma da soma parecerá cada vez mais um gaussiano (uma "curva de sino") à medida que cresce.n

Vamos revisar o que isso não diz:

  • Não afirma que a distribuição de seja sempre exatamente normal. Não pode ser, pelas razões que você aponta.Sn

  • Isso não implica que o número esperado de conexões converja. De fato, ele deve divergir (ir para o infinito). A padronização é uma atualização e redimensionamento da distribuição; a quantidade de redimensionamento está crescendo sem limite.

  • Não diz nada quando o não são independentes ou quando suas variâncias mudar muito como n cresce. (No entanto, existem generalizações do CLT para séries de variáveis ​​"ligeiramente" dependentes).XEun

whuber
fonte
Note que eu não interpreto a pergunta para afirmar que todo mundo escolhe exatamente uma outra pessoa para se conectar - o que levaria a uma teoria estéril porque o número de conexões seria determinado, não aleatório. Em vez disso, interpretei que todas as pessoas que entram na rede escolhem conexões aleatoriamente entre as outras, terminando com um total de 0 a n conexões. A suposição sobre as variações é garantida quando há um limite no número de conexões que qualquer iniciante fará e esse número tem alguma aleatoriedade "mínima".
whuber
XEu
1
@ Andy Não pessoas: o número de conexões feitas. O importante é que haja uma boa chance de que o número de conexões feitas por indivíduos realmente varie e não se estabilize em uma constante. Quando isso acontece, a distribuição limitadora (do número de conexões) é determinada pelo número finito de conexões iniciais que variam, portanto, não é possível abordar uma distribuição Normal assintoticamente.
whuber
1

A resposta depende das suposições que você está disposto a fazer. Uma rede social evolui constantemente ao longo do tempo e, portanto, não é uma entidade estática. Portanto, você precisa fazer algumas suposições sobre como a rede evolui ao longo do tempo.

n

Prob(Nº de conexões para qualquer indivíduo=n-1)=1 .

Se uma pessoa seleciona outra pessoa aleatoriamente para se conectar, eventualmente todos estarão conectados.

No entanto, as redes da vida real não se comportam dessa maneira. As pessoas diferem em vários aspectos.

  1. A qualquer momento, uma pessoa tem um tamanho de rede fixo e a probabilidade de outra conexão ser estabelecida depende do tamanho da sua rede (à medida que as pessoas apresentam outras pessoas, etc.).

  2. Uma pessoa tem sua própria tendência intrínseca de formar uma conexão (como algumas são introvertidas / exterovertadas etc.).

Essas probabilidades mudam com o tempo, o contexto etc. Não tenho certeza de que haja uma resposta direta, a menos que façamos algumas suposições sobre a estrutura da rede (por exemplo, densidade da rede, como as pessoas se comportam etc.).


fonte
@Srikant Você poderia explicar como obtém a "resposta trivial"? (Deve haver algumas suposições não declaradas por trás disso.) E a que teorema você se refere quando conclui que "eventualmente todos estarão conectados"? Isso não é de todo óbvio!
whuber
@whuber Estou assumindo que o tamanho da rede é fixo. A pergunta diz: Uma pessoa escolhe outra pessoa aleatoriamente para fazer uma conexão e, presumivelmente, esse é um processo contínuo. Assim, à medida que o tempo chega ao infinito, todos devem estar conectados. Sem teorema, apenas intuição. Talvez eu esteja usando linguagem imprecisa.
@ Krikant ainda estou confuso, porque depois de um longo tempo, "Prob (número de conexões = n)" é igual a 1 quando n = 3 e, caso contrário, é sempre zero. Afinal, quando "todos devem estar conectados", o número de conexões é igual a n (n-1) / 2. Eu suspeito que você possa ter vários processos aleatórios diferentes em mente ao mesmo tempo. Pode ajudar a divulgar as suposições que você está fazendo e ser um pouco mais preciso.
whuber