Qual a probabilidade de descender de uma pessoa em particular nascida no ano de 1300?

26

Em outras palavras, com base no seguinte, o que é p?

Para tornar isso um problema de matemática em vez de antropologia ou ciências sociais, e para simplificar o problema, suponha que os parceiros sejam selecionados com igual probabilidade em toda a população, exceto que irmãos e primos em primeiro grau nunca acasalam e que parceiros sempre são selecionados do mesmo geração.

  • n1 - população inicial
  • g - o número de gerações.
  • c - o número médio de filhos por casal. (Se necessário, responda que todo casal tem exatamente o mesmo número de filhos.)
  • z - a porcentagem de pessoas que não têm filhos e que não são consideradas parte de um casal.
  • n 2 zn2 - população na geração final. ( ou devem ser dados e (acho) o outro pode ser calculado.)n2z
  • p - probabilidade de alguém da geração final ser descendente de uma pessoa em particular na geração inicial.

Essas variáveis ​​podem ser alteradas, omitidas ou adicionadas, é claro. Estou assumindo por simplicidade que e não mudam com o tempo. Sei que isso vai ter uma estimativa muito grosseira, mas é um ponto de partida.cz

Parte 2 (sugestão para futuras pesquisas):

Como você pode considerar que os parceiros não são selecionados com probabilidade globalmente uniforme? Na realidade, é mais provável que os parceiros tenham a mesma área geográfica, formação socioeconômica, raça e formação religiosa. Sem pesquisar as probabilidades reais disso, como as variáveis ​​desses fatores entrariam em jogo? Quão importante isso seria?

xpda
fonte
2
isso é uma pergunta de lição de casa? Caso contrário, qual é o contexto?
David LeBauer 22/10/11
11
@ John: Obrigado pela sua edição. Acredito que o consenso predominante (neste site e em outros) é que não editamos perguntas simplesmente para adicionar a homeworktag. É melhor para todos os envolvidos deixar o OP fazer isso. Você pode estar interessado neste meta thread, se ainda não o viu.
cardinal
Eu só estou curioso. Eu não sou um estudante e este não é o dever de casa de ninguém. Eu estava apenas brincando sobre o crédito extra, embora eu possa ver como isso implicaria lição de casa.
Xpda # 22/11
3
Para obter uma noção inicial das respostas, considere a fração da população que não está relacionada a um determinado ancestral por descendência. Inicialmente para uma população de . Com a mistura aleatória, é elevado ao quadrado após cada geração. Em uma população inicial de , digamos, isso implica que é quase certamente após gerações (cerca de - anos). f = ( n - 1 ) / n n f n = 10 8 f 0 32 600ff=(n1)/nnfn=108f032600800
whuber
11
Acredito que exista alguma pesquisa acadêmica sobre a probabilidade de um sobrenome único ser extinto. Embora não seja idêntico ao problema apresentado, isso pode fornecer algumas informações interessantes (mas infelizmente não me lembro de onde é). Estranhamente, creio que esses estudos levaram a alguma introspecção na matemática por trás da propagação de doenças infecciosas ...
Michael McGowan

Respostas:

13

Como esta pergunta está recebendo respostas que variam de astronomicamente pequenas a quase 100%, eu gostaria de oferecer uma simulação para servir como referência e inspiração para soluções aprimoradas.

Eu chamo esses "planos de chamas". Cada um documenta a dispersão do material genético dentro de uma população, que se reproduz em gerações distintas. As plotagens são matrizes de finos segmentos verticais que representam pessoas. Cada linha representa uma geração, com a inicial no topo. Os descendentes de cada geração estão na fila imediatamente abaixo dela.

No início, apenas uma pessoa em uma população de tamanho é marcada e plotada em vermelho. (É difícil ver, mas eles estão sempre plotados à direita da linha superior.) Seus descendentes diretos também são desenhados em vermelho; eles aparecerão em posições completamente aleatórias. Outros descendentes são plotados em branco. Como os tamanhos da população podem variar de uma geração para a próxima, uma borda cinza à direita é usada para preencher o espaço vazio.n

Aqui está uma matriz de 20 resultados de simulação independentes.

Gráficos de chama

O material genético vermelho acabou por desaparecer em nove dessas simulações, deixando sobreviventes nos 11 restantes (55%). (Em um cenário, no canto inferior esquerdo, parece que toda a população acabou morrendo.) Onde quer que houvesse sobreviventes, quase toda a população continha material genético vermelho. Isso fornece evidências de que a chance de um indivíduo selecionado aleatoriamente da última geração que contém o gene vermelho é de cerca de 50%.

A simulação funciona determinando aleatoriamente uma sobrevivência e uma taxa média de nascimentos no início de cada geração. A sobrevivência é extraída de uma distribuição Beta (6,2): em média 75%. Esse número reflete a mortalidade antes da idade adulta e as pessoas que não têm filhos. A taxa de natalidade é calculada a partir de uma distribuição Gamma (2,8, 1), com uma média de 2,8. O resultado é uma história brutal de capacidade reprodutiva insuficiente para compensar a mortalidade geralmente alta. Representa um modelo extremamente pessimista, no pior dos casos - mas (como sugeri nos comentários) a capacidade da população de crescer não é essencial. Tudo o que importa em cada geração é a proporção de vermelho na população.

Para modelar a reprodução, a população atual é reduzida aos sobreviventes, coletando uma amostra aleatória simples do tamanho desejado. Esses sobreviventes são emparelhados aleatoriamente (qualquer sobrevivente estranho que sobrar após o pareamento não consegue se reproduzir). Cada par produz um número de filhos extraídos de uma distribuição de Poisson cuja média é a taxa de natalidade da geração. Se um dos pais contiver o marcador vermelho, todos os filhos o herdarão: isso modela a idéia de descida direta por qualquer um dos pais.

Este exemplo começa com uma população de 512 e executa a simulação por 11 gerações (12 linhas, incluindo o início). Variações dessa simulação começando com apenas e até pessoas, usando diferentes quantidades de taxas de sobrevivência e nascimento, todas exibem características semelhantes: no final de gerações ( nove neste caso), há uma chance de 1/3 de que todo o vermelho tenha desaparecido, mas se não tiver, a maioria da população é vermelha. Dentro de mais duas ou três gerações, quase toda a população é vermelha e permanecerá vermelha (ou então a população desaparecerá completamente).2 14 = 16 , 384 log 2 ( n )n=8214=16,384log2(n)

Uma sobrevivência de 75% ou menos em uma geração não é fantasiosa, a propósito. No final de 1347, os ratos infestados de peste bubônica fizeram o seu caminho da Ásia para a Europa; durante os próximos três anos, entre 10% e 50% da população europeia morreu como resultado. A praga se repetiu quase uma vez por geração durante centenas de anos depois (mas geralmente não com a mesma mortalidade extrema).


Código

A simulação foi criada com o Mathematica 8:

randomPairs[s_List] := Partition[s[[Ordering[RandomReal[{0, 1}, Length[s]]]]], 2];

next[s_List, survive_, nKids_] := Flatten[ConstantArray[Max[#], 
   RandomVariate[PoissonDistribution[nKids]]] & /@ 
   randomPairs[RandomSample[s, Ceiling[survive Length[s]]]]] 

Partition[Table[
   With[{n = 6}, ArrayPlot[NestList[next[#, RandomVariate[BetaDistribution[6, 2]], 
        RandomVariate[GammaDistribution[3.2, 1]]] &, 
        Join[ConstantArray[0, 2^n - 1], ConstantArray[1, 1]], n + 2], 
     AspectRatio -> 2^(n/3)/(2 n), 
     ColorRules -> {1 -> RGBColor[.6, .1, .1]},  
     Background -> RGBColor[.9, .9, .9]]
    ], {i, 1, 20}
   ], 4] // TableForm
whuber
fonte
11
Eu acho que modelagem como essa pode ser a melhor abordagem. É muito mais simples e divertido (para mim) do que a matemática, e deve facilitar a introdução de fatores que restringem a seleção de parceiros. Você tem alguma recomendação, advertência ou outro conselho antes de me aprofundar nisso?
Xpda 26/10/11
3
As soluções matemáticas do @xpda fornecerão informações sobre o que importa e o que não importa. Por exemplo, eles mostrarão que você não precisa necessariamente modelar grandes populações. Eles também indicarão o papel desempenhado pela variabilidade, que é mais difícil de lidar analiticamente e vem à tona em uma simulação.
whuber
11
@whuber Você executou a simulação no Mathematica? Você se importaria de publicar código?
assumednormal
11
@ Max O código já está ativo. Peço desculpas pela falta de comentários. Se você executar cada um randomPairse nextnos dados de teste, suas funções deverão se tornar aparentes. Observe o uso de NestListiterar nextpara produzir várias gerações.
whuber
3

O que acontece quando você tenta contar ancestrais?

Você tem 2 pais, 4 avós, 8 bisavós, ... Então, se você voltar gerações, terá antepassados. Vamos assumir uma duração média de geração de anos. Então existem cerca de gerações desde 1300, o que nos dá cerca de 268 milhões de ancestrais na época.2 n 25 28n2n2528

Este é o estádio certo, mas há algo errado com esse cálculo, porque a população da Terra em 1300 não se misturou uniformemente, e estamos ignorando o casamento entre a sua "árvore" ancestral, ou seja, estamos contando duas vezes alguns ancestrais.

Ainda assim, acho que isso pode levar a um limite superior correto da probabilidade de que a pessoa escolhida aleatoriamente em 1300 seja seu ancestral, levando a proporção para a população em 1300228

vqv
fonte
2
Muito significativo, considerando que grande parte da população da época estava bastante isolada uma da outra, portanto havia muito menos oportunidade de evitar casamentos.
dcl
2
Então, vamos supor que o PO seja de descendência inglesa e por volta de 1300, a população da Inglaterra era superior a um milhão. (Digamos antes da grande fome). Como isso mudaria sua análise?
dassouki
228268 milhões , não bilhões. É o estádio certo.
whuber
D'oh! Editou a resposta. O cálculo ainda ignora o casamento entre casais, mas isso pode dar um limite superior correto à probabilidade de uma pessoa escolhida aleatoriamente em 1300 ser seu ancestral, tomando a fração: ou cem milhões. 4228/34
vqv
2

Quanto mais longe você voltar, maior a probabilidade de ser parente de uma pessoa que transmitiu com sucesso seus genes que viveram naquele tempo. Dos 1/4 bilhões de antepassados ​​que você viveu em 1300, muitos deles apareceriam centenas (se não milhares, milhões) de vezes em sua árvore genealógica. A deriva genética e o número de vezes que estamos diretamente relacionados a alguém são provavelmente mais relevantes para as diferenças em nosso código genético do que quem eram nossos ancestrais.

Tim
fonte
0

A probabilidade é = 1-z, todo descendente nesse problema está relacionado aos ancestrais acima. Qualquer que seja a taxa inicial de reprodução (1-z), é sua probabilidade de descender de alguém na população inicial. Probabilidade apenas incerta é quais são as chances de estar vivo na população final.

Concordo com a resposta de Erad, embora agora pense que ela responde a uma pergunta que não foi feita - a saber, qual é a probabilidade de você estar vivo, devido a certas restrições reprodutivas e populacionais conhecidas de seus antepassados.

Wipa
fonte
A questão é encontrar a probabilidade de alguém na geração final ser descendente de uma pessoa em particular na geração inicial. Se = 360 milhões = .2, a probabilidade não seria de em, por exemplo, = 1. z z gn1zzg
Xpda
Além disso, para esclarecer, a questão é encontrar a probabilidade de uma pessoa em particular na geração final ser descendente de uma pessoa em particular na geração inicial.
Xpda # 25/11
11
@xpda Essa é uma interpretação estranha, porque todo mundo é, ou não é, descendente de qualquer indivíduo em particular, como pode ser estabelecido através de testes de DNA. Eu acho que o modo como muitas pessoas podem estar entendendo sua pergunta é se escolhermos uma pessoa arbitrária " " no ano de 1300 e selecionarmos uma pessoa aleatória viva hoje, qual é a chance de que descendam ? Essa pergunta é respondida por estimar a proporção da população de hoje, que é descendente de . Também poderíamos usar para ser selecionado aleatoriamente. A A AAAAA
whuber
O cogito de Wipa Descartes , ergo sum , sugere fortemente que a probabilidade de que eu esteja vivo, desde que haja alguma restrição nos meus antepassados, seja 100% :-)
whuber
@ Whuber, você está correto. Acredito que estamos falando do mesmo problema. O que eu queria esclarecer é que não estou procurando a probabilidade de alguém da primeira geração ter um descendente vivo na última geração. Eu estava com medo de que Wipa tenha apresentado (1-z) a resposta.
Xpda 26/10/11
0

Minha resposta curta e atualizada é:

p>(1z)×1n1(1z)2=2n1

Resposta explicada:
Dada uma pessoa em particular hoje, é certo que ela é descendente de pelo menos 2 pessoas em 1300.

Ao escolher uma pessoa em particular em 1300, há (1-z) chance de a pessoa nunca se reproduzir, e o outro termo é para o número de 'casais de pais' e a probabilidade de a pessoa estar relacionada a esse casal (1 / número de casais).

O (1-z) acaba sendo cancelado, deixando-nos com

p>2n1

Agora, apenas por diversão, mas não necessário para resolver a questão da probabilidade.
Aqui está a população de qualquer geração k na cadeia entre então e hoje.

nk+1=nk(1z)×c2=n1(1z)kck2k

Vamos conectar alguns números como exemplo. Para suposições, eu uso:
g = 28 (gerações de 25 anos entre 1300 e 2011)
n = 360M (estimativa da população mundial em 1300 da wikipedia)
z = 0,2, c = 2,77 = 8 (não dados reais, mas termina com cerca de 7 bilhões de pessoas em 2011)

resultando em: ou mais de uma em 180 milhões.

p>2/360,000,000=5.56×109

Obrigado pela leitura, Erad

Erad
fonte
O que é ? E o que é ? cz
Mvctas # 25/11
Com base na pergunta original acima: c = número médio de filhos por casal, e z = a percentagem de pessoas que não têm filhos
Erad
2
Hum, por que sua probabilidade é menor que = ? 1/n1/360M109
mpiktas 25/10/11
3
A resposta dada aqui vale para cada membro da população original, não importa quem eles sejam. A soma de todos os membros dá um limite superior à probabilidade de que descendamos hoje de alguma pessoa no ano 1300 de , o que é obviamente muito errado (a menos que clones alienígenas fossem introduzido ao longo do caminho ...). 360,000,000/(2.66×10249)1
whuber
11
@Erad No seu comentário, você parece assumir que toda a população de hoje é descendente de uma pequena fração do mundo em 1300. Isso não é plausível. No entanto, suponha, por uma questão de argumento - e para examinar um caso extremo -, que hoje se sabe que todos hoje descendem apenas de um casal, "Adão" e "Eva", vivos em 1300. Então a chance de descida é: 100% se Adão ou Eva são a "pessoa em particular" da pergunta ou então é 0%. Essa chance, calculada sobre a população em 1300, ainda é cerca de , muito maior do que você calcula. 108
whuber
0

Essa é uma pergunta muito interessante, pois está nos pedindo para resolver matematicamente um fractal. Como o famoso jogo da vida .

A% da população com a qual cada geração relacionada crescerá a cada iteração, iniciando em e na geração limite se aproximará de .p1=2n1limkpk=(1z)

Se como a probabilidade de alguém na geração estar relacionado à população inicial. E, por simplicidade, vamos relaxar a regra dos irmãos e primos (pode ser adicionada posteriormente). Então: pkk

p1=2n1

Como cada pessoa da nova geração tem exatamente 2 ancestrais na população inicial. Nesse caso, os parentes podem ser calculados como: Ou, em outras palavras, o número de combinações de irmãos, vezes o número de famílias de irmãos, dividido pelo total de combinações de acasalamento.

p2=relatives×2n2+non.relatives×4n2
p3=immediate. relatives×4
relatives=(c2)×nc(n2)=c1n1
p3=immediate.relatives×4n3+cousins×6n3+non.relatives×8n3

Com cada geração, a probabilidade de se relacionar com alguém da população inicial aumentará, sem dúvida, mas em ritmo decrescente. Isso ocorre porque a probabilidade de atrair "parentes" provenientes da mesma árvore ou de uma árvore semelhante aumentará.

Vamos usar a etnia como exemplo. Digamos que sabemos que alguém é 100% caucasiano. Na geração 28, ele provavelmente está relacionado a uma parcela significativa da população caucasiana em 1300 (como mostrado pela simulação @whuber). Vamos dizer que ele está se casando com alguém que é 100% de uma etnia diferente. Seus filhos serão vinculados a aproximadamente o dobro do número de pessoas às quais estão vinculados a partir de 1300.

Outro pensamento interessante é que, dada a raça humana (homosapien) iniciada em ~ 600 pessoas na África, provavelmente somos uma permutação genética de todas elas que se acasalaram com sucesso.

Erad
fonte