Me deparei com uma pergunta no teste de aptidão para entrevistas de emprego para o pensamento crítico. É algo como isto:
A República Zorganiana tem alguns costumes muito estranhos. Os casais desejam apenas ter filhos do sexo feminino, pois somente as mulheres podem herdar a riqueza da família; portanto, se tiverem um filho do sexo masculino, continuarão tendo mais filhos até ter uma menina. Se eles têm uma menina, eles param de ter filhos. Qual é a proporção de meninas e meninos em Zorgania?
Não concordo com a resposta modelo dada pelo autor da pergunta, que é de cerca de 1: 1. A justificativa era que qualquer nascimento sempre terá 50% de chance de ser homem ou mulher.
Você pode me convencer com uma resposta matemática mais vigorosa de se é o número de meninas e B é o número de meninos no país?
fonte
Respostas:
Comece sem filhos
repita o passo
{
Todo casal que ainda está tendo filhos tem um filho. Metade dos casais tem homens e metade dos casais tem mulheres.
Os casais que têm mulheres deixam de ter filhos
}
Em cada etapa, você obtém um número par de homens e mulheres e o número de casais que têm filhos reduz pela metade (ou seja, aqueles que tiveram mulheres não terão filhos na próxima etapa)
Portanto, a qualquer momento, você tem um número igual de homens e mulheres e, passo a passo, o número de casais que têm filhos diminui pela metade. À medida que mais casais são criados, a mesma situação se repete e todas as outras coisas são iguais, a população conterá o mesmo número de homens e mulheres
fonte
Seja o número de meninos em uma família. Assim que eles têm uma menina, eles param, entãoX
Se é a probabilidade de uma criança ser menino e se os gêneros são independentes entre as crianças, a probabilidade de uma família ter k meninos é P ( X = k ) = p k ⋅ ( 1 - p ) , ou seja , a probabilidade de tendo k meninos e depois tendo uma garota. O número esperado de rapazes é E X = ∞ Σ k = 0 k p k ⋅ ( 1 - P ) =p k
Se , temos que E X = 0,5 / 0,5 . Ou seja, a família média tem um filho. Nós já sabemos que todas as famílias têm uma menina, então a proporção vai ao longo do tempo, mesmo por ser 1 / 1 = 1 .p=1/2 EX=0.5/0.5 1/1=1
A variável aleatória é conhecida como variável aleatória geométrica .X
fonte
p
o mesmo para todas as famílias. Se, em vez disso, assumirmos que alguns casais têm mais probabilidade de ter filhos do que outros ( ou seja , o número delesp
é maior), o resultado muda, mesmo que o valor médio dep
ainda seja 0,5. (Ainda assim, esta é uma excelente explicação das estatísticas subjacentes básicas.)Sumário
O modelo simples de que todos os nascimentos têm 50% de chance de ser meninas é irreal e, como se vê, excepcional. Assim que considerarmos as consequências da variação nos resultados entre a população, a resposta é que a proporção menina: menino pode ser qualquer valor que não exceda 1: 1. (Na realidade, provavelmente ainda seria próximo de 1: 1, mas isso é questão de análise de dados).
Como essas duas respostas conflitantes são obtidas ao assumir a independência estatística dos resultados do nascimento, um apelo à independência é uma explicação insuficiente. Assim, parece que a variação (nas chances de nascimentos femininos) é a ideia principal por trás do paradoxo.
Introdução
Um paradoxo ocorre quando pensamos que temos boas razões para acreditar em alguma coisa, mas somos confrontados com um argumento de aparência sólida ao contrário.
Uma solução satisfatória para um paradoxo nos ajuda a entender o que estava certo e o que pode estar errado sobre os dois argumentos. Como costuma ser o caso em probabilidade e estatística, ambos os argumentos podem realmente ser válidos: a resolução depende de diferenças entre suposições implicitamente feitas. Comparar essas diferentes suposições pode nos ajudar a identificar quais aspectos da situação levam a respostas diferentes. Identificar esses aspectos, sustento, é o que mais devemos valorizar.
Premissas
Como evidenciado por todas as respostas postadas até agora, é natural supor que nascimentos femininos ocorrer de forma independente e com probabilidades constantes de . É sabido que nenhuma dessas suposições é realmente verdadeira, mas parece que pequenos desvios dessas suposições não devem afetar muito a resposta. Deixe-nos ver. Para esse fim, considere o seguinte modelo mais geral e mais realista:1/2
Em cada família a probabilidade de um nascimento feminina é uma constante p i , independentemente da ordem de nascimento.i pi
Na ausência de qualquer regra de parada, o número esperado de partos femininos na população deve estar próximo ao número esperado de partos masculinos.
Todos os resultados do nascimento são (estatisticamente) independentes.
Isso ainda não é um modelo totalmente realista de nascimentos humanos, em que o podem variar com a idade dos pais (particularmente a mãe). No entanto, é suficientemente realista e flexível para fornecer uma resolução satisfatória do paradoxo que se aplicará ainda a modelos mais gerais.pi
Análise
Embora seja interessante realizar uma análise completa desse modelo, os principais pontos se tornam aparentes mesmo quando uma versão específica, simples (mas um tanto extremada) é considerada. Suponha que a população tenha famílias N. Em metade destes a chance de um nascimento feminino é de 2 / 3 e na outra metade a chance de um nascimento feminino é de 1 / 3 . Isso claramente satisfaz a condição (2): o número esperado de partos femininos e masculinos é o mesmo.2N 2/3 1/3
Considere essas primeiras famílias. Vamos raciocinar em termos de expectativas, entendendo que os resultados reais serão aleatórios e, portanto, variarão um pouco das expectativas. (A idéia por trás da análise a seguir foi transmitida de forma mais breve e simples na resposta original que aparece no final deste post.)N
com soluções
A regra de parada favorece os meninos!
Resolução
Se sua intuição é que parar com a primeira garota deve produzir mais meninos na população, então você está correto, como mostra este exemplo. Para estar correto, tudo o que você precisa é que a probabilidade de dar à luz uma menina varie (mesmo que apenas um pouco) entre as famílias.
A resposta "oficial", de que a proporção deve ser próxima de 1: 1, requer várias suposições irrealistas e é sensível a elas: supõe que não pode haver variação entre as famílias e que todos os nascimentos devem ser independentes.
Comentários
A idéia principal destacada por esta análise é que a variação dentro da população tem consequências importantes. A independência de nascimentos - embora seja uma suposição simplificadora usada para todas as análises neste tópico - não resolve o paradoxo, porque (dependendo das outras suposições) é consistente tanto com a resposta oficial quanto com o seu oposto.
Se substituirmos o gênero por alguma outra expressão genética, obteremos uma explicação estatística simples da seleção natural : uma regra que limita diferencialmente o número de filhos com base em sua composição genética pode alterar sistematicamente as proporções desses genes na próxima geração. Quando o gene não está ligado ao sexo, mesmo um pequeno efeito será propagado multiplicativamente por gerações sucessivas e pode rapidamente se tornar bastante ampliado.
Resposta original
Cada criança tem uma ordem de nascimento: primogênito, segundo e assim por diante.
Assumindo probabilidades iguais de nascimentos masculinos e femininos e sem correlações entre os sexos, a Lei Fraca dos Grandes Números afirma que haverá uma proporção próxima de 1: 1 entre mulheres primogênitas e homens. Pela mesma razão, haverá uma proporção próxima de 1: 1 de fêmeas nascidas para homens e assim por diante. Como essas proporções são constantemente de 1: 1, a proporção geral também deve ser de 1: 1, independentemente da frequência relativa das ordens de nascimento na população.
fonte
O nascimento de cada criança é um evento independente com P = 0,5 para um menino e P = 0,5 para uma menina. Os outros detalhes (como as decisões da família) apenas o distraem desse fato. A resposta, então, é que a proporção é 1: 1 .
Para explicar isso: imagine que, em vez de ter filhos, você esteja jogando uma moeda justa (P (cara) = 0,5) até obter uma "cara". Digamos que a família A vira a moeda e obtém a sequência de [caudas, caudas, cabeças]. Então a família B lança a moeda e recebe uma coroa. Agora, qual é a probabilidade de o próximo ser cara? Ainda 0,5 , porque é isso que independente significa. Se você fizesse isso com 1000 famílias (o que significa que 1000 caras apareceram), o número total esperado de caudas é 1000, porque cada flip (evento) era completamente independente.
Algumas coisas não são independentes, como a sequência dentro de uma família: a probabilidade da sequência [cabeças, cabeças] é 0, não é igual a [caudas, caudas] (0,25). Mas como a pergunta não está perguntando sobre isso, é irrelevante.
fonte
Imagine jogar uma moeda justa até observar uma cabeça. Quantas caudas você joga?
O número esperado de caudas é facilmente calculado * para 1.
O número de cabeças é sempre 1.
* se isso não estiver claro para você, consulte 'resumo da prova' aqui
fonte
Casais com exatamente uma garota e nenhum garoto são os mais comuns
A razão de tudo dar certo é que a probabilidade de um cenário em que há mais meninas é muito maior do que os cenários em que há mais meninos. E os cenários em que há muito mais meninos têm probabilidades muito baixas. A maneira específica como funciona é ilustrada abaixo
Você pode ver até onde isso está indo, neste momento, o total de meninas e meninos vai somar um.
Garotas esperadas de um casal= ∑∞n = 1( 12n) = 1
= ∑∞n = 1( n - 1n2) = 1
Soluções de limite da wolfram
Qualquer nascimento, qualquer que seja a família, tem 50:50 de chance de ser menino ou menina
Tudo isso faz sentido intrínseco, porque (por mais que tentem os casais), você não pode controlar a probabilidade de um nascimento específico ser menino ou menina. Não importa se uma criança nasce com um casal sem filhos ou uma família de cem meninos; a chance é de 50:50, portanto, se cada nascimento individual tiver uma chance de 50:50, você sempre deve ter meio menino e meia menina. E não importa como você embaralha os nascimentos entre famílias; você não vai afetar isso.
Isso funciona para qualquer 1 regra
Devido à chance de 50:50 de qualquer nascimento, a proporção terminará em 1: 1 para qualquer regra (razoável 1 ) que você possa criar. Por exemplo, a regra semelhante abaixo também funciona mesmo
Nesse caso, o total esperado de filhos é calculado com mais facilidade
Garotas esperadas de um casal= 0,5 ⋅ 1 + 0,25 ⋅ 1 = 0,75
= 0,25 ⋅ 1 + 0,25 ⋅ 2 = 0,75
1 Como eu disse, isso funciona para qualquer regra razoável que possa existir no mundo real. Uma regra irracional seria aquela em que os filhos esperados por casal fossem infinitos. Por exemplo, "Os pais só param de ter filhos quando têm o dobro de meninos do que meninas", podemos usar as mesmas técnicas acima para mostrar que esta regra gera infinitos filhos:
Podemos então encontrar o número de pais com um número finito de filhos
Número esperado de pais com filhos finitos= ∑∞m = 1( 11 / ( 3 m )2) = π254= 0,18277 … .
Soluções de limite da wolfram
Assim, podemos estabelecer que 82% dos pais teriam um número infinito de filhos; do ponto de vista do planejamento urbano, isso provavelmente causaria dificuldades e mostra que essa condição não poderia existir no mundo real.
fonte
Você também pode usar a simulação:
fonte
mean(rgeom(10000, 0.5))
Mapear isso me ajudou a ver melhor como a proporção da população de nascimentos (assumida como 1: 1) e a proporção da população de crianças seria de 1: 1. Embora algumas famílias tenham vários meninos, mas apenas uma menina, o que inicialmente me levou a pensar que haveria mais meninos do que meninas, o número dessas famílias não seria superior a 50% e diminuiria pela metade com cada criança adicional, enquanto o o número de famílias com apenas uma menina seria de 50%. O número de meninos e meninas se equilibraria. Veja o total de 175 na parte inferior.
fonte
O que você conseguiu foi a resposta mais simples e correta. Se a probabilidade de um filho recém-nascido ser menino é p, e os filhos do sexo errado não são atingidos por acidentes infelizes, não importa se os pais tomam decisões sobre ter mais filhos com base no sexo do filho. Se o número de filhos for N e N for grande, você pode esperar cerca de p * N meninos. Não há necessidade de um cálculo mais complicado.
Certamente existem outras questões, como "qual é a probabilidade de o filho mais novo de uma família ter filhos" ou "qual é a probabilidade de que o filho mais velho de uma família com filhos seja um menino". (Um deles tem uma resposta correta simples, o outro tem uma resposta errada simples e é complicado obter uma resposta correta).
fonte
Deixei
seja o espaço da amostra e deixe
Trivialmente, o valor esperado das meninas é 1. Portanto, a proporção também é 1.
fonte
É uma pergunta complicada. A proporção permanece a mesma (1: 1). A resposta certa é que ela não afeta a proporção de nascimentos, mas afeta o número de filhos por família, com um fator limitante de uma média de 2 nascimentos por família.
Esse é o tipo de pergunta que você pode encontrar em um teste de lógica. A resposta não é sobre a proporção de nascimentos. Isso é uma distração.
Esta não é uma questão de probabilidade, mas uma questão de raciocínio cognitivo. Mesmo se você respondeu a proporção de 1: 1, ainda falhou no teste.
fonte
Estou mostrando o código que escrevi para uma simulação de Monte Carlo (famílias 500x1000) usando o software `MATLAB '. Examine o código para não cometer nenhum erro.
O resultado é gerado e plotado abaixo. Ele mostra que a probabilidade simulada de nascimento de uma menina tem uma concordância muito boa com a probabilidade de nascimento natural subjacente, independentemente da regra de parada para uma gama de probabilidade de nascimento natural.
Brincando com o código, é mais fácil entender um ponto que eu não entendi antes - como outros apontam, a regra de parar é uma distração. A regra de parada afeta apenas o número de famílias que recebem uma população fixa ou, de outro ponto de vista, o número de nascimentos de crianças que recebem um número fixo de famílias. O sexo é determinado exclusivamente pelo lançamento de dados e, portanto, a proporção ou probabilidade (que é independente do número de filhos) dependerá apenas do menino natural: menina nascimento rato.
fonte
A independência dos nascimentos é irrelevante para o cálculo dos valores esperados.
Em relação à resposta do whuber, se houver uma variação da probabilidade marginal entre as famílias, a proporção fica distorcida em relação aos meninos, devido ao fato de haver mais filhos em famílias com maior probabilidade de meninos do que famílias com menor probabilidade, tendo assim um efeito aumentador de a soma do valor esperado para os meninos.
fonte
Independentemente, também programei uma simulação no matlab, antes de ver o que os outros fizeram. A rigor, não é um MC, porque eu só faço o experimento uma vez. Mas uma vez é suficiente para obter resultados. Aqui está o que minha simulação produz. Não defendo a probabilidade de nascimentos serem p = 0,5 como primitivos. Deixo a probabilidade de nascimento variar em um intervalo de Pr (meninos = 1) = 0,25: 0,05: 0,75.
Meus resultados mostram que, como a probabilidade se desvia de p = 0,5, a razão sexual é diferente de 1: na expectativa, a razão sexual é simplesmente a razão entre a probabilidade de nascimento de um menino e a probabilidade de nascimento de uma menina. Ou seja, essa é uma variável aleatória geométrica conforme identificado anteriormente por @ månst. Isso é o que eu acredito que o pôster original foi uma intuição.
Meus resultados imitam o que o pôster acima com o código matlab fez, correspondendo às proporções de sexo nas probabilidades de 0,45, 0,50 e 0,55 de nascimento de um menino. Apresento o meu, adotando uma abordagem um pouco diferente para obter os resultados com um código mais rápido. Para realizar a comparação, omiti a seção de código vec = vec (randperm (s, N)), pois s não está definido em seu código e não conheço a intenção original dessa variável (essa seção de código também parece supérflua - como originalmente indicado).
Eu posto meu código
O gráfico a seguir é esperado, dada a forte lei do grande número. Eu o reproduzo, mas o gráfico que importa é o segundo gráfico.
Aqui, uma probabilidade populacional diferente de 0,5 para o nascimento de qualquer sexo de uma criança alterará a proporção de sexo na população geral. Supondo que os nascimentos sejam independentes (mas não a opção de continuar reproduzindo), em cada rodada de reprodução condicional, a probabilidade da população governa a composição geral dos resultados dos nascimentos de meninos e meninas. Assim, como outros já mencionaram, a regra de parada no problema é irrelevante para o resultado da população, conforme respondido pelo pôster que identificou isso como a distribuição geométrica.
Para completar, o que a regra de parada afeta é o número de rodadas de reprodução na população. Como eu só executei o experimento uma vez, o gráfico está um pouco irregular. Mas a intuição está lá: para um determinado tamanho da população, à medida que a probabilidade de nascimento de uma menina aumenta, vemos que as famílias precisam de menos rondas de reprodução para obter a garota desejada antes que toda a população pare de se reproduzir (obviamente o número de rondas dependerá do número de rondas). tamanho da população, uma vez que aumenta mecanicamente a probabilidade de uma família ter, por exemplo, 49 meninos antes de ter a primeira filha)
A comparação entre minhas relações sexuais calculadas:
e aqueles do pôster anterior com o código matlab:
São resultados equivalentes.
fonte
Depende do número de famílias.
Portanto, a proporção esperada de meninas é2F1( N, 1 , N+ 1 , - 1 )
fonte