O fato de meu filho italiano frequentar uma escola primária mudará o número esperado de crianças italianas para estar presente em sua classe?

37

Esta é uma pergunta decorrente de uma situação da vida real, pela qual fiquei genuinamente intrigado com sua resposta.

Meu filho deve começar a escola primária em Londres. Como somos italianos, fiquei curioso para saber quantas crianças italianas já estão frequentando a escola. Pedi isso ao Oficial de Admissão durante a inscrição e ela me disse que eles têm em média 2 crianças italianas por turma (de 30).

Agora estou no momento em que sei que meu filho foi aceito, mas não tenho outras informações sobre os outros filhos. Os critérios de admissão são baseados na distância, mas, para o propósito desta pergunta, acredito que podemos assumir que ela se baseia na alocação aleatória de uma grande amostra de candidatos.

Quantas crianças italianas devem estar na turma do meu filho? Será mais perto de 2 ou 3?

user90213
fonte
39
Isso me lembra a velha piada: "Eu sempre carrego uma bomba quando viajo, porque quais são as chances de duas pessoas terem uma bomba no mesmo avião?"
Bill o Lagarto
2
O fato de o Oficial de Admissão ter informado que eles têm em média 2 crianças italianas por turma torna esses dados 'suspeitos' para mim. Se resultasse de um cálculo real, você esperaria um número não redondo. Portanto, é possível que o valor verdadeiro seja 1,51 ou 2,49, digamos. Além disso, como é mais provável que o Oficial de Admissão tente 'agradar você' com a resposta, eles podem ter arredondado para cima e não para baixo (se acham que você gostaria de ter seu filho entre outros italianos), sugerindo que a probabilidade a distribuição sobre valores próximos de 2 seria não simétrica. As respostas abaixo podem ser adaptadas.
precisa saber é o seguinte
4
@PatrickT "Mode" é um tipo válido de média.
Ian Ringrose
11
Muito obrigado pessoal por responder. Agora também postei uma pergunta semelhante, mas com um enquadramento diferente ( stats.stackexchange.com/questions/173969/… ), que foi acionado por algumas de suas respostas / respostas.
user90213
11
@PatrickT Eu acho que há muito mais pessoas com pouca educação que ficariam confusas com 1,5 ("Como você tem meio filho?") Do que os nerds irritados com o excesso de arredondamentos me parecem mais propensos. (Assumindo que o número mais precisa não é, na verdade, 1,9 ou 2,1 de qualquer maneira.)
Dan Neely

Respostas:

27

Como sempre, você precisa considerar um modelo probabilístico que descreva como a escola distribui as crianças entre as turmas. Possibilidades:

  1. A escola cuida para que todas as classes tenham o mesmo número de estrangeiros.
  2. A escola ainda tenta garantir que cada nacionalidade seja representada aproximadamente da mesma forma em todas as classes.
  3. A escola não considera nacionalidade e apenas distribui aleatoriamente ou com base em outros critérios.

Tudo isso é razoável. Dada a estratégia 2, a resposta para sua pergunta é não. Quando eles usam a estratégia 3, a expectativa será próxima de 3, mas um pouco menor. Isso ocorre porque seu filho ocupa uma "vaga" e você tem uma chance a menos de um italiano aleatório.

Quando a escola usa a estratégia 1, a expectativa também aumenta; quanto depende do número de estrangeiros por classe.

Sem conhecer sua escola, não há como responder a isso mais perfeitamente. Se você tiver apenas uma turma por ano e os critérios de admissão forem os descritos, a resposta seria a mesma de 3 acima.

Calculando 3 em detalhes:

E(X)=1 1+E(B(29,2/30))=1 1+1.9333=2.9333.

X é o número de crianças italianas na classe. O 1 vem da criança conhecida, os 29 são o resto da turma e 2/30 é a probabilidade de um garoto desconhecido ser italiano, dado o que a escola diz. B é a distribuição binomial.

Observe que começar com não fornece a resposta correta, pois saber que uma criança específica é italiana viola a permutabilidade assumida pela distribuição binomial. Compare isso com o paradoxo de menino ou menina , onde faz diferença se você sabe que um filho é menina versus saber que o filho mais velho é menina.E(X|X1 1)

Erik
fonte
2
Vamos fazer a suposição binomial e vamos . Parece que a escolha entre E ( X ~ B ( 30 , 2 / 30 ) | X 1 ) e E ( B ( 29 , 2 / 30 ) )n=30E(XB(30,2/30)|X1 1)E(B(29,2/30))pode depender das suposições. Por exemplo, se eu presumir que qualquer pai italiano em Londres provavelmente ficará tão confuso quanto @ user90213 e postará uma pergunta aqui, então ver essa pergunta não altera muito minhas expectativas. Eu só aprendi que um garoto é italiano e computaria . É o que você chamou de "permutabilidade"? Se, por outro lado, user90213 for meu amigo íntimo e conheço o filho dele, chegarei à sua resposta. E(X|X1 1)
Ameba diz Reinstate Monica
2
@amoeba Sabendo que em uma escola específica e em uma classe específica existe o filho do user90213 é suficiente para distingui-lo do resto, não depende de quão especial é o seu relacionamento com o user90213. Mas é complicado, pois importa como você aprende as informações. Por exemplo, se você perguntar por e-mail que a criança italiana mais velha de uma classe entra em contato com você pelo nome e obtém uma resposta, você deve optar pela abordagem , mesmo que seja possível distinguir a criança posteriormente. Tente pesquisar no paradoxo menina-menino ou até faça uma pergunta mais geral sobre isso. Há muita discussão sobre isso. E(X|X>1)
Erik
É isso mesmo, obrigado Erik. O que eu quis dizer no comentário anterior é algo semelhante ao seu exemplo de email. Se eu presumir que todos os pais italianos de uma classe postarão uma pergunta aqui, então ver essa pergunta é exatamente como ser contatado pela criança italiana mais velha. Parece que geralmente concordamos com +1. O link do wiki é realmente interessante.
Ameba diz Reinstate Monica
(+1) Mas intrigado, por que você diz "Se você tem apenas uma aula por ano [...]".
Scortchi - Restabelecer Monica
@ Scortchi Se a escola tiver apenas uma turma por ano, poderá usar as duas estratégias denominadas 1 e 2, pois todas as crianças que são aceitas na escola este ano acabam na mesma turma.
Erik
13

Outra maneira de ver isso é no nível de crianças individuais. Assumindo que 30 crianças tiradas aleatoriamente de uma população (que você já indicados podemos), podemos trabalhar para trás para a probabilidade aproximada de uma criança italiana sendo desenhado a partir desta população: = 1 / 15 .2/301 1/15

Dado que sabemos que um dos 30 é italiano, só precisamos calcular a probabilidade para os filhos restantes:

291 1/15=29/15=1.933...

Portanto, saber que seu filho é italiano altera o número esperado de crianças italianas na classe para aproximadamente 2.933, o que é muito mais próximo de 3 que 2.

Thomas Cleberg
fonte
5

Aqui estão meus pensamentos sobre como abordar isso:

Deixe a variável aleatória denotar o número de crianças italianas em uma classe que atualmente é do tamanho n . Seja X o indicador para uma criança nova ser italiana. Suponha que adicionemos o filho X a essa classe. Então o número esperado de crianças italianas nessa classe aumentada de tamanho n + 1 é E ( S n + X ) = E ( S n ) + E ( X ) = E ( S n ) + P (SnnXXn+1 . Observe que a independência não importa aqui, pois estamos apenas usando a linearidade da expectativa. Se o filho X é italiano, então X = 1 com probabilidade 1, aumentamos o valor esperado em 1.E(Sn+X)=E(Sn)+E(X)=E(Sn)+P(X=1)XX=1 1

jld
fonte
11
Então, haverá crianças nesta classe após a adição da criança italiana? n+1 1
Scortchi - Restabelece Monica
Sim. Há algo que eu sinto falta relacionado a isso?
jld
11
Depende de como você lê a pergunta. Suponha que as turmas tenham exatamente 30 filhos.
Scortchi - Restabelece Monica
11
Talvez eu tenha entendido mal a pergunta. Eu pensei que estava perguntando sobre como a adição de uma criança italiana conhecida muda a expectativa.
jld
11
Esse é um ponto muito bom sobre o tamanho de classes possivelmente sendo limitado
jld 23/09/15
1

BEunom(30,2/30)E(X|X1 1)XBEunom(30,2/30)2,28


E[X|X1]=i=030iP(X=i|X1)=030iP(X=i,X1)P(X1)=130iP(i)1P(0)

(observe a alteração no limite inferior da soma no último passo)

jf328
fonte
11
Você pode elaborar a expectativa condicional?
Antoni Parellada 23/09
3
Sua resposta está incorreta. A maneira correta de calcular isso seria 1 (filho conhecido) + E (B (29,2/30)), que é 2,9333. E a suposição de distribuição binomial é questionável.
Erik
Mais uma coisa que eu gostaria de destacar: a) seu cálculo da expectativa condicional está errado. Mas b) mais importante, começar com sua expectativa condicional está incorreto. Saber que uma criança específica é italiana, quebra a permutabilidade assumida pela distribuição binormal. É muito semelhante ao paradoxo menino-menina ( en.wikipedia.org/wiki/Boy_or_Girl_paradox ), onde faz diferença se você sabe que a criança mais velha é uma menina ou sabe que um dos dois filhos é uma menina.
Erik
Comentário zero a) de cima. Mas b) é mais grave de qualquer maneira;)
Erik
Concordo. Para OP, a distribuição não binomial (30, 30/02) é, de facto, mas 1 + binomial (29, 30/02)
jf328
-3

Não. Seu conhecimento dos eventos iminentes não muda nada sobre a experiência típica da escola.

Mart
fonte
2
-1. Isso está incorreto, conforme explicado em detalhes em outras respostas e comentários aqui.
Ameba diz Reinstate Monica
perdoe minha falta de matemática avançada, mas o que faz o filho desta gent para não ser um dos 'tipicamente 2' crianças .. tais que acabam mais perto de 3.?
Mart
Mart: Imagine que eu jogue uma moeda dez vezes e conte as cabeças; nada de estranho na moeda ou no jeito que eu a jogo. Repito esse experimento várias vezes e, em média, vejo quase exatamente cinco cabeças em dez lançamentos; quais resultados você vê (1.000 lançamentos no total, dos quais 50,3% eram cara, bem dentro da variação esperada para um procedimento de lançamento de moeda justo; decidimos concordar que o processo parece pelo menos praticamente justo). Agora eu faço o experimento mais uma vez com você, e você vê que os quatro primeiros arremessos são todos cabeças. Qual é o número esperado de cabeças no conjunto completo de dez lançamentos? 5? Mais?
Glen_b -Reinstate Monica
Observe que, pelo argumento anterior, os quatro primeiros "poderiam ter sido quatro dos cinco esperados". Mas você diria que há menos de 50% de chance nos próximos seis lançamentos (na verdade, você está dizendo que há apenas uma chance de 1/6 em média). Como a moeda saberia aparecer com menos frequência?
Glen_b -Reinstate Monica