Criei uma página da Web que obtém os resultados das medalhas olímpicas ao vivo da Thompson Reuters e a contagem mundial da população da CIA.
Os resultados são interessantes para mim - a Hungria tem uma vantagem de dois dígitos nas medalhas de ouro no resto do mundo. Além disso, os EUA e a China estão perto do fundo em quase todas as categorias.
Minha pergunta é - estou apresentando os dados de maneira justa? Simplesmente peguei a maior população e criei um fator para cada país com base nisso. As colunas de contagem relativa de medalhas são baseadas nesse fator.
Quais colunas eu poderia adicionar? Que outros fatores eu poderia acrescentar para apresentar a visão mais justa? A visão absoluta é fácil - a Reuters faz isso. Como criar uma visão justa?
fonte
Respostas:
Você está tentando encontrar uma estimativa da chance de qualquer indivíduo ganhar uma medalha, sabendo que os "dados" que temos são apenas o número por país. É uma ótima pergunta uma solução justa estar mais próxima do espírito das Olimpíadas.
Basicamente, este é um problema estatístico que é bem aproximado pelo seu método como o número médio (frequência) de medalhas (para cada cor) em relação à população. Mas quão confiável é esse método? Isso está bem próximo do problema de estimar a confiabilidade de um lançamento binomial a partir de diferentes números de arremessos, que tem aplicativos, por exemplo, para comparar a qualidade dos revendedores na Amazon com base em diferentes números de feedback (consulte esta explicação completa ).
Nesse caso em particular, o número da população é sempre suficiente para tornar a aproximação da distribuição beta normal - de modo que é certamente possível comparar a significatividade de cada estimativa para cada país.
fonte