Como posso prever as chances de uma equipe de queimada ganhar com base no histórico de vitórias de seus jogadores?

13

Imagine que existem 80 jogadores de queimada no mundo. Cada um deles jogou milhares de jogos de queimada com os outros 79 jogadores em ordem aleatória mais ou menos. Este é um mundo sem equipes (por exemplo, todo jogador tem uma chance de ser escolhido em qualquer equipe a cada jogo). Conheço a taxa de vitória anterior de cada jogador (por exemplo, um ganhou 46% de todos os jogos anteriores, outro ganhou 56% de todos os seus jogos anteriores). Digamos que há uma partida chegando e eu sei quem está jogando em cada equipe. Eu também conheço a taxa de vitória anterior.

Qual é a melhor maneira de calcular a probabilidade de cada equipe vencer com base na composição da equipe?

Se exigir um cálculo relativamente avançado (por exemplo, regressão logística), deixe-me saber algumas das especificidades. Estou bastante familiarizado com o SPSS, mas prefiro não fazer uma pergunta de acompanhamento.

Além disso, como eu exploraria a precisão do meu método usando dados de arquivo? Eu sei que não será claro, já que a maioria dos jogadores gira em torno de 40-60%, mas ainda assim.

Para ser específico, quais são as chances de a equipe A vencer?

A - composto por indivíduos com taxa de vitória anterior de 52%, 54%, 56%, 58%, 60% B - composto por indivíduos com taxa de vitória anterior de 48%, 55%, 56%, 58%, 60%

(este é apenas um exemplo aleatório para fins ilustrativos. Duas equipes muito boas.)

Edit: Existe uma maneira de começar com um algoritmo muito simples e depois ver como ele funciona? Talvez pudéssemos simplesmente somar as porcentagens de cada equipe e prever que aquela com a maior porcentagem vencerá. É claro que nossa classificação não seria precisa, mas em milhares de jogos arquivados pudemos ver se podemos prever melhor que o acaso.

Behacad
fonte
Não é apenas uma simples divisão das médias? AvgTeam1WinP/ AvgTeam2WinP? Deve render as probabilidades que team1vencerão team2.
PascalVKooten

Respostas:

2

Parece um trabalho para Bayes ingênuo . Eu não entendo bem a teoria por trás disso, infelizmente não posso dar um exemplo, mas Bayes trabalha com dados conhecidos (de arquivo) para fazer inferências.

Eu acho que Bayes está disponível apenas no Statistic Server do SPSS, portanto, se você tiver acesso a um desses, está com sorte. Como alternativa, você pode usar o Weka, que também inclui vários outros classificadores. Talvez você faça sua experiência e nos informe os resultados?

UMAUMABUMA

rath
fonte
Obrigado pelo seu comentário e pela sua edição. Imaginei que uma abordagem bayesiana ou de aprendizado de máquina poderia ser a melhor. Infelizmente, estou relativamente familiarizado com essas abordagens.
Behacad
2

É correto que você tenha não apenas essas porcentagens, mas também todos os resultados individuais do jogo? Então eu sugeriria o pacote r PlayerRatings. Este pacote não trata apenas de problemas como calcular a força do jogador (usando algoritmos como elo ou glicko), mas oferece funções que podem prever resultados futuros do jogo.

Para obter exemplos, consulte: http://cran.r-project.org/web/packages/PlayerRatings/vignettes/AFLRatings.pdf

rdatasculptor
fonte
0

Não é apenas uma simples divisão das médias? AvgTeam1WinP/ AvgTeam2WinP? Deve render as probabilidades que team1vencerão team2.

Se eu considerar o seguinte:

Se você player1jogasse contra player2equipes "1-homem", você concordaria que as chances de o jogador1 ganhar contra o jogador2 seriam a probabilidade de o jogador1 vencer contra o aleatório dividido pela probabilidade de o jogador2 vencer ao acaso (isso, obviamente, só vale no caso em que você considerou a porcentagem de ganhos precisa, como no limite assintótico), simplesmente:

OddsP1VsP2 = WinProbabilityP1 / WinProbabilityP2 

Se você argumenta que não há efeito de interação de alguns jogadores serem terríveis e, portanto, influenciar a pontuação mais negativamente do que o esperado *, ou se alguns jogadores são realmente bons influenciando a pontuação mais positivamente do que o esperado **, parece lógico que você pode basta ter a probabilidade média de cada jogador em cada equipe.

* Se a combinação de 60%, 60%, 60%, 60% for considerada melhor do que uma equipe de 70%, 70%, 70%, 30%, em que um jogador ruim resultaria em piores probabilidades para a equipe as médias são as mesmas. Sem hipóteses adicionais, não é possível resolver essa questão em particular.

** Da mesma forma, se 50,50,50,90 não for considerado igual a 60,60,60,60, o mesmo se aplica.

PascalVKooten
fonte