Por que a FIDE ainda usa o Elo?

11

Fiquei impressionado com o funcionamento do sistema de classificação Glicko . Em particular:

  • mais jogos jogados recentemente fazem com que sua classificação se estabilize
  • menos jogos jogados recentemente fazem com que sua classificação flutue até você receber vários jogos recentes

A USCF modificou seu sistema para ser semelhante alguns anos atrás (onde existe uma escala móvel para ampliar ou diminuir a alteração de classificação para uma determinada partida), e agora que Glickman (o inventor da Glicko) está no quadro de classificação da USCF, Eu imagino que eles eventualmente adotem um sistema ainda mais flexível, como o dele.

Existe uma razão (além de ser resistente à mudança, ou que eles ainda não chegaram a isso): a FIDE não adota um sistema de classificação mais preciso?

Eve Freeman
fonte

Respostas:

9

Não está provado que o Glicko seja mais preciso. A Glicko resolve o problema de uma maneira diferente, com uma ênfase diferente. Considere que todos esses sistemas abstraem a mente humana para um número de 4 dígitos.

Há muita política nas classificações; é um assunto delicado. Se a FIDE adotasse, eles produziriam uma nova lista dos 100 melhores, e muitos GMs provavelmente ficariam chateados.

O sistema ELO é muito fácil de entender; transparência é importante. Sistemas mais complexos têm desvantagens imediatas.

Tony Ennis
fonte
6
+1, embora eu discorde do primeiro parágrafo, o resto é verdadeiro o suficiente. 1) É comprovado que o Glicko é mais preciso em média (medido em termos da frequência com que é capaz de prever quem vencerá uma determinada partida). 2) Sobre abstrair uma mente humana para um número, esse não é realmente o caso. É uma medida de habilidade, de modo que você pode calcular probabilidades (para ganhar / empatar / perder) ao comparar níveis de habilidade. Tudo é apoiado por matemática e estatística. No Glicko-2, existe ainda um novo fator de volatilidade, para os jogadores que jogam de maneira inconsistente (permitindo que suas classificações flutuem mais).
Eve Freeman
1
Interessante. No entanto, eu diria que 'melhor em média' não é necessariamente 'melhor'. E se os momentos em que não for mais preciso causarem danos reais? Vou ler sobre isso, no entanto.
Tony Ennis
7

Tanto quanto eu entendo, o sistema de classificação Glicko adiciona uma pontuação de confiabilidade ao número da classificação, o que pode fornecer uma maior imparcialidade em relação aos cálculos de ajuste da pontuação da classificação. Obviamente, isso pode levar à suposição errada de que existe uma correlação entre jogar jogos classificados e a força resultante de jogar (já que não jogar diminui a pontuação de confiabilidade que, por sua vez, desvaloriza seu número de classificação de alguma forma). Vejo muitos problemas relacionados à pontuação de confiabilidade, embora deva admitir que não sou especialista nas sutilezas do sistema. Apenas para escolher três:

  • Um jogador que joga apenas o jogo com classificação rara pode não receber mais convites. Imagine que você é um diretor de torneio convidando jogadores atraentes. Agora você precisa escolher entre 10 jogadores, todos com o mesmo número de classificação, mas com números de confiabilidade diferentes. Provavelmente você escolherá os que tiverem os melhores números de confiabilidade primeiro. Com o tempo, a diferença de confiabilidade entre jogadores com muitos jogos classificados e menos jogos pode aumentar.
  • A manipulação dos números de classificação pode se tornar mais fácil. Mesmo o sistema ELO não é seguro contra trapaças, porque algumas pessoas obtiveram classificações ou normas de IM / GM jogando em torneios fraudulentos. Uma boa pontuação de confiabilidade pode tornar muito baratos ajudar jogadores sem pontuação de confiabilidade - o bom jogador dá pontos de classificação sem perder muito a si mesmo. Assim que o dinheiro está envolvido, a segurança é uma questão importante. Sinto que o sistema de classificação Glicko é mais propenso a manipulações.
  • A comunicação e a compreensão da força de jogo podem se tornar mais difíceis para as massas. Quando você comunica uma lista de classificação, você encontra problemas. Um jogador com uma classificação de 2000-50 tem uma "força real de jogo" entre 1900 e 2100. Outro jogador tem 1950-2000, que se traduz em um número no intervalo de 1750 e 2150. Portanto, o jogador com 1950-2000 pode ser de fato o melhor jogador, mas provavelmente ficará abaixo do outro, apenas porque ele jogou menos jogos ou contra adversários menos confiáveis. Você torna a explicação do seu sistema de classificação mais difícil para as pessoas, sem realmente garantir mais justiça. Um GM que para de jogar pode ganhar "força potencial" e se gabar de seu potencial campeão mundial, porque seu número de confiabilidade abre espaço crescente para o desvio (lembre-se:

Para resumir: Você pode obter mais do que esperava, porque o pacote inteiro não vem apenas com melhorias. E como há questões monetárias pesadas envolvidas quando você olha para o final superior das listas de classificação, não vejo o mérito de alterar um sistema existente.

Raio
fonte
A maioria das listas de classificação possui um ponto de corte para o escore de confiabilidade (RD), em vez de tentar usá-lo para classificar os jogadores. Portanto, 2000 (50) seria sempre classificado acima de 1950 (100). De acordo com a classificação atual, eles têm uma classificação mais alta, independentemente da confiabilidade. Se o jogador de 1950 (100) ganhasse contra o 2000 (50), sua classificação aumentaria mais significativamente do que se fosse 1950 (50). Você pode descrever como alguém pode enganar o sistema com a Glicko em mais detalhes? Você está falando sobre ensacar sua classificação se tiver alto RD?
Eve Freeman
@ West Freeman: Duvido que este seja o lugar perfeito para provar a relativa fraude de um sistema de classificação e estou apenas tentando adivinhar, porque para mim parece mais barato manipular o sistema, pois não vou perder tantos pontos de classificação quando perco intencionalmente contra um jogador sem classificação. O ponto mais importante da minha resposta é que você deve verificar um sistema não apenas quanto à imparcialidade dos cálculos, mas à fraude, propensão à capacidade de comunicação etc., antes de jogar fora um sistema em funcionamento.
Ray
Mas como o aumento artificial da classificação de alguém os ajuda? Geralmente, as pessoas que tentam burlar o sistema estão tentando diminuir sua classificação para poder jogar nas seções mais baixas e ganhar o primeiro prêmio. Isso pode ser mais fácil com o Glicko, se você evitar jogar por um longo período de tempo e depois perder alguns jogos que deveria ter vencido. Mas combinado com os níveis de classificação e o fato de que isso só pode ser feito de vez em quando, devido ao tempo de recuperação de desastre de RD.
Eve Freeman
1
Você pode precisar de classificações altas para ganhar um título, receber convites ou ser pago pelos clubes para jogar por eles ou trabalhar como treinador. Estou falando de xadrez profissional aqui e onde está o dinheiro real, porque você questionou o comportamento da FIDE.
Ray