O sistema de classificação Elo usa um algoritmo de minimização de descida de gradiente da função de perda de entropia cruzada entre a probabilidade esperada e observada de um resultado em comparações pareadas. Podemos escrever as funções gerais de perda como
onde a soma é realizada sobre todos os resultados todos os oponentes . é a frequência observada do evento e a frequência esperada.
No caso de apenas dois resultados possíveis (ganhar ou perder) e um oponente, temos
Se é o ranking do jogador e é o ranking do jogador podemos construída a probabilidade esperada como seguida, a regra de atualização de descida do gradiente informa o uso
onde e são a probabilidade esperada e observada de vitória do jogador contra o jogador . Estas são as regras de atualização.two outcomes
Na presença de empates, podemos generalizar o modelo acima, incluindo e terceiro resultado com probabilidade
E podemos construir a função Perda como
onde são, respectivamente, a probabilidade observado de , e e a probabilidade esperada de , e . Neste último caso, a regra de atualização seriawin
loose
draw
win
loose
draw
onde e são a probabilidade esperada de o jogador vencer e empatar contra o jogador . E onde e são a probabilidade observada de o jogador vencer e empatar contra o jogador . Esta é a regra de atualização.three outcome
A questão é: por que o sistema de classificação Elo usa as two outcomes
regras de atualização mesmo na presença de empates?
fonte