Por que um jogo de xadrez pode melhorar a chance de ganhar, de acordo com o computador?

14

Ao assistir o copo de Sinquefield em http://grandchesstour.org/ , é possível tentar diferentes movimentos e ver como o computador avalia a posição após a sua sugestão de movimento.

Agora, a maioria dos movimentos prejudicará sua posição, se não for considerada a melhor jogada pelo computador. Mas para alguns movimentos (com bastante frequência), você obtém instantaneamente uma chance maior de ganhar, talvez uma vantagem de meio peão. Não entendo isso: se um único movimento tem potencial para melhorar significativamente a posição dos jogadores, isso já não deve estar refletido na posição atual antes do movimento? Na minha opinião, qualquer jogada que não seja considerada a melhor jogada pelo computador deve levar a uma posição prejudicada, enquanto a melhor jogada deve, na melhor das hipóteses, manter a posição, e não melhorar a posição dos jogadores. Porque, se o computador sabe que esse movimento melhorará a posição dos jogadores, ele já deve estar na posição atual, melhorando a posição dos jogadores, dizendo que "com a melhor jogada, você está com meio peão"?

Hmm, ou talvez seja apenas o resultado de como o site é implementado no grandchesstour.org?

jonasfh
fonte
4
Em alguns casos, os mecanismos têm problemas para encontrar o movimento certo, mas o avaliam corretamente quando você o insere manualmente. Isso não é tão comum quanto o que você está descrevendo.
11684

Respostas:

26

Se o computador fosse capaz de avaliar todas as linhas de jogo até o final do jogo, a avaliação nunca mudaria. De fato, a avaliação de cada jogada seria "vencer", "perder" ou "empatar". Isso é essencialmente o que acontece nas bases de tabela do final de jogo. * Se os computadores pudessem fazer isso para todas as posições, todo jogo contra um computador consistiria em renunciar sem fazer um movimento, oferecer um empate na posição inicial ou ficar irritado por não ter renunciado ou aceito a oferta de empate.

No entanto, os computadores não podem avaliar tão longe porque levaria um tempo impossivelmente longo, tanto porque os jogos podem ser muito longos (centenas de movimentos, em princípio) quanto porque existem muitas possibilidades em cada movimento. Portanto, os computadores precisam usar vários atalhos. Isso inclui tentar descobrir rapidamente quais são as jogadas candidatas mais importantes (pegar uma peça desprotegida é provavelmente uma ótima jogada; pendurar sua rainha é provavelmente uma jogada horrível; ...) e também interromper a busca após vários movimentos e usar algumas heurísticas em vez de pesquisar mais para tentar descobrir se a posição resultante parece boa ou não.

O problema é que esses atalhos podem dar errado. O computador pode decidir que pendurar um pedaço é ruim quando na verdade é um sacrifício genial. Pode decidir que uma posição se estabilizou quando realmente não está. Pode não ter poder suficiente para ver o suficiente no futuro para ver o ponto real de um movimento em particular.

Aqui está um exemplo simples, embora não seja mais muito realista. Suponha que você esteja prestes a me xingar, mas tenho uma série de dez verificações que posso fazer para atrasá-lo. Se eu olhar apenas dez movimentos com antecedência, acho que estou indo bem: talvez eu esteja até fazendo um peão, então minha avaliação é "Depois de dez movimentos, eu ainda estou fazendo um peão, então estou bem "Pontuação +1" Eu jogo meu primeiro cheque, você responde, e agora vejo que é companheiro em dez e me demiti. Esse é o chamado "efeito horizonte" que os programas modernos tentam evitar (por exemplo, olhando mais profundamente ao longo de linhas que têm muitos movimentos forçados), mas ilustra o princípio geral.

Se o mecanismo puder ver, digamos, dez jogadas no futuro, será visto mais longe no jogo a cada jogada. Na posição inicial, ele pode ver como será o quadro no lance 10; depois de um movimento, ele pode ver o movimento 11 e assim por diante. (Novamente, isso é uma simplificação, já que os computadores atualmente não olham uma distância fixa para o futuro, mas isso lhe dá uma idéia geral.)

O exemplo que você deu é apenas uma versão menos dramática dos exemplos que eu dei. À medida que mais movimentos são feitos, o computador pode ver mais profundamente o jogo, permitindo uma avaliação mais precisa. Outra maneira de ver isso é em termos de informação: à medida que mais movimentos são executados, o computador tem mais informações. Costumava adivinhar qual seria a sua resposta ao 1.e4, mas agora sabe que você interpreta o siciliano e assim por diante.


* Há uma leve nuance aqui em que você realmente precisa contar o número de jogadas para a vitória para evitar repetir posições. Por exemplo, considere o final do jogo de KQ x K. Todo movimento que não empate ou renuncia à rainha vence, então você precisa de um mecanismo para dirigir em direção ao xeque-mate, em vez de apenas se mover aleatoriamente e dizer: "Uau, eu vou totalmente para ganhar isso - quase todos os movimentos vencem! "

David Richerby
fonte
Excelente resposta! Eu nunca ouvi falar desse "efeito horizonte", faz muito sentido, muito interessante.
Pedro A
Obrigado pelos esclarecimentos. Estou muito confuso com o grande impacto de um único movimento, mas acho que o tempo que o computador pode analisar é bastante limitado no site em questão, aumentando o efeito.
jonasfh
4

Não há inconsistência. Quando você faz uma jogada, o computador não precisa mais procurar a posição anterior. Agora ele pode concentrar todo o poder de processamento na nova posição e, portanto, a avaliação pode mudar. A árvore do jogo pode ser muito diferente.

É assim que jogamos xadrez.

Olá Mundo
fonte
4
Você pode acrescentar que o mecanismo de xadrez on-line não está analisando muitos movimentos profundamente para começar, portanto a dobra extra é muito mais significativa do que seria no seu computador em casa.
Brian Towers
Hmmm, eu meio que concordo. Ainda assim, estou curioso para saber que o impacto é tão grande para um único movimento. Eu acho que o computador faz uma análise bastante significativa para cada próximo movimento possível, especialmente os promissores, e deve descobrir se um dos movimentos possíveis dará uma posição muito melhorada e ajustará a posição atual de acordo. Mas vejo o comentário de Brian, que deve ser importante aqui.
jonasfh