Há muito tempo os computadores conseguem jogar xadrez usando uma técnica de "força bruta", procurando até uma certa profundidade e depois avaliando a posição. O computador AlphaGo, no entanto, usa apenas uma RNA para avaliar as posições (ele não faz nenhuma pesquisa em profundidade até onde eu sei). É possível criar um mecanismo de xadrez que jogue xadrez da mesma maneira que AlphaGo joga Go? Por que ninguém fez isso? Esse programa teria um desempenho melhor do que os principais mecanismos de xadrez (e jogadores de xadrez) de hoje?
32
Respostas:
EDIT (após a leitura do artigo):
Eu li o jornal pensativamente. Vamos começar com o que o Google afirmou no jornal:
Infelizmente, não acho que seja um bom jornal. Vou explicar com links (para você saber que não estou sonhando):
https://chess.stackexchange.com/questions/19360/how-is-alpha-zero-more-human tem minha resposta sobre como o AlphaZero se comportou como humano
A partida foi injusta , fortemente tendenciosa. Cito Tord Romstad, o programador original do Stockfish.
O Stockfish não poderia ter jogado o melhor xadrez com apenas um minuto por jogada. O programa não foi projetado para isso.
A tabela de hash de 1 GB é absolutamente inaceitável para uma correspondência como esta. O Stockfish frequentemente encontrava colisão de hash. São necessários ciclos de CPU para substituir entradas antigas de hash.
CONCLUSÃO
O Google não provou sem dúvida que seus métodos são superiores ao Stockfish. Seus números são superficiais e fortemente influenciados pelo AlphaZero. Seus métodos não são reproduzíveis por terceiros independentes. Ainda é um pouco cedo para dizer que o Deep Learning é um método superior à programação tradicional de xadrez.
EDIT (dez 2017):
Há um novo artigo do Google Deepmind ( https://arxiv.org/pdf/1712.01815.pdf ) sobre aprendizado de reforço profundo no xadrez. Do resumo, o mecanismo de xadrez Stockfish número um do mundo foi "convincentemente" derrotado. Acho que esta é a conquista mais significativa no xadrez para computadores desde a partida Deep Blue de 1997. Atualizarei minha resposta assim que ler o artigo em detalhes.
Original (antes de dez de 2017)
Vamos esclarecer sua pergunta:
A RNA pode ser usada para motores de xadrez:
Giraffe é reproduzido no nível Master Internation, que é sobre a classificação FIDE 2400. No entanto, Stockfish, Houdini e Komodo estão no FIDE 3000. Essa é uma grande lacuna. Por quê? Por que não a Pesquisa em Árvores Monte-Carlo?
Houve pesquisas de que o Monte Carlo Tree Search não se adapta bem ao xadrez. Go é um jogo diferente para o xadrez. Os algoritmos de xadrez não funcionam para o Go porque o xadrez depende de táticas brutais. A tática é sem dúvida mais importante no xadrez.
Agora, estabelecemos que o MCTS funciona bem para o AlphaGo, mas menos para o xadrez. O aprendizado profundo seria mais útil se:
Se o aprendizado profundo conseguir o seguinte, ele vencerá o algoritmo tradicional:
Deixe-me salientar:
mais um:
Referência:
Eu cito:
fonte
O DeepBlue já venceu Kasparov, então esse problema é resolvido com uma abordagem muito mais simples. Isso foi possível porque o número de movimentos possíveis no xadrez é muito menor do que o esperado , por isso é um problema muito mais simples. Além disso, observe que tanto a NN quanto a força bruta precisam de enormes recursos de computação ( aqui você pode encontrar uma foto do computador atrás do AlphaGo, observe que ele usa nem mesmo as GPUs, mas as TPU para computação). O problema foi que, quando Deep Blue venceu Kasparov, a comunidade go argumentou que isso não seria possível com go (por muitas razões diferentes, mas para resumir os argumentos que eu precisaria dar uma introdução detalhada ao jogo de ir). Sim, você pode ensinar NN a jogar xadrez, Mario , ou tentar ensiná-lo a jogarStarcraft ...
Eu acho que a razão disso é que você simplesmente não ouve com frequência na grande mídia sobre casos em que as pessoas resolvem problemas que já foram resolvidos.
Além disso, sua premissa está errada, o Deep Learning é usado para jogar xadrez, por exemplo, conforme descrito em Deep Learning Machine Learns Xess in 72 Hours, Play at International Master Level . Veja também o artigo correspondente, Girafa: Usando o reforço profundo Aprendendo a jogar xadrez .
fonte