Algumas dúvidas sobre a aplicação do aprendizado por reforço em jogos como xadrez

Eu inventei um jogo de tabuleiro semelhante ao xadrez. Eu construí um mecanismo para que ele possa funcionar de forma autônoma. O mecanismo é basicamente uma árvore de decisão. É composta por: Uma função de pesquisa que em cada nó encontra todos os movimentos legais possíveis Uma função de...