Perguntas com a marcação «game-ai»

20

Como lidar com movimentos inválidos no aprendizado por reforço?

Eu quero criar uma IA que possa jogar cinco em linha / gomoku. Como mencionei no título, quero usar o aprendizado por reforço para isso. Eu uso o método gradiente de política , ou seja, REFORÇAR, com a linha de base. Para a aproximação das funções de valor e política, eu uso uma rede neural ....

15

Como escolho o melhor algoritmo para um jogo de tabuleiro como damas?

Como escolho o melhor algoritmo para um jogo de tabuleiro como damas? Até agora, considerei apenas três algoritmos, a saber, minimax, poda alfa-beta e pesquisa em árvore Monte Carlo (MCTS). Aparentemente, a poda alfa-beta e o MCTS são extensões do algoritmo básico

game-ai minimax alpha-beta-pruning monte-carlo-tree-search

13

Codificação de entrada / saída para uma rede neural para aprender um jogo baseado em grade

Estou escrevendo um jogo de brinquedo simples, com a intenção de treinar uma profunda rede neural sobre ela. As regras dos jogos são aproximadamente as seguintes: O jogo tem um tabuleiro composto por células hexagonais. Ambos os jogadores têm a mesma coleção de peças que podem escolher posicionar...

neural-networks deep-learning game-ai

11

Como treinar uma rede neural para um jogo de tabuleiro redondo?

Estou pensando em como treinar uma rede neural para um jogo de tabuleiro baseado em rounds, como jogo da velha, xadrez, risco ou qualquer outro jogo baseado em rounds. Conseguir a próxima jogada por inferência parece bastante simples, alimentando o estado do jogo como entrada e usando a saída como...

training tensorflow game-ai

11

AlphaZero é um exemplo de uma AGI?

Do artigo de pesquisa do DeepMind em arxiv.org: Neste artigo, aplicamos um algoritmo semelhante, mas totalmente genérico, que chamamos de AlphaZero , aos jogos de xadrez e shogi e Go, sem nenhum conhecimento adicional de domínio, exceto as regras do jogo, demonstrando que um aprendizado de...

game-ai definitions agi alphago

10

Uma rede neural pode elaborar o conceito de distância?

Imagine um jogo em que é uma tela preta além de um pixel vermelho e um pixel azul. Dado este jogo a um humano, eles primeiro verão que pressionar as teclas de seta moverá o pixel vermelho. A próxima coisa que eles tentarão é mover o pixel vermelho para o pixel azul. Dê este jogo a uma IA, ele...

neural-networks game-ai path-planning teaching-concepts

9

Algumas dúvidas sobre a aplicação do aprendizado por reforço em jogos como xadrez

Eu inventei um jogo de tabuleiro semelhante ao xadrez. Eu construí um mecanismo para que ele possa funcionar de forma autônoma. O mecanismo é basicamente uma árvore de decisão. É composta por: Uma função de pesquisa que em cada nó encontra todos os movimentos legais possíveis Uma função de...

reinforcement-learning game-ai game-theory combinatorial-games negamax

9

A pesquisa em árvore Monte Carlo se qualifica como aprendizado de máquina?

Para o meu melhor entendimento, o algoritmo MCTS (Monte Carlo Tree Search) é uma alternativa ao minimax para pesquisar uma árvore de nós. Ele funciona escolhendo um movimento (geralmente aquele com maior chance de ser o melhor) e, em seguida, executando um playout aleatório em movimento para ver...

machine-learning reinforcement-learning game-ai monte-carlo-tree-search alphazero