Nos artigos AlphaGo Zero e AlphaZero do DeepMind , eles descrevem a adição de ruído Dirichlet às probabilidades anteriores de ações do nó raiz (estado da placa) na Monte Carlo Tree Search: Exploração adicional é obtida adicionando ruído Dirichlet às probabilidades anteriores no nó raiz ,...