Por que você não vê camadas de evasão nos exemplos de aprendizado por reforço?
Eu estive estudando o aprendizado por reforço e, especificamente, brincando com a criação de meus próprios ambientes para usar com o OpenAI Gym AI. Estou usando agentes do projeto stable_baselines para testar com ele. Uma coisa que notei em praticamente todos os exemplos de RL é que nunca parece...