Perguntas com a marcação «reinforcement-learning»

Para questões relacionadas ao aprendizado controlado por reforço positivo externo ou sinal de feedback negativo ou ambos, onde o aprendizado e o uso do que foi aprendido até agora ocorrem simultaneamente.

14
Como definir estados na aprendizagem por reforço?

Estou estudando o aprendizado por reforço e suas variantes. Estou começando a entender como os algoritmos funcionam e como eles se aplicam a um MDP. O que não entendo é o processo de definição dos estados do MDP. Na maioria dos exemplos e tutoriais, eles representam algo simples como um quadrado em...