A aprendizagem supervisionada é um subconjunto da aprendizagem por reforço?

16

Parece que a definição de aprendizado supervisionado é um subconjunto de aprendizado por reforço, com um tipo específico de função de recompensa que se baseia em dados rotulados (em oposição a outras informações no ambiente). Esse é um retrato preciso?

todas as estrelas
fonte

Respostas:

24

É verdade que qualquer problema de aprendizado supervisionado pode ser considerado um problema de aprendizado de reforço equivalente: deixe que os estados correspondam aos dados de entrada. Deixe as ações corresponderem às previsões da saída. Defina a recompensa como o negativo da função de perda usada para o aprendizado supervisionado. Maximize a recompensa esperada. Por outro lado, os problemas de aprendizado por reforço geralmente não podem ser considerados problemas de aprendizado supervisionado. Portanto, dessa perspectiva, os problemas de aprendizado supervisionado são um subconjunto de problemas de aprendizado por reforço.

Mas, tentar resolver um problema de aprendizado supervisionado usando um algoritmo geral de aprendizado por reforço seria inútil; tudo o que isso faz é jogar fora uma estrutura que facilitaria a solução do problema. Surgem várias questões no aprendizado por reforço que não são relevantes para o aprendizado supervisionado. E o aprendizado supervisionado pode se beneficiar de abordagens que não se aplicam no cenário geral de aprendizado por reforço. Portanto, embora haja alguns princípios subjacentes comuns e técnicas compartilhadas entre os campos, normalmente não se vê o aprendizado supervisionado discutido como um tipo de aprendizado por reforço.

Referências

Barto e Dietterich (2004) . Aprendizado por reforço e sua relação com o aprendizado supervisionado.

user20160
fonte