Livros sobre Aprendizagem por Reforço

9

Eu tenho tentado entender o aprendizado por reforço há algum tempo, mas de alguma forma não consigo visualizar como escrever um programa para aprender por reforço para resolver um problema do mundo da grade. Você pode me sugerir alguns livros que me ajudariam a construir uma concepção clara do aprendizado por reforço?

girl101
fonte
Por favor, consulte openai também é um bom lugar para aprender Aprendizagem por Reforço de python, basicamente
Vineet Kothari

Respostas:

7

Aqui você tem algumas boas referências sobre Aprendizado por Reforço:

Clássico

Sutton RS, Barto AG. Aprendizado por Reforço: Uma Introdução. Cambridge, Massachusetts: A Bradford Book; 1998. 322 p.

O rascunho da segunda edição está disponível gratuitamente: http://incompleteideas.net/book/the-book-2nd.html

Russell / Norvig Capítulo 21:

Russell SJ, Norvig P, Davis E. Inteligência artificial: uma abordagem moderna. Rio Saddle Superior, NJ: Prentice Hall; 2010.

Mais técnico

Szepesvári C. Algoritmos para aprendizado por reforço. Palestras de Síntese sobre Inteligência Artificial e Machine Learning. 2010; 4 (1): 1–103. http://www.ualberta.ca/~szepesva/RLBook.html

Bertsekas DP. Programação dinâmica e controle ideal. 4ª edição. Belmont, Massachusetts: Athena Scientific; 2007. 1270 p. O Capítulo 6, vol 2, está disponível gratuitamente: http://web.mit.edu/dimitrib/www/dpchapter.pdf

Para desenvolvimentos mais recentes

Wiering M, van Otterlo M, editores. Aprendizado por Reforço. Berlim, Heidelberg: Springer Berlin Heidelberg; 2012 Disponível em: http://link.springer.com/10.1007/978-3-642-27645-3

Kochenderfer MJ, Amato C, Chowdhary G, How JP, Reynolds HJD, Thornton JR, et al. Tomada de decisão sob incerteza: teoria e aplicação. 1 edição. Cambridge, Massachusetts: The MIT Press; 2015. 352 p.

Aprendizado de reforço multi-agente

Buşoniu L, Babuška R, Schutter BD. Aprendizado de reforço multi-agente: uma visão geral. In: Srinivasan D, Jain LC, editores. Inovações em sistemas e aplicações multiagentes - 1. Springer Berlin Heidelberg; 2010 p. 183-221. Disponível em: http://link.springer.com/chapter/10.1007/978-3-642-14435-6_7

Schwartz HM. Aprendizado de máquina multi-agente: uma abordagem de reforço. Hoboken, Nova Jersey: Wiley; 2014.

Vídeos / Cursos

Eu também sugeriria o curso de David Silver no YouTube: https://www.youtube.com/playlist?list=PL5X3mDkKaJrL42i_jhE4N-p6E2Ol62Ofa

Juan Leni
fonte
7

Existe um curso on-line gratuito sobre Aprendizado por Reforço pela Udacity. Verificar: Aprendizado de Máquina: Aprendizado por Reforço

Sreejithc321
fonte
Vale ressaltar que um problema do mundo da rede é apresentado como parte desse curso.
Neil Slater
sim, já vi isso, mas não o suficiente para código o mesmo
girl101
4

Gostei muito do Reforço Leraning: uma introdução de Richard Sutton. Ele fornece uma visão unificadora muito boa da RL, embora não mencione as abordagens mais recentes (é de 1998).

Martin Modrák
fonte
Na verdade, eu queria ver um problema mundial grade que está sendo resolvido por meio do cálculo de caneta e papel, porque isso iria me ajudar a entender o conceito, a menos que eu posso entender o conceito não posso código (especialmente valor iteração)
girl101