Perguntas com a marcação «reinforcement-learning»

Um conjunto de estratégias dinâmicas pelas quais um algoritmo pode aprender on-line a estrutura de um ambiente executando ações adaptativas associadas a diferentes recompensas, a fim de maximizar as recompensas obtidas.

30
Aprendizado supervisionado, aprendizado não supervisionado e aprendizado por reforço: princípios básicos do fluxo de trabalho

Aprendizado supervisionado 1) Um humano constrói um classificador com base na entrada e saída de dados 2) Esse classificador é treinado com um conjunto de dados de treinamento 3) Esse classificador é testado com um conjunto de dados de teste 4) Implantação se a saída for satisfatória Para ser...

24
Análise diária de séries temporais

Estou tentando fazer análise de séries temporais e sou novo nesse campo. Eu tenho contagem diária de um evento de 2006-2009 e quero ajustar um modelo de série temporal a ele. Aqui está o progresso que eu fiz: timeSeriesObj = ts(x,start=c(2006,1,1),frequency=365.25) plot.ts(timeSeriesObj) O...

18
Quando escolher SARSA vs. Q Learning

SARSA e Q Learning são algoritmos de aprendizado por reforço que funcionam de maneira semelhante. A diferença mais marcante é que o SARSA está na política enquanto o Q Learning está fora da política. As regras de atualização são as seguintes: Q Aprendizado: Q ( st, umt) ← Q ( st, umt) + α [ rt +...

14
GAM vs LOESS vs splines

Contexto : Eu quero desenhar uma linha em um gráfico de dispersão que não aparece paramétrica, portanto, eu estou usando geom_smooth()no ggplotno R. Ele retorna automaticamente, geom_smooth: method="auto" and size of largest group is >=1000, so using gam with formula: y ~ s(x, bs = "cs"). Use...