A "otimização convexa on-line" de Zinkevich ( http://www.cs.cmu.edu/~maz/publications/ICML03.pdf ) generaliza os algoritmos de aprendizado de "minimização de arrependimento", de configurações lineares a convexas e fornece bom "arrependimento externo" . Existe uma generalização semelhante para arrependimento interno? (Não tenho muita certeza nem do que exatamente isso significaria.)
19
Respostas:
Tente "Aprendizado sem arrependimentos em jogos convexos", de Gordon, Greenwald e Marks http://portal.acm.org/citation.cfm?id=1390202 . Parece abstrato, provavelmente responde à sua pergunta, ou pelo menos qualquer pessoa que responda a essa pergunta citaria ou seria citada por esse artigo.
fonte
Este artigo da Avrim Blum aponta uma conexão entre arrependimento externo e interno. De acordo com seu resumo, arrependimento externo é uma medida de quão ruim um algoritmo é comparado à melhor ação fixa, enquanto arrependimento interno se compara à melhor variação desse método (melhor permutação fixa de saídas, como relatar a classe A sempre que o algoritmo original reportou classe B).
fonte