No problema dos especialistas, especialistas fornecem previsões binárias diariamente e você precisa prever se choverá amanhã.
Ou seja, no dia , você conhece as previsões passadas dos especialistas, o tempo real para os dias 1 , 2 , … te as previsões para amanhã, e precisa prever se choverá no dia seguinte.
No algoritmo clássico de Maioria Ponderada , o algoritmo comete erros de , onde m é o número de erros do melhor especialista.
Para mim, isso parece uma promessa extremamente fraca, pois não permite nenhum benefício da combinação de previsões de vários especialistas.
Assume-se que cada resultado é , a previsão de especialistas i no dia t é p i , t , e o resultado de dias t é o t . Podemos definir uma maioria ponderada óptimo '' adversário `` como uma função do peso ideal w ∈ ô ( [ n ] ) , de tal modo que a decisão tomada pelo adversário no dia t é definido como s i g n ( w ⋅ p t ), ou seja, a maioria ponderada das previsões, com relação ao vetor . Usando essa notação, o adversário anterior (melhor especialista) só podia escolher vetores unitários.
Como você minimizaria o arrependimento, comparado a ?
Para ver que esse é um adversário muito mais poderoso, considere o caso de especialistas e dias em que o resultado sempre foi . Se , cada especialista cometeu um erro, mas um vetor majoritário ponderado de não possuía.
Respostas:
Se você não se importa com a randomização, os algoritmos padrão de aprendizado on-line na "estrutura de otimização convexa on-line" fornecem essencialmente o que você pede, na expectativa. A razão é que esses algoritmos são necessários para gerar uma distribuição para especialistas a cada passo, sofrendo uma perda esperada igual à expectativa de escolher um especialista nessa distribuição. E eles têm um baixo arrependimento esperado em comparação com a melhor distribuição para especialistas, ou seja, .w∈Δ([n]) O(lnn/T−−−−−√)
Por exemplo, você pode usar o algoritmo clássico de pesos multiplicativos, que é apenas a maioria ponderada, mas escolhe um especialista para seguir com probabilidade proporcional ao seu "peso". Isso é mencionado na pesquisa de Arora (Teorema 6): https://www.cs.princeton.edu/~arora/pubs/MWsurvey.pdf
fonte