Não consigo entender a Thompson Sampling e como ela funciona. Eu estava lendo sobre o Multi Arm Bandit e depois de ler o Algoritmo de limite superior de confiança, muitos textos sugeriam que o Thompson Sampling tivesse um desempenho melhor que o UCB. O que é Thompson Sampling, em termos leigos ou...