Eu sou bastante novo em aprendizado de máquina e estatística, mas estava me perguntando por que a otimização bayesiana não é referida com mais frequência on-line quando se aprende que o aprendizado de máquina otimiza seus hiperparâmetros de algoritmo? Por exemplo, usando uma estrutura como esta: https://github.com/fmfn/BayesianOptimization
A otimização bayesiana de seus hiperparâmetros tem alguma limitação ou grande desvantagem em relação a técnicas como pesquisa em grade ou pesquisa aleatória?
Respostas:
Dito de outra maneira, BO é uma tentativa de manter o número de avaliações de funções em um nível mínimo e obter o máximo "retorno do investimento" de cada avaliação. Isso é importante se você estiver realizando testes destrutivos ou apenas fazendo uma simulação que leva uma quantidade obscena de tempo para ser executada. Mas em todos os casos, exceto nos mais caros, aplique a pesquisa aleatória pura e encerre o dia ! (Ou LIPO, se o seu problema for passível de suposições.) Isso pode poupar várias dores de cabeça, como otimizar seu programa de otimização bayesiano.
fonte