Ultimamente, tenho lido muitos artigos sobre o ADMM e também tentei resolver vários problemas usando-o, nos quais foi muito eficaz. Ao contrário de outros métodos de otimização, não consigo ter uma boa intuição de como e por que esse método é tão eficaz (é claro, já vi análises de convergência em alguns casos, mas nada que me desse muita informação). Existe alguma intuição por trás do ADMM? Como os primeiros cientistas a usá-lo tiveram essa ideia? Alguma intuição geométrica seria melhor, mas qualquer insight que alguém tenha ajudará.
optimization
admm
olamundo
fonte
fonte
Respostas:
Eu encontrar o seguinte caso especial de , e ilustrativos. Nesse caso, a restrição diz , ou seja, podemos substituir para obter o problema Agora, resolver isso pode ser difícil, enquanto a solução de problemas da forma pode ser fácil. (Você mesmo pode criar exemplos disso, um popular é e ). No ADMM, você começa a partir da "forma " e cria o Lagragian aumentado "A=I B=−I c=0 x−y=0
Analisando estes problemas de minimização para e mais perto, você observar que para cada atualização só precisa resolver um problema da "forma mais simples", por exemplo, para o atualização (negligenciando termos que não dependem de ).x y x
O ADMM para o problema é derivado de maneira semelhante, mas os problemas intermediários das atualizações ainda são um um pouco difícil, mas pode ser comparativamente simples em comparação com o original. Especialmente no caso de e (ou equivalente , e a restrição ) as atualizações são mais ou menos simples de implementar.
fonte