Eu tenho essa confusão sobre a regra Armijo usada na pesquisa de linha. Eu estava lendo a pesquisa de linha de rastreamento anterior, mas não entendi o que é essa regra Armijo. Alguém pode elaborar qual é a regra de Armijo? A Wikipédia não parece explicar bem. obrigado
optimization
user34790
fonte
fonte
Respostas:
Depois de obter uma direção de descida para sua função objetiva f ( x ) , você precisa escolher um comprimento de passo "bom". Você não deseja dar um passo muito grande para que a função no seu novo ponto seja maior que o ponto atual. Ao mesmo tempo, você não quer dar um passo pequeno demais, de modo que leva uma eternidade para convergir.p f( X )
A condição de Armijo basicamente sugere que um "bom" comprimento do passo é tal que você tem "uma diminuição suficiente" em no seu novo ponto. A condição é matematicamente declarada como f ( x k + α p k ) ≤ f ( x k ) + β α ∇ f ( x k ) T p k onde p k é uma direção de descida em x k e β ∈ ( 0 , 1 ) .f
A intuição por trás disso é que o valor da função no novo ponto deve estar abaixo da "linha tangente" reduzida em x k na direção de p k . Veja o livro "Numerical Optimization" de Nocedal & Wright. No capítulo 3, há uma excelente descrição gráfica da condição de diminuição suficiente do armijo.f( xk+ α pk) xk pk
fonte
Cinco anos depois, essa pergunta ainda é válida.
Aqui (páginas 16 e 17), você pode encontrar uma ótima explicação, incluindo um algoritmo.
fonte