Ajudar a decidir entre interpolação cúbica e quadrática na pesquisa de linha

Estou realizando uma pesquisa de linha como parte de um algoritmo quase-Newton BFGS. Em uma etapa da pesquisa de linha, uso uma interpolação cúbica para me aproximar do minimizador local.

Seja a função de interesse. Eu quero encontrar um tal que . $f : R \rightarrow R, f \in C^1$ $x^*$ $f'(x^*) \approx 0$

Deixe- , , e ser conhecido. Suponha também . Eu ajusto um polinômio cúbico modo que , , e . $f(x_k)$ $f'(x_k)$ $f(x_{k+1})$ $f'(x_{k+1})$ $0\le x_k<x^*<x_{k+1}$ $Q(x)=ax^3+bx^2+cx+d$ $Q(0)=f(x_k)$ $Q'(0)=f'(x_k)$ $Q(x_{k+1}-x_{k})=f(x_{k+1})$ $Q'(x_{k+1}-x_{k})=f'(x_{k+1})$

a equação quadrática: para o meu procurado usando a solução de forma fechada. $(1): Q'(x^*-x_k) = 0$ $x^*$

O exemplo acima funciona bem na maioria dos casos, exceto quando como a solução de formulário fechado para divide por que fica muito próxima ou exatamente a . $f(x)=\mathcal{O}(x^2)$ $(1)$ $a$ $0$

Minha solução é olhar para e se ele é "muito pequeno" simplesmente tomar a solução de forma fechada para o minimizador do polinômio quadrático para o qual eu já tenho os coeficientes do ajuste anterior para . $a$ $Q_2(x)=bx^2+cx+d$ $b,c,d$ $Q(x)$

Minha pergunta é: como elaborar um bom teste para quando fazer a interpolação quadrática sobre o cúbico? A abordagem ingênua para testar é ruim devido a razões numéricas, então estou olhando para , onde é a precisão da máquina, mas eu sou incapaz de decidir um bom que é invariante escala de . $a \equiv 0$ $|a| < \epsilon\tau$ $\epsilon$ $\tau$ $f$

Pergunta do bônus: existem problemas numéricos com o uso dos coeficientes do ajuste cúbico com falha ou devo executar um novo ajuste quadrático com a maneira apropriada de calcular os coeficientes? $b,c,d$

Editar para esclarecimentos: Na minha pergunta, é na verdade o que é comumente conhecido como na literatura. Eu apenas simplifiquei a formulação da pergunta. O problema de otimização que estou resolvendo não é linear em 6 dimensões. E eu estou bem ciente de que as condições de Wolfe são suficientes para a pesquisa de linha BFGS, portanto, afirmando que eu estava interessado em ; Estou procurando por algo que satisfaça as condições fortes de Wolfe e usar o minimizador da aproximação cúbica é um bom passo ao longo do caminho. $f$ $\phi(\alpha)=f(\bar{x}_k+\alpha \bar{p_k})$ $f'(x^*) \approx 0$

A questão não era sobre BFGS, mas como determinar quando o coeficiente cúbico é pequeno o suficiente para que uma aproximação quadrática seja mais apropriada.

Editar 2: Atualizar notação, as equações permanecem inalteradas.

optimization numerical-analysis interpolation Emily L.
fonte

Respostas:

Hmm ... a interpolação cúbica não é inédita na pesquisa de linhas, mas geralmente é um exagero.

Se estou lendo seu problema corretamente, é apenas um escalar? Nesse caso, o BFGS provavelmente não é a maneira mais eficiente de resolver seu problema. Algoritmos de otimização escalar, como o método de Brenth, provavelmente resolverão seu problema mais rapidamente. $x$

Existem vários algoritmos de pesquisa de linha para BFGS. Para meus próprios aplicativos, usando o BFGS com memória limitada (L-BFGS), esta pesquisa de linhas funciona muito bem. Lembre-se de que você só precisa satisfazer as condições de Wolfe e provavelmente não está ganhando muito encontrando o minimizador exato.

De qualquer forma, para realmente responder à sua pergunta: eu consideraria simplesmente mudar para o polinômio quadrático se resolver o cúbico produzir valores "ruins", como NaN ou Inf (como é feito aqui ).

Não sei bem o que você quer dizer com ? Esses coeficientes para o ajuste cúbico não serão os mesmos que para o ajuste quadrático, portanto você não poderá reutilizá-los. $b,c,d$

Por fim, convém usar , em vez de , pois sua função (provavelmente) será apenas aproximadamente cúbica ou quadrática localmente, e e devem ser mais próximos um do outro (e a solução) do que . $f(x_{k-1})$ $f(x_0)$ $x_k$ $x_{k-1}$ $x_0$

Espero que isto ajude.

LKlevin
fonte

Editado para maior clareza. Ao "usar ", quero dizer que fiz um ajuste cúbico em e descobri que portanto, tenho que já é um polinômio quadrático. E a pergunta era se os coeficientes obtidos para esse ajuste são sensatos para usar na interpolação ou se devo recalcular novos coeficientes para um ajuste quadrático típico.

b, c, d

$b,c,d$

Q (x) = a x^{3} + b x^{2} + c x + d

$Q(x)=ax^3+bx^2+cx+d$

a \equiv 0

$a\equiv 0$

Q (x) = b x^{2} + c x + d

$Q(x)=bx^2+cx+d$

b, c, d

$b,c,d$

Emily L.

Ahh, certo, é claro. Não vejo nenhum problema em usar os coeficientes do ponto de vista numérico. O único ponto em que acho que isso importa é muito próximo da solução em que você terminaria de qualquer maneira.

LKlevin

Você pode motivar sua resposta com o cálculo do cubo e a verificação de valores "ruins"? Por que é seguro fazer isso quando ou ?

a << b

$a << b$

a \approx 0

$a\approx 0$

Emily L.

Quando , e será de aproximadamente aqueles para o caso quadrática. Como a pesquisa de linha BFGS é bastante robusta, você deve usá-las corretamente, mesmo que não sejam completamente precisas. Contanto que você obedeça às condições de Wolfe, obterá convergência. Quanto aos valores "ruins", desde que o computador possa fazer com precisão os cálculos com a precisão que você precisa, tudo está bem. Quando não puder, você começará a ver inf e NaN.

a \approx 0

$a \approx 0$

b, c

$b,c$

d

$d$

LKlevin

Há um artigo de Moré, implementado pela Nocedal, sobre isso:

Jorge J. Moré e David J. Thuente. 1994. Algoritmos de busca de linha com redução suficiente garantida. ACM Trans. Matemática. Softw. 20, 3 (setembro de 1994), 286-307. DOI http://dx.doi.org/10.1145/192115.192132 ( pré-impressão ).

Juan Pablo Frias
fonte

Bem-vindo ao SciComp.SE! Formatei sua postagem para facilitar a localização do artigo. Se você encontrar um link para a implementação do Nocedal, isso seria útil.

Christian Clason