Resolvendo a equação de Hamilton-Jacobi-Bellman; necessário e suficiente para otimizar?

13

Considere a seguinte equação diferencial

x˙(t)=f(x(t),u(t))
que x é o estado e u a variável de controle. A solução é dado por
x(t)=x0+0tf(x(s),u(s))ds.
onde x0:=x(0) é o estado inicial dado.

Agora considere o seguinte programa

V(x0):=maxu0eρtF(x(t),u(t))dts.t. x˙(t)=f(x(t),u(t))x(0)=x0
ρ>0V()F()
ρV(x)=maxu[F(x,u)+V(x)f(x,u)],t[0,).

Digamos que eu tenha resolvido o HJB para V . O controle ideal é então dado por

u=argmaxu[F(x,u)+V(x)f(x,u)].
obterei trajetórias ideais para o estado e o controle {(x(t),u(t)):t[0,)} .

O artigo da wiki diz

... mas quando resolvida em todo o espaço de estados, a equação HJB é uma condição necessária e suficiente para um ótimo.

Em Bertsekas (2005) Dynamic Programming and Optimal Control , Vol. 1, 3ª ed., Na Proposição 3.2.1, ele afirma que resolver para V é a função de custo-a-go ideal e o u ^ * associado ué ideal. No entanto, ele o declara explicitamente como um teorema da suficiência.

Na verdade, só quero ter certeza de que, se eu resolvi o HJB e recuperei o estado associado e as trajetórias de controle, não preciso me preocupar com condições adicionais de otimização.

Solução

Eu tento

Eu acho que fui capaz de derivar as condições necessárias do princípio máximo pela própria equação de HJB.

Defina o hamiltoniano

H(x,u,V(x)):=F(x,u)+V(x)f(x,u)

então temos

ρV(x)=maxuH(x,u,V(x))

que é

ρV(x)=H(x,u,V(x)).

Defina uma função arbitrária q:[0,)R com q(0)=limtq(t)=0 . Agora corrija

x=x+εq

onde é um parâmetro. Ligue o termo ao hamiltoniano maximizado que fornece εR

ρV(x+εq)=H(x+εq,u,V(x+εq)).

Em , temos a solução ideal. Assim, diferencie-se de para obter uma condição de primeira ordem ε=0ε

ρVq=Hxq+HVVq.

Agora defina a variável adjunta com

λ=V(x).

Diferencie ao longo do tempo

λ˙=Vx˙.

e observe que

HV=f(x,u)=x˙.

Conecte tudo no foco que fornece

ρλ=Hx+λ˙.

É isso mesmo. Portanto, resolver o HJB é realmente necessário e suficiente (omitido aqui) para otimizar. Alguém deve adicioná-lo ao wiki. Pode economizar tempo para as pessoas que pensam em tais problemas (não será muito que eu reconheço).

No entanto, a condição de transversalidade está ausente.

limteρtλ(t)=0

II tentativa

Defina a recompensa funcional

J(u):=0eρtF(x,u)dt

Observe que pela definição de . Adicione o Termo neutro ao resultado do pagamento

0eρtλ[f(x,u)x˙]dt=0
x˙=f(x,u)
J(u)=0eρt[F(x,u)+λf(x,u)]dt0eρtλx˙dt=0eρtH(x,u,λ)0eρtλx˙dt

A integração por partes do termo correto e os rhs produzem

0eρtλx˙dt=[eρtλ(t)x(t)]00eρtx(λ˙ρλ)dt

Substitua esse termo

J(u)=0eρt[H(x,u,λ)+x(λ˙ρλ)]dtlimteρtλ(t)x(t)+λ(0)x(0)

Defina

x=x+εqu=u+εp

que fornece

J(ε)=0eρt[H(x+εq,u+εp,λ)+(x+εq)(λ˙ρλ)]dtlimteρtλ(t)[x(t)+εq(t)]+λ(0)x(0)

FOC para máximoJε=0

Jε=0eρt[Hxq+Hup+q(λ˙ρλ)]dtlimteρtλ(t)q(t)=0

Como e são irrestritos, devemos ter qp

Hu=0Hx=ρλλ˙limteρtλ(t)=0
sem noção
fonte
você já identificou as condições necessárias e suficientes?
Jamzy
Em que contexto econômico isso surge?
Stan Shunpike
Modelo de Ramsey, por exemplo, cer.ethz.ch/resec/people/tsteger/Ramsey_Model.pdf
sem noção
1
Eu acho que esse tópico é mais adequado para math.stackexchange.com, pois não está realmente vinculado ao econ. Um mod pode transferi-lo.
nora
Não tenho certeza do que é perguntado aqui: se por Bertsek resolver o HJB for suficiente , você não precisará "se preocupar com condições adicionais de otimização". O "apenas suficiente" contra "necessário e suficiente" surgiria caso o HJB não fosse resolvido - nesse caso, alguém diria "isso não significa que não há solução". A propósito, suas Tentativas I e II são um conteúdo valioso aqui - a primeira mostrando um link entre o HJB e o Optimal Control, a segunda mostrando como os FOCs do Optimal Control podem ser derivados.
Alecos Papadopoulos

Respostas:

1

(Talvez isso deva ser considerado um comentário.)

Se você resolveu a equação HJB, é suficiente obter a solução ideal. Portanto, você "não precisa se preocupar com outras condições de otimização", as quais, acredito, parecem responder à sua pergunta.

Parece que você está preocupado com o componente "necessário" do teorema. O lado da necessidade da declaração é o seguinte: se houver uma solução ótima, deve existir uma solução para a equação HJB.

Não trabalhei com esse problema em particular, mas a resposta em geral é que não esperamos ter uma função diferenciável V. Portanto, não temos uma solução para a equação, como é afirmado. Em vez disso, precisamos olhar para derivadas generalizadas e converter a equação HJB em uma desigualdade. Nesse caso, você pode obter uma "solução de viscosidade". Se estendermos o uso de derivadas generalizadas, pode ser possível provar que sempre existe uma solução desse tipo. Olhando para as suas provas, elas não ajudarão nas condições de necessidade, pois você está assumindo diferenciabilidade.

Brian Romanchuk
fonte