Skip to content
Snippets Groups Projects
Commit b2edf272 authored by Olivier Cots's avatar Olivier Cots
Browse files

tp3

parent 994ceb92
Branches
No related tags found
No related merge requests found
...@@ -12,7 +12,7 @@ Cours de contrôle optimal de l'ENSEEIHT pour le département Sciences du Numér ...@@ -12,7 +12,7 @@ Cours de contrôle optimal de l'ENSEEIHT pour le département Sciences du Numér
* [TP1 - Intégration numérique](tp/ode.ipynb) * [TP1 - Intégration numérique](tp/ode.ipynb)
* [TP2 - Tir simple](tp/simple-shooting.ipynb) * [TP2 - Tir simple](tp/simple-shooting.ipynb)
* [TP3 - Méthode directe et tir simple structuré](tp/direct-indirect-part1.ipynb) * [TP3 - Méthode directe et tir simple structuré](tp/direct-indirect.ipynb)
**Notes de cours - ressources** **Notes de cours - ressources**
......
%% Cell type:markdown id: tags: %% Cell type:markdown id: tags:
[<img src="https://gitlab.irit.fr/toc/etu-n7/controle-optimal/-/raw/master/ressources/inp-enseeiht.jpg" alt="N7" height="100"/>](https://gitlab.irit.fr/toc/etu-n7/controle-optimal) [<img src="https://gitlab.irit.fr/toc/etu-n7/controle-optimal/-/raw/master/ressources/inp-enseeiht.jpg" alt="N7" height="100"/>](https://gitlab.irit.fr/toc/etu-n7/controle-optimal)
# Méthode directe et tir simple structuré # Méthode directe et tir simple structuré
- Date : 2023 - Date : 2023
- Durée approximative : 1.5 séance - Durée approximative : 1.5 séance
Le but est de résoudre par du tir simple indirect, un problème de contrôle optimal dont le contrôle est discontinu. On se propose de résoudre dans un premier temps, le problème par une méthode directe, afin de déterminer la structure optimale et une bonne approximation de la solution pour faire converger la méthode de tir. Le but est de résoudre par du tir simple indirect, un problème de contrôle optimal dont le contrôle est discontinu. On se propose de résoudre dans un premier temps, le problème par une méthode directe, afin de déterminer la structure optimale et une bonne approximation de la solution pour faire converger la méthode de tir.
%% Cell type:code id: tags: %% Cell type:code id: tags:
``` julia ``` julia
using JuMP, Ipopt # pour la méthode directe using JuMP, Ipopt # pour la méthode directe
using DifferentialEquations, NLsolve, ForwardDiff # pour la méthode indirecte using DifferentialEquations, NLsolve, ForwardDiff # pour la méthode indirecte
using Plots # pour les graphiques using Plots # pour les graphiques
include("utils.jl"); # fonctions utilitaires include("utils.jl"); # fonctions utilitaires
``` ```
%% Cell type:markdown id: tags: %% Cell type:markdown id: tags:
## Introduction ## Introduction
On considère le problème de contrôle optimal suivant : On considère le problème de contrôle optimal suivant :
$$ $$
\left\{ \left\{
\begin{array}{l} \begin{array}{l}
\displaystyle \min_{x, u} \displaystyle \int_0^{t_f} x^2(t) \, \mathrm{d}t \\[1.0em] \displaystyle \min_{x, u} \displaystyle \int_0^{t_f} x^2(t) \, \mathrm{d}t \\[1.0em]
\dot{x}(t) = \displaystyle u(t), \quad |u(t)| \le 1, \quad t \in [0, t_f] \text{ p.p.}, \\[1.0em] \dot{x}(t) = \displaystyle u(t), \quad |u(t)| \le 1, \quad t \in [0, t_f] \text{ p.p.}, \\[1.0em]
x(0) = 1, \quad x(t_f) = 1/2 x(0) = 1, \quad x(t_f) = 1/2
\end{array} \end{array}
\right. \right.
$$ $$
où $t_f$ = 2. où $t_f$ = 2.
✏️ **Exercice 1.** ✏️ **Exercice 1.**
1. Appliquez le PMP. Que pouvez-vous dire du contrôle maximisant ? 1. Appliquez le PMP. Que pouvez-vous dire du contrôle maximisant ?
2. Peut-on appliquer simplement la méthode de tir simple vu au TP précédent ? 2. Peut-on appliquer simplement la méthode de tir simple vu au TP précédent ?
%% Cell type:markdown id: tags: %% Cell type:markdown id: tags:
## Méthode directe ## Méthode directe
Avant de définir la méthode directe, on propose une réécriture du problème. Notez que ce n'est pas une obligation en soi de la méthode mais cela simplifie les choses. Avant de définir la méthode directe, on propose une réécriture du problème. Notez que ce n'est pas une obligation en soi de la méthode mais cela simplifie les choses.
✏️ **Exercice 2.** ✏️ **Exercice 2.**
- Mettez le problème sous forme de Mayer (c.f. cours). Vous nommerez la nouvelle variable d'état associée au coût $c(\cdot)$. - Mettez le problème sous forme de Mayer (c.f. cours). Vous nommerez la nouvelle variable d'état associée au coût $c(\cdot)$.
%% Cell type:markdown id: tags: %% Cell type:markdown id: tags:
**Description de la méthode directe.** **Description de la méthode directe.**
L'idée principale est de transformer le problème de contrôle optimal (de dimension infinie) en un problème d'optimisation de dimension finie. L'idée principale est de transformer le problème de contrôle optimal (de dimension infinie) en un problème d'optimisation de dimension finie.
Pour cela : Pour cela :
1. On définit une grille uniforme en temps $(t_1, \dots, t_{N+1})$ où $t_1 = 0$ et $t_{N+1} = t_f$ avec $\Delta t = (t_f - t_0)/N$ le pas de discrétisation. 1. On définit une grille uniforme en temps $(t_1, \dots, t_{N+1})$ où $t_1 = 0$ et $t_{N+1} = t_f$ avec $\Delta t = (t_f - t_0)/N$ le pas de discrétisation.
2. On discrétise l'état, le contrôle et le coût sur cette grille et on note 2. On discrétise l'état, le contrôle et le coût sur cette grille et on note
$$ $$
X = \{ (x_i, u_i, c_i) ~|~ i \in \{1, \dots, N+1\}\} X = \{ (x_i, u_i, c_i) ~|~ i \in \{1, \dots, N+1\}\}
$$ $$
l'ensemble des variables d'optimisation du problème discrétisé. l'ensemble des variables d'optimisation du problème discrétisé.
Si l'on note $(x^*(\cdot), u^*(\cdot), c^*(\cdot))$ la solution du problème de contrôle optimal et $\{ (x^*_i, u^*_i, c^*_i) ~|~ i \in \{1, \dots, N+1\}\}$ la solution du problème discrétisé, on s'attend à avoir Si l'on note $(x^*(\cdot), u^*(\cdot), c^*(\cdot))$ la solution du problème de contrôle optimal et $\{ (x^*_i, u^*_i, c^*_i) ~|~ i \in \{1, \dots, N+1\}\}$ la solution du problème discrétisé, on s'attend à avoir
$$ $$
x^*_i \approx x^*(t_i), \quad u^*_i \approx u^*(t_i), \quad c^*_i \approx c^*(t_i), \quad \forall i \in \{1, \dots, N+1\}. x^*_i \approx x^*(t_i), \quad u^*_i \approx u^*(t_i), \quad c^*_i \approx c^*(t_i), \quad \forall i \in \{1, \dots, N+1\}.
$$ $$
✏️ ️**Exercice 3.** Définissez pour le problème discrétisé : ✏️ ️**Exercice 3.** Définissez pour le problème discrétisé :
1. l'objectif à minimiser en fonction d'une ou plusieurs composantes de $X$ bien choisies. 1. l'objectif à minimiser en fonction d'une ou plusieurs composantes de $X$ bien choisies.
2. les contraintes d'inégalités associées au contrôle. 2. les contraintes d'inégalités associées au contrôle.
3. les contraintes initiales et finales associées à la variable d'état. 3. les contraintes initiales et finales associées à la variable d'état.
4. les contraintes de dynamique sur l'état et le coût, en utilisant le schéma d'intégration de Crank-Nicolson (ou [règle des Trapèzes](https://fr.wikipedia.org/wiki/M%C3%A9thode_des_trap%C3%A8zes)). 4. les contraintes de dynamique sur l'état et le coût, en utilisant le schéma d'intégration de Crank-Nicolson (ou [règle des Trapèzes](https://fr.wikipedia.org/wiki/M%C3%A9thode_des_trap%C3%A8zes)).
%% Cell type:markdown id: tags: %% Cell type:markdown id: tags:
✏️ ️**Exercice 4.** ✏️ ️**Exercice 4.**
- Modifiez le code suivant afin de résoudre le problème par la méthode directe que vous venez de décrire. - Modifiez le code suivant afin de résoudre le problème par la méthode directe que vous venez de décrire.
**Remarque.** Vous pouvez vous inspirer de cet [exemple](https://ct.gitlabpages.inria.fr/gallery/goddard-j/goddard.html) pour le code. Notez que dans cet exemple, la fonction `@NLexpressions` est utilisée mais n'est pas nécessaire ici donc vous pouvez ou non l'utiliser. **Remarque.** Vous pouvez vous inspirer de cet [exemple](https://ct.gitlabpages.inria.fr/gallery/goddard-j/goddard.html) pour le code. Notez que dans cet exemple, la fonction `@NLexpressions` est utilisée mais n'est pas nécessaire ici donc vous pouvez ou non l'utiliser.
%% Cell type:code id: tags: %% Cell type:code id: tags:
``` julia ``` julia
# Création du modèle JuMP, Utilisation de Ipopt comme solver # Création du modèle JuMP, Utilisation de Ipopt comme solver
sys = Model(optimizer_with_attributes(Ipopt.Optimizer, "print_level" => 5)) sys = Model(optimizer_with_attributes(Ipopt.Optimizer, "print_level" => 5))
set_optimizer_attribute(sys,"tol",1e-8) set_optimizer_attribute(sys,"tol",1e-8)
set_optimizer_attribute(sys,"constr_viol_tol",1e-6) set_optimizer_attribute(sys,"constr_viol_tol",1e-6)
set_optimizer_attribute(sys,"max_iter",1000) set_optimizer_attribute(sys,"max_iter",1000)
####### #######
####### DEBUT A MODIFIER ####### DEBUT A MODIFIER
####### #######
####### Les ... sont a remplacer ! ####### Les ... sont a remplacer !
####### #######
####### Attention, on ecrit le probleme sous la forme d'un probleme de Mayer ####### Attention, on ecrit le probleme sous la forme d'un probleme de Mayer
####### #######
# Paramètres # Paramètres
t0 = 0 # temps initial t0 = 0 # temps initial
tf = 0 # temps final tf = 0 # temps final
c0 = 0 # coût initial c0 = 0 # coût initial
x0 = 0 # état initial x0 = 0 # état initial
xf = 0 # état final xf = 0 # état final
N = 50 # taille de la grille N = 50 # taille de la grille
Δt = (tf-t0)/N # pas de temps Δt = (tf-t0)/N # pas de temps
@variables(sys, begin @variables(sys, begin
... # coût ... # coût
... # état ... # état
... # control ... # control
end) end)
# Objectif # Objectif
@objective(sys, Min, ...) @objective(sys, Min, ...)
# Conditions initiales et finales # Conditions initiales et finales
@constraints(sys, begin @constraints(sys, begin
con_c0, ... # contraint sur le coût initial con_c0, ... # contraint sur le coût initial
con_x0, ... # contraint sur l'état initial con_x0, ... # contraint sur l'état initial
con_xf, ... # contraint sur l'état final con_xf, ... # contraint sur l'état final
end) end)
# Contraintes de dynamique avec le schéma de Crank-Nicolson # Contraintes de dynamique avec le schéma de Crank-Nicolson
@NLconstraints(sys, begin @NLconstraints(sys, begin
con_dc[j=1:N], ... # contraint différentielle sur le coût con_dc[j=1:N], ... # contraint différentielle sur le coût
con_dx[j=1:N], ... # contraint différentielle sur l'état con_dx[j=1:N], ... # contraint différentielle sur l'état
end); end);
####### #######
####### FIN A MODIFIER ####### FIN A MODIFIER
####### #######
``` ```
%% Cell type:code id: tags: %% Cell type:code id: tags:
``` julia ``` julia
# Solve for the control and state # Solve for the control and state
println("Solving...") println("Solving...")
optimize!(sys) optimize!(sys)
println() println()
# Display results # Display results
if termination_status(sys) == MOI.OPTIMAL if termination_status(sys) == MOI.OPTIMAL
println(" Solution is optimal") println(" Solution is optimal")
elseif termination_status(sys) == MOI.LOCALLY_SOLVED elseif termination_status(sys) == MOI.LOCALLY_SOLVED
println(" (Local) solution found") println(" (Local) solution found")
elseif termination_status(sys) == MOI.TIME_LIMIT && has_values(sys) elseif termination_status(sys) == MOI.TIME_LIMIT && has_values(sys)
println(" Solution is suboptimal due to a time limit, but a primal solution is available") println(" Solution is suboptimal due to a time limit, but a primal solution is available")
else else
error(" The model was not solved correctly.") error(" The model was not solved correctly.")
end end
println(" objective value = ", objective_value(sys)) println(" objective value = ", objective_value(sys))
println() println()
# Retrieves values (including duals) # Retrieves values (including duals)
c = value.(c)[:] c = value.(c)[:]
x = value.(x)[:] x = value.(x)[:]
u = value.(u)[:] u = value.(u)[:]
t = (0:N) * value.(Δt) t = (0:N) * value.(Δt)
pc0 = dual(con_c0) pc0 = dual(con_c0)
px0 = dual(con_x0) px0 = dual(con_x0)
pxf = dual(con_xf) pxf = dual(con_xf)
if(pc0*dual(con_dc[1])<0); pc0 = -pc0; end if(pc0*dual(con_dc[1])<0); pc0 = -pc0; end
if(px0*dual(con_dx[1])<0); px0 = -px0; end if(px0*dual(con_dx[1])<0); px0 = -px0; end
if(pxf*dual(con_dx[N])<0); pxf = -pxf; end if(pxf*dual(con_dx[N])<0); pxf = -pxf; end
if (pc0 > 0) # Sign convention according to Pontryagin Maximum Principle if (pc0 > 0) # Sign convention according to Pontryagin Maximum Principle
sign = -1.0 sign = -1.0
else else
sign = 1.0 sign = 1.0
end end
pc = [ dual(con_dc[i]) for i in 1:N ] pc = [ dual(con_dc[i]) for i in 1:N ]
px = [ dual(con_dx[i]) for i in 1:N ] px = [ dual(con_dx[i]) for i in 1:N ]
pc = sign * [pc0; pc[1:N]] pc = sign * [pc0; pc[1:N]]
px = sign * [px0; (px[1:N-1]+px[2:N])/2; pxf]; # We add the multiplier from the limit conditions px = sign * [px0; (px[1:N-1]+px[2:N])/2; pxf]; # We add the multiplier from the limit conditions
``` ```
%% Cell type:code id: tags: %% Cell type:code id: tags:
``` julia ``` julia
x_plot = plot(t, x, xlabel = "t", ylabel = "x", legend = false) x_plot = plot(t, x, xlabel = "t", ylabel = "x", legend = false)
u_plot = plot(t, u, xlabel = "t", ylabel = "u", legend = false, size=(800,400), linetype=:steppre) u_plot = plot(t, u, xlabel = "t", ylabel = "u", legend = false, size=(800,400), linetype=:steppre)
px_plot = plot(t, px, xlabel = "t", ylabel = "p", legend = false) px_plot = plot(t, px, xlabel = "t", ylabel = "p", legend = false)
display(plot(x_plot, px_plot, layout = (1,2), size=(800,400))) display(plot(x_plot, px_plot, layout = (1,2), size=(800,400)))
display(u_plot) display(u_plot)
``` ```
%% Cell type:markdown id: tags: %% Cell type:markdown id: tags:
✏️ ️**Exercice 5.** ✏️ ️**Exercice 5.**
1. Commentez les résultats. 1. Commentez les résultats.
2. Modifiez la tolérance de l'optimiseur ainsi que le nombre de points de discrétisation. Commentaires. 2. Modifiez la tolérance de l'optimiseur ainsi que le nombre de points de discrétisation. Commentaires.
3. Décrivez la structure du contrôle optimal en fonction du temps. 3. Décrivez la structure du contrôle optimal en fonction du temps.
%% Cell type:markdown id: tags:
## Méthode indirecte
D'après la condition de maximisation du hamiltonien et la structure optimale de la solution, nous avons besoin de définir 3 fonctions permettant de calculer les flots des systèmes hamiltoniens associés aux contrôles +1, -1 et au contrôle dit singulier qui apparaît lorsque la fonction de commutation reste nulle sur un intervalle de temps non réduit à 0.
✏️ ️️**Exercice 6.**
1. Donner la fonction de commutation.
2. En dérivant deux fois par rapport au temps la fonction de commutations, trouver une condition vérifiée par l'état et une condition vérifiée par le contrôle le long d'un arc singulier, c-a-d le long d'un arc où la fonction de commutation est constante égale à 0.
3. Remplir le code ci-dessous: il faut fournir les 3 contrôles pour définir les flots, puis écrire la fonction de tir.
**Remarque.** La fonction de tir à 3 variables inconnues. Il faut donc trouver 3 équations. La condition terminale en est une. L'annulation de la fonction de commutation au premier temps de commutation en est une autre. La question 2 aide à trouver la dernière condition.
%% Cell type:code id: tags:
``` julia
# système pseudo-hamiltonien
function hv(x, p, u)
return [u, 2x]
end
# systèmes hamiltoniens
hv_min(x, p) = hv(x, p, NaN)
hv_max(x, p) = hv(x, p, NaN)
hv_sin(x, p) = hv(x, p, NaN)
# flots
fmin = Flow(hv_min)
fmax = Flow(hv_max)
fsin = Flow(hv_sin)
# fonction de tir
function shoot(p0, t1, t2)
# integration
x1, p1 = fmin(t0, x0, p0, t1) # x1, p1 sont des scalaires
x2, p2 = fsin(t1, x1, p1, t2)
x3, p3 = fmax(t2, x2, p2, tf)
# conditions
s = zeros(eltype(p0), 3)
s[1] = NaN
s[2] = NaN
s[3] = NaN
return s
end;
```
%% Cell type:markdown id: tags:
4. Trouver (remplir le code ci-dessous) à partir de la solution de la méthode directe, une bonne initialisation pour la fonction de tir.
%% Cell type:code id: tags:
``` julia
# itéré initiale pour la méthode indirecte de tir
p0 = NaN
t1 = NaN
t2 = NaN
#
y = [ p0 ; t1 ; t2]
println("Itéré initial:\n", y)
```
%% Output
Itéré initial:
[NaN, NaN, NaN]
%% Cell type:code id: tags:
``` julia
# fonction de tir et sa jacobienne
foo(y) = shoot(y...)
jfoo(y) = ForwardDiff.jacobian(foo, y)
# Résolution de shoot(p0, t1, t2) = 0.
nl_sol = nlsolve(foo, jfoo, y; xtol=1e-8, method=:trust_region, show_trace=true);
# Retrieves solution
if converged(nl_sol)
p0 = nl_sol.zero[1]
t1 = nl_sol.zero[2]
t2 = nl_sol.zero[3];
println("\nFinal solution:\n", nl_sol.zero)
else
error("Not converged")
end
```
%% Cell type:code id: tags:
``` julia
# affichage de la solution
ode_sol = fmin((t0, t1), x0, p0)
tt0 = ode_sol.t
xx0 = [ ode_sol[1, j] for j in 1:size(tt0, 1) ]
pp0 = [ ode_sol[2, j] for j in 1:size(tt0, 1) ]
uu0 = -ones(size(tt0, 1))
ode_sol = fsin((t1, t2), xx0[end], pp0[end])
tt1 = ode_sol.t
xx1 = [ ode_sol[1, j] for j in 1:size(tt1, 1) ]
pp1 = [ ode_sol[2, j] for j in 1:size(tt1, 1) ]
uu1 = zeros(size(tt1, 1))
ode_sol = fmax((t2, tf), xx1[end], pp1[end])
tt2 = ode_sol.t
xx2 = [ ode_sol[1, j] for j in 1:size(tt2, 1) ]
pp2 = [ ode_sol[2, j] for j in 1:size(tt2, 1) ]
uu2 = ones(size(tt2, 1))
t_shoot = [ tt0 ; tt1 ; tt2 ]
x_shoot = [ xx0 ; xx1 ; xx2 ]
p_shoot = [ pp0 ; pp1 ; pp2 ]
u_shoot = [ uu0 ; uu1 ; uu2 ]
x_plot = plot(t_shoot, x_shoot, xlabel = "t", ylabel = "x", legend = false, fmt = :png)
u_plot = plot(t_shoot, u_shoot, xlabel = "t", ylabel = "u", legend = false, fmt = :png, size=(800,400), linetype=:steppre)
px_plot = plot(t_shoot, p_shoot, xlabel = "t", ylabel = "px", legend = false, fmt = :png)
display(plot(x_plot, px_plot, layout = (1,2), size=(800,400)))
display(u_plot)
```
%% Cell type:markdown id: tags:
5. Comparer avec l'affichage de la solution de la méthode directe.
......
0% Loading or .
You are about to add 0 people to the discussion. Proceed with caution.
Please register or to comment