国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

帶有終端約束的線性二次最優(yōu)控制問題①

2022-06-14 00:52常紹敏丁翊珊邱潔王燕青
關(guān)鍵詞:最優(yōu)控制計(jì)算方法約束

常紹敏, 丁翊珊, 邱潔, 王燕青

西南大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院, 重慶 400715

經(jīng)過半個(gè)多世紀(jì)的發(fā)展, 線性二次最優(yōu)控制問題(LQ問題)被廣泛研究[1-2]. 但是, 已有的結(jié)果大多是系統(tǒng)的狀態(tài)和控制都不帶有任何約束, 同時(shí)現(xiàn)有的算法的收斂速度也鮮有涉及. 近期, 文獻(xiàn)[3]考慮了帶終端約束的隨機(jī)系統(tǒng)的LQ問題, 研究了該問題的可解性問題. 本文是在文獻(xiàn)[3-4]的基礎(chǔ)上研究一類帶有終端約束的確定系統(tǒng)的LQ問題, 并給出了數(shù)值計(jì)算方法, 最后通過具體例子驗(yàn)證了數(shù)值方法的有效性.

1 預(yù)備知識(shí)

本文考慮以下狀態(tài)方程:

(1)

性能指標(biāo)為

其中:T>0,A∈Rn×n,B∈Rn×m,Q∈Rn×n,R∈Rm×m.

經(jīng)典的LQ問題為: 對(duì)于受控系統(tǒng)(1), 在平方可積的控制函數(shù)空間中, 尋找最優(yōu)控制, 極小化二次性能指標(biāo)J(·). 但在實(shí)際問題中, 控制函數(shù)通常帶有一定的約束. 本文中考慮使得系統(tǒng)狀態(tài)達(dá)到特定目標(biāo)的控制集, 即狀態(tài)帶有終端約束的LQ問題. 對(duì)于狀態(tài)的預(yù)期目標(biāo)xT∈Rn, 定義控制函數(shù)類

U∶= {u(·)∈L2(0,T; Rm)|x(T;x0,u(·))=xT}

帶終端約束的LQ問題(簡記為CLQ問題)描述如下:

對(duì)于給定的x0,xT∈Rn, 尋找控制u*(·)∈U, 使得

(2)

如果滿足(2)式的u*(·)存在, 則其被稱為CLQ問題的最優(yōu)控制, 相應(yīng)的狀態(tài)x*(·)∶=x(·;x0,u*(·))被稱為最優(yōu)狀態(tài), (x*(·),u*(·))被稱為最優(yōu)對(duì). 上述問題稱為帶有終端約束的線性二次最優(yōu)控制問題(簡稱為CLQ問題).

為了保證控制集U的非空性和CLQ問題的可解性, 我們?cè)诒竟ぷ髦凶魅缦录僭O(shè):

(A) 系統(tǒng)(1)在區(qū)間[0,T]上精確能控, 即Rank(B,AB, …,An-1B)=n;Q為半正定矩陣,R為正定矩陣.

引理1系統(tǒng)(1)在[0,T]上精確能控的充要條件為系統(tǒng)(1)的Gram矩陣Ψ(0,T)可逆, 其中

Φ(·)滿足

2 主要定理

采用拉格朗日乘子法, 我們首先將CLQ問題轉(zhuǎn)化為無約束的LQ問題. 引入拉格朗日泛函:

Jλ(u(·))=J(u(·))+2〈λ,x(T)〉

其中x(T): =x(T;x0,u(·))為系統(tǒng)(1)的狀態(tài)在t=T處的值. 對(duì)于給定的λ, 無約束的LQ問題即(LQ)λ問題為:

利用引理2, 求解CLQ問題的最優(yōu)控制, 就可以轉(zhuǎn)化為求解如下兩個(gè)子問題:

(1) (LQ)λ問題的最優(yōu)控制問題;

對(duì)于(LQ)λ問題的可解性, 有如下定理.

(4)

證(LQ)λ問題唯一可解性可以用文獻(xiàn)[1]第七章定理2.1的方法得到. 現(xiàn)在證明定理的剩余部分.

我們記

由ε的任意性, 可得

(5)

另一方面, 由方程組(4)容易得到

兩邊積分, 從而

(6)

由(5)式和(6)式可得

又由u(·)的任意性, 得到

定理1給出了最優(yōu)控制的開環(huán)表示, 而在應(yīng)用中, 人們更希望給出閉環(huán)表示, 即狀態(tài)反饋形式. 接下來, 我們就研究CLQ問題的閉環(huán)表示. 我們引入Riccati方程:

(7)

和兩個(gè)常微分方程(簡稱ODE):

(8)

(9)

關(guān)于方程(7),(8),(9)的適定性, 讀者可以參考文獻(xiàn)[1,5].

其中φ(·),yλ(·)分別是方程(8),(9)的解.

證設(shè)x(·)是如下ODE的解

(10)

(11)

利用方程(7)-(9), 我們可以得到

下面引入輔助系統(tǒng)

(12)

引理4系統(tǒng)(12)在[0,T]上精確能控的充要條件是系統(tǒng)(1)在[0,T]上精確能控.

通過引入

引理5P(T)是正定矩陣.

進(jìn)一步對(duì)兩邊在[0,T]上積分, 有

從而

現(xiàn)在我們可以綜合前面的結(jié)果, 得到CLQ問題的可解性.

3 最優(yōu)控制的計(jì)算方法

根據(jù)定理3, 可以得到CLQ問題的基于狀態(tài)反饋的最優(yōu)對(duì)的計(jì)算方法. 具體計(jì)算步驟如下:

1) 選取最優(yōu)參數(shù)λ*.

①解得Riccati方程(7)和ODE(8)的解P(·),φ(·).

②求解最優(yōu)參數(shù)λ*=P-1(T)(φ(T)-xT).

2) 解得最優(yōu)參數(shù)λ*所對(duì)應(yīng)ODE(9)的解yλ*(·).

現(xiàn)在, 我們通過一個(gè)具體的例子, 利用上述計(jì)算方法, 得到CLQ問題的最優(yōu)對(duì).

解: 將條件數(shù)據(jù)代入Riccati方程(7)得其精確解為

由ODE(8)解得

φ(t)=0

進(jìn)而可以計(jì)算最優(yōu)參數(shù):

再由ODE(9)解得

最后可以計(jì)算最優(yōu)對(duì)為

由例1可知, 即便對(duì)于1維系統(tǒng), 要求解CLQ問題仍然十分復(fù)雜, 這就促使我們研究上述計(jì)算方法的數(shù)值算法. 接下來我們上述的計(jì)算方法給出數(shù)值計(jì)算的版本, 首先將時(shí)間區(qū)間[0,T]均分為N份, 即有

0=t0

CLQ問題數(shù)值算法:

Λ=diag{μ1,μ2, …,μm0, 0, …, 0},μi>0,i=1,2,…,m0

定義

2) 選取最優(yōu)參數(shù)λ*的近似值λ.

①求解Riccati方程(7)如下:

采用Euler方法求解ODE(8), 得到其數(shù)值解φi,i=0,1,…,N.

②求解近似最優(yōu)參數(shù)λ

3) 利用Euler方法求解近似最優(yōu)參數(shù)λ所對(duì)應(yīng)ODE(9), 得到其數(shù)值解yi,i=0,1,…,N.

4) 求解近似最優(yōu)對(duì)(xi,ui),i=0,1,…,N:

xi=Piyi+φi,ui=R-1BTyi

取N=25, 用數(shù)值算法得到例1的數(shù)值解, 和精確解的比較見圖1.

圖1 精確解與離散方程解的對(duì)比

圖2 Riccati方程與最優(yōu)對(duì)離散化計(jì)算方法的收斂性

4 結(jié)論

本文利用參數(shù)選擇的方法對(duì)帶有終端約束的LQ問題給出了可解性的理論結(jié)果, 同時(shí)基于最優(yōu)控制的閉環(huán)表示給出了計(jì)算最優(yōu)對(duì)的數(shù)值算法. 與基于開環(huán)表示的確定/隨機(jī)系統(tǒng)的LQ問題算法相比, 本文算法的優(yōu)勢(shì)在于: 避免了條件數(shù)學(xué)期望的計(jì)算, 避免使用梯度下降法等算法[6-10], 從而大大減少了計(jì)算量.

猜你喜歡
最優(yōu)控制計(jì)算方法約束
槽道側(cè)推水動(dòng)力計(jì)算方法研究
基于示蹤氣體法的車內(nèi)新風(fēng)量計(jì)算方法研究
極限的計(jì)算方法研究
基于增益調(diào)度與光滑切換的傾轉(zhuǎn)旋翼機(jī)最優(yōu)控制
二階微分方程最優(yōu)反饋控制
基于隨機(jī)最優(yōu)控制的繳費(fèi)確定型養(yǎng)老基金資產(chǎn)配置策略
第二重要極限的幾種計(jì)算方法
馬和騎師
適當(dāng)放手能讓孩子更好地自我約束
一類線性二次正倒向隨機(jī)最優(yōu)控制問題
象山县| 高州市| 宁夏| 涟水县| 新田县| 喀喇沁旗| 东平县| 怀集县| 北川| 日照市| 南乐县| 合川市| 永泰县| 曲麻莱县| 临安市| 饶河县| 莱阳市| 隆安县| 淳化县| 绵阳市| 当阳市| 光泽县| 成安县| 玉环县| 巨鹿县| 彭州市| 和龙市| 开阳县| 莱州市| 同德县| 浠水县| 呼玛县| 察雅县| 昌图县| 施甸县| 乐安县| 合川市| 南康市| 白城市| 海晏县| 巫溪县|