唐 雷
(山東科技大學(xué),山東 青島 266590)
本文研究了下面的正倒向隨機(jī)控制系統(tǒng)
設(shè)(Ω,F,P)為一概率空間,其中x0是給定的,yT是Ft可測(cè)的隨機(jī)變量,{Bt}t≥0為 d 維標(biāo)準(zhǔn)布朗運(yùn)動(dòng),信息流 Ft=σ{Bs,0≤s≤t},v(t)∈U?Rk我們定義如下允許控制集Uad:,定義指標(biāo)泛函
并且
若有 ,則稱 u(·)為最優(yōu)控制,(x(·),y(·),z(·),u(·))為控制系統(tǒng)(1)的最優(yōu)解。
當(dāng)控制域U是Rk中的一個(gè)非空凸子集時(shí),我們做如下假設(shè):
i)f,σ,g,l,Φ,h關(guān)于各自的自變量是連續(xù)可微的;
ii)f,σ,g關(guān)于各自自變量的導(dǎo)數(shù)有界;
iii)lx,ly,lv都被界住,Φx被 c(1+x )界住,hy被界住。其中c為正常數(shù)。
吳臻[1]將控制系統(tǒng)(1)推廣,并在控制域?yàn)橥辜那闆r下得到完全耦合的正倒向隨機(jī)控制系統(tǒng)的最大值原理,由此我們可以根據(jù)[1]得到如下結(jié)論:
定理 1 (隨機(jī)最大值原理)若(x(·),y(·),z(·);u(·))是正倒向隨機(jī)控制系統(tǒng)(1)的最優(yōu)解,則有
其中哈密頓函數(shù)H如下:
H(t,x,y,z,v,p,q,k)=〈p,-g(t,x,y,z)〉+〈q,f(t,x,y,v)〉+〈k,σ(t,x,v)〉+l(t,x,y,v),其中(p(·),q(·),k(·))是下面對(duì)偶方程的解:
本文基于王向榮等[2]中控制系統(tǒng)研究了一類線性二次正倒向隨機(jī)控制系統(tǒng)的最優(yōu)控制問題,在下面的一節(jié),根據(jù)肖華、吳臻[3]的思想方法,運(yùn)用定理1得到線性控制系統(tǒng)的控制解的顯示形式。第三節(jié),驗(yàn)證所得到的顯示表達(dá)式為最優(yōu)控制,并證明唯一性。
本節(jié)來研究下面的線性正倒向隨機(jī)控制系統(tǒng):
指標(biāo)泛函如下:
顯然,(4)、(5)分別為(1)、(2)的特殊情形。為了簡化記號(hào),我們將這里的Bt規(guī)定為一維布朗運(yùn)動(dòng),A(w),C(w)為n×n階矩陣,B(w),D(w)為n×k階矩陣,vt,t≥0是一個(gè)取值于U?Rk的允許控制過程,并且Ft可測(cè)、平方可積。R(w),Q(w),L(w)是n×n階非負(fù)定對(duì)稱矩陣,N(w)是一個(gè)k×k階正定對(duì)稱矩陣,并存在逆為N-1。由定理1可得相應(yīng)于線性正倒向隨機(jī)控制系統(tǒng)(4)的對(duì)偶方程為:
當(dāng)(x(·),y(·),z(·),u(·))為最優(yōu)解時(shí),由吳臻[2]可知對(duì)偶方程(6)存在唯一解(p(·),q(·),k(·)),與之相應(yīng)的哈密頓函數(shù) H 為:
H(t,x,y,z,v,p,q,k)=
進(jìn)而有 Hv(t,x,y,z,u,p,q,k)=BT(w)q(t)+DT(w)k(t)+2N(w)u(t)。
容易驗(yàn)證(4)、(5)滿足假設(shè)條件(i)、(ii)、(iii),由定理 1 可得:
〈Hv(t,x,y,z,v,p,q,k),v-u(t)〉≥0,
即〈BT(w)q(t)+DT(w)k(t)+2N(w)u(t),v-u(t)〉≥0,?v∈Uad,a.e.,a.s.,進(jìn)一步可得到:
定理 2 若(x(·),y(·),z(·),u(·))是系統(tǒng)(4)和(5)的最優(yōu)解,那么系統(tǒng)控制的顯示表達(dá)式為:
本節(jié)我們證明定理2中所得到的控制u(t)為線性二次正倒向隨機(jī)最優(yōu)控制系統(tǒng)(4)和(5)的唯一最優(yōu)控制。
定理3 定理2中的u(t)是正倒向隨機(jī)控制系統(tǒng)(4)和(5)的唯一最優(yōu)控制。
證明:先驗(yàn)證u(·)為最優(yōu)控制。設(shè)控制u(·)相應(yīng)的軌線為(x(t),y(t),z(t)),對(duì)于任意的允許控制 v(·)∈Uad,其軌線為(xv(·),yv(·),zv(·)),則
因?yàn)?p(0)=-2M(w)y(0),q(T)=2Q(w)x(T),所以
對(duì)〈q(t),xv(t)-x(t)〉和〈p(t),yv(t)-y(t)〉分別運(yùn)用 公式并積分取期望得:
因?yàn)?R(w),L(w),Q(w),M(w)都為非負(fù)定對(duì)稱矩陣,將上面(8)、(9)兩式帶入 J(v(·))-J(u(·))中得到 J(v(·))-J(u(·))≥0。 所以得到 u(t)=-12N-1(w)(BT(w)q(t)+DT(w)k(t))是線性二次正倒向隨機(jī)最優(yōu)控制問題(5)的最優(yōu)控制。
下面我們?cè)僮C明最優(yōu)控制的唯一性,仍沿用經(jīng)典的平行四邊形法則方法[4-5]。
設(shè) u1(·),u2(·)都是最優(yōu)控制,且 u1(·)≠u2(·),與之相應(yīng)的軌線分別為(x1(t),y1(t),z1(t)),(x2(t),y2(t),z2(t))。由最優(yōu)控制定義,我們可得
從而可得u1(t)=u2(t),a.e.,a.s.,唯一性得證。
[1]Wu Zhen.Maximum Principle for Optimal Control Problem of Fully Coupled Forward-Backward Stochastic Systems[J].System Science and Mathematical Science,1998,11(3).
[2]Wang,X.R,Gao,Z.Y,Wu,Z.:Forward-Backward Stochastic Differential Equation and the Liner Quadratic Stochastic Optimal Control[J].ACTA AUTOMATICA SINICA,2003,29(1):32-37.
[3]肖華,吳臻.一類線性二次正倒向隨機(jī)最優(yōu)控制系統(tǒng)的最優(yōu)控制問題[C]//程代展,王行愚.第二十三屆中國控制會(huì)議論文集.上海:華東理工大學(xué)出版社,2004:99-103.
[4]Pontryagin L S.Boltyanskii B T.Gamkrelidze R V,Mishchenko E F.The Mathematical Theory of Optimal Processes[M].New York:Interscience,1962.
[5]Bensoussan A.Lectures in stochastic control.In:Proceedings Cortona,Lecture Notes in Mathematics[M].New York:Springer,1981,972(1):1-62.