徐世昊,崔乃剛,韋常柱
(哈爾濱工業(yè)大學航天學院,哈爾濱 150001)
面對21世紀復雜多變、對抗激烈的戰(zhàn)場環(huán)境,世界各軍事大國均積極發(fā)展以人工智能技術為核心的新一代智能導彈武器系統(tǒng)[1]。而智能導彈武器系統(tǒng)的發(fā)展,離不開智能控制技術在導彈上的應用。
智能控制技術于1971年首次被提出之后,由于其強大的學習能力和對外界環(huán)境的適應能力,迅速成為控制領域的前沿研究方向。目前理論發(fā)展較完善,且取得廣泛應用的智能控制方法主要有模糊控制、神經(jīng)網(wǎng)絡控制、專家控制和自適應控制、自組織控制和迭代學習控制等[2]。國內外許多學者將智能控制技術運用到導彈控制系統(tǒng)設計中,取得了豐富的研究成果。其中,崔乃剛等[3]為解決不確定海況對潛射導彈出水姿態(tài)的影響,設計了潛射導彈模糊PID分段控制器。王強等[4]利用徑向基函數(shù)網(wǎng)絡與K-means最鄰近聚類算法對導彈逆動力學系統(tǒng)進行動態(tài)模型辨識,實現(xiàn)了三通道解耦控制。Rong等[5]為傾斜轉彎導彈設計了自學習模糊控制器,通過擴展序貫自適應模糊推理系統(tǒng)與傳統(tǒng)Back-Stepping控制方法的結合,提高了控制系統(tǒng)應對氣動偏差和外界干擾的能力。Ran等[6]在導彈制導控制一體化系統(tǒng)中加入自適應模糊系統(tǒng)以逼近系統(tǒng)不確定性,并推導了保證系統(tǒng)穩(wěn)定性的模糊系統(tǒng)參數(shù)自適應調節(jié)律。Lee等[7]基于狀態(tài)依賴Riccati方程與模塊化神經(jīng)網(wǎng)絡設計了導彈助推段的自動駕駛儀。王楓等[8]采用擬人控制方法,基于廣義歸約的方法將導彈姿態(tài)控制問題分解成若干本原問題,之后根據(jù)各本原問題的主次關系及耦合關系設計非線性控制律,最后利用遺傳算法優(yōu)化控制器中相應權值。其他學者的研究也主要集中在將智能控制與傳統(tǒng)控制方法相結合,以提高導彈控制系統(tǒng)面對諸如舵控效率不足[9]、多執(zhí)行機構復合控制[10]、氣動偏差[11]、模型不確定性[12]等情況下的控制能力,而此類方法的性能往往受限于傳統(tǒng)控制方法,且沒有利用大量數(shù)據(jù)對神經(jīng)網(wǎng)絡進行離線訓練,以充分發(fā)揮神經(jīng)網(wǎng)絡的強大學習能力。
本文利用神經(jīng)網(wǎng)絡強大的逼近能力和學習能力,俯仰/偏航通道采用飛行數(shù)據(jù)離線訓練神經(jīng)網(wǎng)絡的方式,訓練完成的神經(jīng)網(wǎng)絡可以直接用作控制器;滾轉通道采用神經(jīng)網(wǎng)絡在線調整權值的方式以對系統(tǒng)誤差實時逼近;并將兩種控制器同時應用于某型傾斜轉彎導彈非線性六自由度仿真中,驗證了所設計控制器的有效性。
神經(jīng)網(wǎng)絡的離線訓練需要大量樣本的支撐,而樣本的獲取又依賴于傳統(tǒng)控制器產生的大量仿真數(shù)據(jù)。本文設計符合性能要求的PID控制器,然后通過仿真獲得足夠的神經(jīng)網(wǎng)絡訓練樣本。
將導彈運動方程組進行小擾動線性化處理,忽略由于重力影響等所產生的動力系數(shù),可得三通道擾動運動方程組如下:
(1)
(2)
(3)
式中如a22、a24等所示動力系數(shù)可參考文獻[13]求得。
將式(1)~式(3)進行Laplace變換,可得到三通道傳遞函數(shù),如下所示:
(1)俯仰通道
(4)
(2)偏航通道
(5)
(3)滾轉通道
(6)
式中,ny、nz為導彈過載,δx、δy、δz為舵偏角。
設定控制系統(tǒng)幅值裕度為6dB,相位裕度為45°,可通過頻域分析法設計PID控制參數(shù)。
通過在表1所示范圍內隨機改變導彈運動初始狀態(tài)[x0,y0,z0],目標運動初始狀態(tài)[xt0,yt0,zt0]與目標側向機動過載nzt進行10組六自由度仿真,在每組仿真中取1000個彈道特征點處數(shù)據(jù),從而獲取本文神經(jīng)網(wǎng)絡訓練所需樣本。
表1 仿真參數(shù)變化范圍
RBF網(wǎng)絡于1988年提出后,因其結構簡單、收斂速度快和能夠逼近任意非線性函數(shù)的特性,逐漸地在函數(shù)逼近[14]、模型預測[15]、系統(tǒng)辨識[16]和故障分類[17]等領域得到廣泛應用。常見的正則化RBF網(wǎng)絡具有如下特征[18]:
1)正則化RBF網(wǎng)絡的隱含層只要有足夠多的隱含節(jié)點,則網(wǎng)絡對任意非線性多元連續(xù)函數(shù)具有良好的逼近能力,這意味著正則RBF網(wǎng)絡可以作為非線性函數(shù)的通用逼近器使用;
2)給定一個未知的非線性函數(shù)f(·),總可以選擇一組網(wǎng)絡權值系數(shù),使得網(wǎng)絡對于f(·)的逼近是最優(yōu)的。
RBF網(wǎng)絡采用前饋形式,一般包括輸入層、隱含層和輸出層,其典型結構如圖 1所示。
圖1 RBF網(wǎng)絡結構圖Fig.1 The structure of RBF network
針對圖1所示具有n-h-m結構的RBF網(wǎng)絡,其輸入可表示為x=(x1,x2,…,xn)T,網(wǎng)絡中第i個隱含層節(jié)點的數(shù)據(jù)中心值設為ci,徑向基函數(shù)的寬度設為bi,網(wǎng)絡的映射關系可分為2層[19]:
1)從輸入層到隱含層的非線性映射,選擇Gaussian基函數(shù),則第i個隱含層單元的輸出為:
(7)
2)從隱含層到輸出層的線性映射,則輸出層第j個神經(jīng)元的輸出為:
(8)
本文所設計的過載駕駛儀中,輸入偏差信號、導彈飛行狀態(tài)與輸出控制指令信號之間的關系可表示為函數(shù)映射,通過導彈飛行過程中產生的偏差與飛行狀態(tài)數(shù)據(jù)對RBF網(wǎng)絡進行離線訓練以逼近函數(shù)映射,離線訓練完成的RBF網(wǎng)絡可以直接作為控制器使用。
對于俯仰通道而言,神經(jīng)網(wǎng)絡的輸入為nyc-ny,輸出為舵偏角指令δz;對于偏航通道而言,神經(jīng)網(wǎng)絡的輸入為nzc-nz,輸出為舵偏角指令δy。兩個通道的網(wǎng)絡輸入層節(jié)點數(shù)n=1,輸出層節(jié)點數(shù)m=1,而隱含層節(jié)點數(shù)h需根據(jù)網(wǎng)絡訓練算法確定。
采用Chen等提出的正交最小二乘算法(Orthogonal least squares learning algorithm, OLS)[20]進行RBF網(wǎng)絡的離線訓練,具體步驟如下:
3)在已知訓練樣本輸入數(shù)據(jù)x、輸出數(shù)據(jù)y與RBF網(wǎng)絡數(shù)據(jù)中心xk后,隱含層與輸出層之間的權值與偏移量可以通過廣義逆方法求解隱含層輸出與樣本輸出數(shù)據(jù)之間的線性方程組的方式得出。
4)計算此時RBF網(wǎng)絡輸出相對于樣本輸出的均方誤差(Mean Square Error, MSE),如果MSE小于目標值,則終止算法,否則進行步驟5。
5)對矩陣H進行Gram-Schmidt正交化,使得矩陣H的第k列正交于第k-1列。
6)重復步驟2~步驟5,直至MSE小于目標值或算法達到最大循環(huán)步驟。
采用本文所設計符合性能要求的PID控制器,通過改變導彈運動的初始條件[x0,y0,z0],目標初始位置[xt0,yt0,zt0]與目標側向機動過載nzt進行10組六自由度仿真,以獲得RBF網(wǎng)絡訓練所需樣本數(shù)據(jù),通過每組仿真獲得1000組數(shù)據(jù),在獲得的10000組數(shù)據(jù)中選取9000組作為訓練數(shù)據(jù),剩余1000組作為測試數(shù)據(jù)。設定徑向基函數(shù)寬度bi=0.8,網(wǎng)絡輸出誤差目標為lg(MSE)<-15,RBF網(wǎng)絡設計結果如圖2~圖3所示。
圖2 俯仰通道網(wǎng)絡MSE變化曲線Fig.2 The MSE in recursions of pitch channel RBF network
圖3 偏航通道網(wǎng)絡MSE變化曲線Fig.3 The MSE in recursions of yaw channel RBF network
由圖1與圖2可知,隨著隱含層神經(jīng)元個數(shù)的增加,RBF網(wǎng)絡的擬合誤差在逐漸減小,對于俯仰通道而言,隱含層節(jié)點增加至507個時,lg(MSE)<-15;對于偏航通道而言,隱含層節(jié)點增加至204個時,lg(MSE)<-15。所設計的RBF網(wǎng)絡均滿足精度要求。
利用1000組測試數(shù)據(jù)對訓練所得的RBF網(wǎng)絡進行性能驗證,結果如圖4~圖5所示。
圖4 俯仰通道RBF網(wǎng)絡擬合誤差曲線Fig.4 The RBF network fitting error of pitch channel
圖5 偏航通道RBF網(wǎng)絡擬合誤差曲線Fig.5 The RBF network fitting error of yaw channel
由以上仿真結果可知,俯仰通道擬合誤差最大值在10-5量級,擬合誤差平均值在10-8量級。偏航通道擬合誤差最大值在10-8量級,擬合誤差平均值在10-10量級,見表2。以上結果說明訓練所得RBF網(wǎng)絡能夠很好擬合俯仰通道與偏航通道的控制器。
表2 擬合誤差統(tǒng)計
滾轉通道采用姿態(tài)自動駕駛儀的形式,將式(3)轉化為狀態(tài)空間表達式,有:
(9)
式中:
Δd為系統(tǒng)非建模動態(tài)或擾動量,設其上界為D。
取x1=γ,x2=ωx,將式(9)寫為如下形式:
(10)
(11)
設計控制律為:
(12)
式中,sign為符號函數(shù)。將控制律帶入式(11)中,可得:
(13)
取η≥D,則有:
(14)
上述控制律依賴于f(x)的精確性,若由于外部干擾以及系統(tǒng)未建模動態(tài)的影響使得f(·)為某一不確定非線性函數(shù),則可以采用RBF網(wǎng)絡逼近f(·)來設計控制器。此時RBF網(wǎng)絡的輸入為γc-γ,輸出為f(·)當前取值,網(wǎng)絡輸入層節(jié)點數(shù)n=1,輸出層節(jié)點數(shù)m=1,隱含層節(jié)點根據(jù)仿真尋優(yōu)選擇為h=21。
由式(7)可知,RBF網(wǎng)絡輸入輸出算法為:
(15)
(16)
代入式(12)中,可得控制律:
(17)
將控制律式(17)代入式(11)中,得:
(18)
式中:
設計Lyapunov函數(shù)為:
(19)
對式(19)求導,結合式(17)與式(18)可得:
(20)
則有:
(21)
在實際仿真過程中,為克服滑模抖振問題,可采用準滑動模態(tài)控制方法[21]。即利用連續(xù)的Sigmoid函數(shù)θ(s)代替符號函數(shù)sign(s),θ(s)的表達式為:
(22)
取30s特征點處滾轉通道動力系數(shù),滑模面參數(shù)設為c=50,變結構控制項參數(shù)η=10,Sigmoid函數(shù)中δ=0.05。RBF網(wǎng)絡中心向量設置為:ci=0.01×[-1,-0.9,…,0.9,1],徑向基函數(shù)寬度bi=15,網(wǎng)絡初始權值W全部為0;自適應律參數(shù)λ=0.015;仿真過程中滾轉角指令為γd=15sin(t)deg。在仿真開始1.5s后,在f(x)中加入非線性干擾項,使得f(·)=f(x)+0.1sin(x1)cos(x2)。在不加入RBF網(wǎng)絡逼近f(·),即采用式(6)所示的控制律時,仿真結果如圖6~圖7所示。
圖6 滾轉角跟蹤誤差變化曲線Fig.6 The tracking error of roll angle
圖7 滑模面函數(shù)變化曲線Fig.7 The curve of sliding surface function
由圖6~圖7所示仿真結果可知,在加入外部非線性干擾項后,單純采用滑模控制不能消除滾轉角和滾轉角速率跟蹤誤差,且滑模面也未能收斂至0。在加入RBF網(wǎng)絡對非線性干擾項進行逼近,即采用控制律式(11)與權值自適應律式(14)時,仿真結果如圖8~圖10所示。
圖8 滾轉角跟蹤誤差變化曲線Fig.8 The tracking error of roll angle
圖9 RBF網(wǎng)絡逼近誤差曲線Fig.9 The approximation error of RBF network
圖10 滑模面函數(shù)變化曲線Fig.10 The curve of sliding surface function
由圖8~圖10所示的仿真結果可知,在加入RBF網(wǎng)絡的逼近作用后,滾轉角跟蹤誤差在1s內收斂至0,滾轉角速率跟蹤誤差在4s內收斂至0;同時滑模面也于2s內收斂至0附近鄰域;在加入非線性干擾項后,RBF網(wǎng)絡能夠在2s內通過調節(jié)權值逼近f(·)。
本節(jié)將所設計的兩種智能控制器加入某型傾斜轉彎導彈非線性六自由度仿真中,通過對比彈體實際的過載值與過載指令來評估過載自動駕駛儀的控制性能,同時分析滾轉角的大小。
導彈初始條件設為:
[v0,θ0,ψv0]=[350m/s,0°,0°]
[x0,y0,z0] =[0,8000,-500]m
[ωx0,ωy0,ωz0]=[0,0,0]rad/s
[?0,ψ0,γ0]=[0°,0°,1°]
目標坐標為[xt0,yt0,zt0]=[15000,0,0]m,速度為[vtx0,vty0,vtz0]=[10,0,0]m/s;并進行側向機動,機動過載為0.03g,加入所設計的兩種智能控制器,仿真結果如圖11~圖15所示。
圖11 三維彈道曲線Fig.11 The trajectory curve of missile
圖12 縱向過載跟蹤曲線Fig.12 The tracking curve of vertical overload
圖13 側向過載跟蹤曲線Fig.13 The tracking curve of lateral overload
圖14 滾轉角變化曲線Fig.14 The curve of roll angle
圖15 RBF網(wǎng)絡逼近誤差曲線Fig.15 The approximation error of RBF network
由仿真結果可知,導彈于72.6s成功命中地面機動目標,脫靶量為0.41m,RBF網(wǎng)絡逼近誤差在仿真開始3s內由于權值調整而出現(xiàn)較大幅度的振蕩現(xiàn)象,之后逐漸收斂至0,滾轉角也隨之收斂到0??v向過載和側向過載在3s內均能實現(xiàn)對指令過載信號的穩(wěn)定跟蹤。
1) 對于俯仰和偏航通道使用飛行過程中數(shù)據(jù)對RBF網(wǎng)絡進行離線訓練,以直接得到神經(jīng)網(wǎng)絡控制器,仿真結果表明,隨著RBF網(wǎng)絡隱含層神經(jīng)元的增加,網(wǎng)絡對于俯仰通道控制器的平均逼近誤差減小至3.4375×10-8,對于偏航通道控制器的平均逼近誤差減小至3.2068×10-10。
2) 對于滾轉通道利用滑模控制理論,采用RBF網(wǎng)絡逼近系統(tǒng)中非線性不確定項,結合Lyapunov穩(wěn)定性理論推導了RBF網(wǎng)絡權值自適應調節(jié)律,并證明了所設計控制系統(tǒng)的穩(wěn)定性。通過滾轉通道對指令信號的跟蹤仿真說明了所設計控制系統(tǒng)在外界存在非線性干擾的情況下,RBF網(wǎng)絡可通過調節(jié)權值在2s內逼近干擾項,以提高傳統(tǒng)滑??刂破鞯男阅?。
3) 通過六自由度仿真驗證了所設計的智能控制系統(tǒng)能夠控制導彈成功命中地面機動目標。