鄧偉偉,段朝陽,閆 亮
(中國空空導(dǎo)彈研究院,洛陽 471009)
隨著武器技術(shù)的進步和裝備的發(fā)展,現(xiàn)代戰(zhàn)爭中以第四代戰(zhàn)斗機及高超聲速巡航導(dǎo)彈為代表的高空、高速、高機動目標(biāo)不斷涌現(xiàn),對導(dǎo)彈的敏捷轉(zhuǎn)彎能力和末端精確打擊能力提出了更高的要求,導(dǎo)彈面臨嚴峻挑戰(zhàn)。為了彌補傳統(tǒng)氣動舵控制的不足,采用直/氣復(fù)合控制來提高導(dǎo)彈的響應(yīng)特性,實現(xiàn)對目標(biāo)的精確打擊。
針對導(dǎo)彈直/氣復(fù)合控制問題,國內(nèi)外學(xué)者已經(jīng)開展了大量研究工作[1-4],導(dǎo)彈直/氣復(fù)合控制系統(tǒng)是一個非線性、時變、多變量復(fù)雜控制系統(tǒng),難以建立精確的數(shù)學(xué)模型,基于經(jīng)典與現(xiàn)代控制理論設(shè)計的導(dǎo)彈直/氣復(fù)合控制系統(tǒng)依賴精確的數(shù)學(xué)模型,缺乏自學(xué)習(xí)和自適應(yīng)能力。近年來,人工智能成為研究熱點,未來是智能化戰(zhàn)爭時代,各國為占領(lǐng)智能化軍事領(lǐng)域制高點,都在加快研究智能武器裝備[5],導(dǎo)彈直/氣復(fù)合控制系統(tǒng)智能控制也得到了相應(yīng)的研究。神經(jīng)網(wǎng)絡(luò)[6]、模糊控制[7-8]和遺傳算法[9]結(jié)合了定性決策和定量控制,將人的經(jīng)驗與思維加入到導(dǎo)彈直/氣復(fù)合控制系統(tǒng)中,設(shè)計過程不依賴精確的數(shù)學(xué)模型,但是各類智能控制存在著不可避免的缺點。模糊控制表達人腦的推理能力,設(shè)計相當(dāng)依賴專家或操作人員的經(jīng)驗與知識,若缺乏這樣的經(jīng)驗,很難獲得滿意的控制效果。神經(jīng)網(wǎng)絡(luò)模擬人腦的組織結(jié)構(gòu),具有自學(xué)習(xí)能力,但實際類似于一個黑箱,缺少透明度,可解釋性較差,不能很好地表達人腦的推理功能。自適應(yīng)神經(jīng)模糊推理系統(tǒng)(Adaptive Neural-based Fuzzy Inference System,ANFIS)將二者有機地結(jié)合起來,通過神經(jīng)網(wǎng)絡(luò)建立具有自學(xué)習(xí)能力的模糊控制系統(tǒng),利用神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)機制補償模糊控制系統(tǒng)原有的缺點,能夠得出比較科學(xué)合理的參數(shù),從而提高整個系統(tǒng)對知識的學(xué)習(xí)和表達能力。
本文以末制導(dǎo)段空空導(dǎo)彈為研究對象,建立俯仰通道數(shù)學(xué)模型,設(shè)計2輸入2輸出的模糊控制器。采用自適應(yīng)神經(jīng)模糊推理系統(tǒng),通過樣本數(shù)據(jù)學(xué)習(xí),優(yōu)化常規(guī)模糊控制。直接力裝置數(shù)學(xué)模型首先采用線性化模型進行設(shè)計,之后通過脈沖調(diào)寬調(diào)頻(Pulse Width Pulse Frequency,PWPF)調(diào)制器對線性化設(shè)計得到的直接力控制量進行調(diào)制,得到離散的開關(guān)指令。仿真結(jié)果表明,基于ANFIS的導(dǎo)彈直/氣復(fù)合控制系統(tǒng)能夠快速精確地跟蹤導(dǎo)彈加速度指令,提高系統(tǒng)的控制品質(zhì)。
空空導(dǎo)彈直/氣復(fù)合控制采用姿控式,直接力裝置位于質(zhì)心后,結(jié)構(gòu)如圖1所示。
導(dǎo)彈俯仰通道上小擾動線性化動力學(xué)方程[10]為
(1)
俯仰通道狀態(tài)空間模型為
(2)
其中
氣動舵數(shù)學(xué)模型描述為如下二階系統(tǒng)
(3)
直接力裝置數(shù)學(xué)模型描述為如下一階系統(tǒng)
(4)
模糊控制是一種簡單地將某一空間的輸入映射到另一空間的輸出的規(guī)則[11]。模糊控制的人機對話能力強,方便將人的思考邏輯加入控制過程。模糊控制分為模糊化、模糊推理和解模糊3個過程,3個過程的完成基于知識庫。
知識庫包含了應(yīng)用知識以及控制目標(biāo),由數(shù)據(jù)庫和規(guī)則庫構(gòu)成。數(shù)據(jù)庫包括隸屬函數(shù)和尺度變化因子等,規(guī)則庫包括模糊語言構(gòu)成的一系列控制規(guī)則。模糊化是將輸入指令的清晰量轉(zhuǎn)化為模糊量,以便于模糊推理。模糊推理是模糊控制的核心,基于模糊概念模擬人的推理能力,一般基于控制工程知識、操作人員實際操作過程等來模仿人的決策行為,通過相應(yīng)的模糊控制規(guī)則,得到控制指令的模糊量。解模糊是將模糊推理得到的控制指令的模糊量轉(zhuǎn)化為實際控制的清晰量。模糊控制器結(jié)構(gòu)如圖2所示。
圖2 模糊控制器結(jié)構(gòu)
自適應(yīng)神經(jīng)模糊推理系統(tǒng)利用神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)能力,通過對樣本數(shù)據(jù)的學(xué)習(xí)實現(xiàn)模糊控制的模糊化、模糊推理和解模糊3個過程,優(yōu)化模糊控制的知識庫,建立具有自學(xué)習(xí)、自適應(yīng)能力的模糊控制系統(tǒng)[12]。以2輸入(x1,x2)和1輸出(y)的系統(tǒng)為例,模糊if-then規(guī)則如下:
規(guī)則1:ifx1isA1andx2isB1thenf1=p1x1+q1x2+r1
規(guī)則2:ifx1isA2andx2isB2thenf2=p2x1+q2x2+r2
自適應(yīng)神經(jīng)模糊推理系統(tǒng)可以認為是T-S型模糊控制的神經(jīng)網(wǎng)絡(luò)實現(xiàn),該網(wǎng)絡(luò)是一個多層前饋網(wǎng)絡(luò),結(jié)構(gòu)如圖3所示。
圖3 自適應(yīng)神經(jīng)模糊推理系統(tǒng)結(jié)構(gòu)
第一層:輸入變量模糊化,該層參數(shù)可變,每個節(jié)點是以節(jié)點函數(shù)表示的方形節(jié)點
O1,i=μAi(x1),i=1,2;O1,i=μB(i-2)(x2),i=3,4
(5)
其中,x1(或x2)為節(jié)點的輸入;O1,i為模糊集Ai(或Bi-2)的隸屬函數(shù),隸屬函數(shù)的參數(shù)集為前提參數(shù)。
第二層:模糊集運算,輸入信號相乘,而將其乘積輸出為
O2,i=ωi=μAi(x1)μBi(x2),i=1,2
(6)
第三層:計算每條規(guī)則ωi與全部規(guī)則ω之和的比值為
(7)
第四層:計算每條規(guī)則輸出為
(8)
其中,{pi,qi,ri},i=1,2為結(jié)論參數(shù)。
第五層:計算所有輸入信號的總輸出為
(9)
自適應(yīng)神經(jīng)模糊推理系統(tǒng)根據(jù)樣本數(shù)據(jù)學(xué)習(xí)調(diào)整前提參數(shù)和結(jié)論參數(shù),對于集上任意函數(shù)有無限的逼近能力,為復(fù)雜系統(tǒng)的控制提供了有效的工具。
PWPF調(diào)制器由一階慣性環(huán)節(jié)、施密特觸發(fā)器以及反饋回路組成,如圖4所示。
圖4 PWPF調(diào)制器
其中,Km為一階慣性環(huán)節(jié)放大系數(shù),Tm為一階慣性環(huán)節(jié)時間常數(shù);Uon和Uoff為施密特觸發(fā)器的開關(guān)閾值,Um為施密特觸發(fā)器的脈沖幅值。脈沖調(diào)制基于沖量等價原理,采用PWPF調(diào)制器可以將連續(xù)推力轉(zhuǎn)化為等效的常值脈沖推力。
結(jié)合純氣動舵控制采用的經(jīng)典Raytheon三回路結(jié)構(gòu)[13],針對導(dǎo)彈直/氣復(fù)合控制數(shù)學(xué)模型,直接力控制回路與氣動舵控制回路并行工作,建立導(dǎo)彈直/氣復(fù)合模糊控制系統(tǒng),如圖5所示。
圖5 導(dǎo)彈直/氣復(fù)合模糊控制系統(tǒng)
加速度誤差信號ea和角速度誤差信號eω為模糊控制器的輸入;氣動舵控制信號δz和直接力控制信號δR為模糊控制器的輸出;彈體加速度ay和俯仰角速度ωz為反饋信號。
自適應(yīng)神經(jīng)模糊推理系統(tǒng)的輸入為加速度誤差與角速度誤差,輸出為直接力控制與氣動舵控制。采用離線學(xué)習(xí)模式,通過線性二次型調(diào)節(jié)器(Linear Quadratic Regulator, LQR)采集樣本數(shù)據(jù),分為訓(xùn)練、測試、檢核3個部分,對于裝入系統(tǒng)的樣本數(shù)據(jù)通過網(wǎng)格分割法,按照設(shè)定參數(shù),依據(jù)模糊C-均值聚類方法建立模糊推理系統(tǒng)。依據(jù)模糊控制的設(shè)計經(jīng)驗,設(shè)置模糊子集個數(shù)為7,選取三角形隸屬函數(shù),輸出為線性函數(shù)。利用混合最小二乘估計的反向傳播算法,確定自適應(yīng)神經(jīng)模糊推理系統(tǒng)的前提參數(shù)和結(jié)論參數(shù),確定與輸入輸出樣本數(shù)據(jù)相匹配的模糊控制知識庫,建立具有自適應(yīng)能力的模糊推理系統(tǒng)。
選取導(dǎo)彈在高度12km,馬赫數(shù)3.0的特征點進行設(shè)計,其狀態(tài)方程矩陣為
執(zhí)行機構(gòu)參數(shù)ωδ=120,ξ=0.7,τ=0.02;穩(wěn)態(tài)傳遞增益Kωss=0.00113;PWPF調(diào)制器參數(shù)選取為Km=5,Tm=0.1。
圖6~圖10所示為加速度10m/s2的仿真結(jié)果??梢钥闯觯R?guī)模糊控制相對于LQR超調(diào)量更小,控制用量更優(yōu),控制品質(zhì)更高。當(dāng)加速度指令變化時,基于經(jīng)驗設(shè)計的常規(guī)模糊控制的知識庫需要更新,經(jīng)驗不足時一般采用試湊法完成知識庫更新,設(shè)計過程復(fù)雜。圖11~圖14所示為加速度100m/s2的仿真結(jié)果??梢钥闯?,自適應(yīng)神經(jīng)模糊推理系統(tǒng)控制品質(zhì)優(yōu)于常規(guī)模糊控制,常規(guī)模糊控制設(shè)計由于經(jīng)驗不足,加速度指令跟蹤存在一定的穩(wěn)態(tài)誤差與振蕩。圖15~圖17所示為直接力裝置采用PWPF調(diào)制器,驗證導(dǎo)彈直/氣復(fù)合控制系統(tǒng)的離散特性。加速度響應(yīng)曲線上升段的波動是由于直接力裝置點火產(chǎn)生的瞬時推力造成的正?,F(xiàn)象。仿真結(jié)果表明,基于ANFIS的導(dǎo)彈直/氣復(fù)合控制系統(tǒng)能夠快速精確地跟蹤導(dǎo)彈加速度指令。
圖6 加速度指令10m/s2時加速度響應(yīng)
圖7 加速度指令10m/s2時俯仰角速度響應(yīng)
圖8 加速度指令10m/s2時氣動舵偏用量
圖9 加速度指令10m/s2時直接力用量
圖10 直接力用量局部放大
圖11 加速度指令100m/s2時加速度響應(yīng)
圖12 加速度指令100m/s2時俯仰角速度響應(yīng)
圖13 加速度指令100m/s2時氣動舵偏用量
圖14 加速度指令100m/s2時直接力用量
圖15 采用PWPF調(diào)制器的加速度響應(yīng)
圖16 采用PWPF調(diào)制器的直接力裝置開關(guān)指令
圖17 直接力裝置開關(guān)指令局部放大
本文針對空空導(dǎo)彈直/氣復(fù)合控制問題,基于ANFIS設(shè)計了導(dǎo)彈直/氣復(fù)合控制系統(tǒng)。常規(guī)模糊控制設(shè)計基于經(jīng)驗,不依賴精確的數(shù)學(xué)模型,但是當(dāng)系統(tǒng)工作狀態(tài)變化時,知識庫相應(yīng)地需要更新,設(shè)計過程復(fù)雜,經(jīng)驗不足時難以保證控制品質(zhì)。本文通過引入神經(jīng)網(wǎng)絡(luò),建立了自適應(yīng)神經(jīng)模糊推理系統(tǒng),通過樣本數(shù)據(jù)學(xué)習(xí)建立了模糊控制知識庫,優(yōu)化了常規(guī)模糊控制。采用PWPF調(diào)制器對線性化設(shè)計得到的直接力控制量進行調(diào)制,得到離散的開關(guān)指令,驗證了導(dǎo)彈直/氣復(fù)合控制系統(tǒng)的離散特性。仿真結(jié)果表明,常規(guī)模糊控制的控制品質(zhì)優(yōu)于LQR,系統(tǒng)狀態(tài)發(fā)生變化時,基于ANFIS的導(dǎo)彈直/氣復(fù)合控制系統(tǒng)可以實現(xiàn)加速度指令的快速精確跟蹤,改善了空空導(dǎo)彈的響應(yīng)特性。