趙世超,趙東標,支程昊
(南京航空航天大學 機電學院,南京 210016)
機電作動器(以下簡稱EMA)由于其質(zhì)量輕、靈活性高、控制精度高、維護方便且在運行過程中噪聲小等優(yōu)點,近年來在各類航空航天飛行器中得到越來越廣泛的應用[1]。EMA的工作環(huán)境往往比較復雜,給系統(tǒng)的穩(wěn)定運行帶來了很大的挑戰(zhàn),因而對EMA伺服系統(tǒng)高性能控制策略的研究就顯得尤為關鍵[2]。
EMA作為一個非線性、多變量、強耦合的伺服系統(tǒng),采用傳統(tǒng)的控制方法難以滿足其復雜工況下的性能要求。近年來,各種先進的非線性控制方法得到迅速發(fā)展,神經(jīng)網(wǎng)絡控制由于其強非線性擬合能力,已然成為該領域的研究熱點。文獻[3]設計了一種神經(jīng)網(wǎng)絡與滑??刂葡嘟Y合的方法,利用神經(jīng)網(wǎng)絡觀測系統(tǒng)集總不確定性,提高了航空作動器控制器的參數(shù)適應性和抗干擾能力。文獻[4]將BP神經(jīng)網(wǎng)絡與PI控制方法結合,用于電梯用永磁同步電機的調(diào)速控制,改善了電梯的快速性和舒適性。文獻[5]提出一種基于單神經(jīng)元的永磁同步電機解耦控制策略,實現(xiàn)了d-q軸電流解耦,使系統(tǒng)具有快速的響應能力和良好的靜態(tài)性能。
由于對角遞歸神經(jīng)網(wǎng)絡(以下簡稱DRNN)動態(tài)特性可以很好地對非線性時變系統(tǒng)進行控制[6],本文為改善EMA系統(tǒng)控制性能,將DRNN與PI控制相結合,使得DRNN在系統(tǒng)運行過程中可以實時調(diào)整PI的最佳參數(shù);同時,設計了一種自適應學習率方法,使控制器的學習能力和在線修正能力得到了提高。仿真實驗表明,改進后的DRNN-PI控制方法增強了EMA速度環(huán)的響應能力和抗干擾能力,并改善了EMA整體系統(tǒng)的靜、動態(tài)性能。
EMA根據(jù)其作動形式可分為旋轉式和直線式,本文的EMA采用直線式作動形式,其結構簡圖如圖1所示,以永磁同步電機(以下簡稱PMSM)作為驅動電機,通過離合器、滾珠絲杠將旋轉運動轉變?yōu)橥茥U的直線運動,進而帶動舵面、起落架等實現(xiàn)期望運動[7]。
圖1 EMA機械傳動結構
采用彈簧-阻尼-質(zhì)量模型對EMA結構等效簡化,由歐拉定律,建立EMA的數(shù)學模型如下:
(1)
式中:J為負載折算到電機的轉動慣量;θ為電機位置輸出量;Te為電機的電磁轉矩;B為作動器系統(tǒng)折算到電機的粘性阻尼系數(shù);TL為負載轉矩。
本文EMA驅動電機選用表貼式PMSM,假設磁路不飽和,忽略磁滯和渦流損耗,磁場空間呈正弦分布,在d-q軸系有如下數(shù)學表達式:
(2)
式中:id,iq為定子繞組在同步旋轉坐標系下的電流分量;ud,uq為定子繞組在同步旋轉坐標系下的電壓分量;Rs,L=Lq=Ld分別為定子的電阻和電感;ωr為轉子的電角速度;ψr為轉子永磁磁鏈;p為極對數(shù)。
DRNN與BP神經(jīng)網(wǎng)絡相近,由輸入層、隱含層和輸出層組成,不同點在于前者在隱含層增加了自反饋環(huán)[8],其網(wǎng)絡結構如圖2所示。
圖2 DRNN結構
DRNN輸入層單元接收輸入信號,隱含層接收輸入層信號及其自反饋信號,經(jīng)激勵函數(shù)傳遞給輸出層計算完成前向傳播;然后根據(jù)輸出層輸出結果與期望值誤差進行反向傳播,動態(tài)調(diào)整網(wǎng)絡連接權值,從而使得輸出層結果不斷趨近于期望值。
增量式PI控制算法輸出表達式:
u(k)=u(k-1)+Kp[e(k)-e(k-1)]+Kie(k)
(3)
式中:e(k)和e(k-1)分別為控制器最近2次所采集的系統(tǒng)誤差;u(k)為控制器k時刻輸出;Kp和Ki為控制器增益參數(shù)。
(4)
式中:ωih為輸入層連接隱含層各神經(jīng)元間的權重;ωhh為隱含層自反饋連接的神經(jīng)元權重。σ(·)為隱含層激勵函數(shù),在此選取雙曲正切函數(shù),其表達式如下:
(5)
(6)
式中:ωho為隱含層連接輸出層各神經(jīng)元間的權重;輸出層輸出為控制器增益參數(shù)Kp和Ki,分別對應:
(7)
由于增益參數(shù)均為非負值,故選取輸出層激勵函數(shù)為非負Sigmoid函數(shù),其表達式如下:
(8)
經(jīng)上述前向傳播可得到控制器所需的增益參數(shù),進而根據(jù)式(3)得到控制器輸出量作用于PMSM,使得EMA產(chǎn)生相應動作。DRNN的學習基于反向傳播算法,將誤差信號沿前向傳播路徑反傳,從而調(diào)整各神經(jīng)元間的權重值,使得系統(tǒng)誤差不斷減小。定義系統(tǒng)的性能指標函數(shù)如下:
(9)
式中:r(k)為系統(tǒng)期望值;y(k)為實際值。對于本文的EMA伺服控制系統(tǒng)而言,r(k)即為速度環(huán)控制器期望值,y(k)為實際的PMSM轉速。
采用最速梯度下降法對網(wǎng)絡權重值進行調(diào)整,其調(diào)整公式如下:
(10)
式中:η為學習率;α為使得搜索快速收斂的慣量因子。
據(jù)上式,可得輸出層到隱含層各神經(jīng)元間的權重調(diào)整公式如下:
(11)
式中:?Δu(k)/?y(k)未知,本文在此采用近似計算方法,利用符號函數(shù)sgn(·)對其近似替代,由此帶來的計算不精確影響可以通過調(diào)整學習率進行補償[9-10]。則該項可表示如下:
(12)
(13)
(14)
式中:
(15)
由DRNN學習算法可知,學習率η的選取直接決定了DRNN的收斂速度和學習效果。當學習率η的選取較大時,理論上可以提高神經(jīng)網(wǎng)絡的收斂速度,但是可能會引起權值在最優(yōu)點附近振蕩,從而影響控制器的控制效果[11],導致電機轉速在一定范圍內(nèi)振蕩,不利于EMA伺服系統(tǒng)的穩(wěn)定運行。學習率選取較小,雖然可以避免上述情況的發(fā)生,但同時也會影響DRNN的收斂速度,在應對復雜環(huán)境時可能無法及時對控制器參數(shù)進行調(diào)節(jié),從而也會一定程度上影響控制器的性能。因此,提出一種自適應學習率的方法來替代固定學習率,以期兼顧系統(tǒng)的穩(wěn)定性和快速響應能力。調(diào)節(jié)公式如下:
(16)
同時,注意到采取上述自適應學習率調(diào)整公式時,不可避免地導致學習率最終仍處于一個相對較小的值,在面對轉速突變時,無法保證權值的及時調(diào)整。因此,采取下式對學習率進行修正:
(17)
式中:η0為修正學習率,當k時刻的轉速誤差值減k-1時刻的誤差值大于閾值Δω時,便激活式(17)對學習率進行修正。
結合自適應學習率優(yōu)化的DRNN與PI控制器對EMA速度環(huán)進行控制,其控制框圖如圖3所示。
圖3 DRNN-PI自適應控制框圖
算法流程如下:
(1)確定DRNN神經(jīng)網(wǎng)絡結構,初始化權重值,選取合適的學習率和動量因子,令k=1;
(2)采樣得到k時刻輸入量r(k)和輸出量y(k),并計算得到偏差量e(k);
(3)輸入e(k)、e(k)-e(k-1)和u(k-1)到DRNN中,計算得到輸出量,即Kp和Ki;
(4)根據(jù)式(3)計算得到該時刻控制輸出u(k);
(5)計算當前時刻學習率,根據(jù)反向傳播公式調(diào)整網(wǎng)絡權值系數(shù),實現(xiàn)自適應控制;
(6)令k=k+1,返回步驟(2)。
為了驗證上述系統(tǒng)的控制性能,在Simulink中搭建了改進前后DRNN-PI控制、模糊-PI控制以及傳統(tǒng)PI控制的EMA伺服控制系統(tǒng),進行仿真對比研究。EMA主要參數(shù)如表1所示。
表1 EMA主要參數(shù)
對于傳統(tǒng)的PI控制方法,轉速環(huán)和電流環(huán)均采用PI控制器,速度環(huán)的PI參數(shù)為kpv=10,kiv=200;d、q軸電流PI控制參數(shù)均為kpd=5,kid=300。DRNN的初始權值為[-0.5,0.5]的隨機數(shù),學習率η=0.002 ,縮放因子β=1×106,γ=0.9,修正學習率η0=0.001;電流內(nèi)環(huán)控制器的參數(shù)與PI控制下的參數(shù)一致。
(1)轉速跟蹤:初始給定電機轉速為2 500 r/min;在0.15 s時轉速設定為3 000 r/min;在0.3 s時設定轉速為1 500 r/min。仿真結果如圖4所示。
從圖4可以看出,采用傳統(tǒng)PI控制算法跟蹤轉速變化會出現(xiàn)較大的超調(diào)量,超調(diào)量近100 r/min,采用DRNN-PI控制方法時超調(diào)量較小,模糊-PI沒有明顯的超調(diào),但其穩(wěn)定時間較長,達到0.1 s,而采用改進DRNN-PI控制時可以達到幾乎無超調(diào)并且可以更快地達到穩(wěn)定轉速。
(2)額定轉速下突加突卸負載:給定電機額定速度3 000 r/min,在0.2 s時,加10 N·m的負載,在0.4 s時卸掉負載。仿真結果如圖5所示。
圖5 額定轉速下各控制算法突加突卸載荷曲線圖
從圖5的仿真曲線可以看出,采用傳統(tǒng)PI控制算法,轉速出現(xiàn)3.3%的超調(diào),在負載突變時,轉速出現(xiàn)35 r/min的變化,且需約0.05 s的時間恢復轉速;對于改進前后的DRNN-PI控制算法而言,可以看出轉速的超調(diào)量、負載突變時的轉速變化和恢復時間均有所減少;其中改進后DRNN-PI控制算法可以實現(xiàn)轉速幾乎無超調(diào),達到額定轉速,負載突變時轉速變化量較改進前減少約5 r/min,恢復時間縮短0.01 s;模糊-PI在負載突變時轉速變化量與改進DRNN-PI相近,但其恢復時間更長,約0.04 s。由此可見,改進DRNN-PI具有更快的響應能力和更強的抗干擾能力。
(3)為驗證控制算法在EMA伺服系統(tǒng)中的整體性能,給定EMA位置階躍信號為20 mm,并引入如圖6所示的隨機變負載干擾(0~3 N·m)。其中,EMA位置環(huán)采用比例控制,為方便對比,比例參數(shù)均取相同的值,仿真結果如圖7所示。
圖6 負載轉矩隨機變化曲線
圖7 給定20 mm位置階躍下各控制算法響應曲線
從圖7(a)可以看到,內(nèi)環(huán)采用傳統(tǒng)PI和DRNN-PI控制時,其位置響應均產(chǎn)生超調(diào),采用模糊-PI和改進DRNN-PI控制算法均未出現(xiàn)明顯位置超調(diào),系統(tǒng)可以平滑地達到指定位置,但模糊-PI的響應速度較慢;且EMA到達指定位置時,在隨機負載干擾下,內(nèi)環(huán)采用改進DRNN-PI可以使得EMA位置波動更小。圖7(b)是對應EMA位置階躍20 mm下電機轉速響應變化,可以看到,內(nèi)環(huán)采用模糊-PI和改進DRNN-PI算法使得電機轉速變化具有更小的超調(diào)量,但模糊-PI達到穩(wěn)定轉速所需時間較改進DRNN-PI約長0.02 s,且在轉速平穩(wěn)時,改進DRNN-PI受隨機負載影響轉速波動更小,具有更強的抗干擾能力。由上述可知,內(nèi)環(huán)采用改進DRNN-PI控制算法能夠改善EMA伺服控制效果,使EMA伺服控制系統(tǒng)整體性能表現(xiàn)更好,魯棒性更強。
本文針對EMA速度環(huán)設計了一種DRNN與PI相結合的控制方法,考慮學習率對控制性能的重要影響,引入自適應學習率來動態(tài)調(diào)整DRNN的權值,提高了控制器學習能力和在線修正能力。仿真結果驗證了改進DRNN-PI控制方法在響應能力和抗干擾能力方面均優(yōu)于傳統(tǒng)PI控制、模糊-PI以及固定學習率的DRNN-PI控制方法,增強了EMA整體系統(tǒng)的穩(wěn)定性和魯棒性。