黃志堅+熊雪梅+張贊+李宇棟+陳文濤+張琴
摘要:為解決發(fā)動機缸平衡控制問題,將標準近似動態(tài)規(guī)劃(approximate dynamic programming, ADP)擴展為多輸入多輸出形式,給出其控制算法,并證明其收斂性。仿真結果顯示,該方法能在一定范圍內(nèi)智能地調(diào)節(jié)各缸噴油量,用于補償由多種不確定因素導致的各缸轉(zhuǎn)速差異,從而自適應地提高缸平衡效果。該方法只需基于實時轉(zhuǎn)速,不必檢測和區(qū)分各缸間的轉(zhuǎn)速差異,具有非線性系統(tǒng)的智能優(yōu)化特點。該方法能直接處理各缸間的非線性多輸入多輸出耦合關系。
關鍵詞: 近似動態(tài)規(guī)劃; 多輸入多輸出(MIMO); 非線性系統(tǒng); 自適應性; 缸平衡; 怠速
中圖分類號: TP273 文獻標志碼: A
Abstract: In order to solve the cylinder equilibrium control problem of engines, the standard approximate dynamic programming (ADP) is extended to be of multi-input multi-output (MIMO) form, the control algorithm is presented, and its convergence is proved. The simulation results show that, the method can intelligently adjust the injection quantity of each cylinder in a certain range so as to compensate speed differences among cylinders caused by various uncertain factors, and realize the adaptive improvement of the cylinder equlibrium effect. The method is based on the real-time speed and has no need to detect and distinguish speed differences among cylinders, so it is of intelligent optimization characteristics of nonlinear system. It can directly deal with the nonlinear MIMO coupled relationship among cylinders.
Key words: approximate dynamic programming (ADP); multi-input multi-output (MIMO); nonlinear system; adaptivity; cylinder equilibrium; idle speed
0 引 言
對于發(fā)動機的轉(zhuǎn)速控制,過去專注于其長期轉(zhuǎn)速值上,而常常忽視一個發(fā)動機循環(huán)上各缸間的轉(zhuǎn)速波動,即缸平衡控制問題[1]。因此,有通過對各缸扭矩的自適應調(diào)節(jié)實現(xiàn)轉(zhuǎn)速均衡輸出的需求。目前,該領域只探索過幾種技術與方法。1996年,SHIM等[2]采用PID控制,通過調(diào)整點火提前角平衡怠速發(fā)動機模型的各缸波動。1998年,BIDAN等[3]采用氣流率控制,并依靠車載交流同步電機提供快速補償扭矩,實現(xiàn)了缸平衡控制。1999年,KIM等[4]綜合神經(jīng)網(wǎng)絡方法和遺傳算法,通過改變噴油定時平衡怠速發(fā)動機模型的各缸燃燒。2007年,KIM等[1]又采用遺傳算法和Alopex算法控制怠速發(fā)動機模型的各缸轉(zhuǎn)速波動。2009年,程文志等[5]通過控制共軌柴油機的多次噴油量,補償因各缸噴油量不均而產(chǎn)生的轉(zhuǎn)速波動。2010年,PAYRI等[6]采用多次噴射方法,通過控制引導噴射定時和燃燒質(zhì)心角范圍矯正各缸燃燒的不穩(wěn)定性。2012年,LI等[7]采用模型預測控制提高由噴油器差異和老化磨損等導致的發(fā)動機各缸間的扭矩不平衡。2013年,SUN等[8]采用平均指示壓力的協(xié)方差衡量氫內(nèi)燃機的各循環(huán)差異,并采用PID綜合控制來抑制其不平衡。
然而,上述PID方法對非線性多輸入多輸出耦合系統(tǒng)并不十分高效,其他方法不是需要對象的數(shù)學模型,就是需要檢測波動來自哪一缸或各缸波動的差異。各缸間的瞬態(tài)不平衡檢測往往不夠精確,或者在很多場合需要專用設備。因此,本文采用近似動態(tài)規(guī)劃(approximate dynamic programming, ADP)方法。它不需要專用設備檢測波動來自哪一個缸,也不需要對象的數(shù)學模型,只需要發(fā)動機的實時轉(zhuǎn)速信號。該方法可直接處理發(fā)動機各缸間的非線性多輸入多輸出耦合關系,具有快速迭代收斂性能。它通過自適應調(diào)節(jié)各缸噴油量提高缸平衡效果,從而補償由器件差異、參數(shù)時變、老化磨損等不確定因素導致的各缸差異,具有非線性系統(tǒng)的智能優(yōu)化特點,最終提高發(fā)動機的轉(zhuǎn)速穩(wěn)定性。本方法為發(fā)動機缸平衡控制提供了一種新的思路,是一種可行的非線性多輸入多輸出ADP優(yōu)化算法。
2 控制器設計與仿真
2.1 控制器設計
1)優(yōu)化目標。對一個發(fā)動機循環(huán)上的轉(zhuǎn)速采樣數(shù)據(jù)進行離散傅里葉變換(discrete Fourier transform, DFT),若4個周期性波形完全一致(見圖2中的第一個波形),即各缸間轉(zhuǎn)速波動一致,則其一階諧波與二階諧波的模之和為零[1]。
6)多輸入多輸出連接。執(zhí)行網(wǎng)絡的2個輸入分別是一個發(fā)動機循環(huán)上轉(zhuǎn)速采樣值DFT結果的基波頻率的模、二階諧波頻率的模。執(zhí)行網(wǎng)絡的4個輸出分別是1~4缸噴油量的大小。評價網(wǎng)絡的6個輸入分別是一個發(fā)動機循環(huán)上轉(zhuǎn)速采樣值DFT結果的基波頻率的模、二階諧波頻率的模,以及1~4缸噴油量的大小。endprint
7)控制器參數(shù)。需要設計的控制器參數(shù)有:學習率、期望訓練誤差、最大訓練循環(huán)次數(shù)、折扣因子和神經(jīng)網(wǎng)絡初始權值。對于評價網(wǎng)絡,它們分別為:0.3,每次迭代減0.05直到0.01;0.05;50次;0.95;(-1,+1),隨機取值。對于執(zhí)行網(wǎng)絡,它們分別為:0.3,每次迭代減0.05直到0.01;0.005;500次;0.95;(-1,+1),隨機取值。
2.2 控制仿真
控制仿真見圖3。ADP控制器和發(fā)動機模型均由MATLAB的m文件編程實現(xiàn)。發(fā)動機模型參數(shù)初始化后,即得到當前時刻的運行轉(zhuǎn)速及其波動情況。采樣一個完整工作周期的轉(zhuǎn)速值后,進行DFT,從而得到當前時刻性能指標U(t)的值。已經(jīng)初始化過的ADP控制器在該性能指標及其訓練算法的作用下,首先訓練評價網(wǎng)絡,再在理想轉(zhuǎn)速性能指標和評價網(wǎng)絡訓練結果的基礎上,根據(jù)算法進一步訓練執(zhí)行網(wǎng)絡,從而得到改進的控制策略,作用于發(fā)動機模型,并得到調(diào)節(jié)后的轉(zhuǎn)速及其波動情況。依此循環(huán),直到最優(yōu)。
仿真結果顯示,ADP控制器經(jīng)過8次迭代過程,1~4缸通過智能地調(diào)節(jié)噴油量抵消不平衡扭矩(見圖4),從而消除了各缸間的不平衡轉(zhuǎn)速波動。該過程一致收斂,也沒有超調(diào)現(xiàn)象(見圖5)。評價和執(zhí)行網(wǎng)絡誤差也迅速收斂到一個極小值(見圖6)。試驗結果表明這是一個成功的ADP優(yōu)化學習過程。此外,該控制方法取得了目前為止最快的迭代收斂速度,它可能比目前已經(jīng)發(fā)表文獻中的方法都要快2倍[1]。
形式,并將其應用于典型非線性多輸入多輸出耦合系統(tǒng)。對怠速發(fā)動機缸平衡的控制取得智能化的自適應優(yōu)化效果。ADP優(yōu)化控制器不需要檢測各缸波動的差異,可直接處理四缸間的非線性多輸入多輸出耦合關系,具有非線性系統(tǒng)的智能優(yōu)化特點;ADP方法也是一種反饋控制方法,具有抵抗擾動的魯棒性能。
參考文獻:
[1] KIM DaeEun, PARK J. Application of adaptive control to the fluctuation of engine speed at idle[J]. Information Sciences, 2007, 177(16): 3341-3355. DOI: 10.1016/j.ins.2006.12.021.
[2] SHIM D, PARK J, KHARGONEKAR P P, et al. Reducing automotive engine speed fluctuation at idle[J]. IEEE Transactions on Control Systems Technology, 1996, 4(4): 404-410. DOI: 10.1109/87.508888.
[3] BIDAN P, KOUADIO L K, VALENTIN M, et al. Electrical assistance for S.I. engine idle-speed control[J]. Control Engineering Practice, 1998, 6(7): 829-836. DOI: 10.1016/S0967-0661(98)00061-6.
[4] KIM DaeEun, PARK J. Neural network control for reducing engine speed fluctuation at idle[J]. IEEE Transactions on Control Systems Technology, 1999, 4: 629-634. DOI: 10.1109/ICSMC.1999.812477.
[5] 程文志, 張衡, 徐輝, 等. 高壓共軌柴油機怠速控制策略研究[J]. 車用發(fā)動機, 2009(4): 61-64. DOI: 10.3969/j.issn.1001-2222.2009.04.014.
[6] PAYRI F, BROATCH A, SALAVERT J M, et al. Investigation of diesel combustion using multiple injection strategies for idling after cold start of passenger-car engines[J]. Experimental Thermal and Fluid Science, 2010, 34: 857-865. DOI: 10.1016/j.expthermflusci.2010.01.014.
[7] LI P, SHEN T, LIU D. Idle speed performance improvement via torque balancing control in ignition-event scale for SI engines with multi-cylinders [J]. International Journal of Engine Research, 2012, 13(1): 65-76. DOI: 10.1177/1468087411405415.
[8] SUN Baigang, ZHANG Dongsheng, LIU Fushui. Cycle variations in a hydrogen internal combustion engine[J]. International Journal of Hydrogen Energy, 2013, 38: 3778-3783. DOI: 10.1016/j.ijhydene.2012.12.126.
[9] BELLMAN R. Dynamic programming[M]. Princeton, NJ: Princeton University Press, 1957: 1-56. DOI: 10.1126/science.153.3731.34.
[10] SI Jennie, WANG Yu-Tsung. On-line learning control by association and reinforcement[J]. IEEE Transactions on Neural Networks, 2001, 12(2): 264-276. DOI: 10.1109/72.914523.
[11] SOKOLOV Y, KOZMA R, WERBOS L D, et al. Complete stability analysis of a heuristic approximate dynamic programming control design[J]. Automatica, 2015, 59: 9-18. DOI: 10.1016/j.automatica.2015.06.001.
[12] WANG Ding, LI Chao, LIU Derong, et al. Data-based robust optimal control of continuous-time affine nonlinear systems with matched uncertainties[J]. Information Sciences, 2016, 366: 121-133. DOI: 10.1016/j.ins.2016.05.034.
[13] JIANG He, ZHANG Huaguang, LUO Yanhong, et al. Optimal tracking control for completely unknown nonlinear discrete-time Markov jump systems using data-based reinforcement learning method[J]. Neurocomputing, 2016, 194: 176-182. DOI: 10.1016/j.neucom.2016.02.029.
(編輯 趙勉)endprint