徐宏明,周 泉
(伯明翰大學 先進汽車技術(shù)研究中心,伯明翰B15 2TT,英國)
電動化、智能化、網(wǎng)聯(lián)化,共享化是汽車技術(shù)發(fā)展的趨勢,其中車輛電動化 (包括純電驅(qū)動、燃料電池驅(qū)動和插電式混合動力驅(qū)動) 對全球范圍內(nèi)實現(xiàn)零碳排放有非常深遠的意義。根據(jù)國際能源署 (International Energy Agency, IEA) 的預測,到2050年,以包括插電式混合動力在內(nèi)的電動化汽車將占有市場產(chǎn)品97%的份額[1]。顯而易見, 發(fā)動機的作用和占比取決于今后10年左右時間內(nèi)的相關(guān)研究(包括低碳燃料和生命周期熱效率及排放)的進展, 其潛力是不可低估的[2]。根據(jù)中國2020年發(fā)布的《新能源汽車產(chǎn)業(yè)規(guī)劃 (2021-2035年) 》[3],研究和開發(fā)先進發(fā)動機技術(shù)及其與電動化車輛的融合技術(shù)是實現(xiàn)“三縱”整車集成技術(shù)創(chuàng)新鏈戰(zhàn)略的關(guān)鍵。
控制系統(tǒng)是發(fā)動機非常重要的子系統(tǒng)之一,根據(jù)駕駛員和車輛的功率需求和對發(fā)動機狀態(tài)量的觀測,對發(fā)動機各子系統(tǒng) (例如噴油系統(tǒng)、正時系統(tǒng)、進氣系統(tǒng)、排氣系統(tǒng)等) 的執(zhí)行器進行控制,以保證發(fā)動機以最佳的動力性、燃油經(jīng)濟性進行工作,同時滿足排放法規(guī)的要求。通常來講,發(fā)動機的控制系統(tǒng)包括一個前饋系統(tǒng)和一個反饋系統(tǒng)[4],如圖1所示,其中前饋系統(tǒng)利用控制模型來推斷在發(fā)動機當前狀態(tài)下 (例如,轉(zhuǎn)速、轉(zhuǎn)矩) 滿足車輛功率需求時各執(zhí)行機構(gòu)需要實現(xiàn)的狀態(tài);反饋系統(tǒng)通過比較由前饋系統(tǒng)所確定的控制目標和當前發(fā)動機狀態(tài)的瞬態(tài)誤差,對發(fā)動機的執(zhí)行器進行控制,以保證發(fā)動機的實際狀態(tài)量快速地朝著目標狀態(tài)進行穩(wěn)定的收斂。值得注意的是,無論是前饋控制系統(tǒng)和反饋控制系統(tǒng)均有許多參數(shù) (例如,控制模型參數(shù)、控制閾值、增益量等) 需要在研發(fā)階段進行優(yōu)化[5]。
圖1 發(fā)動機控制系統(tǒng)簡圖
隨著不斷的設計迭代和產(chǎn)品升級,發(fā)動機系統(tǒng)正變得越來越復雜,以滿足越來越嚴苛的排放法規(guī)要求,對發(fā)動機的控制系統(tǒng)而言,也正在引入越來越多的自由度。發(fā)動機系統(tǒng)的升級也對傳統(tǒng)的基于模型的控制開發(fā)流程 (model-based-design,MBD)[6]提出了挑戰(zhàn),因為基于設計實驗 (design of experiment,DoE) 的MBD高度依賴工程師的經(jīng)驗,而對于工程師來講,同時處理上百個參數(shù)來實現(xiàn)多個優(yōu)化設計目標 (例如,力矩、油耗、排放等) 是非常具有挑戰(zhàn)的。近年來,人工智能的高速發(fā)展為發(fā)動機和其他復雜系統(tǒng)的控制和優(yōu)化提供了非常有效的工具[7]。基于人工智能的發(fā)動機系統(tǒng)優(yōu)化在顯著提升發(fā)動機性能方便具有廣闊的前景,同時也對傳統(tǒng)MBD提供了改良的依據(jù)。
本文聚焦發(fā)動機控制器開發(fā),調(diào)研了人工智能技術(shù) (包括演化計算、模糊推理和機器學習) 在前饋控制優(yōu)化、反饋控制優(yōu)化和系統(tǒng)層面全局優(yōu)化3個方面的應用案例,總結(jié)人工智能相關(guān)技術(shù)在上述應用場景的優(yōu)勢和不足,對人工智能技術(shù)在發(fā)動機控制開發(fā)的前景進行分析和展望。
發(fā)動機前饋控制的核心是實時控制模型 (如圖1紅框所示),需要精確地依據(jù)不同的控制參數(shù)對發(fā)動機的性能進行實時的預測,以確定當前發(fā)動機狀態(tài)滿足車輛功率需求情況下的發(fā)動機目標狀態(tài)(例如,氣門正時角、噴油正時角、點火正時角等)。通常來說,理論模型和數(shù)據(jù)驅(qū)動模型被廣泛應用于發(fā)動機系統(tǒng)的控制建模,其中,理論模型是基于發(fā)動機工作的物理化學過程對系統(tǒng)進行白盒建模 (whitebox modelling) 并進行適當簡化以滿足實時計算需求,數(shù)據(jù)驅(qū)動模型則是從統(tǒng)計學和機器學習角度建立的系統(tǒng)輸入輸出之間的黑盒模型 (blackbox model) 或者灰盒模型 (grey box model)。上述模型中參數(shù)均需要依靠發(fā)動機的試驗進行標定,因此, 人工智能方法可以被應用于控制模型的優(yōu)化,以獲得最小的模型誤差。本節(jié)將從理論模型智能標定和數(shù)據(jù)驅(qū)動模型機器學習兩個方面,對基于人工智能的發(fā)動機建模工作進行總結(jié)和分析。
理論模型是基于第一性原理建立的,是發(fā)動機系統(tǒng)工作機理理論解釋的數(shù)學表達。為了最小化理論模型對控制器算力的依賴,通常用于控制的理論模型多為零維模型和一維模型[8]。其中,零維模型是忽略發(fā)動機幾何尺寸對燃燒分布影響的均值模型;一維模型則是僅從單個幾何維度來建立熱力學特征的模型。零維和一維模型能夠給出輸入輸出之間的關(guān)系,但模型參數(shù)還是需要基于試驗進行標定[9]。
進化類算法是一類受到自然界動物行為啟發(fā),利用模擬種群進化 (例如遺傳算法) 或鳥群遷徙 (例如粒子群算法) 的機理來求解工程優(yōu)化問題的方法,已經(jīng)被用于發(fā)動機理論控制模型的智能標定過程當中。Togun等利用遺傳算法 (genetic algorithm, GA)對發(fā)動機的扭矩模型進行了標定[10],其中遺傳算法是一種基于達爾文進化理論的智能算法,被用于尋找最優(yōu)的模型參數(shù),以實現(xiàn)基于不同的控制輸入 (例如點火正時、噴油正時、進排氣門正時等) 來預測發(fā)動機的轉(zhuǎn)矩和油耗。粒子群算法 (particle swarm optimization, PSO),是一類模仿鳥群遷徙的智能算法。XIA等利用粒子群算法實現(xiàn)了對反應控制壓燃 (reactivity controlled compression ignition, RCCI) 發(fā)動機的控制模型進行了優(yōu)化[11]。MA等建立了均質(zhì)壓燃 (homogeneous charge compression ignition, HCCI) 發(fā)動機的控制模型[12],開發(fā)了基于多目標進化算法 (multiple objective evolutionary algorithm, MOEA), 通過優(yōu)化氣門正時和空燃比來獲得考慮燃油經(jīng)濟性、碳氫排放和顆粒物排放的多目標最優(yōu)控制模型[13],圖2展示了隨著MOEA算法迭代的進行,發(fā)動機系統(tǒng)優(yōu)化目標的進化過程。
發(fā)動機工作過程涉及到諸多復雜的物理化學反應,特別是在極端條件下 (例如,高溫、高寒、高壓) 很多物理化學特性無法被全面地進行解析建模,因此,基于理論建模的控制模型具有一定的局限性。然而,得益于人工智能技術(shù)的高速發(fā)展,數(shù)據(jù)驅(qū)動建模方法近年來收到了廣泛的關(guān)注。數(shù)據(jù)驅(qū)動建模是一種基于實驗數(shù)據(jù)利用一系列統(tǒng)計學模型建立輸入輸出映射的方法,相對于理論建模,并不過度依賴對復雜系統(tǒng)的全面了解?;貧w模型 (regression model) 和人工神經(jīng)網(wǎng)絡 (artif icial neural network,ANN) 是最為常見的數(shù)據(jù)驅(qū)動建模方法。
圖2 發(fā)動機優(yōu)化目標的進化過程:獲得優(yōu)化目標的時間代價[13]
回歸建模是一種灰盒模型 (grey box model),它不依賴對復雜系統(tǒng)詳細的理論建模但又是建立在對系統(tǒng)的一定理解 (例如,輸入和輸出之間的大致關(guān)系、參數(shù)相關(guān)性等) 的基礎(chǔ)上。換而言之,回歸是一種曲線/曲面擬合的方法,利用一些經(jīng)驗模型 (例如,線性函數(shù)、多項式函數(shù)、冪函數(shù)、對數(shù)函數(shù)等) 并基于實驗數(shù)據(jù),來建立發(fā)動機的控制模型。
Larsson等利用線性回歸模型建立了汽缸點火時刻和空燃比直接的控制模型[14],試驗表明,線性回歸模型對空燃比預測的誤差能夠控制在1%以內(nèi)。Rahimi-Gorji等利用線性函數(shù)和二次函數(shù)的回歸模型對某款汽油機的功率輸出和燃油消耗進行了建模,試驗表明,上述回歸模型能夠保證85.44%的輸出功率預測精度和92.17%的燃油消耗量預測精度[15]。朱觀宏等提出了一種基于物理模型和支持向量機的柴油機冷卻系統(tǒng)模型,并將其應用于發(fā)動機控制器的故障診斷,結(jié)果表明,該算法能夠準確地識別97%以上的故障情況,平均診斷用時在45 s以內(nèi)[16]。張斌等基于二階模型建立了某高壓共軌柴油機的有效燃油消耗、NOx排放、煙度、缸壓和排氣溫度的響應模型,并基于歐六排放法規(guī)進行了控制參數(shù)的標定[17]。胡松等基于冪函數(shù)建立了多次噴射柴油機的控制模型,能夠在保證擬合優(yōu)度 (R2≥ 0.975) 的基礎(chǔ)上滿足柴油機控制器實時運算要求 (運算耗時小于350μs,遠低于發(fā)動機單個循環(huán)周期20 ms)[18]。然而,回歸模型往往只擅長應對單輸入單輸出 (single input single output, SISO) 和多輸入單輸出 (multiple inputs single output, MISO) 問題,在針對多輸入多輸出 (multiple inputs multiple output, MIMO),特別是在求解某些輸出量之間存在耦合關(guān)系的問題存在局限。
人工神經(jīng)網(wǎng)絡是一種公認的有效的機器學習方法,能夠基于對數(shù)據(jù)的挖掘獲得準確的實時控制模型。受到生物體神經(jīng)網(wǎng)絡的啟發(fā),人工神經(jīng)網(wǎng)絡利用一系列由神經(jīng)元 (neuron) 組成的隱藏層 (hidden layers) 來建立輸入輸出的關(guān)系,利用試驗數(shù)據(jù)來決定神經(jīng)元內(nèi)部線性模型的參數(shù)和非線性激發(fā)函數(shù) (activation function) 的激發(fā)條件以獲得最小的模型誤差,進而實現(xiàn)機器學習。
人工神經(jīng)網(wǎng)絡已經(jīng)被廣泛地用于傳統(tǒng)火花塞點燃 (spark ignition,SI) 發(fā) 動 機 和 壓 燃 (compression ignition, CI) 發(fā)動機的控制建模[19]。謝輝等提出了一種基于Bayes正則化 (Bayesian regularization) 的神經(jīng)網(wǎng)絡模型,并將其用于柴油機燃燒過程中放熱率的建模,并獲得了93.2%以上的精度且具備較高的泛化能力[20]。焦宇飛等提出了二次多項式與神經(jīng)網(wǎng)絡結(jié)合的重型共軌柴油機建模方法,利用GT-Power搭建的虛擬標定平臺,獲得了不同海拔下柴油機轉(zhuǎn)矩、燃油消耗率、燃油消耗量、最高燃燒壓力和渦輪前排氣溫度的模型[21]。戴金池等提出了一種基于LSTM神經(jīng)網(wǎng)絡的柴油機NOx排放預測模型,實驗表明,LSTM神經(jīng)網(wǎng)絡能夠在全球統(tǒng)一瞬態(tài)實驗循環(huán)工況下獲得較高的精度和穩(wěn)定性,且具備較強的泛化能力[22]。
近年來,人工神經(jīng)網(wǎng)絡開始被用來構(gòu)建新型發(fā)動機 (包括新燃料發(fā)動機和新燃燒模式發(fā)動機) 的控制模型。CHO等利用人工神經(jīng)網(wǎng)絡建立了加氫汽油缸內(nèi)直噴發(fā)動機(hydrogen-added gasoline direct injection engine)燃燒過程的精準控制模型[23]。Mehra等利用人工神經(jīng)網(wǎng)絡建立了“氫-天然氣”混合氣 (hydrogen and compressed natural gas,HCNG) 發(fā)動機的動力性和排放控制模型[24]。上述研究均證明了人工神經(jīng)網(wǎng)絡在進行復雜系統(tǒng)方面的先進性及便利性。Fagundez等建立了乙醇點燃發(fā)動機的人工神經(jīng)網(wǎng)絡模型并利用粒子群算法進行了模型的訓練[25],該研究在論證人工神經(jīng)網(wǎng)絡先進性的基礎(chǔ)上,進一步論證了粒子群算法與人工神經(jīng)網(wǎng)絡的融合能夠利用較少神經(jīng)元獲得更準確的發(fā)動機扭矩和排放控制模型。
在車輛的實際行駛過程當中,發(fā)動機往往需要工作在瞬態(tài)工況下,即發(fā)動機的轉(zhuǎn)速和轉(zhuǎn)矩在短時間內(nèi)頻繁地變化,以滿足車輛運行的需求,因此發(fā)動機需要反饋控制系統(tǒng) (如圖1中藍框所示) 來實現(xiàn)在瞬態(tài)工況下對發(fā)動機期望狀態(tài) (前饋控制的輸出量) 的動態(tài)追蹤和修正。通常,比例積分微分 (proportional-integralderivative,PID) 控制器被用于發(fā)動機的瞬態(tài)控制。近年來,人工智能算法被開始應用于PID控制器的智能調(diào)參。與此同時,更加先進的智能算法被直接用于發(fā)動機瞬態(tài)過程的控制決策。本節(jié)將對智能調(diào)參及在線決策兩個方面的研究成果進行分析和討論。
PID控制器能通過連續(xù)計算目標狀態(tài) (發(fā)動機前饋控制系統(tǒng)計算的理論狀態(tài)) 和實際測量狀態(tài) (發(fā)動機的實際測量狀態(tài)) 之間的差值,并利用差值的比例 (P) 增益、時間積分 (I) 增益和時間導數(shù) (D) 增益獲取瞬態(tài)的控制指令,以實現(xiàn)在瞬態(tài)工況下發(fā)動機狀態(tài)朝著預設狀態(tài)快速穩(wěn)定地收斂。根據(jù)基于新歐盟測試工況(new European driving cycle, NEDC) 和全球統(tǒng)一瞬態(tài)工況 (worldwide light-duty test cycle , WLTC) 下發(fā)動機工況點的對比分析[26],如圖3所示,車輛排放法規(guī)將越來越多地考慮瞬態(tài)的工作范圍,這大大增加了發(fā)動機的標定工作強度[27]。
人工智能技術(shù),包括演化算法 (evolutionary algorithm)、模糊推理系統(tǒng) (fuzzy inference system) 和強化學習 (reinforcement learning), 是近年來被開發(fā)的用于PID控制器調(diào)諧的常見方法。Howell等提出了一種基于連續(xù)動作強化學習的自動系統(tǒng) (continuous action reinforcement learning automata, CARLA) 用于發(fā)動機怠速控制的PID參數(shù)調(diào)諧[28]。實驗表明,所提出的CARLA方法相對于傳統(tǒng)的Ziegler-Nichols調(diào)參法能夠顯著地提升怠速工況下的燃油經(jīng)濟性。ZHANG等開發(fā)了一種基于粒子群 (particle swarm optimization, PSO) 算法的柴油發(fā)動機雙回路廢棄再循環(huán)系統(tǒng)PID在線調(diào)參方法,通過試驗對比某款商用發(fā)動機控制器的標定結(jié)果,能夠降低控制目標 (發(fā)動機進氣量) 59.9%超調(diào)量和35.4%的穩(wěn)定時間[29]。LI等提出了一種集成了模糊推理系統(tǒng)的汽油缸內(nèi)直噴 (gasoline direct injection, GDI) 發(fā)動機空燃比PI控制器,并利用混沌增強粒子群 (chaos-enhanced particle swarm, CAPSO) 算法對模糊推理系統(tǒng)進行了優(yōu)化,試驗表明,對比某款商用發(fā)動機控制器中PID控制,所提出的方法能夠降低空燃比控制過程中75%的超調(diào)量和64%的絕對誤差積分 (integral of absolute value of error, IAE)[30]。
盡管PID控制器能夠非常好地解決單輸入單輸出 (single-input single-output, SISO) 和多輸入單輸出(multiple-input single-output, MISO) 的發(fā)動機控制問題,發(fā)動機在實際工作當中有很多的多輸入多輸出問題需要解決,特別是控制輸出之間存在解耦的問題,對此傳統(tǒng)的PID控制很難保證在多個控制輸出情況下的最優(yōu)控制[31]。對此,需要更加先進的控制策略來對發(fā)動機的瞬態(tài)過程進行控制。
圖3 發(fā)動機工況點對比[26]
模糊推理 (fuzzy Inference) 是一種常見的多輸入多輸出智能控制方法,其利用模糊集合和模糊規(guī)則來推理控制輸出和輸入之間的非線性關(guān)系,具有實現(xiàn)容易和魯棒性強的特點。LI等提出了一種類PI的模糊推理系統(tǒng)并應用于汽油缸內(nèi)直噴 (GDI) 發(fā)動機的空燃比控制,該系統(tǒng)以目標狀態(tài)與實際狀態(tài)誤差的比例增益和積分增益為輸入,來實時地推算燃油噴射量和噴射正時的控制輸出,實驗表明該系統(tǒng)能夠獲得穩(wěn)定的空燃比控制,并能夠相對于基于設計實驗的標定方法降低97%的標定工作量[32]。人工神經(jīng)網(wǎng)絡模型 (artif icial neural networks) 也是一種有效的多輸入輸出建模的方法。張眾杰等利用反向傳播(back propagation, BP)神經(jīng)網(wǎng)絡建立了高海拔情況下二級可變幾何截面增壓 (variable geometry turbocharger, VGT) 柴油機的扭矩模型,并運用該模型優(yōu)化了瞬態(tài)工況下噴油量、噴油提前角和VGT截面葉片角的控制策略[33]。
模型預測控制 (model predictive control, MPC) 是一種更為高級的瞬態(tài)控制方法,通過利用人工智能進行控制建?;蚍蔷€性模型在線求解,能夠?qū)崿F(xiàn)發(fā)動機控制系統(tǒng)在瞬態(tài)工況下的在線優(yōu)化 (online optimization)。XU等提出了針對一種發(fā)動機怠速控制的非線性模型預測控制方法,利用粒子群算法實現(xiàn)了發(fā)動機非線性模型的在線求解,以獲得最優(yōu)的實時控制輸出[34]。ZHANG等建立了某款柴油機的雙回路廢氣循環(huán)系統(tǒng)的人工神經(jīng)網(wǎng)絡模型,利用混沌增強粒子群算法實現(xiàn)了人工神經(jīng)網(wǎng)絡的在線求解,提出了一種集成了人工神經(jīng)網(wǎng)絡和粒子群算法的柴油機進氣非線性模型預測控制方法[35]。上述方法均實現(xiàn)了非線性預測模型的實時控制,并且展示了基于人工智能的發(fā)動機瞬態(tài)控制方法相對于PID控制和線性模型預測控制的先進性。
發(fā)動機將是未來電動化車輛的能源系統(tǒng)的一部分,例如在增程式電動車行駛過程中為其動力電池充電。在電動車輛中,發(fā)動機的控制需要從更高的系統(tǒng)層面考慮與電動化動力系統(tǒng)的匹配,這對未來發(fā)動機的控制提出了新的要求。本節(jié)將從混動發(fā)動機模塊設計和發(fā)動機工況點的全局優(yōu)化兩個方面,對現(xiàn)有的研究成果進行總結(jié)。
模塊化設計是針對電動化車輛非常有效的開發(fā)手段,能夠以最低的時間成本和開發(fā)成本獲得電動化汽車的產(chǎn)品迭代和升級。大眾公司 (Volkswagen) 開發(fā)了一種模塊化平臺并實現(xiàn)了靈活而低成本的純電車輛平臺和混動車輛平臺的快速開發(fā)[36]。長安汽車基于一種模塊化開發(fā)平臺,針對混合動力驅(qū)動系統(tǒng)開發(fā)了全新的“藍鯨”系列發(fā)動機,該模塊化平臺能夠設計兼容1.0 ~1.8 L的排量范圍[37]。馬勒 (Mahle) 開發(fā)了一種模塊化混動平臺和靈活發(fā)動機控制器以實現(xiàn)快速的產(chǎn)品設計與迭代[38]。人工智能算法相對于工程師具有更強的多目標多參數(shù)全局優(yōu)化能力[39],因此在混動發(fā)動機模塊化設計領(lǐng)域具有廣闊的應用前景,并應用于兩種主流的模塊化設計路線,即分布優(yōu)化路徑和協(xié)同優(yōu)化路徑[40]。
分布式優(yōu)化路徑是將動力系統(tǒng)的零部件參數(shù)和控制參數(shù)分兩步進行優(yōu)化,即先獲得最優(yōu)的零部件設計參數(shù) (例如,發(fā)動機排量、沖程、壓縮比等) 再對控制參數(shù)進行優(yōu)化 (例如,何時進行純電模式和混動模式的切換)。在零部件尺寸優(yōu)化方面,Parabola等提出了一種凸優(yōu)化 (convex optimization) 方案對混動動力系統(tǒng)的不同子系統(tǒng)進行優(yōu)化[41]。ZHANG等開發(fā)了一種基于第2代非支配解遺傳算法 (NSGA-II) 的多目標優(yōu)化方案以獲得考慮燃油消耗和電池健康狀態(tài)的最優(yōu)混合動力系統(tǒng)構(gòu)型[42]。Shah等利用遺傳算法對混合動力系統(tǒng)的零部件成本和燃油經(jīng)濟性進行了多目標帕累托分析,并在此基礎(chǔ)上對混動發(fā)動機的關(guān)鍵設計參數(shù)進行了優(yōu)化[43]。XU等利用詳盡搜索(exhaustive search)方法,對考慮不同變速器行駛的混合動力構(gòu)型進行了優(yōu)化[44]。ZHOU等提出了一種基于混沌增強粒子群算法的混合動力汽車部件選型方法,通過引入混沌函數(shù),增強粒子群算法搜索的穩(wěn)定性,提高優(yōu)化結(jié)果的穩(wěn)定性和信譽度[45]。在控制參數(shù)優(yōu)化方面,WANG等提出一種基于動態(tài)規(guī)劃 (dynamic programming, DP) 的混合動力車輛控制參數(shù)優(yōu)化方法,以獲得車輛最低的日常使用成本(綜合考慮油耗和電耗)[46]。LV等建立了一個基于神經(jīng)網(wǎng)絡的駕駛員模型,并利用該模型對混合動力車輛的控制系統(tǒng)進行優(yōu)化,以實現(xiàn)針對不同駕駛者的駕駛性和燃油經(jīng)濟性優(yōu)化[47]。
協(xié)同優(yōu)化路徑能夠同時進行零部件尺寸優(yōu)化和控制參數(shù)優(yōu)化。LV等設計了一種聯(lián)合優(yōu)化方法能夠獲得最優(yōu)的零部件參數(shù)和控制參數(shù)組合,并獲得了最佳的車輛動力性能、舒適性和能量使用效率[48]。Mamun等利用粒子群算法實現(xiàn)了針對混合動力車輛零部件尺寸和控制參數(shù)的協(xié)同優(yōu)化[49]。ZHOU等對粒子群算法進行了改良,提出了能夠解決非連續(xù)搜索空間優(yōu)化問題 (例如在混動車輛設計過程當中,電池單元的數(shù)量等參數(shù)為整數(shù),因此其搜索空間為非連續(xù)變化空間) 的改良加速粒子群 (modif ied accelerated particle swarm optimization, MAPSO) 算法,并將其應用于混合動力車輛的模塊化設計,研究以最小化行駛能耗和部件尺寸為設計目標,對標多目標NSGA-II算法,MAPSO能夠以較小的計算代價 (算力需求約為NSGA-II的五分之一) 獲得與NSGA-II算法相同水平的多目標優(yōu)化結(jié)果 (即兼顧最小混動總成尺寸和最低能量消耗兩個設計目標的帕累托最優(yōu)解集,如圖4所示[50])。
對于混合動力車輛而言,實際運行情況下的發(fā)動機工況點的分布收到混合動力能量管理策略的影響。通常,混合動力車輛的能量管理策略通過對車輛能量流的優(yōu)化,在保證電池電量的前提下獲得最佳的燃油經(jīng)濟性和能量使用效率。朱亞卓等基于多工況的實驗研究,分析了某款插電混合動力汽車瞬態(tài)工況下,發(fā)動機工況點的分布及其與電機工況點分布的關(guān)系,如圖5所示[51]。一般來講,混動發(fā)動機的全局最優(yōu)工況點是基于能量管理策略的離線和在線優(yōu)化所獲得[52]。
能量管理策略的離線優(yōu)化 (off line optimization) 假設車輛的行駛信息是預先已知的,通常離線優(yōu)化是基于法規(guī)所要求的行駛工況進行的,以幫助主機廠滿足法規(guī)對車輛燃油經(jīng)濟性和排放的要求[26]。動態(tài)規(guī)劃 (dynamic programming, DP) 是一種公認的能夠獲得全局最優(yōu)解的離線優(yōu)化方法,但動態(tài)規(guī)劃需要同時依賴準確的行駛信息預測和較大的運算負荷,因此,動態(tài)規(guī)劃很難滿足實時控制的要求[53-54]。如何將動態(tài)規(guī)劃的優(yōu)化結(jié)果應用于實時控制對于車輛和動力總成系統(tǒng)層面的優(yōu)化是十分重要的[55]。尋找動態(tài)規(guī)劃結(jié)果的替代控制模型,并基于動態(tài)規(guī)劃所獲得的輸入輸出關(guān)系進行模型優(yōu)化,是一種最為有效的方法。劉靈芝等提出了一種反向傳播 (backpropagation algorithm, BP) 神經(jīng)網(wǎng)絡替代模型,用于將離線全局最優(yōu)策略應用于瞬時的實時控制[56]。啟發(fā)式搜索算法,例如粒子群算法[45,49]和遺傳算法[57-58]已經(jīng)被應用于上述替代模型的優(yōu)化,以獲得最小的均方根值。
圖4 智能多目標協(xié)同優(yōu)化結(jié)果[50]
圖5 混合動力發(fā)動機和電機的瞬態(tài)工況點[51]
在線優(yōu)化 (online optimization) 對于電動化汽車的控制是非常必要的,因為在實際行駛過程中要準確預測車輛行駛工況信息是非常困難的。模型預測控制 (model-based predictive control, MPC) 是一種比較常見的獲得發(fā)動機全局工況點在線優(yōu)化方法[59-60],其通過基于模型的預測,實現(xiàn)預測區(qū)間內(nèi)的滾動優(yōu)化[61]。由于模型預測控制的預測模型多是通過實驗室階段的測試獲得,因此模型預測控制在解決實際行駛時的在線問題方面存在一定的局限性[62-63]。強化學習 (reinforcement learning) 是一種新興的且具有前景的發(fā)動機工況點在線優(yōu)化方法[64],該方法基于Bellman最優(yōu)法則 (Bellman's principle of optimality)[65],通過利用計算代理 (agent) 建立狀態(tài) (state) -動作 (action) -獎勵(reward)的映射,不斷地豐富計算代理的“經(jīng)驗”,以方便計算代理點能夠更好地適應車輛實際行駛過程當中多變的環(huán)境[53]。強化學習在發(fā)動機工況點全局優(yōu)化方面的有效性已經(jīng)在多個車輛平臺上面得到了論證[66]。研究表明,通過強化學習方法,包括Q-learning[67],deep Q-learning[68],double Q-learning[69],double deep Q-learning[70]以及multiple-step Q-learning[71],能夠?qū)崿F(xiàn)對車輛能量轉(zhuǎn)換效率的顯著提高。當前針對強化學習的研究主要基于從計算代理從零開始學習 (learning from scratch) 的假設[72-73],因此需要較長的學習時間以獲得較為理想的控制規(guī)則 (control policy)[74]。
物聯(lián)網(wǎng)時代的到來正推動著車輛互聯(lián)網(wǎng) (internet of vehicle, IoV) 技術(shù)的高速發(fā)展,隨著計算機科學和信息技術(shù)的發(fā)展,各個車輛和主機廠都將成為車輛互聯(lián)網(wǎng)的一部分,并受益于與人工智能、信息共享和云計算。隨著發(fā)動機控制系統(tǒng)的智能控制建模、智能瞬態(tài)決策和智能系統(tǒng)全局優(yōu)化等關(guān)鍵問題的解決,可以預見人工智能技術(shù)將推動未來發(fā)動機控制開發(fā)的3個融合:一是以發(fā)動機數(shù)字孿生技術(shù)為代表的信息系統(tǒng)與物理系統(tǒng)的融合;二是以發(fā)動機多場景智能優(yōu)化技術(shù)為代表的機器學習系統(tǒng)與經(jīng)典控制系統(tǒng)的融合;三是以動力總成域控制器技術(shù)為基礎(chǔ)的多源系統(tǒng)信息的融合。
信息系統(tǒng) (發(fā)動機的數(shù)字模型) 和物理系統(tǒng) (發(fā)動機的工程樣機) 在傳統(tǒng)V流程基于模型開發(fā)環(huán)節(jié)是獨立的。為了分析說明傳統(tǒng)V流程開發(fā)流程和未來融合人工智能的開發(fā)流程,筆者對標準V流程進行了適當?shù)暮喕?,如圖6a所示,其中發(fā)動機模型依靠工程師經(jīng)驗所設計的發(fā)動機臺架實驗獲得,計算機軟件, 例如MATLAB Model-based development (MBD) toolbox, ETAS INCA, AVL CAMEO, 能夠輔助工程師進行發(fā)動機模型的建立和基于模型的控制器優(yōu)化和標定,標定后的控制器再通過發(fā)動機原型機進行功能驗證和排放法規(guī)測試,若無法通過測試,則重新設計實驗,重復基于模型的優(yōu)化環(huán)節(jié),直至通過原型機的驗證完成發(fā)動機產(chǎn)品的初步定性。在比較理想的情況下,筆者認為人工智能有望完全取代工程師與物理發(fā)動機的交互,即完全實現(xiàn)自主的控制器開發(fā),如圖6b所示,人工智能能夠依靠自身的模型學習能力 (例如, 利用神經(jīng)網(wǎng)絡、模糊推理等技術(shù))和自主尋優(yōu)能力 (例如, 利用粒子群算法、遺傳算法或強化學習等技術(shù)),通過控制發(fā)動機試驗自動控制系統(tǒng) (例如AVL PUMA) 直接獲得控制器的優(yōu)化結(jié)果。
圖6 發(fā)動機控制器開發(fā)流程
目前的人工智能系統(tǒng)在尋優(yōu)的過程具有一定的“隨機性”(例如遺傳算法當中的突變機制),因此如果直接將人工智能應用于和物理發(fā)動機的交互存在一定的風險,比如人工智能算法“突變(mutation)”環(huán)節(jié)產(chǎn)生的控制量超過了發(fā)動機允許的物理極限,將會造成發(fā)動機的損傷或更嚴重的安全事故。另一方面,根據(jù)筆者的經(jīng)驗,如果只利用物理發(fā)動機平臺的反饋進行搜索算法 (例如SPEA-II算法[75]) 尋優(yōu),每確定一個工況點就需要10~20 min的時間,這對于具有成百上千個工況點的發(fā)動機控制開發(fā)來講是非常漫長的。因此,在當前技術(shù)條件下,一種介于當前V流程和完全人工智能自主流程之間的方法是最為可行的。
“數(shù)碼孿生”是工業(yè)4.0階段最具發(fā)展前景的建模、仿真技術(shù),該概念是2013年由美國空軍研究實驗室首先提出,用于先進戰(zhàn)機的開發(fā),其核心是充分利用物理模型、傳感器更新、運行歷史等數(shù)據(jù),集成多物理量、多概率的智能建模過程[76]。在國外,數(shù)碼孿生技術(shù)正開始影響著汽車工業(yè)的發(fā)展,TATA公司的研究報告指出,數(shù)碼孿生技術(shù)能夠用于汽車產(chǎn)品的早期概念論證以及對工程人員的培訓,能夠縮短30%以上的開發(fā)周期[77]。因此,筆者認為以發(fā)動機數(shù)字孿生技術(shù)為代表的信息系統(tǒng)與物理系統(tǒng)的融合是現(xiàn)階段發(fā)動機模型開發(fā)方法比較理想的信息-物理系統(tǒng)融合升級路徑。
當前主流的發(fā)動機控制器多是經(jīng)典的“前饋控制+反饋控制”的形式,其控制系統(tǒng)也多為查表系統(tǒng)(lookup-table system),比例積分 (PI) 控制系統(tǒng),以及線性預測模型 (linear model-based predictive control, LMPC) 控制系統(tǒng)。上述系統(tǒng)雖然能夠滿足國六以前的排放標準,但隨著越來越多的實際行駛工況被納入世界各國的排放法規(guī),開發(fā)更加智能的能夠在環(huán)境當中自主學習的控制方法成為了各大主機廠和技術(shù)咨詢公司的技術(shù)共識。
隨著高級別無人駕駛技術(shù)的高速發(fā)展,讓控制器進行自主的環(huán)境認知和學習逐漸變成了可能,然而,就當前技術(shù)現(xiàn)狀而言,給發(fā)動機配備具備自學習算力控制器的技術(shù)路線尚不成熟,一方面發(fā)動機控制器要處理的信息量巨大 (現(xiàn)代發(fā)動機系統(tǒng)有上百個傳感器和執(zhí)行器);另一方面,發(fā)動機是未來電動化動力總成的一部分,與動力總成其他子系統(tǒng)高度耦合,如果給動力總成的每個部件都配備高性能的控制器,整車的成本很難控制。因此,筆者認為當前比較可行的技術(shù)方案是機器學習系統(tǒng)與經(jīng)典控制系統(tǒng)的融合,包含前端 (在動力系統(tǒng)開發(fā)階段)、中端 (在發(fā)動機系統(tǒng)開發(fā)階段) 和末端 (在發(fā)動機實際工作過程當中) 3個場景下的發(fā)動機智能優(yōu)化和控制。
前端融合比較具有代表性的是馬勒 (Mahle) 的模塊化混動系統(tǒng) (MMHP)[38],通過人工智能技術(shù)從動力總成或者更高階的系統(tǒng)層面確定各零部件 (包括發(fā)動機)最優(yōu)的設計參數(shù)以發(fā)動機在標準工況下的最優(yōu)工況點,隨后在針對特定的工況點進行智能標定。中端融合比較有代表性的是 Ricardo 提出的虛擬標定技術(shù)[78],依托人工智能建立能夠快速計算的發(fā)動機系統(tǒng)模型 (該模型對算力的要求介于CFD模型和控制模型之間,能夠準確地預測不同標定值下發(fā)動機的動態(tài)特性),隨后通過智能尋優(yōu)技術(shù),進行發(fā)動機控制器的虛擬標定。末端融合比較有代表性的是大陸公司 (Continental GmH) 提出的電子地平線 (eHorizon) 技術(shù),基于云計算、邊緣計算、GPS和車載傳感器,實現(xiàn)在車輛的行駛過程當中,對發(fā)動機的能量效率和排放控制效果進行不斷的優(yōu)化[79]。
隨著汽車智能化和網(wǎng)聯(lián)化的發(fā)展,汽車將和智能手機一樣,成為車聯(lián)網(wǎng) (internet of vehicles, IoV) 的一個智能終端,將具備數(shù)據(jù)傳感 (特別是用戶數(shù)據(jù)、道路信息搜集)、邊緣計算 (依托車載控制器處理一些計算任務) 和云計算能力 (通過云平臺處理全局的優(yōu)化數(shù)據(jù))。根據(jù)汽車控制器芯片主要供應商恩智浦 (NXP) 所發(fā)布的車聯(lián)網(wǎng)技術(shù)白皮書分析,隨著車輛的功能越來越多,如果采用現(xiàn)行的控制器局域網(wǎng)絡 (controller area network, CAN) 架,將需要100個以上的電子控制單元 (electronic control unit,ECU) 和超過10 km長的總線線束,這將對整車的能耗帶來巨大的影響,因此未來汽車電控系統(tǒng)引入域控制構(gòu)架 (如圖7所示) 是十分必要的[80]。
相較于基于CAN總線系統(tǒng)的獨立控制器,基于域控制框架的控制器 (即域控制器) 數(shù)量上更少,但每個域控制器的功能更加強大,即具有更強的運算能力和接口數(shù)量。每個域控制器將能夠勝任一個總成系統(tǒng)的控制任務(例如動力總成控制)。在數(shù)據(jù)傳輸方面,域控制構(gòu)架也將采用帶寬更高的EtherCAT協(xié)議,能夠比CAN協(xié)議獲得更加高速的數(shù)據(jù)傳輸。上述技術(shù)的變革,都將使得車輛獲取多源信息“大數(shù)據(jù)”成為了可能。根據(jù)互聯(lián)網(wǎng)巨頭Amazon的未來運載技術(shù)和用戶體驗白皮書分析,車聯(lián)網(wǎng)技術(shù)和域控制技術(shù)的高速發(fā)展,為人工智能提供了廣闊的應用空間,將有望進一步提升車輛的用戶體驗和能量效率[81]。
基于上述理由,筆者相信以域控制框架為基礎(chǔ)的多源信息“大數(shù)據(jù)”融合也將成為未來發(fā)動機特別是混合動力發(fā)動機的技術(shù)發(fā)展方向之一。其中,人工智能技術(shù)與多源信息“大數(shù)據(jù)”的融合將能夠為未來發(fā)動機系統(tǒng)提供更加強大的多任務處理能力、更加準確的故障診斷預測、更加面向用戶的節(jié)能減排和用戶體驗的提升。此外,基于多源信息共享的車聯(lián)網(wǎng)絡,還能夠為發(fā)動機產(chǎn)品的設計迭代提供依據(jù),便于主機廠設計和開發(fā)更加高性能的發(fā)動機和車輛產(chǎn)品。
圖7 恩智浦提出的域控制電子構(gòu)架[80]
本文圍繞基于模型的發(fā)動機控制器開發(fā)流程,綜述了目前針對發(fā)動機控制開發(fā)的人工智能技術(shù)研究和發(fā)展現(xiàn)狀,特別是近10年內(nèi)的成果,總結(jié)了人工智能技術(shù)在前饋控制優(yōu)化、反饋控制優(yōu)化和系統(tǒng)層面全局優(yōu)化3個方面的應用案例。根據(jù)對人工智能技術(shù)在發(fā)動機控制開發(fā)的前景分析,筆者得出了如下結(jié)論:
1) 以發(fā)動機數(shù)字孿生技術(shù)為代表的信息系統(tǒng)與物理系統(tǒng)的融合是現(xiàn)階段發(fā)動機模型開發(fā)方法比較理想的系統(tǒng)融合升級路徑,并將助力降低發(fā)動機產(chǎn)品研發(fā)周期和測試成本。
2) 機器學習系統(tǒng)與經(jīng)典控制系統(tǒng)將有望在前端 (在動力系統(tǒng)開發(fā)階段)、中端 (在發(fā)動機系統(tǒng)開發(fā)階段) 和末端 (在發(fā)動機實際工作過程當中) 3個場景下進行融合,以實現(xiàn)發(fā)動機智能優(yōu)化和自適應控制。
3) 以域控制技術(shù)為基礎(chǔ)的人工智能與多源大數(shù)據(jù)的融合,將為未來發(fā)動機系統(tǒng)提供更強大的多任務處理能力、更加準確的故障診斷和預測、更加全面的用戶體驗,以及為主機廠提供產(chǎn)品研發(fā)的“大數(shù)據(jù)”支持。