丁偉奇,王金秋,胡宗杰,李明龍,董光宇,李理光
(同濟(jì)大學(xué) 汽車學(xué)院,上海 201804)
隨著碳減排和環(huán)境保護(hù)的形勢(shì)日趨嚴(yán)峻,尋求更高效的動(dòng)力總成技術(shù)方案已成為全球汽車制造廠商的首要任務(wù).火花控制壓燃著火、可變配氣、渦輪增壓和缸內(nèi)直噴等[1-2]技術(shù)已成為了有效提高汽油機(jī)熱效率的重要手段.但在汽油機(jī)不斷升級(jí)的過程中,早燃及其引起的超級(jí)爆震是限制提升熱效率、降低排放的重要因素之一[3-4].早燃的出現(xiàn)較為隨機(jī)且沒有明顯的征兆,可能是由缸內(nèi)的隨機(jī)熱點(diǎn)引起,如碳粒和油滴[4-6],因而有必要研究能快速檢測(cè)和抑制早燃的技術(shù)手段.
離子電流檢測(cè)技術(shù)已經(jīng)被證實(shí)是一種高效、快速、可靠且成本低廉的缸內(nèi)燃燒檢測(cè)手段.離子電流的產(chǎn)生源于缸內(nèi)燃燒現(xiàn)象自身的離子反應(yīng),當(dāng)在火花塞正、負(fù)極施加電壓時(shí),燃燒反應(yīng)生成的正、負(fù)離子和電子會(huì)產(chǎn)生定向移動(dòng),從而形成離子電流.由于離子電流與燃燒息息相關(guān),因而離子電流可以反映缸內(nèi)燃燒狀態(tài)[7].與基于脈譜和模型的控制方法相比,離子電流檢測(cè)可實(shí)現(xiàn)燃燒的循環(huán)(4個(gè)行程或一個(gè)工作循環(huán))內(nèi)診斷,并用于實(shí)時(shí)反饋控制失火、爆震和早燃等非正常燃燒[8-10],由于離子電流判別早燃的根本目標(biāo)在于準(zhǔn)確并提前判斷出早燃,為今后實(shí)現(xiàn)循環(huán)內(nèi)診斷并抑制早燃提供可能,因而筆者在離線分析中模擬在線采集過程,確定不同判別模型的準(zhǔn)確率和提 前性.
Wang等[7]研究發(fā)現(xiàn),由于實(shí)際燃燒過程中測(cè)得的正常燃燒和早燃工況下的離子電流信號(hào)波形較為復(fù)雜,通過人為定義的方式來尋找早燃工況下離子電流信號(hào)波形的規(guī)律較為困難,實(shí)際判定的準(zhǔn)確率有待提高.而從根本上來說,基于離子電流信號(hào)判定早燃是一種分類問題,神經(jīng)網(wǎng)絡(luò)是一種解決分類問題的重要方法.Arsie等[11]在汽油機(jī)上將循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)模型作為檢測(cè)發(fā)動(dòng)機(jī)當(dāng)前燃燒循環(huán)NOx排放指標(biāo)的虛擬傳感器.Kamat等[12]通過一臺(tái)5.7L的V8發(fā)動(dòng)機(jī),利用RNN模型檢測(cè)當(dāng)前工況下的空氣質(zhì)量流量、空燃比等參數(shù).但RNN有梯度消失的問題,即對(duì)于時(shí)間序列上相隔較遠(yuǎn)的輸入記憶關(guān)聯(lián)性較差,這并不利于分析離子電流信號(hào)波形,因?yàn)樵陔x子電流信號(hào)中,點(diǎn)火線圈的蓄能特征信號(hào)出現(xiàn)的相位比較早,而它對(duì)后續(xù)的燃燒信號(hào)特征判斷仍有重要參考價(jià)值.長(zhǎng)短期記憶(LSTM)神經(jīng)網(wǎng)絡(luò)利用3個(gè)門限單元可使該神經(jīng)網(wǎng)絡(luò)能夠區(qū)分“長(zhǎng)期”和“短期”記憶,可以解決RNN模型的梯度消失問題.
Panousakis等[13]利用神經(jīng)網(wǎng)絡(luò)和離子電流相結(jié)合的方法預(yù)測(cè)發(fā)動(dòng)機(jī)循環(huán)內(nèi)缸壓,從而對(duì)燃燒狀態(tài)進(jìn)行判斷.Johnson等[14]利用神經(jīng)網(wǎng)絡(luò)進(jìn)行燃燒過程圖像的識(shí)別,從而預(yù)測(cè)燃燒相位來判別是否早燃.因而神經(jīng)網(wǎng)絡(luò)與缸壓傳感器以外的檢測(cè)手段相結(jié)合進(jìn)行早燃判斷已成為研究趨勢(shì),但高速攝影和紋影法等研究成本較高,且與神經(jīng)網(wǎng)絡(luò)結(jié)合后難以轉(zhuǎn)化為在線檢測(cè)方法,而在神經(jīng)網(wǎng)絡(luò)與離子電流相結(jié)合的研究中一般缺少針對(duì)早燃檢測(cè)準(zhǔn)確率和提前率的優(yōu)化.
基于此,筆者介紹了根據(jù)離子電流信號(hào)輸入特征值所建立的判斷早燃的LSTM神經(jīng)網(wǎng)絡(luò)模型,基于K折交叉驗(yàn)證和粒子群優(yōu)化法對(duì)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)、超參數(shù)進(jìn)行優(yōu)化,并與其他幾種判別模型進(jìn)行了對(duì)比,得出LSTM神經(jīng)網(wǎng)絡(luò)判別法是性能更優(yōu)的分類模型,且更符合離子電流早燃判別的根本目標(biāo).
試驗(yàn)用臺(tái)架由直噴汽油機(jī)、自制離子電流檢測(cè)設(shè)備、電渦流測(cè)功機(jī)和采集設(shè)備等組成,如圖1所示.直噴汽油機(jī)的技術(shù)參數(shù)見表1.采用INCA連接ECU,對(duì)發(fā)動(dòng)機(jī)運(yùn)行參數(shù)進(jìn)行實(shí)時(shí)監(jiān)控.離子電流檢測(cè)模塊由點(diǎn)火線圈、IONtronic離子電流檢測(cè)板、信號(hào)轉(zhuǎn)換模塊及連接線束構(gòu)成,離子電流檢測(cè)裝置電路如圖2所示.采用AVL燃燒分析儀和Kistler火花塞式缸壓傳感器進(jìn)行基于缸壓的燃燒分析.定義壓縮上止點(diǎn)為0°CA.在-50°~90°CAATDC范圍內(nèi),每0.1°CA采集一次缸壓和離子電流信號(hào)等,在其他曲軸轉(zhuǎn)角區(qū)間內(nèi),每0.5°CA采集一次,因而在每個(gè)工作循環(huán)(720°CA)內(nèi)共采集2560次.定義早燃的初步判別標(biāo)準(zhǔn)為缸壓峰值是否高于9MPa.如果某工作循環(huán)的缸壓峰值超過9MPa,將保存之前100個(gè)循環(huán)和之后200個(gè)循環(huán)的缸壓和離子電流信號(hào)數(shù)據(jù).
圖1 試驗(yàn)臺(tái)架示意 Fig.1 Schematic of the test bench
圖2 離子電流檢測(cè)裝置電路原理示意 Fig.2 Circuit schematic of ionic current detection device
表1 渦輪增壓直噴汽油機(jī)基本參數(shù) Tab.1 Specifications of a turbocharged GDI engine
筆者在轉(zhuǎn)速為1500r/min、負(fù)荷為72%工況下進(jìn)行試驗(yàn).在試驗(yàn)過程中采集相關(guān)數(shù)據(jù),再進(jìn)行離線分析.在離線分析過程中,開發(fā)檢測(cè)早燃的神經(jīng)網(wǎng)絡(luò)模型.在后期的離線分析中,燃燒開始相位定義為5%燃料質(zhì)量已燃燒時(shí)的曲軸轉(zhuǎn)角(CA5).當(dāng)燃燒開始相位早于點(diǎn)火時(shí)刻時(shí),判定此循環(huán)發(fā)生了早燃.
圖3為某單個(gè)循環(huán)內(nèi)的缸內(nèi)壓力和離子電流信號(hào).缸內(nèi)壓力和離子電流信號(hào)出現(xiàn)了多個(gè)峰值.缸內(nèi)壓力信號(hào)的兩個(gè)峰值分別是壓縮峰和缸內(nèi)壓力燃燒峰.在一個(gè)工作循環(huán)內(nèi),離子電流信號(hào)的峰值可分為4類:(1)點(diǎn)火干擾,由于離子電流檢測(cè)裝置電路與點(diǎn)火線圈相連,火花塞點(diǎn)火時(shí)引起的電路震蕩會(huì)對(duì)離子電流信號(hào)形成干擾.其中點(diǎn)火干擾1、2、4為其他3缸的點(diǎn)火干擾信號(hào),因而較?。稽c(diǎn)火干擾3為當(dāng)前缸內(nèi)的點(diǎn)火干擾信號(hào),因而較大.(2)蓄能峰,在火花塞的點(diǎn)火線圈開始蓄能的時(shí)刻,離子電流信號(hào)會(huì)出現(xiàn)兩個(gè)三角形尖峰.(3)放電峰,火花塞放電完成后形成的電路振蕩,是離子電流信號(hào)最強(qiáng)的峰.(4)離子電流峰,燃燒階段缸內(nèi)電子、離子濃度最高時(shí)產(chǎn)生的峰.放電峰后的離子電流信號(hào)可以反映燃燒時(shí)的火花塞附近的電子、離子濃度.可知離子電流峰和缸內(nèi)壓力燃燒峰出現(xiàn)的相位較為接近.
圖3 正常燃燒工況離子電流波形 Fig.3 Ionic current of normal combustion condition
圖4為點(diǎn)火時(shí)刻前、后的離子電流波形.早燃的發(fā)生時(shí)刻一般在點(diǎn)火線圈蓄能時(shí)刻與緊隨其后的點(diǎn)火時(shí)刻之間.在轉(zhuǎn)速為1500r/min下,蓄能峰和點(diǎn)火峰之間的早燃檢測(cè)窗口最大為41°CA,且后續(xù)試驗(yàn)顯示,所有早燃均發(fā)生在此檢測(cè)窗口區(qū)間內(nèi).點(diǎn)火時(shí)刻的點(diǎn)火干擾峰和放電峰之間為離子電流檢測(cè)早燃的空窗期,此時(shí)火花塞處于放電階段,在點(diǎn)火線圈中引起的反向電動(dòng)勢(shì)較大,但被離子電流檢測(cè)電路中的二極管濾除,因而該階段無法檢測(cè)到離子電流信號(hào).
圖4 汽油機(jī)燃燒區(qū)間正常燃燒工況離子電流波形 Fig.4 Ionic current of normal combustion condition in combustion area of gasoline engine
目前,學(xué)者們普遍認(rèn)為早燃是由缸內(nèi)隨機(jī)熱點(diǎn)引發(fā)的.筆者采用在壓縮上止點(diǎn)附近進(jìn)行二次噴油,降低空燃比,使混合氣過濃,二次噴油將燃油直接噴入高溫缺氧的氛圍內(nèi),可能會(huì)導(dǎo)致燃油碳化裂解,從而在燃燒室內(nèi)快速形成積碳,火花塞上的積碳也十分明顯,可以加速引發(fā)早燃.
一旦停止二次噴油,早燃幾乎會(huì)立刻發(fā)生,之后隨著積碳不斷燃燒,早燃也逐漸消失.試驗(yàn)中記錄了6154個(gè)工作循環(huán),發(fā)生早燃的有272個(gè)循環(huán),早燃發(fā)生率為4.42%.在筆者設(shè)計(jì)的早燃循環(huán)中,CA5的平均值為-24.3°CA ATDC.
由于受到了積碳的影響,離子電流波形也出現(xiàn)了一定的變化,受積碳影響的非早燃工況(正常燃燒工況)下的離子電流波形如圖5所示.可知,與圖4不同,早燃檢測(cè)窗口中的離子電流信號(hào)很強(qiáng).這是由于積碳使火花塞的兩個(gè)電極之間的間隙減小、電阻率下降,從而在離子電流檢測(cè)電路中形成電流[15].因此,盡管其間沒有燃燒,但點(diǎn)火前早燃檢測(cè)窗口中的“離子電流信號(hào)”明顯大于0V.
圖5 積碳影響下的非早燃工況離子電流波形 Fig.5 Ionic current under the influence of carbon deposition of normal combustion condition
當(dāng)發(fā)生早燃時(shí),離子電流受到積碳和早燃干擾的共同作用,其波形如圖6所示.與非早燃工況檢測(cè)窗口內(nèi)的離子電流信號(hào)值始終保持下降趨勢(shì)相比,早燃工況的離子電流信號(hào)值在早燃檢測(cè)窗口前半段出現(xiàn)波動(dòng),在后半段信號(hào)值不降反升.另外,當(dāng)早燃發(fā)生時(shí),缸壓幅值及放熱率幅值明顯上升,兩者幅值出現(xiàn)的相位相比非早燃工況明顯前移,同時(shí),由早燃引發(fā)的爆震使得缸壓峰值附近的波形出現(xiàn)了明顯波動(dòng).
圖6 積碳影響下的早燃工況的離子電流波形 Fig.6 Ionic current under the influence of carbon deposition of pre-ignition condition
圖7為早燃與非早燃工況的離子電流波形對(duì)比.當(dāng)發(fā)生早燃時(shí),其離子電流信號(hào)在第二蓄能峰和點(diǎn)火干擾峰之間出現(xiàn)了明顯的上升趨勢(shì).這可能是火焰形成的離子電流與積碳信號(hào)共同作用的結(jié)果.由于積碳存在,將火花塞的電極導(dǎo)通,使得早燃檢測(cè)窗口區(qū)域內(nèi)的離子電流信號(hào)值大于0V;發(fā)生早燃后,火焰形成的離子電流信號(hào)與積碳本身的干擾信號(hào) 發(fā)生疊加,從而在早燃檢測(cè)窗口期后半段中出現(xiàn)離子電流信號(hào)上升的趨勢(shì).
圖7 早燃工況與非早燃工況離子電流波形對(duì)比 Fig.7 Comparison of ionic current between pre-ignition condition and normal combustion condition
對(duì)比大量早燃與非早燃工況的離子電流信號(hào)波形,筆者使用閾值判定算法制定了一個(gè)針對(duì)早燃的判斷程序,如圖8所示.如果對(duì)于3個(gè)連續(xù)的采樣點(diǎn),差值大于預(yù)設(shè)的早燃閾值,則當(dāng)前循環(huán)被視為早燃循環(huán).反之,則將當(dāng)前循環(huán)歸為正常燃燒循環(huán).
圖8 早燃判斷常規(guī)程序原理示意 Fig.8 Schematic of conventional pre-ignition detection program
選用兩個(gè)參數(shù)來衡量判別程序分類的有效性:真陽率和假陽率.真陽率是指程序正確地將早燃循環(huán)判斷為早燃循環(huán)的概率;假陽率是指程序?qū)⒎窃缛佳h(huán)誤判為早燃循環(huán)的概率.筆者對(duì)272個(gè)早燃循環(huán)和5882個(gè)非早燃循環(huán)進(jìn)行計(jì)算,閾值設(shè)置與程序真陽率和假陽率關(guān)系見表2.可知閾值降低會(huì)使真陽率和假陽率同時(shí)升高,無法同時(shí)滿足提高真陽率和降低假陽率的需求,且圖8中的算法也很難進(jìn)一步優(yōu)化.
表2 閾值設(shè)置與程序真陽率和假陽率關(guān)系 Tab.2 Relationship between threshold setting and true positive and false positive rate
圖9為不同閾值的真陽率、假陽率.為了獲得較高的真陽率和較低的假陽率,選取最靠近左上角點(diǎn)(0,1)的閾值點(diǎn)為最優(yōu)判定閾值.因而最終選用0.14V作為判定閾值,此時(shí)的真陽率和假陽率將作為與神經(jīng)網(wǎng)絡(luò)模型判斷結(jié)果的對(duì)比基準(zhǔn).
圖9 不同閾值的真陽率、假陽率 Fig.9 True positive and false positive rate of different threshold
由于筆者利用神經(jīng)網(wǎng)絡(luò)對(duì)試驗(yàn)數(shù)據(jù)進(jìn)行離線分析,而神經(jīng)網(wǎng)絡(luò)檢測(cè)模型的最終目的為實(shí)現(xiàn)早燃的在線檢測(cè),因而需要模擬在線試驗(yàn)的采集方式,對(duì)輸入LSTM神經(jīng)網(wǎng)絡(luò)的特征值序列進(jìn)行預(yù)處理.
為保證輸入神經(jīng)網(wǎng)絡(luò)的特征值序列長(zhǎng)度一致,需要設(shè)定特征值序列的最大長(zhǎng)度.在所采集的6154個(gè)循環(huán)中,離子電流第二蓄能峰出現(xiàn)的曲軸轉(zhuǎn)角均值為(-37.52°±3.40°)CA ATDC.早燃工況的缸壓峰值相位均值為-2°CA ATDC,若神經(jīng)網(wǎng)絡(luò)模型在此時(shí)刻之后判斷出早燃,相比于利用缸壓幅值的判別方法就不再具有提前性,因而選取最大長(zhǎng)度為35個(gè)特征值,此時(shí)特征值序列末尾的平均曲軸轉(zhuǎn)角為-2.5°CA ATDC,可以保證將所有具有早燃特征的離子電流特征值進(jìn)行計(jì)算,即從第二蓄能峰后的第35個(gè)離子電流均值開始,LSTM神經(jīng)網(wǎng)絡(luò)不再采集離子電流信號(hào)值.同時(shí),對(duì)于長(zhǎng)度不足35個(gè)的特征值序列進(jìn)行零值填充,使其達(dá)到最大長(zhǎng)度.從離子電流信號(hào)的第二蓄能峰開始,將進(jìn)入早燃檢測(cè)窗口,由于第二蓄能峰峰值對(duì)于表征燃燒狀態(tài)具有重要作用,因而將每個(gè)燃燒循環(huán)的第二蓄能峰峰值作為輸入神經(jīng)網(wǎng)絡(luò)的特征值序列的第一個(gè)值.由于在-50°~90°CA ATDC區(qū)間內(nèi),每0.1°CA采集一次離子電流信號(hào),從進(jìn)入早燃檢測(cè)窗口開始,筆者對(duì)每0.11ms(1°CA)內(nèi)的10個(gè)采樣點(diǎn)的離子電流信號(hào)求平均值.在任意時(shí)刻,將每0.11ms(1°CA)所求得的離子電流信號(hào)平均值按照時(shí)序依次排列,在第二蓄能峰峰值之后置入輸入神經(jīng)網(wǎng)絡(luò)的特征值序列.對(duì)所有數(shù)據(jù)進(jìn)行預(yù)處理后,共得出24384組數(shù)據(jù),其中60%作為訓(xùn)練集用于神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練,20%作為驗(yàn)證集,20%作為測(cè)試集用于最終的模型校核.
筆者在Python中的TensorFlow框架下進(jìn)行編程和LSTM神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練,同時(shí)調(diào)用Keras模塊.
LSTM在RNN的基礎(chǔ)上引入了3個(gè)門限單元(輸入門it、遺忘門ft以及輸出門ot)和細(xì)胞態(tài)Ct,可以表征神經(jīng)網(wǎng)絡(luò)記憶體在上一時(shí)刻的長(zhǎng)期記憶Ct-1和當(dāng)前時(shí)刻候選態(tài)共同作用下的狀態(tài),記憶體的輸出為ht[16].在實(shí)際訓(xùn)練過程中,每一層循環(huán)神經(jīng)網(wǎng)絡(luò)都由若干個(gè)記憶體構(gòu)成.當(dāng)前時(shí)刻記憶體的輸出ht會(huì)對(duì)下一時(shí)刻的記憶體產(chǎn)生影響,在具有多層循環(huán)神經(jīng)網(wǎng)絡(luò)時(shí),前一層循環(huán)神經(jīng)網(wǎng)絡(luò)的ht會(huì)作為下一層循環(huán)神經(jīng)網(wǎng)絡(luò)的輸入xt.記憶體輸出ht為
細(xì)胞態(tài)Ct為
式中:Wc、Wi、Wf和Wo為待訓(xùn)練參數(shù)矩陣;bc、bi、bf和bo為待訓(xùn)練偏置項(xiàng);σ為Sigmoid激活函數(shù),有
在訓(xùn)練過程中,損失函數(shù)在迭代過程中不斷地減小,待訓(xùn)練項(xiàng)也在迭代中不斷更新,最終求解出適用于解決特定問題的神經(jīng)網(wǎng)絡(luò)模型[17].
選用自適應(yīng)矩估計(jì)(adam)優(yōu)化器,其待訓(xùn)練參數(shù)[17]更新公式為
式中:mt為t時(shí)刻的一階動(dòng)量;Vt為t時(shí)刻的二階動(dòng)量;β1和β2為動(dòng)量修正的超參數(shù),有
式中g(shù)t為t時(shí)刻損失函數(shù)關(guān)于當(dāng)前參數(shù)的梯度.
神經(jīng)網(wǎng)絡(luò)的性能受到許多超參數(shù)的影響,如網(wǎng)絡(luò)層數(shù)、每層的神經(jīng)元數(shù)量、學(xué)習(xí)率和批處理尺寸等.由于超參數(shù)優(yōu)化是一個(gè)組合優(yōu)化問題,無法像一般參數(shù)那樣通過梯度下降法進(jìn)行優(yōu)化,筆者采用K折交叉驗(yàn)證與粒子群優(yōu)化法相結(jié)合的方式對(duì)超參數(shù)進(jìn)行優(yōu)化.
3.2.1 神經(jīng)網(wǎng)絡(luò)層數(shù)優(yōu)化
神經(jīng)網(wǎng)絡(luò)層數(shù)對(duì)于神經(jīng)網(wǎng)絡(luò)性能具有較大的影響,增加神經(jīng)網(wǎng)絡(luò)層數(shù)通??梢蕴岣邤M合程度,從而提高精度,但同時(shí)也會(huì)增加計(jì)算成本并產(chǎn)生過擬合的傾向,降低模型的泛化性.筆者選用交叉熵?fù)p失函數(shù),隱藏層層數(shù)Nh=[2,4,6,8,10],每?jī)蓪与[藏層由一組LSTM層和Dropout層構(gòu)成.輸出層是維度為2的全連接層,采用Softmax激活函數(shù),選用L2正則化,正則化系數(shù)為0.01,輸出(1,0)表示未發(fā)生早燃的概率為100%,輸出(0,1)表示發(fā)生早燃的概率為100%,實(shí)際在測(cè)試集的判斷過程中設(shè)定早燃預(yù)測(cè)概率超過某個(gè)閾值時(shí)視為模型判斷出早燃.在優(yōu)化過程中固定設(shè)置LSTM層神經(jīng)元個(gè)數(shù)Nunit=40,舍棄層(dropout layer)神經(jīng)元舍棄概率為0.2、學(xué)習(xí)率lr=0.001、批處理尺寸bs=64且迭代次數(shù)epochs=100.
圖10為經(jīng)過4折交叉驗(yàn)證后的交叉熵.當(dāng)隱藏層層數(shù)超過6層時(shí),交叉熵?fù)p失函數(shù)下降不再明顯,權(quán)衡神經(jīng)網(wǎng)絡(luò)性能與訓(xùn)練成本,最終選擇隱藏層層數(shù)為6層.
圖10 4折交叉驗(yàn)證后神經(jīng)網(wǎng)絡(luò)交叉熵 Fig.10 Cross entropy in 4 fold cross-validation
3.2.2 基于粒子群優(yōu)化法的其他超參數(shù)優(yōu)化
利用粒子群優(yōu)化法對(duì)超參數(shù)進(jìn)行優(yōu)化,粒子群優(yōu)化算法通過在D維搜索空間中的一系列粒子來尋找最優(yōu)的適應(yīng)度值,第i個(gè)粒子在空間中的位置為zi=(zi1,zi2,…,zid,…ziD),表示一組D個(gè)超參數(shù)的組 合[18].筆者進(jìn)行粒子群優(yōu)化法是為尋找一組超參數(shù)的粒子位置,使交叉熵?fù)p失函數(shù)的適應(yīng)度值達(dá)到最?。谒阉鞯^程中,粒子通過向兩個(gè)最優(yōu)位置移動(dòng)來尋找最優(yōu)解:(1)局部最優(yōu)解pbest,即粒子自身目前找到的最優(yōu)位置,第i個(gè)粒子的pbest集合表示為pi=(pi1,pi2,…pid,…,piD);(2)全局最優(yōu)解gbest,即所有粒子中目前所搜到的最優(yōu)位置,集合表示為pg=(pg1,pg2,…,pgd,…,pgD).第i個(gè)粒子的速度v更新公式為
式中:k為迭代次數(shù);w為慣性權(quán)重;c1、c2為學(xué)習(xí)因子,以避免算法陷入局部最優(yōu)提高收斂速度;r1和r2為隨機(jī)因子,以保證迭代過程中的多樣性.
慣性權(quán)重w的表達(dá)式為
式中:kmax為設(shè)定的最大迭代次數(shù).w可以調(diào)整全局和局部的尋優(yōu)搜索能力,較大的w值利于粒子逃出局部極小值點(diǎn),較小的w值可以加快算法收斂速度并提高解的精度[18].
第i個(gè)粒子的位置z更新公式為
筆者選擇了以下超參數(shù)及搜索區(qū)間進(jìn)行粒子群優(yōu)化:批處理尺寸bs=[32,64,128],每個(gè)LSTM層的神經(jīng)元數(shù)量Nunit=[20,30,40,50,60,70,80,90],學(xué)習(xí)率lr=(0.0001∶0.01),舍棄層舍棄概率dr=(0.1∶0.4),設(shè)定迭代次數(shù)kmax為170次,選用粒子數(shù)量為20.結(jié)合K折交叉后的損失函數(shù)與迭代次數(shù)的關(guān)系如圖11所示,隨著迭代次數(shù)增加,損失函數(shù)逐漸收斂在最小值附近.
圖11 損失函數(shù)與迭代次數(shù)關(guān)系 Fig.11 Relationship between loss function and number of iterations
圖12為不同超參數(shù)的優(yōu)化結(jié)果.圖12a~12b中,在離散量的優(yōu)化中,隨著迭代次數(shù)增加,粒子逐漸集中在最優(yōu)的bs=32,Nunit=70.圖12c~12d中,在連續(xù)量的優(yōu)化中,隨著迭代次數(shù)增加,粒子逐漸縮小搜索范圍,lr在0.001附近波動(dòng),dr在0.3附近波動(dòng).最終得到最優(yōu)的超參數(shù)組合為bs=32、Nunit=70、lr=0.001088和dr=0.3306.
圖12 不同超參數(shù)粒子群優(yōu)化法結(jié)果 Fig.12 Results of particle swarm optimization
將優(yōu)化后的超參數(shù)代入神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,隨后在測(cè)試集上測(cè)試神經(jīng)網(wǎng)絡(luò)的表現(xiàn),將早燃預(yù)測(cè)概率的閾值選為0.5,即當(dāng)模型預(yù)測(cè)早燃概率大于0.5時(shí),判定結(jié)果為早燃,此時(shí)其均方根誤差(RMSE)為0.110,在4877個(gè)測(cè)試集中的判斷正確率為98.50%.由于定義早燃起始時(shí)刻為CA5,因而當(dāng)早燃判出時(shí)刻在CA5與CA10之間時(shí),則模型具有良好的提前性;當(dāng)判出時(shí)刻在CA10與CA50之間,則提前性一般;當(dāng)判出時(shí)刻晚于CA50,則不具有提前性.在LSTM神經(jīng)網(wǎng)絡(luò)中,76.09%的早燃循環(huán)在CA10前就被判斷出來,模型具有較好的提前性,為循環(huán)內(nèi)采取早燃抑制手段提供了更多時(shí)間和可能性.
為了驗(yàn)證LSTM神經(jīng)網(wǎng)絡(luò)在離子電流早燃判斷問題上的優(yōu)越性,建立了前饋(BP)神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)(SVM)判別模型作為對(duì)照,其中BP神經(jīng)網(wǎng)絡(luò)采用與LSTM神經(jīng)網(wǎng)絡(luò)相同的拓?fù)浣Y(jié)構(gòu):1層輸入層、6層隱藏層和1層輸出層,每個(gè)隱藏層的神經(jīng)元數(shù)量為70個(gè);SVM對(duì)照組中采用高斯核函數(shù),對(duì)SVM的超參數(shù)采用K折交叉驗(yàn)證配合粒子群優(yōu)化法進(jìn)行優(yōu)化.3種模型的結(jié)果如表3所示,MAE為平均絕對(duì)誤差,可知LSTM的各項(xiàng)誤差要小于其他兩種判別模型,在CA10前判斷出早燃的概率也高于其他兩種模型.
表3 3種判別模型的結(jié)果 Tab.3 Results of three discriminant models
同時(shí)利用受試者工作特征曲線法(ROC)對(duì)3種模型的分類性能進(jìn)行比較.當(dāng)改變模型早燃預(yù)測(cè)概率的判別閾值時(shí),真陽率和假陽率也會(huì)發(fā)生相應(yīng)的變化,每個(gè)閾值對(duì)應(yīng)一組真陽率和假陽率.對(duì)于理想的分類模型,存在某一個(gè)閾值使假陽率為0,真陽率為1.通過對(duì)3種模型取不同的閾值,繪制出以假陽率為橫坐標(biāo)、真陽率為縱坐標(biāo)的散點(diǎn)圖,再將所有點(diǎn)依次連接得到ROC圖,如圖13所示.由ROC圖曲線下面積(AUC)對(duì)模型分類性能進(jìn)行量化,曲線下的面積越大,表征模型對(duì)早燃判別的能力越強(qiáng).
圖13 3種模型的ROC Fig.13 ROC of three models
表4為三者的AUC對(duì)比.完美判別模型的AUC=1.0,隨機(jī)猜測(cè)的AUC=0.5,當(dāng)AUC為0.5~0.7時(shí),分類模型略優(yōu)于隨機(jī)猜測(cè),具有較低的參考價(jià)值,當(dāng)AUC為0.7~0.9時(shí),模型具有中等參考價(jià)值,當(dāng)AUC大于0.9時(shí),為可靠的預(yù)測(cè)模型,具有很高的參考價(jià)值.可知LSTM模型AUC明顯高于BP模型,且略優(yōu)于SVM模型,具有更強(qiáng)的分類性能.
表4 3種模型的AUC值 Tab.4 AUC of three models
相比于基于閾值的判別方法(真陽率為89.71%和假陽率為8.77%),從ROC圖中可見,LSTM神經(jīng)網(wǎng)絡(luò)判別模型明顯具有更高的準(zhǔn)確性,同時(shí)還保證了良好的提前性,對(duì)于發(fā)動(dòng)機(jī)工作過程中早燃工況的循環(huán)內(nèi)抑制更具有實(shí)際意義,符合基于離子電流判別早燃的根本目標(biāo).可知,綜合考慮計(jì)算成本與計(jì)算準(zhǔn)確率和提前量,LSTM神經(jīng)網(wǎng)絡(luò)判別法相比于閾值判別法更適用于離子電流早燃判定.
(1) 構(gòu)造了針對(duì)離子電流早燃檢測(cè)的LSTM神經(jīng)網(wǎng)絡(luò)模型,利用K折交叉驗(yàn)證配合粒子群優(yōu)化法,優(yōu)化了神經(jīng)網(wǎng)絡(luò)超參數(shù),并最終在測(cè)試集中獲得均方根誤差為0.110、準(zhǔn)確率為98.50%.
(2) 橫向比較了LSTM神經(jīng)網(wǎng)絡(luò)、BP神經(jīng)網(wǎng)絡(luò)和SVM共3種深度學(xué)習(xí)判別模型;相比于BP神經(jīng)網(wǎng)絡(luò)和SVM,LSTM神經(jīng)網(wǎng)絡(luò)判別模型具有更低的誤差和更高的準(zhǔn)確率,同時(shí)76.09%的早燃循環(huán)在CA10前即可檢出,具有更好的提前性;利用ROC判別法對(duì)3種模型進(jìn)行對(duì)比,LSTM模型的AUC達(dá)到了0.9989,分類性能優(yōu)于其他兩種模型.
(3) 相比于常規(guī)離子電流閾值方法(真陽率為89.71%和假陽率為8.77%),LSTM神經(jīng)網(wǎng)絡(luò)判別法雖然計(jì)算成本更高,但具有更高的準(zhǔn)確性,LSTM神經(jīng)網(wǎng)絡(luò)判別法更加符合離子電流早燃判別的根本目標(biāo),相比于其他方法更具有優(yōu)越性.