上官偉,孟月月,楊嘉明,蔡伯根,b
(北京交通大學(xué) a.電子信息工程學(xué)院,b.軌道交通控制與安全國家重點(diǎn)實(shí)驗(yàn)室, c.北京市電磁兼容與衛(wèi)星導(dǎo)航工程技術(shù)研究中心,北京 100044)
高速列車速度快、效率高,列控車載設(shè)備是保證高速列車運(yùn)行安全的關(guān)鍵系統(tǒng)之一,在列車運(yùn)行過程中其發(fā)生的任何故障或安全隱患,若不能得到及時(shí)診斷并進(jìn)行有效處理將導(dǎo)致災(zāi)難性后果.列控車載設(shè)備結(jié)構(gòu)復(fù)雜,依靠人工經(jīng)驗(yàn)的故障診斷方式已無法滿足現(xiàn)場需要.因此,建立一套可以靈活獲取和識(shí)別關(guān)鍵故障信息的智能診斷系統(tǒng),實(shí)現(xiàn)故障的高效診斷并減少對維修人員的依賴,具有重要的意義.
目前,運(yùn)用于鐵路信號(hào)設(shè)備故障診斷上的智能故障診斷技術(shù)[1]可分為以下三類.1)基于系統(tǒng)集成的故障樹診斷技術(shù).文獻(xiàn)[2]建立了系統(tǒng)的結(jié)構(gòu)和功能的動(dòng)態(tài)故障樹模型,采用分層迭代的方法對動(dòng)態(tài)故障樹分析法優(yōu)化,以提高可靠性指標(biāo)的精度.2)基于符號(hào)推理的案例推理診斷技術(shù).文獻(xiàn)[3]采用案例推理診斷方法,進(jìn)行智能診斷檢索技術(shù)研究,對于案例推理的診斷技術(shù)在大型系統(tǒng)中診斷精度不高、推理較慢的問題,設(shè)計(jì)了結(jié)合方案,將神經(jīng)網(wǎng)絡(luò)作為分類器以及案例檢索的算法,提高學(xué)習(xí)速度.3)基于數(shù)值推理的模糊理論、貝葉斯網(wǎng)絡(luò)等診斷技術(shù).文獻(xiàn)[4]提出一種基于數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)混合算法故障診斷網(wǎng)絡(luò),用于軌道電路的故障診斷.設(shè)計(jì)出BP-LM-PSO-GA混合算法,解決單獨(dú)設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)帶來的運(yùn)算量問題,為軌道電路故障診斷的應(yīng)用提出了新方法.文獻(xiàn)[5]建立了一個(gè)在多屬性指標(biāo)下故障態(tài)勢的模糊貝葉斯決策模型,綜合運(yùn)用模糊數(shù)學(xué)及決策理論克服貝葉斯推理時(shí)忽略先驗(yàn)概率的不足,得出故障查找順序,提高現(xiàn)場技術(shù)人員的工作效率.文獻(xiàn)[6-7]建立了一個(gè)貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)模型,初期采用基于K2算法、MCMC算法和專家知識(shí)的融合算法對其結(jié)構(gòu)進(jìn)行優(yōu)化,對武廣高鐵車載設(shè)備故障追蹤表的故障數(shù)據(jù)進(jìn)行實(shí)例分析,驗(yàn)證了模型的有效性;后續(xù)針對故障文本信息的不規(guī)范性和隨意性,從文本數(shù)據(jù)挖掘的角度出發(fā),通過主題模型實(shí)現(xiàn)故障數(shù)據(jù)的分析和特征提取,且采用貝葉斯網(wǎng)絡(luò)克服車載設(shè)備故障的不確定性來實(shí)現(xiàn)其智能分類和診斷.文獻(xiàn)[8]基于歷史故障數(shù)據(jù)得到故障征兆,利用粗糙集理論對故障征兆進(jìn)行屬性約簡,降低訓(xùn)練模型的復(fù)雜度,結(jié)合專家知識(shí)與故障數(shù)據(jù)訓(xùn)練,改進(jìn)貝葉斯網(wǎng)絡(luò)模型,并將故障征兆關(guān)聯(lián)關(guān)系融入模型中,該方法對提升列控系統(tǒng)故障診斷的智能化水平具有借鑒意義.
基于神經(jīng)網(wǎng)絡(luò)的故障診斷是智能診斷理論和方法的核心內(nèi)容之一,其在故障診斷領(lǐng)域的應(yīng)用主要由兩個(gè)方面組成:首先是以故障征兆作為網(wǎng)絡(luò)模型的輸入,診斷結(jié)果作為輸出,神經(jīng)網(wǎng)絡(luò)作為分類器;其次,在上述基礎(chǔ)上采用算法融合的方式,將神經(jīng)網(wǎng)絡(luò)和其他算法組成復(fù)雜的模型,以提高故障診斷準(zhǔn)確率.
本文作者采用貝葉斯正則化(Bayesian regularization,BR)算法對BP神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練性能函數(shù)進(jìn)行優(yōu)化,經(jīng)試驗(yàn)表明BR優(yōu)化的神經(jīng)網(wǎng)絡(luò),其分類能力優(yōu)于傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò),但是仍有部分樣本的實(shí)際輸出與目標(biāo)輸出的偏差過大.原因是在傳統(tǒng)神經(jīng)網(wǎng)絡(luò)中,模型不會(huì)將車載設(shè)備前后時(shí)刻的運(yùn)行狀態(tài)信息相結(jié)合.對任意時(shí)刻的列車運(yùn)行信息進(jìn)行分類時(shí),若結(jié)合歷史運(yùn)行信息,對當(dāng)前時(shí)刻運(yùn)行狀態(tài)診斷就更加準(zhǔn)確.因此,利用長短時(shí)記憶網(wǎng)絡(luò)(Long Short Term Memory,LSTM)的記憶特性,建立LSTM和優(yōu)化神經(jīng)網(wǎng)絡(luò)的級(jí)聯(lián)模型,使用300T型列控車載設(shè)備故障文本數(shù)據(jù)多次對模型進(jìn)行學(xué)習(xí)訓(xùn)練和測試驗(yàn)證.結(jié)果表明:基于LSTM-BP級(jí)聯(lián)的網(wǎng)絡(luò)模型對未知樣本的分類準(zhǔn)確率可達(dá)到95.10%,能充分學(xué)習(xí)具有時(shí)序特性的故障信息,有效診斷關(guān)機(jī)誤報(bào)和引發(fā)故障等具有復(fù)雜故障特征的故障,驗(yàn)證了該智能故障診斷方案的有效性.
基于神經(jīng)網(wǎng)絡(luò)故障診斷的實(shí)質(zhì)是實(shí)現(xiàn)征兆空間到故障空間的映射.列控車載設(shè)備(簡稱車載設(shè)備)故障診斷的過程從模式識(shí)別的角度看,實(shí)質(zhì)是對列車運(yùn)行信息進(jìn)行故障分類的過程.基于神經(jīng)網(wǎng)絡(luò)的故障診斷系統(tǒng)的總體架構(gòu)如圖1所示,主要分為特征表示、訓(xùn)練過程、分類診斷3部分.
圖1 基于神經(jīng)網(wǎng)絡(luò)的故障診斷系統(tǒng)架構(gòu)Fig.1 Fault diagnosis system architecture based on Neural Network
本文研究的300T型列控車載設(shè)備采用分布式結(jié)構(gòu),各部件之間的邏輯關(guān)系緊密.其主要故障可以分為三大類:
1)應(yīng)答器傳輸單元(Balise Transmission Module, BTM)相關(guān)故障:啟機(jī)時(shí)應(yīng)答器服務(wù)可用程序(Balise Service Available,BSA)故障、運(yùn)行時(shí)BSA故障、BTM端口無效和BTM測試超時(shí).
2)列車接口單元(Train Interface Unit,TIU)相關(guān)故障:由繼電器故障引起的硬件故障、用于列車接口相關(guān)安全信號(hào)的輸入和輸出的VDX單元故障.
3)軟件相關(guān)故障:無線超時(shí)、網(wǎng)絡(luò)資源不可用:網(wǎng)絡(luò)干擾導(dǎo)致通道異常中斷,ATPCU雙系A(chǔ)、B代碼比較不一致等.
通過對300T型車載設(shè)備故障日志和工區(qū)記錄的故障信息表的學(xué)習(xí)和總結(jié),歸納出實(shí)現(xiàn)該型號(hào)車載設(shè)備故障診斷面臨以下問題:
1)故障冗雜.一種故障模式具有多種故障特征組合方式;一個(gè)故障特征可出現(xiàn)在多種故障模式中,不同的故障模式之間通常具有一些相似特性.
2)關(guān)機(jī)誤報(bào).車載設(shè)備在列車斷電后才停機(jī),此時(shí)ATP會(huì)警報(bào)一些模塊出錯(cuò),但其實(shí)ATP本身檢測這些模塊并沒有問題.
3)引發(fā)故障.不同的故障同時(shí)發(fā)生并相互耦合或某一故障發(fā)生后會(huì)引發(fā)其他故障.
獲取故障知識(shí)是建立智能故障診斷系統(tǒng)的前提.以某路局2016年1月至6月,300T型車載設(shè)備的列車運(yùn)行日志AE-log文件為研究對象,歸納出其幾種主要常見的故障模式和故障特征,并對它們分別進(jìn)行編碼,如表1和表2所示.
表1 故障模式
續(xù)表1
表2 故障特征
注:“Balise Port* invalid”和“VDX1:IN* I/O failed”中“*”為端口號(hào)1、2、3….“VDX * port switched to invalid”、“* state wrong”和“* failure, * not ordered”中“*”表示繼電器名稱,主要包括EB、RBR、EBFR等.“Braketest failed in * step”中“*”表示數(shù)字1、2、3….“Aval: ***, Bval: ***”中“***”可取任意值.
準(zhǔn)確提取故障特征構(gòu)建恰當(dāng)?shù)奶卣飨蛄渴潜U瞎收显\斷結(jié)果的基礎(chǔ).假設(shè)車載設(shè)備有n種常見的故障模式:S1,S2,…,Sn,其中第i個(gè)(1≤i≤n)故障模式有m個(gè)故障特征X1,X2,…,Xm,令其特征值分別是Vi1,Vi2,…,Vim,記為Vij(1≤j≤m).一般地,其特征取值可定義為
(1)
根據(jù)特征向量的不同,可以得到相應(yīng)的故障模式,故障模式的特征向量表達(dá)式為
Si=(Vi1,Vi2,…,Vim)
(2)
本文采用上述定義構(gòu)建故障特征向量,結(jié)合故障診斷專家經(jīng)驗(yàn),把300T型列控車載設(shè)備常見的主要故障模式及故障特征信息羅列出來,見表3.
表3 故障特征向量
典型BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示.網(wǎng)絡(luò)訓(xùn)練過程分為前向傳播和后向傳播,前向傳播過程用于計(jì)算網(wǎng)絡(luò)的輸出,后向傳播則是根據(jù)誤差反饋調(diào)整網(wǎng)絡(luò)權(quán)值和偏置.網(wǎng)絡(luò)訓(xùn)練結(jié)束后神經(jīng)元間的連接權(quán)值就代表診斷對象特有的知識(shí).
圖2 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 Structure of BP neural network
記第p個(gè)樣本在輸出層第j個(gè)(1≤j≤m)神經(jīng)元節(jié)點(diǎn)的實(shí)際輸出為ypj期望輸出為tpj,那么BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的誤差指標(biāo)函數(shù)為
(3)
式中:ε是以εp為元素的向量,其Jacabi矩陣記為J.BP神經(jīng)網(wǎng)絡(luò)各層神經(jīng)元的連接權(quán)值用向量W表示,k表示迭代步數(shù),則Wk表示第k次迭代的網(wǎng)絡(luò)權(quán)值向量,下一步新的權(quán)值向量為Wk+1.已知移動(dòng)量Wk+1-Wk很小,則ε的一階Taylor級(jí)數(shù)為
ε(Wk+1)=ε(Wk)+J(Wk+1-Wk)
(4)
因此,誤差指標(biāo)函數(shù)可以寫為
(5)
典型BP神經(jīng)網(wǎng)絡(luò)采用最速下降法,只有在誤差平方和目標(biāo)函數(shù)均為正定函數(shù)時(shí),才能找到最小值,否則必產(chǎn)生局部最小值.采用BR算法優(yōu)化網(wǎng)絡(luò)的訓(xùn)練性能函數(shù)可防止網(wǎng)絡(luò)過擬合,改進(jìn)的目標(biāo)誤差函數(shù)為
E=k1ED+k2EW
(6)
其中
式中:Wi為網(wǎng)絡(luò)權(quán)值.改進(jìn)后的誤差指標(biāo)函數(shù)可以在保證網(wǎng)絡(luò)訓(xùn)練誤差小的同時(shí)使得網(wǎng)絡(luò)具有較小的權(quán)值.比例系數(shù)k1、k2通過貝葉斯方法確定,具體公式如下
(7)
式中:γ為神經(jīng)網(wǎng)絡(luò)的有效參數(shù)個(gè)數(shù),γ=N-2k2tr(H)-1;N為神經(jīng)網(wǎng)絡(luò)參數(shù)總數(shù);H為E的Hessian矩陣.
采用Matlab中的神經(jīng)網(wǎng)絡(luò)工具箱建立模型并對其性能進(jìn)行仿真驗(yàn)證.樣本數(shù)據(jù)來源于某路局2016年1月到6月300T型車載設(shè)備的180組故障數(shù)據(jù):任意選取120組數(shù)據(jù)用于網(wǎng)絡(luò)模型的建立,記為學(xué)習(xí)樣本A;剩余60組數(shù)據(jù)設(shè)為非學(xué)習(xí)樣本,用于評(píng)估網(wǎng)絡(luò)模型的泛化能力,記為未知樣本B.其中,泛化能力是指BP神經(jīng)網(wǎng)絡(luò)將從學(xué)習(xí)樣本中學(xué)習(xí)的知識(shí)應(yīng)用到未知樣本中的能力,網(wǎng)絡(luò)的泛化能力越強(qiáng),對未知樣本的分類準(zhǔn)確率就越高.
神經(jīng)網(wǎng)絡(luò)優(yōu)化模型建立[9]的步驟如下:
1)設(shè)計(jì)網(wǎng)絡(luò)學(xué)習(xí)樣本集.
將樣本A隨機(jī)劃分為3部分,其中70%為訓(xùn)練樣本數(shù)據(jù)(train),用于調(diào)整網(wǎng)絡(luò)結(jié)構(gòu)參數(shù),減小誤差;15%為驗(yàn)證樣本數(shù)據(jù)(validation),實(shí)現(xiàn)驗(yàn)證網(wǎng)絡(luò)的泛化能力,并在網(wǎng)絡(luò)泛化能力不再提高時(shí)終止對網(wǎng)絡(luò)的訓(xùn)練;剩余15%作為測試樣本數(shù)據(jù)(test),用來檢驗(yàn)網(wǎng)絡(luò)的性能.
2)構(gòu)造神經(jīng)網(wǎng)絡(luò)優(yōu)化模型.
根據(jù)所采集的故障信息數(shù)據(jù),數(shù)據(jù)的特征向量維度為18,目標(biāo)輸出維度為10,因此設(shè)計(jì)一個(gè)輸入節(jié)點(diǎn)、隱層節(jié)點(diǎn)、輸出節(jié)點(diǎn)分別為18、10、10的三層BP神經(jīng)網(wǎng)絡(luò)模型.選擇BR算法為網(wǎng)絡(luò)的訓(xùn)練性能函數(shù),采用訓(xùn)練樣本對BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,在網(wǎng)絡(luò)訓(xùn)練的同時(shí)使用驗(yàn)證樣本評(píng)估網(wǎng)絡(luò)的誤差,如果誤差持續(xù)下降,則繼續(xù)訓(xùn)練直到滿足預(yù)定的誤差精度,若誤差連續(xù)6次不下降,即使沒有達(dá)到預(yù)定誤差也將終止訓(xùn)練,以防止神經(jīng)網(wǎng)絡(luò)陷入過擬合現(xiàn)象.訓(xùn)練結(jié)束后,使用測試樣本來檢驗(yàn)訓(xùn)練好的BP網(wǎng)絡(luò),若測試誤差的均方根或誤差最大值、最小值及平均值達(dá)到預(yù)定的誤差要求,則網(wǎng)絡(luò)模型建成.
3)未知樣本的測試驗(yàn)證.
網(wǎng)絡(luò)訓(xùn)練完成之后,輸入未知樣本B,得到模型故障診斷結(jié)果,分析并評(píng)估BP神經(jīng)網(wǎng)絡(luò)優(yōu)化模型的泛化能力.
建立網(wǎng)絡(luò)模型結(jié)構(gòu)和參數(shù)相同的BR優(yōu)化神經(jīng)網(wǎng)絡(luò)模型和典型神經(jīng)網(wǎng)絡(luò)模型,采用相同的學(xué)習(xí)樣本A和未知樣本B,分別對兩個(gè)模型進(jìn)行訓(xùn)練學(xué)習(xí)及模型性能驗(yàn)證分析.
圖3(a)中,BP神經(jīng)網(wǎng)絡(luò)模型學(xué)習(xí)過程中的誤差范圍為[-0.6022,1.109],誤差較大,且較為分散,分類結(jié)果不理想.圖3(b)中,經(jīng)過BR算法優(yōu)化的網(wǎng)絡(luò)模型誤差范圍為[-5.7e-0.7,4.4e-0.7],誤差很小,接近于0,樣本數(shù)據(jù)的分類準(zhǔn)確度有較為明顯的提高.
如圖4所示,BP神經(jīng)網(wǎng)絡(luò)對未知樣本的分類出現(xiàn)較多的偏差,誤差范圍為[-0.6973,1.109],分類結(jié)果不理想;BR優(yōu)化的神經(jīng)網(wǎng)絡(luò)對未知樣本的分類誤差集中分布在零誤差線附近,表明BR優(yōu)化模型的分類能力優(yōu)于BP神經(jīng)網(wǎng)絡(luò),但是仍存在樣本的實(shí)際輸出與目標(biāo)輸出誤差大于0.3的情況.
分析一個(gè)誤診斷的樣本,其目標(biāo)輸出為[0,0,0,0,0,0,0,0,0,1],但觀察到其實(shí)際輸出為[0.8,0.01,-0.01,0.02,0.02,0.03,0,0.01,0.02,0.98],如圖5所示.產(chǎn)生誤差的原因在于該樣本表示的信息為關(guān)機(jī)誤報(bào),是由前一個(gè)時(shí)刻對DMI誤操作引發(fā)的,并不是真正的故障.發(fā)生誤診斷的根本原因在于神經(jīng)網(wǎng)絡(luò)模型的樣本數(shù)據(jù)之間是相互獨(dú)立的,無法分析樣本的關(guān)聯(lián)性,滿足車載設(shè)備具有時(shí)序性特征的故障診斷需求.
圖3 神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)誤差直方圖Fig.3 Error histogram of neural network learning
圖4 神經(jīng)網(wǎng)絡(luò)未知樣本誤差直方圖Fig.4 Error histogram of unknown samples for neural network
圖5 某樣本實(shí)際輸出與目標(biāo)輸出對應(yīng)誤差Fig.5 Errors between actual output and target output
對車載設(shè)備的故障準(zhǔn)確診斷不僅需要分析當(dāng)前時(shí)刻的狀態(tài)信息,還需要結(jié)合歷史運(yùn)行信息.因此,需從時(shí)間序列的角度分析并建立診斷模型.
長短時(shí)記憶網(wǎng)絡(luò)(LSTM)是一種特殊的遞歸神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)[10-11],原始RNN的隱層只有一個(gè)狀態(tài)h,對于短期的輸入較為敏感,而LSTM是在隱層增加了一個(gè)細(xì)胞狀態(tài)c,對RNN的隱層進(jìn)行改進(jìn),實(shí)現(xiàn)學(xué)習(xí)長期信息.
細(xì)胞狀態(tài)c由遺忘門、輸入門、輸出門3種特殊門結(jié)構(gòu)組成.其中,門結(jié)構(gòu)是一種選擇式的結(jié)構(gòu),通過一個(gè)sigmoid或者tanh網(wǎng)絡(luò)層后取[0,1]中的任意值,其功能是判決前一狀態(tài)信息是否可以用于下一樣本,當(dāng)輸出值為1時(shí)表示當(dāng)前樣本的所有信息可用于下一樣本,當(dāng)輸出為0時(shí)表示下一樣本與當(dāng)前樣本無關(guān).
LSTM與典型BP神經(jīng)網(wǎng)絡(luò)相同,包括信息前向傳播過程和誤差反向傳播兩部分.對于單個(gè)LSTM記憶模塊,前向傳播過程如圖6所示.其中:xt為t時(shí)刻的輸入向量,ht為t時(shí)刻的隱層輸出,ft、ot分別為遺忘門、輸出門的輸出,輸入門的輸出包括it和at兩部分.其中:Wf、Uf、Wa、Ua、Wi、Ui、Wo、Uo分別為各個(gè)門結(jié)構(gòu)對應(yīng)的權(quán)值矩陣;bf、ba、bi、bo均為偏置量.
LSTM反向傳播和BP神經(jīng)網(wǎng)絡(luò)類似,為了減小反向傳播誤差,從時(shí)間和網(wǎng)絡(luò)2個(gè)層級(jí)計(jì)算反向傳播方向誤差項(xiàng),其次根據(jù)誤差項(xiàng),計(jì)算相應(yīng)的每個(gè)權(quán)重的梯度,然后采用最速下降法迭代更新所有權(quán)重參數(shù),直到誤差滿足需求.
圖6 LSTM隱層單元結(jié)構(gòu)Fig.6 Hidden layer element structure of LSTM
利用LSTM的長期記憶特性,將LSTM和優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)級(jí)聯(lián),構(gòu)建LSTM-BP級(jí)聯(lián)網(wǎng)絡(luò)模型,實(shí)現(xiàn)車載設(shè)備的智能故障診斷.模型結(jié)構(gòu)如圖7所示.
圖7 基于LSTM-BP級(jí)聯(lián)網(wǎng)絡(luò)的故障診斷模型Fig.7 Fault diagnosis model based on LSTM-BP cascaded network
首先將車載設(shè)備的故障數(shù)據(jù)輸入LSTM,利用該網(wǎng)絡(luò)的記憶特性,分析當(dāng)前時(shí)刻樣本與歷史樣本的關(guān)系,對原始數(shù)據(jù)信息進(jìn)行處理;其次將LSTM隱層輸出作為神經(jīng)網(wǎng)絡(luò)優(yōu)化模型的輸入,完成信息的傳遞;最后通過優(yōu)化的神經(jīng)網(wǎng)絡(luò)完成對故障數(shù)據(jù)樣本的學(xué)習(xí),并完成對未知樣本的故障類型診斷.
LSTM-BP級(jí)聯(lián)網(wǎng)絡(luò)模型的構(gòu)建流程:
1)將原始的故障文本數(shù)據(jù)進(jìn)行特征提取和特征表示,構(gòu)成的訓(xùn)練集為:Ftr={f1,f2,…,fn}.
2)對訓(xùn)練集中的數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,處理后的訓(xùn)練集表示為:X={X1,X2,…,XL},對應(yīng)的理論輸出為Y={Y1,Y2,…,YL}.
3)LSTM網(wǎng)絡(luò)的初始化.給定初始權(quán)值矩陣,初始權(quán)值為均勻分布在[0,1]之間的隨機(jī)數(shù).設(shè)置合理的最大迭代訓(xùn)練次數(shù)和最小誤差值.
4)前向計(jì)算過程.將X輸入隱層,LSTM隱層包括L個(gè)按時(shí)間順序排列的LSTM細(xì)胞,輸入經(jīng)過隱層之后的輸出可以表示為:P={P1,P2,…,PL},Pt=LSTMf(Xt,Ct-1,Ht-1),其中Ct-1,Ht-1分別為前一個(gè)樣本隱層的細(xì)胞狀態(tài)和輸出,LSTMf是LSTM前向計(jì)算函數(shù).
5)誤差反向傳播.LSTM網(wǎng)絡(luò)的輸出作為優(yōu)化后的BP神經(jīng)網(wǎng)絡(luò)的輸入,BP網(wǎng)絡(luò)的實(shí)際輸出與理論輸出的均方誤差作為誤差計(jì)算公式,通過最速下降法調(diào)整LSTM網(wǎng)絡(luò)的權(quán)值和偏置,使網(wǎng)絡(luò)誤差不斷減小,實(shí)現(xiàn)網(wǎng)絡(luò)的優(yōu)化.
6)當(dāng)訓(xùn)練次數(shù)或誤差值滿足要求時(shí)模型停止訓(xùn)練,將未知樣本輸入建立好的模型中對模型分類準(zhǔn)確度進(jìn)行驗(yàn)證分析.
設(shè)置LSTM的記憶窗口長度為5,實(shí)現(xiàn)每個(gè)樣本的隱層輸出都包括著前5個(gè)歷史樣本的信息.其所得的隱層輸出作為BR優(yōu)化神經(jīng)網(wǎng)絡(luò)的輸入,樣本分類標(biāo)簽生成的矩陣作為目標(biāo)輸出來訓(xùn)練整個(gè)網(wǎng)絡(luò).最后使用未知樣本對LSTM-BP級(jí)聯(lián)模型的性能進(jìn)行驗(yàn)證分析.
如圖8和圖9所示,分別為LSTM-BP級(jí)聯(lián)模型對學(xué)習(xí)樣本A和未知樣本B的分類誤差直方圖,可知,LSTM-BP模型在學(xué)習(xí)過程中,誤差均小于0.1,訓(xùn)練好的模型對未知樣本進(jìn)行分類時(shí),幾乎所有的樣本分類誤差均分布在零誤差線附近,表明模型的分類性能較好.
圖8 LSTM-BP網(wǎng)絡(luò)學(xué)習(xí)樣本誤差直方圖Fig.8 Error histogram of learning sample for LSTM-BP network
圖9 LSTM-BP網(wǎng)絡(luò)未知樣本誤差直方圖Fig.9 Error histogram of unknown samples for LSTM-BP network
神經(jīng)網(wǎng)絡(luò)對不同的樣本具有不同的分類結(jié)果,因此,需要對網(wǎng)絡(luò)模型進(jìn)行多次驗(yàn)證,分析其分類能力.分別對典型BP網(wǎng)絡(luò)、BR優(yōu)化的神經(jīng)網(wǎng)絡(luò)和LSTM-BP級(jí)聯(lián)網(wǎng)絡(luò)模型,采用相同的樣本數(shù)據(jù)進(jìn)行多次學(xué)習(xí)訓(xùn)練和測試驗(yàn)證.
在學(xué)習(xí)過程中,學(xué)習(xí)樣本劃分的過程是隨機(jī)的,所有訓(xùn)練樣本也具有隨機(jī)性.如圖10所示,典型BP神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練分類準(zhǔn)確率曲線整體上波動(dòng)很大,而且多數(shù)低于50%,訓(xùn)練分類準(zhǔn)確率期望值為45.24%,說明其分類能力受樣本的影響較大.經(jīng)過BR算法優(yōu)化的網(wǎng)絡(luò)模型的訓(xùn)練分類準(zhǔn)確率期望值為87.65%,對樣本的依賴性明顯降低,對不同樣本的分類能力比較穩(wěn)定,和LSTM網(wǎng)絡(luò)級(jí)聯(lián)后模型的分類準(zhǔn)確率期望值為97.37%.
圖10 學(xué)習(xí)樣本分類結(jié)果對比Fig.10 Comparison of classification results of learning samples
對未知樣本的故障分類,如圖11所示,BR優(yōu)化后模型的對未知樣本的分類準(zhǔn)確率有明顯的提高,分類準(zhǔn)確率的期望值由48.76%提高到85.06%.而且,與典型BP網(wǎng)絡(luò)模型相比,優(yōu)化后的模型分類準(zhǔn)確率曲線波動(dòng)較小,說明其泛化能力較強(qiáng),表明了本文采用BR算法對BP網(wǎng)絡(luò)權(quán)值和結(jié)構(gòu)優(yōu)化方案的可行性.
圖11 BP網(wǎng)絡(luò)和優(yōu)化網(wǎng)絡(luò)對未知樣本分類結(jié)果Fig.11 Classification results of unknown samples by BP network and optimization network
圖12是LSTM-BP級(jí)聯(lián)網(wǎng)絡(luò)模型和BR優(yōu)化的神經(jīng)網(wǎng)絡(luò)模型對相同未知樣本的分類結(jié)果圖.LSTM-BP級(jí)聯(lián)的網(wǎng)絡(luò)模型將對未知樣本分類的準(zhǔn)確率期望值由85.06%提高到了95.10%,而且多次驗(yàn)證的結(jié)果波動(dòng)范圍較小,模型的泛化能力強(qiáng),分類準(zhǔn)確率較高,驗(yàn)證了該智能故障診斷方案的有效性.
圖12 BR優(yōu)化網(wǎng)絡(luò)和LSTM-BP級(jí)聯(lián)網(wǎng)絡(luò)對未知樣本的分類結(jié)果Fig.12 Classification results of unknown samples by BR-optimized network and LSTM-BP cascade network
如表4所示,原始BP網(wǎng)絡(luò)模型只對發(fā)生于車載設(shè)備具體部件、特征不冗雜的故障有分類能力,但這些部件定期檢修更換,故障發(fā)生概率較??;經(jīng)BR優(yōu)化后的BP網(wǎng)絡(luò)模型,可進(jìn)一步診斷具有復(fù)雜特征的故障,這類故障是車載設(shè)備的主要故障;與LSTM級(jí)聯(lián)的BR-BP網(wǎng)絡(luò)模型,可以診斷引發(fā)故障和關(guān)機(jī)誤報(bào)的情況,對減少人工檢修的頻次、提高系統(tǒng)故障管理效率有顯著成效.
表4 三種故障診斷模型的診斷效果
注:“√”表示該模型可實(shí)現(xiàn)該類故障的診斷.
1)采用相同的故障樣本數(shù)據(jù)分別對典型BP網(wǎng)絡(luò)和BR優(yōu)化的BP網(wǎng)絡(luò)進(jìn)行試驗(yàn)驗(yàn)證,通過誤差直方圖反映學(xué)習(xí)過程中樣本期望輸出和實(shí)際輸出之差,典型BP神經(jīng)網(wǎng)絡(luò)模型的故障分類誤差范圍為[-0.6973,1.109],誤差較大,且分布較為分散;經(jīng)BR算法優(yōu)化的模型,其誤差范圍為[-5.7e-0.7,4.4e-0.7],誤差很小,接近于0,表明其較典型BP神經(jīng)網(wǎng)絡(luò)有較好的泛化能力.
2)由于單一的神經(jīng)網(wǎng)絡(luò)無法利用歷史故障樣本信息,容易忽略樣本間的關(guān)聯(lián)信息而導(dǎo)致故障分類不準(zhǔn)確.基于LSTM-BP網(wǎng)絡(luò)的級(jí)聯(lián)模型分類準(zhǔn)確率期望值可達(dá)95.10%,對具有時(shí)間特性的車載設(shè)備故障數(shù)據(jù)具有優(yōu)質(zhì)的分類能力,較單獨(dú)由BR算法優(yōu)化的神經(jīng)網(wǎng)絡(luò)模型的分類準(zhǔn)確率期望值高10.04%,證實(shí)了該智能故障診斷方案的有效性.