仲國(guó)強(qiáng),賈寶柱,肖峰,王懷宇
1 大連海事大學(xué)輪機(jī)工程學(xué)院,遼寧大連116026
2 廣東海洋大學(xué)海運(yùn)學(xué)院,廣東湛江524088
船舶大型中、低速柴油機(jī)的運(yùn)動(dòng)形式和系統(tǒng)結(jié)構(gòu)較為復(fù)雜,部分運(yùn)動(dòng)部件的機(jī)械負(fù)荷和熱負(fù)荷較高,其中潤(rùn)滑、冷卻不良及熱應(yīng)力過(guò)大等問題極易引發(fā)故障,從而影響柴油機(jī)的正常運(yùn)轉(zhuǎn),為船舶安全航行帶來(lái)隱患。目前,船舶柴油機(jī)的故障診斷主要依賴于人為經(jīng)驗(yàn)。然而,隨著船舶智能化的發(fā)展,基于數(shù)據(jù)驅(qū)動(dòng)的智能故障診斷方法可在一定程度上避免建立復(fù)雜的對(duì)象模型或過(guò)度依賴專家經(jīng)驗(yàn)等缺點(diǎn),所以受到了日益廣泛的關(guān)注[1-2]。
柴油機(jī)智能故障診斷一般采用基于小樣本數(shù)據(jù)訓(xùn)練的思路,故需先通過(guò)特征提取算法來(lái)獲取故障信號(hào)特征,然后采用支持向量機(jī)(support vector machine,SVM)、BP 神 經(jīng) 網(wǎng) 絡(luò)(back propagation neural network,BPNN)、極限學(xué)習(xí)機(jī)(extreme learning machine,ELM)等機(jī)器學(xué)習(xí)方法,建立故障診斷模型。賀立敏等[3]利用隨機(jī)森林對(duì)柴油機(jī)的熱工參數(shù)進(jìn)行了特征提取,并通過(guò)SVM 算法診斷了柴油機(jī)的常見故障。Zhang 等[4]利用一種新的時(shí)間尺度分解方法提取了振動(dòng)信號(hào),并采用粒子群優(yōu)化算法對(duì)SVM 參數(shù)進(jìn)行了優(yōu)化,可用于柴油機(jī)故障診斷。Xi 等[5]采用t-SNE 算法對(duì)特征信號(hào)進(jìn)行了特征提取和可視化處理,并建立了ELM 分類器,可用于識(shí)別船舶柴油機(jī)的故障隱患。
然而,在實(shí)際工程應(yīng)用中,基于小樣本數(shù)據(jù)訓(xùn)練的方法無(wú)法獨(dú)立完成深層次的特征提取,一旦訓(xùn)練樣本較多或特征較復(fù)雜時(shí),將易出現(xiàn)陷入局部最優(yōu)解、識(shí)別精度較低和泛化能力較弱等問題[6]。
深度信念網(wǎng)絡(luò)(deep belief network,DBN)是深度學(xué)習(xí)框架下常用的一種概率生成模型,其在大量數(shù)據(jù)樣本下更容易捕捉數(shù)據(jù)特征,具有較強(qiáng)的自主提取特征能力和較高的目標(biāo)識(shí)別精度。與卷積神經(jīng)網(wǎng)絡(luò)算法相比,DBN 具有訓(xùn)練樣本量小、操作靈活簡(jiǎn)單、與其他算法兼容性好等優(yōu)點(diǎn)[7]。車暢暢等[8]和李本威等[9]采用DBN 對(duì)渦扇發(fā)動(dòng)機(jī)的狀態(tài)監(jiān)測(cè)參數(shù)進(jìn)行了處理,診斷了發(fā)動(dòng)機(jī)部件的性能衰退故障。賈繼德等[10]利用連續(xù)小波變換和DBN 對(duì)柴油機(jī)缸蓋振動(dòng)信號(hào)進(jìn)行了特征提取和模型訓(xùn)練,實(shí)現(xiàn)了柴油機(jī)的失火故障識(shí)別。李軍亮等[11]利用DBN 預(yù)測(cè)了發(fā)動(dòng)機(jī)狀態(tài)參數(shù),可為可靠性分析和預(yù)防性維護(hù)工作提供數(shù)據(jù)支持。
通過(guò)結(jié)合無(wú)監(jiān)督學(xué)習(xí)和有監(jiān)督學(xué)習(xí)的特點(diǎn),DBN 算法可以從樣本數(shù)據(jù)中自主學(xué)習(xí)并提取隱性特征,同時(shí)獲取較優(yōu)的初始化權(quán)值,從而避免淺層神經(jīng)網(wǎng)絡(luò)因隨機(jī)初始化權(quán)值而陷入局部最小值和計(jì)算精度較低等問題。為此,本文擬提出一種基于深度信念網(wǎng)絡(luò)的船舶柴油機(jī)故障診斷方法,并將開展故障仿真實(shí)驗(yàn),從而評(píng)估對(duì)比不同算法的計(jì)算精度和泛化性能,用以為柴油機(jī)智能故障診斷提供參考。
深度信念網(wǎng)絡(luò)由多層限制性玻爾茲曼機(jī)(restricted Boltzmann machine,RBM)堆疊而成,每層RBM 通過(guò)調(diào)整神經(jīng)元之間的權(quán)值,即可使整個(gè)神經(jīng)網(wǎng)絡(luò)按照最大概率來(lái)生成訓(xùn)練數(shù)據(jù)[11],從而進(jìn)行特征提取和目標(biāo)識(shí)別。典型的RBM 結(jié)構(gòu)是由1 個(gè)可見層v和1 個(gè)隱含層h組成的雙層網(wǎng)絡(luò),如圖1 所示??梢妼佑糜诮邮蛰斎霐?shù)據(jù),隱含層用于提取數(shù)據(jù)特征,可見層神經(jīng)元與隱含層神經(jīng)元相互連接,而各層內(nèi)的神經(jīng)元?jiǎng)t相互獨(dú)立。
圖1中:v=[v1,v2,...,vn],為可見層單元的n個(gè)輸 入 節(jié) 點(diǎn);h=[h1,h2,...,hm] ,為 隱 含 層 單 元 的m 個(gè)輸出節(jié)點(diǎn);w=[wij]n×m,為輸入層到輸出層的連接權(quán)值矩陣,其中i=1,2,…,n 且j=1,2,…,m;A=[a1,a2,...,an],其中ai為第i 個(gè)可見單元vi的偏置;B=[b1,b2,...,bm],其中bj為第j個(gè)隱含單元hj的偏置。
圖1 限制性玻爾茲曼機(jī)的結(jié)構(gòu)Fig.1 Structure of restricted Boltzmann machine
對(duì)于給定的可見層輸入v和隱含層輸出h,限制性玻爾茲曼機(jī)的能量函數(shù)E( )
v,h|θ為
圖2 深度信念網(wǎng)絡(luò)的訓(xùn)練過(guò)程Fig.2 The training process of deep belief network
基于深度信念網(wǎng)絡(luò)的船舶柴油機(jī)故障診斷方法主要包括離線學(xué)習(xí)和在線識(shí)別2 個(gè)階段,具體步驟如圖3 所示。
步驟1:故障樣本的數(shù)據(jù)預(yù)處理。該項(xiàng)工作包括數(shù)據(jù)標(biāo)準(zhǔn)化處理和故障類型編碼,并劃分為訓(xùn)練樣本集和測(cè)試樣本集。
步驟2:創(chuàng)建基于DBN 的故障診斷模型,設(shè)置RBM 層數(shù)和每層RBM 的節(jié)點(diǎn)數(shù)。
圖3 船舶柴油機(jī)的故障診斷流程Fig.3 Fault diagnosis process of marine diesel engine
步驟3:模型預(yù)訓(xùn)練。將訓(xùn)練樣本集導(dǎo)入模型中,從下而上逐層訓(xùn)練各層RBM,按照式(10)~式(12),獲得各層RBM 的初始化參數(shù)wij,ai,bj。
步驟4:模型微調(diào)。采用BP 神經(jīng)網(wǎng)絡(luò)算法反向調(diào)整預(yù)訓(xùn)練參數(shù),得到最終的DBN 模型。
步驟5:測(cè)試柴油機(jī)故障診斷模型的性能。將測(cè)試樣本集傳入診斷模型,進(jìn)行故障預(yù)測(cè)和實(shí)船工況對(duì)比,從而評(píng)估該故障診斷模型的性能。
步驟6:在線故障識(shí)別。將柴油機(jī)實(shí)時(shí)運(yùn)行數(shù)據(jù)進(jìn)行預(yù)處理,然后導(dǎo)入故障診斷模型,進(jìn)行故障識(shí)別。
以某型船舶柴油機(jī)為研究對(duì)象,采用AVL BOOST 軟件建立故障仿真模型,并開展故障仿真實(shí)驗(yàn)以獲取相關(guān)的熱工性能參數(shù)[14-15]。在100%,90%,80%負(fù)荷工況下,分別設(shè)置單缸供油量不均(d1)、增壓器效率低下(d2)、空冷器效率低下(d3)、噴油過(guò)晚(d4)、噴油過(guò)早(d5)和正常狀態(tài)(d6)這6種運(yùn)行狀態(tài)。同時(shí),設(shè)置增壓器出口(MP1)、空冷器出口(MP2)、排氣總管(MP3)及渦輪出口(MP4)這4 個(gè)測(cè)量點(diǎn),并選取各測(cè)量點(diǎn)的氣體壓力、溫度和流速以及主機(jī)的輸出功率P、輸出扭矩N、最高爆發(fā)壓力Pmax等15 個(gè)熱工性能參數(shù)[3,8-10,14-15]。在100%工況下的6 種運(yùn)行狀態(tài)原始數(shù)據(jù)如表1 所示。根據(jù)故障仿真實(shí)驗(yàn),可以獲得規(guī)模為690×15的訓(xùn)練集和規(guī)模為360×15 的測(cè)試集。訓(xùn)練樣本與測(cè)試樣本是在同等故障模式下的不同樣本,訓(xùn)練樣本可用于評(píng)估其訓(xùn)練效果,測(cè)試樣本可用于評(píng)估模型的泛化能力。
采用DBN 算法建立柴油機(jī)故障診斷模型時(shí),需對(duì)網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)進(jìn)行設(shè)定。根據(jù)經(jīng)驗(yàn),第1 層和最后1 層RBM 的節(jié)點(diǎn)數(shù)量應(yīng)與輸入數(shù)據(jù)樣本的屬性維數(shù)和類別數(shù)對(duì)應(yīng)。本文將RBM 的初始學(xué)習(xí)率設(shè)為0.01,訓(xùn)練數(shù)據(jù)批處理量設(shè)為50,RBM的激活函數(shù)設(shè)為sigmoid 函數(shù)。為了選取相對(duì)較好的網(wǎng)絡(luò)結(jié)構(gòu),避免因網(wǎng)絡(luò)層數(shù)過(guò)多而導(dǎo)致訓(xùn)練成本較大的問題,通過(guò)多次實(shí)驗(yàn),計(jì)算不同層數(shù)的DBN 平均性能,其對(duì)比結(jié)果如表2 所示。
重構(gòu)誤差是DBN 在預(yù)訓(xùn)練階段對(duì)樣本數(shù)據(jù)進(jìn)行特征提取的效果評(píng)價(jià)指標(biāo),重構(gòu)誤差越小,表示學(xué)習(xí)效果越好,其提取特征更具有代表性。從表2 可以看出,隨著網(wǎng)絡(luò)層數(shù)增加,耗時(shí)隨之增加,重構(gòu)誤差逐漸降低到一定程度后略有波動(dòng),而網(wǎng)絡(luò)的準(zhǔn)確率先增加后減小,這是由于網(wǎng)絡(luò)層數(shù)增加到一定數(shù)值后,復(fù)雜網(wǎng)絡(luò)將出現(xiàn)過(guò)擬合的問題。綜合考慮重構(gòu)誤差、準(zhǔn)確率和耗時(shí)3 種性能指標(biāo),本文選擇3 層RBM 作為DBN,并選擇網(wǎng)絡(luò)節(jié)點(diǎn)為15-3-11-9-6 的3 層RBM 進(jìn)行訓(xùn)練。圖4所示為在預(yù)訓(xùn)練階段,3 層RBM 的重構(gòu)誤差隨重構(gòu)次數(shù)的變化曲線。由圖4 可知,每層RBM 的重構(gòu)誤差均隨重構(gòu)次數(shù)的增加而不斷減小,其中第3 層RBM 的重構(gòu)誤差在第56 次重構(gòu)訓(xùn)練時(shí)已降至最小值0.244 9。因此,經(jīng)過(guò)3 層RBM 學(xué)習(xí)之后,即可從原始樣本集中提取代表性較強(qiáng)的特征,同時(shí)對(duì)網(wǎng)絡(luò)參數(shù)進(jìn)行初始化處理。
表1 在不同狀態(tài)下船舶柴油機(jī)的原始狀態(tài)數(shù)據(jù)Table 1 The original state data of marine diesel engine in different states
表2 不同結(jié)構(gòu)的DBN 性能對(duì)比Table 2 Comparison of DBN performance with different structures
在預(yù)訓(xùn)練階段所提取的特征和初始化參數(shù),將作為下一步微調(diào)階段輸入量和網(wǎng)絡(luò)參數(shù)的初始值。在微調(diào)階段,設(shè)置BP 神經(jīng)網(wǎng)絡(luò)算法的最大訓(xùn)練次數(shù)為8 000 次,學(xué)習(xí)率為0.8。為了考察不同激活函數(shù)對(duì)訓(xùn)練效果的影響,對(duì)不同激活函數(shù)softmax,sigmoid,linear 的準(zhǔn)確率進(jìn)行測(cè)試,其對(duì)比結(jié)果如表3 所示。
圖4 3 層RBM 的重構(gòu)誤差隨重構(gòu)次數(shù)的變化曲線Fig.4 The variation of the reconstruction error of the three-layer RBM with the number of reconstructions
從表3 可以看出,softmax 激活函數(shù)的準(zhǔn)確率最 高,sigmoid 次 之,linear 最 低,因 此 本 文 選 擇softmax 作為DBN 微調(diào)階段的激活函數(shù)。在訓(xùn)練過(guò)程中,為了防止深度信念網(wǎng)絡(luò)的過(guò)擬合問題,在微調(diào)階段添加了dropout 算法,并將dropout 系數(shù)設(shè)為0.5。圖5 所示為微調(diào)階段DBN 的訓(xùn)練誤差。經(jīng)過(guò)訓(xùn)練樣本集和測(cè)試樣本集驗(yàn)證,該DBN 模型的故障識(shí)別率分別為98.26%和98.61%。
表3 不同激活函數(shù)的準(zhǔn)確率Table 3 Accuracy of different activation functions
圖5 微調(diào)階段DBN 的訓(xùn)練誤差變化曲線Fig.5 Curves of DBN training error in fine tuning
為了進(jìn)行對(duì)比分析,將DBN 算法所采用的數(shù)據(jù)集分別用于BPNN 和SVM 算法訓(xùn)練。BP 神經(jīng)網(wǎng)絡(luò)采用單隱含層,網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)為15-13-6,學(xué)習(xí)率為0.8,最大迭代次數(shù)為8 000,訓(xùn)練目標(biāo)最小誤差為0.001,并采用logsig 激活函數(shù)和traingdx 訓(xùn)練函數(shù)。SVM 算法的懲罰系數(shù)C 設(shè)為1,核函數(shù)選擇RBF 函 數(shù)。計(jì) 算 機(jī) 配 置 為:Intel(R)Core(TM)i7-4790 CPU,主 頻3.60 GHz,內(nèi) 存12 G,運(yùn) 行Matlab 仿真軟件。
3 種算法對(duì)訓(xùn)練集和測(cè)試集樣本的訓(xùn)練時(shí)間及識(shí)別率如表4 所示,可以看出,DBN 算法的耗時(shí)最長(zhǎng),但對(duì)訓(xùn)練樣本集和測(cè)試樣本集的識(shí)別率較高,這反映了該模型的學(xué)習(xí)訓(xùn)練效果和泛化能力較好。這是因?yàn)镈BN 具有相對(duì)復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu),可以從原始訓(xùn)練樣本集中提取更深層次的代表性隱含特征,并且在進(jìn)行BP 神經(jīng)網(wǎng)絡(luò)算法訓(xùn)練之前就獲取了較好的初始化參數(shù),故其在微調(diào)階段網(wǎng)絡(luò)訓(xùn)練的效果更好,從而提高了診斷模型的精度。后,可以準(zhǔn)確識(shí)別的各類別訓(xùn)練樣本數(shù)量為d1(110/120),d2(120/120),d3(120/120),d4(120/120),d5(120/120),d6(56/90)和d1(110/120),d2(120/120),d3(120/120),d4(120/120),d5(120/120),d6(76/90)。由此可知,3 種算法都可以準(zhǔn)確識(shí)別運(yùn)行狀態(tài)d2~d5的訓(xùn)練樣本,但易錯(cuò)誤識(shí)別d1和d6這2 種狀態(tài)的樣本;其中DBN 算法的識(shí)別錯(cuò)誤率最低,對(duì)故障狀態(tài)d1和正常狀態(tài)d6的識(shí)別錯(cuò)誤分別為4 個(gè)和8 個(gè),低于BPNN 和SVM 算法。診斷方法具有較強(qiáng)的泛化能力。
表4 3 種算法故障診斷精度的對(duì)比結(jié)果Table 4 Comparison of fault diagnosis accuracy of three algorithms
圖6 3 種算法對(duì)訓(xùn)練樣本集識(shí)別結(jié)果的混淆矩陣Fig.6 Confusion matrix of recognition results of training sample sets by three algorithms
圖7 3 種算法對(duì)測(cè)試樣本集識(shí)別結(jié)果的混淆矩陣Fig.7 Confusion matrix of recognition results of test sample sets by three algorithms
本文將深度信念網(wǎng)絡(luò)應(yīng)用于船舶柴油機(jī)故障診斷,實(shí)現(xiàn)了原始故障樣本數(shù)據(jù)的深層次隱含特征提取和神經(jīng)網(wǎng)絡(luò)參數(shù)初始化,提升了故障診斷模型的精度和泛化性能。根據(jù)某型船用柴油機(jī)故障仿真的樣本驗(yàn)證結(jié)果:基于DBN 的船用柴油機(jī)故障診斷方法具有較高的識(shí)別精度(高達(dá)98.26%);DBN 算法的故障診斷精度優(yōu)于BPNN 算法和SVM 算法。需注意的是,與其他機(jī)器學(xué)習(xí)方法類似,DBN 算法也是通過(guò)對(duì)樣本庫(kù)數(shù)據(jù)進(jìn)行學(xué)習(xí)而成,因此目前無(wú)法識(shí)別新的故障狀態(tài)。此外,調(diào)整DBN 的網(wǎng)絡(luò)結(jié)構(gòu)和訓(xùn)練次數(shù)時(shí),需要依靠一定程度的人為經(jīng)驗(yàn),這有待進(jìn)一步深入研究。