樊紅衛(wèi) 胡德順 高爍琪 張旭輝 曹現(xiàn)剛
(1.西安科技大學(xué)機(jī)械工程學(xué)院 陜西西安 710054; 2.陜西省礦山機(jī)電裝備智能監(jiān)測重點(diǎn)實(shí)驗(yàn)室 陜西西安 710054)
機(jī)械設(shè)備中的傳動(dòng)齒輪在長期運(yùn)行過程中,受到潤滑油、負(fù)載變化等因素的影響,經(jīng)常會(huì)出現(xiàn)磨損現(xiàn)象。磨損原因主要有主、從動(dòng)輪表面粗糙度和硬度不匹配[1];潤滑油黏度過低[2];負(fù)載加重和循環(huán)次數(shù)增加[3]。據(jù)統(tǒng)計(jì),齒輪傳動(dòng)失效引起的機(jī)械故障在總故障中占比約80%,其中磨損約占40%。一旦發(fā)生磨損故障,不僅會(huì)加劇系統(tǒng)的振動(dòng)噪聲,還會(huì)降低傳動(dòng)精度和效率,甚至引發(fā)斷齒等嚴(yán)重的機(jī)械事故[4]。
機(jī)械磨損檢測技術(shù)已有很長的發(fā)展歷史,主要有放射性檢測、磨粒分析、振動(dòng)檢測、光學(xué)檢測、電學(xué)檢測、磁學(xué)檢測、聲學(xué)檢測、壓痕方法等[5],這些技術(shù)在各自領(lǐng)域取得了良好效果。如,張雪英等[6]通過振動(dòng)信號的小波閾值降噪與遺傳算法優(yōu)化的支持向量機(jī)實(shí)現(xiàn)了齒輪磨損識別;SHI等[7]提出了一種改進(jìn)的磨粒電感檢測法,彌補(bǔ)了普通電感法檢測非鐵磁性金屬顆粒能力不足的問題。
磨粒分析中的鐵譜分析應(yīng)用廣泛,是機(jī)械磨損檢測的重要手段。PENG等[8]提出了一種高斯背景混合模型和斑點(diǎn)檢測算法,對潤滑油中磨損顆粒進(jìn)行檢測,提取了磨粒形狀和尺寸特征,實(shí)現(xiàn)了磨粒在線監(jiān)測。WU等[9]提出了一種恢復(fù)方法來減少在線鐵譜圖像中散焦模糊問題,用卷積神經(jīng)網(wǎng)絡(luò)構(gòu)造退化模型,實(shí)驗(yàn)驗(yàn)證了所提出的恢復(fù)策略能有效提取磨粒特征,具有更高計(jì)算效率。WANG等[10]提出了一種用于識別典型磨損碎片的集成化方法,利用反向傳播神經(jīng)網(wǎng)絡(luò)作為第一級分類,利用卷積神經(jīng)網(wǎng)絡(luò)作為第二級分類,實(shí)驗(yàn)證明了其識別率明顯提高。SUN[11]總結(jié)了柴油機(jī)中常見磨粒特征,將故障機(jī)制與磨粒特征結(jié)合,建立了磨損評價(jià)體系,利用鐵譜分析對柴油機(jī)進(jìn)行監(jiān)測,取得了良好效果。張珊珊等[12]將鐵譜與激光粒度分析技術(shù)綜合應(yīng)用于磨粒識別,既能判斷磨損類型,又能判斷磨損程度。CAO等[13]提出了一種數(shù)據(jù)重構(gòu)與特征提取方法,對監(jiān)測數(shù)據(jù)進(jìn)行重構(gòu)后表征了數(shù)據(jù)變化趨勢,提取了磨損狀態(tài)特征并進(jìn)行了磨損預(yù)測,實(shí)驗(yàn)結(jié)果表明改進(jìn)的模型能提供更早的異常警報(bào),預(yù)測性能良好。LI等[14]針對基于傳統(tǒng)梯度算法的前饋神經(jīng)網(wǎng)絡(luò)易陷入局部極小值問題,提出了基于極限學(xué)習(xí)機(jī)的鐵譜磨粒圖像識別方法,獲得了較好分類效果。閆建陽等[15]提出了一種磨粒圖像多特征融合識別方法,提取了鐵譜圖像磨粒紋理、顏色和幾何特征,歸一化后運(yùn)用SVM與D-S證據(jù)理論實(shí)現(xiàn)了鐵譜圖像識別,準(zhǔn)確度高。WANG等[16]提出了基于卷積神經(jīng)網(wǎng)絡(luò)的鐵譜圖像識別方法,對鐵譜圖像進(jìn)行端到端分類,可用ms級的速度處理圖像,實(shí)現(xiàn)在線監(jiān)測。安超等人[17]提出了基于Mask R-CNN的鐵譜磨粒智能識別方法,克服了傳統(tǒng)方法在復(fù)雜圖像背景下對相似磨粒識別難題。
上述研究對磨粒鐵譜圖像的智能識別提供了不同思路,但尚未見將深度信念網(wǎng)絡(luò)用于磨損狀態(tài)識別。本文作者提出一種基于深度信念網(wǎng)絡(luò)的鐵譜圖像智能識別方法,利用鐵譜技術(shù)制備磨粒圖像集來訓(xùn)練網(wǎng)絡(luò)模型,研究模型中各參數(shù)變化對其性能的影響以確定最佳模型,從而實(shí)現(xiàn)機(jī)械磨損故障類型智能識別。
1986年,HINTON和SEJNOWSKI[18]提出了一種基于能量的隨機(jī)神經(jīng)網(wǎng)絡(luò)即玻爾茲曼機(jī),該模型是一種無監(jiān)督訓(xùn)練模型,具有強(qiáng)大的特征提取能力,能夠提取輸入數(shù)據(jù)中深層次、復(fù)雜的高級特征。但是,模型可見層與隱含層內(nèi)神經(jīng)元全連接,訓(xùn)練時(shí)間較長。因此,SMOLENSKY[19]改進(jìn)提出了一種限制的玻爾茲曼機(jī),即受限玻爾茲曼機(jī)(Restricted Boltzmann Machine,RBM)。RBM同樣具有可見層和隱含層,每層包含若干個(gè)神經(jīng)元,不同于玻爾茲曼機(jī)的是RBM層內(nèi)無連接,結(jié)構(gòu)如圖1所示。
圖1 受限玻爾茲曼機(jī)模型
當(dāng)RBM模型中權(quán)重w、可見層偏置b和隱含層偏置c給定,且可見層v和隱含層h的狀態(tài)給定時(shí),模型的能量為
(1)
基于模型能量函數(shù),可得RBM模型的概率分布:
(2)
進(jìn)一步可得到隱含層和可見層神經(jīng)元被激活的概率為
(3)
(4)
式中:Sigmoid(x)是激活函數(shù),表達(dá)式為
(5)
RBM模型的訓(xùn)練目標(biāo)是不斷學(xué)習(xí)模型中各參數(shù),使RBM所表示的邊緣概率分布P(v)盡可能接近訓(xùn)練數(shù)據(jù)所表示的分布,即最大化似然函數(shù):
(6)
式中:θ為訓(xùn)練目標(biāo)參數(shù),包含w、b、c;v(i)為第i個(gè)樣本數(shù)據(jù);m為訓(xùn)練樣本數(shù)量。
(7)
對式(7)進(jìn)行偏導(dǎo)數(shù)計(jì)算得到:
(8)
(9)
(10)
CD算法利用訓(xùn)練樣本初始化可見層狀態(tài),利用式(3)計(jì)算隱含層神經(jīng)元激活概率,從而確定隱含層神經(jīng)元狀態(tài),然后利用式(4)計(jì)算可見層神經(jīng)元激活概率,從而確定可見層神經(jīng)元狀態(tài),完成CD-1算法,將該過程循環(huán)k次即實(shí)現(xiàn)可見層神經(jīng)元的k次重構(gòu),即完成CD-k算法。
深度信念網(wǎng)絡(luò)(Deep Belief Network,DBN)是HINTON等于2006年提出的基于RBM的學(xué)習(xí)模型[21]。DBN的實(shí)質(zhì)是將若干個(gè)RBM串聯(lián)起來構(gòu)成一個(gè)DBN,其中,上一個(gè)RBM的隱含層即為下一個(gè)RBM的可見層,上一個(gè)RBM的輸出即為下一個(gè)RBM的輸入,結(jié)構(gòu)如圖2所示。
圖2 DBN模型結(jié)構(gòu)
DBN模型的訓(xùn)練分為2個(gè)階段:第一階段是預(yù)訓(xùn)練,先用訓(xùn)練樣本訓(xùn)練第一個(gè)RBM,并用訓(xùn)練好的第一個(gè)RBM參數(shù)初始化DBN第一層參數(shù),然后將第一個(gè)RBM的輸出結(jié)果作為第二個(gè)RBM的訓(xùn)練樣本來訓(xùn)練第二個(gè)RBM,訓(xùn)練完后用第二個(gè)RBM參數(shù)初始化DBN的第二層參數(shù),以此類推,直到最后一層;第二階段是微調(diào),初始化DBN所有層參數(shù)后,利用帶標(biāo)簽的訓(xùn)練集有監(jiān)督地訓(xùn)練DBN,微調(diào)DBN各層參數(shù)。DBN模型的訓(xùn)練過程如下:
第一步:初始化DBN模型結(jié)構(gòu);
第二步:根據(jù)設(shè)定的DBN模型結(jié)構(gòu)劃分其中RBM模型;
第三步:利用CD-k算法對每個(gè)RBM模型進(jìn)行參數(shù)訓(xùn)練;
第四步:利用訓(xùn)練完畢的RBM參數(shù)初始化DBN模型中每層參數(shù);
第五步:利用帶標(biāo)簽的數(shù)據(jù)集有監(jiān)督地訓(xùn)練DBN整體模型。
文中通過鐵譜分析技術(shù),結(jié)合DBN模型,實(shí)現(xiàn)對機(jī)械設(shè)備潤滑油中磨粒鐵譜圖像的智能識別。從鐵譜圖像制備到最終故障識別的流程如圖3[21]所示。
圖3 鐵譜圖像智能識別流程
基于DBN的鐵譜圖像智能識別主要有以下步驟:
(1)利用鐵譜儀制備鐵譜圖像數(shù)據(jù)集,并對圖像進(jìn)行預(yù)處理,然后設(shè)置訓(xùn)練集與測試集;
(2)搭建DBN模型框架,根據(jù)輸入數(shù)據(jù)維度和輸出故障類別數(shù)確定網(wǎng)絡(luò)輸入層和輸出層的神經(jīng)元個(gè)數(shù),初始化其中各參數(shù),包括學(xué)習(xí)率、激活函數(shù)、優(yōu)化器等,利用鐵譜圖像數(shù)據(jù)集對模型中關(guān)鍵參數(shù)進(jìn)行研究,確定DBN模型的最佳參數(shù)設(shè)置;
(3)利用鐵譜圖像逐層訓(xùn)練每一層RBM模型,用訓(xùn)練完的RBM模型參數(shù)初始化同層DBN神經(jīng)元的權(quán)重與偏置,將上一層RBM輸出作為下一層RBM輸入,逐層無監(jiān)督訓(xùn)練每一層RBM模型;
(4)預(yù)訓(xùn)練完畢后,利用帶標(biāo)簽的鐵譜圖像數(shù)據(jù)集有監(jiān)督地微調(diào)整個(gè)DBN模型,優(yōu)化各神經(jīng)元的權(quán)重和偏置;
(5)微調(diào)結(jié)束后,DBN模型即可用于鐵譜圖像的智能識別,實(shí)現(xiàn)磨損故障診斷。
由以上鐵譜圖像識別過程可知,DBN將無監(jiān)督預(yù)訓(xùn)練和有監(jiān)督微調(diào)有機(jī)結(jié)合,實(shí)現(xiàn)了鐵譜圖像數(shù)據(jù)深層特征的自動(dòng)提取和故障類別自動(dòng)識別,較傳統(tǒng)故障識別方法極大地提高了故障診斷的準(zhǔn)確率和效率。
為了制備鐵譜圖像,搭建了齒輪傳動(dòng)系統(tǒng),如圖4[22-23]所示,對該系統(tǒng)中齒輪傳動(dòng)部件運(yùn)行一段時(shí)間后的油液進(jìn)行收集,用于制備鐵譜圖像。
圖4 齒輪傳動(dòng)系統(tǒng)
該齒輪傳動(dòng)系統(tǒng)由變頻電機(jī)驅(qū)動(dòng),磁粉制動(dòng)器模擬負(fù)載,包含二級行星輪系和二級直齒輪減速器,利用600XP150齒輪油進(jìn)行潤滑。潤滑油收集完畢后,利用YTF-8分析式鐵譜儀對油液進(jìn)行譜圖制備[22-23],鐵譜儀平臺(tái)如圖5[22-23]所示,是一種典型的分析式鐵譜儀,由制譜系統(tǒng)和顯微成像系統(tǒng)兩部分組成,所得鐵譜圖像存于上位機(jī)中。
圖5 鐵譜分析平臺(tái)
根據(jù)機(jī)械設(shè)備磨損的磨粒特征,可將磨粒分為正常磨粒、切削磨粒、嚴(yán)重滑動(dòng)磨粒、滾動(dòng)磨粒等,相應(yīng)的鐵譜圖像及其特征總結(jié)如表1所示。
表1 磨粒鐵譜圖像與特征
由于鐵譜圖像制備過程復(fù)雜耗時(shí),譜圖質(zhì)量較難控制,故譜圖數(shù)量通常有限,不足以用來訓(xùn)練深度學(xué)習(xí)模型,因此需要對圖像數(shù)據(jù)進(jìn)行擴(kuò)充。通過數(shù)據(jù)增強(qiáng)方法可以快速擴(kuò)充樣本,包括平移、旋轉(zhuǎn)、對比度增強(qiáng)、翻轉(zhuǎn)等方法。文中通過混合使用以上4種方法對原始鐵譜圖像數(shù)據(jù)集進(jìn)行擴(kuò)充,原始小樣本以指數(shù)速率擴(kuò)充成大樣本,在樣本數(shù)量上滿足了深度信念網(wǎng)絡(luò)模型訓(xùn)練要求。此外,對采集到的鐵譜圖像進(jìn)行了背景色處理,極大提高了前景和背景的辨識度。
采用Python語言,基于TensorFlow框架搭建了DBN模型,其輸入層神經(jīng)元個(gè)數(shù)為3 600,第一層隱含層神經(jīng)元個(gè)數(shù)為2 000,第二層隱含層神經(jīng)元個(gè)數(shù)為1 000,第三層隱含層神經(jīng)元個(gè)數(shù)為100,輸出層神經(jīng)元個(gè)數(shù)為4,損失函數(shù)采用交叉熵,優(yōu)化器選擇Adam,然后利用鐵譜圖像數(shù)據(jù)集(包含訓(xùn)練集40 000張,測試集8 000張,訓(xùn)練集每個(gè)類別10 000張,測試集每個(gè)類別2 000張)對模型重要參數(shù)進(jìn)行研究,包括激活函數(shù)、Dropout值、學(xué)習(xí)率和批訓(xùn)練數(shù),從而完成對齒輪工作狀態(tài)(包含正常狀態(tài)、切削磨損、嚴(yán)重滑動(dòng)磨損、滾動(dòng)磨損)的智能診斷。
3.2.1 激活函數(shù)與Dropout值
設(shè)DBN模型中激活函數(shù)分別為Sigmoid和Relu,研究其在不同Dropout值下的表現(xiàn)。圖6示出了激活函數(shù)為Sigmoid,而Dropout值分別為0.2、0.4、0.6時(shí)訓(xùn)練結(jié)果。
圖6 Sigmoid下不同Dropout值對比曲線
圖7示出了激活函數(shù)為Relu,而Dropout值分別為0.2、0.4、0.6時(shí)訓(xùn)練結(jié)果。
圖7 Relu下不同Dropout值對比曲線
表2和表3給出了以上2種情況下模型訓(xùn)練的各項(xiàng)參數(shù)設(shè)置及量化結(jié)果。
表2 Sigmoid下不同Dropout值的結(jié)果對比
表3 Relu下不同Dropout值的結(jié)果對比
觀察圖6和圖7,結(jié)合表2和表3中數(shù)據(jù),發(fā)現(xiàn)同一激活函數(shù)下Dropout值越大,DBN識別正確率越低,其中激活函數(shù)為Sigmoid,Dropout值為0.2和0.4時(shí),正確率逼近100%,可能發(fā)生了過擬合,Dropout值為0.6時(shí)正確率和耗時(shí)較理想;激活函數(shù)為Relu,Dropout值為0.6時(shí)識別正確率過低,為0.2時(shí)耗時(shí)較大,為0.4時(shí)正確率和耗時(shí)較理想。將兩者橫向比較發(fā)現(xiàn),激活函數(shù)為Sigmoid、Dropout值為0.6和激活函數(shù)為Relu、Dropout值為0.4的識別正確率和耗時(shí)均接近。由于Relu函數(shù)可避免梯度消失且簡單快捷,故文中激活函數(shù)選取Relu,Dropout值取0.4。
3.2.2 預(yù)訓(xùn)練學(xué)習(xí)率
設(shè)DBN預(yù)訓(xùn)練學(xué)習(xí)率分別為0.001、0.01、0.1、1.0,研究其對模型性能的影響,圖8所示為訓(xùn)練結(jié)果。
圖8 不同預(yù)訓(xùn)練學(xué)習(xí)率對比曲線
圖8給出了不同預(yù)訓(xùn)練學(xué)習(xí)率下?lián)p失函數(shù)的變化趨勢,表4給出了訓(xùn)練時(shí)各項(xiàng)參數(shù)設(shè)置及量化結(jié)果。
表4 不同預(yù)訓(xùn)練學(xué)習(xí)率的結(jié)果對比
結(jié)合圖8和表4,發(fā)現(xiàn)4種不同預(yù)訓(xùn)練學(xué)習(xí)率中,0.1是較合適的值,它在前5個(gè)訓(xùn)練周期內(nèi)即可達(dá)到0.001、0.01、1.0訓(xùn)練30個(gè)周期時(shí)的效果,甚至更好,且它訓(xùn)練完30個(gè)周期的Loss值比另外3個(gè)均低,故文中預(yù)訓(xùn)練學(xué)習(xí)率設(shè)為0.1。
3.2.3 微調(diào)學(xué)習(xí)率
設(shè)DBN微調(diào)學(xué)習(xí)率分別為0.000 01、0.000 1、0.001、0.01,研究其對模型性能的影響,圖9所示為訓(xùn)練結(jié)果。
圖9 不同微調(diào)學(xué)習(xí)率對比曲線
圖9給出了不同微調(diào)學(xué)習(xí)率下?lián)p失函數(shù)的變化趨勢,表5給出了訓(xùn)練時(shí)各項(xiàng)參數(shù)設(shè)置及量化結(jié)果。
表5 不同微調(diào)學(xué)習(xí)率的結(jié)果對比
結(jié)合圖9和表5發(fā)現(xiàn),當(dāng)微調(diào)學(xué)習(xí)率為0.01時(shí)效果最差,Loss值基本不變;當(dāng)微調(diào)學(xué)習(xí)率為0.000 01時(shí),雖Loss值逐漸減小,但下降速率很慢;當(dāng)微調(diào)學(xué)習(xí)率為0.001或0.000 1時(shí),Loss值迅速下降,達(dá)到穩(wěn)定狀態(tài)耗時(shí)小,基本在前5個(gè)周期內(nèi)可穩(wěn)定。因微調(diào)學(xué)習(xí)率為0.000 1時(shí)Loss值最小,故文中微調(diào)學(xué)習(xí)率取為0.000 1。
3.2.4 批訓(xùn)練數(shù)
設(shè)DBN批訓(xùn)練數(shù)分別為8、16、32、64,研究其對模型性能的影響,圖10所示是訓(xùn)練結(jié)果。
圖10 批訓(xùn)練數(shù)對比曲線
圖10給出了不同批訓(xùn)練數(shù)下識別正確率的變化趨勢,表6給出了訓(xùn)練時(shí)各項(xiàng)參數(shù)設(shè)置及量化結(jié)果。
表6 不同批訓(xùn)練數(shù)的結(jié)果對比
通過圖10和表6發(fā)現(xiàn),隨著批訓(xùn)練數(shù)增大,識別率逐漸提高,且訓(xùn)練時(shí)間遞減。在合理范圍內(nèi)增大批訓(xùn)練數(shù)具有以下優(yōu)點(diǎn):(1)計(jì)算機(jī)內(nèi)存利用率提高,大矩陣乘法并行化效率提高;(2)每運(yùn)行一個(gè)周期所需迭代次數(shù)減少,對相同數(shù)量數(shù)據(jù)集處理速度更快;(3)在一定范圍內(nèi)批訓(xùn)練數(shù)越大,其確定的下降方向越準(zhǔn),引起訓(xùn)練震蕩越小。對比發(fā)現(xiàn),批訓(xùn)練數(shù)為64時(shí)訓(xùn)練時(shí)間最短且各指標(biāo)最好,故文中批訓(xùn)練數(shù)定為64。
綜上,文中DBN模型的最優(yōu)參數(shù)如表7所示。
表7 DBN模型最優(yōu)參數(shù)
表8給出了采用精確率、召回率、F1-score和訓(xùn)練時(shí)間作為DBN模型評價(jià)指標(biāo)的具體結(jié)果。
表8 DBN模型最終結(jié)果
如表8所示,精確率、召回率和F1-score被作為評判DBN模型的指標(biāo)。其中,精確率表示分類為正的樣本中有多少是真正的正樣本,召回率表示正樣本中有多少被分類正確,而F1-score是精確率和召回率的調(diào)和平均數(shù)。由表8可知,最佳的DBN模型訓(xùn)練所需時(shí)間為3.3 h,精確率、召回率和F1-score值均達(dá)到99%以上且極度相近,證明了文中提出的面向鐵譜圖像智能識別的DBN模型達(dá)到了最佳狀態(tài)。
(1)提出了一種基于DBN的設(shè)備磨粒鐵譜圖像智能識別方法。利用DBN特征提取能力提取了鐵譜圖像特征,利用Softmax分類器實(shí)現(xiàn)了故障準(zhǔn)確分類,克服了BP神經(jīng)網(wǎng)絡(luò)等傳統(tǒng)方法的局限性,提高了鐵譜圖像識別與磨損故障診斷的正確率和效率。
(2)利用鐵譜圖像數(shù)據(jù)集對DBN模型中激活函數(shù)、Dropout值、學(xué)習(xí)率和批訓(xùn)練數(shù)等關(guān)鍵參數(shù)進(jìn)行了量化研究。當(dāng)激活函數(shù)取定時(shí),Dropout值越小正確率越高,但應(yīng)防止過擬合;預(yù)訓(xùn)練和微調(diào)的學(xué)習(xí)率為0.1和0.000 1時(shí)效果最佳;隨著批訓(xùn)練數(shù)增大,訓(xùn)練時(shí)間逐漸下降,模型識別正確率逐漸提升。
(3)經(jīng)對采集的鐵譜圖像進(jìn)行背景色處理、數(shù)據(jù)增強(qiáng)等操作后,構(gòu)造了鐵譜圖像數(shù)據(jù)集,利用該數(shù)據(jù)集訓(xùn)練DBN模型并完成測試,結(jié)果表明DBN識別率高達(dá)99%以上,證明該方法具有潛在工程應(yīng)用價(jià)值。