陳立愛(ài),俞宏艷,汪佳奇,陳松
安徽建筑大學(xué)機(jī)械與電氣工程學(xué)院,安徽 合肥 230601
齒輪作為轉(zhuǎn)速調(diào)節(jié)和動(dòng)力傳遞的常用部件,其是否正常運(yùn)行將影響機(jī)電設(shè)備的工作狀態(tài)[1-3]。齒輪在工作過(guò)程中發(fā)生故障的概率較高,因此對(duì)齒輪進(jìn)行故障診斷尤為重要[4-5]。
齒輪故障診斷方法主要包括信號(hào)處理和機(jī)器學(xué)習(xí)兩大類(lèi),信號(hào)處理方法包括傅里葉變換、譜分析、小波變換、模態(tài)分解[6-9]等,機(jī)器學(xué)習(xí)方法包括人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、深度學(xué)習(xí)[10-13]等。如有學(xué)者研究發(fā)現(xiàn),通過(guò)對(duì)經(jīng)驗(yàn)小波方法進(jìn)行改進(jìn),可有效提高滾動(dòng)軸承和齒輪箱故障檢測(cè)效率[14-15]。徐甜甜等提出了結(jié)合變分模態(tài)分解與譜峭度法的齒輪故障診斷方法,并驗(yàn)證了方法的有效性[16]。Lin et al. 提出了一種基于變分模態(tài)分解和布谷鳥(niǎo)搜索參數(shù)優(yōu)化概率神經(jīng)網(wǎng)絡(luò)(PNN)的齒輪箱故障模型,并利用東南大學(xué)齒輪箱數(shù)據(jù)集進(jìn)行了驗(yàn)證[17]。陳如清等將改進(jìn)煙花算法與PNN 融合,確定PNN 的參數(shù)最優(yōu)值,從而實(shí)現(xiàn)了齒輪箱的故障分類(lèi)[18]。傳統(tǒng)的PNN 與其他神經(jīng)網(wǎng)絡(luò)相比,模型網(wǎng)絡(luò)學(xué)習(xí)過(guò)程簡(jiǎn)單,學(xué)習(xí)速度快,并且具有一定的分類(lèi)準(zhǔn)確性和抗噪聲能力[14],但是其關(guān)鍵參數(shù)選擇主要根據(jù)經(jīng)驗(yàn)確定,從而影響了模型對(duì)故障診斷的識(shí)別率。因此,如何優(yōu)化PNN模型平滑因子,提高對(duì)齒輪故障的診斷效率,是PNN 應(yīng)用的關(guān)鍵問(wèn)題。
主成分分析(PCA)是一種常見(jiàn)的數(shù)據(jù)降維方法[19],韓璞、張洪波等分別應(yīng)用該方法與貝葉斯網(wǎng)絡(luò)、PNN 網(wǎng)絡(luò)相結(jié)合,進(jìn)行汽輪機(jī)、模擬電路的故障診斷[20-21]。
PCA 方法步驟如下:
(1)輸入樣本集D={ x1, x2,… , xm};
(3)計(jì)算協(xié)方差矩陣XXT及所對(duì)應(yīng)的特征值和特征向量;
(4)按照累計(jì)貢獻(xiàn)率達(dá)到90%確定數(shù)據(jù)最佳維數(shù)d′;
(5)取最佳d′個(gè)特征值所對(duì)應(yīng)的特征向量ω1,ω2,…,ωd′,輸 出 投 影 矩 陣W*=(ω1,ω2,…,ωd′)。
PNN 是一種以貝葉斯和Parzen 窗函數(shù)法為數(shù)學(xué)基礎(chǔ)的前饋神經(jīng)網(wǎng)絡(luò),其網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)包括輸入層、模式層、求和層和輸出層,如圖1所示。
圖1 PNN 網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)
設(shè)有d個(gè)網(wǎng)絡(luò)輸入向量,表示為X=[x1,x2,…,xd]T;n個(gè)輸出向量,表示為Y=[y1,y2,…,yn]T,訓(xùn)練過(guò)程如下。
(1)輸入層完成訓(xùn)練樣本特征向量X 的接收,并將數(shù)據(jù)向后傳遞。
(2)模式層采用徑向基非線(xiàn)性映射,計(jì)算各模式種類(lèi)與輸入向量的匹配度,并將其輸出至求和層,該層中第i個(gè)類(lèi)別與第k個(gè)神經(jīng)元所對(duì)應(yīng)的函數(shù)為:
式中:i= 1,2,…,d為訓(xùn)練樣本特征值個(gè)數(shù);ωik為連接模式層和求和層的權(quán)值向量;σ為平滑因子,其取值影響著PNN 分類(lèi)的正確識(shí)別率。
(3)求和層把模式層中類(lèi)別相同的隱含神經(jīng)元輸出,依據(jù)Parzen 窗方法得到各類(lèi)別的概率密度函數(shù)估計(jì)值,其輸出公式為:
式中:fi(x)為第i種標(biāo)簽值的輸出;N為第i類(lèi)神經(jīng)元的數(shù)量。
(4)輸出層把從求和層得到的每一類(lèi)概率密度函數(shù)通過(guò)競(jìng)爭(zhēng)神經(jīng)元做閾值辨別,在所有輸出種類(lèi)中選取出匹配度最高的一個(gè)輸出,從而完成隸屬類(lèi)別的判定。
麻雀搜索算法(SSA)提出于2020 年,主要模擬自然界麻雀尋找食物并躲避獵捕的行為[22]。SSA 把麻雀種群分成發(fā)現(xiàn)者、追隨者、警戒者三類(lèi)。發(fā)現(xiàn)者的任務(wù)是覓食并為整個(gè)種群進(jìn)化提供導(dǎo)向,其數(shù)量在整個(gè)種群中占比設(shè)置為10% ~ 20%。追隨者的任務(wù)是緊緊跟隨在發(fā)現(xiàn)者周?chē)M(jìn)行覓食,發(fā)現(xiàn)者和追隨者在進(jìn)化過(guò)程中滿(mǎn)足進(jìn)化規(guī)則條件時(shí)可互換角色。其位置重新計(jì)算的公式[23]分別為:
為了種群安全,SSA 會(huì)在整個(gè)種群中隨機(jī)選取10% ~ 20%的麻雀作為警戒者,警戒者的任務(wù)是作為種群偵察兵,在種群受到外界捕食者威脅時(shí)及時(shí)提醒其他麻雀[22]。警戒者位置更新公式為:
式中:β為服從標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)數(shù),K∈[-1,1],η為最小常數(shù),fm為當(dāng)前適應(yīng)度值,fg為最佳適應(yīng)度值,fω為最差適應(yīng)度值,Xbest為全局最優(yōu)解。
維度過(guò)高的樣本數(shù)據(jù)會(huì)增加問(wèn)題分析的復(fù)雜度,并且影響PNN 分類(lèi)精度。同時(shí),PNN 性能優(yōu)劣與平滑因子σ選取密切相關(guān),傳統(tǒng)做法是根據(jù)經(jīng)驗(yàn)選取,因缺乏理論依據(jù),不能充分發(fā)揮PNN的作用,從而使得樣本維數(shù)較大時(shí)PNN 分類(lèi)器識(shí)別率較低。我們的樣本數(shù)據(jù)維數(shù)較大,對(duì)訓(xùn)練時(shí)間和精度影響較大。因此,我們提出采用PCA 方法對(duì)數(shù)據(jù)進(jìn)行降維,然后利用SSA 對(duì)PNN 的平滑因子σ進(jìn)行優(yōu)化,形成自適應(yīng)概率神經(jīng)網(wǎng)絡(luò),改善PNN 的性能以達(dá)到最佳的齒輪故障識(shí)別率,即PCA-SSA-PNN 故障診斷模型。具體實(shí)現(xiàn)流程如下:
(1)將齒輪故障數(shù)據(jù)導(dǎo)入系統(tǒng);
(2)利用PCA 進(jìn)行數(shù)據(jù)降維;
(3)設(shè)置SSA 算法參數(shù),設(shè)置種群大小、意識(shí)到危險(xiǎn)的麻雀數(shù)量、最大迭代次數(shù)等;
(4)通過(guò)公式(4)至(6)迭代計(jì)算麻雀種群中各角色位置,并計(jì)算在相應(yīng)位置時(shí)的適應(yīng)度值,以更新全局最優(yōu)個(gè)體;
(5)迭代次數(shù)達(dá)到最大設(shè)定值時(shí),輸出全局最優(yōu)平滑因子σ,將樣本數(shù)據(jù)輸入至優(yōu)化后的模型,并輸出齒輪故障診斷結(jié)果。
案例采用康涅狄格大學(xué)齒輪實(shí)驗(yàn)平臺(tái)及其數(shù)據(jù)集,實(shí)驗(yàn)系統(tǒng)及結(jié)構(gòu)如圖2 所示[10]。齒輪振動(dòng)信號(hào)由加速度計(jì)測(cè)量,采樣頻率為20 kHz。
圖2 齒輪實(shí)驗(yàn)系統(tǒng)及結(jié)構(gòu)
數(shù)據(jù)集包括兩部分:采用時(shí)間同步平均處理后的時(shí)域齒輪故障數(shù)據(jù)和角頻域同步分析后的頻域齒輪故障數(shù)據(jù)。齒輪故障包括正常(本文將“正?!币惨暈楣收献R(shí)別的一種結(jié)果)、斷齒、齒根開(kāi)裂、剝落、削尖1(最嚴(yán)重)、削尖2、削尖3、削尖4、削尖5(最輕微)。對(duì)每種齒輪狀態(tài)使用實(shí)驗(yàn)齒輪箱系統(tǒng)采集104 個(gè)信號(hào),一共936 個(gè)樣本,其中每個(gè)樣本包含4 個(gè)齒輪振動(dòng)信號(hào)的3 600 維角頻域數(shù)據(jù)和3 維時(shí)域數(shù)據(jù),我們使用的所有數(shù)據(jù)均在網(wǎng)站https://doi.org/10.6084/m9.figshare.6127874.v1 上公開(kāi)。
在每組樣本中隨機(jī)選取82 個(gè)(共計(jì)738 個(gè))樣本作為訓(xùn)練集,每組剩下的22 個(gè)(共計(jì)198個(gè))樣本作為測(cè)試集。
構(gòu)建PCA-SSA-PNN 故障診斷模型,對(duì)PCA 降維維度,設(shè)置不同的維數(shù)d'觀(guān)察主成分的累計(jì)貢獻(xiàn)率,以得到最佳維數(shù),經(jīng)測(cè)試,當(dāng)d'=200時(shí)累計(jì)貢獻(xiàn)率為90.6%,因此本文設(shè)置d'=200,這樣既將數(shù)據(jù)降維,易于進(jìn)行故障分類(lèi)識(shí)別,又可減少程序運(yùn)行時(shí)間。降維后數(shù)據(jù)歸一化到0~1 之間,以加快訓(xùn)練網(wǎng)絡(luò)的收斂性。由于PNN 層數(shù)固定,輸入層神經(jīng)元個(gè)數(shù)與數(shù)據(jù)維數(shù)一致,不需要設(shè)計(jì)網(wǎng)絡(luò)層數(shù)。我們的樣本數(shù)據(jù)特征原有3 603個(gè),經(jīng)過(guò)PCA 降維后為200 個(gè),因此輸入層神經(jīng)元個(gè)數(shù)為200。輸出層個(gè)數(shù)對(duì)應(yīng)于齒輪故障狀態(tài),故輸出層神經(jīng)元個(gè)數(shù)定為9。SSA-PNN 網(wǎng)絡(luò)的其他參數(shù)設(shè)置如下:種群數(shù)量pop=20,下邊界lb=0.01,上邊界ub=5,適應(yīng)度函數(shù)為為證明PCA-SSA-PNN 網(wǎng)絡(luò)的有效性,我們同時(shí)構(gòu)建了PNN 模型和PCA-PNN 模型,網(wǎng)絡(luò)參數(shù)設(shè)定完成后,通過(guò)MATLAB 進(jìn)行計(jì)算。本文所使用的訓(xùn)練環(huán)境:CPU 為Intel Core i5_8265U CPU,內(nèi)存4G。
由于SSA 算法最大迭代次數(shù)(M)對(duì)預(yù)測(cè)精度和運(yùn)行時(shí)間影響較大,考慮到計(jì)算時(shí)間,同時(shí)為避免陷入局部最優(yōu),經(jīng)測(cè)試后設(shè)置M為25,適應(yīng)度尋優(yōu)曲線(xiàn)如圖3 所示。
圖3 適應(yīng)度尋優(yōu)曲線(xiàn)
由圖3 可知,優(yōu)化后的PCA-SSA-PNN 診斷模型診斷適應(yīng)度下降很快。在SSA 優(yōu)化初期,因個(gè)體適應(yīng)度較低,迭代后網(wǎng)絡(luò)陷入短暫的局部最優(yōu),隨著種群迭代次數(shù)的不斷增加,與最優(yōu)值的差距不斷縮小。一般在迭代5 次后網(wǎng)絡(luò)跳出局部最優(yōu),迅速收斂,快速找到PNN 模型的最佳σ。
PCA-SSA-PNN 模型訓(xùn)練結(jié)束后,其訓(xùn)練效果和誤差如圖4 所示,可見(jiàn)其分類(lèi)訓(xùn)練效果非常好,訓(xùn)練誤差為0,說(shuō)明建立的模型分類(lèi)識(shí)別性能優(yōu)越。
圖4 PCA-SSA-PNN 分類(lèi)訓(xùn)練結(jié)果
由于神經(jīng)網(wǎng)絡(luò)運(yùn)行時(shí)存在隨機(jī)性,因此每種模型均運(yùn)行8 次進(jìn)行對(duì)比,如表1 所示。
表1 各模型識(shí)別率
為加強(qiáng)對(duì)比,將表1 中的識(shí)別率以圖形形式對(duì)比(見(jiàn)圖5)。
圖5 齒輪故障分類(lèi)識(shí)別率對(duì)比
由圖5 可知,在多次運(yùn)行中,PCA-SSA-PNN模型的分類(lèi)正確率均高于其余兩個(gè)模型。若對(duì)所采集的數(shù)據(jù)不進(jìn)行任何處理,傳統(tǒng)PNN 模型進(jìn)行故障診斷,其平均識(shí)別率僅為74.4%。對(duì)數(shù)據(jù)集基于PCA 方法進(jìn)行特征提取后,PCA-PNN 模型的平均識(shí)別率提升到88.3%。經(jīng)SSA 優(yōu)化的PCA-SSAPNN 模型的平均識(shí)別率在PCA-PNN 的基礎(chǔ)上進(jìn)一步提高到92.6%,說(shuō)明了所提出模型的有效性。
每種模型運(yùn)行時(shí)間不同,與標(biāo)準(zhǔn)的PNN 模型相比,優(yōu)化的PCA-SSA-PNN 比較耗時(shí),平均為93.4s,但在可接受的范圍內(nèi)。若使用計(jì)算性能佳的計(jì)算機(jī),可有效減少運(yùn)行時(shí)間。
為與PCA-SSA-PNN 故障診斷模型對(duì)比,文中同時(shí)采用PCA-PNN、PCA-GRNN、PCARBF、PCA-KNN、PNN 模型,訓(xùn)練網(wǎng)絡(luò)最優(yōu)后統(tǒng)計(jì)8 次運(yùn)行的平均值,如表2 所示。
表2 六種模型故障診斷識(shí)別率 單位:%
由表2 可知,PCA-SSA-PNN 齒輪故障診斷模型診斷結(jié)果最佳,優(yōu)化后的齒輪故障診斷模型正確識(shí)別率為92.6%,與PCA-PNN 模型相比故障識(shí)別率提高4.3%,且明顯高于其他網(wǎng)絡(luò)模型的識(shí)別率。這是因?yàn)镻CA 方法對(duì)數(shù)據(jù)集有一定的降噪效果,同時(shí),經(jīng)SSA 優(yōu)化的PNN 模型能找到最佳的σ,因此故障識(shí)別率最佳。
圖6 列出了PNN、PCA-PNN、PCA-SSA-PNN模型8 次運(yùn)行時(shí)最接近平均值的一次可視化診斷結(jié)果。
圖6 三種模型可視化診斷結(jié)果
圖6 中,縱坐標(biāo)1~9 分別對(duì)應(yīng)齒輪正常、斷齒、齒根開(kāi)裂、剝落、削尖1(最嚴(yán)重)、削尖2、削尖3、削尖4、削尖5(最輕微)9 種狀態(tài)。由圖6 可知,PNN 模型錯(cuò)誤識(shí)別樣本明顯多于其余兩種。PCA-PNN 模型的正確識(shí)別率明顯提高,即數(shù)據(jù)經(jīng)PCA 降維后能有效提升識(shí)別率。PCA-SSAPNN 模型的故障診斷正確識(shí)別率最高,錯(cuò)誤識(shí)別樣本僅有9 個(gè),可見(jiàn)該模型用于齒輪故障診斷可行度較高。
由于傳統(tǒng)PNN 對(duì)齒輪故障診斷分類(lèi)預(yù)測(cè)效果不佳,后續(xù)分析對(duì)比僅針對(duì)PCA-PNN 和PCASSA-PNN 模型。統(tǒng)計(jì)兩種模型對(duì)齒輪每種故障的識(shí)別率,如表3 所示。
表3 兩種模型對(duì)每種故障的識(shí)別率(9 種故障) 單位:%
由表3 可知,PCA-PNN 模型對(duì)齒輪各種故障狀態(tài)正確識(shí)別率差別較大,其中正常、斷齒、削尖1、削尖4 識(shí)別率為100%,齒根開(kāi)裂和剝落識(shí)別率分別為77.2%、59.1%。PCA-SSA-PNN 模型對(duì)正常、削尖3、削尖5 的識(shí)別率為100%,識(shí)別率較低的為剝落和削尖4,分別為77.3%和86.4%。
刪除齒輪故障數(shù)據(jù)集中剝落和齒根開(kāi)裂的故障樣本,以剩余7 種齒輪故障樣本基于PCA-PNN和PCA-SSA-PNN 模型按前述步驟重新進(jìn)行齒輪故障診斷,結(jié)果如表4 所示。
表4 齒輪故障診斷識(shí)別率(7 種故障) 單位:%
由表4 可知,降低樣本集數(shù)量后,PCA-PNN模型中識(shí)別率較低的故障仍然存在,削尖2 故障識(shí)別率由之前的86.3%降為68.1%,削尖4 故障識(shí)別率由100%降為86.3%,但總體平均識(shí)別率有所提升,達(dá)到92.2%。PCA-SSA-PNN 模型的削尖3 故障識(shí)別率由100%降為86.3%,削尖5 由100%降為90.9%,總體平均識(shí)別率同樣提升,達(dá)到94.2%。即與之前相比,兩種模型診斷正確識(shí)別率均有所上升,分別增加了3.9%和1.6%。
抗噪能力對(duì)齒輪故障診斷模型的性能評(píng)價(jià)尤為重要,為了測(cè)試我們所建立的PCA-SSA-PNN模型的抗噪性能,在數(shù)據(jù)集中添加隨機(jī)分布噪聲,噪聲系數(shù)為原有特征的1%、3%、6%、10%。
每種情況運(yùn)行5 次取平均值,兩種模型對(duì)齒輪故障分類(lèi)的識(shí)別率如表5 所示。
表5 噪聲系數(shù)改變時(shí)故障診斷識(shí)別率
由表5 可知,齒輪振動(dòng)數(shù)據(jù)集添加隨機(jī)噪聲干擾后,與無(wú)噪聲相比,兩種齒輪故障診斷模型的識(shí)別率均有所降低,但噪聲程度在10%以下時(shí)識(shí)別率仍都大于85%,說(shuō)明均具有一定的抗噪聲能力。PCASSA-PNN 模型在噪聲系數(shù)小于等于3%時(shí),正確識(shí)別率基本不變,而未經(jīng)優(yōu)化的PCA-PNN 模型,故障識(shí)別率下降了2.3%。噪聲系數(shù)為10%時(shí),PCASSA-PNN 模型齒輪故障識(shí)別率為89%。同樣噪聲系數(shù)為10%時(shí),未優(yōu)化的PCA-PNN 模型齒輪故障識(shí)別率下降到85.2%,此時(shí)PCA-SSA-PNN 模型故障識(shí)別率比PCA-PNN 模型高3.8%。故本文建立的PCA-SSA-PNN 模型在噪聲干擾情況下仍具有較高的故障識(shí)別率。另外,兩種模型的運(yùn)行時(shí)間與噪聲系數(shù)之間沒(méi)有明確關(guān)系,即有無(wú)噪聲影響,對(duì)程序的運(yùn)行時(shí)間幾乎沒(méi)有影響。
我們基于齒輪箱振動(dòng)信號(hào),對(duì)齒輪9 種不同的損傷狀態(tài),在根據(jù)經(jīng)驗(yàn)選擇PNN 模型平滑因子從而使模型識(shí)別率不高的情況下,融合主成分分析法、麻雀搜索算法和PNN 模型,提出一種PCASSA-PNN 模型,用于齒輪箱故障診斷,得出以下結(jié)論。
(1)基于PCA 進(jìn)行數(shù)據(jù)集降維,引入SSA 優(yōu)化PNN 模型的平滑因子,建立PCA-SSA-PNN 模型,能有效提升齒輪故障分類(lèi)的正確識(shí)別率,針對(duì)齒輪的9 種損傷狀態(tài),診斷正確識(shí)別率提升到92.6%。
(2)樣本數(shù)量影響模型正確識(shí)別率,文中減少兩種齒輪故障的樣本數(shù)量時(shí)PCA-SSA-PNN 模型識(shí)別率上升1.6%,達(dá)到94.2%。
(3)添加噪聲后,模型故障分類(lèi)識(shí)別率有所降低,但在噪聲系數(shù)為10%時(shí),識(shí)別率仍比PCAPNN 模型高3.8%。因此,PCA-SSA-PNN 模型具有較好的抗噪能力。
長(zhǎng)沙大學(xué)學(xué)報(bào)2023年2期