邢如意,尹洪申
(1.江蘇聯(lián)合職業(yè)技術(shù)學(xué)院徐州財(cái)經(jīng)分院,徐州 221008;2.中國(guó)礦業(yè)大學(xué)物聯(lián)網(wǎng)(感知礦山)研究中心,徐州 221008)
滾動(dòng)軸承作為旋轉(zhuǎn)機(jī)械的重要組成部分,廣泛應(yīng)用于工業(yè)生產(chǎn)的各個(gè)領(lǐng)域,而旋轉(zhuǎn)機(jī)械的健康運(yùn)行取決于滾動(dòng)軸承的健康狀況,雖然現(xiàn)有的滾動(dòng)軸承制造技術(shù)已經(jīng)取得了很大的進(jìn)步,但是惡劣的運(yùn)行條件仍然會(huì)給軸承帶來(lái)不同程度的損傷[1]。隨著損傷的不斷積累,可能會(huì)導(dǎo)致嚴(yán)重的事故,因此為了提高滾動(dòng)軸承的可靠性,保證機(jī)械設(shè)備的安全運(yùn)行,發(fā)展有效的故障診斷技術(shù)具有重要意義[2-3]。
深度學(xué)習(xí)作為一種有效的特征學(xué)習(xí)方法,已經(jīng)廣泛應(yīng)用于滾動(dòng)軸承的故障診斷[4]。深度信念網(wǎng)絡(luò)(deep belief network,DBN)可以直接從低層信號(hào)中提取特征,形成更具代表性的高層表征,無(wú)需研究人員從數(shù)據(jù)中手動(dòng)提取特征。謝佳琪等[5]利用改進(jìn)的DBN處理原始軸承振動(dòng)信號(hào),實(shí)現(xiàn)了軸承故障的自動(dòng)識(shí)別。卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)由于其局部感受野和參數(shù)共享的特點(diǎn)可以大大降低故障數(shù)據(jù)的復(fù)雜性。在一維CNN的基礎(chǔ)上,康濤等[6]通過(guò)多路輸入最大化CNN的特征提取能力,有效地提高了模型的準(zhǔn)確性和抗干擾能力。雖然深度學(xué)習(xí)網(wǎng)絡(luò)表現(xiàn)出良好的性能和穩(wěn)定性,但這些網(wǎng)絡(luò)模型方法依賴于兩個(gè)前提條件:①訓(xùn)練集和測(cè)試集的數(shù)據(jù)必須符合同一概率分布;②在訓(xùn)練網(wǎng)絡(luò)的過(guò)程中需要足夠的數(shù)據(jù)。然而,在機(jī)械設(shè)備運(yùn)行過(guò)程中,滾動(dòng)軸承的健康狀態(tài)會(huì)隨著時(shí)間發(fā)生變化。導(dǎo)致故障數(shù)據(jù)特征在不同時(shí)間段的分布不同,這種現(xiàn)象使得訓(xùn)練好的深度網(wǎng)絡(luò)無(wú)法長(zhǎng)時(shí)間對(duì)同一任務(wù)保持良好的效果[7]。
為了解決上述問題,域自適應(yīng)遷移網(wǎng)絡(luò)被引入到跨域軸承故障診斷任務(wù)中。CHEN等[8]提出了一個(gè)基于殘差聯(lián)合適應(yīng)對(duì)抗網(wǎng)絡(luò)的無(wú)監(jiān)督遷移學(xué)習(xí)框架,該方法在行星齒輪箱數(shù)據(jù)和滾動(dòng)軸承數(shù)據(jù)兩個(gè)實(shí)驗(yàn)中取得了良好的效果,但上述網(wǎng)絡(luò)只關(guān)注了類標(biāo)簽信息和域標(biāo)簽信息而忽略了連接源域與目標(biāo)域之間的數(shù)據(jù)結(jié)構(gòu)信息;WEN等[9]使用3層稀疏自動(dòng)編碼器來(lái)提取原始數(shù)據(jù)的特征,并應(yīng)用最大平均差異(maximum mean discrepancy,MMD)來(lái)最小化訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)特征之間的差異懲罰,提升了變工況下軸承故障診斷準(zhǔn)確率,但MMD是全局自適應(yīng)的對(duì)齊兩域數(shù)據(jù)分布,沒有考慮類別之間特定域的決策邊界。
針對(duì)以上問題,本文提出了一種基于域?qū)箞D卷積注意力遷移學(xué)習(xí)的故障診斷方法。利用圖卷積網(wǎng)絡(luò)對(duì)實(shí)例圖進(jìn)行建模,完善深度網(wǎng)絡(luò)提取的特征信息,同時(shí)利用LMMD度量不同領(lǐng)域的實(shí)例圖的結(jié)構(gòu)差異,對(duì)齊子域和全局域之間的分布,實(shí)現(xiàn)變工況場(chǎng)景下的精準(zhǔn)故障分類。
常見的SE和CBAM注意力模塊只能沿著信道或空間維度提取特征,生成1D或2D權(quán)重,限制了它們學(xué)習(xí)變化的信道和空間注意力權(quán)重的靈活性[10-11]。而SimAM注意力模塊直接生成三維權(quán)重注意模塊,利用通道和空間共存機(jī)制并共同促進(jìn)信息數(shù)據(jù)的選擇。并且為了更好地評(píng)估每個(gè)神經(jīng)元的重要性,SimAm模塊通過(guò)導(dǎo)出一個(gè)能量函數(shù)傳遞來(lái)找尋每個(gè)神經(jīng)元的重要性[12]。
(1)
圖1 SimAM模塊結(jié)構(gòu)圖
域特征分布對(duì)齊通過(guò)測(cè)量空間距離來(lái)確保源域和目標(biāo)域的特征分布應(yīng)該相似,而域?qū)咕W(wǎng)絡(luò)(domain-adversarial training of neural networks,DANN)的思想來(lái)源于生成對(duì)抗網(wǎng)絡(luò),通過(guò)對(duì)抗性訓(xùn)練確保了神經(jīng)網(wǎng)絡(luò)可以提取領(lǐng)域不敏感的特征信息[13-14]。DANN主要由特征提取器Gf、域鑒別器Gd和故障分類器Gy組成。DANN網(wǎng)絡(luò)流程如圖2所示,首先源域與目標(biāo)域數(shù)據(jù)進(jìn)入Gf后被映射到一個(gè)特征空間中并提取兩域特征信息;其次將提取后的源域數(shù)據(jù)送入Gy中區(qū)分正確的數(shù)據(jù)標(biāo)簽;然后將提取的兩域數(shù)據(jù)經(jīng)過(guò)梯度反轉(zhuǎn)層進(jìn)入Gd中得到域分類標(biāo)簽。DANN網(wǎng)絡(luò)的一方面希望Gy能夠精準(zhǔn)的分類源域數(shù)據(jù)特征類型,保證故障分類器損失最小;另一方面希望Gd無(wú)法準(zhǔn)確區(qū)分兩域數(shù)據(jù)特征類型,使得域鑒別損失越大,通過(guò)這種方式對(duì)齊兩域之間數(shù)據(jù)特征分布。
圖2 DANN網(wǎng)絡(luò)模型圖
在以往的跨領(lǐng)域故障診斷任務(wù)中,基于MMD準(zhǔn)則來(lái)度量不同領(lǐng)域特征分布的相似性是一種非常有效的方法,然而MMD是全局域特征分布的排列,其忽略了源域和目標(biāo)域之間的子域關(guān)系,考慮到同類樣本之間的相關(guān)性,本文引入LMMD來(lái)對(duì)齊同類相關(guān)子域之間的分布。
MMD總是通過(guò)全局?jǐn)?shù)據(jù)來(lái)對(duì)齊子域之間的分布,容易造成子域類別匹配錯(cuò)誤,從而導(dǎo)致域自適應(yīng)模型性能下降。而LMMD通過(guò)深度特征自適應(yīng)和特征學(xué)習(xí)來(lái)匹配源域和目標(biāo)域之間的分布,減少了相關(guān)子域的差異分布,實(shí)現(xiàn)了子域級(jí)別細(xì)粒度的對(duì)比。LMMD的表達(dá)式為:
LMMD2(Ds,Dt)Ec
(2)
GCN是CNN的延伸拓展,是一種專門處理無(wú)規(guī)則數(shù)據(jù)結(jié)構(gòu)的卷積網(wǎng)絡(luò)。假設(shè)一張圖G(A,X),其中A代表它的鄰接矩陣,X代表它的節(jié)點(diǎn)特征。它的對(duì)稱歸一化圖的拉普拉斯矩陣L=IN-D-1/2AD-1/2,其中D是A的對(duì)角度矩陣,IN是單位矩陣。圖譜濾波器gθ=diag(θ)對(duì)輸入信號(hào)x∈RN進(jìn)行平滑處理后可以得到新的圖卷積定義,其表達(dá)式為:
gθ*x=UgθUTx
(3)
式中:θ代表可學(xué)習(xí)的參數(shù),UTx代表節(jié)點(diǎn)x在圖中做的傅里葉變換,Ugθ代表將卷積核映射到頻域。
但是式(3)的圖卷積操作依賴于L的特征分解,因此運(yùn)算十分復(fù)雜,為了解決這個(gè)問題,采用特征值對(duì)角矩陣的切比雪夫多項(xiàng)式逼近卷積核,得到新的卷積核表達(dá)式:
(4)
式中:k是切比雪夫多項(xiàng)式的階數(shù),Λ是L的特征值對(duì)角矩陣。通過(guò)重新定義的GCN操作,對(duì)k鄰距離內(nèi)的節(jié)點(diǎn)信息進(jìn)行聚合,能夠?qū)崿F(xiàn)圖平滑,提升計(jì)算速率。
標(biāo)準(zhǔn)的GCN只能在固定的感受野聚集信息,容易忽略中心節(jié)點(diǎn)與相鄰節(jié)點(diǎn)之間的漸變特征差異,從而造成網(wǎng)絡(luò)特征提取不足的問題。因此本文結(jié)合SimAM注意力模塊,提出了一種基于多感受野SimAM注意力圖卷積網(wǎng)絡(luò)。首先,將原始軸承信號(hào)送入Resnet18網(wǎng)絡(luò)提取故障特征;其次,在Resnet18網(wǎng)絡(luò)中加入SimAM注意力機(jī)制,提高網(wǎng)絡(luò)對(duì)關(guān)鍵信息特征的敏感度;然后,增加GCN的感受野聚合相鄰節(jié)點(diǎn)相對(duì)于中心節(jié)點(diǎn)的漸變特征,通過(guò)融合了它們之間的特征差異,提升網(wǎng)絡(luò)整體的故障特征提取能力,MRF-GCN網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)如圖3所示。
圖3 MRF-GCN網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)圖
為了解決因源域和目標(biāo)域數(shù)據(jù)分布差異過(guò)大而導(dǎo)致的模型診斷能力不足的問題,將DANN和LMMD相結(jié)合,利用DANN網(wǎng)絡(luò)提升兩域數(shù)據(jù)深度特征的表達(dá)一致性,同時(shí)利用LMMD對(duì)兩者高維核空間的數(shù)據(jù)分布進(jìn)行約束,減少模型在子域中的分類誤差,提升了網(wǎng)絡(luò)模型在變工況下的故障分類能力。本文提出的DAGRESL故障診斷模型如圖4所示。
圖4 變工況下DAGRESL故障診斷網(wǎng)絡(luò)模型圖
由圖4可知DAGRESL總的損失函數(shù)由3部分組成:標(biāo)簽分類損失Lc;LMMD損失LLMMD;域判別損失Ld。DAGRESL損失表達(dá)式為:
LDAGRESL=Lc+LLMMD-λLd
(5)
首選,將兩域原始軸承數(shù)據(jù)輸入到Resnet18網(wǎng)絡(luò)中提取軸承故障特征;其次,利用SimAM注意力模塊的通道和空間并存機(jī)制共同促進(jìn)關(guān)鍵特征信息數(shù)據(jù)的選擇,從而得到最終的故障特征;然后,將每個(gè)特征向量視為一個(gè)節(jié)點(diǎn),其值作為節(jié)點(diǎn)特征,送入圖生成層自動(dòng)生成圖形;同時(shí)將獲得的圖形輸入到MRF-GCN,將數(shù)據(jù)結(jié)構(gòu)信息嵌入到節(jié)點(diǎn)特征中。最后,將獲得的節(jié)點(diǎn)特征用于故障分類和領(lǐng)域?qū)褂?xùn)練并完成最終的故障分類。
實(shí)驗(yàn)數(shù)據(jù)通過(guò)CT1002LS加速度傳感器在8 kHz的采樣頻率采集了SQI-MFS實(shí)驗(yàn)臺(tái)的軸承振動(dòng)數(shù)據(jù),SQI-MFS實(shí)驗(yàn)臺(tái)如圖5所示。實(shí)驗(yàn)軸承的型號(hào)為NSK的SER205-16,為了更好的驗(yàn)證模型對(duì)不同軸承損傷類型的故障分類準(zhǔn)確率,用激光分別在內(nèi)圈、外圈、滾動(dòng)體加工雕刻了0.05 mm、0.1 mm、0.3 mm的直徑缺陷。同時(shí)根據(jù)電機(jī)的轉(zhuǎn)速不同共計(jì)采集了900 r/min、1200 r/min、1800 r/min三種轉(zhuǎn)速下的正常軸承數(shù)據(jù)、內(nèi)圈損傷數(shù)據(jù)、外圈損傷數(shù)據(jù)、滾動(dòng)體損傷數(shù)據(jù),分別記為數(shù)據(jù)集D1、D2、D3。3種軸承數(shù)據(jù)集詳情數(shù)據(jù)如表1所示。
表1 SQI-MFS實(shí)驗(yàn)臺(tái)軸承數(shù)據(jù)
圖5 SQI-MFS實(shí)驗(yàn)臺(tái)
為了測(cè)試DAGRESL故障診斷網(wǎng)絡(luò)在變工況下的軸承故障分類準(zhǔn)確率,對(duì)D1、D2、D3三種數(shù)據(jù)集進(jìn)行相互遷移,共計(jì)設(shè)置了6種工況遷移,并分別與已有的深度遷移學(xué)習(xí)方法進(jìn)行比較:MK-MMD[15]、DANN[16]、DSAN[17]。4種方法的實(shí)驗(yàn)結(jié)果圖6所示。
從圖6可知,本文提出的DAGRESL模型不僅在各個(gè)遷移工況中的故障分類準(zhǔn)確率要高于其他3種模型,而且模型的穩(wěn)定性更好。這是因?yàn)槠渌?種模型僅關(guān)注標(biāo)簽分類信息和域標(biāo)簽信息,而忽略了數(shù)據(jù)結(jié)構(gòu)建模,導(dǎo)致深度網(wǎng)絡(luò)提取的特征信息并不完整,從而造成變工況故障分類性能下降。
為了證明本文加入的LMMD度量距離和SimAM注意力模塊對(duì)DAGRESL模型性能的提升,通過(guò)消融實(shí)驗(yàn)進(jìn)行了驗(yàn)證。DAGRES與DAGRESL模型相比沒有加入LMMD度量距離;DAGREL與DAGRESL模型相比沒有加入SimAM注意力模塊。消融實(shí)驗(yàn)結(jié)果如圖7所示。
圖7 SQI-MFS數(shù)據(jù)集變工況消融實(shí)驗(yàn)結(jié)果
從圖7可知,在加入LMMD度量距離后,DAGRESL模型兼顧了目標(biāo)域中不同類別的子領(lǐng)域距離,使特征類間距更小,從而統(tǒng)籌對(duì)齊了子域和全局域之間的分布,實(shí)現(xiàn)了變工況場(chǎng)景下的精準(zhǔn)故障分類;在加入SimAM注意力模塊后,特征提取網(wǎng)絡(luò)利用通道和空間并存機(jī)制共同促進(jìn)信息數(shù)據(jù)的選擇,聚焦更加具有判別力的關(guān)鍵特征信息,從而提高了DAGRESL模型在變工況場(chǎng)景下的故障分類準(zhǔn)確率。
為了更加清晰的分析3種方法在各個(gè)標(biāo)簽的分類結(jié)果,通過(guò)混淆矩陣對(duì)D2-D1的遷移工況任務(wù)進(jìn)行詳細(xì)的分析。圖8為3種模型混淆矩陣消融實(shí)驗(yàn)結(jié)果。
(a) DAGRESL (b) DAGRES
從圖8可以看出,DAGRESL在各個(gè)標(biāo)簽的分類結(jié)果都要優(yōu)于其他兩種模型,再次證明了DAGRESL模型設(shè)計(jì)的合理性。在加入LMMD距離后,DAGRESL模型通過(guò)對(duì)齊子域和全局域之間的分布,有效減少了兩域數(shù)據(jù)之間的分布差異;在加入SimAM注意模塊后,DAGRESL模型對(duì)全局關(guān)鍵信息特征賦予更高的權(quán)重從而豐富特征提取網(wǎng)絡(luò),大大降低了標(biāo)簽錯(cuò)誤分類的概率,進(jìn)一步驗(yàn)證了DAGRESL模型具有較強(qiáng)的變工況故障分類能力。
針對(duì)滾動(dòng)軸承在變工況環(huán)境中網(wǎng)絡(luò)特征提取能力不足的問題,本文提出了一種基于域?qū)箞D卷積注意力遷移學(xué)習(xí)的故障診斷方法,并在SQI-MFS軸承數(shù)據(jù)集上進(jìn)行了驗(yàn)證,通過(guò)實(shí)驗(yàn)我們可以得出以下結(jié)論:
(1)提出的MRF-GCN能夠有效聚合相鄰節(jié)點(diǎn)相對(duì)于中心節(jié)點(diǎn)的漸變特征,融合它們之間的特征差異,提升網(wǎng)絡(luò)整體的故障特征提取能力。
(2)利用SimAM注意模塊的通道和空間并存機(jī)制共同促進(jìn)特征信息數(shù)據(jù)的選擇,聚焦更加具有判別力的關(guān)鍵特征信息,豐富了故障特征提取網(wǎng)絡(luò)模型。
(3)將LMMD與域?qū)咕W(wǎng)絡(luò)相結(jié)合能夠減少相關(guān)子域和全局域之間的結(jié)構(gòu)差異,更好的判斷軸承數(shù)據(jù)所屬域。