国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于坐標(biāo)注意力關(guān)系網(wǎng)絡(luò)的小樣本軸承故障診斷

2024-08-23 00:00:00郭敏陳鵬周超胡國賓范青榮
關(guān)鍵詞:故障診斷軸承

摘 要: 軸承故障診斷對(duì)保障機(jī)械設(shè)備正常運(yùn)轉(zhuǎn)具有重要價(jià)值,基于機(jī)器學(xué)習(xí)的軸承故障診斷是其中一類常用方法,主要包括Alexnet、Resnet-18、關(guān)系網(wǎng)絡(luò)、基于通道注意力SENet 的關(guān)系網(wǎng)絡(luò)(SERN)以及基于混合注意力CBAM 的關(guān)系網(wǎng)絡(luò)(CBRN)等. 在實(shí)際應(yīng)用中,小樣本、變工況等可能導(dǎo)致這些方法出現(xiàn)泛化性能差、精度降低及過擬合等問題. 本文提出了一種基于坐標(biāo)注意力關(guān)系網(wǎng)絡(luò)的小樣本軸承故障診斷方法. 在該方法中,坐標(biāo)注意力關(guān)系網(wǎng)絡(luò)通過坐標(biāo)信息的嵌入和坐標(biāo)注意力的生成來解決關(guān)系網(wǎng)絡(luò)模型無法建立特征圖的長距離依賴關(guān)系及故障的特征位置信息難以獲得的問題,增強(qiáng)模型在目標(biāo)區(qū)域?qū)收咸卣鞯谋磉_(dá),進(jìn)而重構(gòu)出更具判別性的故障樣本特征. 該方法還采用特征嵌入模塊來生成樣本的特征向量,并通過對(duì)已標(biāo)記樣本和未標(biāo)記樣本的特征向量的拼接來生成特征向量組. 最后,該方法利用關(guān)系得分模塊對(duì)特征向量組進(jìn)行非線性距離度量和生成關(guān)系得分,判斷未標(biāo)記樣本的類別、實(shí)現(xiàn)故障分類. 模擬實(shí)驗(yàn)表明,相比已有方法,該方法具有更好的分類能力.

關(guān)鍵詞: 小樣本學(xué)習(xí); 關(guān)系網(wǎng)絡(luò); 故障診斷; 坐標(biāo)注意力機(jī)制; 軸承

中圖分類號(hào): TH133. 3;TP181 文獻(xiàn)標(biāo)志碼: A DOI: 10. 19907/j. 0490-6756. 2024. 047001

1 引言

作為旋轉(zhuǎn)機(jī)械設(shè)備的關(guān)鍵部件之一,軸承起著支撐旋轉(zhuǎn)體的作用. 對(duì)滾動(dòng)軸承故障診斷技術(shù)的研究可以有效提高機(jī)械設(shè)備的運(yùn)轉(zhuǎn)水平,預(yù)防設(shè)備損壞可能引起的重大事故,還可以減少維修費(fèi)用以及設(shè)備停止運(yùn)轉(zhuǎn)造成的經(jīng)濟(jì)損失.

近年來,以深度學(xué)習(xí)為代表的智能故障診斷技術(shù)被廣泛應(yīng)用于軸承故障診斷. 這些方法需要大量穩(wěn)定的樣本數(shù)據(jù)用于訓(xùn)練. 然而,機(jī)器設(shè)備往往在正常狀況下運(yùn)行,故障樣本數(shù)量匱乏,且數(shù)據(jù)呈現(xiàn)非平衡性. 此外,由于工作環(huán)境惡劣及設(shè)備復(fù)雜,設(shè)備往往在不穩(wěn)定工況下運(yùn)行,導(dǎo)致數(shù)據(jù)呈現(xiàn)出強(qiáng)烈的不穩(wěn)定性和時(shí)變性. 因此,軸承故障診斷是典型的小樣本、變工況問題,可能出現(xiàn)傳統(tǒng)深度學(xué)習(xí)方法存在的泛化性能差、診斷精度低及過擬合等問題.

針對(duì)深度學(xué)習(xí)故障診斷技術(shù)的不足,近年來部分學(xué)者在小樣本故障診斷領(lǐng)域取得了一定進(jìn)展,開發(fā)了一些基于數(shù)據(jù)增強(qiáng)、遷移學(xué)習(xí)及元學(xué)習(xí)的小樣本學(xué)習(xí)方法. 小樣本學(xué)習(xí)利用較少的數(shù)據(jù)樣本進(jìn)行模型學(xué)習(xí). 在小樣本故障診斷中,每類故障樣本數(shù)介于幾十個(gè)到幾百個(gè)之間. 數(shù)據(jù)增強(qiáng)方法使用現(xiàn)有輔助數(shù)據(jù)或輔助信息生成新的樣本,實(shí)現(xiàn)對(duì)原始數(shù)據(jù)集的數(shù)據(jù)擴(kuò)充或特征增強(qiáng). 楊光友等[1]用改進(jìn)的生成式對(duì)抗網(wǎng)絡(luò)(SA-ACGAN)對(duì)軸承進(jìn)行故障診斷,實(shí)驗(yàn)測(cè)得模型在故障樣本分布不均衡情況下可取得良好診斷精度. 范旭等[2]提出了生成式對(duì)抗網(wǎng)絡(luò)和卷積自編碼器相融的(GAN-CAE)滾動(dòng)軸承故障診斷方法,對(duì)不平衡數(shù)據(jù)集該模型相比傳統(tǒng)機(jī)器學(xué)習(xí)模型具有更好的泛化性能.

遷移學(xué)習(xí)方法將一個(gè)領(lǐng)域已有的知識(shí)遷移到一個(gè)新的相關(guān)領(lǐng)域中,使得新的相關(guān)領(lǐng)域有更好的學(xué)習(xí)表現(xiàn). 陳仁祥等[3]提出深度置信網(wǎng)絡(luò)(DBN)遷移學(xué)習(xí)故障診斷方法,通過少量已有的標(biāo)記樣本對(duì)DBN 模型進(jìn)行微調(diào),實(shí)現(xiàn)網(wǎng)絡(luò)權(quán)重從源域到目標(biāo)域的遷移以及對(duì)新樣本類別的適應(yīng).值得注意的是,基于數(shù)據(jù)增強(qiáng)的方法不可避免會(huì)帶來生成樣本與真實(shí)樣本間的差異,可能導(dǎo)致增強(qiáng)后的數(shù)據(jù)集和原始數(shù)據(jù)集樣本的分布差異過大,使模型的泛化性能降低. 此外,遷移學(xué)習(xí)方法在面對(duì)源域和目標(biāo)域樣本相似性程度不高時(shí)容易發(fā)生負(fù)遷移[4]現(xiàn)象.

元學(xué)習(xí)(Meta-learning)又稱為學(xué)會(huì)學(xué)習(xí),旨在讓模型學(xué)會(huì)自主進(jìn)行網(wǎng)絡(luò)參數(shù)的調(diào)整,在已有先驗(yàn)知識(shí)的基礎(chǔ)上快速適應(yīng)新任務(wù). 元學(xué)習(xí)方法主要包括基于度量的元學(xué)習(xí)、基于模型的元學(xué)習(xí)以及基于優(yōu)化的元學(xué)習(xí)等3 種. 其中,基于度量的元學(xué)習(xí)通過計(jì)算權(quán)重來表達(dá)樣本間的相關(guān)性,代表模型主要有孿生網(wǎng)絡(luò)[5](Siamese Network)、匹配網(wǎng)絡(luò)[6](Matching Network)、原型網(wǎng)絡(luò)[7](PrototypicalNetwork)和關(guān)系網(wǎng)絡(luò)[8](Relation Network)等.

關(guān)系網(wǎng)絡(luò)作為一種基于度量的元學(xué)習(xí)方法有著良好的泛化性能和工程可移植性,已在故障診斷領(lǐng)域得到一定應(yīng)用. Wu 等[9]提出了基于元學(xué)習(xí)的變工況少樣本遷移學(xué)習(xí)方法,其中的關(guān)系網(wǎng)絡(luò)在極少樣本和相對(duì)簡單的遷移情況下占據(jù)優(yōu)勢(shì)地位. Jiang 等[10]提出了多尺度關(guān)系生成網(wǎng)絡(luò)(MRGN),進(jìn)行小樣本學(xué)習(xí),并通過多尺度特征映射生成樣本間的關(guān)系得分提高模型的分類性能.Wang 等[11]提出具有特征融合和加權(quán)的多尺度決策網(wǎng)絡(luò)(MSDN),設(shè)計(jì)了非線性特征融合項(xiàng),將支持集和查詢集的每層通道的對(duì)應(yīng)特征進(jìn)行非線性拼接,以增強(qiáng)網(wǎng)絡(luò)的擬合能力.

然而,上述這些方法并未考慮到故障信號(hào)圖像內(nèi)部信息間的關(guān)聯(lián)性. 關(guān)系網(wǎng)絡(luò)提取特征時(shí)所采用的卷積神經(jīng)網(wǎng)絡(luò)無法捕捉全局的特征信息,存在長距離依賴問題. 關(guān)系網(wǎng)絡(luò)并未考慮到不同卷積核提取特征的通道信息與位置信息對(duì)度量分類器的影響,可能導(dǎo)致故障特征提取困難[12],造成模型在變工況情況下無法識(shí)別隱藏在圖像中的特征信息.

本文提出了一種坐標(biāo)注意力關(guān)系網(wǎng)絡(luò)(Coor?dinate Attention Relation Network,CARN)故障診斷方法. 在對(duì)標(biāo)記數(shù)據(jù)的需求不高的前提下,該方法可以讓網(wǎng)絡(luò)聚焦于故障特征,減輕對(duì)非必要信息的關(guān)注,更大限度地捕捉故障特征的關(guān)鍵信息,提高故障分類能力. 該方法首先通過坐標(biāo)注意力模塊生成樣本的注意力特征圖,建立特征圖的長距離依賴關(guān)系,以充分捕捉特征圖內(nèi)部的精確位置信息以及有效的特征信息,建立卷積通道之間的聯(lián)系,提高模型的代表性以及特征表達(dá)能力. 隨后,通過關(guān)系網(wǎng)絡(luò)嵌入模塊,該方法生成樣本的特征向量,并將標(biāo)記樣本和未標(biāo)記樣本的特征向量進(jìn)行拼接,通過關(guān)系模塊計(jì)算出樣本之間的關(guān)系得分,判斷未標(biāo)記樣本所屬類別,實(shí)現(xiàn)小樣本條件下軸承的故障診斷. 最后,我們利用凱斯西儲(chǔ)大學(xué)(Case Western Reserve University,CWRU)的軸承數(shù)據(jù)進(jìn)行驗(yàn)證,并將該方法的結(jié)果與Alexnet、Resnet-18、基于通道注意力SENet 的關(guān)系網(wǎng)絡(luò)(SERN)和基于混合注意力CBAM 的關(guān)系網(wǎng)絡(luò)(CBRN)模型的計(jì)算結(jié)果進(jìn)行了對(duì)比,發(fā)現(xiàn)該模型性能更佳、診斷精度更高,適用于小樣本、變工況情況下的軸承故障診斷.

2 理論

軸承故障診斷技術(shù)面臨著小樣本、變工況的問題. 工況因素的變化使得故障樣本的特征差異增大,可能導(dǎo)致傳統(tǒng)的深度學(xué)習(xí)方法在變工況的環(huán)境下模型對(duì)新的故障類別診斷精度低,泛化性能差的問題. 此外,雖然深度遷移學(xué)習(xí)方法通過將已學(xué)到的故障特征遷移到新工況下,可以在一定程度上解決此類問題,但軸承故障診斷還面臨著故障樣本數(shù)量少、樣本分布不均衡的問題,可能造成在深度遷移學(xué)習(xí)模型訓(xùn)練過程中模型參數(shù)無法得到較好調(diào)整,導(dǎo)致過擬合問題,降低診斷精度.

本文采用基于元學(xué)習(xí)的關(guān)系網(wǎng)絡(luò)進(jìn)行故障診斷. 通過元學(xué)習(xí)的訓(xùn)練策略進(jìn)行關(guān)系網(wǎng)絡(luò)的訓(xùn)練,模型在多個(gè)類別和任務(wù)上進(jìn)行自適應(yīng)學(xué)習(xí),能更快地從有限的樣本中學(xué)到關(guān)鍵特征. 此外,該模型通過元學(xué)習(xí)在一個(gè)任務(wù)上學(xué)習(xí)模型的初始參數(shù),通過在新任務(wù)上進(jìn)行參數(shù)微調(diào),可以將已學(xué)到的知識(shí)遷移到新的任務(wù)中. 這樣,模型在有限故障訓(xùn)練樣本的情況下通過將已學(xué)習(xí)到的故障特征遷移到新的工況中達(dá)到故障遷移分類的目的,提高對(duì)新故障類別診斷的泛化性能.

2. 1 元學(xué)習(xí)

元學(xué)習(xí)是一種機(jī)器學(xué)習(xí)方法. 通過元學(xué)習(xí)能夠很好地實(shí)現(xiàn)小樣本分類任務(wù),對(duì)只有少量標(biāo)簽樣本的全新類別進(jìn)行分類預(yù)測(cè). 有別于傳統(tǒng)監(jiān)督學(xué)習(xí)將數(shù)據(jù)集混合后按比例劃分為訓(xùn)練集和測(cè)試集,元學(xué)習(xí)中的訓(xùn)練集和測(cè)試集來源于不同分布,即訓(xùn)練集和測(cè)試集數(shù)據(jù)是不交叉的.

假設(shè)有一個(gè)訓(xùn)練集D,如圖1 所示. 從訓(xùn)練集的每個(gè)類別中挑選幾個(gè)樣本,這些樣本的集合稱為支持集(Support Set). 從每個(gè)類別剩下的樣本中挑選另外幾個(gè)樣本,這些樣本的集合稱為查詢集(Query Set). 支持集的數(shù)據(jù)帶有標(biāo)簽,查詢集的數(shù)據(jù)不帶標(biāo)簽,且支持集和查詢集共享相同的樣本空間. 我們用支持集來訓(xùn)練模型,用查詢集來測(cè)試模型.

元學(xué)習(xí)在構(gòu)建分類任務(wù)時(shí),如果在訓(xùn)練集中隨機(jī)挑選N 個(gè)類別,每個(gè)類別挑選K 個(gè)標(biāo)記樣本作為支持集S={( xi,yi ) }Mi=1 ( M=N*K),并在這N類樣本的剩余部分作為查詢集Q={( xj,yj ) }Cj= 1,則稱其為N-way K-shot 情景訓(xùn)練策略.

元學(xué)習(xí)的情景訓(xùn)練策略分為元訓(xùn)練和元測(cè)試2 個(gè)階段,如圖1 所示. 在元訓(xùn)練階段,給定多個(gè)子訓(xùn)練任務(wù),每個(gè)任務(wù)之間的類別不完全相同,每個(gè)子訓(xùn)練任務(wù)的數(shù)據(jù)均劃分為支持集和查詢集,其中支持集為N 個(gè)類別,每個(gè)類別包括K 張圖片. 通過多個(gè)子任務(wù)的支持集訓(xùn)練各個(gè)子任務(wù)的模型參數(shù),再通過每個(gè)子任務(wù)的查詢集測(cè)試模型性能并更新參數(shù). 經(jīng)過大量任務(wù)訓(xùn)練后,模型在元測(cè)試階段執(zhí)行多個(gè)相似于元訓(xùn)練階段的新任務(wù),此時(shí)新任務(wù)中的類別都未在元訓(xùn)練階段出現(xiàn)過,模型借助訓(xùn)練數(shù)據(jù)去對(duì)未標(biāo)記的測(cè)試數(shù)據(jù)進(jìn)行分類.

2. 2 關(guān)系網(wǎng)絡(luò)

關(guān)系網(wǎng)絡(luò)(Relation Network)是一種基于度量的元學(xué)習(xí)方法,其結(jié)構(gòu)如圖2 所示,由2 個(gè)模塊組成:嵌入模塊(Embedding Module)和關(guān)系模塊(Relation Module).

嵌入模塊用于挖掘圖像中有用的特征信息.當(dāng)網(wǎng)絡(luò)的輸入為圖像時(shí),嵌入模塊將分別提取支持集和查詢集的特征,分別表示為

fφ ( xi )= Ge ( xi ; θe ) (1)

fφ ( xj )= Ge ( xj ; θe ) (2)

其中,fφ (xi)為支持集第i 個(gè)樣本的特征,f φ ( xj ) 為查詢集第j 個(gè)樣本的特征,Ge ( )為嵌入模塊,θe 為相應(yīng)參數(shù). 隨后,將查詢集的特征向量fφ ( xj ) 和支持集的特征向量fφ (xi)拼接起來,將其記為

f ijcon = C ( fφ ( xi ),fφ ( xj ) ) (3)

其中C( · ) 為拼接操作. 用關(guān)系模塊對(duì)拼接好的特征向量組進(jìn)行處理,通過關(guān)系函數(shù)生成每個(gè)類對(duì)應(yīng)的關(guān)系得分rij,其表達(dá)式為

rij = g? ( f ijcon,θr ) (4)

其中g(shù)? ( · ) 為關(guān)系模塊,用于計(jì)算支持集樣本和查詢集樣本的相似性得分,θr 為相應(yīng)參數(shù).

關(guān)系網(wǎng)絡(luò)的嵌入模塊由4 個(gè)卷積塊和2 個(gè)池化層組成,關(guān)系模塊由2 個(gè)卷積塊、2 個(gè)池化層和2個(gè)神經(jīng)元個(gè)數(shù)分別為8 和1 的全連接層組成,每個(gè)卷積塊都由1 個(gè)卷積層、1 個(gè)批量歸一化(BatchNorm,BN)層和1 個(gè)Relu 非線性激活函數(shù)組成.與歐氏度量、余弦度量等傳統(tǒng)的度量方式相比,關(guān)系網(wǎng)絡(luò)訓(xùn)練了可學(xué)習(xí)的非線性距離度量分類器,從而計(jì)算樣本間的匹配程度.

關(guān)系網(wǎng)絡(luò)采用均方誤差(MSE)作為損失函數(shù),其表達(dá)式如下.

當(dāng)輸入的查詢集和支持集樣本屬于相同類別時(shí),函數(shù)值輸出結(jié)果為1;查詢集和支持集樣本屬于不同類別時(shí),函數(shù)值輸出結(jié)果為0.

2. 3 坐標(biāo)注意力機(jī)制

受到工況因素不斷變化的影響,所采集到的軸承振動(dòng)信號(hào)中一般包含大量不相關(guān)噪聲,故障信號(hào)特征微弱,難以檢測(cè). 受到人類生物系統(tǒng)的啟發(fā),注意力機(jī)制已被大量應(yīng)用于深度神經(jīng)網(wǎng)絡(luò). 注意力機(jī)制對(duì)提取特征的不同部分產(chǎn)生對(duì)應(yīng)的權(quán)重,從而強(qiáng)化模型重要的部分、削弱不重要部分的影響. Hu 等[13]提出了基于通道域的注意力模型(SENet),通過分配給卷積通道相應(yīng)權(quán)重有效提高了模型表達(dá)特征的能力. Zhang 等[14]提出一種金字塔分割注意力模型(PSA),通過對(duì)每個(gè)通道上的張量進(jìn)行不同大小的卷積運(yùn)算,再通過SENet 賦予各通道相應(yīng)權(quán)重從而獲取通道注意力,最終輸出多個(gè)尺度融合的特征圖. Park 提出基于空間域和通道域的注意力模型BAM[15]、CBAM[16],模型將卷積神經(jīng)網(wǎng)絡(luò)提取的特征圖分別沿通道和空間這兩個(gè)維度賦予注意力權(quán)重,加強(qiáng)對(duì)重要特征的表達(dá),對(duì)輸入特征進(jìn)行自適應(yīng)細(xì)化. 值得注意的是,上述注意力模塊的網(wǎng)絡(luò)計(jì)算參數(shù)量較大,且忽略了卷積特征圖內(nèi)部的位置信息,因而無法很好地關(guān)注局部重要信息.

本文引入了混合域注意力模塊——坐標(biāo)注意力(Coordinate Attention, CA)[17]. 坐標(biāo)注意力關(guān)注輸入數(shù)據(jù)中不同位置或坐標(biāo)之間的關(guān)系,強(qiáng)調(diào)空間信息的重要性,而非僅僅關(guān)注特征之間的相對(duì)關(guān)系. 相較于其他注意力機(jī)制,坐標(biāo)注意力在提取故障樣本的特征時(shí)通過賦予不同卷積核通道對(duì)應(yīng)的權(quán)重信息建立卷積特征通道之間的聯(lián)系,在關(guān)注樣本的全局信息的同時(shí)利用空間域內(nèi)特征的依賴關(guān)系精確捕獲位置信息,使模型更加專注于包含重要特征信息的區(qū)域,重構(gòu)出更具判別性的特征,增加度量分類器的準(zhǔn)確率,提升模型的診斷性能. 坐標(biāo)注意力模塊的結(jié)構(gòu)如圖3 所示.

當(dāng)坐標(biāo)注意力模塊輸入一個(gè)高度為H,寬度為W,通道數(shù)為C 的圖像時(shí),為方便注意力模塊捕捉圖像空間上的長距離依賴關(guān)系,首先使用下面的公式(6)將全局池因子化,分解為一對(duì)一維特征編碼操作.

給定輸入后,通過2 個(gè)空間域內(nèi)的池核(H,1)和(1,W)沿寬和高方向?qū) 個(gè)通道進(jìn)行編碼,此時(shí)第C 個(gè)通道高度H 方向的輸出可以表示為

與式(7)類似,第C 個(gè)通道寬度W 方向的輸出可以表示為

這樣,通過沿寬度方向和高度方向進(jìn)行相應(yīng)操作可以使注意力模塊在捕捉圖像空間域內(nèi)長距離依賴關(guān)系的同時(shí)還精確保留任一方向的位置信息,使模塊更加精確地定位自身感興趣的特征區(qū)域.

為了有效獲取各通道之間的聯(lián)系,將沿寬度方向和高度方向編碼的輸出進(jìn)行拼接,隨后采用1×1 的卷積核對(duì)拼接的特征進(jìn)行卷積操作,將通道維度降成C/r(其中r 為縮減參數(shù),可用于控制塊的大小). 采用批量歸一化層和Relu 非線性激活函數(shù)進(jìn)行操作,加快模型的收斂速度并增強(qiáng)網(wǎng)絡(luò)的非線性表達(dá)能力. 再對(duì)特征圖維度進(jìn)行分割操作,使拼接的維度還原成原始維度,分別采用2 個(gè)1×1 的卷積核將2 個(gè)特征圖通道數(shù)還原,利用Sigmoid 函數(shù)分別得到每個(gè)通道對(duì)應(yīng)的H 和W 的權(quán)重,隨之實(shí)現(xiàn)特征圖的重構(gòu).

坐標(biāo)注意力塊不會(huì)改變輸入圖像的大小. 在圖像保持大小不變的情況下,注意力塊建立了特征卷積通道之間的聯(lián)系,每個(gè)卷積通道空間內(nèi)更受關(guān)注的區(qū)域有著更高權(quán)重,因而重構(gòu)后的圖像能表現(xiàn)出更具判別性的特征.

3 坐標(biāo)注意力關(guān)系網(wǎng)絡(luò)模型

針對(duì)軸承故障診斷樣本數(shù)量少、故障特征不明顯及工況復(fù)雜等特性,基于坐標(biāo)注意力關(guān)系網(wǎng)絡(luò)的小樣本故障診斷模型(CARN)的結(jié)構(gòu)如圖4所示.

CARN 模型的故障診斷流程如下.

1) 數(shù)據(jù)采集與劃分. 通過傳感器采集軸承的原始振動(dòng)信號(hào). 此時(shí)采集的數(shù)據(jù)是一維振動(dòng)信號(hào),故障特征非常隱蔽. 采用連續(xù)小波變換(ContinuousWavelet Transform,CWT)對(duì)信號(hào)進(jìn)行相應(yīng)處理,將其轉(zhuǎn)化為二維時(shí)頻域信號(hào),使故障特征顯現(xiàn)出來. 將處理后的小波時(shí)頻圖按元學(xué)習(xí)策略進(jìn)行數(shù)據(jù)集劃分為包含支持集和查詢集的訓(xùn)練集和測(cè)試集,其中訓(xùn)練集和測(cè)試集的樣本分布來自不同空間,類別不重疊.

2) 模型訓(xùn)練階段. 輸入樣本在前向傳播階段首先經(jīng)過坐標(biāo)注意力模塊對(duì)其進(jìn)行特征重構(gòu),獲取更為顯著的特征,輸出重新分配權(quán)重的特征圖.通過關(guān)系網(wǎng)絡(luò)嵌入模塊提取重構(gòu)后的特征,然后將支持集和查詢集的樣本特征向量進(jìn)行拼接,形成特征向量組,用關(guān)系模塊計(jì)算特征向量組的相似性關(guān)系. 模型最終經(jīng)過Sigmoid 函數(shù)輸出一個(gè)在[0,1]范圍內(nèi)的相似性得分,輸出的結(jié)果越接近1代表樣本之間的相似程度越高,輸出的結(jié)果越接近0 代表樣本之間相似程度越低. 通過將關(guān)系得分限制在0 到1 之間可以確保輸出結(jié)果的一致性.模型訓(xùn)練得出的結(jié)果經(jīng)過標(biāo)準(zhǔn)化輸出使得樣本得分均在區(qū)間范圍內(nèi),更利于模型處理異常值,并使得輸出的結(jié)果呈現(xiàn)出可解釋性.

訓(xùn)練時(shí)采用Adam 優(yōu)化器,并采用均方差損失函數(shù)(MSE)評(píng)估預(yù)測(cè)得分和真實(shí)得分之間的差異. 在反向傳播階段更新模型的權(quán)重和偏置,使損失函數(shù)值逐步減小,經(jīng)過反復(fù)訓(xùn)練,使模型收斂.

3) 模型測(cè)試階段. 將已標(biāo)記的樣本和未標(biāo)記的樣本一并輸入到已經(jīng)訓(xùn)練好的模型中,嵌入模塊將未標(biāo)記樣本與每類標(biāo)記樣本分別進(jìn)行拼接,通過關(guān)系模塊計(jì)算樣本之間的關(guān)系得分判斷出未標(biāo)記樣本的所屬類別.

4 故障診斷實(shí)驗(yàn)

4. 1 實(shí)驗(yàn)條件

我們采用凱斯西儲(chǔ)大學(xué)(CWRU)的軸承數(shù)據(jù)集[18]對(duì)本文所提出的模型進(jìn)行驗(yàn)證. 軸承試驗(yàn)臺(tái)結(jié)構(gòu)如圖5 所示. 實(shí)驗(yàn)中,通過加速度傳感器采集軸承的振動(dòng)數(shù)據(jù),采樣頻率設(shè)定為12 kHz. 測(cè)試軸承由驅(qū)動(dòng)端軸承(SKF 6205)以及風(fēng)扇端軸承(SKF 6203)組成,采用電火花加工技術(shù)進(jìn)行單點(diǎn)故障生成,故障尺寸大小分別為0. 178、0. 356、0. 534 mm 和0. 028 mm.

實(shí)驗(yàn)采用的4 種軸承狀態(tài)分別為正常狀態(tài)(Normal Class,NC)、內(nèi)圈故障(Inner-race Fault,IF)、外圈故障(Outer-race Fault,OF)以及滾動(dòng)體故障(Rolling-body Fault,RF). 電機(jī)負(fù)載分別設(shè)定為0、1、2 及3 hp,對(duì)應(yīng)的電機(jī)轉(zhuǎn)速分別設(shè)定為1797 、1772、1750 及1730 r/min. 實(shí)驗(yàn)采用的軸承故障數(shù)據(jù)類型如表1 所示.

各種類型的軸承樣本數(shù)據(jù)采集完成后,用重疊采樣進(jìn)行數(shù)據(jù)擴(kuò)充,重疊率設(shè)置為0. 5,每個(gè)樣本由1024 個(gè)數(shù)據(jù)點(diǎn)組成,每種故障類別都包括100 個(gè)樣本,數(shù)據(jù)集樣本總數(shù)為100×40=4000.

圖6 為經(jīng)過連續(xù)小波變換處理后的各類軸承的二維時(shí)頻圖.

4. 2 實(shí)驗(yàn)結(jié)果及分析

4. 2. 1 變負(fù)載故障診斷實(shí)驗(yàn)

為了驗(yàn)證模型在變負(fù)載工況下的泛化性能,我們進(jìn)行樣本變工況故障診斷遷移,相應(yīng)的數(shù)據(jù)集如表2 所示,其中訓(xùn)練集、驗(yàn)證集和測(cè)試集的軸承類型包括正常狀態(tài)、內(nèi)圈故障、外圈故障以及滾動(dòng)體故障,非正常狀態(tài)的軸承故障尺寸為0. 178 mm. 此外,訓(xùn)練集、驗(yàn)證集和測(cè)試集的電機(jī)負(fù)載分別設(shè)置為0、2 以及3 hp,樣本總數(shù)設(shè)置為400,對(duì)應(yīng)于每種狀態(tài)的軸承樣本總數(shù)為100.

1) 不同K 系數(shù)下的變負(fù)載故障診斷. 實(shí)驗(yàn)采用N-way K-shot 情景訓(xùn)練機(jī)制,設(shè)置了不同的K系數(shù). 此處N 的類別確定為4,即NC、IF、OF 及RF,分別進(jìn)行4way-1shot、4way-5shot 及4way-10shot 實(shí)驗(yàn). 訓(xùn)練、驗(yàn)證以及測(cè)試過程中每個(gè)task的支持集和查詢集樣本數(shù)保持一致,即查詢集的數(shù)量根據(jù)K 來定. Adam 優(yōu)化器的初始學(xué)習(xí)率設(shè)置為0. 001,訓(xùn)練迭代次數(shù)設(shè)置為500. 為了確保實(shí)驗(yàn)結(jié)果的準(zhǔn)確性,采用10 次測(cè)試準(zhǔn)確率的平均值進(jìn)行評(píng)估 . 本次實(shí)驗(yàn)過程的硬件配置為 Inte(l R)Core(TM) i5-10400F CPU @ 2. 90 GHz 2. 90 GHz,NVIDIA GeForce RTX 2060;系統(tǒng)環(huán)境為Windows10,Pytorch 版本為1. 11. 0,并在相同實(shí)驗(yàn)條件下與關(guān)系網(wǎng)絡(luò)模型進(jìn)行比較. 模型在不同K-shot 下的故障診斷平均準(zhǔn)確率如圖7 和表3所示.

由圖7 和表3 可知,本文提出的模型準(zhǔn)確率整體上優(yōu)于關(guān)系網(wǎng)絡(luò)RN,坐標(biāo)注意力模塊重構(gòu)的特征更為顯著,使得關(guān)系模塊更易辨別故障類型. 在4way-1shot 實(shí)驗(yàn)中,RN 和CARN 故障診斷準(zhǔn)確率分別達(dá)到了85. 63% 和86. 91%. 在5shot 的情況下,RN 模型準(zhǔn)確率提升了2. 29%,CARN 模型提升了1. 94%. 在10shot 的情況下,CARN 的準(zhǔn)確率達(dá)到了91. 22%,比RN 高出2. 25%. 此外,實(shí)驗(yàn)結(jié)果比較符合小樣本學(xué)習(xí)的分類實(shí)驗(yàn)規(guī)律,即隨著每個(gè)類別樣本數(shù)量K 的增加,分類準(zhǔn)確率會(huì)變高.

2) 不同訓(xùn)練樣本數(shù)量下變負(fù)載故障診斷. 我們通過改變訓(xùn)練集的樣本數(shù)量來驗(yàn)證樣本總數(shù)對(duì)模型診斷精度的影響. 分別設(shè)置訓(xùn)練樣本總數(shù)為100、200 和300,對(duì)應(yīng)每類軸承樣本數(shù)量為25、50和75. 采用預(yù)訓(xùn)練的Alexnet[19]、Resnet-18[20]、RN、基于通道注意力機(jī)制SENET 的關(guān)系網(wǎng)絡(luò)(SERN)以及基于混合注意力機(jī)制CBAM 的關(guān)系網(wǎng)絡(luò)(CBRN)與CARN 進(jìn)行對(duì)比,其中CARN、RN、SERN 以及CBRN 的K 系數(shù)設(shè)定為5. 在訓(xùn)練樣本總數(shù)不同的情況下,各模型的準(zhǔn)確率如圖8 和表4所示.

由圖8 和表4 可知,本文提出的CARN 模型具有最高的故障診斷率. 在樣本總數(shù)為100 時(shí),Alexnet 和Resnet-18 的準(zhǔn)確率分別為72. 34% 和75. 89%;RN、SERN、CBRN 和CARN 分別達(dá)到了80. 8%、81. 25%、82. 1% 和83. 71% 的準(zhǔn)確率,說明在樣本數(shù)量很少的情況下采用非線性分類器的度量模型有著更好的泛化性能;Alexnet 和Resnet-18 則存在輕微的過擬合現(xiàn)象. 隨著樣本總數(shù)的增加,模型的過擬合現(xiàn)象得到有效緩解. 當(dāng)樣本總數(shù)達(dá)到200 時(shí),Alexnet 和Resnet-18 準(zhǔn)確率分別提升了5. 58% 和3. 98%;RN、SERN、CBRN 和CARN分別提升了2. 49%、4. 99%、4. 82% 和3. 4%. 在300 個(gè)總樣本情況下,Alexnet 的準(zhǔn)確率已經(jīng)和RN基本持平,Resnet-18 的準(zhǔn)確率高于RN 和SERN,CBRN 準(zhǔn)確率達(dá)到87. 66%,CARN 則達(dá)到了89. 03%.

綜上,在樣本數(shù)增多的情況下CARN 準(zhǔn)確率依舊高于其他網(wǎng)絡(luò),說明CARN 模型非常適合小樣本條件下軸承的故障診斷,在變工況條件下具有較好魯棒性.

4. 2. 2 不同故障程度診斷實(shí)驗(yàn)

為了驗(yàn)證模型在不同故障程度條件下的泛化性能,診斷實(shí)驗(yàn)隨不同程度的故障進(jìn)行遷移. 樣本數(shù)據(jù)劃分成表5所示,其中訓(xùn)練集、驗(yàn)證集和測(cè)試集的樣本包含內(nèi)圈故障、外圈故障以及滾動(dòng)體故障這3 種類別. 軸承故障尺寸分別設(shè)置為0. 178、0. 356 和0. 534 mm.電機(jī)負(fù)載設(shè)置為1 hp,樣本總數(shù)設(shè)置為300,對(duì)應(yīng)每種故障類別樣本數(shù)設(shè)置為100.

采用Alexnet、Resnet-18、RN、SERN 及CBRN與本文提出的CARN 模型進(jìn)行對(duì)比,每類支持集樣本數(shù)設(shè)定為5. 由圖9 可知,在訓(xùn)練樣本總數(shù)為300 時(shí),RN 準(zhǔn)確率達(dá)到了96. 56%,Alexnet 和Resnet-18 準(zhǔn)確率分別為92. 96% 和94. 27%,SERN、CBRN 以及CARN 的準(zhǔn)確率分別達(dá)到了97. 79%、97. 92% 和98. 75%,CARN 準(zhǔn)確率接近于99%,高于其他模型,說明CARN 模型在小樣本條件下能敏感檢測(cè)到樣本故障程度的變化,具有較好的泛化性能和重構(gòu)特征的能力.

5 結(jié)論

針對(duì)軸承故障診斷方法在樣本數(shù)量少、工況因素差異大的情況下無法識(shí)別隱蔽的樣本特征以及故障特征內(nèi)部之間的聯(lián)系,導(dǎo)致模型泛化性能差、診斷精度低等問題,本文提出了一種基于坐標(biāo)注意力關(guān)系網(wǎng)絡(luò)(CARN)的小樣本學(xué)習(xí)方法用于軸承數(shù)據(jù)的故障診斷. 本文所得結(jié)論如下.

1) 基于關(guān)系網(wǎng)絡(luò)的故障診斷方法通過訓(xùn)練一個(gè)可學(xué)習(xí)的非線性度量分類器,將標(biāo)記樣本和未標(biāo)記樣本的拼接特征向量對(duì)進(jìn)行關(guān)系得分計(jì)算,能夠較好的識(shí)別未標(biāo)記樣本所屬類別,提高模型在小樣本條件下的診斷性能.

2) 本文提出的坐標(biāo)注意力模塊能夠建立特征圖卷積通道之間的聯(lián)系以及特征圖全局的依賴關(guān)系,關(guān)注模型本身感興趣的特征區(qū)域,掌握故障信號(hào)內(nèi)部之間的關(guān)聯(lián)性以及精確的位置信息. 將坐標(biāo)注意力模塊置于CARN 模型的頂端,進(jìn)行軸承故障特征重構(gòu),挖掘隱蔽特征信息,提升了模型特征提取的能力.

3) 通過CWRU 軸承數(shù)據(jù)集故障診斷實(shí)驗(yàn),與Alexnet、Resnet-18 、RN、SERN 以及CBRN 模型進(jìn)行對(duì)比,結(jié)果顯示本文提出的坐標(biāo)注意力模型在小樣本變工況條件下具有良好的泛化性能和較高的診斷精度.

參考文獻(xiàn):

[1] Yang G Y, Liu L, Xi C B. Bearing fault diagnosisbased on SA-ACGAN data generation model [J].China Mechanical Engineering, 2022, 33: 1613.[楊光友, 劉浪, 習(xí)晨博. 自適應(yīng)輔助分類器生成式對(duì)抗網(wǎng)絡(luò)樣本生成模型及軸承故障診斷[J]. 中國機(jī)械工程, 2022, 33: 1613.]

[2] Fan X, Zhou Q, Yu Z Q. Fault diagnosis of rollingbearing based on generative adversarial network convolutionalauto-encode [J]. Industrial Technology Innovation,2021, 8: 94.[范旭, 周強(qiáng), 于忠清. 基于生成式對(duì)抗卷積自編碼器的滾動(dòng)軸承故障診斷[J].工業(yè)技術(shù)創(chuàng)新, 2021, 8: 94.]

[3] Chen R X, Yang X, Hu X L, et al. Planetary gearboxfault diagnosis method based on deep belief networktransfer learning [J]. Journal of Vibration andShock, 2021, 40: 127.[陳仁祥, 楊星, 胡小林,等.深度置信網(wǎng)絡(luò)遷移學(xué)習(xí)的行星齒輪箱故障診斷方法[J]. 振動(dòng)與沖擊, 2021, 40: 127.]

[4] Chai Z, Zhao C. A fine-grained adversarial networkmethod for cross-domain industrial fault diagnosis[ J].IEEE T Autom Sci Eng, 2020, 17: 1432.

[5] Chopra S, Hadsell R, Le C Y. Learning a similaritymetric discriminatively, with application to face verification[C]//2005 IEEE Computer Society Conferenceon Computer Vision and Pattern Recognition(CVPR'05). Piscataway: IEEE, 2005.

[6] Vinyals O, Blundell C, Lillicrap T, et al. Matchingnetworks for one shot learning [C]// 30th Conferenceon Neural Information Processing System,(NIPS’16). New York: ACM, 2016.

[7] Snell J, Swersky K, Zemel R. Prototypical networksfor few-shot learning [J]. 31st Conference on NeuralInformation Processing System, (NIPS’17). NewYork: ACM, 2017.

[8] Sung F, Yang Y, Zhang L, et al. Learning to compare:Relation network for few-shot learning [C]//Proceedings of the IEEE Conference on ComputerVision and Pattern Recognition. Piscataway: IEEE,2018.

[9] Wu J, Zhao Z, Sun C, et al. Few-shot transfer learningfor intelligent fault diagnosis of machine[ J]. Measurement,2020, 166: 108202.

[10] Jiang W, Huang K, Geng J, et al. Multi-scale metriclearning for few-shot learning[J]. IEEE T Circ SystVid, 2020, 31: 1091.

[11] Wang X, Ma B, Yu Z, et al. Multi-scale decisionnetwork with feature fusion and weighting for fewshotlearning[ J]. IEEE Access, 2020, 8: 92172.

[12] Yu H S, Tang B P, Zhang K, et al. Fault diagnosismethod of wind turbine gearboxes mixed with attentionprototype networks under small samples [J].China Mechanical Engineering, 2021, 32: 2475.[余浩帥, 湯寶平, 張楷, 等. 小樣本下混合自注意力原型網(wǎng)絡(luò)的風(fēng)電齒輪箱故障診斷方法[J]. 中國機(jī)械工程, 2021, 32: 2475.]

[13] Hu J, Shen L, Sun G. Squeeze-and-excitation networks[C]//Proceedings of the IEEE conference oncomputer vision and pattern recognition. Piscataway:IEEE, 2018.

[14] Zhang H, Zu K K, Lu J, et al. EPSANet: An efficientpyramid squeeze attention block on convolutionalneural network[ J]. LNCS, 2023, 13843: 541.

[15] Park J, Woo S, Lee J Y, et al. Bam: Bottleneck attentionmodule [EB/OL]. [2018-07-18]. http://arxiv. org/pdf/1807. 06514v2.

[16] Park J, Woo S, Lee J Y, et al. CBAM: Convolutionalblock attention module [J]. LNCS, 2018,11211: 3.

[17] Hou Q, Zhou D, Feng J. Coordinate attention for efficientmobile network design [C]//2021 IEEE/CVF Conference on Computer Vision and PatternRecognition(CVPR). Piscataway: IEEE, 2021.

[18] Smith W A, Randall R B. Rolling element bearing diagnosticsusing the Case Western Reserve Universitydata: A benchmark study [J]. Mech Syst Signal Proces,2015, 64: 100.

[19] Krizhevsky A, Sutskever I, Hinton G E. Imagenetclassification with deep convolutional neural networks[ J]. Comm ACM, 2017, 60: 84.

[20] He K, Zhang X, Ren S, et al. Deep residual learningfor image recognition [C]//Proceedings of the IEEEconference on computer vision and pattern recognition.Piscataway: IEEE, 2016.

(責(zé)任編輯: 周興旺)

基金項(xiàng)目: 國家重點(diǎn)研發(fā)計(jì)劃(2022YFB4701500)

猜你喜歡
故障診斷軸承
軸承知識(shí)
哈爾濱軸承(2022年2期)2022-07-22 06:39:32
軸承知識(shí)
哈爾濱軸承(2022年1期)2022-05-23 13:13:24
軸承知識(shí)
哈爾濱軸承(2021年2期)2021-08-12 06:11:46
軸承知識(shí)
哈爾濱軸承(2021年1期)2021-07-21 05:43:16
軸承知識(shí)
哈爾濱軸承(2021年4期)2021-03-08 01:01:02
凍干機(jī)常見故障診斷與維修
軸承知識(shí)
哈爾濱軸承(2020年4期)2020-03-17 08:13:56
基于量子萬有引力搜索的SVM自駕故障診斷
因果圖定性分析法及其在故障診斷中的應(yīng)用
基于LCD和排列熵的滾動(dòng)軸承故障診斷
且末县| 富锦市| 青岛市| 洪雅县| 渑池县| 汉寿县| 诸暨市| 曲靖市| 安庆市| 英吉沙县| 广东省| 中卫市| 邵阳县| 汉中市| 永善县| 英吉沙县| 扬州市| 汉寿县| 安陆市| 汶川县| 岑巩县| 读书| 无为县| 道真| 贵定县| 沾化县| 桐柏县| 汾西县| 泽普县| 莱州市| 饶阳县| 河南省| 塔城市| 鹤壁市| 禄丰县| 高安市| 娱乐| 襄垣县| 阿勒泰市| 西畴县| 阳朔县|