趙小強(qiáng),郭???/p>
(1.蘭州理工大學(xué)電氣工程與信息工程學(xué)院,蘭州 730050;2.甘肅省工業(yè)過(guò)程先進(jìn)控制重點(diǎn)實(shí)驗(yàn)室,蘭州 730050;3.蘭州理工大學(xué)國(guó)家級(jí)電氣與控制工程實(shí)驗(yàn)室教學(xué)中心,蘭州 730050)
隨著制造業(yè)信息化的要求與無(wú)人制造等多方要素推動(dòng)下,現(xiàn)有旋轉(zhuǎn)機(jī)械設(shè)備的發(fā)展方向朝著信息化、智能化的方向前進(jìn),而滾動(dòng)軸承作為機(jī)械設(shè)備中最常見(jiàn)的零部件,使用條件十分苛刻,這也導(dǎo)致其很容易發(fā)生故障[1-2]。據(jù)不完全統(tǒng)計(jì),旋轉(zhuǎn)機(jī)械的故障約有45%~55%是由滾動(dòng)軸承引起的,滾動(dòng)軸承的故障可能會(huì)使機(jī)械設(shè)備工作異常,甚至造成嚴(yán)重的經(jīng)濟(jì)損失與人員傷亡[3-5]。因此,為了確保旋轉(zhuǎn)設(shè)備的正常運(yùn)行,對(duì)滾動(dòng)軸承進(jìn)行迅速高效的故障診斷是十分重要的。
近年來(lái),隨著深度學(xué)習(xí)的蓬勃發(fā)展,包括卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN) [6-8]在內(nèi)的諸多網(wǎng)絡(luò)模型被應(yīng)用到故障診斷領(lǐng)域,并取得了良好的診斷效果。例如,李恒等[9]通過(guò)短時(shí)傅里葉變換,將原始振動(dòng)信號(hào)轉(zhuǎn)化為時(shí)頻譜圖作為CNN 網(wǎng)絡(luò)的輸入,取得了良好的診斷效果。卞景藝等[10]提出了一種多尺度一維深度卷積神經(jīng)網(wǎng)絡(luò)的診斷方法,構(gòu)建了多個(gè)含有不同尺寸卷積核通道的特征提取層,最后進(jìn)行故障識(shí)別。董紹江等[11]采用奇異值分解與經(jīng)驗(yàn)?zāi)B(tài)分解對(duì)原始信號(hào)進(jìn)行降噪處理,然后將其輸入到帶注意力機(jī)制的CNN 網(wǎng)絡(luò)模型中進(jìn)行故障識(shí)別與分類。
盡管上述方法取得了良好的診斷效果,但是由于CNN 網(wǎng)絡(luò)具有局部連接與權(quán)值共享的特點(diǎn),導(dǎo)致其無(wú)法獲得特征信息的全局感受野,因此YU 等[12]提出了空洞卷積的概念。相比于普通卷積而言,空洞卷積可以增大感受野,讓每個(gè)卷積輸出都包含較大范圍的信息。段浩明等[13]提出了一種端到端基于一維注意力混合卷積神經(jīng)網(wǎng)絡(luò)的滾動(dòng)軸承故障診斷方法,引入空洞卷積以增加感受野,并加入注意力機(jī)制實(shí)現(xiàn)對(duì)滾動(dòng)軸承的智能診斷。喬美英等[14]提出了一種改進(jìn)稀疏濾波與深層空洞門(mén)卷積網(wǎng)絡(luò)相結(jié)合的故障診斷模型,利用空洞門(mén)卷積與雙向LSTM 網(wǎng)絡(luò)進(jìn)行故障分類識(shí)別。然而,空洞卷積在增大感受野的同時(shí),也造成了邊緣信息的丟失,并且損失了信息的連續(xù)性。
Swin transformer 網(wǎng)絡(luò)是LIU 等[15]提出的一種基于移動(dòng)窗口自注意力機(jī)制的網(wǎng)絡(luò),解決了Transformer 網(wǎng)絡(luò)[16]中計(jì)算量巨大的問(wèn)題,已經(jīng)在自然語(yǔ)言處理領(lǐng)域(natural language processing,NLP)取得了巨大成功,該網(wǎng)絡(luò)模型通過(guò)層次化的結(jié)構(gòu),既能獲得全局感受野,又能提高運(yùn)行效率。
基于以上分析,針對(duì)變工況條件下CNN 網(wǎng)絡(luò)在特征提取過(guò)程中無(wú)法充分提取特征全局信息的問(wèn)題,本文提出一種MSCNN-SwinT 的滾動(dòng)軸承故障診斷方法。首先設(shè)計(jì)數(shù)據(jù)處理模塊,利用連續(xù)小波變換保留原始信號(hào)的時(shí)頻特性,將一維振動(dòng)信號(hào)轉(zhuǎn)化為二維時(shí)頻圖像;然后設(shè)計(jì)局部感知模塊,構(gòu)建多尺度卷積神經(jīng)網(wǎng)絡(luò),利用不同尺度的卷積核對(duì)故障信息的局部特征進(jìn)行提取,并使用卷積塊注意模塊(convolutional block attention module,CBAM)剔除冗余信息,提取更重要的故障特征;之后設(shè)計(jì)特征提取模塊,引入殘差連接提高前后特征信息的利用效率并緩解梯度消失現(xiàn)象,通過(guò)SwinT 網(wǎng)絡(luò)學(xué)習(xí)故障信息的全局特征;最后,為減少參數(shù)量和抑制過(guò)擬合現(xiàn)象,使用全局平均池化層代替全連接層進(jìn)行故障識(shí)別。使用美國(guó)凱斯西儲(chǔ)大學(xué)軸承數(shù)據(jù)集和自制數(shù)據(jù)集進(jìn)行試驗(yàn)驗(yàn)證,并與幾種相關(guān)網(wǎng)絡(luò)模型進(jìn)行對(duì)比,驗(yàn)證本文方法的有效性。
滾動(dòng)軸承通常工作在十分復(fù)雜的環(huán)境中,在故障診斷過(guò)程中,特征提取的充分與否將直接影響診斷效果。本文首先使用無(wú)重疊方式將采集到的原始軸承振動(dòng)信號(hào)構(gòu)造數(shù)據(jù)樣本,通過(guò)連續(xù)小波變換將一維信號(hào)轉(zhuǎn)化為二維時(shí)頻圖像作為模型輸入,利用所設(shè)計(jì)的多尺度卷積神經(jīng)網(wǎng)絡(luò)提取故障信息的局部特征,同時(shí)引入CBAM 注意力機(jī)制,提取更重要的信息;之后通過(guò)卷積殘差連接將原始二維時(shí)頻圖像和局部感知圖像進(jìn)行融合,通過(guò)Swin transformer 網(wǎng)絡(luò)學(xué)習(xí)故障信息的全局特征;最后使用全局平均池化來(lái)代替全連接層,減少參數(shù)量,加快訓(xùn)練速度,對(duì)故障信息進(jìn)行分類并輸出識(shí)別結(jié)果。圖1 為本文網(wǎng)絡(luò)結(jié)構(gòu)圖。
圖1 Multiscale convolutional neural networks-Swin transformer 診斷網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 Multiscale convolutional neural networks-Swin transformer diagnostic network architecture
連續(xù)小波變換[17]是將一維振動(dòng)信號(hào)轉(zhuǎn)換為二維時(shí)頻圖的有效方法,具有強(qiáng)大的時(shí)頻特征提取能力。對(duì)于連續(xù)小波變換而言,小波基函數(shù)的選擇至關(guān)重要。Morlet小波是一種雙邊指數(shù)衰減余弦信號(hào),與滾動(dòng)軸承產(chǎn)生的脈沖故障特征十分相似。而Morlet 小波中的Cmor 小波表示具有強(qiáng)適應(yīng)性的特點(diǎn),因此選擇Cmor 小波作為本文小波變換的基函數(shù),其表達(dá)式為
式中Ψr(·)為 小波基函數(shù);t為時(shí)間,s;fb為帶寬參數(shù);exp(·)為 指數(shù)函數(shù);f為小波中心頻率,Hz。參考文獻(xiàn)[18-19],本文取fb=3,f=3 Hz。
傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)通常使用單一尺度卷積層進(jìn)行特征提取,提取的特征信息有限。因此,為了最大程度地獲取故障數(shù)據(jù)的特征信息,本文設(shè)計(jì)了一種多尺度的卷積神經(jīng)網(wǎng)絡(luò),其結(jié)構(gòu)如圖2 所示。第一層使用1 個(gè)1×1的卷積層對(duì)故障數(shù)據(jù)進(jìn)行特征提取,通道數(shù)設(shè)置為32;第二層使用3×3,5×5,1×1 的卷積層,其通道數(shù)分別為8、16、32;第三層使用5×5,3×3,1×1 的卷積層,其通道數(shù)分別為8、16、32。為了提升網(wǎng)絡(luò)性能,每一個(gè)卷積層后面都使用BN 層和ReLU 激活函數(shù),然后通過(guò)Concat 層將不同通道的特征維度拼接到一起,最后通過(guò)卷積塊注意模塊[20]提取關(guān)鍵信息并輸出特征圖。
圖2 多尺度卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 Multiscale convolutional neural network structure
CNN 網(wǎng)絡(luò)因局部連接與權(quán)值共享,在特征提取的過(guò)程中總是通過(guò)卷積層提取局部特征,而后將局部特征進(jìn)行整合,最終得到包含特征信息的特征圖,會(huì)導(dǎo)致部分關(guān)鍵信息丟失。因此,本文基于Swin transformer 網(wǎng)絡(luò)構(gòu)建特征提取模塊。首先在Swin transformer 網(wǎng)絡(luò)之前使用一個(gè)卷積核大小為1×1 的卷積層,在減少參數(shù)量的同時(shí)增加了通道間信息的交流;其次引入殘差連接將局部特征提取模塊的輸入與1×1 卷積層的輸出進(jìn)行融合,提高前后特征信息的利用效率,并將融合后的特征圖作為Swin transformer 網(wǎng)絡(luò)的輸入,最后通過(guò)Swin transformer 網(wǎng)絡(luò)對(duì)特征信息的全局特征進(jìn)行提取,具體結(jié)構(gòu)如圖3 所示。
圖3 多頭注意力機(jī)制結(jié)構(gòu)圖Fig.3 Structure diagram of multi-head attention mechanism
在圖3 中,多頭注意力機(jī)制的輸入為多個(gè)查詢矩陣、鍵矩陣和值矩陣,查詢矩陣、鍵矩陣、值矩陣為固定的單個(gè)值,經(jīng)過(guò)多個(gè)線性層和縮放點(diǎn)積注意力層,然后通過(guò)融合層進(jìn)行融合并利用線性層輸出,所得到的注意力如式(2)。
式中Attention代表注意力機(jī)制函數(shù),Softmax代表歸一化函數(shù),dk代表鍵矩陣維度。
本文Swin transformer 網(wǎng)絡(luò)分為4 個(gè)階段,對(duì)應(yīng)的多頭注意力數(shù)量分別為3、6、12 和24,除第一階段由線性嵌入層和Swin transformer 塊組成之外,其余3 個(gè)階段均由切片合并層和Swin transformer 塊組成。
本文方法的具體流程如下:首先采用連續(xù)小波變換將一維原始振動(dòng)信號(hào)轉(zhuǎn)化為二維時(shí)頻圖,并按照7∶3 的比例將數(shù)據(jù)集劃分訓(xùn)練集與測(cè)試集,之后將訓(xùn)練集輸入到MSCNN-SwinT 模型中進(jìn)行訓(xùn)練,獲取最優(yōu)參數(shù)并保存模型,最后將測(cè)試集輸入到訓(xùn)練好的模型中,實(shí)現(xiàn)對(duì)滾動(dòng)軸承的故障診斷。圖4 為本文方法的流程圖。
圖4 MSCNN-SwinT 模型訓(xùn)練流程Fig.4 MSCNN-SwinT model training process
為了驗(yàn)證所提方法的有效性和泛化能力,本文選擇美國(guó)凱斯西儲(chǔ)大學(xué)軸承數(shù)據(jù)集(case western reserve university,CWRU)和自制數(shù)據(jù)集進(jìn)行試驗(yàn)。
2.1.1 數(shù)據(jù)集及數(shù)據(jù)處理
CWRU 滾動(dòng)軸承數(shù)據(jù)集的試驗(yàn)平臺(tái)由一個(gè)1.5 kW電機(jī)、一個(gè)扭矩傳感器、一個(gè)功率測(cè)試儀和電子控制器組成。被測(cè)軸承型號(hào)SKF6205,采樣頻率12 kHz,選用軸承驅(qū)動(dòng)端數(shù)據(jù)進(jìn)行試驗(yàn)驗(yàn)證,采集4 種不同工況狀態(tài)下的加速度數(shù)據(jù)集,在本文中,將電機(jī)載荷0 kW、電機(jī)轉(zhuǎn)速1 797 r/min 所獲取的數(shù)據(jù)標(biāo)記為數(shù)據(jù)集0,將電機(jī)載荷0.75 kW、電機(jī)轉(zhuǎn)速1 772 r/min 所獲取的數(shù)據(jù)標(biāo)記為數(shù)據(jù)集1,將電機(jī)載荷1.5 kW、電機(jī)轉(zhuǎn)速1 750 r/min所獲取的數(shù)據(jù)標(biāo)記為數(shù)據(jù)集2,將電機(jī)載荷2.2 kW、電機(jī)轉(zhuǎn)速1 750 r/min 所獲取的數(shù)據(jù)標(biāo)記為數(shù)據(jù)集3。將采集到的4 種數(shù)據(jù)集根據(jù)軸承損傷程度及位置用10 種狀態(tài)標(biāo)簽進(jìn)行表示,具體標(biāo)簽與對(duì)應(yīng)的故障狀態(tài)如表1所示。
表1 CWRU 數(shù)據(jù)集標(biāo)簽及對(duì)應(yīng)故障Table 1 CWRU dataset labels and corresponding faults
每段的采樣點(diǎn)數(shù)設(shè)置為784,生成500 個(gè)樣本,對(duì)于每一類故障狀態(tài)生成500 張時(shí)頻圖,并按照7:3 的比例劃分訓(xùn)練樣本和測(cè)試樣本。具體而言,在4 個(gè)數(shù)據(jù)集中,每個(gè)數(shù)據(jù)集的訓(xùn)練樣本和測(cè)試樣本分別為3 500 個(gè)和1 500 個(gè)。使用連續(xù)小波變換將樣本轉(zhuǎn)化為二維時(shí)頻圖像,生成圖像的像素分辨率為224×224,圖5 為10 種故障樣本的時(shí)頻圖,從圖中可以看出,由于樣本信號(hào)中含有的頻率成分以及對(duì)應(yīng)的時(shí)間區(qū)間不同,不同故障的時(shí)頻圖中相同位置的顏色深淺均不相同,表明連續(xù)小波變換可以很好地保留原始樣本信號(hào)的時(shí)頻特性。
2.1.2 試驗(yàn)結(jié)果與分析
試驗(yàn)在pycharm 的pytorch 框架下完成,電腦配置為Windows10 系統(tǒng)、i7-11800H 處理器、16 GB 內(nèi)存。選取Adam 優(yōu)化器優(yōu)化網(wǎng)絡(luò)參數(shù),批次設(shè)置為16,迭代批數(shù)為30,學(xué)習(xí)率為0.001。
選用CrossEntropyLoss 交叉熵作為損失函數(shù),表達(dá)式如式(3)所示。
式中L表示誤差損失值,K表示故障類別的數(shù)量,表 示第i個(gè)類別的真實(shí)標(biāo)簽,表示模型判定可能為第i類故障的預(yù)測(cè)概率值。
圖6 為本文方法迭代30 次的故障識(shí)別準(zhǔn)確率曲線與Loss 函數(shù)變化曲線。
圖6 本文方法在CWRU 數(shù)據(jù)集的驗(yàn)證結(jié)果Fig.6 Validation results of method in this paper on CWRU dataset
從圖6 中可以看出,在經(jīng)過(guò)30 次訓(xùn)練后,訓(xùn)練集和測(cè)試集的準(zhǔn)確率均達(dá)到100%,訓(xùn)練集的損失函數(shù)值從0.667 2 降低至0.005 以下,測(cè)試集的損失函數(shù)值從0.035 7降低至0.003 以下,模型訓(xùn)練至第2 個(gè)批次時(shí),準(zhǔn)確率達(dá)到100%,損失函數(shù)值降低至0.01 以下,模型達(dá)到完全收斂,之后準(zhǔn)確率與損失函數(shù)值趨于穩(wěn)定。
為了進(jìn)一步驗(yàn)證本文方法的特征提取與分類能力,采用T-SNE 降維技術(shù),對(duì)本文網(wǎng)絡(luò)模型的分類結(jié)果進(jìn)行三維立體可視化,結(jié)果如圖7 所示。
圖7 原始數(shù)據(jù)與分類層的特征可視化結(jié)果Fig.7 Results of feature visualization of raw data and classification layer
從圖7 中可以看出,在原始數(shù)據(jù)中,10 類故障數(shù)據(jù)雜亂無(wú)章,相互混疊,難以區(qū)分,而經(jīng)過(guò)本文所提方法的特征提取和分類輸出之后,故障數(shù)據(jù)已經(jīng)完全聚集,相互分離,這表明本文方法具有很強(qiáng)的故障分類能力,最終分類準(zhǔn)確率達(dá)到了99.67%。
2.1.3 變工況條件下的試驗(yàn)驗(yàn)證
變工況試驗(yàn)是對(duì)診斷方法是否具有良好泛化性能的一種檢驗(yàn),本文選取數(shù)據(jù)集0、數(shù)據(jù)集1、數(shù)據(jù)集2、數(shù)據(jù)集3 中的一種作為訓(xùn)練樣本,其余3 種為測(cè)試樣本,例如0~1、0~2、0~3 代表的是以數(shù)據(jù)集0 為訓(xùn)練樣本,數(shù)據(jù)集1、數(shù)據(jù)集2、數(shù)據(jù)集3 為測(cè)試樣本。為了驗(yàn)證連續(xù)小波變換與MSCNN-SwinT 網(wǎng)絡(luò)結(jié)合的優(yōu)勢(shì),進(jìn)一步選擇LeNet5[21]、VGG16[22]、ResNet18[23]、SwinT 網(wǎng)絡(luò)進(jìn)行對(duì)比,為了避免偶然誤差,試驗(yàn)進(jìn)行5 次,結(jié)果取平均值,如表2 所示。
表2 變工況條件下不同方法的診斷結(jié)果Table 2 Diagnostic results of different methods under variable working conditions
由表2 可知,在變工況條件下,CWT-LeNet5、CWT-VGG16、CWT-ResNet18 和CWT-Swin 的平均故障識(shí)別準(zhǔn)確率分別為89.15%、89.30%、94.45%和94.76%,本文方法的故障識(shí)別準(zhǔn)確率為97.94%,較其他4 種方法分別提高8.79、8.64、3.49 和3.18 個(gè)百分點(diǎn)。相比于其他幾種方法,本文方法的準(zhǔn)確率變化趨勢(shì)較為平緩,例如,CWT-LeNet5 方法的最高平均準(zhǔn)確率為96.12%,最低平均準(zhǔn)確率為77.40%;本文方法的最高平均準(zhǔn)確率為99.66%,最低平均準(zhǔn)確率為95.01%,這表明本文方法在變工況條件下具有更好的診斷效果和泛化性能。
2.1.4 特征圖像生成方式對(duì)診斷結(jié)果的影響
為了進(jìn)一步驗(yàn)證小波變換與MSCNN-SwinT 模型結(jié)合的故障識(shí)別分類能力,對(duì)比了其他幾種圖像生成方法:文獻(xiàn)[24]使用遞歸圖編碼技術(shù)(recurrence plots,RP)將一維振動(dòng)信號(hào)轉(zhuǎn)化為二維紋理圖像輸入到ResNet 網(wǎng)絡(luò)中對(duì)滾動(dòng)軸承進(jìn)行故障診斷;文獻(xiàn)[25]使用馬爾可夫轉(zhuǎn)移場(chǎng)編碼技術(shù)(markov transfer field,MTF)將一維原始振動(dòng)信號(hào)轉(zhuǎn)化為具有時(shí)間相關(guān)性的二維特征圖像,然后輸入到CNN 網(wǎng)絡(luò)中實(shí)現(xiàn)故障分類;文獻(xiàn)[26]采用格拉姆角場(chǎng)法(gramian angular field,GAF)將一維信號(hào)轉(zhuǎn)化為二維圖像作為PAM-ResNet 網(wǎng)絡(luò)的輸入,驗(yàn)證小樣本環(huán)境下方法的可行性。本文將相同數(shù)據(jù)集應(yīng)用于上述3 種方法,圖8 為0.014-Ball 故障狀態(tài)下3 種方法生成的特征圖像。
圖8 不同編碼技術(shù)生成的特征圖像Fig.8 Feature images generated by different encoding techniques
將3 種方法生成的特征圖像分別作為MSCNNSwinT 網(wǎng)絡(luò)模型的輸入,為避免偶然現(xiàn)象,試驗(yàn)進(jìn)行5 次,結(jié)果取平均值,如表3 所示。
表3 不同特征圖像的故障診斷準(zhǔn)確率Table 3 Fault diagnosis accuracy of different feature images
由表3 可知,同一種圖像生成方式下,本文模型的故障診斷準(zhǔn)確率均高于其他4 種方法。不同圖像生成方式下,RP-MSCNN-SwinT、MTF-MSCNN-SwinT 和GAFMSCNN-Swin 的準(zhǔn)確率分別為96.37%、94.26%和95.47%,本文方法的故障識(shí)別準(zhǔn)確率達(dá)到100%,相比于其他3 種方法分別提高3.63、5.74 和4.53 個(gè)百分點(diǎn),表明本文模型與連續(xù)小波變換結(jié)合具有更強(qiáng)的故障學(xué)習(xí)能力。
2.2.1 數(shù)據(jù)集及數(shù)據(jù)處理
自制數(shù)據(jù)集的試驗(yàn)平臺(tái)如圖9 所示,主要由三相交流異步電機(jī)、加負(fù)載裝置、不同故障種類軸承、變頻控制器、傳感器、DHDAS 動(dòng)態(tài)信號(hào)采集分析系統(tǒng)組成。軸承固定在主軸上,并將主軸與聯(lián)軸器連接,最終將軸承定位在軸承鎖圈中。
圖9 試驗(yàn)臺(tái)Fig.9 Test platform
試驗(yàn)中被測(cè)軸承為M-BFK-3/4 的深溝球軸承(內(nèi)徑19.05 mm,外徑25.4 mm,滾動(dòng)體9 個(gè),接觸角0°),包含正常,滾動(dòng)體故障,內(nèi)圈故障,外圈故障,混合故障5 種狀態(tài)。試驗(yàn)使用的是剪切加速度傳感器型號(hào)為333B30,靈敏度為102.7 mV/g,剪切加速度傳感器分別固定在軸承座的9 點(diǎn)鐘(x軸)方向和12 點(diǎn)鐘(y軸)方向。本試驗(yàn)使用的是固定在9 點(diǎn)鐘方向的剪切加速度傳感器采集到的振動(dòng)信號(hào)數(shù)據(jù),通過(guò)變頻控制器調(diào)節(jié)電機(jī)頻率,分別為20、30 和40 Hz。在固定的電機(jī)頻率上使用加載裝置通過(guò)單一控制變量法采集負(fù)載分別為0、0.745、1.490、2.235 和2.980 kW 共5 種工況的數(shù)據(jù),樣本數(shù)據(jù)的采集頻率為25 600 Hz。本文選擇其中10 類故障狀態(tài)作為試驗(yàn)數(shù)據(jù)集,具體標(biāo)簽及對(duì)應(yīng)故障如表4所示。每段樣本的采樣點(diǎn)為784,每種故障的樣本為500,共生成5 000 張時(shí)頻圖,按照7:3 的比例劃分訓(xùn)練集與測(cè)試集。
表4 自制數(shù)據(jù)標(biāo)簽及對(duì)應(yīng)故障Table 4 Self-made data labels and corresponding faults
2.2.2 故障診斷結(jié)果分析
本部分試驗(yàn)除試驗(yàn)數(shù)據(jù)與凱斯西儲(chǔ)大學(xué)數(shù)據(jù)集不同以外,所有網(wǎng)絡(luò)模型參數(shù)均相同。
為了驗(yàn)證本文方法的有效性與良好的泛化性能,將本文方法與已有方法進(jìn)行對(duì)比,試驗(yàn)結(jié)果如表5所示。
表5 各種方法診斷結(jié)果Table 5 Diagnostic results by various methods
從表5 中可以看出,本文方法的準(zhǔn)確率達(dá)到99.18%。較其他4 種方法分別提高5.23、2.74、1.40 和1.26 個(gè)百分點(diǎn)。這是因?yàn)镃WT-LeNet5、CWT-VGG16 和CWTResNet18 均采用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行特征提取,雖然利用了卷積神經(jīng)網(wǎng)絡(luò)在圖像分類中的強(qiáng)大能力,但是并沒(méi)有從根本上突破卷積神經(jīng)網(wǎng)絡(luò)無(wú)法提取故障數(shù)據(jù)全局特征的局限,導(dǎo)致準(zhǔn)確率不佳;而CWT-SwinT 單純使用Swin transformer 網(wǎng)絡(luò),雖然對(duì)故障信息的全局特征進(jìn)行了提取,但是其對(duì)于微小特征的學(xué)習(xí)能力不足。而本文方法通過(guò)多尺度卷積神經(jīng)網(wǎng)絡(luò)提取故障信息的局部特征,采用Swin transformer 網(wǎng)絡(luò)學(xué)習(xí)故障信息的全局特征,有效提高了故障診斷的準(zhǔn)確率。
為進(jìn)一步驗(yàn)證所提方法的泛化性能,本文對(duì)上述10種故障做了混淆矩陣試驗(yàn),結(jié)果如圖10 所示。
圖10 混淆矩陣圖Fig.10 Confusion matrix diagram
由圖10 可知,本文所提方法只有1.0%標(biāo)簽為0 的故障和4.0%標(biāo)簽為3 的故障出現(xiàn)誤分現(xiàn)象,其他故障狀態(tài)的分類效果良好,整體故障診斷準(zhǔn)確率達(dá)到了99.33%,這表明本文方法在不同數(shù)據(jù)集上有較高的故障識(shí)別能力和良好的泛化能力。
為了解決變工況條件下卷積神經(jīng)網(wǎng)絡(luò)無(wú)法充分提取全局特征信息的問(wèn)題,本文提出了一種基于MSCNNSwinT 的滾動(dòng)軸承故障診斷方法,主要結(jié)論如下:
1)本文利用連續(xù)小波變換將一維振動(dòng)信號(hào)轉(zhuǎn)化為時(shí)頻圖像,保留了原始信號(hào)的時(shí)頻域特征,設(shè)計(jì)了多尺度卷積神經(jīng)網(wǎng)絡(luò)捕捉時(shí)頻圖像的局部特征,同時(shí)引入CBAM 注意力機(jī)制提取更關(guān)鍵的特征信息,通過(guò)殘差連接加強(qiáng)前后信息的利用效率,并通過(guò)Swin transformer 網(wǎng)絡(luò)捕獲特征圖的全局信息,解決了卷積神經(jīng)網(wǎng)絡(luò)無(wú)法學(xué)習(xí)全局特征的問(wèn)題。
2)針對(duì)CNN 網(wǎng)絡(luò)無(wú)法提取全局信息的問(wèn)題,結(jié)合Swin transformer 網(wǎng)絡(luò)的優(yōu)點(diǎn),本文提出MSCNN-Swin-T 模型,并與幾種典型網(wǎng)絡(luò)模型進(jìn)行試驗(yàn)對(duì)比,結(jié)果表明,在變工況條件下本文方法的平均故障診斷準(zhǔn)確率達(dá)到97.94%,較對(duì)比方法分別提高8.79、8.64、3.49 和3.18 個(gè)百分點(diǎn),這說(shuō)明本文方法在復(fù)雜條件下仍具有很高的診斷準(zhǔn)確率。
3)試驗(yàn)表明,在不同圖像編碼方式下,本文方法的故障診斷準(zhǔn)確率為100%,較其他幾種對(duì)比方法分別提高3.63、5.74 和4.53 個(gè)百分點(diǎn),這表明連續(xù)小波變換與本文所提網(wǎng)絡(luò)模型結(jié)合可以學(xué)習(xí)更多的特征信息從而有更高的準(zhǔn)確率;在不同數(shù)據(jù)集中,本文方法的故障識(shí)別準(zhǔn)確率分別達(dá)到100%與99.18%。這說(shuō)明本文方法具有良好的泛化性能。