鞏曉赟,智澤恒,杜文遼,韓明,胡亞凱,羅雙強(qiáng)
(1.鄭州輕工業(yè)大學(xué)機(jī)電工程學(xué)院,河南鄭州 450002;2.河南中煙工業(yè)有限責(zé)任公司安陽卷煙廠,河南安陽 455004)
感應(yīng)電動機(jī)是回轉(zhuǎn)工藝設(shè)備的關(guān)鍵旋轉(zhuǎn)動力傳動裝置,由于系統(tǒng)組件及其傳動之間具有強(qiáng)關(guān)聯(lián)的相互耦合關(guān)系,傳動裝置中一個故障的發(fā)生易導(dǎo)致故障的并發(fā)性、繼發(fā)性。采用傳統(tǒng)的單一傳感診斷方法不易揭示復(fù)合故障的關(guān)聯(lián)關(guān)系,造成一定的誤診、漏診[1]。同時,在實(shí)際工藝生產(chǎn)過程中,相較于無故障樣本或單故障數(shù)據(jù)樣本,復(fù)合故障數(shù)據(jù)量呈現(xiàn)不充分、小樣本問題,基于深度學(xué)習(xí)的故障診斷方法則需大量的數(shù)據(jù)樣本訓(xùn)練以實(shí)現(xiàn)故障識別的高準(zhǔn)確率。因此,針對單一傳感數(shù)據(jù)診斷復(fù)合故障難與復(fù)合故障數(shù)據(jù)不平衡問題,研究小樣本下多源異構(gòu)數(shù)據(jù)融合遷移診斷方法具有工程指導(dǎo)意義。
工藝設(shè)備中回轉(zhuǎn)機(jī)組的感應(yīng)電機(jī)通常與變速箱、支撐軸承、滾筒等負(fù)載單元聯(lián)結(jié)構(gòu)成,單一傳感數(shù)據(jù)不易有效識別動力傳動裝置中多點(diǎn)復(fù)合故障[2]。近年來,一些學(xué)者采用多源信息對動力裝置進(jìn)行故障診斷以提高識別精度,如EL YOUSFI等[3]通過仿真構(gòu)建電機(jī)-齒輪箱系統(tǒng)電氣模型和負(fù)載端機(jī)械模型,綜合分析電流及振動等多信號響應(yīng),為感應(yīng)電機(jī)的電流、振動信息融合故障診斷提供了理論基礎(chǔ);JUNIOR等[4]針對電機(jī)運(yùn)行過程中故障的隨機(jī)性,綜合利用不同方向的多個振動數(shù)據(jù)監(jiān)測電機(jī)運(yùn)行特性,基于多通道數(shù)據(jù)融合的卷積神經(jīng)網(wǎng)絡(luò)模型獲得更高的診斷精度。
深度學(xué)習(xí)具有強(qiáng)大的數(shù)據(jù)挖掘能力,根據(jù)不同應(yīng)用場景衍生出多種網(wǎng)絡(luò)模型,如自編碼器(Autoencoder,AE)[5]、生成對抗網(wǎng)絡(luò)(Generative Adversarial Network,GAN)[6]、卷積神經(jīng)網(wǎng)絡(luò)(Convolution Neural Network,CNN)[7]、圖卷積神經(jīng)網(wǎng)絡(luò)(Graph Convolution Network,GCN)[8]和遷移學(xué)習(xí) (Transfer Learning,TL)[9]等深度學(xué)習(xí)網(wǎng)絡(luò)模型被應(yīng)用于不同類型的旋轉(zhuǎn)機(jī)械故障診斷。針對工程診斷中故障數(shù)據(jù)不平衡、小樣本問題,基于深度學(xué)習(xí)的診斷方法目前主要有以下兩類研究方向:一是利用數(shù)據(jù)生成方法學(xué)習(xí)并生成大量所需數(shù)據(jù)[10]。如YANG等[11]利用條件生成對抗網(wǎng)絡(luò)(CGAN)生成分布相似的新樣本以解決樣本不足問題,并將之與二維卷積神經(jīng)網(wǎng)絡(luò)結(jié)合實(shí)現(xiàn)軸承故障類型的有效分類;ZHANG等[12]提出一種多模塊梯度懲罰GAN模型,有效擴(kuò)展了軸承的振動訓(xùn)練數(shù)據(jù)。但采用以上數(shù)據(jù)生成方法生成樣本時,其生成方向因受多因素影響較難控制,且數(shù)據(jù)樣本生成后需要驗(yàn)證其與目標(biāo)樣本的相似性才能進(jìn)一步被應(yīng)用,生成方向的多因素影響與復(fù)雜的診斷流程給故障診斷增加了難度。二是利用遷移學(xué)習(xí)方法實(shí)現(xiàn)大樣本源域任務(wù)到小樣本目標(biāo)域任務(wù)的遷移[13-14]。遷移學(xué)習(xí)是將源域中學(xué)習(xí)到的領(lǐng)域知識遷移到目標(biāo)域,經(jīng)過目標(biāo)域微調(diào)模型的適應(yīng)性算法解決目標(biāo)域小樣本問題[15]。如SHAO等[16]通過小波變換將原始振動數(shù)據(jù)轉(zhuǎn)換為時頻圖像,采用ImageNet數(shù)據(jù)集構(gòu)建VGG-16預(yù)訓(xùn)練模型實(shí)現(xiàn)遷移學(xué)習(xí)的小樣本分類;CHEN等[17]采用預(yù)訓(xùn)練的ResNet-50模型與連續(xù)小波變換相結(jié)合實(shí)現(xiàn)軸承故障小樣本分類;LU等[18]通過快速傅里葉變換(FFT)生成頻譜圖,將頻譜圖切割成幾個連續(xù)的子頻譜圖作為樣本,采用AlexNet預(yù)訓(xùn)練模型實(shí)現(xiàn)軸承小樣本的遷移學(xué)習(xí)。
以上遷移學(xué)習(xí)主要采用共享的已封裝自然圖片預(yù)訓(xùn)練模型實(shí)現(xiàn)遷移診斷,但對于小樣本下的復(fù)合故障診斷則存在以下不足:(1)已封裝的單一數(shù)據(jù)源預(yù)訓(xùn)練模型無法適應(yīng)復(fù)合故障的多源信號樣本輸入;(2)遷移后以圖片樣本形式的信號輸入對電流和振動原始信號而言,信號預(yù)處理環(huán)節(jié)增加了故障診斷的復(fù)雜度及人工選參的不確定性;(3)凍結(jié)網(wǎng)絡(luò)過程中缺少對源域與目標(biāo)域的自適應(yīng)優(yōu)化?;谝陨戏治觯疚淖髡咛岢鲆环N小樣本下基于多源信號與多頭卷積神經(jīng)網(wǎng)絡(luò)遷移學(xué)習(xí)的電機(jī)復(fù)合故障診斷模型(Multi-head Convolutional Neural Network-Transfer Learning,TL-MHCNN),以解決單源信號對電機(jī)多點(diǎn)復(fù)合故障信息表征不足以及復(fù)合故障小樣本診斷問題。文中主要貢獻(xiàn)點(diǎn)如下:
(1)提出適應(yīng)復(fù)合故障多源信號的MHCNN作為源域初始模型以滿足電流及振動信號的信息融合與特征提??;
(2)將大樣本單故障的電機(jī)原始數(shù)據(jù)集作為源域,通過遷移網(wǎng)絡(luò)模型構(gòu)建解決目標(biāo)域下以原始數(shù)據(jù)為輸入的電機(jī)小樣本復(fù)合故障診斷問題;
(3)遷移學(xué)習(xí)目標(biāo)域微調(diào)模型中加入正則化懲罰項(xiàng),解決微調(diào)參數(shù)的自適應(yīng)優(yōu)化更新及模型收斂過擬合問題。
遷移學(xué)習(xí)是將一個或者多個場景及任務(wù)中學(xué)習(xí)提取到的領(lǐng)域知識遷移到另一不同場景或任務(wù)中進(jìn)而解決另一相關(guān)領(lǐng)域中的問題,即從源域遷移到目標(biāo)域以解決目標(biāo)域任務(wù)[19]。遷移學(xué)習(xí)中的兩個基本概念,一個概念為域(Domain),另一個為任務(wù)(Task)。域包括特征空間中的所有特征樣本集合X以及分布P(X);任務(wù)包括特征樣本的決策函數(shù)f(X)和標(biāo)簽集合Y,其中決策函數(shù)f(X)為條件概率分布P(yi|xi),yi∈Y,xi∈X。
遷移學(xué)習(xí)本質(zhì)上是利用源域中已有知識提升目標(biāo)域分類函數(shù)性能的一種方法,根據(jù)源域特征樣本集Xs、類別集Ys與目標(biāo)域特征樣本集Xt、類別集Yt,定義源域和目標(biāo)域空間表達(dá)式為
(1)
(2)
式中:源域標(biāo)簽特征樣本數(shù)量Ns與目標(biāo)域標(biāo)簽樣本數(shù)量Nt滿足:Ns?Nt。
遷移學(xué)習(xí)主要圍繞“遷移什么”、“如何遷移”和“何時遷移”3個方面的研究提升學(xué)習(xí)算法在目標(biāo)任務(wù)上的性能。根據(jù)算法對遷移學(xué)習(xí)改造技術(shù)手段的不同可分為基于樣本權(quán)重的遷移學(xué)習(xí)方法、基于特征的遷移學(xué)習(xí)方法、基于模型參數(shù)的遷移學(xué)習(xí)方法、基于關(guān)聯(lián)規(guī)則的遷移學(xué)習(xí)方法。其中基于模型參數(shù)的遷移學(xué)習(xí)方法通過源任務(wù)與目標(biāo)任務(wù)間的共享模型參數(shù)信息來實(shí)現(xiàn)遷移,適合源域與目標(biāo)域樣本特征分布差異較小的應(yīng)用場景。
本文作者利用模型遷移的方式學(xué)習(xí)源域任務(wù)Ts并根據(jù)目標(biāo)域任務(wù)Tt構(gòu)建網(wǎng)絡(luò)模型與參數(shù)更新以適應(yīng)目標(biāo)任務(wù)的性能要求。圖1為本文作者構(gòu)建的遷移網(wǎng)絡(luò)模型的概念示意,其中源域是利用大樣本的電機(jī)單故障數(shù)據(jù)集完成預(yù)訓(xùn)練,目標(biāo)域則通過模型微調(diào)實(shí)現(xiàn)小樣本復(fù)合故障的診斷任務(wù)。
采用傳統(tǒng)的單一傳感診斷方法不易有效識別復(fù)合故障的并發(fā)性與傳播性,造成一定的誤診、漏診。構(gòu)建一種如圖2所示的多頭卷積神經(jīng)網(wǎng)絡(luò)(MHCNN)模型以解決動力裝置中電機(jī)電流、振動等多源異構(gòu)數(shù)據(jù)的信息融合與特征提取。并利用動態(tài)衰減學(xué)習(xí)率與SeLU函數(shù)改進(jìn)超參數(shù)以解決CNN模型的穩(wěn)定性與梯度消失等問題。
圖2 多頭卷積神經(jīng)網(wǎng)絡(luò)主要模塊結(jié)構(gòu)
一維卷積層利用一維卷積核對輸入的一維數(shù)據(jù)進(jìn)行滑動卷積操作,本文作者構(gòu)造了由并行卷積層組成的多頭卷積網(wǎng)絡(luò)。當(dāng)多源信號輸入多頭卷積網(wǎng)絡(luò)時,多卷積內(nèi)核分別對多源信號進(jìn)行卷積運(yùn)算。假設(shè)輸入模型的多源信號表示為X1、X2、…,其中X=[x1,x2,…,xn],多頭卷積網(wǎng)絡(luò)各通道對多源信號的卷積運(yùn)算可以表示為
(3)
為了避免誤差反向傳播過程中由于激活函數(shù)連續(xù)求導(dǎo)相乘導(dǎo)致的梯度消失和梯度爆炸問題,將卷積網(wǎng)絡(luò)廣泛應(yīng)用的ReLU函數(shù)改造成求導(dǎo)不存在零值點(diǎn)的SeLU函數(shù),其函數(shù)及導(dǎo)數(shù)表達(dá)式為
(4)
(5)
式中:μ和λ為常數(shù),通常取值為1.673 3和1.050 7。
在所構(gòu)建的網(wǎng)絡(luò)中將最大池化層嵌入每頭卷積之后,利用池化后的特征向量進(jìn)行相加融合。池化及通道融合的過程可表示為
(6)
由多層相互交叉堆疊的卷積、池化層提取的特征映射后,將多維特征鋪平變換為一維向量輸入全連接層,經(jīng)過全連接層作用后得到輸出。全連接層的作用公式可表示為
yFC=f(WFCxFC+bFC)
(7)
式中:WFC和bFC分別代表全連接層的權(quán)重參數(shù)矩陣和偏置量;f(·)代表全連接層的內(nèi)部激活函數(shù)。
對于多分類問題,利用Softmax函數(shù)作為全連接層的激活函數(shù),通過將任意實(shí)數(shù)向量映射為概率分布向量,滿足所有輸出概率和為1。對于測試樣本x,其屬于某種類別的條件概率計算公式為
(8)
式中:C為類別標(biāo)簽總個數(shù);c為某種預(yù)測類別標(biāo)簽。
(9)
(10)
(11)
Adam為TensorFlow框架中常用的優(yōu)化器,是一種改進(jìn)的梯度下降算法,用于更新神經(jīng)網(wǎng)絡(luò)模型中的參數(shù)[20]。文中在常用的Adam優(yōu)化器中加入動態(tài)衰減學(xué)習(xí)率,模型訓(xùn)練時自適應(yīng)的調(diào)整學(xué)習(xí)率,如式(12):
rd=rend+(rinitial-rend)×es
(12)
式中:rinitial為初始學(xué)習(xí)率;s為迭代步長。
將模型正則化懲罰項(xiàng)加入到模型微調(diào)的過程中,其作用是自適應(yīng)限制網(wǎng)絡(luò)空間的功能容量,通過搜索網(wǎng)絡(luò)空間的有效功能大小來優(yōu)化網(wǎng)絡(luò)有益空間,促進(jìn)優(yōu)化收斂并避免收斂過擬合。正則化懲罰項(xiàng)在模型微調(diào)過程中自適應(yīng)地樹立參數(shù)更新準(zhǔn)則。
(13)
(14)
式中:正則化懲罰項(xiàng)L(w)作為w的對數(shù)先驗(yàn);M為類別個數(shù);yic為符號函數(shù)(樣本i與真實(shí)類別c相同時為1,不同時為0);pic表示樣本i在類別c中的預(yù)測概率。
L2懲罰也稱為權(quán)值衰減,能夠驅(qū)動網(wǎng)絡(luò)權(quán)值為0,其公式為式(15)。但是對于模型遷移學(xué)習(xí)其微調(diào)的起點(diǎn)并不是從0開始,而是從源域預(yù)訓(xùn)練模型凍結(jié)終點(diǎn)開始。假設(shè)對源域問題預(yù)訓(xùn)練的網(wǎng)絡(luò)模型的參數(shù)向量為w0,即為微調(diào)參數(shù)起點(diǎn)。利用這個初始向量作為L2懲罰中的參考項(xiàng),重新定義微調(diào)L2正則化懲罰的公式為式(16):
(15)
(16)
考慮遷移模型微調(diào)后結(jié)構(gòu)之間的對應(yīng)關(guān)系,式(16)中w0和w不構(gòu)成一一映射關(guān)系,因此需要對源域共享到目標(biāo)域的部分網(wǎng)絡(luò)結(jié)構(gòu)以及目標(biāo)域根據(jù)類別數(shù)量微調(diào)的新網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行適應(yīng)性連接,進(jìn)而構(gòu)建出一種如式(17)的復(fù)合正則化懲罰:
(17)
將所構(gòu)建的遷移學(xué)習(xí)模型應(yīng)用于小樣本下動力裝置的電機(jī)復(fù)合故障診斷,基于TL-MHCNN遷移學(xué)習(xí)模型的診斷方法如圖3所示。
圖3 小樣本下TL-MHCNN電機(jī)復(fù)合故障診斷步驟
具體實(shí)施步驟如下:
步驟1,采用電流傳感器和振動加速度傳感器獲取動力傳動裝置的多源信號,構(gòu)建大樣本單故障多通道數(shù)據(jù)集Xs和小樣本復(fù)合故障多通道數(shù)據(jù)集Xt,其中Xs被按比例劃分為訓(xùn)練集Xs,train與測試集Xs,test;
步驟2,構(gòu)建初始化MHCNN模型,并利用單故障訓(xùn)練集Xs,train訓(xùn)練模型;
步驟3,根據(jù)測試集Xs,test的最高精度保存最優(yōu)收斂模型Ms及參數(shù)ws;
步驟4,調(diào)取預(yù)訓(xùn)練模型,依據(jù)目標(biāo)域Dt={(Xt,Yt)}復(fù)合故障類別凍結(jié)底層網(wǎng)絡(luò)并加入新分類層;
步驟6,將新獲取的復(fù)合故障數(shù)據(jù)輸入遷移學(xué)習(xí)模型Mt,并輸出辨識故障結(jié)果。
為驗(yàn)證所提方法對小樣本電機(jī)復(fù)合故障的診斷效果,利用電機(jī)-轉(zhuǎn)子綜合試驗(yàn)臺(MFS-MG2010)進(jìn)行動力裝置電機(jī)復(fù)合故障的實(shí)驗(yàn)?zāi)M,圖4所示為電機(jī)動力傳動裝置示意圖及故障設(shè)置。其中采集信號分別來自A、B、C三個傳感器,其中傳感器A為電流鉗用于采集電流信號,安裝在電機(jī)接線柜的導(dǎo)線上;傳感器B和傳感器C都為振動加速度傳感器,分別安裝在電機(jī)外殼上和負(fù)載支撐座上,用于采集振動信號,采樣頻率為12 800 Hz。此實(shí)驗(yàn)設(shè)置的故障類型分別為電機(jī)軸承內(nèi)圈、滾動體故障、軸承外圈故障、電機(jī)轉(zhuǎn)子斷條故障及其復(fù)合故障。
圖4 實(shí)驗(yàn)故障模擬與數(shù)據(jù)采集示意
分別采集電機(jī)軸承與斷條的單故障信號大樣本作為遷移學(xué)習(xí)源域,電機(jī)軸承與斷條的復(fù)合故障信號小樣本作為遷移學(xué)習(xí)目標(biāo)域。源域的單故障數(shù)據(jù)集設(shè)置如表1所示,信號類型為正常(D1)、電機(jī)斷條缺陷(D2)、軸承內(nèi)圈缺陷(D3)、軸承外圈缺陷(D4)、軸承滾動體缺陷(D5),每類單故障取1 000個樣本,單個樣本長度為2 048,共5 000個樣本,按照訓(xùn)練集和驗(yàn)證集(7∶3)劃分比例。
表1 源域的大樣本電機(jī)單故障數(shù)據(jù)集
目標(biāo)域的小樣本電機(jī)復(fù)合故障數(shù)據(jù)集設(shè)置如表2所示,信號類型分為正常(F1)、軸承內(nèi)圈-電機(jī)斷條復(fù)合(F2)、軸承外圈-電機(jī)斷條復(fù)合(F3)、軸承滾動體-電機(jī)斷條復(fù)合(F4),每類復(fù)合故障取200個樣本,單個樣本長度為2 048。
表2 目標(biāo)域的小樣本電機(jī)復(fù)合故障數(shù)據(jù)集
以初始MHCNN作為遷移學(xué)習(xí)源模型,利用表1中大樣本的電機(jī)單故障數(shù)據(jù)樣本訓(xùn)練源模型,根據(jù)驗(yàn)證集精度保存收斂過程中的最優(yōu)模型進(jìn)而得到源域下的預(yù)訓(xùn)練模型,其遷移學(xué)習(xí)的整體網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù)設(shè)置如表3所示。利用目標(biāo)域下小樣本的復(fù)合故障數(shù)據(jù)樣本再次訓(xùn)練遷移模型對其進(jìn)行微調(diào),并在正則化懲罰項(xiàng)和新目標(biāo)函數(shù)的作用下自適應(yīng)優(yōu)化。
表3 模型網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)
實(shí)驗(yàn)表明,在采用正則化懲罰項(xiàng)自適應(yīng)優(yōu)化網(wǎng)絡(luò)模型時,表3中參數(shù)α和β對構(gòu)建模型的診斷精度有一定影響。利用五次交叉驗(yàn)證法對α和β進(jìn)行參數(shù)尋優(yōu),圖5所示為交叉驗(yàn)證實(shí)驗(yàn)下不同參數(shù)對診斷精度的影響結(jié)果。根據(jù)尋優(yōu)結(jié)果,選取模型中正則化懲罰項(xiàng)中參數(shù)α=0.001,β=0.1。
圖5 五次交叉驗(yàn)證實(shí)驗(yàn)下超參數(shù)α和β的尋優(yōu)結(jié)果
為了驗(yàn)證文中所提遷移學(xué)習(xí)方法的電機(jī)復(fù)合故障診斷性能,對A、B、C三個傳感器的小樣本電機(jī)軸承-斷條復(fù)合故障數(shù)據(jù)分別進(jìn)行測試,表4為10次小樣本遷移模型的復(fù)合故障診斷結(jié)果??芍夯趩卧葱畔⒌脑\斷結(jié)果與傳感器類型和安裝位置有關(guān),其中振動傳感器的診斷結(jié)果較好,且傳感器位置越接近故障點(diǎn),診斷結(jié)果越好。相較于3個單傳感器數(shù)據(jù)的診斷精度,利用傳感器A(電流信號)、傳感器B和C(振動信號)的多源異構(gòu)融合數(shù)據(jù)的診斷精度更好,其中準(zhǔn)確率最高可達(dá)到99.75%、平均準(zhǔn)確率為99.06%,同時誤差值為最??;相較于相同小樣本條件下的遷移診斷,無遷移學(xué)習(xí)的診斷準(zhǔn)確率則為84.17%。
表4 不同多源信號故障診斷實(shí)驗(yàn)結(jié)果對比 單位:%
圖6和圖7為表4不同診斷方法10次實(shí)驗(yàn)下的箱體可視化圖和不同次數(shù)測試實(shí)驗(yàn)的模型準(zhǔn)確率。結(jié)果顯示,文中所提出的基于MHCNN的遷移學(xué)習(xí)方法相比其他方法,準(zhǔn)確率谷值為98.25%,識別準(zhǔn)確率最高達(dá)到了99.75%,診斷精度最高,誤差最小。
圖6 故障識別準(zhǔn)確率誤差可視化箱體圖
圖7 不同模型10次測試識別精度比較
為進(jìn)一步驗(yàn)證文中所提遷移學(xué)習(xí)方法在小樣本下復(fù)合故障診斷的優(yōu)勢,利用文中的遷移學(xué)習(xí)模型TL-MHCNN與未使用遷移學(xué)習(xí)的初始MHCNN模型在不同訓(xùn)練樣本下進(jìn)行模型診斷精度的比較,其結(jié)果如圖8所示。可以看出:同樣在各故障訓(xùn)練樣本1 000個的情況下,基礎(chǔ)初始的遷移學(xué)習(xí)平均準(zhǔn)確率為98.85%,文中的遷移學(xué)習(xí)模型的準(zhǔn)確率為99.88%,遷移學(xué)習(xí)模型比初始模型精度略高但優(yōu)勢不明顯。兩種模型分別依次在800樣本、500樣本、200樣本下訓(xùn)練實(shí)驗(yàn),從結(jié)果可以看到文中的遷移學(xué)習(xí)模型在小樣本下對復(fù)合故障的診斷精度依然達(dá)到99.06%;而未使用遷移學(xué)習(xí)的方法在小樣本訓(xùn)練下模型精度隨著樣本數(shù)減少逐漸降低,在200個小樣本下模型精度僅為84.17%,且模型誤差增大,呈現(xiàn)出模型的不穩(wěn)定性。
圖8 不同樣本數(shù)量下遷移學(xué)習(xí)前后模型精度
實(shí)驗(yàn)中同時記錄小樣本下兩種模型的平均訓(xùn)練時間,如圖9所示??芍耗P陀?xùn)練收斂到最優(yōu)所需時間,文中所提的遷移學(xué)習(xí)方法為112.60 s,而未使用遷移學(xué)習(xí)方法的時間為323.10 s,文中的方法將模型訓(xùn)練收斂時間減少了210.5 s、縮短近2/3。因此可以驗(yàn)證文中的遷移學(xué)習(xí)模型能夠?qū)崿F(xiàn)小樣本下復(fù)合故障的高精度診斷,且模型穩(wěn)定度高、收斂速度快。
圖9 兩種模型訓(xùn)練收斂最優(yōu)時間
將文中所提的遷移學(xué)習(xí)方法與基于ImageNet的遷移學(xué)習(xí)方法進(jìn)行對比,分別包括在ImageNet上預(yù)訓(xùn)練封裝好的SqueezeNet[21]、inceptionV3[22]、AlexNet[23]深度遷移學(xué)習(xí)模型。由于基于ImageNet的遷移學(xué)習(xí)模型需要將信號轉(zhuǎn)換為圖片形式的預(yù)處理,將實(shí)驗(yàn)臺采集的時域信號通過小波變換方法轉(zhuǎn)換為時頻圖,預(yù)處理結(jié)果如圖10所示。
圖10 信號轉(zhuǎn)換小波時頻圖預(yù)處理
表5是不同遷移診斷模型對復(fù)合故障數(shù)據(jù)集的診斷結(jié)果,可知:AlexNet模型的訓(xùn)練時間為89.42 s,訓(xùn)練時間最短,但對復(fù)合故障診斷精度僅為90.17%;SqueezeNet和VGG-16模型的診斷精度分別為91.25%和83.65%,且模型收斂訓(xùn)練時間較長;與其他幾種遷移診斷模型相比,文中所提的遷移診斷模型在小樣本復(fù)合故障下的診斷平均準(zhǔn)確率和模型收斂訓(xùn)練時間都有一定優(yōu)勢。
表5 不同方法模型的診斷精度及訓(xùn)練時間
針對電機(jī)復(fù)合故障小樣本以及單源信號對電機(jī)多點(diǎn)復(fù)合故障信息表征不充分問題,構(gòu)建一種基于多源信號的TL-MHCNN遷移診斷模型。TL-MHCNN遷移診斷模型將MHCNN作為源域初始模型,解決了預(yù)訓(xùn)練模型的多源信號輸入,以滿足電流與振動信號的信息融合與特征提??;將大樣本單故障的電機(jī)原始數(shù)據(jù)集作為源域,構(gòu)建目標(biāo)域下以原始數(shù)據(jù)為輸入的電機(jī)小樣本復(fù)合故障遷移網(wǎng)絡(luò)模型,解決了電機(jī)小樣本復(fù)合故障遷移診斷問題;將正則化懲罰項(xiàng)應(yīng)用到遷移學(xué)習(xí)目標(biāo)域微調(diào)模型中,解決了遷移網(wǎng)絡(luò)模型參數(shù)的自適應(yīng)優(yōu)化問題。文中所提的遷移診斷模型在小樣本下對電機(jī)復(fù)合故障的診斷精度為99.06%,相較于多個模型的診斷結(jié)果,文中所提方法在小樣本下復(fù)合故障的識別精度、穩(wěn)定性與計算效率方面都得到有效提升。