董紹江,蔣明佑,羅召霞
(1.重慶交通大學(xué) 機(jī)電與車(chē)輛工程學(xué)院,重慶 400047;2.西南交通大學(xué) 磁浮技術(shù)與磁浮列車(chē)教育部重點(diǎn)實(shí)驗(yàn)室,成都 610031)
刀具作為機(jī)床的重要組成部分,其狀態(tài)對(duì)于產(chǎn)品的加工質(zhì)量、表面精度及整個(gè)設(shè)備系統(tǒng)的正常運(yùn)維具有重要影響。當(dāng)?shù)毒吣p到一定程度時(shí),如果持續(xù)使用,會(huì)引起切削力、切削溫度及切削振動(dòng)等明顯變化,降低切削性能[1]。美國(guó)肯納金屬公司研究表明,刀具的有效檢測(cè)可避免因刀具損壞導(dǎo)致的工件損壞及設(shè)備故障,節(jié)約費(fèi)用30%[2]。刀具的磨損狀態(tài)監(jiān)測(cè)是加強(qiáng)刀具智能監(jiān)測(cè)識(shí)別能力、提高識(shí)別精度、增強(qiáng)泛化性和魯棒性的重要保障。
針對(duì)刀具狀態(tài)監(jiān)測(cè)提出的方法很多,目前常用的刀具狀態(tài)識(shí)別算法有人工神經(jīng)網(wǎng)絡(luò)(ANN)、隱馬爾可夫模型(HMM)和支持向量機(jī)(SVM)等[3]。Coppel等[4]將人工神經(jīng)網(wǎng)絡(luò)同遺傳算法、蟻群算法相結(jié)合構(gòu)建了自適應(yīng)控制優(yōu)化系統(tǒng),有效監(jiān)測(cè)了銑刀的磨損狀態(tài);Cao等[5]利用小波包變換和Hilbert-Huang變換(HHT)實(shí)現(xiàn)端銑過(guò)程中的顫振識(shí)別,提高了加工生產(chǎn)率和零件質(zhì)量;Zhu等[6]利用隱馬爾可夫模型和基于切削力的節(jié)點(diǎn)平均能量,實(shí)現(xiàn)了切削過(guò)程中磨損量的預(yù)測(cè);Zhang等[7]針對(duì)球頭銑刀提出了一種基于最小二乘支持向量機(jī)的刀具磨損識(shí)別模型,識(shí)別效果較優(yōu)。
以上方法在進(jìn)行刀具狀態(tài)識(shí)別時(shí)通常有兩個(gè)基本假設(shè):1)用于學(xué)習(xí)的訓(xùn)練樣本與測(cè)試樣本滿(mǎn)足獨(dú)立同分布假設(shè)[8];2)具有足夠的可訓(xùn)練樣本。但是實(shí)際的刀具損耗中數(shù)據(jù)更新迅速,原先可利用的訓(xùn)練樣本很快過(guò)期,且新數(shù)據(jù)標(biāo)注過(guò)程繁瑣,導(dǎo)致以上兩個(gè)假設(shè)通常很難滿(mǎn)足。針對(duì)這一問(wèn)題,Sun等[9]構(gòu)建了深度遷移網(wǎng)絡(luò)模型,并以相對(duì)熵離散度(Kullback-Leibler divergence)為衡量標(biāo)準(zhǔn)來(lái)降低不同刀具特征間的差異;郝碧君等[10]在原有時(shí)頻域特征基礎(chǔ)上,通過(guò)小波包分解來(lái)獲取新的能量特征以擴(kuò)充訓(xùn)練數(shù)據(jù);對(duì)于少量訓(xùn)練數(shù)據(jù)無(wú)法訓(xùn)練出較強(qiáng)泛化能力模型的情況,遷移學(xué)習(xí)利用與目標(biāo)數(shù)據(jù)不同但相關(guān)的輔助數(shù)據(jù),極大提高了機(jī)器學(xué)習(xí)算法在目標(biāo)域上的準(zhǔn)確率[11]。
受上述研究啟發(fā),筆者提出了一種基于樣本擴(kuò)充與改進(jìn)領(lǐng)域?qū)咕W(wǎng)絡(luò)(sample expansion and improved domain adversarial training of neural networks,SE-IDANN)的遷移學(xué)習(xí)刀具狀態(tài)識(shí)別方法。通過(guò)二次特征提取與Smote算法擴(kuò)充樣本量;將Wasserstein距離[12]作為衡量標(biāo)準(zhǔn)引入模型,提高兩個(gè)域的分布對(duì)稱(chēng)性;加入殘差塊,在避免梯度爆炸的同時(shí)將模型特征提取層加深,進(jìn)而提高目標(biāo)刀具磨損識(shí)別準(zhǔn)確率。
本研究中所用刀具數(shù)據(jù)提取的一次特征包括時(shí)域特征、頻域特征、時(shí)頻域特征和時(shí)序特征。其中時(shí)域特征為絕對(duì)平均值、均方根值、歪度峭度值等;頻域特征為頻域幅值平均值、頻域幅值標(biāo)準(zhǔn)差等;時(shí)頻域特征為能量特征比(即小波包分解后能量集中頻段值與全頻段能量總和之比);時(shí)序特征為近似熵、自回歸系數(shù)、傅里葉變換系數(shù)等。
受數(shù)據(jù)量影響,一次特征的維度可能無(wú)法滿(mǎn)足深層數(shù)模型的特征提取需求,因此將每個(gè)樣本的一次特征進(jìn)行二次特征提取,以擴(kuò)大特征數(shù)量。表1為提取的二次統(tǒng)計(jì)學(xué)特征。
表1 二次統(tǒng)計(jì)特征
表中的波形指標(biāo)反應(yīng)刀具磨損與崩壞的變化情況;脈沖指標(biāo)用以監(jiān)測(cè)信號(hào)中是否存在沖擊;歪度指標(biāo)是概率密度函數(shù)不對(duì)稱(chēng)性程度的度量;峰值指標(biāo)不受振動(dòng)信號(hào)絕對(duì)水平所左右,不易出現(xiàn)測(cè)量誤差;裕度指標(biāo)和峭度指標(biāo)對(duì)沖激脈沖較為敏感。
受原始數(shù)據(jù)量影響,原有樣本數(shù)較少,可能無(wú)法滿(mǎn)足層數(shù)較深的網(wǎng)絡(luò)訓(xùn)練需求,因此對(duì)原始樣本進(jìn)行樣本擴(kuò)充。
傳統(tǒng)隨機(jī)過(guò)采樣采取簡(jiǎn)單復(fù)制樣本的策略增加少數(shù)類(lèi)樣本,實(shí)際并未產(chǎn)生新的樣本,且容易產(chǎn)生過(guò)擬合。Smote算法[13]是根據(jù)少數(shù)類(lèi)樣本分布人工合成新樣本添加到數(shù)據(jù)集中,基于原有樣本產(chǎn)生的新樣本獨(dú)立于原始樣本,這在一定程度上增加了可遷移樣本量。Smote算法新樣本點(diǎn)產(chǎn)生如圖1所示。
圖1 Smote新樣本產(chǎn)生
對(duì)于少數(shù)類(lèi)樣本中的每個(gè)樣本x,以歐氏距離計(jì)算它到少數(shù)類(lèi)樣本集smin中所有樣本的距離,得到其k近鄰(k-nearest neighbor)。根據(jù)樣本不平衡比例設(shè)置一個(gè)采樣倍率N,對(duì)于每個(gè)少數(shù)類(lèi)樣本x,從其k近鄰中隨機(jī)選擇若干個(gè)樣本。對(duì)于每個(gè)選出的第i個(gè)近鄰xi,分別與原樣本按照公式(1)構(gòu)建新的樣本。
xnew=x+rand(0,1)|x-xi|。
(1)
利用Wasserstein距離作為數(shù)據(jù)分布相似性的標(biāo)準(zhǔn)進(jìn)行分析,在原有DANN模型基礎(chǔ)上引入Wasserstein距離用于衡量?jī)蓚€(gè)分布之間的差異。相比于KL離散度和JS離散度(Jensen-Shannon divergence),即使兩個(gè)支撐集沒(méi)有重疊或者重疊很少,Wasserstein距離仍能衡量?jī)蓚€(gè)分布的相似度。Wasserstein距離定義如式(2)所示:
(2)
神經(jīng)網(wǎng)絡(luò)本身具有特征變換的能力,將Wasserstein距離作為損失值引入DANN,通過(guò)最小化源域與目標(biāo)域數(shù)據(jù)在映射空間下的Wasserstein距離,得到降維后的特征空間。在該特征空間下,目標(biāo)域與源域具有相同或者非常相近的數(shù)據(jù)分布。
DANN網(wǎng)絡(luò)[14]的目標(biāo)是把具有不同分布的目標(biāo)域與源域數(shù)據(jù)映射到同一特征空間,通過(guò)對(duì)抗準(zhǔn)則使其在該空間上的距離縮小,然后用源域訓(xùn)練好的分類(lèi)器對(duì)目標(biāo)域數(shù)據(jù)分類(lèi)。數(shù)據(jù)映射過(guò)程如圖2所示。
圖2 DANN網(wǎng)絡(luò)數(shù)據(jù)映射過(guò)程
DANN網(wǎng)絡(luò)由特征提取器(feature extractor)、類(lèi)別分類(lèi)器(category classifier)和域判別器(domain classifier)組成。特征提取器和類(lèi)別分類(lèi)器共同構(gòu)成一個(gè)前饋神經(jīng)網(wǎng)絡(luò)。在特征提取器后面加入域判別器,并通過(guò)梯度反轉(zhuǎn)層(gradient reversal layer,GRL)連接。DANN的網(wǎng)絡(luò)結(jié)構(gòu)及傳播過(guò)程如圖3所示,圖中f為提取的特征,y為分類(lèi)結(jié)果,Ly為類(lèi)別分類(lèi)損失值,Ld為域判別損失值。
圖3 DANN網(wǎng)絡(luò)結(jié)構(gòu)及傳播過(guò)程
DANN的損失值包含類(lèi)別分類(lèi)損失與域判別損失兩部分。類(lèi)別分類(lèi)損失定義如下:
(3)
式中:(xi,yi)為輸入樣本及其標(biāo)簽,Gf為特征提取過(guò)程,Gy為類(lèi)別分類(lèi)過(guò)程。
源域上的訓(xùn)練優(yōu)化目標(biāo)為:
(4)
域判別損失定義如下:
(5)
式中:di為第i個(gè)樣本的二元標(biāo)簽,表示該樣本屬于目標(biāo)域還是源域;Gd為域判別器輸出。
則域判別器訓(xùn)練優(yōu)化目標(biāo)為:
(6)
DANN網(wǎng)絡(luò)模型的總目標(biāo)函數(shù)為:
(7)
式中E為總損失值。
在原有DANN基礎(chǔ)上進(jìn)行改進(jìn),加深特征提取器網(wǎng)絡(luò)層數(shù)并加入殘差塊,殘差塊結(jié)構(gòu)如圖4所示,圖中s為網(wǎng)絡(luò)輸入,F(xiàn)(s)為殘差塊在第二層激活函數(shù)之前的輸出,RelU為激活函數(shù)。
圖4 殘差塊結(jié)構(gòu)
這一改變使特征提取更加深刻,并有效解決了由于神經(jīng)網(wǎng)絡(luò)深度增加性能反而下降的問(wèn)題。殘差塊的輸出為:
σ(F(s)+s)=σ(W2σ(W1s)+s),
(8)
式中:W1和W2為第一、二層網(wǎng)絡(luò)權(quán)重,σ為激活函數(shù)。
使用Wasserstein距離作為新的網(wǎng)絡(luò)損失值加入模型,這一改變使目標(biāo)域與源域在映射空間下的分布更接近。
將源域與目標(biāo)域特征提取器的輸出作為Wasserstein距離的計(jì)算輸入,并將Wasserstein距離的計(jì)算結(jié)果作為新?lián)p失值加入網(wǎng)絡(luò),反向傳播更新模型參數(shù)的同時(shí)優(yōu)化源域與目標(biāo)域的數(shù)據(jù)分布。模型的最終優(yōu)化目標(biāo)為:
E′(W,b,V,c,U,z)=E(W,b,V,c,U,z)+w(P1,P2),
(9)
式中:w(P1,P2)為目標(biāo)域與源域的Wasserstein距離;E′為調(diào)整后總損失值。
模型迭代訓(xùn)練過(guò)程中,反向傳播更新的最優(yōu)參數(shù)為:
(10)
(11)
IDANN跨刀具磨損狀態(tài)識(shí)別模型流程如圖5所示,圖中的Lw為經(jīng)W距離計(jì)算后的損失值。
圖5 IDANN跨刀具磨損狀態(tài)識(shí)別流程
采用美國(guó)紐約預(yù)測(cè)與健康管理學(xué)會(huì)2010年高速數(shù)控機(jī)床刀具健康預(yù)測(cè)競(jìng)賽開(kāi)放數(shù)據(jù)(Prognostics and Health Management Society, PHM2010)[15]和美國(guó)航空航天局艾姆斯研究中心銑削數(shù)據(jù)(NASA Milling Data Set)[16]兩個(gè)數(shù)據(jù)集進(jìn)行方法驗(yàn)證。將PHM2010試驗(yàn)作為主要試驗(yàn),NASA Milling Data Set試驗(yàn)作為方法遷移的驗(yàn)證試驗(yàn)。
PHM2010刀具數(shù)據(jù)集為試驗(yàn)選用的加工條件及信號(hào)采集參數(shù)(表2)。
表2 PHM2010試驗(yàn)參數(shù)
試驗(yàn)在CNC數(shù)控銑床的刀具進(jìn)給方向(X)、主軸徑向(Y)、主軸軸向(Z)安裝了加速度振動(dòng)信號(hào)傳感器,在夾具及工件上安裝了測(cè)力儀及聲發(fā)射傳感器。試驗(yàn)對(duì)6把銑刀(C1、C2、C3、C4、C5、C6)進(jìn)行了全壽命周期試驗(yàn),每把刀具進(jìn)行了315次銑削加工。采集了X、Y、Z3個(gè)方向的銑削力信號(hào)、三向銑削振動(dòng)信號(hào)和聲發(fā)射均方根值,共7組信號(hào)。其中C1、C4、C6測(cè)量了切削刃的后刀面磨損量,取3個(gè)切削刃的磨損量均值作為刀具磨損結(jié)果,3把銑刀的磨損量均值曲線(xiàn)如圖6所示。根據(jù)刀具磨損過(guò)程的一般規(guī)律[17]及磨損量均值,將刀具磨損狀態(tài)分為3類(lèi)。其中小于85 μm時(shí)磨損較快,為初級(jí)磨損,這一階段,切削刃與加工表面接觸為一條直線(xiàn),切削應(yīng)力集中;85 μm到140 μm時(shí)磨損相對(duì)緩慢,為中級(jí)磨損,這一階段,磨損面寬度增加,磨損量呈現(xiàn)均勻增加;大于140 μm時(shí)磨損急劇,為過(guò)度磨損,這一階段,刀具由切削轉(zhuǎn)為啃削,溫度升高,磨損強(qiáng)度大大加劇。
圖6 PHM2010刀具磨損量均值曲線(xiàn)
對(duì)這3把銑刀分別進(jìn)行了交叉驗(yàn)證:C1、C6作為訓(xùn)練集,C4作為測(cè)試集,定義為試驗(yàn)A;C1、C4作為訓(xùn)練集,C6作為測(cè)試集,定義為試驗(yàn)B;C4、C6作為訓(xùn)練集,C1作為測(cè)試集,此處定義為試驗(yàn)C。
提取的特征包括時(shí)域、頻域、時(shí)頻域、時(shí)序共53種239個(gè)特征。在原有239個(gè)特征基礎(chǔ)上對(duì)每個(gè)樣本的一次特征進(jìn)行二次特征提取,所提特征如1.1節(jié)所述,最終提取252個(gè)特征。
采用Smote算法按比例擴(kuò)充,以B試驗(yàn)為例,原始訓(xùn)練集測(cè)試集樣本比為2∶1,將訓(xùn)練集樣本按4∶1比例擴(kuò)充,擴(kuò)充后各磨損狀態(tài)樣本量為(0∶556,1∶1 540,2∶424),樣本量達(dá)到2 520,擴(kuò)充后訓(xùn)練集測(cè)試集比為8∶1。擴(kuò)充前后數(shù)據(jù)在11號(hào)、91號(hào)、238號(hào)特征維度下的對(duì)比結(jié)果如圖7所示。
圖7 PHM2010樣本擴(kuò)充前后對(duì)比
試驗(yàn)使用PyTorch機(jī)器學(xué)習(xí)庫(kù)進(jìn)行DANN網(wǎng)絡(luò)模型設(shè)計(jì)。使用Adam優(yōu)化器進(jìn)行模型參數(shù)更新,學(xué)習(xí)率為10-3,迭代輪數(shù)為3 000,隨機(jī)失活率(Dropout)為0.5,激活函數(shù)為ReLU,其中類(lèi)別分類(lèi)器與域判別器分別包含3層與2層全連接層,特征提取器為2個(gè)卷積池化層與3個(gè)殘差結(jié)構(gòu)的組合。模型參數(shù)如表3所示。
表3 IDANN模型參數(shù)
特征提取器的第一卷積層F_Conv1使用寬卷積核,能有效削弱高頻噪聲對(duì)特征提取的影響,起到抗干擾作用[18]。F_Conv1卷積核尺寸為1×9,步長(zhǎng)為1×1,卷積核個(gè)數(shù)為6。每個(gè)F_Block包含4個(gè)殘差塊,每個(gè)殘差塊包含2個(gè)卷積層,每層卷積核尺寸、卷積核個(gè)數(shù)相同,其中第一個(gè)殘差塊卷積層的步長(zhǎng)為2×1,其他為1×1。在FC層之間加入Dropout層,防止模型過(guò)擬合。將兩個(gè)域的特征提取器輸出作為Wasserstein距離計(jì)算的輸入,并將此計(jì)算結(jié)果作為損失值嵌入模型。
試驗(yàn)選取CNN、ResNet、DANN作為對(duì)比模型。其中CNN為2層卷積池化層與全連接層組合,ResNet為3個(gè)殘差結(jié)構(gòu)與全連接層組合,DANN為未添加殘差結(jié)構(gòu)與Wasserstein距離指標(biāo)的DANN模型,對(duì)比模型相關(guān)參數(shù)即為表3的各部分參數(shù)。
本研究中同時(shí)將此方法遷移到NASA Milling Data Set數(shù)據(jù)集。試驗(yàn)采集了AC主軸電機(jī)電流信號(hào)、DC主軸電機(jī)電流信號(hào)、工作臺(tái)振動(dòng)信號(hào)、主軸振動(dòng)信號(hào)、工作臺(tái)聲發(fā)射信號(hào)和主軸聲發(fā)射信號(hào),共6組信號(hào)。選取第5、16工況下的數(shù)據(jù)為源域,第9工況數(shù)據(jù)作為目標(biāo)域,進(jìn)行跨刀具材料的磨損狀態(tài)識(shí)別,定義為試驗(yàn)D;其中第5、9、16加工工況如表4所示。
表4 NASA Milling Data Set刀具加工工況
按照刀具的一般磨損規(guī)律及后刀面磨損量變化將刀具磨損狀態(tài)分為3類(lèi):小于250 μm為初級(jí)磨損,250 μm到500 μm為中級(jí)磨損,大于500 μm為過(guò)度磨損。3把刀的后刀面磨損VB曲線(xiàn)如圖8所示。
圖8 NASA Milling Data Set刀具后刀面磨損曲線(xiàn)
根據(jù)試驗(yàn)需求,將每組加工數(shù)據(jù)切分成70個(gè)小樣本。經(jīng)二次特征提取后,特征數(shù)達(dá)到331。采用Smote算法按5∶1比例擴(kuò)充,訓(xùn)練集測(cè)試集比由11∶9擴(kuò)充為55∶9。擴(kuò)充前后數(shù)據(jù)在11號(hào)、91號(hào)、238號(hào)特征維度下的對(duì)比結(jié)果如圖9所示。
圖9 NASA Milling Data Set樣本擴(kuò)充前后對(duì)比
針對(duì)PHM2010數(shù)據(jù)集分別進(jìn)行了有、無(wú)樣本擴(kuò)充條件下CNN、ResNet、DANN、IDANN模型的A、B、C試驗(yàn),識(shí)別正確率如圖10所示。
圖10 PHM 2010競(jìng)賽數(shù)據(jù)識(shí)別正確率
由圖10知,采用樣本擴(kuò)充后,所有模型的識(shí)別正確率均有所提升。證明擴(kuò)充訓(xùn)練樣本在一定程度上增加了可遷移樣本量,有助于目標(biāo)域的分類(lèi)。對(duì)比本研究中提出的遷移學(xué)習(xí)方法與傳統(tǒng)深度學(xué)習(xí)方法的效果,遷移學(xué)習(xí)的識(shí)別正確率均超過(guò)傳統(tǒng)深度學(xué)習(xí)識(shí)別正確率。其中,DANN與IDANN識(shí)別正確率超過(guò)82%,CNN與ResNet識(shí)別正確率低于82%。說(shuō)明對(duì)于本研究中提出的跨刀具的磨損狀態(tài)識(shí)別任務(wù),遷移學(xué)習(xí)識(shí)別效果更高。對(duì)比CNN與ResNet,ResNet正確率總體高于CNN,說(shuō)明隨著網(wǎng)絡(luò)深度增加,特征提取更加深刻,分類(lèi)效果更好。對(duì)比DANN與IDANN,IDANN正確率總體高于DANN,說(shuō)明IDANN在加入Wasserstein距離指導(dǎo)后使源域目標(biāo)域的數(shù)據(jù)分布更接近,遷移效果更好。SE-IDANN方法增加了可遷移樣本量,在加深特征提取深刻性的同時(shí)保證了源域和目標(biāo)域的數(shù)據(jù)分布的對(duì)稱(chēng)性,總體效果優(yōu)于有或無(wú)樣本擴(kuò)充條件下的CNN、ResNet和DANN方法。
試驗(yàn)D識(shí)別結(jié)果如圖11所示。由圖11可知,在NASA Milling Data Set數(shù)據(jù)集下,有樣本擴(kuò)充比于無(wú)樣本擴(kuò)充識(shí)別正確率提高約7%,且有樣本擴(kuò)充條件下正確率均超過(guò)85%。對(duì)比4種不同模型在有、無(wú)樣本擴(kuò)充條件下的識(shí)別正確率,可得IDANN在有樣本擴(kuò)充條件下正確率最高,超過(guò)90%。
圖11 NASA Milling Data Set試驗(yàn)識(shí)別正確率
本研究中結(jié)合原始數(shù)據(jù)特征,通過(guò)二次特征提取和Smote算法進(jìn)行樣本擴(kuò)充,將Wasserstein距離作為源域目標(biāo)域分布相似性標(biāo)準(zhǔn)引入模型,模型特征提取器中加入殘差結(jié)構(gòu),在防止梯度爆炸的前提下加深網(wǎng)絡(luò),以提高目標(biāo)刀具磨損識(shí)別準(zhǔn)確率。結(jié)合傳統(tǒng)深度學(xué)習(xí)模型與遷移學(xué)習(xí)模型進(jìn)行了交叉對(duì)比驗(yàn)證。結(jié)果證明,在跨刀具磨損狀態(tài)識(shí)別任務(wù)中,當(dāng)目標(biāo)域數(shù)據(jù)較少時(shí),基于樣本擴(kuò)充與IDANN的遷移學(xué)習(xí)方法對(duì)刀具狀態(tài)識(shí)別具有一定效果。
將該方法應(yīng)用到其它數(shù)據(jù)集上實(shí)現(xiàn)了方法的遷移,結(jié)果證明該方法在其他數(shù)據(jù)集上同樣有效,實(shí)現(xiàn)了SE-IDANN在刀具磨損狀態(tài)識(shí)別領(lǐng)域的應(yīng)用。