孫燦飛,黃林然,沈勇, 2
1. 航空工業(yè)上海航空測控技術(shù)研究所 研究中心,上海 201601 2. 故障診斷與健康管理技術(shù)航空科技重點實驗室 試驗與驗證中心,上海 201601
行星傳動輪系作為直升機動力傳動系統(tǒng)的核心部件,對整個直升機飛行安全具有重大影響。無論是從故障的發(fā)生頻次還是危險程度考慮,傳動系統(tǒng)行星傳動輪系既是直升機健康監(jiān)測和故障診斷的重點和難點,也是直升機機械部件故障診斷方法研究的熱點。
相較于常規(guī)行星齒輪箱,直升機行星傳動輪系的使用工況更加復(fù)雜惡劣。一是復(fù)雜的工作狀態(tài),主要體現(xiàn)在負載大范圍變化。隨著飛行狀態(tài)的變化,旋翼載荷同步改變,直升機行星傳動輪系運行工況也隨之變化。變負載造成行星傳動輪系齒輪嚙合振動出現(xiàn)變化,信號形態(tài)更加復(fù)雜多變。二是惡劣的工作環(huán)境。直升機是高度復(fù)雜的機、電、液一體化的復(fù)雜裝備系統(tǒng),內(nèi)部零部件眾多,振動傳遞路徑復(fù)雜多樣,內(nèi)部零部件的制造與安裝誤差旋轉(zhuǎn)后引起的微小振動也以干擾形式混合在信號中,使采集信號既有隨機噪聲也有特定干擾,信號背景更加復(fù)雜多變。因此,直升機行星傳動輪系故障診斷方法既要在負載變化下保持診斷的性能,同時又要在噪聲環(huán)境下具有較好的健壯性。
目前,遷移學習在機器學習領(lǐng)域得到廣泛關(guān)注與研究,其中域適應(yīng)方法致力于減少源域工況與目標域工況樣本之間的特征分布差異,在變工況故障診斷中得到了成功應(yīng)用。文獻[8]提取模態(tài)分解信號的多維度特征,采用半監(jiān)督遷移成分分析(Semisupervised Transfer Component Analysis, SSTCA)方法用于變工況的滾動軸承故障診斷。文獻[9]采用稀疏自動編碼器的特征提取以及半監(jiān)督最大獨立域適應(yīng)(Semisupervised Maximum Independence Domain Adaptation, SSMIDA)相結(jié)合的深度遷移學習實現(xiàn)電機軸承的故障診斷。文獻[10]基于一維原始振動信號,采用域?qū)惯w移網(wǎng)絡(luò)(Domain Adversarial Neural Networks, DANN)對變工況下的滾動軸承進行故障診斷。
由于直升機主減速器部件繁多,結(jié)構(gòu)緊湊復(fù)雜,部件之間振動相互耦合疊加影響,加之行星傳動輪系本身獨特的結(jié)構(gòu),采集的振動信號具有強烈的非線性與耦合調(diào)制特征,致使傳統(tǒng)淺層學習方法很難實現(xiàn)高精度的故障診斷。與淺層學習機制相比,深度學習通過建立深度模型,映射輸入信號與輸出模式之間復(fù)雜的內(nèi)在關(guān)系,可以找到更抽象、更高層次的特征表示,適用于大數(shù)據(jù)背景下的多元、非線性、高維數(shù)據(jù)分析。近年來,基于堆疊自編碼器、深度信念網(wǎng)絡(luò)以及卷積神經(jīng)網(wǎng)絡(luò)等深度學習模型的故障診斷方法已成功應(yīng)用于轉(zhuǎn)子、軸承與齒輪等機械部件的特征提取和故障模式識別。
因此,結(jié)合域?qū)惯w移模型變工況下的遷移能力以及深度學習模型的學習能力,本文提出了一種自適應(yīng)域?qū)股疃冗w移學習(Domain-adversarial Deep Transfer Learning, DDTL)的故障診斷方法,旨在解決直升機行星傳動輪系故障診斷在變負載以及強噪聲下的診斷難題,同時方法能根據(jù)工況變化自適應(yīng)調(diào)整網(wǎng)絡(luò)參數(shù),獲得優(yōu)化的診斷模型,提高模型的域適配能力和故障診斷精度。
對于直升機行星傳動輪系故障診斷,模型既要保證對行星傳動輪系振動信號與故障模式之間復(fù)雜的映射關(guān)系具有很強的學習能力,又要保證在變負載和強噪聲條件下具有較好的適應(yīng)能力。因此,提出一種域?qū)股疃冗w移學習(DDTL)網(wǎng)絡(luò)模型,模型采用了具有良好抗噪性能的堆棧收縮自動編碼深度學習網(wǎng)絡(luò)(Stack Contractive Autoencoder Network,SCAE)對故障特征進行提取,并將已知工況下帶標簽訓(xùn)練樣本作為源域,未知工況下無標簽測試樣本作為目標域進行域適應(yīng),采用域?qū)箼C制實現(xiàn)不同負載之間的自適應(yīng)遷移,減少不同負載之間樣本數(shù)據(jù)分布的差異,提高模型的診斷能力與泛化能力。DDTL網(wǎng)絡(luò)模型框架如圖1所示。
圖1 DDTL網(wǎng)絡(luò)模型Fig.1 Network model of DDTL
源域深度特征提取網(wǎng)絡(luò)采用sigmoid激活函數(shù),輸出表達式為
(1)
目標域深度特征提取網(wǎng)絡(luò)輸出表達式為
(2)
與DANN域?qū)狗椒ú煌珼DTL的源域與目標域采用獨立的深度特征提取網(wǎng)絡(luò),這樣可以在工況變化時采用當前工況下無標簽測試樣本自適應(yīng)對網(wǎng)絡(luò)參數(shù)進行訓(xùn)練優(yōu)化,在降低了模型復(fù)雜度的同時,提高了當源域與目標域數(shù)據(jù)分布差異較大時的遷移性能。
在DDTL網(wǎng)絡(luò)模型中,借助源域帶標簽樣本可以訓(xùn)練得到深度特征提取模型。在源域與目標域樣本數(shù)據(jù)分布一致的情況下,與可以共享網(wǎng)絡(luò)權(quán)值實現(xiàn)目標域樣本深度特征提取,但在與數(shù)據(jù)分布出現(xiàn)差異或者差異較大情況下,直接采用權(quán)值共享的對稱映射會降低目標域深度特征的可遷移性。因此,DDTL將源域訓(xùn)練得到的網(wǎng)絡(luò)參數(shù)遷移至目標域作為域適應(yīng)的網(wǎng)絡(luò)初始權(quán)值:
(3)
式中:=1,2,…,。
參數(shù)遷移后,采用目標域無標簽測試樣本對進行網(wǎng)絡(luò)參數(shù)優(yōu)化,以進一步減小源域與目標域之間的域偏移,提高了模型的穩(wěn)定性以及對目標域樣本的診斷性能。
DDTL的訓(xùn)練優(yōu)化分為兩個階段。在第一階段用源域帶標簽樣本訓(xùn)練和標簽分類器,預(yù)測的損失函數(shù)最小化。在此階段訓(xùn)練后和的網(wǎng)絡(luò)參數(shù)保持固定。在第二階段將參數(shù)遷移至后,采用目標域無標簽樣本對和域判別器進行對抗式的訓(xùn)練,不斷優(yōu)化迭代的網(wǎng)絡(luò)參數(shù)。訓(xùn)練完成后,提取到了高質(zhì)量的可遷移深度特征,消除了域之間的分布差異,就可以直接采用源域訓(xùn)練后的進行標簽分類。
1)與的訓(xùn)練優(yōu)化
DDTL的深度特征提取采用堆棧收縮自動編碼網(wǎng)絡(luò),標簽分類器采用softmax作為激活函數(shù),可表達為
(();)=softmax(×()+)
(4)
與的有監(jiān)督訓(xùn)練基于源域帶標簽樣本集{,},目標函數(shù)采用標準的交叉熵損失函數(shù):
(5)
通過隨機梯度下降算法求解優(yōu)化目標函數(shù)獲得與的參數(shù):
(6)
訓(xùn)練優(yōu)化完成特征提取器和標簽預(yù)測器后,將網(wǎng)絡(luò)參數(shù)直接遷移至,并結(jié)合域判別器進行第二階段對抗訓(xùn)練,以消除源域與目標域之間的域偏移,使提取的特征同樣適應(yīng)于標簽預(yù)測器。
2)與的訓(xùn)練優(yōu)化
對于域判別器采用sigmoid作為激活函數(shù),其輸出為二元標簽,代表樣本來自源域或目標域。結(jié)合生成對抗網(wǎng)絡(luò)(Generative Adversarial Networks, GAN)的思想,與形成對抗競爭關(guān)系,相互交替訓(xùn)練,整個優(yōu)化過程可以視為一個極大極小博弈問題,網(wǎng)絡(luò)的損失函數(shù)為:
~[lg()+lg(1-())]
(7)
求解網(wǎng)絡(luò)損失函數(shù),分解為目標域特征提取器與域判別器目標函數(shù):
-~[lg(())]
-~[lg(1-(()))]
(8)
-~[lg(())]
(9)
通過最小化目標函數(shù)來更新標簽預(yù)測器的參數(shù),最大化目標函數(shù)來更新域判別器的參數(shù):
(10)
(11)
采用DDTL進行直升機行星傳動輪系故障診斷的方法流程如圖2所示。具體步驟如下:
1) 樣本預(yù)處理
根據(jù)行星齒輪箱振動模型,齒輪局部故障主要引起頻譜數(shù)據(jù)中齒輪嚙合頻率及諧波的邊帶分布的變化,而且相比于時域信號,頻域信號在變負載情況具有更優(yōu)的診斷準確率,因此對采集的時域樣本數(shù)據(jù)進行信號分解,提取故障敏感信號后進行頻域變換,經(jīng)過歸一化處理后,作為樣本集。將已知負載下正常與故障樣本組合成為訓(xùn)練樣本集(源域,帶樣本標簽),將未知負載下的測試樣本組合作為測試樣本集(目標域,無樣本標簽)。
2) 參數(shù)初始化
采用堆棧收縮自動編碼器SCAE的網(wǎng)絡(luò)結(jié)構(gòu),網(wǎng)絡(luò)輸出層采用softmax作為激活函數(shù)進行的標簽預(yù)測。設(shè)置SCAE初始網(wǎng)絡(luò)參數(shù),包括隱含層層數(shù)和層節(jié)點數(shù),隨機初始化連接參數(shù),即權(quán)重、偏差以及正則化項。
3)與訓(xùn)練
采用訓(xùn)練樣本集(不帶標簽)逐層貪婪訓(xùn)練的SCAE網(wǎng)絡(luò)模型;采用訓(xùn)練樣本集(帶標簽)基于無監(jiān)督訓(xùn)練后的SCAE網(wǎng)絡(luò)模型進行源域特征提取并輸入至,進行的訓(xùn)練,并基于誤差反向傳播完成網(wǎng)絡(luò)模型的有監(jiān)督微調(diào)。
4) 參數(shù)遷移
采用堆棧收縮自動編碼器SCAE的網(wǎng)絡(luò)結(jié)構(gòu),網(wǎng)絡(luò)輸出層采用sigmoid作為激活函數(shù)進行的域判別。采用第1階段訓(xùn)練完成的參數(shù)初始化。
圖2 故障診斷流程Fig.2 Diagram of whole fault diagnosis process
5) 對抗訓(xùn)練
采用源域與目標域樣本分別對、進行訓(xùn)練,提取域特征輸入至進行域判別,并基于對抗學習方式,不斷交替優(yōu)化與。
6) 測試階段
采用源域訓(xùn)練后的對目標域樣本經(jīng)提取的深度特征進行測試,輸出樣本故障模式,完成故障診斷。
在直升機行星傳動仿真實驗臺對方法進行驗證,如圖3所示,主要由變速驅(qū)動電機、可編程控制面板、2級行星齒輪箱、平行軸齒輪箱、可編程磁力制動器、加速度傳感器等構(gòu)成。
圖3 直升機行星傳動仿真實驗臺Fig.3 Helicopter planetary gearboxes transmission platform
實驗設(shè)置了4種齒輪故障模式:磨損、裂紋、切齒和斷齒,如圖4所示。在行星齒輪箱外部安裝加速度傳感器檢測振動信號,采樣頻率為10 kHz。
圖4 行星齒輪箱中典型故障模式部件Fig.4 Typical faulty components of planetary gearboxes
為模擬直升機傳動輪系轉(zhuǎn)速微弱波動與負載大范圍變化的實際工作狀態(tài),實驗在正常與故障情況下設(shè)置了4種變負載工況,各工況下樣本配置情況如表1所示。
表1 不同工況下的樣本配置
為了驗證方法的優(yōu)越性,采用無對抗遷移的SCAE網(wǎng)絡(luò)作為基線方法,其他對比方法包括:常規(guī)域適應(yīng)方法SSTCA、SSMIDA以及基于對抗域適應(yīng)方法DANN。方法采用多層感知器(MLP)進行特征提取,DANN同樣采用MLP作為標簽預(yù)測器和域判別器,采用Adam優(yōu)化器用于網(wǎng)絡(luò)訓(xùn)練。網(wǎng)絡(luò)結(jié)構(gòu)為1000-250-5,其他超參數(shù)預(yù)設(shè)范圍內(nèi)進行隨機搜索,詳見表2,并選擇最優(yōu)設(shè)置下的結(jié)果作為實驗結(jié)果。
表2 超參數(shù)預(yù)設(shè)范圍Table 2 Value sets for hyperparameter tuning
為了體現(xiàn)域適應(yīng)方法對特征分布的影響,選取工況A/D(源域/目標域)的遷移任務(wù)采用t-SNE 對特征進行可視化分析,實驗結(jié)果如圖5所示。
圖5 特征可視化分析Fig.5 Feature visualization analysis
從圖中可見,基線方法采用SCAE網(wǎng)絡(luò)在單一工況下能明顯區(qū)分出故障模式,但不同工況下相同故障模式分散在不同區(qū)域,表明其在處理變工況條件下的局限性。與基線方法相比,域適應(yīng)方法對樣本特征進行映射處理后,兩種工況下的樣本特征分布出現(xiàn)不同程度的接近,體現(xiàn)出域適應(yīng)的效果。相比于其他方法,DDTL在特征空間中分布的一致性更優(yōu),不同故障模式樣本能彼此完全分開,而不同工況下相同故障模式樣本能完全聚集,體現(xiàn)了其優(yōu)異的特征遷移能力與模式識別能力。
從樣本集中選取單工況-單工況、多工況-單工況以及多工況-多工況三種遷移情況進行對比分析。實驗將源域單/多工況下帶標簽樣本作為訓(xùn)練樣本,將目標域工況不帶標簽樣本隨機抽取一半樣本作為訓(xùn)練樣本,另一半樣本作為測試樣本。實驗重復(fù)5次,診斷準確率的平均值與標準差如表3所示。
從表3中可以看出,面對不同工況下樣本特征分布的差異,基線方法在5種遷移任務(wù)中診斷性能最差,平均準確率約為66.8%。SSTCA與SSMIDA通過特征遷移后診斷準確率比基線方法分別提高了8.3%與11.4%,但仍低于采用深度遷移方法的DANN與DDTL。DANN與DDTL結(jié)合了深度學習與域?qū)惯M行特征提取與遷移,但DANN采用域間共享特征提取器,在面對樣本特征分布差異較大情況時,網(wǎng)絡(luò)優(yōu)化往往更為困難,比如在B/D遷移任務(wù)結(jié)果為88.6%,比DDTL低了7.2%。在以上5種方法中,DDTL獲得了最優(yōu)的診斷性能,平均診斷準確率約為97.6%,而且也最為穩(wěn)定,泛化性能最優(yōu),表明方法采用獨立的域間特征提取器能更好適應(yīng)目標域樣本特征分布的變化,通過堆棧自動編碼器深度學習網(wǎng)絡(luò)能更好提取高質(zhì)量特征,基于域?qū)挂材芨孟蜷g特征分布差異,實現(xiàn)高性能的故障診斷。
表3 診斷準確率結(jié)果Table 3 Results of diagnostic accuracy
除了準確率,衡量診斷性能的兩個關(guān)鍵指標是故障漏警率(Missing Alarm Rate, MR)與故障虛警率(False Alarm rate, FR)。行星傳動輪系是直升機的核心部件,沒有冗余和備份,漏警會導(dǎo)致事故發(fā)生,虛警會降低使用維護效率,因此,對于直升機故障診斷,MR與FR越低越好。MR與FR的實驗結(jié)果如圖6所示。
圖6 MR與FR的實驗結(jié)果Fig.6 Results of MR and FR
從圖中可以看出,整體趨勢與診斷準確率相類似,基線方法在MR與FR上的整體表現(xiàn)要弱于其他域適應(yīng)方法,說明域適應(yīng)采用遷移方式更能適應(yīng)工況變化引起的數(shù)據(jù)分布差異對診斷性能的影響。在域適應(yīng)方法中,結(jié)合深度特征提取與域?qū)固卣鬟w移的DDAN與DDTL明顯優(yōu)于SSTCA與SSMIDA,而所提DDTL方法的MR與FR的平均值與標準差上均是最優(yōu),進一步表明了方法在診斷性能與泛化能力上的優(yōu)越性。
為了模擬直升機行星傳動輪系在噪聲條件下的運行環(huán)境,以B/D的遷移任務(wù)為例,實驗結(jié)果如圖7所示。
圖7 不同信噪比下的實驗結(jié)果Fig.7 Results under different SNRs
在外場環(huán)境下通過直升機健康監(jiān)測系統(tǒng)安裝的加速度傳感器在線采集背景噪聲信號,將其加入實驗平臺采集的振動信號中,以模擬真實場景下噪聲環(huán)境,驗證方法在噪聲環(huán)境變化下的健壯性。隨著信噪比(Signal-noise Ratio, SNR)的降低,噪聲導(dǎo)致樣本數(shù)據(jù)出現(xiàn)一定程度波動,從而引起源域與目標域樣本特征分布之間差異變大,五種方法在特征提取與特征遷移方面的抗噪能力的差異導(dǎo)致診斷性能出現(xiàn)不同程度的下降。從圖中可見,基線方法的平均準確率下降幅度小于傳統(tǒng)域適應(yīng)方法SSTCA與SSMIDA,而且在-5 dB的準確率已超過SSTCA,說明相比于傳統(tǒng)時頻域特征,基線方法基于SCAE提取的深度特征在抗噪性能上更優(yōu)。相比較而言,DDAN的噪聲健壯性優(yōu)于傳統(tǒng)域適應(yīng)方法,下降幅度更小,體現(xiàn)了結(jié)合了深度學習與域?qū)固卣鬟w移的優(yōu)越性。
從圖中可見,所有方法中DDTL的噪聲健壯性最優(yōu),在信噪比最小情況下仍保持較高的診斷準確率。這是因為方法采用的SCAE網(wǎng)絡(luò)添加了顯式正則項,使特征提取函數(shù)能抵抗輸入擾動,并通過深層學習把握了數(shù)據(jù)的流形結(jié)構(gòu),在信噪比變化情況下依然維持較高的性能。另外,方法通過特征提取器與域判別器的對抗學習,進一步增強了SCAE模型的穩(wěn)定性,挖掘出更具魯棒性的狀態(tài)特征,獲得更優(yōu)異的診斷性能。
1) 提出了一種結(jié)合深度學習模型與域?qū)惯m配框架的域?qū)股疃冗w移學習方法。方法采用具有良好抗噪性能的堆棧收縮自動編碼深度學習網(wǎng)絡(luò)對故障特征進行提取,源域與目標域采用獨立的特征提取器,提高對目標域樣本分布的適應(yīng)能力,并基于域?qū)箼C制實現(xiàn)特征遷移,提高了模型的診斷能力與泛化能力。
2) 提出了基于DDTL的直升機行星傳動輪系故障診斷方法,方法充分利用DDTL在深度學習模型的學習能力以及域?qū)惯w移模型變工況下的遷移能力,滿足了在變工況與強噪聲等復(fù)雜工況下的故障診斷要求。
3) 所提方法性能與基線方法以及其他域適應(yīng)方法在直升機行星傳動仿真實驗平臺上進行了對比分析,驗證了方法在復(fù)雜工況下故障診斷的優(yōu)異性能與健壯性。