陶新民 李晨曦 李青
摘要: 針對不均衡數(shù)據(jù)下的軸承故障檢測問題,提出一種最大軟間隔支持向量域描述(Maximum Soft Margin Support Vector Domain Description,MSM-SVDD)故障檢測模型。該模型通過引入最大軟間隔正則項,將傳統(tǒng)支持向量域描述(SVDD)算法的分類邊界向故障類偏移,進而提高算法的故障檢測性能,同時對正則化項系數(shù)的取值范圍進行了理論分析。實驗部分討論了正則化項系數(shù)、高斯核參數(shù)以及正常類樣本數(shù)目對模型故障檢測性能的影響,并給出了正則化項系數(shù)與高斯核參數(shù)的取值建議。實驗結(jié)果表明,新提出的MSM-SVDD模型非常適合處理小樣本不均衡數(shù)據(jù)下的故障檢測問題。最后通過實測數(shù)據(jù)的對比實驗,表明MSM-SVDD模型在不均衡數(shù)據(jù)下的故障檢測性能較其他方法有較大幅度提升。
關(guān)鍵詞: 故障檢測; 軸承; 不均衡數(shù)據(jù); 最大軟間隔; 支持向量域描述
中圖分類號: TH163+.3; TH133.3 ?文獻標(biāo)志碼: A ?文章編號: 1004-4523(2019)04-0718-12
DOI:10.16385/j.cnki.issn.1004-4523.2019.04.020
引 言
在工業(yè)領(lǐng)域中,旋轉(zhuǎn)機械是應(yīng)用最為廣泛的一類機械設(shè)備,例如:汽輪機、壓縮機和傳送帶等。軸承作為旋轉(zhuǎn)機械設(shè)備的重要組成部分,其工況直接影響整個旋轉(zhuǎn)機械設(shè)備的運行狀態(tài)。因此開展軸承早期故障檢測研究具有十分重要的現(xiàn)實意義[1]。
振動信號分析方法[2]由于操作簡單,設(shè)備研發(fā)耗費成本較低且優(yōu)于其他方法,因此在當(dāng)前大型旋轉(zhuǎn)機械設(shè)備軸承故障檢測中得到廣泛采用。在振動信號分析方法中,包絡(luò)分析[3]是一種常用的振動信號處理技術(shù),其主要包括HHT[4],EMD[5]和 EEMD[6]等方法。但是受振源復(fù)雜、背景噪聲隨機以及頻譜混疊等因素的影響,上述方法的檢測效果并不理想[7]。近年來,隨著人工智能技術(shù)的迅速發(fā)展,智能化已成為故障檢測技術(shù)的重要發(fā)展方向,而機器學(xué)習(xí)是提高故障檢測系統(tǒng)智能水平的主要途徑[8]。其中,作為機器學(xué)習(xí)方法典型代表的支持向量機(Support Vector Machine, SVM)算法,因其良好的非線性區(qū)分能力被廣泛應(yīng)用于機械系統(tǒng)的故障檢測[9]。但是在實際大型旋轉(zhuǎn)機械設(shè)備故障檢測應(yīng)用中故障類訓(xùn)練樣本是不易獲取的,從而導(dǎo)致正常類訓(xùn)練樣本與故障類訓(xùn)練樣本間數(shù)目不均衡。受不均衡數(shù)據(jù)的影響,SVM算法的檢測性能嚴重下降[10]。因此如何在不均衡數(shù)據(jù)下提高SVM算法的故障檢測性能成為了眾多學(xué)者關(guān)注的重點。近些年,相繼提出了各種處理不均衡數(shù)據(jù)故障檢測的SVM改進算法。其中,代價敏感(Cost-sensitivity SVM, CSSVM)學(xué)習(xí)方法[11]通過把各類不同錯分代價應(yīng)用到分類決策中去對SVM進行改造,盡可能地降低了錯誤分類的整體代價;然而因受等式約束限制,算法性能的提升并不明顯[12]。后來提出的基于邊界人工少數(shù)類過取樣技術(shù)(Border Synthetic Minority Over-sampling Technique, BSMOTE)的代價敏感SVM[13]算法和基于BSMOTE過取樣集成SVM (Ensemble SVM, ESVM)[14]算法雖在一定程度上降低了樣本數(shù)據(jù)的非平衡度,但是上述算法均是利用已有正常類樣本信息增加規(guī)模,容易導(dǎo)致在樣本增加的同時決策域減小,算法過度擬合,從而降低故障檢測精度[15]。為此,學(xué)者們將目光投向與SVM原理相似的支持向量域描述(Support Vector Domain Description, SVDD)[16]算法。由于SVDD訓(xùn)練時不需要故障類樣本,因此較SVM更適合不均衡數(shù)據(jù)下的軸承故障檢測問題[17]。然而正是因為SVDD沒能考慮到少數(shù)故障類樣本信息對決策邊界的影響,使得優(yōu)化后的決策邊界緊靠正常類樣本一側(cè),導(dǎo)致算法的故障檢測性能不高。事實上,在實際不均衡數(shù)據(jù)故障檢測應(yīng)用中,雖然難獲取,但仍可以收集到少數(shù)故障類樣本。為了能利用少數(shù)故障樣本改善分類界面,學(xué)者們提出帶故障類樣本信息的支持向量域描述(Support Vector Domain Description with Negative Samples, SVDD –NEG)[18]算法,該算法通過對正常類和少數(shù)故障類中的錯分樣本增加懲罰項來提高算法的泛化性能。然而正如上文所述,故障樣本雖然存在但數(shù)量較少,在這種極端不均衡情況下,故障類樣本與正常類樣本混疊概率較低,因此,在實際故障檢測應(yīng)用中通常要解決的是不均衡數(shù)據(jù)的可分問題。由于SVDD-NEG采用的是對兩類樣本集的錯分總和進行懲罰來調(diào)整分類邊界,當(dāng)面對可分問題時,兩類樣本集錯分總和通常為零,這時懲罰項將無法起到調(diào)整分類邊界的作用。
為此,本文在借鑒傳統(tǒng)SVM算法分類間隔最大化思想基礎(chǔ)上,對SVDD的優(yōu)化目標(biāo)進行改進,通過增加正常類與故障類樣本間的最大軟間隔正則項[19],實現(xiàn)調(diào)整分類邊界的作用。在此基礎(chǔ)上提出一種基于最大軟間隔SVDD軸承故障檢測模型。該模型通過充分利用少數(shù)故障類樣本信息,將分類邊界向故障類偏移,進而提高模型處理不均衡數(shù)據(jù)的故障檢測性能。實驗部分將本文方法同其他方法進行比較,結(jié)果表明本文方法在數(shù)據(jù)不均衡情況下的軸承故障檢測性能較其他方法有較大幅度提高。