彭 成,賀 婧,唐朝暉,陳 青,桂衛(wèi)華
(1.湖南工業(yè)大學 計算機學院,湖南 株洲 412007;2.中南大學 自動化學院,湖南 長沙 410083)
滾動軸承[1]是旋轉(zhuǎn)機械裝置的關(guān)鍵組成部分,其性能的好壞直接影響整個設(shè)備的運行狀態(tài)。在故障發(fā)生的早期,故障缺陷如裂紋尺寸等相對較小,特征過于微弱,難以及時檢測并定位。而當早期故障擴展到一定程度時,將影響旋轉(zhuǎn)機械裝置的正常運行和整體效能,甚至導致災(zāi)難性事故的發(fā)生。若能采集早期故障的信號數(shù)據(jù)[2],并實時提取最能表征軸承運行狀態(tài)的特征信息,精確地對早期故障進行識別診斷,便可以及早規(guī)避風險,優(yōu)化維修策略,降低成本支出。因此,對滾動軸承進行早期檢測和故障診斷意義重大。
目前,滾動軸承故障診斷可分為3個步驟,分別為特征提取、特征選擇和故障識別[3]。振動信號分析是軸承故障特征提取和診斷的常用方法[4]。Wang等[5]、Cheng等[6]采用收集成本低且具有簡便性的電流和振動信號進行故障診斷,但其局限性在于無法對軸承早期所激發(fā)的微弱故障進行特征提取和精確診斷。聲發(fā)射(Acoustic Emission, AE)是一種新型在線無損檢測技術(shù),在物體產(chǎn)生變形、裂紋等缺陷的初始階段就能接收到大量的AE信號,且AE信號的頻率范圍一般在100 kHz~1 000 kHz之間,不受其他噪音影響[7-9]。因此,AE技術(shù)在早期軸承故障診斷方面具有更高的敏感性和可靠性。Sánchez等[10]通過提取振動、電流和AE信號中的特征按Chi排序使用K最近鄰(K Nearest Neighbor, KNN)分類器對早期故障進行診斷,實驗結(jié)果表明由于AE信號具有頻譜寬、抗干擾性強和故障特征明顯的特點,AE信號在早期故障診斷中精確度達到96%,高出振動信號2個百分點; Chanamala等[11]主要研究了AE技術(shù)在不同轉(zhuǎn)速、負載條件下對軸承外圈裂紋的早期故障識別,實驗結(jié)果表明AE技術(shù)不僅能有效地檢測出早期故障,還能監(jiān)測裂紋的產(chǎn)生和擴展過程;Mary等[12-13]進一步研究表明,將AE信號的參數(shù)與六個時域特征結(jié)合分析,不但可以判斷出外圈裂紋故障的尺寸大小,還可以通過特征值的變化對裂紋尺寸大小的變化進行預(yù)測,而振動檢測技術(shù)卻無法實現(xiàn);Elforjani等[14]在實驗中發(fā)現(xiàn)均方根值和AE信號振幅隨時間的分布情況可預(yù)測軸承故障的發(fā)展趨勢從而較為精確地識別早期缺陷的類別。
AE技術(shù)為軸承早期故障的診斷奠定了基礎(chǔ),但上述文獻缺少對AE信號進行多工況、多部位的特征提取。因此,本文構(gòu)建波形、時域和頻域混合特征池來充分表征軸承的早期故障特點。然而,剔除混合特征池中對反映故障特點貢獻不大的冗余特征以及相關(guān)性較大的特征,保留具有顯著類別差異的信息特征是一大難點。Lu等[15]提出一種基于遺傳算法和動態(tài)搜索策略的優(yōu)勢特征選擇方法,用于尋找軸承故障診斷中最具代表性的特征。遺傳算法可以實現(xiàn)較高質(zhì)量的特征選擇,但在計算時間方面的代價過高且容易陷入局部最優(yōu)。相比之下,序列前向選擇算法(Sequential Forward Selection, SFS)的運行速度相對較快,能夠很好地平衡計算時間和所選最優(yōu)特征的質(zhì)量。Islam等[16]、Ding等[17]使用屬性值、評估模型來創(chuàng)建特征向量、特征子集的目標等級值,并基于SFS算法對特征的目標等級值排序從而進行特征選擇;Kang等[18]開發(fā)了一種基于SFS的異常值不敏感的混合特征選擇(Outlier-Insensitive Hybrid Feature Selection, OIHFS)方法來評估特征子集質(zhì)量,創(chuàng)建新的特征評估指標,通過識別各工況下正常和有缺陷的滾動軸承,驗證了該方法的有效性;Homsapaya等[19]提出一種基于SFS的類內(nèi)和類間距離特征子集評估方法,類間距離通過計算兩兩之間的歐式距離得到。本文在上述文獻僅考慮類內(nèi)稠密區(qū)樣本分布的基礎(chǔ)上,同時考慮類內(nèi)類間樣本的全局分布,關(guān)注位于較不密集區(qū)域或類外圍的樣本,在優(yōu)化判別目標函數(shù)的同時引入反饋停止策略和早棄策略,使得選擇的特征組更精簡,更能表征早期故障特性。
在早期故障識別方面,陳法法等[20]針對滾動軸承早期故障特征微弱、難以快速有效辨識的問題,構(gòu)造了一種基于正交鄰域保持嵌入與多核相關(guān)向量機的機器學習模型;Jia等[21]結(jié)合K-means分類器和t-分布領(lǐng)域嵌入算法(t-Distributed Stochastic Neighbor Embedding, t-SNE)提出一種從大量振動信號中自動提取特征的方法;Bugata等[22]提出一種基于距離和屬性加權(quán)KNN的新型監(jiān)督特征選擇方法(Weighted KNN-Feature Selection, WKNN-FS);Aguilera等[23]使用類內(nèi)(Circled by its own Class, CC)和類間(Circled by Dierent classes, CD)對訓練對象進行質(zhì)量分配的方法,提出一種基于物體間引力的加權(quán)KNN算法(Weighted Attraction Force KNN, WAF-KNN);Sharma等[24]采用平方反特征加權(quán)技術(shù),提出了一種使用加權(quán)K最近鄰分類器(Weighted KNN, WKNN)進行軸承故障診斷的新方法,實現(xiàn)了故障的100%高精度檢測。這些研究成果為特征選擇算法結(jié)合分類器在滾動軸承早期故障診斷中的應(yīng)用開辟了新的思路,但均沒有系統(tǒng)地研究K值對特征提取結(jié)果的影響。Domingues等[25]提出了基于局部異常因子(Local Outlier Factor, LOF)的離群點檢測方法;杜旭升等[26]提出基于領(lǐng)域系統(tǒng)密度差異度量的離群點檢測(Neighborhood System Density Difference, NSD)方法。這些方法在距離度量基礎(chǔ)上,加入密度度量[27],提高了算法魯棒性,為離群點的檢測提供了新的技術(shù)借鑒,但當數(shù)據(jù)集較大、系統(tǒng)內(nèi)部結(jié)構(gòu)復雜時,計算近鄰可達密度會產(chǎn)生較大的偏差。
本文針對早期故障信號特征之間的相關(guān)性和冗余對故障分類計算復雜性和精確度的干擾、傳統(tǒng)的KNN分類器直接采用距離計算進行分類的能力不足、對K值敏感性較大而不利于早期故障分類等問題,以低轉(zhuǎn)速下的滾動軸承早期故障為研究對象,通過提取AE信號的波形特征、時域和頻域的統(tǒng)計特征構(gòu)造混合特征集,采用隸屬度矩陣計算類內(nèi)緊致性和類間重疊性參數(shù),并將二者的比值作為SFS算法進行特征選擇的目標函數(shù),這種新方法能對冗余特征進行壓縮,減少特征相關(guān)性對分類的影響;同時提出反饋停止策略和早棄策略,提高算法效率。最后,將一種新的密度計算方法用于傳統(tǒng)KNN分類器,采用密度和距離雙維度計算的EKNN分類器降低對K值的敏感性,更穩(wěn)定地識別出最優(yōu)特征組,實驗結(jié)果驗證了本文所提方法的有效性和準確性。
AE無損檢測技術(shù)是一種非常有前景的動態(tài)非破壞檢測技術(shù),能夠提高對滾動軸承早期故障狀態(tài)的診斷性能,可以為大量基于數(shù)據(jù)驅(qū)動的故障診斷方法提供基礎(chǔ)信息,但AE信號具有非平穩(wěn)性、復雜性和多樣性等特點[28],從中直接獲取故障狀態(tài)的內(nèi)在信息非常困難,且單一的特征對故障初始階段的敏感性低。為此,采用波形特征參數(shù)法和波形分析法對AE信號進行特征提取,同時從時域和頻域提取特征,從而構(gòu)造混合特征池,對滾動軸承的早期故障特征進行量化,全面反映早期故障的敏感特征。
本文的高維混合特征向量由AE故障信號中提取的21個特征組成,包括采用波形特征參數(shù)法提取的5個波形特征、采用波形分析法提取的10個時域和6個頻域特征。波形特征包括上升時間(f1)、計數(shù)(f2)、持續(xù)時間(f3)、幅度(f4)和能量(f5);時域統(tǒng)計特征包括均值(f6)、均方根值(f7)、峰值(f8)、方根幅值(f9)、峭度(f10)、峭度因子(f11)、波形因子(f12)、裕度因子(f13)、峰值因子(f14)、脈沖因子(f15);頻域統(tǒng)計特征包括功率譜方差(f16)、相關(guān)因子(f17)、諧波因子(f18)、譜原點矩(f19)、重心指標(f20)和均方頻譜(f21)。如表1所示為所有時域和頻域統(tǒng)計特征的公式定義[29]。因為每個特征參數(shù)是用不同統(tǒng)計方法計算的,會對本文算法產(chǎn)生一定影響,所以將各個特征參數(shù)轉(zhuǎn)換到[0,1]范圍中,稱為最大最小歸一化[30],即
(1)
式中:xmax為樣本數(shù)據(jù)的最大值;xmin為樣本數(shù)據(jù)的最小值。
表1 統(tǒng)計特征公式定義
一般地,早期故障分類方法獲取不同類型的故障數(shù)據(jù)構(gòu)造的高維混合特征中存在彼此相關(guān)性大、冗余的特征,導致計算復雜度增加、計算成本上升[31-32]。因此,如何使用特征選擇算法壓縮冗余,篩選出最優(yōu)早期故障特征對提高故障分類性能十分重要。
序列前向選擇算法(SFS)通常用于特征選擇中,是一種自下而上的貪婪搜索方法[33]。雖然SFS算法簡單、高效且較準確,但也存在缺點,其中最明顯的是僅根據(jù)人為經(jīng)驗來設(shè)置使算法停止的最大維數(shù)值,即當目標特征子集的特征維數(shù)達到預(yù)先設(shè)定最大維數(shù)時停止運算。為此,本文對SFS算法進行改進,以隸屬度矩陣計算類內(nèi)緊致性和類間重疊性的比值作為目標函數(shù),將使得目標函數(shù)值最大的特征作為EKNN分類器的輸入,同時改進的SFS算法根據(jù)反饋結(jié)果決定是否繼續(xù)搜索,提早丟棄目標函數(shù)值最小的特征,提高了處理效率。改進的SFS算法的相關(guān)定義如下。
定義1隸屬度矩陣。
(2)
式中:dip為第i個樣本與第p個類別的歐式距離;diq為第i個樣本與第q個類別的歐式距離;c為故障類別個數(shù);s為模糊因子,用來決定模糊度的權(quán)重指數(shù)。
定義2類內(nèi)緊致度。
(3)
定義3類間重疊性。
(4)
定義4目標函數(shù)。目標函數(shù)為類內(nèi)緊致度與類間重疊性的比值,即
(5)
不難發(fā)現(xiàn),類內(nèi)緊致性越大,Compact(c,U)值越大,類間重疊性越小,Overlap(c,U)值越小,可得V值越大,篩選結(jié)果越好。
定義5反饋停止策略。將每一次更新后的目標特征集FF={FF1,FF2,…,FFn}送入EKNN分類器計算后會產(chǎn)生對應(yīng)的分類精確度pre={pre1,pre2,…,prer},若max{|prer+1-prer|,|prer+2-prer+1}<θ且滿足prer 定義6提早丟棄策略。計算原始特征集F=(f1,f2,…,f21)中每一個特征的目標函數(shù)評價值V(fi),丟棄最小函數(shù)值V(fi)=min{V(fi)}的特征,對更新后的組合特征,重復上述操作。 算法1改進的SFS算法。 1.Input目標特征集FF={?},原始特征集F=(f1,f2,…,fn),特征數(shù)n=0,精確度閾值θ 2.計算F中每個特征V值,V=compact(F)∕overlap(F) 8.重復步驟3~步驟6 9.計算每次更新后的FF由EKNN分類器得到的精確度 10.循環(huán)以上步驟直到滿足精確度差值小于閾值θ,即Untilmax{|prer+1-prer|,|prer+2-prer+1}<θ且滿足prer 11.Output FF 改進SFS算法的時間復雜度由于采用了早棄策略,能夠提前停止搜索,相較于原始SFS算法未采用早棄策略能節(jié)省運算時間、提高效率。改進的SFS算法第一次選擇特征加入目標特征集時,計算n個特征的目標函數(shù)值;第二次選擇時,計算(n-2)個函數(shù)值;第s次選擇時,計算(n-2s+2)個函數(shù)值。當目標特征集最終的個數(shù)為m時,需要計算(n-m+1)×m個目標函數(shù)值,因此改進SFS算法的時間復雜度為O((n-m+1)×m)。 KNN是一種簡單且有效的分類器,傳統(tǒng)KNN分類器的核心思想是使用距離計算來確定最近鄰居,根據(jù)訓練集中的大多數(shù)最近鄰居來標記未知的測試樣本[34]。但在早期故障中,正常樣本和異常值會出現(xiàn)緊密重疊部分,KNN分類器難以識別,將導致分類精確度顯著下降,同時非常容易受到鄰域K值大小的影響。本文在傳統(tǒng)KNN僅使用基于距離度量方法上,考慮各數(shù)據(jù)樣本的密度,提出一種新的基于距離和密度雙維度計算的EKNN分類器,在計算時既考慮數(shù)據(jù)集的全局特征,也考慮局部密度特點,能夠?qū)υ缙诠收线M行更精確的識別和分類。EKNN相關(guān)定義如下。 定義1歐式距離。 (6) 式中:xi={xi1,xi2,…,xim}為某兩個特征中的數(shù)據(jù)點;NK(xi)為xi的K個近鄰。距離值升序排列表述為: KNN(xi)={j∈X|d(xi,xj)≤d(xi, NK(xi))}。 (7) 定義2密度計算。利用密度函數(shù)計算樣本xi的局部密度,再計算樣本xi與其近鄰距離的最小值δi。 (8) (9) 最后得出測試樣本xi的輸出概率值Pi=ρi/δi,標記測試樣本為Pi值對應(yīng)的類別。式(8)用KNN(xi)來計算xi的局部密度,其中ρi值越大,表示xi的局部密度越大;用式(9)計算每個樣本的δi值,其中δi值越小,表示xi距離某個類別越近。根據(jù)Pi=ρi/δi得到xi到各類別的Pi值,按降序排列,將xi歸入Pi值最大的類別。 對于給定的測試樣本,EKNN分類方法首先計算測試樣本關(guān)于不同類別的隸屬度,再根據(jù)隸屬度作進一步操作,若隸屬度不小于β,認為該測試樣本的所有最近鄰居都屬于某個確定的類別,則標記測試樣本為此單個類別;若隸屬度小于β,則使用基于距離和密度雙維度計算方法來確定測試樣本的標簽,即根據(jù)上述定義得出測試樣本的(ρi,δi)值和相應(yīng)的Pi值,標記測試樣本為Pi值大對應(yīng)的類別。如圖1所示,給定的3個測試樣本中有兩個測試樣本可以十分確定地通過隸屬度計算出故障類別,分別屬于類別1與類別2;中間的測試樣本,當K=3時,屬于類別1,當K=5時,屬于類別2,而隸屬度計算出的類別為類別1,與實際結(jié)果并不符合,使用密度度量來確定測試樣本的最終類別,結(jié)果為類別2,符合實際結(jié)果。算法描述如算法2所示。 算法2EKNN分類算法。 1.Input數(shù)據(jù)集,算法1所得目標特征集,隸屬度矩陣 2.if樣本隸屬度≥β then 3.即所有最近鄰居都屬于某個確定的類別,標記樣本屬于此類別 4.else 5.樣本處于重疊區(qū)域,使用距離和密度雙維度計算的EKNN分類 6.計算歐式距離,d(i,j)=d(xi,xj) 7.對歐式距離排序,KNN(xi)=sort(d(i,j)) 8.樣本基于式(8)和式(9)計算ρi,δi 9.Pi=ρi/δi得到樣本的最終密度值 10.sort(Pi)對密度值排序 11.max(Pi)為樣本所在類別 12.End if 13.Output分類結(jié)果 基于一種新的密度和距離雙維度計算的EKNN算法,原理簡單且時間復雜度低。其中,計算數(shù)據(jù)集中數(shù)據(jù)對象之間的距離矩陣所需時間復雜度為O(n2),基于二分思想進行排序的時間復雜度為O(nlog2n),而計算局部密度ρi和KNN距離δi所需的時間復雜度均為(n2),計算樣本所屬的標簽可在O(n2)的時間復雜度內(nèi)完成,故EKNN算法的時間復雜度為O(n2)。傳統(tǒng)KNN存在向量的維度越高,對距離的區(qū)分能力越弱的缺點,其時間復雜度為O(tkmn),其中:t為迭代次數(shù),k為簇的數(shù)目,m為記錄數(shù),n為維數(shù)。 本次滾動軸承早期故障診斷實驗使用滾動軸承傳動系統(tǒng)試驗臺,該平臺由調(diào)壓器、驅(qū)動電動機、滾動軸承安裝架、傳感器、加速計和數(shù)據(jù)采集系統(tǒng)等部分構(gòu)成。實驗的滾動軸承型號為6 308,滾珠為8個,鋼球直徑為15 mm,滾道節(jié)徑為65.5 mm,軸承的內(nèi)徑為40 mm,軸承外徑為90 mm。AE采集系統(tǒng)由型號為R15,頻率為70~150 kHz的寬頻AE傳感器、帶有2通道的PCI-2聲發(fā)射數(shù)據(jù)采集卡、型號為1220A系列,增益指標為40 dB的前置放大器及同軸電纜組成。在試驗臺上分別安裝完好的軸承、包含人為制造的3 mm裂紋來模擬早期故障的軸承及12 mm裂紋的軸承。此外,分別在300、400和500轉(zhuǎn)速下采集正常、內(nèi)圈故障、外圈故障、滾珠故障、內(nèi)圈與外圈故障、內(nèi)圈與滾珠故障、外圈與滾珠故障、和內(nèi)圈、外圈與滾珠故障下的8個類別的AE信號,數(shù)據(jù)集屬性如表2所示。對于每種軸承故障,記錄200個AE信號,每個信號持續(xù)10秒,同樣,健康軸承數(shù)據(jù)記錄200個AE信號。因此,總共有6個數(shù)據(jù)集,每個數(shù)據(jù)集總共包含1 600個AE信號。 表2 數(shù)據(jù)集屬性 為驗證本算法的真實有效性,本文采用k-fold交叉驗證方法,通過平均k個不同分組訓練結(jié)果來減少偏差,有效地避免過學習以及欠學習狀態(tài)的發(fā)生。通常,k的取值一般大于等于2,在原始數(shù)據(jù)集合數(shù)據(jù)量小時,k的取值為2。為了抵消數(shù)據(jù)維度增加的計算成本,同時由于實驗的有效性更依賴于數(shù)據(jù)集中變量的個數(shù)而不是分組訓練的偏差[35],因此本文選取k值為3。本文在早期微弱特征選擇過程中構(gòu)建的高維特征樣本池的維數(shù)為Nf×Ns×Nc,其中特征的數(shù)量Nf為21個,每個數(shù)據(jù)集的樣本數(shù)量Ns為200個,類別數(shù)量Nc為8個。如圖2所示,使用MATLAB中的randperm函數(shù)將高維特征池中的樣本隨機被分成3份,經(jīng)過N次交叉驗證(N=10)后,得出最優(yōu)特征組,共包含N×k個候選次優(yōu)特征組。 實驗1改進的SFS+EKNN算法性能分析。 如前所述,采用的混合特征集合包含3個不同域的21種特征:波形特征5個(f1-f5)、時域統(tǒng)計特征10個(f6-f15)、頻域統(tǒng)計特征6個(f16-f21)。為驗證本文算法的有效性,與文獻[10]提出的Chi+KNN算法進行比較,Chi+KNN算法通過提取振動、電流和AE信號中的特征,并將其按Chi排序輸入KNN實現(xiàn)早期故障診斷,與本文提出的實施過程相似,具有可比性。如表3所示,本文采用改進的SFS+EKNN算法和Chi+KNN算法對6個數(shù)據(jù)集進行特征選擇,得到不同的最優(yōu)特征組,且最優(yōu)特征組中特征個數(shù)更精簡,精確度卻更高。精確度反映了被判定的正例中真正的正例樣本的比重,公式定義如下: (10) 表3 不同數(shù)據(jù)集的最優(yōu)特征組 式中:Nt為分類正確的正例樣本數(shù);Nc為類別數(shù);Nsc為第c個類別的樣本總數(shù)。 根據(jù)表3,本文算法在不同數(shù)據(jù)集下的精確度均比Chi+KNN算法高,在數(shù)據(jù)集4~數(shù)據(jù)集6中平均精確度高出1.74%。特別地,在早期故障數(shù)據(jù)集1~數(shù)據(jù)集3中平均精確度高出Chi+KNN算法2.98%。早期故障數(shù)據(jù)集1~數(shù)據(jù)集3的精確度在Chi+KNN算法的基礎(chǔ)上分別提高了1.98%、4.57% 和2.39%,且等于甚至超過在數(shù)據(jù)集4~數(shù)據(jù)集6上的增幅。本文算法在早期故障數(shù)據(jù)集1~數(shù)據(jù)集3的平均精確度僅低于數(shù)據(jù)集4~數(shù)據(jù)集6的1.71%,而Chi+KNN算法低于2.95%。因此,本文算法對軸承的早期故障診斷具有適用性和有效性。由于受特征與特征之間的相關(guān)性、類別與特征之間的關(guān)聯(lián)度等因素影響,算法對于不同故障類別、不同故障程度以及不同運行轉(zhuǎn)速下的軸承故障數(shù)據(jù)集提取到的最優(yōu)特征組有一定的差別。比如,本文算法和Chi+KNN算法在數(shù)據(jù)集3下的最優(yōu)特征組分別為{4、10}和{2、4、7、14、16},可以看出本文算法去除了不相關(guān)特征以及冗余特征,最優(yōu)特征組更精簡,且對于早期故障數(shù)據(jù)集3來說,本文算法選取的最優(yōu)特征組具有更精確的分類,高于Chi+KNN算法2.39%,有較大提升。 如圖3所示,本文算法與Chi+KNN算法選擇的最優(yōu)特征組對早期故障數(shù)據(jù)集1與數(shù)據(jù)集2的不同分類情況,不難發(fā)現(xiàn)圖3a與圖3c的分類更加清晰,且類內(nèi)更加緊致,類間重疊性更低,能夠準確地捕捉早期故障的微弱特征,對正常樣本與異常樣本進行精確識別,且精確度更高。 表4描述了在數(shù)據(jù)集1下的EKNN分類器對30個候選次優(yōu)特征組的分類精確度。從實驗結(jié)果可以看出,當最優(yōu)特征組為F={f4、f7}時,精確度最高為0.97,且f4(幅度)屬于波形特征,f7(均方根值)屬于時域統(tǒng)計特征,表明選擇AE信號波形特征和統(tǒng)計特征來構(gòu)造混合特征具有有效性。 表4 30個候選次優(yōu)特征組的分類精確度 實驗2EKNN算法的K值敏感度分析。 將算法1得到的早期故障特征組應(yīng)用于EKNN算法,對樣本數(shù)據(jù)進行分類。由于在早期故障的多類別分類中,每個類的密度不同,僅使用兩個樣本之間的歐氏距離來決定樣本標簽會導致分類精確度下降,使得分類結(jié)果對K值敏感性較大。因此,當近鄰大小K取值不同時,傳統(tǒng)KNN分類器與本文的EKNN分類器具有較大的差別。實驗2進一步分析K取值不同時(K=3,K=5,K=7,K=9),兩種分類器對分類結(jié)果的影響。如圖4所示,當K=5、K=9時,使用傳統(tǒng)KNN和EKNN分類器對橢圓內(nèi)的樣本進行分類,其實際標簽為內(nèi)圈故障。然而,傳統(tǒng)KNN分類器在K=5時,判斷測試樣本為內(nèi)圈故障,K=9時為外圈故障,分類顯然是不成功的。本文將一種新的密度計算加入到分類過程中,分類器能夠在K=5或K=9時正確地對測試樣本分類,早期故障樣本的分類結(jié)果具有穩(wěn)健性。 表5列出了6個數(shù)據(jù)集和4種K值在傳統(tǒng)KNN、改進SFS+KNN和本文算法下的平均分類精確度。顯然,早期生成的弱故障樣本不易被區(qū)分,會對分類性能產(chǎn)生影響。從表5中可以看出,各算法在數(shù)據(jù)集4~數(shù)據(jù)集6的分類精確度均高于數(shù)據(jù)集1~數(shù)據(jù)集3,因為大尺寸裂紋12 mm比早期故障產(chǎn)生的小尺寸裂紋3 mm更易識別。 表5 在不同數(shù)據(jù)集、不同K取值下3種分類器的診斷性能 依據(jù)表5,本文算法與改進SFS+KNN算法、傳統(tǒng)KNN算法在數(shù)據(jù)集1~數(shù)據(jù)集6,K={3、5、7、9}取值下的精確度差值如圖5所示。其中平均差值1折線表明不同K值在同一數(shù)據(jù)集下,本文算法與改進SFS+KNN算法之間的平均精確度差值;平均差值2折線表明不同K值在同一數(shù)據(jù)集下,本文算法與傳統(tǒng)KNN算法之間的平均精確度差值。圖5中兩條折線的共同點在于本文算法對其他兩種算法在早期故障數(shù)據(jù)集1~數(shù)據(jù)集3的平均分類精確度差值都等于甚至大于在數(shù)據(jù)集4~數(shù)據(jù)集6的平均精確度差值。對比改進SFS+KNN算法,當K=3時,EKNN提高的平均精確度最少為1.78%;K=5時,EKNN提高的平均精確度最多為7.79%;對比傳統(tǒng)KNN算法,當K={3、5、7、9}時,EKNN分別提高了13.73%、16.43%、11.40%和12.62%的平均精確度。雖然數(shù)據(jù)集1~數(shù)據(jù)集3為滾動軸承早期產(chǎn)生的故障數(shù)據(jù),比數(shù)據(jù)集4~數(shù)據(jù)集6更難分類,更易判定失誤,但本文算法對早期故障數(shù)據(jù)集1~數(shù)據(jù)集3的平均精確度高于傳統(tǒng)KNN算法的14.93%,高于改進SFS+KNN算法的2.98%,高于改進SFS+KNN算法在數(shù)據(jù)集4~數(shù)據(jù)集6的平均精確度0.03%。 圖6所示為本文算法與改進SFS+KNN在不同K值、不同數(shù)據(jù)集和8種故障類別的精確度差值。本文算法在K取值不同時,對8種類別的早期故障都能較好地進行分類識別,且精確度均有較大的提高。其中當K值為5時,對內(nèi)圈故障的提高尤為顯著;當K值為5、7、9時,對外圈的故障有顯著提高。 實驗3EKNN對比算法性能分析。 為驗證基于距離和密度雙維度計算的EKNN故障分類方法的有效性和魯棒性,將8個類別的AE信號、6個數(shù)據(jù)集,在相同實驗條件下,除與傳統(tǒng)KNN算法進行比較外,還將其與不同的算法進行比較,精確度由式(10)計算得出。包括文獻[13]的Chi+KNN算法、文獻[15]的t-SNE+KNN算法、文獻[16]的WKNN-FS算法和文獻[17]的WAF-KNN算法。實驗結(jié)果如表6所示,結(jié)果表明本文算法優(yōu)于其他5種算法,比KNN、Chi+KNN、t-SNE+KNN、WKNN-FS和WAF-KNN算法分別高出13.9%、2.43%、32.25%、2.39%和4.81%。 表6 不同方法下的分類精確度 本文首先獲取由AE信號的波形特征、時域特征、頻域特征等構(gòu)成的早期故障混合特征集;然后將內(nèi)類緊致性和內(nèi)間重疊性引入序列前向選擇算法中,提取混合特征中的次優(yōu)特征組作為EKNN分類器的輸入;最后基于距離和改進的密度計算,得到最優(yōu)平均分類概率并輸出最優(yōu)早期故障特征組,在線階段標記該特征組對應(yīng)的故障狀態(tài),實現(xiàn)滾動軸承故障的智能分類。本文所提方法有效地降低了由于故障信號之間的相關(guān)性和冗余對早期故障分類精確度的干擾,改進了傳統(tǒng)的KNN分類器僅采用距離計算進行分類的能力,克服了傳統(tǒng)KNN分類器受K值敏感性影響而不利于早期故障數(shù)據(jù)進行分類的問題,并最終提高了分類精確度。本文僅針對早期微弱信號提出了故障診斷方法,但實際應(yīng)用中滾動軸承的故障數(shù)據(jù)難以完整獲取,無法建立有效的訓練模型。因此,如何在樣本失衡情況下對滾動軸承進行故障診斷有待進一步研究。2.2 算法描述
3 故障分類
3.1 相關(guān)定義
3.2 算法描述
4 實驗及結(jié)果分析
4.1 實驗數(shù)據(jù)
4.2 實驗方案
5 結(jié)束語