王萌,王奉濤
(大連理工大學(xué) 機(jī)械工程學(xué)院,遼寧 大連 116024)
目前,滾動軸承壽命理論歸納為基于統(tǒng)計分析的壽命模型,基于斷裂力學(xué)分析的壽命模型以及基于狀態(tài)監(jiān)測的壽命模型,其中基于狀態(tài)監(jiān)測的壽命預(yù)測方法是當(dāng)前研究的重點方向[1-3]。
文獻(xiàn)[4]提出了基于邏輯回歸的性能退化評估模型,并用試驗進(jìn)行了驗證。文獻(xiàn)[5]以均方根值和峭度值為協(xié)變量,比較了邏輯回歸模型和Weibull比例故障模型對軸承退化狀態(tài)的表征。文獻(xiàn)[6]將邏輯回歸模型應(yīng)用在刀具的壽命預(yù)測中,其建立的刀具壽命預(yù)測模型的協(xié)變量選取的參數(shù)是小波包能量、小波包能量熵和時域特征。邏輯回歸模型與Weibull比例故障模型的主要區(qū)別是,邏輯回歸模型的假設(shè)條件和估計的參數(shù)較少,但能夠更精確的預(yù)測剩余壽命。
在以往的研究中,邏輯回歸模型使用的協(xié)變量選取不一,通常選取幾個時域特征值作為協(xié)變量。然而,單一的評價指標(biāo)并不能完全的表征軸承的退化過程。因此,提出一種基于PCA的邏輯回歸模型協(xié)變量選取方法,其可以在保留大多數(shù)特征值的情況下更好的表征軸承的退化狀態(tài),從而更加有效地對軸承的可靠性進(jìn)行評估。
PCA是一種常用的數(shù)據(jù)分析方法,可以提取數(shù)據(jù)的主要特征分量,常用于高維數(shù)據(jù)的降維[7-8]。
設(shè)有m個變量x1,x2,…,xm,每個變量有n個樣本,第i個變量可以表示為xi=(x1i,x2i,…,xni)T,則由此構(gòu)成的n×m階矩陣為
(1)
將X記為X=[x1,x2,…,xm],其具體算法如下:
1)對原始的特征矩陣X進(jìn)行特征中心化,計算均值,即
(2)
2)計算特征矢量的協(xié)方差矩陣
(3)
3)計算C的特征值λi和特征向量vi
Cvi=λivi;i=1,2,…,n。
(4)
4)計算貢獻(xiàn)率
(5)
5)將λi從大到小排列,取前k個特征值與其對應(yīng)的特征向量組成Δ=(λ1,λ2,…,λk)和V=(v1,v2,…,vk)。
6)計算k維特征矢量(k P=VTX。 (6) 邏輯回歸模型中,因變量yt的取值為0和1,分別表示事件僅有的2種獨立情況;t為事件發(fā)生的時間坐標(biāo),t=1,2,…,n;協(xié)變量X(t)={x1(t),x2(t),x3(t),…,xm(t)},m為協(xié)變量個數(shù),即特征指標(biāo)數(shù)。則事件不發(fā)生(yt=1)的條件概率為 P(yt=1|X(t))= (7) 式中:β0為截距(或稱常數(shù)項);βj為協(xié)變量xj(t)對應(yīng)的回歸系數(shù)。 滾動軸承當(dāng)前的特征量為X(t),則滾動軸承的可靠度函數(shù)R(t|X(t))與累積失效分布函數(shù)F(t|X(t))=1-R(t|X(t))之比滿足 exp[β0+β1x1(t)+β2x2(t)+…+βmxm(t)]。 (8) 由極大似然估計方法求出β0,β1,β2,…,βm后,滾動軸承的可靠度函數(shù)可以表示為 P(t|X(t))= (9) 依據(jù)上述理論基礎(chǔ),所設(shè)計的算法流程如圖1所示,具體實現(xiàn)步驟為: 圖1 本文算法流程圖Fig.1 Flow chart of algorithm in this paper 1)特征參數(shù)選擇。從滾動軸承數(shù)據(jù)集中提取全壽命周期的時域特征、頻域特征和時頻域特征參數(shù)。 2)時域特征處理。對時域特征參數(shù)進(jìn)行相對特征處理,求取相對時域特征值并與相對均方根值和相對峭度值進(jìn)行相關(guān)分析,求取相關(guān)系數(shù)大于0.8的時域特征值組成時域特征集。 3)時頻域特征處理。對軸承數(shù)據(jù)進(jìn)行3層小波包分解,求取頻帶能量最大子帶對應(yīng)的樣本熵作為時頻域特征值。 4)PCA降維。對時域、頻域和時頻域組成的混合域特征集進(jìn)行PCA降維,將高維特征集降為低維特征集,作為邏輯回歸模型的協(xié)變量。 5)軸承可靠性評估。將基于混合域的邏輯回歸模型的可靠性與基于時域相對均方根值和相對峭度值的邏輯回歸模型的軸承可靠性進(jìn)行對比,驗證基于混合域特征集的邏輯回歸模型的有效性。 采用由美國辛辛那提大學(xué)智能維護(hù)中心(IMS)提供的滾動軸承全壽命周期加速軸承性能退化試驗數(shù)據(jù)[9]。試驗臺中的軸承位置和傳感器布置如圖2所示,試驗軸承為雙列圓錐滾子軸承,每列16個滾子,滾子組節(jié)圓直徑為71.501 mm,接觸角為15.17°,軸承轉(zhuǎn)速為2 000 r/min,由彈性加載器施加26.689 kN的徑向載荷。油反饋管道安裝有磁性螺塞來收集潤滑油中的碎屑,用以驗證軸承的性能退化。系統(tǒng)電器開關(guān)的關(guān)閉由磁性螺塞所吸附的金屬碎屑量決定,隨著軸承性能不斷退化,當(dāng)吸附的碎屑量達(dá)到預(yù)先設(shè)定的閾值時數(shù)據(jù)采集工作便會停止。傳感器為8個高靈敏度石英加速度傳感器PCB353B33,分別采集每個軸承x和y方向的加速度信號,采集時間間隔為20 min,采樣頻率為20 kHz,采樣長度為20 480點。 圖2 試驗臺示意圖Fig.2 Diagram of test rig 共進(jìn)行了3次試驗,每次試驗中4套軸承均同時運(yùn)行,選取第1次試驗中3#軸承的全壽命數(shù)據(jù)進(jìn)行分析。第1次試驗結(jié)束時3#軸承內(nèi)圈的嚴(yán)重故障如圖3所示。 圖3 軸承內(nèi)圈的嚴(yán)重故障Fig.3 Serious fault of bearing inner ring 根據(jù)滾動軸承振動信號的特性,選擇能準(zhǔn)確反映滾動軸承運(yùn)行狀態(tài)的特征值。 3.2.1 時域特征 而由于制造、安裝和實際工況的差異,同一工作環(huán)境下同型號軸承間的特征參數(shù)也會存在一定的差異,8套軸承正常工作期內(nèi)一段趨勢平穩(wěn)振動信號的平均時域特征如圖4所示。從圖中可以看出,不同軸承的時域特征值存在較大的差異,為避免軸承個體差異的影響,兼顧良好的上升趨勢并對初始損傷保持敏感,采用相對特征值進(jìn)行后續(xù)處理。具體方法為:選取每個時域特征值正常運(yùn)行期間中一段趨勢平穩(wěn)的數(shù)據(jù),將該段數(shù)據(jù)的平均值設(shè)定為標(biāo)準(zhǔn)值,計算原始特征值與其對應(yīng)的標(biāo)準(zhǔn)值之比,即相對特征值[11]。 圖4 軸承正常運(yùn)行期間的平均時域特征參數(shù)Fig.4 Mean time domain characteristic parameters of bearing during normal operation 時域特征值中常用的指標(biāo)是均方根值和峭度值,取相對均方根值和相對峭度值作為進(jìn)行相關(guān)分析的依據(jù),將19個初選時域特征指標(biāo)分別與相對均方根值和相對峭度值進(jìn)行比較,取相關(guān)系數(shù)大于0.8的時域指標(biāo)組成時域特征集,結(jié)果見表1。由表可知,相關(guān)系數(shù)大于0.8的時域特征值有13個,包括均方根值、標(biāo)準(zhǔn)差、方差、絕對均值、平均功率、方根幅值、峰值、峭度、峰值指標(biāo)、脈沖指標(biāo)、裕度指標(biāo)、峭度指標(biāo)和THIKAT。將這些時域指標(biāo)作為邏輯回歸模型的協(xié)變量參數(shù)。 表1 相關(guān)系數(shù)Tab.1 Correlation coefficients 3.2.2 頻域特征 頻域特征值選取重心頻率和均方頻率,其可以描述功率譜重心位置的變化情況;以及頻率方差,用于描述功率譜能量分布的分散程度[12-13]。 3.2.3 時頻域特征 小波包分解既對信號中的高頻成分擁有較好的時頻分辨率,又對低頻信號的頻率分辨率好。因此,選取3層小波包分解頻帶能量最大子帶對應(yīng)的樣本熵作為時頻域特征值。 3.2.4 主元分析 將選擇好的時域、頻域和時頻域特征值組成混合域特征集,然后采用PCA對高維相對特征參數(shù)進(jìn)行降維,前3個主元的累計貢獻(xiàn)率見表2。由表可知:高維相對特征集經(jīng)過PCA降維后前2個主元的累計貢獻(xiàn)率已經(jīng)達(dá)到了90%以上,第3主元的貢獻(xiàn)率僅為3.09%,因此選擇前2個主元作為邏輯回歸模型的協(xié)變量。 表2 主元分析結(jié)果Tab.2 Results of principal component analysis 為觀察主元分析的效果,將標(biāo)準(zhǔn)高維訓(xùn)練集投影到二維空間上,結(jié)果如圖5所示。從圖中可以看出:正常、早期故障、中期故障、嚴(yán)重故障從小到大依次排列,明顯反應(yīng)出軸承的退化趨勢,其中恢復(fù)期[15]在第1主元上處于早期故障之間,這是由于軸承早期故障裂紋被磨平,振動沖擊減小,故障特征頻率不明顯所導(dǎo)致;從第1主元上可以看出各個故障區(qū)分布很明顯;從第2主元上可以看出特別明顯的早期故障趨勢,這是由于峭度值、峰值等特征指標(biāo)對早期故障特別敏感的原因。 圖5 第1,2主元滾動軸承狀態(tài)圖Fig.5 State diagram of rolling bearing of first and second principal component 為驗證所述算法的有效性,將基于混合域特征集邏輯回歸模型的預(yù)測結(jié)果與基于時域相對均方根值和相對峭度值的邏輯回歸模型結(jié)果進(jìn)行對比分析。2種模型獲取的可靠度曲線如圖6所示。 圖6 邏輯回歸模型的可靠度曲線Fig.6 Reliability curve of logistic regression model 對比分析可知: 1)軸承正常運(yùn)行時期,混合域邏輯回歸模型的可靠度在軸承從接近100%的位置開始,并隨著軸承使用時間的增加平緩下滑;而時域邏輯回歸模型的可靠度起點不僅在88%的位置,而且在軸承正常運(yùn)行期間出現(xiàn)較大波動;說明經(jīng)過PCA降維得到的特征值對軸承正常時期的表征要比僅僅依靠時域特征得到的可靠度要更加穩(wěn)定、準(zhǔn)確。 2)當(dāng)軸承出現(xiàn)早期故障時,基于混合域特征的可靠度曲線出現(xiàn)小幅波動,并開始緩慢下降;而基于時域特征的可靠度曲線出現(xiàn)了劇烈的波動,這是由于峭度值對軸承早期故障特別敏感。 3)到達(dá)中期故障時,基于混合域特征的可靠度曲線波動仍較小,而基于時域特征的可靠度曲線仍存在劇烈的波動。 4)后期故障時,基于混合域的可靠度曲線能夠平緩地描述軸承的退化過程,而基于時域的可靠度曲線出現(xiàn)斷崖式的曲線。 綜上所述,基于混合域的可靠度曲線在表征軸承的退化過程中要比基于單一時域特征值的曲線更加穩(wěn)定、準(zhǔn)確,且不受單一特征值對故障狀態(tài)敏感性的影響。 運(yùn)用主元分析對邏輯回歸模型的協(xié)變量選取進(jìn)行了優(yōu)化,通過試驗研究得到如下結(jié)論: 1)相對時域特征值降低了軸承制造、安裝和實際工況差異的影響,使軸承間的各體差異對時域特征集構(gòu)建的影響大大降低。 2)將時域、頻域和時頻域組成的混合域特征集經(jīng)過PCA降維后得到的特征值比單純的時域特征值蘊(yùn)含了更多能夠表征軸承退化狀態(tài)的信息。 3)基于混合域特征集的邏輯回歸模型能更好的表征軸承的退化性能,比基于時域的模型更加穩(wěn)定,可靠。1.2 邏輯回歸模型
2 方法步驟
3 試驗分析
3.1 試驗平臺
3.2 協(xié)變量選取方法研究
3.3 軸承可靠性評估
4 結(jié)論