范 磊 殷時蓉 陳 婕
(重慶交通大學(xué)機(jī)電與車輛工程學(xué)院 重慶 400074)
液壓驅(qū)動器具有響應(yīng)速度快、功重比大和柔順性好的特點,被廣泛應(yīng)用于外骨骼機(jī)器人柔性關(guān)節(jié)[1]。液壓泵作為外骨骼機(jī)器人柔性關(guān)節(jié)液壓系統(tǒng)的關(guān)鍵工作元件,其工作狀態(tài)關(guān)系整個液壓系統(tǒng)的穩(wěn)定性。外骨骼機(jī)器人柔性關(guān)節(jié)液壓系統(tǒng)是高度復(fù)雜與非線性的系統(tǒng),液壓回路具有多種故障機(jī)理與失效形式,因此提取故障的有效特征存在難度[2-3]。研究液壓信號有效特征的提取與高精度故障類別識別具有重要意義[4]。
液壓信號通過傳感器采集,是一種典型的機(jī)械振動信號,因此液壓類的故障診斷方法與機(jī)械振動信號的信號處理方法相似[5-6]。其中,經(jīng)典故障診斷的特征提取方法主要從信號的時域與頻域兩個方面進(jìn)行特征提取,然后再進(jìn)行狀態(tài)識別[7-8]。希爾伯特變換、小波變換和信號分解等是應(yīng)用于這類問題中最常用的方法[9]。唐宏賓等[10]對信號進(jìn)行了經(jīng)驗?zāi)J椒纸?,然后又對信號的包絡(luò)譜進(jìn)行分析,選取計算得到有效的故障特征,最終實現(xiàn)了液壓泵狀態(tài)的有效分類。曹斌等[11]先使用小波包對原始信號進(jìn)行降噪,然后使用小波包分解并重構(gòu)了降噪后的信號,最后將信號的頻帶能量作為特征,成功實現(xiàn)了液壓信號的分類。韓可等[12]采用了變分模態(tài)分解和支持向量數(shù)據(jù)描述相結(jié)合的識別評估方法,完成了軸向柱塞泵故障的分析。王武[13]結(jié)合三層小波包分解與隨機(jī)森林分類器實現(xiàn)了液壓故障的分類。
梅爾倒譜系數(shù)(MFCC)是一種廣泛運用于聲音類信號特征提取的方法[14],對低頻信號具有較好的敏感性,特征魯棒性較好[15]。由于液壓信號與聲音信號具有相似性,本文提出將梅爾倒譜系數(shù)作為特征用于外骨骼機(jī)器人柔性關(guān)節(jié)液壓泵的泄漏狀態(tài)識別。本文提取樣本液壓信號的12個梅爾倒譜系數(shù),再組合信號的12個時域特征作為樣本的特征向量,然后采用隨機(jī)森林作為分類器,對液壓泵泄漏狀態(tài)進(jìn)行識別,并比較分析了梅爾倒譜系數(shù)結(jié)合隨機(jī)森林分類器與小波特征加希爾伯特-黃特征結(jié)合隨機(jī)森林分類器和支持向量機(jī)的分類識別效果,以驗證方法的有效性。
梅爾倒譜系數(shù)是Davis和Mermelstein在1980年首先提出來的,是對信號的一種短時能量表示。梅爾頻率倒譜系數(shù)的計算方式主要借鑒于人耳聽覺系統(tǒng)對聲音的感知方法。在計算過程中,通過線性余弦變換將信號的頻譜映射到基于聽覺系統(tǒng)的Mel非線性頻譜中,最后再轉(zhuǎn)換到倒譜上[16]。將普通頻率變換為Mel刻度上的表示的公式為:
(1)
式中,f為信號頻率,單位為Hz。
設(shè)需要計算的液壓信號為S(n),梅爾倒譜系數(shù)的提取過程如圖1所示。
圖1 梅爾倒譜系數(shù)的提取過程Fig.1 The extraction process of Mel cepstrum coefficients
(1)預(yù)加重:為了增強(qiáng)信號的高頻部分,使得信號變得平滑,將信號通過高通濾波器。這樣信號中高低頻中的所有頻帶就可以使用相似的信噪比來求取頻譜。
(2)分幀:液壓信號為非平穩(wěn)、非線性信號,具有時變特性,但在短時間內(nèi)可以被看做是平穩(wěn)信號。因此,將原始信號按N個采樣點重新分段,形成新的信號波形單位,稱為幀。同時,為了防止臨近每幀信號之間變化過大,將相鄰兩幀之間進(jìn)行部分重疊。
(3)漢明窗:將信號分成一幀一幀的信號后,幀之間存在不連續(xù)性,于是將信號的每一幀與漢明窗相乘。乘以漢明窗后的信號為:
S′(n)=S(n)×W(n), 0≤n≤N-1
(2)
(3)
式中,W(n)為使用的漢明窗。
(4)快速傅里葉變換(FFT):能量的分布反映著信號的特性,為了得到信號的能量譜,對每一幀信號進(jìn)行快速傅里葉變換。
(4)
式中,N為原始信號的幀數(shù)。
(5)帶通濾波器:使用一系列均勻重疊在梅爾頻率軸上的三角窗對能量譜進(jìn)行轉(zhuǎn)換,得到一組系數(shù)。
(6)對數(shù)能量:對第五步中的每個濾波器組進(jìn)行計算,然后取對數(shù),所得結(jié)果即為對數(shù)能量,這樣,就得到不同頻帶的對數(shù)功率譜。相應(yīng)計算過程如下:
(5)
式中,s(m)即對數(shù)能量;Hm(k)為帶通濾波器得到的一組系數(shù);M為濾波器組中濾波器個數(shù);m=1,2,3,…,M。
(7)離散余弦變換(DCT):對對數(shù)能量譜進(jìn)行余弦變換,將頻譜變換到時域上,就得到梅爾倒譜系數(shù)。計算過程如下:
(6)
式中,n和m分別是計算的信號的幀數(shù)與梅爾倒譜系數(shù)的個數(shù),0≤n≤N,0≤m≤M。濾波器的個數(shù)M取12。
最后,由于濾波器個數(shù)為M,就可以得到12個梅爾倒譜系數(shù),這12個系數(shù)就可以作為信號的12維特征向量用以表征信號。
為了獲得液壓信號所包含的更多信息,除了梅爾倒譜系數(shù)特征,本文還計算了液壓信號的方差、均值、方根幅值、均方根值和最大值,還包括信號的標(biāo)準(zhǔn)差、偏斜度和峭度,最后還有信號的峰值因子、裕度因子、波形因子、脈沖因子一共12個值,作為液壓信號的時域特征來表征信號[17]。最后將12個梅爾倒譜系數(shù)特征與12個時域特征一共24特征組合,作為表征每條液壓信號記錄的特征向量。
隨機(jī)森林(RF)是一種將多棵決策樹集成的分類器。其基本原理是LeoBreiman和Adele Cutler提出的隨機(jī)森林算法。如圖2所示,隨機(jī)森林的基本思想就是將多個弱分類器集成為一個強(qiáng)的分類器,通過多棵決策樹的平均結(jié)果來產(chǎn)生最終結(jié)果。在一個由L棵決策樹集成的隨機(jī)森林分類器中,每棵單獨的決策樹都是一個分類器,其中弱分類器為每個決策樹的節(jié)點[18]。每個決策樹都會有一個判別結(jié)果,所有決策樹的分類結(jié)果的平均就是隨機(jī)森林的最終分類結(jié)果。
當(dāng)隨機(jī)森林開始訓(xùn)練時,首先,每個決策樹都會從全部樣本中隨機(jī)選擇一個子樣本集,然后,在每個節(jié)點上,決策樹都會選擇一個分類效果最好的弱分類器,最后,將所有的弱分類器組合成為最終的分類器[19]。
假設(shè)一個K類的分類任務(wù),每個樣本p在經(jīng)過每個決策樹分類器后,會輸出K個置信度作為輸出值。其中每個置信度分別表示該樣本判別為某一類樣本的概率[20]。最后,從所有決策樹判別的平均結(jié)果中可以得到整個隨機(jī)森林分類器的判別結(jié)果。表達(dá)式如下:
(7)
式中,p(n,p)(f(p)=c)表示樣本p判別屬于c類的概率。
圖2 隨機(jī)森林示意圖Fig.2 Diagram of random forest
本文所使用數(shù)據(jù)取自機(jī)器學(xué)習(xí)數(shù)據(jù)庫平臺(UCI Machine Learning Repository)2018年公布的液壓監(jiān)測數(shù)據(jù)集。該數(shù)據(jù)集是在周期性的負(fù)載試驗臺上測量獲得,該試驗臺由一級工作和二級冷卻-過濾回路組成(如圖3所示),試驗臺的負(fù)載循環(huán)周期為60 s。本文所使用的每個樣本數(shù)據(jù)有3個通道,這3個通道是來自壓力傳感器PS1,PS2,PS3的壓力信號,壓力傳感器的采樣周期為試驗臺的一個60 s 的負(fù)載周期,采樣頻率為1 000 Hz,數(shù)據(jù)長度為6 000個數(shù)據(jù)點。該數(shù)據(jù)集包含液壓泵無泄漏、微弱泄漏、嚴(yán)重泄漏3種狀態(tài)的樣本數(shù)據(jù),本文選取每種狀態(tài)下的450個樣本數(shù)據(jù)。
圖3 液壓系統(tǒng)圖Fig.3 Hydraulic system diagram
本文數(shù)據(jù)處理的具體步驟如下:
(1)提取每個樣本的MFCC特征12個與時域特征12個,組合成為液壓信號的特征向量。因選擇了3個通道的壓力信號,所以最后每個樣本將會用1×72的特征向量表示。
(2)每類泄漏狀態(tài)各有450個樣本,隨機(jī)選擇每類狀態(tài)的250個樣本作為訓(xùn)練集,200個樣本作為測試集,最后組成訓(xùn)練集樣本量為750個,測試集樣本量為600個。
(3)建立訓(xùn)練集與測試集對應(yīng)標(biāo)簽,具體見表1。
(4)設(shè)置隨機(jī)森林分類器樹數(shù)目為500,使用訓(xùn)練集訓(xùn)練分類器。最后使用訓(xùn)練好的模型與測試集進(jìn)行預(yù)測。
表1 液壓泵樣本數(shù)據(jù)Table 1 Sample data of hydraulic pump
表2為梅爾倒譜系數(shù)結(jié)合隨機(jī)森林的最終識別結(jié)果。由表2可知,液壓泵狀態(tài)識別的綜合識別率達(dá)到了99.3%,無泄漏、弱微泄漏與嚴(yán)重泄漏3種狀態(tài)的正確識別數(shù)量分別為199,197,200,識別率分別為99.5%,98.5%與100%。無泄漏、弱微泄漏和嚴(yán)重泄漏3種狀態(tài)識別錯誤的樣本數(shù)分別為1,3,0個。因此可以得出,本文提出的方法能夠有效識別出液壓泵3種不同的泄漏狀態(tài)。
表2 梅爾倒譜系數(shù)結(jié)合隨機(jī)森林的識別結(jié)果Table 2 Recognition results of random forest combined with Mel cepstrum coefficient
為了說明梅爾倒譜系數(shù)在液壓泵泄漏狀態(tài)識別中的有效性,將小波特征加希爾伯特-黃特征與梅爾倒譜系數(shù)進(jìn)行對比。采用希爾伯特-黃變換得到2個特征,再采用小波分解得到6個特征,融合這8個特征作為液壓信號的特征,使用隨機(jī)森林作為分類器進(jìn)行對比實驗。表3為小波分解、希爾伯特-黃變換結(jié)合隨機(jī)森林的識別結(jié)果。由表3可以看出,小波分解、希爾伯特-黃變換結(jié)合隨機(jī)森林的識別率為94.0%,低于梅爾倒譜系數(shù)結(jié)合隨機(jī)森林的識別率(99.3%),說明梅爾倒譜系數(shù)在液壓泵泄漏狀態(tài)識別中具有更佳的特征提取效果。
表3 小波分解、希爾伯特-黃變換結(jié)合隨機(jī)森林的識別結(jié)果Table 3 Recognition results of random forest combined with wavelet decomposition, Hilbert-Huang transform
本文進(jìn)一步采用對比實驗對提出的隨機(jī)森林與MFCC加時域組合特征的液壓泵泄漏狀態(tài)識別方法進(jìn)行驗證。對比模型分別使用隨機(jī)森林與支持向量機(jī),使用相同的訓(xùn)練集與測試集分別進(jìn)行10次獨立重復(fù)實驗。圖4為對比實驗分類識別率結(jié)果。從圖4可以看出,對于使用MFCC加時域組合特征的液壓泵泄漏狀態(tài)的識別,隨機(jī)森林(RF)具有較好的識別效果,識別率穩(wěn)定在99%左右,最高達(dá)到99.3%;支持向量機(jī)的識別效果相對較差,識別率在95%左右,并且具有較大的波動性。通過對比實驗,可以確定,隨機(jī)森林在本文的識別任務(wù)中具有更好的識別率。
圖4 實驗結(jié)果對比Fig. 4 Comparison of experimental results
本研究提出了基于梅爾倒譜系數(shù)(MFCC)與時域組合特征和隨機(jī)森林分類器相結(jié)合的外骨骼機(jī)器人柔性關(guān)節(jié)液壓泵泄漏狀態(tài)識別方法。將梅爾倒譜系數(shù)特征引入液壓泵狀態(tài)的識別中,結(jié)合液壓信號的時域特征,有效地完成了液壓泵泄漏狀態(tài)的分類識別。
本文的研究也證明了梅爾倒譜系數(shù)在機(jī)械振動信號的故障診斷的應(yīng)用的可能性。未來,可繼續(xù)探究梅爾倒譜系數(shù)特征在其他振動信號故障診斷中的應(yīng)用,為其他類信號的故障診斷提供更多的解決方法。