李 善,譚繼文,俞 昆
(青島理工大學(xué) 機(jī)械工程學(xué)院,山東 青島 266520)
基于SLLE算法和流形聚類分析的滾珠絲杠故障診斷*
李 善,譚繼文,俞 昆
(青島理工大學(xué) 機(jī)械工程學(xué)院,山東 青島 266520)
針對滾珠絲杠故障信號非線性的特點(diǎn)及故障特征集中冗余信息的干擾,提出了將SLLE降維方法與流行聚類分析相結(jié)合的故障診斷方法。采集滾珠絲杠不同故障狀態(tài)的振動(dòng)信號和噪聲信號,構(gòu)造原始信號特征向量;利用SLLE算法對特征向量進(jìn)行降維處理,得到篩選后的特征向量,繪制出其三維分布圖;計(jì)算每種故障的聚類中心和流形距離,根據(jù)“最短距離”原則進(jìn)行故障識別診斷。并通過試驗(yàn)及與KPCA、LLE兩種診斷方法的比較,驗(yàn)證了SLLE降維方法與流行聚類分析相結(jié)合的故障診斷方法的有效性和識別結(jié)果的準(zhǔn)確性。
SLLE算法;流形距離;故障診斷
滾珠絲杠以其精度好、傳動(dòng)效率高等特點(diǎn),廣泛應(yīng)用于數(shù)控機(jī)床,是機(jī)械行業(yè)使用最廣的傳動(dòng)組件之一。但常常因?yàn)槭褂煤途S護(hù)不當(dāng),無法滿足加工精度要求,甚至使數(shù)控機(jī)床出現(xiàn)故障和損壞。因此,及時(shí)進(jìn)行滾珠絲杠故障診斷是保證數(shù)控機(jī)床正常運(yùn)行和提高加工質(zhì)量的重要環(huán)節(jié)。
滾珠絲杠發(fā)生故障時(shí),其信號表現(xiàn)為非線性的特點(diǎn),且信號特征向量維數(shù)巨大,不易進(jìn)行后續(xù)診斷工作。由于傳統(tǒng)KPCA降維方法無法保留數(shù)據(jù)原始特征的缺點(diǎn),S.T.Roweis等人提出了LLE方法,該方法很好地保留了數(shù)據(jù)的原始結(jié)構(gòu),并廣泛應(yīng)用于人臉識別,圖像處理等領(lǐng)域。但LLE屬于非監(jiān)督式降維方法,沒有考慮到不同故障的分類。SLLE算法增加了樣本類別信息,相比于KPCA、LLE兩種方法,該方法既保留了數(shù)據(jù)原始特征、又包含故障類別的樣本信息,非常適合于滾珠絲杠不同類別故障的識別與診斷。
聚類分析是模式識別領(lǐng)域中的常用方法之一,常用的聚類分析方法有K-均值法,模糊聚類法等。距離是描述數(shù)據(jù)間差異性的度量,傳統(tǒng)歐氏距離無法反映聚類全局的一致性,只能反映局部數(shù)據(jù)的相似性,因此本文引入基于流形距離的聚類算法,可以放大不同流形上點(diǎn)的距離,同時(shí)縮小相同流形上點(diǎn)的距離。與傳統(tǒng)聚類方法相比,該方法能夠直觀、簡明的反映不同故障的分類信息。
綜上,本文研究基于SLLE算法與流形距離聚類算法相結(jié)合的滾珠絲杠故障診斷方法,并通過試驗(yàn)予以驗(yàn)證。
1.1 LLE算法介紹
LLE(Locally Linear Embedding)算法,即局部線性嵌入算法,是S.T.Roweis 等人提出的一種針對非線性信號特征的無監(jiān)督降維方法。該算法較傳統(tǒng)的核主成分分析法(KPCA)來講,既有處理非線性數(shù)據(jù)的優(yōu)點(diǎn),又有線性降維方法計(jì)算性能的優(yōu)越性。它不僅是數(shù)量上的簡單降維,更是在高維空間信號映射到低維空間的過程中保持了原始數(shù)據(jù)性質(zhì)不變,相當(dāng)于數(shù)據(jù)特征的二次提取[1]。
LLE算法步驟[2]如下:
(1)尋找高維空間中每個(gè)樣本點(diǎn)xi的k個(gè)近鄰點(diǎn)。利用歐氏距離公式計(jì)算xi與其它樣本點(diǎn)的距離,選取距離最近的k個(gè)樣本點(diǎn)。
(2)計(jì)算樣本點(diǎn)的局部重構(gòu)權(quán)值wij。將每個(gè)xi用它的k個(gè)近鄰點(diǎn)的線性組合近似表示,定義重構(gòu)誤差函數(shù)為:
(1)
通過將其重構(gòu)誤差最小化,來求得重構(gòu)權(quán)值:
(2)
其中Qi為局部協(xié)方差矩陣,表示為:
QZ(WTBZijm=(xi-xij)T(xi-xim)
(3)
(3)求解xi在低維空間中的投影yi。保持權(quán)值wij不變,求得樣本點(diǎn)投影在低維空間的值,使得低維重構(gòu)誤差最小,即:
(4)
1.2 SLLE算法介紹
LLE算法的不足之處在于沒有考慮數(shù)據(jù)的類別信息,因此Ridder等人提出了有監(jiān)督的局部線性嵌入算法,即SLLE(SupervisedLocallyLinearEmbedding)。該算法在第一步計(jì)算歐氏距離來尋找k個(gè)近鄰點(diǎn)時(shí),增加了樣本類別信息[3],不同類別樣本點(diǎn)間的歐氏距離的計(jì)算方法不同,可用于多類故障的特征提取。其余步驟與LLE算法相同。
SLLE在計(jì)算樣本點(diǎn)間的距離時(shí)用如下公式[4]:
D′=D+αmax(D)Δ
(5)
其中D′是考慮類別信息之后計(jì)算出的距離,D是原始?xì)W氏距離,max(D) 是不同類別之間的最大距離,α是控制樣本點(diǎn)之間的距離參數(shù),α∈[0,1]是個(gè)經(jīng)驗(yàn)參數(shù),當(dāng)α=0時(shí),SLLE算法與LLE算法相同。Δ取0或1,當(dāng)樣本點(diǎn)屬于同類時(shí),Δ=0;反之取1。
1.3 SLLE參數(shù)設(shè)置
SLLE計(jì)算過程中的近鄰點(diǎn)個(gè)數(shù)k以及輸出維數(shù)d對最后結(jié)果的影響較大。若k取值較大,則不能正確體現(xiàn)局部特性;若k取值較小,則不能保持原有數(shù)據(jù)的拓?fù)浣Y(jié)構(gòu)。k的取值要比d大一些,一般情況下取k=5~12,d可以根據(jù)實(shí)際情況來定[5]。α為經(jīng)驗(yàn)參數(shù),α越大,類別信息影響程度越大;反之越小。查閱相關(guān)文獻(xiàn),一般選取0.2~0.6[6]。
2.1 聚類分析原理
聚類分析(ClusteringAnalysis)是將大量樣本對象按其內(nèi)在相似程度劃分為多個(gè)類別的過程。同一類的對象之間具有高度的相似性[7],進(jìn)行聚類分析時(shí),主要有兩種途徑[8]:一是將樣本對象看作是空間中的點(diǎn),通過點(diǎn)與點(diǎn)之間的距離,來描述樣本對象之間的近似程度,距離越小,表示對象間越相似;二是計(jì)算樣本對象間的相似系數(shù),相似系數(shù)越大,對象間越相似。
2.2 基于流形距離的聚類算法
流形距離度量方法是流形聚類分析中常用的一種方法,該度量方法可以放大不同流形上點(diǎn)的距離,同時(shí)縮小相同流形上點(diǎn)的距離。其計(jì)算距離的方法有很多種,本文采用聚類中心距離度量方法,根據(jù)“最短距離”原則,計(jì)算各樣本點(diǎn)與各類別聚類中心的距離,相距最短的樣本點(diǎn)就歸為相應(yīng)的那一類[9]。如圖1所示,xi和xj分別為兩類數(shù)據(jù)樣本,其白色圓圈為各自類別的聚類中心,橢圓區(qū)域內(nèi)的點(diǎn)為隨機(jī)給出的待測樣本點(diǎn)在低維空間的投影,通過計(jì)算橢圓區(qū)域內(nèi)的點(diǎn)與各聚類中心的距離,來完成相應(yīng)類別的劃分。
圖1 距離度量方法示意圖
xi與xj之間的流形距離為:
(6)
其中,p={p1,p2,…,pr}表示連接p1與pr的一條路徑,Pi,j表示連接xi與xj的所有路徑的集合,L(a,b)表示同一流形上兩點(diǎn)間的的線段長度。
3.1 故障信號的采集及特征提取
本文選用6202z型滾珠絲杠進(jìn)行故障診斷試驗(yàn),在絲杠前端軸承座處布置一個(gè)型號為TZ-2KA的噪聲傳感器,在軸承座的X、Y、Z三個(gè)方向分別布置一個(gè)型號為LC0101的加速度傳感器,采集滾珠絲杠的四種不同故障狀態(tài)(正常狀態(tài)、絲杠彎曲、滾道磨損、滾珠破損)的振動(dòng)信號和噪聲信號。采樣頻率為512Hz,采樣點(diǎn)數(shù)為1536。傳感器分布圖如圖2所示。
圖2 傳感器分布圖
用小波包分解對采集到的信號進(jìn)行分解,提取每個(gè)故障信號分解后的22個(gè)時(shí)-頻域特征值(8個(gè)能量特征值和峰度、偏斜度、頻率方差、均方頻率、重心頻率、裕度因子、脈沖因子、波形因子、峰值因子、峭度因子、絕對平均幅值、方根幅值、均方根值、最大值14個(gè)時(shí)頻域特征值)作為原始信號特征集,四個(gè)傳感器共88維特征值。提取每種故障信號各20組,其中15組作為訓(xùn)練集,5組作為測試集。
3.2 特征集降維處理及性能比較
分別采用KPCA、LLE、SLLE三種方法對訓(xùn)練集和測試集的88維特征值進(jìn)行降維處理,為方便比較,本文選取近鄰點(diǎn)k=10,輸出維數(shù)d=3。圖3為三種方法降維之后的結(jié)果分布圖[10],從圖中可以看出,KPCA和LLE兩種降維方法的特征量有重疊現(xiàn)象,均不能將故障分類;而SLLE方法可以有效地分離出每一種故障,分類效果比較明顯。以此驗(yàn)證了SLLE降維方法的可行性與有效性。
(a)KPCA降維結(jié)果
(b)LLE降維結(jié)果
(c)SLLE降維結(jié)果圖3 三種方法降維結(jié)果分布圖
3.3 聚類分析診斷及結(jié)果比較
對三種方法降維之后的特征訓(xùn)練集進(jìn)行聚類中心計(jì)算,得到每一種故障類型的聚類中心,不同故障狀態(tài)(記正常狀態(tài)為故障A、絲杠彎曲為故障B、滾道磨損為故障C、滾珠破損為故障D)的聚類中心分別為A(-2.35,-1.58,0.59)、B(2.90,-0.31,0.94)、C(-1.23,1.67,1.53)、D(2.45,-0.58,0.86)。利用公式(6)計(jì)算出降維后的測試樣本數(shù)據(jù)與聚類中心的距離,如表1~表3所示。其中,KPCA方法的診斷結(jié)果中有5組數(shù)據(jù)出現(xiàn)錯(cuò)判,診斷識別率為75%;LLE方法的診斷結(jié)果中有2組數(shù)據(jù)錯(cuò)判,診斷識別率為90%;SLLE方法的診斷結(jié)果中只有1組出現(xiàn)錯(cuò)誤,診斷識別率高達(dá)95%,識別效果較好。
表1 KPCA方法的故障診斷結(jié)果
表2 LLE方法的故障診斷結(jié)果
表3 SLLE方法的故障診斷結(jié)果
本文提出了一種將SLLE降維方法與流形距離的聚類分析相結(jié)合的故障診斷方法,應(yīng)用于滾珠絲杠的不同故障狀態(tài)識別。通過繪制降維后數(shù)據(jù)的三維分布圖,得出SLLE降維方法的分類效果明顯優(yōu)越于LLE和KPCA方法。通過四種不同的絲杠故障試驗(yàn),驗(yàn)證了聚類分析在故障診斷方面的可行性。同時(shí),比較三種降維方法與聚類分析相結(jié)合的診斷結(jié)果,得出SLLE算法與流形聚類相結(jié)合的診斷結(jié)果最好,識別率高達(dá)95%。
[1] 張偉,周維佳,劉曉源.基于擴(kuò)展LLE方法的非線性系統(tǒng)故障診斷研究[J].電子學(xué)報(bào),2015,43(9):1810-1815.
[2] 張育林,莊健,王娜,等.一種自適應(yīng)局部線性嵌入與譜聚類融合的故障診斷方法[J]. 西安交通大學(xué)學(xué)報(bào),2010,44(1):77-82.
[3] 胡丹.基于改進(jìn)的SLLE在地震屬性優(yōu)化中的研究與應(yīng)用[D].成都:成都理工大學(xué),2007.
[4] 李鋒,田大慶,王家序,等.基于有監(jiān)督增量式局部線性嵌入的故障辨識[J]. 振動(dòng)與沖擊,2013,32(23):82-88.
[5] 董安,潘宏俠,龔明.基于局部線性嵌入算法的柴油機(jī)故障診斷研究[J]. 計(jì)算機(jī)工程與應(yīng)用,2013,49(22):236-240.
[6] 張石清,李樂民,趙知?jiǎng)?基于一種改進(jìn)的監(jiān)督流形學(xué)習(xí)算法的語音情感識別[J].電子與信息學(xué)報(bào),2010,32(11):2724-2729.
[7] 金曉慧.基于流形距離和核函數(shù)的進(jìn)化聚類算法研究及其應(yīng)用[D].西安:西安電子科技大學(xué),2009.
[8] 郭啟勇.流形聚類的算法研究及其應(yīng)用[D]. 上海:復(fù)旦大學(xué),2009.
[9] 賀旖琳.基于局部線性嵌入的旋轉(zhuǎn)機(jī)械故障診斷研究[D].長沙:湖南科技大學(xué),2014.
[10] 李強(qiáng),皮智謀.基于FastICA_SLLE的轉(zhuǎn)子系統(tǒng)故障診斷研究[J]. 組合機(jī)床與自動(dòng)化加工技術(shù),2014(8):105-108.
(編輯 李秀敏)
Fault Diagnosis of Ball Screw Based on SLLE Algorithm and Manifold Clustering Analysis
LI Shan,TAN Ji-wen,YU Kun
(School of Mechanical Engineering, Qingdao Technological University ,Qingdao Shandong 266520,China )
According to the nonlinear characteristics of ball screw fault signal and the interference of the fault characteristic, the fault diagnosis method based on SLLE dimension reduction method and the popular cluster analysis is put forward. Collect vibration signal and noise signal in different fault state of ball screw and structure original signal feature vector. Using SLLE algorithm to reduce the dimension of feature vectors and feature vectors are obtained. Draw its three-dimensional distribution map. Calculate the cluster centers and manifold distances for each fault and fault diagnosis based on the principle of "shortest distance". And through the experiment and comparison with KPCA and LLE two diagnostic methods, the validity and accuracy of the fault diagnosis method combined with the SLLE dimension reduction method and the popular cluster analysis method was verified.
SLLE algorithm; manifold distance; fault diagnosis
1001-2265(2016)12-0096-04
10.13462/j.cnki.mmtamt.2016.12.026
2016-01-28;
2016-02-29
國家自然科學(xué)基金項(xiàng)目(51075220);山東省高等學(xué)校科技計(jì)劃項(xiàng)目(J13LB11);高等學(xué)校博士學(xué)科點(diǎn)專項(xiàng)科研基金(20123721110001);青島市科技計(jì)劃基礎(chǔ)研究項(xiàng)目(12-1-4-4-(3)-JCH)
李善(1990—),女,山東萊蕪人,青島理工大學(xué)碩士研究生,研究方向?yàn)闄C(jī)械無損檢測與故障診斷,(E-mail)1026622139@qq.com。
TH17;TG506
A