何敬舉,趙榮珍,趙孝禮,孫業(yè)北
(蘭州理工大學(xué)機(jī)電工程學(xué)院,甘肅 蘭州 730050)
隨著現(xiàn)代工業(yè)技術(shù)的不斷發(fā)展, 越來越多的旋轉(zhuǎn)機(jī)械被應(yīng)用到企業(yè)的生產(chǎn)中, 這對旋轉(zhuǎn)機(jī)械故障診斷技術(shù)不斷提出新的要求[1]。機(jī)械故障診斷中最為關(guān)鍵的步驟是提取信號故障特征[2-3]。特征提取又稱屬性約簡或維數(shù)約簡,從數(shù)學(xué)的角度考慮,就是通過某種方法使新數(shù)據(jù)的維數(shù)小于等于原數(shù)據(jù)的維數(shù),新的數(shù)據(jù)在某種評判標(biāo)準(zhǔn)下最大限度地保留原始數(shù)據(jù)的特征[4]。屬性約簡主要是為了解決高維數(shù)據(jù)計(jì)算的復(fù)雜性和準(zhǔn)確性問題,目的是消除冗余和不相關(guān)屬性對計(jì)算過程和最終結(jié)果造成的影響,降低計(jì)算復(fù)雜度,減少計(jì)算時(shí)間[5]。在現(xiàn)實(shí)世界中,數(shù)據(jù)數(shù)量龐大且數(shù)據(jù)質(zhì)量較低,使得許多數(shù)據(jù)存在不確定性[6]。如何從龐大的數(shù)據(jù)集中提取出有效的切合實(shí)際物理意義的故障特征,進(jìn)而提高故障診斷的準(zhǔn)確性和縮短診斷時(shí)間是當(dāng)前需要研究的問題。
粗糙集是一種從不完備、不完整數(shù)據(jù)集中獲取知識(shí)的數(shù)學(xué)方法,近年來被國內(nèi)外專家用在不同領(lǐng)域且都取得了很好的效果[7-8],在故障診斷中也被廣泛應(yīng)用。文獻(xiàn)[9]采用粗糙集理論對離散化后的決策表進(jìn)行約簡,建立故障診斷規(guī)則決策表,能夠簡化決策表屬性約簡的難度,使診斷變得更加簡便。文獻(xiàn)[10]將粗糙集和數(shù)據(jù)庫神經(jīng)網(wǎng)絡(luò)結(jié)合用來診斷液壓機(jī)故障,提高了診斷準(zhǔn)確性。文獻(xiàn)[11]首次對粗糙集理論用于旋轉(zhuǎn)機(jī)械狀態(tài)監(jiān)測與故障診斷系統(tǒng)知識(shí)庫構(gòu)造、實(shí)現(xiàn)在線智能知識(shí)獲取與知識(shí)發(fā)現(xiàn)及歸納推理進(jìn)行了研究,并且給出了理論框架。在此基礎(chǔ)上,文獻(xiàn)[12]將變精度粗糙集用在汽輪機(jī)組的故障診斷上,建立了決策表,證實(shí)了此方法可以有效獲得故障特征屬性。為了解決連續(xù)屬性離散化過程中屬性丟失的問題,文獻(xiàn)[13]首次在國內(nèi)提出鄰域粗糙集概念,并給出了前向貪心算法,證實(shí)了鄰域粗糙集在對連續(xù)屬性約簡時(shí)能夠獲得更高的精確度和準(zhǔn)確度。文獻(xiàn)[14]將多小波包和鄰域粗糙集結(jié)合在一起建立了故障診斷模型,驗(yàn)證了鄰域粗糙集能夠從大量的原始特征中選擇出敏感特征,減小分類算法的復(fù)雜性,提高分類的準(zhǔn)確性,證實(shí)了該模型在復(fù)合故障診斷中具有顯著優(yōu)勢。
然而文獻(xiàn)[14]只對以峰值、均值等信號時(shí)域特征構(gòu)成的數(shù)據(jù)集進(jìn)行了分析,沒有對反映信號本質(zhì)的頻域特征集進(jìn)行分析。為了更好地獲取反映故障本質(zhì)的屬性以及減少連續(xù)屬性離散化過程中屬性的丟失,本文將頻域特征信息和鄰域粗糙集結(jié)合起來對故障特征進(jìn)行提取,證明了該方法能夠獲得旋轉(zhuǎn)機(jī)械典型故障的關(guān)鍵屬性以及準(zhǔn)確的決策規(guī)則。
1982年波蘭科學(xué)家PAWLAK提出了粗糙集理論[15],將研究對象的全體稱為論域,利用不可分辨關(guān)系將論域?;癁槿舾苫コ獾牡葍r(jià)類,作為描述論域中任意概念的基本信息粒子。LIN[16]在1988年提出了鄰域模型的概念,將鄰域理解為基本信息粒子,通過空間中點(diǎn)的鄰域來?;撚蚩臻g。胡清華等[13]利用拓?fù)淇臻g中球形鄰域的概念構(gòu)造了基于鄰域粗糙集模型的數(shù)值特征屬性選擇算法。鄰域粗糙集的基本概念如下:
1)定義(度量)在一給定的N維實(shí)數(shù)空間Ω中,Δ=RN×RN→R,則稱Δ為RN上的一個(gè)度量(距離),若Δ滿足以下條件:
①Δ(χ1,χ2)≥0,其中當(dāng)且僅當(dāng)χ1=χ2時(shí)等號成立, ?χ1,χ2∈RN;
②Δ(χ1,χ2)=Δ(χ2,χ1), ?χ1,χ2∈RN;
③Δ(χ1,χ3)≤Δ(χ1,χ2)+Δ(χ2,χ3),?χ1,χ2,χ3∈RN。
則稱(Ω,Δ)為度量空間,Δ(χi,χj)為距離函數(shù),表示元素χi和元素χj之間的距離。顯然這里合理地給出了元素空間中距離的概念。
2)定義(鄰域)在給定空間Ω上的非空有限集合U={χ1,χ2,…,χn},對?χi的鄰域δ定義為:
δ(χi)={χ|χ∈U,Δ(χ,χi)≤δ},δ≥0
同樣給定鄰域關(guān)系N,和原始粗糙集理論相類比可得鄰域近似空間NS=(U,N)的上近似、下近似和近似邊界分別為:
(1)
NX={χi|δ(χi)?X,χi∈U}
(2)
(3)
正域和負(fù)域分別為:
Pos(X)=NX
(4)
(5)
3)定義(領(lǐng)域決策系統(tǒng))給定一鄰域決策系統(tǒng)NDS=(U,A∪D,n),其中A為條件屬性,D為決策屬性,決策屬性D將論域U劃分為n個(gè)等價(jià)類(X1,X2,…,Xn),對于?B?A,則決策屬性D關(guān)于條件屬性B的上、下近似分別為:
(6)
(7)
類比可得鄰域決策系統(tǒng)的邊界域、正域和負(fù)域分別為:
(8)
PosB(D)=NBD
(9)
(10)
決策屬性D對子集條件屬性B的屬性依賴度為:
(11)
若條件屬性a∈B,則a對決策屬性D的重要度為:
Sig(a,B,D)=γB(D)-γB-{a}(D)
(12)
式中:γB(D)為決策屬性D對子集條件屬性B的屬性依賴度。
用于旋轉(zhuǎn)機(jī)械設(shè)備故障診斷的方法有很多,常用的方法按檢測手段分為振動(dòng)檢測診斷法、噪聲檢測手段法、溫度檢測診斷法、聲發(fā)射檢測診斷法、油液分析診斷法等。其中振動(dòng)檢測診斷法主要采用時(shí)域分析、頻域分析、時(shí)序分析、時(shí)頻域分析等方法來分析采集到的振動(dòng)信號,發(fā)現(xiàn)振動(dòng)變化的原因,從而更可靠、準(zhǔn)確地發(fā)現(xiàn)故障特征。實(shí)際工程中的信號是雜亂無章的且夾雜著噪聲,把信號從時(shí)域轉(zhuǎn)到頻域來分析能夠把混疊在一起的信號分離出來,更能夠找出信號的本質(zhì)。
在數(shù)字信號處理領(lǐng)域用到的一種很基本、很重要的方法就是傅立葉變換。傅立葉變換將原來難以處理的時(shí)域信號轉(zhuǎn)換成了易于分析的頻域信號,從而可以利用一些工具對這些頻域信號進(jìn)行處理、加工。最后還可以用傅立葉反變換將這些頻域信號轉(zhuǎn)換成時(shí)域信號。傅立葉變換是一種特殊的積分變換,其基本公式為:
(13)
式中:F(ω)為f(t)的像函數(shù);f(t)為F(ω)的像原函數(shù)。
頻譜分析可以快速并準(zhǔn)確地找出故障部件的故障所在,也可以進(jìn)行點(diǎn)檢定修,確保機(jī)械設(shè)備不存在安全隱患。頻譜分析還能克服外界對測試的干擾,較為準(zhǔn)確地分析數(shù)據(jù),得到確切的故障診斷信息。因?yàn)槔谜駝?dòng)信號進(jìn)行分析的診斷技術(shù)其本身在機(jī)械設(shè)備領(lǐng)域中有很好的應(yīng)用前景[17],所以利用粗糙集理論在反映信號本質(zhì)的頻域數(shù)據(jù)庫中進(jìn)行知識(shí)的獲取、屬性的約簡能夠獲得更好的特征屬性和更加準(zhǔn)確的決策規(guī)則。
1.3.1頻域決策表理論
在旋轉(zhuǎn)機(jī)械故障診斷中,大量理論和試驗(yàn)證明,不同的故障類型在它們的頻譜圖上有著不同的表現(xiàn),特別是在頻譜圖的各個(gè)倍頻上更有顯著性的差異。從夾雜著噪聲、非平穩(wěn)信號的海量原始故障數(shù)據(jù)集中提取出有效特征從而做出決策是一件非常困難的事,而鄰域粗糙集提供了一種從連續(xù)的或者符號型的數(shù)據(jù)集中有效、準(zhǔn)確獲取知識(shí)的方法[13],所以本文提出的以工頻f的各個(gè)倍頻為條件屬性,以轉(zhuǎn)子不平衡、不對中等故障為決策屬性建立鄰域粗糙集決策表是可行的[12,14]。首先利用式(13)對故障振動(dòng)信號進(jìn)行頻譜分析,讀取各倍頻下對應(yīng)的譜峰值建立故障數(shù)據(jù)庫,然后利用式(14)得到鄰域半徑δ,之后就是進(jìn)行如下的屬性約簡。
1.3.2頻域決策表屬性約簡程序
Step1,輸入決策系統(tǒng)NDS=(U,A∪D),鄰域半徑δ集合,重要度下限;
Step2,初始化約簡集合red=?,樣本smp=U;
Step4,選擇ak使正域Posak(D)最大;
Step5,利用式(12)計(jì)算屬性重要度Sig(ak,red,D);
Step6,如果Sig(ak,red,D)大于設(shè)定的下限值,則輸出約簡結(jié)果red,否則,記錄k值,令:red=red+ak,S=S-Posak,然后返回Step3。
本文采用雙跨轉(zhuǎn)子實(shí)驗(yàn)臺(tái)采集的振動(dòng)信號集合作為實(shí)驗(yàn)對象,采集信號的傳感器為電渦流位移傳感器,轉(zhuǎn)速為2 800r/min,采樣頻率為5 000Hz,信號截取長度為1024字節(jié),模擬轉(zhuǎn)子不平衡、轉(zhuǎn)子不對中和碰磨3種故障狀態(tài)。通過式(13)對振動(dòng)信號的處理計(jì)算出設(shè)備信號1,2,3,4,5,6倍頻處的幅值。令A(yù)1,A2,A3,A4,A5,A6分別代表1,2,3,4,5,6倍頻,作為條件屬性,以轉(zhuǎn)子不平衡、轉(zhuǎn)子不對中和轉(zhuǎn)子碰磨3種故障類型為決策屬性,取16個(gè)樣本為訓(xùn)練樣本建立頻域鄰域粗糙集決策表(表1),論域內(nèi)的每個(gè)元素代表著對應(yīng)故障和倍頻下的頻譜幅值。然后用數(shù)字1代表轉(zhuǎn)子不平衡,2代表轉(zhuǎn)子不對中,3代表轉(zhuǎn)子碰磨,對決策表進(jìn)行歸一化處理,因?yàn)樵卩徲虼植诩写嬖跀?shù)量級和量綱的差異,為了獲得更精確的處理結(jié)果需要對數(shù)據(jù)進(jìn)行歸一化處理[13]。這里對決策屬性也進(jìn)行了歸一化,最后一列為決策屬性歸一化后的結(jié)果(表2)。為了防止大數(shù)吃小數(shù)的現(xiàn)象,應(yīng)分別對每一列進(jìn)行歸一化,其中決策屬性也可以不進(jìn)行歸一化。之后按如下公式計(jì)算鄰域半徑:
δ(Ai)=Std(Ai)/λ(i=1,2,…,6)
(14)
表1 頻域鄰域粗糙集決策表
表2 決策表歸一化后結(jié)果
式中:Std(Ai)為每一列條件屬性的標(biāo)準(zhǔn)差;λ為一設(shè)定的參數(shù),用來根據(jù)分類精度調(diào)整鄰域大小。這樣就可以根據(jù)鄰域粗糙集的定義,以某個(gè)樣本為中心,以鄰域半徑大小為半徑畫圓來確定鄰域。之后再根據(jù)相關(guān)定義對決策表進(jìn)行屬性約簡、特征提取等相關(guān)計(jì)算。整個(gè)數(shù)據(jù)處理過程如圖1所示。鄰域粗糙集的約簡結(jié)果和鄰域半徑的大小與設(shè)定的重要度下限有關(guān),存在合適的鄰域半徑值域使約簡出來的結(jié)果最合適。重要度下限一般設(shè)定為接近于0的數(shù)[13]。表3為當(dāng)λ=0.5、重要度下限為0.001時(shí)約簡得到的屬性以及各屬性對應(yīng)的重要度值。由于決策樹C4.5算法能夠有效地處理連續(xù)屬性和缺省不完整數(shù)據(jù),所以本實(shí)驗(yàn)采用決策樹C4.5來獲取決策規(guī)則。實(shí)驗(yàn)平臺(tái)為Windows 7系統(tǒng)下的基于Java環(huán)境下開源的WEKA軟件。圖2為由原始決策表得到的決策樹,圖3為經(jīng)鄰域粗糙集約簡、刪除掉冗余屬性后得到的決策樹。代入16個(gè)測試樣本進(jìn)行驗(yàn)證,正確率分別為81.25%和87.50%。
圖1 數(shù)據(jù)集處理流程圖
圖2 原始數(shù)據(jù)集決策規(guī)則
圖3 鄰域粗糙集約簡后決策規(guī)則
表3 約簡剩余屬性及對應(yīng)重要度
由圖2可得,原始故障數(shù)據(jù)集在經(jīng)過決策樹C4.5離散化處理后得到的屬性重要度最大為4倍頻,這和實(shí)際測量的實(shí)驗(yàn)結(jié)果的差異性相差較大。在實(shí)際的測量過程中,轉(zhuǎn)子的各種故障在頻譜圖中主要表現(xiàn)為2倍頻、1倍頻、1/2倍頻和1/3倍頻的譜峰值上的差異,隨著倍頻數(shù)的增高,差異性越來越弱化。可見,在對連續(xù)屬性數(shù)據(jù)處理的過程中,特別是對實(shí)際工程復(fù)雜信號的分析中,離散化的過程很容易導(dǎo)致重要的信息丟失,從而使分析得出的結(jié)果表面上只適合單純的數(shù)據(jù),但是不符合實(shí)際情況。
由表3可得,經(jīng)鄰域粗糙集約簡后得到的重要屬性是2倍頻、1倍頻、3倍頻和5倍頻,這和試驗(yàn)中對各種故障做頻譜分析時(shí)得到的譜峰值的差異性比較相似。由圖3也可看出,由1倍頻和2倍頻這兩個(gè)屬性特征就能基本確定故障類型?;氐奖?,和其他條件屬性相比,顯然2倍頻下的屬性特征對3種故障類型差異性的表示更明顯。對比論域?yàn)?2這一行轉(zhuǎn)子碰磨下的2倍頻值0.97和其他碰磨下的2倍頻值,可以看出相差比較大,如果這是測量誤差所致,那就可以單獨(dú)用2倍頻這一個(gè)條件屬性下的值來區(qū)分3種故障類型。對比圖2和圖3可見,原始故障數(shù)據(jù)集經(jīng)過鄰域粗糙集約簡后,刪除了影響數(shù)據(jù)分析的冗余屬性,能夠得到更加準(zhǔn)確和更加符合實(shí)際物理意義的特征值。在后續(xù)用測試樣本進(jìn)行驗(yàn)證時(shí),約簡后的故障分類正確率也大于約簡前的分類正確率。
本文將鄰域粗糙集概念用在了旋轉(zhuǎn)機(jī)械故障診斷的頻域分析當(dāng)中,并以各倍頻為條件屬性、以故障類型為決策屬性建立了決策表來獲取決策規(guī)則。結(jié)果表明,基于鄰域粗糙集理論的原始故障數(shù)據(jù)集的屬性約簡能有效地避免在對具有實(shí)際物理意義的連續(xù)屬性離散化的過程中造成的關(guān)鍵屬性的丟失。實(shí)驗(yàn)結(jié)果表明該方法能夠有效地獲得典型故障的關(guān)鍵屬性和更加準(zhǔn)確的決策規(guī)則。
參考文獻(xiàn):
[1]羅邦劼. 旋轉(zhuǎn)機(jī)械故障診斷技術(shù)的研究現(xiàn)狀及發(fā)展趨勢[J]. 機(jī)電產(chǎn)品開發(fā)與創(chuàng)新,2008(3):85-86.
[2]PENG Z,CHU F, HE Y. Vibration signal analysis and feature extraction based on reassigned wavelet scalogram[J]. Journal of Sound and Vibration,2002,253(5): 1087-1100.
[3]RANDALL R B. Detection and diagnosis of incipient bearing failure in helicoper gearboxes[J]. Engineering Failure Aanlysis,2004,11(2): 177-190.
[4]馮宗翰. 特征選擇新算法研究[D]. 無錫:江南大學(xué), 2011.
[5]孫麗萍, 陳果, 陳立波, 等. 基于 KPCA 的航空發(fā)動(dòng)機(jī)滑油濾磨屑圖像識(shí)別[J]. 機(jī)械科學(xué)與技術(shù), 2010, 29(6):731-736.
[6]楊傳健,葛浩,汪志圣. 基于粗糙集的屬性約簡方法研究綜述[J]. 計(jì)算機(jī)應(yīng)用研究,2012(1):16-20.
[7]馬文萍,黃媛媛,李豪,等. 基于粗糙集與差分免疫模糊聚類算法的圖像分割[J]. 軟件學(xué)報(bào), 2014(11):2675-2689.
[8]葉回春,張世文,黃元仿,等. 粗糙集理論在土壤肥力評價(jià)指標(biāo)權(quán)重確定中的應(yīng)用[J]. 中國農(nóng)業(yè)科學(xué),2014(4):710-717.
[9]陳小青,劉覺民,黃英偉,等. 采用改進(jìn)人工魚群優(yōu)化粗糙集算法的變壓器故障診斷[J]. 高電壓技術(shù),2012(6):1403-1409.
[10] 李雪冬. 基于粗糙集神經(jīng)網(wǎng)絡(luò)液壓機(jī)故障診斷專家系統(tǒng)的研究開發(fā)[D]. 合肥:合肥工業(yè)大學(xué), 2012.
[11] 趙榮珍,孟凡明,張優(yōu)云. 基于粗糙集知識(shí)獲取的轉(zhuǎn)子軸承系統(tǒng)故障診斷知識(shí)庫構(gòu)造研究[J]. 潤滑與密封,2004(4):25-26.
[12] 鄧林峰,趙榮珍,馮如只,等. 基于特征選擇和變精度粗集的屬性約簡方法及其應(yīng)用[J]. 機(jī)械科學(xué)與技術(shù), 2010,29(10):1412-1416.
[13] 胡清華,于達(dá)仁,謝宗霞. 基于鄰域粒化和粗糙逼近的數(shù)值屬性約簡[J]. 軟件學(xué)報(bào),2008, 19(3):640-649.
[14] 瞿金秀,張周鎖,何正嘉. 基于多小波包和鄰域粗糙集的故障診斷模型[J]. 振動(dòng)、測試與診斷,2013(增刊1):137-140.
[15] PAWLAK Z. Theoretical Aspect of Reasoning About Data[M] Wolters Kluwer:Kluwer Academic Publishers, 1991.
[16] LIN T Y. Granular computing on binary relations I:data mining and neighborhood systems[J]. Rough Sets in Knowledge Discovery, 1998(2):165-166.
[17] 劉晶晶. 基于頻譜分析的機(jī)械故障診斷研究[J]. 信息通信, 2014(1):26-37.