□ 李鴻光 □ 孫樹棟 □ 司書賓 □ 司佳佳
西北工業(yè)大學 現代設計與集成制造技術教育部重點實驗室 西安 710072
機械故障[1]指機械系統(tǒng)(零件、組件、部件或整臺設備乃至一系列的設備組合)已偏離其設備狀態(tài)而喪失部分或全部功能的現象。如果能夠對機械的運行狀態(tài)進行監(jiān)測,并在故障發(fā)生前發(fā)現故障并采取相應措施,開展預先維護,對于保障設備正常運行、避免嚴重故障危害是非常有效的。對于旋轉設備,一般可以通過采集實時振動信號,并通過對數據進行分析提取振動特征,從而建立振動幅度、頻率與設備狀態(tài)間的映射關系,達到預先維護的目的。
貝葉斯網絡[2,3](Bayesian Networks,BN)是一種有向無圈圖。它通過基于概率推理的圖形化網絡,表示變量的不確定狀態(tài)及變量之間條件依賴關系。目前貝葉斯網絡在統(tǒng)計決策、醫(yī)療診斷、專家系統(tǒng)以及處理不確定性信息的智能化系統(tǒng)等領域的應用已十分廣泛,是進行數據分析和不確定性推理的重要工具。
本文基于故障模擬器采集到的軸裂紋故障數據集,分別用常用的貝葉斯網絡分類器,如樸素貝葉斯(Na?ve Bayes,NB)[3,4]、 增 強 樸 素 貝 葉 斯 (Augmented Na?ve-Bayes,ANB)[5]、 樹型樸素貝葉斯 (Tree Augmented Na?ve-Bayes,TAN)[6]和無監(jiān)督貝葉斯網絡(General Beyasian Network,GBN)[7]進行診斷模型構建和性能分析,為軸裂紋故障診斷提供了方法依據。
機械故障仿真器/模擬器(MFS)是一種用于機械健康檢測的測試設備。此設備可模擬各種機械軸的常見故障,諸如:軸裂紋不平衡、軸不對中、彎曲軸、裂紋軸、滾珠和油膜軸承缺陷、帶傳動故障、齒輪箱障、電機故障、壓縮機故障及泵故障等。本文涉及的有關故障模擬器的實驗主要是:將以下故障件在故障模擬器上以不同狀態(tài)運行,并收集它們的故障數據。
此故障件包括一根直徑為 4.5 in(1in=25.4 mm)、通過帶4個螺栓的轉盤來模擬裂紋的軸、一根有裂縫及填充物的軸、一根有深度V型裂紋缺口的軸,如圖1所示。
圖1 軸裂紋研究套件
分別取正常軸(T)、裂紋軸 1(L-1)、裂紋軸 2(L-2)、裂紋軸3(L-3)在故障模擬器上運行。其中用轉盤上的4個螺栓緊固的軸裂紋套件模擬正常軸,用松動1個螺栓的套件模擬L-1,用松動2個相鄰螺栓的套件模擬L-2,用松動3個螺栓的套件模擬L-3,分別收集它們在故障模擬器上轉速處于60 Hz時的系統(tǒng)運行狀態(tài)數據。
本數據集取自故障模擬器實驗中,此數據集記錄了軸在正常狀態(tài)和故障狀態(tài)(裂紋)下傳感器所收集的振動數據。目標變量為State(軸狀態(tài)),屬性變量包括:tach、Hz、L-V、L-H、R-V、R-H。 模型涉及的變量描述如表1所示。
表1 實例變量描述
從收集的數據中隨機抽取出12 000條數據,建立數據集,其中取2/3為訓練集,1/3為測試集,表2列出了數據集屬性。
表2 數據集屬性
確定已有數據集D的目標變量T和屬性變量P;整理數據集D,按照變量分布概率隨機生成原則補充缺失數據,遵照平均分布原則將連續(xù)變量離散化。
為了防止過度擬合,保證各分類器的精度,將數據集按照2∶1的比例隨機抽樣,2/3作為訓練集Dtrain,1/3作為測試集Dtest;利用訓練集數據Dtrain分別建立多種貝葉斯網絡分類器模型;對于已建立好的貝葉斯網絡模型,利用測試集Dtest驗證分類器的分類精度和結構復雜度,并與用Dtest測試得到的精度進行比較。
NB分類器[4]是一種結構簡單、實踐有效的貝葉斯分類器,它包含一個根節(jié)點、多個葉節(jié)點,其假定給定目標變量C、各屬性變量Xi相互條件獨立。該分類器采用的局部獨立假設簡化了對訓練數據的條件概率分類,盡管這個假設過于理想化,但這種分類器在實踐中的分類精度較高,而且它的結構簡單,易于理解,計算復雜度低,學習效率高,因此在實踐中得到廣泛應用。
ANB分類器在NB分類器基礎上松弛了屬性變量之間的條件獨立假設,使屬性之間存在一定的依賴關系,即在屬性之間增添連接弧,這些弧稱為擴展弧。從節(jié)點Xi到Xj的擴展弧表示屬性Xj對分類的影響也取決于Xi的值。
TAN分類器[6,8,10]是NB分類器的擴展,它松弛了各屬性變量的條件獨立假設,允許屬性變量所對應的節(jié)點之間由連接弧連接。TAN分類器松弛了屬性變量之間的條件獨立假設,這使它具有兩方面的優(yōu)勢:一方面,繼承了ANB結構中類節(jié)點作為分類節(jié)點特殊地位的優(yōu)勢,可以有效避免由于馬爾可夫鏈的存在而導致分類精度的下降;另一方面,由于強制屬性節(jié)點間只能形成樹結構,因此可以充分利用圖論中最大權重生成樹算法實現對最優(yōu)網絡結構快速搜索,極大地提高了計算效率,保證在網絡結構滿足增強樹結構的條件下,可以逼近真實的類條件概率分布,同時也更好地表達了屬性間的相互關系,并在多數情況下獲得了良好的分類精度,得到了廣泛應用[9]。
GBN分類器[7,11]是一種無約束的貝葉斯網絡分類器。前三種分類器均將目標節(jié)點作為一個特殊的節(jié)點處理,而GBN分類器則把目標節(jié)點當作普通的節(jié)點,通過貝葉斯網絡學習算法構建基于所有節(jié)點的貝葉斯網絡模型。然后,以目標節(jié)點為中心尋找最優(yōu)貝葉斯網絡結構的馬爾可夫覆蓋(Markov blanket,MB)節(jié)點。給定目標節(jié)點的MB,則目標變量條件獨立于網絡中所有其它變量,這樣就大大降低了貝葉斯網絡模型的復雜度。
利用訓練集數據和Bayesialab仿真軟件建立分類器模型,對于連續(xù)變量采用決策樹分布離散化,按上述數據集所建立的NB、ANB、TAN、GBN分類器模型如圖2所示。
圖2 軸裂紋故障診斷貝葉斯網絡模型
根據上述模型,用測試集對模型的分類效果進行測試,各貝葉斯分類器的測試集混淆矩陣見表3。表4列出了基于混淆矩陣計算的各分類器在訓練集和測試集上的分類精度,其中分類精度較高的用字體加粗表示。從表3可以看出,每一種貝葉斯分類器的訓練集和測試集的分類精度基本相等,說明該數據集的貝葉斯分類器模型具有良好的泛化能力。
表3 軸裂紋故障貝葉斯分類器混淆矩陣
表4 貝葉斯分類器分類精度
根據上述模型,用測試集對模型的分類效果進行測試,由上述實驗及表3、表4可分析得知,目前為止分類精度最高為74.09%,表明直接建模精度不高,應該尋找其它的方法建模來提高診斷系統(tǒng)的精確度。表4列出了基于混淆矩陣計算的各分類器在訓練集和測試集上的分類精度,其中分類精度較高的用字體加粗表示。從表3可以看出,每一種貝葉斯分類器的訓練集和測試集的分類精度基本相等,說明該數據集的貝葉斯分類器模型具有良好的泛化能力。另外通過分析還可得出如下結論。
(1)由于NB分類器只考慮屬性變量與目標變量之間的關系,忽略了其它屬性變量之間的關系,所以其分類精度明顯低于其它三種分類器,TAN分類器總是表現一般,ANB分類器和GBN分類器表現得比較好。
(2)由以上建模得知,目前為止分類精度最高為74.09%,接下來可以繼續(xù)討論其它建模方法。
本文通過故障模擬器收集軸裂紋故障數據,以各實例集的訓練集為基礎,利用BayesiaLab仿真軟件實現各貝葉斯網絡分類器的建模;以測試數據集為基礎,利用各貝葉斯網絡分類器模型對測試數據進行分類;通過對各模型精度的比較,從眾多數據中和NB、ANB、TAN和GBN網絡模型中找出了最佳診斷模型。
[1] 李海軍,馬登武,劉宵.貝葉斯網絡理論在裝備故障診斷中的應用[M].北京:國防工業(yè)出版社,2009.
[2] 張連文,郭海鵬.貝葉斯網引論[M].北京:科學出版社,2006.
[3] 王建林,王學玲.數據挖掘中的貝葉斯分類器[J].長春理工大學學報,2006,29(3):51-53.
[4] 謝斌.樸素貝葉斯分類在數據挖掘中的應用[J].甘肅聯(lián)合大學學報(自然科學版),2007, 21(4):79-82.
[5] Cheng Jie,GreinerR.Comparing Bayesian Network Classifiers [C].Proceedings of the 15th Annual Conference on Uncertainty in Artificial Intelligence,San Francisco:Morgan Kaufmann,1999.
[6] FR Iedman N,Geiger D,Goldszm IDT M.Bayesian Network Classifiers[J].Machine Learning,1997,29:131-163.
[7] Munteanu P,Bendou M.The EQ Famework for Learning Equivalence Classes of Bayesian Networks [C].Proceedings of IEEE International Conference on Data Mining,Washington DC:IEEE Computer Society,2001.
[8] Bart Baesens,Geert Verstraeten,Dirk Van den Poel,et al.Bayesian Network Classifiers for Identifying the Slope of the Customer Lifecycle of Long-life Customers [J].European Journal of Operational Research,2004,156(2):508-523.
[9] 李旭升,郭耀煌.靈活的增強樸素貝葉斯分類器[J].信息與控制,2007,36(6):690-695.
[10] 孫笑微,趙大宇,李曉毅,等.基于數據挖掘的TAN分類器的研究與應用 [J]. 計算機技術與發(fā)展,2006,11(16):140-142.
[11] 蔡志強,孫樹棟,Yannou Bernard,等.基于貝葉斯網絡分類器的產品故障率分類研究[J].計算機應用研究,2009,26(9):3307-3309.