周旖鋆,武 凱,孫 宇,楊曉燕,樓曉華
(1.南京理工大學(xué)機(jī)械工程學(xué)院 南京,210094) (2.南通四方科技集團(tuán)股份有限公司 南通,226300)
制冷設(shè)備幾種故障同時(shí)發(fā)生時(shí),各單發(fā)故障間會(huì)相互影響、相互誘導(dǎo)、相互耦合,增加故障診斷系統(tǒng)的誤報(bào)率和漏報(bào)率。因此,開展制冷設(shè)備并發(fā)故障的診斷具有重要的應(yīng)用價(jià)值。Macalister等[1]基于圖論建立了制冷設(shè)備的故障診斷模型,但這種模型面對(duì)較為復(fù)雜的系統(tǒng)時(shí)可能給出無(wú)效診斷結(jié)果。Salvatore等[2]將專家經(jīng)驗(yàn)的知識(shí)庫(kù)與推理機(jī)制相結(jié)合對(duì)制冷設(shè)備故障進(jìn)行診斷,但這類方法推理過程中存在匹配沖突等問題。Flore等[3]基于主元分析方法在制冷設(shè)備故障檢測(cè)中建立主元模型,通過對(duì)比測(cè)量數(shù)據(jù)與正常數(shù)據(jù)的統(tǒng)計(jì)量判斷制冷設(shè)備是否發(fā)生故障,然而這種診斷方法只能執(zhí)行單一故障診斷。Kumar[4]基于指定元分析(designated cell analysis,簡(jiǎn)稱DCA)方法對(duì)制冷系統(tǒng)故障進(jìn)行了診斷,但由于DCA方法僅在各特征向量相互正交的情況適用,因此當(dāng)用于并發(fā)故障診斷時(shí),診斷結(jié)果不夠準(zhǔn)確。韓 華 等[5]把 支 持 向 量 機(jī)(support vector machines,簡(jiǎn)稱SVM)模型用于制冷設(shè)備故障診斷研究并得到了較為準(zhǔn)確的診斷結(jié)果。
為準(zhǔn)確檢測(cè)出制冷設(shè)備的并發(fā)故障,提出一種基于數(shù)據(jù)挖掘與信息融合的并發(fā)故障診斷方法。首先,采集設(shè)備正常工況數(shù)據(jù)和各類單發(fā)故障與并發(fā)故障下的數(shù)據(jù),并分別建立指定元分析模型和支持向量機(jī)模型,為了使指定元分析方法適用于非正交模式,對(duì)原來的算法進(jìn)行改良,提出非完全正交指定元分析方法(non-fully orthogonal designated cell analysis,簡(jiǎn)稱NFODCA);其次,采用上述兩種數(shù)據(jù)挖掘方法診斷制冷設(shè)備故障并進(jìn)行實(shí)驗(yàn)驗(yàn)證;最后,采用加權(quán)證據(jù)理論對(duì)兩種方法的診斷結(jié)果進(jìn)行信息融合以提高診斷結(jié)果的可信度。
制冷設(shè)備可能產(chǎn)生的故障類型較多,根據(jù)經(jīng)驗(yàn)知識(shí)對(duì)制冷系統(tǒng)的工作原理進(jìn)入深入分析后,選取了6類較為典型的單發(fā)故障,通過故障隨機(jī)組合形成并發(fā)故障進(jìn)行研究,所選取的6類典型故障如下:①壓縮機(jī)的吸排氣閥片受損,當(dāng)這類故障發(fā)生時(shí),壓縮機(jī)的實(shí)際輸氣量下降,制冷效果降低;②制冷劑不足,制冷劑短缺的原因通常有兩個(gè),一種是制冷劑在出廠前充注不足,另一種是由于閥門或焊點(diǎn)松動(dòng)導(dǎo)致的制冷劑泄漏;③循環(huán)水泵不轉(zhuǎn),這種故障會(huì)造成壓縮機(jī)吸排氣溫度迅速上升,同時(shí)冷凝器的冷卻效果也會(huì)急劇下降;④冷卻水的流量太小,冷卻塔的水垢太大或冷卻塔內(nèi)部布置不當(dāng)可能導(dǎo)致冷卻水流量太??;⑤膨脹閥開度過小,當(dāng)這種故障發(fā)生時(shí)會(huì)造成制冷設(shè)備循環(huán)的制冷劑不足;⑥過濾器堵塞,過濾網(wǎng)用于過濾灰塵和金屬碎屑等,使用時(shí)間過長(zhǎng)易被堵住。
實(shí)驗(yàn)對(duì)象為一臺(tái)需配冷量為55 kW的制冷機(jī)組,在原有設(shè)備基礎(chǔ)上引入制冷設(shè)備故障模擬及參數(shù)測(cè)試組件,通過實(shí)驗(yàn)采集故障數(shù)據(jù)。各故障的實(shí)現(xiàn)方法如下:①壓縮機(jī)吸排氣閥片損壞,在壓縮機(jī)吸、排氣管路之間設(shè)旁通通路,并安裝針閥或計(jì)量閥作為旁通量調(diào)節(jié)裝置;②制冷劑不足,先將系統(tǒng)抽真空,然后通過逐步加注實(shí)現(xiàn)不同程度制冷劑不足的故障模擬;③循環(huán)水泵不轉(zhuǎn),斷開水泵控制電路即可模擬循環(huán)水泵不轉(zhuǎn)的故障;④冷卻水流量過小,降低旁通流量或減少冷卻水閘閥開度均可改變冷卻水量;⑤膨脹閥開度過小,將手動(dòng)調(diào)節(jié)閥置于電磁閥與蒸發(fā)器之間以模擬膨脹閥開度過小;⑥過濾器堵塞,將一定比例的濾網(wǎng)面積用均布孔洞的厚紙擋住可以模擬過濾器堵塞引起的故障。故障模擬及參數(shù)測(cè)試組件安裝位置如圖1所示。
圖1 故障模擬及參數(shù)測(cè)試組件安裝位置Fig.1 Fault simulation and parameter test component installation location
由于NFODCA模型在建立時(shí)無(wú)需并發(fā)故障數(shù)據(jù)作為訓(xùn)練集,僅在驗(yàn)證模型階段需要并發(fā)故障的數(shù)據(jù)。因此,將2/3的單發(fā)故障數(shù)據(jù)和2/3正常工況數(shù)據(jù)作為訓(xùn)練集用于模型建立,將并發(fā)故障數(shù)據(jù)、剩下的1/3類單發(fā)故障數(shù)據(jù)和1/3正常工況數(shù)據(jù)作為測(cè)試集用于模型驗(yàn)證。
制冷設(shè)備的故障現(xiàn)象、故障原因之間的關(guān)系可以用故障征兆集描述,征兆用測(cè)量值與標(biāo)稱值的偏差度表示。根據(jù)實(shí)際運(yùn)行經(jīng)驗(yàn)和論證分析,在制冷設(shè)備系統(tǒng)運(yùn)行過程中對(duì)壓縮機(jī)吸氣壓力上升、冷凝器進(jìn)口溫度上升等12種征兆進(jìn)行監(jiān)測(cè),則每種征兆u(yù)r(r=1,2,…,12)可表示為
將故障種類的數(shù)目記為s,則s種故障Ds可定義為論域U中的6種指定模式
其中
選取6種單發(fā)故障:壓縮機(jī)吸排氣閥片損壞d1、制冷劑不足d2、循環(huán)水泵不轉(zhuǎn)d3、冷卻水流量過小d4、膨脹閥開度過小d5、過濾器堵塞d6;2種單發(fā)故障組合成的7類并發(fā)故障:d7=d1+d3,d8=d1+d6,d9=d2+d5,d10=d3+d4,d11=d3+d6,d12=d4+d5,d13=d5+d6;3種 單 發(fā) 故 障 組 合 而成的3類并發(fā)故障d14=d1+d2+d4,d15=d3+d4+d6,d16=d4+d5+d6共 計(jì)16種 故 障 和 正 常工況進(jìn)行實(shí)驗(yàn)數(shù)據(jù)采集。以上故障類型根據(jù)經(jīng)驗(yàn)知識(shí)結(jié)合實(shí)際工況選出,其他類型的單發(fā)故障及其他組合形成的并發(fā)故障也可采用文中所述的研究方法。
把故障征兆定義為壓縮機(jī)排氣壓力上升u1、下降u2,壓縮機(jī)吸氣壓力上升u3、下降u4,壓縮機(jī)排氣溫度上升u5、下降u6,壓縮機(jī)吸氣溫度上升u7、下降u8,冷凝器出口溫度上升u9、下降u10,過濾器溫度上升u11、下降u12,分析實(shí)驗(yàn)結(jié)果可得故障與征兆間關(guān)系如表1所示。
表1 制冷裝置故障與征兆間關(guān)系Tab.1 The relationship between faults and symptoms of this quick freezing device
由表1可知,按照式(2)定義的故障模式并非全部正交,例如:發(fā)生壓縮機(jī)吸氣閥片損壞時(shí)會(huì)導(dǎo)致壓縮機(jī)吸氣壓力下降,而發(fā)生循環(huán)水泵不轉(zhuǎn)的故障時(shí)會(huì)間接導(dǎo)致壓縮機(jī)吸氣壓力上升;當(dāng)這兩種故障同時(shí)發(fā)生時(shí),二者的故障特征會(huì)相互影響甚至抵消,而傳統(tǒng)指定元分析算法僅在正交模式下適用;這兩種不相互正交的故障同時(shí)發(fā)生時(shí),將造成故障漏報(bào)。所以對(duì)傳統(tǒng)指定元分析方法進(jìn)行改良,使之適用于非完全正交模式。
當(dāng)樣本數(shù)據(jù)Y處于完全正交模式時(shí),Y具有指定元的分解式[6]
其中:Y由正常子空間和故障子空間組成;di為正交指定模式;wi為相應(yīng)指定元。
當(dāng)Y處于非完全正交模式時(shí)可以表示為
其中:E為殘差空間。
以EET最小為原則將指定模式集劃分為m個(gè)組內(nèi)正交的子集,樣本數(shù)據(jù)Y就可以表示為組內(nèi)正交子集與殘差陣的和
各子集指定元顯著性可用式(7)計(jì)算得出
在指定模式di所表示方向上用式(8)將樣本數(shù)據(jù)Y做投影,即可得到相應(yīng)的指定元wi
其中:n為樣本數(shù)量。
例如:[y11,y21,…,ym1]T表示第1組樣本數(shù)據(jù)第m個(gè)指定模式下的特征向量。計(jì)算得到的win表示第i個(gè)指定元下第n個(gè)樣本所對(duì)應(yīng)的映射值,組成如下的特征向量
最后,根據(jù)正常工況下的數(shù)據(jù)計(jì)算出每個(gè)指定元對(duì)應(yīng)特征值的控制上下限并得到Shewhart圖,若圖中特征值超過了控制限,則認(rèn)為制冷設(shè)備發(fā)生了相應(yīng)故障。
從測(cè)試集中隨機(jī)選取實(shí)驗(yàn)數(shù)據(jù),用NFODCA模型進(jìn)行故障診斷,并將診斷結(jié)果與故障模擬實(shí)驗(yàn)所采集數(shù)據(jù)的故障記錄對(duì)比,驗(yàn)證模型的可靠性。
根據(jù)表1中的制冷裝置故障與征兆間關(guān)系和EET最小原則,將非完全正交的模式集D={d1,d2,…,d6}表示成3組組內(nèi)正交的模式子集,根據(jù)式(6),樣本數(shù)據(jù)Y可以表示為
即當(dāng)非完全正交模式集D劃分為3個(gè)組內(nèi)相互正交的模式子集時(shí),Y可由各投影空間完全表示。
隨機(jī)選取一組實(shí)驗(yàn)數(shù)據(jù),分別關(guān)于D1,D2,D3做指定元分析,根據(jù)式(7)計(jì)算出該組數(shù)據(jù)對(duì)應(yīng)的各個(gè)指定模式的顯著性如表2所示。
表2 對(duì)應(yīng)各指定模式的顯著性Tab.2 Corresponding to the saliency of each desig?nated mode
從表2可以看出,該組數(shù)據(jù)對(duì)應(yīng)的6種指定模式中,d1,d4,d6對(duì)系統(tǒng)的影響較大,據(jù)此可以初步判斷系統(tǒng)中可能發(fā)生了壓縮機(jī)吸排氣閥片損壞、冷卻水流量過小、過濾器堵塞三種故障。為了進(jìn)一步驗(yàn)證該方法的合理性,根據(jù)正常工況數(shù)據(jù)在置信度為95%的條件下計(jì)算出各個(gè)指定模式d1的控制下限L1及上限U1為
將Y在所有指定元上進(jìn)行投影,根據(jù)上文計(jì)算出的控制限在圖2中給出各指定元的Shewhart圖,圖中U,L分別為控制上、下限,橫坐標(biāo)為樣本編號(hào),縱坐標(biāo)表示由式(8),(9)得出的第i個(gè)指定元下第n個(gè)樣本所對(duì)應(yīng)映射值組成的特征向量的特征值,該量無(wú)單位。
從 圖2可 以 看 出,第1,4,6個(gè) 指 定 元 的Shewhart圖在第270個(gè)采樣點(diǎn)以后超出了控制限,而第2,3,5個(gè)指定元的特征值仍穩(wěn)定在控制限以內(nèi),證明制冷設(shè)備從第270個(gè)點(diǎn)開始出現(xiàn)了d1,d4,d63種類型的故障。
將故障診斷結(jié)果與故障模擬實(shí)驗(yàn)采集數(shù)據(jù)的故障記錄對(duì)比,結(jié)果表明,診斷結(jié)果與采集數(shù)據(jù)時(shí)的記錄一致。同理可得到其他測(cè)試集數(shù)據(jù)經(jīng)NFODCA模型分析后的診斷結(jié)果,并與故障模擬實(shí)驗(yàn)采集數(shù)據(jù)的故障記錄對(duì)比,最終得出NFODCA模型的故障診斷準(zhǔn)確率為96.94%,虛警率為0.48%,證明文中提出的非完全正交指定元分析方法能準(zhǔn)確判斷制冷設(shè)備的并發(fā)故障,是一種有效的多故障診斷方法。
圖2 各指定元的Shewhart圖Fig.2 Shewhart diagram of each designated cell
考慮到SVM模型的診斷效果需要與前面的NFODCA模型對(duì)比,仍采用前面的2/3單發(fā)故障數(shù)據(jù)和2/3正常工況數(shù)據(jù)作為訓(xùn)練集,并發(fā)故障數(shù)據(jù)和剩下的1/3單發(fā)故障、1/3正常工況數(shù)據(jù)作為測(cè)試集。通過對(duì)訓(xùn)練集進(jìn)行訓(xùn)練,優(yōu)化SVM參數(shù),建立模型,并用測(cè)試集數(shù)據(jù)驗(yàn)證SVM模型的可靠性。
SVM的主要參數(shù)包含懲罰參數(shù)c以及核函數(shù)參數(shù)g,通常對(duì)于這兩個(gè)參數(shù)的選擇是經(jīng)過大量的實(shí)驗(yàn)分析得出的[7],耗時(shí)耗力。為了快速得到最佳的參數(shù)c和g,使SVM的分類效果更好,采用網(wǎng)格尋優(yōu)和K-折交叉驗(yàn)證方法。網(wǎng)格尋優(yōu)即先在一定范圍上粗略選擇找出c和g,然后在c,g周圍進(jìn)行參數(shù)的精細(xì)選擇[8]。K-折交叉驗(yàn)證方法的主要參數(shù)為折疊次數(shù)K,文中取K=5,即5折交叉驗(yàn)證方法。首先把制冷設(shè)備的數(shù)據(jù)樣本分類成5組子集,將前4組樣本作為訓(xùn)練集,最后1組樣本用于測(cè)試,然后循環(huán)4次,每次都得出一個(gè)均方誤差(mean square error,簡(jiǎn)稱MSE)。將數(shù)據(jù)進(jìn)行5次訓(xùn)練,且每次訓(xùn)練后將得到的數(shù)據(jù)進(jìn)行整理分析,然后將5次的MSE取平均值。最后以MSE最小原則選取c值和g值作為SVM建模的最優(yōu)參數(shù)[9]。
根據(jù)前面得出的最優(yōu)參數(shù),按照分而治之的原則,總故障樣本集Y首先按d1故障分為正樣本(含有d1故障樣本)Fd1和負(fù)樣本(不含d1的故障樣本)FNd1,然后對(duì)這個(gè)二值分類問題建立SVM-d1分類器[10];同理,再將Y分別按故障d2,d3,d4,d5,d6建立二值分類器。如果Y由多個(gè)分類器診斷為包含故障,則根據(jù)表決原則,判定故障樣本Y包含多個(gè)故障[11]。
假設(shè)樣本數(shù)據(jù)Y為含有d2,d3故障的數(shù)據(jù),首先用SVM-d1分類器對(duì)其進(jìn)行診斷,Y通過診斷表現(xiàn)為不含d1故障,則其決策函數(shù)R1可以定義為0;然后將Y用SVM-d2分類器診斷,Y通過診斷表現(xiàn)含有d2故障,則其決策函數(shù)R2可以定義為1;同理得到?jīng)Q策函數(shù)R3,R4,R5,R6的值。這樣診斷下來綜合的評(píng)定決策函數(shù)R表現(xiàn)為0/1/1/0/0/0,由此可以得到此時(shí)的故障Y同時(shí)含有d2,d3故障,同理可以得到其他各類故障所對(duì)應(yīng)的決策函數(shù)。
首先找出SVM的主要參數(shù)即懲罰參數(shù)c和核函數(shù)參數(shù)g,SVM模型在數(shù)據(jù)處理過程中自動(dòng)選擇了參數(shù)c=10,g=0.1,這是隨機(jī)得到的結(jié)果,具有主觀性。因此通過網(wǎng)格尋優(yōu)的方法優(yōu)化參數(shù),圖3為參數(shù)c和g的粗略優(yōu)化和精細(xì)優(yōu)化過程,橫坐標(biāo)表示log2c的范圍,縱坐標(biāo)表示log2g的范圍,均無(wú)量綱。
圖3 參數(shù)粗略和精細(xì)優(yōu)化過程Fig.3 Rough and fine optimization of parameters
圖3 (a)為參數(shù)c和g的粗略優(yōu)化過程:在2-8~28中 粗 略 得 出c=8.031 4,g=4.358 97,MSE=0.109 92,粗略確定了c和g的數(shù)據(jù)范圍;圖3(b)為精細(xì)優(yōu)化過程:縮小范圍在2-4~24中查找c和g,最后 得到最 優(yōu)的c和g為cb=6.062 9,gb=2.297 4,并將其作為SVM此次運(yùn)算的參數(shù)。使用5折交叉驗(yàn)證方法對(duì)并發(fā)故障進(jìn)行診斷,并將故障診斷加過與故障模擬實(shí)驗(yàn)采集數(shù)據(jù)的故障記錄對(duì)比得出故障命中率和虛警率。表3對(duì)比了5折交叉驗(yàn)證下經(jīng)網(wǎng)格優(yōu)化后使用的參數(shù)優(yōu)化前后對(duì)并發(fā)故障的診斷結(jié)果。
由表3可知,選擇默認(rèn)設(shè)置(c=10,g=0.1)時(shí),制冷設(shè)備故障診斷的平均正確率為46.75%,MSE平均值為0.634;而使用優(yōu)化得到的參數(shù)(c=6.062 9,g=2.297 4)后,制冷設(shè)備故障診斷的正確率有了明顯提高,而且每個(gè)折次下都有較高的正確率,平均正確率達(dá)到了96.80%,MSE平均值為0.027,證明該SVM模型對(duì)制冷設(shè)備故障診斷具有較高的準(zhǔn)確率。
表3 5折交叉驗(yàn)證下參數(shù)優(yōu)化前后故障診斷結(jié)果Tab.3 Fault diagnosis results before and after pa?rameter optimization under 5-fold cross vali?dation
將測(cè)試集數(shù)據(jù)分別用支持向量機(jī)(SVM)模型和非完全正交指定元分析(NFODCA)模型診斷,各類故障命中率和虛警率對(duì)比如表4所示。
由表4可見,非完全正交指定元分析(NFODCA)和支持向量機(jī)(SVM)兩種模型對(duì)制冷設(shè)備的故障均有較高的準(zhǔn)確率,且兩種方法對(duì)不同故障識(shí)別度不同,各自在不同類型故障的識(shí)別有一定優(yōu)勢(shì)。
對(duì)于制冷裝置的并發(fā)故障診斷,如果只采用單一的診斷結(jié)論,極易造成誤診。前面分別從非完全正交指定元分析(NFODCA)和支持向量機(jī)(SVM)兩種模型研究了制冷設(shè)備的并發(fā)故障,如果采用多專家集成診斷的方式,將不同方法的診斷結(jié)論進(jìn)行融合決策,那么將會(huì)大大提高制冷設(shè)備故障診斷結(jié)論的準(zhǔn)確性和全面性[12]。
文獻(xiàn)[13]證明基于加權(quán)證據(jù)理論融合具有較好的聚焦能力,因此采用該方法對(duì)非完全正交指定元分析(NFODCA)和支持向量機(jī)(SVM)兩種模型的診斷結(jié)果進(jìn)行信息融合。將訓(xùn)練集中的每組數(shù)據(jù)視為一個(gè)證據(jù)組,將16種不同類型的制冷設(shè)備故障定義為一個(gè)空間Θ{F1,F(xiàn)2,…,F(xiàn)16}作為辨識(shí)框架,Θ是由相互排斥的命題組成的有限完備集。2Θ為Θ的冪集,表示Θ所有子集的集合。在2Θ上定義基本概率分配函數(shù)m:2Θ?[0,1],m滿足下列條件
表4 SVM和NFODCA模型對(duì)各類故障命中率和虛警率對(duì)比Tab.4 Comparison of SVM and NFODCA models for various failure hit ratios and false alarm rates %
筆者采用了兩種故障診斷方法,診斷結(jié)果中有兩種待組合證據(jù)體E1,E2,對(duì)應(yīng)基本概率分配函數(shù)分別為m1,m2,對(duì)應(yīng)焦元分別為Ai,Bj,Ai,Bj的公共焦元為Cl,m1,m2之間的沖突程度系數(shù)為K。根據(jù)不同證據(jù)源的可靠程度分配權(quán)重系數(shù),對(duì)相應(yīng)故障敏感度較高的證據(jù)源賦以較高的權(quán)值,另一個(gè)模型賦以較低的權(quán)值,具體權(quán)值由多次實(shí)驗(yàn)后對(duì)比平均命中率和虛警率擇優(yōu)選出[14]。設(shè)E1,E2的權(quán)重系數(shù)分別為w1,w2,滿足w1+w2=1,定義N個(gè)證據(jù)源對(duì)焦元的平均支持程度為
因此,加權(quán)證據(jù)理論融合公式為
將NFODCA與SVM模型的證據(jù)體經(jīng)上述方法融合后得到的故障診斷結(jié)果與故障模擬實(shí)驗(yàn)采集數(shù)據(jù)的故障記錄對(duì)比,得出故障診斷命中率和虛警率如表5所示。由表5可以看出,制冷設(shè)備的故障識(shí)別結(jié)果經(jīng)加權(quán)證據(jù)理論信息融合后更為精確,平均命中率達(dá)到了99.10%,平均虛警率降低至0.21%。
表5 信息融合后各類故障命中率和虛警率Tab.5 Hit rate and false alarm rate of various faults after information fusion %
1)非完全指定元分析(NFODCA)和支持向量機(jī)(SVM)兩種數(shù)據(jù)挖掘方法在訓(xùn)練集無(wú)并發(fā)故障數(shù)據(jù),僅在測(cè)試集中包含并發(fā)故障數(shù)據(jù)的條件下對(duì)制冷設(shè)備的故障診斷均有較高的準(zhǔn)確率,表明這兩種方法均具有對(duì)未知并發(fā)故障類型進(jìn)行判斷的能力。其中非完全正交指定元分析(NFODCA)的平均命中率達(dá)到了96.94%,平均虛警率為0.48%;支持向量機(jī)(SVM)的平均命中率達(dá)到了96.80%,平均虛警率為0.50%。這兩種方法對(duì)不同故障識(shí)別度不同,各自在不同類型故障的識(shí)別有一定優(yōu)勢(shì)。
2)非完全正交指定元分析(NFODCA)和支持向量機(jī)(SVM)兩種方法的故障識(shí)別結(jié)果經(jīng)加權(quán)證據(jù)理論信息融合后,平均命中率提高了2.23%,平均虛警率降低了0.28%。說明這兩種數(shù)據(jù)挖掘方法和信息融合技術(shù)結(jié)合應(yīng)用后可以對(duì)制冷設(shè)備的并發(fā)故障得到更為準(zhǔn)確的判斷。