劉 倩 李正飛 丁新磊 陳煥新 王譽舟 徐 暢
(華中科技大學能源與動力工程學院 武漢 430074)
公共建筑中暖通空調系統(tǒng)的運行能耗約占建筑能耗的60%[1],而由于暖通空調系統(tǒng)性能下降及故障造成的能源浪費約占商業(yè)建筑總能耗的15%~30%。多聯(lián)機空調系統(tǒng)相比于傳統(tǒng)的中央空調系統(tǒng),具有節(jié)能、控制先進等優(yōu)點[2],自90年代引入我國后,得到了迅速發(fā)展。由于多聯(lián)機系統(tǒng)管路復雜繁瑣、運行工況多變,經(jīng)常會發(fā)生各類故障,如四通閥故障、制冷劑泄漏、電子膨脹閥卡死和泄漏、冷凝器臟污等。一旦發(fā)生故障,不僅會破壞空調系統(tǒng)的正常使用,降低用戶使用舒適度,還會因故障的發(fā)生造成不必要的能源浪費[3-6]。
針對多聯(lián)機系統(tǒng)常見典型故障,本文選擇3種會引起較大損失的故障進行研究,即四通閥故障、電子膨脹閥故障、制冷劑充注量故障。四通閥可以調節(jié)制冷劑流向,從而實現(xiàn)制熱制冷運行模式的自由切換,若發(fā)生故障將不能滿足系統(tǒng)不同季節(jié)、不同功能房間的制冷制熱需求;電子膨脹閥為系統(tǒng)的節(jié)流部件,發(fā)生故障后會影響室內(nèi)機制冷劑流量的分配,使系統(tǒng)無法滿足不同負荷下室內(nèi)的舒適度要求;制冷劑作為制冷系統(tǒng)內(nèi)部的傳熱介質,過少或過充都會影響系統(tǒng)內(nèi)部的阻力特性和換熱特性,并最終影響系統(tǒng)的制冷循環(huán)性能。及時發(fā)現(xiàn)故障,并完成故障類型識別和故障細化診斷,有助于及時修復系統(tǒng),避免持續(xù)不必要的能量損耗。
針對暖通空調系統(tǒng)的故障檢測和診斷的研究相對于信息行業(yè)等起步較晚,但目前也逐步發(fā)展起來,隨著大數(shù)據(jù)時代的到來,基于數(shù)據(jù)挖掘的故障診斷方法也逐漸應用于暖通空調領域[7-11]。N.Kocyigit[12]利用模糊推理系統(tǒng)和人工神經(jīng)網(wǎng)絡對某蒸氣壓縮制冷實驗裝置進行故障診斷,可有效診斷該系統(tǒng)中的8類故障。S.A.Tassou等[13]設計了一種基于人工智能和實時性能檢測的制冷劑泄漏故障診斷與檢測系統(tǒng),可有效區(qū)分制冷劑充注量的穩(wěn)態(tài)、過充和泄漏的狀態(tài)發(fā)生。Han Hua等[14]針對制冷劑充注量泄漏、過充以及系統(tǒng)級別的機油過量診斷問題,提出一種經(jīng)交叉驗證優(yōu)化的最小二乘支持向量機(LS-SVM)模型,相比于未優(yōu)化的單類算法模型具有更優(yōu)良的性能。M.Stylianou[15]提出一種采用統(tǒng)計模式識別算法的診斷模型,可診斷冷水機組的4種故障類型。石書彪等[16]建立了神經(jīng)網(wǎng)絡模型,針對冷水機組不同工況下不同程度的7種典型故障進行檢測和診斷,并進行優(yōu)化提高診斷正確率。
上述研究表明,現(xiàn)階段針對多聯(lián)機系統(tǒng)的故障檢測與診斷研究多是側重于系統(tǒng)的典型故障[17-18]或單一故障,對于系統(tǒng)關鍵部件的故障研究還不夠深入。此外,對于多類故障診斷的研究,也未能實現(xiàn)對各類故障進行進一步的細化診斷。故針對上述問題,本文提出一種基于線性判別分析和隨機森林的多故障診斷策略,可以在完成故障類型識別后,進一步對各類故障中不同的故障表現(xiàn)形式實現(xiàn)細化診斷。
(1)
(2)
若原始數(shù)據(jù)集的類別數(shù)為N,而轉換矩陣W是運用拉格朗日乘子法Sc-1SbW=λW進行特征值求解得到的,W∈Rd×(N-1),其秩為N-1,所以降維后有效特征個數(shù)不會大于N-1。
1)計算每一類別特征的均值向量;
2)分別計算各類內(nèi)散布矩陣Sc和類間散布矩陣Sb;
3)計算矩陣Sb/Sc的特征值及對應的特征向量;
4)選取前k個特征值所對應的特征向量,構造一個k維的轉換矩陣W;
5)將原樣本通過轉換矩陣映射到新的特征空間,其維度為k。
若原始數(shù)據(jù)集的類別數(shù)為N,而轉換矩陣W是由Sc-1SbW=λW進行特征值求解得到的,其秩為N-1,所以降維后有效特征個數(shù)不會大于N-1。
隨機森林(random forest,RF)是一種以決策樹(decision tree,DT)作為基分類器的集成學習算法[20]?!半S機”體現(xiàn)在兩個方面,一是隨機選取樣本,二是隨機選取特征,例如一個集合含有S個樣本,M個特征。森林中的每棵樹都有放回的隨機抽取部分樣本作為訓練樣本,并有放回的隨機選取m0(m0≤M)個特征作為這棵樹的分枝依據(jù)。此方法可以構建出多棵樹,而最終結果是綜合“森林”中所有“樹”的結果得到的,而且森林中的樹不斷通過選用更好的特征進行分枝,從而使性能更優(yōu)良。隨機森林算法的具體實現(xiàn)過程如下:
1)原始數(shù)據(jù)集S個樣本應用bootstrap有放回地隨機抽取K個新的自助樣本集,并由此構建K棵分類樹,每次未被抽取到的樣本組成了袋外數(shù)據(jù);
2)設有M個特征,則在每一棵樹的每個節(jié)點處隨機抽取m0個特征,然后在m0中選擇一個最具有分類能力的特征,變量分類的閾值通過檢查每一個分類點確定;
3)每棵樹完全生長,不做修剪;
4)用生成的隨機森林分類器對新的數(shù)據(jù)進行判別,分類結果按照投票結果確定。
實驗使用一臺額定制冷量為28 kW,制冷劑為R410A的“一拖五”多聯(lián)機系統(tǒng),如圖1所示。該系統(tǒng)主要由壓縮機、電子膨脹閥、室外機、室內(nèi)機等四大基本部件組成。其標稱制冷劑充注量為9.9 kg。多聯(lián)機系統(tǒng)采用密封渦旋壓縮機,系統(tǒng)中設置有多個傳感器,用來測量壓力和溫度等,部分測點已在圖1中標出。
圖1 實驗多聯(lián)機系統(tǒng)
實驗中設有故障實驗和正常實驗,運行工況分為制冷和制熱工況,共包括已知故障3種,通過人為引入故障的方式使系統(tǒng)進行故障運行。電子膨脹閥分為卡死故障和泄漏故障,電子膨脹閥的開度大小定義為當前開度除以最大開度的百分比,對于電子膨脹閥卡死故障實驗,將運行中的內(nèi)機的開度固定在0或100%,對于電子膨脹閥泄漏故障實驗,將關機的一臺內(nèi)機開度設定為50%,這樣電子膨脹閥的開度不再隨著負荷的變化而自動調整;對于四通閥故障,將驅動換向閥的驅動電機人為掉電或人為損壞四通閥以模擬四通閥故障,這樣換向閥就不能再有效改變制冷劑的流動方向;為了獲得制冷劑充注量不足和過量實驗數(shù)據(jù),人為將制冷劑充注量水平充注為標準制冷劑充注量的一定百分比。針對不同的故障設計相關實驗,記錄當前工況下的所有數(shù)據(jù),并從中選取18個特征變量的數(shù)據(jù),具體如表1所示。其中,目標運行能力是指多聯(lián)機機組在當下運行工況下理論上可以提供的制冷能力,本機運行能力=(目標運行能力/系統(tǒng)總運行能力)×100%。
表1 特征變量及其符號
具體故障類型及樣本數(shù)量匯總于表2中。正常工況、四通閥故障、電子膨脹閥故障及制冷劑充注量故障的故障類型標簽分別為L0、L1、L2、L3,并對3類故障的故障類型進行詳細劃分。故障細化后標簽如表2所示。實驗采集了3 d的所有運行數(shù)據(jù),每間隔3 s采集一次數(shù)據(jù),共獲取156 068組數(shù)據(jù),各類故障樣本容量足夠,為故障診斷模型的建立提供保障。
表2 故障標簽及樣本數(shù)量
故障數(shù)據(jù)種類繁多,在實際運行過程中,樣本中含有部分異常值,因此,首先需要將樣本集中的異常值進行剔除,以進一步提高模型診斷可靠性。其次,由于多個變量之間的量綱不一,其差異會對后續(xù)的故障診斷產(chǎn)生影響,故需要用到數(shù)據(jù)標準化消除該差異。本實驗采取對數(shù)據(jù)進行最大最小歸一化處理。
本文提出的多聯(lián)機系統(tǒng)多類故障檢測和診斷策略結合了線性判別分析和隨機森林算法,流程圖如圖2所示,除完成原始數(shù)據(jù)采集和預處理外,該策略主要包括兩個部分,一是故障類型識別模型的訓練和測試,二是單類故障細化診斷模型的訓練和測試。具體流程為:
圖2 多聯(lián)機系統(tǒng)多類故障診斷策略流程圖
1)通過設置實驗系統(tǒng)操作參數(shù)使多聯(lián)機系統(tǒng)處于正常、四通閥故障、電子膨脹閥故障、制冷劑充注量故障狀態(tài),并借助溫度、壓力傳感器等采集原始數(shù)據(jù);
2)原始實驗數(shù)據(jù)剔除異常值,并進行最大最小歸一化預處理;
3)將原始數(shù)據(jù)集按照7∶3劃分為訓練集A和測試集B;并將劃分出的訓練集A按照故障類型劃分為四通閥故障集a、電子膨脹閥故障集b、制冷劑充注故障集c;
4)設置隨機森林模型的參數(shù)值,利用訓練集建立故障類型識別RF模型;
5)對訓練集a、b、c使用線性判別分析進行降維處理,提取關鍵特征向量;
6)利用降維后的訓練集,建立針對3種故障類型的故障細化診斷模型a、b、c;
7)將測試集B輸入至訓練好的RF模型中,輸出故障類型識別結果;
8)將上一步識別出故障類型的樣本輸入至對應的故障細化診斷模型中,實現(xiàn)對各類故障中不同故障表現(xiàn)形式的細化診斷。
本文結合線性判別分析和隨機森林進行多聯(lián)機系統(tǒng)多類別故障診斷,首先通過建立的隨機森林模型完成故障類型識別,然后根據(jù)故障類型識別的結果,自適應的輸入不同的故障細化診斷模型中進行下一步診斷。
實驗所采集的原始數(shù)據(jù)集經(jīng)過預處理后按照7∶3的比例劃分為訓練集A和測試集B,訓練集A用來訓練出故障類型識別模型,測試集B對該模型診斷性能進行檢驗測試。測試集輸入故障類型識別模型時,整體的故障類型識別準確率達到99.99%,可見識別錯誤的樣本數(shù)極少。為便于觀察故障類型識別結果的樣本分布,進一步對結果進行了可視化,如圖3所示。由圖3可知,正常運行工況、電子膨脹閥故障及四通閥故障均能全部正確識別,而制冷劑充注量故障的27 335個測試樣本中僅有4個樣本被錯誤識別為正常樣本,這表明隨機森林模型據(jù)不同類型故障數(shù)據(jù)的差異,學習到極好的分類規(guī)則,進而實現(xiàn)故障類型識別。該模型在測試集上幾乎可完全準確的識別3類故障及正常運行樣本數(shù)據(jù),具有良好的故障識別能力及魯棒性。
圖3 測試集故障類型識別結果樣本分布
故障類型識別模型能較好的識別這3類故障是因為3類故障間的差異性顯著[21],四通閥故障為室外機故障,電子膨脹閥故障為室內(nèi)機故障,而制冷劑充注故障為系統(tǒng)故障。多聯(lián)機系統(tǒng)在進行制冷、制熱模式切換時發(fā)生四通閥故障,制冷劑流向偏離預期流向,會對系統(tǒng)冷凝壓力、壓縮機吸氣溫度及排氣溫度等產(chǎn)生顯著影響;電子膨脹閥通過調節(jié)制冷劑流量控制內(nèi)機負荷,發(fā)生故障主要對故障室內(nèi)機參數(shù)產(chǎn)生影響,但由于該故障會影響不同流向的制冷劑流量,所以系統(tǒng)的冷凝壓力及蒸發(fā)壓力等參數(shù)也會發(fā)生變化;制冷劑過充或不足會顯著影響系統(tǒng)內(nèi)制冷劑溫度的大小,如壓縮機排氣/吸氣溫度,氣液分離器進管/出管溫度等參數(shù)均會有所變動。
該多聯(lián)機系統(tǒng)監(jiān)測了數(shù)個變量,根據(jù)以往的實驗和研究,最終選擇了包括室外環(huán)境溫度在內(nèi)的18個變量,即原始數(shù)據(jù)的輸入為18維。對于不同類型的故障,反映其狀態(tài)的最優(yōu)特征向量之間存在差異,所以在經(jīng)過故障類型識別后,可以對不同類型的故障進行LDA特征提取,選取對應的最優(yōu)特征維數(shù)。LDA是一種特征抽取方式,通過線性的特征抽取所生成的新特征進行數(shù)據(jù)降維,使得原始數(shù)據(jù)映射到低維空間,而生成的新特征不再具有物理意義。
本文根據(jù)單個特征對故障診斷的貢獻率和多個特征對故障診斷的累計貢獻率選取特征參數(shù)和特征空間維度。單個特征區(qū)分貢獻率是指單個所選投影向量對應的特征值占所有特征值之和的比例,特征值反映對應的特征向量的重要程度;累計區(qū)分貢獻率是指所選全部投影特征向量對應的特征值之和占所有特征值之和的比例。從訓練集A中劃分出3類故障集a、b、c,并作為3類故障細化診斷模型的訓練集。根據(jù)原理中提到的,LDA降維最多降至類別數(shù)k-1的維數(shù),而四通閥故障詳細劃分為四通閥掉電和失效兩類,是典型的二分類問題,利用LDA進行降維只能保留一個特征向量,即唯一保留一個特征向量,其對故障區(qū)分貢獻率為100%。此外,對電子膨脹閥故障、制冷劑充注故障進行LDA特征抽取,并觀測這兩類故障在其對應的訓練集上的單個特征區(qū)分貢獻率及累計區(qū)分貢獻率,結果如圖4所示。
圖4 兩類故障訓練集LAD降維單個特征區(qū)分貢獻率及累計區(qū)分貢獻率
電子膨脹閥故障含有泄漏、全開卡死及全閉卡死3種故障形式,利用LDA進行數(shù)據(jù)降維最大可降至2維,保留兩個特征向量,第一特征向量區(qū)分貢獻率為93.14%,第二特征向量的區(qū)分貢獻率為6.86%,累計可達100%;制冷劑充注故障被劃分為4個充注水平,利用LDA進行數(shù)據(jù)降維最大可保留3個特征向量,第一特征向量的區(qū)分貢獻率為87.82%,第二特征向量的區(qū)分貢獻率為9.97%,而第三特征向量的區(qū)分貢獻率僅有2.21%,累計可達100%。對于上述兩種故障,第一特征均對故障區(qū)分具有最大貢獻,而后面的特征對故障區(qū)分的貢獻相對較小,但仍能在一定程度上提高故障的診斷性能。為獲得診斷性能及魯棒性更好的故障細化診斷模型,電子膨脹閥故障診斷模型保留兩個特征,制冷劑充注故障診斷模型保留3個特征。
由于隨機森林本身可以對數(shù)據(jù)集進行特征重要性排序和特征選擇,經(jīng)過計算,若是保留和LDA降維處理后相同的維數(shù),四通閥故障訓練集a中第一特征為化霜溫度;電子膨脹閥故障訓練集b第一、第二特征分別為模塊低壓(蒸發(fā)壓力)、氣液分離器進管溫度;制冷劑充注故障訓練集c第一、第二、第三特征分別為模塊高壓(冷凝壓力)、氣液分離器出管溫度和EXV開度。在保留相同維度,隨機森林模型參數(shù)一致的條件下,兩種特征選擇方式下訓練集上故障細化診斷正確率如圖5所示。由圖5可知,LDA特征抽取相比于隨機森林本身的特征選擇在一定程度上可以提高隨機森林故障細化診斷模型的性能,最終確定的維度使得映射后的特征空間具有最小的類內(nèi)離散度和最大的類間離散度。這一步能有效降低原始數(shù)據(jù)的輸入維度,以便于建立簡單有效的模型,在降低時間成本的同時,可以避免模型過擬合問題。
圖5 LDA降維后RF模型在訓練集上的診斷結果
測試集B中的樣本經(jīng)過故障類型識別后,依據(jù)識別結果將3類故障樣本分別集合到3個小測試集中(即四通閥故障測試集d,電子膨脹閥故障測試集e,制冷劑充注故障測試集f),3個小測試集根據(jù)自身故障類型自主選擇對應的隨機森林診斷模型,進行下一步的故障細化診斷。3類故障細化診斷的結果分別如表3、表4、表5的混淆矩陣所示。
表3 測試集中四通閥故障細化診斷結果
由表3可知,四通閥掉電故障診斷準確率為97.52%,四通閥失效故障診斷準確率為91.10%,可見四通閥掉電相比于一般失效故障更容易被檢測出來,而一般失效故障的訓練樣本數(shù)相對較少,會對模型的診斷性能產(chǎn)生一定影響。
表4中電子膨脹閥故障的3種形式的診斷準確率均達到100%,其中EXV泄漏問題對開度這一參數(shù)的影響也不同于全閉卡死和全開卡死,3種故障的表現(xiàn)形式間存在明顯差異,該隨機森林模型能準確無誤的識別出這3種故障形式。
表4 測試集中電子膨脹閥故障細化診斷結果
由表5可知,4種故障充注水平診斷能力不一,分別為99.87%、98.11%、93.77%、97.41%,其中兩種充注過少(泄漏)的情況能被有效診斷出來,制冷劑充注過少相對于過充,在制冷模式下,系統(tǒng)的蒸發(fā)和冷凝壓力將會有所降低,室外換熱器出口制冷劑溫度降低;制熱模式下,冷凝和蒸發(fā)壓力有所降低同時壓縮機排氣溫度將會升高,所以兩種情況能被有效區(qū)分,過充故障8在診斷中有部分診斷為過充故障9,導致故障9的診斷正確率相對于其他3種充注水平要低。同時,其他幾種充注水平也被錯誤診斷為其他充注水平,因為制冷劑充注故障為系統(tǒng)故障,一旦發(fā)生會對系統(tǒng)內(nèi)多個變量產(chǎn)生影響,由于運行時間的不同以及其他原因,導致某些參數(shù)的變化接近于其他充注水平引起的變化,從而造成診斷失誤。
表5 測試集中制冷劑充注量故障細化診斷結果
故障類型識別后的3類故障的故障細化診斷準確率如圖6所示。四通閥故障、電子膨脹閥故障、制冷劑充注故障在測試集上的整體診斷正確率分別為96.12%、100%、97.44%,而訓練集上的整體診斷準確率分別為100%、100%、99.99%。由于測試集B在故障類型識別過程中有4個制冷劑充注故障樣本被錯誤的診斷為正常運行工況,制冷劑充注故障測試集上的實際診斷正確率為97.42%,說明故障類型識別過程中的診斷準確率會對后面的故障細化診斷結果產(chǎn)生影響,因此要盡可能保證前面故障類型識別準確。而對于四通閥與電子膨脹閥故障,由于識別準確率較高,因此未對故障詳細診斷結果產(chǎn)生影響。上述結果證明,該LDA-RF模型對3種故障的具體故障類型的診斷效果較好,在訓練集和測試集上的準確率均在95%以上,說明該模型具有很好的泛化能力。
圖6 3類故障細化診斷RF模型在訓練集和測試集上的整體診斷結果
本文建立的故障類型識別及故障細化診斷模型可以用于多聯(lián)機系統(tǒng)多故障并發(fā)情況,先完成故障類型識別后,根據(jù)故障類型自適應選擇最優(yōu)故障細化診斷模型,解決了不同故障的不同程度導致的故障標簽過多,對模型建立和診斷結果造成的負面影響。對于不同故障類型,詳細診斷模型的最優(yōu)參數(shù)設置和特征維度差異顯著,而且故障類型識別與進一步的細化診斷所需要的特征數(shù)據(jù)差異很大,前者不同的故障類型之間特征差異顯著,后者同一故障類型不同程度之間的特征差異較小,若直接采取統(tǒng)一的診斷模型進行細化診斷而不考慮不同故障之間的差異性,會導致診斷效果不佳。該分層自適應診斷機制綜合考慮了這兩方面,實現(xiàn)了特定模型對某一故障類型的特定診斷?;诖?,可開展針對該模型的用戶界面開發(fā)[22],實現(xiàn)基本的數(shù)據(jù)輸入、診斷結果輸出功能。維護人員可以根據(jù)診斷結果對系統(tǒng)進行精準維護修理,例如,對于制冷劑泄漏,該模型能夠較為準確的診斷出殘余制冷劑充注水平,幫助維護人員判斷制冷劑補充量;對于四通閥故障,進一步診斷引發(fā)四通閥故障的具體原因,若為掉電只需維護電路狀況消除故障,若為失效則需要進行更換。該用戶界面的開發(fā)和推廣有利于節(jié)省維護系統(tǒng)更多的人力及維護時間,使系統(tǒng)中由故障造成的能源浪費最小化。
本文基于LDA和RF算法提出一種多聯(lián)機系統(tǒng)多類故障診斷策略。該策略可完成兩個任務,一是完成故障類型識別,二是進一步細化診斷每類故障的具體表現(xiàn)形式。故障類型識別基于一般隨機森林算法建模,而對于各單類故障的具體表現(xiàn)形式診斷模型,在基于LDA進行降維提取關鍵特征向量后建立隨機森林模型。實驗中共有3種故障類型,分別存在2、3、4種詳細故障類型,在測試集的驗證下,得到如下結論:
1)故障類型識別過程中,3類故障及正常運行工況整體識別率為99.99%,僅制冷劑充注故障27 335個測試樣本中的4個樣本錯誤識別為正常工況。說明該模型能有效識別3類故障。
2)采取線性判別分析對原始數(shù)據(jù)集進行降維處理,四通閥故障、電子膨脹閥故障、制冷劑充注量故障樣本集由原先18維分別降至1、2、3維。
3)經(jīng)過故障類型識別后的測試樣本分別輸入對應最優(yōu)故障細化診斷模型中,四通閥故障診斷準確率為96.12%,電子膨脹閥的故障診斷準確率為100%,制冷劑充注量的故障診斷準確率為97.44%。說明該模型對不同類型的故障具有良好的診斷性能。
綜上所述,文中建立的隨機森林模型可有效完成故障類型識別和具體故障形式的細分診斷,線性判別分析能有效減少數(shù)據(jù)維度,且對隨機森林模型診斷性能的提高有一定幫助。