周璇 王曉佩 梁列全 閆軍威
(1.華南理工大學 機械與汽車工程學院,廣東 廣州 510640;2.廣東財經(jīng)大學 信息學院,廣東 廣州 510320)
制冷主機是制冷系統(tǒng)的重要組成部分,隨著制冷技術(shù)與生產(chǎn)需要的發(fā)展,制冷主機運行過程呈現(xiàn)大型化、復雜性、非線性、大功率等特性。制冷主機故障直接影響制冷系統(tǒng)運行的經(jīng)濟性、高效性和合理性[1]。制冷主機故障檢測與診斷(FDD)是指監(jiān)測制冷主機各種運行狀態(tài),通過各種技術(shù)判斷其是否發(fā)生故障,分析故障發(fā)生的原因,及時對可能發(fā)生的故障或已發(fā)生的故障進行預報或報警,對于保證制冷系統(tǒng)安全運行,減少制冷系統(tǒng)設(shè)備磨損以及系統(tǒng)節(jié)能降耗具有重要的意義[2]。
制冷主機主要由制冷劑循環(huán)、水循環(huán)、油循環(huán)3類回路系統(tǒng)組成。制冷劑循環(huán)回路包括低壓和高壓回路兩部分,低壓部分指制冷劑離開節(jié)流閥進入蒸發(fā)器,經(jīng)過吸氣管到達壓縮機吸氣閥的那部分循環(huán)回路,這部分管道和設(shè)備中制冷劑的壓力接近蒸發(fā)壓力,故稱為低壓系統(tǒng);另一部分是指制冷劑從壓縮機排氣閥經(jīng)排氣管、油分離器、冷凝器、泄液管、貯液器、高壓輸液管到達節(jié)流閥的那部分循環(huán)回路,這部分管道和設(shè)備中的制冷劑壓力接近冷凝壓力,因此稱其為高壓系統(tǒng)。對于未設(shè)置高壓儲液器和低壓汽液分離器的制冷系統(tǒng),制冷劑的充注量控制尤其重要。制冷劑充注量過高會儲存在冷凝器中,淹沒冷凝器散熱簇管,使散熱面積減小,冷凝壓力升高,導致制冷量下降。制冷劑充注量不足會導致蒸發(fā)器換熱面積不足,降低換熱效率,無法滿足末端用能需求。制冷劑泄漏是導致制冷劑充注量不足的原因之一,基于現(xiàn)有制冷劑低環(huán)保、易燃、易爆等特性,制冷劑泄漏可能會導致環(huán)境污染、火災甚至爆炸。制冷劑充注過量導致其在蒸發(fā)器中無法完全換熱,過熱度低,制冷壓縮機液擊。此外,制冷劑充注量異常還會使系統(tǒng)膨脹閥調(diào)節(jié)波動大,嚴重降低系統(tǒng)穩(wěn)定性、安全性、高效性。Comstock等[3]通過對離心式制冷系統(tǒng)重要故障進行統(tǒng)計分析,發(fā)現(xiàn)制冷劑充注量異常是一種典型的故障,其發(fā)生頻率較高,且后果較為嚴重。目前,制冷劑充注量的準確檢測與控制仍是制冷系統(tǒng)控制的一大難點,科學有效的監(jiān)測制冷劑充注量對制冷系統(tǒng)運行狀態(tài)的識別具有重要的意義。張良俊等[4]通過實驗研究了充注量對制冷系統(tǒng)部分性能參數(shù)及穩(wěn)定性的影響,為系統(tǒng)的最佳充注量提供了依據(jù)??紫閺姷萚5]建立了熱泵系統(tǒng)數(shù)學模型,并用數(shù)值模擬對系統(tǒng)充注量和部分運行參數(shù)的關(guān)系進行研究,尋求最佳充注量。但以上研究主要是對制冷系統(tǒng)單一運行參數(shù)分別進行研究,參數(shù)的選擇根據(jù)經(jīng)驗人為判定,且單一數(shù)據(jù)特征有時并不能充分反映機組運行狀態(tài)的時變性與多樣性[6]。與此同時,大數(shù)據(jù)給空調(diào)機組運行狀態(tài)監(jiān)測及故障診斷的深入研究和應用提供了新的機遇[7]。梁晴晴等[8]針對制冷系統(tǒng)常見的7種故障,提出了基于主元分析-概率神經(jīng)網(wǎng)絡(luò)的制冷系統(tǒng)故障診斷方法,提高了診斷正確率,縮短了診斷時間。卿紅等[9]結(jié)合最小二乘支持向量機和粒子群算法提高了制冷劑泄漏的故障診斷準確率。王江宇等[10]針對多聯(lián)機系統(tǒng)制冷劑充注量故障,結(jié)合主成分分析與決策樹優(yōu)點,提出了基于主成分分析-決策樹(PCA-DT)的制冷劑充注量故障檢測與診斷方法。袁玥等[11]針對多聯(lián)機制冷劑充注量的故障,提出了基于主成分分析和神經(jīng)網(wǎng)絡(luò)相結(jié)合(PCA-BP)的診斷方法,相比傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)算法,縮減了故障的診斷時間,節(jié)省了系統(tǒng)的存儲空間,提高了診斷精度。Cotrufo等[12]針對不同工況建立基于主成分分析的模型,設(shè)置橢圓離群范圍,進而確定異常模式,實現(xiàn)對空調(diào)系統(tǒng)的故障診斷。Li等[13]結(jié)合PCA與支持向量機(SVM)方法對冷水機組故障檢測與診斷方法展開了研究。Hu等[14]利用PCA對制冷系統(tǒng)傳感器故障進行了敏感性分析。Guo等[15]針對多聯(lián)機故障,提出了基于模塊化PCA模型和基于專家規(guī)則的故障診斷方法,并通過實驗驗證了該方法診斷多聯(lián)機故障的有效性。Li等[16]通過對原有的PCA算法進行改進,提出了基于密度聚類和主元分析的螺桿冷水機組故障診斷方法,結(jié)果表明該方法的平均絕對百分誤差(MAPE)值較原方法低,診斷效果更好。上述研究在采集大量數(shù)據(jù)的基礎(chǔ)上,大多采用PCA與其他算法相結(jié)合的方法進行數(shù)據(jù)降維和故障診斷,通常在保留數(shù)據(jù)特征的同時,能很好地去除了信息的冗余,降低了數(shù)據(jù)維度。然而,數(shù)據(jù)通過PCA方法處理后,其數(shù)學特征得以很好保留的同時,卻丟失了其物理意義。
上述研究主要對制冷劑充注量不足、制冷劑充注量正常、制冷劑充注過量3種狀態(tài)展開研究,缺少對制冷劑充注量故障嚴重程度進一步的細化分析。為此,文中針對離心式冷水機組的制冷劑系統(tǒng),提出了一種基于隨機森林算法的制冷劑充注量故障監(jiān)測與診斷方法。
制冷系統(tǒng)制冷劑充注量故障診斷通過對制冷劑的充注量進行在線監(jiān)測,準確確定制冷劑充注量,評估故障嚴重程度,進而采取有效的措施減少故障可能帶來的危害。基于隨機森林算法的制冷劑充注量故障監(jiān)測與診斷流程包括數(shù)據(jù)預處理、特征選擇、故障診斷3部分,如圖1所示。
圖1 故障診斷框架Fig.1 Framework of fault diagnosis
首先對數(shù)據(jù)進行預處理,將數(shù)據(jù)劃分為訓練集和測試集;然后采用隨機森林基尼指數(shù)特征選擇方法量化訓練集中故障特征量的重要性,并選取訓練集中重要的故障特征量作為RF算法的輸入,建立故障診斷模型;最后輸入測試集相應的故障特征量,對制冷劑的充注狀態(tài)進行識別和分類,以此算出分類的準確率,得到低維度輸入下的高精度故障診斷輸出。具體的步驟如下:
(1)數(shù)據(jù)預處理 數(shù)據(jù)預處理包括數(shù)據(jù)清洗、數(shù)據(jù)歸一化。數(shù)據(jù)清洗主要是剔除異常值、死值等;數(shù)據(jù)歸一化用于盡可能降低量綱和數(shù)量級差異所帶來的影響。
(2)特征選擇 采用基于隨機森林基尼指數(shù)平均不純度減少的特征選擇方法對訓練集特征進行貢獻率排序,量化特征的重要性,進而選取貢獻累計率較高的值作為診斷模型的輸入,以降低診斷成本。
(3)故障診斷 選取訓練集M維故障特征量,以診斷準確率P作為隨機森林算法優(yōu)化的目標函數(shù)值
(1)
式中,ncorrect為測試集正確診斷樣本量,Ntotal為測試集樣本總量。
通過對訓練集進行建模,得出不同維度故障特征量條件下,不同樣本規(guī)模下RF算法的診斷準確率。
隨機森林算法是將Bagging集成學習理論與隨機子空間方法相結(jié)合的一種有監(jiān)督機器學習算法[17]。隨機森林算法是以決策樹為基分類器,在決策樹的基礎(chǔ)上,通過引入集成思想增加算法的隨機性,大大提升了算法的適用范圍。集成思想增加了決策樹的差異性,訓練集抽取的隨機性和節(jié)點候選分割特征集合的隨機性增加了決策樹的多樣性,而差異性和多樣性使算法的泛化能力和診斷精度得到提升[18]。隨機森林算法主要包括決策樹生成和分類診斷,如圖2所示。決策樹生成過程主要包括樣本隨機選擇、特征隨機選取、最優(yōu)分割點篩選和樹的生長4部分。隨機森林算法的具體步驟如下:
(1)樣本選擇 從樣本集合中進行獨立重復抽樣,選取n個樣本得到一個樣本集,重復K次得到K個樣本集。
(2)特征選擇 每個樣本集為一棵獨立決策樹,假設(shè)含有M個輸入特征,則在樹的節(jié)點處隨機挑取m個特征作為候選特征集。
圖2 隨機森林算法的結(jié)構(gòu)Fig.2 Structure of random forest algorithm
(3)最優(yōu)分割點篩選 按照一定的原則從候選特征集中選取最優(yōu)特征作為節(jié)點進行分裂。隨機森林構(gòu)建決策樹常用的方法主要有ID3、C4.5、CART算法,其中ID3、C4.5算法基于信息熵原理選擇分裂特征,CART算法以基尼指數(shù)為分割原則,泛化能力比前兩種算法好[19],因此文中以基尼指數(shù)為分割原則,優(yōu)先選取貢獻率高的特征為最優(yōu)特征。
在分類問題中,假設(shè)有K個類、第i棵決策樹、樣本集合D,則基尼指數(shù)為
(2)
式中,Ck是D中屬于第k類的樣本子集。
如果樣本集合D根據(jù)特征A是否取某一可能值a被分割成D1和D2兩部分,則在特征A條件下,集合的基尼指數(shù)定義為
(3)
則特征A在第i棵決策樹這個分裂節(jié)點的重要性為
Vi(A)=G(D)-G(D,A)
(4)
(4)遞歸步驟(2)、(3)進行分支,直到滿足要求。每棵樹最大限度地生長,不進行剪枝操作。
(5)重復上述步驟k次,生成多棵分類樹,同時將生成的多棵分類樹組成隨機森林,用隨機森林分類器對新的數(shù)據(jù)進行判別與分類,分類結(jié)果按樹分類器的投票多少確定。
數(shù)據(jù)特征選擇旨在選取累積貢獻率較高的值作為診斷模型的輸入,文中基于隨機森林基尼指數(shù)進行特征貢獻率排序,以減少數(shù)據(jù)間的冗余性?;陔S機森林基尼指數(shù)的特征貢獻率排序原理如下:
首先求出特征A在n棵樹的總體重要性
(5)
(6)
建模數(shù)據(jù)來自ASHRAE 1999年提供的制冷主機故障數(shù)據(jù)庫,該實驗裝置的狀況可以代表典型的建筑制冷機組狀況[3]。實驗對象是一臺90冷噸(約316 kW)的離心式冷水機組(如圖3所示),其中制冷劑為R134a,蒸發(fā)器和冷凝器為殼管式換熱器。該系統(tǒng)的主要環(huán)路系統(tǒng)包括制冷劑系統(tǒng)和水路系統(tǒng),制冷劑系統(tǒng)包括主制冷劑環(huán)路和兩條輔助制冷劑環(huán)路(用于冷卻動力設(shè)備壓縮機及電機和膨脹閥旁通流量調(diào)節(jié));水路系統(tǒng)包括冷凍水環(huán)路、冷卻水環(huán)路、熱水環(huán)路、城市供水和蒸汽供應環(huán)路。
實驗主要通過按照比例過量充注制冷劑或釋放制冷劑,模擬制冷劑充注量異常的不同故障。針對不同充注量的制冷劑故障分別進行實驗,每次實驗中通過調(diào)節(jié)冷凍水出水溫度、冷卻水進水溫度、主機負荷3個變量模擬制冷系統(tǒng)典型的工況,每個變量有3個設(shè)置范圍,形成3×3×3=27種典型工況。實驗數(shù)據(jù)中共采集65維故障特征量,其中傳感器直接測量獲得的參數(shù)49維,間接計算獲得的參數(shù)16維,為了更好的應用于工程實際,僅對傳感器直接測量獲取的參數(shù)進行處理。本文主要針對制冷劑充注量偏離正常閾值的典型全局故障展開研究。制冷劑充注量共有9種狀態(tài),如表1所示。采樣周期為10 s,每種狀態(tài)采樣時長為51 910 s,共計5 191組數(shù)據(jù),9種狀態(tài)下共有46 719組數(shù)據(jù)。
表1 制冷劑充注量的程度Table 1 Degree of refrigerant charge
通過對數(shù)據(jù)庫內(nèi)數(shù)據(jù)的觀察,發(fā)現(xiàn)存在以下幾種情況:
(1)部分實驗數(shù)據(jù)在整個實驗過程未發(fā)生變化,此類死值數(shù)據(jù)不影響故障診斷效果,直接剔除該維數(shù)據(jù)。
(2)部分實驗數(shù)據(jù)在某一時刻產(chǎn)生突降現(xiàn)象,與前后數(shù)據(jù)差距極大,突變后會迅速回歸正常,主要是實驗過程中數(shù)據(jù)間傳輸產(chǎn)生的噪聲干擾,產(chǎn)生時間極短,分析其原因為非工況因素引起,采用拉依達準則直接予以剔除。
(3)系統(tǒng)在剛開機或關(guān)機后一段時間內(nèi)的所有數(shù)據(jù)均處于極其不穩(wěn)定狀態(tài),這些數(shù)據(jù)不適用于故障診斷建模,因此剔除開、關(guān)機階段的數(shù)據(jù)。
(4)由于數(shù)據(jù)量綱不同,數(shù)據(jù)的數(shù)據(jù)級相差較遠,不利于數(shù)據(jù)的分析。因此,對實驗數(shù)據(jù)進行歸一化預處理,以消除量綱差異造成的影響。
文中提及的數(shù)據(jù)預處理主要包括數(shù)據(jù)清洗、數(shù)據(jù)歸一化兩部分。數(shù)據(jù)清洗主要用于剔除死值、突變值等干擾故障檢測結(jié)果的異常數(shù)據(jù)以及開關(guān)機時的不穩(wěn)定數(shù)據(jù);數(shù)據(jù)歸一化指對不同量綱的數(shù)據(jù)進行歸一化處理。
3.2.1 數(shù)據(jù)清洗
結(jié)合數(shù)據(jù)特點,對數(shù)據(jù)的清洗過程包括剔除死值、開關(guān)機階段不穩(wěn)定數(shù)據(jù)及突變值。實驗研究的49維故障特征量中部分變量為常數(shù),一直未發(fā)生變化,如水路系統(tǒng)中熱水閥開度和蒸汽閥開度、單元狀態(tài)與激活故障四維數(shù)據(jù),因此剔除這4組參數(shù)。任選一組實驗工況如圖4所示,圖中包括冷凍水出水溫度(TEO)、冷卻水進水溫度(TCI)、總負荷(ET)(間接表征主機負荷),其中開機階段(0~1 000 s)及關(guān)機階段(50 500~51 900 s)的數(shù)據(jù)發(fā)生突變,因此剔除開、關(guān)機階段產(chǎn)生的數(shù)據(jù),選取的時間范圍為制冷主機啟動后1 000~50 500 s。由于數(shù)據(jù)采集過程中存在異常突變數(shù)據(jù),采用拉依達準則(如式(7)、(8)所示)對不合理數(shù)據(jù)進行剔除,得到44 928組數(shù)據(jù)。
(7)
(8)
圖4 工況圖Fig.4 Working chart
3.2.2 數(shù)據(jù)歸一化
由于模型輸入的不同故障特征量具有不同的量綱和數(shù)量級,從而存在著不可公度性。為了盡可能降低量綱和數(shù)量級差異帶來的影響,需要對不同類型的輸入數(shù)據(jù)進行量綱歸一化處理。選取9組不同充注狀態(tài)的數(shù)據(jù)集,數(shù)據(jù)總量為44 884條,45維故障特征量。針對該數(shù)據(jù)集9組不同充注量進行標記,如表1所示。訓練集和測試集按照3∶1進行隨機抽取。首先針對訓練集進行數(shù)據(jù)歸一化,將數(shù)據(jù)約簡到[-1,1]之間,如式(9)所示;然后對測試集采用相同的規(guī)則進行歸一化,以確保歸一化后數(shù)據(jù)的一致性。
(9)
式中,ymax=1,ymin=-1,xmax、xmin分別為該訓練集的最大值和最小值。
本文針對訓練集篩選后的45維故障特征量,基于隨機森林的基尼指數(shù)準則確定參數(shù)的重要程度,進行特征貢獻率排序,評估故障特征量對故障診斷的重要度,進而指導實際工程中空調(diào)故障診斷采集參數(shù)的數(shù)量及頻率,有效減少采集和存儲成本,提高診斷效率。首先選取訓練集5 000組數(shù)據(jù),建立RF模型,其中RF模型參數(shù)參考Python 的scikit-learn v0.20 版本默認值設(shè)置,然后基于RF的基尼指數(shù)準則量化不同特征的貢獻率。表2為重要故障特征量累積貢獻率排序結(jié)果,圖5為各特征量貢獻率隨故障特征量的變化情況。
表2 重要特征量的故障貢獻率排序結(jié)果
Table 2 Fault contribution ranking of important characteristic quantities
貢獻率排序特征量描述累積貢獻率1TWI城市供水溫度0.1512TRC_sub過冷度0.2623TCA冷凝器趨近溫度0.3714TR_dis排氣溫度0.4035THI熱水入口溫度0.4286TWO城市供水出口溫度0.4507TSI冷凝器內(nèi)混合溫度0.4718TCI冷凝水入口溫度0.4919TRC冷凝溫度0.51210P_lift壓縮機進出口壓差0.533
圖5 貢獻率隨故障特征量的變化趨勢Fig.5 Change of contribution rate with fault characteristic
由表2可知,對制冷劑充注量異常診斷的貢獻率最高的前3個故障特征量為TWI、TRC_sub和TCA。
1)TWI(城市供水溫度)
TWI為系統(tǒng)的外部參數(shù),由回路示意圖可知,低溫的城市供水在換熱器中與冷卻水進行換熱,吸收室內(nèi)的熱量,然后與外界大氣發(fā)生換熱而使本身溫度降低,再次進入冷凝器中。城市供水溫度一方面與冷卻水回路進行熱量交換,直接影響冷水機組的冷凝溫度與制冷性能;另一方面,城市供水溫度受到外界環(huán)境參數(shù)的影響,間接反映了制冷系統(tǒng)冷負荷的大小,且冷負荷大小直接影響制冷主機的運行狀態(tài)與制冷劑循環(huán)性能。因此,當制冷劑充注量異常時,制冷劑循環(huán)狀態(tài)發(fā)生改變,TWI參數(shù)能夠表征此類故障特征,且貢獻率最高。
2)TRC_sub(過冷度)
過冷度是冷凝器出口的冷媒壓力對應的飽和溫度與冷媒實際溫度之間的差值。TRC_sub表征制冷劑充注量故障特征,需要分4種情況進行討論:
(1)當制冷劑充注過量,且在膨脹閥可有效調(diào)節(jié)范圍之內(nèi)時,多余的制冷劑會存儲在高壓儲液器內(nèi)。
(2)當制冷劑充注過量,且膨脹閥無法有效調(diào)節(jié)時,制冷劑以液體形式進入壓縮機,多余的制冷劑會存儲在冷凝器中導致冷凝壓力顯著升高,飽和溫度升高;同時單位體積的制冷劑在蒸發(fā)器內(nèi)無法充分換熱,導致壓縮機入口溫度降低,制冷劑實際溫度隨壓縮機入口的冷媒溫度降低而降低,冷凝器出口的飽和溫度與冷媒實際溫度之間的差值增加。
(3)當冷凝劑充注量不足,膨脹閥能夠有效調(diào)節(jié)時,高壓儲液器內(nèi)的制冷劑能夠進入制冷循環(huán)系統(tǒng),補充注量不足的部分。
(4)當冷凝劑充注量嚴重不足,膨脹閥無法有效調(diào)節(jié)時,冷凝壓力降低,單位體積的制冷劑在蒸發(fā)器內(nèi)過度換熱導致壓縮機入口溫度升高,制冷劑實際溫度隨壓縮機入口的冷媒溫度降低而降低,冷凝器出口的飽和溫度與冷媒實際溫度之間的差值減小。
圖6為27種工況下不同制冷劑充注量的TRC_sub分布圖,其中rl10、rl20、rl30、rl40分別表示制冷劑泄露10%、20%、30%、40%,ro10、ro20、ro30、ro40表示制冷劑充注量較正常范圍超過10%、20%、30%、40%,正常表示制冷劑充注量在正常范圍。由圖中可以看出,同一工況下過冷度隨著制冷劑充注量的減少而降低,但相鄰工況下過冷度的分布有重合,需要結(jié)合其他參數(shù)對充注量進行診斷。
圖6 27種工況下TRC_sub參數(shù)分布圖
Fig.6 Distribution of TRC_sub parameter under 27 operating conditions
(3)TCA(冷凝器趨近溫度)
冷凝器趨近溫度是指制冷劑冷凝溫度與冷卻水出水溫度的差值,表明換熱器換熱能力的參數(shù)。冷凝壓力隨著制冷劑充注量的增加而增加,冷凝溫度與冷凝壓力呈正相關(guān)。當制冷劑充注量過多時,制冷劑的換熱量增加,導致冷卻水溫度降低,因此趨近溫度升高;反之,趨近溫度降低。圖7為27種工況下不同制冷劑充注量的TCA分布圖。由圖中可以看出,同一工況下冷凝器趨近溫度隨著制冷劑充注量的減少而降低,相鄰工況下TCA的分布有重合,需要結(jié)合其他參數(shù)對充注量進行診斷。
圖7 27種工況下TCA參數(shù)分布圖
Fig.7 Distribution of TCA parameter under 27 working conditions
故障診斷分類準確率可以有效地評價故障診斷方法的有效性。故障診斷準確率受到樣本規(guī)模與故障特征量維度(DFCQ)的影響,因此文中以診斷準確率最高作為目標函數(shù),比較不同樣本規(guī)模與DFCQ在不同診斷方法的診斷結(jié)果,并對結(jié)果進行分析。
為了測試樣本規(guī)模對模型故障診斷準確率的影響,分別選取4組不同的樣本規(guī)模n(3 000、5 000、10 000、15 000)進行故障診斷,每組樣本依據(jù)訓練集和測試集3∶1的比例隨機選?。煌瑫r依據(jù)貢獻率大小,優(yōu)先選用貢獻率大的特征量,在逐漸增加DFCQ的輸入條件下,分別采用基于RF、基于決策樹(DT)、基于支持向量機(SVM)算法的制冷劑充注量故障監(jiān)測與診斷方法進行故障診斷,這些方法的診斷性能受到算法參數(shù)的影響,文中采用網(wǎng)格搜索算法對RF、DT、SVM(采用RBF核函數(shù))算法的關(guān)鍵參數(shù)進行尋優(yōu)。首先以訓練集準確度為評價指標,對訓練集采用4折交叉驗證方法,尋找算法的訓練集最優(yōu)參數(shù)值,然后將參數(shù)傳遞給相應的算法,并用測試集進行驗證,尋優(yōu)算法參數(shù)設(shè)置如表3所示,其中m∈min(15,DFCQ)。實驗結(jié)果表明:3種方法的訓練集準確率在99%~100%之間,如圖8所示。3種方法的測試集5次實驗的平均準確率如表4所示。
表3 尋優(yōu)算法的參數(shù)設(shè)定Table 3 Parameter settings of optimizing algorithms
圖8 3種方法的訓練集準確率比較
Fig.8 Comparison of accuracy of training set among three methods
表4 3種方法的測試集診斷準確率比較
Table 4 Comparison of diagnosis accuracy of test set among three methods
方法DFCQP/%n=3000n=5000n=10000n=15000基于RF基于DT基于SVM590.594.096.597.7893.195.197.798.01593.595.497.698.22094.294.997.598.52593.895.697.698.53094.295.797.698.44594.596.098.098.6586.988.894.095.7888.890.594.296.31590.291.894.296.72091.392.194.396.02590.891.793.896.23091.391.293.795.94591.291.693.996.1590.294.795.996.8892.595.397.998.11589.493.497.398.02088.193.397.097.82587.990.496.597.53082.893.296.497.64584.884.891.491.3
由表4可知:基于RF算法的平均診斷準確率比基于DT算法高約3.3%,比基于SVM算法高約2.9%,說明RF算法的泛化能力最好;當DFCQ相同時,隨著樣本規(guī)模的增大,3種方法的診斷平均準確率呈上升趨勢,但上升幅度逐漸變緩,說明增加樣本規(guī)模可以提高模型診斷準確率,但當樣本規(guī)模足夠大時,模型診斷效果不能明顯提升;當樣本規(guī)模相同時,隨著DFCQ的增加,基于RF算法的測試集診斷平均準確率升高且平均準確率最高約96.8%,基于DT算法的診斷方法在DFCQ為20時的平均準確率最高(約93.42%),基于SVM算法的診斷方法在DFCQ為8時的平均準確率最高(約95.95%),說明當DFCQ達到一定程度時,基于DT、基于SVM算法的診斷效果不會隨著DFCQ的增加而增加,這是因為特征量維度過多導致冗余,會影響模型的泛化能力,導致模型過擬合,而基于RF算法的診斷方法的泛化能力相比基于其他兩種算法的方法好,可以更好地解決模型過擬合和欠擬合問題。基于工程實踐可行性的考慮,前5維的故障特征量都是典型的空調(diào)系統(tǒng)監(jiān)測數(shù)據(jù),基于RF算法、基于DT算法、基于SVM算法的平均準確率分別可以達到94.68%、91.35%、94.40%。在系統(tǒng)監(jiān)測成本有限的條件下,采用RF算法,選取5維故障特征量可以實現(xiàn)制冷劑充注量的有效診斷。綜合考慮模型平均準確率與監(jiān)測成本時,采用RF算法可以實現(xiàn)制冷劑充注量的高準確率診斷。
文中提出的異常診斷方法能夠準確評估離心式冷水機組制冷劑充注量故障的嚴重程度,主要結(jié)論如下:
(1)通過故障特征量貢獻率排序,有針對性地選取部分貢獻率大的故障特征量進行診斷,可以在保留數(shù)據(jù)物理意義的條件下有效地減少數(shù)據(jù)采集成本;
(2)基于診斷準確率考慮,采用RF算法具有良好的識別分類準確率;
(3)基于工程實踐可行性考慮,前5維的故障特征量都是典型的空調(diào)系統(tǒng)監(jiān)測數(shù)據(jù),采用RF算法可以實現(xiàn)制冷劑充注量的有效診斷;
(4)隨機森林算法可以有效地處理規(guī)則模糊的數(shù)據(jù),且該算法具有穩(wěn)定性和普適性。
該方法能夠為預防離心式冷水機組制冷劑泄露導致的火災爆炸危害性事故發(fā)生提供有效依據(jù),同時可預防因人為失誤導致充注量過高而引發(fā)冷水機組液擊事故的發(fā)生,以確保離心式冷水機組安全、穩(wěn)定、高效運行。該方法也可為其他類型的冷水機組故障診斷提供參考。文中建立的故障診斷模型適用于各種型號的離心式冷水機組,但建模復雜度相對較大,今后可以嘗試改進算法,以更好地實現(xiàn)故障診斷。