何宇軒 石靖峰 周鎮(zhèn)新 陳煥新 任兆亭 夏興祥 程亨達
(1 華中科技大學能源與動力工程學院 武漢 430074;2 青島海信日立空調系統(tǒng)有限公司 青島 266510)
多聯(lián)機空調系統(tǒng)可以實現(xiàn)在不同的室內熱負荷下良好運行[1-3],且因其所需空間更小、在建筑內安裝和維護更方便等原因而被廣泛應用[4-6]。在多聯(lián)機系統(tǒng)的運行中,不可避免地會發(fā)生各種故障[7],而空調系統(tǒng)的故障會導致能源的嚴重浪費[8-10]。多聯(lián)機故障中,諸如室外機臟污一類的故障是一種累積性的故障,可稱之為“軟故障”[11]。軟故障形成的時間相對較長,具有明顯的不同故障程度的區(qū)分,形成初期對系統(tǒng)影響較小,且形成時間不容易確定[12]。軟故障一般不會使系統(tǒng)失效,但其逐步形成會使空調的運行參數(shù)逐漸偏離設定值,使用戶的舒適感嚴重下降。此外,若要空調系統(tǒng)做到精確的自動控制,不僅需要優(yōu)秀的控制系統(tǒng),更要考慮到當前的故障程度對空調系統(tǒng)各個參數(shù)的影響。若能通過自動故障診斷與檢測系統(tǒng)辨識出系統(tǒng)當前軟故障水平,對用戶熱舒適性的優(yōu)化、確定系統(tǒng)維護頻率以及減少系統(tǒng)能耗均有重大作用。
Chen Jianli等[13]將暖通空調系統(tǒng)故障檢測與診斷的計算方法分為三類:基于知識的方法、基于數(shù)據(jù)驅動的方法以及基于知識和數(shù)據(jù)驅動的混合方法?;跀?shù)據(jù)驅動的方法直接分析系統(tǒng)傳感數(shù)據(jù)來識別空調系統(tǒng)的故障,主要特點是無需構造復雜精確的數(shù)學模型,也無需專家知識,對復雜系統(tǒng)的適用性良好,因此受到許多研究者的青睞。韓華[14]針對制冷系統(tǒng)的故障檢測與診斷,利用基于互信息的過濾模型以及基于遺傳算法的封裝模型實現(xiàn)數(shù)據(jù)的特征選擇,利用主成分分析法實現(xiàn)特征提取,與支持向量機算法相結合,構造了一個對制冷系統(tǒng)單發(fā)故障命中效果理想的順序集成模型。與單純的支持向量機模型相比,加入了基于遺傳算法的集成模型在制冷劑泄漏以及制冷劑過量這兩類故障上的診斷準確率有了較大提升。范波等[15]建立了多聯(lián)機系統(tǒng)的動態(tài)仿真模型,并利用該模型生成正常運行數(shù)據(jù)以及制冷劑泄漏故障數(shù)據(jù),構建并訓練了一種基于XGboost算法和類隨機森林算法的多聯(lián)機故障診斷模型,模型對故障的檢測準確率達到98.7%,并可以很大程度上避免誤報。Zeng Yuke等[16]針對多聯(lián)機系統(tǒng)的制冷劑充注量故障診斷,提出一種新型非神經(jīng)網(wǎng)絡的深度學習模型——基于樹狀結構的級聯(lián)森林模型,準確率達到94.16%,高于BP神經(jīng)網(wǎng)絡、SVM等傳統(tǒng)算法。魏文天等[17]同樣針對多聯(lián)機系統(tǒng)的制冷劑充注量故障,改進了傳統(tǒng)的Boosting算法,將其模型中的基分類器換成了5個各不相同的基分類器,提出了一種可用于水平辨識的集成模型。結果表明,基于Boosting算法的集成模型對制冷劑充注量故障的水平辨識能力較好,故障診斷準確率可達到96.8%,且高于任何一種基分類器單獨使用的效果。
上述研究結果均存在一定的局限性。部分研究數(shù)據(jù)是通過仿真模型獲得,與實際運行情況可能存在偏差,而在使用故障實驗數(shù)據(jù)的水平辨識研究中,大部分研究均以制冷劑充注量故障為訓練數(shù)據(jù)的來源或主要研究對象,以換熱器臟污故障為研究對象的相對較少。此外,大多數(shù)研究未探究所使用的故障診斷模型中的模型參數(shù)以及數(shù)據(jù)標簽對于診斷結果的影響。針對上述問題,本文提出一種基于一維卷積神經(jīng)網(wǎng)絡的故障診斷模型,并使用分類器鏈算法,以室外臟污故障數(shù)據(jù)為樣本,實現(xiàn)多聯(lián)機系統(tǒng)中軟故障的水平辨識。該模型能夠較好地辨識多聯(lián)機軟故障的各個水平,且在優(yōu)化參數(shù)以及調整編碼方式后,診斷準確率有進一步提升。
本研究以室外機換熱器臟污故障為研究范例,建立多聯(lián)機系統(tǒng)軟故障的水平辨識模型。涉及的數(shù)據(jù)均在某多聯(lián)機空調系統(tǒng)下實驗獲得,按標準進行性能實驗,以進行故障診斷模型的訓練與驗證。相關多聯(lián)機系統(tǒng)結構如圖1所示。多聯(lián)機系統(tǒng)采用R410A為制冷劑,額定充注量為9.9 kg。系統(tǒng)可分為室外部分以及室內部分,室外部分包括全封閉式渦旋壓縮機、油分離器、四通換向閥、室外機換熱器、氣液分離器以及電子膨脹閥等設備。室內部分設置5臺室內機,每臺室內機均帶有1個電子膨脹閥。
圖1 實驗用多聯(lián)機系統(tǒng)結構
室內機換熱器臟污故障主要形成原因為老化或被灰塵覆蓋導致的換熱器散熱或通風受阻,換熱性能降低[18]。因此實驗采用減少室外機進風口面積的方法模擬因換熱器臟污造成的進風口風量減小,將堵塞面積與進風口原面積之比定義為室外臟污強度[19]。實驗分別在0(即正常運行)、20%、40%、60%、80%臟污5種不同的室外機臟污水平下采集了多聯(lián)機系統(tǒng)的運行數(shù)據(jù)。實驗在制冷及制熱兩種模式下均采集了數(shù)據(jù),實驗工況如表1所示,實驗中不同開機臺數(shù)所對應的臟污程度如表2所示。實驗包含3種室內機的運行模式,分別為全開、三開和單開,全開指5臺室內機均開啟,三開指5臺室內機只開啟3臺,單開指5臺室內機只開啟1臺。獲得運行數(shù)據(jù)之后,經(jīng)整理作為后續(xù)搭建的卷積神經(jīng)網(wǎng)絡的輸入數(shù)據(jù)。
表1 數(shù)據(jù)采集實驗工況
表2 實驗中不同開機臺數(shù)所對應的臟污程度
采集到的各工況各臟污情況下的多聯(lián)機系統(tǒng)運行參數(shù)共52 740條,其中發(fā)生室外臟污故障的數(shù)據(jù)47 388條,正常情況下的數(shù)據(jù)5 352條,20%臟污的數(shù)據(jù)11 579條,40%臟污的數(shù)據(jù)11 579條,60%臟污的數(shù)據(jù)12 286條,80%臟污的數(shù)據(jù)11 944條。在臟污工況數(shù)據(jù)中,選取70%的數(shù)據(jù)為訓練集,用作神經(jīng)網(wǎng)絡的輸入,起到訓練神經(jīng)網(wǎng)絡模型的作用,使其可以通過這些訓練數(shù)據(jù)提取出正常數(shù)據(jù)與故障數(shù)據(jù)的隱含特征;剩余30%的數(shù)據(jù)為測試集,在神經(jīng)網(wǎng)絡模型訓練完成之后將其作為模型的輸入,將模型的檢測結果與實際情況進行對比,以此評價神經(jīng)網(wǎng)絡故障檢測模型的性能。每條數(shù)據(jù)對應在一個時間點機組的運行狀況,包含壓縮機吸排氣溫度、室內機出回風溫度等56個參數(shù)。
卷積神經(jīng)網(wǎng)絡與BP神經(jīng)網(wǎng)絡類似,是一種從輸入到輸出的非線性映射,在解決非線性問題方面表現(xiàn)出十分優(yōu)秀的性能[20]。卷積神經(jīng)網(wǎng)絡的主要組成部分有數(shù)據(jù)輸入層、卷積層、池化層、全連接層和數(shù)據(jù)輸出層。根據(jù)數(shù)據(jù)輸入層的數(shù)據(jù)維度主要可以分為一維卷積神經(jīng)網(wǎng)絡、二維神經(jīng)網(wǎng)絡以及更高維度的神經(jīng)網(wǎng)絡。一維神經(jīng)網(wǎng)絡能夠有效處理序列數(shù)據(jù)的模式識別、分類問題,因所采集的多聯(lián)機數(shù)據(jù)每條均可視為一維序列數(shù)據(jù),所以本文采用一維卷積神經(jīng)網(wǎng)絡進行模型的構建。
在需要被分類的樣本數(shù)據(jù)中,每個數(shù)據(jù)有多種類別標簽,在每種類別標簽上均要對樣本數(shù)據(jù)進行分類,即多分類問題。分類器鏈算法是解決多標簽分類問題的一種算法,其核心思想是將多標簽分類問題轉化為多個二分類問題,建立多個二分類器,其中后執(zhí)行的二分類器會將之前的二分類器的分類預測結果視作輸入數(shù)據(jù)的一部分,并在此基礎上做出分類判斷,形成一個鏈狀形式的分類器。分類器鏈方法的這種特點可以考慮到標簽之間的相關性,在各個標簽非獨立的多標簽分類問題下給出更為準確的預測。分類器鏈方法與非分類器方法的對比如表3所示。
表3 非分類器鏈方法與分類器鏈方法的對比
非分類器鏈方法的診斷策略是:將每一個標簽當做獨立的來看待,互不影響或同時對各個標簽進行判斷。本研究以多聯(lián)機軟故障的不同水平作為不同的數(shù)據(jù)標簽,因為軟故障不同水平之間并非獨立,導致標簽與標簽之間存在相互影響的隱含關系。分類器鏈方法對各個標簽按順序進行診斷,且每次診斷會將上一個標簽的診斷結果納入此次的考慮范圍之內,更適用于水平辨識問題。因此,本研究使用一維卷積神經(jīng)網(wǎng)絡作為分類器鏈中的基分類器,每一個基分類器對應不同的軟故障水平,建立基于分類器鏈的多聯(lián)機軟故障水平辨識模型。
建立神經(jīng)網(wǎng)絡分類器模型需要設置的參數(shù)較多,但由于神經(jīng)網(wǎng)絡模型的結構多樣,隨著具體問題的變化而不同,并且各參數(shù)對模型最終效果的影響機制復雜,截至目前針對神經(jīng)網(wǎng)絡中各參數(shù)的選取仍沒有一個較好的通用原則。為得到水平辨識模型中基分類器的較佳參數(shù)設置,本研究以正常數(shù)據(jù)與故障數(shù)據(jù)作為輸入數(shù)據(jù),訓練一個可用于故障檢測的二分類模型。在該模型中將各個參數(shù)分離調整,并以模型預測準確率達到較高水平時的網(wǎng)絡結構和參數(shù)設置作為水平辨識模型中基分類器的網(wǎng)絡結構和參數(shù)設置。最終確定的網(wǎng)絡結構如圖2所示,各參數(shù)如表4所示,表中還列出了在調整過程中各參數(shù)的選擇范圍以及各參數(shù)對模型準確率的影響程度,便于后續(xù)模型的再調參。
表4 基分類器參數(shù)設置
圖2 基分類器網(wǎng)絡結構
在該參數(shù)設置下,故障檢測模型達到99.24%的預測準確率,混淆矩陣如表5所示,且后續(xù)的參數(shù)調整對模型準確率的影響已無明顯提高。因此,將此參數(shù)設置定為分類器鏈中基分類器的初始參數(shù)設置。
表5 故障檢測結果
數(shù)據(jù)標簽一般使用獨熱編碼表示。獨熱編碼主要是采用N位狀態(tài)寄存器對N個狀態(tài)進行編碼,每個狀態(tài)都有獨立的寄存器位,且任意時候只有一位有效。為了在數(shù)據(jù)標簽層面同樣考慮到各個水平之間的相關性,使編碼方式與分類器鏈模型的特點相配合,本文仿照獨熱編碼提出了兩種新的編碼方式,從標簽上體現(xiàn)出臟污水平的變化,如表6所示。
表6 本文提出的編碼方式與獨熱編碼方式的對比
可以看出,若只用4位編碼,獨熱編碼無法表示5種臟污狀態(tài)(包括正常工況),必須采用5位編碼來表示。而本文提出的編碼方式均可以做到只用4位編碼表示5種臟污狀態(tài),節(jié)省了數(shù)據(jù)儲存空間與計算量,同時1或0值隨著臟污水平逐增的編碼方式也與分類器鏈方法的內含邏輯較為匹配。
本文以一維卷積神經(jīng)網(wǎng)絡分類器作為分類器鏈模型中的基分類器,建立了多聯(lián)機系統(tǒng)室外臟污故障水平辨識模型,模型的訓練和驗證流程如圖3所示,具體步驟如下。
圖3 模型訓練和驗證流程圖
1)構建4個基分類器,分類器層數(shù)以及每層超參數(shù)參照3.1節(jié)表4設置。輸入數(shù)據(jù)按7∶3的比例分為訓練集和測試集,每條數(shù)據(jù)由兩部分組成,分別為室外臟污的數(shù)據(jù)樣本x1=[x1,x2,x3,…,xn]T和對應其臟污程度的數(shù)據(jù)標簽y1=[y1,y2,y3,y4]。
2)將訓練集中數(shù)據(jù)樣本x1作為第一個二分類模型的輸入數(shù)據(jù),數(shù)據(jù)標簽的第一項y1作為目標類別,訓練一個二分類模型。
3)將x1與y1結合,得到新的數(shù)據(jù)樣本x2=[x1,x2,x3,…,xn,y1]T作為第二個二分類模型的輸入數(shù)據(jù),數(shù)據(jù)標簽的第二項y2作為目標類別,訓練第二個二分類模型。
4)以此類推,第三個二分類模型的輸入數(shù)據(jù)為x3=[x1,x2,x3,…,xn,y1,y2]T,目標類別為y3;第四個二分類模型的輸入數(shù)據(jù)為x4=[x1,x2,x3,…,xn,y1,y2,y3]T,目標類別為y4,完成所有四個二分類模型的訓練。
建立了基于分類器鏈的室外機臟污故障水平辨識模型之后,即可將測試集輸入模型并評估模型效果,根據(jù)模型實際的診斷效果進行參數(shù)的優(yōu)化。除了整體診斷準確率之外,使用精確率和召回率作為評價指標,以判斷水平辨識模型在故障的每個具體水平上的診斷能力,精確率和召回率的表達式如式(1)、式(2)所示。
(1)
(2)
式中:i為數(shù)據(jù)類別;NTT為被模型正確判斷為i類的i類樣本數(shù)量;NTF為被模型錯誤判斷為i類的非i類樣本數(shù)量;NFT為被模型錯誤判斷為非i類的i類樣本數(shù)量。
圖4 水平辨識模型初步診斷結果
而使用編碼方式1與編碼方式2的分類器鏈模型整體診斷效果相似,且誤診為無故障的樣本數(shù)量均為0。由召回率和精確率的分布可知,這兩個模型對于較低水平和較高水平的診斷效果較好,兩個模型在20%臟污水平和80%臟污水平的精確率均超過了95%。但在臟污故障處于中等水平時,模型診斷效果并不理想,在40%和60%臟污水平下,召回率和精確率都很低,兩個模型均僅有約90%。由混淆矩陣也可以看出,模型在中等水平臟污下預測錯誤的樣本數(shù)量較多。從診斷準確率來看,三種編碼方式的總體診斷準確率差異較小,均在93%~94%之間。但在實際應用中應避免將故障工況診斷為正常工況的漏診情況,因此本文提出的編碼方式在診斷效果上要稍優(yōu)于獨熱編碼模型。
因為分類器鏈模型是由多個基分類器組成,而此處的基分類器中的各種超參數(shù)是以3.1節(jié)中建立的故障檢測模型為基準設置的,可能對水平辨識模型適配性有所降低,因此應對超參數(shù)再加調整,進一步優(yōu)化模型。由表3可知,對模型整體診斷準確率影響較大且趨勢明顯的參數(shù)有卷積層與池化層的交替使用次數(shù)和卷積核的數(shù)量?,F(xiàn)在所用的模型中,卷積層與池化層已經(jīng)交替使用了3次,為了不使模型結果過于復雜,對其不做調整,本文對卷積層中卷積核數(shù)量進行調整,調整結果如圖5所示。
由圖5可知,在增加了卷積核數(shù)量之后,3種模型的診斷準確率均顯著提升。對于使用編碼方式2的模型,卷積核數(shù)量的增加對診斷準確率的影響較小,當卷積核數(shù)量由8提升至18時,使用編碼方式2的模型的準確率增加了2.57%,而使用編碼方式1和獨熱編碼的模型的準確率分別增加了1.59%和1.82%。卷積核數(shù)量達到18時,三種模型的診斷準確率分別為95.44%、95.47%與95.99%,混淆矩陣如圖6所示。在增加了卷積核數(shù)量之后,使用獨熱編碼的模型的特殊誤診情況有所緩解,但仍有較多數(shù)量的故障數(shù)據(jù)樣本被識別為了正常樣本。使用編碼方式1與編碼方式2的模型誤診為無故障的樣本數(shù)量仍保持為0。
圖6 增加卷積核數(shù)量后模型診斷結果
分別針對不同的臟污水平來看模型的結果,可以發(fā)現(xiàn),模型對不同的臟污水平有著不同的識別能力。對于較低水平的臟污故障,模型并未表現(xiàn)出明顯的趨勢。但對于80%臟污水平的數(shù)據(jù),無論是召回率還是精確率,分類器鏈模型的表現(xiàn)均較為優(yōu)秀。說明分類器鏈模型對于嚴重臟污的水平辨識能力較高,辨識輕度臟污的能力較差。對比調整卷積核數(shù)量之前的結果,可以發(fā)現(xiàn)模型在中等水平臟污下的召回率和精確率均有一定的提升。
考慮到采集到的數(shù)據(jù)樣本x中各參數(shù)是多聯(lián)機的各運行參數(shù),如溫度、壓力等,其中的數(shù)據(jù)xn取值跨度較大,最大值達到60以上,最小值達到-10以下,而在分類器鏈模型的訓練過程中,直接將基分類器的預測結果,即0或1附在x末尾,由于1的值過小,附加之后對于數(shù)據(jù)的特征改變不明顯,可能導致后續(xù)的基分類模型不能很好的識別上次預測結果這個附加的數(shù)據(jù)特征。因此,對模型編碼方式作出如下改變:當上一個基分類器輸出為1時,將其放大k倍再附加在x末尾。經(jīng)過多次實驗,發(fā)現(xiàn)k值對3種編碼方式的模型預測準確率的影響如圖7所示。
圖7 放大倍數(shù)k對模型診斷準確率的影響
在將基分類器輸出放大了k倍之后,3種編碼方式的整體診斷準確率略有上升。當k值取為6時,此時3種編碼方式診斷結果的混淆矩陣如圖8所示。
圖8 放大分類器輸出后模型診斷結果
對照圖6可知,采用放大輸出的方法可以避免獨熱編碼的誤診率,相比于k值取1時的情況,獨熱編碼模型將故障數(shù)據(jù)檢測成為正常數(shù)據(jù)的概率下降很多,由3.4%降至0.16%。對于使用另外兩種編碼方式的模型,診斷準確率分別上升0.96%和0.70%,精確率和召回率也稍有改善。
綜合上述研究結果可知,基于分類器鏈的軟故障水平辨識模型在經(jīng)過進一步調參之后可以達到較好的效果,對室外臟污故障的水平辨識可以達到96%以上的故障診斷準確率。3種編碼方式的診斷準確率相差較小,但相比于傳統(tǒng)的獨熱編碼,本文提出的兩種編碼方式能更好地解決模型將故障數(shù)據(jù)診斷為正常工況的情況。還可采用把基分類器的輸出放大再與下一個基分類器的輸入數(shù)據(jù)結合的方法來進一步提升模型診斷效果,該方法可以減少獨熱編碼模型漏診的概率,也能提高其他模型的診斷準確率。
本文提出一種基于一維卷積神經(jīng)網(wǎng)絡的多聯(lián)機系統(tǒng)故障診斷模型,該模型可以實現(xiàn)軟故障的水平辨識。模型使用分類器鏈算法,將基分類器鏈式連接,對每個故障水平進行分類。通過故障檢測實驗確定了基分類器中重要參數(shù)的取值及其對診斷準確率的影響,并提出了新的編碼方式以適應分類器鏈模型。建立分類器鏈模型之后,針對初步診斷結果的不足進行了調整。得到結論如下:
1)分類器鏈方法能較好地解決多聯(lián)機軟故障的水平辨識。使用分類器鏈模型對室外機臟污故障進行診斷,準確率可達96%以上,最高達到96.69%。模型對于臟污水平較高的情況較為敏感,對于80%臟污水平的召回率最高可達99.08%。
2)相比于傳統(tǒng)的獨熱編碼方式,使用本文提出的編碼方式來處理數(shù)據(jù)標簽并訓練模型,能夠有效防止將故障工況診斷為正常工況的情況,更適合在分類器鏈模型中使用。
3)改進了基分類器輸入數(shù)據(jù)的編碼方式,提出了放大基分類器輸出的方法,即將分類器鏈模型中較前端的分類器輸出放大后再進行下一步操作。使用該方法可以較好解決獨熱編碼模型的誤診問題,且使3種編碼方式的準確率均上升了0.7%~0.96%。
綜上所述,基于一維卷積神經(jīng)網(wǎng)絡的分類器鏈模型可以有效地實現(xiàn)多聯(lián)機系統(tǒng)的軟故障水平辨識,對數(shù)據(jù)標簽的編碼方式優(yōu)化可以使分類器鏈模型的診斷效果提升。