丁書久 田佳
西安建筑科技大學(xué)建筑設(shè)備科學(xué)與工程學(xué)院
冷水機(jī)組發(fā)生故障時會造成大量能耗,將故障檢測與診斷(FDD)方法應(yīng)用到冷水機(jī)組領(lǐng)域,及時發(fā)現(xiàn)冷水機(jī)組故障并確定故障類型,具有重要意義。
貝葉斯網(wǎng)絡(luò)(BN)適合處理不確定性問題,且具有強(qiáng)大的融合能力,在 FDD 領(lǐng)域廣泛應(yīng)用。趙陽等人[1]開發(fā)了三層BN,通過專家調(diào)查和統(tǒng)計(jì)學(xué)確定參數(shù)。王亞蘭等人[2]將離散化算法融入BN,避免了依賴專家的主觀性,但會造成信息缺失。何所畏等人[3]提出了條件高斯網(wǎng)(CGN),實(shí)現(xiàn)了連續(xù)節(jié)點(diǎn)變量的概率推理。
CGN 方法需假設(shè)連續(xù)型節(jié)點(diǎn)服從高斯分布,導(dǎo)致方法普適性較差,F(xiàn) DD 準(zhǔn)確率也下降。針對以上方法的局限性,本文在 CGN 的結(jié)構(gòu)基礎(chǔ)上,融入 KDE 估計(jì)連續(xù)型節(jié)點(diǎn)的條件概率分布,在實(shí)現(xiàn)故障檢測診斷過程一體化的同時,提高了 FDD 的準(zhǔn)確率。
貝葉斯網(wǎng)絡(luò)(BN)是基于貝葉斯公式的判別模型,由結(jié)構(gòu)和參數(shù)兩部分組成[4]。BN 的結(jié)構(gòu)是一個有向無環(huán)圖,包括節(jié)點(diǎn)和有向邊,其中節(jié)點(diǎn)代表隨機(jī)變量,節(jié)點(diǎn)之間的有向邊代表變量之間的依賴關(guān)系[5]。BN 的參數(shù)包括所有根節(jié)點(diǎn)在所有可能狀態(tài)下的先驗(yàn)概率和所有子節(jié)點(diǎn)在給定父節(jié)點(diǎn)狀態(tài)下的條件概率表[4]。在BN 中,節(jié)點(diǎn)的數(shù)學(xué)意義為變量各狀態(tài)的概率。有向邊的數(shù)學(xué)意義為給定父節(jié)點(diǎn)狀態(tài)下,子節(jié)點(diǎn)的條件概率。將BN 應(yīng)用到 FDD 中時,已知各故障的先驗(yàn)概率和各類故障發(fā)生時各特征參數(shù)的條件概率后,通過貝葉斯公式可計(jì)算檢測到各特征參數(shù)時,各故障發(fā)生的新概率,即后驗(yàn)概率。后驗(yàn)概率最大的故障可作為最后的判斷結(jié)果。
條件高斯網(wǎng)(CGN)是 BN 的一種特殊形式,可以實(shí)現(xiàn)檢測和診斷過程同時進(jìn)行。相比一般 BN 相比,CGN 最大特點(diǎn)為實(shí)現(xiàn)了連續(xù)型節(jié)點(diǎn)變量的概率推理。圖1 顯示了一個簡單的CGN,其中,節(jié)點(diǎn)S(S1,S2,,Sk)為節(jié)點(diǎn)F的父節(jié)點(diǎn),S為離散型節(jié)點(diǎn),F(xiàn) 為連續(xù)型節(jié)點(diǎn),CGN 假設(shè)節(jié)點(diǎn)F服從高斯分布。CGN 規(guī)定對于一個高斯節(jié)點(diǎn) F,若其只有一個離散的父節(jié)點(diǎn)S,那么在給定S的任一種可能的取值Si(i=1,2,,k)時,F(xiàn)的條件分布可用式(1)表示[5]:
圖1 一個簡單的條件高斯網(wǎng)(CGN)
式中:μS i和ΣS i分布為總體Si的均值向量和協(xié)方差矩陣,其值可使用極大似然估計(jì)法對樣本數(shù)據(jù)參數(shù)估計(jì)獲得。
GGN 模型中存在一個假設(shè):連續(xù)型節(jié)點(diǎn)為高斯節(jié)點(diǎn),即在計(jì)算連續(xù)型節(jié)點(diǎn)的條件概率時,假設(shè)該節(jié)點(diǎn)服從高斯分布。這使CGN 方法的普適性較差,一旦節(jié)點(diǎn)的真實(shí)分布與高斯分布的偏離度較大,就會嚴(yán)重影響診斷的準(zhǔn)確率。
本文針對連續(xù)型節(jié)點(diǎn),在 CGN 的結(jié)構(gòu)基礎(chǔ)上,將非參數(shù)核密度估計(jì)(KDE)方法融入到 CGN 模型中,KDE 是一種不對數(shù)據(jù)總體做任何假設(shè),完全從樣本數(shù)據(jù)本身出發(fā),估計(jì)數(shù)據(jù)總體概率密度函數(shù)的方法,定義如下:
對于單變量的情況,設(shè)X1,X2,……X n是一元總體X的樣本,在任意點(diǎn)x處的總體密度函數(shù)f(x)的核密度估計(jì)定義如下[6]。
式中:K()稱為核函數(shù),h稱為帶寬,n為樣本容量。
由以上定義可知,核函數(shù)和帶寬是估計(jì)核密度的兩個因素。在實(shí)際應(yīng)用中,若核函數(shù)選擇 Gaussian 核函數(shù)時,最優(yōu)帶寬的計(jì)算用式(3)來計(jì)算,其中S為樣本標(biāo)準(zhǔn)差。
假設(shè)冷水機(jī)組有k類故障,用S1,S2,…,S k來表示,正常狀況用Normal 表示,特征參數(shù)有n個。構(gòu)建用于FDD 的改良 CGN(KDE-CGN)模型:第一步,構(gòu)建CGN 結(jié)構(gòu),如圖 2,C GN 共兩層,狀態(tài)層(State Layer)和特征層(Feature Layer),每一層分別有一個節(jié)點(diǎn),父節(jié)點(diǎn)為S節(jié)點(diǎn),為離散型節(jié)點(diǎn);子節(jié)點(diǎn)F節(jié)點(diǎn),為連續(xù)型節(jié)點(diǎn);有向邊由S節(jié)點(diǎn)指向F節(jié)點(diǎn)。S1,S2,…,S k和Normal 為S節(jié)點(diǎn)的k+1 個狀態(tài),F(xiàn)節(jié)點(diǎn)服從 n維分布。第二步,設(shè)置BN 參數(shù),如表 1,F(xiàn)節(jié)點(diǎn)的條件概率分布可通過KDE 方法對各類故障數(shù)據(jù)和正常數(shù)據(jù)非參數(shù)估計(jì)獲得。
表1 用于FDD 的KDE-CGN 模型參數(shù)
圖2 用于FDD 的KDE-CGN 模型
表1 中:Hn表示利用 KDE 方法非參數(shù)估計(jì)出的F節(jié)點(diǎn)的n維真實(shí)分布;其中X為S 節(jié)點(diǎn)狀態(tài)下F節(jié)點(diǎn)的樣本數(shù)據(jù);h和K(u)分布為Hn的帶寬和核函數(shù)。
基于改良條件高斯網(wǎng)(KDE-CGD)的 FDD 流程圖如圖3 所示。
圖3 基于KDE-CGN 模型的FDD 流程
本文所提出的研究方法采用 ASHEAE RP-1043的實(shí)驗(yàn)數(shù)據(jù)進(jìn)行驗(yàn)證。實(shí)驗(yàn)對象是一臺 90 冷噸(約316 kW)的離心式冷水機(jī)組,制冷劑選用 R134a,冷水機(jī)組工作過程圖見圖4,壓焓圖見圖5。實(shí)驗(yàn)通過改變參數(shù)模擬了27 個運(yùn)行工況,并在27 個工況下采集冷水機(jī)組正常數(shù)據(jù)和故障數(shù)據(jù),其中,故障數(shù)據(jù)通過實(shí)驗(yàn)?zāi)M獲得,共模擬了7 類典型軟故障,且每類故障劃分為 4 個劣化等級,從低到高依次為 SL1,S L2,S L3,SL4。7 類典型故障見表2。該實(shí)驗(yàn)通過傳感器測量以10 秒的間隔進(jìn)行數(shù)據(jù)采樣,共需要采集 29 組數(shù)據(jù)集,其中包括一組正常數(shù)據(jù)集和28 組故障數(shù)據(jù)集(7 類故障,每類故障分4 個劣化等級)。每一組數(shù)據(jù)包含64 個特征參數(shù),每一個特征參數(shù)包含5191 個數(shù)據(jù)。
圖4 冷水機(jī)組系統(tǒng)的理想工作過程圖
圖5 冷水機(jī)組熱力循環(huán)壓焓圖
表2 7 類典型軟故障
本文首先選用移動平均濾波器法對原始數(shù)據(jù)進(jìn)行平滑處理,然后選用 Glass 提出的計(jì)算幾何加權(quán)運(yùn)行平均值和幾何加權(quán)運(yùn)行方差的方法對平滑數(shù)據(jù)進(jìn)行穩(wěn)態(tài)篩選[7]。
基于成本和敏感度角度從 64 個特征中選出 8 個特征,8 個特征見表3。
表3 特征選擇后8 個特征
經(jīng)過數(shù)據(jù)預(yù)處理和特征選擇后,本文正常樣本和7 類故障的所有劣化等級樣本中共隨機(jī)選取 1800 個樣本,并劃分為1200 個樣本的訓(xùn)練集和600 個樣本的測試集。訓(xùn)練集的樣本數(shù)據(jù)用于確定 FDD 模型的參數(shù),測試集的樣本數(shù)據(jù)用于對模型的驗(yàn)證。
KDE-CGN 模型的結(jié)構(gòu)如圖2 所示,其中父節(jié)點(diǎn)S為離散型節(jié)點(diǎn),共有 8 個狀態(tài),分別為 Normal 和本文選取的 7 類典型軟故障。子節(jié)點(diǎn)F為連續(xù)型節(jié)點(diǎn),由于通過特征選擇選出了8 個特征,所以F節(jié)點(diǎn)服從 8維真實(shí)分布。
本文假設(shè)8 個狀態(tài)的先驗(yàn)概率初值相等且相加之和為1,均為0.125,詳細(xì)結(jié)果見表4。
表4 S 節(jié)點(diǎn)各狀態(tài)的先驗(yàn)概率
S節(jié)點(diǎn)各狀態(tài)下,F(xiàn)節(jié)點(diǎn)的條件概率分布可分布利用各自的 1200 個訓(xùn)練樣本通過 KDE 方法進(jìn)行非參數(shù)估計(jì)獲得,其中 KDE 方法中的核函數(shù),本研究選用Gaussian 核函數(shù),KDE 方法中的帶寬,本研究通過式(3)計(jì)算。由于F節(jié)點(diǎn)服從8 維真實(shí)分布,可得F節(jié)點(diǎn)的8 維條件概率密度的核密度估計(jì)為:
式中:K()表示高斯核函數(shù);h1,h2,…,h8分別表示 8 個特征在S節(jié)點(diǎn)各狀態(tài)下的數(shù)據(jù)帶寬,具體數(shù)值見表5。
表5 8 個特征在S 節(jié)點(diǎn)各狀態(tài)下的數(shù)據(jù)帶寬
1)首先用未融合KDE 的CGN 模型分別對冷水機(jī)組8 個狀態(tài)下的600 個測試樣本進(jìn)行FDD 判定,結(jié)果見表6。
表6 未融合KDE 的CGN 模型FDD 結(jié)果矩陣
2)利用構(gòu)建好的 KDE-CGN 模型分別對冷水機(jī)組8 個狀態(tài)下的600 個測試樣本進(jìn)行FDD 判定,結(jié)果見表7。
表7 KDE-CGN 模型的FDD 結(jié)果矩陣
FDD 的精度評價指標(biāo)主要表現(xiàn) FDD 方法的檢測診斷準(zhǔn)確性,F(xiàn) AR 指正常狀態(tài)被誤判為故障狀態(tài)的概率。在 HVAC 領(lǐng)域,由于用戶對舒適度要求較高,相對而言,設(shè)備發(fā)生故障產(chǎn)生的危害沒那么嚴(yán)重,所以廠家和用戶對于 FAR 的容忍度較低,F(xiàn) AR 通常為在HVAC 系統(tǒng)FDD 過程中最優(yōu)先控制的精度指標(biāo)。因此本文選用FAR 作為驗(yàn)證FDD 結(jié)果的評價指標(biāo)。
由表6 和表 7 可計(jì)算 CGN 和 KDE-CGN 的 FAR分別為22.7%(136/600)和 5.3%(32/600)。由圖6 可看出,融入 KDE 后的 CGN 在 FDD 精度方面好于傳統(tǒng)CGN,此時FAR 可被大部分用戶所接受。
圖6 兩種方法的FAR 對比圖
本文提出了基于改良 CGN(KDE-CGN)的 FDD方法,并用ASHEAE RP-1043 實(shí)驗(yàn)數(shù)據(jù)對所提方法進(jìn)行驗(yàn)證,結(jié)論如下:
1)C GN 能夠用概率的形式解決不確定性問題,適合作為 FDD 方法的判別模型,且 CGN 模型的結(jié)構(gòu)能夠?qū)崿F(xiàn)故障檢測診斷過程一體化。
2)用 KDE 方法估計(jì)CGN 模型中連續(xù)型節(jié)點(diǎn)的真實(shí)分布,代替?zhèn)鹘y(tǒng)CGN 中假設(shè)的高斯分布,增加了模型的普適性。與 CGN 相比,K DE-CGN 將 FAR 由22.7%降到了5.3%,提高了診斷性能。