張聰,朱永生,楊敏燕,任智軍,閆柯,洪軍
(西安交通大學(xué)現(xiàn)代設(shè)計(jì)及轉(zhuǎn)子軸承系統(tǒng)教育部重點(diǎn)實(shí)驗(yàn)室,710049,西安)
近年來(lái),隨著復(fù)雜機(jī)電裝備自動(dòng)化程度和信息集成度的日益提高,設(shè)備運(yùn)行狀態(tài)數(shù)據(jù)量激增,數(shù)據(jù)驅(qū)動(dòng)的異常檢測(cè)方法成為工業(yè)領(lǐng)域設(shè)備及零部件狀態(tài)識(shí)別新趨勢(shì),為解決傳統(tǒng)異常檢測(cè)方法經(jīng)驗(yàn)依賴性強(qiáng)、準(zhǔn)確率低、誤判漏檢率高等問(wèn)題提供了有效途徑[1]。
以汽輪機(jī)、風(fēng)電裝備等典型轉(zhuǎn)子系統(tǒng)為例,作為一種零部件間高度關(guān)聯(lián)、高度耦合的分布式復(fù)雜系統(tǒng),其運(yùn)行過(guò)程中各測(cè)點(diǎn)振動(dòng)、溫度、壓力等信息要素共同構(gòu)成了轉(zhuǎn)子系統(tǒng)中復(fù)雜且普遍存在的耦合關(guān)系[2]。同時(shí),系統(tǒng)配備的分布式控制系統(tǒng)(DCS)、汽輪機(jī)監(jiān)測(cè)系統(tǒng)(TSI)和數(shù)據(jù)采集與監(jiān)視控制系統(tǒng)(SCADA)等所采集的數(shù)據(jù),表現(xiàn)出多源、海量、異常缺乏、無(wú)標(biāo)簽等特點(diǎn)[3],給復(fù)雜系統(tǒng)的異常檢測(cè)及故障診斷帶來(lái)了極大的挑戰(zhàn)。在復(fù)雜機(jī)電裝備異常檢測(cè)及故障診斷方面,劉國(guó)斌利用汽輪機(jī)DCS數(shù)據(jù),提出了基于多傳感器信息融合的神經(jīng)網(wǎng)絡(luò)方法,并開(kāi)展了汽輪機(jī)故障診斷研究[4]。Niklas等針對(duì)風(fēng)電機(jī)組SCADA系統(tǒng)監(jiān)測(cè)數(shù)據(jù),提出了一種基于自動(dòng)編碼器模型,通過(guò)重構(gòu)所有輸入信號(hào),實(shí)現(xiàn)了對(duì)風(fēng)電機(jī)組各組件的異常檢測(cè)[5]。趙洪山等提出了一種基于風(fēng)電機(jī)組主軸承SCADA狀態(tài)監(jiān)測(cè)數(shù)據(jù)逐層編碼網(wǎng)絡(luò)的深度學(xué)習(xí)方法[6],利用受限玻爾茲曼機(jī)逐層智能學(xué)習(xí)主軸承樣本數(shù)據(jù)蘊(yùn)含的特定規(guī)則,進(jìn)而實(shí)現(xiàn)狀態(tài)識(shí)別。劉超等基于風(fēng)電機(jī)SCADA數(shù)據(jù),提出了一種用于風(fēng)力渦輪機(jī)狀態(tài)的無(wú)監(jiān)督異常檢測(cè)方法,應(yīng)用時(shí)空模式網(wǎng)絡(luò)(STPN)來(lái)提取系統(tǒng)中變量的時(shí)空特征,然后使用基于能量的受限玻爾茲曼機(jī)(RBM)進(jìn)行異常檢測(cè)[7]。
上述研究均未考慮系統(tǒng)各監(jiān)測(cè)變量間存在的復(fù)雜耦合關(guān)系,局限于利用單一變量或多變量簡(jiǎn)單疊加進(jìn)行異常檢測(cè)或故障識(shí)別,對(duì)系統(tǒng)運(yùn)行狀態(tài)敏感性低,計(jì)算結(jié)果的可靠性難以滿足工業(yè)時(shí)序數(shù)據(jù)異常檢測(cè)的需求。針對(duì)上述問(wèn)題,杜海峰等利用網(wǎng)絡(luò)表示故障數(shù)據(jù)結(jié)構(gòu),以壓縮機(jī)組故障樣本作為網(wǎng)絡(luò)節(jié)點(diǎn),不同樣本間的相似性度量作為邊,構(gòu)建復(fù)雜網(wǎng)絡(luò),通過(guò)網(wǎng)絡(luò)結(jié)構(gòu)反映故障狀態(tài)及其特征,通過(guò)對(duì)網(wǎng)絡(luò)社群結(jié)構(gòu)特性及模塊性指標(biāo)進(jìn)行分析,建立了系統(tǒng)狀態(tài)劃分準(zhǔn)則,實(shí)現(xiàn)了對(duì)系統(tǒng)故障的有效診斷[8]。姜洪權(quán)等通過(guò)對(duì)田納西-伊斯曼(TE)化工系統(tǒng)進(jìn)行抽象,并構(gòu)建復(fù)雜網(wǎng)絡(luò),基于網(wǎng)絡(luò)最短路徑長(zhǎng)度定義系統(tǒng)脆性系數(shù),從而實(shí)現(xiàn)對(duì)復(fù)雜系統(tǒng)結(jié)構(gòu)脆弱性的評(píng)價(jià)[9]。Wang等采用有限穿越可視圖的方式構(gòu)建復(fù)雜機(jī)電系統(tǒng)網(wǎng)絡(luò)模型,并基于度分布等復(fù)雜網(wǎng)絡(luò)統(tǒng)計(jì)特性,定義網(wǎng)絡(luò)差異度系數(shù),從而識(shí)別機(jī)電系統(tǒng)的[10]不同狀態(tài)。馮龍飛等提出了一種基于去趨勢(shì)交叉分析-網(wǎng)絡(luò)結(jié)構(gòu)熵(DCCA-NSEn)的復(fù)雜機(jī)電系統(tǒng)多變量耦合網(wǎng)絡(luò)建模與狀態(tài)評(píng)估的方法[11],構(gòu)建了反映多變量耦合關(guān)系的加權(quán)網(wǎng)絡(luò)模型,分析耦合關(guān)系網(wǎng)絡(luò)的結(jié)構(gòu)熵,實(shí)現(xiàn)異常狀態(tài)檢測(cè)。以上方法考慮了系統(tǒng)的整體性和監(jiān)測(cè)數(shù)據(jù)間存在的復(fù)雜耦合關(guān)系,但多采用人為提取特征指標(biāo)的方式進(jìn)行異常狀態(tài)檢測(cè)和故障識(shí)別,依賴經(jīng)驗(yàn)性強(qiáng)。
針對(duì)上述方法的不足,結(jié)合復(fù)雜機(jī)電裝備各部件關(guān)聯(lián)性強(qiáng)、監(jiān)測(cè)點(diǎn)位多、變量耦合關(guān)系繁雜的特點(diǎn),本文提出了一種基于多變量耦合網(wǎng)絡(luò)與變分圖自編碼器的異常檢測(cè)方法。該方法首先基于海量多源傳感器正常監(jiān)測(cè)數(shù)據(jù),構(gòu)建復(fù)雜系統(tǒng)多變量耦合關(guān)系網(wǎng)絡(luò),深度挖掘系統(tǒng)變量間的關(guān)聯(lián)關(guān)系,提升復(fù)雜設(shè)備狀態(tài)感知的敏感性;其次,建立變分圖自編碼器模型,以變量間耦合關(guān)系為輸入,自適應(yīng)提取關(guān)系特征,實(shí)現(xiàn)多源數(shù)據(jù)與系統(tǒng)狀態(tài)的非線性映射,提升復(fù)雜裝備狀態(tài)識(shí)別能力;最后,以變分圖自編碼器模型的重建概率作為指標(biāo),判斷機(jī)電系統(tǒng)運(yùn)行狀態(tài)。
針對(duì)復(fù)雜機(jī)械系統(tǒng)監(jiān)測(cè)數(shù)據(jù)多源、海量、異常缺乏、無(wú)標(biāo)簽等特點(diǎn),建立基于多變量耦合網(wǎng)絡(luò)與變分圖自編碼器的異常檢測(cè)方法,主要由耦合網(wǎng)絡(luò)構(gòu)建及變分圖自編碼器構(gòu)建兩部分組成。其中,前者基于去趨勢(shì)互相關(guān)分析(DCCA)[12],結(jié)合監(jiān)測(cè)變量非線性、非平穩(wěn)性及長(zhǎng)程相關(guān)性等特性,對(duì)系統(tǒng)任意兩變量間的關(guān)聯(lián)關(guān)系進(jìn)行定量分析,得到系統(tǒng)變量間耦合關(guān)系矩陣;后者基于變分圖自編碼器建立多變量耦合關(guān)系重構(gòu)模型,自適應(yīng)提取蘊(yùn)藏在關(guān)系矩陣中的機(jī)械設(shè)備狀態(tài)特性,使用重建概率作為異常分?jǐn)?shù),通過(guò)訓(xùn)練確定重建概率閾值,實(shí)現(xiàn)設(shè)備運(yùn)行狀態(tài)異常檢測(cè)。
1.1.1 去趨勢(shì)互相關(guān)分析 對(duì)于系統(tǒng)監(jiān)測(cè)變量相互耦合、眾多繁雜,且具有非平穩(wěn)、非線性的特點(diǎn),目前基于物理或數(shù)學(xué)模型的耦合關(guān)系分析方法已不適用,因此本文采用基于非平穩(wěn)非線性序列的DCCA方法,通過(guò)計(jì)算序列去趨勢(shì)協(xié)方差以最小化外部趨勢(shì),進(jìn)而實(shí)現(xiàn)序列間相關(guān)性的分析。DCCA方法的主要流程如下[13]。
(1)
圖1 集成序列劃分過(guò)程
(3)計(jì)算所有區(qū)域?qū)?yīng)的去趨勢(shì)協(xié)方差
(2)
(3)
(4)重復(fù)上述分析流程,得到在不同標(biāo)度時(shí)對(duì)應(yīng)的波動(dòng)函數(shù),當(dāng)兩個(gè)序列具有明顯的長(zhǎng)相關(guān)性時(shí),去趨勢(shì)協(xié)方差函數(shù)與標(biāo)度n滿足
Fdcca(n)~nh
(4)
(5)
式中:h為DCCA標(biāo)度指數(shù),即兩序列間耦合特征,衡量?jī)尚蛄虚g的耦合強(qiáng)度;Rdcca為去趨勢(shì)互相關(guān)函數(shù)。
1.1.2 系統(tǒng)多變量耦合關(guān)系網(wǎng)絡(luò)構(gòu)建 基于去趨勢(shì)互相關(guān)分析,可以得到兩變量之間相關(guān)關(guān)系,而復(fù)雜機(jī)電設(shè)備監(jiān)測(cè)點(diǎn)位眾多、監(jiān)測(cè)量豐富,可以同時(shí)獲得多維時(shí)間序列。因此,利用去趨勢(shì)互相關(guān)分析可以構(gòu)建多變量間的相關(guān)關(guān)系,深度挖掘復(fù)雜系統(tǒng)的耦合形態(tài)。系統(tǒng)多變量耦合關(guān)系網(wǎng)絡(luò)構(gòu)建流程如下。
(1)以窗口寬度T截取監(jiān)測(cè)系統(tǒng)各變量時(shí)序數(shù)據(jù),構(gòu)建m維等長(zhǎng)時(shí)間序列集合X={x1,x2,x3,…,xm},其中xm表示第m維監(jiān)測(cè)變量,基于DCCA分析分別計(jì)算集合中兩兩變量之間的標(biāo)度指數(shù)
h11=Rdcca(x1,x1),
h12=Rdcca(x1,x2),…,hmm=Rdcca(xm,xm)
式中:hmm為兩變量間的DCCA標(biāo)度指數(shù)。
(2)按照DCCA標(biāo)度指數(shù)下標(biāo)進(jìn)行排列,得到DCCA標(biāo)度指數(shù)對(duì)稱方陣,用A表示
(6)
式中:hij為變量xi和xj的DCCA標(biāo)度指數(shù)。
(3)以長(zhǎng)度為T的時(shí)間序列X作為節(jié)點(diǎn),以DCCA標(biāo)度系數(shù)對(duì)稱矩陣A為邊,構(gòu)建耦合關(guān)系網(wǎng)絡(luò),如圖10所示,網(wǎng)絡(luò)表示為G=(X,A)。
1.2.1 變分圖自編碼器構(gòu)建 由于變量本身及相互間耦合關(guān)系的復(fù)雜性,系統(tǒng)變量的屬性發(fā)生改變,關(guān)系網(wǎng)絡(luò)G表現(xiàn)出典型的非結(jié)構(gòu)化,該類型數(shù)據(jù)也稱圖結(jié)構(gòu)數(shù)據(jù),因此傳統(tǒng)的針對(duì)結(jié)構(gòu)化數(shù)據(jù)開(kāi)發(fā)的深度學(xué)習(xí)模型不再適用。變分圖自編碼器是一種將變分自編碼器遷移到圖領(lǐng)域的無(wú)監(jiān)督學(xué)習(xí)方法[14],以圖結(jié)構(gòu)數(shù)據(jù)作為輸入,學(xué)習(xí)圖的潛在表示,從而實(shí)現(xiàn)圖的重構(gòu),如圖2所示。
μ—均值;σ—方差;Z—潛在向量;X—節(jié)點(diǎn)特征;A—鄰接矩陣;q—后驗(yàn)分布;p—先驗(yàn)分布;Fgcn,σ、Fgcn,μ—均值和方差的圖卷積函數(shù)。
在變分圖自編碼器中,給定節(jié)點(diǎn)特征X和鄰接矩陣A,首先通過(guò)圖卷積網(wǎng)絡(luò)GCN學(xué)習(xí)數(shù)據(jù)分布,并從該分布中采樣得到潛在向量Z,從而學(xué)習(xí)圖的潛在表示,以充分考慮到樣本潛在空間的可變性,擴(kuò)展模型的表現(xiàn)力,這個(gè)過(guò)程稱為編碼。利用潛在向量Z通過(guò)內(nèi)積重構(gòu)出原始圖,這個(gè)過(guò)程稱為解碼。編碼和解碼的詳細(xì)過(guò)程描述如下。
(1)編碼過(guò)程。給定系統(tǒng)多變量關(guān)系網(wǎng)絡(luò)G,首先利用圖卷積網(wǎng)絡(luò)學(xué)習(xí)其所屬分布,本文采用兩層GCN作為編碼器學(xué)習(xí)目標(biāo)分布,并采樣得到潛在向量Z。圖卷積網(wǎng)絡(luò)的結(jié)構(gòu)如圖3所示。
圖3 圖卷積網(wǎng)絡(luò)結(jié)構(gòu)
模型假設(shè)目標(biāo)為高斯分布,可以唯一地由二階矩確定,因此在變分圖自編碼模型中利用GCN來(lái)計(jì)算目標(biāo)分布的均值和方差
(7)
(8)
μ=Fgcn(X,A)
(9)
logσ=Fgcn,σ(X,A)
(10)
Fgcn,μ和Fgcn,σ分別為均值和方差的GCN函數(shù),共享第1層參數(shù)W0,第2層參數(shù)W1不共享,使用下標(biāo)區(qū)分。
通過(guò)均值和方差確定G(X,A)的后驗(yàn)分布g(Z|X,A)
(11)
(12)
式中:zi為潛在向量Z的元素。
(2)解碼過(guò)程。從編碼器獲取的分布中采樣得到的潛在變量?jī)?nèi)積作為解碼器,激活函數(shù)通常選用Sigmoid,通過(guò)計(jì)算概率實(shí)現(xiàn)重構(gòu),過(guò)程表示為
(13)
(14)
(3)模型學(xué)習(xí)。變分圖自編碼器希望重構(gòu)圖與原始圖盡可能相似的同時(shí),GCN計(jì)算的分布與標(biāo)準(zhǔn)高斯分布盡可能相似。因此,損失函數(shù)由交叉熵和KL散度H兩部分構(gòu)成,交叉熵用于衡量自編碼器的重構(gòu)相似性,H用于衡量?jī)蓚€(gè)分布之間的相似性
(15)
通過(guò)執(zhí)行重參數(shù)化技巧[15]和批量梯度下降,完成異常檢測(cè)模型訓(xùn)練。
1.2.2 基于重建概率的異常檢測(cè) 變分圖自編碼器計(jì)算從學(xué)習(xí)到的分布中產(chǎn)生原始數(shù)據(jù)的概率,稱為重建概率R,計(jì)算公式如下
R=Eq(Z|X,A)[logp(A|Z)]
(16)
通過(guò)分析重建概率的變化趨勢(shì)或突變程度,實(shí)現(xiàn)對(duì)系統(tǒng)的異常檢測(cè)??紤]到系統(tǒng)正常運(yùn)行狀態(tài)下重建概率較大,且具有較小的波動(dòng)性,采用指數(shù)加權(quán)移動(dòng)平均值[16]設(shè)定閾值,具有較高的敏感性,可有效檢測(cè)重建概率的波動(dòng)過(guò)程。
指數(shù)加權(quán)移動(dòng)平均值(EWMA)的統(tǒng)計(jì)量為
lt=λR+(1-λ)lt-1
(17)
式中:t為時(shí)間;λ為歷史R對(duì)當(dāng)前EWMA統(tǒng)計(jì)量的權(quán)重,λ∈(0,1],基于研究分析該過(guò)程中取λ=0.2;l0為某段監(jiān)測(cè)時(shí)間內(nèi)R的均值。
EWMA統(tǒng)計(jì)量的均值和方差可通過(guò)下式確定
μlt=μR
(18)
(19)
系統(tǒng)的EWMA控制圖基于時(shí)間t的下限函數(shù)為
(20)
式中:μR為訓(xùn)練集重建概率R的均值;σR為訓(xùn)練集R的標(biāo)準(zhǔn)差;ns為采樣長(zhǎng)度;z取2。
從式(20)可以看出,當(dāng)t增大時(shí),(1-λ)2t將收斂到0,下限將穩(wěn)定到一個(gè)固定值,因此使用下式計(jì)算該固定值作為閾值
(21)
當(dāng)測(cè)試樣本的重建概率Rt 本文所提異常檢測(cè)方法,通過(guò)建立系統(tǒng)不同傳感器產(chǎn)生的多維度多狀態(tài)監(jiān)測(cè)變量間的耦合關(guān)系網(wǎng)絡(luò),挖掘多維時(shí)間序列間的相關(guān)關(guān)系。進(jìn)一步引入變分圖自編碼器,使用正常數(shù)據(jù)訓(xùn)練模型,能夠提取耦合關(guān)系網(wǎng)絡(luò)的重要特征,并確定重建概率閾值,使用重建概率作為異常分?jǐn)?shù)從而實(shí)現(xiàn)半監(jiān)督的異常檢測(cè),算法流程如圖4所示。 圖4 基于耦合網(wǎng)絡(luò)的VGAE異常檢測(cè)流程圖 所提異常檢測(cè)方法主要步驟如下。 (1)數(shù)據(jù)歸一化。DCS系統(tǒng)所采集的數(shù)據(jù)數(shù)量級(jí)各異,會(huì)給分析系統(tǒng)狀態(tài)帶來(lái)較大影響,因而需對(duì)監(jiān)測(cè)數(shù)據(jù)進(jìn)行歸一化處理,公式如下 (22) (2)基于歷史正常數(shù)據(jù)的系統(tǒng)多變量耦合網(wǎng)絡(luò)構(gòu)建。選取合適的窗口寬度T和步長(zhǎng)S,以窗口寬度T截取時(shí)間序列X={x1,x2,x3,…,xm},按照1.1方法計(jì)算兩兩變量之間的DCCA標(biāo)度指數(shù),以步長(zhǎng)S進(jìn)行滑動(dòng),得出一系列DCCA標(biāo)度系數(shù)對(duì)稱矩陣,完成系統(tǒng)多變量間的耦合關(guān)系網(wǎng)絡(luò)構(gòu)建。 (3)基于變分圖自編碼器的異常檢測(cè)模型構(gòu)建。利用正常數(shù)據(jù)建立的耦合關(guān)系網(wǎng)絡(luò)訓(xùn)練變分圖自編碼器,模型學(xué)習(xí)輸入樣本分布的均值和方差參數(shù),并計(jì)算重建概率和EWMA閾值。 (4)異常檢測(cè)模型應(yīng)用。使用實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù)作為測(cè)試樣本,構(gòu)建耦合關(guān)系網(wǎng)絡(luò),輸入訓(xùn)練階段訓(xùn)練好的模型得到測(cè)試樣本重建概率,當(dāng)測(cè)試樣本的重建概率Rt 采用某火力發(fā)電廠汽輪機(jī)組轉(zhuǎn)子系統(tǒng)DCS多源監(jiān)測(cè)數(shù)據(jù),對(duì)所提異常檢測(cè)方法進(jìn)行驗(yàn)證,并對(duì)方法中關(guān)鍵參數(shù)進(jìn)行研究,為方法的應(yīng)用提供理論指導(dǎo)。 該轉(zhuǎn)子系統(tǒng)DCS多源監(jiān)測(cè)數(shù)據(jù)共包含33組時(shí)間序列,涵蓋振動(dòng)、溫度、壓力等多種物理量。由于各物理量所在測(cè)點(diǎn)存在冗余,剔除同一類型傳感器同一位置不同測(cè)點(diǎn)的監(jiān)測(cè)變量;同時(shí)由于DCS系統(tǒng)所采集的振動(dòng)數(shù)據(jù)采樣率低,無(wú)法準(zhǔn)確反映設(shè)備狀態(tài),在進(jìn)行多源數(shù)據(jù)融合時(shí)將其剔除,最終保留其中17組狀態(tài)變量進(jìn)行轉(zhuǎn)子系統(tǒng)運(yùn)行狀態(tài)識(shí)別。所選變量的詳細(xì)信息如表1所示,各變量所在測(cè)點(diǎn)位置如圖5所示。 表1 汽輪機(jī)轉(zhuǎn)子系統(tǒng)監(jiān)測(cè)變量表 A—主油泵;B—高壓缸;C—中壓缸;D—低壓缸;E—低壓缸;F—聯(lián)軸冷卻器;G—發(fā)電機(jī);H—集電環(huán);0~16—含義見(jiàn)表1。 該轉(zhuǎn)子系統(tǒng)于2017年5月12日出現(xiàn)異常,經(jīng)過(guò)緊急維修,系統(tǒng)又持續(xù)運(yùn)行24 d,之后進(jìn)行了停機(jī)檢修,恢復(fù)至正常狀態(tài)。因此,本文選取該轉(zhuǎn)子系統(tǒng)2月10日至6月18日的監(jiān)測(cè)數(shù)據(jù)進(jìn)行相關(guān)驗(yàn)證。 2.2.1 評(píng)價(jià)指標(biāo) 在進(jìn)行異常檢測(cè)或故障診斷時(shí),不希望模型將設(shè)備正常狀態(tài)判斷為異常狀態(tài)(假陰性)或?qū)惓顟B(tài)判斷為正常狀態(tài)(假陽(yáng)性)。傳統(tǒng)的準(zhǔn)確率是對(duì)模型總體性能的衡量,不能凸顯異常檢測(cè)對(duì)假陰性以及假陽(yáng)性的關(guān)注。因此,本文選用接受者操作特征曲線下面積[17]作為評(píng)價(jià)指標(biāo),衡量模型的有效性,稱為AUC概率。接受者操作特征曲線(ROC)橫坐標(biāo)為假陽(yáng)率,縱坐標(biāo)為真陽(yáng)率,模型的性能越好所對(duì)應(yīng)的假陽(yáng)率越低,真陽(yáng)率越高,即其曲線下面積越大。通過(guò)混淆矩陣對(duì)檢測(cè)結(jié)果進(jìn)行分類,如表2所示。 表2 混淆矩陣 根據(jù)混淆矩陣可以計(jì)算得假陽(yáng)率FPR和真陽(yáng)率TPR為 (23) (24) 2.2.2 模型參數(shù)設(shè)置 本文所提異常檢測(cè)方法共有3個(gè)參數(shù),分別為時(shí)序數(shù)據(jù)截取窗口寬度T,時(shí)序數(shù)據(jù)截取窗口滑動(dòng)長(zhǎng)度S,以及變分圖自編碼器嵌入維數(shù)D。其中,時(shí)序數(shù)據(jù)截取窗口滑動(dòng)長(zhǎng)度S決定著所提方法的最小檢測(cè)間隔時(shí)間,為及時(shí)發(fā)現(xiàn)轉(zhuǎn)子系統(tǒng)異常狀態(tài),選擇每次滑動(dòng)10個(gè)數(shù)據(jù)點(diǎn)進(jìn)行檢測(cè),即每隔10 min進(jìn)行一次系統(tǒng)運(yùn)行狀態(tài)的識(shí)別;時(shí)序數(shù)據(jù)截取窗口寬度T決定著去趨勢(shì)互相關(guān)分析中兩變量的長(zhǎng)度,對(duì)分析兩變量間的相關(guān)關(guān)系至關(guān)重要。本文考慮火電廠的日工作特性,選取720、1 440、2 160、2 880的數(shù)據(jù)長(zhǎng)度進(jìn)行對(duì)照分析,對(duì)照結(jié)果如圖6所示。選擇每次截取24 h數(shù)據(jù)(每隔1 min采集一個(gè)數(shù)據(jù)點(diǎn),截取數(shù)據(jù)量為1 440)以生成所需多變量耦合關(guān)系數(shù)據(jù)效果最佳;變分圖自編碼器嵌入維數(shù)D決定著變分圖自編碼器的特征提取能力,維度太低特征提取能力不足,維度太高容易出現(xiàn)過(guò)擬合問(wèn)題,因此需對(duì)該參數(shù)進(jìn)行尋優(yōu)。 圖6 不同窗口寬度T的平均性能 以火電廠汽輪機(jī)轉(zhuǎn)子系統(tǒng)2017年2月至4月的正常狀態(tài)數(shù)據(jù)為訓(xùn)練樣本,訓(xùn)練本文提出的異常檢測(cè)模型;以5月至7月既包含正常狀態(tài)又包含異常狀態(tài)的數(shù)據(jù)為驗(yàn)證集,驗(yàn)證訓(xùn)練好的異常檢測(cè)模型。按照文獻(xiàn)[18]中的方式初始化權(quán)重,使用Adam[19]訓(xùn)練200次迭代,學(xué)習(xí)率設(shè)為0.01。變分圖自編碼器嵌入維數(shù)D對(duì)模型性能影響規(guī)律如圖7所示。從圖7可以發(fā)現(xiàn),當(dāng)變分圖自編碼器嵌入維數(shù)為32時(shí),本文方法獲得了最佳性能,因此后續(xù)均以32作為變分圖自編碼器的嵌入維數(shù)。 圖7 不同嵌入維度的平均性能 2.2.3 汽輪機(jī)運(yùn)行狀態(tài)檢測(cè)結(jié)果 以2.2.2節(jié)所述參數(shù)設(shè)置及實(shí)驗(yàn)方案,對(duì)本文方法的檢測(cè)效果展開(kāi)研究。本文方法以模型重建概率為指標(biāo)判斷設(shè)備的運(yùn)行狀態(tài),利用式(6)得到多變量耦合網(wǎng)絡(luò),進(jìn)而根據(jù)式(9)~(14)對(duì)模型進(jìn)行訓(xùn)練,僅使用正常數(shù)據(jù)訓(xùn)練時(shí),模型的重建概率及所對(duì)應(yīng)閾值分別由式(16)和式(21)計(jì)算得出,計(jì)算結(jié)果如圖8所示。從圖中可以看出,隨設(shè)備運(yùn)行狀態(tài)的波動(dòng),模型重建概率也隨之波動(dòng),但均高于對(duì)應(yīng)閾值,因此模型判斷此時(shí)設(shè)備處于正常狀態(tài)。利用測(cè)試數(shù)據(jù)對(duì)該模型進(jìn)行驗(yàn)證,同樣根據(jù)式(16),得到模型在測(cè)試數(shù)據(jù)集上的重建概率如圖9所示。當(dāng)設(shè)備運(yùn)行處于正常狀態(tài)時(shí),監(jiān)測(cè)數(shù)據(jù)的重建概率在閾值以上波動(dòng);當(dāng)設(shè)備異常時(shí),即5月12日,監(jiān)測(cè)數(shù)據(jù)的重建概率發(fā)生突變,之后的24 d內(nèi)重構(gòu)概率均處于EWMA閾值以下;當(dāng)設(shè)備大修之后,監(jiān)測(cè)數(shù)據(jù)的重構(gòu)概率逐漸恢復(fù),意味著轉(zhuǎn)子系統(tǒng)正常運(yùn)行。 圖8 訓(xùn)練集重建概率R及EWMA閾值控制圖 圖9 測(cè)試集重建概率R及EWMA閾值控制圖 耦合關(guān)系網(wǎng)絡(luò)作為本文方法的關(guān)鍵,一方面可以挖掘復(fù)雜監(jiān)測(cè)系統(tǒng)各監(jiān)測(cè)變量的關(guān)聯(lián)關(guān)系,擺脫傳統(tǒng)方法僅對(duì)單一數(shù)據(jù)進(jìn)行建模,檢測(cè)靈敏度低的困境;另一方面又可以為變分自編碼器提供良好的輸入,便于建立數(shù)據(jù)與狀態(tài)的映射關(guān)系。利用2.2.2節(jié)的時(shí)序數(shù)據(jù)截取窗口寬度T和時(shí)序數(shù)據(jù)截取窗口滑動(dòng)長(zhǎng)度S,分析轉(zhuǎn)子系統(tǒng)正常狀態(tài)和異常狀態(tài)下的耦合網(wǎng)絡(luò),結(jié)果如圖10所示。圖中數(shù)字節(jié)點(diǎn)表示汽輪機(jī)轉(zhuǎn)子系統(tǒng)監(jiān)測(cè)變量,節(jié)點(diǎn)間的連線代表DCCA矩陣各元素的值,表征兩變量間耦合關(guān)系大小,節(jié)點(diǎn)間無(wú)連線說(shuō)明兩變量間無(wú)耦合。當(dāng)設(shè)備均處于正常(或異常)狀態(tài)時(shí),各時(shí)刻耦合網(wǎng)絡(luò)存在差異性(橫向比較),說(shuō)明單純依靠數(shù)值判斷無(wú)法準(zhǔn)確確定設(shè)備的運(yùn)行狀態(tài),仍需進(jìn)一步提取耦合關(guān)系特征進(jìn)行狀態(tài)識(shí)別;當(dāng)設(shè)備由正常狀態(tài)轉(zhuǎn)為異常狀態(tài)時(shí),監(jiān)測(cè)變量耦合關(guān)系發(fā)生了較狀態(tài)內(nèi)部差異更為顯著的變化。例如,當(dāng)設(shè)備處于正常狀態(tài),變量0、變量12、變量15與其他變量均沒(méi)有關(guān)聯(lián)關(guān)系;當(dāng)設(shè)備處于異常狀態(tài)時(shí),變量0、變量12、變量15與其他變量產(chǎn)生了關(guān)聯(lián)關(guān)系,說(shuō)明耦合關(guān)系網(wǎng)絡(luò)能夠很好地捕捉設(shè)備狀態(tài)變化。 (a)正常狀態(tài)下耦合關(guān)系網(wǎng)絡(luò) 2.2.4 方法對(duì)比 為驗(yàn)證本文方法的先進(jìn)性,本節(jié)引入5種常用的無(wú)監(jiān)督學(xué)習(xí)模型進(jìn)行對(duì)比,模型分別為圖自編碼器(GAE)[14]、卷積變分自編碼器(CVAE)[21]、卷積自編碼器(CAE)[20]、變分自編碼器(VAE)[6]以及自編碼器(AE)[5]。由于5種模型的輸入特性不同,因此上述5種模型的輸入分別對(duì)應(yīng)為原始狀態(tài)向量、原始狀態(tài)向量、耦合關(guān)系矩陣、耦合關(guān)系矩陣、原始狀態(tài)向量+耦合關(guān)系矩陣。此外,構(gòu)建多變量間的耦合關(guān)系除可采用去趨勢(shì)互相關(guān)分析外,文獻(xiàn)[14]還提出基于圖結(jié)構(gòu)數(shù)據(jù)的0和1鄰接矩陣建立變量間的關(guān)聯(lián)關(guān)系,但其只能定性表征節(jié)點(diǎn)間的相關(guān)關(guān)系,本文也將對(duì)其進(jìn)行比較。為了避免實(shí)驗(yàn)中的隨機(jī)性,每組實(shí)驗(yàn)重復(fù)5次,平均結(jié)果如圖11所示,其中A和X作為模型的輸入,分別表示鄰接矩陣和特征矩陣。 從圖11可以看出,本文所提方法異常檢測(cè)結(jié)果優(yōu)于其他方法或輸入的檢測(cè)結(jié)果。由圖11a可以看出,包含變量及變量間關(guān)聯(lián)關(guān)系的方法檢測(cè)準(zhǔn)確率明顯高于僅含一種輸入的方法,變分圖自編碼器因引入圖卷積網(wǎng)絡(luò)作為編碼層,實(shí)現(xiàn)對(duì)圖數(shù)據(jù)的特征提取,效果明顯優(yōu)于傳統(tǒng)方法,且變分圖自編碼模型的特征提取能力優(yōu)于基于重建誤差的圖自編碼器。由圖11b可以看出,相較于文獻(xiàn)[14]所提利用鄰接矩陣表示變量間相關(guān)關(guān)系,去趨勢(shì)互相關(guān)分析通過(guò)計(jì)算兩兩變量間的去趨勢(shì)互相關(guān)進(jìn)而構(gòu)成耦合網(wǎng)絡(luò),定量表征了復(fù)雜系統(tǒng)多源狀態(tài)間的耦合性,能夠更加準(zhǔn)確地表示變量間的耦合關(guān)系。 (a)算法 本文提出了一種基于多變量耦合網(wǎng)絡(luò)的變分圖自編碼模型,實(shí)現(xiàn)汽輪機(jī)轉(zhuǎn)子系統(tǒng)異常檢測(cè)。針對(duì)汽輪機(jī)組多維多態(tài)監(jiān)測(cè)數(shù)據(jù),采用去趨勢(shì)互相關(guān)分析(DCCA)方法,對(duì)多維變量間的相關(guān)關(guān)系進(jìn)行定量分析,構(gòu)建系統(tǒng)多變量耦合關(guān)系網(wǎng)絡(luò);進(jìn)一步建立變分圖自編碼模型,對(duì)系統(tǒng)多變量耦合關(guān)系網(wǎng)絡(luò)進(jìn)行節(jié)點(diǎn)嵌入和特征提取。模型使用圖卷積網(wǎng)絡(luò)學(xué)習(xí)輸入數(shù)據(jù)的分布,采樣獲得其潛在表示,實(shí)現(xiàn)耦合網(wǎng)絡(luò)的重構(gòu),采用重建概率作為異常分?jǐn)?shù),通過(guò)正常狀態(tài)的耦合網(wǎng)絡(luò)訓(xùn)練所得模型,對(duì)測(cè)試數(shù)據(jù)進(jìn)行異常檢測(cè)。 實(shí)驗(yàn)結(jié)果表明:與人為建立多變量耦合關(guān)系網(wǎng)絡(luò)特征指標(biāo)進(jìn)行異常檢測(cè)的方法相比,本文方法通過(guò)建立變分圖自編碼模型,自適應(yīng)提取耦合網(wǎng)絡(luò)的深層特征,減少了人為因素和先驗(yàn)知識(shí)的影響,檢測(cè)結(jié)果更客觀準(zhǔn)確;與直接使用原始多維狀態(tài)變量作為模型輸入的深度學(xué)習(xí)方法相比,本文方法通過(guò)建立多維變量間的耦合關(guān)系,能更準(zhǔn)確地挖掘機(jī)組出現(xiàn)異常前狀態(tài)參數(shù)間相關(guān)關(guān)系的變化。該方法可應(yīng)用于工程實(shí)際中汽輪機(jī)組轉(zhuǎn)子系統(tǒng)狀態(tài)異常檢測(cè)。1.3 基于DCCA-VGAE的異常檢測(cè)方法
2 實(shí)例驗(yàn)證
2.1 數(shù)據(jù)描述
2.2 汽輪機(jī)運(yùn)行狀態(tài)檢測(cè)結(jié)果分析
3 結(jié) 論