劉鵬濤
國(guó)家管網(wǎng)集團(tuán)西部管道有限責(zé)任公司, 甘肅 蘭州 730070
近年來,為減弱以煤炭為主的能源結(jié)構(gòu)體系對(duì)環(huán)境造成的破壞與污染,實(shí)現(xiàn)“雙碳”目標(biāo),以天然氣為主的清潔能源成為實(shí)現(xiàn)能源低碳轉(zhuǎn)型的最佳途徑。天然氣的主要成分是甲烷,與其他燃料相比,天然氣具有成本低、使用安全性高和環(huán)保價(jià)值較高的優(yōu)點(diǎn),被廣泛應(yīng)用于工業(yè)制造[1]、發(fā)電[2]以及城市生活燃?xì)鈁3]等領(lǐng)域。從天然氣的集中開采到使用的過程中,管道運(yùn)輸是天然氣的主要運(yùn)送方式,在管道中通過壓縮機(jī)組對(duì)天然氣進(jìn)行加壓,以額定壓力連續(xù)平穩(wěn)地將天然氣交付給下游客戶。作為管道運(yùn)輸?shù)年P(guān)鍵特種設(shè)備,壓縮機(jī)組主要由壓縮機(jī)體、潤(rùn)滑系統(tǒng)、密封系統(tǒng)和輔助系統(tǒng)組成[4],為天然氣遠(yuǎn)距離傳輸持續(xù)提供壓力保障。然而,由于天然氣的高溫、高壓和易腐蝕等特征,壓縮機(jī)組運(yùn)行過程中極易發(fā)生故障,造成燃?xì)庑孤?、全線停輸,甚至爆炸。研究表明,提前對(duì)壓縮機(jī)組的關(guān)鍵信號(hào)量監(jiān)測(cè)數(shù)據(jù)進(jìn)行分析能極大降低風(fēng)險(xiǎn)和減少事故處理成本,建立可靠的模型進(jìn)行預(yù)警分析已成為當(dāng)前的研究熱點(diǎn)[5]。
目前,常用的預(yù)警分析模型主要分為三類,即基于模式識(shí)別、模糊綜合評(píng)估和深度學(xué)習(xí)。類似于機(jī)器學(xué)習(xí),模式識(shí)別通過建立模型訓(xùn)練壓縮機(jī)組的歷史監(jiān)測(cè)數(shù)據(jù)來預(yù)測(cè)當(dāng)前機(jī)組的狀態(tài)。Wang Jiangyu等人[6]通過分析歷史監(jiān)測(cè)數(shù)據(jù)的相關(guān)性進(jìn)行特征提取,依據(jù)分類和回歸樹建立了機(jī)組故障檢測(cè)決策樹模型(Classification and Regression Tree,CART),當(dāng)數(shù)據(jù)規(guī)模較大時(shí),該算法模型取得預(yù)警效果并不理想。Li Guannan等人[7]通過支持向量數(shù)據(jù)描述(Support Vector Data Description,SVDD)的統(tǒng)計(jì)值判斷數(shù)據(jù)樣本是否出現(xiàn)在正常區(qū)域內(nèi),作為故障檢測(cè)的依據(jù),結(jié)合主成分分析(Principal Component Analysis,PCA)提出一種PCA-R-SVDD故障預(yù)警模型。Cui Chao等人[8]將PCA和反向傳播相結(jié)合,對(duì)歷史監(jiān)測(cè)數(shù)據(jù)進(jìn)行最優(yōu)變量選擇并構(gòu)建動(dòng)態(tài)記憶矩陣,提出簡(jiǎn)化的多變量狀態(tài)估計(jì)(Multivariate State Estimation Technique,MSET)預(yù)警模型。Li Xiaochuan等人[9]通過皮爾遜相關(guān)系數(shù)分析歷史正常數(shù)據(jù)和故障數(shù)據(jù)的區(qū)別,依據(jù)粒子濾波建立了增強(qiáng)代謝灰色故障預(yù)測(cè)模型。這些方法的共同點(diǎn)是通過故障數(shù)據(jù)訓(xùn)練模型參數(shù)進(jìn)行故障預(yù)警,但壓縮機(jī)組的故障數(shù)據(jù)樣本數(shù)量較小,故障類別偏多,依據(jù)PCA和相關(guān)系數(shù)等多元統(tǒng)計(jì)分析方法進(jìn)行深層次數(shù)據(jù)特征挖掘時(shí)故障預(yù)警的準(zhǔn)確性表現(xiàn)較差[10]。
模糊綜合評(píng)估是基于模糊數(shù)學(xué)原理,通過分析故障產(chǎn)生的各種因素建立評(píng)價(jià)指標(biāo)來判別機(jī)組的運(yùn)行狀態(tài)。Gan Luping等人[11]考慮故障類別的相關(guān)性,通過整合故障關(guān)鍵性分析和故障樹提出了加權(quán)模糊風(fēng)險(xiǎn)優(yōu)先級(jí)數(shù)的評(píng)估方法,一定程度上從定性和定量?jī)煞矫嬖鰪?qiáng)了壓縮機(jī)風(fēng)險(xiǎn)評(píng)估的準(zhǔn)確性。為緩解指標(biāo)相關(guān)性對(duì)風(fēng)險(xiǎn)評(píng)估的影響,Sun Yanji等人[12]采用最大互信息系數(shù)消除高度相關(guān)的數(shù)據(jù)指標(biāo),通過二階馬爾可夫模型獲得各個(gè)獨(dú)立數(shù)據(jù)指標(biāo)的預(yù)測(cè)值和優(yōu)先級(jí),再依據(jù)模糊隸屬度加權(quán)法評(píng)估壓縮機(jī)組的運(yùn)行狀態(tài)。Ge Haiyang等人[13]結(jié)合模糊層次分析法、模糊綜合評(píng)價(jià)法以及增強(qiáng)故障模式效應(yīng)分析,提出了基于增強(qiáng)故障模式效應(yīng)分析的復(fù)雜系統(tǒng)風(fēng)險(xiǎn)評(píng)估模型。然而這些指標(biāo)體系的建立過于主觀并且無法有效評(píng)估復(fù)雜系統(tǒng)中的多種失效模式。
隨著深度學(xué)習(xí)在圖像識(shí)別、自然語(yǔ)言處理以及強(qiáng)化學(xué)習(xí)等計(jì)算機(jī)領(lǐng)域取得突破性進(jìn)展,吸引了工控領(lǐng)域的大量學(xué)者展開了對(duì)深度學(xué)習(xí)的研究。Li Xiaochuan等人[14]依據(jù)環(huán)境和氣體溫度的歷史監(jiān)測(cè)數(shù)據(jù),通過長(zhǎng)短期記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)預(yù)測(cè)進(jìn)氣溫度,利用規(guī)范變量分析將進(jìn)氣溫度的變化作為評(píng)判壓縮機(jī)組運(yùn)行性能的依據(jù),雖然該方法有效預(yù)測(cè)了進(jìn)氣溫度但僅利用溫度的變化作為故障預(yù)警的依據(jù)并不可靠。Babu T N等人[15]通過傅里葉變換將軸承振動(dòng)數(shù)據(jù)轉(zhuǎn)化為頻域信號(hào),按振動(dòng)信號(hào)的變化通過人工神經(jīng)網(wǎng)絡(luò)對(duì)壓縮機(jī)組運(yùn)行數(shù)據(jù)進(jìn)行預(yù)警分析。為增強(qiáng)原始數(shù)據(jù)表示強(qiáng)度,Zhao Dongfang等人[16]將壓縮機(jī)組振動(dòng)數(shù)據(jù)轉(zhuǎn)化為二維數(shù)據(jù)重排,結(jié)合注意力機(jī)制與卷積神經(jīng)網(wǎng)絡(luò),提出了基于信號(hào)重排的機(jī)組故障診斷模型,但這些算法模型僅適用于單一信號(hào)量監(jiān)測(cè)數(shù)據(jù)的故障預(yù)警。Qiu Jingwei[17]等人綜合考慮壓縮機(jī)組各子系統(tǒng)的監(jiān)測(cè)數(shù)據(jù),通過深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Networks,DNN)學(xué)習(xí)到主要數(shù)據(jù)的特征表示,作為隱馬爾可夫(Hidden Markov Model,HMM)的顯性輸入推斷壓縮機(jī)組的故障類型,提出一種基于DNN-HNN的故障預(yù)警模型,雖然結(jié)合考慮了子系統(tǒng)數(shù)據(jù)之間的關(guān)聯(lián)性,但該方法過于依賴主特征對(duì)預(yù)警結(jié)果的影響。
現(xiàn)階段,Tian Huixin等人[18]整合振動(dòng)信號(hào)、溫度、壓力等多個(gè)參數(shù)信息,采用深度置信網(wǎng)絡(luò)進(jìn)行多維斷層特征提取,之后依據(jù)特征提取結(jié)果構(gòu)建健康曲線以此判斷壓縮機(jī)組運(yùn)行狀態(tài),提出基于深度置信網(wǎng)絡(luò)的時(shí)空特征融合故障診斷方法(Spatio-Temporal Features Fusion Based on Deep Belief Network,STF-DBN)。馬海輝等人[19]依據(jù)傅里葉變化將壓縮機(jī)組運(yùn)行數(shù)據(jù)轉(zhuǎn)化為頻域特征,作為卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)的輸入,輸出層利用Softmax函數(shù)進(jìn)行故障識(shí)別,壓縮機(jī)組運(yùn)行數(shù)據(jù)從時(shí)域到頻域的轉(zhuǎn)化,極大減少了人為提取特征的主觀性。雖然這些方法在一定程度上取得了較好的預(yù)測(cè)效果,但并未考慮壓縮機(jī)組系統(tǒng)中具有關(guān)聯(lián)關(guān)系信號(hào)量作用下的隱含特征對(duì)壓縮機(jī)組運(yùn)行的影響。如壓縮機(jī)的出口溫度受動(dòng)力渦輪轉(zhuǎn)速、上游進(jìn)口壓力、進(jìn)口溫度、環(huán)境溫度、潤(rùn)滑系統(tǒng)、密封系統(tǒng)、空冷等多種因素影響,這些信號(hào)量監(jiān)測(cè)數(shù)據(jù)同時(shí)發(fā)生波動(dòng)會(huì)使出口溫度急劇增高或降低,如果不及時(shí)預(yù)警會(huì)造成壓縮機(jī)組故障停機(jī),影響上下游正常運(yùn)輸,甚至帶來嚴(yán)重的社會(huì)和經(jīng)濟(jì)問題。此外,這些神經(jīng)網(wǎng)絡(luò)僅適用于具有一定規(guī)則的結(jié)構(gòu)數(shù)據(jù),對(duì)多信號(hào)量作用下的非歐結(jié)構(gòu)數(shù)據(jù)并不有效[20];并且壓縮機(jī)組站控報(bào)警系統(tǒng)僅在單一信號(hào)量超過設(shè)定值時(shí)才發(fā)生報(bào)警,對(duì)多因素微小故障影響下的隱含特征并不敏感。
因此,考慮多因素作用下的隱含特征對(duì)壓縮機(jī)組運(yùn)行的影響,通過圖卷積神經(jīng)網(wǎng)絡(luò)(Graph Convolution Neural Networks,GCNN)對(duì)信號(hào)量的隱含特征進(jìn)行特征提取,提出一種基于GCNN的壓縮機(jī)組風(fēng)險(xiǎn)預(yù)警模型。首先將時(shí)序的信號(hào)量監(jiān)測(cè)數(shù)據(jù)轉(zhuǎn)化為基于時(shí)間點(diǎn)的信號(hào)網(wǎng)絡(luò),依據(jù)信號(hào)網(wǎng)絡(luò)中節(jié)點(diǎn)之間的關(guān)聯(lián)關(guān)系挖掘信號(hào)量的隱含特征;其次通過改進(jìn)的密度峰值聚類(An Improved Density Peak Fast Search Algorithm,AIDP)算法,對(duì)信號(hào)網(wǎng)絡(luò)進(jìn)行故障粗分類,獲得訓(xùn)練數(shù)據(jù)標(biāo)簽;最后通過GCNN學(xué)習(xí)標(biāo)簽數(shù)據(jù)的隱含特征,在輸出層依據(jù)鄰接矩陣進(jìn)一步強(qiáng)化隱含特征表示,實(shí)現(xiàn)壓縮機(jī)組風(fēng)險(xiǎn)預(yù)警分析。
密度峰值聚類(Clustering by Fast Search and Find of Density Peaks,CDP)算法是2014年發(fā)表在SCIENCE期刊上基于距離的聚類算法[21]。相比于其他類型聚類算法,CDP算法通過計(jì)算每個(gè)數(shù)據(jù)點(diǎn)的局部密度和最小距離能自動(dòng)獲取類簇中心;并且能夠快速高效地聚類任意形狀的數(shù)據(jù)點(diǎn)。由于易理解、易擴(kuò)展和高效性等特征,該算法近幾年來吸引了大量研究學(xué)者對(duì)其改進(jìn)并應(yīng)用到各個(gè)領(lǐng)域。
CDP算法的主要思想是通過計(jì)算任意兩個(gè)數(shù)據(jù)點(diǎn)之間的歐氏距離得到截?cái)嗑嚯xdc,依據(jù)dc挖掘每個(gè)數(shù)據(jù)點(diǎn)的近鄰,即局部密度ρi,考慮不同類簇?cái)?shù)據(jù)點(diǎn)之間的最小距離δi盡可能大,同類簇?cái)?shù)據(jù)點(diǎn)之間的δi盡可能小,以ρi為橫軸,δi為縱軸構(gòu)建決策圖,依據(jù)決策圖將ρi和δi較大的數(shù)據(jù)點(diǎn)作為類簇中心,最后將剩余數(shù)據(jù)點(diǎn)依據(jù)鄰域分配到各個(gè)類中心所在的簇。
當(dāng)數(shù)據(jù)點(diǎn)規(guī)模較大、類簇差異較小時(shí),僅依據(jù)決策圖并不能直觀區(qū)分ρi和δi較大的數(shù)據(jù)點(diǎn)作為類簇中心[22];且CDP算法并不適用于無規(guī)則結(jié)構(gòu)的非歐空間數(shù)據(jù)。本文通過定義信號(hào)網(wǎng)絡(luò)的結(jié)構(gòu)相似度,依據(jù)類中心值和類中心值變化率來自動(dòng)選擇聚類中心,提出了AIDP算法。
目前,熱門神經(jīng)網(wǎng)絡(luò)(如LSTM、DBN、DNN和CNN等)僅適用于具有一定規(guī)則的歐氏結(jié)構(gòu)數(shù)據(jù),如文本、圖片、音頻等。但在現(xiàn)實(shí)生活中,很多數(shù)據(jù)的結(jié)構(gòu)特征表現(xiàn)為無規(guī)則特征,不滿足平移不變性特征,如用戶之間的鏈接關(guān)系組成社交網(wǎng)絡(luò)、由知識(shí)圖譜組成的語(yǔ)義網(wǎng)絡(luò)等,這些神經(jīng)網(wǎng)絡(luò)并不能有效提取節(jié)點(diǎn)的特征表示。
GCNN由Kipf T等人[23]于2016年首次提出,依據(jù)傅里葉變換將非歐結(jié)構(gòu)數(shù)據(jù)轉(zhuǎn)化為譜域,通過拉普拉斯算子直接在譜域進(jìn)行卷積操作,按特征表示類別被應(yīng)用于非歐空間圖結(jié)構(gòu)數(shù)據(jù)的節(jié)點(diǎn)分類和圖分類任務(wù)?;谧V域的GCNN特征傳遞方式描述為:
H(l+1)=σ(?H(l)W(l))
(1)
式中:H和H為特征矩陣,分別表示l層的輸出和輸入;?=D0.5(A+I)D0.5為拉普拉斯算子,對(duì)應(yīng)CNN的卷積核,A為鄰接矩陣,I為單位矩陣,D為度矩陣,滿足為l層的特征權(quán)重;σ(·)為激活函數(shù),如(Relu)。
在進(jìn)行特征表示的過程中,由于GCNN很大程度上能夠保留信號(hào)量節(jié)點(diǎn)的隱含特征,本文通過GCNN訓(xùn)練節(jié)點(diǎn)的鄰域獲得隱含特征表示,以提高風(fēng)險(xiǎn)預(yù)警的準(zhǔn)確性。
為及時(shí)了解和掌握壓縮機(jī)組運(yùn)行狀態(tài),保障壓縮機(jī)組安全平穩(wěn)運(yùn)行,通過分析壓縮機(jī)組信號(hào)量歷史監(jiān)測(cè)數(shù)據(jù),提出了基于GCNN的壓縮機(jī)組風(fēng)險(xiǎn)預(yù)警模型,見圖1。為挖掘多個(gè)信號(hào)量微小故障作用下隱含特征對(duì)機(jī)組運(yùn)行的影響,首先時(shí)序信號(hào)量監(jiān)測(cè)值轉(zhuǎn)化為基于時(shí)間點(diǎn)的離散信號(hào)網(wǎng)絡(luò),之后依據(jù)AIPP算法對(duì)信號(hào)網(wǎng)絡(luò)進(jìn)行故障粗分類,獲得訓(xùn)練數(shù)據(jù)標(biāo)簽,最后利用GCNN學(xué)習(xí)標(biāo)簽樣本,充分挖掘信號(hào)量的隱含特征,實(shí)現(xiàn)風(fēng)險(xiǎn)預(yù)警。
圖1 基于GCNN的壓縮機(jī)組風(fēng)險(xiǎn)預(yù)警模型圖
由于數(shù)據(jù)采集與監(jiān)控系統(tǒng)(Supervisory Control and Data Acquisition,SCADA)是以秒為單位獲取壓縮機(jī)組的信號(hào)量監(jiān)測(cè)數(shù)據(jù),這些數(shù)據(jù)存在大量冗余,極大地增加了計(jì)算復(fù)雜度。為降低冗余,本文將SCADA信號(hào)量監(jiān)測(cè)數(shù)據(jù)離散化表示,創(chuàng)新性地給出了信號(hào)量數(shù)據(jù)集的定義描述。之后,考慮信號(hào)量之間的相關(guān)性,將信號(hào)量數(shù)據(jù)集轉(zhuǎn)化為信號(hào)網(wǎng)絡(luò),利用邊權(quán)重和邊權(quán)重取值下限確定網(wǎng)絡(luò)的復(fù)雜程度,通過挖掘網(wǎng)絡(luò)中節(jié)點(diǎn)之間的潛在聯(lián)系來獲取信號(hào)量的隱含特征表示。
2.1.1 信號(hào)量數(shù)據(jù)集
在大量時(shí)序的SCADA數(shù)據(jù)中,以間隔5 s為基準(zhǔn)取該段區(qū)間內(nèi)數(shù)據(jù)的平均值,可以獲得單個(gè)信號(hào)量精準(zhǔn)的預(yù)測(cè)結(jié)果[24]。為了提升計(jì)算效率,通過這種描述方式,本文將時(shí)序的SCADA數(shù)據(jù)轉(zhuǎn)化為離散信號(hào)量取值;同時(shí),考慮信號(hào)量變化趨勢(shì)的差異性和預(yù)警監(jiān)測(cè)的及時(shí)性,將1 min內(nèi)獲得的12個(gè)區(qū)間離散值作為1組信號(hào)量樣本。由此給出了信號(hào)量數(shù)據(jù)集的定義描述:給定m個(gè)SCADA信號(hào)量與n個(gè)時(shí)間點(diǎn)(1 min為1個(gè)時(shí)間點(diǎn)),信號(hào)量數(shù)據(jù)集描述為D=[S1,S2,…,Sn],其中Sn=[sn1,sn2,…,snm]表示第n個(gè)時(shí)間點(diǎn)內(nèi)的m個(gè)信號(hào)量數(shù)據(jù)樣本,snm=表示第m個(gè)信號(hào)量在第n個(gè)時(shí)間點(diǎn)內(nèi)以間隔5 s為基準(zhǔn)的監(jiān)測(cè)平均值。
2.1.2 信號(hào)網(wǎng)絡(luò)表示
壓縮機(jī)組是由多個(gè)子系統(tǒng)組成的集成運(yùn)行系統(tǒng),各子系統(tǒng)的監(jiān)測(cè)信號(hào)量之間存在復(fù)雜的關(guān)聯(lián)關(guān)系,為挖掘信號(hào)量之間潛在聯(lián)系對(duì)壓縮機(jī)組運(yùn)行的影響,本文將各時(shí)間點(diǎn)對(duì)應(yīng)的信號(hào)量數(shù)據(jù)樣本表示為信號(hào)網(wǎng)絡(luò)。
在信號(hào)網(wǎng)絡(luò)中,當(dāng)信號(hào)量節(jié)點(diǎn)之間存在連邊時(shí),表明信號(hào)量節(jié)點(diǎn)之間的監(jiān)測(cè)取值具有較強(qiáng)的相關(guān)性。此外,信號(hào)網(wǎng)絡(luò)的復(fù)雜程度取決于節(jié)點(diǎn)之間的連邊數(shù)量,連邊數(shù)量越多網(wǎng)絡(luò)結(jié)構(gòu)越復(fù)雜,復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu)可以保留更多的信號(hào)量隱含特征,但計(jì)算難度增加;反之,能夠提升計(jì)算效率,但保留的隱含特征較少。本文以信號(hào)量節(jié)點(diǎn)之間的相關(guān)性作為連邊依據(jù),通過邊權(quán)重得到各個(gè)節(jié)點(diǎn)之間相關(guān)系數(shù),之后引入F-score[18]作為邊權(quán)重取值下限,以此確定連邊數(shù)量。
(2)
(3)
綜上,給定信號(hào)量數(shù)據(jù)集D,依據(jù)上述轉(zhuǎn)化方式,與之對(duì)應(yīng)的信號(hào)網(wǎng)絡(luò)最終表示為三元組集合。
現(xiàn)階段,大多算法模型進(jìn)行風(fēng)險(xiǎn)預(yù)警時(shí)主要考慮如何利用信號(hào)量監(jiān)測(cè)數(shù)據(jù)構(gòu)建精確的預(yù)警模型,但劃分故障數(shù)據(jù)標(biāo)簽階段的主觀因素起主要作用。為此,提出了AIDP算法對(duì)各時(shí)間點(diǎn)內(nèi)的信號(hào)網(wǎng)絡(luò)進(jìn)行故障標(biāo)簽粗劃分,類簇的數(shù)量對(duì)應(yīng)標(biāo)簽的種類,將故障標(biāo)簽作為GCNN的訓(xùn)練集,使得風(fēng)險(xiǎn)預(yù)警結(jié)果具有更高的可靠性和可解釋性,所提算法包含關(guān)鍵步驟:將各時(shí)間點(diǎn)內(nèi)的信號(hào)網(wǎng)絡(luò)看作為AIDP算法的數(shù)據(jù)點(diǎn);依據(jù)信號(hào)量在子系統(tǒng)內(nèi)的相關(guān)性和子系統(tǒng)之間的相離性定義了信號(hào)網(wǎng)絡(luò)結(jié)構(gòu)相似度dGzGr;利用類中心值和類中心值變化率自動(dòng)選擇類中心點(diǎn)并劃分故障類別。
2.2.1 AIDP算法描述
不同于CDP算法,AIDP算法數(shù)據(jù)點(diǎn)被描述為各時(shí)間點(diǎn)內(nèi)的信號(hào)網(wǎng)絡(luò),并不能直接采用截?cái)嗑嚯xdc和局部密度ρi進(jìn)行故障類別劃分。為了正確識(shí)別不同時(shí)間點(diǎn)信號(hào)網(wǎng)絡(luò)的故障類型,本文提出了dGzGr來替代dc,并重新定義了局部密度和最小距離。
(4)
局部密度表示信號(hào)網(wǎng)絡(luò)的重要程度,最小距離表示信號(hào)網(wǎng)絡(luò)在同一類別的可能性,通常需要構(gòu)建以局部密度為縱軸,最小距離為橫軸的決策圖,通過綜合比較局部密度和最小距離取值的離散程度確定合適的聚類中心點(diǎn)。為實(shí)現(xiàn)對(duì)各時(shí)間點(diǎn)內(nèi)的信號(hào)網(wǎng)絡(luò)進(jìn)行故障標(biāo)簽粗劃分,依據(jù)所提信號(hào)網(wǎng)絡(luò)結(jié)構(gòu)相似度,給出了局部密度和最小距離的定義描述。
ρGz=∑χ(dGzGr-dc)
(5)
(6)
(7)
然而,在聚類中心點(diǎn)選擇過程中人為主觀因素起決定性作用,一些復(fù)雜的決策圖可能會(huì)造成聚類中心點(diǎn)的多選或少選[24],影響聚類結(jié)果的準(zhǔn)確性。因此,本文引入類中心值ωGz與類中心值變化率rateGz來量化聚類中心點(diǎn)的選擇條件,提出了一個(gè)較客觀的解決思路。
ωGz=ρGz×δGz
(8)
(9)
2.2.2 AIDP算法流程
AIDP算法流程見表1。輸入信號(hào)網(wǎng)絡(luò)數(shù)據(jù)集,輸出信號(hào)網(wǎng)絡(luò)的故障類別。算法依次計(jì)算數(shù)據(jù)集中每個(gè)信號(hào)網(wǎng)絡(luò)的局部密度ρGz與最小距離δGz,獲得類中心值ωGz∈ωG,然后將整個(gè)數(shù)據(jù)集的類中心值ωG進(jìn)行排序,依據(jù)類中心值變化率rateGz獲得類簇中心,最后依據(jù)近鄰距離對(duì)剩余信號(hào)網(wǎng)絡(luò)劃分類別。
表1 AIDP算法偽代碼表
本文利用AIDP算法實(shí)現(xiàn)了對(duì)各時(shí)間點(diǎn)的信號(hào)網(wǎng)絡(luò)粗分類,即對(duì)不同時(shí)間點(diǎn)內(nèi)信號(hào)網(wǎng)絡(luò)進(jìn)行故障識(shí)別,將確定為故障或非故障的信號(hào)網(wǎng)絡(luò)作為GCNN的訓(xùn)練數(shù)據(jù)集。本節(jié)通過GCNN神經(jīng)網(wǎng)絡(luò)訓(xùn)練該數(shù)據(jù)集,學(xué)習(xí)各個(gè)信號(hào)網(wǎng)絡(luò)中關(guān)聯(lián)節(jié)點(diǎn)的隱含特征信息,以增強(qiáng)信號(hào)網(wǎng)絡(luò)的故障表示,實(shí)現(xiàn)故障早發(fā)現(xiàn),提高風(fēng)險(xiǎn)預(yù)警的準(zhǔn)確性。
HGz=σ[?σ(?HGz(0)W(0))W(1)]
(10)
式中:H為輸出層網(wǎng)絡(luò)節(jié)點(diǎn)特征表示;W(0)、W(1)分別為第0層和第1層的權(quán)重矩陣。
GCNN輸出層為節(jié)點(diǎn)的特征表示,即信號(hào)網(wǎng)絡(luò)內(nèi)單個(gè)信號(hào)量的隱含特征,為實(shí)現(xiàn)風(fēng)險(xiǎn)預(yù)警準(zhǔn)確性,需要對(duì)輸出層進(jìn)行池化處理,以聚合信號(hào)網(wǎng)絡(luò)中每個(gè)信號(hào)量的隱含特征,得到信號(hào)網(wǎng)絡(luò)的網(wǎng)絡(luò)特征表示。目前,常用的池化處理方法包含取最大值、取平均以及求和等,這些方法由于計(jì)算效率高被研究和學(xué)者廣泛使用,但融合表示極易造成數(shù)據(jù)丟失,極大地影響預(yù)警準(zhǔn)確性。為保留信號(hào)量節(jié)點(diǎn)更多的隱含特征信息,本文給出了新的節(jié)點(diǎn)特征池化表示方式:
oGz=AHGz·mean(HGz)
(11)
式中:o為經(jīng)池化后的網(wǎng)絡(luò)特征表示;A為節(jié)點(diǎn)的近鄰矩陣。
在同一個(gè)信號(hào)網(wǎng)絡(luò)內(nèi),由于近鄰節(jié)點(diǎn)之間滿足強(qiáng)相關(guān)性,將近鄰節(jié)點(diǎn)視為具有較強(qiáng)聯(lián)系的多個(gè)監(jiān)測(cè)信號(hào)量集合,依據(jù)近鄰節(jié)點(diǎn)之間的強(qiáng)相關(guān)性,能夠增強(qiáng)網(wǎng)絡(luò)故障特征表示,提升多個(gè)監(jiān)控信號(hào)量微小故障對(duì)壓縮機(jī)組運(yùn)行的影響。
sGz=(s1,s2,…,sk)T=softmax(oGz·w+b)
(12)
同理,對(duì)于剩余網(wǎng)絡(luò),通過交叉熵?fù)p失函數(shù)不斷重復(fù)上述過程,直到預(yù)測(cè)故障類別與真實(shí)標(biāo)簽之間的差異盡可能小,整個(gè)訓(xùn)練結(jié)束。
(13)
式中:stGz=表示信號(hào)網(wǎng)絡(luò)Gz的真實(shí)故障分類,采用one-hot編碼。當(dāng)時(shí),對(duì)于第k類,輸出概率s越接近1時(shí),模型越準(zhǔn)確;當(dāng)時(shí),對(duì)于第k類,輸出概率s越接近0時(shí),模型越準(zhǔn)確。
選擇某壓氣站場(chǎng)3臺(tái)離心壓縮機(jī)組運(yùn)行數(shù)據(jù)作為實(shí)驗(yàn)數(shù)據(jù)集來驗(yàn)證算法模型的可行性,自投產(chǎn)以來,該壓氣站場(chǎng)的單臺(tái)壓縮機(jī)最大連續(xù)運(yùn)行時(shí)間超過7 000 h。為便于分析和理解,通過所提出的模型對(duì)該壓氣站場(chǎng)典型的出口溫度過高的異常事件進(jìn)行風(fēng)險(xiǎn)預(yù)警,該事件主要原因是動(dòng)力渦輪轉(zhuǎn)速、上游進(jìn)口溫度和進(jìn)口壓力過高,次要原因包含潤(rùn)滑系統(tǒng)、密封系統(tǒng)、外界環(huán)境溫度過高等。為提高風(fēng)險(xiǎn)預(yù)警的精確度,本文將異常事件發(fā)生前2 h和發(fā)生后5 min內(nèi)的運(yùn)行數(shù)據(jù)作為分析依據(jù),得到包含128個(gè)SCADA監(jiān)測(cè)信號(hào)量和125個(gè)時(shí)間點(diǎn)的實(shí)驗(yàn)數(shù)據(jù)集D128×125×12。
125個(gè)時(shí)間點(diǎn)對(duì)應(yīng)的壓縮機(jī)組出口溫度、壓縮機(jī)組動(dòng)力渦輪轉(zhuǎn)速、壓縮機(jī)組進(jìn)口壓力、環(huán)境溫度見圖2。由圖2-a)可看出,在121~125個(gè)時(shí)間點(diǎn)內(nèi),壓縮機(jī)組出口溫度較高,為異常事件發(fā)生之后的溫度狀態(tài)。由圖2-b)、c)和d)可看出,第100個(gè)時(shí)間點(diǎn)之前的數(shù)據(jù)值都趨于平穩(wěn),當(dāng)超過第100個(gè)時(shí)間點(diǎn)之后,動(dòng)力渦輪轉(zhuǎn)速、壓縮機(jī)組出口壓力、環(huán)境溫度都有明顯的變化。當(dāng)時(shí)異常發(fā)生在夏季,環(huán)境溫度處于上升狀態(tài),各影響因素使壓縮機(jī)組進(jìn)口壓力處于下降趨勢(shì),加之動(dòng)力渦輪轉(zhuǎn)速提高,是造成此次壓縮機(jī)組出口溫度過高異常事件的主要原因。
a)出口溫度
依據(jù)所提信號(hào)量監(jiān)測(cè)值的網(wǎng)絡(luò)表示模型,獲得了該數(shù)據(jù)集對(duì)應(yīng)的信號(hào)網(wǎng)絡(luò)表示,給出了AIDP算法對(duì)該數(shù)據(jù)集的聚類中心決策圖,見圖3。圖3中每個(gè)數(shù)據(jù)點(diǎn)對(duì)應(yīng)1個(gè)信號(hào)網(wǎng)絡(luò),數(shù)據(jù)點(diǎn)編號(hào)分別對(duì)應(yīng)異常事件發(fā)生前、后的時(shí)間點(diǎn),如第125個(gè)時(shí)間點(diǎn)表示事件發(fā)生后第5 min內(nèi)的信號(hào)網(wǎng)絡(luò)。由圖3看出該數(shù)據(jù)集的類中心分別為85、121,數(shù)據(jù)點(diǎn)110具有較高的局部密度和最小距離,從決策圖中并不能直觀確定為聚類中心。因此,本文通過AIDP算法依據(jù)類中心值變化率確定85、121、110為聚類中心,分別對(duì)應(yīng)正常運(yùn)行信號(hào)網(wǎng)絡(luò)、異常信號(hào)網(wǎng)絡(luò)和類別不確定的信號(hào)網(wǎng)絡(luò),經(jīng)過故障識(shí)別粗分類之后,獲得了3種類別的信號(hào)網(wǎng)絡(luò)數(shù)據(jù)集Dataset。
圖3 AIDP算法聚類決策圖
數(shù)據(jù)集Dataset包含101個(gè)正常運(yùn)行信號(hào)網(wǎng)絡(luò)、5個(gè)異常信號(hào)網(wǎng)絡(luò)和19個(gè)類別不確定的信號(hào)網(wǎng)絡(luò),見表2。
表2 Dataset數(shù)據(jù)集表
其中5個(gè)異常類為第121、122、123、124和125個(gè)時(shí)間點(diǎn),都處于異常事件發(fā)生后的時(shí)間點(diǎn)內(nèi);正常運(yùn)行類包含的信號(hào)網(wǎng)絡(luò),都處于事件發(fā)生前的時(shí)間點(diǎn)內(nèi),進(jìn)一步表明AIDP算法對(duì)于故障識(shí)別具有極高的準(zhǔn)確性。而對(duì)于最后一類,由于包含的信號(hào)網(wǎng)絡(luò)所在時(shí)間點(diǎn)已非常接近異常事件發(fā)生時(shí)間點(diǎn),此時(shí)動(dòng)力渦輪轉(zhuǎn)速、上游環(huán)境溫度、進(jìn)口壓力和其他因素的信號(hào)量監(jiān)測(cè)值不斷發(fā)生波動(dòng)變化,由于AIDP算法的信號(hào)網(wǎng)絡(luò)結(jié)構(gòu)相似度是依據(jù)信號(hào)量在子系統(tǒng)內(nèi)的相關(guān)性和子系統(tǒng)之間的相離性來定義的,并不能有效識(shí)別多個(gè)監(jiān)測(cè)信號(hào)量監(jiān)測(cè)值波動(dòng)引起的異常事件。之后將該數(shù)據(jù)集的正常運(yùn)行信號(hào)網(wǎng)絡(luò)和異常信號(hào)網(wǎng)絡(luò)用于訓(xùn)練基于GCNN的壓縮機(jī)組風(fēng)險(xiǎn)預(yù)警模型,通過模型對(duì)類別不確定的信號(hào)網(wǎng)絡(luò)進(jìn)行風(fēng)險(xiǎn)識(shí)別。
將106個(gè)帶標(biāo)簽的信號(hào)網(wǎng)絡(luò)采用五折交叉驗(yàn)證劃分為80%訓(xùn)練集和20%測(cè)試集兩部分,來驗(yàn)證模型的準(zhǔn)確性。訓(xùn)練集包含了82個(gè)正常運(yùn)行信號(hào)網(wǎng)絡(luò)和3個(gè)異常信號(hào)網(wǎng)絡(luò),驗(yàn)證集分別包含19個(gè)正常運(yùn)行和異常信號(hào)網(wǎng)絡(luò),當(dāng)訓(xùn)練集模型收斂時(shí),驗(yàn)證結(jié)果中得到的正常運(yùn)行與異常信號(hào)網(wǎng)絡(luò)分別是19個(gè)、2個(gè),正確率達(dá)到了100%,見表3。實(shí)驗(yàn)結(jié)果表明,本文模型對(duì)信號(hào)網(wǎng)絡(luò)的異常識(shí)別具有非常高的準(zhǔn)確性和魯棒性,此外,采用交叉驗(yàn)證的方法能夠更加有效地驗(yàn)證模型的性能,提高模型的可靠性。
表3 測(cè)試分類結(jié)果表
為驗(yàn)證模型的風(fēng)險(xiǎn)預(yù)警能力,通過訓(xùn)練106個(gè)帶標(biāo)簽的信號(hào)網(wǎng)絡(luò),當(dāng)訓(xùn)練模型收斂時(shí),對(duì)125個(gè)信號(hào)網(wǎng)絡(luò)進(jìn)行結(jié)果驗(yàn)證,獲得了125個(gè)信號(hào)網(wǎng)絡(luò)的softmax所屬類的概率值,風(fēng)險(xiǎn)預(yù)警結(jié)果見圖4。從圖4可看出,在0~114時(shí)間點(diǎn)內(nèi)的信號(hào)網(wǎng)絡(luò)屬于正常運(yùn)行類,從第115個(gè)時(shí)間點(diǎn)開始,對(duì)應(yīng)的信號(hào)網(wǎng)絡(luò)劃分為異常類,比發(fā)生壓縮機(jī)組出口溫度過高的異常事件的發(fā)生提前了6 min,進(jìn)一步驗(yàn)證了所提出的模型對(duì)風(fēng)險(xiǎn)預(yù)警的及時(shí)性和預(yù)警性。由于GCNN保留了信號(hào)量節(jié)點(diǎn)之間的隱含特征信息,通過訓(xùn)練節(jié)點(diǎn)表示,隱含特征信息將各微小的異常信號(hào)量逐漸放大,有效避免了平局池化后節(jié)點(diǎn)特征消失問題;所提出的模型在網(wǎng)絡(luò)表示過程中,將近鄰關(guān)系與節(jié)點(diǎn)表示再一次融合,進(jìn)一步提升了多個(gè)相關(guān)聯(lián)信號(hào)量節(jié)點(diǎn)的隱含特征對(duì)風(fēng)險(xiǎn)預(yù)警的影響,也規(guī)避了AIDP算法無法精確區(qū)分微小故障的問題。
信號(hào)網(wǎng)絡(luò)中,網(wǎng)絡(luò)的復(fù)雜程度取決于節(jié)點(diǎn)之間的連邊數(shù)量,連邊數(shù)量越多網(wǎng)絡(luò)結(jié)構(gòu)越復(fù)雜,故障識(shí)別的準(zhǔn)確度越高,但極大地增加了計(jì)算量;反之,網(wǎng)絡(luò)包含的信息也就越少,對(duì)故障識(shí)別的難度隨之增大。本文采用θvivj作為信號(hào)網(wǎng)絡(luò)的邊權(quán)重,節(jié)點(diǎn)之間關(guān)聯(lián)程度隨θvivj值減小而減小,確定合適的θvivj取值能夠減少數(shù)據(jù)和冗余數(shù)據(jù)對(duì)實(shí)驗(yàn)結(jié)果帶來的影響,提升故障分類的精準(zhǔn)率。
圖5 邊權(quán)重取值下限分析圖
壓縮機(jī)組并不是一個(gè)獨(dú)立的運(yùn)行系統(tǒng),而是由壓縮機(jī)體、潤(rùn)滑系統(tǒng)、密封系統(tǒng)和輔助系統(tǒng)等多個(gè)子系統(tǒng)組成的復(fù)雜集成運(yùn)行系統(tǒng),各個(gè)子系統(tǒng)之間相互配合共同保障壓縮機(jī)組的安全平穩(wěn)運(yùn)行。各子系統(tǒng)監(jiān)測(cè)信號(hào)量之間存在復(fù)雜的關(guān)聯(lián)關(guān)系,針對(duì)多監(jiān)測(cè)信號(hào)量作用下隱含特征對(duì)壓縮機(jī)組運(yùn)行的影響,提出了基于GCNN的壓縮機(jī)組風(fēng)險(xiǎn)預(yù)警模型。與以往風(fēng)險(xiǎn)預(yù)警方法不同,為了提取信號(hào)量監(jiān)測(cè)數(shù)據(jù)的隱含特征,該模型將監(jiān)測(cè)數(shù)據(jù)轉(zhuǎn)化為基于時(shí)間點(diǎn)的信號(hào)網(wǎng)絡(luò),按AIDP算法對(duì)信號(hào)網(wǎng)絡(luò)進(jìn)行故障粗分類得到訓(xùn)練標(biāo)簽樣本,通過GCNN訓(xùn)練標(biāo)簽數(shù)據(jù)的隱含特征實(shí)現(xiàn)壓縮機(jī)組風(fēng)險(xiǎn)預(yù)報(bào)警。
對(duì)壓縮機(jī)組出口溫度過高異常事件進(jìn)行實(shí)驗(yàn)預(yù)警分析,所提模型的故障標(biāo)簽識(shí)別率達(dá)到了100%;與事件發(fā)生時(shí)間相比,所提模型預(yù)測(cè)發(fā)生時(shí)間提早了6 min,極大增強(qiáng)了風(fēng)險(xiǎn)識(shí)別的準(zhǔn)確性與風(fēng)險(xiǎn)預(yù)警能力,為事件的安全處理提供了充足的準(zhǔn)備時(shí)間。在未來工作中,將重點(diǎn)關(guān)注所提模型對(duì)風(fēng)險(xiǎn)預(yù)警及時(shí)性和可靠性的研究,為壓縮機(jī)組的可靠穩(wěn)定運(yùn)行提供安全保障。