楊喜連, 王玉璋, 楊志鵬, 程侃如, 趙群飛
(1.上海交通大學(xué) 電子信息與電氣工程學(xué)院, 上海 200240;2.上海交通大學(xué) 機(jī)械與動力工程學(xué)院, 上海 200240;3.上海發(fā)電設(shè)備成套設(shè)計研究院有限責(zé)任公司, 上海 200240)
隨著全球能源消耗量的增加,能源與環(huán)境問題日益嚴(yán)重[1-2]。能源系統(tǒng)智能化能有效提升能源系統(tǒng)的調(diào)控水平,提高能源系統(tǒng)效率,是實現(xiàn)雙碳雙控目標(biāo)行之有效的措施[3]。進(jìn)行能源系統(tǒng)智能化時需要大量傳感器在線實時檢測能源系統(tǒng)的關(guān)鍵參數(shù),從而實時感知能源系統(tǒng)中各關(guān)鍵部件的狀態(tài),實現(xiàn)能源系統(tǒng)的實時調(diào)控、健康評估和故障診斷[4-5]。傳感器經(jīng)常在高溫、高壓、高濕度、強(qiáng)磁場等惡劣環(huán)境下工作,因此傳感器不可避免地會出現(xiàn)信號異常、老化等現(xiàn)象。狀態(tài)監(jiān)測通常分為4個步驟:異常檢測、故障分類、故障隔離和故障緩解,故障檢測是其中第1步。此外,故障檢測還有助于實現(xiàn)智能控制。由此可見,開展燃機(jī)控制系統(tǒng)傳感器故障診斷研究對于保障燃機(jī)的安全運(yùn)行具有重要意義。
傳感器采集的原始信號通常含有噪聲,直接進(jìn)行故障分類會導(dǎo)致效果不好,且原始數(shù)據(jù)的特征不明顯。常用的基于數(shù)據(jù)的故障分類流程是先提取信號特征[6],然后再使用分類器。常用的提取信號特征的方法為信號分解[7-10],但針對小幅值故障信號及變工況的情況,通過信號分解得到的特征受限。在遷移學(xué)習(xí)中,基于數(shù)據(jù)的模型(如長短期記憶法、卷積神經(jīng)網(wǎng)絡(luò))也可以用來提取特征進(jìn)而進(jìn)行故障分類,但小故障分類準(zhǔn)確度會受到重構(gòu)值準(zhǔn)確度的影響[11]。
受計算機(jī)視覺中監(jiān)督和無監(jiān)督學(xué)習(xí)技術(shù)的啟發(fā)[12],考慮將時間序列編碼為圖像,以允許基于機(jī)器視覺的算法識別、分類以及學(xué)習(xí)圖像特征,充分利用卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)勢。最近,研究人員試圖從時間序列中構(gòu)建不同的網(wǎng)絡(luò)結(jié)構(gòu),用于視覺檢查或設(shè)計距離的測量,如遞歸網(wǎng)絡(luò)被用于分析來自復(fù)雜系統(tǒng)的時間序列的結(jié)構(gòu)特性,時間序列的遞歸矩陣被解釋為相關(guān)復(fù)雜網(wǎng)絡(luò)的鄰接矩陣,使用壓縮距離來表示可擴(kuò)展時間序列分類的遞歸圖(Recurrence plot,RP)。構(gòu)建加權(quán)鄰接矩陣的另一種方法是從一階馬爾可夫矩陣中提取轉(zhuǎn)換動態(tài)。盡管這些映射在不同的時間序列中表現(xiàn)出不同的拓?fù)涮匦?但由于沒有精確的逆運(yùn)算,這些拓?fù)涮匦耘c原始時間序列之間的關(guān)系仍不明確。
筆者利用格拉姆角和/差場以及馬爾可夫轉(zhuǎn)換場(MTF)將時間序列編碼為圖像,對包含5種典型故障(階躍、短路、漂移、噪聲、周期)的數(shù)據(jù)集上的時間序列進(jìn)行二維圖像轉(zhuǎn)換,采用方向梯度直方圖提取圖像特征,再采用支持多分類的支持向量機(jī)對提取的圖像特征進(jìn)行分類。最后,通過混淆矩陣可視化分類結(jié)果來分析故障信號分類結(jié)果的誤差來源。
圖1為各類狀態(tài)傳感器在燃機(jī)本體上的安裝位置示意圖。燃機(jī)系統(tǒng)中所安裝的大量狀態(tài)感知傳感器大體上可以分為物理冗余和空間冗余2種類型。物理冗余是指在同一部件安裝不同類型的傳感器,由于安裝在相同部件上,其具有一定的物理關(guān)系??臻g冗余是指在同一空間內(nèi)安裝多個相同類型的傳感器。傳感器發(fā)生故障的原因主要有2個:一是燃機(jī)系統(tǒng)本身故障;二是傳感元件發(fā)生故障。由于在燃機(jī)系統(tǒng)中燃燒室所處環(huán)境最惡劣,因此需要對指示燃燒狀態(tài)的排氣溫度傳感器(EGT)進(jìn)行故障檢測和分類。在渦輪出口安裝多個傳感器也會增加傳感器故障的概率。
圖1 各類狀態(tài)傳感器在燃機(jī)本體安裝位置示意圖
傳感器故障分類的目標(biāo)是根據(jù)傳感器的歷史觀測值建模,然后及時對異常狀態(tài)進(jìn)行分類。記錄的排氣溫度信號序列表示為時間序列X,目標(biāo)是對故障信號分類問題進(jìn)行建模。
(1)
式中:X為輸入子序列;F為數(shù)據(jù)結(jié)構(gòu)轉(zhuǎn)換器;H為變換為二維圖像后提取的圖像描述子;G(?)為帶有參數(shù)?的分類器;p為故障分類結(jié)果。
真實燃機(jī)控制系統(tǒng)采集的傳感器信號會伴有白噪聲,故障信號的特征提取既要不受噪聲干擾,同時又能反映出故障信號的特征,但很多工況下故障信號的幅值很小,較難區(qū)分其與變工況下正常信號的變化趨勢。故障信號分類流程如圖2所示。
圖2 故障信號分類流程
將一段長為L的時間序列表示為X={xt}t=1,2,…,L,其中xt為時間序列中t時刻的值,然后將其縮放到統(tǒng)一的尺度區(qū)間[-1,1]或[0,1]中。
(2)
或
(3)
因此,可以將時間序列編碼為角余弦,并將時間戳記為半徑,使用式(4)在極坐標(biāo)中表示重新縮放的時間序列。
(4)
式中:θ和r分別為極坐標(biāo)中的角度和半徑;ti為時間戳;N為常數(shù)因子,用于規(guī)范極坐標(biāo)系的跨度。
隨著時間的增加,時間序列對應(yīng)的極坐標(biāo)值在跨越圓上的不同角度點(diǎn)之間發(fā)生扭曲。式(4)的編碼圖有2個重要的性質(zhì)。首先,極坐標(biāo)編碼圖具有雙射性質(zhì),這是由于θ∈[0,π]時cos(θ) 為單調(diào)函數(shù)。給定一個時間序列,所提出的映射在極坐標(biāo)系中只產(chǎn)生一個結(jié)果,具有唯一的逆映射。其次,與笛卡爾坐標(biāo)相反,極坐標(biāo)保留絕對時間關(guān)系。
不同間隔的重新縮放數(shù)據(jù)具有不同的角度界限,繼而在格拉姆角場中為分類任務(wù)提供不同的信息粒度。將重新縮放的時間序列轉(zhuǎn)換至極坐標(biāo)系后,可以通過考慮每個點(diǎn)之間的三角和/差并利用角度透視來識別不同時間間隔內(nèi)的時間相關(guān)性。一段時間序列起始點(diǎn)對應(yīng)的極坐標(biāo)角度為θi和θj,格拉姆求和角場GS,(i,j)和格拉姆差分角場GD,(i,j)定義如下:
(5)
(6)
式中:I為單位行向量。
將時間序列轉(zhuǎn)換至極坐標(biāo)系后,將每個時間步的時間序列作為一維度量空間。由于G(i,j|(|i-j|=k))表示相對于時間間隔k的相對相關(guān)性,因此格拉姆角場具有時間相關(guān)性。主對角線Gi,i是k=0時的特例,其包含原始值/角度信息。然而,GAF矩陣很大,因為當(dāng)原始時間序列的長度為L時,格拉姆矩陣的大小為L×L。為了減小GAF的矩陣大小,應(yīng)用分段聚合方法來近似平滑時間序列,同時保留其趨勢。生成 GAF 的完整過程如圖3所示。
(a) 一維時間故障序列
通過以下步驟計算方向梯度 (HOG) 的直方圖:(1) 灰度化;(2) 全局圖像歸一化;(3) 計算每個像素的梯度(包含大小和方向);(4) 計算梯度直方圖;(5) 跨塊標(biāo)準(zhǔn)化,獲取圖像特征向量。步驟1是應(yīng)用一個可選的全局圖像歸一化實現(xiàn)像素的均衡,旨在降低光照效果的影響,可使用伽馬冪律壓縮像素分布,計算像素的平方根或每個顏色通道的對數(shù)。步驟2是計算一階圖像梯度,捕捉邊界、輪廓和紋理信息,同時進(jìn)一步抵抗光照變化。計算梯度的變體方法還可能包括二階圖像導(dǎo)數(shù),將像素的梯度充當(dāng)原始條形檢測器,用于捕獲有用特征,如階躍故障的格拉姆角場中的梯度變化,如圖4所示。步驟3旨在產(chǎn)生一種對局部圖像內(nèi)容敏感的編碼,同時其對噪聲或外觀的微小變化具有抵抗力,其主要目的是在本地匯集梯度方向信息。步驟4需計算歸一化,采用局部單元組并在傳遞到下一階段前對其整體響應(yīng)進(jìn)行對比歸一化。歸一化為照明、陰影和邊緣對比度引入了更好的不變性,將歸一化的塊描述符稱為HOG描述符。步驟5是從覆蓋檢測窗口的密集重疊網(wǎng)格的所有塊中收集 HOG 描述符到組合特征向量中,以用于分類器的輸入。
圖4 短路故障下采用格拉姆角場變換得到二維圖像后的灰度化圖及對應(yīng)的HOG
折頁損失L為:
yi(WTφ(xi)+b))
(7)
式中:n為訓(xùn)練集的數(shù)據(jù)量;xi為輸入數(shù)據(jù);yi為標(biāo)簽數(shù)據(jù);W和b分別為超平面的法向量和截距;C為調(diào)節(jié)系數(shù);φ為核函數(shù)。
該分類估計器使用隨機(jī)梯度下降 (SGD) 學(xué)習(xí)實現(xiàn)正則化線性模型,即每次估計各樣本的損失梯度,且模型隨著學(xué)習(xí)率的遞減不斷更新。SGD 允許通過部分?jǐn)M合方法進(jìn)行小批量在線學(xué)習(xí)。為使用默認(rèn)學(xué)習(xí)率計劃獲得最佳結(jié)果,輸入數(shù)據(jù)需具有零均值和單位方差。
以深圳某電廠的一臺9F燃?xì)廨啓C(jī)的運(yùn)行數(shù)據(jù)作為實驗數(shù)據(jù),選取3個168小時段運(yùn)行數(shù)據(jù),每1 min采樣一次,每段運(yùn)行數(shù)據(jù)采集量為10 079個。由TimeSynth生成短路、階躍、漂移、噪聲、周期等故障信號,并將其疊加在真實運(yùn)行數(shù)據(jù)上。
圖5為小幅值故障信號的可視化結(jié)果,以檢查格拉姆角場的紋理顯示能力,可視化結(jié)果表明圖像紋理質(zhì)量可以接受。圖5(a)為正常運(yùn)行下的數(shù)據(jù),從格拉姆角場中可以看出,原始信號有微小的負(fù)斜率。當(dāng)施加微小的正漂移時,格拉姆角場正好變成更加均勻的分布場,如圖5(d)所示。圖5(b)為施加微小負(fù)階躍后的曲線,對應(yīng)的二維編碼圖也印證了負(fù)斜率的紋理特征。這說明格拉姆角場分布圖可以放大微小信號的特征,將一維時序圖轉(zhuǎn)換為二維圖后,原本不容易觀察出的特征能夠輕易地被發(fā)現(xiàn)。圖5(c)為施加微小正階躍的曲線,其變化與施加微小負(fù)階躍的曲線正好相反。圖5(e)為施加微小噪聲故障后的曲線,可以看出,與正常信號相比,其所帶噪聲更大。圖5(f)為施加微小周期故障后的曲線,其變化具有周期性。
(a) 正常信號
結(jié)合圖6和圖7可以看出,隨著故障幅值的增加,二維像素的顏色變深。其中,施加正階躍和負(fù)階躍后可視化結(jié)果區(qū)別不大。由圖6和圖7(a)可知,漂移故障與其他故障相比有比較明顯的紋理區(qū)別,但是對于小漂移故障,GAF的紋理更明顯,而馬爾可夫轉(zhuǎn)換場M(i,j)的紋理則與小噪聲故障下的紋理相似。對于小噪聲故障,MTF的紋理比GAF更豐富。在小噪聲和小周期故障下GAF的紋理較相似。
圖6 大幅值故障下原始線框圖
(a) 格拉姆角場GAF
在相同的故障數(shù)據(jù)集下對比了不同可視化方法的分類準(zhǔn)確率及運(yùn)行時間,如表1所示。該數(shù)據(jù)集包含5類故障信號的幅值情況。采用格拉姆求和角場和MTF時結(jié)果最好,分類準(zhǔn)確率達(dá)到96.6%,但其分類混淆矩陣可視化結(jié)果并不完全一致。圖8給出了基于格拉姆角場故障分類結(jié)果的混淆矩陣。其中,nt表示各類故障的數(shù)量,p表示某類故障數(shù)量與該類真實樣本數(shù)量的比值。使用格拉姆求和角場將一維故障信號可視化后,其中21%的噪聲故障被誤檢測為周期故障。圖9給出了基于馬爾可夫轉(zhuǎn)換場故障分類結(jié)果的混淆矩陣,使用MTF將一維故障信號可視化后,12%的漂移故障被誤檢測為噪聲故障。圖8和圖9中的數(shù)字1~5均分別代表漂移、噪聲、周期、短路、階躍。
表1 不同可視化方法下的故障分類準(zhǔn)確率及運(yùn)行時間
(a) nt
(a) nt
(1) 將幅值較小、不易被檢測的時序數(shù)據(jù)轉(zhuǎn)換為可視化圖像后,圖像紋理特征明顯,有利于特征提取。
(2) 所提出的傳感器故障診斷和分類方法的準(zhǔn)確率能達(dá)到96.6%,格拉姆求和角場與馬爾可夫轉(zhuǎn)換場的故障分類準(zhǔn)確率相同,但由于其特性不同,兩者誤差的來源也不相同。