王琪善,章國寶*,黃永明,張永春
(1.東南大學(xué) 自動化學(xué)院,南京 210000;2.江蘇省特種設(shè)備安全監(jiān)督檢驗研究院,南京 2 100018)
現(xiàn)代制造業(yè)設(shè)備的發(fā)展呈現(xiàn)出智能化、綜合化和復(fù)雜化的趨勢,系統(tǒng)各設(shè)備之間高度耦合,導(dǎo)致維護(hù)和保養(yǎng)的成本越來越高,同時某一個設(shè)備的故障可能引發(fā)連鎖反應(yīng),引起系統(tǒng)的崩潰,因此降低故障的誤報和漏報率對保障系統(tǒng)安全性、降低維護(hù)成本,具有重要的價值和意義[1]。傳統(tǒng)的多元統(tǒng)計過程控制(MSPC)主要包括主成分分析(Principal Component Analysis,PCA)和偏最小二乘(Partial Least-Regression,PLS)法[2],已被廣泛用于分析監(jiān)測數(shù)據(jù)和故障間潛在的關(guān)系,當(dāng)信號超過閾值或發(fā)生顯著變化時將觸發(fā)報警。然而隨著工業(yè)流程變得復(fù)雜,工況更加多變,制造過程呈現(xiàn)出運行模態(tài)多樣、非高斯分布、非線性變化,故障類型多變等問題,使得故障檢測變得更加復(fù)雜。
傳統(tǒng)PCA和PLS方法根據(jù)歷史數(shù)據(jù)的統(tǒng)計信息建立靜態(tài)模型,將高維變量映射到低維空間進(jìn)行分析,然而要求數(shù)據(jù)滿足高斯分布和線性特征,在非線性、非高斯的多模態(tài)過程中經(jīng)常產(chǎn)生誤報和漏報,效果不佳。對此,許多研究人員提出了改進(jìn)。為了解決非線性問題,文獻(xiàn)[3]使用動態(tài)主成分分析方法,生成增廣數(shù)據(jù)矩陣擬合非線性過程特征。文獻(xiàn)[4]使用局部近鄰標(biāo)準(zhǔn)化改進(jìn)最小二乘法的非線性表現(xiàn)。文獻(xiàn)[5]提出一種結(jié)合隨機(jī)投影和K近鄰的故障檢測方法,適應(yīng)了過程非線性的特點,文獻(xiàn)[6]提出非負(fù)矩陣分解和Fisher判別分析。為了解決非高斯問題,文獻(xiàn)[7]結(jié)合核PCA和支持向量機(jī)(Support Vector Machine,SVM)進(jìn)行故障檢測,數(shù)據(jù)無需滿足高斯分布。文獻(xiàn)[8]使用獨立主成分分析(ICA)信息融合提取軸承故障特征。為了滿足多工況、多模態(tài)的故障檢測需要,文獻(xiàn)[9]針對各個模態(tài)使用MSPC單獨建模,而非全局建模來容納所有模態(tài),因而隨著模態(tài)的增多,計算復(fù)雜度較高。文獻(xiàn)[10]將貝葉斯統(tǒng)計引入MSPC,通過后驗概率和聯(lián)合概率評估檢測統(tǒng)計量在各模態(tài)下的故障概率。文獻(xiàn)[11]將局部熵引入ICA,將監(jiān)測數(shù)據(jù)轉(zhuǎn)化到局部熵空間,以提高多模態(tài)和非高斯過程檢測效果。
總體來說,由于上述監(jiān)測方法的閾值和置信度是通過統(tǒng)計方式獲得,因此性能會受到基于MPSC方法設(shè)計參數(shù)選擇的顯著影響。因此,在解決非線性、非高斯的多模態(tài)過程故障檢測問題上,MSPC方法首先較易忽略原始模式數(shù)據(jù)中的某些潛在關(guān)系,因而不能涵蓋對早期微小故障的準(zhǔn)確檢測[12]。此外,MPSC方法還會因變量間的耦合而產(chǎn)生意料之外的誤報和漏報。
近年來,通過將故障檢測視為一個判別性問題,人工智能技術(shù)已在該領(lǐng)域得到了成功的應(yīng)用[13]。如果原始測量數(shù)據(jù)的潛在關(guān)系可以通過合適的學(xué)習(xí)算法來學(xué)習(xí),則可以很容易地識別模式的從屬關(guān)系。對于高維工業(yè)制造數(shù)據(jù),可以有效地使用深層結(jié)構(gòu)來發(fā)現(xiàn)低層特征固有的模式,從而提高分類準(zhǔn)確性。Hinton等人[14]提出了反向傳播算法,使得深層結(jié)構(gòu)的參數(shù)更新和高級抽象特征的獲取成為可能,其較強(qiáng)的學(xué)習(xí)能力強(qiáng),適用于多模態(tài)過程的故障檢測。作為一種深度學(xué)習(xí)方法,CNN已證明其在各個領(lǐng)域如語音、圖像等多元模式識別中的功效[15]。其主要的優(yōu)勢體現(xiàn)在:
1)以卷積加采樣為核心的網(wǎng)絡(luò)結(jié)構(gòu)可以直接提取信號中的局部特征,不需要手動提??;
2)隨著網(wǎng)絡(luò)堆疊層次的加深,模型可以獲得更好的能力來表征數(shù)據(jù)和設(shè)備健康狀況之間復(fù)雜的(線性或非線性)映射關(guān)系,從而提高判別能力;
3)數(shù)據(jù)不要求必須滿足高斯分布。在多模態(tài)過程故障檢測領(lǐng)域,基于CNN的深度學(xué)習(xí)判別方法方興未艾。文獻(xiàn)[16]將數(shù)值數(shù)據(jù)表示成雷達(dá)圖,然后將其輸入CNN中構(gòu)建分類模型,取得了優(yōu)異的故障檢測效果,然而同文獻(xiàn),每個模態(tài)單獨建模將導(dǎo)致復(fù)雜性的增加。文獻(xiàn)[17]使用輕量級CNN提取多變量過程的高層特征,在測試集上提高了8%的故障檢測率,然而在將傳感器數(shù)值轉(zhuǎn)換成圖像的過程中沒有考慮變量的相關(guān)性。文獻(xiàn)[18]使用固定多重采樣CNN提取過程數(shù)據(jù)在不同時間尺度上的動態(tài)特性用于故障檢測,然而沒有對模型提出進(jìn)一步的優(yōu)化。
為此,本文提出了一種基于TCNN的多模態(tài)過程故障檢測方法,提出了基于TCNN的在線監(jiān)測框架,建立關(guān)于多模態(tài)過程的全局判別模型,可以進(jìn)行實時的模態(tài)識別和故障檢測。與常規(guī)的MSPC方法不同,TCNN的非線性激活函數(shù)和模型結(jié)構(gòu)適用非高斯分布和非線性特征,深層的模型能夠擬合更深層次的結(jié)構(gòu)信息和數(shù)據(jù)本質(zhì),提高了對多模態(tài)過程故障的檢測效果。最后將提出的方法用于田納西伊士曼工業(yè)過程(Tennessee Eastman Process,TEP)的故障檢測中,與MSPC(PCA)方法,SVM方法、深度置信網(wǎng)絡(luò)(Deep Belief Networks,DBN)方法進(jìn)行了實驗比較,結(jié)果表明本文提出的方法總體上降低了故障的誤報和漏報率。
Tiled CNN(TCNN)是卷積神經(jīng)網(wǎng)絡(luò)的一種變體,使用卷積和多個特征圖來學(xué)習(xí)不變特征。其特殊性表現(xiàn)為本地連接和平鋪(tiled)權(quán)重共享,即使用參數(shù)k控制隱藏層的權(quán)重綁定距離,能夠?qū)W習(xí)平移不變性之外的復(fù)雜不變性(如尺度不變性和旋轉(zhuǎn)不變性),更適用于復(fù)雜不變特征的學(xué)習(xí)。該模型由多個卷積和TICA采樣層堆疊而成,如圖1所示。卷積在局部感受野提取多個特征圖,作為TICA采樣層的輸入。TICA采樣可從未標(biāo)記的圖像塊中學(xué)習(xí)特征,結(jié)構(gòu)如圖2所示,由兩層網(wǎng)絡(luò)構(gòu)成,分別具有平方和平方根非線性采樣功能,詳細(xì)介紹參見文獻(xiàn)[19]。
圖1 TCNN網(wǎng)絡(luò)結(jié)構(gòu)
圖2 TICA層結(jié)構(gòu)
給定一組訓(xùn)練樣本X={x1,x2,x3,...,xk},由未標(biāo)記的多模態(tài)過程測量值構(gòu)成某一模式矩陣,xi=k為采樣點個數(shù),n為傳感器個數(shù),系統(tǒng)的模式即隱藏在矩陣之中。由于高維模式識別屬于非線性可分離問題,因而可以轉(zhuǎn)換為學(xué)習(xí)一個可將特征映射到特定模式的函數(shù),然后將模式與其相應(yīng)類別進(jìn)行匹配。對于本文的模型結(jié)構(gòu)來說,即學(xué)習(xí)非線性函數(shù)以提取表征故障模式的高層矩陣特征X=FW,b,k(X)。FW,b,k模型的訓(xùn)練分為TICA無監(jiān)督預(yù)訓(xùn)練和有監(jiān)督微調(diào)兩部分。無監(jiān)督預(yù)訓(xùn)練階段,通過硬編碼固定第二采樣層的權(quán)重V來學(xué)習(xí)第一層中的權(quán)重W,即解決:
其中,x(t)為經(jīng)卷積后輸入的局部特征,n是輸入大小,m是隱藏層單元個數(shù)。有監(jiān)督微調(diào)階段使用softmax回歸計算梯度,將誤差從輸出端進(jìn)行反向傳播(BP)逐步更新權(quán)重。給定不同模態(tài)下的有標(biāo)簽數(shù)據(jù)集其中k為模態(tài)的個數(shù),為了計算給定假設(shè)函數(shù):
超參數(shù)的選擇對模型的訓(xùn)練速度和最終的分類效果具有重要的影響。目前沒有成熟的理論指導(dǎo)選擇超參數(shù)的值,通過反復(fù)試驗手動進(jìn)行調(diào)整是一項耗時的工作。本文使用灰狼優(yōu)化(WGO)群智能啟發(fā)式搜索算法[20]進(jìn)行超參數(shù)尋優(yōu),以期獲得最佳的多模態(tài)分類模型?;依莾?yōu)化技術(shù)模仿了狼群尋找獵物位置的行為。從最初的隨機(jī)分配開始,狼的位置會進(jìn)行迭代更新,以將其引導(dǎo)至獵物即最佳解決方案附近。在狩獵中,狼群采用α,β,δ,ω四層機(jī)制按順序搜索獵物,分別被稱為最佳、第二佳、第三佳和其他解決方案。對于本文,每只狼的位置都與CNN模型超參數(shù)的個數(shù)相對應(yīng)而構(gòu)成一個矢量Xi={Xi1,Xi2,...XiD},D為搜索空間,即超參數(shù)的個數(shù)。x={X1,X2,...XN},N為灰狼的數(shù)量,那么α,β,δ狼各一只,ω狼有N-3只。在更新位置之前,每只狼首先計算自己和α,β,δ狼的距離:
其中D表示距離,X表示位置,r為隨機(jī)數(shù)。隨后每只狼按照以下的公式更新自己的位置:
其次,超參數(shù)尋優(yōu)的目的是提高分類準(zhǔn)確度,因而定義灰狼適應(yīng)性函數(shù)為:
本文基于灰狼優(yōu)化的TCNN模型超參數(shù)尋優(yōu)算法,見算法1。
算法的時間復(fù)雜度為O(itermax*N*t),itermax為迭代次數(shù),N為灰狼個數(shù),t為TCNN一次前向計算的時間。
將多維傳感器監(jiān)測數(shù)據(jù)轉(zhuǎn)換成圖像,是預(yù)處理步驟的核心問題。為了滿足在線實時檢測同時充分保留傳感器數(shù)據(jù)特點的需求,本文提出基于格拉姆矩陣的差值圖像編碼方式,易于實施且不丟失原始數(shù)據(jù)的特征。在時間點t,工業(yè)現(xiàn)場采集到的多維傳感器數(shù)據(jù)V={v1,v1,...vm},其中vi表示第i個傳感器的數(shù)值,m是傳感器的數(shù)量。首先使用z-scores[21]將數(shù)據(jù)歸一化,避免不同量綱帶來的影響。定義vi,j為兩個不同的傳感器數(shù)據(jù)的差值,即vi,j=vi-vj,i≠j。定義格拉姆差值矩陣G如下:
可以看出,格拉姆矩陣的主對角線保留了原始的傳感器數(shù)據(jù),即Gii=vi。而每一行保留了每個傳感器和其他傳感器的數(shù)據(jù)差值特征,即Gij=vi,j,當(dāng)模態(tài)的變化或故障的發(fā)生表現(xiàn)為某些傳感器數(shù)值的變化時,這可以在矩陣的差值特征中表現(xiàn)出來。為了將矩陣轉(zhuǎn)化成圖像,可以按照公式進(jìn)行縮放:
其中Gmax,Gmin分別為G中的最大值和最小值,I為單位矩陣。圖3(a)展示了52個傳感器在兩個不同采樣時刻的采樣值,分別標(biāo)為紅色和藍(lán)色。通過差值編碼后對應(yīng)的圖像為圖3(b)和圖3(c)。可以看出兩個時刻傳感器數(shù)據(jù)的變化在圖像上表現(xiàn)為不同的局部特征,為模態(tài)的辨識和故障的檢測提供了基礎(chǔ)。
圖3 插值編碼
基于TCNN的多模態(tài)過程在線監(jiān)測方法的框架如圖4所示。首先基于歷史數(shù)據(jù)進(jìn)行離線的模型訓(xùn)練,數(shù)據(jù)經(jīng)過編碼之后構(gòu)成數(shù)據(jù)集用于訓(xùn)練TCNN,通過灰狼優(yōu)化進(jìn)行超參數(shù)尋優(yōu)以期獲得較優(yōu)的分類模型。在線階段使用訓(xùn)練好的模型提取在線數(shù)據(jù)的高層特征識別當(dāng)前運行的模態(tài),進(jìn)一步通過離線學(xué)習(xí)到的模式匹配當(dāng)前運行狀況。
圖4 TCNN在線監(jiān)測框架
與傳統(tǒng)的MSPC方法不同,本文方法通過深層模型學(xué)習(xí)數(shù)據(jù)深層的特征,減少信息的丟失且不容易受到變量耦合的影響,以期提高在線監(jiān)測的效果。
本節(jié)以公開標(biāo)準(zhǔn)化工過程TEP數(shù)據(jù)集進(jìn)行實驗。TEP過程由美國某化工公司控制部門提出,由反應(yīng)器、冷凝器、分離器、循環(huán)壓縮機(jī)和汽提塔五個單元構(gòu)成,系統(tǒng)中有52個傳感器遍布管道、閥門和各種子設(shè)備進(jìn)行變量監(jiān)測,其運行結(jié)構(gòu)如圖5所示,過程輸入反應(yīng)物料為A,C,D,E四種,生成物料有G,H,F三種。本文使用41種測量值,包括22個連續(xù)測量值和19個成分變量,采樣間隔為3分鐘。TEP過程有多種運行模態(tài),每種運行模態(tài)都包含1種正常情況和21種故障情況。訓(xùn)練集每種情況包含480個樣本,共計10560個樣本。測試集每一類故障包含960個樣本,故障是在第160個樣本引入,共計17600個樣本。
圖5 TEP過程流程圖
本文選擇了TEP的基本模態(tài)、模態(tài)1、模態(tài)3和模態(tài)4的歷史數(shù)據(jù)訓(xùn)練模型。各個模態(tài)的工藝參數(shù)如表1所示。
表1 TEP模態(tài)參數(shù)
總數(shù)據(jù)集數(shù)量為10560*4=42252個。使用Keras框架搭建TCNN模型結(jié)構(gòu)為:輸入層、卷積層*4、TICA采樣層*4、全連接層*1。初始化灰狼個數(shù)為50,迭代次數(shù)設(shè)置為50,初始權(quán)重采用隨機(jī)初始化方法并進(jìn)行三次實驗。實驗環(huán)境為Intel i7,GPU 2080 Ti。三次實驗結(jié)果如圖6所示。
圖6 三次優(yōu)化實驗結(jié)果
模型超參數(shù)選擇第三次實驗的結(jié)果,超參數(shù)如表2所示。
表2 超參數(shù)尋優(yōu)結(jié)果
首先驗證TCNN網(wǎng)絡(luò)對工作模態(tài)的學(xué)習(xí)能力。TCNN模型最后學(xué)習(xí)到的全連接層特征是長度為128的一維向量,在某采樣時間點,四種工作模態(tài)下的向量值如圖7所示(從上到下依次為基本模態(tài),模態(tài)1,模態(tài)3和模態(tài)5)??梢钥闯?,四種模態(tài)在該采樣時間的特征向量彼此相異,表現(xiàn)為不同的上限和變化特征。
圖7 四種模態(tài)特征向量值
進(jìn)一步為了說明TCNN學(xué)習(xí)到的特征向量對模態(tài)的辨別能力,每個模態(tài)選取160個正常狀態(tài)的測試樣本進(jìn)行模式的辨別。分別選取特征向量的第2,4,18和23四個維度上分別進(jìn)行比較,如圖8所示。
圖8 四種模態(tài)在各個維度上的辨識結(jié)果
可以看到,在這四個維度上,四種模態(tài)分別在特定的范圍內(nèi)變化,可以和其他模態(tài)較好得識別開?;灸B(tài)可以通過第18維識別,模態(tài)1可以通過第2維識別,模態(tài)3可以通過第23維識別,模態(tài)5可以通過 第4維識別。作為對比,使用文獻(xiàn)[22]的PCA方法,選取TP2和SPE控制限對基本模態(tài)進(jìn)行識別,其在線監(jiān)測結(jié)果如圖9所示??梢钥闯隹刂葡薜膭澐謱?dǎo)致較多的漏識別情況。本文所提出的框架,學(xué)習(xí)到各個模態(tài)的特征更直接和清晰,可以起到相對較好的識別效果。
圖9 PCA方法對基本模態(tài)的識別結(jié)果
為了說明所提出的框架在檢測故障狀態(tài)方面的有效性,以基本模態(tài)為例,在測試集上進(jìn)行了20種故障的實驗。其中故障13為緩慢漂移故障。對過程的干擾較小因而較難檢測,TCNN模型第四層TICA采樣后學(xué)習(xí)到的正常狀態(tài)特征圖和故障13特征圖見圖10。在特征圖上故障13呈現(xiàn)局部亮點的特征,可以和正常狀態(tài)較好得區(qū)分開。
圖10 正常和故障13的特征圖
在線檢測階段,在基本模態(tài)下模擬了24小時的運行狀態(tài),在第8個小時引入故障13,本文方法的檢測結(jié)果如圖11所示。圖中的異常說明發(fā)生了漏報或者誤報。正常階段在4個采樣點產(chǎn)生了誤報,故障發(fā)生后在8個采樣點發(fā)生了漏報,誤報率和漏報率均為2.5%。作為對比,分別使用文獻(xiàn)[22]PCA和文獻(xiàn)[21]SVM方法,文獻(xiàn)[23]DBN方法對故障13進(jìn)行檢測。結(jié)果如圖12~圖14所示。
圖11 本文故障13在線監(jiān)測結(jié)果
圖12 PCA方法對故障13的監(jiān)測
圖13 SVM方法對故障13的監(jiān)測
圖14 DBN方法對故障13的監(jiān)測
從圖中可以直觀得看出PCA方法得漏報和誤報率較高,DBN方法優(yōu)之,SVM方法較優(yōu),但都劣于本文方法。在誤報率上,上述三個方法分別為12.7%,6.2%和5%,均高于本文的2.5%。在漏報率上,上述方法分別為15.6%,7.5%和10.9%,均高于本文的2.5%。在故障13的綜合檢測率上,本文方法取得了較好的結(jié)果。
接著,在基本模態(tài)下所有20種故障的檢測率和對比結(jié)果如表3所示。
表3 各方法故障監(jiān)測率對比
表中每類故障最好的檢測結(jié)果均加粗標(biāo)出,其中CNN方法取得了14次最好的結(jié)果,高于其它方法。同時CNN方法對故障10,16和19的檢測率高于其他方法10%以上。此外TCNN方法的平均故障檢測率最佳,高出PCA方法11.27%,高出SVM方法1.83%。
本文提出了一種基于TCNN的多模態(tài)過程故障檢測方法,利用差值編碼將傳感器數(shù)值轉(zhuǎn)換成圖像,用于訓(xùn)練全局判別模型,使用灰狼優(yōu)化算法進(jìn)行超參數(shù)尋優(yōu)。提出的方法可以進(jìn)行在線的模態(tài)識別和故障檢測,在TEP數(shù)據(jù)集的實驗結(jié)果表明,該方法有較好的模態(tài)識別率和故障檢測率,降低了誤報率和漏報率。該方法為多模態(tài)故障智能檢測提供了新的思路。