鄧明月,劉建昌,許鵬,譚樹彬,商亮亮
(1 東北大學(xué)信息科學(xué)與工程學(xué)院,遼寧沈陽110819; 2 南通大學(xué)電氣工程學(xué)院,江蘇南通226019)
隨著工業(yè)規(guī)模和復(fù)雜性的不斷增加,故障檢測與診斷技術(shù)在確保工藝安全和提高產(chǎn)品質(zhì)量方面已顯示出巨大的價(jià)值。近年來,受益于計(jì)算機(jī)技術(shù)及分布式系統(tǒng)快速發(fā)展,大量的過程數(shù)據(jù)得以采集、存儲(chǔ)?;跀?shù)據(jù)驅(qū)動(dòng)的多元統(tǒng)計(jì)過程監(jiān)測(multivariate statistical process monitoring,MSPM)方法得到了迅速發(fā)展并廣泛應(yīng)用于各類工業(yè)過程中[1-3]。
MSPM 方法的核心思想是從高維數(shù)據(jù)中提取表征數(shù)據(jù)內(nèi)在關(guān)系的潛引變量,并在由這些變量構(gòu)成的低維子空間中建立統(tǒng)計(jì)指標(biāo),最終根據(jù)指標(biāo)的變化情況對(duì)過程進(jìn)行監(jiān)測。典型方法包括主元分析法(principal component analysis,PCA)[4]、偏最小二乘法(partial least squares,PLS)[5]、獨(dú) 立 元 分 析 法(independent component analysis,ICA)[6]等。PCA 和PLS 都是以保留原變量最大方差為原則,選擇一組不相關(guān)變量的線性組合來表示原始相關(guān)變量。此外,PLS 還考慮了輸入輸出變量之間的回歸關(guān)系。它們在使用時(shí)僅利用了二階統(tǒng)計(jì)量方差,因此在處理非高斯過程時(shí)效果較差。ICA 可以從原變量中提取基于高階統(tǒng)計(jì)量的獨(dú)立分量,因此其對(duì)非高斯過程可實(shí)現(xiàn)有效監(jiān)測。然而,上述方法都是線性處理方法,對(duì)于非線性過程表現(xiàn)較差。通過引入核技術(shù),核主元分析法(kernel principal component analysis,KPCA)[7]、核 獨(dú) 立 元 分 析 法(kernel independent component analysis,KICA)[8]等方法被提出。這類方法通過核函數(shù)將輸入空間數(shù)據(jù)映射到高維特征空間,假設(shè)在此空間下數(shù)據(jù)變?yōu)榫€性,然后利用線性方法提取潛引變量并計(jì)算表征過程運(yùn)行狀態(tài)的統(tǒng)計(jì)量從而實(shí)現(xiàn)過程監(jiān)測。T2與SPE(squared prediction error)是上述方法常用的監(jiān)測統(tǒng)計(jì)量[9]。具體來說,T2統(tǒng)計(jì)量計(jì)算了樣本數(shù)據(jù)點(diǎn)與特征空間原點(diǎn)之間的距離,衡量了特征空間中變量的變化情況。SPE統(tǒng)計(jì)量則考慮了變量之間的相關(guān)性被改變的程度,同T2一樣,其本質(zhì)上也是通過度量距離的變化來評(píng)估過程偏差。因此,這兩種統(tǒng)計(jì)量實(shí)現(xiàn)有效檢測的前提是故障幅度不能被計(jì)算監(jiān)測統(tǒng)計(jì)量時(shí)產(chǎn)生的可變性所掩蓋。也就是說,它們對(duì)幅值發(fā)生了明顯變化的故障檢測效果好,對(duì)于那些只改變變量協(xié)方差結(jié)構(gòu)或潛在分布變化的故障表現(xiàn)較差[10]。
Jenssen[11]提出了KECA 用于數(shù)據(jù)變換和降維。KECA 是一種基于信息論的非線性數(shù)據(jù)變換方法,保持了輸入空間數(shù)據(jù)集的最大Renyi 熵。具體變換過程為:首先利用核函數(shù)將原始數(shù)據(jù)映射到高維特征空間,然后對(duì)所得的核矩陣進(jìn)行特征分解,得到每一對(duì)特征值和特征向量對(duì)熵值的貢獻(xiàn),接著選擇前m個(gè)對(duì)熵值貢獻(xiàn)最大的特征向量作為投影方向,使得數(shù)據(jù)在變化前后熵?fù)p最小。KECA 變換的獨(dú)特之處在于:(1) 與KPCA 相比,KECA 可以利用更多有用的信息。KPCA 只考慮了二階統(tǒng)計(jì)量方差,只能提取數(shù)據(jù)中的高斯特征[12]。KECA 試圖最大程度保留原始數(shù)據(jù)的熵值。在信息論中,熵被用于度量信息的不確定度,這種度量利用了數(shù)據(jù)中的高階統(tǒng)計(jì)量。因此,KECA 可以提取數(shù)據(jù)中的非高斯信息。(2) KECA 可以揭示數(shù)據(jù)中潛在的集群結(jié)構(gòu)。它通常生成一個(gè)具有不同角度結(jié)構(gòu)的轉(zhuǎn)換數(shù)據(jù)集,這反映了每個(gè)特征向量都攜帶關(guān)于數(shù)據(jù)集的集群結(jié)構(gòu)的信息。圖1 給出了一個(gè)非線性數(shù)據(jù)集及其經(jīng)過KECA 變換后的數(shù)據(jù)分布圖??梢姡?jīng)過KECA 變換后,不同類的數(shù)據(jù)會(huì)被映射到具有潛在標(biāo)簽的不同角度方向上。上述這些特性使得KECA 已被成功地用于特征提取和聚類等領(lǐng)域[13-15]。在工業(yè)過程監(jiān)測方面,Jiang 等[16]驗(yàn)證了KECA 在監(jiān)測非線性化工過程方面的有效性。Yang 等[17]提出了基于小波變換和KECA 的故障檢測與診斷方法,在高斯和非高斯同時(shí)存在的情況下取得了令人滿意的性能。但其在進(jìn)行檢測時(shí)仍使用基于距離的T2及SPE 統(tǒng)計(jì)量,沒有考慮投影后數(shù)據(jù)的結(jié)構(gòu)特征。齊詠生等[18]提出了一種改進(jìn)的KECA 化工過程故障檢測方法。該方法考慮了KECA 投影后數(shù)據(jù)的結(jié)構(gòu)特性,設(shè)計(jì)了基于CS(Cauchy-Schwarz)測度的角度監(jiān)測指標(biāo)實(shí)現(xiàn)故障檢測。然而,該指標(biāo)的平均檢測率雖然比T2高,但改進(jìn)效果并不明顯。
圖1 非線性數(shù)據(jù)集及其KECA變換Fig.1 Nonlinear data set and KECA transformation
在檢測到故障后,對(duì)故障源進(jìn)行診斷是快速修復(fù)故障的關(guān)鍵。目前,常用的診斷方法有貢獻(xiàn)圖法[19-20]和故障模式識(shí)別法[21-25]。貢獻(xiàn)圖法通過比較各過程變量對(duì)監(jiān)測統(tǒng)計(jì)量的貢獻(xiàn),利用貢獻(xiàn)大小分離故障變量。然而,對(duì)于一些涉及多個(gè)相關(guān)故障變量的復(fù)雜故障,貢獻(xiàn)圖法可能不能很好地發(fā)揮作用。作為故障模式識(shí)別法中的典型方法,相似度因子法因其簡單、快速、應(yīng)用性強(qiáng)等特點(diǎn)已被眾多學(xué)者廣泛研究并應(yīng)用于實(shí)際工業(yè)過程中[23-25]。該方法通過度量與其他已知?dú)v史數(shù)據(jù)集的相似程度來識(shí)別未知故障。Johannesmeyer 等[23]提出了基于PCA 相度似因子(PCA similarity factor,PCASF)的多變量數(shù)據(jù)庫模式匹配方法。該方法通過比較兩個(gè)數(shù)據(jù)集的主元子空間來度量它們的相似性。針對(duì)非線性工業(yè)過程的故障識(shí)別問題,Deng 等[25]提出了基于KPCA 相似度因子(KPCA similarity factor,KPCASF)的模式識(shí)別方法。由于KPCA 只利用了過程變量的方差信息,所以缺乏有效處理非高斯數(shù)據(jù)的能力。事實(shí)上,工業(yè)過程數(shù)據(jù)往往是高斯與非高斯分布共存,在此情況下,基于KPCASF 的故障識(shí)別方法在故障診斷方面可能表現(xiàn)不佳。
為了有效地實(shí)現(xiàn)非線性工業(yè)過程的故障檢測與診斷,本文提出了一種基于KECA 的新方法。首先,考慮到KECA 可以以角結(jié)構(gòu)的方式揭示數(shù)據(jù)中潛在集群結(jié)構(gòu),設(shè)計(jì)了一種新的基于角度的監(jiān)測指標(biāo)。該指標(biāo)充分利用了變換后數(shù)據(jù)間的結(jié)構(gòu)特征,使用角度方差度量了數(shù)據(jù)對(duì)象之間在方向上的相對(duì)差異,彌補(bǔ)了基于距離的監(jiān)測指標(biāo)對(duì)那些故障幅度較小、數(shù)據(jù)結(jié)構(gòu)變化不明顯的故障監(jiān)測效果較差的不足。其次,構(gòu)建了KECA 相似度因子用于故障識(shí)別。不同于PCASF 和KPCASF,由于KECA 所提取的熵成分可以是非線性、非高斯的,因此,KECA相似度因子可以對(duì)同時(shí)具有高斯與非高斯特性的非線性過程進(jìn)行故障識(shí)別。最后,通過典型非線性過程與TE 過程來驗(yàn)證本文所提方法在過程監(jiān)測方面的有效性。
對(duì)于一個(gè)由概率密度函數(shù)p(x)生成的數(shù)據(jù)集D:(x1,x2,…,xN),其Renyi熵被定義為
由于對(duì)數(shù)函數(shù)是單調(diào)函數(shù),這里只考慮V(p)=∫p2(x)dx的大小。為了估計(jì)V(p),引入了Parzen 窗概率密度估計(jì)函數(shù)
式中,xt∈D;kσ(x,xt)為Mercer 核函數(shù);σ為核函數(shù)的參數(shù)。利用樣本均值近似估計(jì)得到
式中,xt′ ∈D;K為N×N的核矩陣;1 為一個(gè)N× 1 的單位向量??赏ㄟ^核矩陣的特征值和特征向量來進(jìn)行Renyi 熵的估計(jì),核矩陣可以特征分解為K=ΦTΦ=EΛET,Λ為特征值λ1,…,λN組成的對(duì)角陣,E為以e1,…,eN為列的特征向量矩陣,進(jìn)一步推導(dǎo)可得
由式(4)可以看出,V?(p)的每一個(gè)分量都對(duì)應(yīng)著一個(gè)特征向量的熵的估計(jì)值,不同的特征值與特征向量對(duì)Renyi熵的貢獻(xiàn)不同。
定義一個(gè)從輸入空間到核特征空間的非線性映射?:Rd→?,表現(xiàn)形式為xt→?(xt),t= 1,2,…,N,這里讓?duì)?[?(x1),?(x2),…,?(xN)]。將N維數(shù)據(jù)通過Φ映射到由k個(gè)KPCA 主軸張成的子空間Um上,選取對(duì)式(4)中熵值貢獻(xiàn)較大的前k個(gè)特征值和特征向量,可以得到轉(zhuǎn)換后的數(shù)據(jù)
式 中,Tm=[t1,t2,…,tm] 為 得 分 矩 陣;Λm=diag(λ1,…,λm);Em=(e1,…,em)為對(duì)應(yīng)的特征向量矩陣。
樣本外數(shù)據(jù)點(diǎn)通過Φ'投影到Um上滿足
KECA 作為一種MSPM 方法,使用能夠表征過程運(yùn)行狀態(tài)的監(jiān)測指標(biāo)實(shí)現(xiàn)故障檢測。當(dāng)過程的運(yùn)行情況偏離受控狀態(tài)時(shí),監(jiān)測指標(biāo)會(huì)發(fā)生相應(yīng)的變化。此時(shí),根據(jù)指標(biāo)的變化情況就可以進(jìn)行故障檢測。因此,使用合適的監(jiān)測指標(biāo)是保證有效故障檢測的前提。
2.1.1 基于距離的監(jiān)測指標(biāo)T2及SPE 統(tǒng)計(jì)量為典型的基于距離的監(jiān)測指標(biāo)。
T2統(tǒng)計(jì)量被定義為:
從式(7)可以看出,T2統(tǒng)計(jì)量利用得分向量的模的變化來反映過程的變化情況。由于特征空間包含了反應(yīng)過程運(yùn)行狀態(tài)的大部分信息。因此使用可以同時(shí)監(jiān)控多個(gè)得分向量的T2控制圖就可以監(jiān)視整個(gè)生產(chǎn)過程。
SPE統(tǒng)計(jì)量被定義為:
SPE 統(tǒng)計(jì)量刻畫了變量之間的相關(guān)性被改變的程度,顯示了異常的過程狀況。
事實(shí)上,T2及SPE 統(tǒng)計(jì)量本質(zhì)上都是基于距離的監(jiān)測指標(biāo),只考慮對(duì)具有一定故障幅度的重要故障進(jìn)行檢測,并要求這些故障幅度不能被計(jì)算監(jiān)測統(tǒng)計(jì)量時(shí)產(chǎn)生的可變性所掩蓋。因此,這兩種指標(biāo)對(duì)那些故障幅度較小及只有數(shù)據(jù)間潛在結(jié)構(gòu)變化的故障監(jiān)測效果較差。
2.1.2 基于角度的監(jiān)測指標(biāo)設(shè)計(jì) 考慮到KECA 通常生成一個(gè)具有不同角度結(jié)構(gòu)的轉(zhuǎn)換數(shù)據(jù)集。即經(jīng)過KECA 變換后不同類的數(shù)據(jù)會(huì)投影到不同的軸向上,揭示了數(shù)據(jù)中潛在的集群結(jié)構(gòu)。因此,利用KECA 變換后數(shù)據(jù)間的角度結(jié)構(gòu)設(shè)計(jì)監(jiān)測指標(biāo)用于故障檢測,是一種可行的方案。
文獻(xiàn)[26]提出了一種基于角度的離群點(diǎn)檢測思想,其使用向量間角度的方差來表述數(shù)據(jù)對(duì)象之間在方向上的相對(duì)差異?;诮嵌鹊碾x群點(diǎn)檢測示意圖如圖2 所示??梢钥闯?,對(duì)于圖2 中圓形區(qū)域內(nèi)的一個(gè)未離群點(diǎn),其與周圍各向數(shù)據(jù)點(diǎn)形成的所有向量之間的夾角差異很大,相應(yīng)地會(huì)得到較大的角度方差;而對(duì)于圓形區(qū)域外的離群點(diǎn)來說,大部分未離群的點(diǎn)多是在某一方向上的聚類簇內(nèi),離群點(diǎn)和這些未離群點(diǎn)形成的角度差異很小,則其角度方差會(huì)相對(duì)較小。因此,一個(gè)點(diǎn)的角度方差如果相當(dāng)小,那么它就有很大概率為離群點(diǎn)。為了度量上述的角度差異,文獻(xiàn)[26]還給出了一種快速計(jì)算方法——近似ABOF。其計(jì)算的是數(shù)據(jù)集中A的差分向量對(duì)其k近鄰的集合中所有點(diǎn)對(duì)的角度方差,滿足
式中,A∈D;(A,B,C)三點(diǎn)相互不同。
圖2 基于角度的離群點(diǎn)檢測示意圖Fig.2 Schematic diagram of angle-based outlier detection
回看圖1 中的KECA 數(shù)據(jù)變換結(jié)果,對(duì)于投影到不同軸向上的三類數(shù)據(jù),當(dāng)設(shè)定某一軸向上的同類數(shù)據(jù)為正常數(shù)據(jù)集時(shí),其他軸向上的點(diǎn)與該軸點(diǎn)之間的角度方差會(huì)很小。此時(shí),依據(jù)上述思想,其他軸向上的數(shù)據(jù)點(diǎn)就會(huì)被判斷為離群點(diǎn)。受此啟發(fā),本文設(shè)計(jì)了基于角度的VoA監(jiān)測指標(biāo)用于KECA 的故障檢測。該指標(biāo)是對(duì)由KECA 變換得到的得分向量計(jì)算approxABOF值,并通過與相應(yīng)的閾值進(jìn)行比較來判斷是否為離群點(diǎn),即故障數(shù)據(jù)點(diǎn)。計(jì)算方法如下:
式中,Nk(ti′)?Tm為測試數(shù)據(jù)的得分向量ti′在正常訓(xùn)練樣本得分向量集內(nèi)的k近鄰;tp,tq∈Nk(ti′)。 當(dāng) 進(jìn) 行 在 線 監(jiān) 測 時(shí),ti′ 的approxABOF 即為其與Nk(ti′)中所有得分向量對(duì)之間角度的方差。若其approxABOF值較小,意味著ti′偏離了樣本集數(shù)據(jù)的角度結(jié)構(gòu),區(qū)別于正常情況下的數(shù)據(jù)分布,可將其判斷為故障點(diǎn)。
為了和傳統(tǒng)監(jiān)測指標(biāo)統(tǒng)一,即未發(fā)生故障時(shí),監(jiān)測統(tǒng)計(jì)量值較小,發(fā)生故障時(shí),統(tǒng)計(jì)量值迅速增大。因此,將approxABOF 平方的倒數(shù)作為VoA監(jiān)控指標(biāo)的設(shè)計(jì)依據(jù),即
其中,為了保持?jǐn)?shù)據(jù)分布的局部結(jié)構(gòu),最近鄰k的數(shù)量通常設(shè)置為一個(gè)不大于15 的整數(shù)[27]。同時(shí),為了保證近似算法具有精確的計(jì)算結(jié)果,k值應(yīng)該足夠大[27]。具體的k值大小根據(jù)實(shí)際情況確定。從式(11)可以看出,如果過程偏離了正常操作工況,過程變量之間的分布情況會(huì)發(fā)生相應(yīng)的改變,導(dǎo)致各得分向量之間夾角的差異變大,approxABOF 值降低,相應(yīng)的VoA監(jiān)控統(tǒng)計(jì)量值迅速增大。此時(shí)通過比較測試數(shù)據(jù)的統(tǒng)計(jì)量VoAtest與在正常運(yùn)行狀態(tài)下得到的樣本數(shù)據(jù)統(tǒng)計(jì)量的控制限VoAlimit大小,即可判斷過程是否發(fā)生故障。其中VoAlimit由核密度估計(jì)(kernel density estimation,KDE)方法來確定。
基于KECA 的過程監(jiān)測過程包括離線建模和在線檢測兩個(gè)階段。在離線建模階段,建立基于KECA 的過程監(jiān)測模型,確定監(jiān)測統(tǒng)計(jì)量的控制限;在在線檢測階段,對(duì)實(shí)時(shí)觀測數(shù)據(jù)進(jìn)行KECA 變換,然后計(jì)算監(jiān)測統(tǒng)計(jì)量,通過與相應(yīng)的控制限比較判斷過程是否發(fā)生了故障。由于特征空間中包含了反應(yīng)過程運(yùn)行狀態(tài)的大部分信息,同時(shí)考慮到本文所提VoA統(tǒng)計(jì)量使用的是得分向量進(jìn)行計(jì)算,監(jiān)測的是特征空間的變化情況,因此本文主要對(duì)特征空間進(jìn)行監(jiān)測。圖3 給出了基于KECA 的過程監(jiān)測流程,具體步驟如下。
離線建模:
(1)對(duì)正常訓(xùn)練數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,使其具有零均值和單位方差;
(2) 給定核函數(shù)及核參數(shù),利用樣本數(shù)據(jù)構(gòu)建KECA模型并提取得分矩陣Tm=[t1,t2,…,tm];
(3) 利用式(11)計(jì)算樣本數(shù)據(jù)的VoA監(jiān)測統(tǒng)計(jì)量;
(4)計(jì)算監(jiān)測統(tǒng)計(jì)量的控制限VoAlimit。
在線檢測:
(1)按離線步驟(1)所得樣本數(shù)據(jù)的均值與方差對(duì)測試數(shù)據(jù)歸一化;
圖3 基于KECA的過程監(jiān)測流程圖Fig.3 Flowchart of process monitoring based on KECA
(2) 對(duì)當(dāng)前測試數(shù)據(jù)進(jìn)行KECA 分析并提取得分向量ti′;
(3) 根據(jù)式(11)計(jì)算測試數(shù)據(jù)的VoAtest監(jiān)測統(tǒng)計(jì)量;
(4) 將VoAtest與相應(yīng)的控制限VoAlimit進(jìn)行比較,如果VoAtest>VoAlimit,則判斷工業(yè)過程發(fā)生了故障,反之,則認(rèn)為測試數(shù)據(jù)正常,返回繼續(xù)監(jiān)測。
基于KECA 的監(jiān)測模型只能檢測出故障,而不提供導(dǎo)致故障的根本原因的信息。一旦故障被檢測到,則識(shí)別故障模式、找出故障根源便成為故障診斷中一個(gè)具有挑戰(zhàn)性的任務(wù)。目前,基于相似度因子的故障模式識(shí)別方法被眾多學(xué)者廣泛研究。相似度因子的核心思想是通過比較兩個(gè)特征子空間的相似程度來識(shí)別故障模式[25]。本文在此基礎(chǔ)上,構(gòu)建了KECA 相似度因子(KECA similarity factor,KECASF)用于故障模式識(shí)別。其通過衡量待測數(shù)據(jù)集與已知故障模式數(shù)據(jù)集之間特征子空間的相似程度,以此判斷測試數(shù)據(jù)的故障類型。下面對(duì)KECASF 的計(jì)算方法進(jìn)行詳細(xì)的推導(dǎo)。
使用KECA 得到測試故障數(shù)據(jù)集S和歷史故障模式數(shù)據(jù)集H的特征子空間L和V分別為
式中,EL和EV分別為S和H經(jīng)過KECA 變換后得到的對(duì)熵值貢獻(xiàn)最大的前m個(gè)特征向量組成的矩陣。
此時(shí),KECASF被定義為
定 義 核 函 數(shù)KSH=Φ(S)Φ(H)T及KHS=Φ(H)Φ(S)T。此時(shí),KECASF可以重新表示為
圖4 基于KECA的故障識(shí)別流程Fig.4 Flowchart of fault identification based on KECA
本節(jié)以典型的非線性過程及TE過程為例,對(duì)本文所提出的基于KECA 的故障檢測與診斷方法進(jìn)行了評(píng)估,并與基于PCA、KPCA 的方法進(jìn)行了性能比較。
為了驗(yàn)證所提方法的有效性,采用文獻(xiàn)[28]中給出的非線性數(shù)值案例,具體結(jié)構(gòu)表述如下。
故障1:從第251 個(gè)樣本開始直到進(jìn)程結(jié)束,向變量x3加入一個(gè)幅值大小為0.03的微小階躍故障。
故障2:從第101 個(gè)樣本開始直到進(jìn)程結(jié)束,給變量x2加入一個(gè)0.005(t- 100)形式的微小斜坡故障。
圖5 和 圖6 給 出 了KECA-VoA、KECA-T2、KPCA-T2及文獻(xiàn)[18]中的KECA-CS方法對(duì)兩種微小故障的檢測結(jié)果??梢钥闯觯瑢?duì)于故障1,四種方法的統(tǒng)計(jì)量始終圍繞控制限上下波動(dòng),不能連續(xù)觸發(fā)報(bào)警,但KECA-VoA方法超過控制限的部分要多于另外三種方法。對(duì)于故障2,雖然四種方法都檢測到了故障的發(fā)生,但它們在檢出故障的實(shí)時(shí)性方面有一定的差距。KECA-VoA、KECA-CS、KPCA-T2和KECA-T2檢出故障的時(shí)刻分別106、123、132、133,其中KECA-VoA檢出故障的時(shí)間明顯提前于其他三種方法。
為了更準(zhǔn)確地比較KECA-VoA、KECA-CS、KECA-T2及KPCA-T2的故障檢測性能,表1 列出了四種方法對(duì)兩種微小故障的檢測率。當(dāng)故障1發(fā)生時(shí),KECA-VoA的檢測率最高為62%,KECA-T2和KECA-CS 的檢測率相近,KPCA-T2具有最低的檢測率;當(dāng)故障2 發(fā)生時(shí),KECA-VoA的檢測率要高于其他三種方法。該結(jié)果表明,本文所設(shè)計(jì)的VoA監(jiān)測指標(biāo)能夠有效提高對(duì)微小故障的檢測性能。
為了進(jìn)一步驗(yàn)證所提改進(jìn)KECA 方法的有效性,通過TE 仿真平臺(tái)進(jìn)行仿真驗(yàn)證。TE 過程是一個(gè)基于化工過程的仿真平臺(tái),被廣泛用作各種過程監(jiān)控策略比較的基準(zhǔn)過程[29-31]。該過程由反應(yīng)器、冷凝器、汽提器、分離器和壓縮機(jī)五個(gè)主要單元組成,包含52 個(gè)監(jiān)測變量,其中有11 個(gè)操作變量、22個(gè)連續(xù)過程變量和19 個(gè)成分變量。本文選用22 個(gè)連續(xù)變量和11個(gè)操作變量來模擬TE反應(yīng)過程。TE模擬器總共生成21種不同類型的故障,包括工藝變量的階躍變化和隨機(jī)變化、反應(yīng)動(dòng)力學(xué)的緩慢漂移、閥門卡死以及一些未知的故障。此外,TE 過程提供了正常運(yùn)行條件下的兩個(gè)數(shù)據(jù)集,分別包含500 和960 個(gè)樣本。同時(shí)每個(gè)故障條件下還包括兩種故障數(shù)據(jù)集:分別為包含500 個(gè)觀測值的訓(xùn)練數(shù)據(jù)集和包含960 個(gè)觀測值的測試數(shù)據(jù)集,故障點(diǎn)在第20個(gè)樣本及第160個(gè)樣本后引入。
圖5 微小故障1的檢測結(jié)果Fig.5 Fault detection results of minor fault 1
圖6 微小故障2的檢測結(jié)果Fig.6 Fault detection results of minor fault 2
表1 兩種微小故障的檢測率Table 1 Fault detection rate of two minor faults/%
4.2.1 故障檢測性能 本文使用960個(gè)正常數(shù)據(jù)樣本建立基于KECA 和KPCA 的監(jiān)測模型,并利用21種故障的測試數(shù)據(jù)集對(duì)兩種監(jiān)測模型進(jìn)行性能評(píng)價(jià)。兩種方法均選用19 個(gè)主元。使用故障檢測率(fault detection rate,F(xiàn)DR)、誤報(bào)率(false alarm rate,F(xiàn)AR)及檢測延遲(detection latency,DL)來評(píng)價(jià)KECA-VoA、KECA-T2及KPCA-T2三種方法對(duì)TE 過程的監(jiān)測能力。其中,故障檢測率為檢出故障數(shù)與故障樣本總數(shù)的比值,誤報(bào)率為誤報(bào)故障數(shù)與正常樣本總數(shù)的比值,檢測延遲為檢出故障時(shí)間與實(shí)際故障發(fā)生時(shí)間的差值,這里定義為首次連續(xù)5 個(gè)及其以上采樣點(diǎn)的統(tǒng)計(jì)量超過控制限才被判定為發(fā)生了故障。下面以故障4、16 及21 為例,進(jìn)行故障監(jiān)測性能實(shí)驗(yàn)。
故障4 為反應(yīng)器冷卻水入口溫度的階躍變化。當(dāng)擾動(dòng)發(fā)生時(shí),反應(yīng)器溫度會(huì)突然升高。由于控制器的作用,擾動(dòng)發(fā)生不久后反應(yīng)器溫度會(huì)恢復(fù)到設(shè)定值,但反應(yīng)器冷卻水流量會(huì)異常增加。這說明故障仍存在于生產(chǎn)過程中,需要系統(tǒng)持續(xù)發(fā)出警報(bào)。KECA-VoA、KECA-T2及KPCA-T2三種方法對(duì)故障4的檢測結(jié)果如圖7 所示??梢钥闯?,KPCA-T2雖然可以檢測出故障4,但統(tǒng)計(jì)量始終圍繞控制限上下波動(dòng),不能連續(xù)觸發(fā)報(bào)警;相比之下,基于KECA 的VoA及T2統(tǒng)計(jì)量從第161 個(gè)樣本開始保持在控制限以上,清晰可靠地檢測到了發(fā)生的故障。此外,KPCA 的T2統(tǒng)計(jì)量在前160 個(gè)樣本中有個(gè)別超過控制限,存在一定的誤報(bào),而基于KECA 的方法誤報(bào)率為0。說明了KECA 在檢測故障4 方面比KPCA 更有效。
圖8 給出了故障16 的檢測結(jié)果??梢钥闯觯琄PCA-T2方法幾乎不能檢測出故障,故障檢測率較低只有14%。相比之下,基于KECA 的方法故障檢出效果明顯提升。其中KECA-T2的檢測率為85.85%,KECA-VoA檢測率提高至87.88%。這說明KECA-VoA更能有效地檢測故障16。實(shí)際上,故障16 是一種未知故障。當(dāng)故障發(fā)生時(shí),過程數(shù)據(jù)的整體均值偏差不大,數(shù)據(jù)特征并沒有發(fā)生明顯變化,從而使得基于幅值的監(jiān)測方法效果可能并不理想。
圖7 故障4的檢測結(jié)果Fig.7 Fault detection results of fault 4
圖8 故障16的檢測結(jié)果Fig.8 Fault detection results of fault 16
故障21 為流4 的閥門被固定在穩(wěn)態(tài)位置。其故障幅值較小,不易檢測。從圖9 給出的監(jiān)測結(jié)果觀察到,KECA-VoA、KECA-T2及KPCA-T2檢出故障的時(shí)刻分別為610、655 和666。很明顯KECA-VoA檢出故障的時(shí)間要提前于其他兩種方法。此外,KECA-T2和KPCA-T2的故障檢測率相近,分別為42.5% 和42%,KECA-VoA的檢測率有所提高為50%。這再次驗(yàn)證了KECA-VoA能夠提高故障檢測性能。
表2 給出了三種方法對(duì)TE 過程21 種故障的檢測結(jié)果。由于故障3、9 及15 的故障征兆不明顯,基于數(shù)據(jù)驅(qū)動(dòng)的方法很難將它們檢測出來,因此本文對(duì)這三種故障不加以考慮。除故障4、11、21 外,由表2 可以看出對(duì)于故障1、2、6、7、8、12、13、14、18,KECA 及KPCA 的檢測率都較高。其中除了故障2,KECA-VoA的檢測率都高于其他兩種方法。對(duì)于故障10、16、17、19,KECA的檢測性能明顯高于KPCA。同時(shí),相較于使用度量距離的T2監(jiān)測指標(biāo),使用VoA進(jìn)行故障檢測可以得到更高的檢測率。此外,三種方法對(duì)故障5 的檢測效果差別不大,但KECA-VoA較其他方法檢測性能還是有所提升。比較三種方法的平均檢測率,KECA-VoA要高于其他方法,并且其故障誤報(bào)率最低。在檢出故障的實(shí)時(shí)性方面,KECA-VoA幾乎對(duì)所有故障的檢測延遲都小于其他兩種。實(shí)際上,故障初期的幅值一般都較小,KECA-VoA方法可以最快發(fā)現(xiàn)故障,因此其對(duì)應(yīng)微小故障的監(jiān)測性能有所提升。綜上所述,與現(xiàn)有的方法相比,本文所提方法能夠更有效地檢測TE過程的故障。
4.2.2 故障識(shí)別性能 當(dāng)檢測到故障后,需要判斷發(fā)生的故障類型。本文比較了KECASF、KPCASF及PCASF的故障識(shí)別性能。
圖9 故障21的檢測結(jié)果Fig.9 Fault detection results of fault 21
對(duì)TE 過程21 種故障數(shù)據(jù)構(gòu)建三種數(shù)據(jù)集,分別為歷史故障模式數(shù)據(jù)集、故障早期數(shù)據(jù)集和故障測試數(shù)據(jù)集[25]。如表3 所示,選取21 種故障的訓(xùn)練數(shù)據(jù)構(gòu)成歷史故障模式數(shù)據(jù)集F01H~F21H 用于建立相似度模型。選取測試數(shù)據(jù)集的第161~360個(gè)樣本構(gòu)成故障早期數(shù)據(jù)集F01E~F21E,這些樣本對(duì)應(yīng)于發(fā)生故障的早期階段。選取測試數(shù)據(jù)集中所有的故障樣本,即第161~960個(gè)樣本,作為故障測試數(shù)據(jù)集F01T ~F21T。計(jì)算未知故障數(shù)據(jù)與F01H ~F21H之間的相似度因子,根據(jù)結(jié)果中的最大值可識(shí)別出發(fā)生的故障類型[25]。
對(duì)21 種故障測試數(shù)據(jù)集的識(shí)別結(jié)果進(jìn)行分析,并與文獻(xiàn)[25]中基于PCASF 和KPCASF 方法的識(shí)別結(jié)果進(jìn)行了比較。為了公平比較,對(duì)故障測試數(shù)據(jù)集F01T~F21T,使用滑動(dòng)窗口技術(shù),選用與文獻(xiàn)[25]中相同的窗口寬度L 為100 個(gè)樣本,確定了15 個(gè)故障數(shù)據(jù)集窗口,設(shè)置移動(dòng)步長為50 個(gè)樣本。
表4 給出了PCASF、KPCASF 及KECASF 的故障識(shí)別結(jié)果。其中NALL為總移動(dòng)窗口數(shù),NPCASF、NKPCASF、NKECASF是正確識(shí)別的窗口數(shù),ηPCASF、ηKPCASF、ηKECASF是不同方法的正確識(shí)別率。從表4可以看出,KECASF 與PCASF 和KPCASF 對(duì)故障數(shù)據(jù)集F01T、F02T、F04T、F14T 和F20T 有著完全相同的識(shí)別結(jié)果,它們可以識(shí)別上述5 個(gè)故障數(shù)據(jù)集的全部15 個(gè)數(shù)據(jù)窗口。對(duì)于F03T、F05T、F08T、F09T、F10T、F12T、F13T、F15T 和F16T 九種故障集,KECASF 能明顯提高正確識(shí)別率。但是,其降低了故障集F18T、F19T、F21T 的識(shí)別率。整體而言,KECASF 的正確識(shí)別率均值由PCASF 的65.1%和KPCASF 的67.9%提高到78.7%。因此,可以認(rèn)為KECASF 對(duì)TE 過程的故障進(jìn)行了有效識(shí)別,本文所提方法顯著提高了TE過程的故障識(shí)別性能。
需要指出的是,本文構(gòu)建的KECASF 故障模式識(shí)別策略并沒有考慮未知故障模式的情況。如果新發(fā)生的故障與所有已知的歷史故障模式之間的相似度因子都接近于0,則新發(fā)生的故障可能是未知的。在這種情況下,需要使用其他方法來識(shí)別故障。當(dāng)確定了新發(fā)生的故障類型,就可以將其數(shù)據(jù)集添加到歷史故障模式數(shù)據(jù)集中。
表2 TE過程21種故障的故障檢測率、誤報(bào)率及檢測延遲Table 2 Fault detection rate,false alarm rate and detection latency of 21 faults in TE process
表3 用于故障識(shí)別的TE過程數(shù)據(jù)集Table 3 TE process datasets for fault identification
圖10 故障7的F07E與F01H~F21H之間的KECASF Fig.10 KECASF between F07E of fault 7 and fault mode data set F01H—F21H
表4 TE過程故障測試數(shù)據(jù)集的識(shí)別結(jié)果Table 4 Identification results of TE process fault test data set
本文提出了一種基于KECA 的非線性過程故障檢測及診斷新方法。該方法首先采用KECA 獲取數(shù)據(jù)的得分向量及非線性特征子空間,并通過分析KECA 變換后數(shù)據(jù)間的結(jié)構(gòu)特征設(shè)計(jì)了VoA角度監(jiān)控指標(biāo)用于故障檢測。該指標(biāo)使用各得分向量之間的角度方差度量變換后數(shù)據(jù)對(duì)象在方向上的差異,彌補(bǔ)了基于距離的T2統(tǒng)計(jì)量對(duì)那些故障幅度較小、只有潛在分布改變的故障檢測效果較差的不足。接著,為了實(shí)現(xiàn)故障診斷,構(gòu)建了KECASF用于故障識(shí)別。KECA 對(duì)數(shù)據(jù)分布和數(shù)據(jù)結(jié)構(gòu)沒有限制,即可以應(yīng)用于非高斯、非線性過程,因此KECASF 可以進(jìn)行有效的識(shí)別。最后,在非線性過程及TE過程中對(duì)本文所提方法進(jìn)行了性能測試,結(jié)果表明,相比于傳統(tǒng)的PCA 及KPCA,本文所提方法具有更高的檢測率、更低的誤報(bào)率、更短的檢測延遲及更高的識(shí)別率,整體上提高了監(jiān)測性能。