高俊峰 周凌柯
(南京理工大學(xué)自動(dòng)化學(xué)院,南京 210094)
近年來(lái),以PCA為代表的多元統(tǒng)計(jì)過(guò)程性能監(jiān)控和故障診斷技術(shù)在化工過(guò)程中得到了成功應(yīng)用[1,2]。但此類(lèi)方法假定過(guò)程變量服從正態(tài)分布,且來(lái)自單一的穩(wěn)定工況。對(duì)于多工況過(guò)程,目前的監(jiān)測(cè)方法大多采用多模型方法[3~6]。Hwang D H和Han C H提出了一種基于多層聚類(lèi)的超級(jí)PCA模型來(lái)解決多工況下化工過(guò)程的實(shí)時(shí)監(jiān)測(cè)問(wèn)題[3]。Lane S等提出一種通用子空間模型來(lái)監(jiān)控多工況半間歇過(guò)程[4]。Zhao S J等為多工況過(guò)程監(jiān)測(cè)開(kāi)發(fā)了多PCA/PLS模型[5,6]。這些方法的共同點(diǎn)是通過(guò)聚類(lèi)或經(jīng)驗(yàn)來(lái)劃分工況,工況數(shù)的選擇和工況界定較多地依賴(lài)于過(guò)程知識(shí)。為減輕監(jiān)測(cè)方法對(duì)過(guò)程知識(shí)的依賴(lài),近年來(lái)高斯混合模型(Gaussian Mixture Model,GMM)被應(yīng)用到多工況過(guò)程監(jiān)測(cè)中來(lái)。GMM的參數(shù)一般使用EM(Expectation Maximization)算法迭代估計(jì),然而常規(guī)EM算法必須事先給定混合模型的分量數(shù)目,且在參數(shù)估計(jì)過(guò)程中不能自動(dòng)調(diào)整。但在實(shí)際工業(yè)過(guò)程中,過(guò)程工況數(shù)經(jīng)常是無(wú)法預(yù)知的,因此,近幾年許多學(xué)者采用的方法是針對(duì)不同的分量數(shù)目多次運(yùn)行EM算法,計(jì)算量較大。Ma J等指出未知分量數(shù)目的高斯混合模型建模問(wèn)題等價(jià)于最大化貝葉斯陰陽(yáng)協(xié)調(diào)函數(shù),并從理論上分析和證明了BYY協(xié)調(diào)函數(shù)用于選取高斯分量數(shù)目的有效性[7]。
為了解決多工況故障監(jiān)控中存在的問(wèn)題,筆者建立了一個(gè)多工況混合模型。該模型首先采用常規(guī)EM算法估計(jì)各工況的GMM參數(shù),然后采用BYY算法根據(jù)所估計(jì)出的GMM參數(shù)來(lái)判斷工況數(shù)。迭代進(jìn)行上述過(guò)程,直到GMM參數(shù)和工況數(shù)都收斂為止?;旌夏P徒⒑?,通過(guò)在其每個(gè)分量中建立PCA模型,建立了一個(gè)多工況故障監(jiān)控模型。該監(jiān)控模型通過(guò)貝葉斯方法對(duì)被監(jiān)控樣本實(shí)施自動(dòng)工況劃分。
假設(shè)x∈Rm是一個(gè)取自多工況過(guò)程的m維樣本,那么其在有限GMM下的概率密度函數(shù)可表示為:
(1)
其中K是包含在GMM中高斯分量的個(gè)數(shù)。將混合模型所有的參數(shù)合并到向量Θ={α1,m1,Σ1,…,αK,mK,ΣK},其中mi、Σi代表第i個(gè)高斯分量的均值向量和協(xié)方差矩陣,αi表示其在混合模型中的權(quán)重?;旌细怕蕄(x|Θ)本質(zhì)上是所有高斯分量的加權(quán)概率和。權(quán)重αi可以理解為任意樣本數(shù)據(jù)來(lái)自于第i個(gè)高斯分量的先驗(yàn)概率。各高斯分量的概率密度方程可以表示為:
(2)
假定Θ中的模型參數(shù)都是常量且沒(méi)有任何的先驗(yàn)知識(shí),那么給定樣本數(shù)據(jù)集X={x1,x2,…,xN},混合模型參數(shù)Θ通常可通過(guò)最大化似然方程L(Θ)求出:
(3)
然而,當(dāng)事先并不知道X中樣本數(shù)據(jù)所屬的高斯分量時(shí),式(3)所定義的方法就會(huì)失效,而EM算法則可以通過(guò)迭代估計(jì)的方法解決上述混合模型參數(shù)估計(jì)問(wèn)題[8]。
給定混合高斯分量數(shù)K和Θ的初值Θ0,EM算法通過(guò)不斷重復(fù)E-step和M-step迭代估計(jì)Θ,直至Θ單調(diào)收斂到其最優(yōu)估計(jì)值。
E-step,給定Θ(t),計(jì)算完全數(shù)據(jù)下的log似然函數(shù)的期望:
(4)
M-step,通過(guò)最大化似然函數(shù)Q(Θ|Θ(t))求取Θ(t+1):
(5)
如上所述,在用EM算法迭代估計(jì)混合模型參數(shù)Θ時(shí),必須事先給定混合模型的高斯分量數(shù)K。然而,在沒(méi)有任何先驗(yàn)知識(shí)的情況下,K很難被準(zhǔn)確地給出。為了解決這個(gè)問(wèn)題,筆者在EM收斂之后,采用BYY算法估計(jì)工況數(shù)[7]。若所估計(jì)的工況數(shù)收斂,則混合模型參數(shù)估計(jì)停止。否則,以采用BYY算法估計(jì)出的混合工況數(shù)為條件重新執(zhí)行EM算法。估計(jì)混合工況數(shù)的BYY協(xié)調(diào)函數(shù)定義如下:
(6)
在用MPMM建立起GMM后,混合高斯分量數(shù)即為工況數(shù),各個(gè)高斯分量對(duì)應(yīng)各個(gè)穩(wěn)定工況的分布特性。為了在所建立GMM的基礎(chǔ)上引入PCA算法,建立多工況過(guò)程監(jiān)測(cè)模型,需要對(duì)訓(xùn)練樣本數(shù)據(jù)進(jìn)行工況劃分。對(duì)于訓(xùn)練樣本數(shù)據(jù)xn,其所屬工況為:
(7)
所有訓(xùn)練樣本數(shù)據(jù)工況劃分結(jié)束后,與傳統(tǒng)PCA相似,對(duì)于每一監(jiān)控樣本x,定義兩個(gè)監(jiān)控統(tǒng)計(jì)量T2和SPE:
T2=xPΛkPTxT
SPE=‖(I-PPT)x‖2
(8)
(9)
其中,k是主元個(gè)數(shù),N是訓(xùn)練樣本數(shù)。g和h的計(jì)算式為:
hg=mean(SPE)
2g2h=var(SPE)
(10)
過(guò)程監(jiān)測(cè)時(shí),需要為每個(gè)新監(jiān)測(cè)樣本xn找到其所屬工況。筆者把xn屬于各個(gè)高斯分量的后驗(yàn)概率作為相應(yīng)的隸屬度。計(jì)算方法為:
(11)
TE過(guò)程是由Downs J J和Vogel E F于1993年提出的一個(gè)實(shí)驗(yàn)平臺(tái),它被廣泛應(yīng)用于評(píng)估和比較過(guò)程監(jiān)測(cè)方法的有效性[9]。其流程如圖1所示[10],該過(guò)程有12個(gè)操作變量和41個(gè)測(cè)量變量。在41個(gè)測(cè)量變量中,前22個(gè)是連續(xù)變量,另外19個(gè)是離散變量。本節(jié)選取16個(gè)連續(xù)變量用于過(guò)程故障監(jiān)測(cè)。
圖1 TE過(guò)程流程
在建立MPMM時(shí),讓TE過(guò)程仿真運(yùn)行70h,采樣間隔為0.01h,產(chǎn)生一個(gè)由兩個(gè)穩(wěn)定工況構(gòu)成的訓(xùn)練樣本數(shù)據(jù)集。這兩個(gè)穩(wěn)定工況是在仿真過(guò)程中改變TE過(guò)程的反應(yīng)器壓力和反應(yīng)器液位水平得到的。在仿真開(kāi)始時(shí),反應(yīng)器壓力和液位水平為其初始值(2 800kPa和65%),此時(shí)TE過(guò)程處于工況1;在仿真進(jìn)行到10.033h時(shí),降低反應(yīng)器壓力至2 705kPa,液位水平保持不變,TE過(guò)程進(jìn)入工況2。取各穩(wěn)定工況1 000個(gè)數(shù)據(jù)點(diǎn),構(gòu)成一個(gè)由2 000個(gè)數(shù)據(jù)點(diǎn)組成的訓(xùn)練樣本數(shù)據(jù)集,然后采用MPMM對(duì)此訓(xùn)練樣本數(shù)據(jù)集建模,所建模型中各高斯分量在混合模型中所占比重分別為0.508 3和0.491 7,與實(shí)際值一致。因此,所建模型很好地描述了3個(gè)工況下訓(xùn)練樣本數(shù)據(jù)的分布特性。
為了驗(yàn)證MPMM監(jiān)控復(fù)雜工業(yè)過(guò)程的有效性,筆者將其分別對(duì)正常和階躍擾動(dòng)兩種工業(yè)過(guò)程進(jìn)行監(jiān)測(cè)。正常過(guò)程測(cè)試樣本數(shù)據(jù)集由3個(gè)工況正常運(yùn)行條件下的采樣數(shù)據(jù)構(gòu)成,每個(gè)工況300個(gè)樣本點(diǎn)。階躍擾動(dòng)測(cè)試樣本數(shù)據(jù)集通過(guò)向工況1中引入階躍變化的故障2產(chǎn)生。故障引入的位置在第100個(gè)樣本點(diǎn)處,共有1 000個(gè)樣本點(diǎn)。故障2通過(guò)改變組分B的含量產(chǎn)生。
圖2 正常數(shù)據(jù)集的仿真結(jié)果
圖3 階躍擾動(dòng)故障2監(jiān)控結(jié)果
圖2、3所示仿真結(jié)果表明,筆者所提方法MPMM的多工況過(guò)程監(jiān)控性能遠(yuǎn)優(yōu)于傳統(tǒng)PCA,而且監(jiān)控延時(shí)較小。說(shuō)明MPMM可以有效且準(zhǔn)確地監(jiān)控多工況工業(yè)過(guò)程。
基于BYY算法和PCA數(shù)據(jù)降維技術(shù),建立了一個(gè)多工況混合模型。該模型克服了采用常規(guī)EM算法建立混合模型時(shí)必須事先給出混合工況數(shù)的限制,極大地提高了模型的適用范圍。模型建立后,通過(guò)在混合模型每個(gè)分量中構(gòu)建PCA模型,建立了一個(gè)多工況故障監(jiān)控模型。最后的仿真研究證明了MPMM在多工況過(guò)程監(jiān)測(cè)中的有效性。
[1] Chiang L H,Ressell E L,Braatz R D. Fault Detection and Diagnosis in Industrial System[M].London:Springer-Verlag,2001:198~205.
[2] Choi S W,Martin E B,Morris A J.Fault Detection Based on a Maximum-Likelihood Principal Component Analysis (PCA)Mixture[J].Industrial and Engineering Chemistry Research,2005,44:2316~2327.
[3] Hwang D H,Han C H.Real-time Monitoring for a Process with Multiple Operating Modes[J].Control Engineering Practice,1999,7(7):891~902.
[4] Lane S,Martin E B,Kooijmans R,et al.Performance Monitoring of a Multi-product Semi-batch Process[J].Journal of Process Control,2001,11(1):1~11.
[5] Zhao S J,Zhang J,Xu Y M.Monitoring of Processes with Multiple Operating Modes Through Multiple Principal Component Analysis Models[J]. Industrial and Engineering Chemistry Research,2004,43(2):7025~7035.
[6] Zhao S J,Zhang J,Xu Y M.Performance Monitoring of Processes with Multiple Operating Modes through Multiple PLS Models[J].Journal of Process Control,2006,16(7):763~772.
[7] Ma J,Wang T,Xu L.A Gradient BYY Harmony Learning Rule on Gaussian Mixture with Automated Model Selection[J].Neurocomputin,2004,56:481~487.
[8] Dempster A P,Laird N M,Rubin D B.Maximum-likelihood from Incomplete Data via the EM Algorithm[J].Journal of the Royal Statistical Society, Series B(Methodological),1977,39(1):1~38.
[9] Downs J J,Vogel E F.A Plant-wide Industrial Process Control Problem[J].Computers Chemisty Engineering,1993,17(3):245~255.
[10] Lawrence R N.Decentralized Control of the Tennessee Eastman Challenge Process[J].Journal of Process Control,1996,6(4):205~221.