常鵬,王普,高學金
?
基于統(tǒng)計量模式分析的T-KPLS間歇過程故障監(jiān)控
常鵬,王普,高學金
(北京工業(yè)大學電子信息與控制工程學院,北京 100124)
核函數(shù)的全影結(jié)構投影(total kernel projection to latent structures,T-KPLS)最近在故障監(jiān)控領域取得了廣泛應用,其實質(zhì)是對數(shù)據(jù)矩陣的協(xié)方差矩陣進行分解,沒有利用數(shù)據(jù)的高階統(tǒng)計量等有用信息,在進行特征提取時會造成數(shù)據(jù)有用信息的丟失,導致故障識別效果差。為了解決此問題,提出了統(tǒng)計量模式分析(statistics pattern analysis, SPA)與核函數(shù)的全影結(jié)構投影法(total kernel projection to latent structures, T-KPLS)相結(jié)合的多向統(tǒng)計量模式分析的核函數(shù)的全影結(jié)構投影法(multi-way statistics pattern analysis total kernel projection to latent structures, MSPAT-KPLS)。該方法首先構造樣本的不同階次統(tǒng)計量, 將數(shù)據(jù)從原始的數(shù)據(jù)空間映射到統(tǒng)計量樣本空間,然后利用核函數(shù)將統(tǒng)計量樣本空間映射到高維核空間并在質(zhì)量變量的引導下將特征空間分為過程變量與質(zhì)量變量相關、過程變量與質(zhì)量變量無關、過程變量與質(zhì)量變量正交和殘差4個子空間;最后針對與質(zhì)量變量相關和殘差空間建立聯(lián)合監(jiān)控模型,當監(jiān)控到有故障發(fā)生時進行故障變量追溯。最后將該方法應用到微生物發(fā)酵過程中,并與傳統(tǒng)方法進行比較,發(fā)現(xiàn)該方法具有更好的監(jiān)控性能。
故障監(jiān)控;核函數(shù)全影結(jié)構投影;統(tǒng)計量模式分析
引 言
多向偏最小二乘(MPLS)方法利用輸入對輸出的解釋作為特征提取的依據(jù),提取較少的主元去更好地解釋與質(zhì)量相關的信息,非常適合檢測與質(zhì)量相關的故障,近年來在間歇生產(chǎn)過程故障監(jiān)測方面取得了廣泛應用[1-6],但是深入研究后發(fā)現(xiàn)經(jīng)MPLS分解后的主元空間含有與質(zhì)量無關的成分,在構建監(jiān)控模型時應該去除。為此Li等[7-9]提出了質(zhì)量相關的T-PLS(total PLS)方法,他們將MPLS分解后的主元空間和殘差空間用主成分分析(PCA)[10-11]分解成與質(zhì)量相關、與質(zhì)量無關、與質(zhì)量正交和殘差4個子空間并分別構建監(jiān)控模型,克服輸入過程變量與輸出質(zhì)量相關故障檢測方法的不足,但是以上方法的本質(zhì)是線性化建模,面對復雜的非線性系統(tǒng),如生物發(fā)酵過程,變量間往往存在較強的非線性關系,利用傳統(tǒng)的線性方法將會給過程監(jiān)控帶來較大的誤差。為了解決該問題,T-PLS方法被推廣到非線性領域,Peng等[12]將核函數(shù)引入T-PLS中,提出了全影核偏最小二乘(totoal kernel partial least squares, KPLS)方法,T-KPLS的基本思想是將原輸入空間線性不可分的數(shù)據(jù)通過核函數(shù)映射到高維特征空間變?yōu)榫€性可分,然后再把高維空間分為與質(zhì)量相關、與質(zhì)量無關、與質(zhì)量正交和殘差4個子空間并建立與質(zhì)量相關和殘差的聯(lián)合統(tǒng)計模型,進一步提高了與質(zhì)量相關故障的監(jiān)控性能。
然而以上方法僅僅利用了數(shù)據(jù)的二階協(xié)方差信息,未考慮數(shù)據(jù)的高階統(tǒng)計量信息造成對數(shù)據(jù)信息提取的不完整,在監(jiān)控過程故障時會引起較大的誤警率,甚至失去監(jiān)控性能[7-9]。統(tǒng)計量模式分析(statistics pattern analysis, SPA))是由He等[13-14]提出的將高階統(tǒng)計量信息用于數(shù)據(jù)建模的數(shù)據(jù)分析技術,近兩年Zhang等[15]和常鵬等[16]將統(tǒng)計量模式分析(SPA)應用在過程監(jiān)控領域并取得了不錯的效果。但是高階統(tǒng)計量的引入并未解決數(shù)據(jù)本身的非線性,而相同變量的不同統(tǒng)計量之間會引入新的非線性關系,增加了原始樣本的非線性,在監(jiān)控非線性系統(tǒng)時監(jiān)控效果不好,本文將統(tǒng)計量模式分析引入T-KPLS中,多向統(tǒng)計量模式分析的核函數(shù)的全影結(jié)構投影法(multi-way statistics pattern analysis total kernel projection to latent structures, MSPAT- KPLS)。其核心算法由以下3部分構成:① 將三維數(shù)據(jù)按照AT方法展開為二維數(shù)據(jù)然后構造樣本不同階次的統(tǒng)計量將數(shù)據(jù)從原始的數(shù)據(jù)空間映射到統(tǒng)計量樣本空間;②利用核函數(shù)將統(tǒng)計量樣本空間映射到高維核空間解決變量間的非線性關系,并將高維核空間分為4個子空間并分別構造監(jiān)控模型的統(tǒng)計量;③將質(zhì)量相關子空間的統(tǒng)計量與殘差子空間的統(tǒng)計量相結(jié)合構造新的統(tǒng)計量用于與質(zhì)量相關的過程故障監(jiān)控,當監(jiān)控到有故障發(fā)生時,引入Peng等[12]提出的故障診斷方法用于故障變量的追溯。最后將本文方法應用在Benchmark模型[17]和實際工廠并與T-PLS、T-KPLS方法進行比較,驗證該方法的有效性。
1 基于SPA的樣本空間構建
1.1 間歇過程數(shù)據(jù)的預處理
間歇過程體現(xiàn)為重復性生產(chǎn)過程,其數(shù)據(jù)集合比連續(xù)過程數(shù)據(jù)集合多一維“批次”元素,三維數(shù)據(jù)矩陣(××)(××)代表間歇過程的數(shù)據(jù)集合,其中為批量數(shù),為變量數(shù),為質(zhì)量變量數(shù),為采樣點數(shù)。按照AT方法[18]將三維數(shù)據(jù)矩陣展開為二維數(shù)據(jù)矩陣(×)和(×),采用該方法建模時不要求批次長度完全相等,且用于在線監(jiān)控時,無需對新批次的未來測量值進行估計。AT 展開方法如圖1所示。
1.2 統(tǒng)計量樣本空間的構建
計算數(shù)據(jù)矩陣(×)不同的統(tǒng)計量,將所有選擇的統(tǒng)計量排列在一個行向量中如式(1)所示
其中,表示變量的均值是一階統(tǒng)計量
表示樣本的方差是二階統(tǒng)計量
表示樣本的偏度是三階統(tǒng)計量
表示樣本的跨度是四階統(tǒng)計量
由式(4)和式(5)可以看出高階統(tǒng)計量的引入加大了統(tǒng)計量樣本之間的非線性,傳統(tǒng)的線性建模方法在此不再適用,固本文引入核來解決統(tǒng)計量樣本之間的非線性。
2 監(jiān)控模型的構建及在線監(jiān)控
2.1 監(jiān)控模型的構建
MSPAT-KPLS的目標是首先通過構造不同樣本統(tǒng)計量in,然后利用核函數(shù)將統(tǒng)計量樣本空間映射到高維核空間解決變量間的非線性關系,并將高維核空間分為4個子空間并分別建立監(jiān)控模型。將輸入變量in映射到高維空間,由于特征空間的維數(shù)很高甚至無窮維,其內(nèi)積計算量非常大,利用核技巧可以避免內(nèi)積運算,其核矩陣K的計算如
(1)將三維數(shù)據(jù)矩陣按照AT方法展開為二維數(shù)據(jù)矩陣并按照式(1)構建樣本統(tǒng)計量然后初始化,其中=1,=in,=。
(3)求輸出變量的負載:=Tt,單位化向量
(4)計算得分向量
(5)重復步驟(2)~步驟(5),直至收斂轉(zhuǎn)步驟(6),否則,回到步驟(3)。
(6)計算下一時刻in,i+1和+1
+1=(8)
(7)令=+1,如果>則終止循環(huán),否則回到步驟(2),主元個數(shù)由交叉驗證法確定,最終將數(shù)據(jù)塊in和分解為如下,具體步驟可參閱文獻[10]
=q+(10)
其中,是原始得分矩陣和直接相關的部分;是原始得分矩陣中和正交的部分;是原始殘差中方差變化較大的部分;而則是in的最終殘差,代表噪聲。
2.2 監(jiān)控統(tǒng)計量及其控制限的構建
對于核矩陣in,其相應的得分向量和殘差如下[10]
2,2和2的控制限可以利用分布來計算,而Q統(tǒng)計量可以用2分布來計算,故障檢測所需統(tǒng)計量及其相應控制限計算方法算如表1所示,其中,,,1,n1,a代表自由度為1和-1, 置信度為的分布,=/2,=2/,是樣本的均值,是樣本的方差,是一個尺度因子為、自由度為、置信度為的2分布的臨界值。構建和的聯(lián)合統(tǒng)計量
表1 監(jiān)控統(tǒng)計量和控制限 Table 1 Monitoring statistic and control limit
如下
由公式可知,改進后的監(jiān)控統(tǒng)計量可以更好地監(jiān)控與質(zhì)量相關的故障,統(tǒng)計量計算的具體推導過程參見文獻[12]。
2.3 在線監(jiān)測
(1)對于新得到的在線數(shù)據(jù)按照2.1節(jié)和2.2節(jié)的方法進行處理得到的數(shù)據(jù)new,t∈R,=1,…,N;然后計算核矩陣∈1×N
new,t=new,t-K-new,t+K1(17)
(2)計算新時刻的統(tǒng)計量,并判斷其是否超過控制限,若未超限,說明系統(tǒng)運行在正常工況下;若超限,說明系統(tǒng)發(fā)生故障,對其進行故障診斷。
2.4 故障診斷
近年來Alcala等[19-20]提出了故障重構的方法應用在非線性系統(tǒng)的故障診斷,并取得了不錯的效果,然而基于故障重構的技術需要大量的已知故障,而實際的間歇過程缺乏故障數(shù)據(jù)。而由Peng等[12]提出的基于核函數(shù)故障診斷方法應用在非線性的故障診斷并取得了很好的效果,但是以上方法是在連續(xù)過程上的應用,為此本文將其擴展到間歇過程領域的用于故障變量的追溯。
3 算法仿真驗證
3.1 算法仿真應用
本文選用美國Illinois州立理工學院的青霉素仿真平臺[16]。青霉素發(fā)酵每個批次的反應時間為400 h,采樣間隔為1 h,選取10個過程變量和2個質(zhì)量變量進行監(jiān)測,如表2所示。為了驗證本文算法的有效性,本文共生產(chǎn)了40個正常批次數(shù)據(jù)作為模型的訓練樣本并與T-PLS和T-KPLS算法進行比較,主元個數(shù)和核參數(shù)選擇如表3所示,故障類型如表4所示,由于篇幅的限制本文只給出故障1的效果圖,其他的監(jiān)控結(jié)果見表5。圖3、圖4、圖5分別為采用T-PLS、T-KPLS和本文算法對故障1的監(jiān)控結(jié)果。由圖3可以看出,其在監(jiān)控過程中存在較大的漏報,漏報率為82.7%,這是因為過程中存在大量的非線性[16],T-PLS對非線性過程監(jiān)控效果差。圖4為T-KPLS方法,其能較好地處理非線性過程,監(jiān)測效果優(yōu)于T-PLS方法,但是由于其僅僅關注二階協(xié)方差信息,忽略了數(shù)據(jù)的高階信息,造
表2 模型所用變量 Table 2 Variables used in the model
表4 仿真中用到的故障類型 Table 4 Fault types introduced in process
成故障報警的延遲,漏報率為10.6%,圖5為本文方法對故障批次的監(jiān)控結(jié)果,漏報率為3.2%,優(yōu)于上述方法,這是因為引入高階統(tǒng)計量后其對數(shù)據(jù)有用信息的提取更加完整,彌補了傳統(tǒng)方法的不足,如表4可知,本文方法的監(jiān)控性能優(yōu)于傳統(tǒng)方法。
3.2 故障診斷
針對故障按照2.4節(jié)的方法進行故障變量追溯,在這里只給出故障1的故障診斷圖(圖6),其他見表6,可以看出該故障診斷方法可以準確識別故障源。
表6 時刻貢獻圖識別故障 Table 6 Moment contribution figure to identify fault
4 算法工業(yè)實際應用
將本文算法應用在北京某生物制藥有限公司的制藥過程監(jiān)控,本小節(jié)實驗的核參數(shù)選為4.2,主元個數(shù)選為4,建模用的變量如表7所示。實際故障批次1:由攪拌速率引起的故障,類型為階躍故障,引入時間15 h到發(fā)酵結(jié)束,大小為20%。實際故障批次2:由攪拌速率引起的故障,類型為斜坡故障,引入時間15 h到發(fā)酵結(jié)束,大小為斜率-0.2%的斜坡故障。
圖7和圖9是分別針對故障1和故障2的監(jiān)控圖,結(jié)果表明MSPAT-KPLS方法可以及時、準確監(jiān)
表7 過程變量與質(zhì)量變量 Table 7 Process variables and quality variables
測到故障,圖8和圖10分別為實際故障1和實際故障2診斷圖,結(jié)果表明該方法可以準確識別出故障源。
5 結(jié) 論
傳統(tǒng)T-KPLS方法未利用數(shù)據(jù)的高階統(tǒng)計量等有用信息,在進行特征提取時會造成數(shù)據(jù)有用信息的丟失,導致故障識別效果差,為了解決此問題,引入SPA技術,提出MSPAT-KPLS。該方法首先通過構造樣本的不同階次統(tǒng)計量將數(shù)據(jù)從原始的數(shù)據(jù)空間映射到統(tǒng)計量樣本空間,然后利用核函數(shù)將統(tǒng)計量樣本空間映射到高維核空間并在質(zhì)量變量的引導下將特征空間分為過程變量與質(zhì)量變量相關、過程變量與質(zhì)量變量無關、過程變量與質(zhì)量變量正交和殘差4個子空間;最后針對過程變量與質(zhì)量變量相關和殘差2個子空間建立聯(lián)合監(jiān)控模型用于過程監(jiān)控,當監(jiān)控到有故障發(fā)生時引入時刻貢獻圖方法用于故障變量的追溯。將該方法應用到工業(yè)過程中,發(fā)現(xiàn)該方法具有更好的監(jiān)控性能,并能夠及時準確識別出故障源。
References
[1] Mori J C, Yu J. Quality relevant nonlinear batch process performance monitoring using a kernel based multiway non-Gaussian latent subspace projection approach [J]., 2014, 24(1): 57-71
[2] Xiong H S, Gong X C, Qu H B. Monitoring batch to batch reproducibility of liquid-liquid extraction process using in-line near-infrared spectroscopy combined with multivariate analysis [J]., 2012, 70(11): 178-187
[3] Jia Runda (賈潤達), Mao Zhizhong (毛志忠), Wang Fuli (王福利). KPLS model based product quality control for batch processes [J].( 化工學報), 2013, 64(4): 1332-1339
[4] Stubbs S, Zhang J, Morris J L. Multiway interval partial least squares for batch process performance monitoring [J].,2014, 52 (35) : 12399-12407.
[5] Geert G, Jef V, Jan F. Discriminating between critical and noncritical disturbances in (bio)chemical bach processes using multi-model fault detection and end-quality prediction [J]., 2012, 51(1): 12375-1238
[6] Naes T, Tomic O. Multi-block regression based on combination so for thogonalisation, PLS regressionand canonical correlation analysis [J]., 2013, 124: 32-42
[7] Li G, Alcala C F, Qin S J,. Output relevant fault reconstruction and fault subspace extraction in total projection to latent structures models [J]., 2010, 49(19):9175- 9183
[8] Zhou D, Li G, Qin S J. Total projection to latent structures for process monitoring [J]., 2010, 56(1): 168-178
[9] Li G, Alcala C F, Qin S J,. Generalized reconstruction based contributions for output relevant fault diagnosis with application to the Tennessee Eastman process [J]., 2011, 19(5): 1114-1127
[10] Jackson J E. A User’s Guide to Principal Components[M]. New York: Wiley, 1991
[11] Nomikos P, MacGregor J F. Monitoring batch process using multiway principal component analysis [J]., 1994, 40(8): 1361-1375
[12] Peng K X, Zhang K, Li G,. Contribution rate plot for nonlinear quality related fault diagnosis with application to the hot strip mill process [J]., 2013, 21(4): 360-369
[13] He Q, Wang J. Statistics pattern analysis: a new process monitoring framework and its application to semiconductor batch processes [J]., 2011, 57(1): 107-121
[14] Wang J, He Q. Multivariate statistical process monitoring based on statistics pattern analysis [J]., 2010, 49(1): 7858-7869
[15] Zhang Hanyuan(張漢元), Tian Xuemin(田學民), Deng Xiaogang(鄧曉剛). Fault identification method based on SPA similarity factor [J].(化工學報), 2013, 64(12): 4503-4508
[16] Chang Peng(常鵬),Wang Pu(王普),Gao Xuejin(高學金),. Batch process monitroing and quality prediction based on statistics pattern analysis and MKPLS [J].(儀器儀表學報), 2014, 35(6): 1409-1416
[17] Birol G, Undey C, Cinar A. A modular simulation package for fed-batch fermentation: penicillin production [J]., 2002, 26(11): 1553-1565
[18] Agudo D, Ferrer A, Ferrer J,. Multivariate SPC of a sequencing batch reactor for wastewater treatment [J]., 2007, 85(1): 82-93
[19] Alcala C F, Qin S J. Analysis and generalization of fault diagnosis methods for process monitoring [J]., 2011, 21(1): 322-330
[20] Alcala C F, Qin S J. Reconstruction based contribution for process monitoring [J]., 2009, 45(1): 1593-1600
Fault monitoring batch process based on statistics pattern analysis of T-KPLS
CHANG Peng, WANG Pu, GAO Xuejin
(College of Electronic Information and Control Engineering, Beijing University of Technology, Beijing 100124, China)
Total kernel projection to latent structures (T-KPLS) has been widely used in the fault detection control field, its core idea is to conduct the covariance matrix decomposition of the data matrix, without using the higher-order statistics and other useful information of the data, which will cause an information loss in the feature extraction process, then result in a bad fault recognition performance. Aiming to solve the problem, a statistics pattern analysis (SPA) combing with the T-KPLS based multi-way statistics pattern analysis total kernel projection to latent structures (MSPAT-KPLS) is proposed. First, different order statistics of the data samples are constructed to map the data from the original data space into the statistic sample space, then utilize kernel function to map the statistic sample space into the higher dimensional kernel space, and according to the quality variable, the feature space will be divided into 4 subspaces, namely: process variable related to quality variable space, process variable not related to quality variable space, process variable orthogonal to quality variable space and residual error space; Lastly, aiming at the process variable related to quality variable subspace and the residual error space, different detection models are constructed, which will trace the fault variables when faults are detected. In the end, apply the proposed method on the microbial fermentation process, and the comparison results with the traditional methods show that the proposed method could achieve a better detection.
fault monitoring; total kernel projection to latent structrues; statistics pattern analysis
date: 2014-09-28.
CHANG Peng, changpeng2011@emails.bjut. edu.cn
10.11949/j.issn.0438-1157.20141476
TP 273
A
0438—1157(2015)01—0265—07
國家自然科學基金項目(61174109,61364009)。
2014-09-28收到初稿,2014-10-09收到修改稿。
聯(lián)系人及第一作者:常鵬(1981—),男,博士研究生。
Foundation item: supported by the National Natural Science Foundation of China (61174109,61364009)