藍艇,童楚東,史旭華
?
變量加權型主元分析算法及其在故障檢測中的應用
藍艇,童楚東,史旭華
(寧波大學信息科學與工程學院,浙江寧波 315211)
傳統(tǒng)主成分分析(PCA)算法旨在挖掘訓練數(shù)據各變量間的相關性特征,已在數(shù)據驅動的故障檢測領域得到了廣泛的研究與應用。然而,傳統(tǒng)PCA方法在建模過程中通常認為各個測量變量的重要性是一致的,因此不能有效而全面地描述出變量間相關性的差異。為此,提出一種變量加權型PCA(VWPCA)算法并將之應用于故障檢測。首先,通過對訓練數(shù)據進行加權處理,使處理后的數(shù)據能夠充分體現(xiàn)出變量間相關性的差異。然后,在此基礎上建立分布式的PCA故障檢測模型。在線實施故障檢測時,則通過貝葉斯準則將多組監(jiān)測結果融合為一組概率指標。VWPCA方法通過相關性大小為各變量賦予不同的權值,從而將相關性差異考慮進了PCA的建模過程中,相應模型對訓練數(shù)據特征的描述也就更全面。最后,通過在TE過程上的測試驗證VWPCA方法用于故障檢測的優(yōu)越性。
主元分析;過程系統(tǒng);過程控制;故障檢測
在整個綜合自動化系統(tǒng)中,故障檢測系統(tǒng)可謂是必不可少的組成部分,因為實時監(jiān)測生產過程的運行狀態(tài)是保證生產安全和維持產品質量穩(wěn)定的必要手段。近年來,得益于各種先進儀表與計算技術的廣泛應用,工業(yè)過程可以測量和存儲海量的數(shù)據樣本。實施故障檢測不再依賴于基于機理模型的過程監(jiān)測方法,取而代之的是以生產過程采樣數(shù)據為核心的數(shù)據驅動的過程監(jiān)測方法[1-4]。作為數(shù)據驅動的過程監(jiān)測方法的一個重要研究分支,多變量統(tǒng)計過程監(jiān)測(multivariate statistical process monitoring, MSMP)方法于近年來受到了工業(yè)界和學術界的廣泛關注,其核心思想在于利用過程正常數(shù)據建立能描述過程正常運行狀態(tài)的統(tǒng)計模型,從而實現(xiàn)對過程是否發(fā)生故障進行監(jiān)測的目的[5-8]。
在現(xiàn)有的多變量統(tǒng)計過程監(jiān)測方法體系中,主元分析(principal component analysis, PCA)是最常用的數(shù)據分析算法,已被廣泛用于工業(yè)過程監(jiān)測實踐中,各種延伸拓展形式層出不窮[9-12]。通常來講,PCA算法旨在挖掘原始高維數(shù)據變量間的相關性特征,使提取的低維特征子空間最大化保留方差信息。在建模過程中,為了消除各變量變化幅值對方差的影響,基于PCA的過程監(jiān)測方法需將采樣數(shù)據按變量進行標準化處理,即所有的測量變量都被歸一化。從某種角度上看,所有測量變量其實都是被賦予了相同的權值,各個測量變量在投影變換過程中的重要性是一致的。這種數(shù)據預處理方式對PCA這類旨在挖掘數(shù)據變量相關性的分析算法而言,有一個缺陷:數(shù)據變量間的相關性是存在差異的,若不對數(shù)據變量間的相關性差異進行有效地權衡,PCA模型所提取的潛藏信息無法全面而有效地描述過程運行的狀態(tài)。針對這一問題,Ge等[13-16]從數(shù)據統(tǒng)計特性角度出發(fā)對變量進行分塊處理,進而提出基于分布式PCA(distributed PCA, DPCA)的過程監(jiān)測方法。DPCA方法能在一定程度上區(qū)分變量間的相關性,而且還利用了多模型的泛化能力,因此能取得優(yōu)越于傳統(tǒng)PCA方法的故障檢測效果。
然而,分布式PCA方法在建模過程中有兩個問題還未得到深入研究探討。首先,變量分塊需要一個截斷閥值將相關性較大的變量區(qū)分出來,截斷閥值的選取無章可循,而且對模型監(jiān)測結果影響較大。其次,每個測量變量與其他變量間的相關性大小存在差異,這種差異未能得到充分的體現(xiàn)。因此,基于PCA尤其是基于分散式PCA的過程監(jiān)測方法所能取得故障檢測效果還有待進一步的商榷。為此,本文提出一種變量加權PCA(variable weighted PCA, VWPCA)算法并將之應用于工業(yè)故障檢測。具體來講,VWPCA首先依據每個測量變量與其他變量間的相關性大小對訓練數(shù)據中各變量進行加權處理,然后對加權處理后的數(shù)據建立相應的PCA模型。也就是說,若過程對象有個測量變量,VWPCA會存在種不同的方式對訓練數(shù)據進行變量加權處理,并相應建立種不同的PCA模型。最后,對在線新測量數(shù)據實施故障檢測,調用每個PCA模型前需對其進行同樣的變量加權處理。VWPCA方法通過相關性大小為各變量賦予不同的權值,將相關性差異考慮進了PCA的投影變換過程中,相應的PCA模型就能更全面地挖掘出原始數(shù)據中的相關性特征??梢哉f,基于VWPCA的過程監(jiān)測方法綜合考慮了分布式建模的優(yōu)勢與采樣數(shù)據各變量相關性的差異。相比于傳統(tǒng)的PCA或分布式PCA方法,它理應取得更好的故障檢測效果。這一點,可在Tennessee Eastmann(TE)[9,17-18]仿真實驗平臺上的通過對比分析得到驗證。
1.1 傳統(tǒng)PCA方法
假設經過標準化處理后的正常過程訓練數(shù)據為∈R×m(為樣本數(shù),為變量數(shù)),對的協(xié)方差矩陣
進行特征值分解即可得到PCA統(tǒng)計模型,即[1]
=T+(2)
=(3)
=(-T) (4)
式中,∈R×d和∈R×d分別是得分矩陣和載荷矩陣,∈R×m為殘差矩陣,<為選取的主元個數(shù)。載荷矩陣中各載荷向量[1,2,…,]即是協(xié)方差矩陣前個最大特征值1,1,…,所對應的特征向量。因此,PCA算法旨在挖掘訓練數(shù)據中各變量間的相關性。
傳統(tǒng)PCA模型主要依賴如下兩個統(tǒng)計量監(jiān)測新樣本是否出現(xiàn)故障,即
(6)
其中,=diag{1,2,…,},為置信限,(,-)表示自由度為與-的分布,2,表示權重為=/2、自由度為=22/的加權2分布,與分別是統(tǒng)計量的估計均值和估計方差[19]。
1.2 分布式PCA方法
相比于傳統(tǒng)PCA方法采用單個PCA模型監(jiān)測過程運行狀態(tài)而言,分布式PCA監(jiān)測模型因采用多個PCA子模型而能顯著提升故障檢測效果。近年來,從數(shù)據統(tǒng)計特性角度出發(fā)設計DPCA故障檢測模型得到了研究者們的青睞。其基本特點就是依據相關性強弱將測量變量劃分為重疊或不重疊的變量子塊,然后建立相應的子PCA故障檢測模型。例如,Ge等[13,20]曾利用PCA模型的載荷向量區(qū)分變量間的相關性。依據各變量在載荷向量上的貢獻程度來得到每個變量子塊,即
(8)
其中,=1,2,…,表示第變量,=1,2,…,表示第個子塊,∈R×1是{+1,+2,…,}的均值向量。在線實施故障檢測時,則利用貝葉斯準則將+1個PCA模型的監(jiān)測結果融合為一個概率型指標(即:BIC2與BIC)[8,13]。
2.1 變量加權PCA算法
過程變量間的相關性是存在差異的,對中某個變量(如∈R×1)而言,它與其他各變量的相關性大小差異如圖1所示??紤]到PCA算法旨在挖掘變量間相關性特征,為了更好地體現(xiàn)出每個測量變量的相關性特征,需要對變量進行加權處理,具體的實施步驟介紹如下。
(1)針對第(=1,2,…,)個測量變量,計算其與中各個變量(=1,2,…,)間的相關性大小,即
(2)根據相關性數(shù)值大小確定對應于第個變量的權向量=[|R,1|,|R,2|,…,|R,m|],并對原始數(shù)據矩陣進行加權處理得到加權后的矩陣,即
=×diag() (10)
(3)利用訓練數(shù)據建立基于PCA算法的故障檢測模型,即
=PT+(11)
(4)重復步驟(1)~步驟(3)直至得到個PCA故障檢測模型。
2.2 在線故障檢測流程
利用VWPCA模型實施在線故障檢測的流程如圖2所示。首先,需利用節(jié)2.1節(jié)中的加權向量1,2,…,將新時刻的采樣數(shù)據并行進行加權處理(即:=×diag()),對應得到1,2,…,。然后,利用相應PCA模型計算監(jiān)測統(tǒng)計量2和Q
(13)
最后,采用貝葉斯準則[21]將組統(tǒng)計量融合為一組概率型指標。以統(tǒng)計量2為例,樣本的故障概率為
式中,=1,2,…,,概率定義如下
(15)
其中,C為統(tǒng)計量對應的控制限,其計算方式如式(5)所示。實際上,其他文獻中也常采用式(16)中計算條件概率的方式[22-24]。最后,可按加權形式融合得到最終的概率監(jiān)測指標BIC2
(17)
對統(tǒng)計量Q同樣進行貝葉斯融合,同理可得到相應的BIC概率型指標。當BIC2>1-或BIC>1-時,為非正常樣本,反之,過程處于正常工作狀態(tài)。
TE仿真模型因其結構的復雜性,已成為不同控制方法和過程監(jiān)測策略的標準實驗平臺[25-26]。TE過程主要有連續(xù)攪拌反應器、產品冷凝器、氣液分離塔、汽提塔和離心式壓縮機5個生產單元組成,可連續(xù)測量22個過程變量和12個操作變量,還可以仿真模擬如表1所列的21種不同的故障,詳細資料可參考文獻[17]。在本文的研究中,選取過程可連續(xù)測量的33個變量作為監(jiān)測變量,詳情可參考文獻[13]。離線建模階段,利用正常工況下的960個樣本建立PCA、DPCA和VWPCA的過程監(jiān)測模型以作對比分析用,置信限統(tǒng)一取值99%。其中,PCA模型涉及保留的主成分個數(shù)統(tǒng)一通過累計方差貢獻率(CPV≥85%)準則確定。
表1 TE過程故障漏報率
首先,將3種故障檢測模型用于監(jiān)測TE過程21種故障工況,并計算針對每種故障監(jiān)測的故障漏報率,詳情列于表1中。值得注意的是,故障3、9和15由于對過程的影響甚微,很多文獻都證實這3種故障是很難被有效地檢測出來的[27-29]。因此,在本研究中不予考慮。在表1中,取得最小漏報率的監(jiān)測指標已用黑體標出。顯而易見,本文所提出的VWPCA方法在絕大多數(shù)故障類型上能取得優(yōu)越于傳統(tǒng)PCA以及DPCA方法的故障檢測結果。尤其是針對故障5、10、16、和19,故障漏報率得到大幅度的下降。為了更好地體現(xiàn)VWPCA相對于PCA與DPCA方法的優(yōu)越性,特將故障5的過程監(jiān)測圖顯示于圖3中,可以較直觀地看出3種方法在監(jiān)測故障5時的漏報情況。此外,雖然VWPCA方法未在故障1、2、13、17和21上取得最佳監(jiān)測效果,但相應的漏報率值相差微乎其微。
其次,為進一步說明VWPCA方法的可靠性,還需對比3種方法的故障誤報率,即將正常數(shù)據樣本錯誤的判別為故障。通常來講,較低的故障漏報率會對應著較高的故障誤報率。因此,利用另外一組500個正常樣本組成的測試數(shù)據集測試PCA、DPCA以及VWPCA方法對正常工況的誤報率。從表2中所列的故障誤報率可以看出,VWPCA方法的兩個統(tǒng)計量都能取得最低的故障誤報率。相比于其他兩種方法而言,本文所提出的VWPCA方法更可靠。通過上述對比分析,充分驗證了基于VWPCA的過程監(jiān)測方法的優(yōu)越性和有效性。
表2 TE過程故障誤報率
本文提出了一種基于分布式變量加權PCA模型的統(tǒng)計過程監(jiān)測方法,旨在解決傳統(tǒng)PCA方法或分布式PCA方法在建模過程中未曾體現(xiàn)出變量間相關性差異的問題。由于PCA算法旨在挖掘變量間的相關性特征,可通過對變量賦予不同的權值而將相關性差異充分體現(xiàn)出來。而在傳統(tǒng)PCA建模方法中,各變量可認為被賦予了相同的權值,未能全面地描述變量間的相關性差異。相比之下,VWPCA方法能針對每個測量變量區(qū)分出其與其他變量間相關性差異,并建立最能描述該變量相關性特征的PCA模型。此外,該方法還利用了分布式建模方式,充分發(fā)揮了多模型的泛華能力,可取得更加可靠而有效的故障檢測效果。然而,VWPCA仍舊是一種線性方法,傳統(tǒng)PCA監(jiān)測模型的缺陷同樣存在于VWPCA中。如何應對非線性、非高斯、多工況的復雜過程對象對下一步的工作提出了挑戰(zhàn)。此外,本文的研究只限于故障檢測,還未涉及后續(xù)的故障診斷,未來需開展相應的研究工作。
[1] GE Z, SONG Z, GAO F. Review of recent research on data-based process monitoring[J]. Ind. Eng. Chem. Res., 2013, 52(10): 3543-3562.
[2] YIN S, DING S X, XIE X,. A review on basic data-driven approaches for industrial process monitoring[J]. IEEE Trans. Ind. Electron., 2014, 61(11): 6418-6428.
[3] 周樂, 宋執(zhí)環(huán), 侯北平, 等. 一種魯棒半監(jiān)督建模方法及其在化工過程故障檢測中的應用[J]. 化工學報, 2017, 68(3): 1109-1115. ZHOU L, SONG Z H, HOU B P,. Robust semi-supervised modelling method and its application to fault detection in chemical processes[J]. CIESC Journal, 2017, 68(3): 1109-1115.
[4] 王磊, 鄧曉剛, 徐瑩, 等. 基于變量子域PCA的故障檢測方法[J]. 化工學報, 2016, 67(10): 4300-4308. WANG L, DENG X G, XU Y,. Fault detection method based on variable sub-region PCA[J]. CIESC Journal, 2016, 67(10): 4300-4308.
[5] 童楚東, 史旭華. 基于互信息的PCA方法及其在過程監(jiān)測中的應用[J]. 化工學報, 2015, 66(10): 4101-4106. TONG C D, SHI X H. Mutual information based PCA algorithm with application in process monitoring[J]. CIESC Journal, 2015, 66(10): 4101-4106.
[6] 江偉, 王振雷, 王昕. 基于混合分塊DMICA-PCA的全流程過程監(jiān)控方法[J]. 化工學報, 2017, 68(2): 759-766. JIANG W, WANG Z L, WANG X. Plant-wide process monitoring based on mixed multiblock DMICA-PCA[J]. CIESC Journal, 2017, 68(2): 759-766.
[7] TONG C, LAN T, SHI X. Double-layer ensemble monitoring of non-Gaussian processes using modified independent component analysis[J]. ISA Trans., 2017, 68: 181-188.
[8] 胡永兵, 高學金, 李亞芬, 等. 基于仿射傳播聚類子集主元分析的間歇過程監(jiān)測方法[J]. 化工學報, 2016,67(5): 1989-1997. HU Y B, GAO X J, LI Y F,. Subset multiway principal component analysis monitoring for batch process based on affinity propagation clustering[J]. CIESC Journal, 2016,67(5): 1989-1997.
[9] RATO T J, REIS M S. Fault detection in the Tennessee Eastman benchmark process using dynamic principal components analysis based on decorrelated residuals (DPCA-DR)[J]. Chemom. Intell. Lab. Syst., 2013, 125(7): 101-108.
[10] 韓敏,張占奎. 基于改進核主成分分析的故障檢測與診斷方法[J]. 化工學報, 2015, 66(6): 2139-2149. HAN M, ZHANG Z K. Fault detection and diagnosis method based on modified kernel principal component analysis[J]. CIESC Journal, 2015, 66(6): 2139-2149.
[11] 童楚東, 藍艇, 史旭華. 基于互信息的分散式動態(tài)PCA故障檢測方法[J]. 化工學報, 2016, 67(10): 4317-4323. TONG C D, LAN T, SHI X H. Fault detection by decentralized dynamic PCA algorithm on mutual information[J]. CIESC Journal, 2016, 67(10): 4317-4323.
[12] LIU Y, ZHANG G, XU B. Compressive sparse principal component analysis for process supervisory monitoring and fault detection[J]. J. Process Control, 2017, 50: 1-10.
[13] GE Z, SONG Z. Distributed PCA model for plant-wide process monitoring[J]. Ind. Eng. Chem. Res., 2013, 52(5): 1947-1957.
[14] TONG C, LAN T, SHI X. Fault detection and diagnosis of dynamic processes using weighted dynamic decentralized PCA approach[J]. Chemom. Intell. Lab. Syst., 2017, 161: 34-42.
[15] TONG C, SONG Y, YAN X. Distributed statistical process monitoring based on four-subspace construction and Bayesian inference[J]. Ind. Eng. Chem. Res., 2013, 52(29): 9897-9907.
[16] JIANG Q, WANG B, YAN X. Multiblock independent component analysis integrated with Hellinger distance and Bayesian inference for non-Gaussian plant-wide process monitoring[J]. Ind. Eng. Chem. Res., 2015, 54(9): 2497-2508.
[17] DOWNS J J, VOGEK E F. A plant-wide industrial process control problem[J]. Comput. Chem. Eng., 1993, 17(3): 245-255.
[18] YIN S, DING S X, HAGHANI A,. A comparison study of basic data-driven fault diagnosis and process monitoring methods on the benchmark Tennessee Eastman process[J]. J. Process Control, 2012, 22: 1567-1581.
[19] QIN S J. Statistical process monitoring: basics and beyond[J]. J. Chemom., 2003, 17(7/8): 480-502.
[20] GE Z, ZHANG M, SONG Z. Nonlinear process monitoring based on linear subspace and Bayesian inference[J]. J. Process Control, 2010, 20(5): 676-688.
[21] GE Z, SONG Z. Multimode process monitoring based on Bayesian method[J]. J. Chemom., 2009, 23(12): 636-650.
[22] LI N, YANG Y. Ensemble kernel principal component analysis for improved nonlinear process monitoring[J]. Ind. Eng. Chem. Res., 2015, 54(1): 318-329.
[23] GE Z, SONG Z. Bayesian inference and joint probability analysis for batch process monitoring[J]. AIChE J., 2013, 59(10): 3702-3713.
[24] HUANG J, YAN X. Dynamic process fault detection and diagnosis based on dynamic principal component analysis, dynamic independent component analysis and Bayesian inference[J]. Chemom. Intell. Lab. Syst., 2015, 148: 115-127.
[25] 楊健, 宋冰, 譚帥, 等. 時序約束NPE算法在化工過程故障檢測中的應用[J]. 化工學報, 2016, 67(12): 5131-5139. YANG J, SONG B, TAN S,. Time constrained NPE for fault detection in chemical processes[J]. CIESC Journal, 2016, 67(12): 5131-5139.
[26] SEVERSON K, CHAIWATANODOM P, BRAATZ R D. Perspectives on process monitoring of industrial systems[J]. Annu. Rev. Control, 2016, 42: 190-200.
[27] ZHANG H, QI Y, WANG L,. Fault detection and diagnosis of chemical process using enhanced KECA[J]. Chemom. Intell. Lab. Syst., 2017, 161: 61-69.
[28] BERNAL-DE-LAZARO J M, LLANES-SANTIAGO O, PRIETO-MORENO A,. Enhanced dynamic approach to improve the detection of small-magnitude faults[J]. Chem. Eng. Sci., 2016, 14: 166-179.
[29] 薄翠梅, 韓曉春, 易輝. 基于聚類選擇k近鄰的LLE算法及故障檢測[J]. 化工學報, 2016, 67(3): 925-930. BO C M, HAN X C, YI H,. Neighborhood selection of LLE based on cluster for fault detection[J]. CIESC Journal, 2016, 67(3): 925-930.
Variable weighted principal component analysis algorithm and its application in fault detection
LAN TingTONG ChudongSHI Xuhua
(Faculty of Electrical Engineering & Computer Science, Ningbo University, Ningbo315211, Zhejiang, China)
Traditional principal component analysis (PCA) algorithm, targeting to explore correlations among measured variables in training dataset, has been intensively investigated and applied to data-driven fault detection. However, all variables are considered equally important in modeling process of traditional PCA-based methods, the difference between variable correlations cannot be comprehensively described. A variable weighted PCA (VWPCA) algorithm was proposed and applied to fault detection. Weight calculations were performed on the training dataset so correlation differences among measured variables were fully reflected in the processed data and a distributed PCA-based fault detection model was constructed. When implemented in online fault detection, the Bayesian inference was used to combine multiple monitoring results into an ensemble of probability indices. VWPCA approach assigned different weights to different variables according to the correlation difference, thus PCA modeling took correlation difference into account and the models could completely describe characteristics of the training dataset. Finally, superiority of the proposed VWPCA method was validated by well-known TE process.
principal component analysis;process systems;process control;fault detection
10.11949/j.issn.0438-1157.20170281
TP 277
A
0438—1157(2017)08—3177—06
藍艇(1976—),男,博士,講師。
國家自然科學基金項目(61503204);浙江省自然科學基金項目(Y16F030001);寧波市自然科學基金項目(2016A610092)。
2017-03-22收到初稿,2017-04-11收到修改稿。
2017-03-22.
LANTing, lanting@nbu.edu.cn
supported by the National Natural Science Foundation of China (61503204), the Natural Science Foundation of Zhejiang Province(Y16F030001) and the Natural Science Foundation of Ningbo (2016A610092).