郭金玉 李濤 李元
摘 要:為了有效提高支持向量機(jī)(SVM)算法的故障檢測和監(jiān)視性能,提出一種新的基于DW-ICA-SVM的工業(yè)過程故障檢測算法。首先,對訓(xùn)練數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,運(yùn)用獨(dú)立元分析(ICA)獲取數(shù)據(jù)的獨(dú)立元矩陣,提取隱藏的非高斯信息。其次,運(yùn)用杜賓-瓦特森(Durbin-Watson,DW)準(zhǔn)則計(jì)算獨(dú)立元(ICs)的DW值,通過DW方法有效提取重要噪聲信息,選取重要的ICs。再次,將包含重要信息的ICs作為SVM模型的輸入,獲得判別分類函數(shù),將測試數(shù)據(jù)的ICs輸入該模型,對其進(jìn)行故障檢測和監(jiān)視。最后,將新算法運(yùn)用于非線性數(shù)值例子和田納西-伊斯曼工業(yè)過程,并與PCA,LPP,ICA,SVM和ICA-SVM方法進(jìn)行比較。結(jié)果表明,所提方法降低了樣本間的自相關(guān)性,有效提高了故障檢測率。因此,新算法在一定程度上加強(qiáng)了對隱藏非高斯信息的提取與識別,為提高SVM算法在工業(yè)過程故障檢測中的應(yīng)用性能提供了參考。
關(guān)鍵詞:自動控制技術(shù)其他學(xué)科;故障檢測;杜賓-瓦特森準(zhǔn)則;獨(dú)立元分析;支持向量機(jī)
中圖分類號:TP277?? 文獻(xiàn)標(biāo)識碼:A
doi:10.7535/hbkd.2021yx04007
收稿日期:2021-03-23;修回日期:2021-05-17;責(zé)任編輯:馮 民
基金項(xiàng)目:國家自然科學(xué)基金(61490701,61673279);遼寧省教育廳一般項(xiàng)目(LJ2019007)
第一作者簡介:郭金玉(1975—),女,山東高唐人,副教授,博士,主要從事工業(yè)過程的故障檢測與診斷、生物特征識別算法及應(yīng)用方面的研究。
通訊作者:李 元教授。E-mail:li-yuan@mail.tsinghua.edu.cn
郭金玉,李濤,李元.基于DW-ICA-SVM的工業(yè)過程故障檢測算法[J].河北科技大學(xué)學(xué)報(bào),2021,42(4):369-379.GUO Jinyu,LI Tao,LI Yuan.Fault detection algorithm of industrial process based on DW-ICA-SVM[J].Journal of Hebei University of Science and Technology,2021,42(4):369-379.
Fault detection algorithm of industrial process based on DW-ICA-SVM
GUO Jinyu, LI Tao, LI Yuan
(College of Information Engineering,Shenyang University of Chemical Technology,Shenyang,Liaoning 110142,China)
Abstract:In order to effectively improve the fault detection and monitoring performance of support vector machine (SVM) algorithm,a new fault detection algorithm of industrial process based on DW-ICA-SVM was proposed.Firstly,the training data was normalized.The independent component analysis (ICA) was used to obtain the independent component matrix of the data and extract the hidden non-Gaussian information.Then the Durbin-Watson (DW) criterion was used to calculate the DW values of the independent components (ICs).The DW method was used to effectively extract important noise information and select the important ICs.The ICs containing important information were used as the input of the SVM model to obtain the discriminant classification function.The ICs of test data were input to the model for fault detection and monitoring.Finally,the method was applied to the nonlinear numerical example and the Tennessee-Eastman industrial process,and compared with PCA,LPP,ICA,SVM and ICA-SVM methods.The results show that the proposed method reduces the autocorrelation among samples and effectively improves the fault detection rate.The proposed method strengthens the extraction and recognition of hidden non-Gaussian information to a certain extent,and provides a reference for improving the performance of SVM algorithm in fault detection of industrial process.
Keywords:
other disciplines of automatic control technology;fault detection;Durbin-Watson criterion;independent component analysis;support vector machine
在大數(shù)據(jù)時(shí)代背景下,工業(yè)自動化技術(shù)得到快速發(fā)展,工業(yè)系統(tǒng)的規(guī)模和控制系統(tǒng)的復(fù)雜程度都在不斷提高,但同時(shí)也造成故障發(fā)生概率的不斷增大,因此對控制系統(tǒng)精度和安全可靠性提出了更高要求。現(xiàn)代工業(yè)系統(tǒng)中需要建立具備高性能的監(jiān)控系統(tǒng)來監(jiān)視系統(tǒng)的運(yùn)行狀態(tài),以便快速有效地檢測出系統(tǒng)故障[1-5]。近年來,基于數(shù)據(jù)驅(qū)動的故障檢測技術(shù)在工業(yè)過程中得到廣泛應(yīng)用,該研究方向也成為國內(nèi)外眾多學(xué)者的研究重點(diǎn)。
主元分析(principal component analysis,PCA) [6-7]方法廣泛應(yīng)用于工業(yè)生產(chǎn)過程故障檢測和監(jiān)視,由于PCA是一種線性算法,因此具有一定的局限性。為了解決PCA在非線性過程中的監(jiān)控問題,基于核理論的主元分析(kernel principal component analysis,KPCA)方法被提出,用以解決非線性過程的實(shí)時(shí)監(jiān)控與檢測[8-10]。PCA和KPCA等算法提取的是數(shù)據(jù)的全局特征,會丟失數(shù)據(jù)的局部結(jié)構(gòu)信息,導(dǎo)致故障檢測性能降低。為了改善PCA和KPCA等全局算法在故障檢測中的不足,HU等[11]將局部保持投影算法(locality preserving projections,LPP)應(yīng)用于工業(yè)過程故障檢測,它可以很好地保持?jǐn)?shù)據(jù)中近鄰點(diǎn)之間的結(jié)構(gòu)信息,保留數(shù)據(jù)的局部特征,提高故障檢測性能。PCA和LPP應(yīng)用T2和SPE兩個(gè)統(tǒng)計(jì)量進(jìn)行過程狀態(tài)監(jiān)控。T2和SPE能夠較好地完成過程監(jiān)控的前提條件是變量服從多元高斯分布且樣本間相互獨(dú)立。事實(shí)上,眾多工業(yè)生產(chǎn)過程變量間存在較強(qiáng)的非線性、非高斯特征[12]。為了提高非高斯過程的故障檢測效果,KANO等[13]將獨(dú)立主元分析(independent component analysis,ICA)應(yīng)用于故障檢測領(lǐng)域。ICA區(qū)別于其他方法的特點(diǎn)在于運(yùn)用ICA方法能夠使每個(gè)分量最大化獨(dú)立。ICA方法不僅充分利用了高階統(tǒng)計(jì)量,而且能夠從數(shù)據(jù)中有效提取出相互獨(dú)立的隱藏變量,這些隱藏變量能夠更好地反映出數(shù)據(jù)的變化特征,最大程度地捕獲有效信息。但是傳統(tǒng)ICA在提取非高斯隱藏信息時(shí),容易丟失數(shù)據(jù)的高斯信息以及部分樣本特征,同時(shí)數(shù)據(jù)間的自相關(guān)性也會導(dǎo)致ICA對部分過程數(shù)據(jù)的檢測效果不理想。
支持向量機(jī)(support vector machine,SVM)方法[14-16]作為機(jī)器學(xué)習(xí)的經(jīng)典算法,在解決小樣本和非線性的故障檢測問題時(shí)具有很多優(yōu)勢,因此被廣泛應(yīng)用于故障檢測與診斷領(lǐng)域。SVM方法通過尋找空間最大分離超平面,實(shí)現(xiàn)將不同類別的數(shù)據(jù)有效分離。值得注意的是,SVM方法在進(jìn)行模型訓(xùn)練時(shí),需要加入正常數(shù)據(jù)和故障數(shù)據(jù)。經(jīng)過訓(xùn)練,SVM模型能有效學(xué)習(xí)到故障數(shù)據(jù)的特征變化特點(diǎn),因此在模型測試時(shí)能夠保持較高的精確度。為了提高SVM算法對故障的快速精準(zhǔn)識別,ONEL等[17]從對偶C參數(shù)SVM (C-parameterized SVM,C-SVM)目標(biāo)函數(shù)靈敏度分析中推導(dǎo)出特征選擇算法,用于故障特征的提取和快速診斷,同時(shí)能夠減少有效信息損失,提高了故障檢測和診斷性能。由于故障檢測與診斷存在非線性問題,XUE等[18]引入高斯核支持向量機(jī)遞歸特征消除(support vector machine recursive feature elimination,SVM-RFE)算法提取非線性特征進(jìn)行故障檢測與診斷,該方法關(guān)鍵在于核參數(shù)的選擇,通過對比選擇出最優(yōu)參數(shù),建立一種先進(jìn)的故障檢測與診斷框架。此外,為了提高SVM算法的故障監(jiān)視性能,JI等[19]運(yùn)用獨(dú)立元分析提取隱藏獨(dú)立分量并與SVM方法結(jié)合,對故障作出有效檢測和診斷。為了進(jìn)一步改進(jìn)ICA-SVM方法的故障檢測性能,HSU等[20]將ICA與SVM結(jié)合,利用ICA獲取隱藏噪聲信息,計(jì)算T2統(tǒng)計(jì)量并引入時(shí)滯和時(shí)差輸入特性作為SVM輸入,有效提高了SVM的故障檢測性能以及對隱藏噪聲信息的提取。
對高維數(shù)據(jù),SVM的運(yùn)行時(shí)間較長。為了降低SVM的運(yùn)行時(shí)間,需要對數(shù)據(jù)進(jìn)行特征提取和降維,而SVM算法性能的高低依賴于數(shù)據(jù)特征提取的好壞。傳統(tǒng)ICA算法運(yùn)用累計(jì)方差貢獻(xiàn)率選取獨(dú)立元,但是無法消除過程變量間自相關(guān)性對故障檢測性能的影響。針對此問題,本文提出一種基于DW-ICA-SVM的工業(yè)過程故障檢測方法。
1 基于DW-ICA-SVM的工業(yè)過程故障檢測
1.1 支持向量機(jī)(SVM)算法
SVM算法作為機(jī)器學(xué)習(xí)中的經(jīng)典分類算法,在解決數(shù)據(jù)集規(guī)模相對較小或樣本非線性問題方面具有許多優(yōu)點(diǎn)。對線性數(shù)據(jù),SVM能夠建立最大分離超平面對數(shù)據(jù)進(jìn)行分類;對非線性問題,需要將數(shù)據(jù)投影到高維空間,去除數(shù)據(jù)非線性,建立最大分離超平面,使數(shù)據(jù)能夠進(jìn)行有效分類。
假設(shè)樣本訓(xùn)練數(shù)據(jù)集為H=x1,y1,x2,y2,…,xm,ym,yi∈-1,+1,在該樣本訓(xùn)練集空間中找到一個(gè)最大分離超平面,把不同類別的樣本有效分類,這是分類學(xué)習(xí)最基本的思想。SVM對指定數(shù)據(jù)分類的超平面如下:
wΤx+b=0,(1)
式中:w=w1,w2,…,wd是權(quán)重向量;b是位移項(xiàng)。為了找到最大間隔的超平面,實(shí)現(xiàn)最大程度分類,需要找到合適的參數(shù)w和b,使得間隔γ最大。考慮到一些無法分類的樣本以及支持向量機(jī)在一些樣本上分類出錯(cuò)的情況,為了提高支持向量機(jī)的容錯(cuò)率,引入懲罰變量C和松弛變量ξ。松弛變量的引入使SVM分類具有一定的容錯(cuò)性,能夠忽略落在隔離帶中的樣本點(diǎn)對超平面劃分的影響,使超平面不用朝這些樣本點(diǎn)方向移動。懲罰變量通常設(shè)置為一個(gè)常數(shù),懲罰變量越大,要求松弛變量的值盡量小,即對噪聲的容忍度越小,其主要起到權(quán)衡的作用。SVM的基本型可表示為
minw,b,ξi12‖w‖2+C∑mi=1ξi,s.t.? yiwΤxi+b≥1-ξi,? i=1,2,…,m,(2)
式中:ξi≥0;C>0,是一個(gè)常數(shù)。
為了求解式(2),需要將其轉(zhuǎn)化為“對偶問題”,運(yùn)用拉格朗日乘法求解,則該問題的拉格朗日函數(shù)可寫為
Lw,b,α,ξ,μ=12‖w‖2+C∑mi=1ξi+∑mi=1αi1-ξi-yiwΤxi+b-∑mi=1μiξi 。(3)
其中αi≥0,μi≥0是拉格朗日乘子。通過對上式求解,可以得到該模型為
fx=wΤx+b=∑mi=1αiyixΤix+b。(4)
在實(shí)際工業(yè)過程中,數(shù)據(jù)并不只是服從線性分布,更多情況是非線性數(shù)據(jù)。為了對數(shù)據(jù)更好地分類,需要通過非線性映射φx將其投影到高維特征空間。為了避免高維運(yùn)算,引入核函數(shù),通過核函數(shù)計(jì)算后該模型為
fx=sign∑mi,j=1αiyiKxi,xj+b。(5)
因此,SVM在對數(shù)據(jù)進(jìn)行分類時(shí),若數(shù)據(jù)是線性分布,則SVM對其進(jìn)行線性分類;若數(shù)據(jù)是非線性分布,則SVM將其映射到高維空間,并引入核函數(shù)解決高維計(jì)算問題,進(jìn)而高效準(zhǔn)確地對數(shù)據(jù)實(shí)現(xiàn)分類。因此,本文使用SVM作為故障分類器,實(shí)現(xiàn)對數(shù)據(jù)的有效檢測。
1.2 DW-ICA-SVM算法
假設(shè)x-∈Rm×n為觀測樣本,其中包含n個(gè)變量。首先需要對原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,將其處理為均值為0、方差為1的數(shù)據(jù),消除數(shù)據(jù)間的量綱影響。標(biāo)準(zhǔn)化后的數(shù)據(jù)矩陣為x,ICA對其分解為
x=As+E,(6)
式中:A∈Rr×n是未知的混合矩陣;s∈Rl×r是獨(dú)立元向量;E∈Rl×n是誤差向量,且r≤n。ICA方法通過觀測樣本估計(jì)出A和s,進(jìn)一步計(jì)算出分離矩陣W和重構(gòu)后的獨(dú)立元向量s∧,使其滿足:
s∧=xW 。(7)
ICA算法需要對數(shù)據(jù)進(jìn)行中心化和白化處理,使觀測變量的協(xié)方差矩陣為單位陣。白化預(yù)處理即對中心化后x的協(xié)方差矩陣進(jìn)行奇異值分解,
ExΤx=UΛUΤ ,(8)
式中:U為特征值對應(yīng)的特征向量組成的矩陣;Λ為x協(xié)方差矩陣的特征值組成的對角陣。
計(jì)算
z=Qx ,(9)
Q=Λ-12UΤ ,(10)
其中z為白化向量。可以得到
z=Qx=QAs=Bs,(11)
其中B=QA為分離矩陣。于是,獨(dú)立元s的估計(jì)值為
s∧=Wx=BΤz=BΤQx=BΤΛ-12UΤx。(12)
那么W和B的關(guān)系可表示為
W=BΤQ 。(13)
本文通過FastICA算法獲取獨(dú)立元矩陣,然后運(yùn)用DW準(zhǔn)則檢驗(yàn)IC是否包含重要信息。相較于傳統(tǒng)選擇獨(dú)立元個(gè)數(shù)的累計(jì)方差貢獻(xiàn)率方法,DW準(zhǔn)則[21]能夠客觀地測量出變量的結(jié)構(gòu)或非隨機(jī)行為,因此能有效挖掘出重要的隱藏變量,優(yōu)化模型的穩(wěn)定性。根據(jù)式(14)能夠計(jì)算各個(gè)變量的DW值,
DW=∑ni=2δxi-δxi-12∑ni=1δxiδxi 。(14)
式中:δxi和δxi-1是向量中連續(xù)點(diǎn)的殘差;n是變量數(shù)。最初DW準(zhǔn)則被提出用于測量信噪比,在沒有任何噪聲的情況下,DW的值會趨向于0,如果信號只有噪聲,DW的值會趨向于2。因此,本文采用DW值的色譜圖方法來確定獨(dú)立元個(gè)數(shù)。如果IC由噪聲組成,即錯(cuò)誤信息,則DW值較高,在色譜圖中顏色較淺;否則,DW值較低,在色譜圖中顏色較深,那么這種IC被認(rèn)為是重要的。提取出包含重要信息的獨(dú)立元矩陣后,運(yùn)用SVM模型對數(shù)據(jù)進(jìn)行分類操作。
1.3 基于DW-ICA-SVM的工業(yè)過程故障檢測步驟
基于DW-ICA-SVM算法的工業(yè)過程故障檢測分為離線建模過程和在線檢測2個(gè)步驟,流程圖如圖1所示。具體的操作步驟如下。
1.3.1 建模過程
1) 獲取正常操作條件的歷史數(shù)據(jù)集X1和故障操作條件下的歷史數(shù)據(jù)集X2;
2) 對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,運(yùn)用ICA方法獲取獨(dú)立元矩陣;
3) 根據(jù)式(14)計(jì)算每個(gè)獨(dú)立元的DW值,進(jìn)行升序排列。運(yùn)用色譜圖確定獨(dú)立元個(gè)數(shù),選取較小的DW值對應(yīng)的獨(dú)立元矩陣;
4)將獨(dú)立元矩陣作為SVM模型輸入,訓(xùn)練SVM得到權(quán)重向量和位移。
1.3.2 在線檢測
1)對新來的測試數(shù)據(jù)運(yùn)用離線建模數(shù)據(jù)的均值和方差進(jìn)行標(biāo)準(zhǔn)化;
2)將標(biāo)準(zhǔn)化后的數(shù)據(jù)投影到ICA模型獲得獨(dú)立元矩陣;
3)利用DW準(zhǔn)則計(jì)算測試數(shù)據(jù)的DW值并排序;
4)將較小DW值對應(yīng)的獨(dú)立元矩陣輸入SVM模型進(jìn)行故障分類。分類結(jié)果將正常數(shù)據(jù)定義為標(biāo)簽0,故障數(shù)據(jù)定義為標(biāo)簽1。
2 仿真結(jié)果與分析
2.1 非線性數(shù)值例子
按照以下模型構(gòu)造非線性數(shù)值例子[22],該數(shù)據(jù)集包含3個(gè)變量:
x1=t+e1,x2=t2-2t+e2,x3=-t3+3t2+e3,(15)
式中:t服從[0.01,3]的均勻分布;e1,e2和e3為服從均值為0、標(biāo)準(zhǔn)差為0.01的正態(tài)分布的均勻噪聲序列。在模型運(yùn)行過程中,對變量1施加幅值為0.01×(i-200)的擾動,其中i代表樣本數(shù)量。對變量2和變量3分別施加幅值為0.75和-0.55的階躍擾動組成該模型故障數(shù)據(jù)集。
本例中,選取200組正常樣本和200組故障樣本共同組成訓(xùn)練數(shù)據(jù)集,用于DW-ICA-SVM模型訓(xùn)練,再選取100組故障樣本用于模型測試,驗(yàn)證模型有效性。將本文方法與PCA,LPP,ICA,SVM和ICA-SVM方法作比較,需要注意的是,ICA-SVM方法需要計(jì)算出ICA的3個(gè)統(tǒng)計(jì)量I2d,I2e和SPE,并將三者組合成矩陣作為SVM模型的輸入,用于故障分類和檢測。圖2是樣本散點(diǎn)圖,“黑色星號”是正常樣本,“紅色圓圈”是故障樣本,圖中清晰地呈現(xiàn)出數(shù)據(jù)服從非線性分布。圖3是變量x1的分布圖,從圖中可以看出,該數(shù)據(jù)分布服從非高斯分布。因此,本文運(yùn)用DW-ICA方法進(jìn)行特征提取。
通過DW色譜圖確定獨(dú)立元的個(gè)數(shù)。圖4是訓(xùn)練數(shù)據(jù)
和故障數(shù)據(jù)不同變量的DW值。從圖4可以清晰地看到,變量1和變量3的DW值相較于變量2較小,顏色較深,這2個(gè)變量包含了較多的隱藏信息,具有檢測價(jià)值,是所需要的重要ICs;而變量2的顏色較淺,DW值較大,包含較多噪聲信息。因此,在本例中,獨(dú)立元個(gè)數(shù)選取2個(gè)。
圖5是各種方法的故障檢測結(jié)果圖,其中“黑色圓圈”代表故障數(shù)據(jù)。PCA,LPP和ICA方法運(yùn)用99%控制限進(jìn)行故障檢測,控制限是由核密度估計(jì)方法[23]確定的。在PCA,LPP,ICA和ICA-SVM方法中獨(dú)立元個(gè)數(shù)的選取采用85%的累計(jì)方差貢獻(xiàn)率[24]來確定。對于SVM,采用高斯核函數(shù)提高對非線性數(shù)據(jù)的處理能力。SVM中需要調(diào)整懲罰因子C,高斯核函數(shù)中需要調(diào)整窗寬g,從而使分類器適應(yīng)特定的分類任務(wù)。對參數(shù)的選取,本文通過網(wǎng)格搜索方法得到參數(shù)的最優(yōu)設(shè)置,將懲罰因子C設(shè)置為0.8,窗寬g設(shè)置為0.45。SVM,ICA-SVM和DW-ICA-SVM方法的檢測結(jié)果將正常數(shù)據(jù)定義為標(biāo)簽0,故障數(shù)據(jù)定義為標(biāo)簽1。從圖5可以看出,傳統(tǒng)算法PCA,LPP和ICA的檢測效果并不理想,主要因?yàn)镻CA是線性算法,對非線性過程檢測效果不理想。LPP算法的統(tǒng)計(jì)指標(biāo)需要服從高斯分布的前提假設(shè),當(dāng)這種假設(shè)不滿足時(shí),會降低其檢測性能。ICA算法在提取隱藏非高斯信息時(shí),容易丟失數(shù)據(jù)的高斯信息以及部分樣本特征,同時(shí)數(shù)據(jù)間自相關(guān)性強(qiáng)弱也會導(dǎo)致ICA對部分過程數(shù)據(jù)的檢測效果不理想。PCA和LPP提取的是二階統(tǒng)計(jì)信息,而ICA提取的是高階統(tǒng)計(jì)信息,ICA的檢測效果好于PCA和LPP。ICA-SVM方法相較于ICA,檢測效果具有一定的提升,這得益于SVM算法優(yōu)秀的分類能力,能夠?qū)⒎蔷€性數(shù)據(jù)映射到高維特征空間進(jìn)行處理。SVM和DW-ICA-SVM方法檢測效果都很好,但是DW-ICA-SVM的檢測結(jié)果要優(yōu)于SVM。
表1是各種算法對非線性數(shù)值例子的故障檢測率對比。從表1可以看出,DW-ICA-SVM的故障檢測率高達(dá)100%,相較于其他方法都有不同程度的提高。PCA,LPP和ICA的檢測結(jié)果并不理想,主要原因是這些算法的使用需要前提假設(shè)以及各自的使用范圍不一樣,并且數(shù)據(jù)的分布情況也會對檢測結(jié)果有一定的影響。但是SVM具有較高的檢測結(jié)果,這得益于SVM算法在訓(xùn)練數(shù)據(jù)時(shí)能夠?qū)W習(xí)到2類樣本的特征變化,因此在模型測試時(shí)能夠?qū)收蠘颖具M(jìn)行有效識別。
文獻(xiàn)[25]指出,數(shù)據(jù)間的自相關(guān)性是影響故障檢測性能的重要因素。本文DW方法能夠選取樣本間具有弱相關(guān)性的樣本,剔除存在較強(qiáng)相關(guān)性的樣本,減少相關(guān)性對數(shù)據(jù)故障檢測性能的影響。圖6是ICA-SVM和DW-ICA-SVM方法的樣本相關(guān)性對比圖。相較于ICA,ICA-SVM方法的檢測效果有一定的提高,但并沒有SVM的檢測效果好。從圖6可以看出,ICA-SVM方法在選取獨(dú)立元時(shí),傳統(tǒng)的選取方法并沒有考慮到樣本相關(guān)性的影響,因此會對結(jié)果有一定的影響。本例中,DW-ICA-SVM的故障檢測率最高,該結(jié)果進(jìn)一步驗(yàn)證了DW-ICA-SVM方法的故障檢測性能,以及該算法的優(yōu)越性和有效性。
2.2 TE工業(yè)過程
TE,即Tennessee Esatman(田納西-伊斯曼過程)工業(yè)過程已成為國際上通用的工業(yè)過程仿真平臺[26-28],被國內(nèi)外學(xué)者廣泛用于故障檢測和診斷領(lǐng)域。TE過程包括5個(gè)主要操作單元、4種氣體進(jìn)料、2個(gè)氣液放熱反應(yīng)生成的2種主產(chǎn)品和2個(gè)衍生放熱反應(yīng)生成的2種副產(chǎn)品等,過程工藝復(fù)雜,具有較多變量。將TE過程產(chǎn)生的數(shù)據(jù)集用于仿真測試,該數(shù)據(jù)集是在TE仿真器中持續(xù)運(yùn)行48 h獲得的[29],期間每隔3 min進(jìn)行采樣記錄。
在TE工業(yè)過程正常操作條件下選取200組正常樣本和200組故障樣本作為訓(xùn)練數(shù)據(jù)集,測試數(shù)據(jù)集中包括160組故障數(shù)據(jù)。本例中選取TE過程故障3,7,9,11,17,19,20和21驗(yàn)證本文算法的有效性。以故障7為例,對比各種方法的檢測性能。本文通過網(wǎng)格搜索方法將懲罰因子C設(shè)置為0.8,窗寬g設(shè)置為0.45。ICA和ICA-SVM方法的獨(dú)立元個(gè)數(shù)由85%累計(jì)方差貢獻(xiàn)率確定。DW-ICA-SVM方法利用DW準(zhǔn)則,選擇包含重要隱藏信息的獨(dú)立元矩陣訓(xùn)練SVM模型。
根據(jù)DW值選擇的獨(dú)立元數(shù)量會對監(jiān)控結(jié)果產(chǎn)生影響,因此,這里討論獨(dú)立元數(shù)量的選取方法。通過DW準(zhǔn)則在信號中查找信噪比,并繪制DW色譜圖。圖7是不同變量的DW值,選擇DW值較小的獨(dú)立元,即在色譜圖中顏色較深的獨(dú)立元,這類獨(dú)立元被認(rèn)為比其他獨(dú)立元更重要。從圖7可以看出,22個(gè)獨(dú)立元的顏色較深,這表明它們比其他獨(dú)立元更重要。對故障7的數(shù)據(jù)集進(jìn)行不同數(shù)量獨(dú)立元的監(jiān)控,檢測結(jié)果如表2所示。從表2中可以看出,隨著選取獨(dú)立元數(shù)量的不同,故障檢測率會產(chǎn)生不同幅度的變化。結(jié)合色譜圖,選擇22個(gè)重要的獨(dú)立元能夠得到最佳的故障檢測效果。綜上所述,證明了DW準(zhǔn)則選取重要獨(dú)立元數(shù)量的有效性。
圖8是各種算法對故障7的檢測結(jié)果對比圖,圖中“黑色圓圈”代表故障數(shù)據(jù)。從圖8可以清晰地看出DW-ICA-SVM的故障檢測效果最好,PCA,LPP,ICA,SVM和ICA-SVM的檢測效果均低于DW-ICA-SVM。故障7屬于階躍故障類型,ICA方法能夠提取到過程變量中隱藏的非高斯信息,實(shí)現(xiàn)對故障特征的有效提取。SVM方法在訓(xùn)練模型時(shí)需要加入正常數(shù)據(jù)和故障數(shù)據(jù)一起訓(xùn)練,模型能夠?qū)W習(xí)到故障特征的變化趨勢,在測試時(shí)快速有效識別正常數(shù)據(jù)和故障數(shù)據(jù)并將其分類。本文方法在運(yùn)用ICA獲取到隱藏非高斯信息后,又運(yùn)用DW準(zhǔn)則進(jìn)一步處理包含非高斯信息的IC,篩選出包含更重要信息的IC,提取到重要的數(shù)據(jù)特征,并在一定程度上降低了樣本間的自相關(guān)性,減小了對故障檢測的影響。因此,DW-ICA-SVM方法的故障檢測效果最好。
圖9為原始數(shù)據(jù)和本文方法處理后數(shù)據(jù)的自相關(guān)性對比圖。從圖9可以看出,原始數(shù)據(jù)樣本間存在較強(qiáng)的自相關(guān)性,這會在很大程度上影響故障檢測結(jié)果,而經(jīng)過本文方法處理后的樣本相關(guān)性明顯減弱,驗(yàn)證了本文方法的有效性。
本文運(yùn)用故障檢測率來衡量算法的優(yōu)越性,表3是各種算法對TE過程故障檢測率的對比情況。從表3可知,對TE過程的故障3,7,9,11,17,19,20和21進(jìn)行檢測時(shí),與其他檢測方法相比較,本文方法的故障檢測率都有不同程度的提高,驗(yàn)證了該方法的有效性。
3 結(jié) 語
本文提出的基于DW-ICA-SVM的工業(yè)過程故障檢測方法,運(yùn)用DW準(zhǔn)則計(jì)算獨(dú)立元的DW值,并將DW值升序排列,提取DW值中較小的重要獨(dú)立元。該方法能夠有效提取和識別過程變量中重要的隱藏非高斯信息,降低過程變量間自相關(guān)性對故障檢測的影響,減小非隨機(jī)行為,將包含重要IC信息的獨(dú)立元作為SVM模型的輸入,通過樣本特征建模獲得判別分類函數(shù),實(shí)現(xiàn)對故障數(shù)據(jù)的有效檢測,仿真結(jié)果驗(yàn)證了該方法的有效性和優(yōu)越性。
本文主要研究DW-ICA-SVM算法在工業(yè)過程故障檢測中的實(shí)現(xiàn)與仿真實(shí)驗(yàn),但是實(shí)際工業(yè)過程數(shù)據(jù)往往具有多模態(tài)特性或者動態(tài)性,這對檢測算法提出了更高的要求,因此,未來需要深入探索這方面的研究,提升算法在多場景中的適應(yīng)性。
參考文獻(xiàn)/References:
[1] 周東華,李鋼,李元.數(shù)據(jù)驅(qū)動的工業(yè)過程故障診斷技術(shù):基于主元分析與偏最小二乘的方法[M].北京:科學(xué)出版社,2011.
[2] 張成,郭青秀,馮立偉,等.基于局部近鄰標(biāo)準(zhǔn)化和動態(tài)主元分析的故障檢測策略[J].計(jì)算機(jī)應(yīng)用,2018,38(9):2730-2734.
ZHANG Cheng,GUO Qingxiu,F(xiàn)ENG Liwei,et al.Fault detection strategy based on local neighbor standardization and dynamic principal component analysis[J].Journal of Computer Applications,2018,38(9):2730-2734.
[3] LAN T,TONG C D,YU H Z,et al.Nonlinear process monitoring based on decentralized generalized regression neural networks[J].Expert Systems with Applications,2020,150:113273.
[4] HUANG J P,YAN X F.Quality-Driven principal component analysis combined with kernel least squares for multivariate statistical process monitoring[J].IEEE Transactions on Control Systems Technology,2019,27(6):2688-2695.
[5] 郭金玉,王東琴,李元.基于二階差商LPP的多模態(tài)過程故障檢測[J].高校化學(xué)工程學(xué)報(bào),2020,34(1):182-189.
GUO Jinyu,WANG Dongqin,LI Yuan.Fault detection of multimode processes based on second order difference quotient LPP[J].Journal of Chemical Engineering of Chinese Universities,2020,34(1):182-189.
[6] DU Y C,DU D P.Fault detection and diagnosis using empirical mode decomposition based principal component analysis[J].Computers & Chemical Engineering,2018,115:1-21.
[7] SHERIFF ZIYAN M,MANSOURI M,KARIM NAZMUL M,et al.Fault detection using multiscale PCA-based moving window GLRT[J].Journal of Process Control,2017,54:47-64.
[8] SHIOKAWA Y,DATE Y,KIKUCHI J.Application of kernel principal component analysis and computational machine learning to exploration of metabolites strongly associated with diet[J].Scientific Reports,2018.doi:10.1038/s41598-018-20121-w.
[9] 翟坤,杜文霞,呂鋒,等.一種改進(jìn)的動態(tài)核主元分析故障檢測方法[J].化工學(xué)報(bào),2019,70(2):716-722.
ZHAI Kun,DU Wenxia,LV Feng,et al.Fault detect method based on improved dynamic kernel principal component analysis[J].CIESC Journal,2019,70(2):716-722.
[10]SOH W,KIM H,YUM B J.Application of kernel principal component analysis to multi-characteristic parameter design problems[J].Annals of Operations Research,2018,263(1):69-91.
[11]HU K L,YUAN J Q.Multivariate statistical process control based on multiway locality preserving projections[J].Journal of Process Control,2008,18(7/8):797-807.
[12]張成,戴絮年,李元.基于DPCA殘差互異度的故障檢測與診斷方法[J/OL].自動化學(xué)報(bào).[2020-03-24].http://kns.cnki.net/kcms/detail/11.2109.tp.20200323.1459.002.html.
ZHANG Cheng,DAI Xunian,LI Yuan.Fault detection and diagnosis based on residual dissimilarity in? dynamic principal component analysis[J/OL].Acta Automatica Sinica.[2020-03-24].http://kns.cnki.net/kcms/detail/11.2109.tp.20200323.1459.002.html.
[13]KANO M,TANAKA S,HASEBE S,et al.Monitoring Independent components for fault detection[J].AIChE Journal,2003,49(4):969-976.
[14]GU Q H,CHANG Y X,LI X H,et al.A novel F-SVM based on FOA for improving SVM performance[J].Expert Systems with Applications,2021,165:113713.
[15]ZHAO Y P,HUANG G,HU Q K,et al.An improved weighted one class support vector machine for turboshaft engine fault detection[J].Engineering Applications of Artificial Intelligence,2020,94:103796.
[16]EBRAHIMI M A,KHOSHTAGHAZA M H,MINAEI S,et al.Vision-based pest detection based on SVM classification method[J].Computers and Electronics in Agriculture,2017,137:52-58.
[17]ONEL M,KIESLICH C A,PISTIKOPOULOS E N.A nonlinear support vector machine-based feature selection approach for fault detection and diagnosis:Application to the Tennessee eastman process[J].AIChE Journal,2019,65(3):992-1005.
[18]XUE Y T,ZHANG L,WANG B J,et al.Nonlinear feature selection using Gaussian kernel SVM-RFE for fault diagnosis[J].Applied Intelligence,2018,48:3306-3331.
[19]JI Z P,ZHANG X J.An integrated fault diagnosis method based on the ICA-SVM[J].Applied Mechanics and Materials,2015,740:523-526.
[20]HSU C C,CHEN M C,CHEN L S.Integrating independent component analysis and support vector machine for multivariate process monitoring[J].Computers & Industrial Engineering,2010,59(1):145-156.
[21]RUTLEDGE D N,BARROS A S.Durbin-Watson statistic as a morphological estimator of information content[J].Analytica Chimica Acta,2002,454(2):277-295.
[22]ZHOU Z,DU N,XU J Y,et al.Randomized kernel principal component analysis for modeling and monitoring of nonlinear industrial processes with massive data[J].Industrial & Engineering Chemistry Research,2019,58(24):10410-10417.
[23]MATIOLI L C,SANTOS S R,KLEINA M,et al.A new algorithm for clustering based on kernel density estimation[J].Journal of Applied Statistics,2018,45(2):347-366.
[24]LI J S,YAN X F.Process monitoring using principal component analysis and stacked autoencoder for linear and nonlinear coexisting industrial processes[J].Journal of the Taiwan Institute of Chemical Engineers,2020,112:322-329.
[25]RATO T J,REIS M S.Advantage of using decorrelated residuals in dynamic principal component analysis for monitoring large-scale systems[J].Industrial & Engineering Chemistry Research,2013,52(38):13685-13698.
[26]DOWNS J J,VOGEL E F.A plant-wide industrial process control problem[J].Computers & Chemical Engineering,1993,17(3):245-255.
[27]UDUGAMA I A,GERNAEY K V,TAUBE M A,et al.A novel use for an old problem:The Tennessee Eastman challenge process as an activating teaching tool[J].Education for Chemical Engineers,2020,30:20-31.
[28]HEO S,LEE J H.Statistical process monitoring of the Tennessee Eastman process using parallel autoassociative neural networks and a large dataset[J].Processes,2019.doi:10.3390/pr7070411.
[29]JIANG Q C,YAN X F.Non-Gaussian chemical process monitoring with adaptively weighted Independent component analysis and its applications[J].Journal of Process Control,2013,23(9):1320-1331.