姬鵬飛,侯凡博,張修太
(安陽工學院電子信息與電氣工程學院,河南安陽455000)
工業(yè)過程具有多工況、非線性、復雜程度高等特點,運行過程中一旦出現(xiàn)故障就會影響產品質量,造成重大的經濟損失,嚴重時甚至出現(xiàn)人員損傷。因此,對工業(yè)過程中各種異常情況進行及時、有效地監(jiān)控就顯得尤為重要[1]。
主元分析(PCA)方法[2]是目前廣泛應用于過程分析和監(jiān)測的方法之一。但是,它是一種線性方法,不適用于非線性過程。針對現(xiàn)代工業(yè)過程的非線性特性,出現(xiàn)了各種非線性監(jiān)控方法,核主元分析(kernelPCA,KPCA)[3]就是其中一種。它考慮了過程的非線性特性,可以有效提取數據的非線性信息,同時在實施過程中沒有復雜的非線性計算,可調參數少,因此廣泛應用于特征提取、人臉識別、圖像處理和故障診斷等領域[4-6]。
在KPCA方法中,核函數的選擇正確與否很大程度上決定了系統(tǒng)非線性特征提取的好壞。因此,核函數種類及其參數的選取對故障檢測的結果影響很大[7]。本文對常見核函數特性進行分析后,將全局核函數和局部核函數混合,構造出兼具兩種核函數優(yōu)點的混合核函數。將混合核函數應用到KPCA方法中,達到對傳統(tǒng)KPCA方法改進的目的。典型非線性過程和TE過程監(jiān)控結果表明,該方法在故障檢測中具有較高的準確性。
KPCA是一種非線性方法,將數據經過非線性映射函數φ:RM→F,把數據映射到高維特征空間F,然后在高維特征空間進行非線性特征的提取[8]。
假設φ(xk)已經均值化處理,則F空間上的協(xié)方差矩陣為:
對應的特征方程為:
式(2)中,λ和v分別為與之對應的特征值和特征向量。將式(1)代入式(2)可得:
由式(3)可知v位于φ(x1),…,φ(xn)的張成空間中,滿足,其中ai(i= 1,2,…,N)為系數向量。則存在:
>對矩陣K用下式進行中心化,
測試樣本數據的第k個非線性主元tk計算如下:
核函數的性能由學習能力和推廣能力兩方面決定。KPCA方法中經常使用的核函數有:
高斯徑向基核函數:
多項式核函數:
Sigmoid核函數:
所有核函數歸納起來可分為泛化能力強、學習能力較弱的全局核函數和學習能力強、泛化能力較弱的局部核函數兩類。只使用一種核函數,在分析系統(tǒng)的性能時會有一定的局限性。
由核函數的性質可知,任意兩個核函數的線性組合,都能組成一個新的核函數[10]。因此,本文對具有較強學習能力的高斯徑向基核函數和具有較強泛化能力的多項式核函數進行組合,構造出兼具二者優(yōu)點的混合核函數,如式(12)所示。
式(12)中,ρ為高斯徑向基核函數所占權重;σ為高斯徑向基核函數參數;d為多項式核函數的階次。對于混合核函數KPCA方法來說,這3個參數的選取對模型的建立有著重要的影響。為了得到具有較好監(jiān)控效果的模型,有必要對這些參數進行優(yōu)化調整。
本文采用交叉驗證法[11],將主元貢獻率f1和故障檢測率f2作為參數優(yōu)化的目標函數,對混合核函數中的三個參數進行優(yōu)化,從而得到最優(yōu)參數值。
式中,k為選取的主元個數,n1為在線采集數據檢測正常個數。
①選取正常建模數據和測試數據,并將數據作標準化處理。
②對混合核函數賦初值,計算建模數據和測試數據的核矩陣K1、Kt,并對K1、Kt進行中心化處理。
③對于K1,進行主元分析,求得特征值和特征向量,并確定T2和SPE控制限。
④將測試數據核矩陣Kt代入模型進行檢測,利用主元貢獻率f1和故障檢測率f2作為優(yōu)化目標,對混合核函數參數不斷進行優(yōu)化,直到符合要求為止。
⑤重復步驟③,確定檢測模型最終的T2和SPE控制限。
①利用建模步驟①得到的均值和方差對在線獲得的數據進行標準化處理。
②利用建模步驟④中得到的混合核函數計算對應的核矩陣K2,并對K2進行中心化處理。
③計算數據的T2和SPE統(tǒng)計量,并判斷這兩個統(tǒng)計量是否超過建模步驟⑤的控制限。
將改進KPCA故障檢測方法應用于典型的非線性過程和TE過程,并與傳統(tǒng)KPCA方法比較,驗證改進后方法的有效性。
為驗證方法的有效性,采用如下非線性過程產生數據進行仿真實驗[12]。
式(14)中,e1,e2,e3為獨立擾動變量,滿足N(0 ,0.01) 的正態(tài)分布,t∈[0 . 01,2]。根據公式XX隨機產生500個樣本數據用于KPCA建模及核函數參數優(yōu)化,產生兩組故障數據測試模型的檢驗能力。測試數據為對樣本x2從100個采樣時刻后加入了0.5的階躍干擾。
根據測試數據,以主元貢獻率f1和故障檢測率f2作為優(yōu)化目標對參數進行優(yōu)化,優(yōu)化結果如表1、表2所示。
表1 高斯徑向基KPCA方法參數優(yōu)化結果
表2 多項式KPCA方法參數優(yōu)化結果
通過表1、表2可知,當σ=5000、d=2時,單一核函數KPCA方法對測試數據的主元貢獻率f1和故障檢測率f2達到最優(yōu),ρ取0.2。參數被確定后,混合核函數最終形式也就確定了。使用傳統(tǒng)KPCA方法和改進KPCA方法的spe統(tǒng)計量檢測結果如圖1所示。
圖1 三種KPCA方法的spe統(tǒng)計量檢測圖
表3 三種方法故障檢測適應函數值
通過圖1的檢測結果可以看到,三種方法都可以很好的檢測出故障。從表3中可以看出定量的數據分析,改進KPCA方法對數據非線性特征的提取要高于傳統(tǒng)KPCA方法,同時故障檢測率也比高于傳統(tǒng)KPCA方法。
TE過程是一個典型的非線性工業(yè)過程,是伊斯曼化學品公司為了評價過程控制和監(jiān)控方法而提供的一個工業(yè)過程平臺[13]。本文選取了TE過程故障中較為典型的故障5和故障11為例分析改進KPCA的檢測效果,故障5為階躍型故障,而故障11為隨機變量型故障,都具有很強的非線性。用于訓練的正常工況樣本有400個,用于測試的故障數據有240個。在檢測過程中,先使系統(tǒng)正常運行8小時,之后引入故障。
同樣,以主元貢獻率f1和故障檢測率f2作為優(yōu)化目標對參數進行優(yōu)化,當σ=300、d=2時,單一核函數KPCA方法對測試數據的主元貢獻率f1和故障檢測率f2達到最優(yōu)。同時取ρ=0.2,構造混合核函數。圖2顯示了三種方法對故障5的spe統(tǒng)計量檢測結果。
圖2 三種KPCA方法對故障5的spe統(tǒng)計量檢測圖
由圖2可以看出,三種方法都可以很好的檢測出故障。表4的定量結果分析表明,改進KPCA方法的非線性特征提取和故障檢測率要高于單一核函數KPCA方法。
圖3 三種KPCA方法對故障11的spe統(tǒng)計量檢測圖
表5 三種方法故障11檢測適應函數值
由圖3可以看出,三種方法都可以檢測出故障11,但是改進KPCA方法的監(jiān)控結果表明,無論在過程的正常運行時刻,還是在引入故障后,此方法誤檢率都要明顯低于另外兩種方法。表5的定量結果也驗證了這一點,改進KPCA方法兼具了高斯徑向基KPCA方法和多項式KPCA方法的優(yōu)點,對于非線性過程故障的檢測效果要高于單一核函數KPCA方法。
本文采用了改進KPCA方法對非線性過程進行故障檢測。該方法采用了混合核函數對數據進行高維映射,由于混合核函數兼具了兩類核函數的優(yōu)點,因此映射后數據具有較強的泛化能力。將主元貢獻率和故障檢測率作為混合核函數參數優(yōu)化的雙重指標,使得到最優(yōu)參數的混合核函數在特征提取和故障檢測方面都優(yōu)于單一核函數。通過在典型非線性過程和TE過程數據進行在線檢測,結果表明改進KPCA方法具有更好的有效性。