李祥宇 楊沖 宋留 趙小燕 劉鴻斌
摘要:故障檢測和故障診斷是工業(yè)過程監(jiān)控的主要內(nèi)容。針對造紙廢水處理過程的多變量、非線性、大時變等特點,本課題首先采用主成分分析(PCA)對故障進行檢測,然后分別采用馬氏距離判別分析和支持向量機(SVM)對偏移、漂移和精度下降3種故障類型進行故障診斷。計算結(jié)果表明,基于主成分分析的故障檢測率達9750%;基于支持向量機故障診斷方法的故障分離能力為9000%,而基于馬氏距離判別分析方法的故障分離能力為7375%。相比基于馬氏距離判別分析的故障診斷方法,基于支持向量機的故障診斷方法更適合于非線性時變的造紙廢水處理過程。
關(guān)鍵詞:故障檢測;故障診斷;主成分分析;馬氏距離判別分析;支持向量機
中圖分類號:TS7;X793文獻標(biāo)識碼:ADOI:1011981/jissn1000684220180355
收稿日期:20170407
基金項目:制漿造紙工程國家重點實驗室開放基金資助項目(201813,201610);南京林業(yè)大學(xué)高層次人才科研啟動基金(163105996);江蘇省制漿造紙科學(xué)與技術(shù)重點實驗室開放基金項目(201530)。
作者簡介:李祥宇,男,1992年生;在讀碩士研究生;主要研究方向:制漿造紙過程監(jiān)測與控制。
*通信聯(lián)系人:劉鴻斌,副教授;主要研究方向:制漿造紙監(jiān)測與控制;Email: hongbinliu@njfueducn。隨著現(xiàn)代工業(yè)系統(tǒng)變得越來越復(fù)雜,提高復(fù)雜系統(tǒng)的穩(wěn)定性也變得越來越重要。故障診斷技術(shù)是提高系統(tǒng)穩(wěn)定性和保障系統(tǒng)安全性的重要技術(shù)之一。在造紙廢水處理過程中,惡劣的工作環(huán)境會加大系統(tǒng)故障發(fā)生的概率,特別是傳感器等一些系統(tǒng)硬件設(shè)備經(jīng)不起長期惡劣環(huán)境的考驗,因此,在廢水處理過程中,需要對這些故障進行準(zhǔn)確的診斷,以防止因故障造成的損害擴大 [1]。故障診斷技術(shù)可以分為3類,即基于解析模型、基于專家知識和基于數(shù)據(jù)驅(qū)動的故障診斷技術(shù)[2]。前兩種因系統(tǒng)的復(fù)雜性和知識的局限性適合于具有較少過程變量的系統(tǒng),對于具有大量歷史數(shù)據(jù)的復(fù)雜工業(yè)系統(tǒng),采用基于數(shù)據(jù)驅(qū)動的故障診斷技術(shù)更為合適?;跀?shù)據(jù)驅(qū)動的故障診斷技術(shù)包括統(tǒng)計分析法、機器學(xué)習(xí)法、信號處理法以及信息融合法等[3]。其中,統(tǒng)計分析法和機器學(xué)習(xí)法在廢水處理領(lǐng)域應(yīng)用較多。由于造紙廢水處理過程中的生化反應(yīng)機理非常復(fù)雜,而且文獻對該過程的研究起步較晚,專家知識比較缺乏,因而在此情況下基于數(shù)據(jù)驅(qū)動的故障診斷方法更適合于該過程。
隨著工業(yè)監(jiān)控系統(tǒng)需要監(jiān)控的過程變量越來越多,單變量監(jiān)控方法已經(jīng)不能滿足監(jiān)控要求,以主成分分析(Principal Component Analysis, PCA)方法為核心的多變量統(tǒng)計過程監(jiān)控在工業(yè)領(lǐng)域得到了迅速發(fā)展[4]?;赑CA的故障檢測方法通過一組線性變換來捕捉過程變量中變化最大的方向,從而監(jiān)控整個變量空間。紀(jì)洪泉等[5]在采用PCA方法進行田納西化工過程(Tennessee Eastman Process, TEP)故障檢測時發(fā)現(xiàn),雖然該方法可以檢測故障,但由于過程是非線性的,所以魯棒性不理想。判別分析是對未知類別樣品進行歸類的一種方法,可應(yīng)用于工業(yè)過程監(jiān)控的故障診斷。貝葉斯判別分析和費舍爾判別分析在工業(yè)故障診斷中的應(yīng)用已有很多研究,距離判別分析更多應(yīng)用于機電故障診斷中。距離判別分析是基于統(tǒng)計分析的故障診斷方法。在距離判別分析中,距離計算是非常重要的環(huán)節(jié)。黃亮等[6]在對模擬電路進行故障診斷時指出,常見的歐式距離計算雖然簡單,但沒有考慮樣品各分量的差別,而馬氏距離計算考慮了變量參數(shù)的大小以及變量間的相關(guān)性,所以馬氏距離計算不受量綱影響,其性能優(yōu)于傳統(tǒng)的歐式距離計算。針對工業(yè)生產(chǎn)過程的非線性特點,Vapnik提出的基于神經(jīng)網(wǎng)絡(luò)的支持向量機(Support Vector Machine, SVM)機器學(xué)習(xí)算法在工業(yè)故障診斷中表現(xiàn)出更多特有優(yōu)勢[7]。它的機理是尋找一個滿足分類要求的最優(yōu)分類超平面,使得該超平面在保證分類精度的同時,能夠使超平面兩側(cè)的空白區(qū)域最大化[8]。李芳[9]采用SVM方法對TEP過程進行故障診斷,該方法具有針對小樣本的分類精度高且測試時間短的優(yōu)點。SVM屬于黑箱建模方法,不要求確定監(jiān)控對象內(nèi)部機理,比較適合復(fù)雜的廢水處理過程[10]。
針對造紙廢水處理過程的特點,本課題首先采用PCA的監(jiān)測指標(biāo)平方預(yù)測誤差(Square Prediction Error, SPE)和T2統(tǒng)計量對造紙廢水?dāng)?shù)據(jù)進行故障檢測,然后分別采用基于馬氏距離判別分析和基于SVM的分類方法對偏移、漂移和精度下降這3種傳感器故障類型進行故障診斷對比分析。
1方法原理
11基于PCA模型的過程監(jiān)測方法
PCA的主要思想是降維,假設(shè)一組數(shù)據(jù)中有n個樣本,p個向量x1,…,xp構(gòu)成原始矩陣,見式(1):
B=x11…x1p
xn1…xnp(1)
S=1p-1BBΤ(2)
式(2)是式(1)的協(xié)方差矩陣。特征值的大小反映了其對應(yīng)的特征變量所包含的信息大小。將協(xié)方差矩陣的特征值大小按照降序排列,取前k(kX=TPT+E=∑pi=1tipTi+E(3)
基于支持向量機的造紙廢水處理過程故障診斷第33卷第3期第33卷第3期基于支持向量機的造紙廢水處理過程故障診斷式中,ti是得分向量,包含著不同樣本之間的信息關(guān)系;pi是加載向量,包含著不同變量之間的信息關(guān)系;p是獨立變量的個數(shù),E是剩余矩陣。
基于PCA模型的過程監(jiān)測是通過監(jiān)視兩個多元統(tǒng)計量,即Hotelling的T2和殘差子空間的Q統(tǒng)計量,來監(jiān)測生產(chǎn)過程運行狀態(tài)是否正常[11]。p個過程變量x1,…,xp所對應(yīng)的T2統(tǒng)計量定義如式(4):
T2p=tpS-1tTp=∑Kk=1t2pkλk(4)
式中,tp是建模樣本xp所對應(yīng)生成的主成分得分向量;對角矩陣S由X的協(xié)方差矩陣的前k個特征值所構(gòu)成。Q為統(tǒng)計量,也稱為SPE統(tǒng)計量,定義為式(5):
SPE=(xp-p)(xp-p)T(5)
T2統(tǒng)計量的控制限分布采用F分布,計算如式(6)所示:
T2α=k(I-1)I-kFk,I-k,α(6)
式中,k為主成分個數(shù); I為數(shù)據(jù)采樣次數(shù);α為顯著性水平。
SPE統(tǒng)計量的控制限計算公式如式(7)~式(9)所示。
SPEα=gx2h,α(7)
g=v2m(8)
h=2m2v(9)
式中,m是建模數(shù)據(jù)集中所有測量數(shù)據(jù)的SPE統(tǒng)計量的均值;v是對應(yīng)的方差。
12基于馬氏距離判別分析的故障診斷方法
設(shè)XX和YY是從總體G中抽取的樣品,G的均值和協(xié)方差陣分別為μ和V(V>0),定義XX與YY之間的馬氏距離D2(XX,YY)為式(10)[12]:
D2(XX,YY)=(XX-YY)TV-1(XX-YY)(10)
定義XX與總體G之間的馬氏距離D2(XX,G)為式(11):
D2(XX,G)=(XX-μ)TV-1(XX-μ)(11)
設(shè)有兩個總體G1和G2,對于給定的樣品X,判別規(guī)則為:當(dāng)D2(X,G1)≤D2(X,G2)時,判定X∈G1;否則判定X∈G2。
設(shè)有m個總體:G1,G2,…,Gm,其均值和協(xié)方差陣分別為μ1,μ2,…,μm及V1,V2,…,Vm,且所有的Vi>0,馬氏距離計算如式(12)所示:
D2(X,Gi)=(X-Gi)TV-1i(X-Gi), i=1,…,m(12)
若存在某個k使得D2(X,Gk)=min1≤i≤m{D2(X,Gi)}成立,則判別X∈Gk。在故障診斷中,根據(jù)以上的判定規(guī)則來判斷未知類別樣本屬于的總體類別,從而判斷出樣本的故障類別。
13 基于SVM分類的故障診斷方法
核函數(shù)在支持向量機中起著非常關(guān)鍵的作用。本課題采用徑向基(Radial Basis Function, RBF)核函數(shù)實現(xiàn)某一非線性變換后的線性分類,RBF核函數(shù)如式(13)所示[13]:圖1造紙廢水處理過程故障診斷流程圖k(xi,xj)=e-Pxi-xjP2/(2σ2)(13)
式中,σ為核函數(shù)的寬度。給定訓(xùn)練集如式(14):
T={(x1,y1),(x2,y2),…,(xl,yl)}∈(X×Y)l(14)
式中,xi∈X=Rn, yi∈Y={1,-1}, i=1,2,…,l,為樣本編號。尋找X∈Rn上的一個實值函數(shù)g(x),用決策函數(shù)f(x)=sign(g(x))推斷任一模式x對應(yīng)的y值。SVM算法最初是為二值分類問題設(shè)計的,當(dāng)處理多值分類問題時,就需要構(gòu)造合適的多類分類器。在故障診斷中,采用一對多法構(gòu)造分類器,即訓(xùn)練時以此把某個類別的樣本歸為一類,其他剩余的樣本歸為另一類,這樣M個類別的樣本就構(gòu)造出來M個SVM。分類時將未知樣本歸為具有最大分類函數(shù)值的那類。
SVM的參數(shù)優(yōu)化主要是針對懲罰參數(shù)c和核函數(shù)參數(shù)σ進行優(yōu)化,c是確定的特征子空間中調(diào)節(jié)學(xué)習(xí)機器的置信范圍和經(jīng)驗風(fēng)險比例,使學(xué)習(xí)的推廣能力最好。這兩個參數(shù)的取值直接影響SVM分類的好壞。本課題采用網(wǎng)格法進行參數(shù)優(yōu)化。在一定的范圍內(nèi)對c和σ進行取值,對于取定的c和σ,把訓(xùn)練集作為原始數(shù)據(jù),采用交叉驗證法得到在此組c和σ數(shù)值下訓(xùn)練集,驗證分類準(zhǔn)確率,把驗證分類準(zhǔn)確率最高的那組c和σ作為最佳參數(shù)。若有多組c和σ對應(yīng)于最高的分類準(zhǔn)確率,選取能夠達到最高分類準(zhǔn)確率中最小的參數(shù)c和σ作為最佳參數(shù);若對應(yīng)最小的c有多組σ,則選擇第一組c和σ作為最佳參數(shù)。參數(shù)優(yōu)化很大程度上是靠經(jīng)驗調(diào)參數(shù)。
造紙廢水處理過程故障診斷流程圖如圖1所示,該流程包括了數(shù)據(jù)的收集與處理、故障的構(gòu)建、基于PCA的故障檢測、基于馬氏距離判別和SVM的故障診斷。
2仿真實驗與討論
21造紙廢水處理過程數(shù)據(jù)
造紙廢水?dāng)?shù)據(jù)[14]采自廣東東莞的一家造紙廠廢水處理車間,測量數(shù)據(jù)顯示了好氧段廢水的工況,結(jié)果如圖2所示。圖2中的數(shù)據(jù)包含170個樣本點,8個廢水變量,其中左邊縱坐標(biāo)分別代表的是進水化學(xué)需氧量(CODinf)、出水化學(xué)需氧量(CODeff)、進水懸浮固形物(SSinf)、出水懸浮固形物(SSeff);右邊縱坐標(biāo)分別代表的是溶解氧量(DO)、流量(Q)、溫度(T)、pH值,其中,把CODeff和SSeff作為輸出
注左邊縱坐標(biāo)表示CODinf和SSinf及CODeff和SSeff含量;右邊縱坐標(biāo)表示流量Q(104 m3/d)、溫度T(℃)、pH值和DO(mg/L)。
在MATLAB中分析處理170個樣本數(shù)據(jù),將前50個樣本數(shù)據(jù)作為訓(xùn)練集,后120個樣本數(shù)據(jù)作為測試集。
本課題針對自變量CODinf、pH值和因變量SSeff分別構(gòu)建數(shù)據(jù)故障。在樣本編號“51~90”中對CODinf加入均值的20%數(shù)據(jù)故障,在樣本編號“91~130”中對pH值加入時間系數(shù)為005的數(shù)據(jù)故障,在樣本編號“131~170”將SSeff的數(shù)據(jù)修改為平均值30 mg/L,標(biāo)準(zhǔn)差為1的精度下降故障。分別得到偏移、漂移和精度下降3種故障類型。故障大小如表1所示。偏移,漂移和精度下降的3種故障類型數(shù)據(jù)分別如圖3(a)~圖3(c)所示[15]。表13種類型的故障大小
偏移漂移精度下降故障產(chǎn)生公式CODinf(t)+418pH(t)+005tSSeff(t)+(30,12)
22基于PCA的故障檢測
由50個樣本構(gòu)建的PCA模型主成分貢獻率如表2所示,選取3個主成分進行建模,測試集的SPE和T2統(tǒng)計量如圖4和圖5所示。
23基于馬氏距離判別和SVM的故障診斷
本課題構(gòu)建3種故障類型,加上正常工況下的樣本類型一共是4種類型的樣本。3種故障類型共包含了120個樣本,每種故障類型含有40個樣本,正常工況下的樣本為50個。選取部分4種類型樣本作為訓(xùn)練集,剩下來的作為測試集,比如選取樣本編號“1~30”“51~70”“91~110”“131~150”作為訓(xùn)練集,則樣本編號“31~50”“71~90”“111~130”“151~170”為測試集。
將正常工況下的樣本設(shè)定為第1類,偏移故障類型設(shè)定為第2類,漂移故障類型設(shè)定為第3類,精度下降故障類型設(shè)定為第4類。將重構(gòu)數(shù)據(jù)的90個樣本作為訓(xùn)練集,80個樣本作為測試集。用馬氏距離判別分析和SVM兩種方法進行故障診斷,預(yù)測測試集樣本的故障類型。SVM網(wǎng)格法選擇c和σ的參數(shù)范圍為[-10, 10]。測試集樣本分類的仿真結(jié)果如圖6和圖7所示。
圖6馬氏距離判別分析測試集分類圖圖7SVM測試集分類圖測試集樣本編號“1~20”為正常工況下的樣本,應(yīng)該分在第1類;樣本編號“21~40”為偏移故障類型,應(yīng)該分在第2類;樣本編號“41~60”為漂移故障類型,應(yīng)該分在第3類;樣本編號“61~80”為精度下降故障類型,應(yīng)該分在第4類。本課題用誤報率、漏報率和樣本類型分離能力3種指標(biāo)來對比這兩種方法的診斷效果。誤報是指系統(tǒng)沒有出現(xiàn)故障卻被錯誤地檢測出發(fā)生故障,漏報指的是系統(tǒng)發(fā)生了故障卻沒有被檢測出來,樣本類型分離能力是診斷系統(tǒng)對不同樣本類型的區(qū)分能力。表3給出了兩種方法的診斷效果性能對比。從表3可以看出,基于馬氏距離判別分析的故障診斷方法與基于SVM的故障診斷方法漏報率相同,相比于基于馬氏距離判別分析法,基于SVM方法的誤報率較高,但其樣本類型分離能力更好。表3馬氏距離判別分析和SVM的故障診斷性能指標(biāo)%
3結(jié)論
針對造紙廢水處理過程的非線性、時變性等特點,本課題首先對造紙廢水?dāng)?shù)據(jù)構(gòu)建3種故障類型,然后采用主成分分析(PCA)對故障進行檢測,最后分別采用馬氏距離判別分析和支持向量機(SVM)對檢測到的故障進行分類診斷分析。故障診斷結(jié)果表明,SVM的故障診斷能力優(yōu)于馬氏距離判別分析。PCA具有特征提取的特點,SVM對小樣本數(shù)據(jù)具有良好的泛化能力,把這兩種方法結(jié)合起來進行故障診斷,可以取得更好的效果。本課題組下一步將研究基于PCA和SVM的集成故障診斷方法,即首先使用PCA對樣本特征信息進行提取,然后使用SVM進行故障分類。
參考文獻
[1]Huang D P, Qiu Y, Liu Y Q, et al. Review of datadriven fault diagnosis and prognosis for wastewater treatment[J]. Journal of South China University of Technology: Natural Science Edition, 2015, 43(3): 111.
黃道平, 邱禹, 劉乙奇, 等. 面向污水處理的數(shù)據(jù)驅(qū)動故障診斷及預(yù)測方法綜述[J]. 華南理工大學(xué)學(xué)報: 自然科學(xué)版, 2015, 43(3): 111.
[2]Wen C L, Lv F Y, Bao Z J, et al. A review of data drivenbased incipient fault diagnosis[J]. Acta Automatica Sinica, 2016, 42(9): 1285.
文成林, 呂菲亞, 包哲靜, 等. 基于數(shù)據(jù)驅(qū)動的微小故障診斷方法綜述[J]. 自動化學(xué)報, 2016, 42(9): 1285.
[3]Zhou D H, Hu Y Y. Fault diagnosis techniques for dynamic systems[J]. Acta Automatica Sinica, 2009, 35(6): 748.
周東華, 胡艷艷. 動態(tài)系統(tǒng)的故障診斷技術(shù)[J]. 自動化學(xué)報, 2009, 35(6): 748.
[4]Fan J C, Wang Y Q, Qin S Z. Combined indices for ICA and their applications to multivariate process fault diagnosis[J]. Acta Automatica Sinica, 2013, 39(5): 494.
樊繼聰, 王友清, 秦泗釗. 聯(lián)合指標(biāo)獨立成分分析在多變量過程故障診斷中的應(yīng)用[J]. 自動化學(xué)報, 2013, 39(5): 494.
[5]Ji H Q, He X, Zhou D H, et al. Fault detection techniques based on multivariate statistical analysis[J]. Journal of Shanghai Jiao Tong University, 2015, 49(6): 842.
紀(jì)洪泉, 何瀟, 周東華, 等. 基于多元統(tǒng)計分析的故障檢測方法[J]. 上海交通大學(xué)學(xué)報, 2015, 49(6): 842.
[6]Huang L, Hou J J, Liu Y. Fault analysis of hierarchical cluster and fault diagnosis of Mahalanobis distance in analog circuit[J]. Journal of Electronic Measurement and Instrument, 2010, 24(7): 610.
黃亮, 侯建軍, 劉穎. 模擬電路層次聚類故障分析與馬氏距離故障診斷[J]. 電子測量與儀器學(xué)報, 2010, 24(7): 610.
[7]Wan P, Wang H J, Xu X L. Fault diagnosis model based on local tangent space alignment and support vector machine[J]. Chinese Journal of Scientific Instrument, 2012, 33(12): 2789.
萬鵬, 王紅軍, 徐小力. 局部切空間排列和支持向量機的故障診斷模型[J]. 儀器儀表學(xué)報, 2012, 33(12): 2789.
[8]Ding S F, Qi B J, Tan H Y. An overview on theory and algorithm of support vector machines[J]. Journal of University of Electronic Science and Technology of China, 2011, 40(1): 2.
丁世飛, 齊丙娟, 譚紅艷. 支持向量機理論與算法研究綜述[J]. 電子科技大學(xué)學(xué)報, 2011, 40(1): 2.
[9]Li F. Application of support vector machine in TE process[J]. Journal of Anhui University of Technology: Natural Science Edition, 2010, 27(2): 195.
李芳. 支持向量機在TE過程故障診斷中的應(yīng)用[J]. 安徽工業(yè)大學(xué)學(xué)報: 自然科學(xué)版, 2010, 27(2): 195.
[10]Liu B, Wan J Q, Huang M Z, et al. A PCALSSVM model for online prediction of the effluent VFA in an anaerobic wastewater treatment system[J]. Acta Scientiae Circumstantiae, 2015, 35(6): 1768.
劉博, 萬金泉, 黃明智, 等. 基于PCALSSVM的厭氧廢水處理系統(tǒng)出水VFA在線預(yù)測模型[J]. 環(huán)境科學(xué)學(xué)報, 2015, 35(6): 1768.
[11]Qin S J. Survey on datadriven industrial process monitoring and diagnosis[J]. Annual Reviews in Control, 2012, 36(2): 220.
[12]Xie Z H. Statistical analysis and application of MATLAB: analysis of 40 cases[M]. Beijing: Beihang University Press, 2010.
謝中華. MATLAB統(tǒng)計分析與應(yīng)用: 40個案例分析[M]. 北京: 北京航空航天大學(xué)出版社, 2010.
[13]Wang X C. Analysis of 43 cases of MATLAB neural network[M]. Beijing: Beihang University Press, 2013.
王小川. MATLAB神經(jīng)網(wǎng)絡(luò)43個案例分析[M]. 北京: 北京航空航天大學(xué)出版社, 2013.
[14]WANG Yao, XU Liang, YIN Wenzhi, et al. Soft sensor modeling of papermaking wastewater treatment processes based on ANN and LSSVR[J]. Transactions of China Pulp and Paper, 2017, 32(1): 50.
汪瑤, 徐亮, 殷文志, 等. 基于ANN和LSSVR的造紙廢水處理過程軟測量建模[J]. 中國造紙學(xué)報, 2017, 32(1): 50.
[15]WANG Lingsong, MA Pufan, YE Fengying, et al. Incipient Fault Detection in Papermaking Wastewater Treatment Processes[J]. China Pulp & Paper, 2017, 36(8): 20.
王齡松, 馬璞璠, 葉鳳英, 等. 造紙廢水處理過程微小故障檢測方法研究[J]. 中國造紙, 2017, 36(8): 20.