郭小萍 張玲 李元
基金項目:國家自然科學基金項目(批準號:61673279)資助的課題;2020年遼寧省教育廳科學研究經費項目(批準號:LJ2020021)資助的課題。
作者簡介:郭小萍(1972-),教授,從事基于數據驅動的復雜過程診斷和質量預測的研究,Gxp2001@sina.com。
引用本文:郭小萍,張玲,李元.基于分布式降噪正交自編碼器的工業(yè)過程故障檢測[J].化工自動化及儀表,2023,50(6):000-000.
DOI:10.20030/j.cnki.1000-3932.202306000
摘? 要? 針對基于過程知識進行模塊劃分的方法,存在知識不足造成模塊劃分不準確以及數據中的噪聲導致的過擬合影響到故障檢測率的問題,提出一種變量模塊劃分并采用降噪正交自編碼器建立分布式故障檢測的方法(MBIDOAE)。首先利用互信息和最短距離的層次聚類將相關關系強的過程變量聚類,獲得多個模塊。然后采用降噪正交自編碼器提取各模塊過程變量的非線性特征構建分布式模型,引入隨機噪聲來增強自編碼器的抗噪性并利用正交矩陣降低特征的冗余性。采用T2和SPE統(tǒng)計量作為故障檢測指標,通過對TE過程的仿真,與PCA、AE、MBIPCA和所提MBIDOAE進行對比,驗證了該方法的有效性。
關鍵詞? 互信息? 層次聚類? 分布式建模? 降噪正交自編碼器? 故障檢測? 冗余變量
中圖分類號? TP277? ? ? ? ? ?文獻標志碼? A? ? ? ? ?文章編號? 1000-3932(2023)06-0000-00
當今工業(yè)得到了蓬勃發(fā)展,與此同時現(xiàn)代工業(yè)生產的復雜程度也日益增加,因此故障的類型也會逐漸增多。而故障一旦發(fā)生,輕則影響工業(yè)生產的進程,造成生產效率降低,重則釀成安全事故。及時檢測并定位出現(xiàn)問題的過程和設備,在釀成嚴重事故之前發(fā)出警報,從而使得工業(yè)生產過程中復雜系統(tǒng)的可靠性和安全性得到很大程度的提高,具有很高的應用價值[1,2]。但復雜工業(yè)過程變量眾多且相互間有復雜的關系,過程局部發(fā)生的故障首先會對相關性強的變量有影響。因此,將過程變量劃分模塊,建立分布式故障檢測有助于提高工業(yè)過程的故障檢測率[3]。
主成分分析(PCA)和偏最小二乘法(PLS)
在過程檢測領域得到了成功的應用[4],但是工業(yè)生產過程中的變量并不總是線性的和高斯的,在大多數情況下,變量更多的是呈現(xiàn)出很強的非線性、非高斯,還有可能出現(xiàn)過擬合的情況,某些變量還會出現(xiàn)自相關的特性,此時上述兩種方法的檢測性能都會有所下降[5]。KRAMER M A提出用非線性PCA檢測方法構造一個多層的神經網絡模型[6],但這種網絡訓練困難且泛化能力差。人工神經網絡的出現(xiàn)針對這一問題提供了另一個嶄新并且可行的方法,并且在數學層面上,該方法可以逼近一個任意的非線性函數。1986年自編碼器(Auto-Encoder,AE)的概念被首次提出,并且在處理高維復雜數據的非線性問題上得到了成功應用[7]。YAN W W等提出了一種降噪自編碼器的模型[8],用于工業(yè)過程的故障檢測,提高了模型的魯棒性,在噪聲干擾較多的情況下檢測效果較好。ZHANG Z等針對高斯問題,提出一種基于變分自編碼器的非線性故障檢測方法[9],有效獲取了過程高斯特征信息,提高了故障檢測效果。文獻[10]采用正交自編碼器的方法降低了輸出特征的冗余性。
現(xiàn)代工業(yè)過程中存在許多變量,變量之間的相關性十分復雜,當個別變量發(fā)生改變導致局部故障發(fā)生時,將會存在眾多冗余變量對故障檢測造成干擾的情況。在采用全局建模策略的故障檢測方法時,故障檢測效果會降低。為了減弱冗余變量對檢測的干擾,MACGREGOR J F等于1994年創(chuàng)新性地提出了基于多塊建模策略的故障檢測方法[11],該方法首先將工業(yè)生產過程劃分成幾個模塊,然后對這幾個模塊分別進行故障檢測,最后融合現(xiàn)有的檢測結果,有效地提高了對復雜過程的故障檢測效果。WESTERHUIS J A等于1998年將多塊PCA與PLS兩種方法結合,并做出一定的改進,提出了新的方法[12],首先對現(xiàn)有的變量進行劃分,分成若干子模塊,然后再借助標準PCA與PLS方法對子塊建模。這些方法都是利用機理來劃分子塊,而在實際應用中,無法事先獲得復雜工業(yè)過程的先驗知識,因此上述兩種方法在工業(yè)生產過程中的泛用性并不高。
互信息是一個隨機變量中包含另外一個隨機變量的信息度量[13]。這個測度指標具有很多的優(yōu)點,如無參數、非線性等,目前,它已經在數據分析與建模領域引起了較多的關注[14,15],此外,多變量統(tǒng)計故障檢測領域方面的研究成果和進展,也有很多是通過借鑒互信息來分析處理過程數據的[16,17]。童楚東和史旭華針對多變量故障檢測,提出一種基于互信息PCA的故障檢測方法[18],有效解決定義的相關矩陣局限于計算變量間的線性關系問題,實現(xiàn)了子塊的自動劃分。文獻[19]利用互信息與層次聚類法,有效解決了建模過程的特征選擇問題。
筆者提出一種基于分布降噪正交自編碼器的工業(yè)過程故障檢測方法,首先計算正常訓練數據變量之間的互信息,然后采用最短距離層次聚類進行子模塊劃分。為了避免出現(xiàn)過擬合的情況,通過人為給原始數據添加噪聲來增強自編碼器的抗噪性。此外為了降低模型輸出特征的冗余性,通過對自編碼器算法加入正交矩陣,進而得到正交自編碼器模型,然后建立降噪正交自編碼器分布式檢測模型提取非線性特征。對提取的特征計算統(tǒng)計量T2和SPE,將其作為故障檢測指標,并用核密度估計法求出控制限。通過對TE[20]過程進行仿真,并與PCA、AE、基于多塊信息的主元分析(MBIPCA)和基于分布式降噪正交自編碼器(MBIDOAE)進行對比,驗證了該方法具有更好的故障檢測效果。
1? 基本方法
1.1? 互信息
互信息(Mutual Information,MI)是一種可以從熵的角度定量測量兩個變量相互獨立性的統(tǒng)計技術。MI是探索變量之間高階相關性的有用工具,基于信息論,選取MI來衡量變量之間的相關性。變量x的香農熵表示為:
(1)
其中,p(x)為x的概率密度函數。熵值越高,表示不確定性越強,包含的統(tǒng)計信息越多。
由于變量間存在關聯(lián)性,還需要計算兩變量的聯(lián)合熵,對于變量x1和x2,其聯(lián)合熵的計算式為:
(2)
其中,p(x1,x2)為x1、x2的聯(lián)合概率密度函數。由此,通過下式計算變量x1和x2的互信息:
(3)
展開后可得:
(4)
1.2? 降噪正交自編碼器
AE是一種常用的基于神經網絡的無監(jiān)督特征提取模型算法[21],AE主要是由編碼器φ和解碼器ψ構成。AE試圖學習一種可以以不同方式表示數據的映射函數,因此可以發(fā)現(xiàn)并利用初始數據。作為一種無監(jiān)督學習算法,自編碼器網絡可以被視為3層,即輸入層、隱藏層和輸出層。輸入層和輸出層具有相同數量的節(jié)點,其目的在于最小化輸入和輸出之間的重構誤差。編碼器用于將輸入數據X映射到低維特征空間,而解碼器將低維特征空間中數據h映射為重構后的數據Y。為了增強抗噪性,通過在原自編碼器的結構中,在輸入信息中注入噪聲,再使用含有噪聲的“腐壞”樣本重構無噪聲的“干凈”輸入[22]。這就是降噪自編碼器(Denoising Auto-encoder,DAE)的原理。研究發(fā)現(xiàn)通過對潛在空間施加正交約束能提高學習特征的獨立性,因此又對自編碼器的隱藏層添加約束,進而得到降噪正交自編碼器(DOAE)模型,DOAE網絡結構如圖1所示。
假設具有n個樣本的數據矩陣表示為X=[x1,x2,…,xn]?Rm×n,每個樣本xi維度為m。通過修改自編碼器的損失函數引入正交矩陣Q,進一步得到新的原始數據的主成分XQ并作為新的學習目標,將隱藏層提取的特征解碼對XQ進行擬合。最后模型的優(yōu)化目標即最小化自編碼器輸出值y與原始數據通過正交矩陣Q得到的主成分XQ之間的差值,模型的目標函數如下:
(5)
其中,自編碼器的輸出層為d維,f(xi;W,b)是d(d 由于QTQ=Id?d,目標函數變?yōu)橐韵滦问剑?/p> (6) 由于目標函數非凸,并且Q與其他參數是相乘關系,難以同時計算。在求解的過程中先對Q進行初始化,然后通過反向傳播法優(yōu)化目標函數來得到最優(yōu)的參數W、b: (7) 加入正交性限制后,再對該模型的原始數據加入噪聲來訓練。降噪自編碼器使用加入噪聲的數據訓練DAE網絡以恢復真實輸入,有較好的魯棒性[23]。所以優(yōu)化問題如下: (8) s.t. QTQ=Id?d 其中,為包含噪聲的數據,=xi+,表示加入的高斯噪聲??梢詫⑹剑?)寫成如下形式: (9) s.t. QTQ=Id?d 其中,為包含噪聲的原始數據,F(xiàn)?RN×d是建模數據的潛在特征。 2? 基于MBIDOAE的故障檢測方法 2.1? 基于互信息的分塊策略 筆者采用計算過程變量的互信息并采用凝聚型層次聚類進行子模塊劃分。該策略首先將兩兩變量計算得到的互信息作為一個簇,然后根據最短距離的合并準則逐步使得這些簇成為越來越大的簇,直到所有對象都在一個簇中,或者滿足某個終止條件。 模塊劃分的主要步驟如下: a. 對正常訓練數據矩陣Xnor?Rn×m,計算兩兩屬性之間的互信息,得到互信息矩陣Inor。 b. 將互信息矩陣Inor中的每個屬性看作一個子塊。 c. 將互信息矩陣中包含最大互信息值的兩個子塊根據最短距離的合并準則合并成一個新的子塊,并將子塊之間的互信息值置0。 d. 互信息矩陣有很多個子塊,需要重復步驟c,直到全部子塊合并為一個子塊。 e. 根據子塊合并記錄,合并的子塊是由兩個多變量合并產生,則需要剔除合并中的單變量子塊,直到當前的聚類結果為兩個多變量子塊合并產生。 由此,將變量V劃分為b個子塊,即V=[V1,V2,…,Vb]。 2.2? 構建故障檢測統(tǒng)計量 筆者采用Hotelling T2和SPE統(tǒng)計量來進行故障檢測。在特征子空間,基于潛在特征F,T2統(tǒng)計量的計算方法為: (10) 其中,fi=f(;W,b),ΣF是F的協(xié)方差矩陣。 在殘差子空間,基于輸入的重構誤差,SPE統(tǒng)計量的計算方法為: (11) 由于對神經網絡提取的特征的分布沒有任何先驗知識,因此可以基于核密度估計(Kernel Density Estimation,KDE)來確定T2統(tǒng)計量和SPE統(tǒng)計量的控制極限。采用高斯核函數,則相應的核密度估計可以表示為: (12) 其中,Ti2是fi的T2統(tǒng)計量,h為估計參數,且h>0。 同樣地,可以得到SPE的核密度估計為: (13) 2.3? MBIDOAE的故障檢測算法流程 基于MBIDOAE的故障檢測分為兩部分:離線建模和在線檢測,算法流程如圖2所示。 離線建模的主要步驟為: a. 標準化正常數據后,計算訓練數據矩陣兩兩變量之間的互信息,得到互信息矩陣Inor。 b. 將互信息矩陣Inor中的每個屬性看作一個子塊,計算兩兩間的最小距離,將互信息值最大、距離最小的兩個子塊合并成一個新的子塊,重新計算新的子塊和所有子塊之間的距離,重復此過程直到所有子塊合并成一個子塊,根據2.1節(jié)所述方法得到b個子塊。 c. 為每個子塊的原始數據添加高斯噪聲生成數據。 d. 分別對每個子塊初始化DOAE模型參數和正交矩陣Q。 e. 根據目標函數來訓練模型,優(yōu)化參數W、b。 f. 固定W和b,計算Q。 g. 利用模型提取出的潛在特征計算每個模型中的T2統(tǒng)計量,利用重構的殘差空間計算每個模型SPE統(tǒng)計量。 h. 分別在每個模型里使用核密度估計法求T2和SPE控制限。 在線檢測主要步驟為: a. 對于測試樣本,采用同樣的方法進行標準化處理和分塊處理。 b. 使用訓練好的DOAE模型提取每個子塊的特征和重構殘差空間。 c. 計算每個模型的檢測統(tǒng)計量T2和SPE。 d. 與控制限比較,若超出控制限,則判斷過程發(fā)生了故障,反之則過程正常。 3? TE過程仿真研究 TE過程是一個典型的復雜工業(yè)過程,主要包括5個操作單元:反應器、冷凝器、循環(huán)壓縮機、分離器和汽提塔,筆者選取52個變量用于建模和檢測。TE過程共有21個故障工況,從第161次采樣時間引入故障,用于訓練模型和在線測試,每個數據集包含960個采樣點。 針對正常訓練數據,通過層次聚類將XMEAS(7)、XMEAS(9)、XMEAS(13)、XMEAS(16)4個變量剔除,確定出48個變量的子模塊劃分結果見表1,各子模塊中包含變量數分別為14、29、5個。 采用PCA、AE、MBIPCA和筆者提出的MBIDOAE對故障14進行故障檢測仿真實驗,結果如圖3~5所示,圖中紅線為控制限。該故障是關于反應器冷卻水閥門的黏住問題故障,其與控制變量XMX(10)最相關,這些變量主要分布在子模塊2中。 圖3a是PCA方法檢測結果,其可以檢測出大部分的故障,但SPE的檢測結果優(yōu)于T2,SPE檢測率是0.975 0,T2檢測率是0.898 5。圖3b是AE方法檢測結果,T2檢測率是0.985 0,SPE檢測率是0.988 0。另外,PCA的T2誤報率為0.025 0,SPE的誤報率為0.037 50,AE的T2誤報率為0.012 5,SPE的誤報率為0.006 3,相比于PCA,AE有較好的檢測效果和較低的誤報率。 圖4a~c為MBIPCA方法對3個子塊的檢測結果,子塊1和3基本沒有檢測出故障,子塊2檢測出了故障,說明子塊1和3變量正常,子塊2變量有故障。另外,子塊2的T2統(tǒng)計量檢測率是0.988 8,SPE檢測率是0.998 8,明確出該故障發(fā)生在子塊2。 圖5a~c為MBIDOAE方法對3個子塊的檢測結果,子塊1和3基本沒有檢測出故障,子塊2檢測出了故障,說明子塊1和3變量正常,子塊2變量有故障。另外,子塊2的T2統(tǒng)計量檢測率是1,SPE檢測率是1,其檢測結果優(yōu)于MBIPCA,明確出該故障發(fā)生在子塊2。此外MBIPCA中的子塊2的T2的誤報率為0.025 0,SPE的誤報率為0.012 5,而MBIDOAE的T2、SPE誤報率均為0。進一步說明了MBIDOAE能明確故障發(fā)生的位置并且能檢測出大部分來,同時在誤報率上優(yōu)于前3種算法。 為了進一步驗證筆者所提方法的有效性,表2分別給出了幾種方法對故障1的誤報率和檢測率。故障1是階躍故障,與A、C進料比有關,通過分析得到與其相關性最大的變量為控制變量XMV(4),它是A、B、C進料,屬于子塊2。通過仿真結果比較,表明所提方法有更好的檢測效果以及更低的誤報率。 4? 結束語 提出一種基于分布式降噪正交自編碼器的工業(yè)過程故障檢測方法,用于針對采用過程知識劃分的方法,由于知識不足造成的模塊劃分不準確以及過程數據中有噪聲從而影響故障檢測率的問題。利用互信息和最短距離的層次聚類將相關關系強的過程變量聚類,獲得多個模塊。當訓練過程中包含過多的噪聲時會出現(xiàn)過擬合的情況,因此通過人為給原始數據添加噪聲的方式來除去其中的噪聲冗余。為了降低模型輸出特征的冗余性,通過對自編碼器算法加入正交矩陣,進而得到降噪正交自編碼器模型,然后建立降噪正交自編碼器分布式檢測模型提取非線性特征。對提取的特征計算統(tǒng)計量T2和SPE,將其作為故障檢測指標,并用核密度估計法求出控制限。通過TE過程進行仿真,將PCA、AE、MBIPCA和MBIDOAE進行對比,驗證了MBIDOAE方法具有更好的故障檢測效果。但該算法僅僅考慮檢測過程的局部信息,對于數據之間存在的其他特征信息沒有深究,今后將在該方面進一步研究。 參? 考? 文? 獻 [1] 劉強,卓潔,郎自強,等.數據驅動的工業(yè)過程運行監(jiān)控與自優(yōu)化研究展望[J].自動化學報,2018,44(11):1944-1956. [2] GE Z Q,SONG Z H,GAO F R.Review of recent research on data-based process monitoring[J].Industrial & Engineering Chemistry Research,2013,52(10):3543-3562. [3] PENG X,DING S X,DU W,et al.Distributed process monitoring based on canonical correlation analysis with partly-connected topology[J].Control Engineering Practice,2020,101:104500. [4] 孟生軍,童楚東.基于DPCA-IM的動態(tài)過程監(jiān)測方法[J].計算機應用研究,2021,38(1):175-178. [5] GE Z Q,SONG Z H.Multivariate Statistical Process Control:Process Monitoring Methods and Applications[M].London:Springer Science & Business Media,2012. [6] KRAMER M A.Nonlinear principal component analysis using auto associative neural networks[J].AIChE Journal,1991,37(2):233-243. [7] RUMELHART D E,HINTON G E,WILLIAMS R J.Learning representations by back-propagating errors[J].Nature,1986,323:533-536. [8] YAN W W,GUO P J,LIANG G,et al.Nonlinear and robust statistical process monitoring based on variant auto encoders[J].Chemometrics and Intelligent Laboratory Systems,2016,158:31-40. [9] ZHANG Z,JIANG T,ZHAN C J,et al.Gaussian feature learning based on variational auto-encoder for improving nonlinear process monitoring[J].Journal of Process Control,2019,75:136-155. [10] 來杰,王曉丹,向前,等.自編碼器及其應用綜述[J].通信學報,2021,42(9):218-230. [11] MACGREGOR J F,JAECKLE C,Kiparissides C,et al.Process monitoring and diagnosis by multiblock PLS methods[J].AIChE Journal,1994,40(5):826-838. [12] WESTERHUIS J A,KOURTI T,MACGREGOR J F.Analysis of multiblock and hierarchical PCA and PLS models[J].Journal of Chemometrics:A Journal of the Chemometrics Society,1998,12(5):301-321. [13] LI W.Mutual information functions versus correlation functions[J].Journal of statistical physics,1990,60(5):823-837. [14] KWAK N,CHOI C H.Input feature selection for classification problems[J].IEEE Transactions on Neural Networks,2002,13(1):143-159. [15] HAN M,REN W,LIU X.Joint mutual information-based input variable selection for multivariate time series modeling[J].Engineering Applications of Artificial Intelligence,2015,37:250-257. [16] VERRON S,TIPLICA T,KOBI A.Fault detection and identification with a new feature selection based on mutual information[J].Journal of Process Control,2008,18(5):479-490. [17] JIANG Q,YAN X.Plant-wide process monitoring based on mutual information multi-block principal component analysis[J].ISA Transactions,2014,53(5):1516-1527. [18] 童楚東,史旭華.基于互信息的PCA方法及其在過程監(jiān)測中的應用[J].化工學報,2015,66(10):4101-4106. [19] 李欣倩,楊哲,任佳.基于互信息與層次聚類雙重特征選擇的改進樸素貝葉斯算法[J].測控技術,2022,41(2):36-40;69. [20] DOWNS J J,VOGEL E F.A plant-wide industrial process control problem[J].Computers & Chemical Engineering,1993,17(3):245-255. [21] 薛南,呂柏權,倪陳龍.基于自編碼器和填充函數的深度學習優(yōu)化算法[J].電子測量技術,2019,42(23):79-84. [22] CHUNG J,KASTNER K,DINH L,et al.A recurrent latent variable model for sequential data[J].Advances in Neural Information Processing Systems,2015,28(10):99-100. [23] 景軍鋒,黨永強,蘇澤斌.基于改進SAE網絡的織物疵點檢測算法[J].電子測量與儀器學報,2017,31(8):1321-1329. (收稿日期:2022-12-29,修回日期:2023-07-24)