徐寶昌 莊朋 李巨峰 唐智和 欒輝 何為
摘 要 污水生化處理過程是一類強非線性、變量耦合、工況復(fù)雜的過程。由于環(huán)境惡劣,污水生化處理過程傳感器故障頻發(fā),導(dǎo)致傳統(tǒng)基于動態(tài)主元分析的故障檢測方法漏報率較高、檢測率較低。提出了一種基于Kantorovich距離的動態(tài)主元分析故障檢測方法。首先,通過動態(tài)主元分析構(gòu)建增廣矩陣,對多維數(shù)據(jù)進行降維,降低數(shù)據(jù)的自相關(guān)性。其次,通過Kantorovich距離對過程的數(shù)據(jù)進行故障檢測。最后,基于國際水協(xié)會的基準仿真模型BSM1對所提方法進行驗證。結(jié)果表明,所提出的方法相較于傳統(tǒng)的動態(tài)主元分析方法,降低了故障誤報率、提高了檢測率。
關(guān)鍵詞 污水處理 故障診斷 動態(tài)主元分析 Kantorovich距離 BSM1
中圖分類號 TP206+.3? ?文獻標志碼 A? ?文章編號 1000-3932(2023)05-0700-08
污水生化處理過程是一類變量眾多、滯后性強、參數(shù)時變的非線性處理過程。由于所處環(huán)境惡劣,會使得傳感器、風(fēng)機等設(shè)備受到腐蝕而發(fā)生損壞,傳感器漂移、偏置、間歇故障時有發(fā)生,使數(shù)據(jù)的可靠性降低,影響污水處理系統(tǒng)的控制與決策,因此,需要對故障做出及時診斷,保證生化處理過程的有效性。
生化處理過程故障診斷主要分為基于模型的方法、基于知識的方法和基于歷史數(shù)據(jù)的方法。筆者采用的動態(tài)主元分析(Dynamic Principal Component Analysis,DPCA)屬于基于歷史數(shù)據(jù)的統(tǒng)計學(xué)方法,該方法不需要建立準確的數(shù)學(xué)模型和貯備大量的先驗知識[1~6]。
基于DPCA的故障診斷策略是增加原始PCA矩陣中的時滯變量,捕捉過程變量中的自相關(guān)特性,通過最大化投影的方差,將觀測值從大維空間轉(zhuǎn)換到小維線性子空間[7]。MIRIN S N S和WAHAB N A通過多尺度主元分析策略,對污水處理廠數(shù)據(jù)進行多尺度分解,增強故障檢測的準確性[8]。ZHOU J等針對污水反應(yīng)過程中的序批式反應(yīng)器,提出采用多路主元分析來對多變量同時進行診斷[9]。
DPCA故障指標通常使用Hotelling T2和平方預(yù)測誤差(Square Prediction Error,SPE)統(tǒng)計指標,T2指標捕獲潛在子空間中的變化,而SPE指標捕獲模型剩余子空間中的變化,它們在微小偏差下會出現(xiàn)漏報誤報情形[10,11]。使用替代統(tǒng)計指標來加強故障檢測有很大的提升空間。近年來,人們提出了用于尋找兩個概率分布之間距離的KLD(Kullback Divergence)[12~14]和HD(Hellinger Distance)[15]指標來加強故障檢測任務(wù)?;贙antorovich距離(KD)的指標已被用于故障檢測問題[16,17]。KD指標表示將大量數(shù)據(jù)從源分布轉(zhuǎn)移到目標分布的最低成本,可以檢測到小量級的故障,并對噪聲損壞的數(shù)據(jù)提供了良好的監(jiān)控[18~20]。KD度量涉及固定長度的移動窗口中兩個分布之間的逐段比較,這使得KD指標能夠捕獲過程數(shù)據(jù)中的敏感細節(jié),從而增強對微小故障的檢測。
綜上所述,筆者提出了一種DPCA-KD生化處理過程故障檢測方案。通過DPCA對生化處理過程的數(shù)據(jù)進行降維,并劃分為主元子空間和殘差子空間,然后對殘差使用KD指標完成檢測,并且與傳統(tǒng)T2指標和SPE指標進行比較,通過在仿真平臺BSM1上進行實驗證明了所提方法的有效性。
運用SPE進行故障診斷的原則與T2類似。
1.2 Kantorovich距離
Kantorovich距離是由最優(yōu)質(zhì)量傳輸理論進化而來的,在最優(yōu)傳輸問題中,目標是找到相對于給定成本函數(shù)將一種質(zhì)量分布轉(zhuǎn)換為另一種質(zhì)量分布的耗費最優(yōu)的方法。這個概念首先被引入來處理不同的組織和規(guī)劃問題,以最大化利潤或最小化成本。VERSHIK A M描述了連續(xù)時間系統(tǒng)Kantorovich距離的不同變體[22]。Kantorovich距離是一種量化在兩個分布之間重新分配概率質(zhì)量所需的最小成本的度量。Kantorovich距離計算僅基于數(shù)據(jù),因此不受數(shù)據(jù)本身分布的限制[23],也不受獨立同分布隨機變量假設(shè)的限制。
對于兩個相似的分布,兩者的Kantorovich距離非常低或者接近于零,而對于不相似的分布,兩者的Kantorovich距離會非常高,這樣就表明了兩者之間的不同程度[24],而過程檢測問題是通過比較故障數(shù)據(jù)與正常數(shù)據(jù)的差異性,因此,Kantorovich距離可應(yīng)用在故障診斷方面。KD度量是相對于給定成本函數(shù)在兩個概率度量之間定義的距離函數(shù),定義成本函數(shù)的常用方法是基于范數(shù):
RIPPL T提出Kantorovich距離不限于任何特定的分布[26],這使得KD度量可以靈活地應(yīng)用于遵循任何統(tǒng)計分布的數(shù)據(jù)。兩個分布之間的KD度量是使用分段過程計算的。由于比較源分布和目標分布中的各個觀測值是一個耗時的過程,因此兩個分布中的數(shù)據(jù)都被分為多個部分,對Kantorovich距離涉及的數(shù)據(jù)堆疊成段,然后對源分布中的每個片段進行比較,從而提供KD度量的平滑表示。
2 基于DPCA-KD的生化處理過程診斷方法
生化處理過程中出現(xiàn)的故障主要分為兩類:一類是過程故障[27,28],例如污泥膨脹、污泥發(fā)黑、污泥塊狀上浮、氣味異常等;另一類是設(shè)備故障[29~31],主要為傳感器故障和執(zhí)行器故障,例如在長時間惡劣環(huán)境下,傳感器發(fā)生偏置、漂移、間歇故障。文中針對的故障是設(shè)備故障,在生化處理過程傳感器發(fā)生故障時,系統(tǒng)能夠及時準確地判斷出故障的發(fā)生,能夠有更高的故障檢測率和更低的故障誤報率。
筆者將KD指標與DPCA故障檢測策略相結(jié)合,以提高污水生化處理的檢測性能。
在基于歷史數(shù)據(jù)的故障診斷方法中,模型生成的殘差攜帶豐富的信息,必須使用良好的統(tǒng)計工具對其進行評估,才能使用這些信息進行過程監(jiān)控。因此,所提出的方法使用KD指標評估生化處理過程訓(xùn)練殘差和測試數(shù)據(jù)之間的差異。殘差采用以下表達式計算:
其中,μKD為KD的均值,σKD為KD的標準差。
DPCA-KD的步驟分為離線開發(fā)和在線檢測階段。
離線開發(fā)階段的具體步驟如下:
a. 將生化過程正常運行數(shù)據(jù)分成S1、S2兩部分,分別進行零均值和單位方差處理;
b. 計算滯后數(shù),獲得增廣矩陣,形成DPCA;
c. 由式(16)分別計算兩組殘差E1、E2;
d. 設(shè)其中一組為X,分別計算均值μx和協(xié)方差陣Σx;
e. 另外一組設(shè)為Y,應(yīng)用移動窗口數(shù)M,計算均值μy和協(xié)方差陣Σy,對X、Y通過封閉公式分布計算KD值,通過式(17)計算控制限H。
3 實驗
生化處理過程是一個復(fù)雜的非線性過程,含有大量的生物處理過程[32],因此,對其建立準確的模型進行數(shù)據(jù)檢測和狀態(tài)監(jiān)控非常必要。歐洲科學(xué)技術(shù)研究領(lǐng)域合作組織(COST)針對污水處理過程建立了BSM1模型[33],用來仿真真實污水處理廠處理污水的過程。
BSM1采用一種比較簡單常見的布局,將硝化反硝化作用結(jié)合在一起,該工廠設(shè)計處理平均流量為20 000 m3/d,平均可生物降解化學(xué)需氧量COD(Chemical Oxygen Demand)濃度為300 mg/L。該工廠由一個5室生物反應(yīng)器和一個二級沉降器組成。生物反應(yīng)器的前2個隔室不通氣,為缺氧池,硝態(tài)氮通過反硝化轉(zhuǎn)變?yōu)榈獨?,含氮有機物通過氨化作用轉(zhuǎn)化成氨氮,而后3個隔室通氣,為好氧池,氨氮通過自養(yǎng)菌的硝化作用變?yōu)橄鯌B(tài)氮。所有隔間都被認為是完全混合的,二次沉降器被建模為10層,存在內(nèi)回流和外回流兩種回流方式。該裝置的主要目的是通過控制氧傳遞系數(shù)來控制反應(yīng)器最后一個隔室中的溶解氧水平,并通過控制內(nèi)部循環(huán)流量來控制最后一個缺氧池中的硝酸鹽水平,具體如圖1所示。
文中數(shù)據(jù)采樣間隔為15 min,使用兩周的干燥天氣數(shù)據(jù),共計1 344個樣本作為參考數(shù)據(jù)集,T2和SPE的統(tǒng)計控制限的置信度均為95%,保留2個主元,窗口大小設(shè)為70,將數(shù)據(jù)分為測試組和訓(xùn)練組,每組共有14個變量(表1)。
對兩組數(shù)據(jù)用平行分析法計算滯后長度,考慮滯后數(shù)為1構(gòu)建DPCA增廣矩陣,對變量SNH使用故障數(shù)據(jù)引入小的偏差數(shù)據(jù),模擬SNH傳感器發(fā)生故障,分別用DPCA-T2、DPCA-SPE、DPCA-KD檢測故障是否發(fā)生以及誤報率和故障檢測率。
首先在采樣數(shù)130~320、410~600中加入3.5的小偏差,分別用DPCA-SPE、DPCA-T2、DPCA-KD檢測故障,當(dāng)觀測值對應(yīng)的統(tǒng)計量超出所對應(yīng)的控制限時,記為故障,DPCA-SPE、DPCA-T2、DPCA-KD統(tǒng)計量如圖2所示。
從圖2可以看到對于間歇故障,DPCA-SPE可以檢測出部分故障,但是故障遺漏率較高;而對于DPCA-T2,故障檢測率更低,誤報率也更高;當(dāng)采用DPCA-KD故障檢測的時候,故障檢測率大幅提升,誤報率也得到了降低。
對于偏置故障,在采樣數(shù)300時引入3.5的微小偏差,DPCA-SPE、DPCA-T2、DPCA-KD統(tǒng)計量如圖3所示。
從圖3中可以看到,對于微小偏差的偏置故障,DPCA-SPE可以檢測出部分故障,但是存在少量的漏報和誤報;DPCA-T2漏報率和誤報率則比較大;而DPCA-KD在誤報與漏報方面表現(xiàn)遠超過傳統(tǒng)的T2和SPE指標,說明DPCA-KD在偏置故障方面有較好的應(yīng)用效果。
對于漂移故障,在采樣數(shù)200到結(jié)束的時候引入斜率0.03的微小偏差,DPCA-SPE、DPCA-T2、DPCA-KD統(tǒng)計量如圖4所示。
從圖4中可以看到,DPCA-SPE可以檢測到數(shù)據(jù)的漂移,但是在采樣數(shù)500的時候才能完全檢測出漂移,對于采樣數(shù)200~500時仍存在誤報和漏報;而對于DPCA-T2,幾乎沒有檢測出數(shù)據(jù)的漂移,漏報和誤報現(xiàn)象嚴重;而DPCA-KD在采樣數(shù)232時可以檢測出故障,相比于DPCA-T2和DPCA-SPE,DPCA-KD檢測在誤報和漏報方面有很大的提升。
3種方法在生化處理過程的故障檢測誤報率(False Alarm Rate,F(xiàn)AR)見表2。
從表2可以看出,對于3種故障,DPCA-T2和DPCA-SPE都存在誤報率,而DPCA-KD的誤報率大幅降低,在間歇故障與偏置故障中雖然存在誤報率,但也很小,在漂移故障中的誤報率則為0。
3種方法在生化處理過程的故障檢測率(Fault Detection Rate,F(xiàn)DR)見表3。
從表3可以看出,對于污水生化處理過程中最常見的3種故障,DPCA-KD方法的故障檢測率接近100%,顯著高于傳統(tǒng)的DPCA-SPE和DPCA-T2方法。
4 結(jié)束語
提出采用DPCA-KD檢測方法對污水生化處理過程進行故障檢測和診斷,利用KD度量計算訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)殘差之間的差異,并根據(jù)差異做出決策。在沒有故障的情況下,KD值很小,而在故障時,KD值很大。所提出的方法在基準生化處理仿真平臺上進行了驗證,通過對3種傳感器故障進行診斷,結(jié)果顯示相對于傳統(tǒng)的DPCA-T2、DPCA-SPE故障檢測,DPCA-KD在微小偏差情況下能夠更準確地診斷出故障,具有更小的誤報率和更高的故障檢測率,降低了過程動態(tài)特征和數(shù)據(jù)自相關(guān)性對故障檢測的影響。
參 考 文 獻
[1] LI W,PENG M J,WANG Q Z.Fault identification in PCA method during sensor condition monitoring in a nuclear power plant[J].Annals of Nuclear Energy,2018,121:135-145.
[2] KUMAR A,BHATTACHARYA A,F(xiàn)LORES-CERRILLO J.Data-driven process monitoring and fault analysis of reformer units in hydrogen plants: Industrial application and perspectives[J].Computers & Chemical Engineering,2020,136(7):106756.
[3] WEI X,GUO Y.Fault diagnosis of rail vehicle suspension system based on distributed DPCA[C]//The 27th Chinese Control and Decision Conference(2015 CCDC).Piscataway,NJ:IEEE,2015:2758-2763.
[4] SEERA M,LIM C P,LOO C K,et al.A modified fuzzy min-max neural network for data clustering and its application to power quality monitoring[J].Applied Soft Computing,2015,28:19-29.
[5] RODR?魱GUEZ-RAMOS A,DA SILVA NETO A J,LLANES-SANTIAGO O.An approach to fault diagnosis with online detection of novel faults using fuzzy clustering tools[J].Expert Systems with Applications,2018,113:200-212.
[6] JIANG Q,YAN X,HUANG B.Review and perspectives of data-driven distributed monitoring for industrial plant-wide processes[J].Industrial & Engineering Chemistry Research,2019,58(29):12899-12912.
[7] BAKDI A,BOUNOUA W,MEKHILEF S,et al.Nonparametric Kullback-divergence-PCA for intelligent mismatch detection and power quality monitoring in grid-connected rooftop PV[J].Energy,2019,189:116366.
[8] MIRIN S N S,WAHAB N A.Fault detection and monitoring using multiscale principal component analysis at a sewage treatment plant[J].Jurnal Teknologi,2014,70(3):87-92.
[9] ZHOU J,HUANG F,SHEN W,et al.Sub-period division strategies combined with multiway principle component analysis for fault diagnosis on sequence batch reactor of wastewater treatment process in paper mill[J].Process Safety and Environmental Protection,2021,146:9-19.
[10] WANG S,CHEN Y.Sensor validation and reconstruction for building central chilling systems based on principal component analysis[J].Energy Conversion and management,2004,45(5):673-695.
[11] CHEN H,JIANG B,DING S X,et al.Data-driven fault diagnosis for traction systems in high-speed trains:A survey,challenges,and perspectives[J].IEEE Transactions on Intelligent Transportation Systems,2020,23(3):1700-1716.
[12] CHEN H,JIANG B,LU N,et al.Incipient fault detection method using Kullback-Leibler divergence for CRH5 and some remarks[C]//2018 Chinese Automation Congress (CAC).Piscataway,NJ:IEEE,2018:881-885.
[13] ZENG J,KRUGER U,GELUK J,et al.Detecting abnormal situations using the Kullback-Leibler divergence[J].Automatica,2014,50(11):2777-2786.
[14] PONTI M,KITTLER J,RIVA M,et al.A decision cognizant Kullback-Leibler divergence[J].Pattern Recognition,2017,61:470-478.
[15] CHEN H,JIANG B,LU N.A newly robust fault detection and diagnosis method for high-speed trains[J].IEEE Transactions on Intelligent Transportation Systems,2018,20(6):2198-2208.
[16] LI D,MARTNEZ S.High-confidence attack detection via wasserstein-metric computations[J].IEEE Control Systems Letters,2020,5(2):379-384.
[17] ASSA A,PLATANIOTIS K N.Wasserstein-distance-b-ased Gaussian mixture reduction[J].IEEE Signal Processing Letters,2018,25(10):1465-1469.
[18] KAMMAMMETTU S,LI Z.Change point and fault detection using Kantorovich distance[J].Journal of Process Control,2019,80:41-59.
[19] ARIFIN B M S,LI Z,SHAH S L.Change point detection using the Kantorovich distance algorithm[J].IFAC-PapersOnLine,2018,51(18):708-713.
[20] KINI K R,MADAKYARU M.Improved process monitoring strategy using Kantorovich distance-independent component analysis:An application to Tennessee Eastman process[J].IEEE Access,2020,8:205863-205877.
[21] YU D,YU J,SUN F,et al.Research on the PCA-based intelligent fault detection methodology for sewage source heat pump system[J].Procedia Engineering,2017,205:1064-1071.
[22] VERSHIK A M.Kantorovich metric:Initial history and little-known applications[J].Journal of Mathematical Sciences,2006,133:1410-1417.
[23] LIU Z,TIAN W,LIU B,et al.A novel dynamic distance coding identification method for oil-gas gathering and transportation process[J].Engineering Applications of Artificial Intelligence,2023,121:106010.
[24] KAMMAMMETTU S, LI Z.Change point and fault detection using Kantorovich distance[J].Journal of Process Control,2019,80:41-59.
[25] ASUKA T.Wasserstein geometry of Gaussian measures[J].Osaka Journal of Mathematics,2011,48(4):1005-1026.
[26] RIPPL T,MUNK A,STURM A.Limit laws of the empir-ical Wasserstein distance:Gaussian distributions[J].Journal of Multivariate Analysis,2016,151:90-109.
[27] LIU Y Q,RAMIN P,F(xiàn)LORES-ALSINA X,et al.Tran- sfo- rming data into actionable knowledge for fault detection, diagnosis and prognosis in urban wastewater systems with AI techniques:A mini-review[J].Process Safety and Environmental Protection,2023,172:501-512.
[28] GARCIA-ALVAREZ D,F(xiàn)UENTE M J,VEGA P,et al.Fault Detection and Diagnosis using Multivariate Statistical Techniques in a Wastewater Treatment Plant[J].IFAC Proceedings Volumes,2009,42(11):952-957.
[29] 劉乙奇,李艷,孫宗海,等.面向污水處理過程因子分析故障診斷方法的研究[J].控制工程,2015,22(3):447-451.
[30] LI T,WINNEL M,LIN H,et al.A reliable sewage quality? abnormal event monitoring system[J].Water Research,2017,121:248-257.
[31] MCKEE K,F(xiàn)ORBES G,MAZHAR M I,et al.A review of major centrifugal pump failure modes with application to the water supply and sewerage industries[C]//ICOMS Asset Management Conference Proceedings.Asset Management Council,2011.
[32] CHEN W,YAO C,LU X.Optimal design activated slu?鄄 dge process by means of multi?鄄objective optimization:case study in Benchmark Simulation Model 1 (BSM1)[J].Water Science and Technology,2014,69(10):2052-2058.
[33] ALEX J,BETEAU J F,COPP J B,et al.Benchmark for evaluating control strategies in wastewater treatment plants[C]//1999 European Control Conference(ECC).Piscataway,NJ:IEEE,1999:3746-3751.
(收稿日期:2023-03-01,修回日期:2023-08-07)
Fault Diagnosis in the Wastewater Treatment Process
Based on DPCA-KD
XU Bao-chang1, ZHUANG Peng1, LI Ju-feng2, TANG Zhi-he2,? LUAN Hui2, HE Wei2
(1. College of Information Science and Engineering, China University of Petroleum (Beijing);
2. CNPC Safety and Environmental Protection Technology Research Institute)
Abstract? ?The biochemical process of wastewater treatment is a process with strong nonlinearity, variable coupling and complex working conditions. The bad environment, frequent sensor failure in the biochemical process can result in? high false positive rate and false positive rate of the traditional fault detection methods based on dynamic principal component analysis. In this paper, a fault detection method based on Kantorovich
基金項目:中國石油天然氣股份有限公司科學(xué)研究與技術(shù)開發(fā)項目(2022DJ6904)。
作者簡介:徐寶昌(1974-),副教授,從事基于深度神經(jīng)網(wǎng)絡(luò)的復(fù)雜系統(tǒng)建模、油氣集輸過程的智能控制與優(yōu)化、控壓鉆井技術(shù)、鉆井過程智能控制與協(xié)同優(yōu)化的研究,xbcyl@cup.edu.cn。
引用本文:徐寶昌,莊朋,李巨峰,等.基于DPCA-KD的污水處理過程故障診斷[J].化工自動化及儀表,2023,50(5):700-706;719.