嚴(yán)愛軍, 倪鵬飛, 于遠(yuǎn)航, 王 普,4(1.北京工業(yè)大學(xué)信息學(xué)部自動化學(xué)院,北京 100124; 2.計算智能與智能系統(tǒng)北京市重點實驗室,北京 100124;3.數(shù)字社區(qū)教育部工程研究中心,北京 100124;4.城市軌道交通北京實驗室,北京 100124)
基于CBR和SVR的生化需氧量預(yù)測模型
嚴(yán)愛軍1,2,3, 倪鵬飛1,3, 于遠(yuǎn)航1,3, 王 普1,3,4
(1.北京工業(yè)大學(xué)信息學(xué)部自動化學(xué)院,北京 100124; 2.計算智能與智能系統(tǒng)北京市重點實驗室,北京 100124;3.數(shù)字社區(qū)教育部工程研究中心,北京 100124;4.城市軌道交通北京實驗室,北京 100124)
針對污水處理過程生化需氧量(BOD)濃度難以實時監(jiān)測的問題,建立了一種基于支持向量回歸機(SVR)修正方法的案例推理(CBR)預(yù)測模型。該模型主要包括案例檢索、案例重用、SVR修正、案例存儲等4個部分,其中,SVR修正模型是利用歷史數(shù)據(jù)構(gòu)造修正案例庫,并采用SVR訓(xùn)練而獲得的,可以對傳統(tǒng)CBR求解模型得到的BOD濃度建議值進行修正。實驗表明本文模型的擬合誤差優(yōu)于支持向量機(SVM)、BP神經(jīng)網(wǎng)絡(luò)、RBF神經(jīng)網(wǎng)絡(luò)以及傳統(tǒng)CBR方法,說明SVR修正方法的引入可以改善CBR的回歸性能,提高CBR的學(xué)習(xí)能力。
生化需氧量; 支持向量回歸機; 案例推理; 案例修正
城鎮(zhèn)污水處理過程的主要目標(biāo)是對城市生產(chǎn)、生活污水進行處理,使出水水質(zhì)滿足國家要求。生化需氧量 (Biochemical Oxygen Demand,BOD)是反映水中可降解的有機物含量的參數(shù),是水質(zhì)評價的關(guān)鍵指標(biāo)之一。BOD的測量涉及到一系列復(fù)雜的生化反應(yīng)過程[1],生化需氧量的傳統(tǒng)測量方法經(jīng)過現(xiàn)場采樣、化驗室培養(yǎng),5 d后才能得到測量值,無法實時在線監(jiān)測,給污水處理廠生化需氧量的穩(wěn)定控制帶來極大困難,因此,BOD的實時在線預(yù)測建模具有重要的現(xiàn)實意義。
目前,對BOD濃度進行檢測的主要方法有采樣化驗法[1]、微生物傳感器法[1]及軟測量法[2]。采樣化驗法周期長,無法滿足控制需求,而使用微生物傳感器法的測量儀存在成本高、壽命短的問題,無法廣泛應(yīng)用。軟測量建模方法主要有機理建模[3]、數(shù)據(jù)驅(qū)動建模[4]和混合建模幾種類型[5]。由于污水處理過程具有強非線性、強耦合性、干擾頻繁等復(fù)雜特性[6],導(dǎo)致過程參數(shù)的機理模型難以建立,而采用數(shù)據(jù)驅(qū)動建模方法可以避免這些問題,通過采集影響B(tài)OD的過程參數(shù)實現(xiàn)間接測量[7]。該方法主要有人工神經(jīng)網(wǎng)絡(luò)[8-9]、徑向基函數(shù)(Radial Basis Function,RBF)神經(jīng)網(wǎng)絡(luò)[2]和支持向量回歸機(Support Vector Regression,SVR)等[10]。利用神經(jīng)網(wǎng)絡(luò)建模時,通常有如下問題:神經(jīng)網(wǎng)絡(luò)的訓(xùn)練需要大量的、有足夠代表性的樣本,隱層層數(shù)及節(jié)點數(shù)目的確定依賴經(jīng)驗;模型存在過擬合、泛化能力差的問題;容易陷入局部最小,不能保證全局最優(yōu),因此神經(jīng)網(wǎng)絡(luò)的應(yīng)用具有一定的局限性。SVR建模方法相對于神經(jīng)網(wǎng)絡(luò)而言參數(shù)確定簡單,計算速度快,但缺乏自學(xué)習(xí)的能力,會限制預(yù)測精度的提高。因此,在數(shù)據(jù)驅(qū)動建模方法中,研究一種易于應(yīng)用且具有學(xué)習(xí)能力的軟測量模型很有必要。
人工智能領(lǐng)域新崛起的案例推理(Case-Based Reasoning,CBR)技術(shù)[11]具有獲取知識方便、易于理解、求解效率高和增量式學(xué)習(xí)性能強等特點。本文將CBR和SVR結(jié)合起來建立BOD濃度的預(yù)測模型,在傳統(tǒng)CBR回歸模型基礎(chǔ)上,提出了一種基于SVR修正方法的CBR預(yù)測模型。在案例修正階段利用BOD濃度的歷史數(shù)據(jù)構(gòu)造修正案例庫,并采用SVR訓(xùn)練修正模型,然后,以傳統(tǒng)CBR求解模型為基礎(chǔ)設(shè)計了BOD濃度的預(yù)測模型,通過案例檢索、案例重用、SVR修正得到BOD濃度的修正解,最后通過對比實驗驗證了本文方法的有效性。
1.1 過程描述
污水處理過程包括預(yù)處理、生化處理以及深度處理,流程如圖1所示。其中,生化處理系統(tǒng)中的生化池采用AAO工藝,分為好氧區(qū)、厭氧區(qū)、缺氧區(qū)三部分。污水與回流污泥首先進入?yún)捬醭?污泥中的聚磷菌利用污水中的溶解態(tài)有機物進行厭氧釋磷。在缺氧池中,污泥中的硝化菌利用剩余的有機物和硝酸鹽進行反硝化作用脫氮。最后在好氧池中,污泥中的硝化菌進行硝化作用將污水中的氨氮轉(zhuǎn)化為硝酸鹽,同時聚磷菌進行好氧吸磷,剩余的有機物也被好氧細(xì)菌氧化。生化池會影響污水處理的整體效果。經(jīng)過生化處理后的污水通過接觸池的加氯處理后,一部分水進入中系統(tǒng)進一步進行深度處理或直接從出水口排放,BOD濃度則是通過對接觸池的出水進行水質(zhì)取樣后檢測分析得到的。一般在5 d后得到分析結(jié)果,滯后非常嚴(yán)重,導(dǎo)致操作人員不能及時監(jiān)控出水水質(zhì)。一旦水質(zhì)不達(dá)標(biāo),這種情況可能會長時存在,同時也會制約污水處理過程閉環(huán)控制功能的實現(xiàn)。因此,BOD濃度的實時監(jiān)測非常必要。
圖1 污水處理流程圖
1.2 特征選擇
構(gòu)建BOD濃度的預(yù)測模型之前,需要分析污水處理過程中影響B(tài)OD濃度的特征變量,并剔除冗余變量,同時要考慮這些變量能夠?qū)崟r監(jiān)測。本文采用德爾菲法[12]進行特征選擇。具體步驟是:對現(xiàn)場工藝師及專家的意見進行整理、歸納、統(tǒng)計、反饋,最后得到一致性決策,從所有特征變量中選擇進水流量x1、溶解氧(DO)濃度x2、進口化學(xué)需氧量(COD)濃度x3、出口COD濃度x4、進口固體懸浮物(SS)濃度x5、出口 SS濃度x6、進口氨氮(NH3-N)含量x7、出口NH3-N含量x8、進口pHx9及出口pHx10共10個特征變量。為了表述方便,用y表示BOD濃度,則輸入輸出關(guān)系可表示為
(1)
由于式(1)所表示的輸入輸出關(guān)系具有強非線性,難以建立準(zhǔn)確的機理模型,因此本文選擇基于數(shù)據(jù)驅(qū)動的建模方法進行BOD濃度的預(yù)測建模。
2.1 模型結(jié)構(gòu)與功能
圖2 BOD濃度的CBR預(yù)測模型結(jié)構(gòu)圖
2.2 算法實現(xiàn)
基于SVR修正的CBR預(yù)測算法實現(xiàn)如下:
(1) 構(gòu)建案例庫。將過程變量x1~x10的歷史數(shù)據(jù)經(jīng)過歸一化處理,與相應(yīng)的BOD濃度表示成特征向量形式,形成p條源案例,存儲于案例庫中。記每條源案例為Ck,可表示為如下形式:
(2)
其中:p是源案例的總數(shù);yk是第k條源案例Ck中的BOD濃度值;Xk是第k條源案例的過程數(shù)據(jù),可表示為
(3)
其中,xi,k(i=1,…,10)表示Ck中第i個過程變量的歸一化值。
(2) 過程變量的權(quán)重分配。由于傳統(tǒng)的案例檢索將過程變量x1~x10對BOD濃度的影響視為同等重要,即平均分配x1~x10的權(quán)重,往往會限制預(yù)測精度的提高[14]。本文采用相關(guān)系數(shù)法分配權(quán)重,以反映每個過程變量與BOD濃度之間的相關(guān)程度。首先計算每個過程變量和BOD濃度之間的相關(guān)系數(shù)Ri(i=1,…,10):
(4)
(5)
(3) 案例檢索。將來自于生產(chǎn)現(xiàn)場的過程變量x1~x10的數(shù)值經(jīng)過歸一化處理,并表示成特征向量形式,構(gòu)成一條待求解的目標(biāo)案例T=(X;y),其中X=(x1,…,xi,…,x10),y為待求解的BOD濃度。根據(jù)KNN規(guī)則,計算X與源案例中過程數(shù)據(jù)Xk的相似度sk:
(6)
通過式(6)可以得到p個相似度,按其大小降序排列,取出前K個相似度對應(yīng)的源案例,供案例重用階段使用。
(7)
本文構(gòu)建修正案例庫的思想是:目標(biāo)案例出現(xiàn)后通過案例檢索、案例重用,得到K個相似的源案例,利用這K個相似案例構(gòu)造一個新的案例,然后將新的案例與案例庫中所有源案例的輸入、輸出值分別求差,得到一個修正案例庫,具體描述如下:
(8)
(9)
其中,yk(k=1,2,…,p)和xi,k(i=1,2,…,10;k=1,2,…,p)的意義分別參見式(2)和式(3)。
(10)
經(jīng)過上述計算得到目標(biāo)案例T=(X;y),就可以實現(xiàn)BOD濃度的實時預(yù)測,避免了人工化驗周期長帶來的監(jiān)測不及時的問題。
2.3 算法步驟
綜上所述,BOD濃度的預(yù)測分2個階段:第1個階段是模型參數(shù)以及權(quán)重的計算,第2階段是對BOD濃度值進行實時預(yù)測,算法步驟如下:
階段1:模型參數(shù)計算。
Step1 參數(shù)初始化,包括設(shè)定KNN規(guī)則近鄰個數(shù)K、SVR參數(shù)的設(shè)置等;
Step2 按式(2)和式(3)的案例表示方式組成案例庫;
Step3 按式(5)計算10個過程變量的權(quán)重。
階段2:實時預(yù)測BOD濃度。
Step1 對新出現(xiàn)的過程變量x1~x10的數(shù)值歸一化處理形成目標(biāo)案例;
Step2 按式(6)檢索出K個相似的源案例;
Step4 按式(8)形成新的案例;
Step5 按式(9)構(gòu)造修正案例庫,并訓(xùn)練SVR修正模型;
Step6 計算新案例與目標(biāo)案例中過程變量的差ΔX;
Step 7 利用SVR修正模型得到BOD濃度的修正值Δy;
Step 8 根據(jù)式(10)計算BOD濃度的修正解y,即為當(dāng)前的實時預(yù)測值y;
3.1 實驗設(shè)計
本文中BP表示BP神經(jīng)網(wǎng)絡(luò)算法;RBF表示RBF神經(jīng)網(wǎng)絡(luò);SVM表示支持向量機算法;傳統(tǒng)的均權(quán)重CBR算法記為MCBR;用SVR進行修正的CBR算法記為SCBR。實驗所用的計算機CPU為Inter?Pentium(R)Dual-CoreT4300 @2.10GHz,內(nèi)存為2GB,實驗程序采用MATLAB7.8.0編程實現(xiàn)。為了全面考察方法的效能,采用十折交叉驗證法進行實驗。
各種方法中的參數(shù)設(shè)置如下:SCBR算法中,近鄰數(shù)K取5,SVR的核函數(shù)取線性核函數(shù),懲罰因子取20;SVM算法中,懲罰因子取10,核函數(shù)取高斯徑向基函數(shù);BP算法中,采用3層網(wǎng)絡(luò)結(jié)構(gòu),隱層神經(jīng)元個數(shù)為15,激發(fā)函數(shù)使用Sigmoid型函數(shù),訓(xùn)練函數(shù)選擇Trainrp,訓(xùn)練次數(shù)為1 200,目標(biāo)誤差為10-5,學(xué)習(xí)速率和收斂誤差分別為0.1和0.01;RBF目標(biāo)誤差為0.005,擴展常數(shù)為3,最大神經(jīng)元個數(shù)為50。
為了測試SCBR方法的有效性,首先對算法的魯棒性進行測試,然后將其和BP、RBF、SVM及MCBR進行對比實驗。實驗數(shù)據(jù)選取國內(nèi)某污水處理廠BOD濃度的歷史數(shù)據(jù),樣本量為137。
3.2 魯棒性測試
為考察SCBR方法的魯棒性,進行內(nèi)部參數(shù)攝動和外部干擾攝動的實驗。
內(nèi)部參數(shù)攝動設(shè)定一個數(shù)值δ1=10,以SVR的懲罰因子為中心,以δ1為半徑的鄰域范圍內(nèi)隨機選擇10個點,分別得到擬合誤差,然后求均值。
外部干擾攝動實驗有2個:一是隨機對2個過程變量的權(quán)重進行攝動,設(shè)定攝動值0<δ2<0.01,一個變量加上δ2,另一個變量則減去δ2;二是改變KNN規(guī)則的近鄰K的個數(shù),從1至7,觀察擬合誤差的大小。實驗結(jié)果如表1所示??梢?SCBR的內(nèi)部參數(shù)懲罰因子、外部參數(shù)(過程變量的權(quán)重和近鄰個數(shù)K)發(fā)生攝動后,BOD濃度預(yù)測值的平均擬合誤差分別為5.06%、5.03%、5.01%,與未加攝動時的5.01%相比,波動不大,其中近鄰個數(shù)K變化時對SCBR算法沒有影響。從而說明SCBR算法具有一定的抗擾能力,有較好的魯棒性。
表1 SCBR的平均擬合誤差
3.3 對比實驗
為了進一步驗證SCBR算法在BOD濃度預(yù)測中的效果,與BP、RBF、SVM及MCBR進行了對比實驗,這些方法對BOD濃度的擬合效果如圖3所示。
將這幾種方法的預(yù)測在十折交叉實驗中的輸出結(jié)果示于表2,從平均值可以看出,MCBR的效果與SVM、RBF和BP相差不多,而SCBR的擬合效果明顯提升,說明SVR修正方法具有一定的應(yīng)用優(yōu)勢。
3.4 應(yīng)用實例
基于上述實驗,將本文方法應(yīng)用于國內(nèi)某污水處理廠進行BOD濃度的實時預(yù)測,在操作員站采用FameView組態(tài)軟件開發(fā)了人機界面,如圖4所示,利用VBS腳本語言編制了預(yù)測程序。操作員站通過檢測變送元件、PLC模擬量采集設(shè)備、以太網(wǎng)獲得過程變量x1~x10的數(shù)值后,預(yù)測程序給出BOD濃度的預(yù)測值,并顯示于人機界面。圖4中實線是BOD的人工化驗值(根據(jù)離散點進行了曲線擬合),黑圓點是預(yù)測值??梢?基于SCBR的預(yù)測軟件能夠反映BOD的變化規(guī)律,出水水質(zhì)的實時監(jiān)測可以為污水處理過程的閉環(huán)優(yōu)化控制奠定基礎(chǔ)。
本文采用CBR和SVR方法建立了污水處理過程BOD濃度的預(yù)測模型,通過構(gòu)建案例庫、利用SVR訓(xùn)練修正模型、案例檢索、案例重用可以實時監(jiān)測BOD濃度的變化情況。通過實驗,說明SVR修正模型訓(xùn)練成功后,作為CBR求解的一個環(huán)節(jié),具有較好的求解質(zhì)量,且有一定的魯棒性,在擬合誤差方面具有應(yīng)用優(yōu)越性,實踐應(yīng)用說明這種預(yù)測方法可以代替滯后嚴(yán)重的人工化驗方法,為實現(xiàn)污水處理過程的閉環(huán)優(yōu)化控制打下了基礎(chǔ)。
圖3 BOD濃度的擬合效果
實驗次數(shù)擬合誤差/%SVMBPRBFMCBRSCBR17.87.07.27.34.426.48.37.86.35.038.87.06.310.34.848.65.59.16.75.757.75.84.47.65.765.85.35.56.54.073.19.25.24.02.885.27.46.27.65.498.89.210.611.36.2108.37.813.89.46.2平均值7.17.37.67.75.0
圖4 BOD預(yù)測人機界面圖
SVR的引入雖然實現(xiàn)了案例解的修正并提高了回歸性能,但對SVR參數(shù)的調(diào)整使得傳統(tǒng)CBR在求解時不需要過多調(diào)整參數(shù)的優(yōu)勢有所下降,可以作為進一步研究的方向和重點。
[1]JOUANNEAU S,RECOULES L,DURAND M J,etal.Methods for assessing biochemical oxygen demand (BOD):A review[J].Water Research,2014,49(1):62-82.
[2]HAN H,CHEN Q,QIAO J.An efficient self-organizing RBF neural network for water quality prediction[J].Neural Networks:the Official Journal of the International Neural Network Society,2011,24(7):717-725.
[4]YAN A,SHAO H,WANG P.A soft-sensing method of dissolved oxygen concentration by group genetic case-based reasoning with integrating group decision making[J].Neurocomputing,2015,169(12):422-429.
[5]NOORI R,SAFAVI S,SHAHROKNI S A N.A reduced-order adaptive neuro-fuzzy inference system model as a software sensor for rapid estimation of five-day biochemical oxygen demand[J].Journal of Hydrology,2013,495(15):175-185.
[6]BELCHIOR C A C,RUI A M A,LANDECK J A C.Dissolved oxygen control of the activated sludge wastewater treatment process using stable adaptive fuzzy control[J].Computers and Chemical Engineering,2012,37(2):152-162.
[8]QIAO J,LI W,HAN H.Soft computing of biochemical oxygen demand using an improved T-S fuzzy neural network[J].Chinese Journal of Chemical Engineering,2014,22(11):1254-1259.
[9]HAMED M M,KHALAFALLAH M G,HASSANIEN E A.Prediction of wastewater treatment plant performance using artificial neural networks[J].Environmental Modelling & Software,2004,19(10): 919-928.
[10]NOORI R,YEH H D,ABBASI M,etal.Uncertainty analysis of support vector machine for online prediction of five-day biochemical oxygen demand[J].Journal of Hydrology,2015,527(6):833-843.
[11]AAMODT A,PLAZA E.Case-based reasoning:Foundationalissues,methodological variations,and system approaches[J].AI Communications,1994,7(1):39-59.
[12]GU D X,LIANG C Y,BICHINDARITZ I,etal.A case-based knowledge system for safety evaluation decision making of thermal power plants[J].Knowledge-Based Systems,2012,26(2):185-195.
[13]COVER T M,HART P E.Nearest neighbor pattern classification[J].IEEE Transactions on Information Theory,1967,13(1):21-27.
[14]QI J,HU J,PENG Y.Hybrid weighted mean for CBR adaptation in mechanical design by exploring effective,correlative and adaptative values[J].Computers in Industry,2016,75:58-66.
[15]COSTA C A,LUCIANO M A,LIMA C P,etal.Assessment of a product range model concept to support design reuse using rule based systems and case based reasoning[J].Advanced Engineering Informatics,2012,26(2):292-305.
[16]KAEDI M,GHASEM-AGHAEE N.Improving case-based reasoning in solving optimization problems using Bayesian optimization algorithm[J].Intelligent Data Analysis,2012,16(2):199-210.
[17]FAN Z,LI Y,ZHANG Y.Generating project risk response strategies based on CBR:A case study[J].Expert Systems with Applications,2015,42(6):2870-2883.
[18]PETROVIC S,MISHRA N,SUNDAR S.A novel case-based reasoning approach to radiotherapy planning[J].Expert Systems with Applications,2011,38(9):10759-10769.
[19]YAN A,CHAI T,YU W,etal.Multi-objective evaluation-based hybrid intelligent control optimization for shaft furnace roasting process[J].Control Engineering Practice,2012,20(9) :857-868.
[20]KIM M,LEE S,WOO S,etal.Approximate cost estimating model for river facility construction based on case-based reasoning with genetic algorithms[J].KSCE Journal of Civil Engineering,2012,16(3):283-292.
[21]JIN R Z,CHO K M,HYUN C T,etal.MRA-based revised CBR model for cost prediction in the early stage of construction projects[J].Expert Systems with Applications,2012,39(5):5214-5222.
[22]YAN A,WANG W,ZHANG C,etal.A fault prediction method that uses improved case-based reasoning to continuously predict the status of a shaft furnace[J].Information Sciences,2014,259(2):269-281.
[23]HAN M,CAO Z.An improved case-based reasoning method and its application in endpoint prediction of basic oxygen furnace[J].Neurocomputing,2015,149(PC):1245-1252.
Prediction Model for Biochemical Oxygen Demand Based on CBR and SVR
YAN Ai-jun1,2,3, NI Peng-fei1,3, YU Yuan-hang1,3, WANG Pu1,3,4
(1.School of Automation,Faculty of Information Technology,Beijing University of Technology, Beijing 100124,China; 2.Beijing Key Laboratory of Computational Intelligence & Intelligent System, Beijing 100124,China; 3.Engineering Research Center of Digital Community,Ministry of Education, Beijing 100124,China; 4.Beijing Laboratory for Urban Mass Transit,Beijing 100124,China)
For the problem of monitoring biochemical oxygen demand (BOD) concentration in wastewater treatment process,a case-based reasoning (CBR) prediction model based on support vector regression machine (SVR) is established in this paper.This model is composed of a case retrieval,a case reuse,a SVR revision and a case retention.The SVR revision model is obtained using the SVR training to revise the BOD concentration suggested from the traditional CBR model.The experiment results indicate that the fitting error of this model is lower compared with the support vector machine (SVM),the BP neural network,RBF neural network and the traditional CBR method.The application of SVR can effectively improve the regression performance and the learning ability for a traditional CBR model.
biochemical oxygen demand; support vector regression; case-based reasoning;case revision
1006-3080(2017)02-0227-07
10.14135/j.cnki.1006-3080.2017.02.012
2016-09-05
國家自然科學(xué)基金(61374143);北京市自然科學(xué)基金(4152010)
嚴(yán)愛軍(1970-),男,教授,博士生導(dǎo)師,從事人工智能、過程建模與優(yōu)化控制的研究。E-mail:yanaijun@bjut.edu.cn
TP273
A
: