劉 幫,秦 斌,王 欣,朱萬力
(湖南工業(yè)大學(xué) 電氣與信息工程學(xué)院,湖南 株洲 412007)
PSO-LIBSVM在污水水質(zhì)建模中的應(yīng)用
劉 幫,秦 斌,王 欣,朱萬力
(湖南工業(yè)大學(xué) 電氣與信息工程學(xué)院,湖南 株洲 412007)
針對間歇式活性污泥法(SBR)復(fù)雜非線性等問題,常規(guī)神經(jīng)網(wǎng)絡(luò)建立的出水水質(zhì)模型性能精度不高。采用支持向量機(jī)建立生化需氧量(BOD)軟測量模型,并通過粒子群算法彌補(bǔ)支持向量機(jī)模型參數(shù)的不足。仿真結(jié)果表明,相對于BP神經(jīng)網(wǎng)絡(luò)、標(biāo)準(zhǔn)SVM模型,PSO-LIBSVM模型的誤差小、精度高,降低了模型的復(fù)雜度并提高了其泛化能力,能達(dá)到較好的預(yù)測效果
LIBSVM;生化需氧量;支持向量機(jī);粒子群算法
水與人們的生活息息相關(guān),是人類賴以生存的根本。隨著經(jīng)濟(jì)的發(fā)展和城市化進(jìn)程的加快,各種污水的排放量日趨加大,水環(huán)境污染不斷加劇,給人們的身體健康帶來非常嚴(yán)重的影響,造成了生態(tài)環(huán)境的惡化[1]。污水處理廠為治理水環(huán)境污染起到了一定的作用,但由于污水處理系統(tǒng)是一個高度非線性、強(qiáng)耦合、多變量和大滯后的復(fù)雜系統(tǒng),其機(jī)理研究還不夠成熟,關(guān)鍵水質(zhì)參數(shù)不能實(shí)現(xiàn)在線測量,而污水處理效果的好壞依賴于對污水指標(biāo)的精確測量,因此很難實(shí)現(xiàn)系統(tǒng)的閉環(huán)控制。對于一些重要水質(zhì)測量指標(biāo)[2-3],如生化需氧量(biochemical oxygen demand,BOD)濃度,缺少成熟且經(jīng)濟(jì)的在線測量儀器。因此,對關(guān)鍵水質(zhì)參數(shù)進(jìn)行在線測量與優(yōu)化控制變得十分迫切。文獻(xiàn)[4]通過對污水處理工藝的機(jī)理模型進(jìn)行非線性誤差補(bǔ)償分析,建立了基于BP神經(jīng)網(wǎng)絡(luò)的BOD軟測量模型,能夠較準(zhǔn)確地對BOD參數(shù)進(jìn)行估計。文獻(xiàn)[5]采用3層前饋神經(jīng)網(wǎng)絡(luò),設(shè)計了一種軟硬件結(jié)合的水質(zhì)參數(shù)軟測量儀表,能實(shí)現(xiàn)對BOD水質(zhì)參數(shù)的快速檢測。由于神經(jīng)網(wǎng)絡(luò)固有的缺陷,如容易陷入局部極小、推廣能力差等,導(dǎo)致其在實(shí)際應(yīng)用中受到一定的約束。
支持向量機(jī)(support vector machine,SVM)是基于結(jié)構(gòu)風(fēng)險最小化原理,能使在小樣本條件下的模型具有全局最優(yōu)、最大泛化和推廣能力;對于需要同時考慮諸多因素和條件的實(shí)際復(fù)雜問題有較強(qiáng)的適應(yīng)性;相對于神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)性的缺點(diǎn),更能得到廣泛地應(yīng)用。但支持向量機(jī)存在核函數(shù)及其參數(shù)選擇的問題[6]。
本文在現(xiàn)有研究成果的基礎(chǔ)上,設(shè)計了一種粒子群優(yōu)化:LIBSVM參數(shù)的BOD預(yù)測模型,能解決學(xué)習(xí)參數(shù)在一定程度上影響模型泛化能力的問題。通過建模后的仿真結(jié)果表明,該模型具有較好的BOD預(yù)估效果,推廣性較強(qiáng)。
支持向量機(jī)模型的性能取決于選擇合適的核函數(shù)類型、核函數(shù)參數(shù)、懲罰系數(shù)等。因此,為獲得高效的預(yù)測估計模型,需要對這些參數(shù)進(jìn)行合理選擇,確定最優(yōu)參數(shù)。
粒子群優(yōu)化算法(particle swarm optimization,PSO)[8]是一種基于群體協(xié)作的隨機(jī)搜索算法,通過群體中個體間的合作與信息共享來指導(dǎo)完成尋優(yōu)。PSO算法具有編程方便,結(jié)構(gòu)簡單,易于實(shí)現(xiàn),搜索速度快,收斂能力強(qiáng)等特點(diǎn),通常被用于在復(fù)雜環(huán)境中求解最優(yōu)問題。PSO算法求解最優(yōu)問題時,將每一只飛行的鳥都當(dāng)作優(yōu)化問題的一個潛在解,食物
3.1 建模過程
由于徑向基核函數(shù)(radial basis function,RBF)學(xué)習(xí)效果好,模型精度高。因此,本文采用RBF作為LIBSVM的核函數(shù),其表達(dá)式為
PSO-LIBSVM 預(yù)測模型的算法步驟如下:
式中d為搜索空間的維數(shù)。
Step2 根據(jù)目標(biāo)函數(shù)計算所有粒子的適應(yīng)度值,本文以SVM訓(xùn)練樣本得到的模型作為適應(yīng)度值。
Step3 將適應(yīng)度值與每個粒子經(jīng)歷過的最好位置進(jìn)行比較,如果更好,則全局最優(yōu)位置Pg被當(dāng)前粒子的最優(yōu)位置所替代。
Step4 對每個粒子當(dāng)前的個體位置Pi與全局位置Pg進(jìn)行比較,如果更好,更新Pg。
Step5 按照式(7)和(8)更新粒子當(dāng)前的速度和位置。
Step6 判斷算法是否滿足終止條件(目標(biāo)函數(shù)誤差達(dá)到預(yù)先設(shè)定的收斂精度,或者算法的循環(huán)次數(shù)達(dá)到用戶設(shè)定的最大迭代次數(shù))。若不滿足,則返回Step2繼續(xù)尋優(yōu);反之,轉(zhuǎn)到Step7。
Step7 輸出最優(yōu)解C, σ并代入 SVM模型,重新訓(xùn)練學(xué)習(xí),得到較優(yōu)的 SVM 預(yù)測模型。
根據(jù)上文描述的算法對BOD進(jìn)行建模。通過對污水處理工藝及影響污水處理效果的因素進(jìn)行分析,結(jié)合現(xiàn)場操作人員的建議,概括出12個過程參數(shù)作為模型的輸入變量,主要包括:生化需氧量、曝氣池酸堿度、曝氣池溶解氧溶度、化學(xué)需氧量、總氮、氨氮、總磷、懸浮固體濃度、混合液固體濃度、氧化還原電位、進(jìn)水水量、溫度,出水BOD質(zhì)量濃度作為模型輸出。由于各變量有不同的工程單位,并且各變量的數(shù)量級不同,如果直接采用原始數(shù)據(jù)計算,會降低算法的精度并造成計算的不穩(wěn)定。因此,采用歸一化方法對數(shù)據(jù)進(jìn)行預(yù)處理。選取污水處理廠提供150組歷史數(shù)據(jù),對數(shù)據(jù)樣本進(jìn)行預(yù)處理,隨機(jī)劃分100組學(xué)習(xí)樣本和50組檢測樣本,建立基于PSO-LIBSVM生化需氧量的預(yù)估模型
3.2 仿真參數(shù)設(shè)置及結(jié)果
參數(shù)的設(shè)置分為2部分。第一部分是支持向量機(jī)參數(shù)設(shè)置:RBF核參數(shù)∈(0.1,1.5);懲罰系數(shù)C∈(0.01,700)。第二部分為PSO算法參數(shù)設(shè)置:粒子維度(,C) ,代表解空間為二維;最大迭代次數(shù)為50;種群數(shù)量為10;取c1=1.7,c2=1.5 ;慣性權(quán)值wmax=0.9,wmin=0.1。經(jīng)過PSO尋優(yōu)后的最佳參數(shù)為C=3.927 3,=2.236 1。
以平均相對誤差和均方根誤來評價模型性能的優(yōu)劣,其表達(dá)式為
式(12)~(13)中:i為樣本數(shù);
yi為BOD的實(shí)際值;
為了作進(jìn)一步比較,分別采用BP神經(jīng)網(wǎng)絡(luò)和標(biāo)準(zhǔn)SVM算法對BOD進(jìn)行建模仿真。其中標(biāo)準(zhǔn)SVM采用的是RBF核函數(shù);C,σ分別取值1和1.29;BP網(wǎng)絡(luò)的參數(shù)為:輸入神經(jīng)元數(shù)為12,輸出神經(jīng)元數(shù)為1,隱層神經(jīng)元數(shù)為13,訓(xùn)練函數(shù)取traingdx函數(shù)。
對應(yīng)的仿真結(jié)果如圖1~3,3種模型的預(yù)測性能見表1。
圖1 PSO-LIBSVM模型預(yù)測輸出Fig. 1 The PSO-LIBSVM model prediction output
圖2 標(biāo)準(zhǔn)SVM預(yù)測輸出Fig. 2 The standard SVM prediction output
圖3 BP神經(jīng)網(wǎng)絡(luò)預(yù)測輸出Fig. 3 The BPNN prediction output
表1 PSO-LIBSVM與標(biāo)準(zhǔn)SVM、BP網(wǎng)絡(luò)預(yù)測性能比較Table 1 The prediction performance of PSO-LIBSVM compared with standard SVM and BPNN
通過分析圖1~3和表1可知,在擬合精度方面,PSO-LIBSVM的平均相對誤差和均方根誤差最小,分別為0.046 4和0.033 0;標(biāo)準(zhǔn)SVM次之,BP神經(jīng)網(wǎng)絡(luò)的誤差最大,因此PSO-LIBSVM擬合精度最高。在泛化性能方面,由于BP神經(jīng)網(wǎng)絡(luò)是基于經(jīng)驗(yàn)風(fēng)險最小化的結(jié)構(gòu),其泛化能力不及標(biāo)準(zhǔn)SVM和PSO-LIBSVM;而支持向量機(jī)的泛化性在一定程度上依賴其參數(shù)的選取,經(jīng)過PSO優(yōu)化過的LIBSVM比標(biāo)準(zhǔn)SVM使用了較少的支持向量,增強(qiáng)了支持向量機(jī)解的稀疏型,降低了模型的復(fù)雜度,因此PSO-LIBSVM泛化性最強(qiáng)。
本文以為Matlab 2013a和Libsvm 3.1工具箱為平臺,把粒子群算法和支持向量回歸機(jī)相結(jié)合,建立了出水BOD的PSO-LIBSVM預(yù)測模型,并且與標(biāo)準(zhǔn)SVM模型、BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測效果進(jìn)行了對比,從平均相對誤差、均方根誤差等幾個性能指標(biāo)進(jìn)行了分析。結(jié)果表明,本文提出的模型預(yù)估效果最好,泛化性能最強(qiáng),更符合實(shí)際問題的需求。
[1] 劉海云,張玉華,孫維鋒. 鶴崗市城市污水處理發(fā)展現(xiàn)狀及對策探討[J]. 環(huán)境科學(xué)與管理,2007,32(7):27-29. Liu Haiyun,Zhang Yuhua,Sun Weifeng. The Dirty Water in City in Hegang City in Crane Handles Development Present Condition and Counterplan Study[J]. Environmental Science and Management,2007,32(7) :27-29.
[2] 徐方舟. 污水處理控制系統(tǒng)設(shè)計及其軟測量的研究[D].無錫:江南大學(xué),2011. Xu Fangzhou. Design of Wastewater Treatment Control System and Research of Soft Sensing Technique[D]. Wuxi Jiangnan University,2011.
[3] 羅騰飛. 基于改進(jìn)BP神經(jīng)網(wǎng)絡(luò)的污水處理出水指標(biāo)預(yù)測[D]. 呼和浩特:內(nèi)蒙古農(nóng)業(yè)大學(xué),2012. Luo Tengfei. Predictive Indicators of Water in Waste Water Treatment Based on Improved BP Artificial Neural Network [D]. Hohhot:Inner Mongolia agricultural University,2012.
[4] 王小藝,劉載文,蘇 震. 基于神經(jīng)網(wǎng)絡(luò)的污水BOD軟測量補(bǔ)償方法研究[J]. 系統(tǒng)仿真學(xué)報,2009,21(增刊2):83-85. Wang Xiaoyi,Liu Zaiwen,Su Zhen. Research on BOD Soft-Sensing Compensation Method Based on Neural Network [J]. Journal of System Simulation,2009,21(S2):83-85.
[5] 喬俊飛,郭 楠,韓紅桂. 基于神經(jīng)網(wǎng)絡(luò)的BOD參數(shù)軟測量儀表的設(shè)計[J]. 計算機(jī)與應(yīng)用化學(xué),2013,30(10):1219-1222. Qiao Junfei,Guo Nan,Han Honggui. Design of SoftMeasurement Instrument for BOD Parameters Based on Neural Network[J]. Computers and Applied Chemistry,2013,30(10):1219-1222.
[6] 付元元,任 東. 支持向量機(jī)中核函數(shù)及其參數(shù)選擇研究[J]. 科技創(chuàng)新導(dǎo)報,2010 (9) :6-7. Fu Yuanyuan,Ren Dong. Study on the Kernel Function and Its Parameter Selection of SVM[J]. Science and Technology Innovation Herald,2010 (9) :6-7.
[7] 周 威,金以慧. 利用模糊次梯度算法求解拉格朗日松弛對偶問題[J]. 控制與決策,2004,19(11) :1213-1217. Zhou Wei,Jin Yihui. Fuzzy Subgradient Algorithm for Solving Lagrangian Relaxation Dual Problem[J]. Control and Decision,2004,19(11) :1213-1217.
[8] 董 芳. 粒子群算法研究及其在動態(tài)優(yōu)化中的應(yīng)用[D].杭州:浙江大學(xué),2014. Dong Fang. Researches on Particle Swarm Optimizer and Its Applications in Dynamic Optimization[D]. Hangzhou:Zhejiang University,2014.
[9]馮輝宗,彭 丹,袁榮棣. 基于PSO-SVM的發(fā)動機(jī)故障診斷研究[J]. 計算機(jī)測量與控制,2014,22(2) :355-357. Feng Huizong,Peng Dan,Yuan Rongdi. Research on Automobile Engine Fault Diagnosis Based on PSO-SVM [J]. Computer Measurement & Control,2014,22(2) :355-357.
(責(zé)任編輯:鄧光輝)
Application of PSO-LIBSVM in Modeling of Sewage Water Quality
Liu Bang,Qin Bin,Wang Xin,Zhu Wanli
(School of Electrical and Information Engineering,Hunan University of Technology,Zhuzhou Hunan 412007,China)
Aiming at complex nonlinear problems in an sequencing batch type activated sludge process (SBR) and poor precision of sewage water quality model established by conventional neural network, applies an support vector machine to set up BOD soft measurement model, and improves the SVM parameter through particle swarm optimization. The simulation results show that compared with the BP neural network and standard SVM model, the PSO-LIBSVM has small error and high precision. It decreases the model complexity, improves its generalization ability, and achieves good prediction effect.
LIBSVM;biochemical oxygen demand;support vector machine;particle swarm optimization
X703
A
1673-9833(2015)02-0089-05
10.3969/j.issn.1673-9833.2015.02.017
2015-02-03
國家自然科學(xué)基金資助項目(61074067,21106036),湖南省科技計劃基金重點(diǎn)資助項目(2014FJ2018),湖南省自然科學(xué)基金資助項目(13JJ3110)
劉 幫(1988-),男,湖南岳陽人,湖南工業(yè)大學(xué)碩士生,主要研究方向?yàn)閺?fù)雜過程建模,集成優(yōu)化控制,E-mail:476694465@qq.com