庹婧藝,徐冰峰,徐 悅,喻 嵐,王雪穎,郭露遙
(昆明理工大學(xué)建筑工程學(xué)院,昆明650000)
混凝投藥是自來水廠運(yùn)行的關(guān)鍵,投加量直接決定著水廠的出水水質(zhì)和經(jīng)濟(jì)效應(yīng)。在保證出廠水水質(zhì)達(dá)標(biāo)的情況下,實(shí)現(xiàn)投藥量的最佳控制,是凈水行業(yè)現(xiàn)階段的重點(diǎn)[1]。張瑤瑤、劉澤華[2,3]研究發(fā)現(xiàn)因原水濁度對(duì)投藥量的影響大,采用回歸方程模型分析水廠投藥量時(shí),須將樣本分為高濁與低濁兩個(gè)方程分別計(jì)算,其計(jì)算方式冗雜,對(duì)數(shù)據(jù)要求高。李培軍、唐德翠[4,5]等人采用機(jī)理模型模擬投藥工藝,模型只是在一定的特殊條件下建立的,需要對(duì)自來水廠投藥混凝的各影響因子都進(jìn)行解析計(jì)算,其準(zhǔn)確度不是很高。王曉杰、李拓[6,7]等人采用BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)混凝投藥量,網(wǎng)絡(luò)本身收斂速度慢,網(wǎng)絡(luò)規(guī)模小,精度難以提高。研究結(jié)果如表1。
據(jù)表1可知,由于單一神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)自身所具有的約束性,還需其他組合算法來增加模型的全局搜索能力[9]、降低運(yùn)動(dòng)過程的魯棒性、提高預(yù)測(cè)精度[10,11],從而達(dá)到模型目標(biāo)期望值的目的。本文采用PSO 優(yōu)化RBF 建立非線性的高維映射水廠投藥量動(dòng)態(tài)模型,以了解原水?dāng)?shù)據(jù)與投藥量之間的規(guī)律,實(shí)現(xiàn)在不同季節(jié)、不同水廠、不同條件下對(duì)投藥量的動(dòng)態(tài)預(yù)測(cè),盡早發(fā)現(xiàn)水質(zhì)變化趨勢(shì),降低藥耗。
表1 自來水廠常用模擬算法精度對(duì)比
RBF 能將訓(xùn)練樣本點(diǎn)使用核函數(shù)方法(Cover 函數(shù))投射到更高維的空間中,可以近似任意非線性函數(shù),精度較高,能避免陷入局部最優(yōu)[12,13]。
影響混凝沉淀的因素很多,根據(jù)水廠實(shí)地調(diào)研以及前人研究表明,原水指標(biāo)中影響投藥量的主要因素有Q(原水流量)、NTU(濁度)、原水pH、CODMn(耗氧量)、溫度、電導(dǎo)率、藻類等[14,15]??紤]上述影響因素對(duì)混凝投藥的敏感度,本文選取Q、NTU、pH、CODMn四個(gè)指標(biāo)作為輸入值的維度,投藥量作為輸出值的維度[16],建立網(wǎng)絡(luò)結(jié)構(gòu)(如圖1)。
圖1 RBF神經(jīng)網(wǎng)絡(luò)模擬水廠投藥量結(jié)構(gòu)
設(shè)輸入值為Xk,那么投藥量輸出值Y(x)為式(1)。
式中:Xi為基函數(shù)的中心;ωi為輸出單元與中心的連接權(quán)值;φ(Xk,Xi)為基函數(shù)。
本文采用PSO 優(yōu)化RBF 算法,建立水廠投藥量模型(如圖2)。
圖2 創(chuàng)建RBF優(yōu)化組合模型流程圖
PSO 算法中每一個(gè)粒子的位置和速度都由適應(yīng)值f(x)衡量優(yōu)劣。本文將減法聚類算法所得到的中心點(diǎn)作為初始中心點(diǎn)位置,用PSO 算法優(yōu)化更新RBF 網(wǎng)絡(luò)中心點(diǎn)位置。粒子的路徑與速度[17]由式(2)、(3)決定
式中:為粒子i在D維空間中第k次游走的運(yùn)行速度;為粒子i在D維空間中第k次游走后的位置;為粒子i在D維空間k次運(yùn)動(dòng)后的個(gè)體最佳位置為粒子在D維空間第k次運(yùn)動(dòng)后,粒子群體的全局最佳位置;c1、c2為加速常數(shù),取值一般在1.5~2.0之間時(shí),算法效果較好;r1和r2為[0,1]內(nèi)的隨機(jī)數(shù)。
取RBF函數(shù)E(均方誤差)的倒數(shù)作為PSO算法的適應(yīng)度函數(shù)f(x)。采用誤差倒數(shù)E作為函數(shù)的適應(yīng)值,能約束粒子群體運(yùn)動(dòng)軌跡,從而通過誤差反向傳遞動(dòng)態(tài)地調(diào)節(jié)RBF 神經(jīng)網(wǎng)絡(luò)的輸出值。
(1)減法聚類法確定節(jié)點(diǎn)數(shù)N。基函數(shù)中心點(diǎn)個(gè)數(shù)即隱藏節(jié)點(diǎn)數(shù)由減法聚類算法得到[18]。數(shù)據(jù)X(x1n,x2n,x3n,x4n)歸一到單位的D維空間后,按照式(4)計(jì)算每個(gè)訓(xùn)練樣本i處的密度指標(biāo)。
選取初次計(jì)算地密度指標(biāo)最大處δ0=max(δki)的訓(xùn)練樣本點(diǎn),作為減法聚類的第一個(gè)聚類中心,xj為隨機(jī)初次聚類中心點(diǎn)。
根據(jù)式(5),將第k次計(jì)算的密度指標(biāo)δkmax的訓(xùn)練樣本點(diǎn)xkmax作為中心,更新k+1次樣本數(shù)據(jù)的最大值密度指數(shù)。
式中:γa,γb由公式(6)確定。
由式(5)得出第k+1次計(jì)算的密度指數(shù)δk+1,當(dāng)時(shí),循環(huán)結(jié)束。所得到的聚類中心個(gè)數(shù)即為RBF 網(wǎng)絡(luò)基函數(shù)中心個(gè)數(shù)N。式中σ為聚類中心點(diǎn)的鄰域半徑,是約束各個(gè)粒子屬于哪類聚類中心的分類歸屬,一般σ≥0.5[19]。
(2)基函數(shù)計(jì)算標(biāo)準(zhǔn)差σ。廣義RBF 網(wǎng)絡(luò)的基函數(shù)一般采用高斯函數(shù)[19],高斯函數(shù)標(biāo)準(zhǔn)差σ由式(7)確定:
式中:dmax是所選取的各個(gè)聚類中心點(diǎn)之間的最大距離。當(dāng)函數(shù)有多維度時(shí),以兩點(diǎn)之間的范數(shù)代替;N為RBF 網(wǎng)絡(luò)隱層節(jié)點(diǎn)個(gè)數(shù)。
(3)PSO 算法更新RBF 網(wǎng)絡(luò)中心點(diǎn)位置。將減法聚類算法所得到的中心點(diǎn)作為初始中心點(diǎn)位置,據(jù)式(3)式計(jì)算粒子每次運(yùn)動(dòng)位置。據(jù)式(1)求得的輸出值Y,計(jì)算得適應(yīng)度函數(shù)為式(8):
式中:Jk為第k次的實(shí)測(cè)值;Yk為第k次的預(yù)測(cè)輸出值。
以式(8)來約束式(3)的運(yùn)動(dòng)過程,最終求得每個(gè)中心點(diǎn)的位置,得到中心點(diǎn)Xpop(x1N,x2N,x3N,x4N)為N的矩陣。
(4)偽逆法確定RBF 函數(shù)權(quán)值。J=J(xn)為期望輸出,假設(shè)Jij為第i個(gè)輸入向量在第j個(gè)輸出節(jié)點(diǎn)的期望輸出值,ωkj為第k個(gè)隱層節(jié)點(diǎn)到第j個(gè)輸出節(jié)點(diǎn)的權(quán)值,i∈(1,n),j∈(1,n),k∈(1,N)。則權(quán)值矩陣ω可用式(9)求得:
式中:G={gik};矩陣ω=ωkj。
(G)+偽逆矩陣,可由式(10)作奇異值分解(SVD)求取。
式中:gik是第i個(gè)輸入向量在第k個(gè)隱層節(jié)點(diǎn)處的輸出值;Xi為第i個(gè)輸入向量,Xk為第k個(gè)隱層節(jié)點(diǎn)輸入向量。
將求解得的函數(shù)模型中心點(diǎn)位置Xid、標(biāo)準(zhǔn)差σ、隱層節(jié)點(diǎn)個(gè)數(shù)N、函數(shù)權(quán)值ω參數(shù)代入式(2)即可得出優(yōu)化模擬后的函數(shù)式。將訓(xùn)練數(shù)據(jù)輸入初始優(yōu)化函數(shù),得出的輸出值與實(shí)際值進(jìn)行對(duì)比,由PSO的適應(yīng)度f(x),動(dòng)態(tài)地約束調(diào)節(jié)基函數(shù)中心點(diǎn)位置,最終得到誤差最小的擬合參數(shù),得出投藥量輸出矩陣Y=Y(Yn)。
選取昆明某自來水廠[水庫水,8 萬m3/d,混凝劑PAC(聚合氯化鋁)],2018年1月-2020年7月的211 組監(jiān)測(cè)數(shù)據(jù)進(jìn)行隨機(jī)排列,確定90%(191 組)的數(shù)據(jù)作為訓(xùn)練樣本,10%(30 組)的數(shù)據(jù)作為測(cè)試樣本[20]。摘取訓(xùn)練樣本數(shù)據(jù)創(chuàng)建4×191 的輸入矩陣,X(x1n,x2n,x3n,x4n),n=1,2,…,191,創(chuàng)建1×191 的矩陣作為實(shí)際輸出值J矩陣,J=J(xn),n=1,2,…,191。
采用荊州某水廠(水庫水,3 500 m3/d,混凝劑PAC),2020年6-12月50 組原水水質(zhì)監(jiān)測(cè)數(shù)據(jù)的60%(30 組)作為訓(xùn)練樣本,40%(20 組)作為測(cè)試樣本,對(duì)已建立的優(yōu)化模型進(jìn)行自適應(yīng)性檢驗(yàn)。
2.2.1 運(yùn)行結(jié)果
經(jīng)計(jì)算,昆明某水廠的模型中網(wǎng)絡(luò)中心點(diǎn)個(gè)數(shù)N為13,迭代70 次收斂,RBF 函數(shù)的輸出權(quán)值為ωmax=53.25、ωmin=-63.30,鄰域半徑σ=0.58,粒子群加速常數(shù)C1=C2=1.578,將最優(yōu)擬合參數(shù)代入式(2)得出優(yōu)化模擬后的函數(shù)式,計(jì)算出混凝劑投加的模擬值與實(shí)際值MRE為0.056 3。荊州某水廠網(wǎng)絡(luò)中心點(diǎn)個(gè)數(shù)N變?yōu)?1,迭代次數(shù)在20 次就發(fā)生收斂,計(jì)算得到MRE0.043 1,MAE(平均絕對(duì)誤差)0.195 4,REmax0.171 8。如圖3所示,PSO 優(yōu)化RBF 網(wǎng)絡(luò)模型對(duì)兩個(gè)不同的水廠,預(yù)測(cè)運(yùn)行結(jié)果表現(xiàn)力優(yōu)秀,平均相對(duì)誤差都在6%以下,模擬精度較高。
圖3 不同水廠預(yù)測(cè)數(shù)據(jù)與實(shí)測(cè)數(shù)據(jù)運(yùn)行結(jié)果對(duì)比
2.2.2 優(yōu)化模型性能分析
如圖4所示,以昆明某水廠為例,單一RBF神經(jīng)網(wǎng)絡(luò)代次數(shù)在200 次左右才達(dá)到收斂,而PSO 優(yōu)化后的RBF 神經(jīng)網(wǎng)絡(luò)70 次就能收斂。迭代次數(shù)明顯降低,算法模型運(yùn)行速率更快。
圖4 迭代次數(shù)對(duì)比
由圖5可知,單一RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的總體誤差較大,且存在較大波動(dòng),對(duì)實(shí)際擬合能力差。而PSO 優(yōu)化RBF 組合神經(jīng)網(wǎng)絡(luò)模型精度明顯提高,它具有更好的數(shù)據(jù)擬合能力和模型的穩(wěn)健性。
圖5 優(yōu)化后的函數(shù)與單一函數(shù)運(yùn)行結(jié)果對(duì)比
以昆明某水廠為例,由表2比較分析,PSO 優(yōu)化RBF 神經(jīng)網(wǎng)絡(luò)相較于單一RBF 神經(jīng)網(wǎng)絡(luò),對(duì)于水廠混凝投藥量預(yù)測(cè)平均相對(duì)誤差降低了3.05%,最大相對(duì)誤差降低了0.198 6,模擬精度更高,能很好地預(yù)測(cè)水廠投藥量。
表2 優(yōu)化組合的RBF與單一RBF模型運(yùn)行精度對(duì)比
(1)高濁度期和低濁度期數(shù)據(jù)對(duì)PSO 優(yōu)化RBF 神經(jīng)網(wǎng)絡(luò)輸出影響不大,訓(xùn)練參數(shù)時(shí)間順序可不作為模型的約束條件,模型預(yù)測(cè)結(jié)果比回歸方程求解輸出更為精準(zhǔn)。
(2)PSO 優(yōu)化RBF 神經(jīng)網(wǎng)絡(luò)模型減少了對(duì)水廠每個(gè)單元的機(jī)理模擬,可直接通過模型得出投藥與原水水質(zhì)的映射關(guān)系,可適用于不同地理位置的水廠。
(3)粒子間的合作與競(jìng)爭使模型增加對(duì)多維復(fù)雜空間的高維搜索能力,快速得出神經(jīng)網(wǎng)絡(luò)權(quán)值的最優(yōu)解,故優(yōu)化RBF 模型比單一RBF 網(wǎng)絡(luò)具有更高的精度,其魯棒性降低,收斂速度更快,可為模擬自來水廠投藥量提供有效參考?!?/p>