陳 磊,王培永
(1. 浙江工業(yè)大學(xué) 土木工程學(xué)院,浙江 杭州 310023;2.柯橋排水有限公司,浙江 紹興 312030)
近年來我國城市給水管網(wǎng)系統(tǒng)平均漏損率達到15.3%,部分城市超過25%??刂坡p能夠節(jié)約大量的水資源,提高供水的安全性和可靠性。科學(xué)地預(yù)測管道漏損時間,將為系統(tǒng)的維護和更換提供決策支持,能夠一定程度減少漏損的發(fā)生率,增強系統(tǒng)的安全性。
張宏偉等[1]根據(jù)管網(wǎng)漏損的主要影響因素,采用線性回歸分析法建立模型,但是該方法難以反映漏損影響因素和漏損時間之間復(fù)雜的非線性關(guān)系。覃炫[2]和邵圓媛[3]分析了漏損的主要影響原因,分別采用具有較強非線性映射能力的BP網(wǎng)絡(luò)和改進BP網(wǎng)絡(luò)來預(yù)測管道漏損時間,但是未提出解決網(wǎng)絡(luò)參數(shù)確定和過學(xué)習(xí)等問題的方法?;诮Y(jié)構(gòu)風(fēng)險最小化的LSSVM僅需確定兩個參數(shù),并且具有比神經(jīng)網(wǎng)絡(luò)更強的預(yù)測性能[4-5]。針對傳統(tǒng)基于交叉驗證的LSSVM建模耗時長的不足,筆者提出了采用全局尋優(yōu)能力較強的AGA優(yōu)化LSSVM參數(shù)的建模算法,以獲得更好的建模速度和預(yù)測效果。
眾多因素將對管道漏損產(chǎn)生影響,比如:管材、施工質(zhì)量、管道腐蝕、地面荷載、管徑、管道埋深和管道壓力等,但是考慮太多因素會使模型變得復(fù)雜,并且管材、施工質(zhì)量和管道腐蝕等因素很難量化。因此,主要因素取管頂覆土、管徑、管道壓力和管道所在道路等級。
目標(biāo)函數(shù)為
s.t.yi=wTφ(xi)+b+eii=1,…,N
(1)
式中:μ和ζ為參數(shù);w∈Rnf為權(quán)值;φ(·):Rm→Rnf為映射函數(shù);b為偏置;ei∈R為誤差。
構(gòu)造計算式,即
(2)
式中αi為乘子。
求偏導(dǎo),即
(3)
去掉w和e,得到
(4)
式中:y=[y1,y2…,yN]T;1v=[1,1,…,1]T;α=[α1,α2…,αN]T;I為N×N的單位陣;Ωil=φ(xi)Tφ(xl)=K(xi,xl),i,l=1,2…,N。
求出α和b,則LSSVM為
(5)
因此,LSSVM僅需確定參數(shù)σ和γ,但傳統(tǒng)基于交叉驗證的參數(shù)優(yōu)化方法耗時較長。
引入全局尋優(yōu)能力較強的AGA[6]優(yōu)化參數(shù),具體過程為
1) 編碼。σ,γ的取值范圍[7]為[0.01,50],各取12 位二進制,個體長度為24 位。
2) 選擇。采用輪盤賭法選擇個體。
3) 自適應(yīng)交叉和變異。交叉采用兩點法。對于每對個體,從(0, 1)范圍中隨機產(chǎn)生一個數(shù):若該數(shù)小于交叉率Pc時,每對個體隨機選兩個點,交叉互換后獲得兩個新個體;當(dāng)該數(shù)大于Pc時,則不執(zhí)行交叉。交叉率為
(6)
式中:f′為兩個體適應(yīng)值中的較大值;favg為每代的平均適應(yīng)值;fmax為每代的最大適應(yīng)值。變異采用單點法。對于每個個體,從(0,1)范圍內(nèi)隨機產(chǎn)生一個數(shù),若該數(shù)小于變異率Pm,則在個體中隨機選一位數(shù)變異,將1變成0,或者0變成1;否則不變異。變異率為
(7)
式中f為變異個體的適應(yīng)值。
4) 保留較優(yōu)個體。父代一半數(shù)目的適應(yīng)值較小個體將由子代適應(yīng)值較大個體所替代。
某縣給水干管一般采用球墨鑄鐵管和鋼管,其中球墨鑄鐵管漏損數(shù)據(jù)較齊全,共有數(shù)據(jù)26 組,因此僅針對球墨鑄鐵管進行預(yù)測。
將前21 組數(shù)據(jù)等分成3 份,以每個解碼后的個體為LSSVM的參數(shù),采用3 折交叉驗證計算個體的適應(yīng)值(即在利用2 份數(shù)據(jù)訓(xùn)練LSSVM后,預(yù)測剩下的1 份數(shù)據(jù),選取1 份不同數(shù)據(jù)進行預(yù)測,得到3 次預(yù)測結(jié)果),其計算式為
(8)
式中:yij為第i次預(yù)測中第j組數(shù)據(jù)對應(yīng)的實際漏損時間;Fij為第i次預(yù)測中LSSVM對第j組輸入數(shù)據(jù)的預(yù)測結(jié)果。
建模及預(yù)測的過程如下:
1) 采用歸一化的方法預(yù)處理訓(xùn)練數(shù)據(jù)、預(yù)測的輸入數(shù)據(jù),并且反預(yù)處理預(yù)測結(jié)果。
2) 最大進化代數(shù)Gmax取100,進化代數(shù)G取1。隨機生成并解碼200 個父代個體,得到200 組(σ,γ),根據(jù)式(8)計算各個體的適應(yīng)值。
3) 若G等于Gmax+1,轉(zhuǎn)到步驟5);若否,則判斷G是否等于1:若是,轉(zhuǎn)到步驟4),若否,解碼,計算個體適應(yīng)值,并用100 個子代較優(yōu)個體替代父代較差個體,構(gòu)成新父代。
4) 對父代執(zhí)行選擇、交叉和變異,得到子代,G=G+1,轉(zhuǎn)步驟3)。
5) 以適應(yīng)值最大個體對應(yīng)的參數(shù)為LSSVM模型的最優(yōu)參數(shù),用21 組數(shù)據(jù)訓(xùn)練該模型,模型對26 組數(shù)據(jù)中最后5 組輸入數(shù)據(jù)(需歸一化)進行預(yù)測,反預(yù)處理后,得到實際預(yù)測值。
為了驗證AGA的優(yōu)化能力,在配置為CPU Intel Core2 Duo E7 400 2.8 G,2 G DDR的筆記本上進行10 次測試,該算法每次都能搜索到如圖1所示的最優(yōu)解,搜索到最優(yōu)解的最短時間為412 s,最長時間為465 s,平均時間為433 s。最短時間獲得最優(yōu)解的最大適應(yīng)值和平均適應(yīng)值的變化曲線分別見圖1,2(其他測試的結(jié)果與兩圖類似),計算得到的最優(yōu)個體為(11.417,9.404),基于AGA-LSSVM模型(模型1)的預(yù)測結(jié)果詳見表1。
圖1 最大適應(yīng)值變化曲線Fig.1 Curve of maximum fitness values
表1 兩模型預(yù)測值和實際值的對比Table 1 Comparison of the prediction values and the actual values between two models
由圖1可知:AGA具有較強的全局尋優(yōu)能力,能夠在進化中迅速脫離局部最優(yōu),搜索到更優(yōu)個體,同時也具有較快的收斂速度,在第21代已找到最優(yōu)解。由圖2可知:46 代后種群的平均適應(yīng)值變化很小,表明個體基本不變,種群進化已基本結(jié)束。
圖2 平均適應(yīng)值變化曲線Fig.2 Curve of average fitness values
為了進一步驗證AGA的優(yōu)化性能,將其與網(wǎng)格交叉驗證法進行對比。交叉驗證中,σ和γ的范圍也取[0.01, 50]。網(wǎng)格劃分方法:先對區(qū)間內(nèi)的σ和γ粗劃網(wǎng)格,各取{0.01,0.025,0.05,0.075,0.1,0.25,0.5,0.75,1,1.5,2,2.5,3,…,49,49.5,50},網(wǎng)格點一共有107×107 個,采用3 折交叉驗證計算各點的適應(yīng)值(數(shù)據(jù)和計算方法與AGA優(yōu)化相同),然后以適應(yīng)值最大的網(wǎng)格點為中心細分網(wǎng)格,共得到網(wǎng)格點201×201 個,優(yōu)化后得到最優(yōu)點為(3.17, 4.32),耗時875 s。采用相同的21 組數(shù)據(jù)訓(xùn)練模型后,得到表1所示的基于交叉驗證LSSVM模型(模型2)的預(yù)測結(jié)果。
綜上,無論是對于優(yōu)化時間、單個預(yù)測結(jié)果還是平均預(yù)測結(jié)果,基于AGA-LSSVM模型都全面優(yōu)于基于交叉驗證LSSVM模型。采用傳統(tǒng)的網(wǎng)格交叉驗證法優(yōu)化LSSVM的參數(shù),不僅耗時,而且優(yōu)化結(jié)果很大程度取決于如何劃分網(wǎng)格。而采用全局尋優(yōu)能力較強的AGA優(yōu)化LSSVM的參數(shù),不僅縮短了建模時間,而且獲得更高的預(yù)測精度。
筆者利用AGA優(yōu)化LSSVM參數(shù),建立了基于AGA-LSSVM管道初次漏損時間預(yù)測模型。實例分析結(jié)果驗證AGA具有更強的全局尋優(yōu)能力,能夠迅速找到LSSVM模型的最優(yōu)參數(shù),顯著地提高了建模速度,并且基于最優(yōu)參數(shù)的LSSVM模型通過對訓(xùn)練數(shù)據(jù)的深入學(xué)習(xí),精確掌握了主要影響因素與漏損時間之間的復(fù)雜非線性關(guān)系,能夠?qū)ο嗤懿墓艿赖某醮温p時間進行高精度預(yù)測。