辛珂 李文竹 劉心
摘要:準(zhǔn)確的短期用水預(yù)測(cè)是優(yōu)化供水系統(tǒng)的基礎(chǔ),對(duì)城市水資源實(shí)時(shí)調(diào)度和城市供水系統(tǒng)調(diào)度有著重要意義。為了克服傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型訓(xùn)練時(shí)間長(zhǎng)、易于陷入局部最優(yōu)的預(yù)測(cè)結(jié)果,且在少量數(shù)據(jù)樣本情況下預(yù)測(cè)精確度不足的缺點(diǎn),本文提出了一種基于遺傳算法一極限學(xué)習(xí)機(jī)的城市短期用水預(yù)測(cè)方法。在引入相關(guān)影響因素的基礎(chǔ)上,用擅長(zhǎng)全局搜索和并行搜索的遺傳算法對(duì)極限學(xué)習(xí)機(jī)參數(shù)進(jìn)行尋優(yōu)。結(jié)果表明,本模型的預(yù)測(cè)精度較高,日均絕對(duì)百分比誤差僅為2.19%,具有較強(qiáng)的實(shí)用價(jià)值,為未來(lái)水資源實(shí)時(shí)調(diào)度提供理論依據(jù)。
關(guān)鍵詞:遺傳算法;極限學(xué)習(xí)機(jī);短期用水量;預(yù)測(cè)模型
中圖分類號(hào):TV213 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2020)13-0217-04
1引言
水利是國(guó)民經(jīng)濟(jì)和社會(huì)發(fā)展所必需的基本要素,為社會(huì)的發(fā)展、糧食和生態(tài)環(huán)境安全提供重要保障。隨著人口不斷向大中型城市遷移,各城市對(duì)于水資源的需求量也大幅度增加。城市供水系統(tǒng)的自動(dòng)化運(yùn)營(yíng)是未來(lái)的一種發(fā)展趨勢(shì),而用水量預(yù)測(cè)在整體城市供水系統(tǒng)的設(shè)計(jì)、規(guī)劃、管理和運(yùn)行中起著重要的作用,是供水策略、運(yùn)行調(diào)度、優(yōu)化設(shè)計(jì)的關(guān)鍵性參考。因此,國(guó)內(nèi)外有大量的研究試圖準(zhǔn)確可靠的預(yù)測(cè)城市用水量,并提出了多種預(yù)測(cè)方法,如:回歸模型、人工神經(jīng)網(wǎng)絡(luò)與差分整合移動(dòng)平均回歸結(jié)合模型、時(shí)間序列、BP神經(jīng)網(wǎng)絡(luò)模型等。早期Braun根據(jù)柏林某個(gè)居民區(qū)的歷史用水?dāng)?shù)據(jù),提出了結(jié)合自回歸方法和考慮附加參數(shù)的回歸模型和基于季節(jié)自回歸綜合移動(dòng)平均(SARIMA)模型的建模方法;楊曉俊利用時(shí)間序列分析中的移動(dòng)平均模型和指數(shù)平滑模型;對(duì)柳林泉的還原泉流量進(jìn)行了較為準(zhǔn)確的預(yù)測(cè);牟天蔚嘲提出一種基于深度學(xué)習(xí)框架的小波深度信念網(wǎng)絡(luò)fsw—DBN)時(shí)間序列模型,對(duì)新開(kāi)河日供水量進(jìn)行較為精確的預(yù)測(cè);鞠佳偉選擇了影響因素明確、計(jì)算簡(jiǎn)單、可隨時(shí)修正參數(shù)的多元線性回歸預(yù)測(cè)方法,建立了預(yù)測(cè)結(jié)果相對(duì)誤差較低的日供水量預(yù)測(cè)模型;郭強(qiáng)用貝葉斯準(zhǔn)則優(yōu)化了傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,避免了傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)再預(yù)測(cè)時(shí)易陷入局部極小化和收斂速度慢的問(wèn)題。
隨著智能算法理論的發(fā)展,神經(jīng)網(wǎng)絡(luò)理論在水量預(yù)測(cè)領(lǐng)域得到了創(chuàng)新發(fā)展和應(yīng)用,但傳統(tǒng)的智能算法如BP神經(jīng)網(wǎng)絡(luò)存在著極易得出局部最優(yōu)解以及收斂速度較慢的不足;人工神經(jīng)網(wǎng)絡(luò)(ANN)神經(jīng)網(wǎng)絡(luò)魯棒性不高,預(yù)測(cè)模型缺乏長(zhǎng)效性和擴(kuò)展能力等?;诖?,提出通過(guò)遺傳算法(GA)優(yōu)化極限學(xué)習(xí)機(jī)(ELM)的短期用水量預(yù)測(cè)模型(GA-ELM預(yù)測(cè)模型)。該方法通過(guò)GA對(duì)ELM模型的初始連接權(quán)值和隱含層神經(jīng)元閾值進(jìn)行優(yōu)化,與其他傳統(tǒng)的智能算法相比,具有更快的學(xué)習(xí)速度,更好的泛化性能,并且ELM模型自身也有較強(qiáng)的魯棒性。最后通過(guò)北京市城區(qū)自來(lái)水水廠數(shù)據(jù)進(jìn)行算例仿真并與傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型及傳統(tǒng)ELM模型進(jìn)行比較,驗(yàn)證所提出的短期用水量預(yù)測(cè)結(jié)果的準(zhǔn)確性。
2城市日用水量主要影響因素分析
2.1城市日用水量的影響因素
城市用水量通常包括生活用水、公共用水以及工業(yè)用水。而對(duì)于城市日用水量與時(shí)間、溫度、氣溫、節(jié)假日等影響因素密切相關(guān),具有復(fù)雜性、非線性、時(shí)變性的特點(diǎn),主要表現(xiàn)為:
(1)氣溫變化會(huì)導(dǎo)致城市內(nèi)居民用水量變化。在溫度較高條件下,居民生活方式可能會(huì)發(fā)生改變,例如飲用水量以及清洗用水量會(huì)提升,導(dǎo)致生活用水量可能會(huì)呈上升趨勢(shì)。
(2)天氣的變化會(huì)影響居民的生活方式及生活行為,導(dǎo)致用水量發(fā)生相應(yīng)的改變,同樣也會(huì)對(duì)城市綠化用水、道路灑水和水庫(kù)蓄水產(chǎn)生影響。
(3)節(jié)假日因素,在節(jié)假日居民在室內(nèi)活動(dòng)的時(shí)間會(huì)比在工作日時(shí)間長(zhǎng),因而居民生活用水會(huì)有增幅,同時(shí)企業(yè)用水可能會(huì)下降。若無(wú)法定假日,可將每周內(nèi)的用水量視為周期性變化。
綜上,城市日用水量應(yīng)存在以每日為單位的短期周期性變化以及以年為單位的長(zhǎng)期周期性變化。因此,本文著重研究氣溫、天氣及節(jié)假日與城市日用水量之間的關(guān)系。
2.2主要影響因素篩選
3基于GA-ELM的短期用水量預(yù)測(cè)模型
極限學(xué)習(xí)機(jī)神經(jīng)網(wǎng)絡(luò)具有預(yù)測(cè)精度高、訓(xùn)練速度快的特點(diǎn),但由于極限學(xué)習(xí)機(jī)模型中網(wǎng)絡(luò)結(jié)構(gòu)的輸入層神經(jīng)元與隱含層神經(jīng)元之間的連接權(quán)值和隱含層神經(jīng)元閾值是隨機(jī)賦值的,這會(huì)導(dǎo)致當(dāng)給定連接權(quán)值定值為0時(shí)隱含層節(jié)點(diǎn)失效。而隱含層神經(jīng)元的節(jié)點(diǎn)數(shù)量過(guò)低會(huì)降低預(yù)測(cè)結(jié)果的預(yù)測(cè)精度,過(guò)多則會(huì)出現(xiàn)過(guò)擬合現(xiàn)象?;诖吮疚倪x用尋優(yōu)效果顯著的遺傳算法對(duì)極限學(xué)習(xí)機(jī)神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值進(jìn)行最優(yōu)篩選,得出GA-ELM預(yù)測(cè)模型。
3.1 ELM神經(jīng)網(wǎng)絡(luò)原理
3.2 GA改進(jìn)ELM算法步驟
由3.1中敘述的模型可知,ELM算法模型的初始輸入層與隱含層的連接權(quán)值和閾值是隨機(jī)產(chǎn)生的,這就會(huì)造成某些時(shí)候ELM算法輸出矩陣H不是滿列秩,使得模型中某些隱含層節(jié)點(diǎn)無(wú)效,這樣就可能會(huì)降低ELM預(yù)測(cè)算法模型的有效性和準(zhǔn)確性。針對(duì)這一問(wèn)題,在計(jì)算輸出權(quán)重之前,對(duì)輸入權(quán)重和閾值進(jìn)行基于遺傳算法的篩選,遺傳算法(GA)是一種模擬生物種群遺傳變異進(jìn)化過(guò)程的一種自適應(yīng)搜索技術(shù),根據(jù)適者生存、優(yōu)勝劣汰的自然法則,將所需求解的問(wèn)題轉(zhuǎn)為生物種群進(jìn)化的過(guò)程,過(guò)程中根據(jù)概率論方法可以自適應(yīng)的改變搜索方向,以較快的速度找出最優(yōu)解。通過(guò)GA對(duì)ELM進(jìn)行優(yōu)化,理論上可以保證輸出矩陣H的列滿秩,并且可以在一定程度上提高學(xué)習(xí)速度、預(yù)測(cè)精度、測(cè)試精度和整體網(wǎng)絡(luò)結(jié)構(gòu)的魯棒性。
對(duì)ELM模型的權(quán)值及閾值參數(shù)尋優(yōu)流程圖如圖1所示。
具體實(shí)現(xiàn)主要步驟如下:
步驟一:將日用水量數(shù)據(jù)和影響因素作為訓(xùn)練樣本輸入。
步驟二:根據(jù)輸入的訓(xùn)練數(shù)據(jù)建立隨機(jī)產(chǎn)生連接權(quán)值與閾值的ELM神經(jīng)網(wǎng)絡(luò)。
步驟三:設(shè)置遺傳算法的種群數(shù)目和優(yōu)化目標(biāo)。優(yōu)選地,選取誤差作為適應(yīng)度函數(shù),優(yōu)化目標(biāo)為達(dá)到目標(biāo)誤差。
步驟四:對(duì)ELM模型的輸入層與隱含層的連接權(quán)值和隱含層閾值進(jìn)行二進(jìn)制編碼。
步驟五:對(duì)種群進(jìn)行訓(xùn)練,并計(jì)算種群中每個(gè)個(gè)體的適應(yīng)度值。
步驟六:根據(jù)適應(yīng)度值,對(duì)種群進(jìn)行選擇、交叉、變異,從而產(chǎn)生子種群,GA的初始參數(shù):種群大小s為60;交叉概率Pc=0.9;突變率Pm=0.01;GA的迭代次數(shù)為120;目標(biāo)誤差(均方誤差/VISE)為1×10-4。將子種群的個(gè)體插入父種群,替代父種群中適應(yīng)度值最小的個(gè)體,得到新種群,同時(shí)迭代次數(shù)加1。
步驟七:判斷是否滿足結(jié)束條件。是則進(jìn)行步驟八,否則返回至步驟五。結(jié)束條件設(shè)置為達(dá)到優(yōu)化目標(biāo)或達(dá)到最大迭代次數(shù)。
步驟八:對(duì)參數(shù)進(jìn)行解碼,根據(jù)得到的最優(yōu)輸入層與隱含層的連接權(quán)值和隱含層節(jié)點(diǎn)閾值更新GA-ELM模型。
步驟九:將影響因素輸入到預(yù)測(cè)模型,得出預(yù)測(cè)結(jié)果。
4仿真實(shí)驗(yàn)
4.1樣本數(shù)據(jù)
本文仿真數(shù)據(jù)為北京自來(lái)水集團(tuán)市區(qū)水廠2019年日供水量數(shù)據(jù),每日為一個(gè)樣本點(diǎn),按照季節(jié)類型應(yīng)該春季、夏季、秋季和冬季4種類型,僅以2019年5月30至7月28日用水量量作為樣本數(shù)據(jù),共60天,如圖2所示,以此數(shù)據(jù)為基礎(chǔ)建立GA-ELM預(yù)測(cè)模型并將當(dāng)日最高氣溫和最低氣溫作為模型影響因素輸入以提高預(yù)測(cè)模型的預(yù)測(cè)精度。
本文以夏季模型為例,共計(jì)60d的樣本數(shù)據(jù)。本文仿真實(shí)驗(yàn)是基于北京自來(lái)水集團(tuán)市區(qū)水廠歷史用水?dāng)?shù)據(jù)進(jìn)行的,因此在選擇合適的輸入日用水量數(shù)據(jù)時(shí)十分謹(jǐn)慎,盡量使用涵蓋所有情況的數(shù)據(jù)。本次選擇的60d樣本數(shù)據(jù)沒(méi)有丟失數(shù)據(jù)和異常數(shù)據(jù),其次,因北京市日用水量數(shù)據(jù)過(guò)于龐大而影響因素?cái)?shù)據(jù)相對(duì)較小,在仿真實(shí)驗(yàn)中要進(jìn)行數(shù)據(jù)和影響因素的歸一化處理。
4.2參數(shù)設(shè)置
由于ELM網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)關(guān)鍵在于隱含層節(jié)點(diǎn)數(shù)目的確定,本文初選數(shù)目6、10、12、14、15等多種方案進(jìn)行實(shí)驗(yàn)比較,分析個(gè)方案下模擬結(jié)果與期望目標(biāo)之間的均方誤差、絕平均對(duì)誤差及平均絕對(duì)百分誤差等指標(biāo),選取性能較好的方案,確定ELM隱含層神經(jīng)元個(gè)數(shù)為12,結(jié)合輸入輸出因子數(shù)量,故網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)確定為2-12-1。
4.3對(duì)比模型及評(píng)價(jià)標(biāo)準(zhǔn)
為了評(píng)估本文所提出的北京市短期用水預(yù)測(cè)的模型預(yù)測(cè)結(jié)果的準(zhǔn)確度,決定采用三種被普遍認(rèn)可的評(píng)價(jià)標(biāo)準(zhǔn),分別為可以更好地反映預(yù)測(cè)誤差的實(shí)際情況的平均絕對(duì)誤差(MAE)、直觀統(tǒng)計(jì)誤差的值的平均絕對(duì)百分誤差(MAPE)以及常用來(lái)作為機(jī)器學(xué)習(xí)模型預(yù)測(cè)結(jié)果衡量標(biāo)準(zhǔn)的標(biāo)準(zhǔn)誤差(RMSE)。MAE可表明預(yù)測(cè)值誤差的實(shí)際情況,MAPE可用來(lái)表示分析測(cè)試結(jié)果的精密度,RMSE則能反映一個(gè)數(shù)據(jù)集的離散程度和穩(wěn)定性。
4.4結(jié)果與分析
GA-ELM預(yù)測(cè)模型與傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型、傳統(tǒng)ELM預(yù)測(cè)模型輸出結(jié)果與性能分析結(jié)果如表2所示,輸出結(jié)果的每日絕對(duì)百分誤差結(jié)果圖如圖3所示。
從表2中可以看出,GA-ELM預(yù)測(cè)值平均誤差(MAE)相較于其他兩種預(yù)測(cè)模型最低,在龐大的百萬(wàn)立方用水量數(shù)據(jù)下,平均誤差在71758.878立方米已經(jīng)是很可觀的數(shù)字。由平均絕對(duì)百分誤差可以看出,在模型預(yù)測(cè)精度上也是GA-ELM精度最高,達(dá)到2.19%,傳統(tǒng)的ELM預(yù)測(cè)模型相對(duì)于傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型優(yōu)勢(shì)則并不明顯。由均方根誤差(RMSE)可以看出,GA-ELM預(yù)測(cè)模型的損失量相對(duì)于其他兩種模型最小。為了進(jìn)一步說(shuō)明GA-ELM模型的預(yù)測(cè)精度,圖3給出三種模型的每日絕對(duì)百分比誤差對(duì)比圖。
從圖3中可以直觀地看出,BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型最大絕對(duì)百分比誤差在7月23日為6.52%,ELM神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型最大絕對(duì)百分比誤差在7月26日,達(dá)到了6.36%,甚至高于同一天的BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,而在7月28日,BP、ELM神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的絕對(duì)百分比誤差達(dá)到最小,分別為2.23%和1.4%,但仍然高于GA-ELM預(yù)測(cè)模型的0.32%,整體上看,GA-ELM模型每日的絕對(duì)百分比誤差都要遠(yuǎn)小于另外兩種對(duì)比預(yù)測(cè)模型。綜上,GA-ELM短期用水預(yù)測(cè)模型的每日預(yù)測(cè)結(jié)果穩(wěn)定性、預(yù)測(cè)精度遠(yuǎn)高于其他兩種模型。
5結(jié)語(yǔ)
城市日用水量具有較明顯的不確定性和隨機(jī)性,傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)方法的預(yù)測(cè)精度未能達(dá)到相對(duì)精確的預(yù)測(cè)結(jié)果,本文提出了一種基于遺傳算法一極限學(xué)習(xí)機(jī)的短期城市用水量預(yù)測(cè)模型,利用極限學(xué)習(xí)機(jī)算法訓(xùn)練速度快,泛化性能強(qiáng),無(wú)須調(diào)整參數(shù)的優(yōu)點(diǎn),并結(jié)合遺傳算法優(yōu)化其輸人權(quán)值和隱含層神經(jīng)元閾值的改進(jìn)方法,改善了該預(yù)測(cè)模型的訓(xùn)練過(guò)擬合或隱含層缺失的隱患,進(jìn)而提高了模型的預(yù)測(cè)穩(wěn)定性和預(yù)測(cè)精度。將該預(yù)測(cè)模型的預(yù)測(cè)結(jié)果與其他兩種預(yù)測(cè)模型的結(jié)果進(jìn)行對(duì)比,結(jié)果表明GA-ELM預(yù)測(cè)模型的預(yù)測(cè)精度較高,具有較強(qiáng)的實(shí)用價(jià)值,從而為未來(lái)水資源調(diào)度和需水預(yù)測(cè)提供新思路。