何兵 高凡 藍利 覃姍
摘要為提高葉爾羌河中長期徑流預(yù)測精度,基于小波分析的基礎(chǔ)上建立遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的耦合模型,對60年葉爾羌河年徑流時間序列進行研究。結(jié)果表明:耦合模型綜合了兩者的優(yōu)勢,在保留神經(jīng)網(wǎng)絡(luò)優(yōu)良非線性擬合能力的同時,又融入遺傳算法的容錯性和全局搜索能力,提高預(yù)測徑流時的學(xué)習(xí)速度和泛化能力。在對年徑流進行預(yù)測時,其預(yù)測平均誤差為-2.69%,而采用傳統(tǒng)單純的BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測的平均誤差為-10.25%。從預(yù)測誤差檢驗以及模型的對比結(jié)果可知此模型合理、可行,因此該算法有助于解決葉爾羌河中長期徑流預(yù)測問題。
關(guān)鍵詞徑流預(yù)測;遺傳算法;BP神經(jīng)網(wǎng)絡(luò);葉爾羌河
中圖分類號P338文獻標識碼A
文章編號0517-6611(2019)03-0208-04
doi:10.3969/j.issn.0517-6611.2019.03.065
建立可靠的預(yù)測模型歷來是水文預(yù)測的重要內(nèi)容,類似的研究成果也較多。受降水、氣溫及下墊面等多重因素的影響,年徑流時間序列具有高度復(fù)雜的非線性、非平穩(wěn)的變化特征,因此很難對其進行預(yù)測[1],尤其針對本底環(huán)境極端脆弱的干旱內(nèi)陸河流地區(qū)來說更是一種挑戰(zhàn)。如何提高年徑流的預(yù)測精度,一直是水文工作者的難題,但也成為研究的熱點之一。在以往的徑流預(yù)測研究中,傳統(tǒng)的回歸模型雖因可操作性強而被廣大學(xué)者廣泛使用,但由于其影響因子的不確定性、不穩(wěn)定性及因子多重交互性等,難以用簡單的線性關(guān)系描述,且年徑流過程的自相依性較弱,僅應(yīng)用單一的統(tǒng)計回歸模型來預(yù)測使得結(jié)果難以被認可[2]。隨著年徑流預(yù)測領(lǐng)域的不斷發(fā)展和完善,徑流預(yù)測也出現(xiàn)了新的方法,如人工神經(jīng)網(wǎng)絡(luò)預(yù)測模型[3]、灰色預(yù)測模型[4]、支持向量機[5]、遺傳算法[6]以及組合模型[3-5],大致可分為物理成因分析法和數(shù)理統(tǒng)計模型2類,但這些統(tǒng)計預(yù)測方法各有優(yōu)缺點,如BP 神經(jīng)網(wǎng)絡(luò)模型雖然原理簡單易操作,但存在延時、收斂精度不高以及易陷入局部極小點等問題[7]。年徑流預(yù)測的方法和模型雖然很多,但沒有一種統(tǒng)一的方法或模型適用于所有的徑流序列[8]。因此,為研究模擬出適用于葉爾羌河流域年徑流的預(yù)測模型,并與傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)模型做對比,以期提高模擬預(yù)測的精度,該研究采用小波分解的信號作為BP神經(jīng)網(wǎng)絡(luò)的輸入項[9],其次利用遺傳算法能尋優(yōu)的特點推求出BP神經(jīng)網(wǎng)絡(luò)的最優(yōu)初始權(quán)重和閾值,最終建立小波分析—遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的耦合模型對葉爾羌河年徑流進行研究。目前,國內(nèi)對葉爾羌河徑流特征分析的研究較多,多集中在對徑流、降水、氣溫、蒸發(fā)以及生態(tài)環(huán)境特征等方面[10-13],而對于年徑流的模擬預(yù)測研究成果較少。在新疆執(zhí)行嚴格的水資源管理制度背景下,對葉爾羌河年徑流進行模擬預(yù)測,可為流域水資源的合理開發(fā)利用、水資源管理等提供理論依據(jù)和技術(shù)支持,同時也可以為干旱區(qū)中小河流的中長期徑流預(yù)測提供參考。
1研究區(qū)概況及數(shù)據(jù)來源
葉爾羌河是國內(nèi)最大的內(nèi)陸河塔里木河的主要源流之一,屬冰雪消融補給型河流,發(fā)源于喀喇昆侖山脈。葉爾羌河的水量控制站卡群站的集水面積為50 248? km2[14],多年平均年徑流為65.66×108 m3,控制出山口以上河長為527 km,流域面積在國內(nèi)占9.36×104 km2[15]。葉爾羌河徑流由冰川融水、地下水及雨雪水混合補給組成,分別占64.0%、22.6%、13.4%,其年內(nèi)徑流量主要集中在夏季,卡群站6—8月徑流量占總徑流量的 68.5%[16]。葉爾羌河流域水系由以下河流組成,其中葉爾羌河最大,提孜那甫河次之,柯克亞河與烏魯克河最小。目前已將提孜那甫河與葉爾羌河通過4條“引葉濟提”的水利工程連通;提孜那甫河和柯克亞河、烏魯克河通過蒙卡提渠也已連通,形成了可統(tǒng)一調(diào)度的完整的葉爾羌河水系[17]。
該研究選取卡群水文站共60年(1957—2016年)的資料對徑流進行模擬預(yù)測。使用前52年(1957—2008年)序列作為模型模擬的訓(xùn)練樣本,后8年(2009—2016年)序列作為模型預(yù)測的檢驗樣本。
2小波及遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)模型
BP 神經(jīng)網(wǎng)絡(luò)被廣泛應(yīng)用于水文預(yù)測預(yù)報等領(lǐng)域,不僅因為其結(jié)構(gòu)簡單便于理解,而且還具有良好的非線性映射能力[18]。但BP神經(jīng)網(wǎng)絡(luò)存在延時、收斂精度不高以及易陷入局部極小點等不可避免的問題,故該研究擬采用小波及遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)模型。該模型因經(jīng)小波分解后的每一頻率成分都有其自身的約束及發(fā)展規(guī)律,它既能反映過去隨時間的演變,還能預(yù)測未來的發(fā)展趨勢[1],故將徑流序列用小波分解為不同頻率的信號,并作為BP神經(jīng)網(wǎng)絡(luò)的輸入神經(jīng)元;為提高年徑流序列模擬的精度,選用尋優(yōu)效果良好的遺傳算法對BP網(wǎng)絡(luò)的初始權(quán)重和閾值進行優(yōu)化,并且尋找到最優(yōu)連接權(quán),從而解決了神經(jīng)網(wǎng)絡(luò)收斂速度慢和收斂精度差的問題。
2.2遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)模型
原序列經(jīng)過小波分解后能得到不同頻率的細節(jié)信號,將這些細節(jié)信號作為BP網(wǎng)絡(luò)的輸入向量,BP網(wǎng)絡(luò)的拓撲結(jié)構(gòu)確定后,再確定BP網(wǎng)絡(luò)的初始權(quán)重和閾值時,用尋優(yōu)能力良好的遺傳算法來獲得BP網(wǎng)絡(luò)的最優(yōu)權(quán)值和閾值[21],繼而進行網(wǎng)絡(luò)測試、誤差計算等步驟。如果遺傳算法得到的最優(yōu)解不符合要求,那么再利用 BP 神經(jīng)網(wǎng)絡(luò)對初始權(quán)重和閾值進行調(diào)試直到符合要求為止,以便能夠取得滿意的模擬結(jié)果,其具體優(yōu)化步驟如下:
式中,n為輸入層節(jié)點數(shù);m為隱含層節(jié)點數(shù);l為輸出層節(jié)點數(shù)。該次試驗初始種群的規(guī)模為40。
(2)用神經(jīng)網(wǎng)絡(luò)誤差平方和的倒數(shù)來定義適應(yīng)度函數(shù),計算每個個體適應(yīng)度值,誤差越小,則適應(yīng)度越大;誤差越大,則反之。
(3)產(chǎn)生的最優(yōu)個體可以直接復(fù)制給下一代,其他的個體,使用交叉和變異等操作來進一步的篩選,在該次試驗中,交叉概率為0.9,變異概率為0.1,進化代數(shù)為30。
(4)重復(fù)上述2~3的步驟,直到訓(xùn)練目標的迭代次數(shù)達到設(shè)定的要求為止。
小波及遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)模型的結(jié)構(gòu)見圖1。
3實例分析
3.1模型模擬該研究所做的工作均是在matlab環(huán)境下進行。小波分析方面,選用db5小波對葉爾羌河年徑流時間序列信號進行小波分解,結(jié)果見圖2。其中d1到d9是經(jīng)小波分解后得到的不同頻率的信號,可反映年徑流序列的細節(jié)信息,和原始信號對比后可以看出d1~d5為主信號層,d6~d9為噪聲信號層,故可以去掉噪聲層,將d1~d5的信號作為BP網(wǎng)絡(luò)的輸入向量,并帶入到模型里面進行計算。
將該研究采用的小波及遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的模型應(yīng)用于葉爾羌河年徑流時間序列。此模型中,BP 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)分為輸入層、隱含層和輸出層,其中,輸入層神經(jīng)元個數(shù)為 5,是由小波分解得到的5個主信號層組成;隱含層神經(jīng)元個數(shù)定為11,隱含層節(jié)點個數(shù)由試算法確定,試算法的思路是取不同的隱含層節(jié)點個數(shù)分別對樣本進行模擬,然后選擇模擬效果達到最好時的節(jié)點個數(shù),由此確定隱含層個數(shù)為11;輸出就是最后的模擬值,個數(shù)為1。該研究利用1957—2008年的共52年的徑流序列樣本在優(yōu)化過的模型中進行訓(xùn)練,并建立模型,利用2009—2016年共8年的實測年徑流序列樣本進行模擬。遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的程序中,種群規(guī)模P取30,遺傳代數(shù)為40,交叉概率Pc取0.9,變異概率Pm取0.1,最后把最優(yōu)個體作為BP神經(jīng)網(wǎng)絡(luò)的初始權(quán)值和閾值。采用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò),在迭代30次后,適應(yīng)度值基本趨于穩(wěn)定(圖3)。BP神經(jīng)網(wǎng)絡(luò)模型采用的是梯度下降法,誤差精度為10-7,學(xué)習(xí)速率為 0.001。
3.2模型預(yù)測
采用適應(yīng)度值最大的權(quán)值和閾值用于網(wǎng)絡(luò)進行模擬,小波及遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測結(jié)果見圖4(a)。由圖4可知,2009年、2010年這2年模擬的結(jié)果與實測年徑流值基本接近,2012年、2013年和2016年這3年模擬效果誤差稍大,但從整體來看,模擬效果良好。另外,為便于分析比較,同時計算單純的BP神經(jīng)網(wǎng)絡(luò)模型,其結(jié)果見圖4(b),相比該研究采用的方法,BP神經(jīng)網(wǎng)絡(luò)模型除了2010年和實測值接近外,其余年模擬效果都不理想。
表1為兩模型模擬值和實測值的具體數(shù)值對比,由計算得本文所采用的模型模擬的誤差平均值為-2.69%,最大誤差值為-8.25%,最小誤差值為-1.67%。而BP神經(jīng)網(wǎng)絡(luò)模型模擬誤差平均值為-10.25%,最大誤差值-20.13%,最小-4.92%,也可由圖4更為直觀的反映此模型模擬效果要比BP神經(jīng)網(wǎng)絡(luò)模型模擬好,因此該研究采用的模型可以用來預(yù)測未來葉爾羌河年徑流時間序列。
根據(jù)以上分析和圖4(a)可以看出,耦合模型有個別數(shù)據(jù)模擬精度不高,分析有兩點原因:一是因為小波變換采用的實際濾波器與理想濾波器存在的差異性,導(dǎo)致小波分解后的小波系數(shù)中存在各種系數(shù)混雜現(xiàn)象,相鄰的小波系數(shù)之間互相受到干擾[23]。這樣會導(dǎo)致小波分解后的數(shù)據(jù)帶入到網(wǎng)絡(luò)模型里存在失真的缺陷。二是年徑流時間序列在經(jīng)過小波分解以及遺傳算法尋優(yōu)的過程中都會產(chǎn)生無法避免的隨機誤差,以及序列樣本的長度限制等,導(dǎo)致模型的部分數(shù)據(jù)模擬效果欠佳。從整體上看,該研究采用的模型模擬精度要高于單純的BP神經(jīng)網(wǎng)絡(luò)模型,具有一定的參考價值。
4結(jié)論與討論
(1)將小波分析和遺傳算法引入到BP神經(jīng)網(wǎng)絡(luò)模型中,計算出此模型模擬誤差平均值為-2.69%,對比BP神經(jīng)網(wǎng)絡(luò)模型模擬誤差平均值-10.25%,該模型模擬精度明顯高于單純的BP神經(jīng)網(wǎng)絡(luò)模型,故基于小波分解以及遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)連接權(quán)的方法可以提高年徑流時間序列模擬的精度,但也有個別數(shù)據(jù)模擬效果欠佳,大致分析兩點原因:一是小波變換特性因素;二是模型誤差的影響,表明該模型的方法和精度還有待完善和提高。
(2)目前條件下,依靠以往徑流資料來做的徑流預(yù)測模
型即數(shù)理統(tǒng)計模型,由于未考慮其他影響因素,可能會導(dǎo)致
預(yù)測精度不理想以及現(xiàn)實意義不大的問題,但在缺乏其他資料地區(qū)的情況下,采用此種方法是可行的。該研究以卡群水文站年徑流為例進行驗證,從預(yù)測誤差檢驗以及模型的對比結(jié)果可知,在小波分析的基礎(chǔ)上建立遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的耦合模型是合理且有效的。所建的耦合模型可以用來預(yù)測未來葉爾羌河年徑流量,也可以為年徑流時間序列的預(yù)測提供參考。
(3)模型的建立都有一定的適用條件,為找到適合的徑流預(yù)測模型,單一的方法會受到一定限制,為提高預(yù)測精度,將多種方法進行耦合,可以發(fā)揮各自優(yōu)勢,揚長避短,從而提高徑流預(yù)測精度的準確性。
參考文獻
[1] 蔣曉輝,劉昌明.基于小波分析的徑向基神經(jīng)網(wǎng)絡(luò)年徑流預(yù)測[J].應(yīng)用科學(xué)學(xué)報,2004,22(3):411-414.
[2] 彭欣怡,于國榮,張代青.不同組合小波神經(jīng)網(wǎng)絡(luò)模型對徑流預(yù)測的適用性[J].人民長江,2015,46(24):24-28.
[3] 李琳琳,岳春芳, 張勝江.基于小波方差分析的BP神經(jīng)網(wǎng)絡(luò)年徑流預(yù)測[J].節(jié)水灌溉,2014(6):44-46.
[4] 晏欣.灰色-人工神經(jīng)網(wǎng)絡(luò)組合預(yù)測方法在徑流中長期預(yù)測中的應(yīng)用研究[D].昆明:昆明理工大學(xué),2013.
[5] 黃巧玲,粟曉玲.基于小波支持向量機耦合的月徑流預(yù)測方法[J].水力發(fā)電學(xué)報,2015,34(3):1-7,20.
[6] 袁曉輝,張勇傳,袁艷斌.基于遺傳規(guī)劃的徑流預(yù)測新方法[J].水力發(fā)電,2006,32(8):11-13.
[7] 郭淳,李祚泳,黨嬡.基于免疫進化算法的BP網(wǎng)絡(luò)模型在徑流預(yù)測中的應(yīng)用[J].水資源保護,2009,25(5):1-4.
[8] 陳匯林,朱凱.年徑流的特征及預(yù)測研究進展[J].農(nóng)業(yè)與技術(shù),2014,34(1):162-163,167.
[9] 李祚泳.水文水資源及水環(huán)境分析的若干進展[J].四川大學(xué)學(xué)報(工程科學(xué)版),2002,34(2):1-4.
[10] 杜清,徐海量,張廣朋,等.葉爾羌河流域1990—2010年生態(tài)環(huán)境變化特征[J].干旱地區(qū)農(nóng)業(yè)研究,2016,34(1):252-256,263.
[11] 王修內(nèi),黃強,暢建霞.新疆葉爾羌河流域徑流規(guī)律分析[J].人民黃河,2012,34(6):45-47,50.
[12] 孫本國,毛煒嶧,馮燕茹,等.葉爾羌河流域氣溫、降水及徑流變化特征分析[J].干旱區(qū)研究,2006,23(2):203-209.
[13] 任加國,鄭西來,許模,等.新疆葉爾羌河流域土壤鹽漬化特征研究[J].土壤,2005,37(6):635-639.
[14] 古麗孜巴·艾尼,滿蘇爾·沙比提.葉爾羌河徑流量時序變化特征及成因分析[J].科技創(chuàng)新與應(yīng)用,2014(13):298-299.
[15] 何兵,高凡,閆正龍,等.葉爾羌河徑流演變規(guī)律與變異特征[J].水資源與水工程學(xué)報,2018,29(1):38-43,49.
[16] 滿蘇爾·沙比提, 胡江玲.塔里木河流域水量變化對生態(tài)環(huán)境影響分析[J].干旱區(qū)資源與環(huán)境,2007,21(10):83-87.
[17] 朱芳芳.淺議葉爾羌河水文特征[J].中國水運,2015,15(3):182-183.
[18] 崔東文.多隱層BP神經(jīng)網(wǎng)絡(luò)模型在徑流預(yù)測中的應(yīng)用[J].水文,2013,33(1):68-73.
[19] 劉素一,權(quán)先璋,張勇傳.小波變換結(jié)合BP神經(jīng)網(wǎng)絡(luò)進行徑流預(yù)測[J].人民長江,2003,34(7):38-39.
[20] 李淼,夏軍,陳社明,等.北京地區(qū)近300年降水變化的小波分析[J].自然資源學(xué)報, 2011,26(6):1001-1011.
[21] 仲云飛, 梅一韜, 吳邦彬,等.遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)在大壩揚壓力預(yù)測中的應(yīng)用[J].水電能源科學(xué),2012,30(6):98-101.
[22] 肖遷,李文華,李志剛,等.基于改進的小波-BP神經(jīng)網(wǎng)絡(luò)的風(fēng)速和風(fēng)電功率預(yù)測[J].電力系統(tǒng)保護與控制,2014(15):80-86.
[23] 何嶺松.小波函數(shù)性質(zhì)極其對小波分析結(jié)果的影響[J].振動工程學(xué)報,2000,13(1):143-145.