国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于多種學(xué)習(xí)方案LSTM的信江流域徑流預(yù)測(cè)

2022-10-11 10:03馬炳焱成靜清劉章君鄧武彬
水力發(fā)電 2022年7期
關(guān)鍵詞:徑流降雨流域

鄭 勇,馬炳焱,成靜清,劉章君,鄧武彬

(1.江西省水利科學(xué)院,江西 南昌 330029;2.鄭州大學(xué)水利科學(xué)與工程學(xué)院,河南 鄭州 450001;3.江西省水利廳,江西 南昌 330009)

1 研究背景

合理的預(yù)測(cè)徑流對(duì)于流域防洪和水資源調(diào)控具有重要意義[1-2]。受流域水文特征高復(fù)雜性和非線(xiàn)性影響,水文統(tǒng)計(jì)學(xué)模型預(yù)測(cè)徑流的精度受統(tǒng)計(jì)數(shù)據(jù)和模型條件的影響,當(dāng)預(yù)報(bào)條件在模型條件范圍內(nèi)時(shí)具有良好的效果,但當(dāng)預(yù)報(bào)條件接近或超出歷史觀(guān)測(cè)極限時(shí),預(yù)測(cè)效果很差[3]。具有一定物理機(jī)制的水文模型雖然可以滿(mǎn)足預(yù)測(cè)精度,但是模型構(gòu)建對(duì)流域下墊面和水文數(shù)據(jù)需求較高且參數(shù)率定過(guò)程復(fù)雜,存在參數(shù)不確定性以及模型普適性較差等問(wèn)題,難以適用于基礎(chǔ)資料缺乏的地區(qū)[4]。近年來(lái),隨著機(jī)器學(xué)習(xí)算法的發(fā)展。以人工神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)為代表的數(shù)據(jù)驅(qū)動(dòng)算法在徑流預(yù)測(cè)中得到廣泛應(yīng)用。以應(yīng)用成熟的BP神經(jīng)網(wǎng)絡(luò)(Back propagation neural network)[5- 8]為例,趙文剛等[9]以汛期和非汛期的安鄉(xiāng)、石龜山及沙灣站的水位、流量為輸入預(yù)測(cè)西洞庭湖南咀站的月經(jīng)流量,預(yù)測(cè)準(zhǔn)確率達(dá)77.8%,預(yù)報(bào)等級(jí)為乙級(jí);李繼清等[10]以唐乃亥水文站1956年~2010年的徑流數(shù)據(jù)為訓(xùn)練樣本,2011年~2017年的數(shù)據(jù)為驗(yàn)證樣本進(jìn)行月和旬徑流預(yù)報(bào),單一BP神經(jīng)網(wǎng)絡(luò)的預(yù)報(bào)合格率為60%;王長(zhǎng)鵬等[11]以2008年~2013年宜昌水文站的日徑流數(shù)據(jù)為訓(xùn)練集,以其中最后90天數(shù)據(jù)為測(cè)試集進(jìn)行了日徑流預(yù)測(cè),標(biāo)準(zhǔn)BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)準(zhǔn)確率達(dá)72.2%。近年來(lái),長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)以其在時(shí)間序列模擬回歸上的優(yōu)勢(shì)[12],逐漸成為徑流預(yù)測(cè)的研究熱點(diǎn),胡慶芳等[13]以漢江安康站及其上游石泉站的前期徑流量和流域面雨量為輸入構(gòu)建LSTM模型對(duì)安康站日徑流進(jìn)行預(yù)測(cè),訓(xùn)練集和檢驗(yàn)集的效率系數(shù)最高可達(dá)0.83和0.84;張森等[14]將LSTM應(yīng)用于晉江上游控制性水文站石礱站2013年~2017年逐月徑流過(guò)程進(jìn)行延時(shí)回歸預(yù)測(cè),合格率為85%,確定性系數(shù)R2為0.953,達(dá)到預(yù)報(bào)甲等標(biāo)準(zhǔn)。綜上可知,LSTM在徑流預(yù)測(cè)的性能上優(yōu)于BP神經(jīng)網(wǎng)絡(luò),兩種方法對(duì)于不同的模型輸入會(huì)產(chǎn)生不同的預(yù)測(cè)效果[15],相關(guān)研究中對(duì)于采用什么樣的輸入數(shù)據(jù)進(jìn)行預(yù)測(cè)尚無(wú)統(tǒng)一標(biāo)準(zhǔn)。

研究基于LSTM,在不改變算法結(jié)構(gòu)的前提下,設(shè)置不同的輸入集,以篩選信江流域日徑流預(yù)測(cè)的最優(yōu)學(xué)習(xí)方案,為基于LSTM的流域徑流預(yù)測(cè)輸入數(shù)據(jù)集的選取提供參考。

2 研究方法

2.1 研究區(qū)和數(shù)據(jù)

研究區(qū)為梅港水文站斷面上游的信江流域。該流域?qū)氽蛾?yáng)湖水系五大流域之一,年均降水量1 826 mm。由于氣候因素的影響,流域年內(nèi)水資源分布不均,春夏兩季降水量占全年總量的73%,流域出口斷面最小流量為4.14 m3/s,最大流量13 800 m3/s,差異巨大,其徑流具有極強(qiáng)的非線(xiàn)性特征[16]。加之信江流域人口密度大,人均水資源量少,準(zhǔn)確高效的徑流預(yù)測(cè)對(duì)于流域洪旱災(zāi)害防治和水資源優(yōu)化配置具有重要意義。

用于本研究日徑流預(yù)測(cè)的降雨數(shù)據(jù)資料為上游上饒站和弋陽(yáng)站以及下游梅港站2007年~2019年日降雨數(shù)據(jù),徑流數(shù)據(jù)為梅港站2007年~2019年實(shí)測(cè)日平均流量數(shù)據(jù),所有數(shù)據(jù)在應(yīng)用前均通過(guò)可靠性、一致性和代表性審查。

2.2 LSTM原理

LSTM是用于處理深度學(xué)習(xí)算法的強(qiáng)大工具,廣泛用于回歸和分類(lèi)[17-18]分析。它是循環(huán)神經(jīng)網(wǎng)絡(luò)的變體之一,能夠解決一般循環(huán)神經(jīng)網(wǎng)絡(luò)在長(zhǎng)序列回歸上的梯度爆炸和梯度消失問(wèn)題。LSTM由1個(gè)輸入層、1個(gè)或多個(gè)記憶單元和1個(gè)輸出層組成,如圖1所示。圖1中,隱藏層包含兩個(gè)狀態(tài)變量h和c,分別用于保存短期狀態(tài)和長(zhǎng)期狀態(tài);因此,在t時(shí)刻,LSTM有3個(gè)輸入:當(dāng)前時(shí)刻網(wǎng)絡(luò)的輸入值xt,上一時(shí)刻網(wǎng)絡(luò)的短期狀態(tài)ht-1和上一時(shí)刻的長(zhǎng)期狀態(tài)ct-1。

圖1 LSTM的輸入輸出映射

圖2給出了LSTM各個(gè)門(mén)控單元的連接方式。LSTM用兩個(gè)門(mén)來(lái)控制長(zhǎng)期狀態(tài)c的內(nèi)容:一個(gè)是遺忘門(mén),它決定了上一時(shí)刻的長(zhǎng)期狀態(tài)有多少保留到當(dāng)前時(shí)刻;另一個(gè)是輸入門(mén),它決定了當(dāng)前時(shí)刻網(wǎng)絡(luò)的輸入有多少保存到長(zhǎng)期狀態(tài)。LSTM用輸出門(mén)來(lái)控制長(zhǎng)期狀態(tài)c有多少輸出到LSTM的當(dāng)前輸出值。

圖2 LSTM的門(mén)控結(jié)構(gòu)

式(1)~式(5)分別對(duì)應(yīng)遺忘門(mén)ft、輸入門(mén)it、當(dāng)前輸入的長(zhǎng)期狀態(tài)c′t、當(dāng)前時(shí)刻的長(zhǎng)期狀態(tài)ct和輸出門(mén)ot的計(jì)算方法。

(1)遺忘門(mén)

ft=σ(Wf[ht-1,xt]+bf)

(1)

式中,Wf為遺忘門(mén)的權(quán)重矩陣;[ht-1,xt]為把兩個(gè)向量連接成一個(gè)更長(zhǎng)的向量;bf為遺忘門(mén)的偏置項(xiàng);σ為激活函數(shù)為Sigmoid函數(shù)。

(2)輸入門(mén)

it=σ(Wi[ht-1,xt]+bi)

(2)

式中,Wi為輸入門(mén)的權(quán)重矩陣;bi為輸入門(mén)的偏置項(xiàng)。

(3)當(dāng)前輸入的長(zhǎng)期狀態(tài)

c′t=tanh(Wc[ht-1,xt]+bc)

(3)

式中,tanh為激活函數(shù);Wc為當(dāng)前輸入的長(zhǎng)期狀態(tài)的權(quán)重矩陣;bc為Wc的偏置項(xiàng)。

(4)當(dāng)前時(shí)刻的長(zhǎng)期狀態(tài)

ct=ft·ct-1+it·c′t

(4)

經(jīng)過(guò)上述運(yùn)算,LSTM將關(guān)于當(dāng)前的記憶c′t和長(zhǎng)期記憶ct-1組合在一起形成了新的長(zhǎng)期狀態(tài)ct。在遺忘門(mén)和輸入門(mén)的控制下,該狀態(tài)既可以保存長(zhǎng)時(shí)間序列的信息,又能避免當(dāng)前無(wú)關(guān)緊要的信息進(jìn)入記憶中。

(5)輸出門(mén)

ot=σ(Wo[ht-1,xt]+bo)

(5)

式中,Wo為輸出門(mén)的權(quán)重矩陣;bo為Wo的偏置項(xiàng)。

LSTM的最終輸出ht由輸出門(mén)ot和長(zhǎng)期狀態(tài)ct共同決定,即

ht=ot·tanh(ct)

(6)

表1 豐水期3種方案部分輸入輸出集數(shù)據(jù)

表2 枯水期3種方案部分輸入輸出集數(shù)據(jù)

3 實(shí)例分析

3.1 學(xué)習(xí)方案

神經(jīng)網(wǎng)絡(luò)通過(guò)建立輸入與輸出的映射關(guān)系來(lái)解決非線(xiàn)性回歸問(wèn)題。在徑流預(yù)測(cè)方面,神經(jīng)網(wǎng)絡(luò)的性能可通過(guò)其在預(yù)測(cè)集上的準(zhǔn)確率來(lái)衡量。在模型構(gòu)建時(shí)保證超參數(shù)不變,考慮對(duì)日徑流量可能產(chǎn)生影響的上游來(lái)水和區(qū)間來(lái)水兩方面因素,以流量和降雨量的不同組合設(shè)計(jì)3種不同的學(xué)習(xí)方案作為輸入,下游梅港站當(dāng)日平均流量作為輸出,3種不同的輸入集對(duì)應(yīng)相同的輸出集,以對(duì)比不同學(xué)習(xí)方案下LSTM徑流預(yù)測(cè)的性能。

方案一:以前期徑流預(yù)測(cè)當(dāng)日徑流,輸入數(shù)據(jù)為梅港站前1、2、3日流量,輸出數(shù)據(jù)為當(dāng)日流量。這樣的處理用于探究LSTM對(duì)徑流趨勢(shì)的預(yù)測(cè)能力。

方案二:前期降雨預(yù)測(cè)當(dāng)日徑流,輸入數(shù)據(jù)為梅港站及上游上饒站和弋陽(yáng)站前1日降雨量,輸出數(shù)據(jù)為當(dāng)日流量。用于判斷前期降雨對(duì)徑流的預(yù)測(cè)能力。

方案三:前期徑流和前期降雨預(yù)測(cè)當(dāng)日徑流,輸入數(shù)據(jù)為梅港站前1、2、3日流量和3站前1日降雨量,輸出數(shù)據(jù)為當(dāng)日流量。該方案用于探究前期降雨和前期徑流對(duì)當(dāng)日徑流的預(yù)測(cè)能力。

由于信江流域降雨主要集中在4月~9月,考慮不同來(lái)水條件,將研究區(qū)2007年~2019年的降雨徑流數(shù)據(jù)分為豐水期(4月~9月)和枯水期(10月~3月)兩種情況。表1和表2為2種情況下3種方案的部分輸入輸出集數(shù)據(jù)。樣本數(shù)據(jù)按照7∶3的比例劃分為訓(xùn)練集和測(cè)試集,對(duì)應(yīng)的豐水期訓(xùn)練集樣本1 663組、測(cè)試集樣本723組,枯水期訓(xùn)練集樣本1 656 組、測(cè)試集樣本710組。訓(xùn)練集數(shù)據(jù)用于構(gòu)建LSTM模型,將其在測(cè)試集上的平均絕對(duì)誤差和納什效率系數(shù)作為衡量模型預(yù)測(cè)性能的指標(biāo)。

圖3 豐水期和枯水期的降雨量和流量

3.2 結(jié)果

信江干流3個(gè)水文站2007年~2019年的降雨及下游梅港站的流量數(shù)據(jù)如圖3所示。在枯水期,徑流多數(shù)由前期徑流或基流決定,而豐水期,徑流由降水和基流共同影響。豐水期最大日平均流量達(dá)12 100 m3/s,平均值為853 m3/s,枯水期最大日平均流量?jī)H為5 400 m3/s,平均值為348.9 m3/s。豐水期最大日降雨量為218.5 mm,平均值為6.6 mm,枯水期最大日降雨量為96 mm,平均值為3.6 mm。

圖4 3種方案豐水期和枯水期的平均絕對(duì)誤差

平均絕對(duì)誤差通過(guò)計(jì)算所有單個(gè)觀(guān)測(cè)誤差的絕對(duì)值的平均值,可以避免誤差相互抵消的問(wèn)題,因而可以準(zhǔn)確反映實(shí)際預(yù)測(cè)誤差的大小,是衡量LSTM預(yù)測(cè)準(zhǔn)確性的重要指標(biāo)。圖4為豐水期和枯水期LSTM在訓(xùn)練集和測(cè)試集上50次迭代的平均絕對(duì)誤差收斂過(guò)程,測(cè)試集最終的平均絕對(duì)誤差如表3所示。不論是豐水期還是枯水期,方案三以前期降雨和前期徑流共同預(yù)測(cè)當(dāng)日徑流的模擬誤差均為最小,是最適合于信江流域日徑流預(yù)報(bào)的方案。

表3 3種方案豐水期和枯水期的最終平均絕對(duì)誤差

表4 3種方案豐水期和枯水期的納什效率系數(shù)

豐水期和枯水期測(cè)試集的流量預(yù)測(cè)結(jié)果見(jiàn)圖5。豐、枯兩種情形下,方案三的擬合效果都優(yōu)于方案一和方案二。表4相應(yīng)地給出了測(cè)試集各方案的納什效率系數(shù)??傮w看來(lái),各方案枯水期的擬合效果都優(yōu)于豐水期。這是由于枯水期數(shù)據(jù)間的差距要小于豐水期,數(shù)據(jù)本身的不穩(wěn)定性更低。方案一和方案三都具有相當(dāng)高的預(yù)測(cè)精度,其中方案三在豐水期和枯水期的納什效率系數(shù)分別為和0.94和0.96,達(dá)到甲級(jí)預(yù)報(bào)水平。平均絕對(duì)誤差和納什效率系數(shù)兩個(gè)指標(biāo)均表明,方案三在信江流域徑流預(yù)測(cè)中效果最佳,方案一次之,方案二最差。

圖5 豐水期和枯水期測(cè)試集的流量預(yù)測(cè)結(jié)果

4 結(jié)論與討論

研究設(shè)置3種LSTM徑流預(yù)測(cè)學(xué)習(xí)方案,方案三以前期流量和前期降雨共同預(yù)測(cè)當(dāng)日流量最終平均絕對(duì)誤差均低于另外兩組方案,模擬結(jié)果的納什效率系數(shù)又最高;因此,方案三表現(xiàn)最佳。在數(shù)據(jù)可以取得的前提下,應(yīng)當(dāng)優(yōu)先考慮將前期徑流和流域前期降雨資料結(jié)合起來(lái)設(shè)置LSTM徑流預(yù)測(cè)模型的輸入,以取得更加良好的預(yù)測(cè)結(jié)果。這也表明前期徑流和前期降雨兩方面單獨(dú)拿出來(lái)對(duì)斷面來(lái)水的代表性都不足,兩者結(jié)合起來(lái)能夠有效提高數(shù)據(jù)的代表性。研究可用于指導(dǎo)基于數(shù)據(jù)驅(qū)動(dòng)的流域徑流預(yù)測(cè)輸入集數(shù)據(jù)的選取,避免不適當(dāng)?shù)妮斎霐?shù)據(jù)導(dǎo)致預(yù)測(cè)結(jié)果不佳。

猜你喜歡
徑流降雨流域
基于SWAT模型的布爾哈通河流域徑流模擬研究
區(qū)域聯(lián)動(dòng)護(hù)流域
降雨型滑坡經(jīng)驗(yàn)性降雨型閾值研究(以樂(lè)清市為例)
西南岔河徑流特性實(shí)例分析
河南省小流域綜合治理調(diào)查
泥石流
稱(chēng)“子流域”,還是稱(chēng)“亞流域”?
閩東北鷲峰山不同跡地與不同植被恢復(fù)模式對(duì)徑流的影響
流域保護(hù)的制度分析
罗平县| 普宁市| 承德县| 洪江市| 通州市| 乌兰察布市| 保亭| 武汉市| 军事| 齐齐哈尔市| 深泽县| 三门县| 临邑县| 五指山市| 永吉县| 颍上县| 富阳市| 凤台县| 偃师市| 双桥区| 惠州市| 临桂县| 临武县| 泉州市| 沙湾县| 西昌市| 孝感市| 赤峰市| 潞西市| 清丰县| 两当县| 上饶县| 个旧市| 长岛县| 探索| 宁安市| 高要市| 老河口市| 博罗县| 永修县| 桓仁|