国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于時(shí)空特征挖掘的流量過程智能模擬方法

2021-02-22 09:00:24朱躍龍余宇峰萬定生
關(guān)鍵詞:測站水文卷積

朱躍龍,趙 群,余宇峰,萬定生

(河海大學(xué)計(jì)算機(jī)與信息學(xué)院,江蘇 南京 211100)

近年來,全球氣候變暖,極端降水事件頻發(fā)導(dǎo)致了各種洪澇災(zāi)害,給人類帶來巨大的經(jīng)濟(jì)社會損失。僅2020年全國共出現(xiàn)45次強(qiáng)降水過程,面降水量622 mm,較常年同期偏多13%,引發(fā)珠江、長江、黑龍江3個(gè)流域極端嚴(yán)重的流域性洪澇災(zāi)害[1]。為了減輕洪水災(zāi)害帶來的不利影響,及時(shí)準(zhǔn)確的水文預(yù)報(bào)顯得尤為重要。水文預(yù)報(bào)是根據(jù)前期的水文氣象資料,對未來一定時(shí)期的水文資料進(jìn)行預(yù)報(bào),對防洪救災(zāi)的決策、水資源的合理利用等具有重要意義[2]。

隨著大數(shù)據(jù)時(shí)代的到來,基于數(shù)據(jù)驅(qū)動的水文預(yù)報(bào)模型在水文事件預(yù)報(bào)中越來越受到重視[3-4]。數(shù)據(jù)驅(qū)動的水文預(yù)報(bào)模型從歷史水文資料出發(fā),挖掘規(guī)律進(jìn)行預(yù)測,為相關(guān)水利人員提供了一個(gè)新的預(yù)測方案。但現(xiàn)有基于數(shù)據(jù)驅(qū)動的水文模型大多側(cè)重于從歷史數(shù)據(jù)中學(xué)習(xí)時(shí)間特征,很少兼顧到數(shù)據(jù)的空間特征[5]。水文數(shù)據(jù)往往包含豐富的時(shí)空特征信息,而該特征信息可以為水文時(shí)空序列相似性,水文時(shí)空數(shù)據(jù)建模分析等作出貢獻(xiàn)[6],本文提出一種基于時(shí)空特征挖掘的流量過程智能模擬方法GS-Hydro,構(gòu)建水文結(jié)構(gòu)關(guān)系圖,利用圖卷積網(wǎng)絡(luò)挖掘空間特征的同時(shí)利用門控循環(huán)單元捕捉時(shí)間特征,以此提高預(yù)測精度。

1 水文預(yù)報(bào)模型相關(guān)研究

1.1 基于數(shù)據(jù)驅(qū)動的洪水預(yù)報(bào)模型

數(shù)據(jù)驅(qū)動模型是從數(shù)據(jù)著手,通過對時(shí)間序列數(shù)據(jù)的分析,從大量的數(shù)據(jù)中發(fā)現(xiàn)和揭示數(shù)據(jù)的發(fā)展變化規(guī)律,以此估測和控制未來可能出現(xiàn)的狀況?;跀?shù)據(jù)驅(qū)動的洪水預(yù)報(bào)模型從歷史水文資料出發(fā),挖掘規(guī)律進(jìn)行預(yù)測,相較于其他水文模型具有普適性。

Hwang等[7]提出一種基于最小二乘支持向量機(jī)(LS-SVM)的非線性水文時(shí)間序列預(yù)測方法,具有較好的預(yù)測精度和預(yù)測性能。Xing等[8]提出一種新的啟發(fā)式優(yōu)化算法BA算法,用于優(yōu)化SVM參數(shù)和預(yù)測2015年月平均流量,其預(yù)測精度比交叉驗(yàn)證的支持向量機(jī)更高。Atiquzzaman等[9-10]針對傳統(tǒng)基于梯度的慢學(xué)習(xí)算法在訓(xùn)練和迭代確定網(wǎng)絡(luò)參數(shù)時(shí)的不確定性問題,提出一種基于極限學(xué)習(xí)機(jī)(ELM)的水文時(shí)間序列快速預(yù)測方法。根據(jù)洪水形成的基本原理,Chen等[11]提出一種基于數(shù)據(jù)驅(qū)動和機(jī)器學(xué)習(xí)的卷積回歸水文預(yù)報(bào)模型,該模型能夠反映小時(shí)降雨量對未來流量變化的影響,并通過疊加這些影響預(yù)測流量變化。

1.2 基于時(shí)空特征的預(yù)報(bào)模型

除了時(shí)序特征,自然界大部分的數(shù)據(jù)還具有空間結(jié)構(gòu)聯(lián)系。相比于單一的時(shí)序預(yù)測,基于時(shí)空特征結(jié)合的預(yù)測考慮了數(shù)據(jù)之間的空間特性,能夠挖掘出更多的信息規(guī)律,提高預(yù)測精度,而空間特征與時(shí)間特征的結(jié)合預(yù)報(bào)也被廣泛地運(yùn)用到了各大領(lǐng)域[12-13]。

Ding等[14]利用長短期記憶模型,提出洪水預(yù)報(bào)模型(STA-LSTM模型),動態(tài)提取關(guān)鍵特征向量,實(shí)現(xiàn)中小河流洪水預(yù)報(bào)。除此之外,空間特征也可用于水文學(xué)的許多方面,如水文相似性分析[15]、流域場景模式庫構(gòu)建[16]、用水效率分析[17]等。

目前基于數(shù)據(jù)驅(qū)動的水文預(yù)報(bào)模型大多考慮時(shí)序特征,很少考慮河流之間的地理聯(lián)系和空間特征。單一測站的水文數(shù)據(jù)具有時(shí)間連續(xù)性、周期性,而將多測站的水文數(shù)據(jù)放在一起,不難看出它們之間的空間聯(lián)系。本文提出一種基于地理關(guān)系的時(shí)空智能流量過程模擬模型,通過地理關(guān)系建立測站之間的結(jié)構(gòu)聯(lián)系,輔助預(yù)測目標(biāo)測站的流量值。

2 基于時(shí)空挖掘的智能流量過程模擬模型

現(xiàn)實(shí)世界中存在大量的圖結(jié)構(gòu)或網(wǎng)絡(luò)結(jié)構(gòu)數(shù)據(jù),傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)難以處理。為了解決這一問題,一種處理圖結(jié)構(gòu)網(wǎng)絡(luò)的半監(jiān)督分類方法——圖卷積神經(jīng)網(wǎng)絡(luò)(graph convolutional networks,GCN)[18]被提出,并被廣泛應(yīng)用于社會網(wǎng)絡(luò)、信息網(wǎng)絡(luò)等領(lǐng)域的特征學(xué)習(xí)。與CNN不同,GCN對圖像進(jìn)行像素卷積,并可以挖掘網(wǎng)絡(luò)結(jié)構(gòu)。目前,GCN主要對社會網(wǎng)絡(luò)、信息網(wǎng)絡(luò)等非結(jié)構(gòu)化數(shù)據(jù)提取特征進(jìn)行學(xué)習(xí),然而很少有人在水文時(shí)間序列數(shù)據(jù)中使用。

本文構(gòu)造了一種新的水文站點(diǎn)地理位置關(guān)系圖,利用GCN挖掘空間特征,再利用門控循環(huán)單元(GRU)[19]挖掘時(shí)間特征,進(jìn)一步進(jìn)行水文預(yù)報(bào),方法結(jié)構(gòu)如圖1所示,圖中Xt為t時(shí)刻的輸入樣本,Ht為模型輸出。

圖1 GS-Hydro模型結(jié)構(gòu)Fig.1 Structure of GS-Hydro model

輸入層,以河流流量信息和當(dāng)前時(shí)段面平均雨量信息為自變量,實(shí)現(xiàn)數(shù)據(jù)規(guī)范化、訓(xùn)練集劃分、驗(yàn)證集劃分、測試集劃分等。隱藏層,在空間方面利用圖卷積神經(jīng)網(wǎng)絡(luò)捕捉河流復(fù)雜的網(wǎng)絡(luò)特征;在時(shí)間方面利用門控循環(huán)單元將前一時(shí)刻的信息傳遞到下一時(shí)刻,其中的更新門和復(fù)位門可以更好、更快地確定信息,為模型留下更多有價(jià)值的信息。輸出層,對數(shù)據(jù)進(jìn)行反規(guī)范化處理,并對輸出結(jié)果進(jìn)行預(yù)測。

2.1 基于距離的水文測站關(guān)系結(jié)構(gòu)圖

2.1.1 水文測站關(guān)系結(jié)構(gòu)圖的建立

結(jié)構(gòu)圖的生成是訓(xùn)練圖卷積網(wǎng)絡(luò)模型的第一步,也是重要的一步。如果結(jié)構(gòu)圖不能很好地反映節(jié)點(diǎn)之間的關(guān)系,模型可能無法有效地挖掘信息。定義水文測站關(guān)系結(jié)構(gòu)圖如下:

G=(V,E)

(1)

式中:G——水文測站地理位置關(guān)系圖;V——節(jié)點(diǎn),指各個(gè)水文測站;E——連接點(diǎn)邊的集合,指各個(gè)水文測站間的地理關(guān)系。

河道距離是目標(biāo)流域到它的上游流域之間的河流長度,根據(jù)DEM估算。當(dāng)每個(gè)網(wǎng)格中的水以最陡的坡度流向其相鄰網(wǎng)格時(shí),可以找到水從任何點(diǎn)到海洋或者從研究區(qū)域流出的流動路徑。如果上游的水流經(jīng)過下游的水流,則河道距離是它們之間的流路長度。如果它們沒有河道聯(lián)系,則河道距離為零。

鄰接矩陣是存放節(jié)點(diǎn)間關(guān)系(邊或弧)數(shù)據(jù)的數(shù)組,定義如下:

(2)

式中:ai,j——鄰接矩陣中第i行、第j列的元素;α、β、δ——矩陣中元素的系數(shù)。

對模型進(jìn)行訓(xùn)練擬合出適合的α、β和δ,然后求出水文測站地理位置關(guān)系圖的邊,以此構(gòu)造水文測站地理位置關(guān)系結(jié)構(gòu)圖。值得注意的是,當(dāng)?shù)乩砭嚯x較大且沒有河道距離時(shí),2個(gè)水文測站的流量變化幾乎沒有關(guān)聯(lián),本文對水平距離100 km以內(nèi)的站點(diǎn)計(jì)算節(jié)點(diǎn)間的關(guān)系。

2.1.2 圖卷積操作

本文使用圖卷積網(wǎng)絡(luò)對各測站進(jìn)行空間特征挖掘,如圖2所示。

圖2 空間特征提取Fig.2 Spatial feature extraction

圖卷積網(wǎng)絡(luò)定義如下:

X(l+1)=f(X(l),A)

(3)

式中:l——層數(shù);X(l)——l層節(jié)點(diǎn)的特征;A——鄰接矩陣。

首先輸入特征矩陣和鄰接矩陣,然后對節(jié)點(diǎn)進(jìn)行特征變換,用度矩陣對鄰接矩陣進(jìn)行歸一化。加入自循環(huán)后,考慮每個(gè)節(jié)點(diǎn)與相鄰節(jié)點(diǎn)之間的關(guān)系,具體模型如下:

(4)

2.2 基于時(shí)空特征的智能流量過程模擬模型

進(jìn)行空間特征提取后可以對時(shí)間特征進(jìn)行處理,本文使用門控循環(huán)單元(GRU)進(jìn)行時(shí)間特征的提取。GRU可以改進(jìn)長短時(shí)記憶網(wǎng)絡(luò)[21](LSTM)的門設(shè)計(jì),克服梯度消失問題。同時(shí),它具有更快的收斂速度,改善了LSTM訓(xùn)練耗時(shí)的問題。

設(shè)定模型損失函數(shù)為均方誤差函數(shù)e,計(jì)算公式如下。

(5)

式中:yt——t時(shí)刻的預(yù)測值;Yt——t時(shí)刻的真實(shí)值;n——模型輸入的樣本數(shù)目。

模型具體計(jì)算過程如下。

a.空間特征提取(以兩層卷積為例):

(6)

b.更新門構(gòu)建:zt=σz(Wz[ht-1,f(Xt,A)])

(7)

c.重置門構(gòu)建:rt=σr(Wr[ht-1,f(Xt,A)])

(8)

(9)

(10)

通過全連接層得到最終輸出:yt=O(Wcht+b),其中O(·)為線性函數(shù);Wc為權(quán)重;b為偏置。

3 試 驗(yàn) 分 析

3.1 數(shù)據(jù)集

試驗(yàn)選取江西省鄱陽湖流域外洲站作為模型流量過程測試站點(diǎn),如圖3所示。試驗(yàn)選取外洲站1998—2010年夏季小時(shí)時(shí)段洪水流量21 060條數(shù)據(jù)以及降雨資料作為數(shù)據(jù),對區(qū)域內(nèi)雨量站的降雨量進(jìn)行算術(shù)平均從而獲得面降雨量,選取前6 h內(nèi)的小時(shí)時(shí)段降雨作為降雨信息對流量預(yù)測提供輔助,區(qū)域內(nèi)選取的雨量站如圖4所示。由于部分降雨不完全,采用水文中常用的線性插值方法對缺失的雨量進(jìn)行補(bǔ)充。試驗(yàn)以各個(gè)水文站為節(jié)點(diǎn),站點(diǎn)之間的地理關(guān)系為鄰接矩陣,各站點(diǎn)的歷史小時(shí)流量數(shù)據(jù)和小時(shí)降雨數(shù)據(jù)為特征矩陣。試驗(yàn)使用60%的數(shù)據(jù)集作為訓(xùn)練數(shù)據(jù)集,20%作為驗(yàn)證數(shù)據(jù)集,20%作為測試數(shù)據(jù)集。

圖3 江西省試驗(yàn)?zāi)M測試站點(diǎn)Fig.3 Experimental simulation test stations in Jiangxi Province

圖4 外洲站周圍雨量站示意圖Fig.4 Schematic diagram of rainfall stations around Waizhou Station

3.2 評價(jià)指標(biāo)及參數(shù)選取

評價(jià)指標(biāo)采用均方根誤差和確定性系數(shù)。采用支持向量機(jī)模型(SVM)[22]、長短時(shí)記憶網(wǎng)絡(luò)(LSTM)、門控循環(huán)單元(GRU)和提出的GS-Hydro模型進(jìn)行訓(xùn)練。訓(xùn)練參數(shù)根據(jù)試驗(yàn)調(diào)試,最優(yōu)超參配置如下:SVM的懲罰系數(shù)為0.3,核函數(shù)為徑向基核函數(shù),區(qū)間為0.05。LSTM的隱節(jié)點(diǎn)數(shù)為100,學(xué)習(xí)因子的區(qū)間為0.005,批處理大小為128,迭代次數(shù)為40。GUR中隱藏節(jié)點(diǎn)數(shù)為50,學(xué)習(xí)速率為0.005,批處理大小為32,迭代次數(shù)為50。GS-Hydro模型中的隱藏節(jié)點(diǎn)數(shù)為32,學(xué)習(xí)速率為0.005,批處理大小為64,迭代次數(shù)為100。

3.3 試驗(yàn)結(jié)果分析

外洲站SVM、LSTM、GRU和GS-Hydro的模型流量3 h預(yù)見期預(yù)測模擬計(jì)算結(jié)果如圖5所示,不同模型在模擬預(yù)測中的評價(jià)指標(biāo)見表1。

圖5 江西省外洲站3 h預(yù)見期下各模型流量預(yù)測結(jié)果Fig.5 Runoff prediction results of Waizhou Station in 3-hour forecast period with different models

表1 各模型預(yù)測結(jié)果評價(jià)指標(biāo)對比Table 1 Comparison of prediction results of different models

從圖5中可以看出,SVM的預(yù)測結(jié)果比較抖動,得到的預(yù)測曲線不如LSTM、GRU和GS-Hydro穩(wěn)定。LSTM和GRU的預(yù)測結(jié)果相似,GS-Hydro比GRU好,比LSTM更穩(wěn)定。

從表1可以看出,1h流量預(yù)測相對最準(zhǔn)確,預(yù)見期越長,精度越低。GS-Hydro是所有不同預(yù)測期的最佳模型,LSTM和GRU的性能略好于GRU,支持向量機(jī)表現(xiàn)最差。GS-Hydro的確定性系數(shù)最高,LSTM與GRU的差異不顯著,SVM稍差。因此,GS-Hydro模型在整體預(yù)測結(jié)果中是最好的,是因?yàn)镚CN捕捉了流量的空間特征,在預(yù)測過程中加入了空間內(nèi)多個(gè)相關(guān)站的雨量,避免了梯度消失和均值漂移的問題。

4 結(jié) 語

本文提出了一種新的流量過程智能模擬方法GS-Hydro,該方法將圖卷積網(wǎng)絡(luò)(GCN)與門控循環(huán)單元(GRU)相結(jié)合,先建立基于河道關(guān)系的水文站點(diǎn)地理位置關(guān)系圖用以進(jìn)行特征挖掘,再將GCN用于獲取樣本的空間特征,GRU用于捕捉樣本的時(shí)間特征。試驗(yàn)表明GS-Hydro模型的性能優(yōu)于其他神經(jīng)網(wǎng)絡(luò)模型。

猜你喜歡
測站水文卷積
2022年《中國水文年報(bào)》發(fā)布
GNSS鐘差估計(jì)中的兩種測站選取策略分析
基于3D-Winograd的快速卷積算法設(shè)計(jì)及FPGA實(shí)現(xiàn)
水文
水文水資源管理
從濾波器理解卷積
電子制作(2019年11期)2019-07-04 00:34:38
全球GPS測站垂向周年變化統(tǒng)計(jì)改正模型的建立
基于傅里葉域卷積表示的目標(biāo)跟蹤算法
測站分布對GPS解算ERP的影響分析
城市勘測(2018年1期)2018-03-15 03:37:02
水文
嘉义市| 信阳市| 张家港市| 安塞县| 苏尼特左旗| 尼玛县| 桑日县| 石阡县| 湖口县| 西藏| 湘阴县| 常山县| 呼图壁县| 高陵县| 萍乡市| 大荔县| 汾西县| 清新县| 杭锦后旗| 南丰县| 麻江县| 通州区| 西丰县| 深泽县| 汝南县| 洛扎县| 叙永县| 米泉市| 新乐市| 甘洛县| 平果县| 夏邑县| 宝坻区| 惠州市| 陈巴尔虎旗| 杭锦旗| 兴海县| 合肥市| 湖口县| 南康市| 白城市|