国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于鯨魚優(yōu)化算法的長短期記憶模型水庫洪水預(yù)報*

2024-01-13 07:40:28丁藝鼎蔣名亮徐力剛范宏翔呂海深
湖泊科學(xué) 2024年1期
關(guān)鍵詞:洪水神經(jīng)網(wǎng)絡(luò)算法

丁藝鼎,蔣名亮,徐力剛,范宏翔,呂海深

(1:河海大學(xué)水文與水資源學(xué)院,南京 210098) (2:中國科學(xué)院南京地理與湖泊研究所,南京 210018) (3:中國科學(xué)院大學(xué)南京學(xué)院,南京 211135) (4:江西省鄱陽湖流域生態(tài)水利技術(shù)創(chuàng)新中心,南昌 330029)

洪水預(yù)報的目的是預(yù)測短、中、長期河道洪水的發(fā)生與變化趨勢。它為防汛搶險和防洪系統(tǒng)調(diào)度等決策提供依據(jù),為水資源的合理利用和保護(hù)、水利工程的建設(shè)和管理以及工農(nóng)業(yè)的安全生產(chǎn)服務(wù)。我國降水時空分布不均勻,加之全球氣候變暖導(dǎo)致的極端天氣事件,使得我國近年來洪水災(zāi)害發(fā)生頻繁,這種洪水災(zāi)害導(dǎo)致的巨額經(jīng)濟(jì)損失不容小覷,總而言之精準(zhǔn)及時的洪水預(yù)報方案顯得尤為重要。由于城市化的影響,流域中的下墊面情況較自然狀態(tài)發(fā)生了巨大變化,這種變化使得以經(jīng)驗公式為基礎(chǔ)的概念模型不得不重新考慮下墊面變化對經(jīng)驗公式的影響。其次,各種水利工程例如水壩等對自然的徑流過程也有著較大影響,如Nilsson等[1]指出全球大部分的大型河流水文情勢受到大壩建設(shè)的影響;而在我國已建庫容在10萬m3以上的水庫工程98112座,其中大型水庫744座,中型水庫3938座[2],所以當(dāng)前形勢下考慮水利工程影響的洪水預(yù)報有著不言而喻的意義,精確的洪水預(yù)報可以為水庫群之間防洪減災(zāi)和水資源調(diào)控提供實際支撐。

目前應(yīng)用于洪水預(yù)報的水文模型主要有3種:(1)數(shù)學(xué)物理模型;(2)概念模型;(3)數(shù)據(jù)驅(qū)動模型(黑箱)[3-4]。隨著計算機(jī)技術(shù)的發(fā)展,人工智能神經(jīng)網(wǎng)絡(luò)一家獨(dú)大,而深度學(xué)習(xí)又逐漸成為人工智能機(jī)器學(xué)習(xí)領(lǐng)域的主流技術(shù),將深度學(xué)習(xí)理論引入水文預(yù)報已經(jīng)成為當(dāng)下洪水預(yù)報新的發(fā)展方向[5-8]。長短期記憶模型(LSTM)相較于傳統(tǒng)水文模型有著更強(qiáng)的非線性擬合和處理長期記憶的能力,在處理具有時序關(guān)系的問題上表現(xiàn)更加優(yōu)秀[9-12],同時LSTM網(wǎng)絡(luò)可以自動學(xué)習(xí)洪水和降雨的特征,具有更高的自適應(yīng)性和普適性。但是LSTM模型的參數(shù)較多,率定參數(shù)工作量大且傳統(tǒng)的率定方法主要依賴于經(jīng)驗或者人工的方法,容易導(dǎo)致模型的參數(shù)落入局部最優(yōu)解以及泛化能力不強(qiáng)等問題[13],如何提高數(shù)據(jù)驅(qū)動模型在洪水預(yù)報中的準(zhǔn)確性、可解釋性,并增強(qiáng)對未來洪水預(yù)測的能力,是目前洪水預(yù)報領(lǐng)域的研究熱點(diǎn)。針對這類問題本文采用優(yōu)化算法代替人機(jī)交互率定。鯨魚優(yōu)化算法(whale optimization algorithms,WOA)有操作簡單、參數(shù)少以及跳出局部最優(yōu)解能力強(qiáng)等優(yōu)點(diǎn),在求解優(yōu)化問題中展現(xiàn)出優(yōu)良的性能和廣泛的應(yīng)用前景[14]。

因此,本文以浙江省橫錦水庫為研究對象并且選用新安江模型[15]為對比模型,基于1986-1997年洪水資料對該流域進(jìn)行次洪模擬,引入優(yōu)化算法和長短期記憶網(wǎng)絡(luò)構(gòu)建浙江橫錦水庫洪水預(yù)報模型,通過置換特征重要性(permutation feature importance)、SHAP(Shapley additive explanations)方法確定特征權(quán)重,再結(jié)合傳統(tǒng)水文方法分析模擬結(jié)果的物理機(jī)制,以期提高神經(jīng)網(wǎng)絡(luò)模型的預(yù)報可解釋性,為提高模型的外延性[16]提供一種新的思路。

1 數(shù)據(jù)與方法

1.1 研究區(qū)域及數(shù)據(jù)

1.1.1 研究區(qū)數(shù)據(jù)資料 橫錦水庫(29°0′~29°20′N,120°00′~121°00′E)位于我國東南沿海,屬于錢塘江水系,流域多山,土層較薄,并且水系發(fā)育良好。流域?qū)俚湫偷膩啛釒Ъ撅L(fēng)氣候,受東亞季風(fēng)影響,盛行東南風(fēng),降水有明顯的季節(jié)變化,雨量豐沛但時空分布不均,空氣濕潤,雨熱季節(jié)變化同步。橫錦流域控制斷面以上有兩條支流匯入,控制站以上集水面積為378 km2,河長81 km[15]。選取該流域中7個雨量站(史姆、西塢、銅錢、窈村、龍壇、八達(dá)、橫錦)1986-1997年的日蒸發(fā)量以及日降雨量和1 h時段降雨量。1個斷面流量監(jiān)測站(橫錦站)的日流量和時段流量資料,時段長1 h,流域雨量站、流量站分布見圖1。本文以1986-1993作為模型的率定期,1994-1997年作為模型的檢驗期,具體率定期和檢驗期次洪資料的選擇見圖2。

圖2 次洪資料率定期和檢驗期的劃分Fig.2 Division of regular and test period in sub-flood data rate

1.1.2 數(shù)據(jù)輸入與輸出 研究中將水文站的上3個時刻時段流量值、6個雨量站和一個水文站的前3個時段和當(dāng)前時段的雨量資料作為7個特征值輸入模型作為輸入數(shù)據(jù),后第N時段的流量作為輸出值,N為預(yù)見期,本文選預(yù)見期為1 h。

1.2 長短期記憶模型計算原理

LSTM是一種對于傳統(tǒng)的循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)的改進(jìn),在傳統(tǒng)的RNN網(wǎng)絡(luò)中信息由于梯度消失[17],無法學(xué)習(xí)到數(shù)據(jù)中的依賴關(guān)系。在LSTM模型中使用記憶細(xì)胞替換原先RNN中的細(xì)胞單元,從而能有效地提取出時間周期的序列數(shù)據(jù)特征值[18]。LSTM隱藏層中記憶細(xì)胞單元結(jié)構(gòu)如圖3所示。

圖3 LSTM隱藏層中記憶細(xì)胞單元結(jié)構(gòu)Fig.3 The structure of memory cell unit in the hidden layer of LSTM

LSTM區(qū)別于其他神經(jīng)網(wǎng)絡(luò)之處在于其擁有獨(dú)特的單元狀態(tài)(細(xì)胞狀態(tài)),Ct表示神經(jīng)網(wǎng)絡(luò)對于t+1時刻前所有輸入信息的總結(jié)。輸入信息經(jīng)過記憶細(xì)胞單元具體過程如下:

輸入信息通過遺忘門,遺忘門決定了記憶細(xì)胞單元從上一狀態(tài)中遺忘多少信息,其計算式為:

ft=σ[Wf(ht-1,xt)+bf]

(1)

式中,Wf為遺忘門的權(quán)重矩陣;bf為遺忘門的偏移向量;σ為sigmoid激活函數(shù),ft經(jīng)過sigmoid函數(shù)運(yùn)算之后就被約束在(0,1),1表示“全部記憶”,0表示“全部遺忘”。

經(jīng)過輸入門,輸入門決定哪些信息被記憶細(xì)胞單元添加到記憶中,其計算式為:

it=σ[Wf(ht-1,xt)+bi]

(2)

(3)

決定出遺忘和記憶的信息后,對記憶單元狀態(tài)變量進(jìn)行更新計算,其計算式為:

(4)

式中,Ct為更新后的記憶單元狀態(tài)變量,⊙是點(diǎn)乘運(yùn)算。

處理后的數(shù)據(jù)最后通過輸出門Ot,輸出門的計算決定了隱藏層狀態(tài)變量ht,其計算式為:

Ot=σ[W0(ht-1,xt)+b0]

(5)

ht=Ot⊙tanh(Ct)

(6)

式中,W0為輸出門權(quán)重矩陣,b0為輸出門偏移量。

1.3 鯨魚優(yōu)化算法及其改進(jìn)

WOA算法是受到自然界座頭鯨捕食行為啟發(fā)的一種智能優(yōu)化算法,該算法較傳統(tǒng)優(yōu)化算法有精準(zhǔn)度高且收斂速度快的特點(diǎn)。WOA算法的基本工作流程為:(Ⅰ)生成[0,1]的隨機(jī)數(shù)p,當(dāng)p>0.5時采用泡泡網(wǎng)攻擊方式,否則當(dāng)|A|<1時進(jìn)入獵物包圍階段,|A|≥1時進(jìn)入搜索獵物階段;(Ⅱ)隨著迭代次數(shù)不斷增加,a逐漸由2減小到0,|A|也逐漸收斂到0,算法從搜索獵物階段過渡到包圍獵物階段[19]。但是由于WOA算法易陷入局部最優(yōu)并且模型內(nèi)參數(shù)調(diào)整方法簡單從而使得全局探索和局部開發(fā)能力難以平衡[20]。本文使用基于混沌的正余弦策略來改進(jìn)鯨魚優(yōu)化算法,具體改進(jìn)步驟如下:(1)采用在WOA算法中尋優(yōu)能力和收斂速度較好的Tent映射來生成初始種群[21];(2)使用正余弦算法(Sine cosine algorithm,SCA)作為全局優(yōu)化算法篩選首領(lǐng)鯨魚位置;(3)添加基于混沌理論的自適應(yīng)權(quán)重,使算法的全局搜索和局部開發(fā)得到較好的平衡,一定程度上也增加了算法跳出局部最優(yōu)區(qū)域的概率。該策略增加模型跳出局部最優(yōu)的能力,減小了原有模型缺陷[21]。其改進(jìn)的自適應(yīng)權(quán)重計算式為:

(7)

X(t+1)=ω·X*(t)-A·D

(8)

X(t+1)=ω·Xrand-A·Drand

(9)

X(t+1)=D′·ebl·cos(2πl(wèi))+ωX*(t)

(10)

式中,Tmax表示最大迭代次數(shù);ωs表示慣性權(quán)重初始下限;ωe是最大迭代次數(shù)的慣性權(quán)重上限。研究表明,當(dāng)ω在[0.4,0.9]之間變化時,算法具有較好的動態(tài)尋優(yōu)能力。通常較大的慣性權(quán)重能夠讓算法具有較好的全局探索能力,而較小的慣性權(quán)重會使算法具有較好的局部開發(fā)能力,隨著迭代的變化,將慣性權(quán)重從0.9非線性遞減至0.4,表明模型實現(xiàn)以全局探索為主向局部探索能力為主的動態(tài)轉(zhuǎn)變[22],本文所提改進(jìn)的WOA算法的流程如圖4所示。

圖4 改進(jìn)算法流程Fig.4 The flow of the improved algorithm

1.4 WOA-LSTM預(yù)報模型的建立

1.4.1 模型結(jié)構(gòu) 本文選擇使用TensorFlow-GPU 2x深度學(xué)習(xí)框架來搭建網(wǎng)絡(luò)結(jié)構(gòu),通過高階應(yīng)用程序接口Keras來進(jìn)行深度學(xué)習(xí)模型的設(shè)計、調(diào)試、評估、應(yīng)用。構(gòu)建網(wǎng)絡(luò)主要步驟為:

1)數(shù)據(jù)預(yù)處理:本研究使用的是流量和降雨資料,由于數(shù)據(jù)的類型不同,數(shù)據(jù)差異較大,在輸入模型之前需要將輸入數(shù)據(jù)資料進(jìn)行標(biāo)準(zhǔn)化。由于降雨和流量數(shù)據(jù)會時而出現(xiàn)異常值(極端事件),而異常值對極差標(biāo)準(zhǔn)化方法影響巨大,故使用標(biāo)準(zhǔn)差標(biāo)準(zhǔn)化公式(11)。對訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)分別進(jìn)行標(biāo)準(zhǔn)化。

(11)

2)LSTM優(yōu)化器選擇:Bi-LSTM的激活函數(shù)選擇ReLU,全連接層的激活函數(shù)為linear。并且優(yōu)化器選擇Adam算法。

3)損失函數(shù)的選擇:深度學(xué)習(xí)中可供選擇的損失函數(shù)有多種,本次研究最終選擇了較為常用的均方誤差損失(mean squared error, MSE)[23],計算公式為:

(12)

式中,y為實測值;yper為預(yù)測值;n為資料序列長度。

4)數(shù)據(jù)校準(zhǔn)計算:在輸出結(jié)果通過馬氏檢驗后,使用馬爾科夫鏈對最后模型輸出的數(shù)據(jù)進(jìn)行殘差校正。

1.4.2 模型參數(shù)選取 本研究中模型的神經(jīng)網(wǎng)絡(luò)層數(shù)、學(xué)習(xí)率(learning-rate)、迭代輪次(epochs)、單次訓(xùn)練數(shù)據(jù)窗口大小(batch-size)、各層的節(jié)點(diǎn)數(shù)(units)由經(jīng)驗確定范圍后由WOA優(yōu)化算法迭代計算出。分別取Bi-LSTM為1、2、3、4層,在預(yù)見期為1 h時,分別獨(dú)立模擬10次計算的納什系數(shù)(NSE),模擬結(jié)果見圖5。本文選用模擬效果最好的3層Bi-LSTM構(gòu)建LSTM模型。

圖5 不同Bi-LSTM層數(shù)模擬結(jié)果對比Fig.5 Comparison of simulation results with different numbers of Bi-LSTM layers

1.4.3 模型評價指標(biāo) 預(yù)報計算過程與實測過程之間的吻合程度可用確定性系數(shù)NSE來評定。NSE是一個標(biāo)準(zhǔn)化統(tǒng)計指標(biāo),其值介于(-∞,1)之間,等于1表示模型結(jié)果完美擬合實測值。計算公式為:

(13)

另外,還選擇洪峰相對誤差、徑流深相對誤差和峰現(xiàn)時差3個指標(biāo)來評定預(yù)報精度。根據(jù)《水文情報預(yù)報規(guī)范》(GB/T 22482-2008)來最后評價預(yù)報方案精度。

1.5 神經(jīng)網(wǎng)絡(luò)解釋方法

本文采用在Python3.x中使用置換特征方法(permutation feature importance method,PFIM)和SHAP法來計算特征值的重要性,置換特征方法計算步驟為:(1)選擇一個特征值,并且在數(shù)據(jù)集上對該特征值的所有數(shù)據(jù)進(jìn)行隨機(jī)排列。(2)計算新的模型預(yù)測結(jié)果。(3)對比新舊模擬結(jié)果的差異,差異越大說明該特征值越重要。

SHAP是一種用于解釋機(jī)器學(xué)習(xí)模型預(yù)測結(jié)果的方法,它基于Shapley值的概念,給出了一種針對單個特征或特征組合的影響分析方法。在SHAP中,將每個特征視為博弈中的參與者,并將模型的預(yù)測視為博弈中的收益。通過使用多個樣本來計算每個特征的Shapley值,SHAP提供了每個特征對模型預(yù)測的影響的全面解釋。SHAP方法可以解釋機(jī)器學(xué)習(xí)模型中每個特征的相對重要性,即在模型預(yù)測中每個特征對結(jié)果的貢獻(xiàn)大小。

2 結(jié)果與討論

2.1 預(yù)報精度總體效果評價

2.1.1 模型率定期參數(shù)設(shè)置及模擬結(jié)果 文中的LSTM模型和WOA-LSTM模型的參數(shù)率定結(jié)果見表1。LSTM的參數(shù)使用人機(jī)交互率定,而WOA-LSTM參數(shù)使用自動率定,選用NSE作為率定的適配度。為對比研究WOA-LSTM的模擬計算效果,對比模型選用在該地區(qū)運(yùn)用較好的洪水預(yù)報模型——新安江模型[24],通過人機(jī)交互率定法得到新安江模型參數(shù)結(jié)果見表2。

表1 神經(jīng)網(wǎng)絡(luò)參數(shù)率定結(jié)果Tab.1 The results of parameter tuning for neural network

表2 新安江最終參數(shù)Tab.2 The final parameters of the Xin’an River

圖6展示了率定期18場洪水的模擬結(jié)果,并采用NSE、均方根誤差(RMSE)以及洪峰相對誤差(絕對值)等指標(biāo)評估了模型在率定期的性能表現(xiàn)。計算結(jié)果表明,在3個指標(biāo)下,WOA-LSTM模型的性能表現(xiàn)均顯著優(yōu)于其他兩個模型。具體而言,在率定期內(nèi),WOA-LSTM模型的RMSE值為7.23 m3/s,NSE值高達(dá)0.997,這表明該模型不僅能夠準(zhǔn)確地模擬洪峰流量,而且對洪水形狀的刻畫也非常精準(zhǔn)。

圖6 率定期洪水模擬對比Fig.6 Comparison of rate-constant flood simulation

2.1.2 模型檢驗期模擬結(jié)果 使用模型對檢驗期3年(1994-1997年)資料的7場洪水進(jìn)行模擬計算。不同模型模擬計算結(jié)果見圖7,統(tǒng)計得到在檢驗期中LSTM、WOA-LSTM和XAJ 3個模型的NSE值分別為0.946、0.926 和0.858,從NSE數(shù)值來看,神經(jīng)網(wǎng)絡(luò)模型能更好地表達(dá)出實測值和模擬流量之間的關(guān)系。圖7b顯示了實測數(shù)據(jù)和模擬值的頻率累積分布,4條線幾乎一致表明3個模型都可以較好地模擬出該流域的洪水過程,但是由于模型本身和資料誤差會導(dǎo)致模型在模擬過程中出現(xiàn)異常值。圖7a得出LSTM和WOA-LSTM在模擬過程中都出現(xiàn)了異常值,盡管LSTM模型能夠更好地擬合小流量數(shù)據(jù),在大流量模擬時表現(xiàn)欠佳。初步分析表明,這可能是由于模型結(jié)構(gòu)復(fù)雜度和參數(shù)未達(dá)到最優(yōu)配置,從而導(dǎo)致洪水預(yù)測偏大。為了進(jìn)一步驗證這一結(jié)論,表3統(tǒng)計了檢驗期7次洪水事件的洪峰流量相對誤差、NSE、徑流深相對誤差以及峰現(xiàn)時差。

表3 目標(biāo)函數(shù)計算Tab.3 Objective function

圖7 檢驗期7場洪水模擬結(jié)果對比Fig.7 The comparison of simulation results for seven flood events during the verification period

根據(jù)《水文情報規(guī)范》(GB/T 22482-2008),3個模型模擬的7場洪水,WOA-LSTM和XAJ模擬結(jié)果洪峰相對誤差、徑流深相對誤差和峰現(xiàn)時差全部小于誤差許可,除LSTM模擬的31950426號洪水峰現(xiàn)時差大于誤差許可3 h外,其余預(yù)測洪水全部達(dá)標(biāo)。洪峰相對誤差的絕對值全部小于誤差許可20%,但是LSTM模型預(yù)測的7場洪水中有6場洪水的預(yù)報洪峰大于實測值,存在系統(tǒng)誤差,相對誤差最大值為17.58,接近誤差許可,這與圖7a得到的結(jié)論相吻合,說明LSTM在預(yù)測大流量時確實存在過擬合問題。而本文所使用的WOA-LSTM模型中由于優(yōu)化的參數(shù)選取和MC矯正流量殘差,雖然小幅度增大了洪水過程線的波動而減小了NSE值,但是卻極大地減小了LSTM自身模擬洪峰偏大的誤差。從模擬效果來看,WOA-LSTM的NSE平均值為0.915、LSTM的NSE平均值為0.928,而洪峰流量誤差絕對均值卻由LSTM模擬的8%下降到4.9%,降幅約為40%,可見鯨魚優(yōu)化算法、長短期記憶算法和馬爾科夫鏈結(jié)合使用在保證流量預(yù)測精度的同時,避免了預(yù)測大流量時存在的過擬合問題,提升了洪峰流量預(yù)測精度。綜上所述,WOA-LSTM擁有更好的模擬效果。

2.2 典型洪水模擬分析

當(dāng)相同的模型應(yīng)用于不同的洪水過程時,其表現(xiàn)往往取決于降雨情況的復(fù)雜性。多峰洪水相比于單峰洪水,其洪峰流量的大小、時間、洪水過程等方面都更為復(fù)雜,而大流量洪峰由于短時間內(nèi)迅速形成,數(shù)據(jù)采集和傳輸過程中可能存在延遲或遺漏,兩種情況都會導(dǎo)致預(yù)報的準(zhǔn)確性下降,本節(jié)對比分析了3個模型對檢驗期這兩種典型洪水的模擬結(jié)果,分別為多次降雨造成典型多峰洪水(31940609、31950426)和單次強(qiáng)降雨帶來的典型單峰洪水(31970818)。

從3次典型洪水的流量過程線(圖8)可以看出,XAJ模型在模擬復(fù)雜降雨過程帶來的多峰洪水時,往往誤差較大,尤其體現(xiàn)在洪峰流量和退水過程。而LSTM和WOA-LSTM模型卻能較好地模擬多峰洪水的復(fù)雜過程。而在大洪水預(yù)報中,由于歷史大洪水資料少,長短期模型能學(xué)習(xí)到的特征也會變少,從而影響到預(yù)測精度,在本文中加入了馬爾科夫鏈殘差矯正步驟可以在一定程度上減少由于學(xué)習(xí)資料少而帶來的精度下降問題。圖8顯示,31970818號洪水在檢驗期中洪峰流量最大,LSTM的模擬結(jié)果無論是洪峰流量還是峰現(xiàn)時間都有較明顯的偏差,而這一偏差在WOA-LSTM中則變得微乎其微,說明這種改進(jìn)策略在橫錦水庫的洪水預(yù)報中是可行的。

圖8 典型洪水流量過程線Fig.8 Typical flood flow process line

2.3 不同預(yù)見期下模擬結(jié)果與比較

本節(jié)分析了3種模型在不考慮未來降雨情況下的預(yù)報能力,具體方法是從預(yù)報時刻開始,不考慮未來降雨資料,僅利用現(xiàn)有的實測降雨資料和流量資料作為模型輸入,每1 h驅(qū)動一次模型,對洪水過程進(jìn)行逐時段預(yù)報分析。

表4表明,3種模型在預(yù)見期增加后預(yù)報能力都有所下降,當(dāng)預(yù)見期為4 h時,WOA-LSTM、LSTM和XAJ對率定期洪水的綜合NSE分別為0.88、0.84和 0.74,WOA-LSTM模型有5場NSE優(yōu)于其他兩個模型,平均洪峰相對誤差XAJ模型較低,但是總體相差不大。當(dāng)預(yù)見期為6 h時,WOA-LSTM和LSTM的率定期綜合NSE分別為0.72和0.58,WOA-LSTM模型要遠(yuǎn)好于LSTM,對于其他3個指標(biāo)二者相差不大。當(dāng)預(yù)見期為8 h時,WOA-LSTM和LSTM的率定期綜合NSE分別為0.55和0.34,峰現(xiàn)時差分別為3和5 h,平均洪峰相對誤差分別為22.9%和27.0%,平均徑流深相對誤差為21%和22%。在這4個指標(biāo)中,WOA-LSTM模型的表現(xiàn)都要優(yōu)于LSTM模型。雖然隨著預(yù)見期增加WOA-LSTM模型預(yù)報精度有所下降,但是下降幅度要小于LSTM??偠灾?WOA-LSTM模型在預(yù)見期2~8 h內(nèi)模擬結(jié)果都要好于其他兩個模型。

表4 不同預(yù)見期預(yù)報結(jié)果比較Tab.4 Comparison of forecast results at different lead times

從不同預(yù)見期預(yù)測結(jié)果分析中可以看出神經(jīng)網(wǎng)絡(luò)模型的優(yōu)勢在于,即使沒有實時降雨資料輸入,它仍能夠有效地考慮未來降雨對系統(tǒng)的影響。通過利用過去的降雨數(shù)據(jù),神經(jīng)網(wǎng)絡(luò)能夠推斷未來降雨的潛在模式和趨勢,從而提供對系統(tǒng)響應(yīng)和預(yù)測的有價值信息。因此,該模型不僅在實時數(shù)據(jù)可獲得時表現(xiàn)出色,而且在沒有實時降雨資料時仍能提供有意義的預(yù)測和決策支持。例如在預(yù)見期6 h時,XAJ模型模擬的31940820號洪水洪峰相對誤差高達(dá)48.4%,而其他兩個模型模擬的洪峰相對誤差在6%以內(nèi),仍然可以較好地刻畫出洪峰流量,說明較傳統(tǒng)水文模型在長預(yù)見期且無未來降水資料輸入時表現(xiàn)不佳,神經(jīng)網(wǎng)絡(luò)模型依舊可以預(yù)測到一定的洪水特征。但是當(dāng)預(yù)見期增加時,數(shù)據(jù)關(guān)聯(lián)性減小,可能會使得模型學(xué)到無用特征而產(chǎn)生過擬合現(xiàn)象,導(dǎo)致模型預(yù)報精度下降[25]。在預(yù)見期為8 h時,WOA-LSTM和LSTM產(chǎn)生的loss曲線見圖9。在LSTM模型中隨著迭代輪次增加,測試集的損失逐漸增大,證明在關(guān)聯(lián)度差的數(shù)據(jù)集中LSTM模型確實會存在過擬合現(xiàn)象,而這種現(xiàn)象在WOA-LSTM模型訓(xùn)練時卻并沒有這么明顯。證明由于WOA優(yōu)化算法,進(jìn)一步優(yōu)化了神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),提高了模型的穩(wěn)定性,降低了過擬合的風(fēng)險。盡管LSTM在納什效率方面表現(xiàn)更好,但在其他方面卻不如WOA-LSTM,WOA-LSTM在綜合效果上更出色。

圖9 模型擬合損失曲線Fig.9 The model fitting loss curve

綜上所述,WOA-LSTM在無需輸入降雨資料的較長預(yù)見期內(nèi),可以一定程度上避免過擬合,從而保持良好的預(yù)測精度和魯棒性。

2.4 WOA-LSTM可解釋性的討論

神經(jīng)網(wǎng)絡(luò)模型是典型的黑箱子模型,由于本身不是構(gòu)建于物理規(guī)律基礎(chǔ)上的,所以模型可解釋性較差,探究其參數(shù)和模型構(gòu)造背后的物理意義逐漸成為神經(jīng)網(wǎng)絡(luò)模型新的發(fā)展方向[26]。

本文先使用PFIM法和SHAP法分別計算各特征值的重要性,再結(jié)合水文模型和氣象學(xué)中使用較多的泰森多邊形法(thiessen polygon method,TPM)和實際流域特性驗證得到的雨量站面積權(quán)重的合理性。

由表5泰森多邊形計算結(jié)果表明橫錦流域各雨量站重要性相似,結(jié)合圖1分析,說明研究流域中各雨量站分布均勻,面積權(quán)重應(yīng)該相似。圖10對比了不同方法得到的特征值重要性值,除了SHAP法給橫錦站賦予了較低的權(quán)重外,SHAP、泰森多邊形、PFMI所計算的權(quán)重值分布大致相同,表明WOA-LSTM模型可以通過數(shù)據(jù)資料學(xué)習(xí)到流域中一定的雨量站面積權(quán)重特征,而這種面積權(quán)重是符合現(xiàn)實地理分布的。

表5 不同方法的特征值權(quán)重Tab.5 Eigenvalue weights of different methods

圖10 站點(diǎn)面積權(quán)重與特征值的重要性評估Fig.10 Importance evaluation of the station area weight and characteristic value

2.5 結(jié)語

本文以橫錦流域作為研究區(qū)域,結(jié)合改進(jìn)的鯨魚優(yōu)化算法,馬爾科夫鏈和長短期記憶神經(jīng)網(wǎng)絡(luò)共同構(gòu)建洪水預(yù)報模型,討論了在不同預(yù)見期下模型的預(yù)測性能、結(jié)合置換特征,SHAP方法增加了模型的可解釋性,得到結(jié)果如下:

1)在對場次洪水預(yù)報中,當(dāng)預(yù)見期同為1 h時,檢驗期1994-1997年7場洪水的NSE值為0.926,徑流深相對誤差、洪峰相對誤差和峰現(xiàn)時差全部在誤差許可以內(nèi),且優(yōu)于對比模型。

2)WOA-LSTM模型中WOA優(yōu)化算法通過改變神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),從而降低模型在復(fù)雜數(shù)據(jù)集上的過擬合風(fēng)險。

3)通過泰森多邊形,SHAP和置換特征值方法相互驗證,表明WOA-LSTM模型可以在訓(xùn)練模型時學(xué)習(xí)到一定的物理機(jī)制,增加模型的可解釋性。

綜上所述,通過將優(yōu)化算法和神經(jīng)網(wǎng)絡(luò)相結(jié)合,在一定程度上避免了人工率定超參數(shù)陷入局部解、過擬合等問題,并且在水庫洪水預(yù)報過程中取得較好的成果,同時通過計算機(jī)方法和水文方法驗證了神經(jīng)網(wǎng)絡(luò)在訓(xùn)練模型時可以學(xué)到一定的物理特征作為數(shù)據(jù)預(yù)測的基礎(chǔ),表明在以后的研究中可以結(jié)合置換特征值等一些新方法進(jìn)一步增加神經(jīng)網(wǎng)絡(luò)的可解釋性,增加模型計算結(jié)果的說服力。但是本文對于神經(jīng)網(wǎng)絡(luò)物理機(jī)制的研究還不夠深入,今后可以通過更多的計算機(jī)方法,從神經(jīng)細(xì)胞層面剖析模型的物理機(jī)制,增加模型的泛化能力,也可以結(jié)合水文統(tǒng)計等方法進(jìn)一步提高模型預(yù)報結(jié)果精度。

猜你喜歡
洪水神經(jīng)網(wǎng)絡(luò)算法
神經(jīng)網(wǎng)絡(luò)抑制無線通信干擾探究
電子制作(2019年19期)2019-11-23 08:42:00
基于MapReduce的改進(jìn)Eclat算法
Travellng thg World Full—time for Rree
洪水時遇到電線低垂或折斷該怎么辦
進(jìn)位加法的兩種算法
又見洪水(外二首)
天津詩人(2017年2期)2017-11-29 01:24:25
一種改進(jìn)的整周模糊度去相關(guān)算法
基于神經(jīng)網(wǎng)絡(luò)的拉矯機(jī)控制模型建立
洪水來了
幼兒畫刊(2016年8期)2016-02-28 21:00:52
復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應(yīng)用
三原县| 梨树县| 定兴县| 岑巩县| 清苑县| 潼南县| 体育| 临海市| 邻水| 九龙城区| 阿巴嘎旗| 淮安市| 靖边县| 长汀县| 观塘区| 沁阳市| 阳泉市| 青川县| 巴中市| 芮城县| 汕尾市| 丰台区| 侯马市| 凉城县| 利辛县| 邮箱| 永靖县| 察雅县| 岗巴县| 阳新县| 嘉兴市| 隆化县| 延安市| 广昌县| 卢龙县| 泗水县| 屯留县| 连云港市| 安福县| 霞浦县| 沈阳市|