鐘鳴,張鴻瑞,王一帆,耿浩
(1.中山大學(xué)地理科學(xué)與規(guī)劃學(xué)院,廣東 廣州 510275;2.云南電網(wǎng)有限責(zé)任公司電力科學(xué)研究院,云南 昆明 650217)
在全球氣候變暖與人類活動(dòng)的影響下,降雨、徑流等水文循環(huán)過程都發(fā)生了變化,全球水資源危機(jī)和洪澇災(zāi)害風(fēng)險(xiǎn)顯著增加[1]。徑流預(yù)測是流域防洪減災(zāi)、水資源優(yōu)化配置的重要依據(jù),也是當(dāng)前全球水文水資源領(lǐng)域的研究重點(diǎn)之一。
目前,徑流預(yù)測模型可分為物理機(jī)制模型和數(shù)據(jù)驅(qū)動(dòng)模型兩類。物理機(jī)制模型主要從物理機(jī)制上對降水、蒸散發(fā)、入滲等關(guān)鍵水文過程進(jìn)行解釋和描述,進(jìn)而實(shí)現(xiàn)產(chǎn)匯流計(jì)算。在這個(gè)過程中,采用合適的經(jīng)驗(yàn)推導(dǎo)公式或者計(jì)算方程刻畫水文過程,因此物理機(jī)制模型對水文氣象數(shù)據(jù)和流域水文特性參數(shù)提出了較高要求[2]。隨著水文科學(xué)的發(fā)展,物理機(jī)制模型的發(fā)展呈現(xiàn)從集總式模型到分布式模型的趨勢,一定程度上提高了徑流預(yù)報(bào)的準(zhǔn)確性[3]。數(shù)據(jù)驅(qū)動(dòng)模型是從數(shù)據(jù)中學(xué)習(xí)物理現(xiàn)象的長期規(guī)律,建立輸入與輸出數(shù)據(jù)之間潛在的映射關(guān)系,弱化了徑流形成的物理過程,從而擁有了更快的運(yùn)算效率和良好的模擬性能。傳統(tǒng)應(yīng)用于徑流預(yù)測的數(shù)據(jù)驅(qū)動(dòng)模型包括自適應(yīng)模糊推理系統(tǒng)(Adaptive Network-based Fuzzy Inference System,ANFIS)、人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)、反向傳播網(wǎng)絡(luò)(Back Propagation Network,BP)、支持向量機(jī)(Support Vector Machine, SVM)等算法,隨著大數(shù)據(jù)和機(jī)器學(xué)習(xí)的發(fā)展,深度學(xué)習(xí)作為一種基于概率論不斷遞歸進(jìn)而尋求最優(yōu)解的方法,能夠通過分層學(xué)習(xí)從大量數(shù)據(jù)集中挖掘復(fù)雜特征。因此,深度學(xué)習(xí)在時(shí)間序列預(yù)測和挖掘數(shù)據(jù)長期相關(guān)性上具有明顯優(yōu)勢,特別是在徑流預(yù)測中,深度學(xué)習(xí)表現(xiàn)出了比其他模型明顯更強(qiáng)的預(yù)報(bào)性能[4]。例如,Bai 等[5]提出基于級聯(lián)框架的LSTM 模型,對日徑流進(jìn)行預(yù)測,通過級聯(lián)建模,可以在一個(gè)框架內(nèi)通過多個(gè)模型充分提取多個(gè)目標(biāo)在不同階段的特征;Lin 等[6]將DIFF 和FFNN 模型引入LSTM 中,從模型結(jié)構(gòu)、參數(shù)及輸入的角度分析模型在徑流模擬中的有效性;Xiang 等[7]提出了基于LSTM 的LSTM-seq2seq模型,并將其用于每小時(shí)的徑流預(yù)測,提高了短期洪水預(yù)報(bào)準(zhǔn)確性。
為了提高徑流預(yù)測的準(zhǔn)確性、高效性和可解釋性,研究物理驅(qū)動(dòng)與數(shù)據(jù)驅(qū)動(dòng)的耦合模型受到越來越多學(xué)者的關(guān)注[8]。通常采用兩種方式實(shí)現(xiàn)多模型耦合,一種方式是在提供觀測數(shù)據(jù)標(biāo)簽時(shí),加入由物理模型提取的控制方程、邊界條件等理論知識限制解集空間;另一種方式是基于物理模型模擬結(jié)果對深度神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)訓(xùn)練,從而建立物理指導(dǎo)的深度學(xué)習(xí)模型[9]。例如,Yang 等[10]將GHM-CaMa-Flood 模型的流量輸出與ERA 數(shù)據(jù)集的氣象數(shù)據(jù)整合作為LSTM 模型的輸入,改進(jìn)了峰值流量的徑流預(yù)測精度;Liu 等[11]利用TIGGE-ECMWF 氣象預(yù)報(bào)數(shù)據(jù),驅(qū)動(dòng)CSSPV2 陸面水文模型預(yù)報(bào)徑流,并將其與氣象數(shù)據(jù)輸入至LSTM 中得到出口斷面流量,將徑流預(yù)報(bào)誤差降低了6%。上述研究表明,物理機(jī)制耦合深度學(xué)習(xí)的徑流預(yù)測方法能有效提升徑流預(yù)測精度和效率。因此,本研究在西江流域建立基于物理模型指導(dǎo)的深度學(xué)習(xí)模型,將基于物理驅(qū)動(dòng)模型的水文水動(dòng)力模型與深度學(xué)習(xí)方法相結(jié)合,建立優(yōu)化的徑流預(yù)測模型,并進(jìn)行模型計(jì)算結(jié)果驗(yàn)證。
西江發(fā)源于云南,流經(jīng)貴州、廣西和廣東,于珠海市注入南海,干流全長2214 km,流域總面積35.31 萬km2。西江流域?qū)賮啛釒Ъ撅L(fēng)氣候,多年平均氣溫為14~20 ℃,多年平均降水量為1200-2200 mm,受季風(fēng)影響,70%以上降水量主要集中在4~10 月。梧州站以上流域集水面積32.7 萬 km2,占西江流域的92.88 %,跨越云南、貴州、廣西等省區(qū),因此本文選取武宣站(WX)和梧州站(WZ)兩個(gè)水文站開展徑流預(yù)測研究,如圖1 所示。
圖1 研究區(qū)概況
VIC(Variable Infiltration Capacity) 模型是基于物理機(jī)制的大尺度分布式水文模型,廣泛應(yīng)用于全球水文模擬工作。VIC 模型主要考慮了大氣-植被-土壤之間的相互作用過程,反映了土壤、大氣和植被之間的水熱變化狀況和水熱過程模擬,可同時(shí)進(jìn)行陸-氣間能量平衡和水量平衡的模擬。本研究基于VIC-3L 模型,將西江流域劃分為4374 個(gè)空間分辨率為5 弧分的網(wǎng)格進(jìn)行徑流預(yù)測。
CaMa-Flood(Catchment-based Macroscale Floodplain)是一個(gè)全球尺度的分布式河流模型,已被廣泛應(yīng)用于不同時(shí)間尺度的大規(guī)模洪水研究中。水文模型模擬產(chǎn)生的徑流可以作為CaMa-Flood 模型的徑流強(qiáng)迫數(shù)據(jù)。本研究以VIC 模型產(chǎn)生的徑流(作為CaMa-Flood 模型的輸入數(shù)據(jù),進(jìn)而得到基于物理機(jī)制模型模擬的日徑流流量。
為了克服基于機(jī)器學(xué)習(xí)的徑流預(yù)測模型的局限性,本研究開發(fā)了一種耦合水文水動(dòng)力模型和深度學(xué)習(xí)的徑流預(yù)測模型,即將基于物理機(jī)制的徑流模擬值和氣象觀測數(shù)據(jù)輸入到深度學(xué)習(xí)框架中,利用深度學(xué)習(xí)方法計(jì)算徑流模擬值。循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Networks,RNN)由輸入層、隱藏層和輸出層組成,是能夠處理時(shí)間序列的神經(jīng)網(wǎng)絡(luò)模型。RNN 模型的計(jì)算公式如下:
其中,f與g為神經(jīng)網(wǎng)絡(luò)激活函數(shù);W和U為權(quán)重矩陣;xt,St,Ot為t時(shí)刻輸入層、隱藏層及輸出層數(shù)據(jù)。
長短時(shí)記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM) 是針對RNN 模型在學(xué)習(xí)較長時(shí)間序列時(shí)存在的梯度消失問題而提出的改進(jìn)模型。LSTM 可以有效處理長距離的依賴,與RNN 相比,LSTM 模型增加了三“門”結(jié)構(gòu),考慮了隱藏層中關(guān)聯(lián)不同時(shí)刻的輸入,常用來研究時(shí)間序列上的變化。具體如下:
式中:Wf,Wi,Wc,Wo和Uf,Ui,Uc,Uo為模型權(quán)重參數(shù);bf,bi,bo為偏移系數(shù);ht為t時(shí)刻的輸出;σ為激活函數(shù);tanh為雙曲正切函數(shù); 表示按元素乘。
在本研究中將特征輸入長度設(shè)定為15 天,輸出特征長度為1 天,選取2010 年1 月至2014年12 月數(shù)據(jù)為訓(xùn)練期,2015 年1 月至2015 年12 月數(shù)據(jù)為驗(yàn)證期,2016 年1 月至2016 年12 月數(shù)據(jù)為測試期。此外,本研究分別建立了物理機(jī)制模型(VIC-CamaFlood)、深度學(xué)習(xí)模型(RNN、LSTM) 和兩種混合模型(VICCamaFlood-RNN、VIC-CamaFlood-LSTM)進(jìn)行徑流預(yù)測,從而進(jìn)行徑流預(yù)測模型對比和優(yōu)選。
選取三個(gè)指標(biāo)來評估洪水特征值,分別是最大流量值(MAX)、95% 分位流量值(Q95) 和90%分位流量值(Q90)。同時(shí),選取納什效率系數(shù)(NSE)、相對誤差(RE)和相關(guān)系數(shù)(R2)三個(gè)指標(biāo)定量評估不同類型徑流預(yù)測模型的徑流模擬性能。具體如下:
其中,和分別指第i天的實(shí)測值和模擬值,N為樣本總數(shù),和分別代表實(shí)測和模擬每日流量的平均值。
基于以上建立的VCR、VCL 兩種混合模型對梧州站和武宣站進(jìn)行了日徑流預(yù)測,并進(jìn)行對比分析。圖2 展示了VCR、VCL 兩種模型的日徑流預(yù)測結(jié)果,表1 展示了兩種耦合模型在訓(xùn)練期(2010-2014 年)、驗(yàn)證期(2015 年)、測試期(2016 年)的徑流預(yù)測結(jié)果的評價(jià)指標(biāo)。在測試期內(nèi),VCR 模型NSE 值范圍為0.70~0.75,VCL 模型NSE 范圍為0.71~0.81;VCR 模型R范圍為0.85~0.88,VCL 模型R 范圍為0.85~0.9;VCR 模型RE 范圍為-5.8%~1.6%,VCL 模型RE 范圍為-8.6%~0.2%;從不同站點(diǎn)評價(jià)指標(biāo)來看,在測試期中,VCL 的NSE 值在兩個(gè)站點(diǎn)的表現(xiàn)均比VCR 有一定程度的提高,均提高了1%~4% 左右;R值上,VCL 模型表現(xiàn)均比VCR 模型高。從既往研究中來看,當(dāng)NSE 值大于0.5 且RE 小于25% 時(shí),那么這模型模擬結(jié)果是可以接受的[12]。同時(shí),VCL 和VCR 模型相關(guān)系數(shù)R均達(dá)到0.85 以上,這說明兩個(gè)站點(diǎn)的徑流模擬結(jié)果與實(shí)測徑流均有一定的相關(guān)性。
表1 基于混合模型的徑流預(yù)測結(jié)果評價(jià)
圖2 基于混合模型的徑流模擬結(jié)果
表2 展示了測試期內(nèi)觀測值和模型模擬值的洪水指標(biāo),其中,VCR 模型MAX 的RE 值范圍為-34.1%~-33.3%,Q95 的RE 范圍為-5.5%~-4.2%,Q90 的RE 值范圍為-0.5%~1.8%;VCL模型MAX 的RE 值范圍為-22.8%~-19.7%,Q95 的RE 范圍為-8.5%~-4.5%,Q90 的RE 值范圍為-3.1%~-1.1%。從不同站點(diǎn)評價(jià)指標(biāo)來看,在測試期中,VCL 的NSE 值在兩個(gè)站點(diǎn)的表現(xiàn)均比VCR 有一定程度的提高;R值上,VCL 模型均比VCR 模型高。在洪水預(yù)報(bào)指標(biāo)中,根據(jù)MAX 指標(biāo)評估,VCL 模型預(yù)報(bào)性能均比VCR模型表現(xiàn)好;根據(jù)Q95 和Q90 評估,VCL 模型比VCR 模型略高;從三個(gè)站點(diǎn)總體評價(jià)指標(biāo)表現(xiàn)來看,武宣站(WX) 在測試期的表現(xiàn)最好,其次是梧州站(WZ)。
表2 基于混合模型的洪水評價(jià)指標(biāo)性能
綜上所述,VCL 模型較VCR 模型能夠更好地模擬徑流和洪水,該結(jié)論將為今后徑流預(yù)測和洪水模擬提供科學(xué)參考。
為進(jìn)一步研究不同類型徑流模擬模型的模擬效果,本文分別建立了物理機(jī)制模型(VICCamaFlood)、深度學(xué)習(xí)模型(RNN、LSTM)和兩種混合模型(VIC-CaMa-Flood-RNN、VICCaMa-Flood-LSTM),并進(jìn)行徑流預(yù)測研究。圖3 展示了三種類型模型在徑流預(yù)測和洪水模擬方面的性能。
在基于VIC-CaMa-Flood 模型的徑流模擬中,所有站點(diǎn)的NSE 值均小于0.5,R值均大于0.7,同時(shí),在VIC-CaMa-Flood 模型的洪水模擬中,RE 值在大部分情況均大于30%。因此,VIC-CaMa-Flood 模型不能很好地模擬徑流和洪水。將VIC-CaMa-Flood 模擬獲得的流量及其氣象驅(qū)動(dòng)數(shù)據(jù)輸入到深度學(xué)習(xí)算法(即VCR、VCL)之后,徑流和洪水的指標(biāo)都得到了顯著的提升,VCR 模型NSE 范圍為0.7 至0.75 之間,R值在0.85 至0.88 之間,除了在MAX 時(shí)RE 值達(dá)到33% 以上,其余均在7% 左右;而VCL 模型NSE 范圍為0.71 至0.81 之間,R值0.85 至0.9 之間,在MAX 時(shí)RE 值均在20%左右,而其他洪水指標(biāo)均在5%左右??傮w而言,VCR 和VCL 模型NSE 值均提升到了0.7 以上,R值均提升到了0.85 以上,三個(gè)洪水指標(biāo)也有著不同程度的改善,且VCL 模型在徑流預(yù)測和洪水預(yù)測方面均優(yōu)于VCR 模型。由此可知,混合模型有效地提高了物理驅(qū)動(dòng)模型的預(yù)測模擬性能,這表明深度學(xué)習(xí)方法在徑流和洪水預(yù)測中起到了誤差校正和提高精度的作用。
在基于深度學(xué)習(xí)模型的徑流預(yù)測中,LSTM模型NSE 范圍為0.25 至0.6 之間,R值范圍為0.6 至0.8 之間,RNN 模型NSE 范圍為0.25 至0.65 之間,R值范圍為0.5 至0.8 之間;在3 個(gè)洪水指標(biāo)上,LSTM 和RNN 模型均在15%左右,這表明深度學(xué)習(xí)模型相較于VIC-CaMa-Flood模型雖然能更好的模擬洪水,但是在徑流模擬上并沒有顯著的提升。而將VIC-CaMa-Flood模型模擬的徑流量輸入到深度學(xué)習(xí)模型中時(shí),無論是徑流預(yù)測還是洪水模擬的性能都得到了顯著提升。由此可知,混合模型可以有效的提高數(shù)據(jù)驅(qū)動(dòng)模型的仿真性能。
本文構(gòu)建了基于物理機(jī)制模型(VICCaMa-Flood) 與深度學(xué)習(xí)方法(RNN、LSTM)耦合的徑流預(yù)測模型,選擇西江流域武宣站(WX) 和梧州站(WZ) 兩個(gè)水文站在2010-2016 年期間的徑流進(jìn)行模擬實(shí)驗(yàn),評估了物理機(jī)制模型(VIC-CamaFlood)、深度學(xué)習(xí)模型(RNN、LSTM) 和兩種混合模型(VICCamaFlood-RNN、VIC-CamaFlood-LSTM) 在徑流和洪水預(yù)測中的性能。本文主要結(jié)論如下:
1)對于VCL 和VCR 模型,在測試期中,VCL 模型NSE 值大于0.71,最大值達(dá)到0.81、R值大于0.85、RE 值小于8%;VCR 模型NSE值大于0.7,最大值達(dá)到0.77、R值大于0.85、RE 值小于6%。結(jié)果表明,VCL 模型相比于VCR 模型能夠更好地模擬徑流和洪水,其模擬結(jié)果與實(shí)測徑流具有更高的相關(guān)性。
2)在三種類型徑流預(yù)測模型的對比中,深度學(xué)習(xí)方法在徑流和洪水預(yù)測中起到了誤差校正和提高精度的作用,物理機(jī)制模型與深度學(xué)習(xí)方法的耦合可提高徑流預(yù)測和洪水預(yù)測的準(zhǔn)確性。