肖梓明,張行南,方園皓
(河海大學(xué)水文水資源學(xué)院,南京210098)
近年來隨著人口上漲、農(nóng)業(yè)產(chǎn)業(yè)升級,農(nóng)業(yè)灌溉對水資源的需求越來越大,為了解決水資源短缺問題,水資源規(guī)劃管理愈發(fā)重要。為了構(gòu)建合適的水資源規(guī)劃管理模型,實現(xiàn)準確的水文模擬必不可少,例如徐宗學(xué)、程磊[1]認為,灌區(qū)模擬問題難以運用傳統(tǒng)的方法進行研究,考慮時空變異的分布式水文模型能夠處理這一問題。在流域水文模型中,降水作為重要的數(shù)據(jù)輸入,對水文模擬的準確性起著至關(guān)重要的作用;在農(nóng)業(yè)灌溉中,準確的降雨對灌溉制度及灌溉決策起著指導(dǎo)作用,例如孫晉鍇等[2]基于多年降雨數(shù)據(jù)對豫東地區(qū)夏玉米灌溉制度進行了優(yōu)化;侯靜文等[3]對桂林市降雨預(yù)報準確度進行了分析,并應(yīng)用到當?shù)厮竟喔葲Q策中。傳統(tǒng)的水文模擬中,降水數(shù)據(jù)主要采用地面站點的觀測值,存在著空間分布性差、站點布設(shè)受地形限制等諸多問題,導(dǎo)致數(shù)據(jù)獲取及準確性方面存在影響,進而影響水文模擬。所以如果能在流域尺度上提供準確的降水數(shù)據(jù),將會使水文模擬的準確性大大提高。
大氣環(huán)流模式(GCM)作為當前全球氣候模擬的有力工具,是獲取降雨數(shù)據(jù)的重要來源之一,其準確性、可靠性和精度也獲得了眾多學(xué)者的肯定[4,5],但是由于計算條件的限制,GCM 一般在比較低的空間分辨率下進行運行(通常是2°或者更低),有學(xué)者[6]認為0.125°的空間分辨率才能滿足流域尺度的水文模擬,因此不能將GCM 的降雨數(shù)據(jù)直接運用在水文模擬中。
此前,已有不少學(xué)者將GCM 降雨數(shù)據(jù)運用到水文模型中的先例,例如:張徐杰[7]采用GCM 集合數(shù)據(jù),在降尺度處理下,利用SWAT 水文模型對蘭江流域未來的徑流量進行了模擬,發(fā)現(xiàn)蘭江流域徑流量和可利用水資源量在未來有減小的趨勢;宣偉棟[8]通過LARS-WG 天氣發(fā)生器對5 種全球氣候模式的結(jié)果進行降尺度,對奴下等站點未來降雨徑流進行模擬,做出趨勢分析;宋小園[9]對于最新的CMIP5 氣候模式,將氣候情景預(yù)測結(jié)果和SWAT 水文模型耦合,構(gòu)建了未來徑流模擬,效果顯著。由此可見,GCM 降雨數(shù)據(jù)作為水文模型降雨輸入存在一定的合理性。但是為了彌補GCM 降雨數(shù)據(jù)在流域尺度上分辨率過低的問題,還需要經(jīng)過降尺度處理,將尺度大分辨率低的數(shù)據(jù)轉(zhuǎn)化為尺度小分辨率高的數(shù)據(jù),使其滿足流域尺度要求。
為了應(yīng)對GCM 數(shù)據(jù)分辨率過低問題,本文以橫江流域為例,運用統(tǒng)計降尺度方法,結(jié)合4種機器學(xué)習方法,對歐洲中期天氣預(yù)報中心(ECMWF)發(fā)布的ERA5 再分析數(shù)據(jù)中的降水數(shù)據(jù),結(jié)合19個大氣環(huán)流因子建立模型,進行降尺度分析,并將結(jié)果輸入新安江水文模型[10],進行徑流模擬,以此分析ERA5 再分析數(shù)據(jù)降尺度后作為流域水文模型降水數(shù)據(jù)來源的可靠性,以此來確定是否可以為農(nóng)業(yè)灌溉提供數(shù)據(jù)支撐。
橫江是長江上游金沙江下游一級支流,源自貴州威寧草海,位于東經(jīng)103°18′至105°57′、北緯26°45′至28°36′之間,全長307 km,流域面積約為1.486 萬km2,多年平均降雨量1 150.9 mm,年內(nèi)降水集中在6-10月,占全年降水的80%左右,以橫江水文站為控制站。圖1為流域概況圖。橫江流域境內(nèi)主要農(nóng)作物為水稻、冬小麥、玉米、甘薯、馬鈴薯等,農(nóng)業(yè)需水量大,需要合理的水資源規(guī)劃管理。
圖1 橫江流域概況Fig.1 Overview of Hengjiang River Basin
(1)ERA5再分析數(shù)據(jù)。ERA5是ECMWF發(fā)布的第五代再分析全球氣候數(shù)據(jù),空間分辨率0.25°×0.25°,本文所采用的降水數(shù)據(jù)下載地址為https://cds.climate.copernicus.eu/cdsapp#!/search?type=dataset,數(shù)據(jù)集為“ERA5 hourly data on single levels from 1979 to present”。
(2)大氣環(huán)流因子數(shù)據(jù)。本文所采用的大氣環(huán)流因子來自于ECMWF 發(fā)布的TIGGE 數(shù)據(jù)集,空間分辨率0.5°×0.5°,數(shù)據(jù)下載地址為https://apps.ecmwf.int/datasets/data/tigge/levtype=sfc/type=cf/。
(3)實測水文數(shù)據(jù)。降雨數(shù)據(jù)為橫江流域內(nèi)的10 個水文(雨量)站的實測數(shù)據(jù),分別為豆沙關(guān)、甘海子、橫江、龍海、龍街子、墨石驛、牛場、箐口塘、下壩、新泉;徑流數(shù)據(jù)為橫江水文站實測徑流數(shù)據(jù)。以上數(shù)據(jù)均摘錄自水文年鑒,數(shù)據(jù)的時間長度為2009年1月1日至2014年12月31日。
在建立統(tǒng)計降尺度模型時,我們認為局地降雨與大氣環(huán)流因子存在某種統(tǒng)計關(guān)系,即:
式中:Y為局地降雨數(shù)據(jù);F為統(tǒng)計關(guān)系;xi為大氣環(huán)流因子。
因子詳情如表1 所示。建立統(tǒng)計關(guān)系的示意圖如圖2 所示(●代表氣象格點,★代表雨量站),氣象格點為ERA5降雨數(shù)據(jù),雨量站點為實測雨量數(shù)據(jù)。每個氣象格點的控制范圍如圖中陰影區(qū)域,為每個雨量站匹配大氣環(huán)流因子時,保證距離最近,即雨量站要被陰影所覆蓋。由于因子數(shù)量較多,確定統(tǒng)計關(guān)系式時較為復(fù)雜,本文借助機器學(xué)習方法進行關(guān)系擬合,共選取四種機器學(xué)習方法:人工神經(jīng)網(wǎng)絡(luò)(ANN)[11]、支持向量機(SVM)[12]、決策樹(DT)[13]、隨機森林(RF)[14],以2009-2013年為訓(xùn)練集,2014年為測試集,檢驗降尺度后的降雨數(shù)據(jù)精度,并將結(jié)果輸入至新安江模型,檢驗其在水文模擬中的效果。
圖2 統(tǒng)計關(guān)系建立示意圖Fig.2 Schematic diagram of statistical relationship establishment
表1 大氣環(huán)流因子信息表Tab.1 Predictor information table
本文所采用的4種機器學(xué)習方法的具體模型如下:
ANN模型為:
式中:y(t)為模型t時刻輸出的降雨;xi(t)為t時刻第i個因子值;vij為連接輸入層和隱層的權(quán)重;wj為連接隱層和輸出層的權(quán)重;n為因子個數(shù);m為隱層維數(shù);θj為隱層閾值;θ0為輸出層閾值;f為Sigmoid函數(shù):f(x)=(1+ e-x)-1。
SVM模型為:
式中:ai、a*i、b為最優(yōu)超平面參數(shù);N為支持向量數(shù);樣本空間X和Xi經(jīng)映射得到。
DT 模型的核心思想為切分點確定,本文以最小二乘法為切分點選擇原則。RF 則是以多個決策樹組成,每個決策樹之間互不影響,其最重要的參數(shù)為決策樹個數(shù)和隨機選擇特征的最大數(shù)量,目標則是均方誤差最小和決定系數(shù)最大。
由于降雨量為0時會對機器學(xué)習的回歸運算產(chǎn)生影響,所以本文將整個降尺度過程分為3步,首先利用機器學(xué)習的分類思想,對ERA5降水數(shù)據(jù)進行晴雨準確率(即是否有雨)的模型運算;其次利用機器學(xué)習的回歸思想,對第一部分有雨的部分進行降雨量準確率的模型運算;最后將前兩部分整合,得出整個ERA5降雨數(shù)據(jù)的降尺度結(jié)果。
本文所采用的水文模型為新安江模型。新安江模型是河海大學(xué)趙人俊于1973年提出的水文模型,該模型主要運用于濕潤半濕潤地區(qū),產(chǎn)流方式為蓄滿產(chǎn)流,蓄水容量曲線為核心部分,其結(jié)構(gòu)分為蒸散發(fā)、產(chǎn)流、分水源、匯流。經(jīng)過眾多學(xué)者的不懈努力,已成為國內(nèi)廣泛運用的流域水文模型。
ERA5 的空間分辨率為0.25°×0.25°,而預(yù)測因子的空間分辨率為0.5°×0.5°,為了保證模型在同樣的分辨率下進行,對數(shù)據(jù)進行插值處理,保證其分辨率相同。
(1)晴雨準確率。將所有的降雨數(shù)據(jù)分為兩類:有雨和無雨,采用機器學(xué)習的分類思想進行模型運算。在質(zhì)量評估方面采用TS 評分進行評價,ERA5 降尺度后在10 個站點的TS評分如圖3 所示。從圖3 可以得出以下結(jié)論:①ERA5 數(shù)據(jù)降尺度前的TS 評分大多在0.4~0.6 之間,只有在龍海站的TS 評分較高,達到了0.726,總體效果并不是很理想;②ANN、SVM、DT、RF 4 種方法在10 個站的均值分別為0.737、0.745、0.684、0.746,而ERA5 在降尺度前的均值為0.508,可以看出,在4 種降尺度方法下TS 評分均有較大幅度的提高,以SVM 和RF 效果最優(yōu),DT 效果最差;③ERA5 對橫江流域的晴雨準確率并不理想,但可以選用SVM 和RF 方法對其進行優(yōu)化,優(yōu)化后的效果更為準確。
圖3 各個站點晴雨準確率TS評分Fig.3 TS scores of sunny or rainy accuracy at various stations
(2)降雨量準確率。在晴雨準確率的基礎(chǔ)上,對有雨部分進行降雨量計算。在質(zhì)量評估方面采用相關(guān)系數(shù)r、平均絕對誤差MAE進行評價,ERA5 降尺度后在10 個站點的兩項指標如圖4 和圖5 所示。從圖中可以得出以下結(jié)論:①ERA5 數(shù)據(jù)降尺度前與實測站點的相關(guān)系數(shù)大多在0.5~0.7 之間,屬于顯著相關(guān),在橫江站更是達到了0.721,只有在龍街子和下壩較低,分別為0.492和0.441,而在平均絕對誤差方面,大多集中在3~5 mm 之間,下壩更是達到了7.398 mm,誤差較大,精度較低;②ANN、SVM、DT、RF 4種方法在10個站的相關(guān)系數(shù)均值分別為0.578、0.632、0.431、0.553,而ERA5 為0.596,可以看出ANN 和RF 方法在降尺度后仍然保持著相當?shù)南嚓P(guān)性,SVM 有所提高,DT 則大幅度下降;在平均絕對誤差方面,4 種方法的均值分別為4.813、4.283、5.670、4.779,而ERA5 為5.063,可以看出ANN、SVM、RF 均有所提高,SVM更是提高了0.78 mm,反觀DT 精度有所下降;③綜合以上可以得出結(jié)論:ERA5 在橫江流域的降雨精度不足,在降尺度方法方面可以選擇SVM 方法,使得結(jié)果在相關(guān)系數(shù)和平均絕對誤差上均有所提高。
圖4 各個站點降雨量相關(guān)系數(shù)Fig.4 Correlation coefficients of rainfall at various stations
圖5 各個站點降雨量平均絕對誤差Fig.5 Average absolute error of rainfall at each station
為了檢驗4 種方法對ERA5 降尺度后的降雨數(shù)據(jù)在水文模擬中的效果,本文計算了4種降雨結(jié)果在研究區(qū)的面雨量,再將面雨量輸入新安江模型進行徑流模擬。面雨量的計算采用泰森多邊形法。
橫江流域以橫江水文站為控制站,以其實測流量作為橫江流域的出口斷面流量,同樣的將2009-2013年劃分為率定期,2014 劃分為驗證期,基于率定期實測數(shù)據(jù)對新安江模型的各項參數(shù)進行率定。新安江模型有16 項參數(shù),其中敏感參數(shù)率定結(jié)果詳見表2。表中參數(shù)意義如下:KC為蒸散發(fā)折算系數(shù)、SM為自由水蓄水容量、KG為自由水蓄水庫對地下水的日出流系數(shù)、KI為自由水蓄水庫對壤中流的日出流系數(shù)、CG為地下水消退系數(shù)、CI為壤中流消退系數(shù)、CS為地面徑流消退系數(shù)。
表2 敏感參數(shù)率定結(jié)果Tab.2 Calibration results of sensitive parameters
在模擬精度方面采用納什效率系數(shù)(NSE)、徑流深相對誤差(Bias)、均方根誤差(RMSE)對驗證期徑流模擬結(jié)果進行評估。圖6為徑流模擬過程。在不同方法下徑流模擬結(jié)果如表3 所示。從圖表中可以看出,實測降雨在驗證期的表現(xiàn)良好,NSE達到了0.61,Bias也控制在正負5%以內(nèi),為-1.17%。而ERA5 的模擬效果很差,NSE為-0.36,Bias為59.44%,從圖6可以看出,ERA5模擬徑流與觀測徑流整體過程基本吻合,造成NSE和Bias效果差的原因可能是ERA5 的整體雨量較大,造成了模擬值比實測值偏高的情況。4種降尺度方法在模擬精度上,相對ERA5 都有不同幅度的提高,其中ANN 和RF 方法較好,ANN的NSE相對實測數(shù)據(jù)提高了0.07,Bias相對實測數(shù)據(jù)下降了1.81%,RF 的NSE與實測數(shù)據(jù)相同,但在Bias上比實測數(shù)據(jù)低了6.1%。SVM 方法在汛期表現(xiàn)很差,存在著峰值嚴重低估的情況,在水文模擬中不可取。DT 方法與ERA5 存在著相同的問題,即徑流過程較好,但整體水量偏高。
圖6 徑流過程模擬Fig.6 Runoff process simulation
表3 不同方法下的徑流模擬結(jié)果Tab.3 Runoff simulation results under different methods
(1)ERA5 降雨數(shù)據(jù)在橫江流域精度較低,在水文模擬上雖然統(tǒng)計指標較差,但徑流過程與實測吻合,造成這種現(xiàn)象的原因可能是整體水量偏大,在模擬過程中可適當調(diào)大蒸散發(fā)折算系數(shù)KC,在農(nóng)業(yè)灌溉中,可根據(jù)當日降水量適當減小計算需灌水量。
(2)建立了從ERA5低分辨率的網(wǎng)格到實測站點的統(tǒng)計降尺度模型,并從晴雨準確率和降雨量準確率兩個方面檢驗降尺度后的數(shù)據(jù)精度,結(jié)果表明:在晴雨準確率和降雨量準確率方面,可選用SVM進行降尺度研究。
(3)在水文模擬中,4種降尺度方法表現(xiàn)各不相同,使用ANN方法進行降尺度的效果最優(yōu),驗證了將ERA5降雨數(shù)據(jù)降尺度后,作為流域水文模型降水輸入的可行性,進一步為農(nóng)業(yè)灌溉提供數(shù)據(jù)支撐。