鮑玲玲, 楊永剛, 劉建軍, 張衛(wèi)華
(1.重慶市水利電力建筑勘測設(shè)計(jì)研究院, 重慶 400020; 2.西南大學(xué) 資源環(huán)境學(xué)院, 重慶 400715)
近年來,全球變暖逐漸加劇,洪災(zāi)、旱災(zāi)等極端氣候事件不斷發(fā)生,國內(nèi)作物產(chǎn)量受頻繁水旱災(zāi)害的嚴(yán)重影響[1-2]。為降低自然災(zāi)害對作物產(chǎn)量的影響,需要制定精確預(yù)測作物需水量的方法,及時(shí)為灌溉決策提供依據(jù)[3-4]。作物系數(shù)法是確定作物需水量的主要方法之一,通過計(jì)算作物系數(shù)Kc與參考作物蒸散量(Reference crop evapotranspiration,ET0)的乘積,最終確定作物需水量,該方法已在新疆[5]、河北等[6]地得到了證明。ET0的準(zhǔn)確估算是精確獲得作物需水量的關(guān)鍵,目前國際糧農(nóng)組織FAO-56分冊推薦Penman-Monteith(P-M)公式為計(jì)算的標(biāo)準(zhǔn)方法[7-8],以輻射項(xiàng)和空氣動力學(xué)項(xiàng)為基本原理,綜合考慮了各種氣象因素,保證了公式的計(jì)算精度,但該公式需要的氣象資料較多,對于氣象數(shù)據(jù)難以獲得的區(qū)域難以使用,因此在一定程度上限制了P-M公式的應(yīng)用[9-10],找到合適的區(qū)域ET0簡便估算方法成為了國內(nèi)外研究的熱點(diǎn)。
目前估算ET0的方法分為經(jīng)驗(yàn)?zāi)P秃腿斯ぶ悄苣P?大類[11-12],人工智能模型近幾年得到了廣泛的應(yīng)用[13]。魏俊等[14]以極限學(xué)習(xí)機(jī)模型為基礎(chǔ),建立了西北地區(qū)ET0估算模型,精度高于Hargreaves-Samani,Chen,EI-Sebail和Bristow等經(jīng)驗(yàn)?zāi)P停恍旆f等[15]基于極限學(xué)習(xí)機(jī)模型,計(jì)算了西北旱區(qū)ET0,確定了最優(yōu)激活函數(shù)及參數(shù)組合輸入;馮禹等[16]基于遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)模型對川中丘陵區(qū)ET0進(jìn)行了估算,模型精度明顯高于Priestley-Taylor模型、Makkink模型、Hargreaves模型和Mc Cloud模型。在同樣氣象數(shù)據(jù)輸入的前提下,人工智能模型精度均高于經(jīng)驗(yàn)?zāi)P?,但針對人工智能模型而言,在不同區(qū)域究竟采用何種氣象數(shù)據(jù)輸入方式的研究較少。本研究將5種氣象數(shù)據(jù)進(jìn)行排列組合,得出7種氣象數(shù)據(jù)輸入組合,分析不同組合下人工智能模型精度,對找到影響區(qū)域ET0關(guān)鍵因素,確定標(biāo)準(zhǔn)輸入組合方式具有十分重要的意義,同時(shí)對人工智能模型在ET0估算中的應(yīng)用推廣十分必要。
作為國家重點(diǎn)生態(tài)功能區(qū)和農(nóng)產(chǎn)品主產(chǎn)區(qū),重慶受季風(fēng)氣候影響,降雨年際年內(nèi)變化幅度大,春旱、秋旱頻發(fā),夏季受副熱帶高壓控制,雨旱同期,農(nóng)作物常常遭受著洪旱災(zāi)害的雙重威脅,嚴(yán)重影響了作物產(chǎn)量,重慶是我國重要的糧食生產(chǎn)基地,針對ET0最優(yōu)估算模型的研究可為當(dāng)?shù)刈魑镄杷看_定和灌溉決策確定提供重要的指導(dǎo)依據(jù),因此是十分必要的[17]。同時(shí)現(xiàn)有對人工智能模型的選擇較單一,未能對多種人工智能模型計(jì)算效果進(jìn)行比較,由于不同人工智能模型在不同區(qū)域的精度不同,且所采用的最優(yōu)氣象數(shù)據(jù)輸入組合同樣不同,同時(shí)尚未發(fā)現(xiàn)針對重慶地區(qū)ET0估算模型的研究。因此,本文基于重慶地區(qū)豐都、奉節(jié)、沙坪壩、萬州、酉陽共5個(gè)站點(diǎn)1991—2016年的逐日氣象數(shù)據(jù),以支持向量機(jī)模型(SVM)、高斯指數(shù)模型(GEM)、隨機(jī)森林模型(RF)、極限學(xué)習(xí)機(jī)模型(ELM)和廣義回歸神經(jīng)網(wǎng)絡(luò)模型(GRNN)5種人工智能模型為基礎(chǔ),得出重慶地區(qū)不同氣象參數(shù)輸入組合ET0最優(yōu)估算模型,為該地區(qū)灌溉決策制定提供依據(jù)。
重慶(105°17′—110°11′E,28°10′—32°13′N)地處長江上游,東臨湖南,西鄰四川,北接陜西,南到貴州,是西南地區(qū)重要的糧食生產(chǎn)基地。重慶為典型的亞熱帶季風(fēng)氣候,年平均氣溫16~18℃,降水豐富,年均降水量超過1 000 mm,年日照時(shí)數(shù)1 000~1 400 h,屬于全國日照最低的地區(qū)之一。本文選擇重慶地區(qū)豐都、奉節(jié)、沙坪壩、萬州、酉陽共5個(gè)站點(diǎn)1991—2016年的逐日氣象數(shù)據(jù),數(shù)據(jù)均來自于國家氣象中心,數(shù)據(jù)控制良好,氣象資料主要包括站點(diǎn)日最高氣溫(Tmax)、最低氣溫(Tmin)、日照時(shí)數(shù)(n)、相對濕度(RH)和2 m處風(fēng)速(U2)。具體站點(diǎn)分布圖可見圖1。
圖1 重慶地區(qū)氣象站點(diǎn)分布
為得出計(jì)算重慶地區(qū)的ET0標(biāo)準(zhǔn)人工智能模型,本文以P-M模型為計(jì)算標(biāo)準(zhǔn),分別選擇支持向量機(jī)模型、高斯指數(shù)模型、隨機(jī)森林模型、極限學(xué)習(xí)機(jī)模型和廣義回歸神經(jīng)網(wǎng)絡(luò)模型共5種人工智能模型,其中支持向量機(jī)模型、隨機(jī)森林模型、極限學(xué)習(xí)機(jī)模型和廣義回歸神經(jīng)網(wǎng)絡(luò)模型精度已在部分地區(qū)得到驗(yàn)證,但在重慶地區(qū)的精度仍未見研究報(bào)道,同時(shí)高斯指數(shù)模型尚未應(yīng)用于國內(nèi)ET0估算當(dāng)中,因此本文基于這5種模型對重慶地區(qū)ET0進(jìn)行模擬,可較好地適應(yīng)人工智能模型預(yù)測研究的前沿方向。
FAO-56分冊推薦的Penman-Monteith(P-M)公式為ET0計(jì)算的標(biāo)準(zhǔn)模型,其模型型式及參數(shù)意義見文獻(xiàn)[17],具體公式如下:
(1)
式中:ET0是由P-M方法計(jì)算得到的參考作物蒸散量數(shù)值(mm/d),Rn是作物表面的凈輻射[MJ/(m2·d)];T是2 m高處的日均氣溫(℃);G是土壤熱量通量密度[MJ/(m2·d)];U2是2 m高處的風(fēng)速(m/s);es是飽和水汽壓差(kPa);ea是實(shí)際水汽壓差(kPa);Δ是蒸汽壓曲線的斜率(kPa/℃);γ是干濕計(jì)常數(shù)(kPa/℃)。
1999年Vapnik[18]首先提出了支持向量機(jī)模型(Support vector machine,SVM)。該模型以結(jié)構(gòu)經(jīng)驗(yàn)最小化代替?zhèn)鹘y(tǒng)的經(jīng)驗(yàn)最小化,克服了神經(jīng)網(wǎng)絡(luò)的諸多不足,模型原理可用下式表示:
(2)
式中:xj,yi為輸入向量的縱坐標(biāo);κ(xi,xj)是由輸入向量xi轉(zhuǎn)換而來的高維特征向量;αi為輸入向量的權(quán)重;b為經(jīng)驗(yàn)系數(shù)。
Liu等[19]提出了高斯指數(shù)模型(Gaussian exponential model,GEM)。該模型分為3個(gè)程序,首先,通過K-means算法對原始樣本進(jìn)行聚類學(xué)習(xí)。其次,基于最大似然估計(jì)進(jìn)行參數(shù)估計(jì),最后,根據(jù)最大后驗(yàn)概率標(biāo)準(zhǔn)重新組合學(xué)習(xí)樣本。該模型可以定義為:
(i=1,2,…,n)
(3)
式中:Hi是峰值幅度;Ni是高峰時(shí)間位置;Wi是高斯波的半寬。
隨機(jī)森林(Random forest,RF)模型由Breiman提出。該模型在模型訓(xùn)練期間引入隨機(jī)屬性選擇,該模型基于隨機(jī)性和差異提取數(shù)據(jù),可以大大提高決策的準(zhǔn)確性[20]。
極限學(xué)習(xí)機(jī)模型(Extreme learning machine,ELM)是單隱層前饋神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法,其學(xué)習(xí)速度比傳統(tǒng)神經(jīng)網(wǎng)絡(luò)算法更快,主要包括輸入層、隱含層和輸出層3個(gè)部分,首先通過輸入層輸入所求變量,通過與隱含層之間的權(quán)重ωij,計(jì)算出輸出層權(quán)重βjk和輸出變量矩陣,得出最終結(jié)果[21]。
廣義回歸神經(jīng)網(wǎng)絡(luò)模型(Generalized regression neural network,GRNN)由輸入層、模式層、求和層和輸出層等4層神經(jīng)元組成[22]。
本文以5個(gè)氣象站點(diǎn)1991—2016年逐日氣象數(shù)據(jù)進(jìn)行模型訓(xùn)練與預(yù)測,氣象數(shù)據(jù)主要包括日最高氣溫(Tmax)、最低氣溫(Tmin)、日照時(shí)數(shù)(n)、相對濕度(RH)和2 m處風(fēng)速(U2),以1991—2011年的數(shù)據(jù)訓(xùn)練模型,以2012—2016年的數(shù)據(jù)驗(yàn)證模型精度,采用不同的氣象參數(shù)輸入組合,驗(yàn)證不同組合形式下不同模型的精度,具體組合形式見表1。
表1 不同模型參數(shù)輸入組合
以均方根誤差(RMSE),相對均方根誤差(RRMSE),確定系數(shù)(R2),平均絕對誤差(MAE)和效率系數(shù)(Ens)5種指標(biāo)形成評價(jià)指標(biāo)體系,用于評判不同模型的精度,具體公式如下:
(3)
(4)
(5)
(6)
(7)
由于評估指標(biāo)過多,單個(gè)評估指標(biāo)很難比較不同的模型。因此,引入GPI指數(shù)來全面評估模型仿真結(jié)果,通過計(jì)算不同模型GPI的數(shù)值,比較不同模型精度,其中GPI數(shù)值越高,表明該模型精度越高[23],具體公式如下:
(8)
式中:αj為常數(shù),反映了不同指標(biāo)對于最終精度的影響程度,其代表了指標(biāo)性質(zhì)與精度最優(yōu)值之間的距離,因此對于負(fù)相關(guān)的誤差指標(biāo)MAE,RRMSE和RMSE,αj取1,正相關(guān)的一致性指標(biāo)Ens和R2,αj取-1,gj為不同指標(biāo)的縮放值的中位數(shù);yij為不同指標(biāo)的尺度值。
分別計(jì)算不同站點(diǎn)共35種模型的精度指標(biāo),計(jì)算結(jié)果可見表2。由表中可以看出,不同模型在不同參數(shù)輸入下的精度存在差異。在豐都站,當(dāng)以組合1為輸入組合時(shí),GEM1模型精度最高,SVM1模型精度次之,RMSE分別為0.150,0.207 mm/d,RRMSE分別為6.67%和9.19%,R2分別為0.989,0.979,Ens分別為0.989,0.978,MAE分別為0.116,0.161 mm/d,2種模型的GPI指數(shù)分別為1.135,0.732,排名較高;在組合2的條件下,同樣是GEM2模型和SVM2模型表現(xiàn)出了較高的精度,而RF2模型精度最低,其RMSE為0.295 mm/d,RRMSE為13.13%,R2為0.957,Ens為0.956,MAE為0.227 mm/d,GPI指數(shù)為0.068;輸入組合3時(shí),GEM3模型精度遠(yuǎn)高于其余模型,其RMSE為0.278 mm/d,RRMSE為12.36%,R2為0.961,Ens為0.961,MAE為0.196 mm/d,GPI指數(shù)為0.244;當(dāng)輸入組合4時(shí),GEM4模型和SVM4模型精度較高,RF4模型精度最低;輸入組合5時(shí),GEM5模型精度較高,其GPI指數(shù)為正,達(dá)到了0.260,其余模型精度較低,GPI指數(shù)均為負(fù);輸入組合6的模型精度遠(yuǎn)低于其余模型,精度最高的模型為GEM6模型,但GPI值僅為-2.548;輸入組合7時(shí),GEM7精度最高,而GRNN7模型精度最低。
表2 ET0日值計(jì)算精度指標(biāo)(以豐都為例)
在奉節(jié)站,當(dāng)輸入組合1時(shí),GEM1模型精度最高,RMSE為0.368 mm/d,RRMSE為12.51%,R2為0.937,Ens為0.935,MAE為0.291 mm/d,GPI指數(shù)為0.820,在所有模型中精度最高;當(dāng)輸入組合2時(shí),GEM2模型精度遠(yuǎn)高于其余模型;在該站點(diǎn),輸入其余組合時(shí)均表現(xiàn)為GEM模型精度最高。
在其余站點(diǎn),當(dāng)輸入不同的參數(shù)組合時(shí),均表現(xiàn)為GEM模型精度遠(yuǎn)高于相同組合輸入情況下的其余模型。
圖2為整個(gè)區(qū)域不同模型的計(jì)算精度對比。由圖中可以看出,在整個(gè)重慶地區(qū),在相同組合下同樣表現(xiàn)為GEM模型精度最高,而GRNN模型和RF模型的精度較低。在相同模型下,輸入組合1時(shí)表現(xiàn)出的精度最高,表明輸入5種全氣象參數(shù)可保證模型計(jì)算精度,在4種氣象參數(shù)輸入的組合下,輸入組合2(Tmax,Tmin,n,U2)和組合4(Tmax,Tmin,n,RH)的精度明顯高于輸入組合3(Tmax,Tmin,U2,RH),這表明輻射項(xiàng)n是保證模型精度不可缺少的重要因素,而組合4的精度要高于組合2,這表明相對濕度RH對ET0變化的影響程度高于風(fēng)速U2。輸入3種氣象參數(shù)時(shí),組合5的精度要顯著高于組合6,表明Tmax和Tmin同樣是影響模型精度的關(guān)鍵因素。比較組合5和組合7的精度可知,有無輻射項(xiàng)n對模型精度的影響顯著,綜上分析,重慶地區(qū)5種氣象因素對ET0變化的影響程度由高到低依次為日照時(shí)數(shù)n、溫度項(xiàng)Tmax和Tmin、相對濕度RH、風(fēng)速U2。
圖2 整個(gè)研究區(qū)域不同模型不同組合計(jì)算精度
圖3(以豐都為例)為不同模型計(jì)算ET0月值的年內(nèi)分布趨勢對比。由圖中可以看出,不同模型計(jì)算結(jié)果與P-M模型計(jì)算結(jié)果變化趨勢基本一致,均呈現(xiàn)先增加后降低的變化趨勢,其中在輸入組合1時(shí),不同模型ET0月值變化趨勢與P-M模型計(jì)算結(jié)果最為接近,在組合1中GEM模型與P-M模型計(jì)算結(jié)果的曲線圖擬合效果最好,GRNN模型和RF模型在各個(gè)站點(diǎn)的擬合效果較差;在組合2時(shí),擬合效果較組合1有所降低,同樣表現(xiàn)為GEM2模型的擬合效果最高;在輸入組合3時(shí),不同站點(diǎn)均表現(xiàn)為GEM3模型精度最高;組合4與組合2的模擬結(jié)果較一致,計(jì)算精度要顯著高于組合3;組合5和組合6輸入?yún)?shù)較少,而組合5的計(jì)算精度顯著高于組合6,組合7雖然僅輸入了Tmax和Tmin2種參數(shù),但其精度要高于組合6。顯然在進(jìn)行ET0月值模擬計(jì)算時(shí),組合6輸入n,RH,U2等3種參數(shù)是不可取的。
圖3 不同模型豐都站ET0月值變化趨勢
為證明人工智能模型的優(yōu)勢,本文計(jì)算了4種經(jīng)驗(yàn)?zāi)P偷木?,并與相同參數(shù)輸入情況下精度最低的人工智能模型對比,結(jié)果見表3。由表3可知,雖然輸入Tmax,Tmin,n的SVM5模型和輸入Tmax,Tmin的SVM7模型的精度在人工智能模型中最低,但其精度仍高于相同輸入?yún)?shù)的經(jīng)驗(yàn)?zāi)P?,因此,在缺少氣象資料情況下,建議在重慶地區(qū)采用人工智能模型計(jì)算ET0。
表3 人工智能模型與經(jīng)驗(yàn)?zāi)P途葘Ρ?/p>
在相同輸入?yún)?shù)條件下的人工智能模型精度要明顯高于經(jīng)驗(yàn)?zāi)P?,這與劉小華等[24]、魏俊等[14]、邢立文等[25]的研究結(jié)論基本一致。本文研究發(fā)現(xiàn),GEM模型在所有模型中表現(xiàn)出了最高的精度,該模型可通過比較標(biāo)準(zhǔn)數(shù)據(jù)和模擬數(shù)據(jù)之間的關(guān)系,從而計(jì)算出高斯指數(shù)用于模型模擬,在一定程度上保證了模型精度。Lesser等[26]驗(yàn)證了GEM模型與其余模型的計(jì)算精度,同樣指出該模型可保證模型效率和訓(xùn)練速度,其精度最高。
本文研究表明,所有的應(yīng)用模型能夠較好反映出ET0與大氣之間變化關(guān)系的復(fù)雜過程,這主要是由于人工智能算法能夠識別ET0與環(huán)境變量之間的非線性關(guān)系[27]。在不同站點(diǎn)中,GEM模型在不同輸入?yún)?shù)組合條件下,都表現(xiàn)出了最高的精度,同時(shí)該模型的預(yù)測模擬時(shí)間僅為15 s,遠(yuǎn)低于其余模型(ELM為20 s,SVM模型為33S,GRNN模型為50 s,RF模型為65 s),作為一種較新的建模技術(shù),GEM模型在預(yù)測日ET0方面表現(xiàn)出較高精度,這在以往的研究中從未得到證實(shí),同時(shí)該模型的計(jì)算效率要高于其余模型,這表明該模型方法具有簡單的網(wǎng)絡(luò)結(jié)構(gòu)和非調(diào)優(yōu)機(jī)制。這一優(yōu)勢可將該模型用于解決諸如干旱、降雨和徑流預(yù)測等實(shí)時(shí)預(yù)報(bào)問題中。
本文研究同時(shí)表明,ELM模型能夠普遍較好估算日ET0。SVM模型、GRNN模型和RF模型需要更長的時(shí)間來尋找各自的最優(yōu)參數(shù)。與其余模型相比,ELM模型更有效地避免過擬合,并具有更高的趨近度[28]。同時(shí),已有研究表明,ELM模型在運(yùn)行過程中存在Sine函數(shù)、Radbas函數(shù)和Hardlim函數(shù)共3種激活函數(shù),本文采用ELM模型默認(rèn)的Sine激活函數(shù)進(jìn)行計(jì)算,雖已有研究表明,Sine激活函數(shù)下的ELM模型精度最高,但在重慶地區(qū)尚未得到驗(yàn)證。在今后的研究中,將對不同激活函數(shù)下的ELM模型精度進(jìn)行比較,以期得到適用于重慶市ET0模擬的最優(yōu)ELM模型激活函數(shù)。本文同時(shí)發(fā)現(xiàn),影響重慶地區(qū)ET0變化的主要因素由高到低依次為日照時(shí)數(shù)n、溫度項(xiàng)Tmax和Tmin、相對濕度RH、風(fēng)速U2??苫跓o偏導(dǎo)數(shù)法計(jì)算該地區(qū)5種氣象因素對于的ET0敏感系數(shù),從而驗(yàn)證該結(jié)論[29]。計(jì)算出的敏感系數(shù)結(jié)果可見表4,由表4可以看出,日照時(shí)數(shù)、溫度項(xiàng)的敏感系數(shù)較高,相對濕度RH次之,風(fēng)速的敏感系數(shù)最低,進(jìn)一步驗(yàn)證了本文結(jié)論。
表4 不同站點(diǎn)氣象因素對的ET0敏感系數(shù)
本文以1991—2011的數(shù)據(jù)進(jìn)行訓(xùn)練模型,估算了2012—2016年的ET0數(shù)據(jù),得到了較高的精度,驗(yàn)證了GEM模型的精確性。CMIP6數(shù)據(jù)給出了未來不同氣候情景下的氣象數(shù)據(jù)值,在今后的研究中,可以用CMIP6的氣象數(shù)據(jù),對不同氣候情景下ET0進(jìn)行估算,進(jìn)一步驗(yàn)證GEM模型的準(zhǔn)確性。
(1) 不同站點(diǎn)不同氣象輸入組合條件下,GEM模型均表現(xiàn)出了較高的精度,其次是ELM模型,表明GEM模型可作為重慶地區(qū)ET0計(jì)算的標(biāo)準(zhǔn)模型使用。
(2) 對比人工智能模型與經(jīng)驗(yàn)?zāi)P偷挠?jì)算結(jié)果可知,在相同氣象參數(shù)輸入的情況下,人工智能模型計(jì)算精度要高于經(jīng)驗(yàn)?zāi)P汀?/p>
(3) 由Tmax,Tmin,n,RH,U2共5種氣象參數(shù)的輸入情況可知,5種氣象參數(shù)對重慶地區(qū)ET0變化的影響程度由高到低依次為日照時(shí)數(shù)n、溫度項(xiàng)Tmax和Tmin、相對濕度RH、風(fēng)速U2,日照時(shí)數(shù)n、溫度項(xiàng)Tmax和Tmin是保證重慶地區(qū)人工智能模型精度必不可少的因素。
(4) 在實(shí)際應(yīng)用中,當(dāng)區(qū)域氣象數(shù)據(jù)無法獲取完全時(shí),僅靠獲取區(qū)域日照和溫度數(shù)據(jù),即可基于GEM模型得到較高精度的ET0數(shù)據(jù),可為計(jì)算區(qū)域作物需水量提供重要的參數(shù)支持。