尹起 周建平 許燕 李志磊 樊湘鵬 魏禹同
摘要: 參考作物蒸散量(ET0)的準(zhǔn)確預(yù)測(cè)對(duì)于作物需水量預(yù)測(cè)、農(nóng)田精準(zhǔn)灌溉和提高水資源利用效率等具有重要意義。為了解決傳統(tǒng)方法獲取ET0的弊端,本研究基于粒子群優(yōu)化(Particle swarm optimization,PSO)-超限學(xué)習(xí)機(jī)(Extreme learning machine,ELM)預(yù)測(cè)ET0。通過選取新疆地區(qū)3個(gè)站點(diǎn)(烏魯木齊、喀什、哈密)的最高氣溫(Tmax)、最低氣溫(Tmin)、平均相對(duì)濕度(RH)、風(fēng)速(u2)、光照時(shí)間(n)等氣象數(shù)據(jù),建立PSO-ELM預(yù)測(cè)模型,對(duì)模型精度和普適性進(jìn)行研究,并通過與ELM、Makkink、I-A模型的對(duì)比,探究不同氣象因子組合模型的預(yù)測(cè)精度。結(jié)果表明,PSO-ELM模型在5種氣象因子輸入下具有最高預(yù)測(cè)精度(平均R2=0.974 7,平均MAE=0.252 0 mm/d,平均RMSE=0.364 3 mm/d)。由PSO-ELM6模型與ELM、Makkink、I-A模型的對(duì)比結(jié)果看出,在相同的氣象因子輸入條件下,3個(gè)站點(diǎn)用PSO-ELM6模型預(yù)測(cè)的效果最好。通過對(duì)PSO-ELM3模型在新疆地區(qū)普適性的研究發(fā)現(xiàn),該模型具有較高的預(yù)測(cè)精度(平均R2=0.946 5,平均MAE=0.307 0 mm/d,平均RMSE=0.356 9 mm/d)。不同站點(diǎn)、不同氣象因子輸入的PSO-ELM模型能夠較為精準(zhǔn)地反映氣象因子與ET0之間復(fù)雜的非線性關(guān)系,且模型在新疆地區(qū)的普適性較好,可以為新疆地區(qū)逐日ET0預(yù)測(cè)提供新的方法。
關(guān)鍵詞: 新疆;粒子群優(yōu)化;超限學(xué)習(xí)機(jī);參考作物蒸散量;模型精度
中圖分類號(hào): S27;TP312 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1000-4440(2021)03-0622-10
Prediction of reference crop evapotranspiration in Xinjiang based on particle swarm optimization(PSO) optimized extreme learning machine
YIN Qi1, ZHOU Jian-ping1, XU Yan1, LI Zhi-lei2, FAN Xiang-peng1, WEI Yu-tong1
(1.College of Mechanical Engineering,Xinjiang University,Urumqi 830000,China;2.Engineering Training Center,Xinjiang University,Urumqi 830000,China)
Abstract: Accurate prediction of reference crop evapotranspiration (ET0) is of great significance in predicting crop water demand, precise irrigation of farmland and improving water resource utilization efficiency. To solve the disadvantages of traditional methods in obtaining ET0, ET0 was predicted based on particle swarm optimization (PSO)-extreme learning machine (ELM) in this study. By selecting meteorological data such as maximum temperature (Tmax), minimum temperature (Tmin), average relative humidity (RH), wind speed (u2) and illumination time (n) of three stations in Xinjiang (Urumqi, Kashgar and Hami), the PSO-ELM prediction model was established. The accuracy and universality of the model was studied, and the prediction accuracy of models combined with different meteorological factors was explored by comparing with ELM, Makkink and I-A models. The results showed that, PSO-ELM model showed the highest prediction accuracy under the input condition of five meteorological factors (average R2=0.974 7, average mean absolute error=0.252 0 mm/d, average root mean square error=0.364 3 mm/d). The prediction effect of PSO-ELM6 model was the best under the same meteorological factor input conditions of three stations by comparing the PSO-ELM6 model with ELM, Makkink, I-A models. The research on the universality of PSO-ELM3 model in Xinjiang showed that, the model had high prediction accuracy (average R2=0.946 5, average mean absolute error=0.307 0 mm/d, average root mean square error=0.356 9 mm/d). The PSO-ELM model with different meteorological inputs at different stations can accurately reflect the complex non-linear relationship between meteorological factors and ET0, and the model shows good generalizability in Xinjiang, which can provide new methods for daily ET0 prediction in Xinjiang.
Key words: Xinjiang;particle swarm optimization;extreme learning machine;reference crop evapotranspiration;model accuracy
參考作物蒸散量(ET0)是水循環(huán)研究中的重要組成部分,也是優(yōu)化農(nóng)業(yè)用水的重要變量,在水資源可持續(xù)管理及農(nóng)業(yè)精準(zhǔn)灌溉中起著重要作用[1]。在農(nóng)業(yè)生態(tài)系統(tǒng)中,約2/3的降水量由作物蒸散過程損失[2-3]。由于頻繁的干旱及農(nóng)業(yè)、個(gè)人和工業(yè)用戶之間對(duì)水資源的競(jìng)爭(zhēng),目前的農(nóng)業(yè)生產(chǎn)用水量已經(jīng)減少[4]。因此,有必要為灌溉管理者和水利研究人員提供一個(gè)準(zhǔn)確的工具來估算參考作物蒸散量。ET0的獲取方法較多,通??梢允褂谜魸B儀或渦流協(xié)方差系統(tǒng)直接測(cè)量,但是使用、建設(shè)和維護(hù)蒸滲儀的成本較高。因此,使用基于氣象因子經(jīng)驗(yàn)和半經(jīng)驗(yàn)建立的數(shù)學(xué)模型是一種更加符合實(shí)際且不需要額外代價(jià)的方法,如Hargreaves-Samani模型、Priestley-Taylor模型、Makkink模型等,但是這些數(shù)學(xué)模型受到多種因素影響,很難準(zhǔn)確預(yù)測(cè)ET0[5]。聯(lián)合國(guó)糧食及農(nóng)業(yè)組織(FAO)推薦FAO-56 Penman-Monteith(PM)方法用于計(jì)算ET0的標(biāo)準(zhǔn)值,該方法需要大量氣象數(shù)據(jù)(相對(duì)濕度、最高氣溫、最低氣溫、太陽輻射和風(fēng)速等),但是這些數(shù)據(jù)并不總能從氣象站獲取,在大多數(shù)發(fā)展中國(guó)家,這些氣象數(shù)據(jù)往往是缺失或無法獲取的[6]。
近年來,機(jī)器學(xué)習(xí)模型被應(yīng)用于各個(gè)領(lǐng)域的科學(xué)和工程研究中以處理各種問題,如建模、優(yōu)化和預(yù)測(cè)等[7-12]。使用機(jī)器學(xué)習(xí)模型通過選擇輸入(添加或刪除輸入因子),并找到變量(輸入和目標(biāo)變量)之間隱藏的復(fù)雜關(guān)系。此外,機(jī)器學(xué)習(xí)在ET0的預(yù)測(cè)方面也得到了大量應(yīng)用[13-20],且氣溫是被證明與ET0相關(guān)性最好的因子[21-22]。本研究選擇基于最高氣溫(Tmax)、最低氣溫(Tmin)的多種氣象因子組合模型對(duì)試驗(yàn)結(jié)果進(jìn)行分析。
張皓杰等[23-24]采用超限學(xué)習(xí)機(jī)(Extreme learning machine,ELM)對(duì)中國(guó)不同地區(qū)的ET0進(jìn)行建模預(yù)測(cè),研究在不同氣象因子輸入下模型的擬合程度,并且得到了較好的結(jié)果。雖然ELM算法已經(jīng)被許多研究者在不同的工程領(lǐng)域中得到驗(yàn)證,但是該算法的參數(shù)(隨機(jī)初始化的輸入權(quán)重和隱藏閾值)會(huì)限制模型的準(zhǔn)確程度。在此背景下,本研究提出1種粒子群優(yōu)化-超限學(xué)習(xí)機(jī)(PSO-ELM)預(yù)測(cè)ET0的方法,并將該算法與傳統(tǒng)ELM算法及2種經(jīng)驗(yàn)?zāi)P瓦M(jìn)行比較,分析在不同地區(qū)輸入不同組合氣象因子的最佳預(yù)測(cè)模型,并通過對(duì)模型的普適性分析,篩選出新疆不同地區(qū)逐日ET0的最佳計(jì)算方法,以期為ET0的高精度預(yù)測(cè)提供一定的參考。
1 材料與方法
1.1 研究區(qū)域和數(shù)據(jù)集劃分
新疆維吾爾自治區(qū)位于中國(guó)西北地區(qū),地處亞歐大陸腹地,屬于溫帶大陸性氣候??紤]到新疆不同地區(qū)地理區(qū)域的差異性,選取站點(diǎn)需要有代表性,本研究選取的3個(gè)主要研究站點(diǎn)為新疆地區(qū)6個(gè)氣象站點(diǎn)中的烏魯木齊牧試站(地理位置為87°11′E、43°27′N,海拔為1 930 m)、喀什站(地理位置為75°45′E、39°29′N,海拔為1 385 m)、哈密站(地理位置為93°31′E、42°49′N,海拔為737 m)。選取的用于模型普適性分析的輔助站點(diǎn)分別為阿勒泰站(地理位置為88°05′E、47°44′N,海拔為735 m)、昭蘇站(地理位置為81°30′E、43°14′N,海拔為1 851 m)、和田站(地理位置為79°56′E、37°08′N,海拔為1 375 m)。本研究站點(diǎn)的地理位置見圖1。本研究獲取的平均氣溫(Tmean)、最高氣溫(Tmax)、最低氣溫(Tmin)、相對(duì)濕度(RH)、風(fēng)速(u)、日照時(shí)長(zhǎng)(n)等逐日氣象數(shù)據(jù)來源于中國(guó)氣象數(shù)據(jù)網(wǎng)(http://data.cma.cn)。本研究站點(diǎn)的氣象數(shù)據(jù)涵蓋2009年1月至2019年12月的11年(132個(gè)月),站點(diǎn)氣象資料完整且經(jīng)過人工審核。本研究中的數(shù)據(jù)集采用留出法進(jìn)行劃分,以2009年1月至2017年12月的數(shù)據(jù)作為訓(xùn)練集,占總數(shù)據(jù)量的82%,以2018年1月至2019年12月的數(shù)據(jù)作為測(cè)試集,占總數(shù)據(jù)量的18%。取3次試驗(yàn)結(jié)果的平均值作為最終數(shù)據(jù)評(píng)價(jià)指標(biāo)。
1.2 參考作物蒸散量計(jì)算方法
以聯(lián)合國(guó)糧食及農(nóng)業(yè)組織推薦的FAO-56 Penman-Monteith(PM)方法作為ET0計(jì)算方法獲取標(biāo)準(zhǔn)ET0值,計(jì)算公式如下:
ET0=0.408△(Rn-G)+γ900T+273u2(es-ea)△+γ(1+0.34u2)(1)
式中,ET0為參考作物蒸散量,mm/d;T為平均氣溫,℃;△為氣溫-飽和水汽壓關(guān)系曲線上氣溫為T時(shí)的斜率,kPa/℃;Rn為凈輻射量,MJ/(m2·d);G為土壤熱通量,MJ/(m2·d);γ為濕度計(jì)常數(shù),kPa/℃;u2為2 m高度處的風(fēng)速,m/s;es為飽和水汽壓,kPa;ea為實(shí)際水汽壓,kPa。上述每個(gè)變量的計(jì)算方法詳見FAO-56[25]。
另外選取2種經(jīng)驗(yàn)?zāi)P停?/p>
Makkink經(jīng)驗(yàn)?zāi)P停?/p>
ET0=0.61△△+γRs2.45-0.12(2)
式中,Rs為太陽總輻射,MJ/(m2·d);其余變量的含義與公式(1)相同。
Irmark-Allen(I-A)經(jīng)驗(yàn)?zāi)P停?/p>
ET0=0.489+0.289Rn+0.023Tmean ?(3)
式中,Tmean為當(dāng)日平均氣溫,℃;其余變量的含義與公式(1)相同。
1.3 超限學(xué)習(xí)機(jī)
ELM是新加坡南洋理工大學(xué)黃廣斌教授于2006年正式提出的[26],旨在克服傳統(tǒng)機(jī)器學(xué)習(xí)算法存在的大量人為調(diào)整參數(shù)、計(jì)算速度緩慢、泛化性能較差等問題。該算法是一種單隱含層前饋傳播的神經(jīng)網(wǎng)絡(luò),其輸入層和隱含層之間的連接權(quán)重、隱含層神經(jīng)元的閾值是隨機(jī)生成的,設(shè)定完成后就不再調(diào)整。隱含層和輸出層的權(quán)重不需要迭代調(diào)整,而是通過解廣義逆求得,因此該算法在計(jì)算時(shí)間上有較大優(yōu)勢(shì)。ELM包括3層:輸入層、隱含層和輸出層。
對(duì)于輸入N個(gè)不同的樣本(xi,yi),xi=[xi1,xi2,…,xin]T∈Rn,ti=[ti1,ti2,…,tik]T∈Rk,設(shè)隱含層節(jié)點(diǎn)數(shù)為L(zhǎng)個(gè),激活函數(shù)為G(x),則該算法的表達(dá)式為:
ti=f(xi)=∑Lj=1βjG(wj·xi+bj),wj∈Rn, βj∈Rk(4)
式中,i=1,2,…,N;j=1,2,…,L;wj=[wi1,wi2,…,win]表示連接輸入層到第j個(gè)隱含層節(jié)點(diǎn)的輸入權(quán)重;βj=[βj1,βj2,…,βjk]T表示連接第j個(gè)隱含層節(jié)點(diǎn)到輸出節(jié)點(diǎn)的輸出權(quán)重;激活函數(shù)G(x)可選擇Sigmoid函數(shù)、Sin函數(shù)等;wj·xi為向量wj和xi的內(nèi)積;bj為隱含層第j個(gè)神經(jīng)元的閾值。
將該表達(dá)式轉(zhuǎn)為矩陣,可得:
Hβ=T(5)
由于H在訓(xùn)練前是已經(jīng)確定的矩陣,該網(wǎng)絡(luò)的訓(xùn)練轉(zhuǎn)化為求輸出權(quán)重的最小二乘解的問題,輸出權(quán)重可表示為下式:
β=H+T(6)
式中,H+為隱含層輸出矩陣H的Moore-Penrose廣義逆[26]。
1.4 粒子群優(yōu)化-超限學(xué)習(xí)機(jī)算法
由于ELM連接的輸入層與隱含層的權(quán)重(w)和隱藏神經(jīng)元閾值(b)是隨機(jī)生成的,從而可能使模型進(jìn)入局部最優(yōu),導(dǎo)致預(yù)測(cè)結(jié)果精度較差。粒子群優(yōu)化算法是1種應(yīng)用廣泛的優(yōu)化算法,是由Eberhart和Kennedy從生物群體的協(xié)作行為出發(fā)提出的,多用于調(diào)整機(jī)器學(xué)習(xí)模型參數(shù),其在農(nóng)業(yè)方面的應(yīng)用也被證明是有前景的[27-28]。因此本研究利用PSO算法優(yōu)化ELM的輸入權(quán)重和隱含神經(jīng)元的閾值。PSO中的每個(gè)粒子被認(rèn)為是群中的一個(gè)個(gè)體,粒子的好壞用適應(yīng)度函數(shù)的值判斷,并通過個(gè)體和全局每步的最優(yōu)位置不斷更新,最終獲得最優(yōu)解。
在1個(gè)D維空間中,設(shè)含有n個(gè)粒子群X=(X1,X2,…,Xn),粒子i的位置(Xi)=(Xi1,Xi2,…,XiD)T,速度(Vi)=(Vi1,Vi2,…,ViD)T,粒子i和整個(gè)群的最佳位置分別為Pi=(Pi1,Pi1,...,PiD)T和Pg=(Pg1,Pg2,...,PgD)T,在粒子群迭代優(yōu)化過程中,粒子i的位置和速度的更新表示為:
Xk+1id=Xkid+Vk+1id(7)
Vk+1id=ωvkid+c1r1(Pkid-Xkid)+c2r2(Pkgd-Xkid) (8)
式中,d=1,2,…,D;i=1,2,…,n;w為慣性權(quán)重,其值代表偏重于全局搜索和局部搜索的能力;k為當(dāng)前迭代次數(shù);c1、c2為學(xué)習(xí)因子;r1、r2為0~1中的隨機(jī)數(shù)。
PSO-ELM算法的具體步驟如下:
(1)對(duì)數(shù)據(jù)集進(jìn)行歸一化處理,并劃分訓(xùn)練集和測(cè)試集。
(2)設(shè)置ELM輸入層、隱含層、輸出層維度,設(shè)置PSO種群大小、最小誤差、迭代速度、迭代次數(shù)、慣性權(quán)重、學(xué)習(xí)因子。
(3)計(jì)算粒子的適應(yīng)度,選擇均方誤差(Mean squared error,MSE)作為適應(yīng)度函數(shù)SMSE,表達(dá)式如下:
SMSE=1N∑Ni=1(Ti-Yi)2(9)
式中:N為總樣本數(shù);Ti為樣本的實(shí)際值;Yi為樣本的預(yù)測(cè)值。
根據(jù)上式計(jì)算個(gè)體的適應(yīng)度,迭代優(yōu)化個(gè)體和全局最優(yōu)粒子的位置和速度;當(dāng)?shù)竭_(dá)設(shè)置的最小誤差或一定的迭代次數(shù)時(shí)終止,得到輸入權(quán)重和隱含層閾值的最優(yōu)參數(shù);將最優(yōu)參數(shù)帶入ELM進(jìn)行計(jì)算,輸出最優(yōu)解。
PSO-ELM算法的流程見圖2。
1.5 算法參數(shù)設(shè)置
設(shè)算法模型輸入氣象因子的數(shù)量為m個(gè),PSO-ELM算法和ELM算法的參數(shù)設(shè)置見表1。
1.6 模型評(píng)價(jià)指標(biāo)
為了評(píng)價(jià)預(yù)測(cè)結(jié)果,選擇決定系數(shù)(R2)、平均絕對(duì)誤差(MAE)、均方根誤差(RMSE)、整體評(píng)價(jià)指標(biāo)(GPI)作為預(yù)測(cè)結(jié)果的評(píng)價(jià)指標(biāo),相關(guān)公式如下:
MAE=1MMi=1|yi-i|(11)
RMSE=1MMi=1(yi-i)2(12)
GPIj=3k=1αk(Zjk-Zk)(13)
式中,yi為真實(shí)值;i為預(yù)測(cè)值;yi—為真實(shí)值的平均值;M為預(yù)測(cè)模型的天數(shù);GPIj為模型j的GPI值;Zjk為模型j參數(shù)k的值;Zk為模型參數(shù)k的中位數(shù),當(dāng)k=R2時(shí),αk=1,當(dāng)k=RMSE或MAE時(shí),αk=-1;GPI越大,預(yù)測(cè)結(jié)果的準(zhǔn)確度越高。
2 結(jié)果與分析
2.1 不同輸入因子下PSO-ELM模型的預(yù)測(cè)精度分析
本研究是基于氣溫因子(Tmax、Tmin)進(jìn)行分析的。由表2可知,包含氣溫因子且表現(xiàn)較差的模型在烏魯木齊、喀什、哈密地區(qū)分別為PSO-ELM8、PSO-ELM4、PSO-ELM8,但模型的各項(xiàng)評(píng)價(jià)指標(biāo)均優(yōu)于不包含氣象因子的模型(PSO-ELM9~PSO-ELM12),在這3個(gè)地區(qū)含有氣象因子且表現(xiàn)最差的模型(喀什地區(qū)的PSO-ELM4模型)的精度也比不含有氣溫因子的最好的模型(喀什地區(qū)的PSO-ELM9模型)高??梢酝茰y(cè),氣溫因子與ET0的相關(guān)性最高,這與李志磊等[21-22]的研究結(jié)論一致。
對(duì)3個(gè)站點(diǎn)基于氣溫氣象因子的8種模型(PSO-ELM1~PSO-ELM8)進(jìn)行分析。圖3為未經(jīng)處理的原始折線,可見ET0在不同站點(diǎn)及不同模型下波動(dòng)較大。由于圖3具有偽噪聲特性,不利于直觀展示各個(gè)模型與PM標(biāo)準(zhǔn)值的擬合度,因此對(duì)預(yù)測(cè)值進(jìn)行高斯平滑處理。圖4為高斯平滑處理后基于PM標(biāo)準(zhǔn)值的2019年烏魯木齊站點(diǎn)、喀什站點(diǎn)、哈密站點(diǎn)PSO-ELM模型日ET0的預(yù)測(cè)曲線,可以看出,各站點(diǎn)ET0表現(xiàn)為喀什站點(diǎn)>哈密站點(diǎn)>烏魯木齊站點(diǎn),3個(gè)站點(diǎn)的年均ET0需求量分別為4.058 6 mm/d、3.034 6 mm/d、1.573 8 mm/d。如表2所示,3個(gè)站點(diǎn)的R2為0.777 0~0.989 2,MAE為0.094 6~1.088 6 mm/d,RMSE為0.131 4~1.588 4 mm/d。
當(dāng)輸入的氣象因子數(shù)量為5個(gè)時(shí),烏魯木齊站點(diǎn)、喀什站點(diǎn)、哈密站點(diǎn)的PSO-ELM1模型的R2分別為0.989 2、0.985 2、0.949 7,MAE分別為0.094 6 mm/d、0.196 7 mm/d、0.464 7 mm/d,RMSE分別為0.131 4 mm/d、0.390 4 mm/d、0.571 1 mm/d,平均R2=0.974 7,平均MAE=0.252 0 mm/d,平均RMSE=0.364 3 mm/d。雖然哈密站點(diǎn)模型的精度略低于其他2個(gè)站點(diǎn),但相比于其他模型的精度已經(jīng)達(dá)到最高水平。以上結(jié)果表明,PSO-ELM1模型的綜合判斷精度在所有模型中最高,能夠精準(zhǔn)反映氣象因子與ET0之間的關(guān)系。
當(dāng)輸入的氣象因子數(shù)量為4個(gè)時(shí),即缺失u2、n、RH其中1個(gè),此時(shí)PSO-ELM模型的精度較輸入5個(gè)氣象因子的模型略有下降,在喀什站點(diǎn)PSO-ELM4模型的R2下降了0.220 6,其預(yù)測(cè)效果相對(duì)較差。而在烏魯木齊站點(diǎn),PSO-ELM4模型的R2為0.968 5,表明該模型在烏魯木齊站點(diǎn)的適用性大于喀什站點(diǎn)及哈密站點(diǎn)。PSO-ELM3模型的精度明顯優(yōu)于PSO-ELM2、PSO-ELM4模型,與PSO-ELM1模型相比,R2、MAE、RMSE的差值分別小于0.002 9 mm/d、0.012 6 mm/d、0.097 5 mm/d,可以作為PSO-ELM1的近似模型。烏魯木齊站點(diǎn)模型按精度排序?yàn)镻SO-ELM3>PSO-ELM4>PSO-ELM2,其中氣象因子u2和RH對(duì)模型的正向影響較大,喀什站點(diǎn)、哈密站點(diǎn)模型按精度排序?yàn)镻SO-ELM3>PSO-ELM2>PSO-ELM4,其中氣象因子u2和n對(duì)模型的正向影響較大。在本輸入因子條件下,3個(gè)站點(diǎn)中表現(xiàn)最好的模型均含有u2因子。綜合考慮得出,在4個(gè)氣象因子條件下,氣象因子u2是除氣溫因素外對(duì)ET0影響最大的,這與張皓杰等[23]研究得出的除氣溫因素外u2因素為西北旱區(qū)ET0的主要驅(qū)動(dòng)因子的結(jié)論一致。
當(dāng)輸入的氣象因子數(shù)量為3個(gè)時(shí),即缺失u2、n、RH其中的2個(gè),PSO-ELM6模型的精度下降最為明顯,其中喀什站點(diǎn)、哈密站點(diǎn)的R2分別降至0.794 8、0.808 2,MAE分別提高至1.021 0 mm/d、0.752 5 mm/d,RMSE分別提高至1.588 4 mm/d、1.174 7 mm/d。值得關(guān)注是,在喀什地區(qū),與PSO-ELM4模型相比可知,PSO-ELM6模型在缺少輸入因子RH的情況下綜合指標(biāo)反而優(yōu)于PSO-ELM4模型,說明在某些地區(qū)增加輸入因子不一定能提升預(yù)測(cè)精度。模型PSO-ELM5在喀什站點(diǎn)、哈密站點(diǎn)表現(xiàn)出較為理想的擬合效果。與PSO-ELM2相比,PSO-ELM5在少了因子n后,3個(gè)站點(diǎn)的R2、MAE、RMSE變化較小,表明輸入不同氣象因子對(duì)ET0的影響水平與貢獻(xiàn)率大小不同,得出n因子的貢獻(xiàn)率較其余2個(gè)因子小。PSO-ELM7模型在烏魯木齊站點(diǎn)的表現(xiàn)優(yōu)于PSO-ELM5且異于喀什站點(diǎn)、哈密站點(diǎn)的較優(yōu)模型,MAE、RMSE分別為0.160 0 mm/d、0.242 1 mm/d,是3因子模型中的最優(yōu)值,表明在烏魯木齊地區(qū),氣象因子RH對(duì)ET0的貢獻(xiàn)率起主導(dǎo)作用,PSO-ELM7可作為該地區(qū)ET0的推薦模型。
當(dāng)輸入的氣象因子數(shù)量為2個(gè)時(shí),即只有Tmax、Tmin2個(gè)因子,僅在輸入氣溫因子時(shí)模型PSO-ELM8也表現(xiàn)出一定的預(yù)測(cè)能力,其中烏魯木齊站點(diǎn)的R2高達(dá)0.871 4,MAE為0.326 9 mm/d,RMSE為0.453 9 mm/d,與喀什站點(diǎn)、哈密站點(diǎn)的相關(guān)指標(biāo)相比最好,說明該模型在新疆平均氣溫較低的地區(qū)(烏魯木齊、喀什、哈密,年均氣溫分別為8.35 ℃、12.95 ℃、11.00 ℃)適用性好;相對(duì)于PSO-ELM6而言少了氣象因子n,但相對(duì)應(yīng)的預(yù)測(cè)精度僅略微下降,這與上文中氣溫因子和ET0相關(guān)性最高的結(jié)論一致;在喀什站點(diǎn),與PSO-ELM7模型相比,PSO-ELM8模型在缺少輸入因子RH情況下綜合指標(biāo)反而也優(yōu)于PSO-ELM7模型,同樣印證了上文所提到的結(jié)論——在某些地區(qū)增加輸入因子不一定能提升預(yù)測(cè)精度。
2.2 PSO-ELM模型與其他模型預(yù)測(cè)精度的比較分析
以PM公式計(jì)算得出的ET0作為標(biāo)準(zhǔn)值,在上述模型精度的評(píng)價(jià)中選擇精度較差的PSO-ELM6模型與ELM、Makkink、I-A 3種模型進(jìn)行綜合對(duì)比,Makkink、I-A模型的計(jì)算方法分別見公式(2)和公式(3)。
選擇氣象因子Tmax、Tmin、n作為輸入?yún)?shù)。表3顯示,3個(gè)站點(diǎn)PSO-ELM6模型的R2、MAE、RMSE范圍分別為0.794 8~0.907 9、0.274 8~1.021 0 mm/d、0.388 3~1.588 4 mm/d。ELM模型的精度較PSO-ELM6低,其中R2、MAE、RMSE的范圍分別為0.704 1~0.897 5、0.287 3~1.106 7 mm/d、0.405 1~1.719 7 mm/d。PSO-ELM6、ELM的GPI分別為1.730 3、0.916 5,結(jié)果表明,粒子群優(yōu)化后的ELM在精度方面有了明顯提升。在經(jīng)驗(yàn)?zāi)P头矫?,雖然烏魯木齊站點(diǎn)經(jīng)驗(yàn)?zāi)P虸-A的R2為0.791 4,小于Makkink的0.857 4,但兩者的GPI分別為-1.135 1、-8.880 7,表明I-A模型的綜合精度比Makkink模型高。4種模型的GPI排序?yàn)镻SO-ELM6>ELM>I-A>Makkink。圖5為在3個(gè)站點(diǎn)由4種不同模型的預(yù)測(cè)結(jié)果與PM公式計(jì)算的ET0標(biāo)準(zhǔn)值分布的箱線圖,可以看出,PSO-ELM6模型的箱體位置分布、中位線、上下邊緣線與PM標(biāo)準(zhǔn)模型非常相近且相似度大于ELM,與I-A、Makkink傳統(tǒng)模型相比,機(jī)器學(xué)習(xí)模型提供了更接近PM標(biāo)準(zhǔn)值的ET0分布。根據(jù)上述分析可知,基于機(jī)器學(xué)習(xí)的模型比傳統(tǒng)經(jīng)驗(yàn)?zāi)P途哂懈玫男阅?,與ELM、I-A、Makkink模型相比,PSO-ELM6模型在所有站點(diǎn)提供了最好的ET0預(yù)測(cè)。
2.3 PSO-ELM模型的普適性分析
由上述分析結(jié)果可知,PSO-ELM3模型(輸入氣象因子為Tmax、Tmin、RH、u2)在輸入因子較少的情況下表現(xiàn)出較高精度。為了對(duì)模型在新疆地區(qū)的普適性進(jìn)行分析,以PSO-ELM3作為烏魯木齊、喀什、哈密訓(xùn)練站點(diǎn)的模型,在2018-2019年選取烏魯木齊、喀什、哈密、阿勒泰、昭蘇、和田中的5個(gè)站點(diǎn)作為預(yù)測(cè)站點(diǎn)建立預(yù)測(cè)模型,共構(gòu)建15個(gè)預(yù)測(cè)模型。
由表4可知,模型PSO-ELM3在新疆地區(qū)各個(gè)站點(diǎn)的R2均大于0.905 0,MAE均小于0.456 7 mm/d,RMSE均小于0.596 8 mm/d,其中阿勒泰站點(diǎn)的ET0誤差相對(duì)較大,平均R2、MAE、RMSE分別為0.923 4、0.345 9 mm/d、0.403 3 mm/d,模型精度稍低,這是由于阿勒泰地區(qū)處于較高的緯度且年平均氣溫(4.25 ℃)與其他站點(diǎn)的差距較大。整體上看,與原始訓(xùn)練站點(diǎn)模型精度對(duì)比可知,預(yù)測(cè)站點(diǎn)的模型預(yù)測(cè)精度僅略微下降,各個(gè)站點(diǎn)間模型的可移植性較好,都達(dá)到了較高水平。結(jié)果表明,PSO-ELM3模型在新疆各地區(qū)的普適性較好,可以將該模型作為預(yù)測(cè)新疆地區(qū)其他站點(diǎn)ET0值的推薦模型。
3 結(jié)論
本研究基于粒子群優(yōu)化算法[29]優(yōu)化超限學(xué)習(xí)機(jī)的權(quán)重和閾值,利用新疆各地區(qū)2009-2019年的氣象數(shù)據(jù)建立了1個(gè)用于逐日ET0預(yù)測(cè)的PSO-ELM模型,將該模型用于不同地區(qū)的ET0預(yù)測(cè)。結(jié)果表明,PSO-ELM在3個(gè)主研究地區(qū)的8種氣象因子組合條件下都表現(xiàn)出了較好的預(yù)測(cè)精度,通過與其他模型的對(duì)比及普適性分析,驗(yàn)證了該模型在不同地區(qū)、不同條件下的適用性和普適性。
對(duì)5種不同的氣象因子進(jìn)行組合,得到3個(gè)站點(diǎn)的8種不同PSO-ELM模型,不同模型預(yù)測(cè)烏魯木齊、喀什、哈密地區(qū)ET0的精度有差異,其中PSO-ELM1的預(yù)測(cè)精度最高,在對(duì)應(yīng)站點(diǎn)的平均R2為0.974 7,MAE、RMSE表現(xiàn)出較小誤差(平均MAE=0.252 0 mm/d,平均RMSE=0.364 3 mm/d)。當(dāng)輸入因子數(shù)為4個(gè)時(shí),模型PSO-ELM2、PSO-ELM3、PSO-ELM4的分析結(jié)果表明,在新疆各站點(diǎn)中除氣溫因子外氣象因子u2對(duì)ET0預(yù)測(cè)影響最大,在只有氣溫因子輸入的情況下,模型也能表現(xiàn)出足夠的精度。結(jié)果表明,PSO-ELM模型在不同氣象因子輸入組合下是一種能夠作為替代PM公式計(jì)算ET0的模型。
將使用Tmax、Tmin、n作為氣象輸入因子的PSO-ELM6、ELM、Makkink、I-A模型與由PM公式計(jì)算出的標(biāo)準(zhǔn)值進(jìn)行對(duì)比發(fā)現(xiàn),PSO-ELM6的預(yù)測(cè)效果好于其他3種模型,烏魯木齊站點(diǎn)、喀什站點(diǎn)、哈密站點(diǎn)的R2分別為0.907 9、0.794 8、0.808 2,且平均MAE為0.682 8 mm/d,平均RMSE為1.050 5 mm/d,均為最小值。因此PSO-ELM6更適合氣象因子(Tmax、Tmin、n)輸入條件下烏魯木齊、喀什、哈密地區(qū)的逐日ET0預(yù)測(cè)。
通過對(duì)模型的普適性分析,將烏魯木齊站點(diǎn)、喀什站點(diǎn)、哈密站點(diǎn)的PSO-ELM3模型應(yīng)用到疆地區(qū)其他站點(diǎn)進(jìn)行ET0預(yù)測(cè),預(yù)測(cè)結(jié)果表現(xiàn)較好,R2為0.920 7~0.982 3,MAE為0.103 4~0.456 6 mm/d,RMSE為0.153 0~0.596 7 mm/d,整體表現(xiàn)出較高的預(yù)測(cè)精度,表明該模型在新疆不同地區(qū)的普適性較好,可以作為新疆缺乏歷史數(shù)據(jù)地區(qū)的ET0預(yù)測(cè)模型使用。
參考文獻(xiàn):
[1] 康紹忠.農(nóng)業(yè)水土工程概論[M].北京:中國(guó)農(nóng)業(yè)出版社,2007:115-118.
[2] SHIRI J, NAZEMI A H, SADRADDINI A A,et al. Comparison of heuristic and empirical approaches for estimating reference evapotranspiration from limited inputs in Iran[J]. Computers and Electronics in Agriculture, 2014,108: 230-241.
[3] KISI O, SANIKHANI H, ZOUNEMAT-KERMANI M, et al. Long-term monthly evapotranspiration modeling by several data-driven methods without climatic data[J]. Computers and Electronics in Agriculture, 2015,115: 66-77.
[4] MARTI P, GONZLEZ-ALTOZANO P, LPEZ-URREAR, et al. Modeling reference evapotranspiration with calculated targets. Assessment and implications[J]. Agricultural Water Management, 2015,149: 81-90.
[5] FERREIRA L B, DA CUNHA F F, DE OLIVEIRA R A, et al. Estimation of reference evapotranspiration in Brazil with limited meteorological data using ANN and SVM-A new approach[J]. Journal of Hydrology, 2019, 572: 556-570.
[6] BANDA P, CEMEK B, KUCUKTOPCU E, et al. Estimation of daily reference evapotranspiration by neuro computing techniques using limited data in a semi-arid environment[J]. Archives of Agronomy and Soil Science, 2018, 64(7): 916-929.
[7] 冀秀梅,王 龍,高克偉,等. 極限學(xué)習(xí)機(jī)在中厚板軋制力預(yù)報(bào)中的應(yīng)用[J].鋼鐵研究學(xué)報(bào),2020,32(5):393-399.
[8] 盧宏亮,趙明松. 基于神經(jīng)網(wǎng)絡(luò)模型的安徽省土壤pH預(yù)測(cè)[J].江蘇農(nóng)業(yè)學(xué)報(bào),2019,35(5):1119-1123.
[9] 李 晨,崔寧博,魏新平,等. 改進(jìn)Hargreaves模型估算川中丘陵區(qū)參考作物蒸散量[J].農(nóng)業(yè)工程學(xué)報(bào),2015,31(11): 129-135.
[10]LI H J, XU Q, HE Y S, et al. Prediction of landslide displacement with an ensemble-based extreme learning machine and copula models[J]. Landslides, 2018, 15(10): 2047-2059.
[11]張 千,魏正英,張育斌,等. 基于煙花算法優(yōu)化極限學(xué)習(xí)機(jī)的溫室參考作物蒸散量預(yù)測(cè)研究[J].中國(guó)農(nóng)村水利水電,2020(3):29-32,38.
[12]許偉棟,趙忠蓋. 基于卷積神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)算法的馬鈴薯表面缺陷檢測(cè)[J].江蘇農(nóng)業(yè)學(xué)報(bào),2018,34(6):1378-1385.
[13]魏 俊,崔寧博,陳雨霖,等. 基于極限學(xué)習(xí)機(jī)模型的中國(guó)西北地區(qū)參考作物蒸散量預(yù)報(bào)[J].中國(guó)農(nóng)村水利水電,2018(8):35-39.
[14]劉小華,魏炳乾,吳立峰,等. 4種人工智能模型在江西省參考作物蒸散量計(jì)算中的適用性[J].排灌機(jī)械工程學(xué)報(bào),2020,38(1):102-108.
[15]樊湘鵬,許 燕,周建平,等. 遺傳算法與小波神經(jīng)網(wǎng)絡(luò)在ET0預(yù)測(cè)中的應(yīng)用[J].燕山大學(xué)學(xué)報(bào),2019,43(2):182-188.
[16]RAWAT K S, SINGH S K, BALA A, et al. Estimation of crop evapotranspiration through spatial distributed crop coefficient in a semi-arid environment[J]. Agricultural Water Management, 2019,213: 922-933.
[17]邢立文,崔寧博,董 娟. 基于LSTM深度學(xué)習(xí)模型的華北地區(qū)參考作物蒸散量預(yù)測(cè)研究[J].水利水電技術(shù),2019,50(4):64-72.
[18]李可利,張 鑫. 基于ANFIS的陜西省參考作物蒸散量計(jì)算[J].自然資源報(bào),2020,35(6):1472-1483.
[19]GRANATA F. Evapotranspiration evaluation models based on machine learning algorithms—A comparative study[J]. Agricultural Water Management, 2019,217: 303-315.
[20]ANTONOPOULOS V Z, ANTONOPOULOS A V. Daily reference evapotranspiration estimates by artificial neural networks technique and empirical equations using limited input climate variables[J]. Computers and Electronics in Agriculture, 2017,132: 86-96.
[21]李志磊,周建平,魏正英,等. ET0預(yù)測(cè)的卡爾曼濾波修正ANFIS模型研究[J].干旱地區(qū)農(nóng)業(yè)研究,2017,35(3):114-119.
[22]馮 禹,崔寧博,龔道枝,等. 基于極限學(xué)習(xí)機(jī)的參考作物蒸散量預(yù)測(cè)模型[J].農(nóng)業(yè)工程學(xué)報(bào),2015,31(增刊1):153-160.
[23]張皓杰,崔寧博,徐 穎,等. 基于ELM的西北旱區(qū)參考作物蒸散量預(yù)報(bào)模型[J].排灌機(jī)械工程學(xué)報(bào),2018,36(8):779-784.
[24]吳立峰,魯向暉,劉小強(qiáng),等. 蝙蝠算法優(yōu)化極限學(xué)習(xí)機(jī)模擬參考作物蒸散量[J].排灌機(jī)械工程學(xué)報(bào),2018,36(9):802-805,829.
[25]ALLEN R G, PEREIRA L S, RAES D, et al. Crop evapotranspiration: guide-lines for computing crop water requirements[M]//FAO. Irrigation and Drainage. Rome:FAO, 1998.
[26]HUANG G, ZHU Q, SIEW C K, et al. Extreme learning machine: theory and applications[J]. Neurocomputing, 2006, 70(1): 489-501.
[27]王 俊,劉 剛. 基于粒子群優(yōu)化聚類的溫室無線傳感器網(wǎng)絡(luò)節(jié)能方法[J].農(nóng)業(yè)工程學(xué)報(bào),2012,28(7):172-177.
[28]劉環(huán)宇,陳海濤,閔詩堯,等. 基于PSO-SVR的植物纖維地膜抗張強(qiáng)度預(yù)測(cè)研究[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2017,48(4):118-124.
[29]郭亞菲,樊 超,閆洪濤. 基于主成分分析和粒子群優(yōu)化神經(jīng)網(wǎng)絡(luò)的糧食產(chǎn)量預(yù)測(cè)[J].江蘇農(nóng)業(yè)科學(xué),2019,47(19):241-245.
(責(zé)任編輯:徐 艷)