張 千,魏正英,張育斌,馮培存,張 磊,賈維兵
(1.西安交通大學(xué)機械工程學(xué)院,西安 710049;2.西安交通大學(xué)機械制造系統(tǒng)工程國家重點實驗室,西安 710049)
灌水量是農(nóng)業(yè)從業(yè)人員在農(nóng)田灌溉過程中需要考慮的一個重要內(nèi)容,灌溉量的多少對灌區(qū)水資源的合理分配以及灌區(qū)整體收益有著很大的影響。參考作物蒸散量ET0是計算作物需水量的重要依據(jù),目前有很多估算ET0的方法[1],包括Penman-Monteith(P-M)法、Hargreaves法、Hargreaves校正法、Irmark-Alleen和Prisetley-Taylor法等,其中P-M法被聯(lián)合國糧農(nóng)組織(FAO)確定為參考作物蒸散量估算的標(biāo)準(zhǔn)方法[2],該方法以能量平衡和空氣動力學(xué)為基礎(chǔ),綜合考慮大量氣象數(shù)據(jù),計算結(jié)果較為準(zhǔn)確,目前被廣泛使用。國內(nèi)外許多學(xué)者進行了多種工況下使用該公式進行參考作物蒸散量的計算的研究,相當(dāng)一部分學(xué)者給出了該公式的修正模型,李振華等建立了基于自然氣象條件下的逐時Penman-Monteith公式,對其空氣動力項進行了修正,得到適合計算溫室ET0的公式[3];張曉萍等使用聚類分析和下墊面參數(shù)對Penman-Monteith公式進行了優(yōu)化,提高了公式在黃河中游地區(qū)的參考作物蒸散量計算精度[4]。但在實際使用過程中,Penman-Monteith公式需要使用大量的氣象參數(shù),完整氣象數(shù)據(jù)難以獲取造成該模型實時使用較為困難[5]。
隨著現(xiàn)代農(nóng)業(yè)的發(fā)展,信息技術(shù)廣泛應(yīng)用于農(nóng)業(yè),越來越多科研工作者將機器學(xué)習(xí)應(yīng)用于農(nóng)業(yè)信息的研究。王升等建立了基于隨機森林和基因表達式編程算法的ET0預(yù)測模型,獲得了較高的預(yù)測精度[6];張育斌等建立基于耦合模擬退火優(yōu)化最小二乘支持向量機的參考作物蒸散量的預(yù)測模型,獲得了階段ET0和總ET0都較好的預(yù)測結(jié)果[7];周瑞等利用粒子群算法優(yōu)化廣義回歸神經(jīng)網(wǎng)絡(luò),并以此建立了參考作物蒸散量的預(yù)測模型,該模型在氣象數(shù)據(jù)缺失情況下依然具有較好的預(yù)測精度[8];馮禹等建立基于極限學(xué)習(xí)機的ET0預(yù)測模型,獲得了川中丘陵地區(qū)蒸散量較好的預(yù)測結(jié)果[9]。然而使用機器學(xué)習(xí)進行數(shù)據(jù)預(yù)測時需要的數(shù)據(jù)量較大,在數(shù)據(jù)量較少的情況下預(yù)測精度較低[10]。
本文提出了一種煙花算法優(yōu)化極限學(xué)習(xí)機(FWAELM)預(yù)測參考作物蒸散量(ET0)的方法,該方法使用煙花算法對極限學(xué)習(xí)機的輸入權(quán)值矩陣和偏置矩陣進行尋優(yōu),解決了極限學(xué)習(xí)機在小樣本數(shù)據(jù)情況下預(yù)測精度較低的問題,并將預(yù)測結(jié)果與極限學(xué)習(xí)機的預(yù)測結(jié)果進行對比,實驗表明,該模型獲得了較高的預(yù)測精度。
在本研究中,采用P-M模型的計算結(jié)果作為FWAELM的學(xué)習(xí)數(shù)據(jù)以及評價標(biāo)準(zhǔn),其公式為:
(1)
式中:ET0為參考作物蒸散量,mm/d;Δ為飽和水壓-溫度曲線的斜率;Rn為作物表面凈輻射,MJ/(m2·d);G為土壤熱通,MJ/(m2·d);γ為溫度表常數(shù);T為2 m高處日平均溫度,℃;μ2為2 m高處平均風(fēng)速;es為飽和水汽壓;ea為實際水汽壓。
極限學(xué)習(xí)機是黃廣斌于2004年提出的一種單隱含層神經(jīng)網(wǎng)絡(luò),是一種基于前饋神經(jīng)網(wǎng)絡(luò)的機器學(xué)習(xí)算法[10]。傳統(tǒng)神經(jīng)網(wǎng)絡(luò)在訓(xùn)練過程中通過梯度下降法來不斷調(diào)整輸入權(quán)值和輸出權(quán)值,存在訓(xùn)練時間長、容易陷入局部最優(yōu)解等問題。極限學(xué)習(xí)機可以隨機初始化輸入權(quán)值矩陣和偏置矩陣,通過計算得到相應(yīng)的輸出矩陣,并得到唯一解,從而使得極限學(xué)習(xí)機能夠做到在保證學(xué)習(xí)精度的前提下獲得更快的學(xué)習(xí)速度,具有更好的泛化效果。極限學(xué)習(xí)機的網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
圖1 極限學(xué)習(xí)機網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 Network structure of extreme learning machine
該算法具有三層結(jié)構(gòu),分別為具有j個輸入神經(jīng)元的輸入層、n個隱含神經(jīng)元的隱含層和1個輸出神經(jīng)元的輸出層。給定一組樣本數(shù)據(jù)(xi,ti),其中xi=[xi1,…,xin]T∈Rn,ti=[ti1,…,tim]T。對于圖1具有n個隱含神經(jīng)元的極限學(xué)習(xí)機,其網(wǎng)絡(luò)結(jié)構(gòu)可以表示為:
(2)
式中:j=[1,2,…,n];βi=[β1,β2,…,βn]為輸出權(quán)重矩陣;g(x)為激活函數(shù);ωij為輸入權(quán)重;bi為隱含神經(jīng)元的閾值;oj為極限學(xué)習(xí)機的輸出結(jié)果。數(shù)據(jù)擬合回歸算法的學(xué)習(xí)目標(biāo)是要使得輸出結(jié)果與真是值誤差最小,即:
(3)
也即存在βi、ωij和bi,使得:
(4)
轉(zhuǎn)換為矩陣表示為:
Hβ=T
(5)
式中:H為隱含節(jié)點的輸出;β為輸出權(quán)重;T為期望輸出,即可求出極限學(xué)習(xí)機的輸出矩陣為:
(6)
式中:H+為H的Moore-Penrose廣義逆,求出輸出權(quán)重即可根據(jù)式(2)求出極限學(xué)習(xí)機的輸出值。
煙花算法(FWA)由譚營受到煙花爆炸啟發(fā)提出的一種群體智能算法,通過模擬煙花在空中爆炸的行為建立數(shù)學(xué)模型,引入隨機因素和選擇策略形成一種并行爆炸式搜索,進而演化成為一種能夠求解復(fù)雜問題最優(yōu)解的全局概率搜索方法[11]。煙花算法主要包含以下幾個部分:
(1) 爆炸算子。煙花算法對初始化隨機產(chǎn)生的N個煙花應(yīng)用爆炸算子,產(chǎn)生新的煙花,主要包括爆炸強度[式(7)],爆炸幅度[式(8)]和位移操作[式(9)]3個操作,爆炸強度確定煙花爆炸差生的火花數(shù)量,爆炸幅度確定煙花爆炸的范圍大小,位移操作確定煙花在爆炸范圍內(nèi)的位移。
(7)
(8)
(9)
式中:Si為第i個煙花產(chǎn)生的火花個數(shù);m為限制火花總數(shù)的常數(shù);Ymax為種群中適應(yīng)度最差的個體的適應(yīng)度值;f(xi)為個體xi的適應(yīng)度值;ε為防止出現(xiàn)零分母的極小常數(shù);Ai為第i個煙花的爆炸范圍;A′為常數(shù),表示最大爆炸幅度;Ymin為種群中適應(yīng)度最好的個體的適應(yīng)度值
(2) 變異算子。變異算子能夠提高種群的多樣性,可以避免局部極值點,以達到全局最優(yōu)。這里使用的是高斯變異。
(10)
式中:g服從均值和方差均為1的高斯分布,即g~N(1,1)。
(3)選擇策略。煙花爆炸后需要在產(chǎn)生的火花中選擇滿足要求的火花作為下一代煙花,選擇策略使用基于距離的選擇策略,即采用歐式距離[式(11)]度量兩個個體之間的距離,采用輪盤賭[式(12)]的方式選擇個體:
(11)
式中:K為爆炸后產(chǎn)生的火花位置集合。
(12)
煙花算法的流程如圖2所示。
圖2 煙花算法流程圖Fig.2 Flowchart of fireworks algorithm
本文中使用數(shù)據(jù)通過極限學(xué)習(xí)機進行擬合回歸存在以下問題[13]:
(1)由于極限學(xué)習(xí)機輸入矩陣及偏置矩陣隨機產(chǎn)生,導(dǎo)致輸出結(jié)果出現(xiàn)數(shù)據(jù)波動;
(2)本文使用數(shù)據(jù)為溫室甜瓜種植環(huán)境數(shù)據(jù),數(shù)據(jù)量較少,樣本豐富性較差極限學(xué)習(xí)機預(yù)測結(jié)果較差。
煙花算法具有強大的并行搜索能力以及良好的收斂性能,基于此提出通過煙花算法優(yōu)化解決上述問題,將ELM的訓(xùn)練誤差作為煙花算法的適應(yīng)度函數(shù),構(gòu)建煙花算法優(yōu)化極限學(xué)習(xí)機(FWAELM)煙花算法優(yōu)化極限學(xué)習(xí)機的主要步驟如下:
(1)隨機產(chǎn)生N個煙花,每一個煙花代表解空間中的一個解;
(2)以ELM的訓(xùn)練誤差作為煙花算法的適應(yīng)度函數(shù),計算每一個煙花的適應(yīng)度值,并根據(jù)適應(yīng)度值計算產(chǎn)生子代火花的數(shù)量、爆炸幅度以及爆炸位移;
(3)通過變異操作擴大種群的多樣性;
(4)計算煙花產(chǎn)生的子代火花適應(yīng)度值,從中選擇適應(yīng)度值最好的火花作為下一代煙花;
(5)計算種群的最優(yōu)解,判斷是否滿足要求,或者是否到達最大迭代次數(shù),若成立則搜索結(jié)束,否則繼續(xù)迭代。
本研究中氣象數(shù)據(jù)為浙江農(nóng)科院溫室甜瓜種植一季過程中的環(huán)境數(shù)據(jù),共87組數(shù)據(jù)。包括日最高氣溫Tmax、日最低氣溫Tmin、日平均溫度Tave、日平均空氣相對濕度RH、日有效光照時長n、日平均光照強度I11,結(jié)合當(dāng)?shù)鼐暥?、海拔等信息,利用彭曼公式計算得到ET0。
煙花算法優(yōu)化極限學(xué)習(xí)機流程如圖3所示。
圖3 煙花算法優(yōu)化極限學(xué)習(xí)機流程圖Fig.3 Flow chart of the FWAELM algorithm
本研究中,模型的評價采用均方根誤差(RMSE)、平均絕對誤差(MAE)和模型可決系數(shù)(R_Square),其計算公式如下:
(13)
(14)
(15)
式中:N為總樣本數(shù);Yi為FWA_ELM的預(yù)測值;Xi為依據(jù)氣象數(shù)據(jù)利用彭曼公式計算得到的ET0值;Ymea為Yi的平均值。
以常規(guī)、方便獲取的氣象參數(shù):Tmax、Tmin、Tave,RH、n、I11以及計算得到的ET0作為ELM和FWAELM的輸入進行訓(xùn)練,以總數(shù)據(jù)的80%作為訓(xùn)練集,20%作為測試集,極限學(xué)習(xí)機和煙花算法優(yōu)化極限學(xué)習(xí)機的預(yù)測結(jié)果結(jié)果分別如圖4和圖5所示。由圖可知FWAELM的預(yù)測結(jié)果要明顯好于ELM的輸出結(jié)果,說明小樣本數(shù)據(jù)量情況下,F(xiàn)WAELM更適合用于ET0的預(yù)測。
使用前述評價方法對模型進行評價,得到評價指標(biāo)如表1所示。
表1 ElM與FWAELM預(yù)測結(jié)果對比Tab.1 Comparison of prediction results between ElM and FWAELM
由表1中數(shù)據(jù)對比可知,F(xiàn)WAELM的均方根誤差為0.115 6,明顯低于ELM的0.403 5,平均絕對誤差也由ELM的0.346 7下降到0.143 6,模型可決系數(shù)由ELM的0.839 0上升到FWAELM的0.943 8。數(shù)據(jù)表明,煙花算法對極限學(xué)習(xí)機的優(yōu)化效果十分顯著,提高了極限學(xué)習(xí)機在小樣本數(shù)據(jù)量情況下的預(yù)測精度。
圖4 ELM預(yù)測結(jié)果Fig.4 ELM prediction results
圖5 FWAELM預(yù)測結(jié)果Fig.5 FWAELM prediction results
在實際使用中,有些數(shù)據(jù)較為難以獲取,為了研究氣象數(shù)據(jù)缺失情況下模型的精度, 將不同變量因子進行組合,建立相應(yīng)的FWAELM模型,分組進行數(shù)據(jù)訓(xùn)練與預(yù)測,分析缺失不同數(shù)據(jù)時,F(xiàn)WAELM的模型精度[14]。結(jié)果如表2所示。
表2 不同氣象參數(shù)組合條件下模型精度Tab.2 Model accuracy under different meteorological parameter combination conditions
由表2分析可知,氣象因子個數(shù)對模型有著較大的影響,氣象因子越多,模型精度越高。當(dāng)氣象數(shù)據(jù)降為兩個時,模型的均方根誤差大于0.5,平均絕對誤差也增大到0.4以上,模型可決系數(shù)降到0.5附近,模型精度較差,而保留氣象因子個數(shù)在3個及以上時,模型的均方根誤差最大為0.328 4,平均絕對誤差最大為0.283 1,模型可決系數(shù)最小為0.857 3,模型精度較好,所以使用時應(yīng)保證該模型的輸入氣象因子個數(shù)大于等于3個。當(dāng)模型輸入?yún)?shù)個數(shù)由5個變?yōu)?個時,缺少RH相對于缺少Tmax或Tmin模型精度變化較小,說明日平均空氣相對濕度RH對模型精度影響較?。蝗鄙賲?shù)Tmax時,模型精度變化較大,RMSE由0.115 6變?yōu)?.245 7,MAE由0.143 6變?yōu)?.192 1,R_Square由0.943 8變?yōu)?.921 6,說明最大溫度Tmax對模型有較大的影響。當(dāng)模型輸入?yún)?shù)個數(shù)變?yōu)?個時,缺少因子n時,模型誤差最大,說明日照時長對模型精度影響較高。說明在使用時,為確保模型擁有較高的精度,盡量保證輸入的氣象因子中包含最大溫度和日照時長。
本文從優(yōu)化極限學(xué)習(xí)機在溫室蒸散量ET0預(yù)測的應(yīng)用入手,完成了:
(1)建立了煙花算法優(yōu)化極限學(xué)習(xí)機的溫室蒸散量預(yù)測模型(FWAELM),并將其與極限學(xué)習(xí)機(ELM)預(yù)測模型進行對比,F(xiàn)WAELM模型精度相對于ELM有很大提高,RMSE、MAE、R_Square三個評價指標(biāo)的值分別由0.403 5、0.346 7、0.819 0優(yōu)化到0.115 6、0.143 6、0.943 8。
(2)研究了氣象參數(shù)缺失對FWAELM模型精度的影響,計算了不同氣象參數(shù)輸入情況下模型的評價指標(biāo),結(jié)果表明溫度參數(shù)和日照時長參數(shù)對模型精度影響較大,其中溫度參數(shù)中,最大溫度對模型精度的影響程度較大,當(dāng)參數(shù)缺失不超過3個時,模型的RMSE小于0.328 4,MAE小于0.283 1,R_Square大于0.857 3,模型精度較高,因此使用FWAELM模型進行ET0預(yù)測仍能取得較好的結(jié)果。
□