何淑林,劉慧敏,金立強(qiáng),劉 勇,*
(1.黑龍江大學(xué),哈爾濱 150000;2.黑龍江東部節(jié)水設(shè)備有限公司,哈爾濱 150000)
【研究意義】植物消耗水分的主要途徑為植株間的蒸騰作用、地表滲漏、地表徑流,還有一部分用于自身的生長發(fā)育。對于果樹而言,由于其枝繁葉茂且冠層較大,果樹吸收的水分有95%都用于蒸騰作用[1],因此準(zhǔn)確計(jì)算果樹蒸騰量對果樹的合理灌溉、提高水資源利用率具有重要意義?!狙芯窟M(jìn)展】植物需水量的計(jì)算方法有多種,其中使用最普遍的有2種:一種是直接計(jì)算,即根據(jù)土壤濕度和最佳土壤濕度的偏差,直接計(jì)算出植物在各個(gè)生長階段的需水量;另一種是間接確定,由于植物的水分大部分都用于蒸騰作用,可以通過模型預(yù)測植物的蒸騰量,間接計(jì)算植物在各個(gè)生長時(shí)期的需水量[2-3]。Kumar等[4]利用極限學(xué)習(xí)機(jī)(Extreme Learning Machine, ELM)方法對蒸騰量進(jìn)行預(yù)測,結(jié)果表明ELM模型的預(yù)測精度較高,且預(yù)測模型簡單、易實(shí)現(xiàn);Wang等[5]建立的模型框架將反向傳播神經(jīng)網(wǎng)絡(luò)(Back Propagation Network, BP)和Hargreaves蒸散模型相結(jié)合,建立了集成未來氣候變化情景下的水資源分配優(yōu)化模型,該模型框架可以揭示受氣候變化影響的水文氣象要素的規(guī)律,具有很大的研究意義;Hou等[6]將熱紅外遙感的知識應(yīng)用到農(nóng)業(yè)灌溉中,預(yù)測在不同灌溉速率下作物的蒸騰速率,可以幫助安排灌溉時(shí)間,對于精準(zhǔn)灌溉具有重要意義;陳士旺等[7]根據(jù)基質(zhì)含水率的變化情況,分析了溫室番茄蒸騰量花期和苗期的預(yù)測精度,對溫室灌溉管理具有很大的推廣應(yīng)用價(jià)值;商志根等[8]建立PSO優(yōu)化最小二乘支持向量機(jī)的預(yù)測模型,預(yù)測作物的需水量,具有預(yù)測精度高、泛化能力強(qiáng)等優(yōu)點(diǎn);孟瑋等[9]在徑向基神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上加入了人工蜂群算法,預(yù)測蓄水坑灌狀態(tài)下的蘋果樹需水量,為果園的灌溉管理提供了科學(xué)的依據(jù)?!厩腥朦c(diǎn)】國內(nèi)外研究人員對植物需水量預(yù)測進(jìn)行了廣泛的研究,雖然取得了一定的進(jìn)展,但如何提高預(yù)測精度,降低預(yù)測模型的復(fù)雜度等問題仍然是研究的重點(diǎn)問題,上述學(xué)者建立的預(yù)測模型對模型的實(shí)用性以及實(shí)驗(yàn)對比等方面的考慮有所欠缺?!緮M解決的關(guān)鍵問題】針對以上問題,本研究將深度學(xué)習(xí)中的LSTM神經(jīng)網(wǎng)絡(luò)應(yīng)用于果樹蒸騰量預(yù)測,主要針對如何提高模型的預(yù)測精度、降低模型的復(fù)雜度等問題進(jìn)行改進(jìn),并進(jìn)行對比分析。
由于影響果樹蒸騰量的環(huán)境因子很多,傳感器采集的各種環(huán)境因子之間具有一定的耦合性,如果將所有變量輸入到預(yù)測模型中,會使預(yù)測模型變得復(fù)雜,從而增加了模型預(yù)測的難度。因此,使用較少的新變量代替原來較多的變量,并使這些較少的新變量保留盡可能多的原始變量所反映的信息成為關(guān)鍵問題。
主成分分析(Principal Component Analysis,PCA)是一種常用的解決多變量問題的方法,通過將多維的數(shù)據(jù)特征映射成低維數(shù)據(jù)特征,在降低數(shù)據(jù)的維度的同時(shí)可以包含大部分的數(shù)據(jù)信息[10],從而使得模型的復(fù)雜度降低。
在農(nóng)業(yè)預(yù)測領(lǐng)域中,由于蒸騰量受多種環(huán)境因子的影響,田地采集環(huán)境數(shù)據(jù)也是一種典型的非平穩(wěn)性時(shí)間序列,歷史時(shí)刻的環(huán)境數(shù)據(jù)會對當(dāng)前時(shí)刻的蒸騰量產(chǎn)生影響,因此可以用LSTM神經(jīng)網(wǎng)絡(luò)對蒸騰量進(jìn)行預(yù)測[11]。
LSTM神經(jīng)網(wǎng)絡(luò)是循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)的變體,是一種特殊的RNN模型[12]。LSTM有3個(gè)控制門,這3個(gè)控制門相互配合,通過控制該時(shí)刻和上一時(shí)刻的輸入、輸出,來對細(xì)胞狀態(tài)進(jìn)行更新,可以很好地解決“梯度消失”的問題。為了解決長時(shí)依賴的問題,在LSTM單元中,使用3個(gè)閾值層,用來有效控制可以通過門的信息量[13]。
第一步是由遺忘層通過sigmoid單元來決定什么信息可以通過細(xì)胞狀態(tài),sigmoid函數(shù)輸出一個(gè)(0,1)之間的值,過濾上一時(shí)刻傳遞下來的信息以及當(dāng)前時(shí)刻輸入的信息。
第二步是利用輸入層,通過sigmoid單元產(chǎn)生需要更新的數(shù)據(jù)。
第三步是對以前的細(xì)胞狀態(tài)進(jìn)行更新。
第四步是計(jì)算本時(shí)間節(jié)點(diǎn)LSTM神經(jīng)網(wǎng)絡(luò)的輸出值。首先計(jì)算得到一個(gè)初始輸出ot,然后將ct值縮放到-1~1之間,將ot與縮放后的ct相乘,最后得到模型的輸出。
由于在整個(gè)模型訓(xùn)練中并非所有的中間節(jié)點(diǎn)信息都有相同的貢獻(xiàn)程度,同時(shí)還存在一些噪聲,影響模型的預(yù)測程度,注意力(Attention)機(jī)制突出了關(guān)鍵特征向量對輸出的貢獻(xiàn),很好地優(yōu)化了傳統(tǒng)模型[14]。Attention機(jī)制通過對模型輸入特征進(jìn)行計(jì)算,為不同輸入特征賦予不同的權(quán)重,對關(guān)鍵特征向量賦予更高的權(quán)重,以幫助模型做出更準(zhǔn)確的判斷。
LSTM神經(jīng)網(wǎng)絡(luò)對于輸入數(shù)據(jù)序列較短時(shí),學(xué)習(xí)效果較好,但是輸入較長的數(shù)據(jù)列,仍然會受到長時(shí)依賴問題的影響,進(jìn)而會丟失部分重要信息,難以達(dá)到滿意的訓(xùn)練效果。為了更好地發(fā)揮LSTM神經(jīng)網(wǎng)絡(luò)的優(yōu)勢,解決上述問題,本文在LSTM網(wǎng)絡(luò)模型的基礎(chǔ)上加入了Attention機(jī)制。引入Attention機(jī)制后,捕獲長時(shí)依賴特征會更加容易,只需要一次計(jì)算就可以將任意2個(gè)關(guān)鍵詞聯(lián)系起來,這使得長距離依賴的捕獲變得容易。因此,本文提出了Attention-LSTM模型來預(yù)測果樹蒸騰量。將PCA篩選出的主要影響因子作為輸入,預(yù)測果樹蒸騰量。
Attention-LSTM網(wǎng)絡(luò)模型的實(shí)現(xiàn)步驟為:
1)獲取傳感器測得的氣象數(shù)據(jù)和土壤墑情數(shù)據(jù),利用拉依達(dá)法則對異常數(shù)據(jù)進(jìn)行篩選和校正。
2)采用主成分分析提取出影響蒸騰量的關(guān)鍵影響因子,減少輸入,消除變量間的相關(guān)性,同時(shí)劃分樣本訓(xùn)練集和測試集。
3)將主成分分析得出的關(guān)鍵影響因子輸入到Attention-LSTM神經(jīng)網(wǎng)絡(luò)中,對蒸騰量進(jìn)行預(yù)測。
4)計(jì)算損失函數(shù),損失函數(shù)選擇均方誤差為每一輪網(wǎng)絡(luò)訓(xùn)練后的預(yù)測值與實(shí)際值的偏差,根據(jù)損失函數(shù)的值調(diào)整各個(gè)網(wǎng)絡(luò)層的權(quán)重,判斷訓(xùn)練次數(shù)是否達(dá)到設(shè)定的值,如果沒有達(dá)到設(shè)定值則繼續(xù)訓(xùn)練。
5)對收斂的神經(jīng)網(wǎng)絡(luò)進(jìn)行測試,計(jì)算模型的誤差來驗(yàn)證模型的好壞,輸出預(yù)測的蒸騰量并繪制圖像。
本文采用3種誤差分析方法,即平均絕對誤差(MAE)、平均絕對百分比誤差(MAPE)和均方根誤差(RMSE)來驗(yàn)證蒸騰量預(yù)測的準(zhǔn)確性。由于誤差之間可能會出現(xiàn)相互抵消的情況,利用平均絕對誤差可以有效地避免這個(gè)問題。平均絕對百分比誤差是一種衡量預(yù)測準(zhǔn)確性的統(tǒng)計(jì)指標(biāo)。利用均方根誤差可以有效地說明數(shù)據(jù)的離散程度。誤差越小,模型的預(yù)測精度越高。
本文將均方誤差(MSE)作為驗(yàn)證預(yù)測模型性能優(yōu)劣的評價(jià)指標(biāo),誤差越小說明預(yù)測模型越好。
本文以山西省運(yùn)城市的一個(gè)6 666.7 m3蘋果試驗(yàn)田為研究對象,分別在試驗(yàn)田的4個(gè)方位布置傳感器,監(jiān)測多個(gè)角落的數(shù)據(jù)信息。對于蘋果園的氣象數(shù)據(jù),使用多元素百葉箱進(jìn)行采集;利用土壤墑情傳感器,采集蘋果園中的土壤環(huán)境數(shù)據(jù)。本文將2015—2020年采集的28 354組數(shù)據(jù)作為試驗(yàn)數(shù)據(jù),每相隔1 h傳感器采集1次環(huán)境數(shù)據(jù),采集的數(shù)據(jù)有空氣溫度、空氣濕度、大氣壓強(qiáng)、光照強(qiáng)度、風(fēng)速、降水量、土壤溫度、土壤濕度、pH值、日照時(shí)間等。
數(shù)據(jù)采集過程中會出現(xiàn)數(shù)據(jù)缺失、數(shù)據(jù)重復(fù)、數(shù)據(jù)不均衡以及數(shù)據(jù)類型不一致等情況,所以在構(gòu)建神經(jīng)網(wǎng)絡(luò)之前,需要對數(shù)據(jù)進(jìn)行預(yù)處理,主要包括:異常數(shù)據(jù)篩選與校正、平滑處理以及歸一化處理,使所有數(shù)據(jù)處在同一量綱上,加快模型的訓(xùn)練速度,保證模型穩(wěn)定收斂,提高預(yù)測精度。
經(jīng)過預(yù)處理并將數(shù)據(jù)進(jìn)行日平均平滑處理,最終得到4 264組數(shù)據(jù)集,并對數(shù)據(jù)集進(jìn)行樣本劃分,將其中的3 744組數(shù)據(jù)作為預(yù)測模型的訓(xùn)練數(shù)據(jù)集,400組數(shù)據(jù)作為驗(yàn)證數(shù)據(jù)集,120組數(shù)據(jù)作為測試數(shù)據(jù)集。
利用傳感器采集到的氣象數(shù)據(jù)和土壤墑情數(shù)據(jù)量大,而且影響果樹蒸騰量的環(huán)境因子很多[15-17],各環(huán)境因子之間具有一定的耦合性,如果將所有變量輸入到預(yù)測模型中,大量的數(shù)據(jù)必然會加大模型的訓(xùn)練難度并降低預(yù)測精度。因此利用PCA的方法降低輸入變量的維數(shù),利用SPSS軟件進(jìn)行主成分分析,對影響蒸騰量的環(huán)境因子進(jìn)行數(shù)據(jù)篩選。表1為各環(huán)境因子的相關(guān)性。表中X1為蒸騰量(mm/d)、X2為空氣溫度(℃)、X3為空氣濕度(%)、X4為風(fēng)速(m/s)、X5為日照時(shí)間(h)、X6為降水量(mm)、X7為大氣壓強(qiáng)(Pa)、X8為光照強(qiáng)度(Lux)、X9為土壤溫度(℃)、X10為土壤濕度(%)。
表1 相關(guān)性結(jié)果Table 1 Correlation Result
空氣濕度、空氣溫度、風(fēng)速、光照強(qiáng)度、土壤濕度與蒸騰量相關(guān)系數(shù)分別為0.605、-0.595、0.599、0.634、-0.598,說明這5個(gè)環(huán)境因子與蒸騰量的相關(guān)性較大,其他變量與蒸騰量的相關(guān)性較小。因此,初定空氣溫度、風(fēng)速、光照強(qiáng)度、空氣濕度、土壤濕度為關(guān)鍵影響因子。
表2為主成分累積貢獻(xiàn)率,其中方差百分比越大,說明此主成分的貢獻(xiàn)率越大。主成分的累積貢獻(xiàn)率是提取主成分個(gè)數(shù)的重要依據(jù),在X1~X10的10個(gè)主成分中,其中前3個(gè)主成分就可以把變量表達(dá)為85%以上,說明前3個(gè)主成分基本包含了全部變量所具有的信息,因此本文選擇3個(gè)主成分進(jìn)行分析。
表2 主成分累計(jì)貢獻(xiàn)率Table 2 Cumulative contribution rate of principal components
此外,只考慮累積貢獻(xiàn)率是不夠的,還要對主成分得分系數(shù)進(jìn)行分析。表3為前3個(gè)主成分的得分系數(shù)。從表3可以看出,空氣溫度、大氣壓強(qiáng)、光照強(qiáng)度在第1主成分載荷較大,空氣濕度、土壤濕度在第2主成分載荷較大,風(fēng)速在第3主成分載荷較大。因此,可以把空氣溫度、大氣壓強(qiáng)、光照強(qiáng)度、空氣濕度、土壤濕度、風(fēng)速作為主要影響因子,作為預(yù)測模型的輸入樣本。
表3 主成分得分系數(shù)Table 3 Principal component score coefficient
圖1為Attention-LSTM模型的損失值,損失值越小表示模型性能越好。圖中橫軸代表訓(xùn)練次數(shù),縱軸代表損失值,藍(lán)色的線代表訓(xùn)練損失值,黃色的線代表驗(yàn)證損失值??梢杂^察到當(dāng)預(yù)測模型的訓(xùn)練次數(shù)為50次左右時(shí),模型基本達(dá)到穩(wěn)定,訓(xùn)練損失值可以達(dá)到0.1,驗(yàn)證損失值可以達(dá)到0.05,說明模型預(yù)測精度高,具有較高的魯棒性。
圖1 Attention-LSTM模型的損失Fig.1 Loss of the Attention-LSTM model
由于彭曼公式FAO-56PM計(jì)算的蒸騰量準(zhǔn)確性相對較高,已經(jīng)成為國際通用的計(jì)算蒸騰量的方法[18],因此,本文將彭曼公式計(jì)算出的蒸騰量作為Attention-LSTM預(yù)測模型的目標(biāo)輸出,該目標(biāo)輸出被用來驗(yàn)證Attention-LSTM模型的預(yù)測精度。
Attention-LSTM最終預(yù)測結(jié)果如圖2所示,其中藍(lán)色線是FAO-56PM的值,紅線是Attention-LSTM的預(yù)測值,可以看出基于Attention-LSTM的神經(jīng)網(wǎng)絡(luò)預(yù)測模型預(yù)測出的值和FAO-56PM的值達(dá)到很好地?cái)M合,說明本文的模型預(yù)測精度較高。
圖2 Attention-LSTM預(yù)測結(jié)果Fig.2 Attention-LSTM prediction results
為了驗(yàn)證本文提出的預(yù)測模型的性能,采用Attention-LSTM模型對PCA分析的數(shù)據(jù)集進(jìn)行訓(xùn)練和測試,將BP模型、RNN模型、LSTM模型、Attention-RNN模型、Attention-LSTM模型進(jìn)行對比。
結(jié)果見圖3,可以看出BP模型的預(yù)測誤差最大,個(gè)別樣本數(shù)據(jù)的蒸騰量預(yù)測誤差超過2 mm/d;RNN模型的誤差較大,大部分樣本的蒸騰量誤差在1 mm/d周圍震蕩;Attention-LSTM、LSTM和Attention-RNN模型的預(yù)測誤差較小,其蒸騰量預(yù)測誤差大部分在1 mm/d附近波動,其中Attention-LSTM模型的誤差最小,預(yù)測精度最高。
圖3 Attention-LSTM與其他模型預(yù)測誤差比較Fig.3 Comparison of forecast errors between attention-LSTM and other models
表4為各模型預(yù)測精度比較結(jié)果,其中Attention-LSTM模型的預(yù)測精度最高,MAE、MAPE、RMSE和MSE分別為0.387、0.148、0.487和0.062。與BP模型相比,各項(xiàng)指標(biāo)分別提高了44.7%、15.3%、44.5%、30.3%;與RNN模型相比,各項(xiàng)指標(biāo)分別提高了33.3%、19.6%、33.7%、16.8%;與LSTM模型相比,各項(xiàng)指標(biāo)分別提高了28.8%、7.9%、30.2%、15.0%;與Attention-RNN模型相比,各項(xiàng)指標(biāo)分別提高了20.0%、11.7%、19.9%、10.1%??傮w來看,基于Attention-LSTM的果樹蒸騰量預(yù)測模型具有較好的預(yù)測性能,可以準(zhǔn)確預(yù)測果樹蒸騰量。
表4 各模型預(yù)測精度比較Table 4 Comparison of prediction accuracy of each model
本文在LSTM神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上加入了Attention機(jī)制,通過對模型輸入變量進(jìn)行計(jì)算,對關(guān)鍵影響因子賦予更高的權(quán)重,以幫助模型做出更準(zhǔn)確的判斷,從而提高預(yù)測的精度。與彭曼公式計(jì)算出的蒸騰量進(jìn)行比較,本文的預(yù)測模型運(yùn)用PCA篩選出的空氣溫度、大氣壓強(qiáng)、光照強(qiáng)度、空氣濕度、土壤濕度、風(fēng)速,可以計(jì)算出精準(zhǔn)的蒸騰量,用到的傳感器更少,降低了模型的復(fù)雜度。與其他模型相比,本文提出的預(yù)測模型預(yù)測精度高,實(shí)現(xiàn)簡單,可以在有限的環(huán)境數(shù)據(jù)下,實(shí)現(xiàn)更加準(zhǔn)確的蒸騰量預(yù)測,從而實(shí)現(xiàn)果樹的需水量預(yù)測。
本文主要是針對果園的灌溉進(jìn)行研究的,相對于大田和溫室種植而言并不適用,下一步將繼續(xù)改進(jìn)模型,擴(kuò)大研究范圍,爭取可以應(yīng)用到更廣泛的農(nóng)業(yè)種植中,以滿足農(nóng)業(yè)生產(chǎn)的需要,推動農(nóng)業(yè)的高質(zhì)量發(fā)展。