趙 暢 崔 培
(天津工業(yè)大學(xué),天津 300387)
作物生長(zhǎng)機(jī)理模型是指用數(shù)學(xué)公式描述作物復(fù)雜的生長(zhǎng)生理過(guò)程。通過(guò)輸入氣象數(shù)據(jù)、土壤數(shù)據(jù)、田間管理數(shù)據(jù)和作物遺傳參數(shù)來(lái)在田間尺度進(jìn)行產(chǎn)量估測(cè)。作物模型通常以天為步長(zhǎng),定量化的評(píng)價(jià)各種因子帶來(lái)的影響?,F(xiàn)階段DSSAT、APSIM、WOFOST等作物生長(zhǎng)模型在國(guó)際上受到了廣泛的認(rèn)可。作物生長(zhǎng)機(jī)理模型精度較高,在大面積估產(chǎn)時(shí),由于模型輸入數(shù)據(jù)較多,且不易獲取,常給估產(chǎn)工作帶來(lái)困難。且作物模型在對(duì)病蟲(chóng)害和極端天氣上,不能很好地預(yù)測(cè)產(chǎn)量。
1.2.1 區(qū)域尺度上作物模型播期和收獲日期獲取
單點(diǎn)尺度下的模型需要輸入播種日期和收獲日期來(lái)進(jìn)行模擬,在單點(diǎn)尺度下這些參數(shù)獲得,但是當(dāng)在區(qū)域尺度上播期和收獲日期就變得難以獲得。李克南等根據(jù)多個(gè)氣象站年平均生長(zhǎng)季觀測(cè)資料在研究區(qū)域上進(jìn)行插值,獲得了區(qū)域尺度的播種日期;鐘新科等在研究近30年中國(guó)玉米氣候生產(chǎn)潛力時(shí)空變化特征時(shí),同樣選擇獲得582 個(gè)農(nóng)氣站春玉米生育期數(shù)據(jù)和 407 個(gè)農(nóng)氣站的夏玉米生育期,其中包含了30年的平均播種期和成熟期。該方法獲取的播種日期在進(jìn)行多年份模擬時(shí)固定不變,而實(shí)際生產(chǎn)過(guò)程中是變化的,因此會(huì)帶來(lái)一部分誤差。王立為提出黑龍江所在實(shí)驗(yàn)區(qū)五日滑動(dòng)平均溫度大于10℃即可播種,該方法適用于本地區(qū)部分范圍,但在進(jìn)行大范圍模擬潛在產(chǎn)量時(shí),播期受到土質(zhì)、播種前多日溫度、濕度、海拔、地形等多種因素影響,難以確定播種日期。這個(gè)思路可以擴(kuò)展一下,研究土壤淺層溫度和地表溫度或空氣溫度的關(guān)系,這就需要了解不同土壤導(dǎo)熱效率、土壤含水量、空氣溫度等等變量相互之間的影響。國(guó)內(nèi)在應(yīng)用模型大面積計(jì)算時(shí),仍是根據(jù)經(jīng)驗(yàn)播種日期(氣象站觀測(cè)記錄所得)來(lái)進(jìn)行區(qū)域插值,得到區(qū)域尺度上的播種日期,這種做法使播期推遲,錯(cuò)過(guò)最佳生長(zhǎng)日期,但目前沒(méi)有很好的替代方法。
作物收獲日期的確定除了獲取觀測(cè)站資料插值得來(lái)之外,國(guó)內(nèi)許多學(xué)者對(duì)其進(jìn)行了研究。黃健熙等提出了多種預(yù)測(cè)成熟期的方法:1.基于時(shí)間序列HJ-1A/B衛(wèi)星數(shù)據(jù)構(gòu)建時(shí)間序列NDVI,并采用上包絡(luò)線(xiàn)S-G濾波進(jìn)行去噪,進(jìn)而提取NDVI最大時(shí)對(duì)應(yīng)的抽穗期,然后根據(jù)多年抽穗期到成熟期觀測(cè)值積溫平均值來(lái)判定是否滿(mǎn)足成熟積溫,并且在研究區(qū)每個(gè)像元應(yīng)用此方法,結(jié)果表明抽穗期提取均方根誤差為2.6天,成熟期均方根誤差3.2天。在預(yù)報(bào)精度方面,隨著預(yù)報(bào)數(shù)據(jù)預(yù)報(bào)時(shí)效越長(zhǎng),成熟期預(yù)測(cè)值誤差越大,當(dāng)預(yù)報(bào)時(shí)效小于等于10d時(shí),成熟期預(yù)測(cè)精度趨于穩(wěn)定;2.使用MODIS遙感數(shù)據(jù)形成1*1km分辨率的LAI數(shù)據(jù),用于提取抽穗?yún)^(qū),再利用積溫模型和太陽(yáng)輻射量模型綜合判斷成熟期,判別精度較高,均方根誤差為2.89d;3.基于MODIS LAI產(chǎn)品構(gòu)建LAI時(shí)間序列值提取玉米抽雄期,再根據(jù)積溫和太陽(yáng)輻射量總和判斷成熟期;并且比較了另一種模型,基于MODIS LAI產(chǎn)品,按照兩個(gè)生育期面積之比經(jīng)驗(yàn)平均值做為閾值,計(jì)算逐日到當(dāng)日時(shí)的該面積比,當(dāng)大于閾值后即認(rèn)為成熟,該LAI 面積比模型在大區(qū)域作物成熟期預(yù)測(cè)方面具有較高適用性;4.結(jié)合遙感數(shù)據(jù)和WOFOST,利用算法耦合LAI,優(yōu)化模型輸入?yún)?shù),用優(yōu)化過(guò)的參數(shù)在像元尺度上逐個(gè)驅(qū)動(dòng)模型;李友勇等提出用生育期某個(gè)時(shí)段≥15℃或20℃的累計(jì)天數(shù)和生育期長(zhǎng)度進(jìn)行回歸,結(jié)果較吻合。
現(xiàn)有的成熟期預(yù)測(cè)方法大都是基于遙感和積溫模型或者遙感和作物模型來(lái)進(jìn)行預(yù)測(cè),這是由于我國(guó)的農(nóng)田小而分散,土地有各種復(fù)雜的情況,運(yùn)用遙感的方法大大提高了預(yù)測(cè)精度。并且遙感的介入使得區(qū)域估測(cè)成熟期有了可能。
1.2.2 區(qū)域尺度上作物模型遺傳參數(shù)獲取
另一個(gè)作物模型區(qū)域化的障礙是模型需要輸入本地化后的遺傳參數(shù)。農(nóng)田尺度的做法常常是經(jīng)過(guò)調(diào)參、驗(yàn)證后得到合理的參數(shù),但是當(dāng)擴(kuò)展到區(qū)域尺度上時(shí),作物遺傳參數(shù)變得難以獲取。
李克南等利用超大尺度調(diào)試法,調(diào)整出一套適用華北地區(qū)的作物品種參數(shù)。黃健熙等將研究區(qū)域劃分成各個(gè)分區(qū),在對(duì)WOFOST遺傳參數(shù)標(biāo)定的過(guò)程中,對(duì)于不敏感參數(shù)采用文獻(xiàn)記錄的或者模型默認(rèn),對(duì)于敏感參數(shù)根據(jù)觀測(cè)數(shù)據(jù)測(cè)定得來(lái),如比葉面積和一些土壤參數(shù)。江銘諾等在將WOFOST面域化時(shí),對(duì)模型代碼進(jìn)行了修改,根據(jù)研究區(qū)的不同地點(diǎn)對(duì)模型參數(shù)進(jìn)行設(shè)置,生成分辨率為0.1°的作物參數(shù)文件。
李克南等利用APSIM-Wheat作物模擬了47年華北地區(qū)冬小麥潛在產(chǎn)量、水分限制產(chǎn)量和水氮限制產(chǎn)量,發(fā)現(xiàn)決定冬小麥潛在產(chǎn)量和水分限制產(chǎn)量的分別是生長(zhǎng)季內(nèi)總輻射和生長(zhǎng)季內(nèi)降水量。江銘諾等在利用WOFOST對(duì)華北平原夏玉米1979-2015年生長(zhǎng)狀況進(jìn)行了模擬,利用一元線(xiàn)性回歸和經(jīng)驗(yàn)正交分解分析了其潛在產(chǎn)量的時(shí)空變化,并與氣象要素進(jìn)行逐柵格相關(guān)性分析。結(jié)果表明,部分地區(qū)產(chǎn)量和氣溫呈較顯著關(guān)系,部分地區(qū)和太陽(yáng)總輻射呈較好的相關(guān)關(guān)系。馬鴻元利用課題組已經(jīng)標(biāo)定好的區(qū)域化的作物參數(shù),將模型做為外部框架,將不同年份氣象模擬結(jié)果做為集合成員代表概率分布,開(kāi)發(fā)出了從某一時(shí)刻開(kāi)始預(yù)報(bào)產(chǎn)量的框架,具備一定的預(yù)報(bào)能力。杜春英等應(yīng)用WOFOST模型對(duì)黑龍江水稻進(jìn)行了產(chǎn)量預(yù)報(bào),根據(jù)農(nóng)業(yè)氣象觀測(cè)站資料和實(shí)際調(diào)研重新劃分了六個(gè)不同水稻適宜區(qū),并在此基礎(chǔ)上調(diào)整了模型參數(shù),預(yù)報(bào)精度較高。
作物模型在單點(diǎn)尺度上應(yīng)用較為廣泛,精度較高,輸出結(jié)果豐富。但是推廣到區(qū)域上時(shí),常常因其作物遺傳參數(shù)、播期、收獲期、田間管理等資料難以獲取,而無(wú)法得到很好的應(yīng)用,其豐富的輸出結(jié)果也因大尺度下計(jì)算效率問(wèn)題只能選擇某些輸出結(jié)果。但是作物模型在單點(diǎn)尺度上能很好展現(xiàn)what-if問(wèn)題,幫助認(rèn)識(shí)作物生長(zhǎng)機(jī)理,如果能在區(qū)域上驗(yàn)證模型,再進(jìn)行what-if類(lèi)問(wèn)題的探討,如改變單年內(nèi)播期、水肥施用量等探究對(duì)產(chǎn)量的影響,將取得有意義的結(jié)果。
經(jīng)驗(yàn)?zāi)P屯ㄟ^(guò)構(gòu)建作物產(chǎn)量和某些因子的線(xiàn)性回歸模型進(jìn)行估產(chǎn)。通過(guò)遙感手段獲取某些指標(biāo)再與產(chǎn)量建立某種關(guān)系是有效的估測(cè)產(chǎn)量的手段。任建強(qiáng)等基于估測(cè)美國(guó)玉米產(chǎn)量的目的,以縣為基本單元,找出產(chǎn)量和NDVI指數(shù)線(xiàn)性回歸最好的時(shí)段,以縣產(chǎn)量為基礎(chǔ),根據(jù)種植面積確定州產(chǎn)量,最終獲得了35個(gè)州玉米最佳估產(chǎn)模型參數(shù),用2011年的數(shù)據(jù)驗(yàn)證,精度較高;黃健熙等研發(fā)了一種將LAI和作物模型同化的區(qū)域冬小麥產(chǎn)量估測(cè)系統(tǒng);歐陽(yáng)玲等通過(guò)對(duì)產(chǎn)量和NDVI、EVI、GNDVI等指標(biāo)進(jìn)行多元線(xiàn)性回歸,估測(cè)了北安市玉米、大豆產(chǎn)量;王蕾基于VTCI和分位數(shù)回歸模型對(duì)冬小麥的單產(chǎn)進(jìn)行了估測(cè),結(jié)果表明,某些情況下,分位數(shù)回歸比最小二乘模型估產(chǎn)效果更好。
前人再利用遙感某些參數(shù)和產(chǎn)量回歸方面做了大量研究,這些研究多是基于線(xiàn)性模型,然而有時(shí)線(xiàn)性模型不能很好地反映作物生長(zhǎng)過(guò)程,近年來(lái)機(jī)器學(xué)習(xí)方法在估產(chǎn)方面取得了很大的進(jìn)展,能夠很好地?cái)M合作物生長(zhǎng)的非線(xiàn)性過(guò)程。
2.2.1 隨機(jī)森林估產(chǎn)
隨機(jī)森林是一種統(tǒng)計(jì)學(xué)習(xí)理論,利用重抽樣方法從原始樣本中抽取多個(gè)樣本,對(duì)每個(gè)樣本構(gòu)建決策樹(shù),通過(guò)對(duì)決策樹(shù)建模并且多棵樹(shù)投票平均得出最終結(jié)果。該方法精度得到了大量實(shí)驗(yàn)驗(yàn)證,是一種自然的非線(xiàn)性建模工具。
我國(guó)在農(nóng)業(yè)估產(chǎn)方面,已有很多學(xué)者應(yīng)用隨機(jī)森林方法進(jìn)行了研究。下文將介紹國(guó)內(nèi)外學(xué)者如何運(yùn)用隨機(jī)森林方法進(jìn)行估產(chǎn)。劉峻明等根據(jù)河南省1990-2015年間連續(xù)種植冬小麥的106個(gè)縣市,獲得2740個(gè)有效單產(chǎn)數(shù)據(jù),利用氣象要素和空間要素做為輸入變量,訓(xùn)練隨機(jī)森林模型。并用2014/2015年數(shù)據(jù)進(jìn)行檢測(cè)模型精度。輸入變量中的氣象要素包括兩部分,一是每一年每一個(gè)市縣在拔節(jié)至抽穗期間的最高氣溫、最低氣溫、累計(jì)降水量、負(fù)積溫、有效積溫五個(gè)特征,拔節(jié)期和抽穗期根據(jù)歷史觀測(cè)取平均日期;二是根據(jù)小麥穗分化進(jìn)程,將拔節(jié)至抽穗期按8d為單位進(jìn)行分段,獲得各分段內(nèi)Tmax、平均氣溫、Tmin、最大氣溫日較差、平均相對(duì)濕度、Ps計(jì)42個(gè)特征,空間要素包括經(jīng)緯度和高程數(shù)據(jù)。模型變量重要性顯示:經(jīng)緯度、高程、小花分化后期平均溫度和小花分化前期最小溫度、拔節(jié)至抽穗期負(fù)積溫占前六位。且發(fā)現(xiàn)小花分化后期氣象要素和空間要素和相對(duì)氣象產(chǎn)量構(gòu)建隨機(jī)森林模型時(shí),R方可達(dá)87%,RMSE為0.07,這可作為產(chǎn)量預(yù)報(bào)的一個(gè)思路。陶惠林等利用無(wú)人機(jī)獲取了冬小麥挑旗期、開(kāi)花期和灌漿期數(shù)碼影像指數(shù)(植被指數(shù)、r、g、b和歸一化后的RGB)和光譜參數(shù),首先與產(chǎn)量進(jìn)行了相關(guān)性分析,然后擬合了各個(gè)時(shí)期相關(guān)性顯著的指數(shù)和產(chǎn)量的多元線(xiàn)性回歸和隨機(jī)森林模型,結(jié)果顯示,多元線(xiàn)性回歸模型擬合精度大于隨機(jī)森林,這可能是因?yàn)橛?xùn)練樣本數(shù)量少的原因,該實(shí)驗(yàn)共48個(gè)產(chǎn)量數(shù)據(jù)。王鵬新等以河北省中部平原為研究區(qū)域,獲得LAI和VICI的時(shí)間序列,以產(chǎn)量為因變量構(gòu)建了單變量、雙變量的隨機(jī)森林模型,雙變量模型表現(xiàn)較好。
2.2.2 深度學(xué)習(xí)估產(chǎn)
深度學(xué)習(xí)是近年來(lái)隨著軟硬件的突破而興起的機(jī)器學(xué)習(xí)算法,最初用在識(shí)別不同圖像上,精度極高,迅速地被應(yīng)用到各行各業(yè)中。深度學(xué)習(xí)通過(guò)給定的數(shù)據(jù)進(jìn)行學(xué)習(xí),即學(xué)習(xí)數(shù)據(jù)中的表示,用這種表示進(jìn)行數(shù)據(jù)變換。深度指一系列連續(xù)的表示層,通常包括數(shù)十個(gè)甚至上百個(gè)表示層,這些表示層都是從訓(xùn)練數(shù)據(jù)中自動(dòng)學(xué)習(xí)的,而這些分層通常是通過(guò)神經(jīng)網(wǎng)絡(luò)模型來(lái)學(xué)習(xí)的。學(xué)習(xí)指為神經(jīng)網(wǎng)絡(luò)的所有層找到一組權(quán)重值,使得信息進(jìn)入時(shí),像蒸餾一般,純度層層提高。下文將介紹學(xué)者們利用哪些要素和農(nóng)業(yè)產(chǎn)量聯(lián)系起來(lái)進(jìn)行深度學(xué)習(xí)?
周亮等使用MODIS數(shù)據(jù)構(gòu)建了基于卷積神經(jīng)網(wǎng)絡(luò)的冬小麥估產(chǎn)模型,其輸入層是每年該地區(qū)36張包含12個(gè)波段的影像,每個(gè)波段生成36個(gè)向量,最終形成36*36*12的數(shù)組,以該地區(qū)該年產(chǎn)量為輸出層訓(xùn)練模型,所有遙感影像在假設(shè)冬小麥單產(chǎn)和影像像素位置無(wú)關(guān)的前提下進(jìn)行直方圖降維和歸一化。結(jié)果顯示,訓(xùn)練集預(yù)測(cè)精度R方可達(dá)0.98,測(cè)試集精度可達(dá)0.71,并進(jìn)行了魯棒性檢驗(yàn),相關(guān)系數(shù)R基本超過(guò)了0.8;深度學(xué)習(xí)具有模擬精度高,輸入數(shù)據(jù)簡(jiǎn)單等優(yōu)點(diǎn),現(xiàn)在大部分學(xué)者利用遙感圖像序列來(lái)與產(chǎn)量進(jìn)行聯(lián)系,學(xué)習(xí)遙感圖像序列中的表示。因遙感影像具有實(shí)時(shí)性,遙感面積大的特點(diǎn),并且可以反映作物的生長(zhǎng)狀態(tài),而深度學(xué)習(xí)擅長(zhǎng)處理圖像,提取圖像中的特征,故模擬精度較高。也有人利用土壤、氣象數(shù)據(jù)和遙感圖片綜合來(lái)進(jìn)行估產(chǎn),大部分研究輸入層都包括從遙感獲得的一些信息,這是由于遙感信息實(shí)時(shí)性、在大區(qū)域中應(yīng)用方便的原因。
近年機(jī)器學(xué)習(xí)的興起使諸多方法用于農(nóng)業(yè)產(chǎn)量預(yù)測(cè),隨機(jī)森林輸入數(shù)據(jù)簡(jiǎn)單,訓(xùn)練時(shí)間相對(duì)少,擬合精度較高,且不用擔(dān)心傳統(tǒng)回歸方法過(guò)擬合、失擬合等問(wèn)題;神經(jīng)網(wǎng)絡(luò)訓(xùn)練時(shí)間稍長(zhǎng),且對(duì)電腦硬件有一定要求,其預(yù)測(cè)精度同樣很高;但是機(jī)器學(xué)習(xí)方法也是一種新興的統(tǒng)計(jì)方法,是端到端的輸入與輸出,并不能反映作物中間發(fā)育過(guò)程,作物模型對(duì)此有很多的機(jī)理描述,輸出結(jié)果豐富,能解決what-if問(wèn)題。
區(qū)域大面積估產(chǎn)上,二者都可以結(jié)合遙感,提高精度,進(jìn)行估產(chǎn)。有學(xué)者結(jié)合作物模型的輸出和機(jī)器學(xué)習(xí)方法進(jìn)行了產(chǎn)量預(yù)測(cè),未來(lái),應(yīng)考慮如何在提高精度的同時(shí),簡(jiǎn)化工作,減少工作量,結(jié)合模型和機(jī)器學(xué)習(xí)方法的優(yōu)點(diǎn),進(jìn)行估產(chǎn)。
農(nóng)村科學(xué)實(shí)驗(yàn)2022年12期