陳 幗 ,徐新剛 ,杜曉初 ,楊貴軍 ,趙曉慶 ,魏鵬飛 ,王玉龍 ,范玲玲
(1. 湖北大學(xué)資源與環(huán)境學(xué)院,武漢430062;2. 農(nóng)業(yè)部農(nóng)業(yè)遙感機(jī)理與定量遙感重點(diǎn)實(shí)驗(yàn)室/北京農(nóng)業(yè)信息技術(shù)研究中心,北京100097;3. 國(guó)家農(nóng)業(yè)信息化工程技術(shù)研究中心,北京100097)
收獲指數(shù)(Harvest Index,HI)指收獲時(shí)作物籽粒產(chǎn)量和地上部生物量的比值,又名經(jīng)濟(jì)系數(shù),是選擇作物品種和品種改良研究中的重要參考因子[1]。收獲指數(shù)通??梢酝ㄟ^(guò)田間取樣獲得,但需要耗費(fèi)較大的人力、物力,并具有一定滯后性。遙感技術(shù)擁有動(dòng)態(tài)、快速和準(zhǔn)確獲取地表作物參數(shù)信息的優(yōu)勢(shì),隨著遙感監(jiān)測(cè)技術(shù)的快速發(fā)展,通過(guò)遙感手段獲取收獲指數(shù)將成為未來(lái)收獲指數(shù)評(píng)價(jià)的發(fā)展趨勢(shì)[2]。
當(dāng)前,基于遙感技術(shù)的作物收獲指數(shù)遙感估算已開(kāi)展了初步研究。杜鑫等[3]利用遙感技術(shù)監(jiān)測(cè)作物收獲指數(shù)的可行性分析研究,基于HI的形成過(guò)程總結(jié)歸納出3類利用遙感技術(shù)實(shí)現(xiàn)HI估測(cè)的方法,為如何利用遙感方式估算收獲指數(shù)提供了借鑒思路。Moriondo等[4]基于時(shí)間序列NDVI(歸一化植被指數(shù))遙感信息,利用小麥開(kāi)花前后NDVI均值比作為指示特征,開(kāi)展小麥的收獲指數(shù)遙感提取研究,但是該方法需要首先確定提取區(qū)域內(nèi)最大收獲指數(shù)和其可能會(huì)有的變動(dòng)幅度,不同的取值一定程度會(huì)影響收獲指數(shù)估算結(jié)果?;贛oriondo等的研究,任建強(qiáng)等[5]做了方法改進(jìn),利用MODIS衛(wèi)星遙感影像獲取冬小麥生長(zhǎng)期內(nèi)時(shí)間序列NDVI數(shù)據(jù),以小麥開(kāi)花前的NDVI累計(jì)值與花后NDVI累計(jì)值的比值作為指示HI的遙感指數(shù),很好地估測(cè)了區(qū)域冬小麥的收獲指數(shù),反演結(jié)果與實(shí)測(cè)結(jié)果的R2達(dá)到了0.49。上述方法,盡管很好地實(shí)現(xiàn)區(qū)域尺度作物HI的遙感估測(cè),但需要作物生長(zhǎng)季內(nèi)逐日或者短周期間隔的時(shí)間序列衛(wèi)星遙感影像,數(shù)據(jù)處理工作量巨大。
另一方面,由于作物收獲指數(shù)反映了作物光合產(chǎn)物在籽粒和營(yíng)養(yǎng)器官上的分配比例,它與作物不同生育期植株體內(nèi)光合產(chǎn)物的形成、運(yùn)轉(zhuǎn)過(guò)程息息相關(guān),并受到諸多因素的影響,因此,作物不同生育期的生長(zhǎng)對(duì)作物最終收獲指數(shù)的形成都具有或多或少的影響,如何來(lái)刻畫不同生育期對(duì)作物HI的影響貢獻(xiàn),組合預(yù)測(cè)方法提供了一種可能途徑。文章通過(guò)獲取的冬小麥多生育期多時(shí)相地面冠層高光譜數(shù)據(jù),開(kāi)展小區(qū)田塊尺度的作物收獲指數(shù)高光譜估測(cè)研究,通過(guò)引入最優(yōu)組合預(yù)測(cè)方法,將基于不同生育期光譜信息建立的不同冬小麥?zhǔn)斋@指數(shù)光譜估測(cè)模型進(jìn)行組合,通過(guò)優(yōu)化算法賦予最優(yōu)權(quán)重,從而構(gòu)建組合估測(cè)模型實(shí)現(xiàn)冬小麥?zhǔn)斋@指數(shù)的高光譜估測(cè),相關(guān)的研究并不多見(jiàn)。該文提出的作物收獲指數(shù)遙感光譜估測(cè)方法,嘗試?yán)脵?quán)重最優(yōu)組合算法,以達(dá)到充分利用作物多個(gè)生育期有用信息進(jìn)而改善收獲指數(shù)估算精度的目的,以期為基于多時(shí)相光譜信息的HI遙感估算提供新的方法參考。
實(shí)驗(yàn)區(qū)位于北京郊區(qū)的順義區(qū)和通州區(qū),該區(qū)域?qū)儆谂瘻貛О霛駶?rùn)大陸性季風(fēng)氣候。年平均溫度11.3℃,年平均降水量在620 mm左右。氣候宜人,地形平緩,適宜耕種。為展開(kāi)研究,在順義區(qū)和通州區(qū)種植基地中隨機(jī)挑選出27個(gè)采樣點(diǎn),采樣選取大田塊、生長(zhǎng)具有代表性冬小麥地塊進(jìn)行實(shí)驗(yàn)獲取數(shù)據(jù)。
實(shí)驗(yàn)于2009—2010年冬小麥生長(zhǎng)季開(kāi)展,分別選取冬小麥起身期、拔節(jié)期、孕穗期、開(kāi)花期和灌漿期,對(duì)冬小麥冠層進(jìn)行光譜測(cè)定。測(cè)定日期分別為:2010年4月1日、4月17日、4月29日、5月17日和6月2日。測(cè)量光譜儀選用ASD Field Spec FR2500,光譜范圍350~2 500 nm,采樣間隔為1 nm。盡量選擇在天氣晴朗時(shí)測(cè)定,測(cè)定時(shí)間為北京時(shí)間10: 00~14: 00。測(cè)定時(shí),探頭始終垂直向下且保持與地面約為1 m的距離,探頭視場(chǎng)角為25°。在每個(gè)采樣點(diǎn)測(cè)量10次,取平均值為光譜測(cè)定的結(jié)果。在每個(gè)采樣點(diǎn)測(cè)定前、后立即進(jìn)行標(biāo)準(zhǔn)白板矯正。在進(jìn)行植被指數(shù)計(jì)算時(shí),為排除干擾波段,僅僅選用敏感度較高的400~1 100 nm作為有效分析數(shù)據(jù)。
選取研究區(qū)內(nèi)共27個(gè)實(shí)測(cè)樣區(qū)。其中,通州區(qū)、順義區(qū)樣區(qū)數(shù)分別為15個(gè)和12個(gè)。樣區(qū)位置的選擇充分考慮了冬小麥生長(zhǎng)狀況和區(qū)域分布的代表性,且樣區(qū)面積均不小于100 m×100 m。采用五點(diǎn)取樣法進(jìn)行取樣,拷種稱量后,剪掉根部,只保留地上生物量部分進(jìn)行晾曬,之后稱量5采樣點(diǎn)冬小麥干重記錄為M。隨后進(jìn)行脫粒處理,稱取籽粒的重量記錄為M′,這樣每個(gè)采樣點(diǎn)的實(shí)測(cè)收獲指數(shù)HI即為兩者重量的比值。該實(shí)驗(yàn)測(cè)得的結(jié)果HI,即為試驗(yàn)區(qū)域內(nèi)冬小麥?zhǔn)斋@指數(shù)的實(shí)際測(cè)量值。該值將被用于構(gòu)建單個(gè)生育期的預(yù)測(cè)模型以及驗(yàn)證組合預(yù)測(cè)模型所計(jì)算結(jié)果的精度。計(jì)算公式為:
式(1)中,HI為收獲指數(shù),M′為小麥籽粒重量,M為小麥干重。
到目前為止,植被指數(shù)的種類已經(jīng)達(dá)到了100多種,并在各個(gè)領(lǐng)域得到了廣泛應(yīng)用。由于關(guān)于收獲指數(shù)的研究成果有限,能夠明顯反映收獲指數(shù)大小的植被指數(shù)還在探索中,但是收獲指數(shù)的大小與作物光合作用關(guān)系密切[6],在選擇植被指數(shù)構(gòu)建模型時(shí),可以將對(duì)光合作用有關(guān)的因素列入考慮范圍,如葉面積大小、溫度、施氮水平、葉綠素含量等。
在挑選出的植被指數(shù)中,NDVI(歸一化差值植被指數(shù))、DVI(差值植被指數(shù))、RVI(比值植被指數(shù))、EVI(增強(qiáng)植被指數(shù))、OSAVI(優(yōu)化土壤調(diào)整植被指數(shù))等均屬于常用的植被指數(shù),而后學(xué)者們?yōu)榱斯罍y(cè)水稻大葉面積指數(shù),在NDVI的計(jì)算公式上進(jìn)行了改良,提出了GBNDVI(綠藍(lán)波段歸一化植被指數(shù))、GRNDVI(紅綠波段歸一化植被指數(shù))、RBNDVI(紅藍(lán)波段歸一化植被指數(shù))、BNDVI(藍(lán)波段歸一化植被指數(shù)),這些改良的植被指數(shù)也被挑選為反演參數(shù)。常用于監(jiān)測(cè)葉綠素含量的植被指數(shù)有:NPCI(歸一化色素葉綠素植被指數(shù))、TCARI(轉(zhuǎn)化葉綠素吸收反射指數(shù))、MCARI 2#(改進(jìn)葉綠素吸收比率指數(shù)II)、GVI(綠度植被指數(shù))等;植被含氮量估測(cè)常用的植被指數(shù)有:NDRE(歸一化紅邊指數(shù))、MTCI(MERIS陸地葉綠素指數(shù))、SIPI(結(jié)構(gòu)不敏感色素指數(shù))、PPR(植被色素比率)等;除此之外,該研究還引入了一些新型的植被指數(shù)作為對(duì)比參考,如DPI(雙峰值指數(shù))、REP-li(線性內(nèi)插法紅邊位置指數(shù))、PSRI(三波段比值指數(shù))、MSR(改進(jìn)比值植被指數(shù))等。
綜合以上,共計(jì)44種植被指數(shù)被列為反演參數(shù)。計(jì)算時(shí),分別選擇620~760 nm、492~577 nm、400~450 nm、700~1 100 nm的波段范圍內(nèi)平均反射率作為紅光(R)、綠光(G)、藍(lán)光(B)和近紅外(NIR)波段的反射率值。其詳細(xì)的計(jì)算公式和引用文獻(xiàn)如表1所示。
表1 采用的植被指數(shù)Table 1 Summary of vegetation indices studied
續(xù)表
將測(cè)定出的冬小麥5個(gè)生育期的冠層光譜數(shù)據(jù),代入表1所列公式進(jìn)行計(jì)算。按照不同生育期,排列出27個(gè)取樣點(diǎn)對(duì)應(yīng)的44個(gè)植被指數(shù)值,并將每個(gè)生育期的44種植被指數(shù)與冬小麥實(shí)測(cè)收獲指數(shù)HI之間建模,進(jìn)行相關(guān)性計(jì)算。選擇決定性系數(shù)(R2)和均方根誤差(RMSE)作為指標(biāo),將所計(jì)算的結(jié)果進(jìn)行排序,挑選R2較大同時(shí)RMSE盡量較小的5個(gè)植被指數(shù)作為篩選結(jié)果。
偏最小二乘法(Partial Least-Square,PLS)是一種多元統(tǒng)計(jì)分析法,具有計(jì)算簡(jiǎn)單、建模預(yù)測(cè)精度高、解釋性強(qiáng)等優(yōu)點(diǎn)。PLS通常用于解決對(duì)于多個(gè)因變量和多個(gè)自變量的回歸建模等問(wèn)題,當(dāng)解釋變量的個(gè)數(shù)遠(yuǎn)超過(guò)樣本個(gè)數(shù)或者解釋變量?jī)?nèi)部存在多重共線性時(shí),PLS能運(yùn)用成分提取的方法,解釋變量與因變量的相關(guān)性[34]。研究中篩選出的植被指數(shù)即為解釋變量,實(shí)測(cè)收獲是因變量,將二者利用PLS結(jié)合后,得到每個(gè)生育期的單個(gè)預(yù)測(cè)方程。與其他線性模型一樣,PLS的最終結(jié)果也是一個(gè)線性模型,其方程為:
式(2)中,Y是因變量,即實(shí)測(cè)收獲指數(shù);X1~Xn是用于構(gòu)建模型的植被指數(shù);A1~An是對(duì)應(yīng)植被指數(shù)的系數(shù);B是殘差參數(shù)。使用PLS得到A1~An和B的值,即可得到單個(gè)生育期的預(yù)測(cè)方程。
組合預(yù)測(cè)法是采用兩種或者兩種以上不同的預(yù)測(cè)方法,對(duì)同一對(duì)象進(jìn)行預(yù)測(cè),對(duì)各單獨(dú)的預(yù)測(cè)結(jié)果適當(dāng)加權(quán)綜合后作為其最終結(jié)果[35]。這種方法能聚集各個(gè)預(yù)測(cè)方法的有用信息,使得組合模型的精度優(yōu)于其中任意一個(gè)單一模型的模擬精度,從而達(dá)到提高預(yù)測(cè)收獲指數(shù)精度的目的。研究采用組合預(yù)測(cè)法確定每個(gè)生育期對(duì)于最終收獲指數(shù)值的貢獻(xiàn)程度,即計(jì)算出每個(gè)生育期對(duì)應(yīng)的權(quán)重。確定權(quán)重的算法很多,該文采用最優(yōu)加權(quán)算法,評(píng)價(jià)最優(yōu)的標(biāo)準(zhǔn)為使組合預(yù)測(cè)偏差值之和最小。公式為:
式(3)中,ft代表第i種預(yù)測(cè)方法在t時(shí)刻的預(yù)測(cè)值,為第i種預(yù)測(cè)方法的權(quán)系數(shù),且滿足
根據(jù)最小二乘法,當(dāng)殘差平方和達(dá)到最小,變權(quán)系數(shù)達(dá)到最佳。設(shè)et為t時(shí)刻組合預(yù)測(cè)的偏差,則計(jì)算最佳變權(quán)系數(shù)的方程組為:
式(4)中,k1~kN是需要求解的系數(shù),代表單個(gè)生育期的預(yù)測(cè)方程在組合預(yù)測(cè)中的權(quán)重。最后,用實(shí)測(cè)的數(shù)據(jù)和組合方程預(yù)測(cè)出的收獲指數(shù)值進(jìn)行驗(yàn)證。
將5個(gè)生育期內(nèi)的植被指數(shù)和實(shí)測(cè)植被指數(shù)進(jìn)行相關(guān)性分析,計(jì)算出R2和RMSE,并進(jìn)行排序,選取每個(gè)時(shí)期中R2盡可能大和RMSE盡可能小的5個(gè)最優(yōu)植被指數(shù),結(jié)果如表2所示。每一項(xiàng)植被指數(shù)與收獲指數(shù)的R2都非常低,均沒(méi)有超過(guò)0.3,拔節(jié)期內(nèi)所有植被指數(shù)與實(shí)測(cè)收獲指數(shù)的相關(guān)性幾乎趨近于0,且RMSE也出現(xiàn)了非常巨大的值??梢钥闯?,單個(gè)生育期的單個(gè)植被指數(shù)與實(shí)測(cè)收獲指數(shù)的相關(guān)性太低,因此篩選5個(gè)最優(yōu)植被指數(shù)與收獲指數(shù)構(gòu)建模型。
表2 不同生育期最優(yōu)植被指數(shù)Table 2 Optimal vegetation indices in different stages
利用5個(gè)生育期中的最優(yōu)植被指數(shù)與PLS結(jié)合,建立冬小麥?zhǔn)斋@指數(shù)的估算模型,可以得到經(jīng)過(guò)建模后,單生育期的預(yù)測(cè)模型。將模型中得到的預(yù)測(cè)值與實(shí)測(cè)的收獲指數(shù)進(jìn)行相關(guān)性分析,按照生育期進(jìn)行順序排列,結(jié)果如表3所示。相對(duì)于單個(gè)植被指數(shù)擬合,單生育期的多個(gè)植被指數(shù)擬合的結(jié)果在相關(guān)性方面有了明顯提高,能明顯看出單個(gè)生育期預(yù)測(cè)方程對(duì)于最終結(jié)果的影響大小。但是,只有灌漿期擬合結(jié)果的R2超過(guò)了0.4,其余4個(gè)時(shí)期與實(shí)測(cè)值的相關(guān)性都不明顯;5個(gè)RMSE相較于單個(gè)生育期擬合而言,結(jié)果有了明顯優(yōu)化,且結(jié)果相對(duì)穩(wěn)定,沒(méi)有太大起伏。說(shuō)明在經(jīng)過(guò)PLS建模之后,單個(gè)生育期的擬合已達(dá)到最優(yōu)狀態(tài),但是精度并不足以支持預(yù)測(cè)方程成立,需要進(jìn)一步提高。
表3 植被指數(shù)與PLS結(jié)合預(yù)測(cè)收獲指數(shù)的結(jié)果Table 3 Performance of the combination of vegetation indices and PLS for predicting harvest index
利用組合預(yù)測(cè)的方法,計(jì)算出了最優(yōu)變權(quán)系數(shù),將系數(shù)得到組合預(yù)測(cè)的方程為:
式(5)中每個(gè)單生育期預(yù)測(cè)方程前的系數(shù),代表單個(gè)生育期對(duì)最終結(jié)果的貢獻(xiàn)程度,即在組合預(yù)測(cè)方程中,單生育期預(yù)測(cè)方程的權(quán)重系數(shù)。這些系數(shù)根據(jù)前文中式(4)所列出的方程計(jì)算而出。
將各生育期的預(yù)測(cè)結(jié)果帶入組合預(yù)測(cè)方程中,得到最終的預(yù)測(cè)結(jié)果。建立實(shí)測(cè)地面冬小麥?zhǔn)斋@指數(shù)與組合預(yù)測(cè)結(jié)果的關(guān)系為:
式(6)中,x為組合預(yù)測(cè)得到的參數(shù),y為預(yù)測(cè)出的收獲指數(shù),詳細(xì)結(jié)果由圖1所示。由圖可以看出,相較于單個(gè)生育期的預(yù)測(cè)結(jié)果而言,RMSE的變化不大,比單個(gè)預(yù)測(cè)模型中的最小值只降低了0.003,但是R2有了顯著提升,較單個(gè)預(yù)測(cè)模型的最大值提升了0.13。根據(jù)前文所述,組合預(yù)測(cè)法具有提取單個(gè)預(yù)測(cè)模型中有效信息的功能,單個(gè)預(yù)測(cè)模型的有效信息越多,代表單個(gè)模型的貢獻(xiàn)度越大,在組合預(yù)測(cè)中被賦予的權(quán)重就越大,反之則越小。由式(5)可以看出,開(kāi)花期和灌漿期的單個(gè)預(yù)測(cè)模型在組合中權(quán)重最大,這與冬小麥栽培種植的特征基本吻合。由于前3個(gè)生育期的時(shí)間較短,作物光合產(chǎn)物的累積量不及后兩個(gè)生育期的累積量充足,而收獲指數(shù)的確定與光合作用累計(jì)的生物量密切相關(guān),所以時(shí)間間隔最長(zhǎng)的開(kāi)花期相較于其他生育期對(duì)于收獲指數(shù)的影響力最大,因此相關(guān)性最高,權(quán)重最大。因此,運(yùn)用組合預(yù)測(cè)的算法,可以成功篩選出單個(gè)預(yù)測(cè)模型中的有效信息,利用最優(yōu)加權(quán)組合預(yù)測(cè)模型的精度比起單個(gè)模型預(yù)測(cè)的精度提升明顯。表明組合預(yù)測(cè)的方法能夠?yàn)槔眠b感數(shù)據(jù)信息估算收獲指數(shù)提供有效的方法途徑。
圖1 組合預(yù)測(cè)值與冬小麥?zhǔn)斋@指數(shù)關(guān)系Fig.1 Relationship between combination predicted value and winter wheat harvest index
單一生育期的植被指數(shù)與實(shí)測(cè)收獲指數(shù)相關(guān)性較低,在挑選出每個(gè)生育期中相關(guān)性最合適的5個(gè)植被指數(shù)后與PLS建模,相關(guān)性有所提高但依然很低,值最高的R2來(lái)自灌漿期為0.42,對(duì)應(yīng)的RMSE為各生育期預(yù)測(cè)值中最低為0.06,說(shuō)明PLS的確具有能提升預(yù)測(cè)精度的能力,可是在該研究中,PLS與單一生育期建模并不能達(dá)到理想的預(yù)測(cè)標(biāo)準(zhǔn)。在利用組合預(yù)測(cè)法構(gòu)建方程以后,預(yù)測(cè)值與實(shí)測(cè)值的相關(guān)性有了明顯提高。研究結(jié)果表明,在多種不同的方法進(jìn)行預(yù)測(cè)時(shí),使用組合預(yù)測(cè)法可以有效起到提取有用信息的作用,從而可以提高對(duì)冬小麥?zhǔn)斋@指數(shù)的估算精度。利用組合預(yù)測(cè)法得到的預(yù)測(cè)結(jié)果與實(shí)測(cè)結(jié)果的R2能達(dá)到0.55,對(duì)應(yīng)的RMSE為0.06。