基于PLS和組合預(yù)測(cè)方法的冬小麥?zhǔn)斋@指數(shù)高光譜估測(cè)*

2019-07-03 05:51徐新剛杜曉初楊貴軍趙曉慶魏鵬飛王玉龍范玲玲

中國(guó)農(nóng)業(yè)信息 2019年2期

陳幗，徐新剛，杜曉初，楊貴軍，趙曉慶，魏鵬飛，王玉龍，范玲玲

（1. 湖北大學(xué)資源與環(huán)境學(xué)院，武漢430062；2. 農(nóng)業(yè)部農(nóng)業(yè)遙感機(jī)理與定量遙感重點(diǎn)實(shí)驗(yàn)室/北京農(nóng)業(yè)信息技術(shù)研究中心，北京100097；3. 國(guó)家農(nóng)業(yè)信息化工程技術(shù)研究中心，北京100097）

0 引言

收獲指數(shù)（Harvest Index，HI）指收獲時(shí)作物籽粒產(chǎn)量和地上部生物量的比值，又名經(jīng)濟(jì)系數(shù)，是選擇作物品種和品種改良研究中的重要參考因子［1］。收獲指數(shù)通?？梢酝ㄟ^(guò)田間取樣獲得，但需要耗費(fèi)較大的人力、物力，并具有一定滯后性。遙感技術(shù)擁有動(dòng)態(tài)、快速和準(zhǔn)確獲取地表作物參數(shù)信息的優(yōu)勢(shì)，隨著遙感監(jiān)測(cè)技術(shù)的快速發(fā)展，通過(guò)遙感手段獲取收獲指數(shù)將成為未來(lái)收獲指數(shù)評(píng)價(jià)的發(fā)展趨勢(shì)［2］。

當(dāng)前，基于遙感技術(shù)的作物收獲指數(shù)遙感估算已開(kāi)展了初步研究。杜鑫等［3］利用遙感技術(shù)監(jiān)測(cè)作物收獲指數(shù)的可行性分析研究，基于HI的形成過(guò)程總結(jié)歸納出3類利用遙感技術(shù)實(shí)現(xiàn)HI估測(cè)的方法，為如何利用遙感方式估算收獲指數(shù)提供了借鑒思路。Moriondo等［4］基于時(shí)間序列NDVI（歸一化植被指數(shù)）遙感信息，利用小麥開(kāi)花前后NDVI均值比作為指示特征，開(kāi)展小麥的收獲指數(shù)遙感提取研究，但是該方法需要首先確定提取區(qū)域內(nèi)最大收獲指數(shù)和其可能會(huì)有的變動(dòng)幅度，不同的取值一定程度會(huì)影響收獲指數(shù)估算結(jié)果?；贛oriondo等的研究，任建強(qiáng)等［5］做了方法改進(jìn)，利用MODIS衛(wèi)星遙感影像獲取冬小麥生長(zhǎng)期內(nèi)時(shí)間序列NDVI數(shù)據(jù)，以小麥開(kāi)花前的NDVI累計(jì)值與花后NDVI累計(jì)值的比值作為指示HI的遙感指數(shù)，很好地估測(cè)了區(qū)域冬小麥的收獲指數(shù)，反演結(jié)果與實(shí)測(cè)結(jié)果的R2達(dá)到了0.49。上述方法，盡管很好地實(shí)現(xiàn)區(qū)域尺度作物HI的遙感估測(cè)，但需要作物生長(zhǎng)季內(nèi)逐日或者短周期間隔的時(shí)間序列衛(wèi)星遙感影像，數(shù)據(jù)處理工作量巨大。

另一方面，由于作物收獲指數(shù)反映了作物光合產(chǎn)物在籽粒和營(yíng)養(yǎng)器官上的分配比例，它與作物不同生育期植株體內(nèi)光合產(chǎn)物的形成、運(yùn)轉(zhuǎn)過(guò)程息息相關(guān)，并受到諸多因素的影響，因此，作物不同生育期的生長(zhǎng)對(duì)作物最終收獲指數(shù)的形成都具有或多或少的影響，如何來(lái)刻畫不同生育期對(duì)作物HI的影響貢獻(xiàn)，組合預(yù)測(cè)方法提供了一種可能途徑。文章通過(guò)獲取的冬小麥多生育期多時(shí)相地面冠層高光譜數(shù)據(jù)，開(kāi)展小區(qū)田塊尺度的作物收獲指數(shù)高光譜估測(cè)研究，通過(guò)引入最優(yōu)組合預(yù)測(cè)方法，將基于不同生育期光譜信息建立的不同冬小麥?zhǔn)斋@指數(shù)光譜估測(cè)模型進(jìn)行組合，通過(guò)優(yōu)化算法賦予最優(yōu)權(quán)重，從而構(gòu)建組合估測(cè)模型實(shí)現(xiàn)冬小麥?zhǔn)斋@指數(shù)的高光譜估測(cè)，相關(guān)的研究并不多見(jiàn)。該文提出的作物收獲指數(shù)遙感光譜估測(cè)方法，嘗試?yán)脵?quán)重最優(yōu)組合算法，以達(dá)到充分利用作物多個(gè)生育期有用信息進(jìn)而改善收獲指數(shù)估算精度的目的，以期為基于多時(shí)相光譜信息的HI遙感估算提供新的方法參考。

1 研究區(qū)與研究方法

1.1 研究區(qū)域

實(shí)驗(yàn)區(qū)位于北京郊區(qū)的順義區(qū)和通州區(qū)，該區(qū)域?qū)儆谂瘻貛О霛駶?rùn)大陸性季風(fēng)氣候。年平均溫度11.3℃，年平均降水量在620 mm左右。氣候宜人，地形平緩，適宜耕種。為展開(kāi)研究，在順義區(qū)和通州區(qū)種植基地中隨機(jī)挑選出27個(gè)采樣點(diǎn)，采樣選取大田塊、生長(zhǎng)具有代表性冬小麥地塊進(jìn)行實(shí)驗(yàn)獲取數(shù)據(jù)。

1.2 冬小麥冠層光譜測(cè)定

實(shí)驗(yàn)于2009—2010年冬小麥生長(zhǎng)季開(kāi)展，分別選取冬小麥起身期、拔節(jié)期、孕穗期、開(kāi)花期和灌漿期，對(duì)冬小麥冠層進(jìn)行光譜測(cè)定。測(cè)定日期分別為：2010年4月1日、4月17日、4月29日、5月17日和6月2日。測(cè)量光譜儀選用ASD Field Spec FR2500，光譜范圍350～2 500 nm，采樣間隔為1 nm。盡量選擇在天氣晴朗時(shí)測(cè)定，測(cè)定時(shí)間為北京時(shí)間10： 00～14： 00。測(cè)定時(shí)，探頭始終垂直向下且保持與地面約為1 m的距離，探頭視場(chǎng)角為25°。在每個(gè)采樣點(diǎn)測(cè)量10次，取平均值為光譜測(cè)定的結(jié)果。在每個(gè)采樣點(diǎn)測(cè)定前、后立即進(jìn)行標(biāo)準(zhǔn)白板矯正。在進(jìn)行植被指數(shù)計(jì)算時(shí)，為排除干擾波段，僅僅選用敏感度較高的400～1 100 nm作為有效分析數(shù)據(jù)。

1.3 收獲指數(shù)測(cè)定

選取研究區(qū)內(nèi)共27個(gè)實(shí)測(cè)樣區(qū)。其中，通州區(qū)、順義區(qū)樣區(qū)數(shù)分別為15個(gè)和12個(gè)。樣區(qū)位置的選擇充分考慮了冬小麥生長(zhǎng)狀況和區(qū)域分布的代表性，且樣區(qū)面積均不小于100 m×100 m。采用五點(diǎn)取樣法進(jìn)行取樣，拷種稱量后，剪掉根部，只保留地上生物量部分進(jìn)行晾曬，之后稱量5采樣點(diǎn)冬小麥干重記錄為M。隨后進(jìn)行脫粒處理，稱取籽粒的重量記錄為M′，這樣每個(gè)采樣點(diǎn)的實(shí)測(cè)收獲指數(shù)HI即為兩者重量的比值。該實(shí)驗(yàn)測(cè)得的結(jié)果HI，即為試驗(yàn)區(qū)域內(nèi)冬小麥?zhǔn)斋@指數(shù)的實(shí)際測(cè)量值。該值將被用于構(gòu)建單個(gè)生育期的預(yù)測(cè)模型以及驗(yàn)證組合預(yù)測(cè)模型所計(jì)算結(jié)果的精度。計(jì)算公式為：

式（1）中，HI為收獲指數(shù)，M′為小麥籽粒重量，M為小麥干重。

1.4 植被指數(shù)選擇

到目前為止，植被指數(shù)的種類已經(jīng)達(dá)到了100多種，并在各個(gè)領(lǐng)域得到了廣泛應(yīng)用。由于關(guān)于收獲指數(shù)的研究成果有限，能夠明顯反映收獲指數(shù)大小的植被指數(shù)還在探索中，但是收獲指數(shù)的大小與作物光合作用關(guān)系密切［6］，在選擇植被指數(shù)構(gòu)建模型時(shí)，可以將對(duì)光合作用有關(guān)的因素列入考慮范圍，如葉面積大小、溫度、施氮水平、葉綠素含量等。

在挑選出的植被指數(shù)中，NDVI（歸一化差值植被指數(shù)）、DVI（差值植被指數(shù)）、RVI（比值植被指數(shù)）、EVI（增強(qiáng)植被指數(shù)）、OSAVI（優(yōu)化土壤調(diào)整植被指數(shù)）等均屬于常用的植被指數(shù)，而后學(xué)者們?yōu)榱斯罍y(cè)水稻大葉面積指數(shù)，在NDVI的計(jì)算公式上進(jìn)行了改良，提出了GBNDVI（綠藍(lán)波段歸一化植被指數(shù)）、GRNDVI（紅綠波段歸一化植被指數(shù)）、RBNDVI（紅藍(lán)波段歸一化植被指數(shù)）、BNDVI（藍(lán)波段歸一化植被指數(shù)），這些改良的植被指數(shù)也被挑選為反演參數(shù)。常用于監(jiān)測(cè)葉綠素含量的植被指數(shù)有：NPCI（歸一化色素葉綠素植被指數(shù)）、TCARI（轉(zhuǎn)化葉綠素吸收反射指數(shù)）、MCARI 2#（改進(jìn)葉綠素吸收比率指數(shù)II）、GVI（綠度植被指數(shù)）等；植被含氮量估測(cè)常用的植被指數(shù)有：NDRE（歸一化紅邊指數(shù)）、MTCI（MERIS陸地葉綠素指數(shù)）、SIPI（結(jié)構(gòu)不敏感色素指數(shù)）、PPR（植被色素比率）等；除此之外，該研究還引入了一些新型的植被指數(shù)作為對(duì)比參考，如DPI（雙峰值指數(shù)）、REP-li（線性內(nèi)插法紅邊位置指數(shù)）、PSRI（三波段比值指數(shù)）、MSR（改進(jìn)比值植被指數(shù)）等。

綜合以上，共計(jì)44種植被指數(shù)被列為反演參數(shù)。計(jì)算時(shí)，分別選擇620～760 nm、492～577 nm、400～450 nm、700～1 100 nm的波段范圍內(nèi)平均反射率作為紅光（R）、綠光（G）、藍(lán)光（B）和近紅外（NIR）波段的反射率值。其詳細(xì)的計(jì)算公式和引用文獻(xiàn)如表1所示。

表1 采用的植被指數(shù)Table 1 Summary of vegetation indices studied

續(xù)表

1.5 統(tǒng)計(jì)分析

將測(cè)定出的冬小麥5個(gè)生育期的冠層光譜數(shù)據(jù)，代入表1所列公式進(jìn)行計(jì)算。按照不同生育期，排列出27個(gè)取樣點(diǎn)對(duì)應(yīng)的44個(gè)植被指數(shù)值，并將每個(gè)生育期的44種植被指數(shù)與冬小麥實(shí)測(cè)收獲指數(shù)HI之間建模，進(jìn)行相關(guān)性計(jì)算。選擇決定性系數(shù)（R2）和均方根誤差（RMSE）作為指標(biāo)，將所計(jì)算的結(jié)果進(jìn)行排序，挑選R2較大同時(shí)RMSE盡量較小的5個(gè)植被指數(shù)作為篩選結(jié)果。

1.6 偏最小二乘建模

偏最小二乘法（Partial Least-Square，PLS）是一種多元統(tǒng)計(jì)分析法，具有計(jì)算簡(jiǎn)單、建模預(yù)測(cè)精度高、解釋性強(qiáng)等優(yōu)點(diǎn)。PLS通常用于解決對(duì)于多個(gè)因變量和多個(gè)自變量的回歸建模等問(wèn)題，當(dāng)解釋變量的個(gè)數(shù)遠(yuǎn)超過(guò)樣本個(gè)數(shù)或者解釋變量?jī)?nèi)部存在多重共線性時(shí)，PLS能運(yùn)用成分提取的方法，解釋變量與因變量的相關(guān)性［34］。研究中篩選出的植被指數(shù)即為解釋變量，實(shí)測(cè)收獲是因變量，將二者利用PLS結(jié)合后，得到每個(gè)生育期的單個(gè)預(yù)測(cè)方程。與其他線性模型一樣，PLS的最終結(jié)果也是一個(gè)線性模型，其方程為：

式（2）中，Y是因變量，即實(shí)測(cè)收獲指數(shù)；X1～Xn是用于構(gòu)建模型的植被指數(shù)；A1～An是對(duì)應(yīng)植被指數(shù)的系數(shù)；B是殘差參數(shù)。使用PLS得到A1～An和B的值，即可得到單個(gè)生育期的預(yù)測(cè)方程。

1.7 組合預(yù)測(cè)法

組合預(yù)測(cè)法是采用兩種或者兩種以上不同的預(yù)測(cè)方法，對(duì)同一對(duì)象進(jìn)行預(yù)測(cè)，對(duì)各單獨(dú)的預(yù)測(cè)結(jié)果適當(dāng)加權(quán)綜合后作為其最終結(jié)果［35］。這種方法能聚集各個(gè)預(yù)測(cè)方法的有用信息，使得組合模型的精度優(yōu)于其中任意一個(gè)單一模型的模擬精度，從而達(dá)到提高預(yù)測(cè)收獲指數(shù)精度的目的。研究采用組合預(yù)測(cè)法確定每個(gè)生育期對(duì)于最終收獲指數(shù)值的貢獻(xiàn)程度，即計(jì)算出每個(gè)生育期對(duì)應(yīng)的權(quán)重。確定權(quán)重的算法很多，該文采用最優(yōu)加權(quán)算法，評(píng)價(jià)最優(yōu)的標(biāo)準(zhǔn)為使組合預(yù)測(cè)偏差值之和最小。公式為：

式（3）中，ft代表第i種預(yù)測(cè)方法在t時(shí)刻的預(yù)測(cè)值，為第i種預(yù)測(cè)方法的權(quán)系數(shù)，且滿足

根據(jù)最小二乘法，當(dāng)殘差平方和達(dá)到最小，變權(quán)系數(shù)達(dá)到最佳。設(shè)et為t時(shí)刻組合預(yù)測(cè)的偏差，則計(jì)算最佳變權(quán)系數(shù)的方程組為：

式（4）中，k1～kN是需要求解的系數(shù)，代表單個(gè)生育期的預(yù)測(cè)方程在組合預(yù)測(cè)中的權(quán)重。最后，用實(shí)測(cè)的數(shù)據(jù)和組合方程預(yù)測(cè)出的收獲指數(shù)值進(jìn)行驗(yàn)證。

2 研究結(jié)果

2.1 相關(guān)性分析

將5個(gè)生育期內(nèi)的植被指數(shù)和實(shí)測(cè)植被指數(shù)進(jìn)行相關(guān)性分析，計(jì)算出R2和RMSE，并進(jìn)行排序，選取每個(gè)時(shí)期中R2盡可能大和RMSE盡可能小的5個(gè)最優(yōu)植被指數(shù)，結(jié)果如表2所示。每一項(xiàng)植被指數(shù)與收獲指數(shù)的R2都非常低，均沒(méi)有超過(guò)0.3，拔節(jié)期內(nèi)所有植被指數(shù)與實(shí)測(cè)收獲指數(shù)的相關(guān)性幾乎趨近于0，且RMSE也出現(xiàn)了非常巨大的值?？梢钥闯?，單個(gè)生育期的單個(gè)植被指數(shù)與實(shí)測(cè)收獲指數(shù)的相關(guān)性太低，因此篩選5個(gè)最優(yōu)植被指數(shù)與收獲指數(shù)構(gòu)建模型。

表2 不同生育期最優(yōu)植被指數(shù)Table 2 Optimal vegetation indices in different stages

2.2 單生育期與收獲指數(shù)的PLS建模

利用5個(gè)生育期中的最優(yōu)植被指數(shù)與PLS結(jié)合，建立冬小麥?zhǔn)斋@指數(shù)的估算模型，可以得到經(jīng)過(guò)建模后，單生育期的預(yù)測(cè)模型。將模型中得到的預(yù)測(cè)值與實(shí)測(cè)的收獲指數(shù)進(jìn)行相關(guān)性分析，按照生育期進(jìn)行順序排列，結(jié)果如表3所示。相對(duì)于單個(gè)植被指數(shù)擬合，單生育期的多個(gè)植被指數(shù)擬合的結(jié)果在相關(guān)性方面有了明顯提高，能明顯看出單個(gè)生育期預(yù)測(cè)方程對(duì)于最終結(jié)果的影響大小。但是，只有灌漿期擬合結(jié)果的R2超過(guò)了0.4，其余4個(gè)時(shí)期與實(shí)測(cè)值的相關(guān)性都不明顯；5個(gè)RMSE相較于單個(gè)生育期擬合而言，結(jié)果有了明顯優(yōu)化，且結(jié)果相對(duì)穩(wěn)定，沒(méi)有太大起伏。說(shuō)明在經(jīng)過(guò)PLS建模之后，單個(gè)生育期的擬合已達(dá)到最優(yōu)狀態(tài)，但是精度并不足以支持預(yù)測(cè)方程成立，需要進(jìn)一步提高。

表3 植被指數(shù)與PLS結(jié)合預(yù)測(cè)收獲指數(shù)的結(jié)果Table 3 Performance of the combination of vegetation indices and PLS for predicting harvest index

2.3 組合預(yù)測(cè)建模

利用組合預(yù)測(cè)的方法，計(jì)算出了最優(yōu)變權(quán)系數(shù)，將系數(shù)得到組合預(yù)測(cè)的方程為：

式（5）中每個(gè)單生育期預(yù)測(cè)方程前的系數(shù)，代表單個(gè)生育期對(duì)最終結(jié)果的貢獻(xiàn)程度，即在組合預(yù)測(cè)方程中，單生育期預(yù)測(cè)方程的權(quán)重系數(shù)。這些系數(shù)根據(jù)前文中式（4）所列出的方程計(jì)算而出。

將各生育期的預(yù)測(cè)結(jié)果帶入組合預(yù)測(cè)方程中，得到最終的預(yù)測(cè)結(jié)果。建立實(shí)測(cè)地面冬小麥?zhǔn)斋@指數(shù)與組合預(yù)測(cè)結(jié)果的關(guān)系為：

式（6）中，x為組合預(yù)測(cè)得到的參數(shù)，y為預(yù)測(cè)出的收獲指數(shù)，詳細(xì)結(jié)果由圖1所示。由圖可以看出，相較于單個(gè)生育期的預(yù)測(cè)結(jié)果而言，RMSE的變化不大，比單個(gè)預(yù)測(cè)模型中的最小值只降低了0.003，但是R2有了顯著提升，較單個(gè)預(yù)測(cè)模型的最大值提升了0.13。根據(jù)前文所述，組合預(yù)測(cè)法具有提取單個(gè)預(yù)測(cè)模型中有效信息的功能，單個(gè)預(yù)測(cè)模型的有效信息越多，代表單個(gè)模型的貢獻(xiàn)度越大，在組合預(yù)測(cè)中被賦予的權(quán)重就越大，反之則越小。由式（5）可以看出，開(kāi)花期和灌漿期的單個(gè)預(yù)測(cè)模型在組合中權(quán)重最大，這與冬小麥栽培種植的特征基本吻合。由于前3個(gè)生育期的時(shí)間較短，作物光合產(chǎn)物的累積量不及后兩個(gè)生育期的累積量充足，而收獲指數(shù)的確定與光合作用累計(jì)的生物量密切相關(guān)，所以時(shí)間間隔最長(zhǎng)的開(kāi)花期相較于其他生育期對(duì)于收獲指數(shù)的影響力最大，因此相關(guān)性最高，權(quán)重最大。因此，運(yùn)用組合預(yù)測(cè)的算法，可以成功篩選出單個(gè)預(yù)測(cè)模型中的有效信息，利用最優(yōu)加權(quán)組合預(yù)測(cè)模型的精度比起單個(gè)模型預(yù)測(cè)的精度提升明顯。表明組合預(yù)測(cè)的方法能夠?yàn)槔眠b感數(shù)據(jù)信息估算收獲指數(shù)提供有效的方法途徑。

圖1 組合預(yù)測(cè)值與冬小麥?zhǔn)斋@指數(shù)關(guān)系Fig.1 Relationship between combination predicted value and winter wheat harvest index

3 結(jié)論

單一生育期的植被指數(shù)與實(shí)測(cè)收獲指數(shù)相關(guān)性較低，在挑選出每個(gè)生育期中相關(guān)性最合適的5個(gè)植被指數(shù)后與PLS建模，相關(guān)性有所提高但依然很低，值最高的R2來(lái)自灌漿期為0.42，對(duì)應(yīng)的RMSE為各生育期預(yù)測(cè)值中最低為0.06，說(shuō)明PLS的確具有能提升預(yù)測(cè)精度的能力，可是在該研究中，PLS與單一生育期建模并不能達(dá)到理想的預(yù)測(cè)標(biāo)準(zhǔn)。在利用組合預(yù)測(cè)法構(gòu)建方程以后，預(yù)測(cè)值與實(shí)測(cè)值的相關(guān)性有了明顯提高。研究結(jié)果表明，在多種不同的方法進(jìn)行預(yù)測(cè)時(shí)，使用組合預(yù)測(cè)法可以有效起到提取有用信息的作用，從而可以提高對(duì)冬小麥?zhǔn)斋@指數(shù)的估算精度。利用組合預(yù)測(cè)法得到的預(yù)測(cè)結(jié)果與實(shí)測(cè)結(jié)果的R2能達(dá)到0.55，對(duì)應(yīng)的RMSE為0.06。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡