吾木提·艾山江 尼加提·卡斯木 陳 晨 買買提·沙吾提
(1.伊犁師范大學(xué)資源與生態(tài)研究所, 伊寧 835000; 2.伊犁師范大學(xué)生物與地理科學(xué)學(xué)院, 伊寧 835000;3.新疆大學(xué)地理科學(xué)學(xué)院, 烏魯木齊 830046)
冬小麥是我國重要的糧食作物之一,其種植面積和產(chǎn)量僅次于水稻[1]。LAI是與植被利用光能和冠層結(jié)構(gòu)密切相關(guān),能夠很好地反映作物生長趨勢和估算產(chǎn)量的重要作物參數(shù)之一[2]。因此,通過遙感準確、快速地估算區(qū)域作物的LAI不僅有利于更好的作物生長連續(xù)長期監(jiān)測,且有利于在作物綜合管理和精確農(nóng)業(yè)中的應(yīng)用[3]。
隨著高光譜技術(shù)的發(fā)展,其數(shù)百或數(shù)千個窄波段為開發(fā)靈敏的植被指數(shù)提供了更多可能。諸多研究學(xué)者已經(jīng)完善了傳統(tǒng)光譜植被指數(shù),并利用高光譜數(shù)據(jù)的光譜分辨率和連續(xù)性開發(fā)了新的數(shù)據(jù)分析技術(shù)[4]。目前,冬小麥葉面積指數(shù)的遙感估算大致從單波段反射率和波段組合植被指數(shù)著手,結(jié)合不同回歸算法來實現(xiàn)。對于單波段反射率而言,諸多學(xué)者利用不同的預(yù)處理數(shù)學(xué)方法。孟禹弛等[5]利用地面實測冬小麥生理參數(shù)和冠層光譜數(shù)據(jù),通過一階微分預(yù)處理并計算植被指數(shù),建立了冥函數(shù)模型和指數(shù)模型;梁棟等[6]通過對冬小麥高光譜曲線進行連續(xù)小波變換,并與LAI建立支持向量機回歸模型,實現(xiàn)了冬小麥不同生育期LAI估算;付元元等[7]在高光譜遙感反演LAI時,利用主成分回歸(Principle component regression, PCR)或偏最小二乘回歸(Partial least squares regression, PLSR)結(jié)合的高光譜維數(shù)約簡方法,降低基于全譜段建立的模型不穩(wěn)定,同時取得了較好的估算結(jié)果。而對于典型的植被指數(shù)而言,陳雪洋等[8]探討了歸一化植被指數(shù)(Normalized difference vegetation index, NDVI)、比值植被指數(shù)(Ratio vegetation index, RVI)、土壤調(diào)節(jié)植被指數(shù)(Soil-adjusted vegetation index, SAVI)、增強型植被指數(shù)(Enhanced vegetation index, EVI)和紅邊參數(shù)在建立高光譜模型反演冬小麥LAI的精度;除此之外,夏天等[9]、陳曉凱等[10]、田明璐等[11]、孫華林等[12]、陶惠林等[13]、吾木提·艾山江等[14]利用RVI、NDVI和差值植被指數(shù)(Difference vegetation index, DVI)、EVI、再歸一化植被指數(shù)(Resource difference vegetation index, RDVI)等典型的光譜指數(shù),采用任意兩波段組合算法提取最優(yōu)窄波段組合植被指數(shù),通過多元逐步回歸和偏最小二乘等線性回歸算法構(gòu)建了冬小麥LAI估算模型,取得了較好的效果。以上研究顯示以任意兩波段組合構(gòu)建植被指數(shù)能夠?qū)ふ易魑锢砘瘏?shù)的響應(yīng)位置,有利于提高模型的估算精度[15-16]。而結(jié)合高光譜數(shù)據(jù)的光譜分辨率優(yōu)勢,對典型的三波段植被指數(shù)的波段組合進行優(yōu)化,并與單波段反射率、兩波段植被指數(shù)之間進行系統(tǒng)的比較,尋求符合當?shù)丨h(huán)境的LAI敏感波段組合植被指數(shù)和提高估算精度方面值得探討。
本文以冬小麥在拔節(jié)期的LAI和同步冠層高光譜為數(shù)據(jù)源,采用波段組合優(yōu)化方法,構(gòu)建基于不同類型數(shù)據(jù)下(包括原始光譜、一階導(dǎo)數(shù)、二階導(dǎo)數(shù))所有可能組合的兩波段植被指數(shù)和三波段植被指數(shù),探索不同維度(單波段反射率、兩波段植被指數(shù)、三波段植被指數(shù))數(shù)據(jù)對LAI的敏感性變化,利用人工神經(jīng)網(wǎng)絡(luò)(ANN)、K近鄰(KNN)和支持向量回歸(SVR)構(gòu)建LAI估算模型,并進行對比和分析篩選最優(yōu)模型,以其為精準農(nóng)業(yè)估算作物參數(shù)提供理論基礎(chǔ)。
研究區(qū)地理位置為89°13′~91°22′E,42°25′~45°29′N,位于新疆維吾爾自治區(qū)奇臺縣,年平均氣溫5.5℃,年平均無霜期153 d,年平均降水量269.4 mm,屬于沙漠干旱氣候[17]。該地區(qū)主要作物以冬小麥為主,播種時間為2017年9月25日。根據(jù)冬小麥的關(guān)鍵生長期和當?shù)靥鞖鈼l件,從2018年4—6月,在起身期、拔節(jié)期、開花期等階段采集樣品。地面觀測在東西方向每隔20 m和南北方向30 m,在130 m×420 m的地塊進行。采用五點采樣法進行采樣,共有78個采樣點,并用GPS記錄取樣點的坐標(圖1)。
在起身期和拔節(jié)期,冬小麥冠層的高光譜數(shù)據(jù)由ASD FieldSpec3型光譜儀進行測量,光譜測量于北京時間10:00—14:00無云照射中進行。為每個樣本收集了10條光譜曲線,測量間隔為0.1 s,求平均值作為該樣本測量數(shù)據(jù)。高光譜數(shù)據(jù)預(yù)處理部分,因受邊緣帶350~399 nm的高光噪聲,將該區(qū)域進行刪除。其余完整連續(xù)的光譜曲線400~1 300 nm作為數(shù)據(jù)源,利用Savitzky-Golay方法進行平滑,再利用一階微分和二階微分等數(shù)學(xué)方法完成高光譜數(shù)據(jù)變換。
基于數(shù)字圖像處理技術(shù)的攝影方法可用于估算LAI[18]。本研究采樣區(qū)域面積為Ss,莖總數(shù)設(shè)為n。5根莖從樣本區(qū)取出,作為掃描的小麥樣本。將一張A4白紙放在平面寫字板上,面積為Sp(21 cm×29.7 cm),用膠水將葉片粘在紙上,以確保葉片之間沒有重疊。利用ECOSYS FS-1125 MFP型多功能數(shù)字復(fù)合掃描儀掃描所有樣品。分辨率設(shè)置為600像素×600像素,掃描的圖像保存為TIFF格式。使用ENVI打開上述TIFF文件,使用“決策樹”的分類方法將綠葉和白紙分開,然后分別計算樣品占用的像素數(shù)PZ和綠葉占用的像素數(shù)PY。葉面積指數(shù)計算公式為
探索冬小麥LAI數(shù)據(jù)與高光譜數(shù)據(jù)之間重要關(guān)系的最有效方法之一是對窄帶反射率因子進行計算。該研究涉及到任意波段組合植被指數(shù),分別為二維植被指數(shù)(Two-dimensional vegetation index, 2DVI)和三維植被指數(shù)(Three-dimensional vegetation index, 3DVI)。2DVI為兩個波段進行任意組合構(gòu)建兩波段植被指數(shù),如:比值植被指數(shù)(RVI)、歸一化植被指數(shù)(NDVI)和差值植被指數(shù)(DVI);3DVI為3個波段進行任意組合構(gòu)建三波段植被指數(shù)(表1)。通過研究團隊在Java平臺上開發(fā)的軟件來實現(xiàn)兩波段組合計算過程,利用Matlab軟件完成三維植被指數(shù)的構(gòu)建與計算。
表1 波段組合植被指數(shù)Tab.1 Band combination vegetation index
采用的機器學(xué)習(xí)算法包括:人工神經(jīng)網(wǎng)絡(luò)(ANN)[22]、K近鄰(KNN)[23]和支持向量回歸(SVR)[24]。
以決定系數(shù)(Coefficient of determination,R2)和均方根誤差(Root mean square error, RMSE)來驗證模型的穩(wěn)定性,相對分析誤差(Relative percent deviation, RPD)為計算過程標準偏差(Standard deviation, SD)與估計標準誤差(Standard error of prediction, SEP)之比,可驗證模型的預(yù)測能力。RPD大于2.0,說明該模型具有較好的預(yù)測能力;RPD在1.4~2.0之間,代表具有一般預(yù)測能力;RPD小于1.4,說明其預(yù)測能力較差。
對研究區(qū)冬小麥冠層LAI數(shù)據(jù)進行了統(tǒng)計,結(jié)果見表2。本次采樣共78個,將數(shù)據(jù)劃分為兩個部分,一個子集用于模型建模(n=47),另一個子集用于模型驗證(n=31)。對應(yīng)于建模集和驗證集的LAI平均值分別為6.38和6.46,標準偏差(SD)分別為1.28和0.96。所有采樣點的LAI平均值為6.42,變異系數(shù)為16.51%。
通過整數(shù)階微分對高光譜進行預(yù)處理,分析基于不同預(yù)處理方法的單波段以及兩波段植被指數(shù)對LAI相關(guān)性的影響。
表2 冬小麥LAI數(shù)據(jù)統(tǒng)計分析Tab.2 Statistical analysis of winter wheat LAI data
2.2.1單波段反射率與LAI關(guān)系
基于原數(shù)據(jù)(Original data, OD)、一階和二階微分的預(yù)處理,單波段反射率與LAI之間相關(guān)關(guān)系存在明顯的差異(圖2)。原數(shù)據(jù)光譜反射率與LAI的相關(guān)性在可見光(450~710 nm)、近紅外(750~910 nm、1 020~1 100 nm)部分0.01水平上呈顯著相關(guān),相關(guān)系數(shù)在-0.4~0.3之間變化。整數(shù)階微分處理后,與LAI的相關(guān)系數(shù)有所提高,提高到0.6以上;一階微分和二階微分相比,一階微分預(yù)處理不僅提高了相關(guān)性,而且增加了通過0.01水平顯著性波段范圍。
圖2 基于不同預(yù)處理的高光譜數(shù)據(jù)與LAI相關(guān)性結(jié)果Fig.2 Correlation results between hyperspectral data and LAI based on different preprocessing
2.2.2兩波段植被指數(shù)與LAI關(guān)系
基于原數(shù)據(jù)、一階和二階微分的預(yù)處理,進行兩波段植被指數(shù)(RVI、NDVI、DVI)與LAI之間相關(guān)性熱圖分析(圖3~5)。對原數(shù)據(jù)而言,所有兩波段組合的3種植被指數(shù)篩選發(fā)現(xiàn)(表3),與LAI的相關(guān)系數(shù)絕對值最大的對應(yīng)波段組合為OD-RVI(728 nm,994 nm)、OD-NDVI(724 nm,987 nm)、OD-DVI(785 nm,860 nm);對于一階導(dǎo)數(shù)變換而言,LAI敏感的波段組合植被指數(shù)為OD-RVI(627 nm,774 nm)、OD-NDVI(769 nm,974 nm)、OD-DVI(729 nm,811 nm);對于二階導(dǎo)數(shù)變換而言,LAI敏感的波段組合植被指數(shù)為OD-RVI(735 nm,776 nm)、OD-NDVI(539 nm,762 nm)、OD-DVI(686 nm,764 nm)。從波段組合范圍以及相關(guān)程度分析發(fā)現(xiàn),整數(shù)階微分預(yù)處理對3種植被指數(shù)與LAI之間的相關(guān)性有所提升,為估算模型的構(gòu)建提供了可選擇的變量。
圖3 基于原始光譜的兩波段植被指數(shù)與LAI的相關(guān)性Fig.3 Correlation between two-band vegetation index and LAI based on original spectral data
圖4 基于一階微分光譜的兩波段植被指數(shù)與LAI的相關(guān)性Fig.4 Correlation between two-band vegetation index and LAI based on the first derivative spectral data
圖5 基于二階微分光譜的兩波段植被指數(shù)與LAI的相關(guān)性Fig.5 Correlation between two-band vegetation index and LAI based on the second derivative spectral data
表3 最佳兩波段組合植被指數(shù)Tab.3 The best two-band combination vegetation index
圖6 基于原始光譜的三波段植被指數(shù)與LAI的相關(guān)性Fig.6 Correlation between three-band vegetation index and LAI based on original spectral data
2.2.3三波段植被指數(shù)與LAI關(guān)系
基于原數(shù)據(jù)、一階和二階微分的預(yù)處理,進行三波段植被指數(shù)與LAI之間相關(guān)性分析(圖6~8)?;谠几吖庾V數(shù)據(jù)的三波段植被指數(shù)計算結(jié)果中,僅選取3種植被指數(shù)相關(guān)性結(jié)果,見圖6;分析發(fā)現(xiàn)3DVI-1、3DVI-3、3DVI-7分別與LAI呈顯著相關(guān)關(guān)系,相關(guān)系數(shù)絕對值介于0.4~0.6之間。其余4種指數(shù)(3DVI-2、3DVI-4、3DVI-5、3DVI-6)均與LAI的相關(guān)程度偏低,未參與建模過程。
圖7 基于一階微分光譜的三波段植被指數(shù)與LAI的相關(guān)性Fig.7 Correlation between three-band vegetation index and LAI based on the first derivative spectral data
圖8 基于二階微分光譜的三波段植被指數(shù)與LAI的相關(guān)性Fig.8 Correlation between three-band vegetation index and LAI based on the second derivative spectral data
基于一階微分的三波段植被指數(shù)計算結(jié)果中,與LAI呈顯著相關(guān)的植被指數(shù)有5種,分別是3DVI-1、3DVI-2、3DVI-4、3DVI-5、3DVI-7,相關(guān)系數(shù)絕對值介于0.6~0.9之間,相關(guān)性三維結(jié)果見圖7;其中3DVI-4與LAI之間相關(guān)系數(shù)達到最大?;诙A微分的三波段植被指數(shù)與LAI之間的相關(guān)性三維熱圖見圖8,7種三波段植被指數(shù)均呈顯著相關(guān),相關(guān)系數(shù)絕對值介于0.6~0.7之間,見表4。
在不同光譜預(yù)處理下,對三波段植被指數(shù)波段組合進行優(yōu)化,并進行最佳波段組合篩選;若出現(xiàn)相同大小的最值,都被采集為最佳波段組合,并適用于估算模型的最佳參數(shù)。
諸多研究表明,基于多種波段組合植被指數(shù)構(gòu)建的農(nóng)作物參數(shù)估算模型精度顯著高于敏感單波段反射率建立的模型,不同波段之間的運算結(jié)果能夠有效加強農(nóng)作物參數(shù)的關(guān)聯(lián)程度,從而提高估算模型的精度[25-26]。本文對高光譜窄波段反射率及其不同形式組合運算構(gòu)建的2DVI、3DVI植被指數(shù)為數(shù)據(jù)源,并以最佳變量構(gòu)建模型如下:以原數(shù)據(jù)、一階和二階微分數(shù)據(jù)的KNN、ANN和SVR模型;對各變換光譜數(shù)據(jù)分別進行最佳2DVI、3DVI植被指數(shù)的KNN、ANN和SVR模型;因參與模型變量不同,共構(gòu)建了27種估算模型,模型估算精度見圖9。
估算模型所需數(shù)據(jù)總體分為單波段反射率、2DVI、3DVI等3種類型(簡稱:一維、二維、三維),在3種類型光譜數(shù)據(jù)下,采用K近鄰(KNN)、人工神經(jīng)網(wǎng)絡(luò)(ANN)和支持向量回歸(SVR)建模對冬小麥LAI進行估算;分析發(fā)現(xiàn),對光譜數(shù)據(jù)進行一階二階微分預(yù)處理,顯著提高了各維度數(shù)據(jù)構(gòu)建的估算模型精度。尤其是一階微分光譜處理在KNN模型各維度數(shù)據(jù)構(gòu)建模型中表現(xiàn)突出,決定系數(shù)R2分別為0.57、0.83、0.89;對于ANN和SVR模型而言,在一維、二維數(shù)據(jù)構(gòu)建的模型中表現(xiàn)突出;在三維數(shù)據(jù)構(gòu)建模型中,基于二階微分預(yù)處理的光譜數(shù)據(jù)結(jié)果比較偏高。從總體的估算模型對比分析,KNN構(gòu)建的估算模型精度在各維度數(shù)據(jù)中,決定系數(shù)均偏高,而均方根誤差均偏低。其中以一階微分處理運算的最佳3DVI植被指數(shù)為自變量,建立冬小麥葉面積指數(shù)KNN估算模型表現(xiàn)最優(yōu),其決定系數(shù)最高(R2=0.89),均方根誤差最低(RMSE為0.31)。
依據(jù)模型穩(wěn)定性和預(yù)測能力評價指標RPD對27種模型的估算能力進行比較分析,結(jié)果見表5。本研究不具備估測樣本能力的模型(RPD小于1.5)主要是基于原數(shù)據(jù)單波段反射率所構(gòu)建的模型,其余部分模型的RPD均大于1.5,具備較好的估算能力。從總體分析發(fā)現(xiàn),KNN模型的估算能力明顯高于ANN和SVR模型的估算能力;尤其是以最佳波段組合優(yōu)化植被指數(shù)為模型參數(shù)時,KNN模型RPD大于2.0的模型數(shù)量占比較大,共5種模型;而其余RPD大于2.0的模型數(shù)量各占3個。從光譜數(shù)據(jù)變換角度分析發(fā)現(xiàn),在一階微分預(yù)處理后分別進行最佳2DVI和3DVI植被指數(shù)的計算中,冬小麥LAI與最佳波段組合植被指數(shù)之間的相關(guān)性明顯提升,從而基于一階微分處理所構(gòu)建模型的估算能力顯著提高。
綜上所述,在不同的數(shù)據(jù)類型下,建立的機器學(xué)習(xí)估算模型存在一定的差異。冬小麥LAI估算模型(KNN-3DVI-FD)的實測值與預(yù)測值的空間分布見圖10,可以看出,以最佳3DVI植被指數(shù)變量,采用KNN算法構(gòu)建冬小麥LAI估算模型,其實測值和預(yù)測值空間上擬合效果更接近于1∶1,說明在本研究中是最具有估算能力的模型。
掌握農(nóng)作物的生長狀況主要取決于作物的葉面積指數(shù),LAI是能夠描述農(nóng)作物冠層結(jié)構(gòu)的重要參數(shù)之一[27-28]。在冬小麥整個生育期中,拔節(jié)期氮素積累過程較顯著,直接反映冬小麥健康生長趨勢,對冬小麥拔節(jié)期LAI的精確、快速遙感監(jiān)測能夠為后期田間尺度施肥管理提供理論依據(jù)[29-30]。
基于高光譜數(shù)據(jù)以及最優(yōu)植被指數(shù)的農(nóng)作物典型參數(shù)反演得到了諸多學(xué)者的研究,亞森江·喀哈爾等[31]、陳曉凱等[10]分別對春小麥的葉綠素含量和冬小麥的葉面積指數(shù)進行高光譜監(jiān)測,探討了任意兩波段組合植被指數(shù)與作物參數(shù)之間的相關(guān)關(guān)系,表明基于最優(yōu)兩波段組合植被指數(shù)構(gòu)建的模型精度顯著提高。本研究基于光譜變換和最優(yōu)波段組合植被指數(shù)進行冬小麥拔節(jié)期LAI估算研究,結(jié)果表明原數(shù)據(jù)、一階二階微分變換與LAI在紅邊波段750~910 nm、760~810 nm內(nèi)呈顯著相關(guān)(P<0.01)。通過分析發(fā)現(xiàn),基于3種光譜變換所構(gòu)建的任意兩波段、三波段植被指數(shù)與LAI相關(guān)性顯著提高,顯著相關(guān)波段組合中包含紅邊波段(表4),這與劉偉東等[32]、蘇偉等[33]研究成果相符,都反映了紅邊波段對作物LAI的重要性,表明任意波段組合的植被指數(shù)應(yīng)用到農(nóng)作物參數(shù)反演是可行的。
表4 最佳三波段組合植被指數(shù)Tab.4 The best two-band combination vegetation index
在諸多研究中,經(jīng)常假設(shè)自變量和因變量呈線性關(guān)聯(lián)而構(gòu)建回歸模型,在實際中該條件較難滿足。陳曉凱等[10]研究表明最優(yōu)窄波段植被指數(shù)與冬小麥LAI的關(guān)系表現(xiàn)為非線性關(guān)系。因此,本文為擬合自變量和因變量之間的非線性關(guān)系,引入了KNN、ANN和SVR等3種機器學(xué)習(xí)算法;通過分析3種算法發(fā)現(xiàn),K近鄰算法對數(shù)據(jù)的非線性擬合結(jié)果較好,尤其是基于一階微分光譜處理的9個3DVI指數(shù)(表4)與LAI之間構(gòu)建KNN模型相對于其它兩種算法明顯提高,更適合解決非線性擬合問題。
以冬小麥冠層高光譜為數(shù)據(jù)源,在一階、二階微分預(yù)處理的基礎(chǔ)上,計算任意波段組合的2DVI指數(shù)和3DVI指數(shù),利用人工神經(jīng)網(wǎng)絡(luò)(ANN)、K近鄰(KNN)和支持向量回歸(SVR)算法來構(gòu)建LAI估算模型,并進行對比分析。結(jié)果表明:基于不同預(yù)處理光譜的任意波段組合植被指數(shù)在紅邊位置與LAI相關(guān)性顯著提高,尤其是基于一階微分預(yù)處理光譜的FD-3DVI-4(714 nm, 400 nm, 1 001 nm)指數(shù)與LAI相關(guān)系數(shù)達到0.93(P<0.01),更能說明充分利用海量光譜信息很有必要,能夠避免光譜信息的丟失和失效。對于3種模型構(gòu)建方法而言,以最優(yōu)波段組合3DVI為自變量,發(fā)現(xiàn)K近鄰算法數(shù)據(jù)擬合好,構(gòu)建的模型精度較好,其決定系數(shù)最高(R2=0.89),均方根誤差最低(RMSE為0.31),相對分析誤差為2.41,可為作物長勢評估和估產(chǎn)提供科學(xué)依據(jù)。
圖9 冬小麥LAI高光譜估算模型精度對比Fig.9 Comparison of LAI hyperspectral estimation models for winter wheat
表5 冬小麥LAI的27種估算模型相對分析誤差Tab.5 Relative analysis errors of 27 estimation models of winter wheat LAI
圖10 實測值與預(yù)測值的散點圖Fig.10 Scatter plot of measured and predicted values