武旭梅,常慶瑞,落莉莉,由明明
(西北農(nóng)林科技大學(xué)資源環(huán)境學(xué)院,陜西 楊凌 712100)
葉綠素含量是評價作物生理狀態(tài)和長勢的重要參數(shù)[1],對其進行估測可作為評估作物生長發(fā)育狀況及產(chǎn)量高低的有效手段。目前,國內(nèi)外已有很多學(xué)者借助高光譜遙感技術(shù)對不同作物的葉綠素含量進行了估測,尺度包括葉片和冠層,應(yīng)用的光譜信息包括原始光譜、導(dǎo)數(shù)光譜以及由此構(gòu)造的特征參數(shù)、植被指數(shù),均取得了一定的效果[2-9]。水稻是我國的主要糧食作物,對其葉綠素含量的估測亦有很多研究[10-16],但主要集中在南方稻作區(qū)。針對北方,特別是西北引黃灌區(qū)的研究相對較少,且不同研究者應(yīng)用的光譜信息均是在特定條件下提取的,建立的估算模型具有地域性和時效性,不能直接用于該區(qū)域水稻冠層葉綠素含量的估測,因此有必要進行相關(guān)研究。
便攜式葉綠素儀SPAD-502采用光電無損檢測方法測定植物葉片的葉綠素含量,其測得的SPAD(Soil and Plant Analyzer Development)值與葉綠素含量具有較高相關(guān)性,常用于表征葉綠素含量[17-19]。本研究將西北引黃灌區(qū)水稻作為研究對象,通過田間試驗,觀測水稻冠層SPAD與高光譜數(shù)據(jù),應(yīng)用植被指數(shù)建立水稻冠層SPAD的高光譜估算模型。通過比較探索,尋求能夠高精度反演西北引黃灌區(qū)水稻冠層SPAD的遙感模型,從而為實時監(jiān)測本區(qū)水稻生長發(fā)育狀況提供理論和技術(shù)支持。
田間試驗布設(shè)在寧夏回族自治區(qū)青銅峽市葉盛鎮(zhèn)寧夏農(nóng)林科學(xué)院水稻示范基地(東經(jīng)106°10′48″,北緯38°7′12″)。該基地屬于中溫帶大陸性干旱氣候,年日照時數(shù)2 955 h,年平均氣溫8.3~8.6℃,無霜期176 d,年降水量260.7 mm。
試驗共36個小區(qū),每個小區(qū)面積為60 m2(10 m×6 m)。各小區(qū)均施純磷、純鉀各90 kg·hm-2作為基肥。試驗設(shè)置3個氮素水平,即分別施純氮0、240、300 kg·hm-2;4個碳素水平,即分別施純碳0、4 500、9 000、13 500 kg·hm-2,共12個組合處理,每個處理重復(fù)3次。試驗使用的肥料為重過磷酸鈣、氯化鉀、尿素和稻殼炭。每個小區(qū)選擇2個樣點,分別于2017年7月9日(抽穗期)、8月10日(乳熟期)和9月11日(蠟熟期)進行田間觀測。
1.2.1 冠層光譜測定 采用美國SVC公司生產(chǎn)的SVC HR-1024i型便攜式非成像全波段地物光譜儀測定。光譜儀波長范圍350~2 500 nm,其中350~1 000 nm光譜分辨率≤3.5 nm,1 000~1 850 nm光譜分辨率≤9.5 nm,1 850~2 500 nm光譜分辨率≤6.5 nm;測量時鏡頭視場角25°,傳感器探頭垂直朝下,距冠層垂直高度1 m;每測量1個樣點均用參考板進行標(biāo)定。選擇天氣晴朗無云、風(fēng)力微弱時測定,時間為10∶00~14∶00。每個樣點測定5條光譜曲線,取其平均值作為該樣點的光譜反射率。
1.2.2 葉綠素含量測定 對應(yīng)于測定冠層光譜位置,采用便攜式葉綠素儀SPAD-502對光譜儀視場范圍內(nèi)的水稻冠層葉片進行測定,得到10個SPAD數(shù)據(jù),取其平均值作為該樣點的冠層SPAD。
利用光譜儀自帶的處理軟件對光譜曲線進行融合、平滑處理。其中,對400~2 400 nm波段的光譜以間隔4 nm進行重采樣;利用Excel軟件對光譜數(shù)據(jù)進行一階導(dǎo)數(shù)變換,得到一階導(dǎo)數(shù)光譜數(shù)據(jù)。
對眾多學(xué)者研究中用來反演葉綠素含量的植被指數(shù)[1-19]進行分析,選取應(yīng)用最廣泛的比值植被指數(shù)(ratio vegetation index,RVI)、差值植被指數(shù)(difference vegetation index,DVI)、歸一化植被指數(shù)(normalized difference vegetation index,NDVI)和土壤調(diào)節(jié)植被指數(shù)(soil-adjust vegetation index,SAVI)反演水稻冠層葉綠素含量(表1)。通過任意波段組合的方式,構(gòu)建基于原始光譜和一階導(dǎo)數(shù)光譜的植被指數(shù),并分別與SPAD進行相關(guān)性分析,得到植被指數(shù)與SPAD決定系數(shù)等值線圖。根據(jù)決定系數(shù)最大的原則,選擇最佳波段組合建立植被指數(shù)。上述處理過程在MATLAB軟件中實現(xiàn)。
分別利用普通回歸分析方法和隨機森林算法構(gòu)建水稻冠層葉綠素含量估算模型,并進行對比分析。隨機森林(Random Forest, RF)是一種基于分類樹的機器學(xué)習(xí)算法,能夠在保障模型精度的同時大大降低運算量,功能強大且簡單易用[20],算法通過R語言中的randomForest軟件包實現(xiàn)。采用決定系數(shù)R2、均方根誤差RMSE和平均相對誤差RE對模型預(yù)測值與實測值進行精度檢驗,RMSE和RE越小模型精度越高。
注:Rλ1、Rλ2分別為兩個波長的冠層光譜反射率,Dλ1、Dλ2分別為兩個波長的冠層光譜反射率的一階導(dǎo)數(shù);L為土壤校正參數(shù),本文選取L=0.5。
Note:Rλ1andRλ2refer to the canopy spectral reflectance of 2 wavelengths,Dλ1andDλ2refer to the first derivative of the canopy spectral reflectance with 2 wavelengths, respectively.Lis the soil correction parameter, andL=0.5 is selected in this paper.
試驗共得到216個樣點數(shù)據(jù),將其隨機分為兩組,其中144個作為訓(xùn)練樣本進行分析與建模,72個作為驗證樣本對模型精度進行檢驗,各組樣本的SPAD統(tǒng)計特征見表2。從表2中可以看出,訓(xùn)練樣本的SPAD在8.1~55.4之間,包含了整體樣本的最小值與最大值,區(qū)間分布比較合理,變異程度相對較大,在一定意義上保證了所構(gòu)建的水稻冠層SPAD估算模型的適用范圍。驗證樣本和訓(xùn)練樣本的統(tǒng)計特征相似,能夠?qū)λ⒛P偷目煽啃赃M行驗證。
將水稻冠層SPAD與原始光譜、一階導(dǎo)數(shù)光譜進行相關(guān)性分析,結(jié)果如圖1所示。
表2 水稻冠層SPAD統(tǒng)計特征
由圖1可知,水稻冠層SPAD與原始光譜在752~880 nm范圍內(nèi)呈正相關(guān),其余波段呈負(fù)相關(guān)。其中在400~740、760~812、956~1 000、1 084~2 400 nm波段范圍相關(guān)性均達(dá)到極顯著相關(guān)水平(99%置信度,n=216),相關(guān)性在700 nm處達(dá)到最大(R=-0.833)。水稻冠層SPAD與一階導(dǎo)數(shù)光譜的相關(guān)系數(shù)介于-0.834~0.737之間,在680 nm處達(dá)到-0.834。與原始光譜相比,一階導(dǎo)數(shù)光譜與SPAD的相關(guān)性在740~760、800~920 nm波段得到顯著提高。
采用任意波段組合的方式,運用原始光譜構(gòu)建植被指數(shù),并分別與SPAD進行相關(guān)性分析,得到?jīng)Q定系數(shù)R2等值線圖(圖2)。從圖2可以看出,在每個植被指數(shù)與SPAD的決定系數(shù)等值線圖中都存在R2大于0.7的區(qū)域,表示由這些波段組合構(gòu)建的植被指數(shù)與SPAD的相關(guān)性達(dá)到較高水平。與DVI和SAVI相比,RVI和NDVI與SPAD相關(guān)性較好的波段組合范圍相對較大。RVI的最佳波段組合為RVI(R696,R540),DVI為DVI(R700,R536),NDVI為NDVI(R600,R592),SAVI為SAVI(R700,R536),R2分別為0.838、0.805、0.830、0.831。
采用同樣方法構(gòu)建基于一階導(dǎo)數(shù)光譜的植被指數(shù),得到最佳比值植被指數(shù)RVI(D1316,D736)、最佳差值植被指數(shù)DVI(D704,D700)、最佳歸一化植被指數(shù)NDVI(D1228,D752)、最佳土壤調(diào)節(jié)植被指數(shù)SAVI(D704,D700),R2分別為0.843、0.791、0.827、0.791??梢?,上述8個植被指數(shù)與水稻冠層SPAD的相關(guān)性明顯高于原始光譜、一階導(dǎo)數(shù)光譜與SPAD的相關(guān)性,可以更好地用來建立估算模型。
圖1 水稻冠層SPAD與原始光譜、一階導(dǎo)數(shù)光譜的相關(guān)性Fig.1 Correlation betweenthe original spectra, the first derivative spectra, and SPAD of rice canopy
2.4.1 普通回歸估算模型及精度檢驗 以上述植被指數(shù)為自變量,分別與水稻冠層SPAD進行線性函數(shù)、指數(shù)函數(shù)、二次多項式、對數(shù)函數(shù)、冪函數(shù)擬合,構(gòu)建水稻冠層SPAD的估算模型。通過比較決定系數(shù)R2、均方根誤差RMSE和平均相對誤差RE,得到各植被指數(shù)的最佳單變量估算模型(表3)。
由表3可知,不同植被指數(shù)的SPAD估算模型均為非線性,主要是由于同時期不同土壤肥力造成水稻植株的明顯差異以及不同生育期植株的持續(xù)生長帶來的變化導(dǎo)致水稻冠層SPAD與植被指數(shù)之間呈現(xiàn)非線性變化。8個模型的建模R2介于0.77~0.88,RMSE介于4.2~5.3,RE介于15%~30%;驗證R2均在0.69之上,RMSE均低于4.8,RE<21%,模型精度較高。其中以RVI(D1316,D736)為自變量建立的指數(shù)模型建模R2最大,建模和驗證的RMSE、RE明顯低于其他模型,精度最高。對比4種植被指數(shù),以RVI和NDVI為自變量建立的模型略優(yōu)于DVI和SAVI,其原因可能是水稻在抽穗期和乳熟期的植被覆蓋度較高,使DVI和SAVI對冠層SPAD的敏感度下降。
表3 水稻冠層SPAD單變量估算模型
2.4.2 基于隨機森林算法的估算模型及精度檢驗 為了更準(zhǔn)確估測水稻冠層SPAD,采用隨機森林算法建立估算模型。應(yīng)用上述8個植被指數(shù)為自變量構(gòu)建模型,得到各自變量的重要性指標(biāo)(表4),其中精度平均較少值(%IncMSE)和節(jié)點不純度平均減少值(IncNodePurity)越大說明自變量的重要性越強。通過對比,選擇重要性最好的4個植被指數(shù)RVI(R696,R540)、DVI(R700,R536)、SAVI(R700,R536)、RVI(D1316,D736)建立模型。
在模型構(gòu)建中,有兩個影響模型精度的重要參數(shù)決策樹(ntree)和分割變量(mtry),需對其進行合理設(shè)置。圖3是決策樹的數(shù)目與模型誤差的折線圖,可以看出,當(dāng)決策樹的數(shù)目大于500后,模型誤差趨于穩(wěn)定。理論上,決策樹的數(shù)目越多,模型的效果就越好,但是計算量也就越大,增加樹的數(shù)量帶來的效果提升程度是遞減的??紤]其運算成本,本試驗確定隨機森林算法中決策樹ntree=1000。根據(jù)經(jīng)驗及逐一嘗試,分割變量mtry設(shè)置為2。
表4 隨機森林自變量重要性指標(biāo)
圖3 決策樹的數(shù)目與模型誤差折線圖Fig.3 Line chart of decision trees and model error
分別對訓(xùn)練樣本和驗證樣本的實測值與模型預(yù)測值進行擬合分析,檢驗所建模型的精度,結(jié)果如圖4所示。
由圖4(a)可見,訓(xùn)練樣本點均勻地聚集在1∶1線附近,表明模型預(yù)測值與實測值很接近,模型的建模R2達(dá)到0.898,RMSE<2.1,RE低于8%。對比表3和圖4可知,與普通回歸估算模型相比,基于隨機森林算法的估算模型建模和驗證R2增大,RMSE、RE減小,預(yù)測精度得到明顯提高,可以實現(xiàn)水稻冠層SPAD的精準(zhǔn)估測。
本研究通過田間試驗獲取了西北引黃灌區(qū)水稻的冠層光譜和SPAD數(shù)據(jù),運用任意波段組合的方式構(gòu)建了一系列基于原始光譜和一階導(dǎo)數(shù)光譜的植被指數(shù)RVI、DVI、NDVI和SAVI。通過計算植被指數(shù)與SPAD的相關(guān)性,篩選出了最優(yōu)波段組合構(gòu)建的植被指數(shù)作為自變量,利用普通回歸分析方法和隨機森林算法建立了水稻冠層SPAD估算模型。最后,通過對比分析得到了能夠高精度反演西北引黃灌區(qū)水稻冠層SPAD的遙感模型,可為實時監(jiān)測該區(qū)域水稻生長發(fā)育狀況及估產(chǎn)提供理論和技術(shù)支持。
相比原始光譜,西北引黃灌區(qū)水稻冠層一階導(dǎo)數(shù)光譜在部分波段與SPAD的相關(guān)性更強,這與前人研究結(jié)果[21]一致。應(yīng)用普通回歸分析方法,以RVI(D1316,D736)為自變量建立的指數(shù)模型是估算西北引黃灌區(qū)水稻冠層SPAD的最佳單變量模型。采用隨機森林算法,以4個植被指數(shù)RVI(R696,R540)、DVI(R700,R536)、SAVI(R700,R536)、RVI(D1316,D736)建立的估算模型比普通回歸模型預(yù)測精度更高,可作為反演西北引黃灌區(qū)水稻冠層SPAD的最佳模型。但隨機森林算法計算量大,在實際應(yīng)用中對軟硬件要求都比較高。相對而言,基于單變量的普通回歸分析方法參數(shù)單一,計算方式簡單,在對精度要求不是很高的情況下可以直接用于西北引黃灌區(qū)水稻的實際監(jiān)測。
圖4 基于隨機森林算法的水稻冠層SPAD估算模型檢驗Fig.4 Accuracy verification of rice canopy SPAD estimation model based on random forest algorithm
本研究建立的模型與以往學(xué)者針對南方稻田得到的研究結(jié)果[15-16]有所差異,原因在于水稻冠層光譜受光照條件、冠層結(jié)構(gòu)和土壤、水體等復(fù)雜情況的影響產(chǎn)生很大差異,由此建立的模型不能統(tǒng)一。針對西北引黃灌區(qū)水稻冠層葉綠素含量的估測,秦占飛等[19]應(yīng)用了紅邊參數(shù),本研究應(yīng)用植被指數(shù)亦取得了很好的效果。但受天氣條件限制,本研究僅在水稻抽穗期、乳熟期、蠟熟期進行了采樣,模型的可靠性和普適性尚需進一步驗證。用更多的數(shù)據(jù)、更科學(xué)的建模方法建立可通用的水稻冠層葉綠素含量估測模型將是未來研究工作的重點。