王玉娜,李粉玲,李振發(fā),呂書豪
(西北農(nóng)林科技大學(xué)資源環(huán)境學(xué)院,陜西楊凌712100)
氮素是作物生長必需的營養(yǎng)物質(zhì)之一,與作物的生長狀況、產(chǎn)量和蛋白質(zhì)含量息息相關(guān)[1-2]。氮營養(yǎng)指數(shù)(nitrogen nutrition index,NNI)是定量表達作物氮素營養(yǎng)豐缺程度的一個重要指標,能夠從作物群體特征出發(fā),較準確地反映作物的氮營養(yǎng)狀況[3]。實時、快速、無損監(jiān)測作物氮營養(yǎng)指數(shù)是掌握農(nóng)田氮素養(yǎng)分分布、協(xié)調(diào)田間管理措施的重要依據(jù)[4-5]。
隨著高光譜遙感技術(shù)的發(fā)展,國內(nèi)外學(xué)者在實時監(jiān)測葉片葉綠素含量(LCC)、葉片氮素含量(LNC)、葉片氮素積累(LNA)、植株氮素濃度(PNC)、植物氮素吸收(PNU)等作物氮素營養(yǎng)方面取得了一定的研究成果[6],但利用高光譜技術(shù)對作物NNI實時監(jiān)測的研究還比較少。研究表明,利用線性內(nèi)插法紅邊位置(REPLI)估測冬小麥NNI的精度較高,決定系數(shù)可達0.859[7];春玉米NNI與黃邊內(nèi)一階微分光譜中的最大值相關(guān)性較高[8];在可見光至近紅外光的冠層光譜反射率區(qū)域,對夏玉米NNI最敏感的光譜帶位于710和512 nm[9]。植被指數(shù)與作物NNI也密切相關(guān)。如,植被指數(shù)與甜椒NNI在果實生長早期和開花期存在較強的相關(guān)性,但相關(guān)性在營養(yǎng)階段和收獲階段變?nèi)鮗10];Yu等[11]提出了一種基于雙植被指數(shù)的NNI遙感指數(shù)(NNIRS),可用于監(jiān)測作物氮素狀況。然而,目前還沒有具體的植被指數(shù)用于跨多個生長發(fā)育時期的NNI反演。在目前的高光譜遙感研究中,偏最小二乘回歸、支持向量機、隨機森林回歸等算法被廣泛應(yīng)用,而且均顯示出了強大的模型構(gòu)建能力,但不同算法在具體實踐中應(yīng)用效果各有千秋,如對玉米冠層原始高光譜信息預(yù)處理后,結(jié)合隨機森林算法反演NNI的精度要優(yōu)于偏最小二乘回歸和BP神經(jīng)網(wǎng)絡(luò)回歸[9]??傮w來看,作物冠層高光譜技術(shù)結(jié)合機器學(xué)習(xí)算法是NNI估算的潛在途徑,但目前基于冠層高光譜的NNI估算精度整體不高,而且對不同生育時期的估算結(jié)論有待驗證。如,基于無人機高光譜成像影像構(gòu)建了NNI的隨機森林估算模型,雖然模型較為穩(wěn)定,但其解釋能力不到80%[12];基于無人機高光譜成像影像和不同時期的植被指數(shù)預(yù)測冬小麥NNI時,揚花期的解釋能力要高于拔節(jié)期和孕穗期[13];機器學(xué)習(xí)算法結(jié)合遙感數(shù)據(jù)、土壤、氣候和田間管理參數(shù)會進一步提升作物NNI估算模型的精度[14]。
有研究者認為,吸光度變換(ABS)[15]、連續(xù)統(tǒng)去除變換(CR)[16]等光譜變換能在一定程度上減弱作物冠層原始光譜背景噪聲,提升作物理化參數(shù)的反演精度[17-18]。本研究對獲取的冬小麥冠層高光譜數(shù)據(jù)進行光譜變換,構(gòu)建“三邊”參數(shù)、任意兩波段光譜指數(shù)和植被指數(shù)三類光譜參數(shù),篩選對NNI敏感的光譜特征參數(shù),基于偏最小二乘回歸、隨機森林、支持向量機回歸和梯度增強回歸構(gòu)建冬小麥NNI模型,并對模型精度進行比較,以期獲得最佳NNI估算方法,為診斷調(diào)控冬小麥氮素營養(yǎng)、實時監(jiān)測生長狀況和后期田間管理提供基礎(chǔ)數(shù)據(jù)。
2017-2019年在陜西省咸陽市乾縣梁山鎮(zhèn)齊南村設(shè)置冬小麥小區(qū)種植試驗(34°38′N,108°07′E)。該區(qū)土壤類型為壤土,0~40 cm耕層有機質(zhì)含量為13.36 g·kg-1,全氮含量為0.48 g·kg-1,速效氮含量為44.86 mg·kg-1,有效磷含量為13.54 mg·kg-1,速效鉀含量為182.88 mg·kg-1。供試小麥為當?shù)刂髟云贩N小偃22。試驗設(shè)置不同水平的氮磷鉀單因素處理,每個處理重復(fù)兩次,小區(qū)面積90 m2(10 m×9 m)。氮素處理設(shè)置0、30、60、90、120和150 kg·hm-26個施氮水平,各處理均施磷(P2O5)45 kg·hm-2和鉀(K2O)60 kg·hm-2;磷素處理設(shè)置0、22.5、45、67.5、90 和112.5 kg·hm-26個施磷(P2O5)水平,各處理均施氮90 kg·hm-2和鉀肥(K2O)60 kg·hm-2;鉀素處理設(shè)置0、15、 30、45、60 和 75 kg·hm-26個施鉀(K2O)水平,各處理均施氮90 kg·hm-2和施磷(P2O5)45 kg·hm-2。小區(qū)種植管理方式同當?shù)卮筇铩?/p>
采用美國SVC HR-1024I型野外光譜輻射儀,分別在2017、2018、2019年冬小麥生長發(fā)育的四個關(guān)鍵時期(拔節(jié)期、抽穗期、開花期和灌漿期)進行冠層高光譜測定。調(diào)整光譜儀視場角25°,鏡頭垂直向下距冬小麥冠層1 m處,重復(fù)測定冠層光譜10次。每個樣區(qū)選取兩個樣點,取平均值作為該樣區(qū)的光譜反射率。每次冠層光譜測定前進行標準白板校正,以確保良好的光譜測定質(zhì)量。為減弱或消除光譜的背景噪聲,提高敏感波段的靈敏度,本研究對350~1 350 nm范圍內(nèi)高光譜反射率數(shù)據(jù)分別進行平滑光譜變換(SM)、一階導(dǎo)數(shù)光譜變換(FD)、吸光度變換(ABS)和連續(xù)統(tǒng)去除光譜變換(CR)4種預(yù)處理[19]。
采集冠層高光譜數(shù)據(jù)后,各小區(qū)以測定點為中心,采集0.5 m×0.5 m范圍內(nèi)的植株地上部。從樣品中隨機選取20株稱鮮重,放置105 ℃烘箱殺青30 min,然后于80 ℃下烘干48 h以上,根據(jù)范圍比例計算記錄各小區(qū)地上部干物質(zhì)重。烘干的樣品粉碎后稱取0.2 g,使用凱氏定氮法測定冬小麥植株氮濃度(%)。NNI定義為作物地上部植株氮濃度與臨界氮濃度的比值[20]。NNI=Nc/Nct;Nct =4.28W-0.49。式中Nc為作物植株氮濃度(%),Nct為臨界氮濃度(%)。臨界氮濃度為作物達到最大干物質(zhì)所需要的最低氮濃度,本研究采用李正鵬基于小偃22建立的關(guān)中平原冬小麥臨界氮濃度模型[21]:W為作物地上部生物量(t·hm-2)。
為充分利用光譜信息構(gòu)建光譜參數(shù),提高作物高光譜監(jiān)測精度,本研究構(gòu)建三類光譜參數(shù)進行估算分析:(1)“三邊”參數(shù),是在原始光譜和一階導(dǎo)數(shù)光譜的基礎(chǔ)上構(gòu)建的光譜參數(shù),主要包括藍邊內(nèi)最大一階導(dǎo)數(shù)值(Db)、紅邊內(nèi)最大一階導(dǎo)數(shù)值(Dr)、黃邊內(nèi)最大一階導(dǎo)數(shù)值(Dy)、綠峰反射率最大值(Rg)、紅谷反射率最小值(Rr)、藍邊面積(Sb)、黃邊面積(Sy)、紅邊面積(Sr)、紅邊面積和藍邊面積的比(Sr/Sb)、紅邊面積和黃邊面積的比(Sr/Sy)、紅邊面積和藍邊面積歸一化值((Sr-Sb)/(Sr+Sb))及紅邊面積和黃邊面積歸一化值((Sr-Sy)/(Sr+Sy))等12類特征參數(shù);(2)任意兩波段光譜指數(shù),是在各變換光譜350~1 350 nm波段范圍內(nèi)計算任意兩個光譜反射率之間的差值(DSI)、比值(RSI)和歸一化指數(shù)(NDSI);(3)篩選與NNI相關(guān)性較好的植被指數(shù),主要包括紅邊指數(shù)1(VOG1)、MERIS 陸地葉綠素指數(shù)(MTCI)、改進紅邊比值植被指數(shù)(mSR705)、改進紅邊歸一化植被指數(shù)(ND705)、最佳植被指數(shù)(VIopt)、修正型三角植被指數(shù)(MTVI2)和土壤調(diào)節(jié)植被指數(shù)(SAVI)等7類[22]。
對構(gòu)建的三類光譜參數(shù)與NNI進行皮爾遜相關(guān)性分析,利用逐步回歸對與NNI呈極顯著相關(guān)的光譜參數(shù)進行敏感性和不存在共線性篩選,篩選出的敏感光譜參數(shù)參與NNI建模。本研究的建模方法包括偏最小二乘回歸(PLSR)、隨機森林(RFR)、支持向量機回歸(SVR)和梯度增強回歸(GBDT)。
PLSR是多元線性回歸分析、典型相關(guān)分析和主成分分析集成的建模方法,通過主成分分析對樣本數(shù)據(jù)進行篩選,確定對因變量解釋性最強的變量參與建模,克服變量的多重相關(guān)性問題[23-24]。RFR是通過自助重采樣,從原始的訓(xùn)練樣本中有放回地隨機采樣構(gòu)建決策樹進行分類預(yù)測的一種算法,具有很好的抗過擬合能力和抗噪聲能力[25-26]。SVR通過使樣本實測值與預(yù)測值之間的損失函數(shù)最小化和靠超平面最遠的樣本點之間的間隔最大來確定模型[27-28]。GBDT通過樣本建立決策樹,得到預(yù)測值和殘差,后面的決策樹基于前面決策樹進行殘差學(xué)習(xí),直到樣本預(yù)測值和實測值的殘差為零[29-30]。本研究在SPSS20.0軟件中進行偏最小二乘回歸,在R軟件中實現(xiàn)隨機森林算法,在Python軟件中進行SVR和GBDT。
本研究將三年拔節(jié)期、抽穗期、開花期和灌漿期的數(shù)據(jù)混合,共采集樣本數(shù)據(jù)432個,按照3∶1的比例隨機劃分為建模集和驗證集。模型精度采用決定系數(shù)(r2)、均方根誤差(RMSE)和相對預(yù)測偏差(RPD)檢驗。r2反映模型擬合能力,RMSE和RPD可以衡量預(yù)測值與實測值之間的離散程度和偏差,r2越接近1,RMSE越小,模型預(yù)測效果越好,RPD大于2時,模型具有極好的預(yù)測能力[31]。
2.1.1 任意兩波段光譜參數(shù)篩選
利用Matlab軟件分析350~1 350 nm波段范圍內(nèi)四種預(yù)處理光譜中任意兩波段組合的歸一化光譜指數(shù)(NDSI)、差值光譜指數(shù)(DSI)和比值光譜指數(shù)(RSI)與NNI的相關(guān)性,分別選擇與NNI相關(guān)性最大的波段組合參與顯著性檢驗,入選波段見表1。拔節(jié)期入選波段集中在可見光區(qū)域,隨著生育時期的變化,入選波段向長波方向偏移,在可見光和近紅外區(qū)域均有分布。
表1 各生育期任意兩波段光譜參數(shù)入選波段Table 1 Optimal bands selection in any two-band spectral index for each growth stage
2.1.2 三類光譜參數(shù)與氮營養(yǎng)指數(shù)的相關(guān)性
相關(guān)性分析(圖1)表明,各生育時期“三邊”參數(shù)中,拔節(jié)期“三邊”參數(shù)與NNI相關(guān)性最好(圖1a),紅邊內(nèi)最大一階導(dǎo)數(shù)值、紅邊面積、紅谷反射率最小值、紅邊面積和藍邊面積的比、紅邊面積和黃邊面積的比、紅邊面積和藍邊面積歸一化值、紅邊面積和黃邊面積歸一化值與NNI的相關(guān)系數(shù)分別為0.33、0.27、0.25、0.41、0.32、0.42和0.32,均達到極顯著水平(P<0.01)??傮w來看,紅邊位置計算的光譜參數(shù)與NNI的相關(guān)性較好,拔節(jié)期、開花期和灌漿期的紅邊內(nèi)最大一階導(dǎo)數(shù)值、紅邊面積與NNI均相關(guān)極顯著。
圖1 光譜參數(shù)與氮營養(yǎng)指數(shù)的相關(guān)性Fig.1 Correlation between spectral parameters and nitrogen nutrition index (NNI).
在拔節(jié)期,典型植被指數(shù)與NNI均極顯著相關(guān)(圖1b)。在開花期,VIopt、MTVI2、SAVI與NNI的相關(guān)系數(shù)分別是0.30、0.29和0.29,均極顯著相關(guān)。灌漿期的VOG1與NNI也通過了0.01水平的顯著性檢驗。抽穗期各參數(shù)與NNI的相關(guān)性均未通過0.01水平的顯著性檢驗。
各生育時期的任意兩波段光譜指數(shù)與NNI的相關(guān)性均通過0.01水平的顯著性檢驗(圖1c)。其中,拔節(jié)期的任意兩波段光譜參數(shù)與NNI的相關(guān)性最佳,相關(guān)系數(shù)均大于其他時期,其中基于一階導(dǎo)數(shù)光譜的NDSI和RSI與NNI的相關(guān)系數(shù)最大,均為0.66。
2.1.3 基于逐步回歸篩選敏感光譜參數(shù)
從各個生育時期與NNI呈極顯著相關(guān)的光譜參數(shù)中,利用逐步回歸法剔除多重共線性的光譜參數(shù),篩選出對模型敏感的解釋變量(表2)。其中,拔節(jié)期敏感光譜為任意兩波段光譜參數(shù)和“三邊”參數(shù),抽穗期、開花期和灌漿期的敏感光譜參數(shù)均為任意兩波段光譜參數(shù),植被指數(shù)三個時期均未入選。
表2 各生育期敏感光譜參數(shù)Table 2 Sensitive spectral parameters ateach growth stage
基于各生育時期的敏感光譜參數(shù),分別采用偏最小二乘回歸(PLSR)、隨機森林算法(RFR)、支持向量機回歸(SVR)和梯度增強回歸(GBDT)構(gòu)建冬小麥NNI預(yù)測模型。從圖2來看,拔節(jié)期、抽穗期、開花期和灌漿期基于GBDT構(gòu)建模型的預(yù)測精度均高于其他三個模型,決定系數(shù)(r2)分別為0.96、0.92、0.90、0.95,均方根誤差(RMSE)分別為0.05、0.05、0.05、0.03,同時基于GBDT驗證模型的決定系數(shù)(r2)也高于其他三個模型,模型精度相對較高。
圖2 基于PLS、RFR、SVR和GBDT的冬小麥NNI的建模精度
比較四個生育時期,建模集中,拔節(jié)期四個模型的決定系數(shù)(r2)高于其他生育時期,其中GBDT模型的建模精度最佳,r2和均方根誤差(RMSE)分別為0.96和0.05;其次是RFR模型,r2和RMSE分別為0.89和0.05,其他模型的建模精度相對較低。
所有模型中,拔節(jié)期GBDT模型的驗證精度也最佳,r2和RMSE分別為0.95和0.12;其實測值與預(yù)測值斜率為0.87,散點空間分布接近1∶1線(圖3)。從相對預(yù)測偏差(RPD,實測值和預(yù)測值之間標準差和均方根誤差之比)(圖4)看,拔節(jié)期GBDT模型的RPD最高,為2.12;其次為SVM模型,其RPD為1.92。其余模型的RPD均小于1.5??傮w來看,各個生育時期GBDT模型精度相對較高,拔節(jié)期建立的NNI模型精度優(yōu)于其他時期,且拔節(jié)期基于GBDT的NNI模型具有較好的預(yù)測能力。
圖3 拔節(jié)期基于GBDT的NNI預(yù)測值與實測值相關(guān)性
圖4 冬小麥NNI估算模型相對預(yù)測偏差對比
快速精準實現(xiàn)作物氮素管理對于提高氮肥利用率、減少土壤和地下水污染至關(guān)重要[32-33]。NNI綜合植株氮濃度和生物量在診斷氮素營養(yǎng)狀況的不同作用,為快速實現(xiàn)作物氮素營養(yǎng)診斷和管理提供支持。本研究中,任意兩波段篩選出的比值光譜指數(shù)位置為749和763 nm,與王仁紅等得到的冬小麥NNI引用比值指數(shù)位置相似[7],也表明了紅邊參數(shù)與農(nóng)學(xué)組分之間的密切關(guān)系[34]。對原始冠層光譜進行一階導(dǎo)數(shù)、吸光度和連續(xù)統(tǒng)去除變換,能夠在一定程度降低噪聲干擾,增強光譜特征[35]。本研究基于變換光譜的任意兩波段光譜參數(shù)與NNI的相關(guān)性優(yōu)于“三邊”參數(shù)和植被指數(shù),其中由拔節(jié)期一階導(dǎo)數(shù)光譜組成的歸一化、比值光譜指數(shù)與NNI相關(guān)性最高。
本研究采用偏最小二乘回歸、隨機森林算法、支持向量機回歸和梯度增強回歸分別建立冬小麥的NNI模型,其中梯度增強回歸模型和隨機森林模型均未出現(xiàn)過度擬合現(xiàn)象。梯度增強回歸顯著提升了NNI的估算精度,這是因為梯度增強回歸通過多個決策樹構(gòu)建更強大的模型,不斷迭代,決策樹深度小[29],預(yù)測速度快,參數(shù)設(shè)置比隨機森林算法和支持向量機回歸更敏感,模型精度更高。拔節(jié)期基于梯度增強回歸構(gòu)建的NNI預(yù)測模型決定系數(shù)達到0.95,精度優(yōu)于王仁紅等[7]基于線性內(nèi)插法共邊位置對冬小麥NNI的估測(決定系數(shù)為0.86,均方根誤差為0.08)。不同于劉昌華等[13]的研究,本研究中拔節(jié)期基于梯度增強回歸的NNI模型取得了最佳驗證精度。如果在拔節(jié)期能夠準確估測冬小麥NNI,這對于科學(xué)精準施肥,對于提高冬小麥產(chǎn)量和改善冬小麥品質(zhì)有著重要的意義[36]。本研究為拔節(jié)期冬小麥氮素的評估提供了理論和方法,這一結(jié)果還有待更多的數(shù)據(jù)集進行驗證。另外,計算NNI時,臨界氮濃度采用了同為研究關(guān)中平原地區(qū)冬小麥氮素的李正鵬等[21]的臨界氮濃度稀釋曲線模型,該模型是基于小麥品種小偃22所建,因此未來需要針對不同品種建立更為廣適的臨界氮濃度模型,以進一步增強NNI高光譜監(jiān)測的普適性。
本研究通過相關(guān)性分析法和逐步回歸法,分別篩選出各生育時期與冬小麥NNI敏感的解釋變量,利用偏最小二乘回歸、隨機森林算法、支持向量機回歸和梯度增強回歸分別建立冬小麥NNI模型。從拔節(jié)期到灌漿期,任意兩波段光譜參數(shù)與NNI均極顯著相關(guān),相關(guān)性明顯優(yōu)于“三邊”參數(shù)和植被指數(shù),其中拔節(jié)期任意兩波段光譜參數(shù)與NNI的相關(guān)性高于其他生育時期,且基于一階導(dǎo)數(shù)光譜的歸一化光譜指數(shù)和比值光譜指數(shù)與NNI的相關(guān)系數(shù)最大。在各生育時期中,基于梯度增強回歸的NNI模型精度高于其他模型,其中拔節(jié)期該模型的精度最高,r2、RMSE和RPD分別為0.95、0.12和2.12,說明其具有較好的預(yù)測能力。