韓玉杰 丁寧 馮海寬 張春蘭
摘要 ? ?精確、快速估算冬小麥葉片氮含量,對冬小麥長勢監(jiān)測及田間管理指導(dǎo)具有重要的研究意義。為精確反演冬小麥葉片氮含量(leaf nitrogen content ,LNC),本文利用遙感方法,依托不同氮處理水平對冬小麥的影響試驗(yàn),基于獲取的高光譜遙感數(shù)據(jù)和LNC地面實(shí)測數(shù)據(jù),對比分析光譜指數(shù)與隨機(jī)森林算法(random forest ,RF)反演冬小麥葉片氮含量的精度和穩(wěn)健性。結(jié)果表明,以敏感波段496 nm和604 nm為自變量,利用隨機(jī)森林算法構(gòu)建的LNC回歸模型精度較光譜指數(shù)法有了大幅提高,模型的建模精度為R2=0.922,均方根誤差為0.290;驗(yàn)證精度為R2=0.873,均方根誤差為0.397,并且相對分析誤差值為2.220,表明將敏感波段與隨機(jī)森林算法組合構(gòu)建的反演模型能較好地反演冬小麥葉片氮含量。
關(guān)鍵詞 ? ?冬小麥;葉片氮含量;遙感;隨機(jī)森林算法
中圖分類號 ? ?S127;S512.1 ? ? ? ?文獻(xiàn)標(biāo)識碼 ? ?A
文章編號 ? 1007-5739(2019)13-0001-03 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 開放科學(xué)(資源服務(wù))標(biāo)識碼(OSID)
Remote ?Sensing ?Estimation ?of ?Nitrogen ?Content ?in ?Winter ?Wheat ?Leaves ?Based ?on ?Random ?Forest ?Algorithm
HAN Yu-jie 1 ? ?DING Ning 1 ? ?FENG Hai-kuan 2 ? ?ZHANG Chun-lan 2
(1 College of Surveying and Geo-Informatics,Shandong Jianzhu University,Jinan Shandong 250101;
2 National Engineering Research Center for Information Technology in Agriculture)
Abstract ? ?Precisely and rapidly monitoring of nitrogen content in winter wheat leaves was of great significance for monitoring the growth of winter wheat and guiding field management.By remote sensing,the accuracy and robustness of estimating nitrogen content in winter wheat leaves by spectral index and random forest algorithm were compared and analyzed based on hyperspectral data and LNC field data.The results showed that the precision of the LNC regression model constructed by the RF was much higher than that of the spectral index with sensitive bands 496 nm and 604 nm as independent variables.The accuracy of the model was R2=0.922,RMSE=0.290,the validation accuracy was R2=0.873,RMSE=0.397,and the RPD value was 2.220.It showed that the model constructed by the RF has good precision of wheat LNC.
Key words ? ?winter wheat;leaf nitrogen content(LNC);remote sensing;random forest algorithm
作物的光合作用、生長發(fā)育等離不開礦物質(zhì)元素的攝入,作為礦物質(zhì)元素之一的氮元素是作物生長需求量與施用量較多的礦物質(zhì)元素[1]。
當(dāng)?shù)獱I養(yǎng)元素施用不足時(shí),會嚴(yán)重影響作物的產(chǎn)量及品質(zhì);相反,當(dāng)作物施氮過多時(shí),又會對環(huán)境造成一定的污染。因此,精確估算冬小麥葉片氮素含量,對冬小麥長勢監(jiān)測、提高氮肥利用效率以及深入開展精準(zhǔn)農(nóng)業(yè)研究具有重要的意義[2]。
冬小麥作為我國重要的糧食作物之一,其氮素營養(yǎng)診斷對于小麥長勢監(jiān)測及田間技術(shù)指導(dǎo)具有重要的研究意義[3]。近年來,新興起的高光譜遙感技術(shù)具有諸多優(yōu)勢,如信息量大、光譜分辨率高、波段連續(xù)性強(qiáng)等,已受到作物氮素營養(yǎng)診斷科研人員的青睞[4]。
目前,科研人員對作物氮素診斷開展了大量的研究。如楊寶華等[5]通過篩選敏感波段構(gòu)建冬小麥氮含量反演模型,能夠較好地估算冠層氮含量;王仁紅等[4]利用高光譜數(shù)據(jù)建立氮營養(yǎng)指數(shù)(NNI)的經(jīng)驗(yàn)?zāi)P?,定性診斷氮營養(yǎng)情況,說明利用光譜反射率估算作物冠層氮含量是具有可行性的;還有一些科研人員利用機(jī)器學(xué)習(xí)算法(如人工神經(jīng)網(wǎng)絡(luò)法、隨機(jī)森林算法)估算作物的冠層氮含量[6-7]。
目前,前人在監(jiān)測作物氮含量方面開展了大量的工作,并取得了豐碩的成果,但是不同的反演方法各有特點(diǎn),如估算作物氮含量的線性回歸模型比較容易構(gòu)建,而且還具有可視化的優(yōu)點(diǎn),但也存在對大數(shù)據(jù)集處理需要降維、參數(shù)過多容易出現(xiàn)過飽和現(xiàn)象等問題;而隨機(jī)森林算法作為一種新型學(xué)習(xí)方法,具有抗噪聲能力強(qiáng)、不易出現(xiàn)過飽和等優(yōu)點(diǎn),在數(shù)據(jù)分析與挖掘方面具有重要的應(yīng)用價(jià)值,同時(shí)也可以很好地解決線性回歸模型的缺陷問題。因此,本文運(yùn)用統(tǒng)計(jì)分析方法,將敏感波段與隨機(jī)森林算法組合估算冬小麥葉片氮含量(LNC),進(jìn)而構(gòu)建估算冬小麥葉片氮含量(LNC)的最優(yōu)模型。
1 ? ?材料與方法
1.1 ? ?試驗(yàn)地概況
冬小麥試驗(yàn)在北京市小湯山國家精準(zhǔn)農(nóng)業(yè)示范基地(東經(jīng)116.44°,北緯40.18°)開展。試驗(yàn)區(qū)平均海拔約為36 m,年平均氣溫約14.0 ℃。
1.2 ? ?試驗(yàn)設(shè)計(jì)
試驗(yàn)共設(shè)置3個(gè)因素處理,即小麥品種為2個(gè),分別是京9843、中麥175;氮素水平設(shè)置4個(gè)處理,分別為施純N 0、91.065、182.130、273.195 kg/hm2;水分供給設(shè)置3個(gè)水平,即雨養(yǎng)、正常水、2倍正常水。其他田間管理措施與當(dāng)?shù)卣9芾砬闆r一致。
1.3 ? ?數(shù)據(jù)采集
試驗(yàn)數(shù)據(jù)于冬小麥4個(gè)關(guān)鍵生育期(拔節(jié)期、挑旗期、開花期及灌漿期)分別同步獲取冬小麥冠層高光譜反射率數(shù)據(jù)和LNC數(shù)據(jù),其試驗(yàn)數(shù)據(jù)的70%樣本用于構(gòu)建冬小麥LNC反演模型,剩余30%用于模型的驗(yàn)證。其中,冬小麥地面冠層高光譜數(shù)據(jù)利用美國ASD Field SpecFR Pro 2500光譜儀獲取,其光譜范圍為350~2 500 nm,采樣間隔為1 nm。冬小麥葉片氮含量采用凱氏定氮法測定。
1.4 ? ?數(shù)據(jù)分析方法
1.4.1 ? ?組合光譜指數(shù)法。由于冠層反射率數(shù)據(jù)受外界監(jiān)測環(huán)境的影響,有必要篩選敏感波段,然后組合得到一種光譜參數(shù)即為光譜指數(shù)[8]。由代數(shù)形式組合得到的光譜指數(shù)能夠消除一些噪聲的影響[9-10],從而可提高光譜指數(shù)對作物生化指標(biāo)的監(jiān)測精度。本文組合得到的光譜指數(shù)為歸一化光譜指數(shù)(Normalized difference spectral index,NDSI)、比值光譜指數(shù)(Ratio spectral index,RSI),其公式組合形式如下[11]:
NDSI(x,y)=(1)
RSI(x,y)=(2)
式(1)和式(2)中,x和y分別為一定波段范圍內(nèi)任意2個(gè)波段所對應(yīng)的光譜反射率。
1.4.2 ? ?隨機(jī)森林算法。隨機(jī)森林算法(random forest,RF)是由Breiman L[12]提出,該算法是基于集成學(xué)習(xí)的思想將多棵樹集成的一種算法,其基本單元是決策樹,本質(zhì)屬于機(jī)器學(xué)習(xí)的一大分支。隨機(jī)森林算法是一種靈活性強(qiáng)、實(shí)用性高的學(xué)習(xí)算法,能有效地運(yùn)用在大數(shù)據(jù)集上,而且不需要降維,能夠獲得精確的結(jié)果。因此,在數(shù)據(jù)分析與挖掘方面具有極其重要的應(yīng)用價(jià)值。
1.5 ? ?模型評價(jià)指標(biāo)
1.5.1 ? ?決定系數(shù)。決定系數(shù)(R2)是用來衡量擬合效果的指標(biāo),R2在0~1之間,值越大表明模型擬合精度越高,其計(jì)算公式為:
1.5.2 ? ?均方根誤差。均方根誤差(RMSE)是衡量模擬值偏離實(shí)測值程度大小的指標(biāo),其值越小,表示模擬值與實(shí)測值吻合性越好,反映構(gòu)建的反演模型精度較高。其計(jì)算公式為:
RMSE=(4)
式(4)中,變量解釋同公式(3)。
1.5.3 ? ?相對分析誤差。相對分析誤差(RDP)是衡量模型質(zhì)量的指標(biāo),當(dāng)RPD<1.4時(shí),表明構(gòu)建的反演模型效果差,無法對樣本數(shù)據(jù)進(jìn)行預(yù)測;當(dāng)1.4≤RPD<2.0時(shí),表明構(gòu)建的反演模型效果一般,可以對樣本數(shù)據(jù)進(jìn)行粗略評估;當(dāng)RPD≥2.0時(shí),表明構(gòu)建的反演模型預(yù)測能力較好。其計(jì)算公式為:
其中,標(biāo)準(zhǔn)差SD=,式中變量解釋同公式(3)。
2 ? ?結(jié)果與分析
2.1 ? ?篩選敏感波段
由于作物的光譜反射率在350~400 nm及1 000 nm以后受水汽影響及環(huán)境噪聲影響較大,本文選取數(shù)據(jù)質(zhì)量較好的400~1 000 nm的光譜反射率數(shù)據(jù)進(jìn)行以下分析。篩選敏感波段的程序在Matlab內(nèi)運(yùn)行,通過在400~1 000 nm波段范圍篩選敏感波段,組合得到的NDSI和RSI對LNC的敏感性如圖1所示。結(jié)果表明,496 nm與604 nm為敏感波段,其組合得到的光譜指數(shù)RSI(R604,R496)和NDSI(R604,R496))與葉片氮含量(LNC)的決定系數(shù)R2分別為-0.871、-0.865,表明由敏感波段組合的光譜指數(shù)與LNC高度負(fù)相關(guān),這是由于歸一化和比值的數(shù)學(xué)計(jì)算形式能夠降低或消除一些噪聲的影響[13]。
2.2 ? ?利用光譜指數(shù)法構(gòu)建冬小麥LNC模型
由篩選的敏感波段(496、604 nm)組合得到的NDSI(R604,R496)、RSI(R604,R496)為自變量,分別構(gòu)建冬小麥LNC的反演模型。由圖2可知,以RSI(R604,R496)為自變量構(gòu)建的冬小麥LNC反演模型的決定系數(shù)R2為0.759,高于以RSI(R604,R496)為自變量構(gòu)建的冬小麥LNC反演模型的決定系數(shù)R2。說明以比值形式組合的光譜指數(shù)RSI(R604,R496)為自變量構(gòu)建的冬小麥LNC反演模型的估算效果較好。
為了進(jìn)一步檢驗(yàn)利用光譜指數(shù)法構(gòu)建的冬小麥LNC估算模型的精度與穩(wěn)定性,采用相同生育期采集的獨(dú)立樣本集對其精度進(jìn)行驗(yàn)證。由圖3可知,利用光譜指數(shù)RSI(R604,R496)構(gòu)建的冬小麥LNC估算模型的驗(yàn)證精度R2為0.793,并且其估算模型的RPD值為1.86,表明以光譜指數(shù)RSI(R604,R496)為自變量構(gòu)建的冬小麥LNC估算模型的預(yù)測精度高于以光譜指數(shù)NDSI(R604,R496)為自變量構(gòu)建的冬小麥LNC估算模型的預(yù)測精度。
2.3 ? ?基于隨機(jī)森林法構(gòu)建冬小麥LNC模型
為了構(gòu)建較優(yōu)的冬小麥LNC估算模型,本文基于與光譜指數(shù)法相同的建模樣本集,利用隨機(jī)森林算法(RF)構(gòu)建冬小麥LNC的RF回歸模型,并采用與光譜指數(shù)法相同的驗(yàn)證樣本集對模型精度進(jìn)行驗(yàn)證。為了便于這2種方法間的對比與分析,利用隨機(jī)森林法構(gòu)建冬小麥LNC估算模型的輸入因子為2.1篩選的敏感波段496 nm和604 nm處的光譜反射率,因變量為冬小麥LNC,在MATLAB軟件中運(yùn)行隨機(jī)森林算法(RF)回歸試驗(yàn)代碼。利用隨機(jī)森林算法(RF)構(gòu)建的冬小麥LNC估算模型如圖4(a)所示,其決定系數(shù)R2為0.922,均方根誤差為0.290,利用隨機(jī)森林算法構(gòu)建的冬小麥LNC估算模型的預(yù)測精度較高。采用獨(dú)立的驗(yàn)證樣本集對利用隨機(jī)森林算法構(gòu)建的冬小麥LNC估算模型的精度及穩(wěn)定性進(jìn)行驗(yàn)證。由圖4(b)可知,該模型的擬合精度較高,可以對冬小麥LNC進(jìn)行精確算。
與2.2利用光譜指數(shù)法構(gòu)建的冬小麥LNC估算模型相比,利用隨機(jī)森林法構(gòu)建的冬小麥LNC反演模型的估算精度(R2=0.922)和預(yù)測精度(R2=0.873)均較高。利用光譜指數(shù)RSI(R604,R496)構(gòu)建的LNC估算模型的RPD值為1.86,而利用RF構(gòu)建的冬小麥LNC估算模型的RPD值為2.220,表明利用RF構(gòu)建的冬小麥LNC估算模型反演效果較好,能用于冬小麥LNC的精確估算。
3 ? ?結(jié)論與討論
目前,已有較多研究者利用遙感技術(shù)開展冬小麥葉片氮含量估算研究工作,但由于線性回歸模型存在受外界生長環(huán)境影響較大的問題,尋找高效的冬小麥葉片氮含量反演方法仍需進(jìn)一步探討。由于監(jiān)測環(huán)境中影響因素較多,本文首先進(jìn)行了敏感波段的篩選,通過篩選發(fā)現(xiàn)496 nm與604 nm波段為敏感波段,而且由敏感波段組合的光譜指數(shù)對LNC的敏感性較好,R2分別為-0.871、-0.865;然后分別利用線性回歸和隨機(jī)森林法構(gòu)建冬小麥LNC估算模型,結(jié)果表明,隨機(jī)森林法構(gòu)建的LNC估算模型的建模精度(R2=0.922,RMSE=0.290)和驗(yàn)證精度(R2=0.873,RMSE=0.397)均較高,這是因?yàn)榫€性回歸模型存在對大數(shù)據(jù)集需要降維、擬合過程中參數(shù)過多容易出現(xiàn)過飽和等缺陷;新興起的隨機(jī)森林算法具有抗噪能力強(qiáng)、適應(yīng)能力好、對大數(shù)據(jù)集處理精度高且不需要降維等多種優(yōu)勢[14-15],可以很好地解決線性回歸模型的缺陷。因此,通過篩選敏感波段,利用隨機(jī)森林算法構(gòu)建冬小麥LNC估算模型可以作為氮素田間快速診斷的有效方法。
4 ? ?參考文獻(xiàn)
[1] 田永超,朱艷,姚霞,等.基于光譜信息的作物氮素營養(yǎng)無損監(jiān)測技術(shù)[J].生態(tài)學(xué)雜志,2007(9):1454-1463.
[2] 李永梅,張學(xué)儉,張立根.水稻氮素高光譜遙感估測模型研究[J].江蘇農(nóng)業(yè)科學(xué),2016,44(8):435-439.
[3] 尚艷,常慶瑞,劉秀英,等.關(guān)中地區(qū)小麥冠層光譜與氮素的定量關(guān)系[J].西北農(nóng)林科技大學(xué)學(xué)報(bào)(自然科學(xué)版),2016,44(5):38-44.
[4] 王仁紅,宋曉宇,李振海,等.基于高光譜的冬小麥氮素營養(yǎng)指數(shù)估測[J].農(nóng)業(yè)工程學(xué)報(bào),2014,30(19):191-198.
[5] 楊寶華,陳建林,陳林海,等.基于敏感波段的小麥冠層氮含量估測模型[J].農(nóng)業(yè)工程學(xué)報(bào),2015,31(22):176-182.
[6] ZHANG C H,KOVACS J M,WACHOWIAK M P,et al.Relationship between hyperspectral measurements and mangrove leaf nitrogen conce-ntrations[J].Remote Sensing,2013,5(2):891-908.
[7] YI Q X,HUANG J F,WANG F M,et al.Monitoring rice nitrogen status using hyperspectral reflectance and artificial neural network[J].Environ-mental Science & Technology,2007,41(19):6770-6775.
[8] 童慶禧,張兵,鄭蘭芬.高光譜遙感[M].北京:高等教育出版社,2006:121.
[9] HUNT E R,DORAISWAMY P C,MCMURTREY J E,et al.A visible band index for remote sensing leaf chlorophyll content at the canopy scale[J].International Journal of Applied Earth Observation and Geoinf-ormation,2013:103-112.
[10] 姜海玲,楊杭,陳小平,等.利用光譜指數(shù)反演植被葉綠素含量的精度及穩(wěn)定性研究[J].光譜學(xué)與光譜分析,2015,35(4):975-981.
[11] INOUE Y,GU?魪RIF M,BARET F,et al.Simple and robust methods for remote sensing of canopy chlorophyll content:A comparative analysis of hyperspectral data for different types of vegetation[J].Plant,Cell and En-vironment,2016,39:2609-2623.
[12] BREIMAN L.Random forests[J].Machine Learning,2001,45(1):5-32.
[13] RICHARDSON A J,WEIGAND C L.Distinguishing vegetation from soil background information[J].Photogrammetric Engineering and Remote Sensing,1977,43(12):1541-1552.
[14] 張春蘭.基于綜合長勢參數(shù)指標(biāo)的冬小麥長勢遙感監(jiān)測[D].西安:西安科技大學(xué),2018.
[15] 韓兆迎,朱西存,房賢一,等.基于SVM與RF的蘋果樹冠LAI高光譜估測[J].光譜學(xué)與光譜分析,2016,36(3):800-805.