崔小濤,常慶瑞,屈春燕,史博太,蔣丹垚,夏利恒,王玉娜
(西北農(nóng)林科技大學資源環(huán)境學院,陜西 楊凌 712100)
葉綠素與植物光合作用能力和生長狀況緊密相關(guān),是植物氮含量重要指示器[1-2]。傳統(tǒng)測量葉綠素含量方法主要有分光光度法、原子吸收法等,這些方法耗時、耗力、過程繁瑣。目前,高光譜遙感具有實時、快速、無損監(jiān)測葉綠素含量優(yōu)勢,為作物葉綠素含量定量化診斷提供有效手段[3-4]。將高光譜遙感技術(shù)應(yīng)用于葉綠素含量測定研究中,作物方面對小麥、玉米研究較多,Daughtry等研究光譜指數(shù)、光譜波段與玉米葉綠素關(guān)系,構(gòu)建不同模型預測玉米葉綠素含量[5-6];李粉玲等利用光譜指數(shù)與SPAD值建立模型,探究預測小麥葉綠素最佳模型[7-8]。在預測模型方面由簡單傳統(tǒng)線性模型拓展到復雜機器學習算法模型,劉露等通過構(gòu)建夏玉米光譜反射率與植株冠層SPAD值傳統(tǒng)線性模型,尋找最優(yōu)光譜指數(shù)[9];劉京等通過蘋果葉片歸一化光譜參數(shù)與SPAD值構(gòu)建多項式回歸及支持向量回歸模型,發(fā)現(xiàn)支持向量回歸模型優(yōu)于多項式回歸模型[10];于汧卉等基于地面高光譜和實測農(nóng)學數(shù)據(jù),發(fā)現(xiàn)將PROSAIL模型、連續(xù)小波變換和偏最小二乘回歸結(jié)合可實現(xiàn)冬小麥葉綠素遙感估算[11]。由于BP神經(jīng)網(wǎng)絡(luò)算法模型具有實現(xiàn)任何復雜非線性映射功能,具有自學習推廣、概括能力[12],在葉綠素預測方面應(yīng)用較多。劉文雅等采用BP神經(jīng)網(wǎng)絡(luò)定量模擬馬尾松葉綠素含量[13];李媛媛等基于光譜反射率和玉米葉片SPAD值,構(gòu)建傳統(tǒng)回歸模型、主成分回歸模型、偏最小二乘回歸模型與BP神經(jīng)網(wǎng)絡(luò)模型,表明BP神經(jīng)網(wǎng)絡(luò)對葉綠素具有較好預測能力[14]。
遺傳算法具有并行性,可使BP神經(jīng)網(wǎng)絡(luò)更易收斂到全局最小,提高BP神經(jīng)網(wǎng)絡(luò)模型反演精度[15]。但運用多種光譜參數(shù),使用基于多元線性逐步回歸遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)模型預測SPAD值研究較少。本文以西北地區(qū)油菜作物為研究對象,基于光譜反射率構(gòu)建光譜參數(shù)和油菜葉片SPAD值,構(gòu)建單因素模型、多元線性逐步回歸模型、偏最小二乘回歸模型、基于多元線性逐步回歸遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)模型,旨在探究預測油菜葉片SPAD值最優(yōu)模型,為西北地區(qū)油菜長勢遙感監(jiān)測提供理論和技術(shù)支持。
本試驗研究區(qū)位于陜西省寶雞市扶風縣杏林鎮(zhèn)西坡村,東經(jīng)107°58'48'',北緯 34°19'12'',位置見圖1,地處關(guān)中平原西部,陜西省中西部,屬于溫帶大陸性季風氣候,年平均氣溫12.4℃,無霜期約209 d,年平均降雨量592 mm,降雨分布不均,主要集中在夏、秋兩季,作物一年一熟,主要為小麥、玉米、油菜等。本試驗劃分10個小區(qū),小區(qū)面積為64 m2。2018年9月14日播種,采用一次性施足底肥,即 N:240 kg·hm-2,P2O5:120 kg·hm-2,K2O:180 kg·hm-2,田間管理方式同當?shù)卮筇锷a(chǎn)管理,當年試驗田油菜未發(fā)生病蟲害。
本試驗按照油菜4個關(guān)鍵生育期采樣觀測,分別是苗期(2019年3月29日)、蕾薹期(2019年4月16日)、開花期(2019年4月25日)、成熟期(2019年5月11日),采樣時每小區(qū)設(shè)8個采樣點,每個采樣點采集一株油菜上層、中層、下層各兩片葉片,作為采樣點樣本,立即放入塑封袋,排凈空氣,放入裝有冰袋恒溫箱。采用SPAD值作為葉綠素含量指標[10],測定油菜葉片SPAD值和光譜反射率。
1.2.1 葉片SPAD值測定
使用日本KONICA MINOLTA公司生產(chǎn)SPAD-502型手持式葉綠素儀測定油菜葉片SPAD值,測量前將待測葉片編號,擦拭干凈葉片,每個樣點測量選取上、中、下3層共6片葉子,選取每片葉子在不同部位10次測量平均值作為SPAD值,測量時需避開葉脈位置,求取每個樣點6片葉片SPAD值平均值作為該樣點最終SPAD值。
1.2.2 葉片光譜反射率測定
采用美國SVC HR-1024i型光譜儀測定油菜葉片光譜反射率,研究光譜400~1 000 nm波段,因綠色植物光譜在可見光波段主要受葉綠素影響。利用光譜儀自帶軟件SVC HR-1024i PC將油菜葉片光譜曲線重采樣到1 nm。每個樣點選取測量上、中、下3層共6片葉片(與被測SPAD葉片對應(yīng)),為使測量結(jié)果更具代表性,每葉片測量2條光譜,測量時需避開葉脈位置,求取12條光譜平均值作為該樣點最終光譜反射率。
本研究選取8種基于高光譜位置特征參數(shù)、5種光譜曲線構(gòu)成面積特征參數(shù)、4種新光譜特征參數(shù)和14種植被指數(shù)(見表1)。以上參數(shù)在本研究中統(tǒng)稱為光譜參數(shù),這些光譜指數(shù)認可度較高,物理意義較明確。
構(gòu)建單因素模型時,本研究采用一元線性、多項式、指數(shù)、對數(shù)和冪函數(shù)回歸模型。運用Excel 2016建模。
構(gòu)建多因素模型時,本研究采用偏最小二乘回歸模型(PLSR)、基于多元線性逐步分析遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)模型(MLSR-GA-BP神經(jīng)網(wǎng)絡(luò))。PLSR集中主成分分析、典型相關(guān)分析和線性回歸分析特點,建立最優(yōu)模型;MLSR-GA-BP神經(jīng)網(wǎng)絡(luò)模型首先利用多元線性逐步回歸篩選出對因變量影響大變量,簡化神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),再利用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)權(quán)值和閾值,最終建立最優(yōu)模型。具體遺傳算法參數(shù)和BP神經(jīng)網(wǎng)絡(luò)參數(shù)見表2。運用DPS數(shù)據(jù)處理系統(tǒng)和Matlab 2016建模。
本研究采用決定系數(shù)R2、均方根誤差RMSE和相對誤差RE共3個指標評價模型擬合預測能力,其中決定系數(shù)R2越大(不超過1),均方根誤差RMSE和相對誤差RE越小,模型擬合預測能力越強。
具體公式見式1~3。本試驗每個生育期80個樣本,4個生育期共320個樣本,本試驗將測定SPAD值排序,按照3∶1抽樣采用分層抽樣法,構(gòu)建估算模型和驗證模型,每個生育期估算模型樣本60個,驗證模型樣本20個。
表1 光譜參數(shù)及其定義或計算公式Table 1 Spectral parameters and their definition or calculation formula
表2 遺傳算法參數(shù)和BP神經(jīng)網(wǎng)絡(luò)算法參數(shù)Table 2 Genetic algorithm parameters and BP neural network algorithm parameters
由圖2可知,油菜葉片SPAD平均值呈下降趨勢,蕾薹期、開花期和成熟期較苗期相比分別下降12.71%、17.11%和26.51%,由方差分析結(jié)果可見,苗期分別和蕾薹期、開花期、成熟期差異顯著,成熟期分別和蕾薹期、開花期差異顯著,但蕾薹期和開花期無顯著差異。
由圖3可知,各生育期光譜反射率總體趨勢一致,與大多數(shù)綠色植物高光譜反射率規(guī)律一致,在400~500 nm,由于葉綠素強烈吸收藍光,形成第1個吸收谷;在600~700 nm,由于葉綠素強烈吸收紅光,形成第2個吸收谷,兩個吸收谷在550 nm附近形成較強反射峰,在670~780 nm,由于葉綠素對紅光強烈吸收逐漸變?yōu)閷t外光散射,造成反射率急劇上升;在780~1 000 nm,由于葉片內(nèi)部結(jié)構(gòu)和葉片內(nèi)營養(yǎng)成分濃度等影響,形成持續(xù)高反射率平臺。由圖3可知,不同生育期反射率變化,總體趨勢從苗期到成熟期反射率呈上升趨勢,但在400~520和580~690 nm附近,開花期反射率大于成熟期反射率,總體趨勢與不同生育期油菜葉片SPAD平均值規(guī)律相反,原因為油菜葉片SPAD值越高,葉綠素含量越高,對光吸收越強,反射率越低。
2.2.1 油菜葉片SPAD值與原始光譜反射率相關(guān)性分析
分析油菜葉片SPAD值與原始光譜反射率作相關(guān)性,結(jié)果見圖4。各生育期油菜葉片SPAD值與原始光譜均在綠黃波段和紅光波段呈極顯著相關(guān)性,550和710 nm附近相關(guān)性達最大,均為顯著負相關(guān),710 nm后4個生育期相關(guān)性均迅速下降,而后緩慢上升,但僅成熟期在0.01水平上達到顯著正相關(guān),其他3個生育期均未達到。
2.2.2 油菜葉片SPAD值與光譜參數(shù)相關(guān)性分析
利用SPSS軟件分析油菜葉片SPAD值與光譜參數(shù)相關(guān)性,結(jié)果見表3。苗期、蕾薹期和開花期均有22個光譜參數(shù)在0.01水平上顯著相關(guān)(具體光譜參數(shù)不同),1個光譜參數(shù)在0.05水平上顯著相關(guān),8個光譜參數(shù)不相關(guān)(具體光譜參數(shù)不完全相同),成熟期26個光譜參數(shù)在0.01水平上顯著相關(guān),1個光譜參數(shù)在0.05水平上顯著相關(guān),4個光譜參數(shù)不相關(guān),成熟期比其他3個生育期葉片SPAD值與光譜參數(shù)相關(guān)性更強。苗期相關(guān)性最強光譜參數(shù)是MCARI,相關(guān)性0.808,其中SRg、CARI、MCARI相關(guān)性均達0.800以上;蕾薹期相關(guān)性最強光譜參數(shù)為VOG2和MTCI,相關(guān)性是0.908,其中14個光譜參數(shù)相關(guān)性達到0.800以上;開花期相關(guān)性最強光譜參數(shù)為CARI,相關(guān)性為0.839,其中Db、SRg、CARI、MCARI和MTCI相關(guān)性達到0.800以上;成熟期相關(guān)性最好光譜參數(shù)為SRg,相關(guān)性為0.869,其中有13個光譜參數(shù)相關(guān)性達0.800以上。Db、SDb、 SRg、 CARI、 MCARI、 MCARI/OSAVI、 MTCI共7個光譜參數(shù)在4個生育期相關(guān)性均達0.770以上,可較好參與模型建立。
本研究為使各模型具有可比性,從31種光譜參數(shù)中選取出與油菜葉片SPAD值相關(guān)系數(shù)絕對值大于0.770光譜參數(shù)(7種)建模。
2.3.1 油菜葉片SPAD值單因素模型構(gòu)建與精度比較
模型建模結(jié)果見表4,可見,苗期MCARI建立冪函數(shù)模型建模決定系數(shù)R2最高,驗證決定系數(shù)R2較大,RMSE和RE均較小,MCARI建立冪函數(shù)模型擬合預測能力最優(yōu);同理,蕾薹期MCARI/OSAVI所建立二次多項式模型擬合預測能力最優(yōu);開花期CARI建立指數(shù)模型擬合預測能力最優(yōu);成熟期MCARI建立冪函數(shù)模型相比于同期其他參數(shù)建模最優(yōu)。比較4個生育期最優(yōu)模型,可見蕾薹期建模決定系數(shù)和驗證決定系數(shù)均最高,RMSE和RE均較低,蕾薹期可利用MCARI/OSAVI建立二次多項式模型估算油菜葉片SPAD值。
2.3.2 偏最小二乘回歸模型構(gòu)建與精度比較
模型建模結(jié)果見表5??梢?,蕾薹期建模決定系數(shù)R2和驗證決定系數(shù)R2相比其他生育期均最高,RMSE在3以下,RE在4.5%以下,均較小,故在4個生育期中蕾薹期模型精度最高,擬合預測能力最優(yōu)。
表3 不同生育期油菜葉片SPAD值與光譜參數(shù)相關(guān)性Table 3 Correlation between SPAD value and spectral parameters of rape leaves at different growth stages
表4 不同生育期光譜參數(shù)與SPAD值單因素最優(yōu)估算模型Table 4 Single factor optimal estimation model of spectral parameters and SPAD values at different growth periods
表5 不同生育期偏最小二乘回歸模型Table 5 Partial least squares regression model for different growth periods
2.3.3 基于多元線性逐步分析遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)模型(MLSR-GA-BP神經(jīng)網(wǎng)絡(luò))構(gòu)建與精度比較
模型建模結(jié)果見表6。
由表6可知,蕾薹期建模決定系數(shù)R2最高,建模效果最優(yōu),其次為開花期、成熟期、苗期。但成熟期驗證決定系數(shù)R2最高,且RMSE和RE最低,故成熟期驗證精度最高,其次為蕾薹期、苗期、開花期。綜合驗證精度和預測精度,蕾薹期和成熟期擬合預測效果良好。
表6 不同生育期MLSR-GA-BP神經(jīng)網(wǎng)絡(luò)模型Table 6 MLSR-GA-BP neural network model at different growth stages
為篩選估算油菜葉片SPAD值最優(yōu)模型,對比模型見表7。MLSR-GA-BP建模決定系數(shù)R2在4個生育期均最大,建模效果最優(yōu),PLSR次之,單因素模型最差。在模型精度方面,MLSR-GA-BP驗證決定系數(shù)R2在4個生育期均最大,驗證均方根誤差RMSE在苗期、蕾薹期和成熟期均為最低,開花期略高于單因素模型,驗證相對誤差RE均最小,綜合3個指標可見,MLSR-GA-BP神經(jīng)網(wǎng)絡(luò)模型預測精度最高。
因此將MLSR-GA-BP神經(jīng)網(wǎng)絡(luò)模型驗證樣本實測值和預測值空間分布繪制成散點圖5,圖中實線為實測值回歸方程,虛線為1∶1線,當回歸方程越接近于1∶1線,說明模型效果更優(yōu)。由圖5可見,成熟期模型估算效果最好,曲線斜率為0.97,最接近1。
表7 不同生育期各模型比較Table 7 Comparison of models in different growth periods
在可見光波段,油菜葉片SPAD值與葉片光譜反射率呈負相關(guān),葉綠素含量越高,光譜反射率越低,光吸收越強。在估算葉片SPAD值時,模型選擇至關(guān)重要。
目前已有學者將多種模型應(yīng)用至各種作物SPAD值估算,多因素模型優(yōu)于單因素模型,機器學習算法模型優(yōu)于傳統(tǒng)線性模型,在機器學習算法中BP神經(jīng)網(wǎng)絡(luò)算法模型優(yōu)于偏最小二乘算法模型,與本文研究結(jié)果一致[14]。SPAD值反映葉綠素含量,差異體現(xiàn)在反射率光譜從可見光到近紅外多個光譜波段上,光譜參數(shù)即不同光譜波段組合,單因素建模僅考慮單一光譜參數(shù),而多因素建模將多個光譜參數(shù)參與建模,故多因素模型優(yōu)于單因素模型;其次偏最小二乘算法模型集中主成分分析、典型相關(guān)分析和線性回歸分析特點,BP神經(jīng)網(wǎng)絡(luò)算法模型具有實現(xiàn)復雜非線性映射功能,適合求解內(nèi)部機制復雜問題,具有自學、推廣、概括能力,遺傳算法并行性,可使其更易收斂至全局最小,機器學習算法模型優(yōu)于傳統(tǒng)線性模型,BP神經(jīng)網(wǎng)絡(luò)算法模型優(yōu)于偏最小二乘算法模型。研究BP神經(jīng)網(wǎng)絡(luò)時,其隱含層節(jié)點數(shù)無固定計算方法,前人使用幾種方法[14],但經(jīng)訓練,均不適合本模型,本模型隱含層節(jié)點數(shù)經(jīng)多次嘗試,選擇最優(yōu)節(jié)點數(shù)。
目前,國內(nèi)外對SPAD值估算模型尚無統(tǒng)一定論,最優(yōu)模型選取不同。不同作物葉綠素含量不同,同種作物葉綠素含量也受品種、種植地點、水肥狀況、儀器差異影響,導致無法確定估算SPAD值統(tǒng)一模型標準。本文測定油菜葉片SPAD值僅限于反映西北干旱地區(qū)情況,受此影響模型結(jié)果尚無法應(yīng)用于其他地區(qū)油菜葉片SPAD值估算。
本文以西北地區(qū)油菜作物為研究對象,通過分析油菜葉片SPAD值與光譜參數(shù)相關(guān)性,篩選對SPAD敏感光譜參數(shù),分別構(gòu)建并比較基于光譜參數(shù)單因素模型、偏最小二乘回歸模型(PLSR)和基于多元線性逐步回歸遺傳算法優(yōu)化(GA)BP神經(jīng)網(wǎng)絡(luò)SPAD估算模型,結(jié)論如下:
a.油菜SPAD平均值在苗期、蕾薹期、開花期、成熟期呈下降趨勢,而油菜葉片光譜反射率總體趨勢則呈上升趨勢,但在400~520和580~690 nm,開花期反射率大于成熟期反射率,因油菜葉片SPAD值越高葉綠素含量越高,對光吸收越強,反射率越低,總體趨勢呈相反趨勢。油菜SPAD平均值在蕾薹期和開花期無顯著差異,其他生育期均呈顯著差異。
b.苗期相關(guān)性最優(yōu)光譜參數(shù)為MCARI,蕾薹期相關(guān)性最強光譜參數(shù)為VOG2和MTCI,開花期相關(guān)性最優(yōu)譜參數(shù)為CARI,成熟期相關(guān)性最優(yōu)光譜參數(shù)為SRg。從光譜參數(shù)角度看,Db、SDb、SRg、CARI、MCARI、MCARI/OSAVI、MTCI共 7 個光譜參數(shù)在4個生育期相關(guān)性均達0.770以上,相關(guān)性較好,可參與模型構(gòu)建。
c.從最優(yōu)模型來看,MLSR-GA-BP神經(jīng)網(wǎng)絡(luò)模型為最優(yōu)模型,建模R2均在0.77以上,最大為0.91,驗證R2均在0.72以上,最高達0.92,可更好預測油菜葉片SPAD值。