曹英麗,江凱倫,劉亞帝,于正鑫,肖 文,于豐華
(沈陽(yáng)農(nóng)業(yè)大學(xué)信息與電氣工程學(xué)院/遼寧省農(nóng)業(yè)信息化工程技術(shù)中心,沈陽(yáng)110161)
在水稻生產(chǎn)中,水稻植株的葉綠素含量是反映其營(yíng)養(yǎng)脅迫、光合能力和健康狀況的重要生化指標(biāo)之一,也是決定水稻產(chǎn)量和品質(zhì)的關(guān)鍵要素[1]。無(wú)人機(jī)高光譜遙感技術(shù)能夠?qū)λ镜娜~綠素含量進(jìn)行大規(guī)模的連續(xù)監(jiān)測(cè),實(shí)現(xiàn)優(yōu)化資源利用和控制水稻健康生長(zhǎng),獲得更好的水稻產(chǎn)量。
高光譜遙感監(jiān)測(cè)主要是通過(guò)提取作物冠層反射率信息構(gòu)建光譜特征參數(shù),對(duì)作物的葉片葉綠素含量、氮素、葉面積指數(shù)等生物量進(jìn)行反演,其中紅邊位置(red edge position,REP)是綠色植被反射光譜中較為明顯的光譜特征參數(shù)[2],與作物的葉綠素含量密切相關(guān)[3]。相比于受脅迫和不健康的植物,具有較高葉綠素含量的健康植物的REP會(huì)向更長(zhǎng)的波長(zhǎng)移動(dòng)(紅移)[4]。由于REP對(duì)中高密度植被的敏感性更高,因此廣泛用于作為監(jiān)測(cè)大田作物生物量的光譜特征參數(shù),例如玉米葉綠素含量[5]、冬小麥葉綠素含量[6]、馬鈴薯植株氮濃度[2]、油菜葉氮含量[7]和小麥冠層氮濃度[8]等。
高光譜REP提取算法主要包括:最大一階導(dǎo)數(shù)(MFD)[9]、線(xiàn)性四點(diǎn)插值(LI)[10]、線(xiàn)性外推法(LE)[11]、多項(xiàng)式擬合(PF)[12]、拉格朗日插值(LAG)[13]和倒高斯模型(IG)[14]等方法。MFD是從反射光譜中提取REP最常用的方法,但是此方法提取的REP數(shù)據(jù)在700nm和725nm呈雙峰分布,并且出現(xiàn)不連續(xù)現(xiàn)象[11]。一些算法傾向于從反射光譜數(shù)據(jù)中提取連續(xù)REP,例如,通過(guò)IG方法提取的REP與針葉樹(shù)葉綠素含量有顯著的相關(guān)性[14]。DAWSON等[13]提出了LAG方法,然而僅當(dāng)一階導(dǎo)數(shù)光譜可用時(shí),基于LAG和IG的方法才適用[14]。CHO等[11]定義了從4個(gè)坐標(biāo)波段的一階導(dǎo)數(shù)光譜中提取REP的LE方法,以減輕雙峰特征對(duì)葉綠素和REP之間相關(guān)性的不穩(wěn)定性影響。DARVISHZADEH等[15]通過(guò)LE方法提取的REP能夠精確地模擬意大利馬杰拉國(guó)家公園的草地葉綠素含量和葉面積指數(shù)。PF技術(shù)使用高階曲線(xiàn)擬合光譜,將REP定位為反射光譜的最大一階導(dǎo)數(shù),PU等[12]表明用PF方法擬合的反射率曲線(xiàn)幾乎接近紅邊區(qū)域的實(shí)際光譜特性。GUYOT等[10]定義了LI方法,并表明該方法是從反射光譜數(shù)據(jù)中提取REP的一種更實(shí)用和更合適的方法,只需要4個(gè)波段和一個(gè)簡(jiǎn)單的插值計(jì)算可得到REP。這些提取REP的算法已被證明在監(jiān)測(cè)幾種植物的葉綠素[5-6]、氮[7-8]和葉面積指數(shù)[15-16]方面表現(xiàn)出良好的效果。
基于無(wú)人機(jī)光譜遙感影像的作物營(yíng)養(yǎng)監(jiān)測(cè)模型的構(gòu)建方法主要包括機(jī)器學(xué)習(xí)和經(jīng)驗(yàn)統(tǒng)計(jì)回歸方法[17]。以機(jī)器學(xué)習(xí)模型為代表的有反向傳播神經(jīng)網(wǎng)絡(luò)(BPNN)、支持向量機(jī)(SVM)、極限學(xué)習(xí)(ELM)等,紀(jì)偉帥等[18]利用無(wú)人機(jī)低空遙感技術(shù),通過(guò)構(gòu)建6個(gè)特征光譜指數(shù)建立多元線(xiàn)性回歸、SVM、BPNN 3種棉花花鈴期的SPAD值反演模型,其中BPNN模型的決定系數(shù)達(dá)到0.758,實(shí)現(xiàn)對(duì)棉花長(zhǎng)勢(shì)的監(jiān)測(cè)。于豐華等[19]采用PCA提取水稻高光譜特征,利用粒子群優(yōu)化后的ELM建立水稻氮素含量反演模型,決定系數(shù)達(dá)到0.838,為農(nóng)用無(wú)人機(jī)精準(zhǔn)施肥提供模型基礎(chǔ)。毛博慧等[20]采取遺傳算法對(duì)冬小麥冠層高光譜特征參數(shù)尋優(yōu),利用最小二乘SVM預(yù)測(cè)冬小麥葉綠素含量,為后續(xù)施肥管理提供依據(jù)。經(jīng)驗(yàn)統(tǒng)計(jì)回歸模型更多應(yīng)用在研究光譜植被指數(shù)和作物的生理化參數(shù)的關(guān)系中,董超等[21]通過(guò)無(wú)人機(jī)采集冬小麥多光譜影像數(shù)據(jù)獲得6種植被指數(shù),建立小麥冠層SPAD值的線(xiàn)性、二階多項(xiàng)式、對(duì)數(shù)、指數(shù)和冪函數(shù)模型,反演冬小麥不同施氮水平的狀況。高林等[22]利用大豆的多光譜和高光譜數(shù)據(jù)獲取5種植被指數(shù),結(jié)合地面實(shí)測(cè)LAI構(gòu)建線(xiàn)性、對(duì)數(shù)、冪、指數(shù)、二次多項(xiàng)式等回歸模型,為精準(zhǔn)農(nóng)業(yè)研究提供理論研究。本研究通過(guò)無(wú)人機(jī)遙感系統(tǒng)采集的水稻冠層高光譜圖像數(shù)據(jù),對(duì)比分析MFD、LI、PF、LE、IG、LAG共6種算法從高光譜反射率數(shù)據(jù)中獲取的REP,然后使用5種統(tǒng)計(jì)回歸方法(線(xiàn)性回歸、對(duì)數(shù)曲線(xiàn)回歸、乘冪曲線(xiàn)回歸、指數(shù)曲線(xiàn)回歸、二次多項(xiàng)式回歸)和兩種機(jī)器學(xué)習(xí)方法(BPNN、ELM)量化不同REP與水稻葉綠素含量之間的關(guān)系,從而建立能夠監(jiān)測(cè)水稻冠層葉綠素含量的反演模型,研究結(jié)果將有助于建立水稻田大規(guī)模的監(jiān)測(cè)技術(shù),為水稻葉綠素的無(wú)損、快捷、大規(guī)模診斷提供依據(jù)。
試驗(yàn)于2019~2020年6~9月進(jìn)行,地點(diǎn)在沈陽(yáng)農(nóng)業(yè)大學(xué)北方粳型超級(jí)稻成果轉(zhuǎn)化基地(118°53′E,38°43′N(xiāo),平均海拔40m),試驗(yàn)設(shè)計(jì)4個(gè)施氮水平:N0對(duì)照(0kg·hm-2)、N1(150kg·hm-2)、N2(240kg·hm-2)、N3(330kg·hm-2);2019年種植5個(gè)粳稻品種:V1(399)、V2(鹽豐47)、V3(橋潤(rùn)粳)、V4(美豐稻)、V5(鹽粳糯66),共20個(gè)小區(qū);2020年種植V1-V3和V5,4個(gè)粳稻品種,2019年小區(qū)分布圖如圖1。
圖1 水稻試驗(yàn)小區(qū)分布圖Figure 1 Distribution of rice plots
1.2.1 無(wú)人機(jī)高光譜圖像采集 無(wú)人機(jī)采用深圳大疆創(chuàng)新公司M600 PRO六旋翼無(wú)人機(jī),搭載四川雙利合浦公司GaiaSky內(nèi)置推掃式機(jī)載高光譜成像系統(tǒng)采集高光譜圖像,高光譜成像傳感器采集的波段范圍為400~1000nm,采樣間隔為0.45nm,在400~1000nm的光譜范圍內(nèi)產(chǎn)生1345個(gè)波段。去除了光譜上下邊界上的兩個(gè)波段,得有效波段1343個(gè)。無(wú)人機(jī)高光譜成像系統(tǒng)如圖2。
圖2 無(wú)人機(jī)高光譜成像系統(tǒng)Figure 2 Hyperspectral imaging system of UAV
在數(shù)據(jù)采集過(guò)程中,高光譜圖像的采集時(shí)間選定每次試驗(yàn)11∶00至12∶00之間進(jìn)行。數(shù)據(jù)采集時(shí)間為晴天或多云天氣(云量小于20%),太陽(yáng)光強(qiáng)度相對(duì)穩(wěn)定。無(wú)人機(jī)飛行高度為50m,一幅高光譜場(chǎng)景圖像對(duì)應(yīng)的覆蓋面積為400m2。所有的高光譜圖像都是在水稻生育期獲得的。利用ENVI5.3+IDL軟件對(duì)采集到的高光譜數(shù)據(jù)進(jìn)行處理和提取。在處理過(guò)程中,首先采用光譜角度映射器(SAM)去除噪聲,通過(guò)計(jì)算每個(gè)感興趣區(qū)域的平均光譜,得到每個(gè)試驗(yàn)小區(qū)的高光譜信息。
水稻田間冠層數(shù)據(jù)獲取試驗(yàn)時(shí)間范圍主要涵蓋水稻生長(zhǎng)中的分蘗期、拔節(jié)期和孕穗期3個(gè)時(shí)期。人工地面采集數(shù)據(jù)作為無(wú)人機(jī)高光譜數(shù)據(jù)的地面真值,采集時(shí)間與高光譜圖像數(shù)據(jù)采集時(shí)間同步。在每個(gè)試驗(yàn)小區(qū)中間長(zhǎng)勢(shì)均勻區(qū)域隨機(jī)選取4穴水稻作為該小區(qū)的樣本點(diǎn)。共有效采集240份水稻樣品,每份樣品取50片冠層葉片放入密封袋中,儲(chǔ)存在溫度約為4℃的移動(dòng)冰室中。使用手持差分GPS裝置RTK測(cè)量采樣點(diǎn)的地理坐標(biāo)信息,無(wú)人機(jī)高光譜成像系統(tǒng)獲取的高光譜遙感圖像包含每個(gè)像素的GPS信息,將地面數(shù)據(jù)一一對(duì)應(yīng)到HSI數(shù)據(jù)中具有相同GPS坐標(biāo)的像素。采用移動(dòng)平均濾波器(moving average filter)對(duì)試驗(yàn)小區(qū)獲取的400~800nm的反射率光譜數(shù)據(jù)進(jìn)行降噪平滑處理(濾波系數(shù)為0.2),降低噪聲對(duì)葉綠素含量反演精度的影響,處理后水稻冠層高光譜曲線(xiàn)如圖3。
圖3 高光譜反射率平滑降噪處理Figure 3 Hyperspectral reflectance smoothing and noise reduction
1.2.2 葉片葉綠素含量測(cè)定與高光譜 將水稻樣品送回
實(shí)驗(yàn)室后,從樣品中選出充分展開(kāi)的葉片,剪碎后相互混合均勻,稱(chēng)取0.4g置于200mL混合溶液中,混合溶液由體積比9∶9∶2的丙酮、乙醇和蒸餾水3種溶液配置而成。將含葉混合物的溶液在實(shí)驗(yàn)室遮光環(huán)境溫度約為20℃下靜置,待葉樣品呈全白色后,利用分光光度計(jì)進(jìn)行比色,分別測(cè)定D663nm和D645nm,按式(1)計(jì)算水稻樣品的葉綠素含量(Chl)[23-24]。
本研究進(jìn)行6次試驗(yàn)數(shù)據(jù)采集,共收集有效數(shù)據(jù)樣本230個(gè)。在數(shù)據(jù)集的劃分中采用5折劃分方法,將數(shù)據(jù)劃為5等分,選擇1個(gè)分區(qū)作為測(cè)試集,剩下的4個(gè)分區(qū)作為訓(xùn)練集,因此訓(xùn)練集和測(cè)試集共有5組(圖4),表1顯示了其中一組的數(shù)據(jù)統(tǒng)計(jì)特征。
圖4 數(shù)據(jù)5折劃分Figure 4 Data partition in 5 fold
由表1可知,除樣本量外,訓(xùn)練集和測(cè)試集具有相似的統(tǒng)計(jì)特性。另外,變異系數(shù)大于50%,說(shuō)明葉綠素含量數(shù)據(jù)具有較高的離散性。在葉綠素含量整體樣本中,其最大值和最小值分別為99.70mg·L-1和2.60mg·L-1,其變幅計(jì)算為97.10mg·L-1,樣本的葉綠素含量變異系數(shù)為50.83%,均值為53.197mg·L-1,標(biāo)準(zhǔn)差為27.04,根據(jù)Lilliefors檢驗(yàn)[25],p=0.4032>0.05,顯著性概率值說(shuō)明該葉綠素樣本數(shù)據(jù)符合正態(tài)分布,滿(mǎn)足葉綠素含量的反演要求。
表1 水稻葉片葉綠素含量統(tǒng)計(jì)結(jié)果Table 1 A statistical table of chlorophyll content in rice leave
1.3.1 最大一階導(dǎo)數(shù)法(MFD)在最大一階導(dǎo)數(shù)法[9]中,REP由反射光譜在紅邊區(qū)域的最大一階導(dǎo)數(shù)對(duì)應(yīng)的波長(zhǎng)來(lái)確定。利用反射光譜的一階差分變換計(jì)算一階導(dǎo)數(shù),即:
式中:FDR為在波長(zhǎng)i處的光譜反射率的一階導(dǎo)數(shù)值,i位于波長(zhǎng)為j和j+1之間的中點(diǎn);Rλ(j)和Rλ(j+1)分別為波長(zhǎng)為j與j+1處的光譜反射率;Δλ為波長(zhǎng)為j和j+1之間的差值。
1.3.2 線(xiàn)性四點(diǎn)插值法(LI) 線(xiàn)性四點(diǎn)插值法[10]將紅邊處的反射率曲線(xiàn)簡(jiǎn)化為一條直線(xiàn),利用波長(zhǎng)為670nm和780nm的反射率確定拐點(diǎn)處反射率,700nm和740nm處的反射率通過(guò)線(xiàn)性插值來(lái)估計(jì)拐點(diǎn)波長(zhǎng)。它僅使用4個(gè)波段(670,700,740,780nm)通過(guò)兩步簡(jiǎn)單的計(jì)算來(lái)確定REP。
計(jì)算拐點(diǎn)處的反射率(Rre):
式中:R為光譜反射率。
計(jì)算紅邊波長(zhǎng)即紅邊位:
1.3.3 線(xiàn)性外推法(LE)線(xiàn)性外推法[11]計(jì)算REP為一階導(dǎo)數(shù)遠(yuǎn)紅外區(qū)(680~700nm)和近紅外區(qū)(725~760nm)光譜外推的兩條直線(xiàn)交點(diǎn)所對(duì)應(yīng)的波。
遠(yuǎn)紅外直線(xiàn)(Far-red line):
近紅外直線(xiàn)(NIR line):
式中:m和c為直線(xiàn)的斜率和截距。在交點(diǎn)處,這兩條直線(xiàn)有相等的λ(波長(zhǎng))和FDR值。因此,REP即交點(diǎn)處的λ值,可表示為:
線(xiàn)性外推法利用4個(gè)波段來(lái)計(jì)算REP,其中2個(gè)固定波段:680nm和760nm(表示紅邊區(qū)域的上下界),通過(guò)使用遠(yuǎn)紅外與近紅外區(qū)域的不同波段組合得到的REPs與葉綠素含量的相關(guān)性強(qiáng)度來(lái)確定另外2個(gè)波段。
1.3.4 多項(xiàng)式擬合法(PF)多項(xiàng)式擬合法[12]是利用5次多項(xiàng)式函最小二乘擬合到對(duì)應(yīng)于紅邊區(qū)域反射率的波長(zhǎng)之間的反射光譜。
式中:λ為從670~780nm中連續(xù)的249個(gè)波段。REP由近似源譜的函數(shù)的最大一階導(dǎo)數(shù)來(lái)確定的,一階導(dǎo)數(shù)利用一階差分變換計(jì)算得出。
1.3.5 倒高斯模型(IG) 紅邊反射率的光譜形狀近似于倒高斯函數(shù)的一半。因此,使用倒高斯模型[13]來(lái)擬合紅邊區(qū)域的反射率,反射率方程表示為:
式中:Rs為近紅外區(qū)光譜反射率最大值;R0為紅光區(qū)光譜反射率最小值;λ為波長(zhǎng);λp和σ分別為光譜參數(shù)和高斯模型偏差系數(shù),REP由這兩個(gè)參數(shù)確定。
式中:λp和σ可利用線(xiàn)性擬合法計(jì)算出,式(3)可變換為:
式中:B()
λ為關(guān)于λ的線(xiàn)性方程,因此通過(guò)線(xiàn)性回歸可計(jì)算出與倒高斯模型兩個(gè)參數(shù)相關(guān)的最佳擬合系數(shù)a0和a1,λp和σ可表示為:
1.3.6 拉格朗日插值法(LAG)拉格朗日插值法[14]利用光譜反射率的最大一階導(dǎo)數(shù)對(duì)應(yīng)的波長(zhǎng)以及相鄰的兩個(gè)波段進(jìn)行插值計(jì)算得到REP。
式中:Dλ為波長(zhǎng)λ的光譜反射率的一階導(dǎo)數(shù)值;λi為最大一階導(dǎo)數(shù)對(duì)應(yīng)的波長(zhǎng);λi+1和λi-1為相鄰上下的兩個(gè)波段。
本研究利用6種紅邊位置提取方法,從水稻冠層高光譜反射率數(shù)據(jù)中獲取REP作為反演模型的輸入,對(duì)于反演模型的建立使用5種統(tǒng)計(jì)回歸算法(線(xiàn)性回歸、對(duì)數(shù)曲線(xiàn)回歸、乘冪曲線(xiàn)回歸、指數(shù)曲線(xiàn)回歸和二次多項(xiàng)式回歸),以及兩種非線(xiàn)性的機(jī)器學(xué)習(xí)方法[反向傳播神經(jīng)網(wǎng)絡(luò)(BPNN)和極限學(xué)習(xí)機(jī)(ELM)]。
反向傳播神經(jīng)網(wǎng)絡(luò)(BPNN)屬于一種前饋網(wǎng)絡(luò),具有自學(xué)習(xí)和自適應(yīng)的優(yōu)點(diǎn)[26-27]。BPNN基于梯度下降策略,根據(jù)實(shí)際輸出值和目標(biāo)輸出值之間的誤差進(jìn)行參數(shù)調(diào)整。訓(xùn)練是通過(guò)在每個(gè)循環(huán)結(jié)束時(shí)反復(fù)更新權(quán)值來(lái)進(jìn)行的,直到所有訓(xùn)練樣本的平均平方和誤差最小化,并且在指定的誤差范圍內(nèi)。更多細(xì)節(jié)可以參考[28]。BP NN結(jié)構(gòu)為1-10-1,即輸入層和輸出層為1個(gè)神經(jīng)元,隱含層的神經(jīng)元個(gè)數(shù)為10,設(shè)定學(xué)習(xí)速率為0.01,最大確認(rèn)失敗次數(shù)為6,最小性能梯度為10-6,最大訓(xùn)練次數(shù)為1000次。
極限學(xué)習(xí)機(jī)(ELM)[29]是一種新型的單隱含層前饋神經(jīng)網(wǎng)絡(luò),它與傳統(tǒng)的單隱含層前饋神經(jīng)網(wǎng)絡(luò)相比,能夠有效克服傳統(tǒng)神經(jīng)網(wǎng)絡(luò)因采用梯度下降法進(jìn)行訓(xùn)練而導(dǎo)致陷入局部極值的缺點(diǎn),并且具有處理速度快、泛化能力強(qiáng)、易于實(shí)現(xiàn)等優(yōu)點(diǎn)[30]。ELM輸入層和隱含層的連接權(quán)值、隱含層的閾值可以隨機(jī)設(shè)定,且設(shè)定完后不再調(diào)整,而B(niǎo)PNN在訓(xùn)練過(guò)程中需要不斷反向去調(diào)整權(quán)值和閾值,ELM在保證學(xué)習(xí)精度的前提下,比BPNN學(xué)習(xí)算法速度更快、泛化能力更強(qiáng)。
對(duì)于模型的評(píng)價(jià),使用五折交叉驗(yàn)證法:5組測(cè)試集的決定系數(shù)(R2)、均方根誤差(RMSE)、絕對(duì)誤差(MAE)的各均值作為模型的評(píng)價(jià)參數(shù),3種參數(shù)的計(jì)算公式為:
式中:y^i、yi和yˉ分別為水稻葉綠素含量的預(yù)測(cè)值、觀(guān)測(cè)值、平均值;n為樣本的數(shù)量。通過(guò)比較不同模型的評(píng)價(jià)參數(shù),最終選擇最佳的水稻冠層葉綠素反演模型。
在230個(gè)葉綠素(Chl)含量樣本中,將葉綠素含量按從小到大順序排列,選取第1~76個(gè)葉綠素樣本對(duì)應(yīng)的47條光譜反射率曲線(xiàn)求平均得到的一條光譜曲線(xiàn)作為低Chl含量光譜,同理分別將第77~153和第153~230的葉綠素樣本對(duì)應(yīng)的光譜反射率曲線(xiàn)計(jì)算得到中、高Chl含量光譜,3種水平的葉綠素平均含量分別為90.1612,53.5189,15.3215mg·L-1,其對(duì)應(yīng)的光譜反射率在紅邊光譜區(qū)(680~780nm)變化曲線(xiàn)如圖5。在704~780nm可以觀(guān)察到相比于低、中Chl含量光譜,高Chl含量光譜表現(xiàn)出更低的反射率,原因是葉綠素含量越高,吸收的紅光越多[20]。
圖5 不同葉綠素含量下的光譜紅邊區(qū)反射率Figure 5 Reflectance of the red edge region of the spectral under different chlorophyll contents
低、中、高Chl含量光譜曲線(xiàn)的一階導(dǎo)數(shù)值由光譜反射率的數(shù)值梯度與光譜波長(zhǎng)的數(shù)值梯度的比值計(jì)算得到,在紅邊光譜區(qū)(680~780nm)變化曲線(xiàn)如圖6。在波段685~714nm區(qū),3種Chl含量水平的光譜反射率明顯上升,葉綠素含量越低,反射率上升程度越高,這是因?yàn)槿~片內(nèi)部散射增加的原因[20]。
圖6 不同葉綠素含量下的光譜紅邊區(qū)反射率的一階導(dǎo)數(shù)值Figure 6 The first derivative value of the reflectance in the red edge region of the spectrum under different chlorophyll content
6種不同的方法所提取紅邊位置的頻率直方圖如圖7,相關(guān)的統(tǒng)計(jì)信息如表2。可以看出MFD所提取的紅邊位置主要分布在700~730nm,而LAG所提取的紅邊位置分布與其類(lèi)似,并且統(tǒng)計(jì)參數(shù)也相接近,這是因?yàn)長(zhǎng)AG是基于MFD利用一階導(dǎo)數(shù)最大值對(duì)應(yīng)波段與其相鄰的波段進(jìn)行內(nèi)插;LI提取的紅邊位置變幅較大,主要分布在700~750nm,LE提取的紅邊位置涵蓋了紅邊區(qū)域,經(jīng)過(guò)檢驗(yàn),兩種方法提取的紅邊位置都符合正態(tài)分布,p分別為0.46和0.50,并且LI和LE所提取的紅邊位置與水稻葉綠素含量皮爾遜相關(guān)系數(shù)高于其他4種方法,分別為0.71和0.70。LE中除固定的兩個(gè)波段外,另兩個(gè)波段由遠(yuǎn)紅外和近紅外內(nèi)不同的波段組合得到,不同組合波段下通過(guò)LE提取紅邊位置,計(jì)算其與水稻葉綠素?cái)?shù)據(jù)的皮爾遜相關(guān)系數(shù)最大值來(lái)確定最優(yōu)的波段組合,圖8為不同波段組合下計(jì)算得到的皮爾遜相關(guān)系數(shù)圖,可以看出在近紅外遠(yuǎn)紅外691~700nm和731~760nm下的波段組合得到的相關(guān)系數(shù)值較大,最大值對(duì)應(yīng)的橫縱坐標(biāo)即對(duì)應(yīng)所求的2個(gè)波段,分別為699.5nm和731nm,波段的組合會(huì)因不同作物的和光譜反射率的變化而改變,應(yīng)根據(jù)作物的改變?nèi)ふ腋鼮檫m合的組合波段[18]。PF提取的紅邊位置主要集中分布在720nm附近,部分分布于780nm,皮爾遜相關(guān)系數(shù)最小,為0.28;PF與MFD的原理相似,都是尋通過(guò)找紅邊區(qū)域反射率的最大一階導(dǎo)數(shù)值對(duì)應(yīng)的波段確定紅邊位置,不過(guò)PF的紅邊區(qū)域反射率是由五次多項(xiàng)式擬合原反射光譜得到,目的是為了減少一階導(dǎo)數(shù)不連續(xù)性的影響,而分布在780nm附近的紅邊位置是由于所擬合的部分多項(xiàng)式函數(shù)在770~780nm出現(xiàn)極值。IG所提取的紅邊位置值主要分布在715~730nm,標(biāo)準(zhǔn)差最小,為3.58。6種方法提取的紅邊位置的均值都接近720nm,LI和LE所提取的紅邊位置與水稻葉綠素?cái)?shù)據(jù)的相關(guān)性高于其他4種方法;其中PF提取的紅邊位置過(guò)于集中,在730~770nm出現(xiàn)不連續(xù),且與葉綠素的相關(guān)性低。
圖7 6種不同方法提取紅邊位置的頻率統(tǒng)計(jì)直方圖Figure 7 Frequency statistical histograms of red edge locations from 6 methods
表2 6種不同方法提取紅邊位置統(tǒng)計(jì)Table 2 The statistics of red edge position from 6 method
圖8 LE不同組合波段與葉綠素含量相關(guān)性系數(shù)圖Figure 8 Diagram of correlation coefficient of different LE combination bands and chlorophyll concentrations
2.2.1 統(tǒng)計(jì)回歸模型結(jié)果 對(duì)6種紅邊位置提取算法分別建立線(xiàn)性模型、對(duì)數(shù)曲線(xiàn)模型、乘冪曲線(xiàn)模型、指數(shù)曲線(xiàn)模型和二次多項(xiàng)式模型,各模型的評(píng)價(jià)參數(shù)以及p值如表3。
表3 基于統(tǒng)計(jì)回歸方法的葉綠素含量反演模型信息Table 3 Chlorophyll inversion model information for different statistical regressions
可以看出LE-對(duì)數(shù)曲線(xiàn)模型精度最高,測(cè)試集R2、RMSE、MAE的均值分別達(dá)到0.763,9.249,11.253,p=0.016<5%,具有95%的置信區(qū)間(CI)的回歸系數(shù),LE方法提取的REP和葉綠素含量存在顯著對(duì)數(shù)回歸關(guān)系;其次是LI-線(xiàn)性模型,測(cè)試集R2、RMSE、MAE的均值分別達(dá)到0.695,10.106,11.237,p_value=0.032<5%,LI方法提取的REP和葉綠素含量同樣存在顯著線(xiàn)性回歸關(guān)系。整體來(lái)看,相同提取REP技術(shù)下的線(xiàn)性模型、對(duì)數(shù)曲線(xiàn)模型以及二次多項(xiàng)式模型更優(yōu)于乘冪曲線(xiàn)模型和指數(shù)曲線(xiàn)模型,R2值都高于后兩者,乘冪曲線(xiàn)模型、指數(shù)曲線(xiàn)模型的R2值偏小,均低于0.35,RMSE和MAE值偏大,該類(lèi)模型不能夠很好的解釋REP和葉綠素的關(guān)系。在6種REP提取算法中,由LI和LE所提取的REP相比其余4種方法更能反映葉綠素含量關(guān)系,相同統(tǒng)計(jì)回歸算法下所建立的模型的性能優(yōu)于后者。
基于不同技術(shù)提取的REP不同模型,由表3可知,除指數(shù)模型外在紅邊波段皆是增函數(shù),可以說(shuō)明的是與葉綠素含量較低相比,較高葉綠素含量的REP會(huì)向較長(zhǎng)波長(zhǎng)移動(dòng),即紅移,另外基于LI的線(xiàn)性回歸結(jié)果說(shuō)明該方法提取的REP與葉綠素含量存在一定的線(xiàn)性關(guān)系,這與ANSAR等[16]研究發(fā)現(xiàn)一致。LE-對(duì)數(shù)曲線(xiàn)模型和LI-線(xiàn)性模型可以滿(mǎn)足水稻葉綠素的診斷,兩者都是利用四個(gè)相應(yīng)的波段計(jì)算求出紅邊位置,對(duì)于LE-對(duì)數(shù)曲線(xiàn)模型,REP由4個(gè)波段(680,699.5,731,760nm)外推的兩條直線(xiàn)的交點(diǎn)所確定,其中699.5nm和731nm這兩個(gè)波段由紅邊內(nèi)的波段組合和葉綠素含量的最大相關(guān)系數(shù)確定,而對(duì)于LI-線(xiàn)性模型,只需4個(gè)波段(670,780,740,780nm)的反射率通過(guò)簡(jiǎn)單的兩步計(jì)算[式(3)和式(4)]來(lái)直接計(jì)算得出紅邊位置。
2.2.2 機(jī)器學(xué)習(xí)建模方法結(jié)果 在機(jī)器學(xué)習(xí)建模方法中,同樣利用六種紅邊位置作為模型輸入量,BPNN和ELM的模型參數(shù)結(jié)果如表4??梢钥闯觯訪(fǎng)I和LE方法提取的紅邊位置,在兩種模型中表現(xiàn)優(yōu)于其他4種REP提取方法,這與回歸建模的結(jié)果一致,LE-ELM模型測(cè)試集R2、RMSE、MAE的均值分別達(dá)到0.781,8.375,9.828,LI-ELM模型測(cè)試集R2、RMSE、MAE的均值分別達(dá)到0.702,9.794,9.339。兩種建模方法比較,ELM模型的預(yù)測(cè)精度優(yōu)于BPNN模型,并且由于ELM的特定超參數(shù)隨機(jī)設(shè)定后不再調(diào)整,使其學(xué)習(xí)速度更快。PF和IG方法提取的紅邊位置在兩種建模方法中的精度最低,該兩種紅邊位置不能夠很好地反演葉綠素含量的。值得注意的是機(jī)器學(xué)習(xí)算法在葉綠素反演中更優(yōu)于回歸算法,這是因?yàn)闄C(jī)器學(xué)習(xí)算法通過(guò)犧牲可解釋性來(lái)獲得更高的預(yù)測(cè)能力。
表4 反向傳播神經(jīng)網(wǎng)絡(luò)和極限學(xué)習(xí)機(jī)的葉綠素含量反演模型信息Table 4 BPNN and ELM chlorophyll content inversion model information
本研究利用無(wú)人機(jī)采集的水稻冠層高光譜數(shù)據(jù),建立了估算水稻葉綠素含量的反演模型,能夠?qū)λ救~綠素含量進(jìn)行快速準(zhǔn)確的監(jiān)測(cè)。為此,比較了6種常用的紅邊位置(REP)提取算法,對(duì)從高光譜反射率中提取的REP進(jìn)行分析和比較。其次,利用5種統(tǒng)計(jì)回歸方法(線(xiàn)性回歸、對(duì)數(shù)曲線(xiàn)回歸、乘冪曲線(xiàn)回歸、指數(shù)曲線(xiàn)回歸、二次多項(xiàng)式回歸)和兩種機(jī)器學(xué)習(xí)方法(BPNN、ELM),研究紅邊位置與地面所測(cè)量的水稻葉綠素含量的關(guān)系,最終選取基于紅邊位置水稻葉綠素含量的最佳反演模型。
水稻冠層葉綠素含量高光譜紅邊特性分析結(jié)果表明,紅邊區(qū)域(680~727nm)觀(guān)察到水稻冠層表現(xiàn)出更敏感的光譜響應(yīng):低葉綠素含量的近紅外光譜區(qū)(660~727nm)反射率較高、高葉綠素含量的REP出現(xiàn)紅移。水稻葉綠素含量統(tǒng)計(jì)回歸模型結(jié)果表明,LE-對(duì)數(shù)曲線(xiàn)模型表現(xiàn)出良好的葉綠素預(yù)測(cè)性能,測(cè)試集R2、RMSE、MAE均值分別達(dá)到0.763,9.249,11.253,構(gòu)成波段組合的另2個(gè)波段為699.5nm和731nm,REP分布范圍涵蓋紅邊區(qū)域(660~780nm),該模型能夠較準(zhǔn)確反演水稻葉綠素含量。LI-線(xiàn)性模型模型測(cè)試集R2、RMSE、MAE均值分別達(dá)到0.695,10.106,11.237,該方法計(jì)算簡(jiǎn)單,可為水稻葉綠素檢測(cè)儀的開(kāi)發(fā)提供理論依據(jù)。水稻葉綠素含量機(jī)器學(xué)習(xí)反演模型中,以L(fǎng)I和LE所提取的紅邊位置作為特征輸入,相比與其他4種REP提取方法表現(xiàn)出更好的預(yù)測(cè)效果,在BPNN模型中,以L(fǎng)E提取的REP作為模型輸入,測(cè)試集R2、RMSE、MAE均值分別為0.699,10.818,10.427。對(duì)于ELM模型,其中LE-ELM模型和LI-ELM模型的測(cè)試集R2、RMSE、MAE均值分別為0.781和0.702,8.375和9.794,9.828和9.339,滿(mǎn)足對(duì)水稻葉綠素含量的反演要求,LE-ELM模型在所有模型中,其預(yù)測(cè)精度最高,能夠有效準(zhǔn)確地評(píng)估水稻葉綠素含量。與BPNN算法相比,ELM有著預(yù)定義的網(wǎng)絡(luò)架構(gòu),不需要手動(dòng)調(diào)整參數(shù),有更快的學(xué)習(xí)速度、更高的泛化性能。