吳劍飛
(安徽理工大學空間信息與測繪工程學院,安徽 淮南 232001)
葉片含水率是作物生長發(fā)育的診斷指標,影響其生理功能,最終影響作物品質(zhì)和產(chǎn)量[1]。傳統(tǒng)的物理干燥方法,具有耗時費力等缺點[2]。遙感技術中的高光譜分析技術,有著精確、快捷等優(yōu)勢,成為地表作物觀測的強有力工具[3]。
高光譜遙感獲取地物信息的同時,也存在信息冗余問題,導致模型過擬合現(xiàn)象,影響預測模型的運行速度和精度。國內(nèi)外學者針對光譜變換處理和最優(yōu)波段組合提取方法在建立預測模型上的應用開展了大量研究。如,孫俊等[4]采用多種波段篩選方法獲取不同水分脅迫下油麥菜含水率模型,模型預測決定系數(shù)達0.9214;張玨等[5]采用改進離散粒子群算法獲取青貯玉米含水率的特征波段適應度函數(shù),預測決定系數(shù)達0.80。
本研究以孕穗-抽穗期冬小麥為主要試驗樣品,通過采集其高光譜數(shù)據(jù)和葉片含水率,并選擇4種高光譜數(shù)據(jù)類型,以與葉片含水率(LWC)相關性為判定標準,由4種波段篩選方法獲取敏感波段組合,結(jié)合偏最小二乘回歸(PLSR)、BP神經(jīng)網(wǎng)絡和支持向量機回歸(SVR)構(gòu)建波段組合特征與含水率的反演模型,并分析評價預測效果,以達到冬小麥葉片含水率的精準、快捷監(jiān)測。
研究區(qū)位于安徽省潁上縣謝橋鎮(zhèn)(E115°56′~116°38′,N32°27′~32°4′),屬于溫帶與亞熱帶過渡型氣候。地處淮北沖擊平原,土地肥沃,農(nóng)村自然條件良好,土地類型主要為砂礓黑土和潮土。作為該地區(qū)主要糧食作物,小麥是當?shù)剞r(nóng)業(yè)經(jīng)濟收入主要來源,且在飲食結(jié)構(gòu)中有重要地位。因此,實現(xiàn)該地區(qū)農(nóng)作物含水率的動態(tài)檢測,能夠為實時、定量判斷農(nóng)作物生長狀態(tài),指導農(nóng)業(yè)生產(chǎn)建設提供理論依據(jù)。
2019年5月2日和5月3日,利用ASD FieldSpec4光譜儀(波長范圍為350~1000nm和1000~2500nm,采樣間隔分別為1.4nm和2nm)獲取當?shù)卦兴?抽穗期冬小麥的冠層光譜。采樣時間為11∶00—13∶00。當天天氣晴朗,技術人員著深色衣物工作,并收集了96組冬小麥的高光譜數(shù)據(jù)。儀器為每樣本獲取了20條光譜曲線,在去除所有異常光譜之后,取平均值作為該樣品的標準光譜。
取光譜采集位置處的小麥裝入采樣包,保證水分不受損失。在實驗室中,先分離出冬小麥的葉片和莖,再用電子天平秤稱取其飽和鮮重,放在烘干箱105℃烘2h,然后再放置于75℃下烘干至恒重,測定干重。葉片含水率(Leaf Water Content,LWC)的計算公式:
(1)
式中,F(xiàn)Wleaf為葉片鮮質(zhì)量;DWleaf為葉片干質(zhì)量。
表1 冬小麥葉片含水率的統(tǒng)計特征
表1表示冬小麥樣品中葉片含水率的最大值、最小值、均值和方差。
對原始光譜和冬小麥葉片含水率進行Pearson相關性分析,并保留了相關系數(shù)較高的波段[6]。利用MATLAB 2019a軟件對小麥原始光譜(OS)進行了光譜預處理操作,包括一階導數(shù)(FD)、二階導數(shù)(SD)和多元散射校正(MSC)[7.8]。并利用Origin軟件制圖。
圖1 經(jīng)不同降噪方法預處理后的光譜
圖1顯示了預處理操作后的光譜曲線,可以看出,F(xiàn)D與SD消除與波長無關的漂移,MSC消弱粒徑散射影響。
為獲取所有波段組合情況,將波段范圍內(nèi)任意2個波段構(gòu)建光譜指數(shù)[9],主要有歸一化光譜指數(shù)(NDSI)、比值光譜指數(shù)(RSI)和差值光譜指數(shù)(DSI),以等勢圖形式呈現(xiàn)。
(2)
(3)
DWI=Rλ1-Rλ2
(4)
式中,Rλ1和Rλ2分在數(shù)植上等于該波段對應的反射率。
連續(xù)投影法是一種前向變量選取方法,可以使矢量空間共線性問題最小化[10],該算法的具體步驟如下[11]:在樣品數(shù)據(jù)中選擇一條光譜列向量作為初始矢量;估計其他列向量在該初始矢量上的投影;選取出最小投影值對應的列向量作為下一個投影的初始向量,直到選取波段數(shù)達到所需數(shù)量;將提取的所有波段組合進行多元線性回歸,在局部最小的RMSE中選擇R2最大的波段組合作為最優(yōu)波段組合。
為降低起始向量選取的隨機性,本研究采用MCU Araújo[11]等提出的選取起始光譜向量的方法。
在MATLAB 2019a軟件中采用支持向量機回歸[12]、BP神經(jīng)網(wǎng)絡[13]和偏最小二乘回歸[14]構(gòu)建預測模型。在本研究中,決定系數(shù)R2、均方根誤差RMSE等統(tǒng)計參數(shù)用于綜合評定模型精度。其中,R2越接近于1;RMSE越小,表明模型反演效果越好,反之則越差。
以原始光譜信號OS、一階導數(shù)變換FD、二階導數(shù)變換SD和多元散射校正MSC處理后的曲線為基準,構(gòu)建雙波段光譜指數(shù)與冬小麥葉片含水率的等勢圖如圖2所示,在等勢圖中每個位置橫坐標x和縱坐標y分別對應輸入波長數(shù)據(jù)λ1和λ2,根據(jù)右側(cè)數(shù)軸,每個位置對應的值表示與葉片含水率的相關系數(shù),其中相關性最高的雙波段作為敏感波段組合。
圖2 冬小麥葉片含水率與光譜指數(shù)相關性等勢圖
表2顯示了模型反演結(jié)果,結(jié)合圖2得出,同一類型光譜變換后的數(shù)據(jù)構(gòu)建相關系數(shù)等勢圖在分布上有一定相似,表明與葉片含水率相關的敏感波段固定于特定波段區(qū)間。相同波段組合下,比值植被指數(shù)與葉片含水率的相關系數(shù)高于歸一化植被指數(shù),經(jīng)過多元散射校正變換后光譜所建模型的決定系數(shù)更加平穩(wěn)。其中,孕穗-抽穗期冬小麥含水率的MSC-NDSI-BP模型預測精度最高,其中R2為0.8082,RMSE為0.7937%。
圖3顯示了連續(xù)投影算法提取葉片含水率敏感波段的運行過程。SPA法在運行過程中通過分析投影向量的大小進行特征波段變量的篩選,通過計算校正模型的RMSE值確定的波段子集即為優(yōu)選波段[19]。
由圖3可以看出,隨變量數(shù)的增加,RMSE值逐漸減小,圖中紅色正方形圈出點表示確定的RMSE值,對應的即為最優(yōu)特征波段變量。敏感波段組合最終確定為816nm、919nm、932nm、1407nm、1410nm、1415nm、1438nm、2235nm、2346nm、2358nm、2386nm,壓縮率達99.39%。
表2 雙波段指數(shù)回歸模型預測精度對比
圖3 SPA優(yōu)選波段過程
表3 優(yōu)選波段組合回歸模型預測精度對比
基于SPA篩選出的敏感波段組合構(gòu)建的模型預測結(jié)果如表3所示,結(jié)合表2對比可以看出,使用SPA算法優(yōu)選特征波段后,所建模型精度均有所提高。其中,OS-SPA-PLSR精度最高,R2為0.9020,RMSE為0.3762%;PLSR建模方法相較于SVR與BP神經(jīng)網(wǎng)絡,更適用于孕穗-抽穗期冬小麥LWC的預測。
表2顯示了利用全波段波長構(gòu)建的冬小麥葉片含水率反演模型的結(jié)果,比較而言,敏感波段優(yōu)選后所建模型的反演精度和穩(wěn)定性均有所提升。經(jīng)過對比研究發(fā)現(xiàn),應用連續(xù)投影算法優(yōu)選敏感波段后,通過偏最小二乘回歸建立與葉片含水率反演模型的R2分別提高了0.0758,進一步確定連續(xù)投影算法對模型反演效果的提高。
結(jié)合表2、表3與表4對比可知,SPA算法在篩選與冬小麥葉片含水率相關性較高的敏感波段上表現(xiàn)更佳,降低了模型的復雜度,避免了雙波段指數(shù)模型存在的信息“丟失”問題和全波段模型存在的運行速度慢與過擬合問題,最終優(yōu)選的預測模型以高壓縮率的數(shù)據(jù)獲取了優(yōu)于全波段模型的PLSR模型,以高精度優(yōu)于雙波段指數(shù)模型。
表4 全波段與優(yōu)選波段所建模型預測精度對比
本研究同步獲取了孕穗-抽穗期冬小高光譜數(shù)據(jù)和葉片含水率,經(jīng)過多種光譜預處理方法,采用雙波段指數(shù)和連續(xù)投影算法篩選敏感波段,采用多種建模方法建立含水率預測模型,經(jīng)對比后得出以下結(jié)論。
對冬小麥原始光譜進行變換處理可以有效提高雙波段組合與冬小麥葉片含水率的相關性。其中,由600~700nm、1400~1600nm附近和1900~2000nm波段范圍內(nèi)的光譜數(shù)據(jù)構(gòu)成的雙波段指數(shù)與冬小麥含水率的相關性較高。
由雙波段指數(shù)、敏感波段組合和全波段所建含水率反演模型中,PLSR模型反演效果優(yōu)于SVR和BP神經(jīng)網(wǎng)絡回歸,其中對孕穗-抽穗期小麥葉片含水率的最佳預測模型為FD-SPA-PLSR。
連續(xù)投影算法有效降低了模型構(gòu)建所需波段數(shù),敏感波段分布在800~950nm、1400~1450nm和2230~2400nm,表明了小麥葉片含水率敏感波段多固定于特定波段范圍,為后續(xù)進一步研究波段與含水率關系提供參考。本研究采用壓縮率98%的波段建立了含水率反演模型并有較好的建模效果,模型預測R2達到0.9453。