紀(jì)童,王波,楊軍銀,李強(qiáng),劉志剛,關(guān)文昊,何國(guó)興,潘冬榮,柳小妮
(1.甘肅農(nóng)業(yè)大學(xué)草業(yè)學(xué)院/草業(yè)生態(tài)系統(tǒng)教育部重點(diǎn)實(shí)驗(yàn)室/甘肅省草業(yè)工程實(shí)驗(yàn)室/中-美草地畜牧業(yè)可持續(xù)發(fā)展研究中心,甘肅 蘭州 730070; 2.甘肅省草原技術(shù)推廣總站,甘肅 蘭州 730000)
葉綠素作為植被生化參數(shù)的光合色素,不僅與其他生化指標(biāo)(氮、粗蛋白)有著密切聯(lián)系,同時(shí)也是影響植物生產(chǎn)的重要指標(biāo)[1]。當(dāng)草地受到嚴(yán)重破壞時(shí),葉綠素含量的降低側(cè)面反映了植物在脅迫條件下的生理狀態(tài),顯示草地的光合能力與健康狀況[2]。傳統(tǒng)的生理生化分析方法對(duì)葉綠素進(jìn)行測(cè)定的過(guò)程具有破壞性,且難以實(shí)時(shí)、快速地監(jiān)測(cè)。近年來(lái),隨著遙感技術(shù)的快速發(fā)展,高光譜技術(shù)已成為現(xiàn)代遙感技術(shù)的重要組成部分,例如:利用光譜儀進(jìn)行植物光譜識(shí)別[3],以及對(duì)植物含水量[4]、葉綠素含量[5]、土壤有機(jī)質(zhì)[1]、生物量等的估算和反演研究,這些成果有效解讀了地物光譜特征規(guī)律,為遙感監(jiān)測(cè)提供了理論支撐與技術(shù)指導(dǎo)。
基于高光譜的植物葉綠素含量研究十分普遍,劉偉東等[7]利用相關(guān)分析與逐步回歸方法研究了水稻(Oryzasativa)葉綠素密度與光譜反射率光譜及一階微分光譜的相關(guān)關(guān)系,并建立了相關(guān)的預(yù)測(cè)模型;唐延林等[8]發(fā)現(xiàn)高光譜植被指數(shù)(色素比值指數(shù)PSSRa、色素歸一化差值指數(shù)PSNDa和紅邊位置λred等)與玉米葉綠素、類胡蘿卜素存在極顯著的相關(guān)關(guān)系;唐延林等[9]研究發(fā)現(xiàn)紅邊位置與紅邊斜率和大麥(Hordeumvulgare)冠層葉綠素顯著相關(guān);孫雪梅等[10]分析發(fā)現(xiàn)紅谷面積與GNDVI指數(shù)與水稻葉綠素含量之間相關(guān)性均最好;宋開山等[11]研究了大豆(Glycinemax)葉綠素含量與冠層光譜相關(guān)性,發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)模型結(jié)合光譜相關(guān)指標(biāo)可以較好反演大豆葉綠素含量(R2=0.946 7);姚付啟等[12]對(duì)法國(guó)梧桐(Platanusorientalis)與白毛楊(Populustomentosa)的光譜反射率、一階導(dǎo)數(shù)和紅邊參數(shù)與葉綠素含量進(jìn)行了相關(guān)性分析,并利用神經(jīng)網(wǎng)絡(luò)模型建立了精度較好的神經(jīng)網(wǎng)絡(luò)模型。
但光譜數(shù)據(jù)多維度、高相關(guān)、非線性以及數(shù)據(jù)量大等獨(dú)特特點(diǎn),給高光譜數(shù)據(jù)的篩選與建模帶來(lái)了挑戰(zhàn),因此如何有效篩選光譜信息并應(yīng)用于學(xué)習(xí)算法中,成為光譜數(shù)據(jù)分析領(lǐng)域中的重要問(wèn)題。Person相關(guān)系數(shù)法[13-15]常用于光譜敏感波段與光譜指標(biāo)的篩選,主成分分析法(PCA)[16-17]和偏最小二乘法(PIS)中的變量投影重要性(VIP)[18-21]等也被廣泛應(yīng)用于光譜數(shù)據(jù)降維與消除共線性。基于此,本研究利用Person相關(guān)系數(shù)法、PCA和VIP方法,選擇對(duì)葉綠素比較敏感的原始光譜波段與植被指數(shù),采用多元逐步回歸與多元線性回歸方法建立高寒草地植物群落的葉綠素反演模型,為祁連山東緣高寒草地的遙感監(jiān)測(cè)提供技術(shù)支撐。
研究區(qū)位于甘肅省武威市天祝藏族自治縣抓喜秀龍鄉(xiāng)(N 37°40′,E 102°32′)的高寒草甸,海拔2 960~3 425 m,氣候潮濕、空氣稀薄、太陽(yáng)輻射強(qiáng),天然植被為寒溫潮濕類高寒草甸。該地區(qū)水熱同期,無(wú)絕對(duì)無(wú)霜期,僅分冷、熱兩季,年均氣溫-0.1℃,最熱月7月均溫12.7℃,最冷月1月均溫-18.3℃,≥0℃的年積溫為1 380℃;年均降水量416 mm,多集中于7、8和9月;年蒸發(fā)量為1 592 mm,水熱同期,年蒸發(fā)量約是降水量的3.8倍。
土壤以亞高山草甸土、亞高山黑鈣土為主,土層厚度40~80 cm,土壤pH為7.0~8.2。
為避免主觀因素,在5個(gè)樣地內(nèi)利用等距取樣法,每個(gè)樣地設(shè)置10個(gè)1 m ×1 m樣方,每個(gè)樣方距離5 m,共計(jì)50個(gè)樣方作為試驗(yàn)建模組,另隨機(jī)采集10個(gè)樣方,作為模型檢驗(yàn)組。
光譜數(shù)據(jù)測(cè)定選擇在天氣晴朗、無(wú)風(fēng)、無(wú)云天氣,北京時(shí)間10∶00~14∶00進(jìn)行。光譜采集時(shí)光纖探頭垂直向下,距植被冠層垂直高度依據(jù)樣品冠層大小及探頭視場(chǎng)角(25°)確定,使樣品冠層恰能位于探頭視場(chǎng)范圍內(nèi)。每個(gè)樣方共采集100個(gè)點(diǎn)(1 cm × 1 cm)的光譜數(shù)據(jù),取其均值作為1個(gè)樣方的光譜反射率。
表1 儀器參數(shù)及要求
1.2.2 葉綠素指標(biāo)測(cè)定 光譜數(shù)據(jù)采集完成后,將樣方中的草樣剪下裝袋,帶回實(shí)驗(yàn)室用分光光度計(jì)法[22]測(cè)定總?cè)~綠素含量(Chl),每個(gè)樣方的草樣重復(fù)測(cè)定5次,取其平均值作為對(duì)應(yīng)的葉綠素指標(biāo)。
1.2.3 植被指數(shù)選取 400~790 nm可見光波段,植物葉綠素對(duì)光譜特征影響極大,在760 nm附近反射率急劇上升,形成植物特有的紅邊現(xiàn)象[23],光譜區(qū)別明顯,因此選取480~760 nm波段對(duì)植物自身葉綠素變化較敏感的光譜指數(shù)GI、RGI、MCARI、TCARI和CIred edge作為原始變量。另外,光譜測(cè)定極易受外界環(huán)境,如土壤背景、大氣氣溶膠、植被冠層等的干擾,導(dǎo)致結(jié)果出現(xiàn)誤差,而RVI和VARI可以有效矯正大氣氣溶膠的影響,消除部分輻射誤差,NDVI670和NDVI705對(duì)冠層結(jié)構(gòu)非常敏感,PSRI可用于植被健康的監(jiān)測(cè)與檢測(cè),選擇這些植被指數(shù)有助于提升光譜精度。
本試驗(yàn)共篩選出15個(gè)植被指數(shù)(表2)。
表2 植被指數(shù)
光譜測(cè)定易受天氣、空氣水分、冠層水分等因素影響,導(dǎo)致光譜曲線出現(xiàn)異常。因此在進(jìn)行光譜數(shù)據(jù)分析之前,應(yīng)剔除有明顯異常的數(shù)據(jù)。本研究使用地物光譜儀自帶的View Spec Pro軟件對(duì)每個(gè)樣點(diǎn)的多次重復(fù)測(cè)量值進(jìn)行平均處理,可消除光譜噪音的影響。
1.3.1 原始光譜數(shù)據(jù) 針對(duì)原始光譜數(shù)據(jù)量大,且光譜波段彼此間高度相關(guān)的問(wèn)題,試驗(yàn)選擇利用Person相關(guān)系數(shù)法篩選顯著相關(guān)的原始光譜波段,以達(dá)到初步降維的目的,但篩選波段彼此之間仍存在高度相關(guān)(多重共線性),因此利用多元逐步回歸法對(duì)篩選變量進(jìn)行逐步篩選,去除指標(biāo)間的多重共線性,保證模型精度。
1.3.2 植被指數(shù) 植被指數(shù)通常結(jié)合不同波長(zhǎng)范圍的反射率來(lái)增強(qiáng)植被某一特征或細(xì)節(jié),因此利用植被指數(shù)增強(qiáng)光譜對(duì)葉綠素含量的敏感性,試驗(yàn)利用15種植被指數(shù),通過(guò)相關(guān)系數(shù)法(Person)、主成分分析法(PCA)和變量投影重要性(VIP)篩選敏感植被指數(shù),為避免指標(biāo)間存在多重共線性,利用多元逐步回歸法消除指標(biāo)間的共線性,建立葉綠素反演模型。
2.1.1 原始光譜敏感波段篩選 波長(zhǎng)小于1 327 nm時(shí),植被冠層葉綠素含量與原始光譜反射率Person相關(guān)系數(shù)正相關(guān),在384 nm(0.508)、528 nm(0.493)、721 nm(0.485)出現(xiàn)峰值,其中384 nm處相關(guān)系數(shù)最大(圖1)。以0.05顯著相關(guān)水平為依據(jù),篩選出了波長(zhǎng)處于350~650 nm、680~902 nm的522個(gè)原始光譜波段,作為多元逐步回歸模型的變量。
圖1 葉綠素與原始光譜反射率相關(guān)系數(shù)Fig.1 Correlation coefficient between chlorophyll content and original spectral reflectance
2.1.2 反演模型 因篩選出的522個(gè)原始光譜波段指標(biāo)之間存在多重共線性,利用多元逐步回歸消除多重共線性,建立多元回歸模型(表3)。
表3 多元逐步回歸模型
共建立了17個(gè)回歸模型,其中紫外光波段與紫光波段入選較多,引入紅光波段651 nm的模型17精度最高,RMSE最小(R2=0.889,RMSE=0.27),可以作為原始光譜葉綠素反演模型。
y=1.23×380 nm-0.356×363 nm+0.53×370 nm-0.462×439 nm+0.654×437 nm-0.789×373 nm-0.464×455 nm+0.325×459 nm-0.645×651 nm+0.424×466 nm+0.366×399 nm+0.232(R2=0.889,RMSE=0.27)
模型檢驗(yàn)結(jié)果見圖2(圖中虛線為趨勢(shì)線)。
估測(cè)值與實(shí)測(cè)值擬合情況較好,擬合精度R2=0.916 1,RMSE=0.05(圖2),說(shuō)明模型可以較好地反演高寒草地植物群落葉綠素。
圖2 精度檢驗(yàn)Fig.2 Accuracy test
2.2.1 Person相關(guān)系數(shù)法 經(jīng)Person相關(guān)性矩陣分析(圖3),植被指數(shù)RVI、SAVI、NDVI670、VARI、PSRI、ARVI、RGI、GI、OSAVI和GNDVI與葉綠素指標(biāo)的相關(guān)性較高,相關(guān)系數(shù)絕對(duì)值均大于0.42。
圖3 葉綠素與植被指數(shù)的Person相關(guān)系數(shù)Fig.3 Person correlation between chlorophyll and vegetation index注:圖形分為兩部分,上三角為相關(guān)系數(shù)與顯著性檢驗(yàn),下三角為散點(diǎn)圖與擬合曲線,圖中星號(hào)代表顯著性檢驗(yàn)P值,無(wú)*與*代表差異性不顯著,**與***代表差異性顯著,各變量的相關(guān)關(guān)系可在兩變量的行列交叉處找到。圖中植被指數(shù)對(duì)應(yīng)的橫縱坐標(biāo)無(wú)單位,葉綠素含量對(duì)應(yīng)的橫縱坐標(biāo)單位為(g/m2)
植被指數(shù)之間相關(guān)性多元逐步回歸消除植被指數(shù)之間的高相關(guān)性,建立的模型如下:
Y=6.675×OSAVI-2.166(R2=0.473,RMSE=0.525 6)。
2.2.2 主成分分析法 經(jīng)主成分分析降維(圖4)后的植被指數(shù)共有10個(gè)主成分。
圖4 碎石圖Fig.4 Scree plot
其中主成分1方差貢獻(xiàn)率為60.3%,主成分2方差貢獻(xiàn)率為17.4%,主成分3方差貢獻(xiàn)率為11.6%,而主成分4~10累積方差貢獻(xiàn)率不足10%,且主成分3到主成分4,斜率開始趨于平緩,因此剔除主成分4~10,只保留主成分1、2和3,這3個(gè)主成分既能達(dá)到降維的目的,又能反映原始數(shù)據(jù)89.3%的信息。
為研究各植被指數(shù)在3個(gè)主成分中的貢獻(xiàn)程度,列出原始因子特征向量以便討論各植被指數(shù)在主成分中的貢獻(xiàn)情況(表4)。
表4 原始因子特征向量
將特征向量帶入主成分公式中,得到主成分Z1、Z2和Z3的表達(dá)式:
Z1=0.3*R1-0.166*R2-0.246*R3-0.225*R4+0.303*R5+0.311*R6-0.304*R7+0.321*R8-0.303*R9+0.306*R10+0.106*R11+0.167*R12+0.167*R13+0.312*R14+0.194*R15
(1)
Z2=0.224*R1+0.396*R2+0.307*R3+0.343*R4+0.199*R5-0.059*R6-0.037*R7+0.118*R8-0.030*R9-0.024*R10+0.39*R11-0.310*R12-0.310*R13+0.145*R14+0.387*R15
(2)
Z3=0.148*R1-0.413*R2-0.217*R3-0.328*R4-0.113*R5-0.023*R6+0.019*R7-0.044*R8-0.056*R9-0.091*R10+0.084*R11-0.522*R12-0.522*R13-0.011*R14+0.192*R15
(3)
利用篩選出的3個(gè)主成分與葉綠素含量建立多元線性回歸模型:
y=0.401*Z1+2.812*Z2-2.968*Z3-3.415(R2=0.391,RMSE=0.577)。
但模型精度(R2=0.391)過(guò)低,無(wú)法反演高寒草地的葉綠素。
2.2.3 變量投影重要性法 利用VIP方法進(jìn)行重要性評(píng)價(jià),當(dāng)VIP值大于1時(shí),說(shuō)明該植被指數(shù)在估算植物葉綠素含量時(shí)具有重要作用。植被指數(shù)NDVI705與ARVI變量投影重要性大于1(圖6)。
利用NDVI705與ARVI建立葉綠素多元逐步回歸模型:
y=2.553×NDVI705+4.849×ARVI-1.861(R2=0.440,RMSE=0.547 8)
可明顯看出數(shù)據(jù)點(diǎn)與方程擬合面的擬合程度不佳,模型精度過(guò)低(圖6)。不能用于高寒草地群落葉綠素的反演。
圖5 VIP指數(shù)圖Fig.5 VIP Index Chart
圖6 3維模型圖Fig.6 3D model diagram
各種色素是支配植物光譜響應(yīng)的主要因素,其中葉綠素所起的作用最為重要[27]。本研究發(fā)現(xiàn),原始光譜敏感波段350~650 nm與680~902 nm的522個(gè)原始光譜波長(zhǎng)與高寒草地植物群落葉綠素的相關(guān)系數(shù)均達(dá)到了0.05的顯著相關(guān)水平。這522個(gè)原始光譜波長(zhǎng)大體分布于紫外波段(350~380 nm)、藍(lán)紫光波段(380~485 nm)、綠光波段(485~565 nm)、部分紅光波段(625~650 nm、680~740 nm)與部分近紅外波段(780~902 nm)。
350~380 nm紫外波段與葉綠素相關(guān)系數(shù)高的原因主要為試驗(yàn)地位于海拔3 000 m以上的高寒草地,紫外輻射強(qiáng)度較高,而葉綠素對(duì)紫外光都有較強(qiáng)的吸收作用[28]。范雅等[30-31]的相關(guān)研究也顯示了葉綠素對(duì)近紫外線波段范圍內(nèi)的光具有較強(qiáng)的吸收,并指出該波段對(duì)葉綠素含量估算具有很大潛力。
綠色植物在450~500 nm為中心的藍(lán)光波段及以650~680 nm為中心的紅光波段,由于光合色素強(qiáng)烈吸收太陽(yáng)輻射能而形成兩個(gè)通常被稱為“藍(lán)谷”和“紅谷”的低反射區(qū)。在這兩個(gè)低反射區(qū)之間的550 nm附近,植物葉片對(duì)輻射能吸收很少,因而形成了綠光波段反射峰。本研究結(jié)果說(shuō)明高寒草地植物群落在528 nm形成高反射峰,該波段對(duì)植物葉綠素含量極為敏感。
植物光譜曲線在紅光波段的葉綠素吸收谷與近紅外波段的高反射率之間的陡升部分,在700~750 nm處,被稱為植物的“紅邊”區(qū),典型綠色植被光譜曲線均具有明顯的“紅邊”特征。研究[32,34]表明,植物紅光波段(640~780 nm)與葉綠素含量相關(guān)性較好,本研究也發(fā)現(xiàn),原始光譜波段721 nm與葉綠素相關(guān)性也較高。但近紅外波段(780~1 000 nm)葉片光譜反射率受葉片色素含量影響較小,主要受葉片內(nèi)部生理結(jié)構(gòu)蛋白質(zhì)纖維素和含水率等影響[35],解釋了721 nm后相關(guān)系數(shù)降低的現(xiàn)象。
本研究中,原始光譜多元逐步回歸模型在剔除了諸多變量后,得到了模型17,模型精度R2達(dá)到0.89,其中波段多為紫外波段、藍(lán)紫光波段與紅光波段的651 nm,說(shuō)明高海拔紫外輻射強(qiáng)地區(qū),紫外波段、藍(lán)紫光波段與紅光波段對(duì)高寒植物群落的葉綠素有重要影響。
單一原始光譜反射率有時(shí)對(duì)植物指標(biāo)不敏感,而且光譜測(cè)定時(shí)易受到外界環(huán)境如土壤背景、大氣氣溶膠等影響,此時(shí)結(jié)合不同波段的植被指數(shù),可以增強(qiáng)植物指標(biāo)特征或消除環(huán)境因子的影響。本研究利用Person相關(guān)系數(shù)法分析了葉綠素的光譜敏感波段與高相關(guān)性植被指數(shù),結(jié)果發(fā)現(xiàn)單波段(原始光譜)與葉綠素的相關(guān)系數(shù)遠(yuǎn)低于波段組合(植被指數(shù)),證明植被指數(shù)在高寒草地群落葉綠素指標(biāo)的反演中優(yōu)于單波段(原始光譜)。程乾等[36]的分析也發(fā)現(xiàn)基于美國(guó)衛(wèi)星遙感器EMODIS歸一化植被指數(shù)(EMODIS-NDVI)、增強(qiáng)植被指數(shù)(EVI)及紅邊位置指數(shù)(REP)與水稻葉片葉綠素含量的相關(guān)性高于可見光、近紅外波段;易秋香等[34]對(duì)不同品種玉米葉片的葉綠素含量的反演結(jié)果發(fā)現(xiàn)植被指數(shù)優(yōu)于單一特征變量,與本文研究結(jié)果一致。
在植被不同的生長(zhǎng)時(shí)期,土壤背景及其變化對(duì)植被葉綠素含量的反演將產(chǎn)生一定的影響,因此反演葉綠素含量時(shí),尤其是當(dāng)植被覆蓋度較低時(shí)必須考慮土壤背景的影響。本研究通過(guò)Person相關(guān)系數(shù)分析發(fā)現(xiàn),可以修正土壤背景對(duì)植被指數(shù)的影響的植被指數(shù)OSAVI與高寒草地植物群落葉綠素的相關(guān)系數(shù)最高,而變量投影重要性分析也得出NDVI705與OSAVI為重要變量。NDVI705是NDVI的改進(jìn)型,它對(duì)葉冠層的微小變化十分敏感,OSAVI有較好的抗土壤干擾的能力,因此土壤背景與植物冠層的差異是影響高寒草地葉綠素含量反演的主要因素。
本研究還發(fā)現(xiàn),原始光譜的多元逐步回歸模型精度遠(yuǎn)優(yōu)于其余模型,這主要是因?yàn)槎嘣鸩交貧w法是眾多數(shù)學(xué)建模方法中針對(duì)線性問(wèn)題的一種處理方法,該方法可以處理多個(gè)變量,不僅僅能解決單一因素所造成的影響,還可以將涉及到的所有變量以及可能影響結(jié)果的眾多因素都帶入回歸方程,逐步排除,最終選取最佳的回歸方程,并提供相應(yīng)的驗(yàn)證參數(shù)。光譜模型受空間、時(shí)間、環(huán)境影響較大,利用該方法可以全面考量全光譜波段,是影響因素多時(shí)較為理想和便捷的解決方法。余蛟洋等[26]和沈佳等[37]的研究結(jié)果也表明了多元逐步回歸模型在處理光譜信息時(shí)的優(yōu)勢(shì)作用。
綜上所述,本研究所建立的原始光譜變量的多元逐步回歸模型可以用于高寒草地植物群落葉綠素的反演。下一步擬進(jìn)行其他營(yíng)養(yǎng)指標(biāo)的高光譜反演研究,為高寒草地群落的遙感監(jiān)測(cè)提供理論支持。
原始光譜384、528、721 nm波段的反射率與高寒草地植物群落的葉綠素相關(guān)系數(shù)較高,共篩選出522個(gè)原始光譜波段作為多元逐步回歸變量;植被指數(shù)RVI、SAVI、NDVI670、VARI、PSRI、ARVI、RGI、GI、OSAVI、GNDVI與群落葉綠素顯著相關(guān),且優(yōu)于單波段原始光譜;利用篩選出敏感波段的原始光譜反射率與植被指數(shù)指標(biāo)建立反演模型,其中原始光譜多元逐步回歸模型精度(R2=0.889)最高,且模型檢驗(yàn)結(jié)果較好(R2= 0.9161,RMSE=0.05),可作為高寒草地植物群落葉綠素的反演模型。