賈艷才
(河北省塞罕壩機(jī)械林場,河北 承德 067000)
葉面積指數(shù)(Leaf area index,LAI)是一種關(guān)鍵性的參數(shù),可清楚表明植被的生理狀態(tài)。在遙感反演中,通常認(rèn)為LAI是單位地面上冠層葉片垂直投影到水平面上的面積總和[1]。LAI在植物的光合作用和蒸騰作用等生理生化活動中起著至關(guān)重要的作用[2-4]。因此,快速準(zhǔn)確地獲取大尺度的LAI具有重要意義。
LAI的傳統(tǒng)測量方法包括破壞性取樣法、異速生長方程法和凋落物收集法[5-8]。但這些傳統(tǒng)的方法不僅耗時耗力,而且很難得到大尺度的LAI數(shù)據(jù)。隨著遙感技術(shù)的不斷發(fā)展,空間分辨率的傳感器逐步推新,使用遙感技術(shù)進(jìn)行反演成為獲得大尺度下森林LAI的有力手段。孫華[9]等利用偏最小二乘回歸法對攸縣黃豐橋林場的LAI進(jìn)行了反演。陳艷華[10]等通過引入土壤反射指數(shù),研究出PROSAIL可以實現(xiàn)LAI的反演工作。Campos-Taberner[11]等將PROSAIL模型與人工神經(jīng)網(wǎng)絡(luò)法結(jié)合對地中海區(qū)域內(nèi)水稻的不同時相和空間分辨率進(jìn)行了LAI的反演。PROSAIL模型相比于經(jīng)驗關(guān)系法明確了物理意義,適用于更多種植被類型以及更廣的空間范圍,但此模型還存在一定弊端,如需要參數(shù)眾多,并且部分參數(shù)難以獲得。當(dāng)前研究中利用單個植被指數(shù)反演LAI時通常會受到飽和性、包含的波段信息不足等而影響反演精度[12],并且研究對象多是純林,對于樹種差異性是否對LAI的反演精度有影響沒有深入研究[13]。
目前在研究中若要分樹種建立LAI的反演模型,則要測得足夠的樣本量,費(fèi)時費(fèi)力,而當(dāng)研究區(qū)域樹種類型較多時,分樹種建立反演模型就很難繼續(xù)下去。因此,引入啞變量體現(xiàn)了不同樹種對LAI反演的作用,相當(dāng)于將不同類型的樣本合并,擴(kuò)大了樣本容量,提高了模型精度。
本文以塞罕壩機(jī)械林場中的千層板林場、北曼甸林場和二道口林場部分區(qū)域為研究區(qū)域。塞罕壩位于河北省承德市圍場滿族蒙古族自治縣境內(nèi),坐標(biāo)為E116°32′~118°14′,N41°35′~42°40′。極端最高氣溫33.4℃,最低氣溫-43.3℃,年均氣溫-1.3℃,年均降水量460.3mm,是典型的半干旱半濕潤寒溫性大陸季風(fēng)氣候。塞罕壩處于典型的森林—草原交錯帶,地形以山地、高原、丘陵、曼甸為主。土壤類型大多為山地棕壤、森林土和風(fēng)沙土。林場的樹種以落葉松、樟子松、白樺、云杉等為主,森林覆蓋率達(dá)80%,林木年平均生長率為9.7%,總蓄積達(dá)到1012×104m3。
在承德塞罕壩機(jī)械林場中的千層板林場、北曼甸林場和二道口林場部分區(qū)域范圍內(nèi)以“隨機(jī)采樣”為原則設(shè)置樣地共178個(白樺40個,落葉松56個,樟子松48個,云杉34個),同時盡量使樣地在研究區(qū)域內(nèi)均勻分布(見圖1)。在樣地的2條對角線各均勻取3個點(diǎn)進(jìn)行測量,其中2條對角線中點(diǎn)重合,即1個樣地內(nèi)LAI測量點(diǎn)為5個。使用光學(xué)儀器LAI-2200C在每個測量點(diǎn)進(jìn)行4個不同方向的測量,每個方向測量3次。將1個樣地內(nèi)測量的LAI所有數(shù)據(jù)的平均值作為該樣地的LAI值。
圖1 樣地分布圖
1.2.1 遙感影像的處理
利用Snap和Sen2Cor軟件對獲得的2019年8月8日的哨兵2號遙感影像(http://blog.sina.com.cn/s/blog_764b1e9d0102wek0.html)進(jìn)行幾何校正、正射校正、輻射校正、大氣校正、拼接裁剪處理,最終得到研究區(qū)域的遙感影像。
1.2.2 植被指數(shù)與地形因子的獲取
植被指數(shù)是反映綠色植被的相對豐度和活性的輻射量值,通過計算遙感影像不同光譜波段間的線性和非線性組合來實現(xiàn)[14]。本研究采用了以下幾種植被指數(shù),具體表達(dá)式如表1所示。
植被指數(shù)的獲取主要通過ENVI中的波段運(yùn)算獲得。地形因子主要為DEM。
表1 植被指數(shù)表
綠色植物由于光合作用,對可見光,特別是紅光會強(qiáng)烈吸收,而在近紅外波段則吸收率非常低。由于這些獨(dú)特的光譜特性,使得遙感波段中包含了很多植物冠層葉片的信息。本文通過對遙感影像的原始波段以及相關(guān)的植被指數(shù)和地形因子來構(gòu)建LAI的反演模型。
1.3.1 基本模型
線性模型在LAI反演中已得到廣泛應(yīng)用[9],以線性模型作為LAI反演模型的基礎(chǔ)模型:
LAI=a0+a1X1+…+anXn+ε
式中,LAI為葉面積指數(shù),a0、a1…an為參數(shù),X1、X2…X3為各變量因子,ε為誤差項。
各因子與LAI的關(guān)系并不完全符合線性關(guān)系,利用R語言中的spreadLevelPlot函數(shù)檢查各變量的方差齊性,通過推薦的冪轉(zhuǎn)換參數(shù),對原始數(shù)據(jù)進(jìn)行冪轉(zhuǎn)換。除此之外,還對原始數(shù)據(jù)進(jìn)行對數(shù)變換,增加線性擬合的準(zhǔn)確度。
1.3.2 啞變量模型
基于基礎(chǔ)模型的啞變量模型的基本形式為:
LAI=b0+∑aizi+b1X1+b2X2…bnXn+ε
式中,LAI為因變量,b0、b1…bn為參數(shù),X1、X2…X3為各變量因子,zi為啞變量,ai為相應(yīng)的啞變量參數(shù),ε為誤差項。
依據(jù)模型的需要對類別特征進(jìn)行編碼處理,為了避免引起多重共線性,一般類別為k的特征需要編碼為一組k-1個衍生啞變量,以表示特征內(nèi)部的所有類別。將樹種作為啞變量,由于樹種有4個水平,因此得到3個衍生啞變量。
當(dāng)樹種為落葉松時,樹種落葉松取值為1,樹種樟子松取值為0,樹種云杉取值為0。
當(dāng)樹種為樟子松時,樹種落葉松取值為0,樹種樟子松取值為1,樹種云杉取值為0。
當(dāng)樹種為云杉時,樹種落葉松取值為0,樹種樟子松取值為0,樹種云杉取值為1。
當(dāng)樹種為白樺時,樹種落葉松取值為0,樹種樟子松取值為0,樹種云杉取值為0。
1.3.3 模型評價
模型結(jié)果采用確定系數(shù)R2、均方根誤差RMSE、平均相對誤差ME、赤池信息準(zhǔn)則AIC。
AIC=2p-2ln(L)=Nln(SSE)-Nln(N)+2p
對所有的變量因子進(jìn)行全局擇優(yōu),選擇使R2最大的變量因子作為模型的自變量。由圖2可以看出,B5、B6、B9、B10、B11、B12、B13以及B19對R2貢獻(xiàn)比較大。
圖2 變量因子篩選圖
變量的詳細(xì)信息如表2所示,對比植物的光譜曲線發(fā)現(xiàn),各變量的中心波長都處于植被光譜曲線的反射波峰,表明這些變量蘊(yùn)含了很多植物冠層葉片信息,可以通過這些變量來反演LAI。而DEM則反映了同一樹種在不同海拔的情況下葉面積指數(shù)也會發(fā)生變化[15,16]。
表2 變量信息表
將8個變量因子進(jìn)行線性擬合,利用R中的model.matrix函數(shù)將樹種轉(zhuǎn)化為3個虛擬變量,構(gòu)建啞變量模型。模型構(gòu)建如下。
線性模型:
啞變量模型:
使用R2、RMSE、ME、AIC值對模型進(jìn)行檢驗與評價。R2介于0~1,R2越大說明模型精度越高;RMSE、ME、AIC值越小越好,說明模型擬合誤差低。通過表3可知,雖然模型的平均相對誤差都為0,但啞變量的R2略高于線性模型,RMSE和AIC值都低于
表3 模型評價表
線性模型,表示將樹種作為啞變量有助于提高LAI的反演精度。從圖3中可以看出,啞變量模型的殘差分布范圍更加均勻。用已構(gòu)建好的啞變量模型結(jié)合研究區(qū)域的遙感影像和DEM,反演得到研究區(qū)域的LAI分布圖(圖4)。
圖3 模型殘差分布圖
圖4 研究區(qū)域LAI分布圖
本文以塞罕壩地區(qū)落葉松、樟子松、白樺及云杉為例,選用線性模型來對構(gòu)建LAI的反演模型。利用全局則優(yōu)來挑選適合的模型自變量,最終選擇的變量為:B5:vegetation red edge(中心波長:0.740um)、B6:vegetation red edge(中心波長:0.705um)、B9:blue(中心波長:0.490um)、B10:SWIR(中心波長:1.610um)、B11:SWIR(中心波長:2.190um)、B12:coastal aerosol(中心波長:0.443um)、B13:NDVI、B19:DEM。其中,前7個變量主要是不同光譜信息對LAI的影響,DEM則主要是LAI對地形因子的響應(yīng)。通過對模型指標(biāo)的評價,啞變量模型提高了LAI反演的預(yù)測精度以及適用性,為大尺度區(qū)域LAI的反演提供一定參考。