鄧再春,張 超,2,朱夏力,范金明,錢 慧,李成榮
(1.西南林業(yè)大學(xué) 林學(xué)院,云南 昆明 650224;2.西南林業(yè)大學(xué) 云南省山地農(nóng)村生態(tài)環(huán)境演變與污染治理重點(diǎn)實(shí)驗(yàn)室,云南 昆明 650224)
森林蓄積量是一定森林面積上所有活立木材積的總和[1]。作為森林生物量和碳儲(chǔ)量的重要評(píng)價(jià)指標(biāo),森林蓄積量能直接反映森林資源的數(shù)量與質(zhì)量,是森林資源調(diào)查的重要因子之一。隨著無(wú)人機(jī)遙感技術(shù)的快速發(fā)展,無(wú)人機(jī)載可見光/多光譜遙感影像在森林資源調(diào)查領(lǐng)域得以快速推廣,為森林蓄積量調(diào)查提供了快速高效的技術(shù)手段。傳統(tǒng)的森林蓄積量調(diào)查主要以地面調(diào)查為主,此類調(diào)查周期長(zhǎng),對(duì)人力、物力的需求量巨大[2]。20 世紀(jì)90 年代以來(lái),國(guó)內(nèi)外學(xué)者通過(guò)獲取單一或多源遙感影像,以地面調(diào)查數(shù)據(jù)作為因變量,以各類植被指數(shù)、紋理特征、地形因子等作為自變量,采用主成分分析、偏最小二乘法、逐步回歸、隨機(jī)森林、k鄰近模型等方法建立回歸模型,估測(cè)森林蓄積量,進(jìn)行了較多有益的探索[3-5]。衛(wèi)星遙感影像具有長(zhǎng)時(shí)序、大尺度、易獲取等優(yōu)勢(shì),但其影像易受天氣影響,且難以兼顧分辨率和成本。無(wú)人機(jī)具有成本低、機(jī)動(dòng)靈活、影像分辨率高等優(yōu)點(diǎn),作為傳統(tǒng)遙感估測(cè)的補(bǔ)充手段,在森林資源調(diào)查中得到了廣泛應(yīng)用。通過(guò)搭載可見光、多光譜、高光譜、激光雷達(dá)等多種傳感器,可獲得低空地表有關(guān)森林資源的多層面數(shù)據(jù)[6]。大量研究表明:基于無(wú)人機(jī)航拍影像估測(cè)森林蓄積量具有較高的可行性。利用無(wú)人機(jī)航拍影像估測(cè)森林蓄積量主要包括2 個(gè)角度:① 基于數(shù)字正射影像(DOM)、數(shù)字表面模型(DSM)、冠層高度模型(CHM)獲取林分株數(shù)、胸徑、冠幅、樹高等因子,從單木、林分2 個(gè)角度進(jìn)行蓄積量估測(cè)[7-12];② 基于影像提取各類植被指數(shù)、紋理特征、地形因子等,建立森林蓄積量估測(cè)模型,或是建立單株材積估測(cè)模型,再進(jìn)一步計(jì)算森林蓄積量[13-14]。
無(wú)人機(jī)多光譜影像較可見光影像具有更豐富的光譜信息,可計(jì)算對(duì)森林蓄積量敏感的各類植被指數(shù),已被廣泛用于植被參數(shù)信息的提取研究,在未來(lái)森林蓄積量估測(cè)研究中具有較大的潛力[14]?,F(xiàn)有研究大多以無(wú)人機(jī)獲取的可見光影像為基礎(chǔ),對(duì)無(wú)人機(jī)載多光譜影像的嘗試相對(duì)較少。本研究基于大疆精靈4 多光譜版無(wú)人機(jī)拍攝的多光譜影像,在不進(jìn)行影像分割的情景下,提取研究區(qū)單波段反射率、各類植被指數(shù)、紋理特征等因子,計(jì)算標(biāo)準(zhǔn)地范圍內(nèi)的均值,建立云南松Pinusyunnanensis林蓄積量估測(cè)模型,分析其在森林蓄積量估測(cè)建模中的可行性和適用性,旨在為今后森林蓄積量的遙感估算研究提供有益的方法參考。
研究區(qū)位于云南省昆明市富民縣羅免鄉(xiāng)(25°16′21″~25°25′26″N,102°20′46″~102°29′14″E)。該地區(qū)屬天然云南松林分布的典型區(qū)域,地勢(shì)西南、西北高,東南低。屬于低緯度亞熱帶高原季風(fēng)氣候區(qū),四季溫差小,干濕季分明,年平均氣溫為15.8 ℃,年平均降水量為847.0 mm,研究區(qū)內(nèi)以典型的天然云南松純林為主。
于2022 年10 月在研究區(qū)內(nèi)選取能充分代表林分總體特征平均水平的地塊,設(shè)置大小為25 m×25 m 的標(biāo)準(zhǔn)地,共63 個(gè)。對(duì)標(biāo)準(zhǔn)地內(nèi)胸徑≥5.0 cm 的所有活立木進(jìn)行每木定位,并測(cè)量胸徑、樹高、最長(zhǎng)冠幅、最短冠幅。標(biāo)準(zhǔn)地林分因子見表1。根據(jù)實(shí)測(cè)的胸徑、樹高,利用二元立木材積公式計(jì)算單木材積,在此基礎(chǔ)上計(jì)算標(biāo)準(zhǔn)地的蓄積量。云南松林二元立木材積公式:
表1 標(biāo)準(zhǔn)地林分因子匯總Table 1 Summary of stand factors in sample plots
其中:V為材積(m3);D為胸徑(cm);H為樹高(m)。
大疆精靈4 多光譜無(wú)人機(jī)作為多光譜影像采集平臺(tái),集成了1 個(gè)可見光相機(jī)和5 個(gè)多光譜相機(jī)[包括紅光(B1)、綠光(B2)、藍(lán)光(B3)、紅邊(B4)和近紅外(B5)波段]。于2022 年11 月14 日利用大疆精靈4 多光譜無(wú)人機(jī),采用DJI GS PRO 地面站軟件從各標(biāo)準(zhǔn)地獲取多光譜影像數(shù)據(jù)。飛行高度設(shè)置為100 m,航向和旁向重疊率均設(shè)置為85%。利用DJI Terra 軟件對(duì)原始圖像進(jìn)行預(yù)處理,生成數(shù)字正射影像(DOM)和數(shù)字表面模型(DSM)。將5 個(gè)單波段的合成圖像在ArcGIS 中合成為多光譜影像(影像分辨率為5.3 cm),計(jì)算所需的各類特征變量。
1.4.1 單波段反射率及植被指數(shù) 植被指數(shù)是指多光譜遙感數(shù)據(jù)經(jīng)過(guò)線性或非線性數(shù)學(xué)運(yùn)算,產(chǎn)生能反映植被生長(zhǎng)狀況的數(shù)值,已廣泛用于森林蓄積量建模反演[15]。提取多光譜影像中紅光、綠光、藍(lán)光、紅邊、近紅外等5 個(gè)波段的反射率(b1、b2、b3、b4、b5),計(jì)算蓄積量估測(cè)中常用的植被指數(shù):歸一化植被指數(shù)(NDVI),比值植被指數(shù)(RVI),差值植被指數(shù)(DVI),大氣抗阻植被指數(shù)(ARVI),以及根據(jù)可見光波段計(jì)算的植被指數(shù):過(guò)綠指數(shù)(EXG)[16],綠藍(lán)比值指數(shù)(GBRI)[17],綠紅比值指數(shù)(GRRI)[18],歸一化綠藍(lán)差異指數(shù)(NGBDI)[19],歸一化綠紅差異指數(shù)(NGRDI)[20],可見光波段差異植被指數(shù)(VDVI)[21]等10 個(gè)植被指數(shù)。
1.4.2 紋理特征 在蓄積量估測(cè)中加入紋理特征有助于提高蓄積量的估算精度[22-24]。為避免影像高頻空間信息的丟失,選擇較小的3×3 窗口提取紋理特征[25]。借助ENVI 5.3 的紋理提取工具,在3×3 窗口下,通過(guò)灰度共生矩陣提取紋理特征,主要包括方差(VA),均值(ME),協(xié)同性(HO),熵(EN),對(duì)比度(CO),二階矩(SM),相異性(DI)和相關(guān)性(CC)[14]。5 個(gè)波段共40 個(gè)紋理特征。
1.4.3 均值計(jì)算與特征變量篩選 由于標(biāo)準(zhǔn)地為方形標(biāo)準(zhǔn)地,且部分樣地郁閉度較低,所以以標(biāo)準(zhǔn)地中的某一點(diǎn)提取各特征變量值不能充分反映標(biāo)準(zhǔn)地特征。本研究以標(biāo)準(zhǔn)地邊界為矢量區(qū)域,借助ArcGIS 的分區(qū)統(tǒng)計(jì)工具計(jì)算標(biāo)準(zhǔn)地范圍內(nèi)各特征變量的平均值作為自變量,建立蓄積量估測(cè)模型[26]??捎糜诮⑿罘e量估測(cè)模型的因子會(huì)隨著研究區(qū)、數(shù)據(jù)源、成像時(shí)間等的差異而不同,在建立模型之前對(duì)蓄積量與各特征變量進(jìn)行Pearson 相關(guān)性分析,篩選與蓄積量相關(guān)性較高的特征變量構(gòu)建模型。
根據(jù)相關(guān)性分析的結(jié)果,選擇在0.01 水平與蓄積量極顯著相關(guān)的特征變量為自變量,按照7∶3 比例隨機(jī)劃分訓(xùn)練集和測(cè)試集,采用多元線性回歸(MLR)、支持向量機(jī)(SVR)、隨機(jī)森林(RF)等3 種回歸方法建立蓄積量估測(cè)模型。
利用決定系數(shù)(R2)、均方根誤差(ERMS)、平均絕對(duì)誤差(EMA)、平均相對(duì)誤差(EMR)進(jìn)行精度評(píng)價(jià)[26]。
將單波段反射率、植被指數(shù)、紋理特征與蓄積量進(jìn)行相關(guān)分析(表2),5 個(gè)波段反射率中,蓄積量與b1、b2無(wú)顯著相關(guān)性,與b3呈極顯著負(fù)相關(guān)(P<0.01),與b4、b5呈極顯著正相關(guān)(P<0.01)。
表2 蓄積量與單波段反射率、植被指數(shù)的相關(guān)性Table 2 Correlation between forest volume and single band reflectance and vegetation indexes
在植被指數(shù)中,NGRDI 與蓄積量不相關(guān),NGBDI 與蓄積量呈顯著正相關(guān)(P<0.05)外,其余植被指數(shù)均與蓄積量呈極顯著正相關(guān)(P<0.01)。
如表3 所示:在8 個(gè)紋理特征中,HO、EN 與蓄積量的相關(guān)性較高,VA、CO、DI 次之,CC、SM、ME 與蓄積量的相關(guān)性較低。比較5 個(gè)波段提取的紋理特征,與蓄積量顯著相關(guān)的紋理特征數(shù)由大到小依次為B5、B4、B1、B2、B3。
表3 蓄積量與紋理特征的相關(guān)性Table 3 Correlation between forest volume and texture factors
根據(jù)相關(guān)性分析結(jié)果,篩選出26 個(gè)在0.01 水平與蓄積量顯著相關(guān)的因子,分別為單波段反射率b3、b4、b5,植被指數(shù)RVI、NDVI、DVI、VDVI、EXG、ARVI、GBRI、GRRI,紋理特征B1-EN、B1-HO、B1-ME、B2-EN、B2-HO、B3-EN、B4-CO、B4-DI、B4-HO、B4-VA、B5-CO、B5-DI、B5-EN、B5-HO、B5-VA。
2.2.1 多元線性回歸 傳統(tǒng)的線性回歸模型易受自變量間共線性的影響,利用主成分分析可將原始的多個(gè)變量轉(zhuǎn)化為少數(shù)主成分因子,每個(gè)主成分之間相互獨(dú)立,克服自變量間的多重共線性的同時(shí)保留了原始變量的絕大部分信息[3-4]。根據(jù)特征根和累計(jì)方差解釋率確定主成分個(gè)數(shù)(表4)。當(dāng)主成分個(gè)數(shù)為4 個(gè)時(shí),累計(jì)方差解釋率達(dá)93.66%,因此確定主成分為C1、C2、C3、C4。
表4 主成分分析結(jié)果Table 4 Principal component analysis
提取的4 個(gè)主成分因子與原始變量的線性關(guān)系如表5,利用提取出的4 個(gè)主成分因子建立多元線性回歸模型:M=41.569+11.949C1-2.162C2+2.020C3-2.706C4。其中:M為蓄積量(m3·hm-2);C1、C2、C3、C4為主成分分析提取的主成分因子。
表5 主成分與原始變量的線性關(guān)系Table 5 Linear relationship between principal components and original variables
2.2.2 隨機(jī)森林 本研究使用Matlab 建立隨機(jī)森林回歸模型,決策樹數(shù)目為100,最小葉子數(shù)為1,其余參數(shù)均為默認(rèn)值。如圖1 所示:隨機(jī)森林模型中,變量重要性前5 位的均為紋理特征,說(shuō)明紋理特征對(duì)于蓄積量估測(cè)模型的重要性不可忽視。紋理特征間的重要性程度差異大,不同波段間也存在較大差異;植被指數(shù)對(duì)模型的影響比較穩(wěn)定,植被指數(shù)間除GRRI 外無(wú)明顯差異。
圖1 隨機(jī)森林模型變量重要性Figure 1 Importance of random forest model variables
2.2.3 支持向量機(jī) 基于Matlab 借助LIBSVM 工具箱構(gòu)建支持向量回歸(SVR)模型,支持向量機(jī)(SVM)類型為e-SVR,函數(shù)選擇徑向基核函數(shù)(RBF),涉及懲罰系數(shù)(c)和徑向基核函數(shù)的參數(shù)(γ)這2 個(gè)重要參數(shù)。利用格網(wǎng)化尋優(yōu),得到最佳c、γ分別為4、0.062 5。
精度評(píng)價(jià)結(jié)果:在訓(xùn)練集上,隨機(jī)森林模型精度最高(R2=0.89,EMA=4.69 m3·hm-2,ERMS=5.45 m3·hm-2,EMR=14.5%),支持向量機(jī)次之(R2=0.74,EMA=5.27 m3·hm-2,ERMS=8.31 m3·hm-2,EMR=13.1%),多元線性回歸精度最低(R2=0.35,EMA=10.12 m3·hm-2,ERMS=12.85 m3·hm-2,EMR=28.1%)。在測(cè)試集上,隨機(jī)森林精度仍最高(R2=0.69,EMA=7.59 m3·hm-2,ERMS=9.05 m3·hm-2,EMR=26.4%),其次是支持向量機(jī)(R2=0.55,EMA=10.51 m3·hm-2,ERMS=12.45 m3·hm-2,EMR=38.5%),多元線性回歸最低(R2=0.33,EMA=10.08 m3·hm-2,ERMS=12.21 m3·hm-2,EMR=34.9%)。3 種模型的測(cè)試集精度均有降低。
根據(jù)估測(cè)蓄積量與實(shí)測(cè)蓄積量繪制散點(diǎn)圖。在訓(xùn)練集上(圖2A~C),隨機(jī)森林和支持向量機(jī)模型離散程度較小,散點(diǎn)在兩側(cè)分布較均勻,模型擬合效果較好;多元線性回歸模型散點(diǎn)在兩側(cè)分布較均勻,但離散程度較高,模型擬合較差。在測(cè)試集上(圖2D~F),3 種模型散點(diǎn)在兩側(cè)分布不均勻,隨機(jī)森林離散程度小,其余2 種模型離散程度大。3 種模型在訓(xùn)練集、測(cè)試集上均存在一定的低值高估和高值低估現(xiàn)象。
圖2 實(shí)測(cè)蓄積量與估算蓄積量之間的相關(guān)關(guān)系Figure 2 Correlation between measured forest volume and estimated forest volume
本研究基于無(wú)人機(jī)多光譜影像提取單波段反射率、各類植被指數(shù)、紋理特征,并計(jì)算其標(biāo)準(zhǔn)地均值,利用結(jié)合主成分分析的多元線性回歸、隨機(jī)森林、支持向量機(jī)等建立蓄積量估測(cè)模型,結(jié)果表明:隨機(jī)森林模型的精度最高,支持向量機(jī)次之,多元線性回歸最低。
蘇迪等[10]根據(jù)平均胸徑、平均樹高、坡度、坡向等因子建立蓄積量估測(cè)模型(模型R2=0.738,ERMS=5.135 8 m3·hm-2),曾霞輝[11]提取平均冠幅、郁閉度、平均樹高、株數(shù)密度建立蓄積量估測(cè)模型(模型對(duì)應(yīng)的R2、EMR分別為0.64~0.78、18.93%~39.68%)。本研究所建立隨機(jī)森林模型和支持向量機(jī)模型的誤差水平與其基本一致,多元線性回歸模型精度較低。
于東海[13]在對(duì)遼寧老禿頂子國(guó)家級(jí)自然保護(hù)區(qū)的蓄積量估測(cè)研究中,提取植被指數(shù)、紋理特征、地形因子,并通過(guò)主成分分析提取主成分因子建立多元線性回歸模型,模型R2為0.88,擬合效果良好,測(cè)試集平均相對(duì)誤差為9.96%。與該研究相比,本研究結(jié)合主成分分析法建立的多元線性回歸模型R2為0.35,測(cè)試集的平均相對(duì)誤差為34.9%,精度較低。對(duì)研究區(qū)進(jìn)行對(duì)比發(fā)現(xiàn),于東海[13]所選研究區(qū)森林覆蓋率97%,郁閉度、樣地單位面積蓄積量高;本研究區(qū)郁閉度差異大,標(biāo)準(zhǔn)地單位面積蓄積量低,最大值為79.49 m3·hm-2,最小值低至7.90 m3·hm-2,平均值為41.97 m3·hm-2。2 個(gè)研究區(qū)森林郁閉度存在較大差異,估測(cè)精度可能受到郁閉度的影響。
不同窗口下提取的紋理特征對(duì)蓄積量估測(cè)精度存在一定影響,提取窗口過(guò)大或過(guò)小都會(huì)造成紋理特征的錯(cuò)誤分割進(jìn)而影響估測(cè)精度[27]。基于無(wú)人機(jī)多光譜影像,在不同窗口大小下提取的紋理特征對(duì)蓄積量估測(cè)精度的影響有待進(jìn)一步研究。
研究區(qū)林分較稀疏,在部分標(biāo)準(zhǔn)地中,有少量的樹木位于標(biāo)準(zhǔn)地邊界附近,其部分樹冠在標(biāo)準(zhǔn)地邊界之外。計(jì)算各變量均值時(shí),此部分樹冠所對(duì)應(yīng)的特征變量沒有參與均值計(jì)算,可能對(duì)估測(cè)精度產(chǎn)生一定的影響。
以大疆精靈4 無(wú)人機(jī)獲取滇中地區(qū)典型天然云南松林多光譜影像,提取并計(jì)算標(biāo)準(zhǔn)地單波段反射率、植被指數(shù)、紋理特征均值,共55 個(gè)特征變量,經(jīng)相關(guān)性分析篩選出26 個(gè)變量參與模型構(gòu)建。通過(guò)對(duì)隨機(jī)森林、支持向量機(jī)、多元線性回歸3 種模型進(jìn)行精度評(píng)價(jià),最佳估測(cè)模型為隨機(jī)森林。3 種模型在估測(cè)蓄積量時(shí)均存在一定的低值高估和高值低估現(xiàn)象。與同類型研究的蓄積量估測(cè)誤差水平基本一致,表明在不進(jìn)行單木分割的情況下,利用無(wú)人機(jī)多光譜影像提取各因子,以各因子的標(biāo)準(zhǔn)地均值建立模型估測(cè)蓄積量具有一定的可行性。