張 蘇,周小成*,黃洪宇,馮芝清
(1.福州大學(xué) 地理空間信息技術(shù)國家地方聯(lián)合工程研究中心 空間數(shù)據(jù)挖掘與信息共享教育部重點(diǎn)實(shí)驗(yàn)室, 福建 福州 350116;2.福建金森林業(yè)股份有限公司, 福建 將樂 353300)
森林蓄積量指的是森林中林木材積的總量。它是反映國家或地區(qū)的森林資源總體規(guī)模和水平的一項重要依據(jù)指標(biāo),也能反映森林資源的豐富程度,并衡量優(yōu)劣的森林生態(tài)環(huán)境[1-3]。根據(jù)少部分野外實(shí)地調(diào)查樣地數(shù)據(jù)并結(jié)合遙感影像,構(gòu)建以野外實(shí)地調(diào)查數(shù)據(jù)為基準(zhǔn)的蓄積量估測模型,可最大程度地減少野外實(shí)地調(diào)查的工作量,蓄積量模型的構(gòu)建與應(yīng)用具有很重要的研究價值和實(shí)際意義。傳統(tǒng)方法測定蓄積量主要是由全國森林一、二類清查獲取數(shù)據(jù)[4],存在工作量巨大、時間久、耗費(fèi)經(jīng)費(fèi)多及間隔期長等問題。近十年來“3S”技術(shù):航天遙感技術(shù)(RS)、地理信息系統(tǒng)(GIS)與計算機(jī)的發(fā)展以及與數(shù)學(xué)模型的結(jié)合應(yīng)用,為森林蓄積量的估測帶來了新的發(fā)展方向[5-7]。當(dāng)前,基于高分辨率遙感影像的森林蓄積量建模估測[8]研究主要分為以下兩個方面: 一方面是探索高分辨率遙感影像中與森林參數(shù)相關(guān)性較強(qiáng)的因子構(gòu)建蓄積量反演模型[9-10],如采用不同數(shù)據(jù)源數(shù)據(jù)的光譜因子、紋理因子、各種植被指數(shù)等特征建立蓄積量反演模型[11-12];另一方面是采用新型的回歸算法構(gòu)建蓄積量模型,從傳統(tǒng)的多元線性回歸模型[13]到當(dāng)下的多元非線性回歸、支持向量機(jī)回歸(SVR)[14]、BP 神經(jīng)網(wǎng)絡(luò)[15]、k-近鄰(k-nearest neighbor,k-NN)[16]等。
SVM是近幾年使用較多的一種機(jī)器學(xué)習(xí)算法,許多學(xué)者已經(jīng)將該方法應(yīng)用到測繪技術(shù)與地理信息中,并取得了不錯的精度效果[17-19]。付虎艷等以香格里拉縣高山松為研究對象,選用基于TM[20]影像提取的17個因子,建立SVM非參數(shù)模型,精度達(dá)到76.6%;蒙詩櫟等[21]人從高空間分辨率衛(wèi)星WorldView-2的多光譜遙感影像中提取一系列遙感因子,采取SVR方法進(jìn)行森林地上生物量建模及驗(yàn)證,獲得組合植被指數(shù)與紋理因子的模型并取得較精確的AGB估算結(jié)果(R2=0.85)。本文將福建省的將樂縣作為研究區(qū)域,研究國產(chǎn)高分辨率高分一號遙感影像的光譜因子與紋理信息,并結(jié)合野外實(shí)地調(diào)查測量的數(shù)據(jù),提取出影響蓄積量的一系列遙感因子,并且篩選出與因變量相關(guān)性較強(qiáng)的6個因子,分別采用多元線性回歸和支持向量機(jī)回歸(SVR)的方法,獲取模型的精度并建立最優(yōu)蓄積量估測模型。
將樂縣處于福建省的西北部,三明市的北部,地貌為山地丘陵,屬于中亞熱帶季風(fēng)氣候,地理位置為東經(jīng)117°05' ~17°40', 北緯26°04 ~ 26°26',屬于我國南方45 個重點(diǎn)林業(yè)縣之一。將樂縣土地面積約為2244 km2,森林資源極其豐富,其中林業(yè)用地約為1956 km2,有林地面積約為1896 km2,森林總蓄積約為1309萬m3,森林覆蓋率達(dá)到84.8%。其中人工林多以針葉林為主,針葉林的樹種多為馬尾松(PinusmassonianaLamb)、杉木(Cunninghamialanceolate(Lamb.)Hook)等。
本文采用國產(chǎn)高分辨率GF-1 號2 m 的多光譜遙感影像,影像獲取時間為2016年12月19日。獲取的遙感影像會存在幾何變形,這是因?yàn)樵诔上竦倪^程中,傳感器平臺、地球自轉(zhuǎn)、地球曲率等不可抗力因素,影像傳感器接收的輻射值也會因?yàn)榇髿獾奈蘸蜕⑸渥饔?、地形因素、傳感器誤差等造成干擾。因此對GF-1 號遙感影像需要進(jìn)行預(yù)處理,依次進(jìn)行輻射校正、大氣校正和正射校正,確保1 個像元以內(nèi)的校正誤差。結(jié)合將樂地區(qū)的小班矢量數(shù)據(jù)裁剪預(yù)處理后的遙感影像,得到將樂縣影像數(shù)據(jù)。
外業(yè)數(shù)據(jù)采用將樂縣樣地實(shí)測數(shù)據(jù),由2016 年7 月中下旬野外調(diào)繪采集得到,由傳統(tǒng)測量方法獲取樣地參數(shù)信息。在已有的樣地信息中篩選出具有代表性的樣地并構(gòu)建蓄積量模型,能夠保證構(gòu)建的蓄積量模型具有一定的穩(wěn)定性和可靠性。本研究主要針對針葉林蓄積量的估測,選取45個樣地作為樣本,樣本選在研究區(qū)內(nèi)植被分布具有典型性的區(qū)域內(nèi),其海拔分布范圍為220 ~ 662 m,坡度范圍4.1 ~ 34.9°,選取以馬尾松、杉木等為優(yōu)勢樹種的林分,基本涵蓋了研究區(qū)內(nèi)大部分針葉林林分類型。
野外實(shí)地獲取每個樣地的坐標(biāo)信息、每個樣地的樹種、胸徑、樹高等林分參數(shù)信息。依據(jù)樣地實(shí)測的胸徑、樹高和株數(shù),根據(jù)二元材積表可以計算出每個樣地的實(shí)測總蓄積量。用隨機(jī)采樣的方法選取樣本總數(shù)的2/3作為建模數(shù)據(jù),剩余的1/3樣本作為檢驗(yàn)數(shù)據(jù),樣本分布情況如圖1所示。
本文從遙感影像上獲得一系列遙感因子,作為自變量進(jìn)行蓄積量的估測。研究的總體技術(shù)路線如圖2所示。
遙感影像的植被指數(shù)可以較好地反映植物的植被種類、生長狀態(tài)和空間分布[22]。相關(guān)學(xué)者研究表明,森林植被指數(shù)在估測森林蓄積量以及生物量時,得到了較高的精度。在本研究中,光譜因子選取為多光譜波段值以及一些相關(guān)植被指數(shù),分別為B、G、R、NIR,紅邊比值植被指數(shù)(red green ratio index,RGRI)、再歸一化植被指數(shù)(renormalized differnce vegetation index, RDVI)、比值植被指數(shù)(ratio vegetation index,RVI)、差值植被指數(shù)(difference vegetation index,DVI)、歸一化植被指數(shù)(normalized differnce vegetation index,NDVI)、歸一化差異綠度指數(shù)( normalized dieffernce green index,NDGI)、紅綠植被指數(shù)(green red normalized differnce vegetation index,GRNDVI)[23],共計11個光譜因子。
影像的紋理特征是遙感影像的重要特征,它反映了地表的粗糙程度,表現(xiàn)了影像中地物的結(jié)構(gòu)及其與周圍環(huán)境的關(guān)系。大量研究表明,遙感影像中全色波段的紋理特征能較好地分析森林組成和結(jié)構(gòu)。本文中的紋理因子選取最為廣泛的基于灰度共生矩陣的紋理特征[24-25]。選取樣本基于灰度共生矩陣的紋理特征統(tǒng)計量,包括協(xié)同性(homogeneity, Homo)、對比度(contrast)、相關(guān)性(correlation)、均值(mean)、標(biāo)準(zhǔn)差(standard deviation,SD)、相異性(dissimilarity,Diss)、熵(entropy)、 二階矩(second moment,SM)、GLDV(歸一化灰度)二階矩和GLDV對比度[26]等10個因子變量。
采用皮爾森相關(guān)系數(shù)(Pearson correlation coefficient)對23個遙感因子與實(shí)測蓄積量進(jìn)行相關(guān)性分析,選取相關(guān)性較顯著的因子作為建模的自變量。獲取的遙感因子與蓄積量相關(guān)系數(shù)如表1。
表1 遙感因子和蓄積量的相關(guān)系數(shù)表Tab.1 Correlation coefficient table of remote sensing factors and volume
注:※表示因子與蓄積量的相關(guān)性在0.05水平上顯著
圖2 總體技術(shù)路線圖Fig.2 General technology roadmapping
多元線性回歸反演蓄積量是定量估測蓄積量的傳統(tǒng)方法。它將遙感影像與對應(yīng)的野外實(shí)地測量的樣地的各波段值和波段比值, 并結(jié)合各種相關(guān)的其他影響因子。以遙感因子作為自變量,實(shí)地測量的樣地蓄積量為因變量,進(jìn)行多元線性回歸擬合,求出方程的參數(shù), 得到最佳多元線性回歸方程,從而估測整個林分的蓄積量。多元線性回歸估計蓄積量的一般公式為V=b+a1x1+a2x2+…+aixi+…+anxn;公式中的V是野外實(shí)測的蓄積量;b是回歸方程的常數(shù);xi是第i項自變量即不同的遙感因子,i=1,2,…,n;ai為i項因子的回歸系數(shù)。將隨機(jī)采樣篩選后的遙感因子與蓄積量進(jìn)行多元線性回歸擬合,得到光譜因子和紋理特征因子反演的蓄積量方程如公式(1):
V=-21.0836+0.0284xEVI-28.4137xGRNDVI+18.7234xNDVI+0.0017xCO+2385.5xSM+14.8040xCC
(1)
將剩余的15個樣地數(shù)據(jù)及遙感因子作為測試數(shù)據(jù),帶入多元線性回歸模型,得到估測值,模型擬合數(shù)據(jù)與實(shí)測數(shù)據(jù)的相關(guān)系數(shù)為0.671,決定系數(shù)R2為0.45,精度低,擬合情況較差。
3.2.1支持向量機(jī)回歸SVR建模
SVR的基本思想是,通過非線性變換,將輸入空間映射到一個高維的特征空間,并使用線性函數(shù)在這個特征空間來擬合樣本數(shù)據(jù),同時又能獲得較好的泛化能力。在利用支持向量機(jī)解決實(shí)際問題時,首先需要把它轉(zhuǎn)化為一個可以用支持向量機(jī)求解的數(shù)學(xué)模型,這個轉(zhuǎn)換過程稱為模型的選擇,包括SVM類型的選擇、訓(xùn)練集的選擇、核函數(shù)的選擇、SVM中自由參數(shù)的選擇等。
本文將30個樣地數(shù)據(jù)及對應(yīng)的遙感因子作為訓(xùn)練數(shù)據(jù)輸入SVM函數(shù)中,選擇支持向量機(jī)回歸算法回歸建立模型,從而進(jìn)行模型選擇。選取的核函數(shù)為線性核函數(shù),當(dāng)核函數(shù)的懲罰因子系數(shù)c為0.25,參數(shù)系數(shù)g為256時,此時模型的均方差MSE最低為0.286(圖3),模型為最優(yōu)模型[27]。
將剩余的15個樣地數(shù)據(jù)及遙感因子作為測試數(shù)據(jù)帶入模型,得到估測值,擬合數(shù)據(jù)與實(shí)測數(shù)據(jù)的相關(guān)系數(shù)為0.764,決定系數(shù)R2為0.58,精度優(yōu)于多元線性回歸,擬合情況較好。
圖3 最優(yōu)參數(shù)選取結(jié)果圖Fig.3 Optimal parameter selection result chart
3.2.2SVR模型精度分析
SVR模型擬合情況優(yōu)于多元線性回歸,所以對SVR模型預(yù)測出來的蓄積量值與野外實(shí)地測量的蓄積量值進(jìn)一步分析,選取精度評價指標(biāo):平均相對誤差、總相對誤差和平均預(yù)估誤差[28],獲取SVR模型的估測精度以及檢驗(yàn)?zāi)P偷倪m用性,結(jié)果如表2所示, SVR蓄積量模型的預(yù)估精度達(dá)到98.22%。
表2 精度檢驗(yàn)結(jié)果Tab.2 The results of accuracy test
由生成的SVR蓄積量模型反演出基于小班的將樂縣2016年蓄積量分布圖(如圖4)。由分布圖可以看出,將樂縣東部方向和西南方向森林蓄積量較高,森林覆蓋度大,與實(shí)際情況相符。
圖4 2016年將樂縣森林蓄積量分布圖Fig.4 The distribution map of forest volume in Jiangle county in 2016
遙感影像可以提供動態(tài)、完整的植被覆蓋信息,進(jìn)而提高林業(yè)的工作效率。本文以福建省將樂縣為研究對象,將與森林蓄積量相關(guān)性強(qiáng)的遙感因子作為模型的自變量,分別運(yùn)用多元線性回歸和支持向量機(jī)回歸(SVR)算法進(jìn)行蓄積量建模,選取精度高的SVR蓄積量模型進(jìn)一步精度分析,并反演出將樂縣區(qū)域的蓄積量大致分布圖,為保護(hù)區(qū)內(nèi)森林蓄積的調(diào)查與管理提供參考依據(jù)。
(1)以國產(chǎn)高分辨率高分一號衛(wèi)星2 m分辨率遙感影像為主要數(shù)據(jù)源,結(jié)合野外實(shí)測數(shù)據(jù),分別采用多元線性回歸和SVR方法創(chuàng)建蓄積量估測模型,結(jié)果表明SVR方法優(yōu)于多元線性回歸方法,SVR構(gòu)建的蓄積量模型預(yù)估精度達(dá)到98.22%。
(2)采用精度高的SVR蓄積量模型對整個將樂縣進(jìn)行反演,得到基于小班的將樂縣平均蓄積量大致分布圖。
(3)本研究雖然反演出蓄積量分布圖,但對于分布圖的精度需要進(jìn)一步驗(yàn)證,下一步將結(jié)合其他數(shù)據(jù),比如無人機(jī)數(shù)據(jù),Lidar數(shù)據(jù)來優(yōu)化蓄積量分布圖。本文僅使用光譜紋理因子反演蓄積量,可探索地形因子對蓄積量的影響[29]。近些年,機(jī)器學(xué)習(xí)的方法被廣泛應(yīng)用于分類、回歸[30],許多文獻(xiàn)中選用k-近鄰(k-NN)、BP神經(jīng)網(wǎng)絡(luò)[31]等的方法進(jìn)行蓄積量估測,并取得了較好的精度結(jié)果。但不同研究區(qū)域的適用性有待驗(yàn)證,對于將樂縣下一步可以采用多種機(jī)器學(xué)習(xí)方法進(jìn)行蓄積量的反演估測。
貴州大學(xué)學(xué)報(自然科學(xué)版)2019年3期