摘 要:【目的】構(gòu)建地理加權(quán)隨機(jī)森林(Geographically weighted random forest, GWRF)模型估算森林碳儲(chǔ)量以解決區(qū)域尺度范圍內(nèi)森林碳儲(chǔ)量估算精度不高的問(wèn)題,對(duì)科學(xué)經(jīng)營(yíng)管理森林、推動(dòng)碳循環(huán)和碳匯相關(guān)研究、實(shí)現(xiàn)我國(guó)“雙碳”目標(biāo)有重要指導(dǎo)意義?!痉椒ā恳院邶埥⌒∨d安嶺、長(zhǎng)白山地區(qū)森林植被碳儲(chǔ)量為研究對(duì)象,基于2015年森林資源連續(xù)清查數(shù)據(jù)和Landsat8-OLI影像,采用普通最小二乘(Ordinary least squares, OLS)、隨機(jī)森林(Random forest, RF)模型、地理加權(quán)回歸(Geographically weighted regression, GWR)模型以及地理加權(quán)隨機(jī)森林模型分別構(gòu)建不同林型及總體(不分林型)的森林碳儲(chǔ)量估測(cè)模型,比較是否區(qū)分林分類型時(shí),不同模型預(yù)測(cè)精度之間的差異,實(shí)現(xiàn)對(duì)研究區(qū)森林碳儲(chǔ)量的精準(zhǔn)反演?!窘Y(jié)果】1)各個(gè)模型在區(qū)分林型時(shí)的預(yù)測(cè)精度均高于總體(不分林型)情況,以GWRF模型精度最優(yōu),其中針葉林精度最高(R2=0.58, RMSE=15.97 t/hm2);闊葉林次之(R2=0.46, RMSE=17.66 t/hm2);針闊混交林隨后(R2=0.45, RMSE=19.51 t/hm2);總體(不分林型)最低(R2=0.40, RMSE=20.22 t/hm2)。2)4種模型的檢驗(yàn)精度GWRF>RF>GWR>OLS。與OLS相比,GWRF在針葉林、闊葉林、針闊混交林和總體(不分林型)中提升的ΔR2分別為0.15、0.09、0.16和0.04;降低的ΔRMSE分別為2.09、1.35、3.47和0.89 t/hm2;與RF相比,GWRF提升的ΔR2分別為針葉林0.14、闊葉林0.06、針闊混交林0.04、總體(不分林型)0.02;降低的ΔRMSE分別為針葉林1.95 t/hm2、闊葉林0.86 t/hm2、針闊混交林0.67 t/hm2、總體(不分林型)0.29 t/hm2。3)研究區(qū)森林碳儲(chǔ)量密度最高預(yù)測(cè)值為77.08 t/hm2,最低值為5.24 t/hm2,平均值為41.07 t/hm2,總量為552.04 Tg;從空間上看,森林碳儲(chǔ)量高值分布在小興安嶺東南部、張廣財(cái)嶺等地區(qū),呈現(xiàn)斑狀不均勻性分布?!窘Y(jié)論】相比于其他3種模型,GWRF作為局部模型,考慮到空間異質(zhì)性,在區(qū)域尺度范圍內(nèi)估測(cè)森林碳儲(chǔ)量有較好的應(yīng)用前景。區(qū)分林分類型能提高預(yù)測(cè)精度,在今后對(duì)森林生物量或碳儲(chǔ)量的研究中,應(yīng)考慮區(qū)分林分類型建模。本研究的模型和方法有一定適應(yīng)性,可為森林資源的快速和精準(zhǔn)監(jiān)測(cè)提供方法借鑒。
關(guān)鍵詞:森林碳儲(chǔ)量;地理加權(quán)隨機(jī)森林;地理加權(quán)回歸;隨機(jī)森林;遙感估測(cè)
中圖分類號(hào):S757.3 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1673-923X(2024)07-0064-13
基金項(xiàng)目:國(guó)家重點(diǎn)研發(fā)計(jì)劃項(xiàng)目(2020YFC1511603-1);中央高校基本科研業(yè)務(wù)費(fèi)專項(xiàng)資金資助項(xiàng)目(2572022DT03);中國(guó)龍江森林工業(yè)集團(tuán)有限公司科技項(xiàng)目(HFW230100074);東北林業(yè)大學(xué)碳中和專項(xiàng)科學(xué)基金項(xiàng)目(HFW220100054)。
Geographically weighted random forest approach to predict forest carbon storage by remote sensing in Heilongjiang
WEI Gerana, LI Mingzea, QUAN Yinga, WANG Bina,b, LIU Jianyanga, MING Langa
(a. Key Laboratory of Sustainable Forest Ecosystem Management-Ministry of Education; b. Engineering Consulting and Design Institute Co. Ltd., Northeast Forestry University, Harbin 150040, Heilongjiang, China)
Abstract:【Objective】To construct a geographically weighted random forest (GWRF) model for characterizing forest carbon storage in order to address the problem of low accuracy in estimating forest carbon stocks at the regional scale. This has significant implications for the scientific management of forests, the advancement of research on the carbon cycle and carbon sequestration, and the achievement of our country’s “double carbon” goal. 【Method】 Focusing on the carbon storage of forest vegetation in the Xiaoxing’an mountains and Changbai mountains of Heilongjiang province, this paper was based on the 2015 continuous forest resource inventory data and Landsat 8-OLI imagery. Different forest carbon storage estimation models were constructed for various forest types and the total (no forest type), using ordinary least squares (OLS), random forest (RF), geographically weighted regression (GWR), and geographically weighted random forest (GWRF). Additionally, this paper also compared the differences in prediction accuracy among different models whether distinguishing forest stand types and achieved accurate inversion of forest carbon storage in the study area.【Result】1) Each model exhibited higher predictive accuracy when distinguishing between forest types compared to the total (no forest type) situation. The GWRF model achieved the highest accuracy, with the highest precision for coniferous forest (R2=0.58, RMSE=15.97 t/hm2); followed by broadleaf forest (R2=0.46, RMSE=17.66 t/hm2); mixed forest (R2=0.45, RMSE=19.51 t/hm2); and the lowest accuracy for the total (no forest type) (R2=0.40, RMSE=20.22 t/hm2). 2) The test accuracy of the four models was GWRF>RF>GWR>OLS. Compared with OLS, GWRF increased ΔR2 by 0.15, 0.09, 0.16, and 0.04 in coniferous forest, broadleaf forest, mixed forest, and total(no forest type); and decreased ΔRMSE by 2.09, 1.35, 3.47 and 0.89 t/hm2, respectively. Compared with RF, the ΔR2 increased by GWRF is 0.14 for coniferous forest, 0.06 for broadleaf forest, 0.04 for mixed forest, and 0.02 for total (no forest type); the reduced ΔRMSE is 1.95 t/hm2 in coniferous forest, 0.86 t/hm2 in broadleaf forest, 0.67 t/hm2 in mixed forest, and 0.29 t/hm2 in total (no forest type). 3) The highest predicted forest carbon storage density in the study area was 77.08 t/hm2, the lowest is 5.24 t/hm2, the average was 41.07 t/hm2, and the total was 552.04 Tg. From a spatial perspective, high values were concentrated in the southeastern regions of the Xiaoxing’an mountains and Zhangguangcai mountains, displaying a patchy and uneven distribution.【Conclusion】Comparing to the other three models, GWRF, as a local model that accounts for spatial heterogeneity, has promising applications for estimating forest carbon storage on a large scale. Differentiating forest stand types can improve the accuracy of prediction, we should take into account distinguishing stand type modeling in future research on forest biomass or carbon stocks. The models and methods studied in this paper have a certain level of adaptability and can provide methodological references for the rapid and precise monitoring of forest resources.
Keywords: forest carbon storage; geographically weighted random forest; geographically weighted regression; random forest; remote sensing estimation
森林生態(tài)系統(tǒng)作為陸地生態(tài)系統(tǒng)中最大的碳庫(kù),在涵養(yǎng)水源、固碳釋氧、維持全球碳平衡等方面發(fā)揮著不可替代的作用,研究森林生態(tài)系統(tǒng)的碳儲(chǔ)量,一直以來(lái)都是國(guó)內(nèi)外學(xué)者關(guān)注的熱點(diǎn)問(wèn)題[1]。隨著國(guó)家戰(zhàn)略層面提出在2030年完成碳達(dá)峰、2060年實(shí)現(xiàn)碳中和的目標(biāo),越來(lái)越多的研究者開(kāi)始將目光投向關(guān)于林業(yè)碳匯的研究,而如何合理發(fā)揮森林植被的巨大碳匯能力、提升森林的固碳能力、早日科學(xué)實(shí)現(xiàn)“雙碳”目標(biāo)是當(dāng)前研究問(wèn)題的重中之重[2]。
森林碳儲(chǔ)量作為反映森林生態(tài)系統(tǒng)基本特征的重要指標(biāo)和評(píng)價(jià)森林結(jié)構(gòu)功能和生產(chǎn)潛力的理論基礎(chǔ),對(duì)維持全球碳平衡有重要意義[3],準(zhǔn)確估算森林碳儲(chǔ)量并分析其空間格局關(guān)系到如何降低大氣中二氧化碳濃度、減緩全球氣候變暖、實(shí)現(xiàn)我國(guó)“雙碳”目標(biāo)等重大議題[4];能推動(dòng)碳循環(huán)和碳匯相關(guān)研究的進(jìn)展并為實(shí)現(xiàn)可持續(xù)發(fā)展、經(jīng)營(yíng)管理森林和生態(tài)環(huán)境建設(shè)提供決策服務(wù)[5]。森林碳儲(chǔ)量的估算方法包括傳統(tǒng)的樣地清查法,微氣象學(xué)方法和遙感估測(cè)法等[6],傳統(tǒng)的樣地清查法雖然能獲得較為準(zhǔn)確的數(shù)據(jù),但其存在耗費(fèi)巨大人力物力財(cái)力、更新速度慢,難以適時(shí)動(dòng)態(tài)監(jiān)測(cè)的問(wèn)題;而遙感技術(shù)憑借其監(jiān)測(cè)范圍廣、信息獲取周期短、實(shí)時(shí)和經(jīng)濟(jì)便捷等優(yōu)勢(shì),成為近年來(lái)估算森林碳儲(chǔ)量的重要手段[7]。使用遙感變量與地面實(shí)測(cè)數(shù)據(jù)建立不同的模型,能夠提高森林碳儲(chǔ)量的反演精度,是解決當(dāng)前區(qū)域尺度內(nèi)關(guān)于森林碳儲(chǔ)量的研究中存在的對(duì)演變規(guī)律認(rèn)識(shí)不清、空間格局不明確、定量精度不夠等問(wèn)題的重要途徑,這使得大區(qū)域尺度內(nèi)估算森林碳儲(chǔ)量成為可能[8]。
隨著遙感技術(shù)和機(jī)器學(xué)習(xí)的快速發(fā)展,高分辨率遙感數(shù)據(jù)結(jié)合以BP神經(jīng)網(wǎng)絡(luò)、K-最近鄰法、隨機(jī)森林、支持向量機(jī)等為代表的非參數(shù)模型[9-10],和以地理加權(quán)回歸模型、克里金插值等為代表的地統(tǒng)計(jì)方法是大區(qū)域尺度內(nèi)森林碳儲(chǔ)量估測(cè)的兩種最主要的途徑。然而,非參數(shù)模型不能很好考慮變量間的空間位置關(guān)系,地統(tǒng)計(jì)學(xué)模型難以克服因變量與自變量之間的非線性關(guān)系、自變量間的多重共線性以及變量間的交互作用等問(wèn)題[11]。如何將兩種途徑進(jìn)行科學(xué)整合,使其發(fā)揮各自優(yōu)勢(shì)是解決上述問(wèn)題的有效途徑,地理加權(quán)隨機(jī)森林(Geographically weighted random forest, GWRF)模型便應(yīng)運(yùn)而生。該模型將空間位置信息考慮進(jìn)隨機(jī)森林(Random forest, RF)模型中,最早于2019年由Santos等[12]提出。Khan等[13]使用GWRF模型,基于從遙感數(shù)據(jù)中提取的植被指數(shù)、初級(jí)生產(chǎn)總值(GPP)、氣候資料等,改進(jìn)了對(duì)美國(guó)玉米帶玉米產(chǎn)量的預(yù)測(cè)方法。通過(guò)將GWRF模型與其他流行的機(jī)器學(xué)習(xí)算法的預(yù)測(cè)結(jié)果進(jìn)行比較,發(fā)現(xiàn)GWRF模型有更優(yōu)的預(yù)測(cè)結(jié)果、能更好地解決空間非平穩(wěn)性問(wèn)題。然而,該模型目前并未用于對(duì)森林生態(tài)系統(tǒng)碳儲(chǔ)量的估測(cè)研究中,如何利用該模型提高森林碳儲(chǔ)量的估測(cè)精度是本研究需要明確的問(wèn)題,這對(duì)進(jìn)一步改善大尺度范圍內(nèi)的森林碳儲(chǔ)量估測(cè)有參考意義。
綜上所述,估算森林碳儲(chǔ)量作為實(shí)現(xiàn)我國(guó)“雙碳”目標(biāo)的重要基礎(chǔ),目前已取得一定進(jìn)展,但構(gòu)建新算法在大尺度范圍內(nèi)更精準(zhǔn)地測(cè)算森林碳儲(chǔ)量仍是研究的重難點(diǎn)。因此,本研究擬利用Landsat8-OLI影像和2015年森林資源連續(xù)清查數(shù)據(jù),使用普通最小二乘、隨機(jī)森林模型、地理加權(quán)回歸模型、地理加權(quán)隨機(jī)森林模型對(duì)黑龍江省小興安嶺、長(zhǎng)白山地區(qū)森林碳儲(chǔ)量進(jìn)行估測(cè),對(duì)比各類模型的優(yōu)劣,選出最優(yōu)模型,為大尺度森林碳儲(chǔ)量的遙感估測(cè)提供方法借鑒。
1 材料與方法
1.1 研究區(qū)概況
研究區(qū)位于黑龍江省小興安嶺、長(zhǎng)白山地區(qū)(122°40′~135°05′E,43°26′~50°07′N)。該地幅員遼闊,橫跨黑龍江、烏蘇里江、松花江、綏芬河四大水系,地勢(shì)西北高、東南低,屬寒溫帶與溫帶大陸性季風(fēng)氣候,冬季寒冷漫長(zhǎng),夏季溫暖短暫,年平均氣溫為-5~-2 ℃,年降水量為350~600 mm。水文復(fù)雜,河流眾多。主要樹(shù)種有落葉松Larix gmelinii、樟子松Pinus sylvestris var. mongolica、紅皮云杉Picea koraiensis、蒙古櫟Quercus mongolica、山楊Populus davidiana、白樺Betula platyphylla等[14]。研究區(qū)位置如圖1所示。
1.2 數(shù)據(jù)來(lái)源與處理
1.2.1 樣地調(diào)查數(shù)據(jù)收集與處理
本研究的實(shí)測(cè)數(shù)據(jù)來(lái)源于黑龍江省2015年森林資源連續(xù)清查數(shù)據(jù),共計(jì)1 915塊喬木林地。使用每木檢尺數(shù)據(jù)基于黑龍江省各樹(shù)種相容性生物量模型[15]和已建立的灌木草本生物量模型[16]計(jì)算各樣地森林植被生物量,乘以含碳率轉(zhuǎn)換系數(shù)得到各樣地森林植被碳儲(chǔ)量總量,除以樣地面積得到各樣地森林植被碳儲(chǔ)量密度(t/hm2)。
為了獲得更為準(zhǔn)確的預(yù)測(cè)結(jié)果,同時(shí)探討區(qū)分林分類型能否提高模型的預(yù)測(cè)精度,本研究將林分類型分為針葉林(coniferous forest,CFF)、闊葉林(broadleaf forest,BLF)和針闊混交林(mixed forest,MXF)3種[17],剔除超過(guò)±2倍標(biāo)準(zhǔn)差以外的數(shù)據(jù)以減少異常數(shù)據(jù)對(duì)模型擬合精度的影響[18],采用隨機(jī)抽樣的方法從剔除后的數(shù)據(jù)中挑選出80%作為訓(xùn)練樣本,其余20%作為測(cè)試樣本,具體分布見(jiàn)下表。
1.2.2 遙感影像預(yù)處理及變量提取
Google earth engine(GEE)作為一種基于云計(jì)算技術(shù)分析和處理遙感圖像的平臺(tái),給用戶快速處理大量遙感數(shù)據(jù)提供了可能[19]。為了獲取與地面調(diào)查時(shí)間相匹配的遙感影像,本研究從GEE平臺(tái)獲取2015年生長(zhǎng)季(5—10月)的LANDSAT/LT08/ C02/T1_L2數(shù)據(jù)集,該數(shù)據(jù)集已經(jīng)過(guò)幾何精校正、輻射定標(biāo)和大氣校正,經(jīng)過(guò)比例縮放得到地表反射率,通過(guò)去云、融合得到分辨率為30 m的較為清晰研究區(qū)地表反射率圖像[20]。利用該圖像計(jì)算構(gòu)建森林碳儲(chǔ)量模型所需的自變量即原始波段、植被指數(shù)及原始波段對(duì)應(yīng)的紋理特征,基于數(shù)字高程模型(digital elevation model,DEM)數(shù)據(jù)提取坡度、坡向、海拔等信息,共計(jì)143個(gè)變量。
1.3 變量篩選及重要性評(píng)價(jià)
變量篩選作為回歸算法中重要的一步,對(duì)模型擬合精度有重要影響。過(guò)多變量可能會(huì)導(dǎo)致信息冗余,降低模型精度;而變量過(guò)少則會(huì)使得模型丟失關(guān)鍵解釋信息,亦會(huì)對(duì)模型精度造成影響,因此選擇合適的變量是保證模型擬合精度的有效途徑[21]。本研究使用R語(yǔ)言中“caret”和“Random forest”包實(shí)現(xiàn)隨機(jī)森林遞歸特征消除(recursive feature elimination with random forest,RFE-RF),將皮爾遜相關(guān)系數(shù)設(shè)為0.9以刪除高度相關(guān)的自變量[22],使用RFE-RF方法,以RMSE為標(biāo)準(zhǔn),采用五折交叉驗(yàn)證法重復(fù)10次,篩選出使得RMSE最低的最重要變量,實(shí)現(xiàn)對(duì)針葉林、闊葉林、針闊混交林及總體(不分林型)特征變量的降維,得到與響應(yīng)變量有顯著影響的特征因子。
“IncNodePurity”(Increase in node purity),作為評(píng)價(jià)變量重要性的無(wú)單位量綱指標(biāo),通過(guò)殘差平方和來(lái)度量,表示隨機(jī)森林樹(shù)上每個(gè)節(jié)點(diǎn)純度的增加?!癐ncNodePurity”的大小取決于變量對(duì)節(jié)點(diǎn)純度增加的貢獻(xiàn)程度,分裂后節(jié)點(diǎn)純度越高,該值越大,則變量越重要[23-24]。采用該指標(biāo)評(píng)價(jià)構(gòu)建針葉林、闊葉林、針闊混交林及總體(不分林型)森林碳儲(chǔ)量估測(cè)模型的變量重要性。
1.4 建模方法
1.4.1 普通最小二乘
OLS是一種線性模型,用來(lái)描述響應(yīng)變量Y與解釋變量X1,X2,…,Xp之間的回歸關(guān)系。該模型通過(guò)使P個(gè)解釋變量與響應(yīng)變量之間殘差平方和最小的方式來(lái)擬合模型,具體形式見(jiàn)參考文獻(xiàn)[25],本研究在R語(yǔ)言中實(shí)現(xiàn)該模型。
1.4.2 地理加權(quán)回歸
GWR作為一種考慮空間對(duì)象的局部效應(yīng)模型,以距離權(quán)重的形式將樣點(diǎn)數(shù)據(jù)的地理位置嵌入到回歸系數(shù)中,使得在每一個(gè)觀測(cè)點(diǎn)都有一套獨(dú)立的回歸系數(shù),能夠克服數(shù)據(jù)的空間非平穩(wěn)性,具體形式見(jiàn)參考文獻(xiàn)[26]??臻g核函數(shù)和帶寬作為GWR模型的兩個(gè)重要參數(shù),對(duì)模型的擬合精度有重要影響,選取最優(yōu)空間核函數(shù)和帶寬能夠提高模型的預(yù)測(cè)精度。本研究使用R語(yǔ)言中“GWmodel”包實(shí)現(xiàn)GWR,選取最佳組合預(yù)測(cè)森林碳儲(chǔ)量。
1.4.3 隨機(jī)森林
RF作為機(jī)器學(xué)習(xí)中一種重要的非參數(shù)模型算法,是利用多個(gè)弱分類器進(jìn)行分類和預(yù)測(cè)的方法。該方法能夠克服使用單個(gè)決策樹(shù)帶來(lái)的過(guò)擬合問(wèn)題,能夠自動(dòng)進(jìn)行特征選擇和特征縮放,對(duì)高維度,復(fù)雜的數(shù)據(jù)有較好的適應(yīng)性同時(shí)對(duì)噪聲和異常數(shù)據(jù)有較強(qiáng)的容錯(cuò)能力[27]。RF通過(guò)自助法(Bootstrap)隨機(jī)抽取訓(xùn)練樣本生成隨機(jī)樹(shù)進(jìn)而組成隨機(jī)森林,在訓(xùn)練階段,它從給定的訓(xùn)練集中隨機(jī)抽取大約三分之二的訓(xùn)練樣本以盡可能地增長(zhǎng)指定數(shù)量的樹(shù);在每個(gè)節(jié)點(diǎn)上隨機(jī)選擇多個(gè)變量進(jìn)行分割,重復(fù)n次。使用這些樣本生長(zhǎng)樹(shù)木,給出回歸樹(shù)的集合,經(jīng)過(guò)訓(xùn)練后,對(duì)所有單個(gè)回歸樹(shù)的預(yù)測(cè)進(jìn)行平均,實(shí)現(xiàn)預(yù)測(cè)。本研究在Python中實(shí)現(xiàn)RF,通過(guò)格網(wǎng)搜索法尋找最優(yōu)參數(shù)以提高模型性能。
1.4.4 地理加權(quán)隨機(jī)森林
RF作為一個(gè)非空間的全局模型,無(wú)法解決空間異質(zhì)性的問(wèn)題,GWRF基于RF,將RF擴(kuò)展為由多個(gè)子模型組成的分解,作為一種局部模型,充分考慮到變量間的非線性影響、變量間的交互作用以及空間異質(zhì)性和空間自相關(guān)性等問(wèn)題。該模型允許分析多變量矢量信息以訓(xùn)練RF,對(duì)每個(gè)位置i,計(jì)算局部RF,引入基于距離的權(quán)重來(lái)定義RF袋中的不同概率,并對(duì)附近物體之間的空間關(guān)系進(jìn)行建模,考慮到不同特征變量的空間位置信息,最終綜合所有決策樹(shù)的預(yù)測(cè)經(jīng)投票得出結(jié)果,具體形式見(jiàn)參考文獻(xiàn)[30]。GWRF模型每個(gè)局部RF運(yùn)行的區(qū)域稱為鄰域(或內(nèi)核),數(shù)據(jù)點(diǎn)與其內(nèi)核之間的最大距離稱為帶寬(Bandwidth),常見(jiàn)的兩種核函數(shù)為“自適應(yīng)”和“固定”,自適應(yīng)核函數(shù)能夠根據(jù)點(diǎn)的密度分布來(lái)確定每個(gè)點(diǎn)的權(quán)重,鄰域由n個(gè)最鄰近點(diǎn)確定,能更好地適應(yīng)不同密度分布的數(shù)據(jù);而固定核函數(shù)的帶寬則指局部模型運(yùn)行區(qū)域圓的半徑。不同帶寬對(duì)模型精度和預(yù)測(cè)時(shí)間有很大影響,選取合適帶寬是一個(gè)基于試錯(cuò)法的繁瑣過(guò)程,無(wú)論是“自適應(yīng)”還是“固定”核函數(shù),均需在各種帶寬上提取帶外數(shù)據(jù)(out-of-bag,OOB)的精度,從而選取具有最佳性能的帶寬,帶寬測(cè)試范圍應(yīng)依照實(shí)際樣本分布情況設(shè)定[28]。此外,為了更好實(shí)現(xiàn)預(yù)測(cè),可將從局部子模型(GWRF)中提取的局部異質(zhì)信號(hào),合并到使用更多數(shù)據(jù)的全局模型(RF)中[29],通過(guò)融合預(yù)測(cè),能夠提升預(yù)測(cè)精度,權(quán)重系數(shù)A對(duì)預(yù)測(cè)精度有很大影響,權(quán)重系數(shù)A越大,則GWRF所占的權(quán)重越大。使用R語(yǔ)言中的“SpatialIML”包實(shí)現(xiàn)GWRF[30]。
1.5 模型評(píng)價(jià)與檢驗(yàn)
為了評(píng)估模型反演的準(zhǔn)確性,檢驗(yàn)?zāi)P偷姆夯芰?,本研究使用決定系數(shù)(Coefficient of determination,R2)、均方根誤差(Root mean squared error,RMSE)、相對(duì)均方根誤差(Relative root mean square error,rRMSE%)和平均絕對(duì)誤差(Mean absolute error,MAE)檢驗(yàn)預(yù)測(cè)精度,計(jì)算方法見(jiàn)參考文獻(xiàn)[24]。
2 結(jié)果與分析
2.1 特征變量篩選及重要性分析
經(jīng)過(guò)篩選,最終得到用于建模的特征變量數(shù)分別為針葉林34、闊葉林10、針闊混交林11、總體(不分林型)9。以“IncNodePurity”為標(biāo)準(zhǔn),評(píng)價(jià)不同林型下建模變量的重要性,結(jié)果如圖2所示。從結(jié)果可知,不同類型的遙感指數(shù)在不同林型下的重要程度不同,但B6波段的重要性最高,表現(xiàn)在對(duì)針葉林、總體(不分林型)來(lái)說(shuō),B6波段的反射率最為重要;而對(duì)闊葉林和針闊混交林而言,B6的波段的總平均值(SAVG)紋理最重要。
2.2 地理加權(quán)隨機(jī)森林模型參數(shù)敏感性分析
GWRF作為局部模型,確定其局部模型運(yùn)行的區(qū)域?qū)M合的精度有很大影響。本研究選取“自適應(yīng)”核函數(shù),針對(duì)針葉林、闊葉林、針闊混交林及總體(不分林型),依據(jù)各自的樣本數(shù)量分別定義不同的帶寬測(cè)試范圍?;趲鈹?shù)據(jù)的交叉驗(yàn)證結(jié)果,測(cè)試以局部模型GWRF(Local R2)、0.5為權(quán)重融合GWRF和RF(Mixed R2)(局部模型和全局模型權(quán)重相等)和0.25為權(quán)重融合GWRF和RF(Low. Local R2)(局部模型權(quán)重更小,有利于全局模型)的預(yù)測(cè)精度[30],最終,以GWRF模型的R2(Local R2)為標(biāo)準(zhǔn)[28],確定最佳帶寬。經(jīng)多次測(cè)試,最終選取的帶寬為針葉林150、闊葉林240、針闊混交林55、總體(不分林型)490。結(jié)果如圖3所示:
為了實(shí)現(xiàn)預(yù)測(cè),使用不同權(quán)重系數(shù)A:0.1,0.2,0.25,0.3,0.4,0.5,0.6,0.7,0.75,0.8,0.9,1融合GWRF與RF,驗(yàn)證不同權(quán)重系數(shù)在獨(dú)立檢驗(yàn)樣本上的精度差異進(jìn)一步探明GWRF所占的不同比重對(duì)預(yù)測(cè)精度的影響,尋找最佳權(quán)重系數(shù)及最優(yōu)模型。以R2和RMSE為標(biāo)準(zhǔn),分別測(cè)試針葉林、闊葉林、針闊混交林和總體(不分林型)的最佳預(yù)測(cè)權(quán)重,得到最佳權(quán)重系數(shù)為:針葉林0.9、闊葉林0.6、針闊混交林0.6,總體(不分林型)0.5。結(jié)果如圖4所示:
2.3 模型精度評(píng)價(jià)
建立了針葉林、闊葉林、針闊混交林及總體(不分林型)的GWRF模型,在獨(dú)立驗(yàn)證樣本上將其與OLS、GWR、RF模型分別進(jìn)行對(duì)比,結(jié)果如表5、圖5所示:
OLS作為傳統(tǒng)的線性回歸模型,精度最低;GWR模型在OLS基礎(chǔ)上考慮到位置因素,進(jìn)一步提高了模型精度;而RF模型作為一種非參數(shù)模型,更加靈活,因此有著更高的預(yù)測(cè)精度;GWRF模型考慮到兩種模型的優(yōu)勢(shì),且以不同權(quán)重融合局部模型(GWRF)和全局模型(RF)能實(shí)現(xiàn)更好的預(yù)測(cè),精度最高。4種模型的檢驗(yàn)精度GWRF>RF>GWR>OLS。
區(qū)分林分類型能提高預(yù)測(cè)精度且GWRF模型的提升效果分林分類型表現(xiàn)更明顯。無(wú)論是否分林型建模,GWRF均能取得最優(yōu)的預(yù)測(cè)結(jié)果,有最高的R2和最低的RMSE、rRMSE%、MAE。GWRF模型的R2在針葉林、闊葉林、針闊混交林和總體(不分林型)上分別為0.58、0.46、0.45和0.40;RMSE分別為15.97、17.66、19.51和20.22 t/hm2。與OLS模型相比,GWRF的R2在針葉林、闊葉林、針闊混交林和總體(不分林型)中分別提升了0.15、0.09、0.16和0.04;RMSE分別降低了2.09、1.35、3.47和0.89 t/hm2。與RF模型相比,GWRF提升的ΔR2分別為針葉林0.14、闊葉林0.06、針闊混交林0.04、總體(不分林型)0.02;降低的ΔRMSE分別為針葉林1.95 t/hm2、闊葉林0.86 t/hm2、針闊混交林0.67 t/hm2、總體(不分林型)0.29 t/hm2。在各種林分類型檢驗(yàn)的過(guò)程中,針葉林精度最高,闊葉林次之,針闊混交林隨后,總體(不分林型)最低。
2.4 研究區(qū)森林碳儲(chǔ)量反演制圖
由2.3可知,按林分類型所構(gòu)建的GWRF模型對(duì)森林碳儲(chǔ)量的預(yù)測(cè)精度要明顯高于其他模型和總體(不分林型)情況。因此,本研究利用該模型,依照MODIS的國(guó)際地球生物圈計(jì)劃(IGBP)土地覆蓋分類方案產(chǎn)品,分針葉林、闊葉林和針闊混交林對(duì)研究區(qū)的森林碳儲(chǔ)量進(jìn)行反演制圖,結(jié)果如圖6所示。由結(jié)果可知,研究區(qū)森林碳儲(chǔ)量密度最低預(yù)測(cè)值為5.24 t/hm2,最高預(yù)測(cè)值為77.08 t/hm2,平均值為41.07 t/hm2;該地區(qū)森林碳儲(chǔ)量總量為552.04 Tg。從空間分布來(lái)看,森林碳儲(chǔ)量高值分布在小興安嶺東南部、張廣財(cái)嶺等地區(qū),呈現(xiàn)斑狀不均勻性分布特征。
3 結(jié)論與討論
3.1 討 論
準(zhǔn)確估算森林碳儲(chǔ)量作為我國(guó)碳匯項(xiàng)目中重要的一項(xiàng),是實(shí)現(xiàn)可持續(xù)發(fā)展、保護(hù)生物多樣性、弄清碳核算、制定碳減排政策的有效途徑。對(duì)比了OLS、GWR、RF和GWRF四種模型間的精度差異,明確GWRF模型充分考慮變量之間的交互作用和空間位置關(guān)系,能在大范圍內(nèi)更精準(zhǔn)地測(cè)算森林碳儲(chǔ)量,可為之后對(duì)森林生物量或碳儲(chǔ)量的遙感估測(cè)提供方法借鑒。本研究結(jié)果與Quinones等[31]的預(yù)測(cè)結(jié)果一致,表明GWRF模型作為一種基于樹(shù)的非參數(shù)機(jī)器學(xué)習(xí)模型,在每個(gè)位置上建立了不同的回歸樹(shù)模型,考慮到自變量與因變量之間的非線性關(guān)系,克服了變量間的多重共線性,能夠?qū)崿F(xiàn)更靈活的預(yù)測(cè)。但GWRF作為局部模型,目前沒(méi)有考慮局部模型之間的差異,即GWRF建立的每個(gè)局部RF均使用同樣的參數(shù)和特征,無(wú)法根據(jù)局部特點(diǎn)選取最優(yōu)參數(shù)及最重要變量,在今后的研究中,可考慮使用RF的變量選擇[32]、格網(wǎng)搜索[33]和遞歸特征消除[34]等方法實(shí)現(xiàn)局部參數(shù)的微調(diào)和局部特征選擇。
在估算森林碳儲(chǔ)量的發(fā)展歷程中,使用傳統(tǒng)光學(xué)遙感影像的劣勢(shì)日益突出,由于光學(xué)遙感飽和性的存在,會(huì)使估測(cè)結(jié)果出現(xiàn)低值高估和高值低估的現(xiàn)象,這會(huì)對(duì)反演精度造成影響。邱彩新等[35]使用Landsat8結(jié)合地統(tǒng)計(jì)學(xué)方法估算浙江省喬木林碳儲(chǔ)量,構(gòu)建協(xié)同克里金插值法模型R2達(dá)到0.45,與本研究精度類似,但也表明使用單一遙感數(shù)據(jù)源估算森林碳儲(chǔ)量的精度有待提高,使用更高分辨率的光學(xué)影像或加入激光雷達(dá)等數(shù)據(jù)是提升預(yù)測(cè)精度的可行方法[36]。穆喜云等[37]以機(jī)載LiDAR遙感數(shù)據(jù)為數(shù)據(jù)源,采用隨機(jī)森林和多元線性回歸方法,對(duì)內(nèi)蒙古大興安嶺生態(tài)站的森林碳儲(chǔ)量進(jìn)行估測(cè),獲得了比較理想的結(jié)果,表明使用機(jī)器學(xué)習(xí)算法融合多源遙感數(shù)據(jù)將成為大尺度范圍內(nèi)估算森林碳儲(chǔ)量的必然要求。
由本研究結(jié)果可知,研究區(qū)2015年森林碳儲(chǔ)量密度平均值為41.07 t/hm2,這與Chang等[38]在隨機(jī)森林框架下,使用協(xié)同光學(xué)植被指數(shù)和微波植被光學(xué)厚度產(chǎn)品對(duì)我國(guó)森林地上碳儲(chǔ)量的估測(cè)結(jié)果類似,證實(shí)了本研究方法的可行性和結(jié)果的可靠性。遙感技術(shù)憑借其大尺度、全方位覆蓋的優(yōu)勢(shì),能夠較為準(zhǔn)確地刻畫(huà)研究區(qū)森林碳儲(chǔ)量的空間分布格局。但由于缺少大興安嶺地區(qū)的樣地?cái)?shù)據(jù),考慮到該地區(qū)的空間異質(zhì)性,本研究無(wú)法實(shí)現(xiàn)對(duì)整個(gè)黑龍江省的森林碳儲(chǔ)量反演,考慮收集該地區(qū)數(shù)據(jù)可解決上述問(wèn)題。從反演圖可知,碳儲(chǔ)量最大值分布在小興安嶺、張廣財(cái)嶺的部分地區(qū),這與該地區(qū)森林密集,結(jié)構(gòu)完整,立地指數(shù)、林地質(zhì)量較高且較少受人為破壞有關(guān),與劉暢[39]對(duì)黑龍江省森林碳儲(chǔ)量空間分布格局的研究結(jié)果類似。盡管如此,大尺度范圍內(nèi)估算森林碳儲(chǔ)量仍舊會(huì)存在很大的不確定性,全面量化預(yù)測(cè)森林植被碳儲(chǔ)量的不確定性仍是未來(lái)研究的重點(diǎn)。模型參數(shù)、自變量、樣本的不確定性都會(huì)對(duì)結(jié)果造成影響,模型是否穩(wěn)健,參數(shù)設(shè)置是否合理,樣本是否具有代表性等問(wèn)題均是需要考慮的問(wèn)題。由于定位偏差和測(cè)量誤差等的影響,樣地可能無(wú)法與遙感影像完全吻合,從遙感影像獲取的信息會(huì)受到地形等因素的影響,這都是估算森林碳儲(chǔ)量不確定性的來(lái)源[40],合理規(guī)避不確定性,用穩(wěn)健的方法量化森林碳匯仍是亟待解決的問(wèn)題。本研究中闊葉林和針闊混交林R2接近,但RMSE差異較大且針闊混交林的rRMSE%低于闊葉林,這表明模型能較好地解釋數(shù)據(jù)間變異性,但模型的預(yù)測(cè)精度在兩種林型之間存在差異。RMSE作為絕對(duì)指標(biāo),與相對(duì)指標(biāo)R2的量級(jí)不同;而rRMSE%與樣本平均值有關(guān)。本研究中針闊混交林在研究區(qū)域中占比相對(duì)較少且平均值偏大,這會(huì)對(duì)結(jié)果造成影響,考慮加入混交林樣本或使用其他的分類方法可進(jìn)一步改善模型的驗(yàn)證精度。
3.2 結(jié) 論
綜上,本研究建立了2015年小興安嶺、長(zhǎng)白山地區(qū)針葉林、闊葉林、針闊混交林和總體(不分林型)的森林碳儲(chǔ)量估測(cè)模型。通過(guò)對(duì)比OLS、GWR、RF和GWRF模型之間的精度差異,發(fā)現(xiàn)GWRF模型在區(qū)分林分類型后進(jìn)行建模效果更佳。GWRF模型的R2、RMSE、rRMSE%和MAE均優(yōu)于上述3種模型,在4種林分類型下,針葉林精度最高,闊葉林次之,針闊混交林隨后,總體(不分林型)最低。研究區(qū)2015年森林碳儲(chǔ)量密度平均值為41.07 t/hm2,總量為552.04 Tg。森林碳儲(chǔ)量高值集中在張廣財(cái)嶺、小興安嶺等部分地區(qū),空間上呈現(xiàn)斑狀不均勻性分布,這與該地林地質(zhì)量較高且受人為影響較小有關(guān)。本研究結(jié)果證明了加入空間因素的機(jī)器學(xué)習(xí)模型考慮到空間異質(zhì)性,能提高預(yù)測(cè)精度,未來(lái)應(yīng)對(duì)其他機(jī)器學(xué)習(xí)模型如支持向量機(jī)等的地理實(shí)現(xiàn)加以研究。
參考文獻(xiàn):
[1] 宋潔.祁連山森林碳儲(chǔ)量與森林景觀格局時(shí)空變化研究[D].蘭州:甘肅農(nóng)業(yè)大學(xué),2021. SONG J. Research on temporal and spatialchanges of forest carbon storage and forest landscape pattern in Qilian mountains[D]. Lanzhou: Gansu Agricultural University,2021.
[2] 張穎,李曉格,溫亞利.碳達(dá)峰碳中和背景下中國(guó)森林碳匯潛力分析研究[J].北京林業(yè)大學(xué)學(xué)報(bào),2022,44(1):38-47. ZHANG Y, LI X G, WEN Y L. Forest carbon sequestration potential in China under the background of carbon emission peak and carbon neutralization[J]. Journal of Beijing Forestry University,2022,44(1):38-47.
[3] 劉騰艷,毛方杰,李雪建,等.浙江省竹林地上碳儲(chǔ)量的時(shí)空動(dòng)態(tài)模擬及影響因素[J].應(yīng)用生態(tài)學(xué)報(bào),2019,30(5):1743-1753. LIU T Y, MAO F J, LI X J, et al. Spatiotemporal dynamic simulation on aboveground carbon storage of bamboo forest and its influence factors in Zhejiang province, China[J]. Chinese Journal of Applied Ecology,2019,30(5):1743-1753.
[4] 王成武,羅俊杰,唐鴻湖.基于InVEST模型的太行山沿線地區(qū)生態(tài)系統(tǒng)碳儲(chǔ)量時(shí)空分異驅(qū)動(dòng)力分析[J].生態(tài)環(huán)境學(xué)報(bào), 2023,32(2):215-225. WANG C W, LUO J J, TANG H H. Analysis on the driving force of spatial and temporal differentiation of carbon storage in the Taihang mountains based on InVEST model[J]. Ecology and Environmental Sciences,2023,32(2):215-225.
[5] 戚玉嬌,李鳳日.基于KNN方法的大興安嶺地區(qū)森林地上碳儲(chǔ)量遙感估算[J].林業(yè)科學(xué),2015,51(5):46-55. QI Y J, LI F R. Remote sensing estimation of aboveground forest carbon storage in Daxing’an mountains based on KNN method[J]. Scientia Silvae Sinicae,2015,51(5):46-55.
[6] 程鵬飛,王金亮,王雪梅,等.森林生態(tài)系統(tǒng)碳儲(chǔ)量估算方法研究進(jìn)展[J].林業(yè)調(diào)查規(guī)劃,2009,34(6):39-45. CHENG P F, WANG J L, WANG X M, et al. Research progress in estimating carbon storage of forest ecosystem[J]. Forest Inventory and Planning,2009,34(6):39-45.
[7] 張桂蓮.基于遙感估算的上海城市森林碳儲(chǔ)量空間分布特征[J].生態(tài)環(huán)境學(xué)報(bào),2021,30(9):1777-1786. ZHANG G L. Spatial distribution characteristics of carbon storage of urban forests in Shanghai based on remote sensing estimation[J]. Ecology and Environmental Sciences,2021,30(9): 1777-1786.
[8] PULITI S, BREIDENBACH J, SCHUMACHER J, et al. Above-ground biomass change estimation using national forest inventory data with Sentinel-2 and Landsat[J]. Remote Sensing of Environment,2021,265:112644.
[9] 李康杰,胡中岳,劉萍,等.基于Landsat-8 Oli影像的珠三角森林生物量估測(cè)[J].中南林業(yè)科技大學(xué)學(xué)報(bào),2023,43(3):73-81. LI K J, HU Z Y, LIU P, et al. Estimation of forest aboveground biomass in the Pearl River Delta based on Landsat-8 Oli remote sensing image data[J]. Journal of Central South University of Forestry Technology,2023,43(3):73-81.
[10] 鄭偉楠,吳勇,歐光龍.基于Landsat 8 OLI的昆明市主要森林類型生物量遙感估測(cè)與反演[J].西南林業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)),2023,43(6):107-116. ZHENG W N, WU Y, OU G L. Remote sensing estimation and inversion of biomass for major forest types in Kunming based on Landsat 8 OLI[J]. Journal of Southwest Forestry University(Natural Sciences),2023,43(6):107-116.
[11] 李蘭暉,黃聰聰,張鐿鋰,等.基于地理加權(quán)隨機(jī)森林的青藏地區(qū)放牧強(qiáng)度時(shí)空格局模擬[J].地理科學(xué),2023,43(3): 398-410. LI L H, HUANG C C, ZHANG Y L, et al. Mapping the multitemporal grazing intensity on the Qinghai-Tibet Plateau using geographically weighted random forest[J]. Scientia Geographica Sinica,2023,43(3):398-410.
[12] SANTOS F, GRAW V, BONILLA S. A geographically weighted random forest approach for evaluate forest change drivers in the Northern Ecuadorian Amazon[J]. PLoS ONE, 2019,14(12):e0226224.
[13] KHAN S N, LI D P, MAIMAITIJIANG M. A geographically weighted random forest approach to predict corn yield in the US corn belt[J]. Remote Sensing,2022,14(12):2843.
[14] 劉暢,李鳳日,甄貞.空間誤差模型在黑龍江省森林碳儲(chǔ)量空間分布的應(yīng)用[J].應(yīng)用生態(tài)學(xué)報(bào),2014,25(10):2779-2786. LIU C, LI F R, ZHEN Z. Prediction of spatial distribution of forest carbon storage in Heilongjiang province using spatial error model[J]. Chinese Journal of Applied Ecology,2014,25(10): 2779-2786.
[15] 賈煒瑋.東北林區(qū)各林分類型森林生物量和碳儲(chǔ)量[M].哈爾濱:黑龍江科學(xué)技術(shù)出版社,2014. JIA W W. Forest biomass and carbon storage of each forest stand type in the northeast forest region[M]. Harbin: Heilongjiang Science and Technology Press,2014.
[16] 范文義,張海玉,于穎,等.三種森林生物量估測(cè)模型的比較分析[J].植物生態(tài)學(xué)報(bào),2011,35(4):402-410. FAN W Y, ZHANG H Y, YU Y, et al. Comparison of three models of forest biomass estimation[J]. Chinese Journal of Plant Ecology,2011,35(4):402-410.
[17] 錢(qián)春花.喀斯特地區(qū)森林生物量遙感反演與時(shí)空動(dòng)態(tài)分析—以貴州省為例[D].南京:南京林業(yè)大學(xué),2022.QIAN C H. Study on remote sensing inversion and spatiotemporal dynamic analysis of forest biomass in Karst area: a case study of Guizhou province[D]. Nanjing: Nanjing Forestry University,2022.
[18] LI H M, ZHANG G L, ZHONG Q C, et al. Prediction of urban forest aboveground carbon using machine learning based on Landsat 8 and Sentinel-2: a case study of Shanghai, China[J]. Remote Sensing,2023,15(1):284.
[19] 趙安周,田新樂(lè).基于GEE平臺(tái)的1986—2021年黃土高原植被覆蓋度時(shí)空演變及影響因素[J].生態(tài)環(huán)境學(xué)報(bào),2022,31(11): 2124-2133. ZHAO A Z, TIAN X L. Spatiotemporal evolution and influencing factors of vegetation coverage in the Loess Plateau from 1986 to 2021 based on GEE platform[J]. Ecology and Environmental Sciences,2022,31(11):2124-2133.
[20] 李春強(qiáng),高永剛,徐涵秋.Landsat新型熱紅外地表溫度產(chǎn)品與MODIS地表溫度產(chǎn)品的交互對(duì)比[J].光譜學(xué)與光譜分析, 2023,43(3): 940-948. LI C Q, GAO Y G, XU H Q. Cross comparison between Landsat new land surface temperature product and the corresponding MODIS product[J]. Spectroscopy and Spectral Analysis, 2023,43(3):940-948.
[21] HU T, SUN Y M, JIA W W, et al. Study on the estimation of forest volume based on multi-source data[J]. Sensors,2021,21(23):7796.
[22] AI H X, WU X W, ZHANG L, et al. QSAR modelling study of the bioconcentration factor and toxicity of organic compounds to aquatic organisms using machine learning and ensemble methods[J]. Ecotoxicology and Environmental Safety,2019,179: 71-78.
[23] 李會(huì)朋,胥輝,張超,等.基于隨機(jī)森林模型的云南松天然林生物量遙感估測(cè)[J].西部林業(yè)科學(xué),2022,51(3):60-66,80. LI H P, XU H, ZHANG C, et al. Remote sensing stimation of Pinus yunnanensis natural forest biomass based on random forest model[J]. Journal of West China Forestry Science, 2022,51(3):60-66,80.
[24] 孫忠秋,高金萍,吳發(fā)云,等.基于機(jī)載激光雷達(dá)點(diǎn)云和隨機(jī)森林算法的森林蓄積量估測(cè)[J].林業(yè)科學(xué),2021,57(8):68-81. SUN Z Q, GAO J P, WU F Y, et al. Estimating forest stock volume via small-footprint LiDAR point cloud data and random forest algorithm[J]. Scientia Silvae Sinicae,2021,57(8):68-81.
[25] 戚玉嬌.大興安嶺森林地上碳儲(chǔ)量遙感估算與分析[D].哈爾濱:東北林業(yè)大學(xué),2014. QI Y J. Estimates of forest above ground carbon storage using remote sensing in Daxing’an mountions[D]. Harbin: Northeast Forestry University,2014.
[26] 劉勝剛,余哲修,歐光龍,等.基于GWR思茅松單木含碳量模型的構(gòu)建及空間分布研究[J].西南林業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)),2022,42(6):105-113. LIU S G, YU Z X, OU G L, et al. The study on spatial distribution and spatial model establishing based on GWR of carbon content of individual tree for Pinus kesiya var. langbianensis in natural forest[J]. Journal of Southwest Forestry University (Natural Sciences),2022,42(6):105-113.
[27] 孫雪蓮,舒清態(tài),歐光龍,等.基于隨機(jī)森林回歸模型的思茅松人工林生物量遙感估測(cè)[J].林業(yè)資源管理,2015(1):71-76. SUN X L, SHU Q T, OU G L, et al. Remote sensing estimation of the biomass of artificial Simao pine forest based on random forest regression[J]. Forest Resources Management,2015(1):71-76.
[28] GEORGANOS S, KALOGIROU S. A forest of forests: a spatially weighted and computationally efficient formulation of geographical random forests[J]. ISPRS International Journal of Geo-Information,2022,11(9):471.
[29] AGUIRRE-GUTIéRREZ J, RIFAI S, SHENKIN A, et al. Pantropical modelling of canopy functional traits using Sentinel-2 remote sensing data[J]. Remote Sensing of Environment, 2021,252:112122.
[30] GEORGANOS S, GRIPPA T, GADIAGA A N, et al. Geographical random forests: a spatial extension of the random forest algorithm to address spatial heterogeneity in remote sensing and population modelling[J]. Geocarto International,2021,36(2): 121-136.
[31] QUINONES S, GOYAL A, AHMED Z U. Geographically weighted machine learning model for untangling spatial heterogeneity of type 2 diabetes mellitus (T2D) prevalence in the USA[J]. Scientific Reports, 2021,11(1):6955.
[32] GENUER R, POGGI J M, TULEAU-MALOT C. Variable selection using random forests[J]. Pattern Recognition Letters, 2010,31(14):2225-2236.
[33] PROBST P, WRIGHT M N, BOULESTEIX A L. Hyperparameters and tuning strategies for random forest[J]. Wires Data Mining and Knowledge Discovery, 2019,9(3):e1301.
[34] DARST B F, MALECKI K C, ENGELMAN C D. Using recursive feature elimination in random forest to account for correlated variables in high dimensional data[J]. BMC Genetics, 2018,19(1):65.
[35] 邱新彩,鄭冬梅,王海賓,等.結(jié)合地統(tǒng)計(jì)學(xué)與Landsat 8影像的喬木林地上碳儲(chǔ)量估算[J].中南林業(yè)科技大學(xué)學(xué)報(bào),2020, 40(11):138-146. QIU X C, ZHENG D M, WANG H B, et al. Estimation of aboveground carbon storage of arbor forest based on the combination of geo-statistical method and Landsat 8 images[J]. Journal of Central South University of Forestry Technology, 2020,40(11):138-146.
[36] LI Y G, HAN N, LI X J, et al. Spatiotemporal estimation of bamboo forest aboveground carbon storage based on landsat data in Zhejiang, China[J]. Remote Sensing, 2018,10(6):898.
[37] 穆喜云,劉清旺,龐勇,等.基于機(jī)載激光雷達(dá)的森林地上碳儲(chǔ)量估測(cè)[J].東北林業(yè)大學(xué)學(xué)報(bào),2016,44(11):52-56. MU X Y, LIU Q W, PANG Y, et al. Forest aboveground carbon storage using RF algorithmic model and airborne LiDAR data[J]. Journal of Northeast Forestry University, 2016,44(11):52-56.
[38] CHANG Z B, FAN L, WIGNERON J P, et al. Estimating aboveground carbon dynamic of China using optical and microwave remote-sensing datasets from 2013 to 2019[J]. Journal of Remote Sensing, 2023,3:5.
[39] 劉暢.黑龍江省森林碳儲(chǔ)量空間分布研究[D].哈爾濱:東北林業(yè)大學(xué),2014. LIU C. Spatial distribution of forest carbon storage in Heilongjiang province[D]. Harbin: Northeast Forestry University, 2014.
[40] 譚雨欣,田義超,黃卓梅,等.基于XGBoost機(jī)器學(xué)習(xí)算法的北部灣茅尾海無(wú)瓣海桑紅樹(shù)林地上生物量反演[J].生態(tài)學(xué)報(bào),2023,43(11):4674-4688. TAN Y X, TIAN Y C, HUANG Z M, et al. Aboveground biomass of Sonneratia apetala mangroves in Mawei Sea of Beibu Gulf based on XGBoost machine learning algorithm[J]. Acta Ecologica Sinica, 2023,43(11):4674-4688.
[本文編校:吳 毅]
中南林業(yè)科技大學(xué)學(xué)報(bào)2024年7期