国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于機(jī)器學(xué)習(xí)算法的森林生物量多源遙感估測(cè)

2024-01-20 03:32黃天寶歐光龍徐熊偉王振會(huì)藺如喜
關(guān)鍵詞:樣地生物量森林

黃天寶,歐光龍,吳 勇,徐熊偉,王振會(huì),藺如喜,徐 燦*

(1.西南林業(yè)大學(xué),云南 昆明 650244;2.中國地質(zhì)調(diào)查局 昆明自然資源調(diào)查中心,云南 昆明 650111;3.自然資源部 自然生態(tài)系統(tǒng)碳匯工程技術(shù)創(chuàng)新中心,云南 昆明 650111)

森林生物量是森林生態(tài)系統(tǒng)的重要數(shù)量、質(zhì)量指標(biāo),對(duì)其精準(zhǔn)監(jiān)測(cè)是提高森林生態(tài)系統(tǒng)碳匯效益的重要保障[1]。傳統(tǒng)野外調(diào)查方法獲取森林生物量信息存在諸多局限性,利用遙感手段對(duì)森林生物量估測(cè)已然成為當(dāng)前的熱點(diǎn)[2]。被動(dòng)遙感系統(tǒng)的光學(xué)遙感數(shù)據(jù)不僅具有覆蓋范圍廣、獲取容易、時(shí)間、空間分辨率高、技術(shù)成熟等優(yōu)點(diǎn),而且多光譜光學(xué)遙感具有紅色、近紅外(NIR)或紅邊波段,對(duì)植被具有較好敏感性等,被泛應(yīng)用于森林生物量研究估測(cè)領(lǐng)域[3-5]。在光學(xué)遙感森林生物量遙感估測(cè)中,空間分辨率和光譜特征在很大程度上影響著森林生物量遙感估測(cè)精度[7],不同空間分辨率影像對(duì)地物的光譜特征及與樣地尺度不匹配產(chǎn)生的混合像元都會(huì)造成估測(cè)差異[7-8]。隨著遙感技術(shù)的不斷發(fā)展,多源遙感數(shù)據(jù)協(xié)同估測(cè)森林生物量成為熱點(diǎn),多源遙感數(shù)據(jù)協(xié)同估測(cè)可以克服單一影像對(duì)地物特征描述的片面性,因此具有較好的估測(cè)精度[9-10],此外,環(huán)境因子也被廣泛用于協(xié)同遙感估測(cè),且在一定程度上可以提高森林生物量遙感估測(cè)精度[11-12]。然而,在整合多源數(shù)據(jù)估測(cè)森林生物量中,信息冗余無疑是面臨的一個(gè)問題,在眾多變量中選擇最優(yōu)特征變量參與建模是影響估測(cè)效果的關(guān)鍵一步[13-15]。在變量選擇方法中Boruta是一種基于隨機(jī)森林學(xué)習(xí)器的啟發(fā)式算法,是通過變量與學(xué)習(xí)器結(jié)合的包裝式變量選擇方法,具有從復(fù)雜數(shù)據(jù)中挑選出與模型適應(yīng)性較強(qiáng)特征變量的能力[16-18]。

在森林生物量遙感估測(cè)中的模型按結(jié)構(gòu)通??煞譃閰?shù)模型和非參數(shù)模型,非參數(shù)模型大多統(tǒng)稱為機(jī)器學(xué)習(xí)模型,機(jī)器學(xué)習(xí)算法在森林生物量遙感估測(cè)中具有能充分捕捉復(fù)雜遙感變量與森林生物量之間的非線性復(fù)雜關(guān)系的能力,相較于參數(shù)模型,往往具有更好的估測(cè)效果[19]。常見的經(jīng)典機(jī)器學(xué)習(xí)算法隨機(jī)森林、k-近鄰、支持向量機(jī)、BP神經(jīng)網(wǎng)絡(luò)等算法被廣泛運(yùn)用于森林生物量遙感估測(cè)[19-21]。Stacking集成算法作為經(jīng)典的集成算法之一,相較于單一模型,Stacking集成模型能對(duì)特征數(shù)據(jù)充分學(xué)習(xí),集各基礎(chǔ)模型優(yōu)點(diǎn)于一身、具有較強(qiáng)的泛化能力,可以克服單一模型結(jié)果的偶然性和片面性,具有較好的學(xué)習(xí)效果[22-23]。

森林生物量分為地上生物量和地下生物量,大多研究都是基于地上生物量遙感估測(cè),全株樹木生物量估測(cè)的研究相對(duì)較少。Landsat 8 OLI、sentinel 2A、GF2(國產(chǎn)高分2號(hào))影像分別具有30、10、4 m不同的空間分辨率及不同波段,然而很少有研究在樣地大小為10 m×10 m尺度上比較3種影像及影像整合的估測(cè)性能,為進(jìn)一步探索基于機(jī)器學(xué)習(xí)算法的3種空間分辨率影像及整合3種影像在10 m×10 m樣地下的森林生物量(地上+地下)估測(cè)性能,以及協(xié)同機(jī)器學(xué)習(xí)算法(RF、SVM、DT、GBM、k-NN、Stacking)的估測(cè)效果,本研究引入地形因子、氣候因子、林分因子為輔助因子對(duì)GF2、sentinel 2A、Landsat 8 OLI影像、整合3種影像4種情況下基于Boruta算法變量選擇方法,對(duì)楚雄州元謀縣喬木林森林生物量遙感估測(cè)展開探索,可為森林生物量遙感估測(cè)提供參考和借鑒。

1 研究區(qū)概況

元謀縣位于云南省楚雄州(25°33′44″-25°36′50″N,101°51′21″-101°53′32″E),為干熱河谷典型區(qū)(圖1),屬于生態(tài)脆弱區(qū),該地區(qū)旱濕季節(jié)分明,年平均降水量<800 mm,年平均氣溫21.9 ℃,最高溫達(dá)40°以上,年積溫7 791.6 ℃。年平均蒸發(fā)量為3 847.8 mm,年平均降水量634 mm,年平均蒸發(fā)量遠(yuǎn)大于年降水量。全年降水量大多集中在6-10月。由于地形和降水導(dǎo)致植被在垂直方向的分布差異明顯,1 600 m以下主要以灌木為主,1 600 m以上主要喬木為主[24-25]。

地圖審圖號(hào):GS(2019)1822號(hào)

2 研究方法

2.1 樣地?cái)?shù)據(jù)處理

樣地?cái)?shù)據(jù)為2022年按樹種分布、地理位置特征等調(diào)查的元謀縣77塊喬木樹種,樣地大小為10 m×10 m,用RTK記錄樣地質(zhì)心點(diǎn)坐標(biāo),其樣地分布見圖1,涵蓋了元謀地區(qū)主要喬木樹種分布區(qū)域。樹種主要包括云南松(Pinusyunnanensis)、錐鏈櫟(Quercusfranchetii)、余甘子(Phyllanthusemblica)、旱冬瓜(Alnusnepalensis)、油杉(Keteleeriafortunei)、桉樹(Eucalyptusrobusta)、華山松(P.armandii)、厚皮香(Ternstroemiagymnanthera)、黃檀(Dalbergiahupeana)等。參考tang等[26]、Luo等[27]、胥輝等[28]的云南省優(yōu)勢(shì)樹種生長異速生長方程,計(jì)算單株樹木的森林生物量,各公式見表1,沒有生長異速方程的樹種采用相近樹種或按常綠落葉林、落葉闊葉林選取生長異速方程。

表1 單木生物量計(jì)算Table 1 Biomass calculation of individual trees

樣地單位面積生物量(Q)計(jì)算公式為

(1)

式中:n為樣地樹種株樹;W為單木生物量(t);S為樣地面積(hm2)。

圖2為樣地單位面積生物量按優(yōu)勢(shì)樹種、森林類型分布基本情況,其中闊葉林的樣地較多,針葉林和混交林樣地相對(duì)較少,所調(diào)查樣地中針葉林的平均生物量大于混交林,大于闊葉林;松屬、櫟屬為優(yōu)勢(shì)樹種的樣地單位面積生物量值分布差異較大;樣地單位面積生物量最小值為1.86 t·hm-2,最大值為184.11 t·hm-2,平均值為60.53 t·hm-2。

圖2 樣地生物量基本情況Fig.2 Basic situation of biomass in sample plots

2.2 數(shù)據(jù)獲取及預(yù)處理

Landsat 8 OLI為地理空間數(shù)據(jù)云(http://www.gscloud.cn/)下載得到,分辨率30 m×30 m,本研究用了b1-b7波段;GF2為云南巡天衛(wèi)星科技有限公司購買,分辨率4 m×4 m,共4個(gè)波段,將獲得的Landsat 8 OLI、GF2在ENVI 5.3中經(jīng)過大氣校正、輻射定標(biāo)、裁剪等預(yù)處理工作,最終得到地表反射率產(chǎn)品;sentinel 2A為GEE(google earth engine)云計(jì)算平臺(tái)下載得到元謀地區(qū)2A級(jí)地表反射率產(chǎn)品,sentinel 2A分辨率10 m×10 m,共12個(gè)波段;環(huán)境因子來源于http://www.worldclim.org/,包括年均降水(MAP)和年均氣溫(MAT);DEM高程數(shù)據(jù)來源于地理空間數(shù)據(jù)云(http://www.gscloud.cn/)。

2.3 特征變量提取

參考Miura等[29]、Schlerf等[30]、Hashemi等[31]的研究在ENVI 5.3中完成對(duì)植被指數(shù)的計(jì)算,包括GF2、Sentinel 2A、Landsat 8 OLI 的單波段、植被指數(shù)、紋理特征。林分因子包括優(yōu)勢(shì)樹種、森林類型(針葉林、闊葉林、針闊混交林),樣地坐標(biāo)與影像坐標(biāo)均為高斯-克呂格投影坐標(biāo)(CGCS2000_3_Degree_GK_Zone_34),并在Arcgis 10.7中以“多值提取至點(diǎn)”功能完成各樣地遙感變量統(tǒng)計(jì)值提取,DEM數(shù)據(jù)(坡向、坡面、海拔)的提取,以及環(huán)境因子統(tǒng)計(jì)值提取,變量見表2。

表2 變量名稱Table 2 Variables

2.4 特征變量選擇

Boruta是一種基于隨機(jī)森林學(xué)習(xí)器的啟發(fā)式算法,其核心思想是通過對(duì)原始真實(shí)特征進(jìn)行訓(xùn)練,構(gòu)造陰影特征,并將原始特征與陰影特征聚合為特征矩陣進(jìn)行訓(xùn)練,然后以陰影特征的特征重要性分?jǐn)?shù)為參考,從原始真實(shí)特征中選擇與因變量相關(guān)的特征集[32]。Boruta算法除了生成特征排序外還將特征分為3種類型(confirmed、tentative、rejected)對(duì)變量重要性進(jìn)行定性評(píng)價(jià)[16-18]。在R語言中利用boruta程序包,分別對(duì)GF2、sentinel 2A、Landsat 8 OLI及三者變量整合情況下進(jìn)行變量選擇。

2.5 模型構(gòu)建

利用R語言的caret包實(shí)現(xiàn)隨機(jī)森林模型(RF)[33]、支持向量機(jī)(SVM)[34]、決策樹(DT)[35-36]和梯度提升機(jī)(GBM)[37-38]模型的構(gòu)建。堆疊集成算法(Stacking)一般由兩層學(xué)習(xí)器組成,第1層為初級(jí)學(xué)習(xí)器,第2層稱為元學(xué)習(xí)器,其基本思想是利用訓(xùn)練數(shù)據(jù)集訓(xùn)練模型構(gòu)造基學(xué)習(xí)器,將所有基學(xué)習(xí)器的預(yù)測(cè)結(jié)果與響應(yīng)變量真值組合為一個(gè)新的數(shù)據(jù)集,最后基于元學(xué)習(xí)器對(duì)新數(shù)據(jù)集進(jìn)行訓(xùn)練和預(yù)測(cè),也逐漸被應(yīng)用于森林生物量遙感估[22-23]。在本研究中,以RF、k-NN、SVM、DT、GBM作為基礎(chǔ)模型,最終以RF算法進(jìn)行Stacking集成。77塊均為建模樣本,并采用K折交叉驗(yàn)證對(duì)模型評(píng)價(jià)。利用R語言的caret包實(shí)現(xiàn)RF、k-NN、SVM、GBM、DT模型的構(gòu)建,采用網(wǎng)格化模型參數(shù)調(diào)優(yōu)。

2.6 評(píng)價(jià)指標(biāo)

K折交叉驗(yàn)證能有效避免過學(xué)習(xí)和欠學(xué)習(xí)狀態(tài)的發(fā)生,尤其針對(duì)小樣本數(shù)據(jù)建模具有較好的適用性,其模型評(píng)價(jià)結(jié)果也比較具有說服性[39],因此,本研究所有機(jī)器學(xué)習(xí)算法均采用K折交叉驗(yàn)證對(duì)模型檢驗(yàn)評(píng)價(jià),K取10。采用決定系數(shù)(R2)和均方根誤差(RMSE)對(duì)模型評(píng)價(jià)。

3 結(jié)果與分析

3.1 boruta算法選擇

經(jīng)過boruta算法分別對(duì)基于sentinel 2A條件下、Landsat 8 OLI條件下、GF2條件下及整合多源遙感條件下進(jìn)行森林生物量遙感測(cè)進(jìn)行變量選擇,boruta算法結(jié)果見圖3,結(jié)果皆為Confirmed下的特征變量,在基于sentinel 2A估測(cè)森林生物量中,選擇的變量為林分因子中的森林類型(forests_types)、植被指數(shù)和紋理因子,其中植被指數(shù)PEIP的得分最高;在Landsat 8 OLI下,紋理因子b2_ME_9×9的得分最高;在GF2下,植被指數(shù)GNDVI的得分最高;在SUM下GF2的GNDVI得分最高,但環(huán)境因子和地形因子特征沒有被捕獲。

圖3 變量選擇Fig.3 Variable selection

3.2 模型評(píng)價(jià)

在基于boruta算法變量選擇下,分別在sentinel 2A、Landsat 8 OLI、GF2及SUM條件下完成RF、DT、k-NN、GBM、SVM模型、Stacking集成算法模型構(gòu)建,經(jīng)過K折交叉驗(yàn)證,K=10,取其R2和RMSE的平均值作為評(píng)價(jià)指標(biāo),建模結(jié)果見圖4。集成算法相較于單模型均有較好的估測(cè)性能,從集成算法的結(jié)果看,SUM估測(cè)森林生物量相較于單一遙感具有較好的估測(cè)效果,此外,GF2在元謀地區(qū)遙感估測(cè)森林生物量中相較于sentinel 2A、Landsat 8 OLI具有較好的估測(cè)性能,sentinel 2A的估測(cè)性能優(yōu)于Landsat 8 OLI,SUM下的Stacking模型R2為 0.73,RMSE為28.46 t·hm-2,為本研究的最優(yōu)模型形式。此外在單一算法中RF具有較好的估測(cè)效果。

圖4 建模結(jié)果Fig.4 Modeling results

3.3 反演估算

圖5為基于sentinel 2A、Landsat 8 OLI、GF2、及SUM下Stacking集成算法的元謀地區(qū)森林生物量遙感估測(cè)反演結(jié)果,由圖5可以看出,4種情況下的反演結(jié)果均有較好的異質(zhì)性,其中基于Landsat 8 OLI的估測(cè)結(jié)果相較于sentinel 2A、GF2、SUM位于60~90 t·hm-2的圖斑居多,sentinel 2A為影像源下,低值的圖斑居多,基于GF2和SUM的估算結(jié)果較為相似,從模型評(píng)價(jià)效果來看整合多源遙感和GF2模型性能優(yōu)于sentinel 2A和Landsat OLI,在高值估測(cè)能力方面SUM優(yōu)于GF2,具有較寬的估測(cè)范圍,基于SUM的估測(cè)結(jié)果更具參考意義。

圖5 元謀地區(qū)森林生物量遙感估算結(jié)果Fig.5 Estimation results of forest biomass remote sensing in Yuanmou area

4 討論

基于Boruta算法在單一影像變量重要性得分中sentinel 2A影像的植被指數(shù)PEIP(紅邊感染點(diǎn)指數(shù))、GF2的GNDVI得分最高,具紅邊波段的植被指數(shù)具有較好的得分,這與光學(xué)影像的紅邊波段對(duì)植被敏感的特征相呼應(yīng),此外在高分辨率影像GF2中,相對(duì)較多紋理特征與較高的得分,這與高分辨率影像估測(cè)森林生物量中紋理特征具有較好的估測(cè)效果相呼應(yīng)[8]?;趕entinel 2A感測(cè)森林生物量中,林分因子森林類型也有較好的貢獻(xiàn)率,若能有更多容易獲取的林分因子協(xié)同森林生物量遙感估測(cè)[40-41],將會(huì)獲得更好的估測(cè)效果。此外,光學(xué)遙感對(duì)針葉林、闊葉林、針闊混交林的光譜特征存在差異,由于受樣本量限制,本研究僅將森林類型作為一個(gè)變量,若能分森林類型進(jìn)行遙感估測(cè),在一定程度上可以提高估測(cè)精度[41]。本研究引入年平均降水、年平均氣溫作為變量,但效果稍遜于遙感因子,在特征變量選擇時(shí)沒有被捕獲,可能是由于區(qū)域尺度較小,氣候因子的變化梯度不夠明顯,往往在大區(qū)域森林生物量遙感估測(cè)中,氣候因子能發(fā)揮較好的效果[42]。

在本研究中,GF2相較于sentinel 2A、Landsat 8 OLI具有較好的估測(cè)效果,這與高分辨率遙感影像更具區(qū)分光譜特征變化能力、空間信息更加豐富、紋理和細(xì)節(jié)等信息更加突出等優(yōu)點(diǎn)相呼應(yīng),相較于粗分辨率往往具有更好的估測(cè)效果相呼應(yīng)[43],sentinel 2A估測(cè)效果優(yōu)于Landsat 8 OLI,這與sentinel 2A與10 m×10 m樣地尺度匹配,在理論上不存在混合像元,且與Landsat 8 OLI相比具有更高的空間分辨率相呼應(yīng)。整合多源遙感往往比單一遙感具有較好的估測(cè)性能[44-45],本研究也如此,但在單一模型層面基于GF2構(gòu)建的k-NN模型R2為0.46,整合3種影像后k-NN模型R2為0.39,GF2的RF模型R2為0.58,而整合3種影像后的RF模型R2為0.52,存在整合后反而模型效果比單一影像差的情況,本研究的解釋為在變量選擇方面只用了Boruta算法進(jìn)行特征選擇,在一定程度上可能存在偶然性和片面性、存在有用信息遺漏的情況以及針對(duì)所選擇的同一份數(shù)據(jù)集對(duì)不同的學(xué)習(xí)器普適性會(huì)存在差異所導(dǎo)致,恰好集成算法在一定程度可以彌補(bǔ)這種缺陷,克服單一模型結(jié)果的偶然性和片面性,綜合各模型對(duì)數(shù)據(jù)集進(jìn)行客觀評(píng)價(jià),在一定程度上更具說服力[22-23],若能綜合多種變量選擇方法或許可以彌補(bǔ)單一變量選擇手段的不足[46-48]。Stacking集成算法可以提高估測(cè)精度[22,43,49],通過降低生物量估計(jì)偏差的形式來提高估測(cè)精度[49],本研究最優(yōu)集成模型的R2為0.73,RMSE為28.46 t·hm-2,在光學(xué)遙感估測(cè)森林生物量中,與Lin[22]、岳彩榮[50]和孫雪蓮[51]基于光學(xué)遙感估測(cè)森林生物量相比較,其精度偏中上,主動(dòng)遙感機(jī)載傳感器系列在小區(qū)域往往有更好的估測(cè)效果[53-54]。

此外,在森林生物量遙感估測(cè)中,影像像元大小與樣地尺寸的匹配問題導(dǎo)致產(chǎn)生大量混合像元也會(huì)影響森林生物量遙感估測(cè)精度,本研究比較了3種空間分辨率影像尺度在10 m×10 m樣地尺度的估測(cè)效果,但沒有體現(xiàn)混合像元帶來的具體誤差,Yu等[7]提出了一種熵加權(quán)指數(shù)的尺度轉(zhuǎn)換方法,以修正粗分辨率遙感圖像估計(jì)的生物量結(jié)果的尺度誤差,改善了尺度不匹配帶來的誤差,值得參考和借鑒。在融合高、中低分辨率森林生物量遙感估測(cè)中,若能用高分辨率影像提取林分結(jié)構(gòu)信息結(jié)合中低分辨率影像的多波段、光譜信息,應(yīng)該可以很好地改善森林生物量遙感估測(cè)效果,有待進(jìn)一步探索。

5 結(jié)論

通過機(jī)器學(xué)習(xí)算法用GF2、sentinel 2A、Landsat 8 OLI、SUM影像及輔助因子對(duì)元謀地區(qū)喬木林森林生物量展開估測(cè),研究表明,在10 m×10 m樣地尺度下SUM的估測(cè)效果最佳,其余依次為GF2、sentinel 2A和Landsat 8 OLI,SUM下的Stacking集成算法為最終估測(cè)模型,模型的R2為0.73,RMSE為28.46 t·hm-2。Boruta算法進(jìn)行特征選擇下,單一影像中sentinel 2A的植被指數(shù)PEIP、Landsat 8 OLI的紋理因子b2_ME_9×9、GF2的GNDVI分別具有最高的得分,GF2的GNDVI為SUM下的最高得分變量。在構(gòu)建RF、SVM、DT、GBM、k-NN及對(duì)5個(gè)模型的Stacking集成算法中,Stacking集成算法均優(yōu)于單一基礎(chǔ)模型,在單一算法層面RF具有較好的估測(cè)性能。進(jìn)一步說明高分辨率影像在10 m×10 m樣地尺度下具有較好的估測(cè)效果,整合多源遙感和集成算法相較于單一遙感源和單一算法具有較好的估測(cè)精度,可為森林生物量遙感估測(cè)提供一定的參考和借鑒。

猜你喜歡
樣地生物量森林
額爾古納市興安落葉松中齡林植被碳儲(chǔ)量研究
昆明市主要綠化樹種閾值測(cè)定與分析
基于角尺度模型的林業(yè)樣地空間結(jié)構(gòu)分析
輪牧能有效促進(jìn)高寒草地生物量和穩(wěn)定性
哈Q森林
哈Q森林
哈Q森林
哈Q森林
生物量高的富鋅酵母的開發(fā)應(yīng)用
基于SPOT-5遙感影像估算玉米成熟期地上生物量及其碳氮累積量