張子慧,吳世新,趙子飛,李向義,曾凡江,謝聰慧,侯冠宇,羅格平
1 中國科學(xué)院新疆生態(tài)與地理研究所荒漠與綠洲生態(tài)國家重點實驗室,烏魯木齊 830011
2 中國科學(xué)院太空應(yīng)用重點實驗室,北京 100094
3 中國科學(xué)院新疆生態(tài)與地理研究所新疆荒漠植物根系生態(tài)與植被修復(fù)重點實驗室,烏魯木齊 830011
4 中國科學(xué)院空間應(yīng)用工程與技術(shù)中心,北京 100094
5 中國科學(xué)院大學(xué),北京 100049
草地資源是我國陸地上面積最大的生態(tài)系統(tǒng)類型,具有防風(fēng)、固沙、保土、調(diào)節(jié)氣候、凈化空氣、涵養(yǎng)水源等生態(tài)功能,是草地畜牧業(yè)發(fā)展最重要的物質(zhì)基礎(chǔ),對于全球生態(tài)環(huán)境、碳循環(huán)和維系生態(tài)平衡起重要的作用[1]。其時空分布格局可以反映草地植被的碳匯潛力[2]。草地地上生物量(aboveground biomass,AGB)通常用草地地上部分植被的干重表示,是全球碳循環(huán)的重要組成部分,是指導(dǎo)畜牧業(yè)生產(chǎn)管理的重要指標(biāo)[3]。估算草地AGB是草地資源空間格局動態(tài)研究的重要內(nèi)容,也是草畜平衡綜合分析的基礎(chǔ),祁連山作為我國西部地區(qū)的重要生態(tài)保護屏障、黃河流域的重要水源產(chǎn)流地,也是我國生物多樣性保護的優(yōu)先區(qū)域,區(qū)域土地覆蓋以草地為主,其生態(tài)保護事關(guān)我國西部地區(qū)的生態(tài)安全及經(jīng)濟社會可持續(xù)發(fā)展。及時準(zhǔn)確地獲取祁連山草地產(chǎn)量數(shù)據(jù)、草地植被生長狀況、AGB大小及其空間分布,對區(qū)域復(fù)合生態(tài)系統(tǒng)功能的科學(xué)評估具有參考價值,對草地退化機理研究與治理、指導(dǎo)草地畜牧業(yè)生產(chǎn),維護生態(tài)服務(wù)功能和區(qū)域可持續(xù)發(fā)展具有重要意義[4—5]。
目前,草地AGB反演面臨著諸多挑戰(zhàn),數(shù)據(jù)源方面,遙感影像具有探測范圍大、成本低、容易獲取等優(yōu)點,為通過間接測量的、非破壞性的手段反演草地AGB現(xiàn)狀,遙感影像已成為生物量反演的主要數(shù)據(jù)源,目前使用較多的為MODIS、Landsat- 8和Sentinel- 2影像數(shù)據(jù)[6—9],其中Sentinel- 2數(shù)據(jù)具有更高的空間分辨率(10m),可以更好地與實測AGB數(shù)據(jù)相匹配,是目前常用的性能最好的星載遙感數(shù)據(jù)[7—11]。雖然衛(wèi)星影像可以進行大范圍的監(jiān)測,考慮到衛(wèi)星影像與實地采集樣方間的尺度差異,有些細(xì)節(jié)特征還是不能突出,因此許多學(xué)者引入UAV數(shù)據(jù)用于減少多源數(shù)據(jù)間的尺度效應(yīng)[12—15]。特征提取方面,國內(nèi)外學(xué)者構(gòu)建了一系列與AGB密切相關(guān)的植被指數(shù)用于提高草地AGB遙感反演的精度[10—11,16—18],比如增強型植被指數(shù)(Enhanced Vegetation Index,EVI)能夠改善歸一化植被指數(shù)(Normalized Difference Vegetation Index,NDVI)在高植被覆蓋區(qū)的飽和現(xiàn)象[16]、轉(zhuǎn)換型土壤調(diào)節(jié)植被指數(shù)(Transformed Soil-adjusted Vegetation Index, TSAVI)對土壤背景值敏感[17]、比值植被指數(shù)(Ratio Vegetation Index, RVI)在植被覆蓋度高的情況下對植被十分敏感[18]等,不同植被指數(shù)能夠反映不同的植被特征,根據(jù)研究區(qū)植被特征選取合適的植被指數(shù)用于AGB反演建模是極其重要的。反演算法方面,機器學(xué)習(xí)算法成為當(dāng)前常用的構(gòu)建模型的方法,許多學(xué)者利用數(shù)理方法構(gòu)建草地AGB參數(shù)反演模型[19—24],且已被證實適用于草地AGB的反演中。目前常用的算法包括線性回歸算法和非線性回歸算法兩大類,其中線性回歸算法多以一元線性回歸和多元線性回歸為主[19—20],非線性回歸算法多以支持向量機回歸(Support Vector Regression, SVR)[21]和DTR[22]、RFR[23]、GBRT[22]和XGBoost[24]等基于決策樹形成的回歸算法為主,反演AGB過程中可能會遇到變量之間的關(guān)系并不是線性的,利用線性回歸算法構(gòu)建模型時受到限制,SVR算法可以用于解決非線性回歸問題,但容易出現(xiàn)過擬合現(xiàn)象且計算復(fù)雜度高、可解釋性不好,基于決策樹的算法不僅可以用于線性或非線性的回歸問題中,還能夠很好的避免過擬合現(xiàn)象,是目前應(yīng)用最為廣泛的反演算法。DTR模型解釋性好,可以使用圖形化描述模型[22];RFR是用訓(xùn)練數(shù)據(jù)隨機計算出多顆決策樹,實現(xiàn)簡單,訓(xùn)練速度快,模型泛化能力強[23];GBRT對異常值的魯棒性非常強,在相對較少的調(diào)參時間下,預(yù)測的準(zhǔn)確度較高[22];XGBoost在代價函數(shù)中加入了正則項,能夠控制模型的復(fù)雜度,可以防止過擬合現(xiàn)象還能夠減少計算量[24]。因此,基于4種算法的獨特優(yōu)勢,本文探討了這4種算法反演祁連山草地AGB的適用性。以往的AGB反演研究取得了長足的進展,提出了許多新的方法和理論,綜合以上內(nèi)容依舊存在著三個重要問題,一是如何減少多源數(shù)據(jù)間的尺度差異;二是如何選取適合研究區(qū)內(nèi)植被特點的植被指數(shù);三是如何選擇合適的反演算法用于構(gòu)建草地AGB反演模型。
研究對象為祁連山的草地生態(tài)系統(tǒng),位于青藏高原東北部(圖1,94°33 ′10.8″ —100°39′ 7.2″ E, 36°51 ′25.2 ″—39°54′ 37.2″ N),是河西走廊地區(qū)重要的生態(tài)保護屏障和主要的水資源涵養(yǎng)地[26]。研究區(qū)內(nèi)平均海拔約為3800m,占地面積約為128300km2,年平均溫度為0.6℃,年平均降水量約為400—700mm[27]。光照充足,冬季長而寒冷,夏季短而溫和,干濕分明,常年受西風(fēng)環(huán)流的影響,屬于典型的高原大陸性氣候[28]。水熱條件隨海拔的升高而發(fā)生變化,氣候類型和植被類型表現(xiàn)為明顯的垂直地帶性差異[29]。主要植被類型有木本豬毛菜(SalsolaarbusculaPall.)、高山嵩草(KobresiaPygmaeaC. B. Clarke)、針茅(StipacapillataL.)、鬼箭錦雞兒(CaraganaJubata(Pall.) Poir.)、二裂委陵菜(PotentillabifurcaLinn.)等[30]。主要草地類型有荒漠草原、高寒荒漠草原、高寒苔草草原、高寒嵩草草甸、高寒針茅草原等[31—33]。
圖1 研究區(qū)示意圖
1.2.1地面實測AGB數(shù)據(jù)
祁連山草地實測AGB數(shù)據(jù)獲取時間為2021年7月20日—8月10日,正值植被生長期。共布設(shè)23個能夠代表祁連山草原植被、地形及土壤等特征的采樣區(qū)(如圖1所示),按一定方向在樣地中間位置設(shè)100m×100m樣線(圖2),記錄每個采樣區(qū)的基本信息,包括經(jīng)度、緯度、海拔高度、蓋度、株高等。為方便與Sentinel- 2 影像數(shù)據(jù)的分辨率(10m)相匹配,保證樣方在采樣區(qū)內(nèi)覆蓋主要草地類型且均勻分布,沿樣線布置5個1m×1m樣方,每個樣方間隔距離為20m(圖2),共計115個樣方。收集樣方內(nèi)所有植物的地上部分,稱其鮮重后在實驗室內(nèi)置于105℃下殺青,采用85℃烘干至恒重,獲得每個樣方的草干重,分別計算每個樣方的生物量,獲取115個樣方的AGB實測數(shù)據(jù)。用于構(gòu)建祁連山草地AGB反演的訓(xùn)練集和測試集。經(jīng)實地考察,研究區(qū)群落由西北至東南方向具有明顯差異,西北區(qū)域植被較稀疏,以荒漠草原為主,東南區(qū)域植被分布均勻且覆蓋度均達85%以上,以嵩草草原為主。
圖2 采樣區(qū)示意圖
1.2.2圖像數(shù)據(jù)與處理
Sentinel- 2是高分辨率多光譜成像衛(wèi)星,覆蓋可見光、近紅外等13個波段,其中包含3個紅邊波段(表1),能夠反映植被的反射率光譜特征,重采樣后分辨率可達到10m[6—9]。本研究中所需的Sentinel- 2遙感產(chǎn)品通過歐洲航天局(European Space Agency, ESA)官網(wǎng)(https://scihub.copernicus.eu/dhus/#/home)下載云覆蓋率低于10%、與實地采樣時間相近的21景影像,以及2016年植被生長期的影像。
表1 Sentinel- 2 MSI數(shù)據(jù)的參數(shù)信息
UAV數(shù)據(jù)通過大疆Phantom 4 Pro獲取,無人機按照DJI GO 4設(shè)定的飛行路線自動飛行至覆蓋整個采樣區(qū),設(shè)置航向重疊率為80%、旁向重疊率為70%,飛行高度為15m,并按一定的時間間隔(1.5s)垂直拍攝地表,共拍攝23個樣地的UAV數(shù)據(jù),空間分辨率為0.4cm?;赟entinel- 2影像數(shù)據(jù)對UAV數(shù)據(jù)進行圖像方向配準(zhǔn)、尺度配準(zhǔn),提取兩種影像數(shù)據(jù)特征向量,從而將UAV數(shù)據(jù)配準(zhǔn)至Sentinel- 2數(shù)據(jù)。UAV數(shù)據(jù)作為聯(lián)系Sentinel- 2遙感影像和1m×1m實地樣方的媒介,可以在一定程度上減少Sentinel- 2 影像數(shù)據(jù)和地面樣方之間存在的尺度差異。研究區(qū)DEM數(shù)據(jù)來源于美國地質(zhì)勘探局(United States Geological Survey,USGS)提供的30m分辨率SRTM數(shù)據(jù)(https://lpdaac.usgs.gov/products/srtmgl1v003/)。
教學(xué)結(jié)束后,采用自制調(diào)查問卷對兩組護生職業(yè)核心能力和人文素養(yǎng)各項指標(biāo)進行測評。問卷包括主動學(xué)習(xí)力、學(xué)習(xí)興趣、團隊協(xié)作、語言表達能力、溝通能力、人文素養(yǎng)6個方面,滿分100分,分值越高表明能力越強。問卷以不記名方式填寫。共發(fā)放問卷127份,回收127份,有效回收率100%。
利用SNAP、ArcGIS軟件對Sentinel- 2數(shù)據(jù)進行預(yù)處理,包括重采樣、鑲嵌、裁剪等(圖3)。使用Pix4D Mapper對UAV數(shù)據(jù)進行拼接、地理位置疊加、空三加密等操作,得到數(shù)字正射影像,最后導(dǎo)入ENVI圖像處理軟件中進行影像裁剪等處理(圖3)。
圖3 數(shù)據(jù)處理流程圖
1.2.3植被指數(shù)選取
為了證實Sentinel- 2數(shù)據(jù)在反演AGB方面的潛力,比較分析相關(guān)研究,在UAV數(shù)據(jù)輔助下,對處理后Sentinel- 2 影像數(shù)據(jù)提取了EVI、RVI、紅邊歸一化植被指數(shù)(Red Edge Normalized Difference Vegetation Index, NDVI705)、TSAVI、紅邊簡單比值(Red Edge Simple Ratio,SRre)和改進型簡單比值(Modified Simple Ratio, MSR)6種植被指數(shù)(表2),用于反演祁連山AGB的空間分布。
表2 選取的植被指數(shù)
建立祁連山草地AGB反演模型,進行模型的適用性分析,技術(shù)路線圖見圖4,圖中y、y-y1、y-y1-y2-…-yn-1為單顆決策樹的相關(guān)AGB輸入值;y1、y2、yn、y1+Ω(f1)、y2+Ω(f2)、y1+Ω(fn)分別為單顆決策樹的AGB輸出值;F(x)為算法的輸出值。
圖4 技術(shù)路線圖
本文利用了DTR、RFR、CBRT和XGBoost 4種算法構(gòu)建祁連山草地AGB反演模型。這4種算法均基于分類與回歸樹(Classification and Regression Trees, CART)實現(xiàn)預(yù)測,CART采用二分遞歸分割技術(shù),通過構(gòu)建一個二叉樹將樣本進行遞歸劃分,使用樣本的最小方差作為分裂節(jié)點的依據(jù)。
DTR在訓(xùn)練數(shù)據(jù)集所在的輸入空間中,遞歸地將每個區(qū)域劃分為兩個子區(qū)域并決定每個子區(qū)域上的輸出值,構(gòu)建二叉決策樹,根據(jù)樣本中不同特征的信息純度形成樹的各個結(jié)點,輸入樣本數(shù)據(jù)流經(jīng)整顆決策樹,最終在葉子結(jié)點輸出最終的結(jié)果[22]。RFR作為一種集成學(xué)習(xí)方法,采用了Bagging的思想,在原始訓(xùn)練樣本集中有放回地重復(fù)隨機抽取新的訓(xùn)練樣本集合,基于多顆決策樹引入了隨機屬性選擇對數(shù)據(jù)進行預(yù)測,輸出所有決策樹輸出的平均值,可以避免單顆決策樹的局限性,通過降低模型方差來提高性能[21,23]。GBRT基于CART決策樹及Boosting技術(shù)的集成學(xué)習(xí)算法,以串行的方式建立多顆決策回歸樹,是一種迭代的決策樹算法,能夠抑制決策樹的復(fù)雜性,降低單顆決策樹的擬合能力,再通過梯度提升的方法集成多個決策樹,使用一階泰勒公式優(yōu)化模型,通過降低殘差來提高性能[22,34]。XGBoost基于GBRT進行了改進,在傳統(tǒng)的Boosting的基礎(chǔ)上,使用了二階泰勒公式優(yōu)化模型,并在代價函數(shù)里加入了正則化項(公式(1)),能夠降低模型的方差,用于控制模型的復(fù)雜度,使學(xué)習(xí)出來的模型更加簡單,提高模型泛化能力[24,35]。
(1)
式中:Ω(ft)為第t顆樹的正則化項;T為第t棵樹的葉子結(jié)點數(shù);wj為葉子結(jié)點j的權(quán)重向量l2范數(shù);Υ和λ為XGBoost算法的參數(shù)。
交叉驗證的基本思想是將原始數(shù)據(jù)進行分組,其中80%的數(shù)據(jù)作為訓(xùn)練集,20%的數(shù)據(jù)作為測試集,首先用訓(xùn)練集對回歸器進行訓(xùn)練,再利用驗證集來測試訓(xùn)練得到的模型,作為評價回歸器的性能指標(biāo),使用交叉驗證是為了得到可靠穩(wěn)定的模型,常見的交叉驗證形式有K折交叉驗證、留一交叉驗證等。
為了分析4種算法反演祁連山草地AGB的適用性,本文利用5折交叉驗證對模型進行評估,利用平均絕對誤差(Mean Absolute Deviation,MAE,公式(2))、均方根誤差(Root Mean Squared Error,RMSE,公式(3))和決定系數(shù)(R-squared,R2,公式(4)) 3個指標(biāo)[21—24]用于模型精度評定。
(2)
(3)
(4)
計算了植被指數(shù)與實測AGB間的Pearson相關(guān)系數(shù)(圖5),發(fā)現(xiàn)AGB與各植被指數(shù)均表現(xiàn)為顯著正相關(guān)(P≤0.01)。其中,EVI、TSAVI和AGB的相關(guān)性相對較低;TSAVI與其他植被指數(shù)的相關(guān)性也較低。造成該結(jié)果的原因是祁連山草地植被覆蓋度較高,受土壤背景影響低,而EVI和TSAVI更適用于低覆蓋區(qū)的植被研究中,能夠降低土壤背景的影響,提高對植被的敏感性,主要與EVI和TSAVI本身所反映的植被特征有關(guān)。
圖5 植被指數(shù)與AGB的相關(guān)系數(shù)矩陣
本文評估了4種算法反演祁連山草地AGB的因子重要性(圖6),每種算法中各因子重要性表現(xiàn)也有其異同點。在RFR模型中,各因子間重要性差異較小,利用該模型反演AGB時考慮的因子較多,模型復(fù)雜度較高;而DTR模型中,各因子間重要性差異較大,利用該模型反演AGB時考慮的因子較少,可能會出現(xiàn)影響因子考慮不全的結(jié)果。RVI在4種算法中均占較高權(quán)重,對于反演祁連山AGB狀況有著不可代替的作用;并且RVI對土壤背景變化的敏感性較弱,在植被覆蓋度較高的情況下對植被信息反映敏感,表明祁連山草地的覆蓋度較高; EVI和TSAVI 2種植被指數(shù)的重要性均較低也能夠表明研究區(qū)植被覆蓋度較高的現(xiàn)狀,因為這兩個植被指數(shù)更適合對低覆蓋度的植被監(jiān)測,所表現(xiàn)出的結(jié)果與它們和AGB間的相關(guān)性也有關(guān)。在XGBoost算法中,降低了EVI的影響,說明該植被指數(shù)不適用于祁連山草地AGB的反演,不能有效地反映出研究區(qū)草地的植被特征;明顯突出了SRre的重要性,該指數(shù)與近紅外與紅邊波段信息有關(guān),這兩個波段對植被信息反映比較敏感。
圖6 AGB與各植被指數(shù)的因子重要性評估結(jié)果
通過比較4種算法中反演祁連山草地AGB最優(yōu)模型的MAE、RMSE、R2和模型精度進行模型的適用性評價(表3)。其中,XGBoost模型具有最低的MAE(71.60 kg/hm2)和RMSE(99.74 kg/hm2),最高的R2(0.78)和精度(74.75%),反演效果最好,其次分別為GBRT、RFR、DTR。因為RFR、GBRT和XGBoost 3種算法均是在DTR的基礎(chǔ)上進行了改進,其中,RFR采用的是bagging思想,而GBRT采用的是boosting思想,以串行的方式建立決策樹;GBRT在優(yōu)化的時候只用到一階導(dǎo)數(shù)信息,XGBoost在代價函數(shù)中加入了正則項,與其他算法有其獨特的先進性。XGBoost算法中突出的SRre植被指數(shù),更適用于祁連山草地AGB的反演,對植被信息反映敏感,因此本文將選用XGBoost算法對祁連山草地AGB進行反演,用于進一步分析其空間分布狀況。
表3 4種回歸模型算法的適用性比較
綜合上述模型適用性的分析,本文利用XGBoost反演祁連山草地AGB,總體上呈現(xiàn)出由西北向東南增加的趨勢(圖7),平均AGB為925.43 kg/hm2,AGB分布主要受到水熱條件的影響,靠近水源的區(qū)域AGB更大,水分條件差的區(qū)域AGB較低。東南區(qū)域靠近青海湖,屬于高原大陸性氣候,光照充足,具有良好的適宜植被生長的水熱條件,同時在植被生長峰值期間受到西南季風(fēng)的影響,帶來的部分水汽適宜植被生長,因而AGB較高;西北區(qū)域水分條件較差,受季風(fēng)影響弱,主要受到山間徑流的影響,使得AGB沿水資源分布狀況而發(fā)生變化,與東南區(qū)域相比,AGB較低。
圖7 祁連山草地AGB空間分布圖
上述研究結(jié)果表明,在UAV數(shù)據(jù)的基礎(chǔ)上,利用Sentienl- 2 影像數(shù)據(jù)提取出的植被指數(shù),選用XGBoost模型反演祁連山草地AGB空間分布的方法具有很強的應(yīng)用潛力,在交叉驗證的基礎(chǔ)上,模型精度也在可接受范圍,與其他研究相比[23],本文針對祁連山草地AGB的空間制圖結(jié)果是可信的,該研究能夠提供一定的可信度與理論支撐,但依舊存在四類重要問題值得討論分析。
在空間分布上受到降水量差異影響,草地AGB表現(xiàn)出空間分異性,由于研究區(qū)內(nèi)降水量存在年際差異,大范圍下草地AGB狀況會存在一定的滯后性,以往研究結(jié)論也提出相關(guān)論證[36—37]。本研究及將在后續(xù)工作中繼續(xù)探討降水量的年波動是否會在很大程度上影響XGBoost模型反演祁連山草地AGB空間分布的效果,以及祁連山草地AGB呈現(xiàn)出怎樣的動態(tài)變化模式。
本文在反演祁連山草地AGB過程中主要存在以下3各個方面的不確定性:首先是多源數(shù)據(jù)間的尺度效應(yīng)[11,17],Sentinel- 2數(shù)據(jù)的空間分辨率為10m,UAV數(shù)據(jù)分辨率為0.4cm,實地采集樣方大小為1m×1m,使用Sentinel- 2數(shù)據(jù)和UAV數(shù)據(jù)協(xié)同反演祁連山草地AGB能夠在一定程度上提高模型精度,但依舊會存在一些處理上以及算法上的誤差。其次是在研究區(qū)內(nèi)采樣點布設(shè)較少,既對研究區(qū)AGB的反演會存在一定誤差[20,38];也可能會造成過擬合現(xiàn)象,由于XGBoost算法中添加了正則化項來控制模型的復(fù)雜度,與其它3種算法相比,能夠提高模型反演的精度,但不能完全消除反演時存在的高估和低估問題[19]。第三是本文中所使用的Sentinel- 2數(shù)據(jù)由于受到云覆蓋的限制,選擇了與采樣時間相近的影像用于研究,雖然時間不能完全匹配,但造成的這種不確定性對于祁連山草地AGB變化的影響是可以忽略不計的。
利用UAV數(shù)據(jù)作為實現(xiàn)空天地一體化監(jiān)測技術(shù)的中間媒介,將Sentinel- 2影像數(shù)據(jù)和地面采樣數(shù)據(jù)進行像元尺度的匹配,尤其是對于西北區(qū)域,建群種為木本豬毛菜,散布在該區(qū)域且自身生物量較重,導(dǎo)致在實地采樣過程中會受到較大影響,而Sentinel- 2數(shù)據(jù)的像元尺度是10m,計算出的植被指數(shù)為10m×10m范圍內(nèi)的均值,本研究中通過提取UAV數(shù)據(jù)的特征波段,分析其與Sentinel- 2影像數(shù)據(jù)間的差異,發(fā)現(xiàn)UAV數(shù)據(jù)能夠觀測到Sentinel- 2數(shù)據(jù)所不能表現(xiàn)出的細(xì)節(jié)特征。因此,UAV數(shù)據(jù)的引入能夠降低匹配Sentinel- 2數(shù)據(jù)和實地樣方間的誤差,該結(jié)論與孫世澤等[20]、劉沁茹等[39]的研究結(jié)果一致。UAV數(shù)據(jù)可以減少尺度匹配過程中的誤差,但這種誤差是不能完全消除的,UAV數(shù)據(jù)獲取過程中會受到GPS誤差的影響,以及對UAV數(shù)據(jù)處理時也會受到系統(tǒng)誤差的影響。
本文所選用的XGBoost模型被證實適用于反演研究區(qū)草地AGB狀況。在空間分布適用性上,XGBoost模型精度為74.75%,MAE為71.60 kg/hm2,RMSE為99.74 kg/hm2,R2為0.78。除多等[19]基于MODIS數(shù)據(jù),利用GIS空間數(shù)據(jù)處理技術(shù)和多元統(tǒng)計分析方法反演草地AGB,R2介于0.1295—0.6929之間。黃家興等[40]基于Sentinel- 2植被指數(shù)數(shù)據(jù),利用二次曲線回歸模型反演天??h草地AGB,R2介于0.4019—0.6983之間,郭超凡等[41]基于Sentinel- 2影像數(shù)據(jù),利用隨機森林回歸模型反演草地AGB,R2為0.74。與前人的研究結(jié)果相比,本研究所利用的XGBoost模型在反演祁連山草地AGB中具有一定的優(yōu)勢,反演效果較好,模型適用性較高。
本文以Sentinel- 2 遙感影像計算的6種植被指數(shù)為特征,結(jié)合實拍UAV數(shù)據(jù)以及地面的115個樣本點實測AGB數(shù)據(jù),采用DTR、RFR 、GBRT和XGBoost 4種算法進行了祁連山草地地上生物量的遙感反演,以期為綠色推動祁連山草地畜牧業(yè)發(fā)展、維護生態(tài)平衡與生物多樣性提供科學(xué)依據(jù)和理論支持。主要結(jié)論如下:
(1)6種植被指數(shù)均與實測AGB表現(xiàn)為顯著正相關(guān),其中RVI、NDVI705、SRre和MSR這4個植被指數(shù)與AGB的相關(guān)性更強,主要因為它們是由紅色、紅邊和近紅外波段對AGB較敏感的波段信息構(gòu)成的;通過評估6種植被指數(shù)的因子重要性,RVI和SRre在祁連山草地AGB反演中占據(jù)重要地位,RVI本身對高覆蓋區(qū)植被監(jiān)測敏感,紅邊波段(SRre)的加入能夠在一定程度上提高AGB反演模型的精度,減少植被在紅色波段的飽和效應(yīng)。
(2)通過對4種反演算法進行適用性評價,得出XGBoost算法反演祁連山草地AGB的效果最好,具有最強的適用性,MAE為71.60 kg/hm2、RMSE為99.74 kg/hm2,R2為0.78、模型精度為74.75%,且適用于祁連山草地AGB的長時間序列反演。
(3)UAV數(shù)據(jù)的應(yīng)用能夠減少Sentinel- 2數(shù)據(jù)(10m)與實地采樣(1m×1m)間尺度效應(yīng)的影響,UAV數(shù)據(jù)可以提供更詳細(xì)的空間細(xì)節(jié)特征,便于Sentinel- 2影像中提取出的植被指數(shù)與地面實測AGB數(shù)據(jù)相匹配。
(4)利用XGBoost算法對祁連山草地AGB進行反演制圖,祁連山草地平均AGB為925.43 kg/hm2,其空間分布上表現(xiàn)為由西北向東南遞增的趨勢,主要原因是受到水資源分布的影響。