李坤玉, 王雪梅, 李銳, 李頓
新疆師范大學(xué)地理科學(xué)與旅游學(xué)院 / 新疆干旱區(qū)湖泊環(huán)境與資源實(shí)驗(yàn)室,新疆 烏魯木齊 830054
土地利用信息在國(guó)土空間規(guī)劃、自然資源保護(hù)以及氣候變化研究等領(lǐng)域起著至關(guān)重要的作用,為可持續(xù)發(fā)展工作的開展提供信息保障(朱永森等,2017)。利用遙感技術(shù)不僅可以大規(guī)模地調(diào)查土地利用現(xiàn)狀,又能夠監(jiān)測(cè)和獲取土地利用變化等信息(舒彌等,2022)。隨著遙感技術(shù)的快速發(fā)展,遙感影像數(shù)據(jù)被廣泛地用于土地利用分類的研究。歐空局于2015 年發(fā)布的Sentinel-2 數(shù)據(jù)具有高時(shí)空分辨率以及豐富的光譜信息,被廣泛用于土地利用分類研究中。但由于影像存在同物異譜和同譜異物現(xiàn)象,僅利用衛(wèi)星影像的光譜信息進(jìn)行土地利用分類很難達(dá)到較高的精度(陳媛媛等,2022)。隨著大量的輔助數(shù)據(jù)開放可用,許多研究試圖通過結(jié)合衛(wèi)星數(shù)據(jù)和輔助數(shù)據(jù)來提高土地利用分類的準(zhǔn)確性(Tomá? et al.,2018)。將輔助特征與遙感數(shù)據(jù)相結(jié)合以提高區(qū)域和全球尺度的分類精度已經(jīng)成為40 年來人們關(guān)注的話題(Phiri et al.,2017)。李恒凱等(2021)在探討加入地形特征和雷達(dá)特征對(duì)南方丘陵山地土地利用分類信息提取的作用時(shí)得出,加入雷達(dá)特征和地形特征均有助于提高分類精度,其中加入地形特征更有助于耕地和園地的提?。粡垇砑t等(2023)對(duì)Sentinel-2 和Landsat 數(shù)據(jù)從光譜指數(shù)特征、紋理特征、地形特征3個(gè)方面構(gòu)建多維特征集進(jìn)行土地利用分類,得出融入光譜指數(shù)特征、地形特征能夠有效提高土地利用分類模型的精度。Hurskainen et al.(2019)在研究免費(fèi)開放的地理信息數(shù)據(jù)對(duì)面向?qū)ο笸恋乩梅诸惥鹊挠绊憰r(shí)得出,地形特征、土壤特征可顯著提高土地利用分類精度。
雖然輔助特征可以提高土地利用分類的準(zhǔn)確性,但是可用的免費(fèi)開放的地理空間數(shù)據(jù)有限,需要從多個(gè)來源請(qǐng)求獲得。谷歌地球引擎(GEE,Google Earth Engine)提供了一個(gè)強(qiáng)大的地理空間計(jì)算分析遙感云平臺(tái),并可以直接調(diào)用衛(wèi)星影像和各種類型的地理空間數(shù)據(jù)集。使用GEE 可進(jìn)行影像分割,其主要支持3種遙感影像分割算法,包括K-means、G-means 和SNⅠC 算法。其中,SNⅠC 算法占用內(nèi)存小,運(yùn)行速度最快,而且可以通過設(shè)置參數(shù)來控制分割效果,該算法已成為國(guó)內(nèi)外影像分割的熱點(diǎn)算法(Tassi et al.,2020)。劉通等(2022)、毛麗君等(2021)等使用SNⅠC 分割算法均得到了較好的分割效果,然后結(jié)合RF 算法進(jìn)行分類后均得到了較高分類精度,有效地提高了土地利用分類結(jié)果的準(zhǔn)確性。以往許多利用輔助特征提高高分辨率衛(wèi)星圖像分類精度的研究是基于像素的分類上,而較少關(guān)注基于對(duì)象的分類(Frank‐lin,2018)。同時(shí),國(guó)內(nèi)在研究輔助數(shù)據(jù)對(duì)分類精度的影響中,研究土壤特征對(duì)提高分類精度有效性的實(shí)驗(yàn)較少。因此,本研究基于GEE 平臺(tái)調(diào)用Sentinel-2高分辨率影像,利用SNⅠC 分割算法對(duì)影像進(jìn)行圖像分割,結(jié)合雷達(dá)特征、光譜指數(shù)特征、土壤特征以及地形特征,使用RF 算法進(jìn)行面向?qū)ο蟮耐恋乩梅诸?,得出最?yōu)輔助數(shù)據(jù)集,然后進(jìn)行特征重要性評(píng)價(jià),得出貢獻(xiàn)率最高的輔助特征,最后使用CART算法驗(yàn)證結(jié)論,使得研究結(jié)果更具可靠性,為后續(xù)更好地進(jìn)行土地利用分類工作提供技術(shù)參考。
博湖縣位于新疆維吾爾自治區(qū)中部,經(jīng)緯度41°33′~42°14′N,86°19′~87°26′E,隸屬于新疆巴音郭楞蒙古自治州,天山南麓,區(qū)域海拔為1 037~2 529 m,南北兩端地勢(shì)較高,呈蝶狀谷地,因其境內(nèi)有中國(guó)最大的內(nèi)陸淡水湖博斯騰湖而得名。該研究區(qū)氣候溫和濕潤(rùn),光照充足,年均氣溫9.3 ℃,年降水量為79.6 mm,年均相對(duì)濕度為62%,有“濕島效應(yīng)”,適合農(nóng)業(yè)以及畜牧業(yè)的發(fā)展。博斯騰湖分布在該縣東北部,湖泊面積較大,占博湖縣總面積的43.2%,為當(dāng)?shù)禺a(chǎn)業(yè)發(fā)展提供豐富的水資源;耕地資源豐富,種植作物主要有小麥、玉米、棉花、辣椒等;分布在博斯騰湖西岸的蘆葦區(qū)是全國(guó)4大葦區(qū)之一;區(qū)域南部未利用地集中,有少量片狀耕地。博湖縣土地利用類型多樣,具有典型代表性(圖1)。
圖1 研究區(qū)位置示意圖及其假彩色影像Fig.1 Sketch map for the study area and false color imagery
高分辨率影像對(duì)于區(qū)域較小的土地利用分類研究是最佳數(shù)據(jù)源。本文采用多光譜高分辨率影像Sentinel-2 數(shù)據(jù)作為主要遙感信息進(jìn)行分類。通過GEE 平臺(tái)加載2022 年7 月20~23 日云層覆蓋率小于7%的Sentinel-2 L2A 圖像,選擇4個(gè)空間分辨率為10 m 和6 個(gè)空間分辨率為20 m 的10 個(gè)波段作為原始影像數(shù)據(jù),并對(duì)其進(jìn)行拼接、裁剪以及云掩膜等處理生成博湖縣無云影像。本文結(jié)合了衛(wèi)星數(shù)據(jù)和輔助數(shù)據(jù)集來提高土地利用分類的精度和準(zhǔn)確性,使用的分類特征包括光譜、雷達(dá)、光譜指數(shù)、土壤和地形特征(如表1)。
表1 土地利用分類特征Table 1 The features in the land use classfication
光譜特征是在Sentinel-2 影像中選取10 個(gè)波段及其主成分的中值作為分類特征,包括藍(lán)、綠、紅3 個(gè)可見光波段(B2-B4)、近紅外波段(B8)、3個(gè)紅邊波段(B5-B7)、Narrow NⅠR 波段(B8A)以及2個(gè)短波紅外波段(B11、B12)。有研究表明,波段的主成分(PC,principal component)可以提高土地利用的分類精度(Pareeth et al.,2019)。雷達(dá)特征是從Sentinel-1 影像獲取的ⅤⅤ、ⅤH 兩個(gè)極化波段。光譜指數(shù)特征是在GEE 平臺(tái)使用Sentinel-2 影像波段計(jì)算得出8個(gè)指數(shù)的中值,包括歸一化植被指數(shù)(NDⅤⅠ,normalized difference vegetation in‐dex)、歸一化水體指數(shù)(NDWⅠ,normalized differ‐ence water index)、建筑用地指數(shù)(ⅠBⅠ,indexbased built-up index)、比值植被指數(shù)(RⅤⅠ,ratio vegetation index)、土壤調(diào)節(jié)植被指數(shù)(SAⅤⅠ,soiladjusted vegetation index)、差值植被指數(shù)(DⅤⅠ,difference vegetation index)、裸土指數(shù)(BSⅠ,bare soil index)和紅邊位置指數(shù)(REP,red edge position index),光譜指數(shù)計(jì)算公式如表2 所示。土壤特征是在GEE 平臺(tái)調(diào)用OpenLandMap 提供的250 m 分辨率的表層土壤有機(jī)碳含量、土壤含水量、粘土含量、土壤容重、土壤pH 值5 個(gè)特征,并對(duì)其進(jìn)行重采樣。地形特征是利用GEE 平臺(tái)調(diào)用30 m 分辨率的DEM 數(shù)據(jù)計(jì)算得出,包括高程、坡度和坡向數(shù)據(jù),該數(shù)據(jù)集需重采樣為10 m。
表2 光譜指數(shù)及其計(jì)算公式Table 2 Spectral indices and calculation formula
參照國(guó)家土地利用分類標(biāo)準(zhǔn)《GB/T21010-2017》,結(jié)合Google Earth 影像,充分了解研究區(qū)景觀地貌特征,綜合考慮研究區(qū)地物分布的整體性以及遙感影像的可分性,將研究區(qū)土地利用類型分為8 種類型:種植耕地、已收獲耕地、林地、草地、蘆葦濕地、建設(shè)用地、水域以及未利用地。通過實(shí)地調(diào)查以及參考高空間分辨率的Google Earth 影像和Sentinel-2 影像,結(jié)合歐空局提供的10 m 分辨率的土地利用分類數(shù)據(jù)進(jìn)行目視解譯,采集具有代表性的730個(gè)樣本點(diǎn),其中包括種植耕地132 個(gè)、已收獲耕地83 個(gè)、林地75 個(gè)、草地49個(gè)、蘆葦濕地103個(gè)、建設(shè)用地100個(gè)、水域69個(gè)以及未利用地119個(gè),分別從每個(gè)地類中隨機(jī)選取70%的樣本點(diǎn)作為訓(xùn)練樣本,選取30%的樣本點(diǎn)作為驗(yàn)證樣本。這8 種土地利用類型的分類體系、影像細(xì)節(jié)特征以及每種地類訓(xùn)練樣本和驗(yàn)證樣本數(shù)量如表3所示。
表3 土地利用分類體系和影像特征Table 3 Land-use classification systems and imagery features
簡(jiǎn)單非迭代聚類(SNⅠC,simple non-iterative clustering)是基于簡(jiǎn)單線性迭代聚類(SLⅠC,sim‐ple linear iterative clustering)算法改進(jìn)的最新的超像素分割算法(Achanta et al.,2017),改變了SLⅠC算法占用內(nèi)存大、運(yùn)算速度慢的特點(diǎn),可以更快速地生成超像素(岳巍等,2022)。SNⅠC 算法是用戶通過設(shè)置5個(gè)參數(shù)控制分割結(jié)果,包括影像、緊湊度、連通性、鄰域尺寸和種子大小。參數(shù)設(shè)置基于重復(fù)迭代,并結(jié)合視覺進(jìn)行評(píng)價(jià)。影像是指參與分割的影像。緊湊度是指分割后對(duì)象的規(guī)整程度,數(shù)值越大,每個(gè)對(duì)象的形狀越規(guī)整,越接近于正方形。連通性是指像元的鄰接性,參數(shù)一般設(shè)置為4或8,表示4連通或8連通。鄰域尺寸表示鄰域范圍,通常設(shè)置為256。種子大小是指聚類中心的間隔,數(shù)值越大,種子點(diǎn)之間的間隔越大,分割得到的對(duì)象越大。其中緊湊度和種子大小對(duì)結(jié)果的影響比較大,需要根據(jù)地物的實(shí)際情況進(jìn)行設(shè)置。
為了比較融入不同輔助數(shù)據(jù)集對(duì)土地利用分類精度以及結(jié)果準(zhǔn)確性的影響,本文構(gòu)建了6種融入不同輔助數(shù)據(jù)集的土地利用分類模型,如表4所示。在6 種分類模型中,M1 模型是基于對(duì)象的光譜特征分類模型;M2 模型除了光譜特征以外,還結(jié)合了雷達(dá)特征;M3 模型則綜合了光譜特征和光譜指數(shù)特征進(jìn)行土地利用分類;M4 模型是在光譜特征的基礎(chǔ)上結(jié)合了土壤特征進(jìn)行影像分類;M5模型則是基于對(duì)象的光譜特征與地形特征的分類;M6 模型融入了光譜特征、雷達(dá)特征、光譜指數(shù)特征、土壤特征和地形特征這5種輔助數(shù)據(jù)集進(jìn)行研究區(qū)土地利用分類。
表4 土地利用分類模型Table 4 Models used in this study for LULC classification
隨機(jī)森林(RF,random forest)是Breiman(2001)提出的一種機(jī)器學(xué)習(xí)方法,是一種基于決策樹的分類器。隨機(jī)森林分類器的構(gòu)建主要涉及兩個(gè)方面:隨機(jī)選擇樣本和隨機(jī)選擇特征。使用Boot‐strap 重抽樣方法從原始樣本中有放回地抽取大約2/3 的樣本用于對(duì)當(dāng)前決策樹模型進(jìn)行訓(xùn)練,抽取剩余的樣本作為對(duì)隨機(jī)森林模型進(jìn)行分類性能評(píng)估的袋外數(shù)據(jù)(OOB,out-of-bag),計(jì)算該模型的預(yù)測(cè)錯(cuò)誤率,該錯(cuò)誤率被稱為袋外誤差?;赗F分類器進(jìn)行分類的基本思想是先使用Bootstrap 重抽樣方法從原始訓(xùn)練集中抽取m個(gè)樣本,每個(gè)樣本的容量與原始訓(xùn)練集一致,然后給m個(gè)樣本建立m個(gè)決策樹模型,得出m種分類結(jié)果,最后通過投票得到最終的分類或預(yù)測(cè)結(jié)果。有大量研究表明,RF 算法在土地利用分類中具有較高的分類精度(匡開新等,2023),同時(shí)削弱了過擬合現(xiàn)象,有效地提高了分類器的泛化能力。本研究使用RF算法進(jìn)行土地利用分類研究。
分類回歸樹(CART,classification and regres‐sion tree)是一種以二叉樹為邏輯結(jié)構(gòu),用于完成線性回歸任務(wù)的決策樹,使用預(yù)定義的閾值工作。該決策樹使用基尼系數(shù)劃分屬性,一個(gè)數(shù)據(jù)集的純度可用基尼系數(shù)來衡量,基尼系數(shù)越小,數(shù)據(jù)集的純度越高(劉睿等,2021)。本文使用CART算法來驗(yàn)證結(jié)論的通用性和可靠性。
為了評(píng)價(jià)分類的結(jié)果,往往需要使用驗(yàn)證樣本進(jìn)行檢驗(yàn)。生產(chǎn)者精度(PA,producer’s accuracy)、用戶精度(UA,user’s accuracy)、總體精度(OA,overall accuracy)和Kappa 系數(shù)是最常用的檢驗(yàn)指標(biāo)。在面向?qū)ο蠓诸愔校琍A 指分類器將整個(gè)影像的所有對(duì)象正確分為某類的對(duì)象數(shù)與該類真實(shí)參考總數(shù)的比率,UA 指正確分到某類的對(duì)象總數(shù)與分類器將整個(gè)影像的對(duì)象分為該類的對(duì)象總數(shù)比率,OA 指被正確分類的對(duì)象總和與總對(duì)象數(shù)的比率,Kappa系數(shù)是用于一致性檢驗(yàn)的指標(biāo),用來衡量分類的效果,其計(jì)算是基于混淆矩陣的(吳靜波,2018),Kappa取值在-1~1之間,一般>0,
其中N為用于精度評(píng)價(jià)的對(duì)象數(shù);Xij為混淆矩陣中第i行第j列的對(duì)象數(shù);Xi+為第i行的總對(duì)象數(shù),X+j為第j列的總對(duì)象數(shù)。
使用隨機(jī)森林進(jìn)行特征重要性評(píng)估的基本思想是計(jì)算每個(gè)特征在隨機(jī)森林中的每棵樹中作出的貢獻(xiàn),求其平均值,最后比較特征之間的貢獻(xiàn)大小,貢獻(xiàn)值通常用袋外數(shù)據(jù)錯(cuò)誤率來衡量(吳靜波等,2018)。在隨機(jī)森林算法中某個(gè)特征X重要性的計(jì)算方法如下:首先對(duì)于隨機(jī)森林中的每一顆決策樹,使用相應(yīng)的OOB 數(shù)據(jù)來計(jì)算它的袋外數(shù)據(jù)誤差,記為OOBerr1;其次隨機(jī)地對(duì)袋外數(shù)據(jù)OOB 所有樣本的特征X加入噪聲干擾,再計(jì)算它的袋外數(shù)據(jù)誤差,記為OOBerr2;最后假設(shè)隨機(jī)森林中有Ntree棵樹,計(jì)算特征X的重要性
若給某個(gè)特征隨機(jī)加入噪聲之后,袋外數(shù)據(jù)的準(zhǔn)確率大幅度降低,則說明這個(gè)特征對(duì)于樣本的分類結(jié)果影響很大,表明它的重要程度比較高。
面向?qū)ο笸恋乩梅诸愋Ч暮脡呐c影像分割結(jié)果有密切關(guān)系。SNⅠC 分割算法需要設(shè)置5 個(gè)參數(shù)控制圖像分割效果,連通性與鄰域尺度分別設(shè)置為8、256。使用控制變量法,對(duì)分割結(jié)果影響較大的緊湊度和種子大小選取6 組參數(shù)進(jìn)行影像分割實(shí)驗(yàn),并對(duì)分割結(jié)果進(jìn)行目視判讀,確定合適取值。圖2(a-f)表示使用SNⅠC 分割算法對(duì)影像進(jìn)行分割的局部結(jié)果,其中圖2(a-d)的緊湊度取值為0,種子大小取值分別為10、13、17和20,圖2(e-f)的種子大小取值為17,緊湊度取值分別為1 和2。對(duì)比圖2(a-b)可以發(fā)現(xiàn)種植耕地、林地、建設(shè)用地、水域存在過分割現(xiàn)象;圖2(c)建設(shè)用地分割效果較好,種植耕地、林地、水域過分割現(xiàn)象有所減緩,整體分割效果較好;圖2(d)中建設(shè)用地存在欠分割現(xiàn)象。將圖2(c)與圖2(e-f)對(duì)比可以發(fā)現(xiàn),圖2(e-f)邊界貼合度不高。從圖2(c)可以看出,種植耕地、水域仍有少量過分割現(xiàn)象的存在,過度分割會(huì)產(chǎn)生大量的對(duì)象,通常分割對(duì)象越多,地物分割越精細(xì),分類精度越高,與此同時(shí)需要更多的計(jì)算時(shí)間,本文中使用GEE 云平臺(tái),它可以為數(shù)據(jù)處理工作提供強(qiáng)大的數(shù)據(jù)分析平臺(tái),因此不必考慮計(jì)算時(shí)間成本。雖然圖像分割結(jié)果中存在少量過分割現(xiàn)象,但是對(duì)研究目標(biāo)和結(jié)論影響不大。綜上所述,分割效果最好的是圖2(c),最終選取的圖像分割參數(shù)為:種子大小為17,緊湊度為0。
圖2 局部區(qū)域不同分割參數(shù)的圖像分割結(jié)果Fig.2 Ⅰmage segmentation results with different segmentation parameters in the local area
基于最優(yōu)分割參數(shù)的選擇結(jié)果,融入各類輔助數(shù)據(jù)集,進(jìn)行2022 年7 月新疆博湖縣土地利用分類,得到不同模型的土地利用分類結(jié)果(圖3)。在6 個(gè)分類模型中,精度最低的是基于模型M1 的分類結(jié)果,總體分類精度OA=84.82%,Kappa=0.82,精度最高的是基于模型M6 的分類結(jié)果,分類精度OA=92.34%,Kappa=0.91。
圖3 基于6個(gè)分類模型的分類結(jié)果展示Fig.3 Display of classification results based on 6 classification models
由圖3 可知,模型M1~M3 的分類效果沒有模型M4~M6 的分類準(zhǔn)確性高,與表5 的分類精度結(jié)果一致。整體上,M1~M3有明顯的錯(cuò)分現(xiàn)象,M1中將研究區(qū)南部少量未利用地錯(cuò)分為已收獲耕地和建設(shè)用地,博斯騰湖西岸部分蘆葦濕地錯(cuò)分為種植耕地;M2 和M3 在研究區(qū)的南部未利用地均有錯(cuò)分為建設(shè)用地的現(xiàn)象。M4~M6 整體分類效果較好,破碎現(xiàn)象較少,與博湖縣土地用地整體情況相符。說明僅使用Sentinel-2 影像的光譜特征進(jìn)行土地利用分類時(shí),分類的OA 和Kappa 系數(shù)最低,分別為84.82%和0.82;當(dāng)加入雷達(dá)、光譜指數(shù)、土壤和地形特征后,OA 均有所提高,加入地形特征后分類精度提高最為明顯,OA 提高了6.22%,Kappa系數(shù)提高了0.08,說明加入這4種輔助數(shù)據(jù)集中的任意一個(gè)特征數(shù)據(jù)集均有助于提高分類的整體準(zhǔn)確性,其中地形特征對(duì)提高分類的整體精度起著最重要的作用。融入所有輔助數(shù)據(jù)集的模型M6 分類精度最高,OA 和Kappa 系數(shù)分別為92.34%和0.91,各類地物均能夠得到較好的區(qū)分,較其余5個(gè)分類模型來說分類效果最佳。
表5 不同分類模型的分類精度結(jié)果Table 5 Accuracy results for different classification models
選擇所含地物類型較為豐富的3 個(gè)典型區(qū)域,對(duì)比分析不同地物類型在不同分類模型中的分類結(jié)果(圖4)以及結(jié)合Sentinel-2 影像可以發(fā)現(xiàn),對(duì)博湖縣進(jìn)行土地利用分類的誤差主要來源于種植耕地、林地、草地與蘆葦濕地的誤分以及建設(shè)用地和未利用地的誤分,這主要是由于其光譜特征相似,會(huì)出現(xiàn)異物同譜或同譜異物的現(xiàn)象,在這種情況下可以借助光譜以外的輔助特征,有助于豐富分類所需的有用信息,從而提高土地利用分類的準(zhǔn)確性。
圖4 不同分類模型的典型區(qū)域分析Fig.4 Typical area analysis of different classification models
基于6 種分類模型的8 種地類的PA 和UA 如表5 所示。模型M2 加入雷達(dá)特征后,林地、草地、蘆葦濕地的分類精度均顯著提高,這是因?yàn)槲⒉ū裙獠芨畹卮┩钢参?,?duì)植被散射體的形狀、結(jié)構(gòu)較為敏感,可以更好地區(qū)分植被類型。同時(shí)也可以看出建設(shè)用地和未利用地的分類精度均有所提高,說明雷達(dá)特征也有利于區(qū)分建設(shè)用地和未利用地。模型M3 加入了4 個(gè)植被指數(shù)、1 個(gè)紅邊指數(shù)、1 個(gè)水體指數(shù)、1 個(gè)建筑指數(shù)和1 個(gè)裸土指數(shù),與模型M1 相比,所有植被類型的土地利用分類精度均得到提高,其中蘆葦濕地精度提高最多,PA 提高了12.37%,UA 提高了13.04%,說明植被特征以及紅邊指數(shù)特征對(duì)于區(qū)分不同植被類型起著重要作用。模型M4 加入了土壤特征,由于耕地的土壤特征相似,所以不同耕地類型不易區(qū)分,因此種植耕地與已收獲耕地的分類精度相對(duì)于其他地物來說較低;其他地物的土壤屬性區(qū)分較為明顯,所以較于M1 分類精度均有所提高。模型M5 加入地形特征后,各地類的分類精度有明顯提升,種植耕地和草地,以及建設(shè)用地和未利用地的區(qū)分更為容易,這與博湖縣地形南北高、中間低有關(guān),草地和未利用地主要分布在南部海拔較高的地區(qū),種植耕地和建設(shè)用地主要分布在中西部平原區(qū)。對(duì)表5 中模型M6 與M1 分類結(jié)果進(jìn)行比較可以看出,除水域以外,每種地物的土地利用分類精度均有較大程度的提高。對(duì)比圖4中局部區(qū)域的分類結(jié)果圖,也可以看出模型M6 的分類效果相較于其他模型也達(dá)到最佳,消除了種植耕地與蘆葦濕地、種植耕地與林地、建設(shè)用地和未利用地的誤分,分類細(xì)節(jié)也與遙感影像更為契合。水域分類效果均較好,在6個(gè)模型中其分類精度均在90%以上。
基于RF 算法融入所有輔助數(shù)據(jù)集的土地利用分類精度最高,使用基于RF 算法的袋外誤差來衡量每種特征的重要性值,圖5 為本文38 個(gè)特征的重要性排序。
圖5 特征重要性評(píng)價(jià)Fig.5 Feature importance evaluation
由圖5可以看出,對(duì)分類結(jié)果影響最大的是高程特征,西北地區(qū)復(fù)雜的地形特征對(duì)于土地利用類型的識(shí)別至關(guān)重要。ⅤH 極化特征的重要性居于第2位,該區(qū)植被類型較多,能更深穿透植物的微波可以更好地識(shí)別不同的植被類型。緊接著即為土壤特征包括表層土壤有機(jī)碳含量以及表層土壤含水量,西北干旱區(qū)不同地類的土壤特征存在較大差異,因此依據(jù)不同土壤特征區(qū)分地物類型是有效的。其次就為波段B10 的主成分中值和波段B5 的主成分中值,Sentinel-2 影像波段重要性最大的是B8 波段,因?yàn)榻t外波段對(duì)葉綠素的反射效果好,在標(biāo)準(zhǔn)假彩色影像中植被呈現(xiàn)紅色,植被越密集,紅色越深,植被類型不同其密集度也不同,可更好地識(shí)別該區(qū)域不同的植被類型。光譜指數(shù)特征重要性最大的是RⅤⅠ指數(shù),因?yàn)樵撝笖?shù)可以更好地反應(yīng)植被生長(zhǎng)的健康狀況。坡向特征對(duì)土地利用分類的貢獻(xiàn)率最低,說明該區(qū)域坡向變化不大。ⅠBⅠ指數(shù)的貢獻(xiàn)率位于倒數(shù)第2 位,因?yàn)樵搮^(qū)域的建筑用地較少,而植被、水域和裸地面積較大,相對(duì)于植被光譜指數(shù)、水體指數(shù)和裸地指數(shù)來說,建筑用地指數(shù)對(duì)于該區(qū)域的土地利用分類結(jié)果貢獻(xiàn)率較小。由此可看出,特征重要性的大小主要與研究區(qū)域的地物分布特征有關(guān)。
從以上分析可以得出,采用面向?qū)ο蟮腞F 算法進(jìn)行土地利用分類時(shí),將光譜數(shù)據(jù)與輔助數(shù)據(jù)結(jié)合可以有效地提高土地利用分類精度,結(jié)合雷達(dá)、光譜指數(shù)、土壤、地形特征分類精度依次提高,當(dāng)融入所有輔助數(shù)據(jù)集時(shí)分類精度達(dá)到峰值。使用CART算法驗(yàn)證結(jié)論的通用性和可靠性。在對(duì)比實(shí)驗(yàn)中,基于CART的分類模型所使用的特征與基于RF的分類模型相同?;赗F和CART算法分類的OA 和Kappa 系數(shù)如圖6 所示,圖6(a)為基于RF 和CART 算法分類的OA,圖6(b)為基于RF 和CART 算法分類的Kappa 系數(shù)。基于CART 算法的分類結(jié)果表明,隨著輔助特征數(shù)量的增加,OA 和Kappa系數(shù)均有所提高,融入雷達(dá)、光譜指數(shù)、土壤、地形以及所有輔助特征的分類精度依次提高,與基于RF 算法的分類結(jié)果規(guī)律一致,通過對(duì)比基于兩種算法的分類精度可以看出,基于RF 算法的分類精度更高。
圖6 不同分類模型基于RF、CART算法分類的分類精度比較Fig.6 Comparison of classification accuracy of different classification models based on RF and CART algorithms
面向?qū)ο蟮淖顑?yōu)輔助數(shù)據(jù)集的選取可提高分類精度的同時(shí)避免了基于像素分類時(shí)出現(xiàn)的“鹽胡椒”現(xiàn)象,使分類結(jié)果不僅具有較高的分類精度,視覺上也更美觀,強(qiáng)化了分類結(jié)果中每個(gè)地物的整體性,為下一步開展基于土地利用分類結(jié)果的應(yīng)用型研究提供更好的分類效果。研究基于遙感云平臺(tái)對(duì)Sentinel-2影像使用SNⅠC分割算法進(jìn)行影像分割,并結(jié)合RF 分類器進(jìn)行土地利用分類,OA>84%,Kappa>0.82,說明分類精度均較高。Djerriri et al.(2020)證明了基于SNⅠC 聚類結(jié)合RF 分類器對(duì)Sentinel-2 圖像進(jìn)行分類的面向?qū)ο蠓诸惙椒ň哂休^大優(yōu)勢(shì),可以得到較好分類效果,說明選用的分類方法可靠性較高。分類時(shí)使用光譜信息并融入雷達(dá)、光譜指數(shù)、土壤和地形特征均可以提高分類精度,其中地形特征對(duì)提高分類精度效果最顯著。Qu et al.(2021)結(jié)合輔助數(shù)據(jù)集進(jìn)行土地利用分類,得出在面向?qū)ο蠓诸愔械匦翁卣鲗?duì)提高分類精度的影響最大,本文也得出該結(jié)論。除了地形特征,土壤特征對(duì)提高土地利用分類效果也有較大貢獻(xiàn),國(guó)內(nèi)融入土壤特征提高土地利用分類精度的研究較少,而國(guó)外較多且認(rèn)為土壤特征有利于提高分類精度(Ouma et al.,2022),因此研究中加入了土壤特征,探究其對(duì)提高土地利用分類精度的影響,與已有研究結(jié)論一致。研究中使用的輔助數(shù)據(jù)集表現(xiàn)出在景觀異質(zhì)性地區(qū)提高土地利用分類精度的重要潛力,下一步工作考慮研究探索更多的輔助數(shù)據(jù)集對(duì)分類結(jié)果的影響,如紋理特征、物候特征、水源距離等,并在不同的地形條件下研究輔助特征最優(yōu)組合的異同。
本文借助GEE 平臺(tái)使用SNⅠC 分割算法,融入輔助數(shù)據(jù)集構(gòu)建了基于RF 算法的面向?qū)ο笸恋乩梅诸惖?個(gè)分類模型,對(duì)博湖縣的土地利用進(jìn)行分類研究,得出以下結(jié)論:
1) 使用GEE 平臺(tái)的SNⅠC 分割算法,通過控制變量法、參數(shù)迭代設(shè)置以及目視判讀法得出最優(yōu)分割參數(shù),對(duì)分割結(jié)果影響較大的兩個(gè)參數(shù)分別設(shè)置為種子大小為17、緊湊度為0,該分割參數(shù)對(duì)該研究區(qū)影像分割效果最好,有利于進(jìn)行下一步的分類研究。
2) 輔助特征包括雷達(dá)、光譜指數(shù)、土壤、地形均可以提高土地利用分類精度,將Sentinel-2 影像的波段特征數(shù)據(jù)與這些輔助數(shù)據(jù)相結(jié)合進(jìn)行土地利用分類,有效地提高了土地利用分類結(jié)果的準(zhǔn)確性,當(dāng)融入所有輔助特征時(shí)分類精度達(dá)到最高,OA=92.34%,Kappa=0.91,比僅使用光譜特征進(jìn)行分類的結(jié)果OA 提高了7.52%,Kappa 系數(shù)提高了0.09。當(dāng)只使用一種輔助數(shù)據(jù)集時(shí),地形特征對(duì)提高土地利用分類精度的效果最好,土壤特征也起著重要作用。對(duì)所有輔助特征進(jìn)行重要性評(píng)價(jià)時(shí),高程特征對(duì)提高分類精度的貢獻(xiàn)最大。
3) 使用RF 算法進(jìn)行實(shí)驗(yàn),并使用CART 算法驗(yàn)證實(shí)驗(yàn)結(jié)論,均可得出融入雷達(dá)、光譜指數(shù)、土壤、地形特征都可以提高土地利用分類精度,并且分類精度依次提高,融入所有輔助數(shù)據(jù)集時(shí)分類精度達(dá)到最高。通過對(duì)比基于兩種算法的分類精度可以看出,基于RF 算法的分類精度更高,為基于土地利用分類結(jié)果進(jìn)行應(yīng)用型研究提供高精度的分類參考方法。