国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于GEE的洱海流域土地利用/覆被分類算法對比研究

2024-01-20 02:46董亞坤何紫玲曾維軍
關(guān)鍵詞:洱海土地利用流域

董亞坤,王 鈺,何紫玲,王 鵬,趙 昊,曾維軍*

(1.云南農(nóng)業(yè)大學(xué) 水利學(xué)院,云南 昆明 650201;2.云南農(nóng)業(yè)大學(xué) 資源與環(huán)境學(xué)院,云南 昆明 650201;3.自然資源部 云南山間盆地土地利用野外科學(xué)觀測研究站,云南 昆明 650201)

土地利用/覆被變化(LULC)反映區(qū)域的經(jīng)濟(jì)水平和城鎮(zhèn)化的發(fā)展[1-3]。準(zhǔn)確分類和評估土地利用變化對于保護(hù)土地和生態(tài)環(huán)境及制定可持續(xù)發(fā)展戰(zhàn)略至關(guān)重要[4]。遙感影像具有觀測面積廣、周期短等優(yōu)點(diǎn),在監(jiān)測大面積及長時(shí)序土地覆被變化方面具有優(yōu)勢,因此在LULC分類中被廣泛使用[5]。從單一類型的LULC變化監(jiān)測,如森林、水域等,到地表覆被的全部分類[6];從傳統(tǒng)的人工目視解譯,到如今的人工智能自動(dòng)、批量化解譯[7]。隨著遙感技術(shù)及處理平臺的發(fā)展,機(jī)器學(xué)習(xí)算法、人工智能解譯在遙感影像分類中的應(yīng)用,分類和回歸樹(classification and regression tree,CART)[5]、隨機(jī)森林(random forest,RF)[8]、支持向量機(jī)(support vector machines,SVM)[9]等方法廣泛應(yīng)用于遙感圖像分類中,GEE是一個(gè)采用JavaScript或Python語言調(diào)用、處理和分析數(shù)據(jù)的平臺[6],其性能穩(wěn)定,尤其適合大范圍、長時(shí)間、多源遙感數(shù)據(jù)解譯,一經(jīng)推出便被眾多科研人員使用,研究區(qū)涉及平原[10]、島嶼[11]、流域盆地[1]等地形地貌。

洱海流域內(nèi)的大理市屬于旅游勝地,頻繁的人類活動(dòng)造成地表變動(dòng)劇烈[12]。目前,有關(guān)洱海流域土地覆被產(chǎn)品,如Globeland30、GLC_FCS30等是公認(rèn)度較高的土地覆被產(chǎn)品,但總體精度不高,各有優(yōu)缺點(diǎn)[5],在對分類精度要求更高的中小尺度內(nèi)會存在區(qū)域適應(yīng)性不強(qiáng)的問題[8]。如GLC_FCS30在云南山區(qū)會將湖泊、耕地錯(cuò)分成草地、林地或城鎮(zhèn)用地;許曉聰?shù)萚13]指出Globeland30 分類結(jié)果細(xì)節(jié)表現(xiàn)不足且經(jīng)過人工處理,而GLC_FCS30在中國南部的丘陵城市、印度中部的鄉(xiāng)村、美國的東部平原,會出現(xiàn)部分地類錯(cuò)分或者分類結(jié)果不完整。陳逸聰?shù)萚14]指出,FROM_GLC、GLC_FCS30 和 GlobeLand30總體對占長三角地區(qū)面積越高的地類其分類精度越高。此外,谷曉天等[15]、戴琴等[16]對比4種分類算法,指出區(qū)域最優(yōu)的分類算法并進(jìn)行精度對比;賈玉潔等[17]將面向?qū)ο筇卣鞯臎Q策樹、 ISODATA法和最大似然法對Sentinel-2A影像進(jìn)行分類對比,指出面向?qū)ο筇卣鞯臎Q策樹方法在大理市的適用性較好。眾多分類方法多集中于單期的土地利用/覆被分類,缺少長時(shí)間序列下較大面積復(fù)雜高原山區(qū)的快速、準(zhǔn)確提取。而高原山區(qū)受山脈陰影、地形復(fù)雜等因素影響,在遙感影像的長時(shí)間、高效分類上,難以滿足研究需求。

因此,本研究利用GEE平臺,利用CART、RF和SVM 3種常用的機(jī)器學(xué)習(xí)方法,進(jìn)行洱海流域的長時(shí)間土地利用覆被變化分類,尋找最適合的分類方法,為洱海流域土地的合理開發(fā)利用及產(chǎn)業(yè)布局規(guī)劃提供數(shù)據(jù)參考。

1 材料與方法

1.1 研究區(qū)概況

洱海流域位于中國云南省大理白族自治州境內(nèi),流域面積2 565.0 km2,屬于川滇生態(tài)屏障區(qū)的重要組成部分[18]。流域氣候濕潤,是典型的亞熱帶高原季風(fēng)氣候,具有年溫差小、日溫差大、干濕季節(jié)分明的氣候特點(diǎn)[19]。

1.2 數(shù)據(jù)來源和處理

1.2.1 數(shù)據(jù)來源 基于Google Earth Engine(GEE)平臺數(shù)據(jù)集,選取數(shù)據(jù)見表1。

表1 數(shù)據(jù)來源

1.2.2 數(shù)據(jù)處理 首先,基于GEE平臺加載研究區(qū)矢量邊界和已有的土地利用/覆被數(shù)據(jù)(GLC_FCS30);選取研究區(qū)地表植被生長狀況較好的時(shí)間段,同時(shí)為消除冬季高山積雪影響,設(shè)置各年份影像獲取時(shí)間均為3-10月(此時(shí)間段雖橫跨3個(gè)季節(jié),但卻為研究區(qū)種植水稻等糧食作物時(shí)節(jié),也是植被生長旺盛時(shí)期,可利用季節(jié)性差異進(jìn)行土地覆被分類),通過年份篩選含云量低于20%的遙感影像;其次,采用GEE中的算法對每期原始衛(wèi)星影像數(shù)據(jù)進(jìn)行裁剪等預(yù)處理,構(gòu)建光譜指數(shù);基于DEM數(shù)據(jù)提取高程、坡度等,構(gòu)建地形特征,聯(lián)合光譜指數(shù)構(gòu)建多維分類特征集;然后,基于Google Earth Pro、遙感影像和GLC_FCS30產(chǎn)品數(shù)據(jù)選取樣本點(diǎn),進(jìn)行洱海流域的LULC分類;之后進(jìn)行八鄰域空間濾波等分類后處理,平滑影像。研究技術(shù)路線見圖 1。

1.3 研究方法

1.3.1 土地利用分類和樣本點(diǎn)選擇 結(jié)合研究區(qū)實(shí)際情況,將洱海流域的土地利用類型分為耕地、林地、草地、水域、建設(shè)用地和未利用地 6 類。樣本點(diǎn)的選取采用“多源一致、時(shí)序穩(wěn)定、均勻選取”的方法[5]。首先在GLC_FCS30等產(chǎn)品中遴選分類可信、穩(wěn)定不變的區(qū)域選取樣本點(diǎn);其次利用實(shí)地調(diào)查數(shù)據(jù)、 Google Earth Pro歷史影像、不同波段的影像組合選取樣本點(diǎn);在此基礎(chǔ)上,再根據(jù)分類結(jié)果、評價(jià)精度,結(jié)合實(shí)地確認(rèn)的地類,以目視方式,適當(dāng)修正少量樣本點(diǎn),保證樣本均勻分布的同時(shí)反復(fù)調(diào)整訓(xùn)練樣本使不同方法分類效果達(dá)到較優(yōu)狀態(tài)[15]。經(jīng)對不同地類、不同年份的樣本點(diǎn)計(jì)算,樣本點(diǎn)的重合率在80%以上,重合的區(qū)域?yàn)楹础⒂谰没巨r(nóng)田、受人類活動(dòng)影響較小的林地和草地以及建設(shè)用地(表2)。

圖1 技術(shù)路線

表2 訓(xùn)練樣本點(diǎn)

1.3.2 分類特征 洱海流域地形、地貌多樣,有高聳的蒼山山脈,需要選擇多種特征參數(shù)進(jìn)行輔助分類,以提高分類精度。首先應(yīng)用遙感影像豐富的光譜信息,因此光譜特征是最主要的特征參數(shù)。而山體陰影、坡度等會影響洱海流域土地利用/覆被分類,所以地形特征是分類過程中除光譜特征外最主要的特征參數(shù)[17]。在光譜特征中,植被在洱海流域中所占面積最大,NDVI和EVI是區(qū)分植被與非植被的重要參數(shù);洱海流域存在大面積水域,城鎮(zhèn)用地主要分布在洱海周圍壩區(qū)與盆地壩區(qū),MNDWI和NDBI對水域和城鎮(zhèn)用地的提取具有重要作用。

1.3.3 土地利用分類算法 選取目前常用的3種機(jī)器分類方法——CART、RF和SVM分別進(jìn)行土地利用分類,選取其中最適合研究區(qū)的分類算法。

CART方法是一種決策樹學(xué)習(xí)分類器,其基本原理是從訓(xùn)練數(shù)據(jù)中構(gòu)建預(yù)測模型,通過遞歸分割數(shù)據(jù)空間,擬合每個(gè)分區(qū)預(yù)測模型來預(yù)測連續(xù)的測試變量和目標(biāo)變量,獲得決策樹模型[5]。

RF運(yùn)用Bootstrap方法進(jìn)行隨機(jī)且有放回地從訓(xùn)練集中抽取訓(xùn)練樣本[20]。RF需要設(shè)置決策樹個(gè)數(shù)和結(jié)點(diǎn)特征數(shù)2個(gè)參數(shù),決策樹個(gè)數(shù)過多會影響模型效率,過少則影響模型精度,因此在兼顧效率和精度的同時(shí),通過試驗(yàn)確定決策樹個(gè)數(shù)為30[3]。

SVM是Vapnik根據(jù)統(tǒng)計(jì)學(xué)習(xí)理論提出的一種廣義機(jī)器學(xué)習(xí)方法,通過計(jì)算出待分離樣本之間的最佳分離超平面對樣本進(jìn)行歸類[2]。

GEE中樣本點(diǎn)的選擇是隨機(jī)的,分別選取60%、70%、80%、90%的樣本點(diǎn)作為訓(xùn)練樣本并進(jìn)行分類對比,最終選取約70%的樣本作為訓(xùn)練樣本,約30%的樣本作為驗(yàn)證樣本。分類精度采用總體分類精度(OA)、消費(fèi)者精度(UA)、生產(chǎn)者精度(PA)和Kappa系數(shù)進(jìn)行評價(jià)[5]。

2 結(jié)果與分析

2.1 整體分類結(jié)果對比分析

在GEE中使用CART、RF和SVM對2000、2005、2010、2015年和2020年的洱海流域LULC進(jìn)行分類,3 種分類算法的精度評價(jià)見表3。RF的總體精度和Kappa系數(shù)均在90%以上;CART的總體精度在90%,Kappa系數(shù)在87%;SVM的總體精度最高為91%,Kappa系數(shù)最高為88%。單從總體精度和Kappa系數(shù)來看,RF的總體精度和Kappa系數(shù)都最高,CART,SVM的總體精度和Kappa系數(shù)都最低。同時(shí)RF和CART的5期精度評價(jià)數(shù)值整體起伏變化基本一致,而SVM 5期精度評價(jià)數(shù)值結(jié)果波動(dòng)較大,總體精度最大相差17%,Kappa系數(shù)最大相差22%。

表3 分類精度評價(jià)

以2020年為例,3 種分類算法的分類結(jié)果及各土地利用類型的評價(jià)精度見圖2、表4。圖2中,CART、RF和SVM均能夠很好地對洱海流域的LULC進(jìn)行分類。其中CART和RF的分類結(jié)果一致度更高,而SVM的分類結(jié)果和CART、RF有明顯差別,尤其是在建設(shè)用地的分類中,如大理市區(qū)。

圖2 2020年CART、RF和SVM土地利用分類結(jié)果

表4 2020年3種分類算法下的混淆矩陣

RF算法下的6種土地利用類型的PA和UA整體要好于CART和SVM算法。除了未利用地的PA較低之外,其余土地利用類型的PA和UA均在80%以上,達(dá)到良好的分類效果。而通過比較,3種分類方法下的PA和UA均水體最高,林地次之,未利用地的分類精度結(jié)果最低。RF算法比CART和SVM算法的結(jié)果更準(zhǔn)確,更適合于洱海流域的地類劃分。

2.2 局部分類結(jié)果對比分析

由圖3可知,CART解譯的結(jié)果細(xì)節(jié)較為突出,如道路能夠準(zhǔn)確提取。但圖斑較破碎,實(shí)際準(zhǔn)確度不夠高,有錯(cuò)分區(qū)域,如草地錯(cuò)分成耕地,林地錯(cuò)分成水域;SVM圖斑較為連貫、成片,但線狀地物不夠突出,實(shí)際分類結(jié)果也不夠高,存在錯(cuò)分或少區(qū)域,如建設(shè)用地比實(shí)際縮小或錯(cuò)分成未利用地;相比之下,RF在線狀地物提取的準(zhǔn)確度不如CART,在圖斑連續(xù)性不如SVM,但實(shí)際分類結(jié)果要高于二者,盡管也存在錯(cuò)分地類,如草地錯(cuò)分成耕地。在滿足評價(jià)精度和實(shí)際準(zhǔn)確度的基礎(chǔ)上,RF在三者當(dāng)中分類精度最高,同時(shí)也可以處理分類上的微小差異。因此,得到了基于RF算法的5期洱海流域LULC分類結(jié)果,稱為Erhai_RF(圖4)。

圖4 Erhai_RF算法分類結(jié)果

由表5可見,協(xié)同使用光譜和地形特征獲得了最高解譯精度,單獨(dú)使用地形特征解譯精度最低。洱海流域2000、2005、 2010、2015年和2020年最高總體精度分別為93.10%、92.9%、95.0%、93.3%和93.3%,對應(yīng)Kappa系數(shù)分別為91.2%、90.6%、93.4%、91.5%和91.3%,滿足分析要求。與單獨(dú)使用光譜特征和地形特征的分類相比,加入光譜和地形特征后,5期OA平均分別提高了2.7%和20.8%??梢?聯(lián)合光譜和地形特征后,總體精度得到一定提高。

表5 RF不同特征組合的分類精度

2.3 Erhai_RF與Globeland、GLC_FCS對比分析

以2020年為例,選取了海西海水庫北部(圖5A)、山中道路(圖5B)、大理機(jī)場(圖5C)、典型草地(圖5D)和洱海入水口(圖5E)與出水口(圖5F)共6個(gè)區(qū)域進(jìn)行對比分析。圖5A海西海水庫北部的水體,圖5B、5E、5F的道路、橋梁,Globeland和GLC_FCS 解譯出部分或者未能完全解譯出來,而Erhai_RF能夠較完整地解譯出水體、道路和橋梁;從圖5C來看,Erhai_RF和Globeland均能夠解譯出機(jī)場跑道,但Erhai_RF卻將機(jī)場附近的草地錯(cuò)分成耕地。GLC_FCS 未能將機(jī)場解譯出;由圖5B、5D看,Erhai_RF和GLC_FCS均能將林地和草地準(zhǔn)確解譯出,但Erhai_RF也出現(xiàn)將草地錯(cuò)分成耕地。Globeland也能夠準(zhǔn)確解譯出林地但卻將部分草地大面積錯(cuò)分成耕地。

A.海西海水庫北部;B.山中道路;C.大理機(jī)場;D.典型草地;E.洱海入水口;F.洱海出水口

由表6分析可知,Erhai_RF2020的PA和UA幾乎全部高于Globeland30和GLC_FCS30,最少也高出3.49%;同時(shí)OA和Kappa系數(shù)也至少高出Globeland30和GLC_FCS30 7.6%。其中Erhai_RF2020的草地的PA和UA較于Globeland30和GLC_FCS30相差最大,最大為74.04%;未利用地的PA和UA相較于二者相差最小,最小為4.34%。

表6 Erhai_RF2020與Globeland30、GLC_FCS30的精度比較

總之,局部區(qū)域解譯對比顯示,Erhai_RF與Globeland、GLC_FCS 均存在錯(cuò)分區(qū)域。但Erhai_RF與Globeland、GLC_FCS較少存在錯(cuò)分,同時(shí)在線狀地物上如道路提取更加準(zhǔn)確。

3 討論

使用RF、CART和SVM 3種分類算法進(jìn)行洱海流域的土地覆被解譯,均取得良好的分類結(jié)果。RF分類算法總體精度最高,CART次之,SVM最差,與Kulithalai等[3]、戴聲佩等[2]學(xué)者的研究結(jié)果一致。3種分類算法在不同地類之間的分類精度各有優(yōu)缺點(diǎn)。CART在城鎮(zhèn)用地細(xì)節(jié)上更加突出,SVM在草地分類上準(zhǔn)確度更高,而RF更適合實(shí)際分類準(zhǔn)確度和評價(jià)精度都較高的地類。主要原因在于3種分類算法的原理不同,其次地形地貌、樣本點(diǎn)的質(zhì)量和數(shù)量也是原因之一。在多次分類試驗(yàn)中,使用高分辨率的遙感影像、樣本點(diǎn)選取進(jìn)一步準(zhǔn)確、遙感影像進(jìn)行正射校正消除山體陰影等都會進(jìn)一步提高解譯的精度。經(jīng)對比分析,3種分類算法當(dāng)中,RF的實(shí)際分類結(jié)果、總體精度等都最適合洱海流域,說明RF算法適合高原、山區(qū)、平原等地形地貌。同時(shí)在大范圍內(nèi)也可使用RF算法[13],適用地形較多。

訓(xùn)練樣本點(diǎn)的質(zhì)量、數(shù)量和分布對于分類結(jié)果至關(guān)重要[13,20]。樣本點(diǎn)的數(shù)量和研究區(qū)的面積、地形、地類復(fù)雜度具有相關(guān)性。研究區(qū)面積越大、地形越復(fù)雜、分類地物越多所需樣本點(diǎn)數(shù)量越多[21]。樣本點(diǎn)數(shù)量要根據(jù)研究區(qū)的實(shí)際情況確定,樣本點(diǎn)過多會影響解譯的速度和效率,過少會影響解譯的精度[3]。盡管將Google Earth Pro、已有的GLC_FCS產(chǎn)品、各種波段組合的影像聯(lián)合在一起來選取樣本點(diǎn),但地表“同物異譜”“異物同譜”現(xiàn)象普遍存在,如坡耕地和草地,裸巖石區(qū)域和建設(shè)用地,從而不可避免地造成遙感圖像分類過程中的錯(cuò)分、漏分等現(xiàn)象[21]。

洱海流域?qū)儆诟咴介g盆地,流域面積2 000多km2,屬于中小尺度流域,分類只按一級地類。因此對樣本點(diǎn)的選取力求隨機(jī)均勻地分布在整個(gè)研究區(qū)。經(jīng)多次試驗(yàn),樣本點(diǎn)選取的數(shù)量也只有數(shù)百個(gè),和Globeland、GLC_FCS等全球范圍內(nèi)的土地覆被產(chǎn)品選取數(shù)千甚至上萬的樣本點(diǎn)相比,相差巨大。但正是研究區(qū)域較小,所以RF分類方法在分類速度、分類精度上能夠達(dá)到甚至超過Globeland、GLC_FCS,但在地類分類數(shù)量上不如二者。一方面是尺度不同,Globeland、GLC_FCS等是面向全球范圍的LULC產(chǎn)品,另一方面是面向的使用者不同,需求不同。小范圍的研究區(qū)更追求分類結(jié)果的準(zhǔn)確性。結(jié)合洱海流域的地形地貌,相關(guān)學(xué)者[6]提出RF的分類方法精度更高,與本研究結(jié)果一致,但仍存在不足之處。遙感影像分辨率可進(jìn)一步提高,如使用高分辨衛(wèi)星影像、多源影像融合等方法以達(dá)到更好的結(jié)果。另外,本次引入的主要特征為光譜及地形特征,在提高分辨率后可加入紋理特征,并使用其他分類方法如面向?qū)ο蟮姆诸惙椒ㄟM(jìn)一步提高解譯精度。同時(shí)今后選取更加準(zhǔn)確的訓(xùn)練樣本也會提高解譯精度。

4 結(jié)論

在RF 、CART和SVM分類算法中,RF對洱海流域分類精度最高,均超過90%,其次是CART,在90%左右,SVM最低,在85%左右;在使用相同數(shù)據(jù)源和訓(xùn)練樣本的情況下,RF分類方法能夠更準(zhǔn)確識別各類地物信息,更適于洱海流域土地利用分類的研究。

洱海流域土地覆被分類與地形地貌、樣本點(diǎn)等具有相關(guān)性。RF 、CART和SVM算法在洱海流域土地利用分類中均對水體的分類精度較高,對未利用地的分類精度較低。

Erhai_RF與Globeland、GLC_FCS雖在局部分類上存在一定差異,但是在空間布局上保持著較高的一致性,具有較高的分類精度,滿足研究需求。

猜你喜歡
洱海土地利用流域
壓油溝小流域
堡子溝流域綜合治理
羅堰小流域
洱海月下
洱海,好美
洱海
水利規(guī)劃與設(shè)計(jì)(2018年1期)2018-01-31
土地利用生態(tài)系統(tǒng)服務(wù)研究進(jìn)展及啟示
愛上洱海,只需要這十個(gè)瞬間
濱??h土地利用挖潛方向在哪里