国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

隨機森林算法在干旱區(qū)土地利用遙感分類中的應(yīng)用研究

2017-03-29 14:09:08韓燕王玲羅沖
關(guān)鍵詞:波段土地利用重要性

韓燕,王玲,羅沖

(石河子大學(xué)理學(xué)院地理系,新疆 石河子 832003)

隨機森林算法在干旱區(qū)土地利用遙感分類中的應(yīng)用研究

韓燕,王玲*,羅沖

(石河子大學(xué)理學(xué)院地理系,新疆 石河子 832003)

為了驗證隨機森林算法在干旱區(qū)土地利用遙感分類中的效果,本文采用隨機森林算法,結(jié)合Landsat8遙感影像以及DEM、NDVI等輔助數(shù)據(jù),解譯了干旱區(qū)典型流域瑪納斯河流域的土地利用圖。分析結(jié)果表明:(1)分析決策樹數(shù)量(k)和分類變量數(shù)量(m)對分類精度具有很大影響。通過優(yōu)化2個參數(shù)得到最優(yōu)隨機森林模型,當(dāng)k取103、m取6時,模型分類精度可達95%;(2)通過土地利用分類精度的影響因子分析發(fā)現(xiàn),海拔高程和歸一化植被指數(shù)對土地利用分類的影響程度比坡向的影響更大。(3)通過分類結(jié)果對比分析發(fā)現(xiàn),應(yīng)用隨機森林算法分類的精度比用最大似然法的分類精度高9%,利用變量重要性篩選出的遙感波段構(gòu)建優(yōu)化隨機森林模型,能有效降低遙感數(shù)據(jù)源數(shù)據(jù)量,而Kappa系數(shù)保持在0.97不變。隨機森林算法可以在干旱區(qū)土地利用分類中廣泛應(yīng)用。

遙感,土地利用分類,隨機森林,干旱區(qū)

土地利用遙感分類是目前進行土地利用變化成因、現(xiàn)狀、趨勢以及相關(guān)研究的主要技術(shù)手段[1]。利用遙感影像解譯出的土地利用資料克服了傳統(tǒng)的土地調(diào)查需要大量的人力和財力投入和不能勝任區(qū)域土地變更的實時快速更新等諸多問題[2,3]。遙感數(shù)據(jù)分類與其他學(xué)科的分類研究相比具有數(shù)據(jù)量大、變量多、地表環(huán)境復(fù)雜等特點。如何利用這些數(shù)據(jù)高精度提取地表專題信息一直是該領(lǐng)域的研究重點[4-6]。

隨機森林算法被譽為目前分類精度最高、最為穩(wěn)定的分類算法,近十年來在多光譜、高光譜、雷達遙感數(shù)據(jù)遙感土地覆蓋利用分類中表現(xiàn)出優(yōu)越的性能[7-8]。

Chan等[9]研究了隨機森林算法和提升算法在生境分類差異性問題,結(jié)果表明這2種集成學(xué)習(xí)算法在分類精度上差異不大(1%左右),均優(yōu)于人工神經(jīng)網(wǎng)絡(luò)算法的分類結(jié)果;在分類時間和分類穩(wěn)定性方面,隨機森林算法則表現(xiàn)較為優(yōu)越。Vrgaliano等[10-11]在研究區(qū)范圍較大、生態(tài)環(huán)境異質(zhì)性強的區(qū)域時,結(jié)果顯示隨機森林在處理數(shù)據(jù)維度高、類間異質(zhì)性小、分類類別復(fù)雜遙感解譯方面表現(xiàn)優(yōu)良;雷震[12]在國內(nèi)對隨機森林在遙感分類方面的研究缺乏的情況下,對其發(fā)展歷史和應(yīng)用前景進行了探討,指出隨機森林作為新興的分類算法可提高遙感分類的精度;王書玉等[13]運用隨機森林算法對洪河濕地影像進行分類,分類總精度和Kappa系數(shù)分別為88.31%和0.82,較常用的MLC和CART算法分類的精度有顯著提高。

國內(nèi)對隨機機森林算法的分類研究廣泛分布于生態(tài)、醫(yī)學(xué)、經(jīng)濟等領(lǐng)域內(nèi),并表現(xiàn)出良好的性能[14-15]。而在遙感分類領(lǐng)域內(nèi)隨機森林算法對遙感影像土地利用分類的研究并未見完整的報道[16]。

本研究針對隨機森林算法在土地利用遙感分類過程中的具體應(yīng)用進行研究,分析算法參數(shù)對分類精度的影響和遙感光譜波段與光譜指數(shù)在土地利用分類中的重要程度,以保證分類精度的基礎(chǔ)上達到降維的效果,評價隨機森林在分類精度上效率,以期利用隨機森林算法為干旱區(qū)的土地利用分類提供依據(jù)。

1 材料與方法

1.1 研究區(qū)概況

瑪納斯河流域地處天山北麓中段,準(zhǔn)葛爾盆地南緣,是天山北坡最大的綠洲(E85°01′-86°32′,N43°27′-45°21′)。流域內(nèi)地勢從北向南逐漸降低,地貌呈典型的山盆系統(tǒng)結(jié)構(gòu),依次為山地—山前傾斜平原—沙漠,區(qū)域年降水量110-200 mm,年潛在蒸發(fā)量1500-2000 mm,雨量稀少,蒸發(fā)量大,屬于典型的溫帶大陸性干旱半干旱氣候[17]。

受海拔和水資源的影響,流域內(nèi)林地、草地主要位于山地低山區(qū);大量來自山區(qū)的融水流入山前平原區(qū),適宜耕種,在此地區(qū)分布有耕地、水庫、城市等大量人造景觀;距離山區(qū)水源較遠(yuǎn)的古沖積平原,土地利用則主要以沙漠為主[18]。

圖1 瑪納斯河流域位置Fig.1 Location of Manasi River Basin

1.2 方法

1.2.1 樣本數(shù)據(jù)獲取

利用中國科學(xué)院土地利用遙感監(jiān)測分類系統(tǒng)對研究區(qū)的土地利用類型進行劃分。從2000年土地利用圖中共導(dǎo)出不同土地類型2050個樣本數(shù)據(jù)點,所有樣本點經(jīng)過Google Earth 2013年影像目視驗證(表1)。不同地類樣本數(shù)據(jù)按2∶1的比例隨機分為2部分,2/3的數(shù)據(jù)作為實驗數(shù)據(jù),1/3的數(shù)據(jù)作為驗證數(shù)據(jù),用于對比分析中分類精度的計算。

表1 用于隨機森林算法的土地覆蓋利用類別與樣點數(shù)目Tab.1 Land-use type and number of sampling points for random forest algorithm

1.2.2 遙感數(shù)據(jù)的獲取與預(yù)處理

選擇研究區(qū)中作物生長旺盛的2013年8月19號的Landsat 8 OLI遙感影像(wrs2條帶號144028、144029、144030)為基準(zhǔn)影像(來源USGS,http://glovis. usgs.gov/),獲取的影像經(jīng)過輻射校正和基于MODTRAN4+模型的大氣校正,裁剪導(dǎo)出瑪納斯河流域影像數(shù)據(jù)。

1.2.3 遙感指數(shù)選取

歸一化植被指數(shù)(NDVI)作為反映植被信息最重要的指數(shù),被廣泛應(yīng)用于遙感分類領(lǐng)域,尤其是干旱半干旱區(qū)因人類活動的影響,不同土地利用下的植被覆蓋程度差異很大,故將預(yù)處理后的OLI近紅外和紅外波段求得的NDVI數(shù)據(jù)作為預(yù)測變量加入到研究區(qū)的土地利用分類中。

瑪納斯河流域是典型的山盆結(jié)構(gòu)區(qū)域,地勢起伏大,土地利用大都因地制宜,地形數(shù)據(jù)的加入可以有效提高海拔和坡度等地形差異明顯的地類。地形數(shù)據(jù)包括30分辨率的SRTM-DEM數(shù)據(jù)和由其導(dǎo)出地形描述數(shù)據(jù)——坡度、坡向指數(shù)。至此,本研究使用 Landsat 8多光譜波段(7個波段:b1-b7)、NDVI、DEM、坡度(aspect)和坡向(slope)共計 11個波段(以下稱作變量)來反演研究區(qū)的土地利用狀況。本文對遙感影像的所有處理均在軟件ENVI5.1中完成。

1.2.4 隨機森林算法

其中,b(x)是第 b個隨機分類樹的預(yù)測值。

隨機森林采用基尼指數(shù)(GINI Index)來選擇最佳分裂屬性,對于給定的訓(xùn)練集,基尼指數(shù)算法如下:

隨機森林的隨機性主要體現(xiàn)在兩方面[19-20]:

(1)隨機選擇子樣本時,在面對輕微數(shù)據(jù)變動時其穩(wěn)定性較高,從而提高分類精度。

(2)算法從屬性集中隨機選擇k個屬性,每個樹節(jié)點分裂時,從這隨機的k個屬性,選擇最優(yōu)的。這樣雖然降低每棵樹的強度,也使得樹之間的相關(guān)性降低,減少了泛化誤差。

隨機森林算法自提出以來,已經(jīng)很多的商業(yè)和開源軟件中包含了該算法,本文使用開源軟件R來實現(xiàn)隨機森林算法和影像分類,其中的Random Forest程序包可以方便的建立隨機森模型,raster程序包可以利用存在的RandomForest模型進行影像分類。

1.2.5 隨機森林土地利用分類模型的構(gòu)建方法

隨機森林算法是以大量C&RT為基分類器的集合,其與其他樹形分類器最明顯的不同之處在于分類時每個節(jié)點處,使用給定數(shù)目的變量(本文取值范圍為1-11)進行分割;該參數(shù)在單個數(shù)的構(gòu)建過程中不變,但是具體分類變量是隨機選取的。在構(gòu)建隨機森林模型時分類樹數(shù)量(k)增多能夠有效降低泛化誤差和避免出現(xiàn)過擬合;變量數(shù)目(m)選擇則有局限性,一方面過多會在增強單棵決策樹能力但會增加決策樹之間的相關(guān)性,而過少單棵樹又會變得太弱。

在構(gòu)建分類模型的過程中,隨機森林利用建成單顆決策樹時剩余的袋外數(shù)據(jù)對該模型分類精度進行評價,即袋外誤差(OBB誤差)。Rodriguez-Galiano證明使用OBB誤差評價分類效果與使用測試數(shù)據(jù)評價等效,并且OBB誤差評估具有無偏性的特點;在處理小數(shù)據(jù)量分類時,不必考慮驗證數(shù)據(jù),更具有優(yōu)勢。

考慮到本研究各個土地利用類型的樣本容量普遍偏小,本文使用OBB誤差作為評價不同分類節(jié)點變量數(shù)目和決策樹數(shù)目組合的隨機森林模型分類精度的影響的指標(biāo)。

1.2.6 土地利用分類模型的優(yōu)化

隨機森林算法不僅能高精度的完成土地利用遙感分類,還能評價分類變量對總體和每一種土地利用類型分類的重要程度,一般的分類方法則不能完成關(guān)變量對分類結(jié)果的重要性計算。變量的重要性分析可以在變量過多的情況下對變量進行降維處理,如高光譜數(shù)據(jù)和多源數(shù)據(jù)的分類和信息提取研究中提取重要性較高的變量作為研究的數(shù)據(jù)來源。

隨機森林可以通過2種指標(biāo)來評價各個變量的重要性。(1)在隨機森林樹生成的過程中,計算OBB誤差和分類投票正確的次數(shù),然后對每個變量的OBB數(shù)據(jù)進行隨機轉(zhuǎn)換,計算此變量變換后的分類正確的次數(shù),用無變換數(shù)據(jù)的投票次數(shù)減去變換后投票正確的次數(shù),然后在除以隨機森林總樹數(shù),得到變量初始的重要性,除以標(biāo)準(zhǔn)差,就是變量的重要性,用Mean decrease accuracy(MDA)表示;(2)隨機森林算法在分類時使用Gini指數(shù)來作為分割方式,計算每個變量Gini指數(shù)在每個節(jié)點的異質(zhì)性,累加所有樹的減少值來表示變量的重要性,用Mean decrease gini(MDG)表示。

2 結(jié)果與分析

2.1 隨機森林土地利用分類模型的構(gòu)建

圖2為決策樹數(shù)量逐漸增加,不同m值(最小值、最大值和默認(rèn)值,也就是1、11、3)下的OBB誤差的變化趨勢。

圖2 決策樹的數(shù)量(k)和分類節(jié)點變量的數(shù)量(m)對分類結(jié)果的影響Fig.2 Effect of the numbers of trees(k)and the number of variables(m)on OBB errors

對比3種分類節(jié)點變量模型下分類樹數(shù)量(k)對分類精度的影響可以看出隨機森林算法只有在決策樹匯集成“森林”時,其分類精度才會提高,并且穩(wěn)定。具體如下:k較小時,分類誤差較大,隨著k值不斷變大,分類誤差呈波動式降低,當(dāng)k值大約到達100時,3個分類器的分類精度趨于穩(wěn)定,其后的誤差平均值分別為9%、6%和7%,之后決策樹數(shù)量的增加不會對OBB誤差造成明顯影響,OBB誤差趨于穩(wěn)定。

隨機森林模型中k值小時,分類效果不佳;k值大于一定值后,分類精度趨于穩(wěn)定,較為理想。考慮到隨著k值變大,分類器花費的計算時間也不斷增多,在保證高分類精度的同時,k值不應(yīng)過大。

圖2中還可以看出在相同k值下,不同分類節(jié)點變量數(shù)目(m)的分類器的分類精度表現(xiàn)出明顯的差異。m取最大值(11)和最小值(1)時,OBB誤差均不是最小。可見m值得變化不僅影響單棵樹的強度,而且改變了“森林”里樹與樹之間的相關(guān)性。平衡K、m對模型分類的影響是提高土地利用分類精度的關(guān)鍵所在。

分析分類節(jié)點變量數(shù)目與OBB誤差在不同決策樹數(shù)目組合下的相關(guān)性,可見m與分類精度之間的相關(guān)性逐漸降低(表2)。k值較小時,分類節(jié)點變量數(shù)目和分類精度具有高度的負(fù)相關(guān)性,表明當(dāng)決策樹數(shù)目較小時,分類節(jié)點變量個數(shù)的增加大大增強了單棵樹的分類能力,優(yōu)化了分類效果;隨著k的增加,m值與分類精度的相關(guān)性很弱,而不同的k值間的相關(guān)性則很高。k值增加到分類穩(wěn)定值(100)后,隨機森林對分類節(jié)點變量的數(shù)量并不敏感,分類精度趨于穩(wěn)定。

表2 不同決策樹數(shù)目組合下的分類節(jié)點變量數(shù)目與OBB誤差相關(guān)性Tab.2 The correlation between numbers of trees(k) and random spilt variables(m)on OBB errors

由表2可見,隨機森林模型的分類精度由分類樹數(shù)量和分類節(jié)點變量數(shù)量共同決定,因此最佳分類模型的確定是通過開展不同參數(shù)組合的分類精度實驗求得。計算得出OBB誤差最小值為0.04952,然而最小值所在的參數(shù)k小于100,并沒有形成穩(wěn)定的隨機森林模型,而第二小值0.05142與0.04952差異很小,故取該位置的參數(shù)組合(k=106,m=6)隨機森林模型經(jīng)行探討。圖3是利用隨機森林算法反演得到的瑪納斯河流域土地利用分布。

圖3 瑪納斯河流域隨機森林土地利用分類Fig.3 Random forest land use classification

2.2 土地利用分類模型的優(yōu)化結(jié)果

Mean decrease accuracy是當(dāng)把一個變量變成隨機數(shù)時,隨機森林預(yù)測準(zhǔn)確度的降低程度,該值越大表示該變量的重要性就越大。MeanDecreaseGini通過基尼指數(shù)計算每個變量對分類樹上每個節(jié)點的觀測值的異質(zhì)性影響。該值越大表示該變量的重要性越大。

利用2種變量重要性計算方法,根據(jù)前文生成的遙感分類模型分析 Landsat OLI多光譜波段、NDVI、和DEM、Slope、Aspect 3個地形數(shù)據(jù)對總體分類精度的影響(圖4)。

圖4 不同遙感波段對土地利用總體分類的重要性Fig.4 The importance of different romote sensing bands on the landuse classification

圖4a和圖4b分別表示基于Gini指數(shù)和OBB誤差減少下的分類變量對總體分類精度的重要性。對比2幅圖發(fā)現(xiàn)每個遙感波段在不同測定方法下的變量重要性排序是一致的,表明2種測量手段是等效的。

分析單個波段的變量重要性可以看出:DEM、NDVI和b5(近紅外波段)對分類精度的影響最大,MDG指標(biāo)分別為 141、70和48;MDA指數(shù)同樣很高,0.43、0.25和0.12??梢娛芨珊祬^(qū)流域獨特的地形結(jié)構(gòu)和自然環(huán)境條件影響,地表海拔和植被生長狀況對于劃分土地利用類別具有很大的幫助。OLI b5-b7波段的變量重要性緊隨其后,重要性大小排序為b5>b7>b6;該波段的波譜范圍為近紅外波段至短波紅外波段,而可見光范圍深藍(lán)光波段至紅波段(b1-b4)對土地利用遙感分類的重要性很低,具體原因仍需后續(xù)研究。

圖5 變量減少對基于OBB測定分類精度的影響Fig 5.Effect of variable reduction on classification accuracy based on OBB

圖5表示在逐步去除變量重要性最小的變量后,總體分類精度的變化情況。可見,當(dāng)使用變量個數(shù)大于3個(總變量數(shù)的30%)時,總體分類精度在94%左右浮動變化,之后急速減少。當(dāng)預(yù)測變量數(shù)為8個時,分類精度的最大值為94.67%,結(jié)合圖4b發(fā)現(xiàn),分類精度最大值是去除了變量重要性最小的3個變量。

2.3 隨機森林與最大似然分類精度對比

結(jié)合節(jié)1.2.5與1.2.6,利用變量選取后分類精度最高的8個分類變量構(gòu)建隨機森林和最大似然分類模型。通過對比最大似然分類算法來判定分類精度的高低是否取決于分類算法的不同。本研究使用軟件ENVI默認(rèn)的ML分類模塊完成最大似然算法的土地利用分類和精度評價部分(表3)。

表3 分類精度總體評價Tab.3 Summary of classification accuracies by maximum likelihood and random forest classification

表3顯示,利用最大似然算法和隨機森林算法獲取的全變量和DEM、NDVI等8個分類變量的分類精度的差異,Kappa系數(shù)使用驗證數(shù)據(jù)計算。表3可見,隨機森林算法的分類精度總是要高于最大似然分類,利用全部變量的分類結(jié)果的Kappa系數(shù)分別為0.97和0.88,隨機森林算法的分類精度顯著提高,較最大似然高出9%;考慮到分類精度均已高達85%以上,精度的每一點提升難度很大。當(dāng)分類變量限于變量重要性最為重要的8個波段時,隨機森林的精度保持不變,最大似然分類的精度卻有所增加,Kappa系數(shù)從0.88變成0.91,提升了3%。最大似然分類精度的差異性大概在于它的參數(shù)特性,一些光譜和地形特征數(shù)據(jù),例如坡向,在該區(qū)域可能并不是正態(tài)分布。

3 討論與結(jié)論

本研究的主要目的是探析隨機森林算法在干旱區(qū)流域尺度上的土地利用分類效用。對于融合了歸一化植被指數(shù)、DEM、坡度、坡向和OLI遙感影像數(shù)據(jù),該算法出色的完成了瑪納斯河流域的土地利用分類。

(1)隨機森林算法的分類精度主要受2個參數(shù)的影響:決策樹的數(shù)量(k)與分類變量的數(shù)量(m),分析表明,當(dāng)k<100時,分類樹的數(shù)量與分類精度有著明顯的正相關(guān)性,之后分類精度趨于穩(wěn)定,分類變量輕微的影響分類精度。本研究中,地形數(shù)據(jù)中的坡向(aspect)和坡度(slope)數(shù)據(jù)在2種測量方式下的重要性均很低,尤其是坡向數(shù)據(jù),對分類精度無影響,因此在的土地利用分類中,可以剔除該變量,達到在分類精度不降低的情況下,減少數(shù)據(jù)量。

(2)利用隨機森林算法可以根據(jù)Gini指數(shù)和OBB誤差對土地利用分類變量(波段)的重要性進行分析,分析表明海拔高程和歸一化植被指數(shù)對土地利用分類的影響程度較高,光譜波段內(nèi)紅光波段至短紅外波段(b4-b7)的重要性要比可見光波段(b1-b4)高。

(3)對比最大似然算法分類結(jié)果表明,隨機森林算法的分類效果和分類精度表現(xiàn)的均很優(yōu)秀,兩者總體kappa系數(shù)分別為0.97和0.88,相差了9個百分點。利用變量重要性篩選出的遙感波段構(gòu)建優(yōu)化隨機森林模型,其分類精度保持不變,可以利用該方法對數(shù)據(jù)源降維處理。本研究顯示,利用驗證樣本計算得出的分類精度要比基于袋外數(shù)據(jù)的分類精度高,其原因可能是驗證樣本的獨立性不能完全確定。隨機森林算法比傳統(tǒng)的分類算法提供更高的分類精度,通過變量重要性篩選的遙感波段能夠有效的剔除多余波段,精簡數(shù)據(jù)源。

本研究只選擇了歸一化植被指數(shù)、DEM、坡度和坡向作為輔助OLI遙感數(shù)據(jù)分類的增強數(shù)據(jù),因此在區(qū)分在此類光譜區(qū)分性小的類別時可能會有誤分和漏分。選擇更多的數(shù)據(jù)是否能提高分類效果,將是下一步工作的重點。本研究可為繪制流域尺度的土地利用分類提供了一個新的方法與參考。

[1]彭建,王仰麟,張源,等.土地利用分類對景觀格局指數(shù)的影響[J].地理學(xué)報,2006,61(2):157-168. Peng J,Wang Y L,Zhang Y,et al.Research on the influence of land use classification on landscape metrics[J].Acta Geographica Sinica,2006,61(2):157-168.

[2]冉有華,李文君,陳賢章.TM圖像土地利用分類精度驗證與評估——以定西縣為例 [J].遙感技術(shù)與應(yīng)用,2003,18 (2):81-86. Ran Y H,Li W J,Chen X Z.Verification and assessment of land use classification by using TM image-taking dingxi County as an example[J].Remote Sensing Technology and Application,2003,18(2):81-86.

[3]趙庚星,李玉環(huán),徐春達.遙感和GIS支持的土地利用動態(tài)監(jiān)測研究——以黃河三角洲墾利縣為例 [J].應(yīng)用生態(tài)學(xué)報,2000,11(4):573-576. Zhao G X,Li Y H,Xu C D.Land use dynamic monitoring supported by remote sensing and GIS——a case study in Kenli County of Yellow River delta[J].Chinese Journal Ournal of Applied Ecology,2000,11(4):573-576.

[4]黎夏,葉嘉安,廖其芳.利用案例推理(CBR)方法對雷達圖像進行土地利用分類[J].遙感學(xué)報,2004,8(3):246-253. Li X,Yeh Anthony Gar-On,Liao Q F.Case-based reasoning(CBR)for land use classification using radar images[J]. Journal of Remote Sensing,2004,8(3):246-253.

[5]李恒凱,吳立新,李發(fā)帥.面向土地利用分類的HJ-1CCD影像最佳分形波段選擇[J].遙感學(xué)報,2013,17(6):1572-1586. Li H K,Wu L X,Li F S.Optimal fractal band selection on HJ-1 CCD image for land use classification[J].Journal of Remote Sensing,2013,17(6):1572-1586.

[6]李小文,劉素紅.遙感原理與應(yīng)用[M].北京:科學(xué)出版社,2008:104-105.

[7]張雷,王琳琳,張旭東,等.隨機森林算法基本思想及其在生態(tài)學(xué)中的應(yīng)用——以云南松分布模擬為例 [J].生態(tài)學(xué)報,2014,34(3):650-659. Zhang L,Wang L L,Zhang X D,et al.The basic principle of random forest and its applications in ecology:a case study ofPinus yunnanensis[J].Acta Ecologica Sinica,2014,34(3):650-659.

[8]Rodriguez-Galiano V F,Chimire B,Roganet J,et al.An assessment of the effectiveness of a random forest classifier for landcover classification[J].ISPRS Journal of Photogrammetry and Remote Sensing,2012,67:93-104.

[9]Chan J C W,Paelinckx D.Evaluation of random forest and adaboost tree-based ensemble classification and spectral band selection for ecotope mapping using airbornehyperspectral imagery[J].Remote Sensing of Environment,2008,112(06):2999-3011.

[10]Rodriguez-Galiano V F,Abarca-Hernand Z F,Ghimire B, et al.Incorporating spatial variability measures in landcover classification using random forest[J].Procedia Environmental Sciences,2011,3:44-49.

[11]Rodriguez-Galiano V F,Chica-Olmd M,Abarca-Hernandez F,et al.Random Forest classification of Mediterranean land coverusingmulti-seasonal imagery and multi-seasonal texture[J].Remote Sensing of Environment,2012,121:93-107.

[12]雷震.隨機森林及其在遙感影像處理中應(yīng)用研究[D].上海:上海交通大學(xué),2012.

[13]王書玉,張羽威,于振華.基于隨機森林的洪河濕地遙感影像分類研究[J].測繪與空間地理信息,2014,37(4):83-85, 93. Wang S Y,Zhang Y W,Yu Z H.Classification of Honghe Wetland remote sensing image based on random forests[J]. Geomatics& Spatial In for Mation Technology,2014,37 (4):83-85,93.

[14]李欣海.隨機森林模型在分類與回歸分析中的應(yīng)用[J].應(yīng)用昆蟲學(xué)報,2013,50(4):1190-1197. Li X H.Using“random forest”for classification and regression[J].Chinese Journal of Applied Entomology,2013,50 (4):1190-1197.

[15]韓玉,施海龍,曲波,等.隨機森林方法在醫(yī)學(xué)中的應(yīng)用[J].中國預(yù)防醫(yī)學(xué)雜志,2014,15(1):79-81. Han Y,Shi H L,Qu B,et al.Random forests application in medicine[J].Chin Prev Med,2014,15(1):79-81.

[16]李旭青,劉湘南,劉美玲,等.水稻冠層氮素含量光譜反演的隨機森林算法及區(qū)域應(yīng)用[J].遙感學(xué)報,2014,18(4):923 -945. Li X Q,Liu X N,Liu M L,et al.Random forest algorithm and regional applications of spectral inversion model for estimating canopy nitrogen concentration in rice[J].Journal of Remote Sensing,2014,18(4):923-945.

[17]封玲.瑪納斯河流域農(nóng)業(yè)開發(fā)與生態(tài)環(huán)境變遷研究[M].北京市:中國農(nóng)業(yè)出版社,2006:1-3.

[18]程維明,周成虎,劉海江,等.瑪納斯河流域50年綠洲擴張及生態(tài)環(huán)境演變研究[J].中國科學(xué)(D輯:地球科學(xué)),2005,35(11):1074-1086. Chen W M,Zhou C H,Liu H J,et al.Manas river valley oasis expansion and ecological environment evolution research 50 years[J].Science in China(series D),2005,35(11): 1074-1086.

[19]Liaw A,Wiener M,Classification and regression by random Forest[J].R News,2002,2(3),18-22.

[20]Genuer,R.,et al.Variable selection using random forests[J]. Pattern Recognition Letters,2010,31(14):2225-2236.

Application of random forest algorithm in the remote sensing classification of land use in arid region

Han Yan,Wang Ling*,Luo Chong
(College of Science of Shihezi University,Shihezi,Xinjiang 832003,China)

The aim of this resesearch is to test the random forest algorithm in the remote sensing classification in arid area. The land use map of the Manasi River Basin,a typical watershed in arid area,had been interpreted using this method based on Landsat 8,DEM and NDVI data.The results show that:(1)both the number of decision trees(k)and the number of classification variables(m)have effect on the classification accuracy.When k,m are 103,6,respectively,the classification accuracy reaches 95%;(2)through the comparative analysis,DEM and NDVI have more influence on the classification accuracy than the slope;(3)Based on the results of classification,the random forest algorithm accuracy is higher than 9%with the maximum likelihood method..The random forest algorithm could reduce data redundancy and keep the accuracy with 0.97 of Kappa coefficient.The method could be applied in land use classification of remote sensing in the arid area.

Remote sensing,land use classification,random forests algorithm,arid areas

F323.211;TP301.6

A

10.13880/j.cnki.65-1174/n.2017.01.016

1007-7383(2017)01-0095-07

2016-10-17

國家自然科學(xué)基金項目(41361073)

韓燕(1981-),女,碩士研究生,專業(yè)方向為遙感影像信息提取和土壤鹽漬化成因,e-mail:66720287@qq.com。

*通信作者:王玲(1974-),女,教授,從事遙感與地理信息系統(tǒng)應(yīng)用方面研究,e-mail:rain_ling@163.com。

猜你喜歡
波段土地利用重要性
春日暖陽
“0”的重要性
論七分飽之重要性
幼兒教育中閱讀的重要性
甘肅教育(2020年21期)2020-04-13 08:09:24
土地利用生態(tài)系統(tǒng)服務(wù)研究進展及啟示
M87的多波段輻射過程及其能譜擬合
讀《邊疆的重要性》有感
濱??h土地利用挖潛方向在哪里
日常維護對L 波段雷達的重要性
西藏科技(2015年4期)2015-09-26 12:12:58
L波段雷達磁控管的使用與維護
河南科技(2014年18期)2014-02-27 14:14:53
长兴县| 西和县| 奉节县| 西宁市| 望谟县| 岑巩县| 福鼎市| 青河县| 高密市| 巍山| 蒙自县| 五大连池市| 通州市| 安仁县| 日土县| 教育| 梅河口市| 定西市| 无极县| 闸北区| 健康| 绥阳县| 防城港市| 安顺市| 凤山县| 凭祥市| 神农架林区| 西宁市| 辉县市| 长治县| 古丈县| 铁岭县| 永宁县| 天柱县| 霍林郭勒市| 青神县| 克东县| 平阴县| 高要市| 连州市| 新龙县|