彭力恒 劉凱* 朱遠輝 柳林
?
旋轉(zhuǎn)森林算法在GF-2衛(wèi)星影像土地利用分類中的應用
彭力恒1劉凱1*朱遠輝2柳林2
(1 中山大學地理科學與規(guī)劃學院 廣東省城市化與地理環(huán)境空間模擬重點實驗室 廣東省公共安全與災害工程技術(shù)研究中心,廣州 510275) (2 廣州大學地理科學學院 公共安全地理信息分析中心,廣州 510006)
“高分二號”(GF-2)衛(wèi)星影像中精細的空間信息可用于高精度的土地利用分類研究。為了獲取基于GF-2衛(wèi)星影像土地利用分類的最優(yōu)特征空間,以及將旋轉(zhuǎn)森林算法應用于提高遙感影像分類精度中,文章利用GF-2衛(wèi)星影像數(shù)據(jù),基于光譜特征(4個多光譜波段和1個全色波段)、指數(shù)(植被指數(shù)、水體指數(shù)及簡單比值指數(shù))和變換成分(主成分、最小噪聲分離成分與獨立成分)構(gòu)建特征空間,應用基于決策樹的旋轉(zhuǎn)森林算法構(gòu)建面向?qū)ο蟮姆诸愐?guī)則集,進行土地利用分類,并與最近鄰和決策樹算法的分類結(jié)果對比分析。結(jié)果表明,結(jié)合光譜特征、幾何特征和紋理特征,采用旋轉(zhuǎn)森林算法得到的分類總體精度為84.85%,Kappa系數(shù)為0.819;引入指數(shù)、變換成分后分類總體精度提高4.90%,Kappa系數(shù)提高0.058;相比于最近鄰分類器和決策樹分類器,結(jié)合旋轉(zhuǎn)森林思想的決策樹分類器總體精度分別提高11.97%和15.44%,Kappa系數(shù)分別提高0.142和0.184。研究結(jié)果可為中國高分辨率衛(wèi)星影像的信息提取及基于旋轉(zhuǎn)森林算法的土地利用分類研究提供參考。
旋轉(zhuǎn)森林算法 土地利用分類 決策樹 “高分二號”衛(wèi)星 遙感應用
自1999年,第一顆提供高空間分辨率影像的商業(yè)衛(wèi)星發(fā)射以來,人們獲取高分辨率遙感影像數(shù)據(jù)變得更加容易。如何從高分辨率影像中快速地獲取地表覆蓋信息、有效地識別各類地物并對土地利用進行分類,一直都是遙感應用領(lǐng)域致力解決的問題。相比于國外衛(wèi)星資料,國產(chǎn)衛(wèi)星可提供可靠穩(wěn)定的數(shù)據(jù)源,且價格相對低廉[1]。我國自主研制的首顆亞米級空間分辨率民用光學衛(wèi)星“高分二號”(GF-2)衛(wèi)星2014年8月19日成功發(fā)射,其星下點空間分辨率達到0.8m[2]。GF-2衛(wèi)星具有高定位精度和快速姿態(tài)機動能力等特點,其衛(wèi)星綜合觀測效能相比于GF-1等同類衛(wèi)星有很大的提高;GF-2衛(wèi)星可為國土資源部等部門提供示范應用服務,已在農(nóng)業(yè)、海岸線、城市研究等領(lǐng)域取得一些成果[3-5]。相比于其他的國產(chǎn)民用衛(wèi)星,GF-2衛(wèi)星影像可提供更多的細節(jié)信息,這些信息可轉(zhuǎn)化為豐富的光譜、紋理特征,充足的特征有助于提升土地利用分類的精度[5]。
目前,以GF-2衛(wèi)星為代表的國產(chǎn)民用衛(wèi)星應用拓展已經(jīng)成為國內(nèi)外學者的研究熱點:對GF-2衛(wèi)星影像進行混合像元分解,獲取其亞像元以及超像元的信息,對北京海淀區(qū)的市區(qū)、市郊、農(nóng)村等三種區(qū)域進行綠地提取,發(fā)現(xiàn)GF-2衛(wèi)星影像提取精度在各區(qū)域及各尺度上均比Landsat-8衛(wèi)星影像高[6];結(jié)合GF-2衛(wèi)星影像提取出的Gabor紋理特征,利用隨機條件場模型,對北京通州區(qū)的城市森林進行提取,分類總體精度比傳統(tǒng)最大似然法提高3.71%[7];使用GF-2衛(wèi)星影像提供的形態(tài)建筑指數(shù)、歸一化植被指數(shù)、線段等高空間分辨率特征,獲取了四個研究區(qū)域的城市邊界,其提取平均精度超過90%[8];獲取GF-2衛(wèi)星影像的光譜、紋理特征,可用于對四川內(nèi)江市隆昌縣進行城市生態(tài)用地分類[5]。GF-2衛(wèi)星填補了亞米級國產(chǎn)衛(wèi)星的空白,其高空間分辨率所帶來的紋理、幾何特征將為土地利用的分類 提供更豐富的信息,但如何利用GF-2衛(wèi)星影像豐富的信息,獲得更高的研究精度也是當前面臨的主要挑戰(zhàn)。
旋轉(zhuǎn)森林(Rotation Forest,RoF)算法是Rodriguez 2006年提出的一種集成學習算法,它通過“旋轉(zhuǎn)”特征軸的思想,提高各分類特征的多樣性及其基分類器準確性,從而提高各種土地利用類型的識別精度[9]。文獻[10]使用旋轉(zhuǎn)森林算法對城市和農(nóng)村兩種無人機圖像進行分類,發(fā)現(xiàn)其分類效果在集成學習方法中表現(xiàn)最佳;文獻[9]使用高光譜數(shù)據(jù)對采用不同基分類器的旋轉(zhuǎn)森林算法進行研究;文獻[11]使用Landsat衛(wèi)星影像研究秦淮河流域的不透水面景觀格局演變;文獻[12]對GF-1衛(wèi)星影像進行積雪提取,發(fā)現(xiàn)使用決策樹基分類器的旋轉(zhuǎn)森林算法分類精度比隨機森林算法的精度高。旋轉(zhuǎn)森林算法在高光譜、中高分辨率多光譜遙感圖像的分類中會優(yōu)于傳統(tǒng)的分類算法,然而很少關(guān)注到“旋轉(zhuǎn)”的思想對分類精度所帶來的影響,旋轉(zhuǎn)森林算法應用于高分辨率遙感數(shù)據(jù)的研究較少,GF-2衛(wèi)星數(shù)據(jù)于旋轉(zhuǎn)森林算法的應用潛力更是有待挖掘。
本文選擇東莞市西南部GF-2衛(wèi)星影像,采用不同的特征組合,分析旋轉(zhuǎn)森林算法在GF-2衛(wèi)星數(shù)據(jù)的應用潛力,并與最近鄰算法和決策樹算法分類結(jié)果進行對比分析,為亞米級遙感衛(wèi)星數(shù)據(jù)的土地利用分類研究提供參考。
選取東莞市沙田鎮(zhèn)約1.5km×1.0km的區(qū)域作為研究區(qū)(東經(jīng)113°37′00″~113°37′55″,北緯22°50′55″ ~22°51′35″),包括建設用地、水域、耕地等常見的土地利用類型,見圖1。研究數(shù)據(jù)為中國資源衛(wèi)星應用中心提供的GF-2衛(wèi)星1號全色多光譜傳感器(Panchromatic and Multispectral Sensor,PMS1)影像,獲取時間為2014年10月6日。圖1使用標準偽彩色顯示,R、G、B通道分別輸入影像的近紅外、紅、綠波段。PMS1提供4個多光譜波段(藍、綠、紅、近紅外)和1個全色波段的影像數(shù)據(jù),其空間分辨率分別優(yōu)于4m和1m[3]。
圖1 研究區(qū)GF-2衛(wèi)星影像圖
研究區(qū)內(nèi)GF-2衛(wèi)星影像(圖1)可識別到的土地利用類型包括建設用地、林地、耕地、水域等。依據(jù)《土地利用現(xiàn)狀分類》(標準號GB/T 21010-2017)[13]的分類系統(tǒng),再結(jié)合研究區(qū)內(nèi)土地覆蓋的特點,確定本文分類體系為:建筑、耕地、道路、裸土、水域、林地6類;考慮到高分辨率影像不可避免的建筑物陰影問題,需要在分類時添加陰影一類,在土地利用制圖時,再把陰影歸并到建筑的類別下。
圖2為研究技術(shù)路線,包括以下部分:1)采用ENVI 5.3軟件(Harris Corporation)對數(shù)據(jù)進行預處理,包括輻射定標、FLAASH大氣校正、幾何校正、圖像融合、圖像裁剪,圖像融合方法采用HCS變換的Intensity Match方法[14],融合后重采樣為1m;2)進行指數(shù)計算、特征變換和影像分割,影像分割時需要輸入部分指數(shù)特征;3)從分割后的影像中提取特征并組成3個特征組合;4)挑選訓練樣本訓練分類器,并根據(jù)輸入特征對圖像進行分類;5)根據(jù)驗證樣本的分類結(jié)果,對其進行分析和評價。
圖2 研究技術(shù)路線圖
(1)影像分割和指數(shù)計算
選取4個指數(shù)特征,包括歸一化植被指數(shù)(Normalized Difference Vegetation Index,NDVI)[15]、歸一化水體指數(shù)(Normalized Difference Water Index,NDWI)[15]、簡單比值指數(shù)(Simple Ratio Index,SR)的兩種變形SR_R[16]和SR_B。從文獻[15]可看出,SR_R指數(shù)參與分割可有效區(qū)分耕地與非耕地的地物邊界,從而提高分割準確性,因此,根據(jù)比值的思想[16]和NDWI輸入的波段計算SR_B,目的是令水陸界線更明顯。采用eCognition 9.0軟件(Trimble Inc.)所提供的一種自下而上的多尺度分割算法[17],把SR_R和SR_B加入到影像原始波段(4個多光譜和1個全色波段)中并對其進行分割。進行多組影像分割試驗,對比發(fā)現(xiàn),尺度參數(shù)和形狀參數(shù)分別設置為80和0.3時,可使得各類土地利用最小單元成為一個對象,能有效運用于本文圖像的分類。
式中BLUE、RED、NIR分別為GF-2衛(wèi)星多光譜的藍波段、紅波段、近紅外波段的亮度值。
(2)對象尺度特征計算
基于多尺度分割后的結(jié)果,計算圖像對象尺度的特征[18],包括波段統(tǒng)計特征、幾何特征和紋理特征,見表1。
表1 本文使用的特征說明
Tab.1 Features description in this study
表注:1)每一個波段均包含一個均值、標準差和偏度,即這3類波段統(tǒng)計特征各產(chǎn)生2+3個特征,其中為特征波段數(shù)量;2)紋理特征采用GF-2衛(wèi)星全色波段的全方向灰度共生矩陣(Gray-level Co-occurrence Matrix,GLCM)和灰度級差矢量(Gray-level Difference Vector,GLDV)。
(3)變換成分特征計算
對GF-2衛(wèi)星影像的多光譜波段進行主成分分析(Principal Component Analysis,PCA)[19]、最小噪聲分離[20]、獨立成分分析[21]三種變換,獲得各個變換的前3個成分,作為變換成分特征。
(4)特征組合方案
定義三種特征組合的方案,見表2。組合1表示原始波段、幾何特征、紋理特征的組合,組合2表示在組合1基礎上加入指數(shù)特征,組合3表示在組合2基礎上加入變換成分特征。組合1、組合2、組合3輸入到旋轉(zhuǎn)森林算法中,所得分類結(jié)果分別記為RoF-1、RoF-2、RoF-3,組合3輸入到最近鄰算法(k-Nearest Neighbors,kNN)和C4.5決策樹算法(Decision Tree,DT)中[22],所得分類結(jié)果分別記為kNN-3和DT-3。
表2 特征組合方案
Tab.2 Scheme of feature composition
旋轉(zhuǎn)森林算法主要思想是利用PCA對原始數(shù)據(jù)的特征軸進行旋轉(zhuǎn),使基分類器獲得不同的訓練樣本,以增加基分類器間的差異性,最終達到提高分類準確性的效果[23-24]。
假設=[1,2,3,···,x]表示一個具有維特征的樣本向量,×階矩陣則表示包含個用于訓練樣本的數(shù)據(jù)集;[1,2,3,···,y]T表示中各樣本歸屬類別的向量,中類別用表示、類別數(shù)為,則y∈{1,2,3,···,}(=1,2,3,···,)。旋轉(zhuǎn)森林的個基分類器1,2,3,···,D會按如下三步訓練所得:
1)將特征集隨機分割成個特征子集,即各子集均包含約=/維特征。
3)重復上一步次后,所得的主成分向量可組成旋轉(zhuǎn)系數(shù)矩陣
根據(jù)特征集排列順序重排中的列,獲得×階矩陣,(,)就是基分類器D的特征訓練集。重復步驟2)、3)兩步,即可訓練得個基分類器。
在分類階段,對于一個具有維特征的待分類樣本向量=[1,2,3,···,z],若P()表示基分類器D把分為第類ω的可能性(=1,2,3,···,),則屬于類ω的置信度為
計算得個類的置信度后,則會被分為置信度最高的一個類型。
本文基于WEKA 3.8平臺[22],實現(xiàn)旋轉(zhuǎn)森林算法、最近鄰算法和決策樹算法的分類,使用三者分類結(jié)果進行對比分析。
為保證精度檢驗的合理性,使用基于多項式分布的方法[15],以計算驗證樣本數(shù)量
式中為自由度為1的2分布上側(cè)()的分位數(shù);Π為所有地類中面積比例最接近50%的第類土地利用的面積占比;b為第類土地利用的錯分率。顯著性水平=b=0.05,本文分類數(shù)目=7,即至少需選取674個驗證樣本才能保證精度評價的合理性。
在野外調(diào)查的基礎上,結(jié)合三位解譯專家的意見,選取得988個樣本對象;使用隨機分層抽樣的方法[25],把988個樣本按照3︰7的比例,分配為訓練樣本和驗證樣本,其中訓練樣本分配得295個、驗證樣本為693個。采用基于誤差混淆矩陣計算的總體精度、制圖精度、用戶精度和Kappa系數(shù)4個指 標[19]用于評價精度。
為了驗證各種特征組合的適用性,提取GF-2衛(wèi)星影像各個特征組合的對象尺度特征(包括光譜、幾何、紋理特征),輸入到旋轉(zhuǎn)森林分類器中——對全部特征分割成3個特征子集(=3),對特征子集進行PCA變換以獲得新的特征訓練集,在此特征集中每次取100個特征來訓練剪枝置信度為0.25的決策樹基分類器,迭代10次后使用訓練后的基分類器對影像進行對象尺度的土地利用類型置信度計算,選取置信度最高的作為各個對象的土地利用類型,最終獲得GF-2衛(wèi)星數(shù)據(jù)的分類結(jié)果,見圖3。圖3(a)為GF-2衛(wèi)星真彩色組合影像,圖3(b)和圖3(c)分別表示使用特征組合3的最近鄰算法分類(kNN-3)和決策樹算法分類(DT-3),圖3(d)、圖3(e)和圖3(f)分別表示使用特征組合1(RoF-1)、2(RoF-2)和3(RoF-3)的旋轉(zhuǎn)森林算法分類。使用驗證樣本作為參考,統(tǒng)計分類結(jié)果誤分類和漏分類的情況,計算總體精度、Kappa系數(shù)等指標,對比分析不同特征組合的分類精度的差異。在最佳分類結(jié)果(RoF-3,見圖3(f))的基礎上,去除陰影類別,并糾正分類錯誤,獲得研究區(qū)土地利用的專題制圖,見圖4。
圖3 GF-2衛(wèi)星影像分類結(jié)果圖
圖4 GF-2衛(wèi)星影像土地利用專題圖
表3為選擇森林算法分類結(jié)果的精度對比,使用GF-2衛(wèi)星的特征組合1進行旋轉(zhuǎn)森林分類(RoF-1),總體精度和Kappa系數(shù)分別為84.85%和0.819;而加入指數(shù)特征后(RoF-2),總體精度和Kappa系數(shù)分別提升1.30%和0.016,即指數(shù)特征對分類精度的提升有一定幫助;相比于RoF-2,加入變換成分特征(RoF-3)的總體精度和Kappa系數(shù)分別提高了3.60%和0.042,說明變換成分的特征能有效地增加各土地利用類別之間的差異性,能夠提高旋轉(zhuǎn)森林的分類精度。綜合5種特征(RoF-3,波段統(tǒng)計、幾何特征、紋理特征、指數(shù)特征、變換成分特征)的旋轉(zhuǎn)森林算法所獲得的土地利用分類精度最高,比只使用前三個特征(RoF-1,波段統(tǒng)計、幾何特征、紋理特征)的分類在總體精度和Kappa系數(shù)上分別提高4.90%和0.058,因此,選用特征組合3作為不同分類方法比較的特征組合。
表3 不同特征輸入旋轉(zhuǎn)森林算法的精度比較
Tab.3 Accuracy comparison of RoF classification using different feature combinations
為驗證GF-2衛(wèi)星影像土地利用分類的可行性,以及旋轉(zhuǎn)森林算法相比于傳統(tǒng)算法應用在GF-2衛(wèi)星影像土地利用分類的效果,提取GF-2衛(wèi)星影像特征組合3的86個對象尺度特征(包括光譜、幾何、紋理特征),使用最近鄰、決策樹和旋轉(zhuǎn)森林三種算法進行分類,其中,旋轉(zhuǎn)森林算法采用決策樹算法中剪枝置信度為0.25的基分類器。通過總體精度、Kappa系數(shù)等指標,對比分析不同分類方法的差異,見表4。
表4 各種分類方法精度比較
Tab.4 Accuracy comparison of classification using different algorithms
使用傳統(tǒng)的最近鄰算法,分類結(jié)果的總體精度和Kappa系數(shù)分別為77.78%和0.735,說明GF-2衛(wèi)星影像應用在傳統(tǒng)方法的土地利用分類上可獲得較好的結(jié)果,具有一定的可用性。決策樹算法的總體精度和Kappa系數(shù)分別為74.31%和0.693(表4),在分類精度方面比最近鄰算法有所下降。相比于最近鄰算法,使用旋轉(zhuǎn)森林算法的分類結(jié)果在總體精度上提高了11.97%,達到89.75%;在Kappa系數(shù)上提高了0.142,達到0.877。旋轉(zhuǎn)森林算法在使用基分類器進行分類前,先對部分訓練樣本的特征進行PCA變換,再輸入到基分類器內(nèi)進行訓練,這一過程相當于為訓練樣本增加了大量特征,而且這些特征間的方差、信息熵、信噪比均比沒變換之前大,這使得不同土地利用類別之間的訓練樣本有了更顯著的差異,即使是相同的基分類器,其識別待分類樣本的準確性亦會因此而得到提高。所以,同樣是使用決策樹基分類器,經(jīng)過旋轉(zhuǎn)森林變換后的GF-2衛(wèi)星影像土地利用分類精度有顯著提高,總體精度提高了15.44%,Kappa系數(shù)提高了0.184。旋轉(zhuǎn)森林算法的分類精度比傳統(tǒng)最近鄰算法和旋轉(zhuǎn)森林的基分類器決策樹算法,均有較大的提升,說明旋轉(zhuǎn)森林算法在GF-2衛(wèi)星影像土地利用分類中有較高的適用性。
三種分類算法得到的分類結(jié)果誤差混淆矩陣見表5、表6、表7。其中,“參考數(shù)據(jù)”指驗證樣本中的實際地物類型,“被評價數(shù)據(jù)”指驗證樣本中的分類結(jié)果,對角線數(shù)字代表被正確分類的驗證樣本數(shù)量,對角線上方三角形內(nèi)數(shù)字代表參考數(shù)據(jù)被漏分類的驗證樣本數(shù)量,對角線下方三角形內(nèi)數(shù)字代表參考數(shù)據(jù)被誤分類的驗證樣本數(shù)量。以表5中的數(shù)字為例,129表示有129個真實地物類型為建筑的驗證樣本被正確分類為建筑、30表示有30個真實地物類型為建筑的驗證樣本被遺漏而被錯誤分類為道路、14表示有14個真實地物類型為裸土的驗證樣本被誤分類為建筑,而153表示153個驗證樣本被分類為建筑、171表示有171個驗證樣本的真實地物類型為建筑。由表5、表6、表7,可以發(fā)現(xiàn)各種土地利用類型之間的混淆有一定的規(guī)律:1)耕地和林地在光譜上非常類似,只有幾何特征和部分紋理特征可以區(qū)分兩種土地利用類型,因此其制圖精度和用戶精度均較低;耕地在旋轉(zhuǎn)森林算法中的制圖精度僅有70.69%,但已比最近鄰法的62.07%和決策樹的50.00%有所提高。2)陰影和水域在光譜上亦十分相似,兩者均有粗糙度低和反射率低的特點,其紋理特征差異亦不明顯,兩者僅有大小、形狀等幾何特征用以區(qū)分,因此在沒有“旋轉(zhuǎn)”的情況下,兩類用地的特征差異性不明顯,而且陰影是伴隨建筑物出現(xiàn)的,陰影亦會被誤分為建筑,然而經(jīng)過旋轉(zhuǎn)之后,陰影的用戶精度提高了10.65%,其被誤分為建筑或水域的概率有所下降。3)建筑和道路同屬人工地物,其光譜、紋理上的差異不明顯,需要通過幾何及部分光譜特征進行區(qū)分,因此兩者可分程度不高,經(jīng)過“旋轉(zhuǎn)”后的道路在用戶精度上對比最近鄰和決策樹分別提高32.76%和36.16%,而旋轉(zhuǎn)后的建筑制圖精度和用戶精度均提升至少15%;需要說明的是,由于GF-2衛(wèi)星的單景影像并非正射影像,因此建筑側(cè)面在一定程度上會影響影像分割結(jié)果,使對象的形狀不如正射圖像規(guī)則;而各棟建筑的頂部使用材料不一,其光譜、紋理等特征亦有較大差異,這使建筑的制圖精度和用戶精度均偏低。
表5 最近鄰分類結(jié)果的誤差混淆矩陣
Tab.5 Confusion matrix of kNN classification
表6 決策樹分類結(jié)果的誤差混淆矩陣
Tab.6 Confusion matrix of DT classification
表7 旋轉(zhuǎn)森林分類結(jié)果的誤差混淆矩陣
Tab.7 Confusion matrix of RoF classification
本文基于GF-2衛(wèi)星影像的全色和多光譜數(shù)據(jù),提取出其指數(shù)特征和變換成分特征,采用面向?qū)ο蟮挠跋穹指?,并使用最近鄰算法、決策樹算法和旋轉(zhuǎn)森林算法對此數(shù)據(jù)進行了土地利用分類的研究。試驗結(jié)果表明:1)綜合波段統(tǒng)計、幾何、紋理、指數(shù)、變換信息的旋轉(zhuǎn)森林分類算法所獲得的土地利用分類精度最高,比只用原始波段統(tǒng)計和幾何、紋理特征的總體精度提高4.90%,Kappa系數(shù)提高0.058;2)基于旋轉(zhuǎn)森林算法的分類(總體精度89.75%,Kappa系數(shù)0.877)相較于傳統(tǒng)的最近鄰法,在總體精度上提高11.97%,在Kappa系數(shù)上提高0.142;3)同樣使用決策樹基分類器,經(jīng)過旋轉(zhuǎn)森林思想改進的分類結(jié)果總體精度提高15.44%,Kappa系數(shù)提高0.184,說明旋轉(zhuǎn)森林算法在GF-2衛(wèi)星土地利用分類中有較好作用,可一定程度上提高分類精度。
[1] 王蕾, 楊武年, 任金銅, 等. GF-2衛(wèi)星影像在土地變更監(jiān)測中的適用性及潛力分析[J]. 航天返回與遙感, 2017, 38(4): 96-105. WANG Lei, YANG Wunian, REN Jintong, et al. Applicability and Potential Analysis of GF-2 Satellite Image in Land Change Monitoring[J]. Spacecraft Recovery & Remote Sensing, 2017, 38(4): 96-105. (in Chinese)
[2] 史園莉, 付卓, 姜俊, 等. 高分二號衛(wèi)星遙感影像制圖適用性分析[J]. 測繪通報, 2017(12): 86-89. SHI Yuanli, FU Zhuo, JIANG Jun, et al. Applicability Analysis of GF-2 Imagery Mapping[J]. Bulletin of Surveying and Mapping, 2017(12): 86-89. (in Chinese)
[3] 任傳帥, 黃文江, 葉回春, 等. 利用高分二號數(shù)據(jù)提取香蕉林信息及精度分析[J]. 遙感信息, 2017, 32(6): 78-84. REN Chuanshuai, HUANG Wenjiang, YE Huichun, et al. Extraction of Banana Orchards Based on GF-2 Satellite Imagery and Its Accuracy Analysis[J]. Remote Sensing Information, 2017, 32(6): 78-84. (in Chinese)
[4] 吳小娟, 肖晨超, 崔振營, 等.“高分二號”衛(wèi)星數(shù)據(jù)面向?qū)ο蟮暮0毒€提取法[J]. 航天返回與遙感, 2015, 36(4): 84-92. WU Xiaojuan, XIAO Chenchao, CUI Zhenying, et al. Coastline Extraction Based on Object-oriented Method Using GF-2 Satellite Data[J]. Spacecraft Recovery & Remote Sensing, 2015, 36(4): 84-92. (in Chinese)
[5] 王芳, 楊武年, 鄧曉宇, 等. 高分二號數(shù)據(jù)的城市生態(tài)用地分類方法探討[J]. 測繪科學, 2018, 43(3): 71-76. WANG Fang, YANG Wunian, DENG Xiaoyu, et al. Discussion on Urban Ecological Land Classification Method Based on GF-2 Data[J]. Science of Surveying and Mapping, 2018, 43(3): 71-76. (in Chinese)
[6] YIN W, YANG J. Sub-pixel vs. Super-pixel-based Greenspace Mapping Along the Urban-rural Gradient Using High Spatial Resolution Gaofen-2 Satellite Imagery: A Case Study of Haidian District, Beijing, China[J]. International Journal of Remote Sensing, 2017, 38(22): 6386-6406.
[7] WANG H, WANG C, WU H. Using GF-2 Imagery and the Conditional Random Field Model for Urban Forest Cover Mapping[J]. Remote Sensing Letters, 2016, 7(4): 378-387.
[8] ZHANG Q, HUANG X, ZHANG G. Urban Area Extraction by Regional and Line Segment Feature Fusion and Urban Morphology Analysis[J]. Remote Sensing, 2017, 9(7): 663.
[9] XIA J, DU P, HE X, et al. Hyperspectral Remote Sensing Image Classification Based on Rotation Forest[J]. IEEE Geoscience and Remote Sensing Letters, 2014, 11(1): 239-243.
[10] AKAR ?. The Rotation Forest Algorithm and Object-based Classification Method for Land Use Mapping through UAV Images[J]. Geocarto International, 2017, 33(5): 538-553.
[11] 宋明明, 都金康, 鄭文龍, 等. 秦淮河流域近30年不透水面景觀格局時空演變研究[J]. 地球信息科學學報, 2017, 19(2): 238-247. SONG Mingming, DU Jinkang, ZHENG Wenlong, et al. Quantifying the Spatial-temporal Changes of Impervious Surface Landscape Pattern from 1988 to 2015 in Qinhuai River Basin[J].Journal of Geo-information Science, 2017, 19(2): 238-247. (in Chinese)
[12] 李成蹊, 肖鵬峰, 馮學智, 等. 用高分一號衛(wèi)星數(shù)據(jù)識別多時相山區(qū)積雪[J]. 遙感信息, 2017, 32(2): 71-78. LI Chengxi, XIAO Pengfeng, FENG Xuezhi, et al. Snow Cover Extraction from Multi-temporal GF-1 Satellite Imagery in Moutain Areas[J]. Remote Sensing Information, 2017, 32(2): 71-78. (in Chinese)
[13] 全國國土資源標準化技術(shù)委員會. 土地利用現(xiàn)狀分類: GB/T 21010-2017[S]. 北京: 中國標準出版社, 2017. China Technical Committee for Land and Resources Standardization. Current Land Use Classification: GB/T 21010-2017 [S]. Beijing: China Standards Press, 2017. (in Chinese)
[14] PADWICK C, DESKEVICH M, PACIFICI F, et al. WorldView-2 Pan-sharpening[C]//Proceedings of the ASPRS 2010 Annual Conference. USA: ASPRS, 2010: 2630.
[15] LANTZ N J, WANG J. Object-based Classification of Worldview-2 Imagery for Mapping Invasive Common Reed, Phragmites Australis[J]. Canadian Journal of Remote Sensing, 2013, 39(4): 328-340.
[16] BIRTH G S, MCVEY G R. Measuring the Color of Growing Turf with a Reflectance Spectrophotometer[J]. Agronomy Journal, 1968, 60(6): 640.
[17] BENZ U C, HOFMANN P, WILLHAUCK G, et al. Multi-resolution, Object-oriented Fuzzy Analysis of Remote Sensing Data for GIS-ready Information[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2004, 58(3/4): 239-258.
[18] Trimble GmbH. eCognition Developer 9.0 Reference Book[M]. Frankfurt: Trimble Germany GmbH, 2014.
[19] 趙英時. 遙感應用分析原理與方法[M]. 2版. 北京: 科學出版社, 2013: 187-208. ZHAO Yingshi. Analysis Principles and Methods on Remote Sensing Application [M]. 2nd ed. Beijing: Science Press, 2013: 187-208. (in Chinese)
[20] GREEN A A, BERMAN M, SWITZER P, et al. A Transformation for Ordering Multispectral Data in Terms of Image Quality with Implications for Noise Removal[J]. IEEE Transactions on Geoscience and Remote Sensing, 1988, 26(1): 65-74.
[21] HYV?RINEN A. Fast and Robust Fixed-point Algorithms for Independent Component Analysis[J]. IEEE Transactions on Neural Networks, 1999, 10(3): 626-634.
[22] WITTEN I H, FRANK E, HALL M A. Data Mining: Practical Machine Learning Tools and Techniques[M]. San Francisco: Morgan Kaufmann Press, 2005.
[23] RODRIGUEZ J J, KUNCHEVA L I, ALONSO C J. Rotation Forest: A New Classifier Ensemble Method[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2006, 28(10): 1619-1630.
[24] 邵良杉, 馬寒. 基于旋轉(zhuǎn)森林的分類器集成算法研究[J]. 計算機工程與應用, 2015, 51(23): 149-154. SHAO Liangshan, MA Han. Study on Classifier Ensemble Algorithm Based on Rotation Forest[J]. Computer Engineering and Applications, 2015, 51(23): 149-154. (in Chinese)
[25] HYNDMAN R J, ATHANASOPOULOS G. Forecasting: Principles and Practice[M/OL]. 2nd ed. Melbourne: OTexts, (2018-05-08) [2018-07-03].https://otexts.org/fpp2.
GF-2 Satellite Imagery Application in Land Use Classification Based on Rotation Forest Algorithm
PENG Liheng1LIU Kai1*ZHU Yuanhui2LIU Lin2
(1 School of Geography and Planning, Sun Yat-sen University, Guangdong Key Laboratory for Urbanization and Geo- Simulation, Guangdong Provincial Engineering Research Center for Public Security and Disaster, Guangzhou, 510275, China)(2 College of Geographical Science, Guangzhou University, Center of GeoInformatics for Public Security, Guangzhou 510006, China)
GF-2 satellite imagery has detailed spatial information and is applicable to high-accuracy land use classification. In this paper, the feature space is optimized based on GF-2 satellite imagery and the Rotation Forest (RoF) algorithm is integrated to improve the land use classification accuracy. In constructing the feature space, spectral information (4 multispectral bands and 1 panchromatic band), several indices (vegetation index, water index and simple ratio), and transformed components (principal components, minimum noise fraction components, and independent components) from the pre-processed GF-2 satellite data are involved. An object-oriented land use classification is obtained by training an ensemble Decision Tree (DT) classifier based on RoF idea. The classification results are also compared with those by k-Nearest Neighbor (kNN) and DT algorithms. The results show that the overall accuracy (OA) and the Kappa coefficient of RoF classification are respectively 84.85% and 0.819 by adopting feature space with spectral, geometry and textural information. By integrating indices and transformed components in the feature space mentioned above, the OA and the Kappa coefficient can be increased by 4.90% and 0.058 respectively. Comparing with kNN classifier and original DT classifier, the OAs of the DT-based RoF classifier can be increased by 11.97% and 15.44% respectively, and the increased Kappa coefficient of agreement are 0.142 and 0.184 respectively. This research provides technical support for the information extraction from China self-developed high-resolution satellite imagery and the land use classification based on RoF algorithm.
Rotation Forest algorithm; land use classification; decision tree; GF-2 satellite; remote sensing application
TP79
A
1009-8518(2019)01-0112-11
10.3969/j.issn.1009-8518.2019.01.013
彭力恒,男,1994年生,2016年獲中國地質(zhì)大學(武漢)遙感科學與技術(shù)專業(yè)工學學士學位,現(xiàn)在中山大學地圖學與地理信息系統(tǒng)專業(yè)攻讀碩士學位。研究方向為環(huán)境遙感。E-mail: penglh6@mail2.sysu.edu.cn。
劉凱,男,1979年生,2007年獲中國科學院廣州地球化學研究所環(huán)境科學專業(yè)博士學位,副教授,碩士生導師。研究方向為環(huán)境遙感。E-mail: liuk6@mail.sysu.edu.cn。
2018-07-04
廣東省自然科學基金項目(2016A030313261, 2016A030313188);廣東省省級科技計劃項目(2017A020217003)
(編輯:王麗霞)