林 卉,邵聰穎,李海濤,顧海燕,王李娟
(1. 江蘇師范大學地理測繪與城鄉(xiāng)規(guī)劃學院,江蘇 徐州 221116; 2. 中國測繪科學研究院, 北京 100083)
高分辨率遙感影像5種面向對象分類方法對比研究
林 卉1,邵聰穎1,李海濤2,顧海燕2,王李娟1
(1. 江蘇師范大學地理測繪與城鄉(xiāng)規(guī)劃學院,江蘇 徐州 221116; 2. 中國測繪科學研究院, 北京 100083)
針對主流的面向對象分類方法在遙感影像處理中的使用范圍不明確的問題,以e-Cognition軟件平臺為基礎,處理標準數據集,綜合考慮視覺效果、總體精度和用戶精度3方面,系統(tǒng)地比較分析了主流的面向對象分類方法在高分辨率影像中的分類效果和精度分析。試驗結果表明:使用不同的分類方法均存在混分現(xiàn)象且混分對象不完全一樣。在處理同一標準數據集時,隸屬度函數分類方法的精度最高但分類速度最慢,Bayes的分類效果最差但操作簡單,支持向量機(SVM)、決策樹(DT)、隨機森林(RF)的分類速度均較快且都有較高的精度,其中SVM分類方法在區(qū)分相似性高的對象方面具有明顯優(yōu)勢。在選擇高分影像分類方法時,要充分考慮分類影像的特征選擇從而選擇合適的分類方法。
面向對象分類;SVM分類;RF分類;DT分類;Bayes分類;隸屬度函數分類
高分辨率的衛(wèi)星遙感影像在獲取地表細節(jié)、大比例尺制圖及監(jiān)測環(huán)境變化等方面具有顯著優(yōu)勢,應用前景非常廣闊。隨著高分辨率影像的普及,以及商業(yè)化的面向對象分類智能軟件的面世,面向對象分類方法越來越受到青睞,其應用也逐漸擴展到眾多領域,高分辨率遙感影像主要用于測繪制圖、國土資源管理、油氣礦業(yè)、精準農業(yè)交通及道路設施、軍事目標識別與災害評估等。國內外學者針對高分辨率遙感影像面向對象分類方法展開了一系列研究。
郭亞鴿等以HJ-1數據、Landsat數據為主并結合DEM數據,對森林植被進行分類,并對比了隸屬度函數和最大似然分類方法,結果表明,隸屬度函數在植被森林二級類信息提取的效果優(yōu)于最大似然方法[1];郭玉寶等以高分一號影像為試驗數據,使用隨機森林、支持向量機、最大似然3種方法進行了城市用地分類對比分析,綜合分析發(fā)現(xiàn),隨機森林算法表現(xiàn)更優(yōu),既能保證分類精度又能保持一定的時間效率[2];趙丹平等以多源高分辨率遙感影像為試驗數據,從分類效果、分類精度等方面對比分析支持向量機、決策樹、隨機森林3種分類方法的優(yōu)劣,大量的試驗分析表明,可綜合隨機森林對特征的優(yōu)選機制和支持向量機的高分類精度,得到新的組合分類器[3];Qian等通過處理WorldView-2影像發(fā)現(xiàn)在城市土地分類中,支持向量機和貝葉斯分類方法分類效果優(yōu)于決策樹和最近鄰分類方法[4];Duro等利用決策樹分類方法、隨機森林分類方法、支持向量機分類方法進行農業(yè)景觀分類,并進行對比分析,試驗表明決策樹和隨機森林分類方法更適合農業(yè)景觀分類[5];Song等通過土地覆蓋分類試驗發(fā)現(xiàn)人工神經網絡和支持向量機在分類準確率上無顯著差異,但通常支持向量機表現(xiàn)略好[6];Campomanes等利用支持向量機分類方法和隨機森林分類方法對紅樹林進行提取,并進行比較分析,試驗結果表明,隨機森林方法優(yōu)于支持向量機[7];Li等分析兩種非監(jiān)督分類方法(ISODATA和基于特征空間變換聚類分類方法)和13個監(jiān)督分類方法(最大似然分類方法、最近鄰分類方法、支持向量機分類方法、決策樹、隨機森林分類方法、Logistic模型樹分類方法等)發(fā)現(xiàn),大多監(jiān)督分類方法可以產生較高的分類精度,綜合各方面考慮,最大似然、隨機森林、支持向量機、Logistic模型樹分類方法的分類效果最優(yōu)[8];Chan等利用高光譜影像比較分析了隨機森林和決策樹兩種分類方法的分類結果,試驗表明,兩種方法具有同樣高的分類精度,但隨機森林的訓練速度更快、更穩(wěn)[9]。Novack等利用WorldView-2和QuickBird-2模擬影像采用支持向量機、C4.5決策樹、隨機森林和回歸樹4種方法對屋頂進行分類,并比較分析各種方法的優(yōu)劣,試驗表明,隨機森林分類方法精度最高,效果最好,支持向量機效果最差[10]。
隨著計算機技術學科的發(fā)展,面向對象的高分辨率遙感影像分類方法突破了傳統(tǒng)的依靠像元自身光譜特征進行分類的缺陷,研究方法呈現(xiàn)多樣化發(fā)展。常用的面向對象分類方法包括貝葉斯分類(Bayes)、支持向量機分類(support vector machine,SVM)、決策樹分類(decision tree,DT)、隨機森林分類(random forest,RF)、隸屬度函數分類等。雖然國內外專家學者對各類方法進行了深入的研究,并成功應用于高分辨率影像的分類,但是還未在標準數據集中比較分析主流分類方法在高分辨率影像中的分類效果和精度。本文以正射影像為主要數據,借助DSM數據,以eCognition軟件為平臺,采用標準數據集對5種面向對象分類方法的分類效果進行對比分析。
圖1是5種分類試驗的技術路線,先對正射影像和DSM進行多尺度分割,利用ESP(estimation of scale parameters)得出最優(yōu)參數[11],然后分別對5種方法進行分類,前4種方法需要對樣本進行訓練。
圖1 5種分類試驗的技術路線
采用eCognition9.0對研究區(qū)進行面向對象分類,運用多尺度分割算法對影像進行分割,為了確保影像分類的精度,利用ESP得出最優(yōu)分割參數,最佳分割尺度為100,形狀因子為0.1,緊致度因子為0.5。
利用隨機森林算法得出最優(yōu)特征[12],選取Mean_nir(近紅外波段均值)、NDVI(歸一化植被指數)、Mean_DSM(高度均值)3個特征。其中,歸一化植被指數=(Nir-Red)/(Nir+Red)。
DT、SVM、RF、Bayes 4種方法需要進行樣本訓練,根據試驗區(qū)地物類型覆蓋范圍,選取典型、有代表性的樣本。在選取的樣本中,一部分用來訓練樣本,一部分用來進行精度評價。
對試驗數據采用DT、SVM、RF、Bayes和隸屬度函數等5種方法進行影像分類,前4種方法使用同一個訓練樣本,5種方法使用同一個樣本進行精度評價。
1.4.1 Bayes分類方法
在eCogniction軟件中完成Bayes分類時,需要先根據分類體系,為每種類別選取少量具有代表性的樣本進行訓練,再根據訓練樣本影像對象進行貝葉斯分類。
1.4.2 SVM分類方法
在eCogniction軟件中完成SVM分類時,同Bayes過程一樣。訓練樣本時,綜合考慮樣本數量、模型大小和運行速度,優(yōu)先選擇線性核函數作為SVM分類器的核函數。SVM模型中懲罰系數C(對誤差的寬容度)是一個非常重要的參數。C值越大表明越不能容忍出現(xiàn)誤差,更易出現(xiàn)過擬合線性;相反,C越小,容易欠擬合。C過大或過小,泛化能力都會變差。經過多次試驗后,本文的懲罰系數C為2。
1.4.3 DT分類方法
在eCogniction軟件中完成DT分類時,同Bayes過程一樣,采用的是CART算法。經過多次試驗,每個節(jié)點需要的最小樣本數為5,進行交叉驗證數為3。
1.4.4 RF分類方法
在eCogniction軟件中完成RF分類時,同Bayes過程一樣。經過多次試驗,單棵樹的最大深度為3,每個節(jié)點需要的最小樣本數為3,森林中樹的數目上限50,森林訓練的OOB誤差為0.01。
1.4.5 隸屬度函數分類方法
雖然隸屬度函數分類不需要提前選擇樣本,但仍需要多次試驗獲取各個地物分類的最佳閾值,因此,確定地物類別的閾值范圍及隸屬度函數決定了隸屬度函數分類的效果。在此分類過程中,使用eCognition軟件平臺,先大致確定某一地物的閾值范圍,再經過多次調試,獲取較為準確的閾值。對于隸屬度函數的選擇也是結合各個地物光譜特征,盡量選擇能夠準確描述該類別地物變化曲線的隸屬度函數。通過多次試驗,通過對各類進行定量描述,使用隸屬度函數分類方法可提取分類系統(tǒng)中的各類土地利用類型,各地類類描述見表1。
表1 各地類類描述
試驗區(qū)為波茨坦城區(qū),試驗數據為ISPRS提供的標準數據集(正射影像與DSM),分辨率均為5 cm[13]。參與分類的波段為藍、綠、紅、近紅外1。從可解譯性出發(fā),結合試驗區(qū)的特點,劃分試驗區(qū)用土地類型:建筑區(qū)、水體、樹、低植被和不透水面5類,原始影像以假彩色顯示(如圖2所示)[14]。
圖2 分辨率5 cm的波茨坦城區(qū)
5種分類方法分類效果如圖3所示,精度評價見表2。
表2 5種分類方法的精度評價
圖3 5種分類方法的結果
圖3給出了5種方法在波茨坦城區(qū)的分類結果。從圖3的視覺效果上看,5種方法都得到了很好的分類效果。隸屬度和RF分類效果最好,其次是DT和SVM,分類效果最差的是Bayes。Bayes方法存在明顯的水體、建筑物和不透水面混分現(xiàn)象;SVM方法存在明顯的低植被、樹和不透水面混分現(xiàn)象;DT方法存在水體、建筑物混分現(xiàn)象;RF方法存在水體、建筑物和不透水面混分現(xiàn)象;隸屬度函數方法存在低植被和樹混分現(xiàn)象。
表2給出了5種分類方法的精度評價結果。從表2的總體精度來看,5種方法都得到比較滿意的總體分類精度,總體精度的大小是:隸屬度函數>RF>DT>SVM>Bayes,分別為:98.19%、96.99%、93.96%、93.37%、90.36%。從表2的用戶精度看,隸屬度函數和RF方法的5類地物的精度總體上高于其他4種方法,而Bayes方法的建筑物和樹的精度低于其他4種方法,DT方法的樹和水體的精度都偏低,SVM方法的低植被精度最低。
針對5種分類方法得到的結果圖詳細分析如下:
從圖3(a)和表2可以看出有少部分的建筑區(qū)被錯分成了水體,樹的提取效果最好,但也導致大片的低植被錯分成樹。DT分類過程具有很強的可理解性,在理論上也能較好地解釋各個類別之間的特征與差別,特別適合大數據量的遙感影像處理。DT分類方法在實際生產中應用更為廣泛,對地類空間分布要求不高,但要求各類別之間特征明顯。
從圖3(b)和表2可以看出,SVM分類方法的分類精度與DT相近,相比DT、SVM的分類速度更快,并且SVM對樹和低植被區(qū)分效果優(yōu)于DT,樹和低植被具有較高的相似性,SVM對相似性較高的地類分類效果更好,但SVM方法的核函數和分類參數(包括懲罰系數C,核函數參數)的選擇沒有特別好的辦法,不容易找到最優(yōu)的核函數和分類參數。
從圖3(c)和表2可以看出,RF分類方法既有較好的分類精度,又有較快的分類速度,但決策樹的個數影響RF方法分類效果和速度。為保證既有較快的分類速度又能滿足精度需求,應選擇合適的生成樹個數。RF方法適合大數據量、多特征參數的高分影像的實際生產應用。
從圖3(d)和表2可以看出,在分類過程中Bayes分類方法易于操作,而且能取得較好精度,分類速度較快。Bayes方法在水體、樹和低植被的邊界分類效果不好,其適用于地物類別之間特征明顯,各地物類別空間分布均勻的區(qū)域,不適用于各個地類之間特征不明顯或有交叉的情況,或是各個地類在整幅影像中分布不均勻的區(qū)域。
從圖3(e)和表2可以看出,隸屬度函數分類方法對影像分類結果最為準確,體現(xiàn)了隸屬度函數分類方法的優(yōu)越性,但隸屬度函數分類方法對操作人員的技術要求較高,分類過程中工作量較大,尤其是閾值的確定需要經過大量試驗,其分類精度與用戶設定閾值直接相關。因此,隸屬度函數適用于地形復雜,地物類別之間特征有交叉的情況,其分類結果較為精確,但實際生產中由于需要大量的試驗和經驗,數據適用性不高。
5種分類方法在高分辨率遙感影像中都得到了相對較好的分類效果。從試驗結果可以看出,這5種方法均存在一定程度上的混分現(xiàn)象,不同方法的混分對象不一樣。綜合考慮視覺效果、總體精度和用戶精度,隸屬度函數的分類效果最好,但分類速度最慢,極大依賴于大量的試驗和經驗數據;Bayes的分類效果最差,但操作簡單、分類速度快;其余3種方法分類效果和分類速度類似,其中SVM分類方法能夠較好地區(qū)分相似性高的對象,如低植被和樹木。綜上所述,這5種方法在不同的情況下可以發(fā)揮各自的分類優(yōu)勢,應當根據實際情況選擇不同的分類方法。
[1] 郭亞鴿, 于信芳, 江東, 等. 面向對象的森林植被圖像識別分類方法[J]. 地球信息科學學報, 2012, 14(4): 514-522.
[2] 郭玉寶, 池天河, 彭玲, 等. 利用隨機森林的高分一號遙感數據進行城市用地分類[J]. 測繪通報, 2016 (5): 73-76.
[3] 趙丹平, 顧海燕, 賈瑩. 機器學習法在面向對象影像分類中的對比分析[J]. 測繪科學, 2016, 41(10): 181-186.
[4] QIAN Y, ZHOU W, YAN J, et al. Comparing Machine Learning Classifiers for Object-based Land Cover Classification Using very High Resolution Imagery[J]. Remote Sensing, 2014, 7(1): 153-168.
[5] DURO D C, FRANKLIN S E, DUBé M G. A Comparison of Pixel-based and Object-based Image Analysis with Selected Machine Learning Algorithms for the Classification of Agricultural Landscapes Using SPOT-5 HRG Imagery[J]. Remote Sensing of Environment, 2012, 118(6): 259-272.
[6] SONG X, DUAN Z, JIANG X. Comparison of Artificial Neural Networks and Support Vector Machine Classifiers for Land Cover Classification in Northern China Using a SPOT-5 HRG Image[J]. International Journal of Remote Sensing, 2012, 33(10): 3301-3320.
[7] CAMPOMANES F, PADA A V, SILAPAN J. Mangrove Classification Using Support Vector Machines and Random Forest Algorithm: a Comparative Study [R]. Enschede: University of Twente, 2016.
[8] LI C, WANG J, WANG L, et al. Comparison of Classifica-tion Algorithms and Training Sample Sizes in Urban Land Classification with Landsat Thematic Mapper Imagery[J]. Remote Sensing, 2014, 6(2): 964-983.
[9] CHAN J C W, PAELINCKX D. Evaluation of Random Forest and Adaboost Tree-based Ensemble Classification and Spectral Band Selection for Ecotope Mapping Using Airborne Hyperspectral Imagery[J]. Remote Sensing of Environment, 2008, 112(6): 2999-3011.
[10] NOVACK T, ESCH T, KUX H, et al. Machine Learning Comparison between WorldView-2 and QuickBird-2-simulated Imagery Regarding Object-based Urban Land Cover Classification[J]. Remote Sensing, 2011, 3(10): 2263-2282.
[12] 顧海燕, 閆利, 李海濤, 等. 基于隨機森林的地理要素面向對象自動解譯方法[J]. 武漢大學學報(信息科學版), 2016, 41(2): 228-234.
[13] ISPRS.2D Semantic Labeling Contest-Potsdam[DB/OL]. (2001-12-19)[2016-09-15]. http:∥www2.isprs.org/commissions/comm3/wg4/2d-sem-label-potsdam.html.
[14] 張繼賢, 魏鉅杰, 趙爭,等. 基于多方向多源合成孔徑雷達數據融合的假彩色正射影像制作[J]. 測繪學報, 2011, 40(3):276-282.
FiveObject-orientedClassificationMethodsAnalysisBasedonHigh-resolutionRemoteSensingImage
LIN Hui1,SHAO Congying1,LI Haitao2,GU Haiyan2,WANG Lijuan1
(1. School of Planning,Geomatics and Geography of Jiangsu Normal University, Xuzhou 221116, China; 2. Chinese Academy of Surveying and Mapping, Beijing 100083, China)
In view of the mainstream object-based classification method in remote sensing image processing using range is not clear, based on e-Cognition software, the standard data set is processed. Comprehensively considering the visual effects, overall accuracy and user accuracy, classification results and precision analysis of mainstream object-based classification are systematic analysis in the high resolution image. The experimental results show that there are mixed phenomena using different classification methods and the mixed objects are not exactly the same. In dealing with the same standard data set, the membership function has the highest accuracy but the slowest speed. The classification effect of Bayes is the worst, but the operation is simple. The classification speed of SVM, RF, DT are faster and have higher accuracy. Meanwhile SVM has obvious advantages in distinguishing objects with high similarity. In the selection of high resolution image classification method, we should fully consider the feature selection of classified images to select the appropriate classification method.
object-based classification;SVM classification;RF classification;DT classification;Bayes classification;membership function classification
林卉,邵聰穎,李海濤,等.高分辨率遙感影像5種面向對象分類方法對比研究[J].測繪通報,2017(11):17-21.
10.13474/j.cnki.11-2246.2017.0340.
P237
A
0494-0911(2017)11-0017-05
2017-04-13;
2017-05-05
國家自然科學青年基金(41401397);江蘇省自然基金青年項目(BK20140237)
林 卉(1973—),男,碩士,副教授,主要從事遙感圖像處理工作。E-mail:linhuixznu@126.com