舒陽,李少丹,李京,2,唐宏,2,史曉霞,杜紅悅
(1.北京師范大學(xué)地表過程與資源生態(tài)國家重點實驗室,北京100875;2.北京師范大學(xué)環(huán)境演變與自然災(zāi)害教育部重點實驗室,北京100875;3.北京物資學(xué)院物流學(xué)院,北京100025;4.中華測繪技術(shù)服務(wù)公司,北京100088)
結(jié)合空間像素模板和多類AdaBoost的高分影像分類
舒陽1,李少丹1,李京1,2,唐宏1,2,史曉霞3,杜紅悅4
(1.北京師范大學(xué)地表過程與資源生態(tài)國家重點實驗室,北京100875;2.北京師范大學(xué)環(huán)境演變與自然災(zāi)害教育部重點實驗室,北京100875;3.北京物資學(xué)院物流學(xué)院,北京100025;4.中華測繪技術(shù)服務(wù)公司,北京100088)
高分辨率遙感影像分類是遙感圖像理解的基本問題之一,也是許多其他遙感應(yīng)用的前提。為解決目前基于像素分類方法空間關(guān)系描述不足的問題,該文利用空間像素模板構(gòu)建像素間的空間關(guān)系,并結(jié)合多類AdaBoost算法實現(xiàn)高分辨率遙感影像的分類。首先利用過濾式特征選擇方法自動生成空間像素模板,進(jìn)而構(gòu)建考慮空間關(guān)系的多維特征向量,最后利用基于指數(shù)損失函數(shù)的多類AdaBoost方法對多維特征進(jìn)行分類。對不同場景影像開展實驗,結(jié)果表明,該文方法利用空間像素模板引入空間信息,可有效實現(xiàn)高分辨率遙感影像分類。與其他方法相比,分類精度顯著提高(約20%),能夠更好地區(qū)分光譜相似地物,同時分類結(jié)果“椒鹽效應(yīng)”大大降低,具有良好的空間一致性。
多類AdaBoost;空間像素模板;空間信息;高分辨率遙感影像;分類
隨著國內(nèi)外高分辨率遙感衛(wèi)星的相繼發(fā)射以及航空影像獲取能力的提高,高分辨率遙感影像逐漸成為對地觀測和空間信息獲取的重要手段之一[1-2]。高分辨率遙感影像及其成果已廣泛應(yīng)用于測繪[3]、國土調(diào)查[4]、環(huán)境評價[5]和災(zāi)害監(jiān)測[6]等領(lǐng)域。
高分辨率遙感影像分類是遙感圖像理解的基本問題之一,也是許多其他遙感應(yīng)用的前提。與中低分辨率影像相比,高分辨率遙感影像能提供大量豐富的空間細(xì)節(jié),地物表現(xiàn)力大大增強。然而當(dāng)傳統(tǒng)基于像素的分類方法用于高分辨率影像分類時,分類結(jié)果表現(xiàn)為類內(nèi)差異變大,類間差異變小,“椒鹽效應(yīng)”嚴(yán)重。大量研究表明,充分利用高分辨影像的空間信息可以有效提高影像分類精度。面向?qū)ο蠓诸愂悄壳白畛S玫母叻钟跋穹治龇椒?,該類方法一般包括兩個步驟:首先對影像進(jìn)行分割以形成均質(zhì)的區(qū)域,即“對象”;然后利用分類算法進(jìn)行分類。其分析基元為均質(zhì)的“對象”,可充分利用幾何、紋理等多種空間關(guān)系[7-8],提高了分類精度。此類方法嚴(yán)重依賴分割結(jié)果,而如何形成語義分割對象仍未解決,需要大量的人工交互式干預(yù)[9],這限制了該類方法的應(yīng)用。另一類方法利用鄰域像素的信息輔助對中心像素的分類。此類算法以單個像素為分析基元,充分考慮臨近像素的空間上下文信息從而獲得好的分類結(jié)果。目前對基于鄰域空間關(guān)系的建模進(jìn)行了大量研究。馬爾科夫隨機場(MRF)模型通過定義合適的鄰域系統(tǒng)對圖像進(jìn)行概率建模,可以充分利用像元間的相互關(guān)系進(jìn)行分類[10]。數(shù)學(xué)形態(tài)學(xué)的方法通過開閉運算提取像元鄰域的空間信息[11]。目前利用空間鄰域信息進(jìn)行高分辨率遙感影像分類的技術(shù)已經(jīng)在商業(yè)軟件Feature Analyst中得到成功運用[12]。而如何確定最佳鄰域特征成為該類方法的關(guān)鍵問題。
影響遙感影像分類結(jié)果的另一個重要因素是分類器的選擇。許多機器學(xué)習(xí)領(lǐng)域的算法被用于高分辨率遙感影像分類,如支持向量機(SVM)、AdaBoost等[13-14]。其中AdaBoost算法由Freund于1995年在Boosting算法的基礎(chǔ)上改進(jìn)而來,其主要特點是將多個弱分類器利用投票方式組合成一個強分類器,從而得到精度較高的分類結(jié)果[15]。AdaBoost算法最初是解決兩類分類問題,對于多類問題通常轉(zhuǎn)化為多組兩類問題進(jìn)行處理,這限制了其應(yīng)用。Zhu提出的基于最小化指數(shù)損失函數(shù)的多類AdaBoost(multi-class AdaBoost,mc-AdaBoost)可直接處理多類問題[16],具有更好的普適性。
基于以上分析,本文提出綜合利用空間像素模板和mc-AdaBoost算法對高分辨率遙感影像進(jìn)行分類的方法,其算法流程如圖1所示。首先利用特征選擇的方法自動生成度量空間鄰域模式的空間像素模板,進(jìn)而構(gòu)建具有空間信息的多維特征,最后利用mc-AdaBoost算法直接對像素的多維特征進(jìn)行分類。
圖1 算法流程
本文算法的關(guān)鍵是空間像素模板的選擇??臻g像素模板定義為一個矩形窗口,用于表征像素間空間相關(guān)關(guān)系特征的鄰域模式。窗口內(nèi)任意一簇像素組合都是空間鄰域特征的一類模式,如圖2(a)所示為5×5的窗口的一種空間像素模板,藍(lán)色部分代表被選擇的鄰域像素。
圖2 空間像素模板和特征向量構(gòu)建
空間像素模板通過選定的周圍像素來引入空間關(guān)系,而如何選擇周圍像素成為問題的關(guān)鍵。慎利等[17]在文章中提出基于過濾式特征選擇的空間像素模板生成方法,并將其應(yīng)用于高分辨率遙感影像河流提取。該方法通過定義相關(guān)性函數(shù),其充分考慮像素間的空間關(guān)系,進(jìn)而構(gòu)建有效的鄰域模式,為本文選擇的方法。
本文選擇采用多類AdaBoost對融入空間信息的高維特征向量進(jìn)行分類。AdaBoost算法是在Boosting算法的基礎(chǔ)上改進(jìn)而來,是組合分類器的典型代表,最初應(yīng)用于人臉識別[15]。該算法自從提出以來受到人們的廣泛關(guān)注,目前已廣泛應(yīng)用于手寫識別[18]、故障診斷[19]、圖像分類[20-21]等領(lǐng)域。其基本思想是將若干弱分類器通過投票方式組合形成強分類器,從而得到具有很高精度的分類結(jié)果。研究表明,這種組合分類器的方法比采用單一分類器可以得到更高的分類精度[22]。AdaBoost算法最初只能用于解決兩類問題,為了解決多類問題研究人員提出了AdaBoost.M1,AdaBoost.M2,AdaBoost.MH等一系列改進(jìn)算法。這些改進(jìn)一般是將多類問題分解為多個兩類問題,僅適合處理類別數(shù)較少的情況,且具有過程復(fù)雜,計算量大的缺點。其中研究表明,AdaBoost.MH算法是現(xiàn)有多類算法中精度較高的,因此本文選擇其作為新算法的比較對象。本文引用Zhu[19]提出的基于最小化指數(shù)損失函數(shù)的mc-AdaBoost,可直接對空間像素模板構(gòu)建的高維特征向量進(jìn)行分類。
2.1 實驗數(shù)據(jù)
為驗證本文方法在不同場景下的有效性,選用兩幅不同場景的高分辨率遙感影像,即一幅北京密云郊區(qū)Pleiades 1A衛(wèi)星多光譜影像(1000像素× 1000像素,4個波段,分辨率2m,如圖3(a)所示)和一幅意大利佩斯卡拉城區(qū)QuickBird衛(wèi)星多光譜融合影像(1000像素×1000像素,3個波段,分辨率0.6m,如圖4(a)所示)作為實驗數(shù)據(jù)。
通過對兩幅影像進(jìn)行分析,Pleiades 1A多光譜數(shù)據(jù)為郊區(qū)高分辨率影像,主要包括:河流、道路、建筑、植被和裸地等地物類型。QuickBird多光譜數(shù)據(jù)為典型的城市高分辨率影像,其主要地物包括:樹木、草地、建筑、道路和陰影。由于該影像分辨率較高,陰影比較明顯,因此將其作為單獨一種類型進(jìn)行分類。
2.2 實驗設(shè)計
為了驗證本文方法的正確性與有效性,本文將其與現(xiàn)有的已經(jīng)證明比較有效的分類方法進(jìn)行比較,即AdaBoost.MH和支持向量機(SVM)算法。每幅影像的所有方法采用相同的訓(xùn)練樣本(圖3(b)與圖4(b)所示)。分類與回歸樹(CART)是一種簡單有效的分類方法。本文方法和AdaBoost.MH方法均采用CART作為弱分類器,弱分類器個數(shù)設(shè)置為300,最大迭代次數(shù)均為300,其中CART方法選擇最小誤分率作為分支度量指標(biāo)。SVM分類方法選擇徑向基函數(shù)(RBF)作為其核函數(shù),懲罰因子設(shè)為100。
2.3 結(jié)果分析
(1)郊區(qū)場景結(jié)果分析
本實驗將該遙感影像分為河流、道路、建筑、植被和裸地5類,其中建筑與道路、裸地在光譜值上存在一定的重疊,容易發(fā)生混淆。根據(jù)圖1所示的流程圖,利用前文介紹的過濾式特征選擇方法自動生成空間像素模板(圖3(c)),進(jìn)而形成考慮鄰域像素信息的高維特征向量,然后選擇一定數(shù)量的訓(xùn)練樣本(圖3(b)),最后利用樣本訓(xùn)練得到的 mc-AdaBoost進(jìn)行分類。由于影像中主要地物基本呈現(xiàn)條形分布(河流、道路等),因此獲得的空間像素模板亦為長條結(jié)構(gòu)。各種方法分類結(jié)果分別如圖3(d)~圖3(f)所示。
從視覺角度分析,由于AdaBoost.MH和SVM方法采用單像素作為分析基元,其分類結(jié)果斑塊比較破碎,存在嚴(yán)重的“椒鹽效應(yīng)”。相反地,本文方法利用空間像素模板獲取不同地物的依存關(guān)系,將像素間的空間相關(guān)性引入分類過程中,利用鄰近像素的類別輔助判定中心像素的類別,因而分類結(jié)果具有很高的空間一致性。此外,通過比較發(fā)現(xiàn)本文的方法能夠很好地區(qū)分建筑、道路和裸地,特別是較小的道路也得到了很好的區(qū)分;AdaBoost.MH方法中道路分類效果較好,而建筑和裸地發(fā)生了混淆;SVM方法中建筑、道路與裸地均發(fā)生了嚴(yán)重的混淆。這主要是由于三類地物光譜有重疊,SVM無法找到較好的支撐向量進(jìn)行區(qū)分。而本文方法由于考慮鄰域像元的信息,在高維特征上三類地物區(qū)分明顯,因此可以獲得較好的分類結(jié)果。
為了對分類結(jié)果進(jìn)行定量評價,本文在原始影像上隨機選取1172個樣本點,對其進(jìn)行類別標(biāo)識后與分類結(jié)果比較分析,從而得到定量的精度評價。本文方法與其他方法的精度評價如表1所示,總體精度與Kappa系數(shù)的比較見表3。
從表1可以看出,總體上各類方法對水體和植被兩類地物分類效果均較好,本文方法較其他兩種方法精度略高。本文方法在道路和建筑兩類地物分類精度大大高于其他兩種方法,而由于兩類地物光譜重疊,AdaBoost.MH和SVM方法均將部分建筑誤分為道路,導(dǎo)致分類精度降低。3種方法對裸地分類精度均不高,但較之其他兩種方法,本文方法對裸地分類精度仍顯著較高(約10%)。此外,針對各類地物3種方法分類精度由高到低依次為本文方法、AdaBoost.MH方法和SVM方法。說明本文方法對各類地物均能得到較好的區(qū)分,獲得比較高的分類精度。從總體上看(如表3所示),本文方法總體精度達(dá)到88.99%,Kappa系數(shù)為0.8586,顯著高于其他兩種方法,精度提高約23%,表明本文方法優(yōu)于其他方法。同時需要指出的是AdaBoost.MH方法比SVM方法具有更高的分類精度,這是由于該類方法通過將弱分類器加權(quán)集成為強分類器,使其能夠區(qū)分較為相似的樣本,提高了分類器的泛化能力。
(2)城區(qū)場景結(jié)果分析
該遙感影像是典型的城區(qū)影像,其中樹木和草地在光譜上有重疊,容易發(fā)生混淆。同時屋頂類型多樣,光譜較為復(fù)雜,容易與其他地物產(chǎn)生混淆。如圖4(b)所示,選擇一定數(shù)量的訓(xùn)練樣本用于分類器學(xué)習(xí)。根據(jù)特征選擇的方法生成空間像素模板,如圖4(c)所示,由于影像內(nèi)地物以建筑為主,空間像素模板呈現(xiàn)方形結(jié)構(gòu)。各種方法分類結(jié)果分別如圖4(d)~圖4(f)所示。
從視覺上看,本文方法與其他兩種方法相比具有更好的空間一致性。同時,對建筑與道路進(jìn)行了更好的區(qū)分,而其他方法均有許多建筑被誤分為道路的情況。這是主要是由于本文方法通過空間像素模板利用鄰域像素信息輔助分類,而陰影一般伴隨建筑出現(xiàn),因此本文方法中陰影的信息提高建筑的識別精度。同理,本文方法能夠?qū)淠竞筒莸剡M(jìn)行有效識別。
通過對隨機選擇1728個樣本點進(jìn)行類別標(biāo)注,并與分類結(jié)果比較分析獲得定量的精度評價。從表2中可以看出,本文方法對各類地物的識別精度均高于其他兩種方法。本文方法對草地和樹木兩類光譜相似地物的分類精度高于其他兩種方法。AdaBoost.MH和SVM方法將草地誤分為樹木,導(dǎo)致精度降低,尤其是SVM方法的草地分類精度極低;本文方法由于考慮陰影信息對樹木的輔助分類,因此能對草地和樹木進(jìn)行有效區(qū)分。同理,本文方法對建筑和道路的分類精度也較高,而其他兩種方法將建筑與道路產(chǎn)生混淆。本文方法中陰影的分類精度也高于其他方法。針對以上各類地物,3種方法的分類精度由高到低依次為本文方法、AdaBoost.MH方法和SVM方法。總體上(如表4所示),本文方法在總體精度和Kappa系數(shù)上均優(yōu)于其他方法,精度提高約24%,充分表明其能有效地實現(xiàn)對高分辨率遙感影像的分類。
圖3 原始Pleiades 1A影像、訓(xùn)練樣本與不同方法影像分類結(jié)果
表1 Pleiades 1A影像不同方法精度評價
圖4 原始QuickBird影像、訓(xùn)練樣本與不同方法影像分類結(jié)果
表2 QuickBird影像不同方法精度評價
表3 Pleiades 1A影像不同方法總體精度和Kappa系數(shù)
表4 QuickBird影像不同方法總體精度和Kappa系數(shù)
在高分辨率遙感影像分類中,如何利用影像的空間信息以及合適的分類器成為獲得良好分類結(jié)果的關(guān)鍵。本文針對該問題,提出一種利用空間像素模板和基于最小化指數(shù)損失函數(shù) mc-AdaBoost方法用于高分辨率遙感影像分類。為利用空間關(guān)系進(jìn)行高分辨率遙感影像分類,該方法通過過濾式特征選擇的方法確定最佳的空間鄰域范圍,繼而形成融入鄰域空間關(guān)系的高維特征向量,最后利用mc-AdaBoost集成學(xué)習(xí)算法實現(xiàn)影像分類。本文選擇CART做為弱分類器,在不同場景的高分辨率遙感影像上開展實驗。實驗結(jié)果表明,本文方法利用空間鄰域信息可有效實現(xiàn)高分辨率遙感影像分類,與其他基于像素的方法相比大大提高了分類精度(約20%),能夠更好地區(qū)分光譜相似地物。同時分類結(jié)果“椒鹽效應(yīng)”大大降低,具有良好的空間一致性。
[1] 李德仁.論21世紀(jì)遙感與GIS的發(fā)展[J].武漢大學(xué)學(xué)報(信息科學(xué)版),2003,28(2):127-131.
[2] 李德仁,童慶禧,李榮興,等.高分辨率對地觀測的若干前沿科學(xué)問題[J].中國科學(xué):地球科學(xué),2012,42(6):805-813.
[3] 張永生,劉軍.高分辨率遙感衛(wèi)星立體影像RPC模型定位的算法及其優(yōu)化[J].測繪工程,2004,13(1):1-4.
[4] 朱曉華,丁晶晶,劉彥隨,等.村域尺度土地利用現(xiàn)狀分類體系的構(gòu)建與應(yīng)用[J].地理研究,2006,29(5):883-890.
[5] 程承旗,李啟青,沙志友,等.城市居住單元環(huán)境質(zhì)量的高分辨率遙感評價方法研究[J].地球科學(xué)進(jìn)展,2006,21(1):24-30.
[6] 胡德勇,李京,趙文吉,等.基于對象的高分辨率遙感圖像滑坡檢測方法[J].自然災(zāi)害學(xué)報,2009,17(6):42-46.
[7] STUMPF A,LACHICHE N,MALET J,et.al.Active learning in the spatial domain for remote sensing image classification[J].IEEE Transactions on Geoscience and Remote Sensing,2014,52(5):2492-2507.
[8] ZHANG P,LV Z,SHI W.Object-based spatial feature for classification of very high resolution remote sensing images[J].IEEE Transactions on Geoscience and Remote Sensing Letter,2013,10(6):1572-1576.
[9] DOS S J,GOSSELIN P,PHILIPP-FOLIGUET S et.al.Interactive multiscale classification of high-resolution remote sensing images[J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,2013,6(4):2020-2034.
[10] TSO B,OLSEN R C.A contextual classification scheme based on MRF model with improved parameter estimation and multiscale fuzzy line process[J].Remote Sensing of Environment,2005,97(1):127-136.
[11] PESARESI M,BENEDIKTSSON J A.A new approach for the morphological segmentation of high-resolution satellite imagery[J].IEEE Transactions on Geoscience and Remote Sensing,2001,39(2):309-320.
[12] 牛春盈,江萬壽,黃先鋒,等.面向?qū)ο笥跋裥畔⑻崛≤浖﨔eature Analyst和eCognition的分析與比較[J].遙感信息,2007,22(2):66-70.
[13] MOUSTAKIDIS S,MALLINIS G,KOUTSIAS N,et al.SVM-based fuzzy decision trees for classification of high spatial resolution remote sensing images[J].IEEE Transactions on Geoscience and Remote Sensing,2012,50(1):149-169.
[14] 龔健雅,姚璜,沈欣.利用AdaBoost算法進(jìn)行高分辨率影像的面向?qū)ο蠓诸悾跩].武漢大學(xué)學(xué)報(信息科學(xué)版),2010,35(12):1440-1443.
[15] FREUND Y.Boosting a weak learning algorithm by majority[J].Information and Computation,1995,121(2):256-285.
[16] ZHU J,ZOU H,ROSSET S,et al.Multi-class AdaBoost[J].Statistics and Its Interface,2009,2(3):349-360.
[17] 慎利,唐宏,王世東,等.結(jié)合空間像素模板和Adaboost算法的高分辨率遙感影像河流提取[J].測繪學(xué)報,2013,42(3):344-350.
[18] 丁曉青,付強.一種適用于超多類手寫漢字識別的新改型Adaboost算法[J].中國工程科學(xué),2009,11(10):19-24.
[19] 李勝,張培林,佟若雄.基于多類AdaBoost的故障診斷算法[J].電子測量技術(shù),2011,34(8):101-105.
[20] 周紅英,藺啟忠,吳昀昭,等.基于AdaBoost的組合分類器在遙感影像分類中的應(yīng)用[J].計算機應(yīng)用研究,2007,24(10):181-184.
[21] 許凱,秦昆,杜鶿.基于AdaBoost的高分辨率遙感影像城市綠地提取算法[J].計算機工程與應(yīng)用,2009,44(20):63-25.
[22] BIGDELI B,SAMADZADEGAN F,REINARTZ P.A multiple SVM system for classification of hyperspectral remote sensing data[J].Journal of the Indian Society of Remote Sensing,2013,41(4):763-776.
Classification of High Resolution Remote Sensing Image by Combining Spatially Correlated Pixels Template and Multi-class AdaBoost
SHU Yang1,LI Shao-dan1,LI Jing1,2,TANG Hong1,2,SHI Xiao-xia3,DU Hong-yue4
(1.State Key Laboratory of Earth Surface Processes and Resource Ecology,Beijing Normal University,Beijing100875;2.Key Laboratory of Environmental Change and Natural Disaster,Ministry of Education,Beijing Normal University,Beijing100875;3.Logistics School,Beijing Wuzi University,Beijing100025;4.China Mapping Technology Service Corporation,Beijing100088)
The classification of high resolution remote sensing image is one of the basic problems in remote sensing image understanding.In order to solve the problem of the classification of remote sensing image based on pixel,a method is proposed in this paper by combining the spatially correlated pixels template with multi-class AdaBoost to obtain the classification of high resolution remote sensing image.Firstly,a specific form of spatially correlated pixels is generated by using the feature selection based on filter.Then,the feature vectors are formed using the spatially correlated pixels template,which contain the spatial information.Finally,a multi-class AdaBoost algorithm based on the exponential loss function is used to classify these feature vectors.Experimental results show that the proposed method is used to classify the high resolution remote sensing images effectively,which builds the spatial information with the spatial pixel template.Compared with other methods,the accuracy of classification results of the proposed method is higher(about 20%).Meanwhile,the result of proposed method has better spatial consistency with lower effect of pepper and salt.The confusing geo-objects which have similar spectral characteristics can be distinguished well by the proposed method.
multi-class AdaBoost;spatially correlated pixels template;spatial information;high resolution remote sensing image;classification
10.3969/j.issn.1000-3177.2015.04.020
TP751
A
1000-3177(2015)140-0115-06
2014-06-05
2014-11-26
國家高技術(shù)研究發(fā)展計劃課題(2012AA121302);國家科技支撐計劃課題(2012BAH27B01、2012BAH27B03)。
舒陽(1987—),男,博士研究生,主要研究方向為遙感圖像處理與模式識別。
E-mail:sysun@m(xù)ail.bnu.edu.cn