邵振峰,張 源,周偉琪,宋 楊
(1.武漢大學(xué) 測繪遙感信息工程國家重點實驗室,湖北 武漢 430079;2.測繪遙感信息工程國家重點實驗室 深圳研發(fā)中心,廣東 深圳 518057;3.武漢大學(xué) 資源與環(huán)境科學(xué)學(xué)院,湖北 武漢 430079;4.廣州市城市規(guī)劃勘測設(shè)計研究院,廣東 廣州510060)
基于測繪衛(wèi)星影像的城市不透水面提取
邵振峰1,2,張 源1,周偉琪3,宋 楊4
(1.武漢大學(xué) 測繪遙感信息工程國家重點實驗室,湖北 武漢 430079;2.測繪遙感信息工程國家重點實驗室 深圳研發(fā)中心,廣東 深圳 518057;3.武漢大學(xué) 資源與環(huán)境科學(xué)學(xué)院,湖北 武漢 430079;4.廣州市城市規(guī)劃勘測設(shè)計研究院,廣東 廣州510060)
針對城市大尺度的不透水面提取需求,以高分辨率遙感影像為數(shù)據(jù)源,基于隨機森林模型,對光譜和紋理特征進(jìn)行重要性分析,選出最優(yōu)參數(shù),實現(xiàn)高精度城市不透水面提取。選取武漢市作為實驗區(qū),以資源3號衛(wèi)星遙感影像為數(shù)據(jù)源,不透水面提取的總體精度為0.97,所提取的高精度不透水面可為海綿城市的規(guī)劃和建設(shè)提供有效的專題數(shù)據(jù)。
不透水面;隨機森林;高分辨率遙感;海綿城市
不透水面通常是指水不能滲透的任何物質(zhì),且基本上是通過交通和建筑物的建設(shè)與人類活動和居住密切相關(guān)的[1]。不透水面迅速增加是快速城市化最顯著的特征之一。近年來,在城市化進(jìn)程的快速發(fā)展下,地物分布信息變化頻繁,郊區(qū)透水性較好的土地類型也向透水性差的城市化用地轉(zhuǎn)變,導(dǎo)致以植被覆蓋區(qū)為主要組成部分的自然景觀被人工構(gòu)建物替代,老城區(qū)的工業(yè)用地和低密度居住用地被開發(fā)為高密度居住用地和商業(yè)用地;由此引起了諸如城市熱島效應(yīng)、非點源污染、大氣污染、生物多樣性降低等一系列生態(tài)、環(huán)境和氣候問題。不透水面作為評估城市生態(tài)環(huán)境的主要因素和城市人民生活水平的一個重要指標(biāo),被廣泛應(yīng)用于城市土地利用分類、城市人口密度評估、城市規(guī)劃、城市環(huán)境評估、熱島效應(yīng)分析以及水文過程模擬等研究中。
20世紀(jì)70年代以來,通過遙感影像提取不透水面已受到廣泛關(guān)注。早期不透水面提取主要依靠地面測量和手工數(shù)字化方法。該方法雖然精度高,但存在自動化水平低、費時費力、所得數(shù)據(jù)范圍較小等缺點,限制了其應(yīng)用范圍。相比之下,遙感影像因識別信息的波段范圍廣、監(jiān)測不受地理位置及環(huán)境的限制、具有開闊的視野和瞬態(tài)成像的功能、成本低等優(yōu)勢越來越被各領(lǐng)域關(guān)注。以往對不透水面的估計和制圖的研究多是基于Landsat TM/ETM+等中空間分辨率影像[2-3],然而中空間分辨率影像難以滿足城市規(guī)劃管理和制圖需求。高分辨率遙感影像所提供的細(xì)節(jié)信息更有利于城市管理分析。因此如何從高分辨率遙感影像中快速準(zhǔn)確地提取不透水面信息已引起學(xué)者的廣泛關(guān)注[4-5]。
目前國內(nèi)外在這方面的研究多側(cè)重于應(yīng)用,利用現(xiàn)有方法進(jìn)行實驗,并對比效果。人工神經(jīng)網(wǎng)絡(luò)、決策樹和支持向量機等現(xiàn)有機器學(xué)習(xí)算法已被應(yīng)用于不透水面提取當(dāng)中[6],其優(yōu)勢在于分類結(jié)果具有高精度,能有效處理高維數(shù)據(jù)和緩解光譜異質(zhì)性問題。WU[7]等基于IKONOS影像使用SMA方法評估在高分辨率遙感影像中SMA方法是否適用,并針對高分辨率中產(chǎn)生的混合像元和類內(nèi)變異增加的問題,提出以內(nèi)部成員集選擇和光譜歸一化方法改善提取效果的思路。YANG[8]等基于線性光譜混合分解檢測樹冠下的植被及高低反照度不透水面等3類地物分量,進(jìn)一步結(jié)合面向?qū)ο蠓诸惙椒ㄌ崛”本┑貐^(qū)QuickBird影像的不透水面信息,該方法將由樹冠引起的不透水面低估問題降低了11.2%。LU[9]利用IKONOS影像對比決策樹分類和最大似然分類,前者得到更好的分類效果。ZHOU[10]等提出了一種MASC,以多個子模塊組合的算法對陰影進(jìn)行二次分類以提高ISA的提取精度。Robert等利用多尺度分割與面向?qū)ο竽:诸惙椒▽hio地區(qū)的8種土地覆蓋類型進(jìn)行分類,并評估該技術(shù)的有效性,結(jié)果總體精度達(dá)到93.6%[11]。Miller[12]等通過迭代獲取訓(xùn)練樣本和面向?qū)ο蟮姆椒?,利用特征分析工具獲取高分辨率遙感影像光譜空間的上下文關(guān)系,對北卡羅來納州的威克郡土地利用覆蓋進(jìn)行提取分析,其總體精度達(dá)92%。在上述機器學(xué)習(xí)算法中,隨機森林作為一個新興、強大的算法,具有很多潛在的優(yōu)勢,如對噪聲魯棒且可評估變量重要程度等。該算法不僅能很好地捕獲非線性關(guān)系,還具有很好的并行計算能力[13]。Schneider[14]等基于精度評價指標(biāo)對隨機森林算法、最大似然算法和支持向量機算法進(jìn)行比較,認(rèn)為隨機森林算法在應(yīng)對數(shù)據(jù)缺失時,能達(dá)到更好的分類效果。這也是本文選取隨機森林算法進(jìn)行實驗的原因之一。但作為一種統(tǒng)計學(xué)習(xí)算法,它也有其固有的缺點:在樣本數(shù)據(jù)分布不均時,分類結(jié)果傾向于樣本數(shù)目多的類別,造成對其他類別的低估。
本文基于資源3號測繪遙感衛(wèi)星影像,結(jié)合紋理特征和4種光譜指數(shù):土壤調(diào)整型植被指數(shù)(SAVI)、歸一化水體指數(shù)(NDWI)、建筑物指數(shù)(BAI)和亮度值(Brightness),分析不透水面參數(shù)重要性,提取城市高精度不透水面。
Breiman[15]等在2001年提出的隨機森林(RF)模型是一種以分類與回歸決策樹(CART)作為弱分類器組合成的Bagging集成分類器。該模型結(jié)合特征重要性選取[16],以Bagging緩解CART對訓(xùn)練集小波動敏感的問題,在處理線性或非線性關(guān)系中較好地保持噪聲與變量的平衡,具有分類精度高、人工干預(yù)少、能對數(shù)據(jù)提供額外的刻畫以及運算快等優(yōu)勢[17]。這使RF算法越來越多地應(yīng)用于遙感影像分類和建立回歸分析模型中[18-19]。
在建立RF模型的過程中,從給定訓(xùn)練集中選取2/3的數(shù)據(jù)重復(fù)采樣得到N個bootstrap 數(shù)據(jù)集,同時將余下的1/3數(shù)據(jù)作為OOB數(shù)據(jù)(out-of-bag data)評估預(yù)測精度。未修剪的樹是獨立的bootstrap 數(shù)據(jù)集通過迭代方式將數(shù)據(jù)點分到左右兩個子集中逐步構(gòu)造得到,如圖1所示。這個分割過程相當(dāng)于在分割函數(shù)的參數(shù)空間中尋找最大信息增量意義下最佳參數(shù)的過程。其中,需要兩個重要的參數(shù):最小葉子數(shù)和N個決策樹。當(dāng)模型訓(xùn)練完成,將數(shù)據(jù)輸入模型進(jìn)行分類預(yù)測。對一個輸入數(shù)據(jù)集迭代得根據(jù)訓(xùn)練得到的RF中的各個決策樹進(jìn)行判斷,直到各決策樹的葉節(jié)點。在每個葉節(jié)點處應(yīng)用統(tǒng)計學(xué)方法,對達(dá)到此葉節(jié)點的分類標(biāo)簽統(tǒng)計直方圖,進(jìn)而估計此葉節(jié)點上的類分布,即最后分類結(jié)果通過投票統(tǒng)計獲得。
圖1 RF模型原理
隨著空間分辨率的提高,由于城市景觀異質(zhì)性的影響,地物細(xì)節(jié)特征愈加顯著,但也使得類內(nèi)光譜變異性增強、同物異譜現(xiàn)象明顯。地形起伏、高大建筑物和樹冠產(chǎn)生的陰影,嚴(yán)重干擾了陰影區(qū)域下墊面的光譜;被陰影覆蓋的地區(qū)可能包含破碎的草地和道路等多種地物類別,也使得地物識別更加困難。并且,高分辨率遙感影像中通常只包含可見光波段和近紅外波段[20],僅依靠光譜特征很難應(yīng)對光譜類內(nèi)變異問題。為減少同物異譜現(xiàn)象的影響,紋理信息和面向?qū)ο蟮姆诸惙椒ū粡V泛應(yīng)用[21-22]。紋理是指圖像色調(diào)作為等級函數(shù)在空間上的變化,可應(yīng)用于邊緣檢測和降低光譜類內(nèi)變異問題。獲取適合紋理信息的關(guān)鍵在于影像的選擇、窗口大小和紋理計算方法等[23]。為了提高分類精度,本文選取常用的4個光譜指數(shù)和紋理特征作為新波段加入到原影像中進(jìn)行分類。
2.1 光譜指數(shù)
為了提取水體信息,McFeeters[24]于1996年提出NDWI指數(shù)。在該指數(shù)中,水體表現(xiàn)出較高的數(shù)值,其他地物的值接近于0和負(fù)值。隨后一種改進(jìn)型的MNDWI指數(shù)被提出,用于減緩建筑物與水體的噪聲。由于高分辨率影像缺乏中紅外波段,本文選取NDWI指數(shù)以增強建筑物與水體間的區(qū)別。SAVI指數(shù)[25]也被廣泛用于估算植被信息,同時能增強建筑物與植被間的區(qū)別。雖然NDVI指數(shù)更適用于大面積的植被估算,但相比之下,SAVI指數(shù)由于顧及土壤亮度背景,提取城市之間的植被具有更強大的魯棒性。BAI指數(shù)用于檢測瀝青、混凝土等人工建筑面,其優(yōu)勢在于即使圖像稍有模糊,仍能具備較好的檢測效果。由于高分辨率影像中存在陰影問題,Brightness指數(shù)被用于區(qū)分陰影區(qū)域和非陰影區(qū)域[26]。
式中,R、G、B和NIR分別表示紅、綠、藍(lán)和近紅外波段。
2.2 紋理特征
本文使用基于二階矩陣的紋理濾波[27],即利用灰度共生矩陣計算紋理特征。二階概率統(tǒng)計用一個灰度空間相關(guān)性矩陣來計算紋理值。該矩陣也是一個相對頻率矩陣,即統(tǒng)計像元值在兩個鄰近的由特定的距離和方向分開的處理窗口中的出現(xiàn)頻率,表達(dá)某個像元和它的特定鄰域之間關(guān)系。本文中選取均質(zhì)性和均值作為新的特征加入分類,如表1。
表1 紋理特征計算公式
3.1 研究區(qū)域與數(shù)據(jù)預(yù)處理
本文選取2012年8月獲取的資源3號衛(wèi)星遙感影像,實驗區(qū)域覆蓋江漢區(qū)政府及西北湖附近區(qū)域,如圖2所示。該區(qū)域地物類型豐富,包含水體、裸土、陰影和不透水面(包括道路、建筑物、停車場等人工構(gòu)建面)等多種下墊面。通過輻射定標(biāo)將DN值轉(zhuǎn)化為反射率,再作大氣校正。以Google Earth 1 m分辨率影像作為參考,選取一定量的樣本,將2/3的數(shù)據(jù)作為訓(xùn)練樣本生成RF模型,余下1/3作為驗證樣本進(jìn)行精度評定。
3.2 光譜指數(shù)和紋理特征計算
采用預(yù)處理后的影像計算光譜指數(shù)和紋理特征。其中灰度共生矩陣所采用的窗口大小為3×3。圖3a~d分別表示SAVI、NDWI、Brightness和BAI,圖3e、f為根據(jù)近紅外波段計算灰度共生矩陣的均值和均質(zhì)性。
圖2 實驗區(qū)域
圖3 光譜指數(shù)與紋理特征
3.3 參數(shù)優(yōu)選
為了獲取最優(yōu)的分類結(jié)果及平衡時間效率,參數(shù)優(yōu)選是一個重要部分。由圖4分析可知,當(dāng)最小葉子數(shù)確定時,決策樹個數(shù)增多,均方根誤差減小;在決策樹個數(shù)達(dá)到18時,誤差基本趨于穩(wěn)定。決策樹個數(shù)為20時,最小葉子數(shù)越大,均方根誤差越大。因此,本文通過均方根誤差大小,確定最優(yōu)葉子數(shù)、決策樹個數(shù)分別為5和20。選取光譜指數(shù)和紋理特征加入原影像中,對比在最優(yōu)葉子數(shù)下輸入特征的重要性,如圖5所示。
圖4 最優(yōu)葉子數(shù)選擇
圖5 特征重要性篩選
3.4 分類結(jié)果
為了進(jìn)一步驗證RF算法的高精度優(yōu)勢,以ANNs算法和最大似然(ML)算法作比較。圖6 a~c分別為RF算法、ANNs算法與ML算法分類結(jié)果。在分類結(jié)果右上角湖泊中,ANNs算法明顯將植被和水體誤分為不透水面和陰影;RF算法對水體與陰影也稍有錯分;ML算法將裸土與不透水面嚴(yán)重誤分。通過計算該地區(qū)不透水面面積與總面積之比得到其不透水率為64.71%。
圖6 3種方法分類結(jié)果對比
3.5 精度評定
本文中采用混淆矩陣來對分類結(jié)果進(jìn)行精度評價,包括總體精度、Kappa系數(shù)、生產(chǎn)者精度和用戶精度等指標(biāo)。為了探究特征選擇對于精度的影響,本文將原始影像4個波段, 4個光譜指數(shù)特征及經(jīng)過二階紋理濾波生成的32個特征,共40個特征加入實驗,與僅用紅外波段生成的均質(zhì)性、均值2個紋理特征及4 個光譜指數(shù)特征,共8個特征進(jìn)行對比研究。實驗發(fā)現(xiàn),在特征數(shù)較多時(圖7),進(jìn)行特征選擇能夠剔除干擾因素進(jìn)而提高精度;當(dāng)特征數(shù)較少(僅有8 個)時,剔除重要性低的特征對精度影響效果并不明顯,甚至有所下降;說明特征選擇在一定程度上能提高時間效率,有利于大數(shù)據(jù)的處理。同時,本文將RF算法與ANNs算法、ML算法精度進(jìn)行比較,如圖 8。RF算法和ANNs算法等機器學(xué)習(xí)方法從精度上要優(yōu)于ML算法。RF、ANNs和ML三者總體精度分別為97.06%、92.71%和87.18%。不透水面生產(chǎn)者精度分別為96.34%、94.50%和93.22%。其中,DIS_PA、 LIS_ PA分別表示高反照度和低反照度不透水面的生產(chǎn)者精度指標(biāo)。
圖7 不同特征數(shù)下特征選擇精度對比
圖8 3種方法精度對比
城市化是當(dāng)代全球變化的重要組成之一。世界上大約有54%的人口居住在城市中,到2050年,這個數(shù)字將增加到66%。城市快速擴張也帶來了一系列的生態(tài)環(huán)境問題。本文探索了一種快速有效的不透水面提取方法,并基于RF模型,對光譜指數(shù)和紋理特征進(jìn)行重要性分析,選出最優(yōu)的參數(shù)。對采用資源3號衛(wèi)星遙感影像提取的武漢市部分區(qū)域不透水面進(jìn)行實驗,結(jié)果表明該方法具有更高的提取精度。依據(jù)該方法提取的城市不透水率,可為準(zhǔn)確定位城市建成區(qū)透水性的薄弱環(huán)節(jié)提供技術(shù)支撐,為透水性的改造和監(jiān)測提供有效的數(shù)據(jù)源,并可為新區(qū)海綿城市的規(guī)劃提供數(shù)據(jù)支持。
[1] Okujeni A, Linden S V D, Hostert P. Extending the Vegetation–impervious–soil Model Using Simulated EnMAP Data and Machine Learning[J].Remote Sensing of Environment,2015,158(10):69-80
[2] ZHANG L, WENG Q. Annual Dynamics of Impervious Surface in the Pearl River Delta, China, from 1988 to 2013, Using Time Series Landsat Imagery[J]. Isprs Journal of Photogrammetry & Remote Sensing, 2016,113(3):86-96
[3] SONG X P, Sexton J O, HUANG C, et al. Characterizing the Magnitude, Timing and Duration of Urban Growth from Time Series of Landsat-based Estimates of Impervious Cover[J]. Remote Sensing of Environment, 2016,175:1-13
[4] LU D, WENG Q. Extraction of Urban Impervious Surfaces from an IKONOS Image[J].International Journal of Remote Sensing, 2009,30(5):1 297-1 311
[5] XU H. Rule-based Impervious Surface Mapping Using High Spatial Resolution Imagery[J]. International Journal of Remote Sensing, 2013,34(1):27-44
[6] Grinand C, Rakotomalala F, Gond V, et al. Estimating Deforestation in Iropical Humid and Dry Forests in Madagascar from 2000 to 2010 using Multi-date Landsat Satellite Images and the Random Forests Classifier[J]. Remote Sensing of Environment, 2013,139:68-80
[7] WU C. Quantifying High-resolution Impervious Surfaces Using Spectral Mixture Analysis[J]. International Journal of Remote Sensing, 2009,30(11):2 915-2 932
[8] YANG J, LI P. Impervious Surface Extraction in Urban Areas from High Spatial Resolution Imagery Using Linear Spectral Unmixing[J]. Remote Sensing Applications Society & Environment,2015,1:61-71
[9] LU D, Hetrick S, Moran E. Impervious Surface Mapping with Quickbird Imagery[J].International Journal of Remote Sensing,2011,32(9):2 519-2 533
[10] ZHOU Y Y, WANG Y Q. Extraction of Impervious Surface Areas from High Spatial Resolution Imagery by Multiple Agent Segmentation and Classification [J]. Photogrammetric Engineering & Remote Sensing, 2008,74(7):857-868
[11] Frohn R C, Chaudhary N. Multi-scale Image Segmentation and Object-oriented Processing for Land Cover Classification [J]. Geosciences & Remote Sensing, 2008,45(4):377-391
[12] Miller J E, Nelson S A C, Hess G R. An Object Extraction Approach for Impervious Surface Classification with Veryhigh-resolution Imagery[J]. Professional Geographer,2009, 61(2):250-264
[13] Kühnlein M, Appelhans T, Thies B, et al. Improving the Accuracy of Rainfall Rates from Optical Satellite Sensors with Machine Learning: a Random Forests-based Approach Applied to MSG SEVIRI[J]. Remote Sensing of Environment,2014,141:129-143
[14] Schneider A. Monitoring Land Cover Change in Urban and Peri-urban Areas Using Dense Time Stacks of Landsat Satellite Data and a Data Mining Approach [J]. Remote Sensing of Environment, 2012,124:689-704
[15] Breiman L. Random Forests [J]. Machine Learning, 2001, 45(1):5-32
[16] Amit Y, Geman D. Shape Quantization and Recognition with Randomized Trees[J]. Neural Computation, 1997,9(7):1 545-1 588
[17] Fawagreh K, Gaber M M, Elyan E. Random Forests: From Early Developments to Recent Advancements[J]. Systems Science & Control Engineering an Open Access Journal, 2014,2(1):602-609
[18] Akar ?, Güng?r O. Integrating Multiple Texture Methods and NDVI to the Random Forest Cassification Algorithm to Detect Tea and Hazelnut Plantation Areas in Northeast Turkey[J]. International Journal of Remote Sensing, 2015,36(2):442-464
[19] Dye M, Mutanga O, Ismail R. Combining Spectral and Textural Remote Sensing Variables Using Random Forests: Predicting the Age of Pinus Paula Forests in KwaZulu-Natal, South Africa[J]. Journal of Spatial Science, 2012,57(2):193-211
[20] Jungho Im, LU Z Y, Jinyoung Rhee, et al. Impervious Surface Quantification Using a Synthesis of Artificial Immune Networks and Decision/Regression Trees from Multi-sensor Data[J]. Remote Sensing of Environment, 2012,117:102-113
[21] ZHANG Y, ZHANG H, LIN H. Improving the Impervious Surface Estimation with Combined Use of Optical and SAR Remote Sensing Images[J]. Remote Sensing of Environment, 2014,141:155-167
[22] Moran E F. Land Cover Classification in a Complex Urbanrural Landscape with Quickbird Imagery[J]. Photogramm Eng Remote Sensing, 2010,76(10):1 159-1 168
[23] Frohn R C, Chaudhary N. Multi-scale Image Segmentation and Object-oriented Processing for Land Cover Classification[J]. Geosciences & Remote Sensing, 2008,45(4):377-391
[24] Mcfeeters S K. The Use of the Normalized Difference Water Index (NDWI) in the Delineation of Open Water Features[J]. International Journal of Remote Sensing, 1996,17(7):1 425-1 432
[25] Alhammadi M S, Glenn E P. Detecting Date Palm Trees Health and Vegetation Greenness Change on the Eastern Coast of the United Arab Emirates Using SAVI [J]. International Journal of Remote Sensing, 2008,29(6):1 745-1 765
[26] Hsieh Y T, WU S T, LIAO C S, et al. Automatic Extraction of Shadow and Non-shadow Landslide Area from ADS-40 Image by Stratified Classification[C]. 2011 IEEE International Geoscience and Remote Sensing Symposium,Vancouver, 2011
[27] Haralick R M, Shanmugam K, Dinstein I. Textural Features for Image Classification[J]. IEEE Transactions on Systems Man & Cybernetics, 1973,3(6):610-621
P237
B
1672-4623(2016)07-0001-05
10.3969/j.issn.1672-4623.2016.07.001
邵振峰,教授,博士生導(dǎo)師,主要從事城市遙感、智慧城市和海綿城市方面的科研和教學(xué)工作。
2016-05-04。
項目來源:中央高?;究蒲袠I(yè)務(wù)費專項資金資助項目(2042016kf0179、2042016kf1019);國家測繪地理信息局測繪基金資助項目(測科函[2015]19 號);2016年廣州市科技計劃資助項目(201604020070)。