馮東東,張志華,石浩月
(1.蘭州交通大學測繪與地理信息學院,蘭州 730070;2.地理國情監(jiān)測技術(shù)應用國家地方聯(lián)合工程研究中心,蘭州 730070;3.甘肅省地理國情監(jiān)測工程實驗室,蘭州 730070)
改造城中村不但能夠保證村內(nèi)居民生產(chǎn)生活需要,而且可有效集約土地,提升城市美觀性與協(xié)調(diào)性[1]。目前有關城中村的研究主要集中在理論和政策層面,易受時空因素制約,缺少數(shù)據(jù)支撐及定量分析。因此如何從城市結(jié)構(gòu)中精細提取出城中村區(qū)域,逐漸成為學者們研究的熱點。
近年來有學者提出利用遙感影像提取城中村,例如劉輝[1]基于深度神經(jīng)網(wǎng)絡模型和場景語義描述的方法,以深圳和武漢為例提取城中村;Boutell等[2]將地物場景分割為一定數(shù)量的子塊,然后計算每個子塊的光譜特征,最后根據(jù)子塊特征,使用支持向量機算法實現(xiàn)地物的分類。此外,還有學者提出基于面向?qū)ο蟮某侵写逄崛》椒?,例如尚春艷[3]利用傳統(tǒng)的面向?qū)ο蠓▽ρ芯繀^(qū)的城中村土地利用進行檢測,并提取變化信息;Li等[4]利用高分辨率影像,以非監(jiān)督深度學習為基礎,建立了多種分割模型,對深圳市城中村進行提取。然而,由于城中村內(nèi)房屋建筑復雜,特征不一,常用的分割算法難以準確分割出城中村與相鄰地物對象,因此面向像元和對象的提取方法難以有效應用于城中村提取。
鑒于此,本文結(jié)合多元空間數(shù)據(jù),利用遙感影像提取技術(shù)與地理信息系統(tǒng)(geographic information system,GIS)空間分析技術(shù)相結(jié)合的方法對城中村進行提取;并通過對廣州市主城區(qū)的城中村進行定量空間分析,總結(jié)出城中村的分布特征,從而為解決城中村改造等問題提供數(shù)據(jù)支撐和方法參考。
廣州市位于廣東省中南部,瀕臨南海,是國家首批沿海開放城市,屬珠三角地區(qū)和粵港澳大灣區(qū)經(jīng)濟中心,截至2019年,廣州市人口總數(shù)約1 531萬人,城鎮(zhèn)化率接近90%[5]。選取廣州市的4個中心城區(qū)(天河區(qū)、越秀區(qū)、荔灣區(qū)和海珠區(qū))作為研究區(qū)域,其在廣州市的地理位置如圖1所示。本項研究數(shù)據(jù)源主要有:①廣州市高分一號衛(wèi)星影像數(shù)據(jù);②道路網(wǎng)數(shù)據(jù),由開源地圖OpenStreetMap (OSM)提供;③建筑物輪廓數(shù)據(jù),研究區(qū)共計101 453棟建筑物輪廓面數(shù)據(jù),其中包含建筑物矢量邊界信息及樓層高度和面積屬性信息;④興趣點(point of interest,POI)數(shù)據(jù),研究區(qū)共計545 812個點數(shù)據(jù),共3大類,18種具體類型。
圖1 研究區(qū)概況Fig.1 Overview of the research area
本文從提取研究區(qū)城中村的角度出發(fā),結(jié)合了互聯(lián)網(wǎng)POI數(shù)據(jù)、高分辨率遙感影像數(shù)據(jù)以及建筑物輪廓數(shù)據(jù)等,實現(xiàn)對研究區(qū)城中村提取。首先對原始數(shù)據(jù)進行空間分析和處理,構(gòu)造出城中村地塊特征屬性,然后對包含特征屬性的城中村地塊數(shù)據(jù)進行分類,得到提取結(jié)果。本文實驗的主要實驗流程如圖2所示。
圖2 實驗流程圖Fig.2 Experimental flow chart
深度學習是指利用分層迭代算法的思想,讓計算機對輸入的各種形式的文件、圖案等內(nèi)容進行自動的歸納識別[6]。ENVI Deep Learning是基于TensorFlow模型構(gòu)建的,TensorFlow是一個開源框架,ENVI使用它來執(zhí)行深度學習任務[7]。利用深度學習提取城中村的步驟如下:
1)影像預處理。主要包括影像的輻射定標、大氣校正、幾何糾正及波段融合等過程。
2)創(chuàng)建標簽圖像。通過裁剪影像子集,繪制標簽數(shù)據(jù),并使用模塊工具生成標簽圖像(label raster)。標簽數(shù)據(jù)需要選擇具有代表性的典型區(qū)域進行樣本采集。
3)訓練模型。利用感興趣區(qū)和標簽圖像初始化一個新的模型,并在模塊中設置訓練參數(shù),對模型進行訓練。
4)執(zhí)行分類。使用模塊提供的工具對圖像進行分類,該工具會生成一幅類激活圖像(class activation map,CAM)。CAM是一個灰度圖像,其像元值表示屬于提取目標的概率。對CAM圖像進行分類后處理,可直觀表示出城中村提取結(jié)果。
由于單方面利用遙感影像提取出的城中村信息存在與老城區(qū)、工業(yè)廠房等混淆的問題,因此需要進一步的精細提取。城中村其明顯的特征為房屋不高且密集,本文通過統(tǒng)計建筑物高度面積等屬性信息,再結(jié)合高分辨率遙感影像的光譜特征,以及各類POI核密度屬性實現(xiàn)對城中村信息的提取。
以詳盡的道路網(wǎng)絡劃分出的區(qū)域作為城中村基本地塊單元,根據(jù)地塊單元的矢量圖斑,分割研究區(qū)高分辨率影像,計算每個地塊單元中影像各波段的均值及亮度值,融合建筑物、POI等空間信息構(gòu)建地塊單元特征集合。詳細步驟如下:
1)在eCognition中對高分一號影像進行分割,通過計算得到研究區(qū)地塊單元的光譜屬性信息,存入對應的地塊單元矢量圖斑下[8]。實現(xiàn)以地塊圖斑為基本單元,將影像分割成地塊影像單元集合,并為每個影像單元賦予唯一的編號ID,便于索引。
2)原始建筑物輪廓數(shù)據(jù)包含樓層高度信息,利用ArcGIS計算出建筑物面積值,再將地塊單元矢量數(shù)據(jù)與建筑物數(shù)據(jù)進行空間關聯(lián),從而統(tǒng)計出每個地塊單元內(nèi)建筑物的高度、面積等屬性信息[9]。通過計算每個地塊單元內(nèi)建筑物的平均高度、高度標準差、建筑物面積總和以及平均建筑面積信息,作為建筑物屬性值。
3)使用ArcGIS核密度分析工具,計算每個輸出柵格像元周圍鄰域內(nèi)輸入POI點的密度[10-11],這在一定程度上可反映城中村與非城中村地區(qū)的POI差異性。其中核密度分析中關鍵參數(shù)搜索半徑SR的計算方法如式(1)所示:
(1)
式中:SD為要素之間的標準距離;Dm為要素之間的中值距離;n為沒有使用 population 字段的點數(shù),如果提供population字段,則n是population字段值的總和,其中,population字段是指在核密度分析過程中,計算目標位置時的樣本個數(shù)。
結(jié)合研究區(qū)城市POI類型及特點,選取不同的核密度參數(shù)得到實驗結(jié)果,其中住宅用地POI核密度搜索半徑(帶寬)值設為1 500 m,公共服務用地POI核密度搜索半徑值為3 000 m,而商業(yè)服務用地2 000 m。得到各類POI的核密度柵格圖后,利用ArcGIS的分區(qū)統(tǒng)計工具和屬性表連接功能,將各類POI的核密度柵格值連接到之前的地塊單元矢量數(shù)據(jù)中。可在ArcGIS中查看構(gòu)建的研究區(qū)地塊單元矢量圖斑屬性表,其中包含地塊ID、地塊類別、地塊光譜特征屬性、建筑物特征屬性及各類POI特征屬性。
統(tǒng)計標簽數(shù)據(jù)中每個對象的光譜信息、建筑物屬性信息以及各類POI核密度屬性后,即完成研究區(qū)帶有特征城中村標簽數(shù)據(jù)的構(gòu)建,構(gòu)建的特征類型如表1所示[12]。
表1 構(gòu)建的地塊單元特征Tab.1 Features of constructed land units
支持向量機(support vector machine,SVM)是一種對已知樣本的特點進行學習,從而預測未知樣本類別的機器學習方法,通常用于數(shù)據(jù)的二分類問題。利用SVM分類算法進行城中村的精細分類,為了使分類面能將訓練樣本無誤地分類且具有最大的分類間隔,訓練樣本還需要滿足[13-14]:
yi[(w·xi)+b]-1≥0,
(2)
式中:i為樣本集序號;x,y和b均為列向量;w為支持向量對應的樣本點到?jīng)Q策面的距離向量。
(3)
為了便于求解,構(gòu)造出Lagrange函數(shù),即
(4)
式中:i為樣本集下標,i=1,2,…,l;ai為Lagrange系數(shù),對w和b求偏微分得:
(5)
(6)
將式(2),(5)和(6)作為約束條件,就將原始問題轉(zhuǎn)成求解二次規(guī)劃時的對偶性問題,可得出:
(7)
(8)
式(7)是一個二次函數(shù),在式(8)約束下存在唯一最優(yōu)解。若ai*為最優(yōu)解,且b*可由約束條件式(2)求得,b*為最優(yōu)解下向量b的取值。求解公式得最優(yōu)分類函數(shù)為:
(9)
本文選取天河區(qū)為樣本集,首先繪制城中村標簽數(shù)據(jù)[15],共105個及背景地物321個,共計樣本總數(shù)426個,其中包含輸入圖像的原始波段和掩模波段,掩模波段中DN值為1的像元代表目標,0代表背景。然后利用感興趣區(qū)和標簽圖像初始化一個新模型,在Train TensorFlow Mask Model中設置訓練參數(shù),經(jīng)多次試驗,選取參數(shù)模型如下:PatchSize值為316,Epochs值為20,ClassWeight值為0~2,LossWeight值為1,SolidDistance值為1,BlurDistance值為0~2。最后使用訓練模型對影像分類,其結(jié)果會產(chǎn)生一幅CAM圖像,該灰度圖像的像元值表示屬于提取目標的概率,圖像中高亮顯示部分即與目標特征的匹配度較高,如圖3所示。對CAM圖像進行密度分割,使其按照不同顏色進行顯示,如圖4所示。
圖3 CAM類激活圖Fig.3 CAM class activation diagram
圖4 城中村提取結(jié)果Fig.4 Extraction results from urban villages
初步提取到的圖像存在圖斑小且邊緣鋸齒明顯的現(xiàn)象,需使用Sieve Classes與Clump Classes工具對圖像進行過濾和聚合[16],將處理后的結(jié)果疊加到影像圖上,截取部分影像如圖5所示。
圖5 分類后處理的城中村矢量Fig.5 Urban village vector after classification processing
ENVI Deep Learning精度可用以下4個指標來表示:Loss為訓練損失,用于表示模型與驗證訓練數(shù)據(jù)的匹配程度;Precision為用戶精度,表示正確分類的像元數(shù)占該類別像元數(shù)的比例;Recall為生產(chǎn)者精度,表示正確分類的像元數(shù)占該類別實際像元數(shù)的比例;F1為模型精度系數(shù),是Precision和Recall的調(diào)和平均值,計算方法為[17-18]:
(10)
精度高低可通過Loss和F1的值來評價,在ENVI深度學習模塊下查看訓練模型精度參數(shù),繪制精度參數(shù)折線圖,如圖6所示。
圖6 深度學習模型精度參數(shù)Fig.6 Precision parameters of deep learning model
通過圖6可知,隨迭代次數(shù)增加,模型的損失值Loss降低,精度F1值上升,表明深度學習工具可以較好地訓練提取模型,實現(xiàn)對城中村的提取,共計識別出城中村423個,發(fā)現(xiàn)有272個被正確識別,正確識別率為64.31%。
原始的OSM數(shù)據(jù)存在缺失與拓撲錯誤,需進行后處理;然后將道路網(wǎng)絡數(shù)據(jù)轉(zhuǎn)化為面狀圖斑,最終得到6 718個地塊單元,如圖7所示。
圖7 研究區(qū)地塊單元矢量圖斑Fig.7 Plot unit vector pattern spot in the study area
在棋盤分割算法的基礎上,對地塊單元矢量圖斑添加圖層,將研究區(qū)的高分影像進行分割[19],影像局部分割結(jié)果如圖8所示。
圖8 影像基于矢量分割結(jié)果Fig.8 Image segmentation is based on vector segmentation results
將分割出的矢量圖層與上文利用ENVI Deep Learning提取出的輪廓信息進行疊加,并為各地塊對象添加城中村與非城中村的屬性值,最后進行修正統(tǒng)計,制作一份完整的標簽數(shù)據(jù)。
利用機器學習軟件包LIBSVM[20]分類器完成地塊單元數(shù)據(jù)集的分類,通過自定義選取數(shù)據(jù)集中的特征向量,對光譜特征、建筑物特征和POI特征進行不同的組合疊加[21-22],得出LIBSVM分類器在選取不同特征向量時的城中村分類精度(表2)。
表2 選擇不同特征屬性的分類精度Tab.2 Select the classification accuracy of different feature attributes
由表2可知,使用LIBSVM分類器區(qū)分城中村與非城中村地塊,僅利用影像的光譜特征,難以達到較好分類效果,融合POI特征和建筑物特征后,可以取得較好的分類效果。將結(jié)果映射到地塊單元矢量文件的屬性表中,得到如圖9所示的識別結(jié)果,圖中共計識別出城中村地塊455個,根據(jù)統(tǒng)計結(jié)果,發(fā)現(xiàn)有401個城中村被正確識別,分類精度高達90.19%。圖10為部分識別結(jié)果疊加Google Earth影像。
圖9 城中村識別結(jié)果Fig.9 Urban village identification results
圖10 在Google Earth上顯示識別結(jié)果Fig.10 Display the recognition results in Google Earth
城中村的錯分對象主要為老舊居民區(qū)和工業(yè)區(qū)。三者之間共同特征為綠化率低、樓層較矮,當單個面積較小的建筑物所占該地塊總比例較高時,三者在影像上表現(xiàn)出的特征極為相似,所以LIBSVM分類器很容易誤判。
海珠區(qū)中城中村數(shù)量最多、密度最大;其次是天河區(qū)、荔灣區(qū);最后是越秀區(qū),越秀區(qū)為中心商業(yè)區(qū),城中村改造完成度高;整體而言,研究區(qū)城中村分布較為分散,分布在整個城市區(qū)域中。
針對目前城中村研究缺少數(shù)據(jù)支撐和定量分析等問題,將遙感影像提取技術(shù)與GIS空間分析技術(shù)相結(jié)合,提出基于深度學習工具提取城中村和基于多元空間數(shù)據(jù)識別城中村地塊的方法。實驗結(jié)果表明,利用深度學習工具,能夠較好地提取出城中村邊界信息?;诼肪W(wǎng)分割高分辨率遙感影像,結(jié)合機器學習分類方法識別城市不同地塊單元,對城中村可精細提取,分類精度高達90%。
本文基于多元數(shù)據(jù)對城中村提取進行了研究,但提取結(jié)果仍存在一定的偏差,進一步研究的問題主要包括:
1)在融合多元空間數(shù)據(jù)輔助提取城中村時,可考慮添加Sentinel衛(wèi)星數(shù)據(jù),表示出地物的空間高度信息,用于區(qū)分城中村建筑和平整的運動場等地物。
2)因訓練模型耗時較長,且模型訓中存在一定的隨機性,對于高分辨率遙感影像復雜的地物環(huán)境,提取結(jié)果仍存在與老舊居民區(qū)、工業(yè)區(qū)混合現(xiàn)象,可考慮進一步優(yōu)化模型參數(shù),提升提取效率及精度。