李 婭,劉亞嵐?,任玉環(huán),王智灝,曲 暢
(1 中國科學(xué)院遙感與數(shù)字地球研究所, 北京 100101; 2 中國科學(xué)院大學(xué), 北京 100049; 3 北京大學(xué)地球與空間科學(xué)學(xué)院遙感與地理信息系統(tǒng)研究所, 北京 100871) (2017年10月24日收稿; 2018年1月19日收修改稿)
新常態(tài)時期的中國經(jīng)濟和城市進入新的發(fā)展階段,傳統(tǒng)的城市發(fā)展模式面臨諸多問題,對城市規(guī)劃理念、策略和建設(shè)提出新的要求和挑戰(zhàn)。要求突出以人為本的創(chuàng)新驅(qū)動,加強空間資源優(yōu)化配置,優(yōu)化城鎮(zhèn)空間結(jié)構(gòu),加強存量利用[1]。而加強城市功能區(qū)的合理規(guī)劃,即通過對土地使用情況進行空間分析以及空間調(diào)整[2],確定最合理的城市功能區(qū)空間布局,使其在提高城市土地利用效率的基礎(chǔ)上,可以將城市各項產(chǎn)業(yè)集聚起來并發(fā)揮最大效能,一定程度上提高城市土地利用效率,確保新型城鎮(zhèn)戰(zhàn)略的有效實施[3-4]。
高分辨率遙感影像具有高空間分辨率、高清晰度、信息量豐富等優(yōu)點,極大提高了遙感在城市土地利用/覆被變化研究中的應(yīng)用能力[5]。然而,過去單一依賴遙感影像進行的城市應(yīng)用,土地利用信息更新速度慢,且傳統(tǒng)基于語義網(wǎng)進行遙感圖像分類僅是通過分析地物特點,對圖像底層特征進行挖掘[6],并不能分析真實的土地功能類型信息。由于缺乏語義屬性,造成遙感空間信息難以轉(zhuǎn)換為被規(guī)劃所用的有效信息[7]?;ヂ?lián)網(wǎng)產(chǎn)品的發(fā)展提供了大量數(shù)據(jù)語義信息,為城市土地功能的研究提供了新的研究方向。
國內(nèi)外學(xué)者針對大數(shù)據(jù)時代下的城市空間結(jié)構(gòu)劃分方法進行了一定的應(yīng)用探究。趙衛(wèi)鋒等[8]以顯著性的差異提出POI數(shù)據(jù)分層指標(biāo),獲得能夠用于智能化路徑引導(dǎo)的層次性知識空間。于翔[9]以北京市為例,結(jié)合城市公交刷卡數(shù)據(jù)和興趣點實現(xiàn)城市功能區(qū)識別研究,輔助規(guī)劃人員和公眾有效識別和理解復(fù)雜的城市空間結(jié)構(gòu)。Yuan等[10]利用出租車GPS信息和城市興趣點數(shù)據(jù),運用數(shù)據(jù)挖掘方法研究城市不同區(qū)域的功能劃分。宋瑞和姚鄭[11]采用大數(shù)據(jù)技術(shù)實現(xiàn)一個熱點區(qū)域人員流動的實時監(jiān)測系統(tǒng)。Bauer等[12]實現(xiàn)大數(shù)據(jù)條件下基于人類時空活動實現(xiàn)城市土地利用分類研究。但是現(xiàn)階段利用POI數(shù)據(jù)與遙感數(shù)據(jù)結(jié)合實現(xiàn)城市功能區(qū)分類研究還很少見。
本文基于國產(chǎn)GF-1高空間分辨率遙感影像數(shù)據(jù),綜合利用多種影像特征進行城市建設(shè)用地提取,進而結(jié)合路網(wǎng)數(shù)據(jù)以及POI數(shù)據(jù)等基礎(chǔ)地理數(shù)據(jù)中可以反映城市功能特征的語義信息對城市空間結(jié)構(gòu)進行深入分析,從而得到城市功能區(qū)語義分類結(jié)果。
北京市城市用地類型復(fù)雜,城市功能類型豐富,因而本文選擇北京作為主要研究城市。但由于覆蓋整個北京市的POI數(shù)據(jù)量較大,考慮到實驗運行效率問題,本文選取西城區(qū)部分區(qū)域作為實驗區(qū)域,具體范圍為北緯39.865 2°~39.957 7°,東經(jīng)116.253 3°~116.364 2°,如圖1所示。
本文主要采用GF-1高分辨率遙感影像、POI數(shù)據(jù)、路網(wǎng)數(shù)據(jù)等進行城市功能區(qū)語義信息挖掘與遙感分類的相關(guān)研究。
1)GF-1影像數(shù)據(jù)
本文采用GF-1衛(wèi)星2 m全色/8 m多光譜傳感器影像作為數(shù)據(jù)源,影像獲取時間為2016年4月21日,其衛(wèi)星有效載荷技術(shù)指標(biāo)見表1。在基于遙感影像進行城市用地分類前,對GF-1影像數(shù)據(jù)進行輻射定標(biāo)、大氣校正、正射校正、圖像融合等預(yù)處理。并根據(jù)研究區(qū)域范圍對融合影像進行裁剪,裁剪后的影像如圖2所示。
表1 GF-1號傳感器有效載荷技術(shù)指標(biāo)Table 1 The payload technical indicators of GF-1
圖2 研究區(qū)GF-1假彩色合成影像Fig.2 The false color composite image of GF-1 in study area
2)POI數(shù)據(jù)
互聯(lián)網(wǎng)電子地圖都包含有興趣點(point of interest,POI)信息,即帶有名稱、類別、經(jīng)緯度等屬性信息的空間特征點。這些興趣點信息基本上都是面向大眾需求的城市空間信息,可以描述城市空間各類工程性和社會性服務(wù)設(shè)施,蘊含有豐富的人文經(jīng)濟及自然特征,是進行城市空間數(shù)據(jù)分析的重要基礎(chǔ)地理數(shù)據(jù)。
本文基于爬蟲軟件從百度地圖網(wǎng)頁上獲取到研究區(qū)域范圍內(nèi)與影像同時期的POI數(shù)據(jù),共87 436條。每條數(shù)據(jù)都包括POI的名稱、類型、地址、電話信息、經(jīng)度、緯度6個屬性。
結(jié)合2011年中華人民共和國住房和城鄉(xiāng)建設(shè)部頒布的新版《城市用地分類與規(guī)劃建設(shè)用地標(biāo)準(zhǔn)》,同時考慮城市功能的普遍性和數(shù)據(jù)類別的認(rèn)知度以及顯著性,將POI數(shù)據(jù)分為居住用地、公共管理與公共服務(wù)用地、商業(yè)服務(wù)設(shè)施用地、工業(yè)用地、道路與交通設(shè)施用地、綠地與廣場用地6個較具代表性的類別,作為相應(yīng)功能區(qū)的直接土地類型映射進行分類。最終POI數(shù)據(jù)類別描述見表2。
表2 POI數(shù)據(jù)分類表Table 2 Classification of POI data
POI數(shù)據(jù)使用前需進行清洗、抽取、查重、空間定位、定義投影與坐標(biāo)轉(zhuǎn)換等相關(guān)處理,然后根據(jù)表2進行POI類別劃分和數(shù)量統(tǒng)計,統(tǒng)計結(jié)果見表3。考慮到綠地與廣場用地的數(shù)量比例極小,故本文主要針對前5種用地類型進行研究。
表3 各類型POI數(shù)據(jù)量統(tǒng)計Table 3 Statistics of various types of POI
3)路網(wǎng)數(shù)據(jù)
本文所用的路網(wǎng)數(shù)據(jù)來源于OpenStreetMap的中國路網(wǎng)矢量數(shù)據(jù),根據(jù)研究區(qū)域范圍進行數(shù)據(jù)裁剪。
本文基于GF-1遙感影像數(shù)據(jù)中的地表覆蓋信息和POI數(shù)據(jù)蘊涵的城市功能語義信息,實現(xiàn)城市空間結(jié)構(gòu)的深入分析。首先基于面向?qū)ο蠓椒▽崿F(xiàn)城市建設(shè)用地信息提取,然后結(jié)合核密度分析結(jié)果,構(gòu)建功能區(qū)類別定義模型,最終實現(xiàn)城市功能區(qū)語義分類。本文的技術(shù)流程圖如圖3所示。
圖3 技術(shù)流程圖Fig.3 Technical flow chart
本文采用面向?qū)ο蟮姆椒╗13]進行城市建設(shè)用地遙感信息提取,經(jīng)過多次實驗,城市建設(shè)用地及背景地類的提取規(guī)則見表4。針對水體的破碎性以及陰影、道路等地塊混淆性等問題,對信息提取結(jié)果進行后期人工交互處理,最終地類合并后建設(shè)用地的提取結(jié)果見圖4。以提取樣本為參考數(shù)據(jù),將建設(shè)用地提取結(jié)果進行定量精度評價,得到建設(shè)用地提取精度達(dá)93.68%。
為解決功能區(qū)劃分過程中邊界設(shè)定問題,本研究將提取的建設(shè)用地疊加路網(wǎng)數(shù)據(jù)進行區(qū)塊分割,并將區(qū)塊作為城市功能分區(qū)研究的基本單元。在基于遙感的城市建設(shè)用地信息提取和區(qū)塊分割基礎(chǔ)上,利用核密度分析、構(gòu)建功能區(qū)類別定義模型等一系列方法,將城市功能區(qū)劃分為道路與交通設(shè)施用地、工業(yè)用地、居住用地、商服用地、公共管理與公共服務(wù)設(shè)施用地五大類。
表4 面向?qū)ο蟮母鞯仡愄崛∫?guī)則Table 4 The object-oriented extraction rules of lands
圖4 建設(shè)用地提取結(jié)果Fig.4 Extraction results of construction land
2.2.1 核密度分析
核密度分析法[14](kernel density estimation)是由Rosenblatt和Emanuel Parzen提出的針對數(shù)據(jù)自身特點研究其形態(tài)分布的一種非參數(shù)估計方法。其理論主要源于地理學(xué)第一定律,即認(rèn)為距離越近的事物之間的關(guān)聯(lián)度越緊密,與核心要素越接近的位置獲取的密度擴展值則越大。其公式為
(1)
式中:f(x)為任意點x處的核密度計算函數(shù);x1,x2,…,xn為取自一元連續(xù)總體的樣本點;h為帶寬,其中h>0作為一個平滑參數(shù),即距離衰減閾值或者搜索半徑;n為與位置x的距離小于等于h的要素點數(shù);K函數(shù)為核函數(shù)(非負(fù)、積分為1,符合概率密度性質(zhì),并且均值為0),它是表示空間權(quán)重的函數(shù)。
圖5是不同核函數(shù)下的核密度估計圖,單從曲線光滑度來說,Gaussian和Epanechnikov曲線光滑度較好,Uniform(或Box)曲線光滑度最差,但整體上來看,不同核函數(shù)對核密度估計影響不大。根據(jù)應(yīng)用的普遍性,本文選取光滑度較好的Gaussian核函數(shù)對數(shù)據(jù)進行處理。
圖5 不同核函數(shù)下的核密度估計圖Fig.5 Kernel density estimation using different kernel functions
除核函數(shù)外,帶寬也是影響核密度估計結(jié)果的重要參數(shù)。圖6顯示不同帶寬對核密度估計的影響,故而多次實驗選取最佳帶寬非常必要。
圖6 不同帶寬下的核密度估計圖Fig.6 Kernel density estimation with different bandwidths
針對本研究的POI樣本點,對上述公式進行二維平面的擴展,在點(x,y)處的核密度表達(dá)公式為
(2)
通過將離散的POI數(shù)據(jù)分布點轉(zhuǎn)化為連續(xù)平滑的核密度分布圖,基于統(tǒng)計結(jié)果選取能完全包含95%以上同類別POI數(shù)據(jù)點的核密度區(qū)間設(shè)為最佳提取閾值,對各類別POI數(shù)據(jù)點集中分布區(qū)域進行提取。
將路網(wǎng)分割后的區(qū)塊與相應(yīng)的核密度集中分布區(qū)域建立空間連接,并計算核密度分布區(qū)域在每一區(qū)塊的覆蓋面積比例?;诟黝惞δ苡玫馗采w面積比例指數(shù)Sij進行功能區(qū)的初步提取,即面積比例指數(shù)大于50的區(qū)塊定義為第j類別的功能區(qū)。其公式為
×100%.
(3)
式中:i為第i個區(qū)塊;j為第j類POI數(shù)據(jù);Aij為第i個區(qū)塊中第j類POI核密度分布覆蓋面積;Ai為第i個區(qū)塊的面積。
由于北京市城市功能結(jié)構(gòu)復(fù)雜,混合功能區(qū)占主要部分,本文將落入?yún)^(qū)塊矢量單元僅存在一種功能用地的情況定義為單一功能區(qū),并針對區(qū)塊矢量單元中存在多種功能用地的情況,引入POI類別影響力因子,構(gòu)建功能區(qū)類別定義模型實現(xiàn)功能區(qū)的進一步定義。
2.2.2 功能區(qū)類別定義模型
針對區(qū)塊矢量單元中存在多種功能用地共存的情況,本文通過建立功能區(qū)類別定義模型實現(xiàn)功能區(qū)類別語義劃分。
1)POI類別權(quán)重設(shè)定
實驗針對POI數(shù)據(jù)點進行核密度分析的方法雖然可以在一定程度上得到各類POI數(shù)據(jù)點在空間上的聚集分布形態(tài),但由于實驗區(qū)域內(nèi)每類POI數(shù)據(jù)點的數(shù)量相差懸殊且每一級類別所包含的語義信息對城市功能區(qū)劃分的影響程度不同。通常同類別POI數(shù)量越多,對城市功能區(qū)定義影響程度越大;類別等級高的POI,對城市功能區(qū)定義影響程度相應(yīng)也越大。因此在對功能區(qū)進行進一步定義時需要針對每類POI數(shù)據(jù)點的影響力程度設(shè)定權(quán)重。
①一級類別影響力因子權(quán)重設(shè)定
考慮到POI的數(shù)量將對城市功能分區(qū)的影響程度不同,針對一級類別影響力因子權(quán)重的定義主要采用因素成對比較法,設(shè)定比較項之間比值和為1,通過兩兩比較得到比值,并將多類比較結(jié)果求取均值,得到一級類別影響力因子權(quán)重系數(shù)W1={w1,w2,…,wi,…,wn1},其計算公式為
,j=1,2,…,n1.
(4)
式中:n1為一級類別的數(shù)目;wij為第i類與第j類兩兩比較后的第i類比值;Wi為第i類影響力因子權(quán)重值。
基于式(4)得到各一級類別的影響力因子權(quán)重W1如表5所示。
表5 一級類別影響力因子權(quán)重Table 5 Weight values of the influence factors in the first-degree type
注: 1居住用地;2公共管理與公共設(shè)施服務(wù)用地;3商服用地;4工業(yè)用地;5道路與交通設(shè)施用地
②二級類別影響力因子權(quán)重設(shè)定
在一級類別下,考慮到各二級類別POI的數(shù)量對一級類別的影響程度,二級類別影響力權(quán)重定義采用與一級類別權(quán)重定義相同的方法,得到各二級類別類影響力因子權(quán)重W2={w1,w2,…,wr,…,wn2}。
③三級類別影響力因子的權(quán)重設(shè)定:在一級類別、二級類別的影響下,三級類別數(shù)量較多且類別多樣。故而根據(jù)三級類別數(shù)量影響力,三級類別設(shè)定為W3={w1,w2,…,wk,…,wn3},其中wrk=Nk/10,Nk為第k類描述類別中每類POI數(shù)據(jù)點數(shù)量,r為k類歸屬的二級類。為避免類別間權(quán)重相差太大,各項值最大設(shè)為500。
最終確定每k類POI影響力因子權(quán)重系數(shù)公式為Wk=wi×wir×wrk。
2)功能區(qū)類別定義模型
考慮到不同類別POI核密度分布存在大量重疊區(qū)域,功能區(qū)類別定義模型的構(gòu)建主要是通過統(tǒng)計重疊區(qū)域區(qū)塊矢量單元中各類POI的數(shù)量,求取該區(qū)塊單元中該類POI點密度ρij。在此基礎(chǔ)上引入每類POI的影響力因子最終權(quán)重系數(shù),通過式(5)得到對應(yīng)區(qū)塊單元中各類POI的影響分值φij。進一步比較同一街區(qū)矢量單元中各POI類型的影響分值比σ是否超過50%,判斷該區(qū)塊矢量單元是以單一功能區(qū)為主,還是多種功能區(qū)共同作用的混合功能區(qū)。其中針對混合功能區(qū)進行判別,將多類影響分值比例超過70%的混合區(qū)類別區(qū)分出來,若影響分值比例均不超過30%則作為多功能混合用地。
(5)
式中:i為POI類別,j為區(qū)塊單元空間標(biāo)記數(shù),ρij為j區(qū)塊區(qū)第i類POI的點密度,wi為第i類影響因子權(quán)重,φij為j區(qū)塊內(nèi)第i類POI的影響分值,σij為j區(qū)塊內(nèi)第i類POI的影響分值比。
將5類POI數(shù)據(jù)進行二維核密度計算,經(jīng)過多次實驗,最佳搜索半徑為0.005,得到各POI類別的核密度分布圖,見圖7。從圖中可以看出POI數(shù)據(jù)點的集中分布區(qū)域,選取包含95%以上同類別POI的核密度閾值對相應(yīng)功能用地核密度空間分布進行提取,得到各功能用地集中分布區(qū)域。
對研究區(qū)域進行各類功能用地覆蓋面積比例指數(shù)的計算,然后根據(jù)功能區(qū)類別定義模型機理進行實驗,最終得到如圖8所示的研究區(qū)域功能區(qū)劃圖。
為檢驗功能區(qū)劃分結(jié)果的精度,本文從路網(wǎng)分割的5 694個區(qū)塊中,按照置信度95%進行樣本統(tǒng)計計算,最終選取360處樣本區(qū)塊作為檢驗區(qū)域,其空間分布詳見圖9,對比百度地圖進行結(jié)果檢驗,其中315處地塊功能屬性定義符合,功能區(qū)劃分結(jié)果精度達(dá)87.5%。
本文基于遙感影像與互聯(lián)網(wǎng)大數(shù)據(jù)進行城市功能區(qū)語義分類研究,從檢驗結(jié)果來看,精度相對較高。文中將遙感技術(shù)、GIS技術(shù)、統(tǒng)計技術(shù)進行有效結(jié)合,為城市功能用地分類提供了新的思路和模型方法。由于本文語義分類方法主要基于遙感影像及POI數(shù)據(jù),數(shù)據(jù)受區(qū)域局限較小,可方便用于其他區(qū)域研究。
當(dāng)然,POI數(shù)據(jù)進行功能區(qū)語義分類的研究過程中還存在若干技術(shù)問題,例如針對一些基礎(chǔ)的、普遍的POI數(shù)據(jù)分類還沒有一個相對統(tǒng)一的標(biāo)準(zhǔn);建設(shè)用地的提取階段,精度對最終的功能區(qū)分類結(jié)果存在一定程度的影響;采用不同分辨率的遙感影像對精度的影響程度不同;同時,由于POI數(shù)據(jù)僅以“點”的形式存在,無法反映出設(shè)施的邊界、規(guī)模、使用狀況等信息,容易造成多功能區(qū)混分的情況;介于不同功能區(qū)間的道路歸屬問題等。
圖8 研究區(qū)域功能分區(qū)分布圖Fig.8 Urban functional zoning map of the study area
另外,遙感技術(shù)雖然為地學(xué)研究及空間信息應(yīng)用提供了海量的數(shù)據(jù),并且在客觀方面輔助了城市土地管理的監(jiān)察與規(guī)劃,但目前這些數(shù)據(jù)直接為規(guī)劃利用的實例還較少,前人可參考經(jīng)驗不足,仍需在今后繼續(xù)深入進行研究。
圖9 結(jié)果檢驗所需樣本地塊Fig.9 The sample areas for validating the results