閆學(xué)東,郭浩楠,李永昌,王云*,官云林
(1.北京交通大學(xué),綜合交通運(yùn)輸大數(shù)據(jù)行業(yè)重點(diǎn)實(shí)驗(yàn)室,北京100044;2.山東省交通規(guī)劃設(shè)計(jì)院集團(tuán)有限公司,濟(jì)南250031)
隨著我國城鎮(zhèn)化進(jìn)程的快速推進(jìn),大城市的輻射帶動(dòng)能力不斷增強(qiáng),都市圈作為一種新型空間形態(tài)應(yīng)運(yùn)而生。都市圈以一個(gè)或多個(gè)中心城市為核心,能夠吸引輻射周邊地區(qū),促進(jìn)相互聯(lián)系與合作,帶動(dòng)區(qū)域經(jīng)濟(jì)社會(huì)發(fā)展,對(duì)于我國新型城鎮(zhèn)化建設(shè)具有重要意義,也因此得到了學(xué)術(shù)界與社會(huì)各界的廣泛關(guān)注。國外自上世紀(jì)50年代便開始了對(duì)都市圈的相關(guān)研究,并將其作為一種地域統(tǒng)計(jì)與管理單位,服務(wù)于社會(huì)經(jīng)濟(jì)建設(shè)。國內(nèi)學(xué)者自上世紀(jì)80年代末起對(duì)都市圈界定問題展開了初步探究。但由于對(duì)研究問題認(rèn)知的差異性,不同研究領(lǐng)域?qū)W者對(duì)都市圈的界定標(biāo)準(zhǔn)不盡相同,產(chǎn)生了包括“都市區(qū)”“大都市區(qū)”“城市群”“都市連綿區(qū)”等一系列概念。
不同的定義與界定標(biāo)準(zhǔn)導(dǎo)致都市圈在空間尺度、影響范圍等方面無法形成統(tǒng)一認(rèn)知,這不僅不利于相關(guān)理論研究的深入開展,同時(shí)也會(huì)嚴(yán)重影響政府部門規(guī)劃工作的有序?qū)嵤R虼?,如何合理劃分都市圈區(qū)域范圍及其結(jié)構(gòu)特征對(duì)學(xué)術(shù)界和規(guī)劃領(lǐng)域都具有十分重要的意義,更是開展和推動(dòng)有關(guān)都市圈研究的基礎(chǔ)和前提。
早期國外學(xué)者主要采用土地及人口規(guī)模作為評(píng)判指標(biāo),隨后引入通勤率、城市化水平等進(jìn)一步反映區(qū)域間的經(jīng)濟(jì)社會(huì)聯(lián)系強(qiáng)度,強(qiáng)調(diào)了核心區(qū)與外圍區(qū)域之間的人口空間活動(dòng)情況。日本將外圍區(qū)域到中心區(qū)域的通勤比例超過15%作為都市圈界定的閾值,美國將通勤率作為大都市區(qū)范圍界定的唯一指標(biāo)[1]。
在我國,都市圈這一大尺度的城市空間組織問題最早受到地理及規(guī)劃領(lǐng)域人文學(xué)者的關(guān)注。但受限于早期交通調(diào)查制度不完善,通勤率相關(guān)數(shù)據(jù)難以獲取,學(xué)者們多選取人口與經(jīng)濟(jì)規(guī)模、非農(nóng)化水平等作為都市圈界定的主要指標(biāo)。周一星[2]等采用外圍縣區(qū)非農(nóng)化水平來界定都市圈范圍。寧越敏[3]等發(fā)現(xiàn),相比于非農(nóng)化水平,外圍地區(qū)的城鎮(zhèn)化水平更合適用來界定都市區(qū)范圍。
研究表明,都市圈這一概念著重強(qiáng)調(diào)區(qū)域間的經(jīng)濟(jì)社會(huì)聯(lián)系。早期研究中采用的非農(nóng)化或城鎮(zhèn)化等宏觀經(jīng)濟(jì)指標(biāo)則注重于區(qū)域本身的屬性劃分,無法完全體現(xiàn)區(qū)域間的關(guān)系。居民通勤作為城市居民活動(dòng)的必要組成部分,能反映大城市郊區(qū)化發(fā)展及人口外遷所導(dǎo)致的出行空間變化,是區(qū)域間經(jīng)濟(jì)社會(huì)聯(lián)系的直觀體現(xiàn)。張沛[1]等在研究中指出,通勤率仍是都市圈范圍界定中最為合理的指標(biāo)。與此同時(shí),我國自上世紀(jì)八十年代起逐步開始進(jìn)行大城市居民出行調(diào)查,這一舉措為利用通勤數(shù)據(jù)進(jìn)行都市圈范圍界定的研究提供了有利條件。但調(diào)查周期長(zhǎng),人工成本高等固有問題使調(diào)查數(shù)據(jù)的時(shí)效性與準(zhǔn)確性難以保證。
近年來,隨著大數(shù)據(jù)技術(shù)的廣泛應(yīng)用,通過手機(jī)信令數(shù)據(jù)、交通刷卡數(shù)據(jù)等對(duì)居民通勤問題展開研究已成為現(xiàn)實(shí)。Jiangping Zhou[4]等利用刷卡數(shù)據(jù)對(duì)北京市小汽車和公交的通勤效率進(jìn)行對(duì)比分析。有保障的數(shù)據(jù)來源與不斷突破的挖掘技術(shù)為都市圈區(qū)域劃分及層級(jí)結(jié)構(gòu)研究提供了新方向。王德[5]等利用手機(jī)信令數(shù)據(jù)識(shí)別用戶居住地與工作地,根據(jù)區(qū)域間的通勤聯(lián)系對(duì)上海都市區(qū)的邊界及區(qū)域劃分展開研究。隨著共享經(jīng)濟(jì)和網(wǎng)約出行的發(fā)展,順風(fēng)車服務(wù)憑借其便捷、經(jīng)濟(jì)、舒適等優(yōu)點(diǎn),在高峰期間主要用于居民通勤出行[6]。與傳統(tǒng)出租車與??燔囅啾?,順風(fēng)車可以提供跨區(qū)乃至跨城市的出行服務(wù),且隨著服務(wù)范圍增加,有利于獲得更加全面的區(qū)域間聯(lián)系的數(shù)據(jù),為開展都市圈相關(guān)研究提供了必要的數(shù)據(jù)支撐。與手機(jī)信令數(shù)據(jù)相比,順風(fēng)車出行數(shù)據(jù)可以提供更加直觀、全過程、全信息的通勤數(shù)據(jù),更有利于區(qū)域間通勤聯(lián)系的直接獲取。
本文利用京津冀地區(qū)網(wǎng)約順風(fēng)車訂單數(shù)據(jù)與POI 數(shù)據(jù),使用基于網(wǎng)格的K-means++聚類方法對(duì)北京都市圈區(qū)域劃分進(jìn)行研究,確定北京都市圈功能區(qū)域范圍。進(jìn)一步使用層次聚類法,結(jié)合不同功能區(qū)域內(nèi)通勤特征對(duì)北京都市圈層級(jí)結(jié)構(gòu)展開研究。研究成果可為有關(guān)部門制定都市圈規(guī)劃與管理政策提供依據(jù)。
(1)順風(fēng)車訂單數(shù)據(jù)
該數(shù)據(jù)字段包括訂單編號(hào)、出發(fā)時(shí)間、到達(dá)時(shí)間、出發(fā)城市、到達(dá)城市、行程、費(fèi)用等15個(gè)屬性字段。提取京津冀市域范圍內(nèi)2017年5月-7月的網(wǎng)約順風(fēng)車訂單數(shù)據(jù),通過對(duì)數(shù)據(jù)的預(yù)處理及清洗得到共計(jì)1200余萬條有效數(shù)據(jù)。
對(duì)訂單行程距離進(jìn)行統(tǒng)計(jì)分析后發(fā)現(xiàn),居民出行距離分布如圖1所示,出行距離的99%分位數(shù)為100 km,在后續(xù)研究中將京津冀范圍內(nèi)順風(fēng)車服務(wù)距離定義為100 km。對(duì)工作日與非工作日不同時(shí)間的訂單數(shù)量統(tǒng)計(jì)如圖2所示,發(fā)現(xiàn)順風(fēng)車在工作日6:00-10:00 與16:00-19:00 期間相較于非工作日同時(shí)段訂單量劇增。
圖1 行程距離百分位數(shù)分布圖Fig.1 Travel distance percentile distribution
圖2 工作日與非工作日訂單量分布對(duì)比Fig.2 Comparison order volume distribution on workdays and weekend
(2)順風(fēng)車早高峰通勤特性
考慮到晚高峰期間居民出行目的多樣化,如通勤、休閑、購物、娛樂等,故選用工作日早高峰期間順風(fēng)車訂單數(shù)據(jù),分析訂單起點(diǎn)與終點(diǎn)的空間分布情況,得到訂單起終點(diǎn)核密度圖,如圖3所示。
圖3 順風(fēng)車訂單數(shù)據(jù)起終點(diǎn)分布Fig.3 Distribution of density of departure and destination of carpooling data
從圖3可以看出,早高峰期間順風(fēng)車訂單數(shù)據(jù)起點(diǎn)主要集中在回龍觀、天通苑、望京、四惠、通州、亦莊、良鄉(xiāng)等區(qū)域,訂單終點(diǎn)則主要集中在上地、望京、中關(guān)村、金融街、豐臺(tái)科技園等區(qū)域,這些熱點(diǎn)區(qū)域與北京市交通發(fā)展年報(bào)[7]中六環(huán)內(nèi)主要居住地與就業(yè)地分布熱點(diǎn)區(qū)域一致。因此,由早高峰訂單起終點(diǎn)分布情況可以間接說明順風(fēng)車在早高峰期間主要用于通勤出行。
基于上述結(jié)果,假設(shè)順風(fēng)車通勤訂單為起止時(shí)間均在工作日6:00-10:00 的訂單,可以根據(jù)訂單字段中的出發(fā)時(shí)間與到達(dá)時(shí)間,篩選兩個(gè)時(shí)間戳均在工作日6:00-10:00 的順風(fēng)車訂單,并作為通勤訂單數(shù)據(jù),用于后續(xù)研究。
(3)興趣點(diǎn)數(shù)據(jù)
興趣點(diǎn)(Point of Interes,POI)數(shù)據(jù),指與居民日常生活相關(guān)的各類設(shè)施的信息點(diǎn),包括住宅小區(qū)、公司企業(yè)、購物中心、娛樂場(chǎng)所等。企業(yè)與公司作為開展經(jīng)濟(jì)活動(dòng)的主要場(chǎng)所,POI數(shù)據(jù)作為能夠反映不同企業(yè)位置及數(shù)量分布的數(shù)據(jù)可以映射不同空間的經(jīng)濟(jì)活動(dòng)強(qiáng)度。本文利用高德地圖獲取覆蓋京津冀范圍的12大類共計(jì)87萬余條POI數(shù)據(jù)。
為避免以往研究中以交通小區(qū)或行政區(qū)域?yàn)榛狙芯繂卧鶎?dǎo)致的尺度不一、空間不連續(xù)等問題[8]。本文將研究區(qū)域劃分為網(wǎng)格,采用空間網(wǎng)格作為標(biāo)準(zhǔn)研究單元,將數(shù)據(jù)映射到網(wǎng)格中,實(shí)現(xiàn)數(shù)據(jù)統(tǒng)一均衡分布,再結(jié)合土地利用屬性確定都市圈內(nèi)不同功能區(qū)域。
利用順風(fēng)車訂單行程分布情況,設(shè)定本文研究區(qū)域,該區(qū)域要能夠包含北京都市圈的可能范圍。由前文可知,99%的順風(fēng)車訂單行程小于100 km,故先以北京市區(qū)五環(huán)為邊界,并向四周延伸100 km設(shè)定為研究區(qū)域,并將該區(qū)域劃分為100×100個(gè)方形柵格,如圖4所示。該范圍將包含幾乎全部順風(fēng)車訂單,便于開展進(jìn)一步研究。
圖4 網(wǎng)格模型研究范圍Fig.4 Research scope of grid model
將清洗后的順風(fēng)車訂單數(shù)據(jù)匹配至網(wǎng)格中,由于初始研究區(qū)域范圍選取較大,部分網(wǎng)格中的出行量極少。計(jì)算初始研究區(qū)域范圍內(nèi)每個(gè)網(wǎng)格中的早高峰均出行量,將日均出行量少于1次的網(wǎng)格定義為無效網(wǎng)格,并將其剔除,可以消除缺少數(shù)據(jù)的網(wǎng)格對(duì)后續(xù)聚類分析產(chǎn)生的影響,減少計(jì)算量。最終得到有效網(wǎng)格分布情況及其早高峰期間出行OD量分布如圖5所示。圖5中OD分布是順風(fēng)車數(shù)據(jù)在網(wǎng)格模型中的直觀展示,可將獲取的POI數(shù)據(jù)匹配至網(wǎng)格中,結(jié)合網(wǎng)格中多重?cái)?shù)據(jù)屬性,利用聚類算法確定北京都市圈具體范圍。
圖5 有效網(wǎng)格起訖點(diǎn)訂單量分布Fig.5 Origin-destination order quantity distribution of valid grid
以K-means 為代表的基于劃分的聚類方法和以DBSCAN為代表的基于密度的聚類方法是當(dāng)前利用交通大數(shù)據(jù)進(jìn)行區(qū)域劃分研究中最常用的兩種方法。由于本文以每個(gè)網(wǎng)格作為數(shù)據(jù)點(diǎn),同時(shí)包含位置、起訖點(diǎn)(OD)數(shù)量、POI信息等多重屬性,而DBSCAN 算法在聚類過程中無法考慮多重?cái)?shù)據(jù)屬性,故本文結(jié)合復(fù)雜屬性的K-means類算法進(jìn)行網(wǎng)格聚類。K-means 聚類算法在實(shí)際應(yīng)用中的主要問題在于需事先給定聚類數(shù)值k,且隨機(jī)選取的聚類中心可能導(dǎo)致完全不同的聚類結(jié)果[9]。
(1)k值選取
在選取聚類數(shù)k值時(shí)用到的方法主要有手肘法和輪廓系數(shù)法:手肘法的判斷依據(jù)是誤差平方和(Sum of Squared Errors,SSE)。隨著聚類數(shù)增加,每個(gè)簇的聚合程度會(huì)大幅增加,隨之SSE的下降幅度較大。當(dāng)聚類數(shù)增大到真實(shí)類別數(shù)目后,k值增加將不會(huì)顯著提高聚合程度,SSE 下降幅度也會(huì)變小,隨后趨于平緩。所以會(huì)在SSE-k圖中形成下降趨勢(shì)變緩,形似肘部的區(qū)域,該手肘部對(duì)應(yīng)的k值即為恰當(dāng)?shù)木垲悢?shù)。具體計(jì)算方法為
式中:Ci為第i個(gè)簇;x為Ci簇中的樣本點(diǎn);ui為簇Ci的質(zhì)心。
輪廓系數(shù)法是通過對(duì)聚類合理程度進(jìn)行有效度量來選擇恰當(dāng)?shù)木垲悢?shù)k值[10],計(jì)算公式為
當(dāng)k值分布較廣時(shí),單獨(dú)使用手肘法會(huì)面臨手肘部不明顯,且會(huì)在多個(gè)位置出現(xiàn)肘部,無法準(zhǔn)確判斷聚類數(shù)k的情況;而單獨(dú)使用輪廓系數(shù)法,會(huì)出現(xiàn)當(dāng)與的值都比較大且,此時(shí)的輪廓系數(shù)S值可能會(huì)較大,但其實(shí)樣本x與簇中其他樣本距離較遠(yuǎn),緊湊程度較低的情況,影響聚類效果。因此,結(jié)合使用手肘法與輪廓系數(shù)法,有利于選擇恰當(dāng)?shù)木垲悢?shù)k值。
(2)初始點(diǎn)選擇
在初始點(diǎn)選擇方面,K-means++聚類算法改進(jìn)了傳統(tǒng)K-means 中隨機(jī)選取初始點(diǎn)的方式。它強(qiáng)調(diào)聚類中心間的距離盡可能的遠(yuǎn),即假設(shè)已經(jīng)選取了n個(gè)初始聚類中心,在選取第n+1 個(gè)聚類中心時(shí),距離當(dāng)前n個(gè)聚類中心越遠(yuǎn)的點(diǎn)會(huì)有更高的概率被選擇。這種初始聚類中心選擇方式能夠顯著改善聚類效果。
將獲取的POI 數(shù)據(jù)匹配至篩選獲得的有效網(wǎng)格中,每個(gè)網(wǎng)格中將包含網(wǎng)格所處位置、順風(fēng)車訂單量所表征的通勤出行OD 量,以及POI 數(shù)據(jù)所反映的土地使用情況等三大類屬性,部分樣本數(shù)據(jù)如表1所示。
表1 聚類數(shù)據(jù)格式示例Table 1 Example of clustering data format
首先計(jì)算不同聚類數(shù)k值手肘法與輪廓系數(shù)法中關(guān)鍵指標(biāo)參數(shù)。因網(wǎng)格數(shù)量較多且分布散亂,本文展示k取30~50時(shí)聚類效果明顯的SSE與輪廓系數(shù)進(jìn)行比選。結(jié)合前文分析,應(yīng)當(dāng)選取同時(shí)使得SSE 值處于手肘部且輪廓系數(shù)較大的k值,如圖6中所示,最佳聚類數(shù)應(yīng)為42。
圖6 不同k 值時(shí)兩種系數(shù)的分布Fig.6 Distribution of two coefficients at different k values
使用基于網(wǎng)格的K-means++聚類算法得到對(duì)北京市都市圈范圍內(nèi)42類功能區(qū)。將早高峰期間目的地為北京中心區(qū)的出行量與該區(qū)域總出行量之比定義為通勤率,參考張沛[1]對(duì)都市圈范圍界定研究中的結(jié)論,以出行量超過2000 同時(shí)通勤率大于5%為閾值進(jìn)一步篩選,最終得到圖7所示的19個(gè)北京都市圈主要功能區(qū)。值得注意的是,雖然天津市早高峰期間出行總量較多,有44萬余條,但其通勤率不足5%,故未能被劃分于北京都市圈功能區(qū)中。從宏觀角度來看,天津市作為省級(jí)行政區(qū)域與直轄市,自身城市功能較為完善,可在區(qū)域范圍更廣的京津冀城市群有關(guān)研究中作為主要中心城市之一展開單獨(dú)研究。
圖7 北京都市圈功能區(qū)劃分結(jié)果Fig.7 Result of functional area division of Beijing metropolitan area
功能區(qū)根據(jù)其與所在行政區(qū)域相對(duì)位置進(jìn)行命名,但并不代表整個(gè)行政區(qū)域。圖8為聚類功能區(qū)與現(xiàn)有行政區(qū)域?qū)Ρ?,兩者具有顯著差異性,涿州市、廊坊市、香河縣等一些行政劃分不屬于北京市的區(qū)域在聯(lián)系度層面反而強(qiáng)于延慶區(qū)、平谷區(qū)等一些北京市郊區(qū)。因此在北京市城市及交通整體建設(shè)中,如果僅從自身行政區(qū)域角度進(jìn)行規(guī)劃設(shè)計(jì)是不夠的,必須考慮北京都市圈影響范圍進(jìn)行統(tǒng)一規(guī)劃,還需針對(duì)不同功能區(qū)域特性提出對(duì)應(yīng)的發(fā)展方向。
圖8 北京都市圈功能區(qū)與行政區(qū)劃分對(duì)比Fig.8 Comparison of functional areas and administrative are as in Beijing metropolitan area
得到北京都市圈主要功能區(qū)域劃分結(jié)果后,利用訂單起止時(shí)間篩選到順風(fēng)車通勤訂單數(shù)據(jù),針對(duì)不同功能區(qū)的通勤強(qiáng)度、通勤時(shí)空分布特征、通勤可達(dá)性等特征進(jìn)行分析,并利用其通勤特征屬性圍繞北京都市圈的層級(jí)結(jié)構(gòu)劃分開展相關(guān)研究。
(1)通勤強(qiáng)度
在研究功能區(qū)通勤強(qiáng)度時(shí),定義功能區(qū)內(nèi)早高峰期間的OD 數(shù)量為該功能區(qū)的通勤強(qiáng)度(Commuting Intensity,CI)指標(biāo),通勤強(qiáng)度的計(jì)算公式為
式中:ICI(A)為功能區(qū)A的通勤強(qiáng)度;OA為早高峰期間從功能區(qū)A出發(fā)的訂單量;DA為早高峰期間到達(dá)A的訂單數(shù)量。計(jì)算得到各個(gè)功能區(qū)的通勤強(qiáng)度ICI(單位:萬輛)如圖9所示。
圖9 功能區(qū)通勤強(qiáng)度指標(biāo)分布Fig.9 Distribution of functional area commuting intensity
(2)區(qū)域獨(dú)立性
除通勤強(qiáng)度指標(biāo)外,還可以引入功能區(qū)獨(dú)立性(Regional Independence,RI)表示功能區(qū)的通勤聯(lián)系度。通過外來通勤率(External Commuting Rate,ECR)與外出通勤率(Outgoing Commuting Rate,OCR)分析某個(gè)功能區(qū)在早高峰期間與其他功能區(qū)之間的通勤聯(lián)系,其計(jì)算公式為
若某功能區(qū)的獨(dú)立性高,則說明在早高峰期間其外出通勤與外來通勤都較少,該功能區(qū)具備較為完善且均衡的職住分布;若某功能區(qū)的獨(dú)立性低,則說明其早高峰期間的外出通勤或外來通勤較高,該功能區(qū)可能是居住地主導(dǎo)的通勤發(fā)生地或商業(yè)發(fā)達(dá)的通勤吸引地,或是該區(qū)域職住分布不合理導(dǎo)致的無法就近就業(yè)。經(jīng)計(jì)算得到各個(gè)功能區(qū)的獨(dú)立性指標(biāo)IRI如圖10所示。
圖10 功能區(qū)獨(dú)立性指標(biāo)分布Fig.10 Distribution of functional area regional independence
從圖10 可以發(fā)現(xiàn),北京中心區(qū)的通勤強(qiáng)度與獨(dú)立性都較高,說明該區(qū)域內(nèi)的綜合功能較為齊全,既有大量的工作崗位,又能提供足夠的居住環(huán)境,且該功能區(qū)內(nèi)的居民傾向于在本區(qū)域內(nèi)工作。其他功能區(qū)域隨著與中心區(qū)之間距離增加,通勤強(qiáng)度在逐漸下降,結(jié)合功能區(qū)獨(dú)立性指標(biāo)可以將其原因歸結(jié)為兩方面:一方面是隨著距離增加,部分距離北京市中心區(qū)較遠(yuǎn)的功能區(qū)域如廊坊、涿州、高碑店等,形成了獨(dú)立發(fā)展的組團(tuán),其區(qū)域獨(dú)立性較高,外出通勤與外來通勤需求都有所下降,且在本區(qū)域內(nèi)使用順風(fēng)車通勤的意愿不強(qiáng)。另一方面是部分獨(dú)立性較差的功能區(qū)域如朝陽外、回龍觀、通州等,即使存在與其他區(qū)域尤其是北京中心區(qū)之間較多的通勤需求,但由于通勤時(shí)間和金錢成本的急劇增大,使得其與其他區(qū)域的通勤聯(lián)系強(qiáng)度減弱。由于都市圈范圍較大,城市軌道交通往往無法服務(wù)遠(yuǎn)郊層的居民,應(yīng)當(dāng)通過發(fā)展市郊鐵路提高遠(yuǎn)郊層對(duì)都市圈中心層的可達(dá)性,為遠(yuǎn)郊層通勤客流提供快速、便捷、大運(yùn)量的服務(wù),將有利于推動(dòng)都市圈的進(jìn)一步快速發(fā)展。
(3)通勤時(shí)間
在研究功能區(qū)的通勤時(shí)空分布時(shí),平均通勤時(shí)間能夠直觀反映功能區(qū)內(nèi)居民通勤出行特征,統(tǒng)計(jì)各功能區(qū)早高峰期間出發(fā)訂單的出行時(shí)間,得到功能區(qū)平均外出通勤時(shí)間為
式中:TA為早高峰期間從功能區(qū)A出發(fā)訂單的平均通勤時(shí)間;NA為早高峰期間從功能區(qū)A出發(fā)的所有通勤訂單量;tn為第n條訂單的通勤時(shí)間。圖11 為計(jì)算得到的各功能區(qū)早高峰期間的平均外出通勤時(shí)間。
圖11 功能區(qū)通勤時(shí)間分布Fig.11 Distribution of commuting time based on functional area
從圖11可以發(fā)現(xiàn),早高峰期間北京都市圈內(nèi)順風(fēng)車平均通勤時(shí)長(zhǎng)超過80 min,絕大多數(shù)功能區(qū)的外出通勤時(shí)間在120 min以內(nèi),密云、平谷、燕郊、懷柔、固安等部分功能區(qū)的通勤時(shí)間較長(zhǎng),超過2 h。
(4)可達(dá)性
可達(dá)性指從某個(gè)區(qū)域到達(dá)另一區(qū)域的容易程度,根據(jù)不同標(biāo)準(zhǔn)和計(jì)算方法,可達(dá)性分為多種類型。累積機(jī)會(huì)法也稱等時(shí)間線法和等值線法,使用一定閾值內(nèi)能夠到達(dá)活動(dòng)點(diǎn)的數(shù)量表示可達(dá)性,該值越大表示可達(dá)性越高。
在研究功能區(qū)的可達(dá)性時(shí),利用劃分好的功能區(qū)之間的通勤量OD矩陣及其通勤時(shí)間信息,采用累積機(jī)會(huì)法計(jì)算不同功能區(qū)的通勤可達(dá)性,即
計(jì)算每個(gè)功能區(qū)內(nèi)的通勤指標(biāo),并進(jìn)行min-max標(biāo)準(zhǔn)化處理,得到結(jié)果如表2所示。
表2 用于層次聚類的通勤特征指標(biāo)Table 2 Commuting characteristic index for hierarchical clustering
都市圈功能區(qū)內(nèi)的通勤特征指標(biāo)不僅可以反映都市圈的通勤特征現(xiàn)狀,還可以用于都市圈層級(jí)結(jié)構(gòu)劃分。根據(jù)功能區(qū)的通勤特征差異性可以將其劃分為不同類別,不同類別的功能區(qū)構(gòu)成了都市圈的層級(jí)結(jié)構(gòu)。本文針對(duì)已有的19 個(gè)功能區(qū),選取凝聚式層次聚類方法結(jié)合其通勤特征進(jìn)行層次聚類,分析不同功能區(qū)在都市圈中的層級(jí)位置。
凝聚式層次聚類算法將每個(gè)對(duì)象作為一個(gè)類,然后將這些類合并為越來越大的類,直至所有對(duì)象都在同一個(gè)類中或滿足某種終止條件,其算法流程如下。
Step 1 將每個(gè)對(duì)象看作一類,計(jì)算兩兩之間的最小距離;
Step 2 將距離最小的兩個(gè)類合并成一個(gè)新類;
Step 3 重新計(jì)算新類與所有類之間的距離;
Step 4 重復(fù)Step 2 和Step 3,直到所有類合并成一類或達(dá)到某個(gè)結(jié)束條件。
當(dāng)每一類中只包含一個(gè)單獨(dú)功能區(qū)時(shí),類之間的距離為
式中:D(x),y指x與y兩個(gè)類之間的距離;xn和yn分別為類x與y之間的第n個(gè)特征變量。
當(dāng)一類中包含多個(gè)功能區(qū)時(shí),以屬于不同類中的兩兩功能區(qū)之間歐氏距離的均值作為兩類的距離,計(jì)算公式為
式中:A,B,C,E為4個(gè)不同的功能區(qū)。
結(jié)合不同功能區(qū)中的通勤特征變量,對(duì)北京市都市圈19 個(gè)功能區(qū)進(jìn)行凝聚式層次聚類,得到的聚類結(jié)果如圖12所示。
圖12 層次聚類結(jié)果樹狀圖Fig.12 Dendrogram of hierarchical clustering results
圖12 清晰地顯示了層次聚類過程:當(dāng)設(shè)置最終聚類數(shù)量為2 類時(shí),如圖中最右側(cè)虛線所示,北京中心區(qū)被單獨(dú)劃分為一類,剩余所有功能區(qū)歸為一類;當(dāng)最終聚類數(shù)為3時(shí),如圖中間虛線所示,北京中心區(qū)為一類,燕郊、懷柔區(qū)、固安縣、密云區(qū)為一類,剩下所有功能區(qū)為一類;當(dāng)最終聚類數(shù)為4類時(shí),如圖中最左側(cè)虛線所示,所有功能區(qū)被劃分為4 個(gè)組團(tuán),北京中心區(qū)為一類,燕郊、懷柔區(qū)、固安縣、密云區(qū)(組團(tuán)1)為一類,房山區(qū)、順義區(qū)、廊坊市、香河縣、高碑店市、涿州市(組團(tuán)2)為一類,通州南部、昌平東南、大興區(qū)、昌平西南、通州區(qū)、朝陽外、回龍觀地區(qū)、石豐門地區(qū)(組團(tuán)3)為一類。
根據(jù)功能區(qū)的特征變量及聚類結(jié)果可以發(fā)現(xiàn),北京中心區(qū)由于其通勤強(qiáng)度高、可達(dá)性優(yōu)異,在聚類過程中始終單獨(dú)屬于一類,故在進(jìn)行都市圈層級(jí)劃分時(shí),應(yīng)當(dāng)將其定義為都市圈核心層;在劃分為4類時(shí),得到了3類特征明顯的組團(tuán),組團(tuán)1和組團(tuán)2都與北京中心區(qū)距離較遠(yuǎn),組團(tuán)3距離北京中心區(qū)較近,可將組團(tuán)1 與組團(tuán)2 合并作為北京都市圈的外層,組團(tuán)3定義為北京都市圈的中層。
結(jié)合聚類分析結(jié)果與不同功能區(qū)地理區(qū)位特征,可以將北京都市圈劃分為如圖13所示的3個(gè)層級(jí):北京中心區(qū)為核心層;由組團(tuán)2 內(nèi)的功能區(qū)構(gòu)成的第二層級(jí)——近郊層;由組團(tuán)1 和組團(tuán)2 內(nèi)功能區(qū)共同構(gòu)成的第三層級(jí)——遠(yuǎn)郊層。結(jié)合不同圈層的通勤指標(biāo)特征,可對(duì)相關(guān)功能區(qū)的后續(xù)發(fā)展規(guī)劃提供參考,例如通過建設(shè)市域或市郊軌道交通解決遠(yuǎn)郊層面臨的通勤困境,增強(qiáng)與其他區(qū)域間的通勤聯(lián)系,有助于都市圈的良性發(fā)展。
圖13 北京都市圈三級(jí)層級(jí)結(jié)構(gòu)Fig.13 Three level hierarchical structure of Beijing metropolitan area
本文以京津冀區(qū)域?yàn)檠芯繉?duì)象,基于順風(fēng)車訂單數(shù)據(jù)與城市POI數(shù)據(jù),使用聚類算法實(shí)現(xiàn)北京都市圈主要功能區(qū)域界定、層級(jí)結(jié)構(gòu)劃分。本文方法有效劃分了北京都市圈的19 個(gè)主要功能區(qū)域及3級(jí)圈層結(jié)構(gòu)。結(jié)果表明,功能區(qū)與現(xiàn)有行政區(qū)域劃分具有差異性,在未來規(guī)劃建設(shè)中,應(yīng)當(dāng)圍繞都市圈功能區(qū)域劃分與圈層結(jié)構(gòu)進(jìn)行綜合規(guī)劃,破除行政邊界對(duì)都市圈基礎(chǔ)設(shè)施建設(shè)與通勤交通發(fā)展的束縛;提高都市圈核心層與外圍圈層之間的通勤可達(dá)性是促進(jìn)都市圈發(fā)展的關(guān)鍵任務(wù)。由于都市圈范圍內(nèi)的通勤方式多樣且數(shù)據(jù)難以全部獲取,本文只采用和分析了順風(fēng)車訂單數(shù)據(jù),對(duì)功能區(qū)篩選條件也比較簡(jiǎn)單,后續(xù)可融合多源數(shù)據(jù)對(duì)都市圈的區(qū)域劃分進(jìn)行更加深入的研究。