国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大數(shù)據(jù)條件下城市用地類型辨識(shí)研究?基于出租車GPS數(shù)據(jù)的動(dòng)態(tài)感知

2016-04-25 01:04:01梁軍輝北京大學(xué)城市與環(huán)境學(xué)院北京100871北京大學(xué)深圳研究生院廣東深圳518055
上海國(guó)土資源 2016年1期
關(guān)鍵詞:城市用地大數(shù)據(jù)分析

梁軍輝,林 堅(jiān),杜 洋(1.北京大學(xué)城市與環(huán)境學(xué)院,北京 100871;2.北京大學(xué)深圳研究生院,廣東·深圳 518055)

?

大數(shù)據(jù)條件下城市用地類型辨識(shí)研究?基于出租車GPS數(shù)據(jù)的動(dòng)態(tài)感知

梁軍輝1,2,林 堅(jiān)1*,杜 洋1,2
(1.北京大學(xué)城市與環(huán)境學(xué)院,北京 100871;2.北京大學(xué)深圳研究生院,廣東·深圳 518055)

摘 要:隨著大數(shù)據(jù)的廣泛應(yīng)用以及城市規(guī)劃管理的智慧化、精細(xì)化轉(zhuǎn)變,土地管理需要豐富城市探查視角,開拓用地分類方式。傳統(tǒng)遙感影像分類具有時(shí)效性低、不能反映真實(shí)用地功能的弊端,而基于價(jià)值密度低、時(shí)效性高的GPS數(shù)據(jù)進(jìn)行土地分類可以有效克服這一不足。本文以深圳市福田區(qū)為案例,通過海量出租車GPS數(shù)據(jù)的時(shí)空挖掘,在驗(yàn)證居民活動(dòng)、出租車上下車活動(dòng)與城市用地類型之間相關(guān)關(guān)系的基礎(chǔ)上,利用SVM監(jiān)督分類算法和粒子群優(yōu)化方法得出的最優(yōu)參數(shù)對(duì)出租車GPS數(shù)據(jù)進(jìn)行分類和準(zhǔn)確率驗(yàn)證。結(jié)果顯示:出租車GPS數(shù)據(jù)的分類結(jié)果與福田實(shí)際的土地利用類別匹配精確度高達(dá)97.16%,可以證明出租車GPS數(shù)據(jù)能夠?qū)崿F(xiàn)對(duì)城市土地利用類型實(shí)時(shí)、精確的動(dòng)態(tài)感知。

關(guān)鍵詞:城市用地;類型辨識(shí);大數(shù)據(jù)分析;SVM算法;動(dòng)態(tài)感知

近年來,隨著信息革命的不斷推進(jìn)和人本主義思想的傳播,城市管理向智慧化、精細(xì)化發(fā)展。土地利用管理領(lǐng)域也在積極轉(zhuǎn)變,改變過去單一依賴遙感影像識(shí)別,帶來的用地分類更新速度慢、僅反映地表物理光譜而不能反映真實(shí)的土地功能等弊端,試圖改變過去對(duì)城市空間的探查視角,通過對(duì)大數(shù)據(jù)的挖掘,一方面實(shí)現(xiàn)對(duì)城市土地快速、實(shí)時(shí)的監(jiān)控;另一方面,挖掘居民活動(dòng)時(shí)空間特征,獲取反映土地功能的城市用地分類。

在此背景下,國(guó)內(nèi)外一些學(xué)者突破傳統(tǒng)的遙感影像識(shí)別方法,使用手機(jī)信令數(shù)據(jù)、出租車活動(dòng)的GPS數(shù)據(jù)、WiFi熱點(diǎn)數(shù)據(jù)、地理位置標(biāo)簽等居民數(shù)字足跡實(shí)現(xiàn)對(duì)土地利用類型的動(dòng)態(tài)感知。劉瑜提出了“社會(huì)感知”的概念,每個(gè)個(gè)體在城市空間中扮演“傳感器”的作用,主張社會(huì)感知數(shù)據(jù)包含了空間互動(dòng)與地方語義學(xué)的豐富信息,超出傳統(tǒng)遙測(cè)數(shù)據(jù)的范疇,并使用上海的出租車GPS數(shù)據(jù)驗(yàn)證了理論的可行性[1];王靜遠(yuǎn)在2014年BCL年會(huì)上提出“城市數(shù)據(jù)畫像”的概念,即大數(shù)據(jù)可以像“X光片”一樣穿透城市物理空間,探查城市空間與土地利用的真實(shí)狀況,并通過北京市微博數(shù)據(jù)反映居民對(duì)城市土地利用的強(qiáng)度?,F(xiàn)階段,已有學(xué)者基于大數(shù)據(jù)進(jìn)行了一些針對(duì)用地分類的實(shí)證研究。Soto等利用CDR(call detail records)數(shù)據(jù),采用模糊C均值聚類算法和K均值聚類算法推斷土地利用類型[2,3],其與現(xiàn)實(shí)用地類型基本相符;Calebrese等基于麻省理工學(xué)院里3000多個(gè)WiFi接收器的時(shí)間序列數(shù)據(jù),借助特征分解方法,區(qū)分出宿舍、圖書館、教室等建筑物類型[4];J.Yuan等利用北京市POI數(shù)據(jù)點(diǎn)和出租車GPS數(shù)據(jù),對(duì)不同區(qū)域的城市用地類型進(jìn)行聚類分析[5];Jameson等應(yīng)用隨機(jī)森林分類算法對(duì)波士頓地區(qū)60多萬匿名手機(jī)用戶三周CDR數(shù)據(jù)進(jìn)行分類,分析了其在居住用地、商業(yè)用地、工業(yè)用地、公園綠地以及其他用地上所表現(xiàn)的時(shí)序特征[6],以此推斷城市用地類型;Gang Pan等利用4000輛出租車數(shù)據(jù),采用改進(jìn)的基于密度的空間聚類算法(DBSCAN),設(shè)計(jì)六個(gè)上下車的動(dòng)態(tài)特征,利用SVM、KNN、LAD、BP四種分類方法進(jìn)行比較,較好實(shí)現(xiàn)了城市土地利用類型的感知[7,8]。

不難看出,基于大數(shù)據(jù)對(duì)城市用地分類的理念和方法進(jìn)行革新,已成為研究的重要方向。但是,總結(jié)已有研究,提高分類精度,實(shí)現(xiàn)時(shí)效性與分類精度二者之間的統(tǒng)一仍是現(xiàn)階段尚未克服的難點(diǎn)。本研究利用深圳市出租車GPS數(shù)據(jù),在研究居民活動(dòng)特征、出租車上下車活動(dòng)與城市用地類型關(guān)系的基礎(chǔ)上,定性分析出出租車起訖點(diǎn)與城市用地類型之間的相關(guān)關(guān)系,利用粒子群優(yōu)化方法和SVM監(jiān)督分類算法定量衡量出出租車起訖點(diǎn)對(duì)城市用地類型的感知精度,最終證明出租車起訖點(diǎn)數(shù)據(jù)能夠準(zhǔn)確感知城市用地類型。

1 研究方法

1.1 基于出租車GPS數(shù)據(jù)的居民活動(dòng)特征與城市用地類型的關(guān)系分析

(1)居民活動(dòng)、出租車上下車活動(dòng)與活動(dòng)場(chǎng)所及其用地類型的關(guān)系探討

居民在一天內(nèi)的活動(dòng)包括一系列的工作活動(dòng)和非工作活動(dòng),其往往沿時(shí)間順序排列,而且表現(xiàn)出社群層面的相對(duì)一致性,如:在工作日,前一晚上在家睡眠,早上離家去工作,下午下班前往超市購(gòu)物或參加娛樂活動(dòng)或直接回家[9,10]。這些活動(dòng)的發(fā)生依賴于相應(yīng)的活動(dòng)場(chǎng)所,活動(dòng)場(chǎng)所性質(zhì)的不同,在一天時(shí)間內(nèi)的不同時(shí)間段吸納的人流量也顯著不同,換言之,透過不同活動(dòng)場(chǎng)所在一天內(nèi)的不同時(shí)段內(nèi)吸納人流量的差異特征,可以推演這一活動(dòng)場(chǎng)所的用地性質(zhì)。

居民在一天中完成不同類型的活動(dòng),活動(dòng)場(chǎng)所隨時(shí)間變化有一定的規(guī)律[11]。圖1表示了居民工作日的活動(dòng)示意圖,橫軸表示活動(dòng)時(shí)間,縱軸表示活動(dòng)發(fā)生地點(diǎn)之間的相對(duì)距離。拐點(diǎn)A表示在居住用地內(nèi)活動(dòng)結(jié)束,并開始產(chǎn)生交通行為;拐點(diǎn)B表示交通行為結(jié)束,并開始在工作地發(fā)生活動(dòng),A和B代表居民活動(dòng)狀態(tài)變化的臨界點(diǎn)。

圖1 居民日常出行活動(dòng)示意圖Fig.1 The spatio-temporal behavior pattern of residents’ daily activity

出租車作為城市重要的交通工具,一定程度上反映了居民的活動(dòng)特征,通過對(duì)一個(gè)活動(dòng)場(chǎng)所不同時(shí)間段的上車量和下車量之差異分析,可以反映該活動(dòng)場(chǎng)所吸納人流量的狀況及時(shí)間分布特征?,F(xiàn)實(shí)中,出租車GPS記錄數(shù)據(jù)由7個(gè)字段構(gòu)成:車牌號(hào)、采集時(shí)間點(diǎn)、經(jīng)度、緯度、車輛狀態(tài)、車速、行車方向。其中,車輛狀態(tài)分為空載(即非打表)和重載(即打表),分別設(shè)定為0和1,從0變?yōu)?表示上車(起點(diǎn)),從1變?yōu)?表示下車(訖點(diǎn))。無疑,上車代表在上車點(diǎn)區(qū)域內(nèi)居民活動(dòng)量減少,下車剛好相反。進(jìn)一步分析,采用出租車下車活動(dòng)剩余量(式1),可以刻畫在某一個(gè)時(shí)間段內(nèi)在某一個(gè)活動(dòng)場(chǎng)所的吸納人流量:

R=D-U(1)

式中,R為出租車下車剩余活動(dòng)量;D為下車活動(dòng)量;U為上車活動(dòng)量。

為此,本文提出假設(shè):將不同地塊范圍內(nèi)不同時(shí)間段內(nèi)出租車下車剩余活動(dòng)量與城市用地類型進(jìn)行關(guān)聯(lián),可以實(shí)現(xiàn)城市用地類型的感知。

(2)城市用地空間分布與出租車??奎c(diǎn)的聯(lián)系特征提取

為了利用出租車GPS數(shù)據(jù)實(shí)現(xiàn)對(duì)城市土地利用類型的感知,首先需提取出租車GPS記錄點(diǎn)中車輛行駛狀態(tài)發(fā)生變化的點(diǎn),即起訖點(diǎn)(由0到1或1到0),然后將其與土地利用現(xiàn)狀圖在ArcGIS10.0平臺(tái)上進(jìn)行疊加分析,根據(jù)距離臨近原則,賦予每個(gè)起訖點(diǎn)臨近地塊的地類圖斑屬性(將道路沿中心線切分,歸并到相鄰地類),最終確定每一個(gè)起訖點(diǎn)所處的用地范圍。對(duì)于每輛出租車一次出行產(chǎn)生的起訖點(diǎn)數(shù)據(jù),同時(shí)具備了時(shí)間、位置屬性以及賦予的,定義地類圖斑屬性(圖2)。

圖2 出租車坐標(biāo)點(diǎn)賦予地類圖斑屬性示意圖Fig.2 Taxi coordinates point given to the land use attribute

1.2 應(yīng)用出租車GPS數(shù)據(jù)對(duì)城市用地分類的感知方法試驗(yàn)及精度檢測(cè)

(1)應(yīng)用出租車GPS數(shù)據(jù)點(diǎn)對(duì)城市用地分類的感知方法:SVM監(jiān)督分類算法

支持向量機(jī)(Support Vector Machine,SVM)分類算法是1995年由Vapnik等人在統(tǒng)計(jì)學(xué)理論的基礎(chǔ)上首先提出的[12],它是一種基于VC維理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小化準(zhǔn)則的學(xué)習(xí)算法。SVM的優(yōu)點(diǎn)在于能夠通過定義核函數(shù)將低維空間的樣本點(diǎn)向高維空間轉(zhuǎn)變,然后在該空間中構(gòu)造最優(yōu)分類面,從而解決數(shù)據(jù)非線性可分的情況[13]。SVM主要包括有一對(duì)多法、一對(duì)一法、決策樹法三種[14,15]。在此,本文選擇根據(jù)一對(duì)一法設(shè)計(jì)的Libsvm多分類工具箱進(jìn)行GPS數(shù)據(jù)點(diǎn)的分類,Libsvm是臺(tái)灣大學(xué)林智仁(Lin Chih-Jen)教授開發(fā)設(shè)計(jì)的一個(gè)簡(jiǎn)單、易于使用和快速有效的SVM模式識(shí)別與回歸軟件包。采用工具箱默認(rèn)的C-SVC模型[16],函數(shù)形式為:

式中,i表示支持向量的個(gè)數(shù);w代表支持向量的系數(shù);b是常數(shù);K(x,Xi)代表核函數(shù)(包括線性核函數(shù)、多項(xiàng)式核函數(shù)、高斯徑向基核函數(shù)和兩層感知器核函數(shù)等)。

在核函數(shù)K(x,Xi)類型選擇上,以往的研究表明,各參數(shù)一致的情況下高斯徑向基核函數(shù)作為映射函數(shù),分類精度相對(duì)較好,其函數(shù)形式如下:

式中,g是核函數(shù)參數(shù),為憑測(cè)試經(jīng)驗(yàn)給定的常數(shù);X表示支持向量,是分類模型對(duì)已知用地類型樣本點(diǎn)進(jìn)行學(xué)習(xí)訓(xùn)練后產(chǎn)生的能夠?qū)⒉煌悇e數(shù)據(jù)分開的數(shù)據(jù)點(diǎn);x表示待分類數(shù)據(jù)點(diǎn)。

(2)SVM監(jiān)督分類算法的關(guān)鍵參數(shù)優(yōu)化:粒子群優(yōu)化算法

在利用SVM進(jìn)行數(shù)據(jù)分類時(shí),有些情況下,在高維空間中仍然會(huì)存在一些離群點(diǎn)??紤]到函數(shù)的容錯(cuò)性,在函數(shù)分類過程中引入懲罰因子C≥0(憑測(cè)試經(jīng)驗(yàn)給定的常數(shù)),控制對(duì)錯(cuò)分樣本的懲罰程度。懲罰因子C用于控制模型復(fù)雜度和逼近誤差,在確定的特征空間中調(diào)節(jié)SVM算法的置信范圍和經(jīng)驗(yàn)風(fēng)險(xiǎn)的比例,其值越大,則數(shù)據(jù)的擬合精度越高。同時(shí),g主要影響樣本數(shù)據(jù)在高維特征空間中分布的復(fù)雜程度,對(duì)模型的分類精度有著重要影響。因此,對(duì)SVM核函數(shù)參數(shù)g和懲罰因子C進(jìn)行優(yōu)化具有重要意義。

粒子群優(yōu)化算法(PSO)由Kennedy和Eberhart于1995年提出,是計(jì)算機(jī)智能領(lǐng)域基于群體智能的優(yōu)化算法,它同遺傳算法類似,通過個(gè)體間的協(xié)作和競(jìng)爭(zhēng)實(shí)現(xiàn)全局搜索[17]。該算法的優(yōu)勢(shì)在于簡(jiǎn)單易行,求解速度快,目前已得到廣泛應(yīng)用。為此,本文利用PSO算法對(duì)g和c進(jìn)行優(yōu)化選擇。

(3)應(yīng)用出租車GPS點(diǎn)數(shù)據(jù)對(duì)城市用地分類辨識(shí)方法的精度檢測(cè)

SVM結(jié)果的分類準(zhǔn)確率檢測(cè)也是驗(yàn)證方法可行性的重要環(huán)節(jié)。用地分類辨識(shí)過程結(jié)束后,將通過分類準(zhǔn)確率予以驗(yàn)證(式4)。

式中,A代表分類準(zhǔn)確率,r代表正確分類個(gè)數(shù),f代表錯(cuò)誤分類個(gè)數(shù)。

2 研究區(qū)域及分析過程

2.1 研究區(qū)域與研究數(shù)據(jù)

本文以深圳市福田區(qū)為研究區(qū)。福田區(qū)位于深圳特區(qū)中部,面積78.8km2,由24km2的中心城區(qū)和深南大道兩側(cè)帶狀經(jīng)濟(jì)開發(fā)區(qū)域及部分丘陵、山地、海灘組成,是深圳市重點(diǎn)開發(fā)建設(shè)的中心城區(qū)。選取該研究區(qū)域的原因在于:(1)土地利用類型豐富,各類用地在該區(qū)域均有體現(xiàn);(2)處于中心城區(qū),人口流動(dòng)量大,可以提供海量的出租車GPS數(shù)據(jù)進(jìn)行問題分析。

本文所使用的數(shù)據(jù)為深圳市2011年土地利用現(xiàn)狀數(shù)據(jù)和2011年4月18日至26日1億多條深圳市出租車GPS數(shù)據(jù)。其中,針對(duì)2011年土地利用現(xiàn)狀數(shù)據(jù),本文結(jié)合深圳市福田區(qū)用地特征,將其分為為綠地(包括園地、林地、草地等)、商服用地、工礦倉(cāng)儲(chǔ)用地、住宅用地、公共管理與公共服務(wù)用地五大類(圖3)。

圖3 深圳福田區(qū)區(qū)位圖Fig.3 The location of Futian district in Shenzhen city

2.2 基于出租車GPS數(shù)據(jù)的居民活動(dòng)特征與城市用地類型的關(guān)系分析

以五大類用地為居民活動(dòng)特征數(shù)據(jù)統(tǒng)計(jì)和分類的基本單元。圖4顯示工作日和休息日里各地類范圍內(nèi)下車剩余活動(dòng)量的時(shí)序特征分布??梢钥闯?,無論在工作日還是休息日,居住用地范圍內(nèi)下車剩余活動(dòng)量在早上7點(diǎn)會(huì)出現(xiàn)負(fù)峰值,而下午6點(diǎn)以后逐漸增加;與之相對(duì)應(yīng),在工作日時(shí),商服用地在早上8點(diǎn)左右會(huì)出現(xiàn)一個(gè)峰值,而在下午7點(diǎn)以后活動(dòng)剩余量迅速下降,在休息日時(shí),商服用地的活動(dòng)剩余量呈現(xiàn)規(guī)律與工作日相近,但峰值降低。除此之外,公共管理與公共服務(wù)用地、工礦倉(cāng)儲(chǔ)用地、綠地等也分別呈現(xiàn)出不同的下車剩余活動(dòng)量變化特征。

圖4 不同地類范圍內(nèi)出租車下車剩余活動(dòng)量時(shí)序特征圖Fig.4 Temporal characteristics of residual activity of taxis in different categories

由于福田區(qū)各類用地面積以及從業(yè)人員數(shù)量的不同,導(dǎo)致地類內(nèi)的上下車活動(dòng)剩余量在數(shù)量級(jí)上存在一定差別,如工業(yè)用地平均每天在9點(diǎn)左右的下車剩余活動(dòng)量還不到100,而商服用地則達(dá)到了400左右。為了便于活動(dòng)特征的比較,本文對(duì)出租車下車剩余活動(dòng)量進(jìn)行Z-score標(biāo)準(zhǔn)化處理,使不同地類相同時(shí)間段內(nèi)的居民活動(dòng)特征變化在同一個(gè)數(shù)量級(jí)上(圖5)。結(jié)果表明,在工作日,居民從居住地出發(fā)分別到工業(yè)用地、商服用地以及公共服務(wù)用地工作,此時(shí)居住用地為一天活動(dòng)的起始點(diǎn),其下車剩余活動(dòng)量則會(huì)出現(xiàn)波谷,而工礦倉(cāng)儲(chǔ)用地、公共管理與公共服務(wù)用地、商服用地由于整體的上班機(jī)制和出行距離的不同,下車剩余活動(dòng)量會(huì)在不同時(shí)間段依次出現(xiàn)波峰。比如商服用地上的活動(dòng)強(qiáng)度在8:30左右達(dá)到波峰,而工業(yè)用地在9:00左右才達(dá)到,公共服務(wù)用地在7:00和9:00左右分別有一個(gè)波峰,但其活動(dòng)強(qiáng)度相對(duì)工礦倉(cāng)儲(chǔ)與商服用地弱;到晚上,居民陸續(xù)回到居住地休息,居住用地下車剩余活動(dòng)量明顯增加,特別是在休息日7:00~9:00期間,該用地整體活動(dòng)明顯比工礦倉(cāng)儲(chǔ)和商服用地要活躍。

由以上分析可知,針對(duì)不同類型的城市用地,其出租車下車剩余活動(dòng)量的時(shí)序特征在工作日、休息日有很強(qiáng)的規(guī)律性。通過出租車起訖點(diǎn)及其臨近地類、時(shí)間信息等,推算不同時(shí)間、地段的出租車下車活動(dòng)剩余量時(shí)空特征,可以推演和感知相應(yīng)的城市用地類型。

圖5 不同地類范圍內(nèi)出租車下車剩余活動(dòng)量時(shí)序特征標(biāo)準(zhǔn)化圖Fig.5 The standard of the time series of the residual activity of the taxi in different categories

2.3 應(yīng)用出租車GPS數(shù)據(jù)對(duì)城市用地分類的感知方法試驗(yàn)與精度檢驗(yàn)

為了較好地衡量出租車GPS數(shù)據(jù)點(diǎn)對(duì)用地類型的感知能力,本文利用粒子群優(yōu)化算法(PSO)來尋找C-SVC模型參數(shù)g和c的最優(yōu)值[18],g和c的尋優(yōu)范圍分別設(shè)定為[10-2,103]和[10-1,102],最大迭代次數(shù)設(shè)定為200,尋優(yōu)結(jié)果如圖6、圖7所示。

從圖6可以看出,測(cè)試樣本的預(yù)測(cè)分類大部分落在實(shí)際分類區(qū)間,最佳參數(shù)c和g則如圖7所示。此時(shí)c=77.2354,g=893.7747,最佳的樣本分類準(zhǔn)確率達(dá)到90%以上。優(yōu)化參數(shù)后的C-SVC模型函數(shù)形式如式5。

圖6 實(shí)際分類與預(yù)測(cè)分類圖Fig.6 The actual classification and prediction classification

圖7 PSO參數(shù)尋優(yōu)準(zhǔn)確率曲線Fig.7 The accuracy rate curve of PSO aprameter optimization

利用福田區(qū)不同用地類型的出租車起訖數(shù)據(jù)點(diǎn)對(duì)C-SVC模型進(jìn)行學(xué)習(xí)訓(xùn)練和準(zhǔn)確率檢測(cè),以確定GPS數(shù)據(jù)點(diǎn)對(duì)應(yīng)的用地類型和最終的分類準(zhǔn)確率。實(shí)驗(yàn)發(fā)現(xiàn),隨著訓(xùn)練集樣本的增多,分類準(zhǔn)確率逐漸提高。本文利用全體數(shù)據(jù)的25%作為訓(xùn)練集,利用剩余的75%的數(shù)據(jù)點(diǎn)作為測(cè)試集進(jìn)行分類準(zhǔn)確率驗(yàn)證,結(jié)果表明整體準(zhǔn)確率達(dá)到97.16%,其中,各地類分類準(zhǔn)確率如表1所示。將分類后的數(shù)據(jù)點(diǎn)轉(zhuǎn)成柵格數(shù)據(jù)與用地現(xiàn)狀圖比較發(fā)現(xiàn),GPS數(shù)據(jù)所識(shí)別出的用地類型和位置與現(xiàn)狀圖具有較高的匹配度,如圖8所示。

表1 各地類分類準(zhǔn)確率Table 1 Classification accuracy rate of each land use category

圖8 用地現(xiàn)狀圖(左)與GPS數(shù)據(jù)點(diǎn)分類圖(右)對(duì)比Fig.8 The comparison of land use category (L) and GPS data points classification (R)

進(jìn)一步將分類后的GPS數(shù)據(jù)點(diǎn)與用地分布圖進(jìn)行疊置,為便于觀察,本文將相同地類的GPS數(shù)據(jù)點(diǎn)與地類圖斑以不同顏色顯示(如圖9)。結(jié)果顯示,絕大部分?jǐn)?shù)據(jù)點(diǎn)分類結(jié)果與地類圖斑是完全對(duì)應(yīng)的。從右側(cè)局部圖可以看到,錯(cuò)分點(diǎn)均出現(xiàn)在地類交接區(qū)域(即道路中心線附近),這種現(xiàn)象的產(chǎn)生一方面是因?yàn)槌鲎廛嘒PS點(diǎn)定位存在精度誤差,另一方面是由于分類模型對(duì)這種交錯(cuò)地帶數(shù)據(jù)點(diǎn)分類能力不強(qiáng),但這些極少數(shù)的錯(cuò)分點(diǎn)并不影響GPS數(shù)據(jù)點(diǎn)對(duì)用地類型準(zhǔn)確感知的能力。

圖9 GPS錯(cuò)分?jǐn)?shù)據(jù)點(diǎn)與用地現(xiàn)狀圖對(duì)比Fig.9 The comparison of GPS data points misclassification and land use category

3 結(jié)論與討論

本文是眾多大數(shù)據(jù)挖掘嘗試的一部分,主要探討居民出行產(chǎn)生的數(shù)字足跡在城市用地類型動(dòng)態(tài)感知中的應(yīng)用。針對(duì)深圳市福田區(qū)案例,通過分析不同用地類型出租車下車活動(dòng)剩余量的時(shí)序特征,觀察到不同城市用地類型在不同時(shí)間段的出租車下車剩余活動(dòng)量具有顯著的差異,并且符合居民活動(dòng)和活動(dòng)場(chǎng)所間的時(shí)空聯(lián)系規(guī)律,支持了應(yīng)用出租車GPS數(shù)據(jù)開展用地動(dòng)態(tài)感知研究的假設(shè);在此基礎(chǔ)上,基于SVM監(jiān)督學(xué)習(xí)分類算法對(duì)樣本點(diǎn)進(jìn)行分類,采用優(yōu)化的模型參數(shù)提高了分類精度,研究表明,采用C-SVC模型,應(yīng)用出租車GPS數(shù)據(jù)對(duì)城市用地類型的感知精度高達(dá)97.16%,具有較好的可行性。

然而,本文分析發(fā)現(xiàn),SVM分類算法雖然獲得了非常好的分類效果,但由于數(shù)據(jù)量龐大、運(yùn)算工具硬件要求高等限制,使得用地分類和辨識(shí)速度相對(duì)較慢,降低了SVM的分類運(yùn)算優(yōu)勢(shì)。此外,出租車GPS數(shù)據(jù)只是居民出行產(chǎn)生的足跡之一,類似WiFi熱點(diǎn)數(shù)據(jù)、地理位置標(biāo)簽數(shù)據(jù)、手機(jī)活動(dòng)數(shù)據(jù)、私人汽車數(shù)據(jù)、POI數(shù)據(jù)等都值得加以利用,若在分析過程中能結(jié)合這些數(shù)據(jù),將有利于更精細(xì)化地感知出更為不同的城市用地類型,這也是值得探索的大數(shù)據(jù)挖掘工作。

參考文獻(xiàn)(References)

[1] Liu Y,Liu X,Gao S,et al.Social sensing:A new approach to understanding our socioeconomic environments[J].Annals of the Association of American Geographers,2015,(4):512-530.

[2] Soto V,Frias-Martinez E.Automated land use identification using cell-phone records[C]//Proceedings of the 3rd ACM international workshop on HotPlanet’11,Bethesda,Maryland,USA,2011.

[3] Soto V,Frias-Martinez E.Robust land use characterization of urban landscapes using cell phone data[C]//Pro-ceedings of the 1st workshop pervasive urban application pervasive,2011:1-8.

[4] Calabrese F,Reades J,Ratti C.Eigenplaces:Segmenting space through digital signatures[J].IEEE Pervasive Computing,2010,9(1):78-84.

[5] Yuan J,Zheng Y,Xie X.Discovering regions of different functions in a city using human mobility and POIs[C]//ACM KDD’12 Beijing,China,2012.

[6] Toole Jameson,Ulm Michael,González Marta,et al.Inferring land use from mobile phone activity[C]//Pro-ceedings of the ACM SIGKDD international workshop on urban computing,2012.

[7] Pan G,Qi G D,Wu Z H,et al.Land-use classification using taxi GPS traces[J].IEEE Transactions on Intelli-gent Transportation Systems,2013,14(1):113-123.

[8] 潘綱,李石堅(jiān),齊觀德,等.移動(dòng)軌跡數(shù)據(jù)與智慧城市[J].中國(guó)計(jì)算機(jī)學(xué)會(huì)通訊,2012,8(5):31-37.Pan G,Li S J,Qi G D,et al.Mobile trajectory data and wisdom city[J].Communication of the China Com-puter Federation,2012,8(5):31-37.

[9] 趙一斌,石心怡,關(guān)志超.基于GIS支持的出行行為時(shí)間空間及序列特征研究[J].中山大學(xué)學(xué)報(bào)(自然科學(xué)版),2010,49(S1):43-47.Zhao Y B,Shi X Y,Guan Z C,et al.An analytical framework for travel-activity pattern analysis:A GIS ap-proach[J].Acta Scientiarum Naturalium Universitatis Sunyatseni,2010,49(S1):43-47.

[10] 申悅,柴彥威.基于GPS數(shù)據(jù)的北京市郊區(qū)巨型社區(qū)居民日?;顒?dòng)空間[J].地理學(xué)報(bào),2013,68(4):506-516.Shen Y,Chai Y W.Daily activity space of suburban megacommunity residents in Beijing based on GPS da-ta[J].Acta Geographica Sinica,2013,68(4):506-516.

[11] 周素紅,鄧麗芳.基于T-GIS的廣州市居民日?;顒?dòng)時(shí)空關(guān)系[J].地理學(xué)報(bào),2010,65(12):1454-1463.Zhou S H,Deng L F.Spatio-temporal pattern of residents' daily activities based on T-GIS:A case study in Guangzhou,China[J].Acta Geographica Sinica,2010,65(12):1454-1463.

[12] Cortes C,Vapnik V.Support vector networks[J].Machine Learning,1995,20(3):273-297.

[13] 肖芳.支持向量機(jī)在數(shù)據(jù)挖掘中的應(yīng)用[C]//第十二屆全國(guó)數(shù)學(xué)地質(zhì)與地學(xué)信息學(xué)術(shù)研討會(huì),2013.Xiao F.Application of support vector machine in data mining[C]//The 11st national workshop on mathematical geosciences and geoiinformatics of China,2013.

[14] 孫德山.支持向量機(jī)分類與回歸方法研究[D].長(zhǎng)沙:中南大學(xué)博士學(xué)位論文,2004.Sun D S.The research on support vector machine classification and regression methods[D].Doctoral disser-tation,Changsha:Central South University,2004.

[15] 焦春鵬.基于二分類SVM的多分類方法比較研究[D].西安電子科技大學(xué)碩士學(xué)位論文,2011.Jiao C P.Comparison study on multi-category classification with binary SVMs[D].Master's thesis,Xi'an:Xidian University,2011.

[16] Chang C C,Lin C J.LIBSVM:A library for support vector machines[Z].2009.

[17] 谷文成,柴寶仁,滕艷平.基于粒子群優(yōu)化算法的支持向量機(jī)研究[J].北京理工大學(xué)學(xué)報(bào),2014,34(7):705-709.Gu W C,Chai B R,Teng Y P.Research on support vector machine based on particle swarm optiminzation[J].Transactions of Beijing Institute of Technology,2014,34(7):705-709.

[18] 王小川,史峰,郁磊,等.MATLAB神經(jīng)網(wǎng)絡(luò)43個(gè)案例分析[M].北京:北京航空航天大學(xué)出版社,2013.Wang X C,Shi F,Yu L,et al.The cases analysis of MATLAB neural network[M].Beijing:Beihang University Press,2013.

Research on the identification of urban land use under the big data condition:Dynamic awareness based on taxi GPS data

LIANG Jun-Hui1,2,LIN Jian1,DU Yang1,2
(1.College of Urban and Enνironmental Sciences,Peking Uniνersity,Beijing 100871,China;2.Shenzhen Graduate School,Peking Uniνersity,Guangdong Shenzhen 518055,China)

Abstract:This paper uses the Shenzhen Futian district as a case study,to mine the massive amounts of taxi GPS data through time and space,for testing the correlation between the activities of residents,on and off taxi,and the urban land use pattern.It classifies the taxi GPS data and verifies its accuracy using the SVM classification algorithm,while the optimal parameters are determined using the particle swarm optimization method.The results show that,the matching accuracy of the classification of the taxi GPS data and the actual land use pattern of Futian district can be as high as 97.16%,which proves that the taxi GPS data can be used for real-time,accurate,dynamic awareness on urban land use pattern.

Key words:urban land use;type identification;big data analysis;SVM algorithm;dynamic awareness

基金項(xiàng)目:國(guó)家自然科學(xué)基金項(xiàng)目(41371534)*通訊作者:林堅(jiān)(教授/博導(dǎo)/北京大學(xué)城市與環(huán)境學(xué)院城市與區(qū)域規(guī)劃系主任):jlin@urban.pku.edu.cn.

作者簡(jiǎn)介:梁軍輝(1989-),男,碩士生,主要研究方向?yàn)槌鞘信c區(qū)域規(guī)劃.

修訂日期:2015-02-04

收稿日期:2015-01-25

doi:10.3969/j.issn.2095-1329.2016.01.007

中圖分類號(hào):F293.22

文獻(xiàn)標(biāo)志碼:A

文章編號(hào):2095-1329(2016)01-0028-05

電子郵箱:1175088379@qq.com

聯(lián)系電話:010-62751176

猜你喜歡
城市用地大數(shù)據(jù)分析
南京都市圈城市用地?cái)U(kuò)展特征分析
SOFM網(wǎng)絡(luò)下的深圳市城市用地功能識(shí)別分析
甘肅省主要城市空間擴(kuò)張協(xié)調(diào)性分析
環(huán)滇池地區(qū)城市用地?cái)U(kuò)張與經(jīng)濟(jì)發(fā)展脫鉤分析
大數(shù)據(jù)分析對(duì)提高教學(xué)管理質(zhì)量的作用
亞太教育(2016年36期)2017-01-17 17:26:50
基于大數(shù)據(jù)分析的電力通信設(shè)備檢修影響業(yè)務(wù)自動(dòng)分析平臺(tái)研究與應(yīng)用
面向大數(shù)據(jù)遠(yuǎn)程開放實(shí)驗(yàn)平臺(tái)構(gòu)建研究
面向大數(shù)據(jù)分析的信息管理實(shí)踐教學(xué)體系構(gòu)建
傳媒變局中的人口電視欄目困境與創(chuàng)新
科技傳播(2016年19期)2016-12-27 14:35:21
大數(shù)據(jù)分析的移動(dòng)端在網(wǎng)絡(luò)課堂教學(xué)中的應(yīng)用
衡阳市| 诏安县| 谢通门县| 延吉市| 南投县| 靖西县| 石景山区| 马尔康县| 凉城县| 揭东县| 拉孜县| 观塘区| 青铜峡市| 明水县| 江陵县| 小金县| 南投县| 德令哈市| 定陶县| 上犹县| 鄂托克前旗| 乌兰浩特市| 鄂伦春自治旗| 达拉特旗| 霍山县| 浦东新区| 巴楚县| 上饶县| 柯坪县| 辽阳县| 华蓥市| 无极县| 石门县| 琼中| 扬中市| 兰考县| 凤翔县| 澄迈县| 孝昌县| 新密市| 山西省|