衛(wèi) 龍,高紅梅
(1.西南交通大學(xué)信息化與網(wǎng)絡(luò)管理處,四川 成都 610031;2.西南交通大學(xué)交通運(yùn)輸與物流學(xué)院,四川 成都 610031)
?
基于軌跡數(shù)據(jù)挖掘的居民出行特征研究進(jìn)展
衛(wèi) 龍1,高紅梅2
(1.西南交通大學(xué)信息化與網(wǎng)絡(luò)管理處,四川 成都 610031;2.西南交通大學(xué)交通運(yùn)輸與物流學(xué)院,四川 成都 610031)
軌跡數(shù)據(jù)的挖掘方法為研究居民出行特征提供了研究新思路,近年來國(guó)內(nèi)外學(xué)者開展了大量的相關(guān)研究工作。文章從軌跡數(shù)據(jù)挖掘、人類出行行為模型及利用軌跡數(shù)據(jù)挖掘提取居民出行特征三個(gè)方面,總結(jié)了基于軌跡數(shù)據(jù)挖掘的居民出行特征研究進(jìn)展,并提出了目前存在的一些問題以及未來的研究方向。
軌跡數(shù)據(jù);數(shù)據(jù)挖掘;居民出行特征;研究進(jìn)展
在信息時(shí)代,人類產(chǎn)生并積累了大量的位置數(shù)據(jù),如手機(jī)的通話記錄、出租車軌跡、公交卡、社交網(wǎng)絡(luò)位置簽到信息等,這些數(shù)據(jù)記錄了移動(dòng)對(duì)象的行為特征,包括位置、時(shí)間、速度、方向等屬性。這些數(shù)據(jù)按照時(shí)間形成序列,就構(gòu)成了軌跡數(shù)據(jù)。移動(dòng)互聯(lián)網(wǎng)、智能設(shè)備、大數(shù)據(jù)、云計(jì)算、傳感器網(wǎng)絡(luò)、計(jì)算機(jī)存儲(chǔ)等技術(shù)的快速發(fā)展,使得這些軌跡數(shù)據(jù)能夠保存下來,并被處理。
這些軌跡數(shù)據(jù)不僅記錄了人在時(shí)間序列上的位置信息,而且在背后暗含了人與人之間的關(guān)系,人與社會(huì)之間的關(guān)系,人與城市之間的關(guān)系等信息。對(duì)單一對(duì)象而言,個(gè)體的活動(dòng)能夠反映個(gè)體自身的行為特征。對(duì)于群體對(duì)象而言,眾多個(gè)體的活動(dòng)反映了該群體共同的行為特征。同一城市大量移動(dòng)對(duì)象的活動(dòng),則反映了該城市總體的社會(huì)活動(dòng)特征。
城市居民出行特征反映了城市交通的特征。傳統(tǒng)的城市居民出行特征可通過經(jīng)濟(jì)普查、人口普查及居民出行調(diào)查等方法獲取,這些方法不但耗時(shí)耗力,而且實(shí)時(shí)性較差、成本較高。大數(shù)據(jù)時(shí)代的到來,為研究獲取城市居民出行特征提供了豐富的數(shù)據(jù)資源,通過軌跡數(shù)據(jù)挖掘居民出行特征也成為研究熱點(diǎn)之一。較傳統(tǒng)的研究方法相比,基于軌跡數(shù)據(jù)挖掘的居民出行特征方法,有研究數(shù)據(jù)海量化、不需要追加額外的安裝和維護(hù)費(fèi)用、投資成本少等優(yōu)點(diǎn)。
居民出行特征在城市交通和物流等方面有廣泛的應(yīng)用。國(guó)內(nèi)外學(xué)者很早就對(duì)居民出行特征進(jìn)行了一定的研究。但是由于技術(shù)的限制,當(dāng)時(shí)的居民出行特征獲取大多是通過調(diào)查的方式來進(jìn)行,費(fèi)用比較高。毛海虓(2005)[1]在他的博士論文中提到:上海市在1981年初次進(jìn)行交通調(diào)查時(shí),花費(fèi)了約100萬人民幣,作者在1994年參加汕頭市的交通調(diào)查時(shí),60萬人口的城市花費(fèi)了40萬人民幣。同時(shí)他對(duì)居民的出行特征和背后的原因進(jìn)行了分析。國(guó)內(nèi)外很多學(xué)者也通過其他因素分析了居民出行特征。鄧毛穎等(2000)[3]通過分析廣州市1984年、1998年居民出行調(diào)查數(shù)據(jù),發(fā)現(xiàn)居民以生活購(gòu)物為目的的出行范圍最短,而上班出行范圍最遠(yuǎn),上學(xué)與娛樂介于兩者之間。
居民出行特征也是一個(gè)動(dòng)態(tài)變化的過程。周錢(2007)[2]通過綜合分析社會(huì)經(jīng)濟(jì)發(fā)展情況,并研究相關(guān)的居民出行調(diào)查資料,發(fā)現(xiàn)隨著社會(huì)經(jīng)濟(jì)和城市的發(fā)展,我國(guó)城市居民出行特征有了顯著的變化:經(jīng)濟(jì)發(fā)達(dá)地區(qū)中大城市的居民出行特征開始接近于發(fā)達(dá)國(guó)家水平,而中小城市和欠發(fā)達(dá)地區(qū)城市的出行特征和國(guó)外的差別還是比較大。不同城市的居民出行特征是不同的。沈俊江(2011)[10]通過對(duì)安寧市2009年調(diào)查數(shù)據(jù)的分析,發(fā)現(xiàn)中小城市出行次數(shù)高、出行距離不長(zhǎng),以上班上學(xué)出行為主,體力出行比較多,與大城市的出行模式不同。羅典等(2010)[4]用廣州市作為案例,分析了1984年與2005年前后兩次居民出行調(diào)查數(shù)據(jù),發(fā)現(xiàn)隨著經(jīng)濟(jì)的發(fā)展和城市空間的變化,居民出行特征也發(fā)生了變化。由于城市空間的擴(kuò)展,居民出行距離增加,出行頻率也有所提高,居民采用機(jī)動(dòng)車出行的比例大幅度提高。
居民出行特征與性別、年齡也有關(guān)系。Kwan(1999)[5],Kwan etal(2003)[6]發(fā)現(xiàn)不同特征群體出行范圍具有顯著差異。Yuan etal(2011)[7]發(fā)現(xiàn)女性的平均活動(dòng)半徑略高于男性;Kang etal(2010)[8]按照年齡把居民分為四組:20歲以下為少年,20歲到39歲為年輕人,40歲到59歲為中年人,60以上為老年人,他們發(fā)現(xiàn)少年人和老年人一般沒有工作,傾向于圍繞一個(gè)點(diǎn)做比較短的出行,而年輕人和中年人的出行距離要遠(yuǎn)得多;Lenormand et al(2015)[9]則分析了影響出行特征的一些因素,例如性別、年齡和收入等,男人、年輕人和活躍的人相對(duì)于女人、老年人和不活躍的人而言,出行要短一些,而且出行大多是圍繞他們的生活中心進(jìn)行。文獻(xiàn)[8]中的研究數(shù)據(jù)來源于中國(guó),文章[9]研究的數(shù)據(jù)來源于西班牙的巴塞羅拉和馬德里,他們得出的結(jié)論也有不同。
大量軌跡數(shù)據(jù)的積累和數(shù)據(jù)挖掘方法的發(fā)展為研究居民出行特征提供新的思路。與較傳統(tǒng)的研究方法相比,基于軌跡數(shù)據(jù)挖掘的居民出行特征方法,有研究數(shù)據(jù)海量化、不需要追加額外的安裝和維護(hù)費(fèi)用、投資成本少等優(yōu)點(diǎn)。因此,基于軌跡數(shù)據(jù)挖掘的居民出行特征提取,具有比較廣闊的研究?jī)r(jià)值和應(yīng)用前景,也成為了國(guó)內(nèi)外學(xué)者的研究熱點(diǎn)之一。
2.1 數(shù)據(jù)挖掘和軌跡數(shù)據(jù)挖掘
技術(shù)的發(fā)展使得人類的歷史移動(dòng)數(shù)據(jù)能夠被持久化保存,從而形成了時(shí)空軌跡數(shù)據(jù)。每條軌跡由一系列的時(shí)空采樣點(diǎn)構(gòu)成,采樣點(diǎn)有可能包含采樣位置、時(shí)間、運(yùn)動(dòng)速度等屬性信息[11]。軌跡數(shù)據(jù)具有時(shí)空屬性,與一般的數(shù)據(jù)有著不同的特點(diǎn)。軌跡數(shù)據(jù)具有重要的用途,能夠應(yīng)用于交通、能源、智慧城市等方面。軌跡數(shù)據(jù)挖掘目前已經(jīng)成為數(shù)據(jù)挖掘研究領(lǐng)域中的一個(gè)重要分支和新興的研究?jī)?nèi)容。
數(shù)據(jù)挖掘(Data Mining,DM)從提出到現(xiàn)在,已經(jīng)得到了長(zhǎng)足的發(fā)展。它指從大量的數(shù)據(jù)通過特定的算法來發(fā)現(xiàn)隱藏在數(shù)據(jù)背后的信息,提取出人們感興趣的內(nèi)容。數(shù)據(jù)挖掘(Data Mining,DM)與知識(shí)發(fā)現(xiàn)(Knowledge Discovery in Database,KDD)有著緊密的聯(lián)系,數(shù)據(jù)挖掘可以看成是知識(shí)發(fā)現(xiàn)的一個(gè)重要步驟。Fayyad定義“KDD”是從數(shù)據(jù)集中識(shí)別出有效的、新穎的、潛在有用的,以及最終可理解的模式的非平凡過程[12]。數(shù)據(jù)挖掘從20世紀(jì)提出到現(xiàn)在已經(jīng)形成了一些比較成熟的技術(shù),例如統(tǒng)計(jì)技術(shù)、關(guān)聯(lián)規(guī)則分析、決策樹、神經(jīng)網(wǎng)絡(luò)、回歸分析等。
目前,針對(duì)軌跡數(shù)據(jù)的挖掘成為數(shù)據(jù)挖掘領(lǐng)域的前沿課題,很多學(xué)者做了大量的研究[13-16]。特別是Yu Zheng(2015)[13]對(duì)軌跡數(shù)據(jù)挖掘做了一個(gè)綜述,提出了軌跡數(shù)據(jù)挖掘的范例。他從軌跡的數(shù)據(jù)來源、軌跡數(shù)據(jù)的預(yù)處理、軌跡數(shù)據(jù)的管理、軌跡數(shù)據(jù)的不確定性、軌跡模式的數(shù)據(jù)挖掘、異常檢測(cè)、軌跡數(shù)據(jù)轉(zhuǎn)換成其他形式等多個(gè)方面對(duì)軌跡數(shù)據(jù)挖掘進(jìn)行了一個(gè)比較全面的綜述。
2.2 人類出行行為模型
一些學(xué)者在研究人類移動(dòng)性的基礎(chǔ)上提出了一些模型。居民出行特征為這些模型提供了數(shù)據(jù)參考和實(shí)證分析工具。
Song(2010)[18]、Gonzalez(2008)[19]等人研究發(fā)現(xiàn),人類的個(gè)體行為雖然表面上看起來是隨機(jī)的、無序的,但實(shí)際上在時(shí)間上和空間上具有高度的規(guī)律性,人類的某些活動(dòng)行為的可預(yù)測(cè)性甚至可以達(dá)到93%。從這個(gè)意義上講,人類的出行行為可以通過模型來描述和分析。Han(2011)[20]提出了一個(gè)層次的地理模型來模擬實(shí)際的交通系統(tǒng),來分析人類軌跡的分布規(guī)律。Hu(2011)[21]提出了一個(gè)人類和動(dòng)物進(jìn)行遷移的通用模型。Simini[2012][22]在分析重力模型的基礎(chǔ)上,引入隨機(jī)過程,提出了輻射模型,并通過實(shí)例發(fā)現(xiàn)該輻射模型比較符合實(shí)際。周濤(2013)[17]對(duì)人類行為時(shí)間特性的實(shí)證分析和建模,人類行為空間特性的實(shí)證分析和建模,以及人類行為統(tǒng)計(jì)分析的應(yīng)用研究進(jìn)行了綜述,并提出了若干模型。陸鋒(2014)[23]提出隨著定位數(shù)據(jù)的擴(kuò)充,使得個(gè)體移動(dòng)軌跡和相互作用定量化成為可能,同時(shí)信息技術(shù)、地理信息科學(xué)等交叉學(xué)科的發(fā)展為研究提供了有力支撐,他將人類移動(dòng)性的研究歸納為面向人和面向地理空間兩大方向。Meng(2015)[24]提出了三種模型來預(yù)測(cè)人類的出行模式,并利用實(shí)際數(shù)據(jù)來驗(yàn)證這些模型。
這些模型表明人類出行特征具有一定的規(guī)律性,從軌跡數(shù)據(jù)里可以研究居民出行特征。
2.3 利用軌跡數(shù)據(jù)提取居民出行特征
隨著技術(shù)的進(jìn)步,產(chǎn)生了大量的軌跡數(shù)據(jù),例如GPS、出租車數(shù)據(jù)、通話記錄等等。很多學(xué)者利用這些數(shù)據(jù),結(jié)合大數(shù)據(jù)的處理手段,提出了很多方法來研究居民的出行特征。
移動(dòng)電話的通話記錄含有用戶的位置信息(這個(gè)信息通過基站地位可以獲取,定位精度較低),很多學(xué)者通過通話記錄中的位置信息來研究居民的移動(dòng)特征。Ahas等(2005)[25]提出,利用手機(jī)的定位數(shù)據(jù),可以監(jiān)測(cè)人口數(shù)量以及居民出行軌跡,可以預(yù)測(cè)居民的聚集情況,從而提前做出響應(yīng)。軌跡數(shù)據(jù)挖掘結(jié)果的展示也是一個(gè)熱點(diǎn)問題,Ratti等(2006)[26]在分析手機(jī)數(shù)據(jù)的基礎(chǔ)上,利用熱點(diǎn)圖來展現(xiàn)城市居民活動(dòng)時(shí)空變化的結(jié)果。Sohn等(2008)[27]通過研究提出一種基于手機(jī)經(jīng)過觀測(cè)點(diǎn)的時(shí)間和路徑選擇概率來間接取數(shù)據(jù)的方法。Vieira等(2010)[28]通過研究手機(jī)通話和短信數(shù)據(jù)來研究居民出行的密度變化,他們發(fā)現(xiàn)在城市中心區(qū),工作日上午的人類密集程度最高,到了下午,密集程度有所下降,而郊區(qū)周末時(shí),早上和下午的人類密集程度最高。Phithakkitnukoon(2010)[29],Di(2011)[30]從手機(jī)定位數(shù)據(jù),利用外部POI(Point of Interest)和土地利用類型來挖掘人類出行模式。Sevtsuk等(2010)[31]研究了羅馬398個(gè)基站的手機(jī)通話數(shù)據(jù),發(fā)現(xiàn)人類活動(dòng)特征受到人口、設(shè)施以及環(huán)境等多種因素的影響。Zhang Da qiang(2012)[33]考慮利用手機(jī)軌跡數(shù)據(jù)來預(yù)測(cè)用戶的位置。他們從MIT Reality Mining的數(shù)據(jù)庫(kù)中106人,11508個(gè)電話記錄,350000小時(shí)的記錄數(shù)據(jù)中判斷用戶的位置。他們提出了一個(gè)新的機(jī)制NextMe,挖掘在同一個(gè)時(shí)間段內(nèi)訪問同一個(gè)地點(diǎn)的用戶軌跡模式,來提高結(jié)果的準(zhǔn)確性。賴見輝(2014)[34]在博士論文中提出利用移動(dòng)通信定位數(shù)據(jù),采用模糊模式識(shí)別方法來進(jìn)行用戶就業(yè)地和居住地識(shí)別。他以人口普查數(shù)據(jù)和經(jīng)濟(jì)普查數(shù)據(jù)為基礎(chǔ)進(jìn)行了驗(yàn)證,表明方法具有較高的實(shí)用性。
隨著車載GPS的普及和應(yīng)用,尤其是出租車的GPS軌跡信息獲取更為容易。GPS的定位數(shù)據(jù)比較準(zhǔn)確,一些學(xué)者利用GPS軌跡來獲取居民移動(dòng)特征。Hua(2014)[35]結(jié)合地圖信息,從GPS軌跡中挖掘人類運(yùn)行模式。他們先把軌跡分段,尋找特征點(diǎn),再將特征點(diǎn)與地圖進(jìn)行匹配,最后獲取一個(gè)地區(qū)的人類流動(dòng)模式。張俊濤(2015)[36]針對(duì)出租車軌跡數(shù)據(jù),考慮了軌跡的方向和數(shù)量特征,將人類活動(dòng)與高斯定律類比,提出了一種基于高斯定律思想的軌跡挖掘方法,來發(fā)現(xiàn)城市居民的出行行為特征。JianXun Cui(2016)[37]利用哈爾濱城市2013年的出租車GPS數(shù)據(jù)來分析哈爾濱居民的出行需求和運(yùn)輸網(wǎng)絡(luò),并在結(jié)果的基礎(chǔ)上分析城市交通所隱藏的問題。
一些學(xué)者融合了多源數(shù)據(jù)分析居民出行特征。毛峰(2015)[38]結(jié)合了出租車車載GPS數(shù)據(jù)和時(shí)空社交媒體數(shù)據(jù)以及居民出行調(diào)查數(shù)據(jù)來進(jìn)行識(shí)別居民的通勤行為。
一些學(xué)者基于馬爾科夫模型來預(yù)測(cè)居民出行行為。Sadilek(2012)[39]構(gòu)建了一套系統(tǒng)從數(shù)據(jù)中構(gòu)建社會(huì)關(guān)系圖,Baraglia(2013)[40]利用機(jī)器學(xué)習(xí)的方法,從歷史數(shù)據(jù)來預(yù)測(cè)人類未來的出行位置。喬少杰(2015)[41]提出了大數(shù)據(jù)環(huán)境下,移動(dòng)對(duì)象自適應(yīng)軌跡的預(yù)測(cè)模型,他引入基于隱馬爾科夫模型的自適應(yīng)軌跡預(yù)測(cè)模型SATP,對(duì)大數(shù)據(jù)環(huán)境下移動(dòng)海量軌跡利用基于密度的聚類方法進(jìn)行位置密度分區(qū)和高效分段處理,減少HMM的狀態(tài)數(shù)量,并做了實(shí)驗(yàn)。實(shí)驗(yàn)表明,針對(duì)速度隨機(jī)改變的移動(dòng)對(duì)象,其平均預(yù)測(cè)準(zhǔn)確率為84.1%,高于相同情況下的樸素預(yù)測(cè)算法。
目前時(shí)空軌跡數(shù)據(jù)的挖掘是數(shù)據(jù)挖掘研究中的一個(gè)熱點(diǎn)問題。軌跡數(shù)據(jù)挖掘方法的發(fā)展為研究居民出行特征提供了新的思路。但是利用軌跡數(shù)據(jù)挖掘居民出行特征的方法還存在一些問題:
(1)數(shù)據(jù)覆蓋面不足。如利用出租車GPS數(shù)據(jù)來挖掘居民出行特征時(shí),一些很少利用出租車出行的居民的出行特征就無法識(shí)別出來。
(2)目前的一些數(shù)據(jù),由于保護(hù)隱私或者其他原因,缺乏如性別、職業(yè)等特征的數(shù)據(jù),這樣在判斷居民出行特征時(shí)可能缺乏一些關(guān)鍵參數(shù)。
(3)數(shù)據(jù)挖掘中隱私保護(hù)的問題。這個(gè)問題與第(2)個(gè)問題成為一個(gè)矛盾。數(shù)據(jù)關(guān)于個(gè)人參數(shù)的項(xiàng)越多,個(gè)人的隱私的保留的可能性就更大。如何在保護(hù)個(gè)人隱私和挖掘出有用信息之間找到平衡,是一個(gè)值得研究的問題。
(4)軌跡數(shù)據(jù)數(shù)量體量龐大,處理這些數(shù)據(jù)需要技術(shù)的發(fā)展和進(jìn)步。軌跡數(shù)據(jù)本質(zhì)上是非結(jié)構(gòu)化數(shù)據(jù),目前大數(shù)據(jù)處理的幾個(gè)關(guān)鍵技術(shù):Mapreduce[43]技術(shù)和Hadoop[42]平臺(tái)以鍵值對(duì)的形式組織和處理數(shù)據(jù),并不太適合處理時(shí)空數(shù)據(jù)模型。
本文主要對(duì)基于軌跡數(shù)據(jù)挖掘的方法來研究居民出行特征的研究進(jìn)展做了綜述。以下方向值得深入探究:
(1)多源數(shù)據(jù)融合研究。單一數(shù)據(jù)的覆蓋面有限,通過多源數(shù)據(jù)融合挖掘,能夠提高研究居民出行特征的準(zhǔn)確性。但是多源數(shù)據(jù)的挖掘方法與單源數(shù)據(jù)的挖掘方法是不同的,需要新思路和新手段。
(2)數(shù)據(jù)隱私保護(hù)方法研究。個(gè)人數(shù)據(jù)暴露越多,個(gè)人隱私的暴露風(fēng)險(xiǎn)就越大。需要設(shè)計(jì)合適的算法,通過適當(dāng)?shù)臄_亂對(duì)個(gè)人原始數(shù)據(jù)進(jìn)行不可逆加密,但不影響最終的數(shù)據(jù)挖掘結(jié)果,這就需要多學(xué)科交叉以及新的創(chuàng)新。
(3)針對(duì)居民出行特征的軌跡數(shù)據(jù)挖掘框架研究。軌跡數(shù)據(jù)規(guī)模非常龐大,迫切需要高性能的軌跡數(shù)據(jù)挖掘算法。挖掘的數(shù)據(jù)和目的不同,數(shù)據(jù)挖掘的算法和思路也不同??梢葬槍?duì)居民出行特征來設(shè)計(jì)數(shù)據(jù)挖掘框架和高效的挖掘算法。
[1]毛海虓,中國(guó)城市居民出行特征研究[D].北京:北京工業(yè)大學(xué),2005.
[2]周 錢,陸化普,徐 薇,城市居民出行特性比較分析[J].中南公路工程,2007(32):2.
[3]鄧毛穎,謝 理.廣州市居民出行特征分析及交通發(fā)展的對(duì)策[J].城市規(guī)劃,2000,24(11):45-49.
[4]羅 典,甘勇華.城市空間發(fā)展對(duì)居民出行特征的影響研究:以廣州為例[J].交通與運(yùn)輸:學(xué)術(shù)版,2010(1):11-14.
[5]Kwan M P.Gender and individual access to urban opportunities:a study using space-time measure[J].The Professional Geographer,1999,51(2):210-227.
[6]Kwan M P,Lee J.2003.Geovisualization of human activity patterns using 3D GIS:a time-geographic approach[C].//Goodchild M F,Janelle D G.Spatially integrated socialscience.examples in best practice.Oxford,UK:Oxford University Press:48-66.
[7]Yuan Y,Raubal M,Liu Y.Correlating mobile phone usage and travel behavior:a case study of Harbin,China.Computers,Environment and Urban Systems[J].2011,36(2):118-130.
[8]Kang C,Gao S,Lin X,et al.2010.Analyzing and geo-visualizing individual human mobility patterns using mobile records//Liu Y,Chen A.The 18th international conference on geo informatics.Beijing,China:IEEE:1-7802.11a,Part II:Wireless LAN Medium Access Control(MAC)and Physical Layer(PHY)Specification[S].
[9]Lenormand M,Louail T,Cantúros O G,etal.Influence of sociodemographics on human mobility[J].Scientific Reports,2015,5.
[10]沈俊江,何保紅,孫靜怡中小城市居民出行特征分析及交通發(fā)展對(duì)策研究公路工程[J].2011(36):1.
[11]許佳捷,鄭 凱,池明旻,等.軌跡大數(shù)據(jù):數(shù)據(jù)、應(yīng)用與技術(shù)現(xiàn)狀[J].通信學(xué)報(bào),2015,36(12):97-105.
[12]FayyadUM,Piatetsky-ShapiroG,SmythP.Knowledge discovery and data mining:towards a unifying framework[C].//Proceedings of KDD-96:International Conference on Knowledge Discovery and Data Mining.Portland,Oregon:AAAI Press,1996:82-88.
[13]Yu Zheng,Trajectory Data Mining:An Overview.ACM Transaction on Intelligent Systems and Technology,[J].2015,9(6):3,1-41.
[14]吉根林,趙 斌.面向大數(shù)據(jù)的時(shí)空數(shù)據(jù)挖掘綜述[J].南京師大學(xué)報(bào):自然科學(xué)版,2014(1):1-7.
[15]吉根林,趙 斌.時(shí)空軌跡大數(shù)據(jù)模式挖掘研究進(jìn)展[J].數(shù)據(jù)采集與處理,2015,30(1):47-58.
[16]劉大有,陳慧靈,齊 紅,等.時(shí)空數(shù)據(jù)挖掘研究進(jìn)展[J].計(jì)算機(jī)研究與發(fā)展,2013,50(2):225-239.
[17]周 濤,韓筱璞,閆小勇,等.人類行為時(shí)空特性的統(tǒng)計(jì)力學(xué)[J].電子科技大學(xué)學(xué)報(bào),2013,42(4):481-540.
[18]Song C,Qu Z,Blumm N,etal.Limits of predictability in human mobility[J].Science,2010,327(19):1018-1021.
[19]González M C,Hidalgo C A,Barabási A.Understanding individual human mobility patterns[J].Nature,2008,453(7196):779-782.
[20]Han X P,Hao Q,Wang B H,etal.Origin of the scaling law in human mobility:Hierarchy of traffic systems[J].Physical Review E,2011,83(3):036117.
[21]Hu Y,Zhang J,Huan D,etal.Toward a general understanding of the scaling laws in human and animal mobility[J].Europhysics Letters,2011,96(3):38006.
[22]Simini F,González M C,Maritan A,etal.A universal model for mobility and migration patterns[J].Nature,2012,484(7392):96-100.
[23]陸 鋒,劉 康,陳 潔,大數(shù)據(jù)時(shí)代的人類移動(dòng)性研究[J].地球信息科學(xué),2014(16):5.
[24]Meng Chen a,Xiaohui Yu a,b,Yang Liu,Mining moving patterns for predicting next location[J].Information Systems 54(2015)156-168.
[25]Ahas R,Mark U.Location Based Services-New Challenges for Planning and Public Administrations?[J].Futures,2005,37:547-561.
[26]Ratti C, Frenchman D, Pulselli R M, etal.Mobile Landscapes: Using Location Data from Cell Phones for Urban Analysis[J].Environment and Planning B-Planning & Design,2006,33(5):727-748.
[27]Sohn K,Kim D.Dynamic origin-destination flow estimation using cellular communication system[J].Vehicular Technology,IEEE Transactions on.2008,57(5):2703-2713.
[28]Vieira M R,F(xiàn)rias-Martinez V,etal.Characterizing Dense Urban Areas from Mobile Phone-Call Data:Discovery and Social Dynamics[C].IEEE.Second International Conference on Social Computing(Social Com),Minneapolis:(IEEEXplore),2010.
[29]Phithakkitnukoon S,Horanont T,Di Lorenzo G,etal.Activity-aware map:Identifying human daily activity pattern using mobile phone data[M].In:Albert Ali Salah,Theo Gevers,Nicu Sebe,et al.Human Behavior Understanding.Berlin Heidelberg:Springer,2010:14-25.
[30]Di Lorenzo G,Calabrese F.Identifying human spatio-temporal activity patterns from mobile-phone traces[M].Intelligent Transportation Systems(ITSC),2011 14th InternationalIEEE Conference on.IEEE,2011:1069-1074.
[31]Sevtsuk A,Ratti C.Does Urban Mobility Have a Daily Routine?Learning from the Aggregate Data of Mobile Networks [J].Journal of Urban Technology,2010,17(1):41-60.
[32]Lu X,Wetter E,Bharti N,etal.Approaching the limit of predictability in human mobility.[J].Scientific Reports,2013,3(10).
[33]Daqiang Zhang,Athanasios V.Vasilakos,Prediction Location Using Mobile Phone Calls[J].Acm sigcomm Computer Communication Review,2012,295-296.
[34]賴見輝,基于移動(dòng)通信定位數(shù)據(jù)的交通信息提取及分析方法研究[D].北京:北京工業(yè)大學(xué),2014.
[35]Hua Yuan,YuQian,RuiYang,MingRen,Human mobility discovering and movement intention detection with GPS trajectories[J].Decision Support Systems,2014 39-51.
[36]張俊濤,武 芳,張 浩,利用出租車軌跡數(shù)據(jù)挖掘城市居民出行特征[J].地理與地理信息科學(xué),2015(31):6.
[37]JianXun Cui,F(xiàn)eng Liu,Jia Hu,Davy Janssens,Geert Wets,Mario Cools,Identifying mismatch between urban travel demand and transport network services using GPS data:A case study in the fast growing Chinese city of Harbin[J].Neurocomputing,2016(181):4-18.
[38]毛 峰,基于多元軌跡數(shù)據(jù)挖掘的居民通勤行為與城市職住空間特征研究[D].上海:華東師范大學(xué),2015.
[39]Sadilek A,Kautz H,Bigham J P.Finding your friends and following them to where you are[C].//Proceedings of the fifth ACM international conference on Web search and data mining.ACM,2012:723-732.
[40]Baraglia R,Muntean C I,Nardini F M,etal.LearNext:learning to predict tourists movements[C].//Proceedings of the 22nd ACM international conference on Conferenceon information & knowledge management.ACM,2013:751-756.
[41]喬少杰,李天瑞,韓 楠,等.大數(shù)據(jù)環(huán)境下移動(dòng)對(duì)象自適應(yīng)軌跡預(yù)測(cè)模型[J].軟件學(xué)報(bào),2015,26(11):2869-2883.
[42]The Apache Software Foundation.Welcome to Apache Hadoop[EB/OL].[2013-08-10]http://hadoop.apache. org.
[43]Dean J,Ghemawat S.MapReduce:simplified data processing on large clusters[J].Communications of the ACM,2008,51(1):107-113.
Research Progress on Resident Travel Characteristics Based on Trajectory Data Mining
WEI Long1,GAO Hong-mei2
(1.Information Technology and Network Administration Division,Southwest Jiaotong University,Chengdu,Sichuan,610031;2.School of Transportation and Logistics,Southwest Jiaotong University,Chengdu,Sichuan,610031)
The trajectory data mining method provides a new research idea for the study of resident travel characteristics extraction,thus in recent years,the domestic and foreign scholars have done a lot of related research work.From three aspects of trajectory data mining,human travel behavior model,and resident travel characteristics extraction by using the trajectory data mining,this article summarized the research progress of resident travel characteristics based on trajectory data mining,and proposed some existing problems and future research directions.
Trajectory data;Data mining;Resident travel characteristics;Research progress
國(guó)家自然科學(xué)基金“大都市區(qū)物流企業(yè)區(qū)位選擇模式及演化機(jī)理研究:以成都為案例”;(項(xiàng)目號(hào):41501123)
U491.1+22
A
10.13282/j.cnki.wccst.2016.10.022
1673-4874(2016)10-0087-06
2016-09-06
衛(wèi) 龍(1977—),工程師,在讀博士研究生,研究方向:居民出行特征、網(wǎng)絡(luò)安全、數(shù)據(jù)挖掘;
高紅梅(1981—),工程師,在讀博士研究生,研究方向:職住地分布、通信信息、數(shù)據(jù)挖掘。
四川省重大前沿項(xiàng)目“基于信息理論安全的分布式云存儲(chǔ)系統(tǒng)”(項(xiàng)目號(hào):2015JY0282)