劉玉強(qiáng), 顧晶晶, 孫 明, 凌 超
(南京航空航天大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院 江蘇 南京 211100)
城市的飛速發(fā)展使人們的出行更加方便,但同時(shí)也帶來(lái)了交通擁堵、資源浪費(fèi)和人口密集的問題。同時(shí),隨著基于位置技術(shù)服務(wù)(location based services,LBS)的普及和設(shè)備計(jì)算能力的提高[1],城市居民的行為將被傳感器收集[2],以生成大量的人類活動(dòng)數(shù)據(jù)集,使得探索現(xiàn)代城市中各種社會(huì)行為規(guī)律,幫助解決快速現(xiàn)代化所帶來(lái)的各種城市問題成為可能。
由于城市處于復(fù)雜并高度動(dòng)態(tài)的環(huán)境下,人群活動(dòng)行為呈現(xiàn)著不同的規(guī)律,如何對(duì)人群活動(dòng)進(jìn)行解釋和預(yù)測(cè)存在著一定難度。本文首先對(duì)城市中的人群活動(dòng)數(shù)據(jù)進(jìn)行預(yù)測(cè)和分析,基于城市人群活動(dòng)數(shù)據(jù)對(duì)城市進(jìn)行區(qū)域劃分,據(jù)此提取城市人群活動(dòng)模態(tài),提出一種基于多模態(tài)融合的人群流量預(yù)測(cè)算法,通過(guò)提取城市區(qū)域之間的多重相關(guān)性來(lái)建立多模態(tài)表示,對(duì)于各種模態(tài)進(jìn)行融合從而提高預(yù)測(cè)的準(zhǔn)確性。本文的貢獻(xiàn)如下:
1) 為了捕獲城市區(qū)域之間的多種相關(guān)性,使用圖卷積算子探索區(qū)域之間的相關(guān)性以建立多模態(tài)并構(gòu)建了四個(gè)相關(guān)性圖,包括區(qū)域間距離圖、流量相似性圖、流量交互性圖和區(qū)域特征相似性圖;
2) 使用帶有注意力機(jī)制的卷積神經(jīng)網(wǎng)絡(luò)模型對(duì)不同的模態(tài)圖進(jìn)行卷積,并在此基礎(chǔ)上進(jìn)行多模態(tài)融合,更好地捕獲區(qū)域之間的差異;
3) 通過(guò)對(duì)上海市真實(shí)數(shù)據(jù)集的實(shí)驗(yàn),證明了所提出的模型可以準(zhǔn)確預(yù)測(cè)人群活動(dòng)流量。
城市流量預(yù)測(cè)是關(guān)乎城市未來(lái)發(fā)展的重要問題。它主要是通過(guò)采集歷史數(shù)據(jù)并用某種數(shù)學(xué)模型來(lái)預(yù)測(cè)未來(lái)的流量情況。交通預(yù)測(cè)有幾種通用方法,包括回歸和時(shí)間序列分析。另外由于城市環(huán)境下人類活動(dòng)數(shù)據(jù)可以應(yīng)用于多種場(chǎng)景,在流量預(yù)測(cè)方面通過(guò)特征可劃分為三類。
城市數(shù)據(jù)流量預(yù)測(cè)算法大多基于時(shí)空特征,由于這些研究通常集中于特定類型的數(shù)據(jù)流量,算法簡(jiǎn)單。文獻(xiàn)[3]提出一種新穎的多視圖子空間聚類算法,適用于小量數(shù)據(jù)集,當(dāng)涉及數(shù)據(jù)種類多,人類活動(dòng)數(shù)據(jù)過(guò)于復(fù)雜的情況下,時(shí)間和空間復(fù)雜度較高,算法的成本消耗大[4]。
基于概率圖模型的城市數(shù)據(jù)流量預(yù)測(cè)算法主要應(yīng)用于數(shù)據(jù)集單一、內(nèi)部聯(lián)系緊密的情況,局限性較大。文獻(xiàn)[5]提出了一種基于動(dòng)態(tài)集群的過(guò)度預(yù)測(cè)框架來(lái)預(yù)測(cè)站點(diǎn)式共享自行車的流量。通過(guò)建立一個(gè)加權(quán)相關(guān)網(wǎng)絡(luò)來(lái)模擬站點(diǎn)之間的關(guān)系,并將具有相似自行車使用模式的相鄰車站動(dòng)態(tài)分組為集群。文獻(xiàn)[6]使用耦合隱馬爾可夫模型 (coupled hidden Markov model, CHMM) 對(duì)從高速公路的環(huán)路檢測(cè)器所收集的數(shù)據(jù)進(jìn)行建模。通過(guò)期望最大化 (expectation-maximization, EM)算法來(lái)擬合模型參數(shù)。
隨著數(shù)據(jù)規(guī)模的增長(zhǎng)和設(shè)備計(jì)算能力的提高,深度學(xué)習(xí)得到了迅速發(fā)展。文獻(xiàn)[7]提出圖卷積神經(jīng)網(wǎng)絡(luò) (graph convolutional network, GCN) 的概念,該方法將光譜圖理論與深層神經(jīng)網(wǎng)絡(luò)聯(lián)系在一起。文獻(xiàn)[8]提出了用于自行車流量預(yù)測(cè)的多圖卷積網(wǎng)絡(luò),但是該方法沒有考慮到自行車流量區(qū)域其他的空間相關(guān)性。文獻(xiàn)[9]提出了一種基于數(shù)據(jù)驅(qū)動(dòng)的擴(kuò)散卷積遞歸神經(jīng)網(wǎng)絡(luò) (diffusion convolutional recurrent neural network, DCRNN)。但是,這些方法都針對(duì)特定種類的人群流,難以適應(yīng)其他流量預(yù)測(cè)問題。文獻(xiàn)[10]提出了一種使用空間圖卷積為人群流量預(yù)測(cè)問題構(gòu)建多視圖圖卷積網(wǎng)絡(luò)模型,這種方法需要積累長(zhǎng)時(shí)間的數(shù)據(jù),并且很難在高度動(dòng)態(tài)的城市環(huán)境中進(jìn)行。
通過(guò)分析以上研究現(xiàn)狀,現(xiàn)有研究工作中有大量關(guān)于城市人群活動(dòng)數(shù)據(jù)的流量預(yù)測(cè)的工作,但是主要是通過(guò)解決問題中的眾多約束或圖形模型來(lái)執(zhí)行帶有一些環(huán)境變量的交通量預(yù)測(cè)。環(huán)境方面的變量很多,用戶無(wú)法考慮所有這些變量,這也使優(yōu)化變得極其復(fù)雜且難以解決。
城市環(huán)境中收集的數(shù)據(jù)主要由傳感器收集的分散的GPS數(shù)據(jù)點(diǎn)組成。在城市復(fù)雜的地理環(huán)境中,無(wú)法直接用GPS數(shù)據(jù)點(diǎn)執(zhí)行相應(yīng)的建模。本文基于OPTICS (ordering points to identify the clustering structure) 算法提出了一種改進(jìn)后的基于熱度值的城市區(qū)域形成(heat-ordering points to identify the clustering structure, Heat-OPTICS) 算法,將城市區(qū)域劃分為相同大小的網(wǎng)格,然后使用區(qū)域劃分算法形成具有不同規(guī)模邊界的城市熱區(qū) (urban heat region, UHR)。
本文使用PageRank值來(lái)衡量區(qū)域活動(dòng)的程度,其中PageRank值計(jì)算公式為
其中:outj表示第j個(gè)網(wǎng)格流出流量的大?。籌i表示第i個(gè)網(wǎng)格流出流量目的地網(wǎng)格的集合;R表示網(wǎng)格總數(shù);?和a表示控制PageRank值大小的參數(shù)。PageRank值PRi為網(wǎng)格i的區(qū)域流行度。
如圖1所示,本文的模型框架圖包括三個(gè)部分:數(shù)據(jù)準(zhǔn)備、模型構(gòu)建以及學(xué)習(xí)預(yù)測(cè)。在數(shù)據(jù)準(zhǔn)備過(guò)程中,城市人群流量數(shù)據(jù)以小時(shí)為間隔劃分,共T個(gè)小時(shí)。通過(guò)劃分市區(qū),確定了流量預(yù)測(cè)任務(wù)是區(qū)域級(jí)別的。
圖1 模型框架圖
整個(gè)城市用加權(quán)圖G=(V,R,A)表示,其中:V和R表示節(jié)點(diǎn)數(shù)(根據(jù)區(qū)域劃分算法劃分)和邊集合;A∈RV×V表示節(jié)點(diǎn)的鄰接矩陣。其中每個(gè)節(jié)點(diǎn)擁有Z個(gè)屬性,每個(gè)屬性表示與區(qū)域相關(guān)的人群流量,設(shè)定Ft∈RV×Z從而對(duì)歷史數(shù)據(jù)集以小時(shí)為時(shí)間間隔(Ft-h~Ft)來(lái)構(gòu)建圖信號(hào)。人群活動(dòng)行為會(huì)受到天氣、溫度、假期和該地區(qū)興趣點(diǎn)類型等因素的影響,將這些因素作為數(shù)據(jù)的補(bǔ)充屬性。
在模型構(gòu)建中,對(duì)于人群活動(dòng)數(shù)據(jù)以及區(qū)域?qū)傩蕴卣魍ㄟ^(guò)基于注意力機(jī)制的圖卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。為了捕獲該信息城市區(qū)域之間存在的多重相關(guān)性,本文構(gòu)建四個(gè)相關(guān)圖:區(qū)域間距離圖、流量相似性圖、流量交互性圖、區(qū)域特征相似性圖,并使用多模態(tài)融合將這些包含有額外信息的圖作為人群活動(dòng)流量圖的補(bǔ)充信息,從而更好地進(jìn)行人群流量預(yù)測(cè)。
在學(xué)習(xí)和預(yù)測(cè)過(guò)程中,首先將人群活動(dòng)數(shù)據(jù)應(yīng)用于基于注意力機(jī)制的圖卷積神經(jīng)網(wǎng)絡(luò)。對(duì)于其他相關(guān)圖,使用全連接神經(jīng)網(wǎng)絡(luò)通過(guò)多模態(tài)融合來(lái)完成學(xué)習(xí)預(yù)測(cè)。本文的人群流量預(yù)測(cè)問題就是去學(xué)習(xí)函數(shù)f(),來(lái)預(yù)測(cè)未來(lái)一段時(shí)間的圖信號(hào),函數(shù)映射關(guān)系為
用dist(i,j)表示網(wǎng)格i的中心與網(wǎng)格j之間的歐氏距離。隨后,將網(wǎng)格i的熱點(diǎn)值定義為
其中neii表示圍繞i的一組網(wǎng)格。顯然,i周圍的網(wǎng)格越受歡迎,Hi的熱點(diǎn)值越高。接下來(lái),將當(dāng)前熱點(diǎn)網(wǎng)格可訪問的剩余網(wǎng)格添加到這些新群集中,并重復(fù)此過(guò)程,直到所有網(wǎng)格都被加入到群集并且沒有創(chuàng)建新群集為止。算法1為 Heat-OPTICS 算法的偽代碼。
算法1Heat-OPTICS
Input: Grids, PRth, Maximum radius eps, Hth, Minpts
Output: center point of clusters order=[c1, c2, …, cn], UHRs
Initialization: UHRs←?, V←?, get HeatPoint, PopPoint, Q←HeatPoint
1: for each unprocessed set p of Q do
2:for g of p do
3: if g∈V then
4: Continue
5: R←Cluster (g, PopPoint, HeatPoint)
6: if |HeatPoint∩R|≤Minpts then
7: V←V∪R
8: UHRs←UHRs∪{R}
9:increase PRth, Hth, Minpts
10: get HeatPoint, PopPoint
11: Q←HeatPoint-V
12: for each x of Grids-Q do
13: computer Reachable Distance to each Point x in Order
14: if Reachable Distance 15: HOIs←x 16: return UHRs 為了更好地捕獲城市區(qū)域之間的空間依賴性,假設(shè)兩個(gè)較近的城市區(qū)域之間有更加緊密的聯(lián)系。另外,區(qū)域特征、流量頻率以及流動(dòng)模式的相似性對(duì)于人群活動(dòng)預(yù)測(cè)也有不可忽視的影響?;谶@些考慮,本文構(gòu)建城市區(qū)域之間的四種相關(guān)性圖。 2.2.1構(gòu)建區(qū)域間距離圖 在城市地區(qū)中,地理位置相近的區(qū)域會(huì)受到同一事件的影響,為此,本文構(gòu)造了一個(gè)區(qū)域距離相關(guān)圖Gd=(V,Rd,Ad),其公式為 其中:dist(i,j)為計(jì)算任意兩個(gè)區(qū)域中心i和j之間的距離;指數(shù)函數(shù)為模擬城市區(qū)域之間的距離相關(guān)性;為了控制Ad的稀疏性,將距離閾值設(shè)置為Thd;bd的目的是將Ad調(diào)整為合適的尺寸。 2.2.2構(gòu)建流量相似性圖 若想在某個(gè)區(qū)域中找到人群流動(dòng)模態(tài)時(shí),可以參考其他具有相似人群流動(dòng)模態(tài)的區(qū)域。為此,構(gòu)造流量相似性圖Gs=(V,Rs,As),具體公式為 式中使用協(xié)方差矩陣C來(lái)計(jì)算相關(guān)系數(shù)。另外,為了控制As的稀疏性,將距離閾值設(shè)置為Ths;bs的目的是將As調(diào)整為適當(dāng)?shù)拇笮 ?/p> 2.2.3構(gòu)建流量交互性圖 從人群活動(dòng)流量的歷史記錄中可以獲取城市區(qū)域之間的交換流量。為此,構(gòu)造流量交換圖Gu=(V,Ru,Au),用于對(duì)兩個(gè)區(qū)域之間的交易交互頻率的編碼。具體公式為 其中Γ表示歸一化函數(shù),并且為了控制Au的稀疏性,設(shè)置了距離閾值為Thd。 2.2.4構(gòu)建區(qū)域特征相似性圖 區(qū)域之間特征的差異也會(huì)影響區(qū)域間人口活動(dòng)。為此,構(gòu)造區(qū)域特征圖Gp=(V,Rp,Ap),以測(cè)量?jī)蓚€(gè)區(qū)域之間興趣點(diǎn)特征的相似性。具體公式為 式中:nj表示屬于j類的興趣點(diǎn)的數(shù)量;Ni表示位于網(wǎng)格i上的所有興趣點(diǎn)的數(shù)量,通過(guò)網(wǎng)格總數(shù)R和包括第j個(gè)種類的興趣點(diǎn)網(wǎng)格總數(shù)rj的商,對(duì)其取對(duì)數(shù),來(lái)衡量網(wǎng)格中興趣點(diǎn)的重要性。使用協(xié)方差矩陣C來(lái)計(jì)算相關(guān)系數(shù),具體計(jì)算公式為 Cij=E[(Fi-E(Fi))(Fj-E(Fj))]。 在這項(xiàng)工作中,采用頻譜圖卷積來(lái)構(gòu)建城市人群流量的多種相關(guān)性的卷積算子,為了方便起見,設(shè)定圖卷積算子為*,其中={Ap,As,Au,Ad},利用圖的拉普拉斯算子L定義為 其中:DA∈RV×V是鄰接矩陣A的度矩陣;ΨA∈RV×V和ΛA∈RV×V分別表示特征向量的矩陣形式和特征值矩陣。根據(jù)以上定義,在傅里葉域中將具有圖形信號(hào)F∈RV×Z和濾波器θ∈Rk的圖卷積定義為 θ* H(l)=ReLU(θ*F:,c),c∈[0,Z), 式中:F:,c表示取F矩陣的第c列。ReLU為非線性激活函數(shù),并且在每個(gè)傳播層中加入?yún)?shù)化的注意力引導(dǎo)機(jī)制,注意力機(jī)制傾向于選擇對(duì)于區(qū)域i影響更大的區(qū)域,對(duì)其給予更高的關(guān)聯(lián)程度。對(duì)于區(qū)域i的輸出為 其中:節(jié)點(diǎn)i到節(jié)點(diǎn)j在第l層的余弦距離代表了節(jié)點(diǎn)i到j(luò)的關(guān)聯(lián)程度。 為了更好地將人群流視圖的潛在表示與相關(guān)屬性融合在一起,采用基于參數(shù)矩陣的多模態(tài)融合方法,計(jì)算公式為O=W1⊙O1+W2⊙O2+W3⊙O3+W4⊙O4,其中:W1,…,W4是多模態(tài)中的區(qū)域可調(diào)參數(shù),分別代表各種相關(guān)效應(yīng)的程度;O1,…,O4表示基于注意力機(jī)制的圖卷積神經(jīng)網(wǎng)絡(luò)的輸出值;⊙表示向量?jī)?nèi)積。為了更好地適應(yīng)突發(fā)性情況,使用基于門控機(jī)制的多模態(tài)融合:sigmoid(Oext)⊙O,Oext表示額外特征如天氣、節(jié)假日等;最終的人群流量預(yù)測(cè)最終輸出為:Ft=f(O+sigmoid(Oext)⊙O)。 其中:ThL表示用于限制損失函數(shù)大小的閾值(默認(rèn)為1)。假設(shè)W是基于注意力神經(jīng)網(wǎng)絡(luò)的訓(xùn)練參數(shù),則可以轉(zhuǎn)化為優(yōu)化問題: Ft[i,c]代表從第i行到第c列的流量。 本文對(duì)于基于多模態(tài)融合的人群流量預(yù)測(cè)模型(MFCFP)進(jìn)行了廣泛的實(shí)驗(yàn)研究,并與五種預(yù)測(cè)算法進(jìn)行對(duì)比。在兩個(gè)不同的數(shù)據(jù)集分別進(jìn)行了兩組實(shí)驗(yàn),評(píng)估所提出的MFCFP算法的有效性和參數(shù)敏感性,同時(shí)還測(cè)量了使用不同的相關(guān)圖進(jìn)行空間依賴建模的效果。 本文使用兩個(gè)不同的上海市人群流量數(shù)據(jù)集,詳細(xì)信息如下。 摩拜單車:真實(shí)的摩拜單車數(shù)據(jù)包括2018年2月—2019年3月由173 202輛共享自行車在上海產(chǎn)生的754 327 310條行駛記錄。每條記錄均包括車輛ID、上車和下車時(shí)間、經(jīng)緯度信息等。 出租車:出租車的真實(shí)GPS軌跡數(shù)據(jù)集,時(shí)間段為2016年6月—2016年7月。每條記錄包括出租車ID、時(shí)間、經(jīng)緯度等信息。區(qū)域劃分和圖構(gòu)造方法與摩拜單車數(shù)據(jù)集設(shè)置相同。 本文將提出的MFCFP算法與其他五種人群流量預(yù)測(cè)算法進(jìn)行了對(duì)比,同時(shí)還選擇沒有經(jīng)過(guò)多模態(tài)融合的結(jié)果進(jìn)行對(duì)比。其他預(yù)測(cè)算法介紹如下。 歷史平均數(shù)(historical average,HA):直接使用過(guò)去一段時(shí)間的平均人群流量作為預(yù)測(cè)。 向量自回歸[11](vector auto regression,VAR):是自回歸模型在多元上的一個(gè)擴(kuò)展版本,可以對(duì)區(qū)域之間的相關(guān)性進(jìn)行建模。 梯度提升回歸樹(gradient boosting regression tree,GBRT):梯度提升回歸樹由Python的sklearn軟件包實(shí)現(xiàn)。最佳參數(shù)是通過(guò)網(wǎng)格搜索自動(dòng)獲得的。 基于注意力機(jī)制的圖卷積神經(jīng)網(wǎng)絡(luò)(attention-based graph convolutional network,AGCN):構(gòu)建了一個(gè)三層圖卷積神經(jīng)網(wǎng)絡(luò),其中輸入是前六個(gè)時(shí)間步長(zhǎng)的流量,而輸出是接下來(lái)的六個(gè)時(shí)間步長(zhǎng)的流量。 擴(kuò)散卷積遞歸神經(jīng)網(wǎng)絡(luò)(DCRNN)[8]:擴(kuò)散卷積遞歸神經(jīng)網(wǎng)絡(luò)使用道路網(wǎng)絡(luò)建立非歐幾里得的區(qū)域關(guān)系,并通過(guò)將圖卷積集成到門控循環(huán)單元中來(lái)建模時(shí)空依賴性。 表1顯示了在不同算法下兩個(gè)數(shù)據(jù)集的人群活動(dòng)流量預(yù)測(cè)的誤差值。其中本文算法MFCFP在所有測(cè)試中均表現(xiàn)最佳,已用黑體標(biāo)出。與僅使用單個(gè)相關(guān)圖的AGCN相比,MFCFP使用模態(tài)融合,因?yàn)镸FCFP算法可以更好地補(bǔ)充區(qū)域之間的相關(guān)性,補(bǔ)充信息更加充分,因此誤差通常低于AGCN。此外,在這些測(cè)試中,AGCN、DCRNN和MFCFP的效果要優(yōu)于其他指標(biāo),這表明捕獲城市人群活動(dòng)預(yù)測(cè)的時(shí)空依賴性具有重要意義,并且可以更好地執(zhí)行人群活動(dòng)預(yù)測(cè)。MFCFP比DCRNN更好,主要是因?yàn)锳GCN和MFCFP模型使用市區(qū)之間的相關(guān)性作為補(bǔ)充信息來(lái)更好地提取城市的時(shí)空依賴性,而DCRNN使用的信息相對(duì)較少。GBRT作為決策樹集成模型,在摩拜單車數(shù)據(jù)集上表現(xiàn)良好,甚至優(yōu)于VAR,但在出租車數(shù)據(jù)集上表現(xiàn)較差。這可能是由于其數(shù)據(jù)集的效率更高,并且GBRT很難解決出租車的高度稀疏性,因此這個(gè)數(shù)據(jù)集無(wú)法滿足該方法的性能要求。 表1 不同算法下人群活動(dòng)流量預(yù)測(cè)的誤差值 為了研究多模態(tài)融合的效果,使用單個(gè)相關(guān)圖來(lái)預(yù)測(cè)摩拜單車數(shù)據(jù)集的人群活動(dòng)流量,將時(shí)間步長(zhǎng)設(shè)置為6,相關(guān)圖分別是區(qū)域間距離圖、流量交互性圖、流量相似性圖和區(qū)域特征相似性圖(表2)。如表2中黑體所示,MFCFP模型總是比僅使用單個(gè)相關(guān)性的其他圖更好,這表明所提取的區(qū)域之間的相關(guān)性是有效的,并且這些空間相關(guān)性可以更好地進(jìn)行人群流量預(yù)測(cè),因此它們包括有意義的先驗(yàn)知識(shí)。僅使用單個(gè)相關(guān)圖的模型具有相似的結(jié)果,并且使用區(qū)域興趣點(diǎn),相似關(guān)系的模型誤差要小于使用其他相關(guān)圖的模型,這可能是由于人群地區(qū)之間的活動(dòng)主要影響因素是區(qū)域興趣點(diǎn)的特征。城市中的人流往往是出于對(duì)某些特征興趣點(diǎn)感興趣,例如購(gòu)物中心、電影院等,這意味著區(qū)域之間的特征興趣點(diǎn)對(duì)于預(yù)測(cè)偏遠(yuǎn)人群的流向更為重要。 表2 多個(gè)相關(guān)圖的誤差值 本文提出了一種多模態(tài)融合人群流量預(yù)測(cè)模型MFCFP。該模型由基于注意力機(jī)制的圖的卷積神經(jīng)網(wǎng)絡(luò)組成,用于預(yù)測(cè)城市不規(guī)則區(qū)域的流入和流出。MFCFP不僅利用城市間距離的相關(guān)性,而且還利用流量相似性、流量交互性以及區(qū)域特征相似性來(lái)更好地捕獲時(shí)間和多個(gè)空間相關(guān)性。最后,使用上海市兩個(gè)不同的真實(shí)數(shù)據(jù)集評(píng)估了MFCFP模型。實(shí)驗(yàn)結(jié)果表明,本文所提出的MFCFP方法可以很好地預(yù)測(cè)人群活動(dòng)的流量。2.2 使用相關(guān)圖對(duì)區(qū)域相關(guān)性進(jìn)行編碼
2.3 基于注意力機(jī)制的圖卷積網(wǎng)絡(luò)
2.4 多模態(tài)融合
3 實(shí)驗(yàn)與分析
3.1 數(shù)據(jù)集
3.2 實(shí)驗(yàn)設(shè)置
3.3 實(shí)驗(yàn)結(jié)果
4 總結(jié)