国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

公交通勤個體出行特征圖譜構(gòu)建及相似性判別

2020-08-24 03:01:20翁劍成
關(guān)鍵詞:刷卡公共交通相似性

梁 泉,翁劍成,周 偉,榮 建

(1.交通運(yùn)輸部管理干部學(xué)院 道路教研部,北京 101601;2.北京工業(yè)大學(xué) 城市交通學(xué)院,北京100124;3.中華人民共和國交通運(yùn)輸部,北京100736)

0 引 言

公共交通作為受眾最廣、影響最大的出行方式,已成為通勤乘客出行的主體[1]。目前北京市公共交通通勤乘客日均客流300 萬人,日均出行時間54 min,日均出行距離19.4 km,通勤交通在城市交通系統(tǒng)中舉足輕重[2]。

為進(jìn)一步提高公共交通服務(wù)水平,滿足公共交通乘客出行需求,精確掌握乘客出行特征尤為重要。以往的公交出行特征提取主要通過抽樣問卷、走訪調(diào)研、網(wǎng)絡(luò)調(diào)查等手段完成。周錢等[3]應(yīng)用結(jié)構(gòu)方程模型等提煉出行特征參數(shù);V.S.WALLE等[4]結(jié)合調(diào)查數(shù)據(jù)分析了公交出行的時空特征;王珂[5]通過調(diào)查軌道沿線家庭居住和通勤情況,分析了居民的通勤方式、時耗和費(fèi)用等特征;楊敏等[6]通過出行者空間特征分析,提出了出行者家庭和工作因素是出行模式選取的重要因素。但由于調(diào)查成本高,調(diào)查樣本往往偏少且覆蓋面窄,故小樣本居民出行調(diào)查對出行總體特征描述精確度不夠,無法實(shí)現(xiàn)公共交通出行特征的精細(xì)化提取[7]。同時,以往研究集中反映宏觀交通運(yùn)行狀態(tài),缺乏對個體出行特征的描述[8-9]。事實(shí)上,個人屬性存在較大差異,從個體交通出行特征入手則能更科學(xué)地獲取乘客出行規(guī)律。

伴隨云計(jì)算、互聯(lián)網(wǎng)+等新興技術(shù)快速發(fā)展,公交系統(tǒng)智能化水平極大提升,可實(shí)現(xiàn)每位公共交通出行者出行交易過程和車輛運(yùn)行狀態(tài)信息記錄,綜合網(wǎng)絡(luò)通信、地理信息、GPS定位及電子控制等,形成了個體交通出行多源數(shù)據(jù),為更加準(zhǔn)確和精細(xì)化的公交出行特征提取奠定了數(shù)據(jù)支撐。戴霄等[10]分別提出了基于線路與公交IC卡數(shù)據(jù)的出行特征分析方法;J.J.BARRY等[11]融合公交IC卡與車輛GPS數(shù)據(jù),得到公交車行駛軌跡,并利用數(shù)據(jù)挖掘算法分析了乘客上下車站點(diǎn)特征;ZHAO Jinhua等[12]結(jié)合 AFC(automatic fare collection)及AVC(automatic vehicle collection)系統(tǒng),對軌道交通出行的 OD 矩陣進(jìn)行估算;N.KARASMAA[13]通過將公交IC卡刷卡數(shù)據(jù)與GPS定位數(shù)據(jù)聯(lián)合分析,實(shí)現(xiàn)了車輛運(yùn)行指標(biāo)計(jì)算及乘客出行起終點(diǎn)、換乘點(diǎn)判別。更重要的是,基于智能公交大數(shù)據(jù)時代的多源數(shù)據(jù)為從個體角度分析公共交通出行特征提供了可能。

圖譜作為特征可視化表達(dá)方式,以符號形式描述對象間的概念及相互關(guān)系,構(gòu)成聯(lián)結(jié)的知識結(jié)構(gòu),能實(shí)現(xiàn)特征的直觀表達(dá)[14]。通過醫(yī)學(xué)數(shù)據(jù)提取實(shí)體、關(guān)系、屬性等知識圖譜的組成元素,對醫(yī)學(xué)知識進(jìn)行表示、抽取、融合、推理及質(zhì)量評估,醫(yī)療圖譜形成了最佳知識表征框架:一方面便于醫(yī)生通過圖譜動態(tài)推理制定合適的診療方案;另一方面圖譜可視化表達(dá)可幫助病人了解診療過程[15]。利用大樣本學(xué)術(shù)信息(如期刊論文、專利報(bào)告等)對科學(xué)知識結(jié)構(gòu)、關(guān)系與演化過程進(jìn)行可視化,圖書情報(bào)領(lǐng)域的引證圖譜能自動展示文獻(xiàn)與作者關(guān)系,并進(jìn)一步分析科學(xué)知識演化過程與結(jié)果[16]。同樣,基于行車過程中駕駛員操作行為和車輛運(yùn)行狀態(tài)的時序變化特征和編碼組合,駕駛行為圖譜能形象化地描述駕駛操作過程,辨別不同駕駛員的駕駛習(xí)慣[17]??傮w而言,通過對原始數(shù)據(jù)進(jìn)行加工和處理,圖譜能對數(shù)據(jù)特征進(jìn)行有效地組織與表達(dá),刻畫其過程變化特征。

因此,筆者基于公共交通多源數(shù)據(jù),借助圖譜對復(fù)雜信息可視化表達(dá)的優(yōu)勢,從個體角度構(gòu)建了表征乘客時空軌跡特性的特征圖譜,準(zhǔn)確反映個體乘客時間分布與空間位置波動;并選取多子區(qū)間相似性判別方法,度量個體特征圖譜相似性;為個體出行特征提取提供新思路,為不同類型公共交通通勤乘客出行行為準(zhǔn)確辨識提供借鑒,為精細(xì)化公共交通出行服務(wù)提供支撐。

1 數(shù)據(jù)基礎(chǔ)

筆者依托北京城市交通協(xié)同創(chuàng)新中心和綜合交通協(xié)同運(yùn)行與超級計(jì)算應(yīng)用技術(shù)協(xié)同創(chuàng)新平臺,以公共交通刷卡與線站數(shù)據(jù)為數(shù)據(jù)基礎(chǔ)進(jìn)行分析。公共交通刷卡數(shù)據(jù)包括地面公交IC卡刷卡和軌道AFC系統(tǒng)刷卡數(shù)據(jù);公共交通線站數(shù)據(jù)包括地面公交和軌道交通線站數(shù)據(jù)。結(jié)合前期研究成果,已完成了基于多源數(shù)據(jù)的預(yù)處理及公交出行過程匹配,進(jìn)而提取獲得出行階段數(shù)據(jù)[18],為出行特征圖譜構(gòu)建奠定數(shù)據(jù)支撐。

筆者以某乘客4 d的出行數(shù)據(jù)為例,獲得該乘客出行階段數(shù)據(jù)示意,如表1。

表1 某乘客連續(xù)4 d出行階段數(shù)據(jù)

2 圖譜構(gòu)建與相似性判別

筆者選用北京市全體公交乘客連續(xù)一周的出行數(shù)據(jù),針對公共交通通勤出行者,通過個體出行特征圖譜構(gòu)建及圖譜相似性判別,提取公共交通通勤乘客時空特性,并實(shí)現(xiàn)相同個體出行行為分類與不同個體出行行為相似性判別。

定義公交常乘客為一周工作日中至少有4 d采用公共交通出行的乘客。針對通勤乘客刷卡時間間隔及往返情況的閾值分析,研究規(guī)定公交常乘客在一周中,刷卡最大時間間隔大于7 h且往返地點(diǎn)為閉合的情況出現(xiàn)次數(shù)不少于3次,則判定其為公共交通通勤出行者。

2.1 個體出行特征圖譜繪制

考慮周一相比其它工作日客流量激增,隨機(jī)因素較多,出行特征可能存在較大差異,故暫不考慮。筆者以個體乘客為分析單元,同一乘客相鄰出行階段數(shù)據(jù)為分析基礎(chǔ),制定出行特征圖譜繪制步驟。

2.1.1 步驟1

公共交通出行階段數(shù)據(jù)排序。選取乘客連續(xù)4 d的出行階段數(shù)據(jù),并按刷卡時間進(jìn)行排序。

2.1.2 步驟2

繪制圖譜位置坐標(biāo)點(diǎn)。以時間序列(min)為橫坐標(biāo),以位置點(diǎn)(km)為縱坐標(biāo)。

1)橫坐標(biāo)設(shè)置

假定某乘客第1天出行的第1個刷卡時間點(diǎn)為1(即橫坐標(biāo)),相鄰位置點(diǎn)橫坐標(biāo)差表示前后刷卡的時間點(diǎn)分鐘差值;同時,假定第2天首個刷卡橫坐標(biāo)比前一天的末橫坐標(biāo)大100 min,即連續(xù)4 d橫坐標(biāo)值持續(xù)增大。

2)縱坐標(biāo)計(jì)算

選取北京天安門為出行位置對比點(diǎn),假定每天第1個縱坐標(biāo)值P1為當(dāng)天的首個出行階段上車站點(diǎn)與天安門的曼哈頓距離,如式(1):

(1)

式中:P1為每天首個縱坐標(biāo);N1為每天首個刷卡站點(diǎn)的經(jīng)度;N0為天安門經(jīng)度(116.388°);T1為每天首個刷卡站點(diǎn)的緯度;T0為天安門緯度(39.9075°)。

縱坐標(biāo)依次為前一位置點(diǎn)的縱坐標(biāo)值加或減兩點(diǎn)間路徑距離,差值體現(xiàn)相鄰位置點(diǎn)實(shí)際路徑距離。定義規(guī)則如式(2):

(2)

式中:Di+1為從i個站點(diǎn)到第i+1個站點(diǎn)的實(shí)際路徑距離,km。

2.1.3 步驟3

確定圖譜元素。由節(jié)點(diǎn)大小表示出行方向,線型和線寬體現(xiàn)出行方式。

出行方向由出行階段上下車站點(diǎn)經(jīng)緯度通過反正切函數(shù)計(jì)算得到,為實(shí)際角度值。為了區(qū)分出行方向唯一性,利用實(shí)心節(jié)點(diǎn)表示角度值為0°~180°,空心節(jié)點(diǎn)為-180°~0°;每日首個出行方向以天安門為基準(zhǔn)。對出行方式,粗實(shí)線代表軌道交通,細(xì)實(shí)線表示地面公交,虛線表示無公共交通出行。

2.2 通勤個體出行特征圖譜相似性分析

基于個體出行特征圖譜,通過相似性分析,可以實(shí)現(xiàn)相同乘客出行行為分類與不同乘客行為相似性識別。

2.2.1 相似性判定指標(biāo)確定

圖譜相似性判定從表征個體乘客出行行為特征的角度選取判定指標(biāo),根據(jù)文獻(xiàn)[19],乘客出行特征主要體現(xiàn)為出行路徑、出行時間、出行位置等方面。故筆者提出了圖譜相似性判別方法,分別從出行路徑、出行時間、出行位置這3個層面選取判定指標(biāo)。其中,采用出行方式和出行方向共同表征出行路徑,采用出行時間表征乘客時間特性,采用乘坐線路表征位置波動特性。個體出行特征指標(biāo)與圖譜元素屬性關(guān)聯(lián)如表2。

表2 個體出行特征指標(biāo)與圖譜元素屬性關(guān)聯(lián)

1)出行方式

由線型、線寬體現(xiàn)不同出行方式。

2)出行方向

采用節(jié)點(diǎn)大小表示出行方向。

3)出行時間

考慮到通勤者下班后可能存在娛樂、購物等活動,晚上到家時間跨度較大。故采用乘客每日首個上車時間,及當(dāng)日出行階段平均耗時體現(xiàn)出行時間。

4)乘坐線路

定義波動系數(shù)體現(xiàn)所乘線路的動態(tài)性,波動系數(shù)越小,表示各天出行位置點(diǎn)的變化程度越小。計(jì)算方法如式(3)、(4)。

M=[E(l1),E(l2),…,E(ln)]

(3)

(4)

式中:M為各天的位置點(diǎn)均值;E(ln)為第ln天位置點(diǎn)均值;T為波動系數(shù);D(M)為M方差;E(M)為M均值。

2.2.2 圖譜相似性判定

在個體出行圖譜的相似性判別中,筆者采用非連續(xù)性與連續(xù)性相結(jié)合進(jìn)行綜合判別。首先,由非連續(xù)性角度度量圖譜各組成元素間的相似程度,通過計(jì)算結(jié)構(gòu)相似度進(jìn)行判別[20-21];其次,選用公共子序列度量方法尋找不重疊的多個公共子區(qū)間,從時間先后角度判別子區(qū)間連續(xù)相似性,采用最長公共子序列衡量連續(xù)相似性,即兩個或多個序列中存在最長的共同子序列[21];最后,實(shí)現(xiàn)相同個體出行行為分類與不同個體圖譜相似性判定。

1)非連續(xù)性判定

為獲取圖譜間的結(jié)構(gòu)相似度,研究首先計(jì)算結(jié)構(gòu)距離(SD)。SD包括不同個體或相同個體不同天的特征屬性比較。圖譜結(jié)構(gòu)距離計(jì)算如式(5):

SD(Ci,Cj)=MD×WM+DD×WS+TD×WT+

LD×WL

(5)

式中:SD(Ci,Cj)為i與j天的結(jié)構(gòu)距離;MD為方式距離;DD為方向距離;TD為時間距離;LD為線路距離;W={WM,WS,WT,WL}為特征權(quán)重向量,分別表示軌跡的方式權(quán)重、方向權(quán)重、時間權(quán)重和線路權(quán)重,其中:各權(quán)重應(yīng)滿足權(quán)重取值非負(fù)且WM+WS+WT+WL=1,由于筆者未對各權(quán)重的重要程度進(jìn)行研究,因此假定各權(quán)重不分主次,取WM=WS=WT=WL=0.25。

(1)方式距離

方式距離主要表征乘客采用不同出行方式的差異性,不考慮出行方式的乘坐順序,為各方式占比的公共差值絕對值。例如,某乘客i天的出行方式為4次軌道,j天為3次軌道1次公交,則i天與j天的方式距離計(jì)為1/4。

(2)方向距離

方向距離從最大、平均和最小角度的層面表示結(jié)構(gòu)距離。計(jì)算方法如式(6):

Dmin(Li,Lj)]

(6)

式中:Dmax(Li,Lj)即|Dmax(Li)-Dmax(Lj)|,反映了i天與j天最大斜率差異絕對程度;類似地,Davg為平均斜率差異絕對值;Dmin為最小斜率差異絕對值。

(3)時間距離

時間距離從最長、平均和最短出行時間的層面表示結(jié)構(gòu)距離。計(jì)算如式(7):

Tmin(Li,Lj)]

(7)

式中:Tmax(Li,Lj)即|Tmax(Li)-Tmax(Lj)|,反映了i與j天最長出行時間差異絕對程度;Tavg為平均出行時間絕對差異程度;Tmin為最小出行時間絕對差異程度。

(4)線路距離

采用波動系數(shù)表征i與j天的線路距離LD(Ci,Cj),其波動系數(shù)計(jì)算如式(4)。

綜上,由于不同特征值值域不同,需將每個特征距離值做歸一化處理。引入結(jié)構(gòu)距離的歸一化函數(shù)N(SD)。則結(jié)構(gòu)相似度(GS)計(jì)算如式(8):

GS(Ci,Cj)=1-N[SD(Ci,Cj)]

(8)

GS(Ci,Cj)體現(xiàn)了不同個體或相同個體不同天的特征圖譜結(jié)構(gòu)相似程度;其值越大,則相似性程度高。若結(jié)構(gòu)相似度超過一半,需進(jìn)一步判定連續(xù)相似性,否則,直接判定為不相似。

2)連續(xù)相似性判定

筆者采用最長公共子序列(longest common sub-sequence, LCSS)衡量連續(xù)相似性。通過計(jì)算最長公共子序列并轉(zhuǎn)化為LCSS距離衡量軌跡間連續(xù)性相似程度[22],如式(9):

(9)

式中:LC(i,j)為圖譜i與j之間的LCSS長度;m為圖譜i的出行階段數(shù)量;n為圖譜j的出行階段數(shù)量;?為x軸相似閾值;ε為y軸相似閾值;β為方向相似閾值;R(i)、R(j)分別為軌跡i、j去掉首個記錄點(diǎn)后的軌跡間隔。

當(dāng)軌跡記錄點(diǎn)數(shù)j均為0時,LC(i,j)=0;若記錄點(diǎn)個數(shù)不為0,則用遞歸方式判斷共有子序列長度最大值。當(dāng)同時滿足橫坐標(biāo)差小于?、縱坐標(biāo)差小于ε、方向角度小于β時,該對記錄點(diǎn)相似,LCSS距離值加1??紤]到北京公共交通通勤乘客從家出發(fā)時刻常集中在07:00—09:00,且不同天可能存在娛樂、餐飲、購物等活動的差異,取?=1 h;ε取相鄰兩個軌道站點(diǎn)間距,按均值1.7 km計(jì)算;參照利用乘客軌跡行程統(tǒng)計(jì)居民出行方向分布的方向劃分間隔[23],設(shè)定β=30°。

通過歸一化處理,將LCSS距離轉(zhuǎn)換為[0, 1]的距離,如式(10):

(10)

式中:DLCSS(i,j)為特征圖譜i與j間的LCSS距離;min(m,n)為i與j記錄點(diǎn)個數(shù)的較小值。

3 案例分析

為方便數(shù)據(jù)驗(yàn)證與核對,筆者選取北京工業(yè)大學(xué)附近居民區(qū)為研究區(qū)域。經(jīng)計(jì)算統(tǒng)計(jì),90%以上公共交通通勤乘客一天內(nèi)出行時間跨度在14 h內(nèi),故x軸值域最大不超過3 500(14×60×4=3 360 min);85%以上通勤乘客的位置波動在16 km內(nèi),故y軸采用統(tǒng)一性值域范圍,即[0, 16]。隨機(jī)選取5名典型乘客,構(gòu)建個體出行圖譜如圖1。

由圖1可獲得公共交通個體乘客的出行特征包括:① 通勤乘客的主要出行方式。由圖譜線型可知乘客A在連續(xù)4 d的公共交通出行中以地鐵為主,尤其高峰期間常乘坐地鐵,平峰期間較多乘坐公交;乘客B則以公交出行為主,早高峰主要乘坐公交,平峰乘坐地鐵。② 乘客路徑距離分布。由圖譜縱軸可知乘客A路徑距離在4 km內(nèi),而乘客D則集中在2 km左右。③ 乘客出行目的地。乘客B日均有3個公共交通目的地,除去工作地與家,平峰出行1次;而乘客C日均4~5個目的地,無明顯出行規(guī)律。④ 不同天的出行相似性。由圖1可明顯看出:乘客A后兩天出行存在明顯相似性,乘客E前兩天與后兩天出行也顯著相似。

筆者以乘客A為例,計(jì)算相似性指標(biāo)值如表3。計(jì)算乘客A不同天的結(jié)構(gòu)距離與LCSS距離,得到特征圖譜相似性判別結(jié)果如表4,其中:rij指該乘客不同日期對比。由表4可知:乘客A后兩天的出行相似性較大,而第1、3天出行幾乎不存在相似性。

表3 乘客A相似性指標(biāo)值

表4 乘客A個體出行圖譜相似性判別結(jié)果

對于不同個體,通過非連續(xù)性與連續(xù)相似性判別可以得到乘客A和B的出行相似性,如表5。其中:ri指兩名乘客在同日期對比。由表5知:乘客A和B在該周的出行行為不存在明顯的相似性。

表5 乘客A和B出行特征圖譜相似性判別結(jié)果

根據(jù)上述方法,分析這5名乘客出行特征圖譜綜合相似性判別結(jié)果如表6。由表6可知:乘客B和E在該周出行行為明顯相似,其他乘客則不存在明顯相似性。

表6 5名乘客出行特征圖譜綜合相似性判別

4 結(jié) 論

筆者針對公共交通通勤乘客,構(gòu)建了個體出行特征圖譜,并提出了圖譜相似性判別方法,為分析公共交通出行特征提供了新思路。

1)通過設(shè)定公交常乘客刷卡最大間隔與往返地點(diǎn)閉合次數(shù)等規(guī)則鑒別通勤乘客,進(jìn)而基于圖譜可視化優(yōu)勢,以時間序列為橫坐標(biāo),位置點(diǎn)為縱坐標(biāo),節(jié)點(diǎn)大小為出行方向,從個體的角度構(gòu)建了通勤出行特征圖譜,直觀化地展示乘客乘坐公共交通的出行過程。

2)從非連續(xù)性與連續(xù)性判別的角度,通過結(jié)構(gòu)相似度與最長公共子序列計(jì)算相結(jié)合,提出圖譜相似性綜合判別方法,實(shí)現(xiàn)相同乘客出行行為分類與不同乘客行為相似性判別。

3)筆者以北京5名公交常乘客一周的公共交通數(shù)據(jù)為例進(jìn)行示例分析,為利用圖譜進(jìn)行乘客出行行為特征分析進(jìn)行了探索。未來將采用計(jì)算機(jī)語言進(jìn)行大樣本研究與測試,進(jìn)一步驗(yàn)證該方法的可靠性與穩(wěn)定性,對相同個體通勤乘客,可實(shí)現(xiàn)其出行穩(wěn)定性分類,比如將出行者劃分為高穩(wěn)定、中穩(wěn)定、低穩(wěn)定通勤乘客,為更加準(zhǔn)確地掌握不同穩(wěn)定性乘客的出行需求奠定支撐。同時,對于不同個體,出行者相似度判別可分析不同個體乘客間出行行為的差異性和一致性,進(jìn)而實(shí)現(xiàn)公共交通總體出行人群細(xì)化分類。

猜你喜歡
刷卡公共交通相似性
一類上三角算子矩陣的相似性與酉相似性
《城市公共交通》雜志社簡介
淺析當(dāng)代中西方繪畫的相似性
基于計(jì)算實(shí)驗(yàn)的公共交通需求預(yù)測方法
低滲透黏土中氯離子彌散作用離心模擬相似性
公共交通一卡通TSM平臺研究
刷卡
成長日記
刷臉就可以購物
奧秘(2014年8期)2014-08-30 06:32:04
交通運(yùn)輸部發(fā)布通知推進(jìn)城市公共交通智能化應(yīng)用工程建設(shè)事項(xiàng)
郁南县| 马公市| 樟树市| 玉环县| 栾城县| 民乐县| 石棉县| 通化市| 平昌县| 西贡区| 延寿县| 彭州市| 青铜峡市| 包头市| 长垣县| 康马县| 宜兰县| 陵川县| 西青区| 昌黎县| 灵台县| 革吉县| 镇坪县| 勐海县| 黎平县| 乐陵市| 凤阳县| 浪卡子县| 万安县| 罗城| 绵阳市| 卢氏县| 务川| 巢湖市| 泸水县| 湾仔区| 通州区| 彰武县| 永济市| 射阳县| 灵璧县|