姚恩建, 周文華, 張永生
(1.北京交通大學(xué) 城市交通復(fù)雜系統(tǒng)理論與技術(shù)教育部重點實驗室,北京 100044;2.北京交通大學(xué) 交通運輸學(xué)院,北京 100044)
隨著城市軌道交通網(wǎng)絡(luò)規(guī)模的持續(xù)擴大,客流時空分布規(guī)律愈加復(fù)雜,作為客流生成源頭的進出站客流,運營管理部門需對其實時監(jiān)測,準確把握未來短時間內(nèi)客流變化趨勢,從而實時調(diào)整運營計劃,對突發(fā)大客流做出及時預(yù)警和響應(yīng)。為此,高精度、小粒度的實時進出站客流量預(yù)測已成為精細化運營管理的關(guān)鍵。同時,新站不斷開通運營,成為新線接入線網(wǎng)后實時客流預(yù)測的重點。然而,新站開通初期缺乏足夠歷史數(shù)據(jù),且客流波動大,變化規(guī)律較不穩(wěn)定,對未來短時間內(nèi)客流的精準把握愈發(fā)艱難。因此,對新站開通初期實時進出站客流量預(yù)測方法的研究尤為必要。
針對城市軌道交通新站客流預(yù)測,目前國內(nèi)外學(xué)者主要在項目可行性分析等過程中進行中長期或短期的客流需求預(yù)測,為新線開通后的客運組織等提供數(shù)據(jù)支撐。如光志瑞[1]基于車站可達性指標建立新線接入后新站進出站客流預(yù)測模型,得到新站開通后全天的進出站客流量,以評估新線開通后的運輸組織方案。蔡昌俊[2]等基于非集計理論,預(yù)測了新線接入條件下的城市軌道交通新線車站與既有線車站之間的工作日客流量。程濤[3]等基于既有站客流規(guī)律采用多元線性回歸模型預(yù)測新線開通初期的客運量,包括全天的客運強度及規(guī)模。趙路敏[4]等通過新線工程可行性研究報告的數(shù)據(jù)和既有路網(wǎng)OD數(shù)據(jù)預(yù)測新線開通后的全網(wǎng)客流。但是,以上研究均以日為單位預(yù)測新站客流,其預(yù)測粒度及精度尚不能滿足城市軌道交通運營管理部門對客流實時監(jiān)測的精細化運營需求。
對于實時客流預(yù)測方法,國內(nèi)外已有諸多研究,常用模型包括時間序列模型[5-6]、卡爾曼濾波模型[7-8]、支持向量機模型[9-10]和神經(jīng)網(wǎng)絡(luò)模型[11-12]等。這些模型大多用顯性的數(shù)學(xué)解析式或隱性的關(guān)系表達式描述影響因素與預(yù)測變量之間的擬合函數(shù)關(guān)系[13],客流預(yù)測時需要為歷史數(shù)據(jù)建立近似模型,參數(shù)訓(xùn)練調(diào)整復(fù)雜,可移植性較弱,且通常用于網(wǎng)絡(luò)穩(wěn)定情況下基于固有的穩(wěn)定客流規(guī)律預(yù)測未來客流,不適用于客流波動性較大的新站開通初期客流精細化預(yù)測需求。
相對于參數(shù)回歸方法,非參數(shù)回歸方法摒棄傳統(tǒng)求解數(shù)學(xué)解析模型的過程,不對數(shù)據(jù)做任何嚴格限定,且算法效率高,可移植性強。張曉利[13]、張濤[14]等對短時交通流量進行預(yù)測時,比較了非參數(shù)回歸和神經(jīng)網(wǎng)絡(luò)的預(yù)測效果,證明了前者較后者具有更高精度和更強移植性。王翔[15]等對高速公路短時行程時間進行預(yù)測,證明非參數(shù)回歸比時間序列自回歸模型有更好的預(yù)測準確度與實時性。劉美琪[16]等研究了非參數(shù)回歸在城市軌道交通進站客流量短時預(yù)測中的應(yīng)用,比較了非參數(shù)回歸、卡爾曼濾波模型和貝葉斯組合預(yù)測模型的預(yù)測效果,發(fā)現(xiàn)非參數(shù)回歸的總體預(yù)測精度最高,能很好地適應(yīng)城市軌道交通客流的復(fù)雜時變性和不確定性。但該研究依賴大量歷史數(shù)據(jù),無法適應(yīng)新站開通初期缺乏數(shù)據(jù)的情況,同時采用傳統(tǒng)K近鄰非參數(shù)回歸方法時,近鄰值K固定不變無法適應(yīng)實時預(yù)測,且算法只注重對客流分時比例的把握,缺少對客流量差異性的考慮。
針對新站開通初期實時進出站客流量預(yù)測,不僅需要解決歷史數(shù)據(jù)缺乏的難點,同時要考慮預(yù)測方法能否把握開通初期客流不穩(wěn)定的復(fù)雜時變特征。因此,本文以廣州地鐵廣佛線二期開通為例,分析新站開通初期客流變化規(guī)律及其與車站周邊土地利用性質(zhì)的相關(guān)性,基于相同土地利用性質(zhì)的既有車站客流數(shù)據(jù),構(gòu)建新站開通初期客流預(yù)測的歷史數(shù)據(jù)庫;結(jié)合實時進出站客流特征,考慮客流量的差異,對K近鄰非參數(shù)回歸方法中狀態(tài)向量及K值的確定、預(yù)測算法等做出改進,提出新站開通初期實時進出站客流量預(yù)測方法;利用廣州地鐵實際數(shù)據(jù)對該方法進行驗證。
廣州地鐵廣佛線二期全長約為6 km,2015年12月28日開通,新開通的車站包括鶴洞、沙涌和燕崗3個車站。采用廣州市軌道交通自動售檢票系統(tǒng)(簡稱AFC系統(tǒng))采集的15 min進、出站客流量,計算15 min進、出站客流分時系數(shù)(其值分別為15 min的進、出站客流量占全日總進站、總出站客流量的比值),用于分析客流變化規(guī)律。由于進站客流與出站客流的分析方法相同,且變化規(guī)律一致,此處以進站客流量為例,分析各新站開通當(dāng)天及之后若干平常日的進站客流變化規(guī)律。其中平常日指除節(jié)假日、大型活動等特殊日期的正常工作日和周六日。
鶴洞站15 min進站客流分時系數(shù)變化曲線如圖1所示。由圖1可知:鶴洞站開通初期,工作日內(nèi)客流雖已具有一定周期性,但仍有大幅波動,短時間內(nèi)甚至發(fā)生突變,客流變化規(guī)律較不穩(wěn)定,且與周六日存在較大差異。進一步地,對AFC系統(tǒng)采集的客流數(shù)據(jù)進行統(tǒng)計,得到鶴洞站開通后前8個月內(nèi)各月日均進站客流量,如圖2所示。由圖2可知:日均進站客流量在前3個月(自然月)變化較大,從第4個月開始呈穩(wěn)定增長。同樣,沙涌站和燕崗站的客流變化也表現(xiàn)出相同規(guī)律。
圖1 鶴洞站15 min進站客流量變化曲線
圖2 鶴洞站日均進站客流量及其變化率
因此,若采用傳統(tǒng)的客流預(yù)測方法,在新站開通初期的不穩(wěn)定客流數(shù)據(jù)中尋找適應(yīng)實時精準預(yù)測的動態(tài)映射關(guān)系顯然不夠理想,而非參數(shù)回歸方法不需確定具體的函數(shù)關(guān)系,直接從客流數(shù)據(jù)中獲取相關(guān)信息,能夠更好地適應(yīng)新站開通初期不穩(wěn)定客流的預(yù)測。
然而,新站開通初期缺乏歷史數(shù)據(jù),沒有歷史客流變化規(guī)律作為未來短時間內(nèi)客流預(yù)測的依據(jù)與參考,使得非參數(shù)回歸方法也難以直接應(yīng)用。因此,構(gòu)建新站開通初期實時進出站客流量預(yù)測的歷史數(shù)據(jù)庫是本研究的首要任務(wù)。
城市軌道交通客流發(fā)生與客流吸引的源泉是土地利用,即進出站客流在全天不同時間段上的分布規(guī)律很大程度上由車站沿線的土地利用性質(zhì)決定[1]。土地利用性質(zhì)主要分為居住類、辦公類、居住占優(yōu)類、辦公占優(yōu)類、商業(yè)類、樞紐類、綜合類等,當(dāng)車站周邊土地存在混合利用的情況時,在不同時間段用于表征車站客流產(chǎn)生/吸引量的土地利用性質(zhì)可能會發(fā)生改變,如工作日為辦公占優(yōu)類,周六日可能變?yōu)樯虡I(yè)類。根據(jù)對鶴洞站周邊土地利用情況的調(diào)研分析可知,其周邊土地利用以居住區(qū)為主,含小規(guī)模的辦公區(qū),故可將其歸為居住占優(yōu)類車站。以工作日為例,取其15 min進、出站客流分時系數(shù)(其中進站為正,出站為負)觀察新站進、出站客流變化規(guī)律。鶴洞站的進、出站客流分時系數(shù)變化規(guī)律如圖3(a)所示,可見該站客流有明顯的進站和出站早晚高峰,并且早高峰時進站客流大于出站客流,晚高峰時相反。在既有車站中,東曉南車站周邊土地利用情況與鶴洞站相似,同屬居住占優(yōu)類的東曉南車站,其進、出站客流分時系數(shù)變化規(guī)律曲線也如圖3(a)中所示,可見東曉南車站的進、出站客流分時系數(shù)變化規(guī)律與鶴洞站非常相似。沙涌站和燕崗站也歸為居住占優(yōu)類車站,與東曉南車站的客流分時系數(shù)變化規(guī)律同樣一致。另外,在廣州地鐵網(wǎng)絡(luò)中,選取其他相同土地利用性質(zhì)的既有車站進行分析,如圖3(b)至圖3(d)所示,可以看出相同土地利用性質(zhì)的車站進出站客流分時系數(shù)變化規(guī)律均存在較高的相似性。
圖3 不同土地利用性質(zhì)車站進、出站客流分時系數(shù)的變化規(guī)律
由此可見,基于進站、出站客流分時系數(shù)變化規(guī)律與車站周邊土地利用性質(zhì)的內(nèi)生關(guān)系,建立新站與既有車站之間的映射,采用相同土地利用性質(zhì)既有車站(簡稱為相似既有車站)的歷史客流數(shù)據(jù),可以構(gòu)建新站實時進出站客流量預(yù)測的歷史數(shù)據(jù)庫。
根據(jù)新站開通初期實時進出站客流特征,對K近鄰非參數(shù)回歸方法做出改進,提出適用于新站開通初期的實時進出站客流量預(yù)測方法。
K近鄰非參數(shù)回歸預(yù)測方法的核心思想是數(shù)據(jù)庫模式匹配,即從歷史數(shù)據(jù)庫中提取數(shù)據(jù)特征,根據(jù)合理的狀態(tài)向量找到與當(dāng)前實時觀測數(shù)據(jù)相匹配的K個近鄰數(shù)據(jù),將其作為預(yù)測算法的輸入,最終得到下一時段的客流預(yù)測值。該預(yù)測方法包括構(gòu)建歷史數(shù)據(jù)庫、確定狀態(tài)向量、制定相似機制、近鄰K值的選取和預(yù)測算法5個步驟。
首先,基于模糊C均值聚類方法選取與新站土地利用性質(zhì)相同的既有車站,構(gòu)建相似既有車站客流基礎(chǔ)數(shù)據(jù)庫。根據(jù)對不同土地利用性質(zhì)車站進出站客流分時系數(shù)變化規(guī)律的分析,可發(fā)現(xiàn)進出站客流早晚高峰的客流特征與車站周邊土地利用性質(zhì)具有直接關(guān)聯(lián),故選取早晚高峰系數(shù)(其值為早晚高峰時段內(nèi)15 min進、出站客流分時系數(shù)的總和,即早晚高峰時段內(nèi)客流量占全日總客流量的比值)作為車站聚類指標。對不同時間、不同位置的城市軌道交通網(wǎng)絡(luò)中所有既有車站進行模糊C均值聚類[17],其中既有車站的位置通過既有路網(wǎng)車站可達性[18]進行劃分?;诰垲惤Y(jié)果,構(gòu)建車站性質(zhì)匹配庫,以描述預(yù)測日時間屬性、新站的車站位置、新站的土地利用性質(zhì)與既有車站的映射關(guān)系。如對于新站X,則有
DML:SX=f(TP,SL,ST)
(1)
式中:DML為車站性質(zhì)匹配庫,包括性質(zhì)相匹配的所有既有車站;SX為新站X匹配得到的相似既有車站集;TP為預(yù)測日時間屬性對應(yīng)指標;SL為新站車站位置指標;ST為新站周邊土地利用性質(zhì)指標。其中新站X的車站位置和周邊土地利用性質(zhì)可以根據(jù)城市地圖進行確定。
其次,構(gòu)建新站客流基礎(chǔ)數(shù)據(jù)庫。新站開通運營后,新站的客流數(shù)據(jù)較相似既有車站的客流數(shù)據(jù)更能直接體現(xiàn)其客流變化規(guī)律,故應(yīng)將新站的客流數(shù)據(jù)及時加入歷史數(shù)據(jù)庫。
最后,基于新站及既有車站客流基礎(chǔ)數(shù)據(jù)庫,確定歷史客流數(shù)據(jù)的時間跨度,構(gòu)建歷史數(shù)據(jù)庫。歷史數(shù)據(jù)庫的構(gòu)成,一方面應(yīng)盡量多的包含未來可能發(fā)生的客流變化規(guī)律,同時也不能過于冗余,以免影響預(yù)測的實時性。因此,歷史數(shù)據(jù)庫的構(gòu)成可表示為
(2)
對于時間跨度T1,因不同新站的相似既有車站數(shù)目不一,需結(jié)合實際合理確定。同時,隨著新站客流數(shù)據(jù)的不斷積累,時間跨度T2需逐日增加,即T2=dt-d0(其中,d0為新站開通日,dt為預(yù)測日)。當(dāng)新站開通一段時間后,且自身客流數(shù)據(jù)足以代表未來客流變化趨勢時,應(yīng)從歷史數(shù)據(jù)庫中剔除相似既有車站的客流數(shù)據(jù),以避免數(shù)據(jù)庫冗余。
此外,對于歷史數(shù)據(jù)庫中客流數(shù)據(jù)的時間屬性,需要與預(yù)測日時間屬性保持一致,即若預(yù)測日為工作日,則歷史數(shù)據(jù)庫中均為工作日的客流數(shù)據(jù)。隨著新站客流數(shù)據(jù)的逐漸積累,可對歷史數(shù)據(jù)庫進一步細分,如將平常工作日的歷史數(shù)據(jù)庫分成周一至周五分別進行構(gòu)建,以提高算法預(yù)測效率及精度。
歷史數(shù)據(jù)庫的形成過程可以簡要表述如圖4所示。
圖4 歷史數(shù)據(jù)庫形成示意圖
不同時段的實時進、出站客流量均可看作獨立的1個時間序列,在各時間序列中,連續(xù)若干時間段的客流量間具有較強的關(guān)聯(lián),因此選取與預(yù)測時段進、出站客流量最密切相關(guān)的若干相鄰時段的進、出站客流量作為狀態(tài)向量。具體方法是:通過計算q階自相關(guān)系數(shù)rq確定狀態(tài)向量中前m個時段的客流量,即將連續(xù)n個時間段的進或出站客流量看作時間序列{Q(1),Q(2),…,Q(n)},則這個時間序列q階自相關(guān)系數(shù)rq的計算公式為
(3)
其中,
通常,對于給定的自相關(guān)系數(shù)閾值M,當(dāng)相關(guān)系數(shù)rq≥M時,可認為時間序列中間隔q個時段的2個值相關(guān)性較強。為使?fàn)顟B(tài)向量中盡可能多地包含與預(yù)測時段相關(guān)的客流時段,取m=max{q|rq≥M}, 即m為滿足rq≥M的最大q值, 并由預(yù)測時段前m個時段的進或出站客流量構(gòu)成狀態(tài)向量。
傳統(tǒng)非參數(shù)回歸方法,在匹配近鄰數(shù)據(jù)時,用歐式距離作為指標衡量實時數(shù)據(jù)與歷史數(shù)據(jù)的匹配程度,歐式距離的取值范圍為[0,∞),為了與通常的相似程度判別方法(即1表示最為相似,0表示完全不相似[19])更為一致,本文采用相似度測度函數(shù)替代歐式距離作為近鄰匹配機制。相似度測度函數(shù)為
(4)
式中:A和H分別為實時數(shù)據(jù)和歷史數(shù)據(jù)中同一時段的狀態(tài)向量;ak和hk分別為實時和歷史狀態(tài)向量中各時段進或出站客流量;K為近鄰的個數(shù);c為常量,用于調(diào)節(jié)相似度的分布。
目前,對于近鄰個數(shù)K的取值沒有既定準則。大多研究通過對不同K取值下一定量樣本的測試結(jié)果進行誤差判斷,確法最優(yōu)K值,并在預(yù)測時始終取該值。不同于既有研究,本文在實時客流預(yù)測時,動態(tài)計算每個預(yù)測時段的K值,即以歷史數(shù)據(jù)庫中預(yù)測日前Nk天對應(yīng)時段的客流為預(yù)測樣本,計算得到Nk個最優(yōu)K值,并取其均值作為當(dāng)前預(yù)測時段的K值。
根據(jù)前文分析,新站與相同土地利用性質(zhì)的既有車站之間進出站客流分時系數(shù)變化規(guī)律高度相似,但客流量不完全相近。例如,同為辦公類車站的珠江新城站與林和西站,客流分時系數(shù)變化規(guī)律非常相似,如圖5所示,但分時客流的量級存在較大差異,如圖6所示。同時,同一車站的進出站客流量由于一定的自然增長同樣存在客流量上的波動,因此,為減小預(yù)測客流量與近鄰客流量的差異,本文定義近鄰系數(shù),其計算公式見式(5),用以調(diào)整近鄰的客流量,調(diào)整計算公式見式(6)。對珠江新城站客流進行調(diào)整,調(diào)整后的客流量與林和西站的客流量非常相近,如圖6所示,這說明通過近鄰系數(shù)的調(diào)整能夠有效減小客流量的差異。
(5)
(6)
圖5 分時系數(shù)對比
圖6 調(diào)整前后分時客流量對比
以實際數(shù)據(jù)與近鄰數(shù)據(jù)的相似度為權(quán)重,相似度越大權(quán)重越大;采用基于相似度的加權(quán)平均法,得到預(yù)測時段t的客流預(yù)測值y(t),計算方法為
(7)
其中,
式中:si為第i個近鄰狀態(tài)向量與當(dāng)前狀態(tài)向量間的相似度;αi為第i個近鄰預(yù)測值的權(quán)重。
以廣州地鐵廣佛線二期開通的鶴洞、沙涌和燕崗3個新站為例,這3個新站均屬于居住占優(yōu)類車站。盡管本文所提出的方法適用于新線開通初期進出站客流量的實時預(yù)測,但考慮到文章篇幅的限制,以下以開通前半年內(nèi)的廣州地鐵線網(wǎng)既有車站客流數(shù)據(jù)作為歷史客流數(shù)據(jù),采用本文提出的方法,僅對該線路新站開通后的實時進站客流進行預(yù)測,時間粒度為15 min,預(yù)測場景為平常工作日。
廣州地鐵全網(wǎng)共有136個既有車站,對其進行模糊C均值聚類。結(jié)合廣州地鐵運營現(xiàn)狀,工作日早晚高峰時段分別為7:00—9:00和17:00—19:00,計算這2個時間段內(nèi)客流量占全日總客流量的比值,即為早、晚高峰系數(shù),將其作為聚類指標,對工作日的全網(wǎng)既有車站進行聚類,結(jié)果見表1。
表1 工作日車站聚類結(jié)果
由表1可知:既有車站中居住占優(yōu)類車站有三元里、東曉南、江南西等共14個車站,考慮相似既有車站較多,取新線開通前半年內(nèi)的客流數(shù)據(jù),再加入新站開通后逐日形成的客流數(shù)據(jù),由此構(gòu)成歷史數(shù)據(jù)庫。
為適時剔除既有車站客流數(shù)據(jù),分析近鄰匹配結(jié)果中既有車站客流與新站客流的占比。結(jié)果顯示:新站開通后的前4個月,既有車站的匹配比例依次為95.33%,55.00%,28.00%,19.53%,反之新站本站客流的匹配比例逐月上升。即隨著新站開通后時間的推移,本站的歷史客流量更能體現(xiàn)本站未來客流量變化趨勢。因此,考慮到預(yù)測算法的運行效率,新站開通3個月后,剔除歷史數(shù)據(jù)庫中既有車站的客流數(shù)據(jù),即令T1=0。
另外,新站開通初期,因本站客流數(shù)據(jù)量較少,在數(shù)據(jù)庫構(gòu)建時,將所有的平常工作日數(shù)據(jù)匯集在一起構(gòu)建工作日的歷史數(shù)據(jù)庫。在新站開通3個月后,隨著新站數(shù)據(jù)量不斷增大,考慮到同一周次的客流規(guī)律相似度更高,可將歷史數(shù)據(jù)庫進一步細化,分別針對周一至周五等5個工作日構(gòu)建歷史數(shù)據(jù)庫,以提高算法的預(yù)測效率。
狀態(tài)向量的確定。根據(jù)廣州地鐵全網(wǎng)既有車站半年內(nèi)平常工作日15 min進站客流量,以每日每車站60個(7:00—22:00)時段進站客流量為1個樣本序列,共計19 312條樣本。根據(jù)式(3)計算樣本各階自相關(guān)系數(shù),取閾值M=0.5,統(tǒng)計所有樣本中rq≥0.5的占比,結(jié)果見表2。
表2 各階自相關(guān)系數(shù)滿足閾值條件(rq≥0.5)的占比統(tǒng)計
由表2可知:樣本中q=1,2,3時,均有90%以上樣本數(shù)據(jù)滿足rq≥0.5,而q=4時,滿足要求的樣本量低于30%,可認為實時進站客流量中,預(yù)測時段進站客流量與前3個時段進站客流量具有較強相關(guān)性。因此,確定平常工作日場景下進站客流量預(yù)測時m=3,即本文提出的方法適用于當(dāng)日15 min的實時客流量采集時段已滿足3個的情況。
近鄰K值的確定。參照相關(guān)研究[14]結(jié)論,本文取Nk=10,表3列出燕崗站部分時段預(yù)測時的K取值,由于每日每時段均重新計算K值,且各時段取值不盡相同,本文不再一一列舉。
表3 燕崗站部分時段近鄰K值
基于實際數(shù)據(jù),定義a(t)為預(yù)測時段t實際的進站客流量,將本文方法的預(yù)測結(jié)果與實際值進行對比分析,采用平均絕對誤差MAE與平均絕對百分比誤差MAPE對模型進行精度檢驗,其計算公式見式(8)和式(9),預(yù)測結(jié)果見表4。
(8)
(9)
表4 新站部分日期實時進站客流量預(yù)測誤差
根據(jù)誤差統(tǒng)計,各新站開通當(dāng)天平均絕對百分比誤差均在22%以下,鶴洞、沙涌的誤差略大于燕崗,分析原因發(fā)現(xiàn),鶴洞、沙涌站的客流規(guī)模小,基礎(chǔ)客流量較小,導(dǎo)致相對誤差略大。前3個月的平均MAE不超過16人次,平均MAPE在17%以下。為更具體地分析15 min進站客流量預(yù)測誤差,取燕崗站2015-12-30的實時進站客流量預(yù)測值與實際值進行比較,如圖7所示,由圖7可以看到數(shù)據(jù)點基本分布在45°線附近,說明預(yù)測結(jié)果較為理想。
圖7 燕崗站預(yù)測值與真實值對比
為驗證本文提出的改進算法的有效性,以預(yù)測燕崗站2015-12-30實時進站客流量為例,分別采用不考慮客流量差異性的傳統(tǒng)非參數(shù)回歸方法和本文方法進行預(yù)測。結(jié)果表明,采用傳統(tǒng)預(yù)測方法的平均絕對誤差為23人次,平均絕對百分比誤差為17.23%;采用本文方法的預(yù)測誤差分別為16人次和12.19%??梢?,本文提出的改進算法預(yù)測精度更優(yōu)于傳統(tǒng)非參數(shù)回歸算法。
此外,由表4還可以看到,隨著開通時間的推移,預(yù)測誤差有一定變化。為進一步分析該方法的預(yù)測效果,結(jié)合歷史數(shù)據(jù)庫的不同組成,對新站開通后連續(xù)4個月內(nèi)平常工作日實時進站量進行預(yù)測,統(tǒng)計得到周平均預(yù)測誤差,如圖8所示。由圖8可知:隨著歷史數(shù)據(jù)庫中本站客流量的增多,各新站的實時進站客流量預(yù)測精度會逐漸提高直至平穩(wěn)。該結(jié)果說明:隨著預(yù)測時間跨度的增大,本站歷史客流量逐漸積累,對歷史數(shù)據(jù)庫進一步細分后,本文提出的方法可以得到較好的預(yù)測效果,說明本文的預(yù)測方法具有良好的適應(yīng)性。
圖8 模型預(yù)測精度變化
本文分析了城市軌道交通新站開通初期客流的變化規(guī)律,發(fā)現(xiàn)新站開通初期3個月內(nèi)客流量波動較大,而后客流量變化趨于穩(wěn)定。為解決新站開通初期客流預(yù)測中歷史數(shù)據(jù)缺乏的問題,本文提出了基于相同土地利用性質(zhì)的既有車站歷史客流數(shù)據(jù)的新站開通初期客流預(yù)測的歷史數(shù)據(jù)庫構(gòu)建方法,然后針對新站開通初期客流波動大等問題,結(jié)合新站實時客流特征,提出了基于改進非參數(shù)回歸方法的新站實時進出站客流量預(yù)測方法。其中,針對實時預(yù)測改進了狀態(tài)向量及近鄰K值的確定方法,并考慮客流量差異性對預(yù)測算法做出調(diào)整,以提高算法的預(yù)測精度達到實時客流精準預(yù)測的要求。
以廣州地鐵廣佛線二期新站開通初期的實際進站客流量預(yù)測為例,對本文方法的預(yù)測效果進行了驗證。結(jié)果顯示:各新站實時進站量預(yù)測的平均絕對誤差不大于16人次。此外,隨著新站客流量數(shù)據(jù)不斷積累,該方法的預(yù)測精度會逐漸提高,說明該方法在數(shù)據(jù)量充足的情況下能夠更加精確地預(yù)測實時進出站客流量,實現(xiàn)車站及網(wǎng)絡(luò)客流的實時監(jiān)測,為新站開通后及時制定并實施運輸組織計劃提供重要的決策依據(jù)。
[1]光志瑞.基于土地利用和可達性的城市軌道交通進出站客流量預(yù)測[D].北京:北京交通大學(xué),2013.
(GUANG Zhirui. Passenger Flow Prediction for Urban Railway Station’s Entrance and Exit Based on Land-Use and Accessibility [D]. Beijing: Beijing Jiaotong University, 2013. in Chinese)
[2]蔡昌俊,姚恩建,張永生,等. 基于AFC數(shù)據(jù)的城軌站間客流量分布預(yù)測[J].中國鐵道科學(xué),2015,36(1):126-132.
(CAI Changjun, YAO Enjian, ZHANG Yongsheng, et al. Forecasting of Passenger Flow’s Distribution among Urban Rail Transit Stations Based on AFC Data[J]. China Railway Science, 2015,36(1):126-132. in Chinese)
[3]程濤,周峰,酈海通.西安地鐵2號線南段運營初期客流預(yù)測[J].都市快軌交通,2015,28(5):45-49.
(CHENG Tao, ZHOU Feng, LI Haitong. Forecasting Passenger Flow on Southern Extension of Xi’an Metro Line 2 in Preliminary Operation Stage[J]. Urban Rapid Rail Transit,2015,28(5):45-49. in Chinese)
[4]趙路敏,王奕,杜世敏.新線開通對線網(wǎng)客流特征的影響[J]. 都市快軌交通,2011,24(2):46-49.
(ZHAO Lumin, WANG Yi, DU Shimin. Impact of Opening a New Line on Passenger Flow Feature ofUrban Rail Transit Network[J]. Urban Rapid Rail Transit, 2011,24(2):46-49. in Chinese)
[5]JAN G De Gooijer, ROB J. Hyndman. 25 Years of Time Series Forecasting[J].International Journal of Forecasting,2006,22(3):443-473.
[6]WILLIAMS B M, HOEL L A. Modeling and Forecasting Vehicular Traffic Flow as a Seasonal ARIMA Process: Theoretical Basis and Empirical Results[J]. Journal of Transportation Engineering, 2003, 129(6):664-672.
[7]OKUTANI I, STEPHANEDES Y J. Dynamic Prediction of Traffic Volume through Kalman Filtering Theory[J]. Transportation Research Part B: Methodological, 1984, 18(1): 1-11.
[8]張春輝, 宋瑞, 孫楊. 基于卡爾曼濾波的公交站點短時客流預(yù)測[J]. 交通運輸系統(tǒng)工程與信息, 2011, 11(4): 154-159.
(ZHANG Chunhui, SONG Rui, SUN Yang. Kalman Filter-Based Short-Term Passenger Flow Forecasting on Bus Stop[J].Journal of Transportation Systems Engineering and Information Technology,2011,11(4):154-159. in Chinese)
[9]楊軍,侯忠生.基于小波分析的最小二乘支持向量機軌道交通客流預(yù)測方法[J].中國鐵道科學(xué),2013,34(3):122-127.
(YANG Jun, HOU Zhongsheng. A Wavelet Analysis Based LS-SVM Rail Transit Passenger Flow Prediction Method[J]. China Railway Science, 2013,34(3):122-127. in Chinese)
[10]SUN Yuxing, LENG Biao, GUAN Wei. A Novel Wavelet-SVM Short Time Passenger Flow Prediction in Beijing Subway System[J]. Neurocomputing,2015(166):109-121.
[11]YU Wei, MU Chen Chen. Forecasting the Short-Term Metro Passenger Flow with Empirical Mode Decomposition and Neural Networks[J]. Transportation Research Part C,2012(21):148-162.
[12]董升偉.基于改進BP神經(jīng)網(wǎng)絡(luò)的軌道交通短時客流預(yù)測方法研究[D].北京交通大學(xué),2013.
(DONG Shengwei.The Research of Short-Time Passenger Flow Forecasting Based on Improved BP Neural Network in Urban Rail Transit[D]. Beijing: Beijing Jiaotong University, 2013. in Chinese)
[13]張曉利,陸化普.非參數(shù)回歸方法在短時交通流預(yù)測中的應(yīng)用[J].清華大學(xué)學(xué)報:自然科學(xué)版,2009,49(9):1471-1475.
(ZHANG Xiaoli, LU Huapu. Non-Parametric Regression and Application for Short-Term Traffic Flow Forecasting[J].Journal of Tsinghua University:Science and Technology,2009,49(9):1471-1475. in Chinese)
[14]張濤,陳先,謝美萍,等.基于K近鄰非參數(shù)回歸的短時交通流預(yù)測方法[J].系統(tǒng)工程理論與實踐,2010,30(2):376-384.
(ZHANG Tao, CHEN Xian, XIE Meiping, et al.K-NN Based Nonparametric Regression Method for Short-Term Traffic Flow Forecasting[J].System Engineering-Theory & Practice, 2010,30(2): 376- 384. in Chinese)
[15]王翔,陳小鴻,楊祥妹.基于K最近鄰算法的高速公路行程時間預(yù)測[J].中國公路學(xué)報,2015,28(1):102-111.
(WANG Xiang, CHEN Xiaohong, YANG Xiangmei. Short Term Prediction of Expressway Travel Time Based onKNearest Neighbor Algorithm[J].China Journal of Highway and Transport, 2015,28(1): 102-111. in Chinese)
[16]劉美琪,焦朋朋,孫拓.城市軌道交通進站客流量短時預(yù)測模型研究[J].城市軌道交通研究,2015(11):13-17.
(LIU Meiqi, JIAO Pengpeng, SUN Tuo. On Short-Term Forecasting Model of Passenger Flow in Urban Rail Transit[J].Urban Mass Transit, 2015(11):13-17. in Chinese)
[17]姚恩建,李斌斌,劉莎莎,等.考慮土地利用性質(zhì)匹配度的城軌客流分布預(yù)測[J].交通運輸系統(tǒng)工程與信息,2015,15(6):107-113.
(YAO Enjian, LI Binbin, LIU Shasha, et al. Forecast of Passenger Flow Distribution among Urban Rail Stations Considering the Land-Use Matching Degree[J]. Journal of Transportation Systems Engineering and Information Technology, 2015,15(6):107-113. in Chinese)
[18]姚恩建,程欣,劉莎莎,等.基于可達性的城軌既有站進出站客流預(yù)測[J].鐵道學(xué)報,2016,38(1):1-7.
(YAO Enjian, CHENG Xin, LIU Shasha, et al. Accessibility-Based Forecasting on Passenger Flow Entering and Departing Existing Urban Railway Stations[J]. Journal of the China Railway Society, 2016,38(1):1-7. in Chinese)
[19]李星毅.基于相似性的交通流分析方法[D].北京:北京交通大學(xué),2010.
(LI Xingyi. Methods of Traffic Flow Analysis Based on Similarity[D]. Beijing: Beijing Jiaotong University, 2010. in Chinese)