李揚(yáng) 胡堯 商明菊 楊超 周江娥
摘要:為對(duì)新增車輛的通行擁堵進(jìn)行預(yù)測(cè),首先使用K-Medoids聚類算法將交通流運(yùn)行狀態(tài)劃分為順暢、阻滯、擁堵三類,然后引入交通流特征參數(shù)構(gòu)建累積Logistic回歸模型量化新增車輛對(duì)路段運(yùn)行狀態(tài)的影響,最后基于支持向量回歸機(jī)預(yù)測(cè)新增車輛通行時(shí)間。研究結(jié)果表明:當(dāng)只考慮車流量、限行時(shí)段和二者之間的交互作用時(shí),模型預(yù)測(cè)道路狀態(tài)的正確率達(dá)到82.36%,此時(shí)車流量在非限行時(shí)段每增加一輛車,發(fā)生比從順暢狀態(tài)轉(zhuǎn)為非順暢狀態(tài)的概率是原來的1.087倍:當(dāng)考慮車流量、黃牌車比例、限行時(shí)段、外地車比例及后兩者的交互作用時(shí),模型預(yù)測(cè)通行時(shí)間MSE最小,預(yù)測(cè)效果最優(yōu)。
關(guān)鍵詞:交通流運(yùn)行狀態(tài);累積Logistic回歸模型;支持向量回歸機(jī);通行時(shí)間
中圖分類號(hào):0212文獻(xiàn)標(biāo)識(shí)碼:A
目前,世界各大中城市幾乎都面臨著交通擁堵問題。交通擁堵給人們的生活帶來很多負(fù)面影響,例如降低人們的出行效率,對(duì)社會(huì)造成經(jīng)濟(jì)損失以及擁堵時(shí)尾氣排放等問題。交通擁堵在很大程度上阻礙一個(gè)城市的發(fā)展,因此構(gòu)建合理且易于實(shí)施的擁堵預(yù)測(cè)模型對(duì)人們尤為重要。
關(guān)于構(gòu)建交通擁堵預(yù)測(cè)模型,有很多學(xué)者進(jìn)行了研究。熊勵(lì)等構(gòu)建基于MapReduce的多元對(duì)數(shù)線性回歸擁堵預(yù)測(cè)模型,預(yù)測(cè)效果良好:崔承穎等運(yùn)用累積Logistic回歸方法對(duì)各路段的擁堵概率進(jìn)行估計(jì):劉夢(mèng)涵等將似然比方法和累積Lo-gistic回歸模型結(jié)合運(yùn)用到交通擁堵評(píng)價(jià)模型中。近年來,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)也被廣泛應(yīng)用在交通擁堵預(yù)測(cè)上,然而大多數(shù)預(yù)測(cè)僅限于對(duì)當(dāng)前的車流量狀態(tài)進(jìn)行預(yù)測(cè),而根據(jù)當(dāng)前的交通流狀態(tài),進(jìn)行新增車輛通行擁堵預(yù)測(cè)的問題研究較少。
本文選取深圳市交通數(shù)據(jù)進(jìn)行分析,運(yùn)用聚類方法對(duì)交通狀態(tài)進(jìn)行劃分,建立累積Logistic回歸模型,分析新增車輛對(duì)交通運(yùn)行狀態(tài)的影響,并將構(gòu)建的累積Logistic回歸模型與支持向量回歸機(jī)模型結(jié)合預(yù)測(cè)出新增車輛的通行時(shí)間。
1 模型理論
2實(shí)證分析
2.1數(shù)據(jù)準(zhǔn)備
研究數(shù)據(jù)來源于深圳尚龍數(shù)學(xué)中心網(wǎng)站(http://m2et,org/)公布的深圳市交通數(shù)據(jù)。選擇的路段位于北環(huán)大道新洲立交西往東方向,長度575m,離其最近的卡口為10100206卡口,選擇該路段2018年3月26日至2叭8年3月28日的數(shù)據(jù),整理數(shù)據(jù)得出在該時(shí)段1~3車道的車流量(每兩分鐘過車數(shù))、外地車(非粵B)匯人比和黃牌車(大車包括公交車)比例;此外,將白天設(shè)為1.黑夜設(shè)為0.將限行時(shí)段(7:00-9:00.17:30-19:30)設(shè)為1.非限行時(shí)段設(shè)為0.總結(jié)出時(shí)間屬性:計(jì)算路段的路段通行時(shí)間(長度除以通行速度),上述數(shù)據(jù)粒度為2min(全天共有720個(gè)時(shí)刻,3天2160個(gè)時(shí)刻)。表1為整理后的該路段部分?jǐn)?shù)據(jù)。
取2018年3月26日和3月27日的數(shù)據(jù)作為訓(xùn)練集,3月28日的數(shù)據(jù)作為測(cè)試集,得到卡口這3天每兩分鐘的過車數(shù)和通行時(shí)間時(shí)序圖,如圖1所示。
從圖1可看出:3月26日和3月27日的過車數(shù)時(shí)序圖趨勢(shì)相差不多,而3月28日的過車數(shù)趨勢(shì)在早上大約10點(diǎn)后下降,與實(shí)際情況相差較大,可能是數(shù)據(jù)的質(zhì)量造成的:3月26日為星期一,其通行時(shí)間的早高峰(約8:00)較3月27日和3月28日明顯,與實(shí)際情況相符。
2.2模型求解與評(píng)價(jià)
2.2.1基于Logistic回歸的交通運(yùn)行狀態(tài)評(píng)估
將訓(xùn)練集(3月26日和3月27日)的車流量和通行時(shí)間(長度/通行速度)進(jìn)行K-Meclioids聚類,得到3類交通運(yùn)行狀態(tài)聚類結(jié)果,設(shè)為1(順暢),2(阻滯),3(擁堵)。根據(jù)聚類結(jié)果,結(jié)合滑動(dòng)窗口構(gòu)建解釋變量集,將交通狀態(tài)(順暢,阻滯,擁堵)作為響應(yīng)變量建立累積Logistic回歸模型,經(jīng)過多種模型的選擇,得到三個(gè)模型。
其中:q(t)為t時(shí)刻車流量,S為時(shí)段(白天黑夜),W(t)為t時(shí)刻外地車比例,日(t)為t時(shí)刻黃牌車比例,α為時(shí)段S與外地車比例W(t)的交互作用;x為限行時(shí)段,β為車流量和限行時(shí)段的交互作用;γ為限行時(shí)段x和外地車比例W(t)的交互作用。AIC為在逐步回歸時(shí)以AIC信息統(tǒng)計(jì)量為準(zhǔn)則,通常選取最小的AIC作為最優(yōu)模型。模型一考慮車流量、時(shí)段(白天黑夜)、外地車比例、黃牌車比例以及時(shí)段與外地車比例的交互作用,建立累積Logistic回歸模型,如表2所示。
由累積概率表達(dá)式(2)(3)得出S=1(白天)時(shí),車流量q(t)、外地車比例W(t)、黃牌車比例H(t)對(duì)交通狀態(tài)都有影響。當(dāng)外地車比例W(t)和黃牌車比例H(t)不變時(shí),車流量q(t)的發(fā)生比為exp(0.015)=1.015.表明當(dāng)流量每增加一輛車時(shí),交通狀態(tài)從順暢變?yōu)樽铚驌矶聲r(shí)的概率是原來的1.015倍;當(dāng)車流量q(t)和黃牌車比例H(t)不變時(shí),外地車比例W(t)發(fā)生比為exp(3.695-3.259)=1.547.即外地車比例W(t)每增加一個(gè)百分比,交通狀態(tài)從1(順暢)變?yōu)?(阻滯)或3(擁堵)時(shí)的概率是原來的1.547倍。因此應(yīng)該對(duì)外地車進(jìn)行限時(shí)通行。
模型二只考慮車流量、限行時(shí)段(早晚高峰)、車流量和限行時(shí)段的交互作用等因素,得到結(jié)果如表3所示。
由累積概率式(4)(5)得到:當(dāng)不在限行時(shí)段內(nèi)(x=0)時(shí),只有車流量q(t)對(duì)通行時(shí)間有影響。車流量q(t)的發(fā)生比為exp(0.083)=1.087.表明此時(shí)車流量每增加一輛車時(shí),交通狀態(tài)從順暢變?yōu)樽铚驌矶聲r(shí)的概率是原來的1.087倍。模型三考慮車流量、黃牌車比例、限行時(shí)段(早晚高峰)、外地車比例以及限行時(shí)段和外地車比例的交互作用,模型結(jié)果如表4所示。
由式(6)、(7)可得:當(dāng)在限行時(shí)段內(nèi)(x=1)時(shí),x和外地車比例W(t)有交互作用。有車流量q(t),黃牌車比例H(t)和外地車比例W(t)對(duì)通行時(shí)間有影響。外地車比例W(t)和黃牌車比例H(t)不變,車流量q(t)發(fā)生比為exp(0.063)=1.065.車流量每增加一輛車時(shí),交通狀態(tài)從1(順暢)變?yōu)?(阻滯)或3(擁堵)時(shí)的概率為原來的1.065倍,這意味著γ=2(阻滯)和γ=3(擁堵)的概率會(huì)增加。
為評(píng)估各模型的預(yù)測(cè)效果,將該路段3月26日和3月27日作為訓(xùn)練數(shù)據(jù)預(yù)測(cè)3月28日(一天共720個(gè)數(shù)據(jù))的交通狀態(tài),并將預(yù)測(cè)狀態(tài)與真實(shí)狀態(tài)作對(duì)比(當(dāng)預(yù)測(cè)狀態(tài)和真實(shí)狀態(tài)一致表示預(yù)測(cè)正確,不一致則表示預(yù)測(cè)錯(cuò)誤),分別計(jì)算三個(gè)模型預(yù)測(cè)的正確率。其中3月28日真實(shí)狀態(tài)為距三種狀態(tài)的聚類中心最短距離時(shí)所對(duì)應(yīng)的交通狀態(tài)。設(shè)T、T、T分別表示真實(shí)狀態(tài)為順暢、阻滯、擁堵狀態(tài),P、P、P分別表示預(yù)測(cè)狀態(tài)為順暢、阻滯、擁堵狀態(tài)。表5描述三個(gè)模型在各情形下的數(shù)據(jù)個(gè)數(shù),其中每個(gè)模型下的9個(gè)數(shù)加起來為3月28日數(shù)據(jù)的總數(shù)量即720。
從表5計(jì)算正確率可得,模型一為59.58%,模型二為82.36%,模型三為80.280A,,比較各模型AIC信息統(tǒng)計(jì)量,模型二最小,因此在三個(gè)模型中,模型二能較好地測(cè)算出車輛增加時(shí)路段交通狀態(tài)的變化。
2.2.2基于支持向量回歸機(jī)的通行時(shí)間預(yù)測(cè)
上一節(jié)通過累積Logistic回歸模型得出新增車輛對(duì)路段交通狀態(tài)的影響,本節(jié)對(duì)新增車輛的通行時(shí)間進(jìn)行預(yù)測(cè)。將累積Logistic回歸的三個(gè)模型代人支持向量回歸機(jī)中,運(yùn)用滑動(dòng)窗口法對(duì)窗口數(shù)^進(jìn)行選擇,如圖2所示(圖中用“o”表示:MSE達(dá)到最小的滑動(dòng)窗口數(shù))。
表6列出三個(gè)支持向量回歸機(jī)(SVR-1.SVR-2.SVR-3)對(duì)通行時(shí)間的預(yù)測(cè)結(jié)果,可以看出:對(duì)于滑動(dòng)窗口數(shù),三個(gè)模型相差不大:但對(duì)比MSE,模型三的訓(xùn)練MSE和預(yù)測(cè):MSE在這三個(gè)模型中最小。因此針對(duì)新增車輛的通行時(shí)間預(yù)測(cè),模型三在這三個(gè)模型中是最好的。
圖3更加直觀的展現(xiàn)了SVR三個(gè)模型的通行時(shí)間真實(shí)值和預(yù)測(cè)值的對(duì)比,可以看出模型三比其他兩個(gè)模型擬合效果稍好,但三個(gè)模型在下午4點(diǎn)至6點(diǎn)擬合效果不好,這可能是由于圖1中3月28日的車流量數(shù)據(jù)(過車數(shù))與實(shí)際不符造成的。整體來說,三個(gè)模型能夠較好的預(yù)測(cè)出通過該路段的通行時(shí)間,可為市民提供參考建議。
3結(jié)論
通過對(duì)深圳市交通數(shù)據(jù)建立累積Logistic回歸模型,研究結(jié)果表明:當(dāng)只考慮車流量、限行時(shí)段和二者之間的交互作用時(shí),模型正確率達(dá)到最高為82.36%,此時(shí)車流量在非限行時(shí)段每增加一輛車,發(fā)生比從順暢狀態(tài)轉(zhuǎn)為非順暢狀態(tài)的概率是原來的1.087倍:結(jié)合支持向量回歸機(jī)較好地預(yù)測(cè)出新增車輛的通行時(shí)間,其中考慮車流量、黃牌車比例、限行時(shí)段、外地車比例及限行時(shí)段和外地車比例的交互作用時(shí),模型MSE最小,效果最優(yōu)。此外基于Logistic回歸的模型還說明,當(dāng)外地車比例增加時(shí),擁堵的概率會(huì)增大,因此應(yīng)該對(duì)外地車進(jìn)行限時(shí)通行來緩解高峰期時(shí)的交通擁堵狀態(tài)。本文研究結(jié)果可為交通相關(guān)部門提供參考。