趙彪 劉曉鋒 付甜
摘? 要:為了實(shí)時(shí)判斷城市交通及快速路交通狀況,并充分考慮到快速路及交通系統(tǒng)的模糊性、差異性、波動(dòng)性,文章首先給出了一套基于模糊C均值聚類法(Fuzzy C-Means)的快速路交通狀況判斷算法,將道路的交通狀況區(qū)分為通暢、基本順暢、緩行、堵塞4類。其次,利用了長短期記憶網(wǎng)絡(luò)(LSTM)的長短時(shí)預(yù)測(cè)技術(shù),給出了一個(gè)基于深度學(xué)習(xí)的模式,對(duì)交通運(yùn)行三參數(shù)進(jìn)行預(yù)測(cè),并利用路側(cè)檢測(cè)設(shè)備不斷獲取新的真實(shí)數(shù)據(jù),對(duì)預(yù)測(cè)模型進(jìn)行迭代訓(xùn)練。然后利用已形成的模糊聚類模型,得到快速路交通運(yùn)行狀態(tài)的預(yù)測(cè)結(jié)果。最后以天津市黑牛城道的真實(shí)交通數(shù)據(jù)進(jìn)行實(shí)驗(yàn)驗(yàn)證,結(jié)果表明,文章提出的交通流狀態(tài)預(yù)測(cè)模型準(zhǔn)確性達(dá)到93.22%,能為快速路交通控制提供有效的狀態(tài)預(yù)測(cè)。
關(guān)鍵詞:城市快速路;模糊C均值聚類;深度學(xué)習(xí);LSTM短時(shí)預(yù)測(cè)方法;交通運(yùn)行三參數(shù)
中圖分類號(hào):TP391.9? ? 文獻(xiàn)標(biāo)識(shí)碼:A? ? 文章編號(hào):2096-4706(2023)01-0001-08
Traffic Operation State Discrimination and Prediction of Urban Expressway
Based on Deep Learning
ZHAO Biao, LIU Xiaofeng, FU Tian
(Tianjin University of Technology and Education, Tianjin? 300222, China)
Abstract: In order to judge the urban traffic and traffic condition of expressway in real time, and to fully consider the fuzziness, variability, and fluctuation of expressway and traffic system, a set of judgment algorithms of expressway traffic condition based on Fuzzy C-Means is given in this paper firstly, which distinguishes the traffic conditions of roads into four categories: smooth, basically smooth, slow and blocked. Secondly, a model based on deep learning is given to predict the three parameters of traffic operation by using the Long Short-Term Memory (LSTM) long short-term prediction technique, and the prediction model is trained iteratively by continuously acquiring new real data using roadside detection equipments. Then using the developed fuzzy clustering model, the prediction results of the traffic operation state of the expressway are obtained. Finally, the real traffic data of Heiniu Road in Tianjin is used for experimental validation, and the results show that the accuracy of the traffic flow state prediction model proposed in this paper reach 93.22%, which can provide effective state prediction for expressway traffic control.
Keywords: urban expressway; Fuzzy C-Means; deep learning; LSTM short-time prediction method; three parameters of traffic operation
0? 引? 言
作為都市道路交通的主動(dòng)脈,城市快速路以其大容量、高效、強(qiáng)聯(lián)通的特性承載著城市內(nèi)各個(gè)主要功能區(qū)域的交通,極大地減輕了城市壓力,提升了城市的整體服務(wù)質(zhì)量。對(duì)于道路交通的模糊性、隨機(jī)性、復(fù)雜性,實(shí)時(shí)準(zhǔn)確的短期交通流量預(yù)測(cè),對(duì)快速路的智能控制和管理具有基礎(chǔ)性和決定性的作用。
以往的短期交通預(yù)測(cè)工具,主要可以分成以下三種:參數(shù)方法、非參數(shù)方法和混合方法。參數(shù)化方法包括時(shí)間排序方式和卡爾曼濾波[1,2]。焦朋朋等[3]充分利用其對(duì)高維特征數(shù)據(jù)預(yù)測(cè)精度高以及計(jì)算速度快的優(yōu)勢(shì),提出了基于集成學(xué)習(xí)XGBoost模型的交通流預(yù)測(cè)。褚瑞娟[4]給出了基于CEEMDAN-IWEP和GWO-LSSVM的運(yùn)輸流組合分析模型,通過CEEMDAN模型可以把原始運(yùn)輸流時(shí)間序列劃分成若干個(gè)比較均勻、簡(jiǎn)單的本征模態(tài)分量的殘余誤差序列,采用最小二乘支持向量機(jī)對(duì)重組后的序列和殘差分量進(jìn)行預(yù)測(cè),將各LSSVM模型的預(yù)測(cè)結(jié)果相加得到最終的預(yù)測(cè)結(jié)果。張亮亮[5]等人給出了基于階段特征分析的城市快速路交通運(yùn)營狀況預(yù)報(bào)方案,運(yùn)用滑動(dòng)變異系數(shù)的方法將道路運(yùn)營狀況序列細(xì)分為幾個(gè)有不同特征的子序列,并分析了各個(gè)特征子序列的自關(guān)系,從而建立了門限自回歸的道路運(yùn)營狀況多步預(yù)報(bào)模式。Guo[1]等采用動(dòng)態(tài)的過程方差,生成可行的預(yù)測(cè)和估計(jì)水平間隔,運(yùn)用改進(jìn)的自適應(yīng)卡爾曼濾波方法預(yù)測(cè)交通流。Lin[6]基于交通流理論,將ARIMA模型與GARCH模型相結(jié)合,得到相應(yīng)的波動(dòng)特征,實(shí)現(xiàn)高速公路交通流預(yù)測(cè)。Shahriari[7]將bootstrapping抽樣方法和ARIMA結(jié)合,建立E-ARIMA交通流預(yù)測(cè)模型。
傳統(tǒng)的基于機(jī)器學(xué)習(xí)的方法利用人為的特征來捕捉交通流的特征,這不足以獲得準(zhǔn)確的預(yù)測(cè)性能。此外,早期基于神經(jīng)網(wǎng)絡(luò)的工作通常使用淺層網(wǎng)絡(luò)或只有一個(gè)隱藏層,這也無法捕捉交通流的不確定性和復(fù)雜的非線性。與傳統(tǒng)的ANN模型相比,深度學(xué)習(xí)模型使用多層架構(gòu),從大量的原始數(shù)據(jù)中自動(dòng)提取固有的特征。最近,深度學(xué)習(xí)激發(fā)了交通研究的興趣。不同的深入了解模式,也被引入于交通流分析。然而,現(xiàn)有的基于深度學(xué)習(xí)模型的交通流預(yù)測(cè)工作存在以下缺點(diǎn):
(1)很多作品的著眼點(diǎn)在于單參數(shù)的預(yù)測(cè),比如交通量預(yù)測(cè)、交通速度預(yù)測(cè),但往往缺乏對(duì)整體交通運(yùn)行情況的控制要素的關(guān)注,使得預(yù)測(cè)結(jié)果不能完全反映出交通運(yùn)行的具體情況,很難在具體的交通管理與控制中作為控制性指標(biāo)使用。
(2)目前大多數(shù)的快速路匝道控制策略研究的主要方法是人工定周期控制和自適應(yīng)控制。前者無法隨交通運(yùn)行狀態(tài)的變化而進(jìn)行實(shí)時(shí)調(diào)整,后者則因?yàn)榭焖俾方煌ㄏ到y(tǒng)的復(fù)雜性和模糊性而缺乏預(yù)見性,因此在國內(nèi)的推廣相對(duì)較慢。同時(shí)目前的研究缺乏對(duì)預(yù)測(cè)參數(shù)的歸類處理,也就很難開展對(duì)不同交通運(yùn)行狀態(tài),如擁堵狀態(tài)、暢通狀態(tài)等的針對(duì)性交通管理與控制。本文提出的快速路交通運(yùn)行狀態(tài)預(yù)測(cè)方法,可以有效解決這些問題,為快速路交通控制提供支持。
1? 基于FCM的快速路交通狀態(tài)判別
1.1? FCM算法簡(jiǎn)介
C均值模糊聚類算法[8]由Bezdek和Castelaz于1972年提出,以同類對(duì)象相似度最大,不同類別對(duì)象相似度最小為原則,將多維數(shù)據(jù)樣本劃分為特定類數(shù)。具體方法如下:
設(shè)X={x1, x2,…, xn}為n元數(shù)據(jù)集合,xi∈Rs。FCM把X劃分為c個(gè)子集S1, S2,…,Sc,若用V={α1,…,αc}表示這c個(gè)子集的聚類中心,uij表示元素xj對(duì)Si的隸屬度,則FCM算法的優(yōu)化目標(biāo)函數(shù)為:
(1)
滿足如下約束條件:
(2)
其中,
(3)
(4)
(5)
式中U={uij}為c×n矩陣,V={α1,α2,…,αn}為c×s矩陣,xj與αi的距離為dij,本文中距離計(jì)算采用歐式距離。m為模糊指數(shù),用來控制分類矩陣U的模糊程度,其取值大于1,m越大,分類的模糊程度越高,在實(shí)際的交通運(yùn)行預(yù)測(cè)應(yīng)用中m的最佳范圍為(1.5,2.5)。該算法的主過程通過不斷迭代收斂,獲取目標(biāo)函數(shù)的最小值,隸屬度值uij采用拉格朗日乘數(shù)法進(jìn)行計(jì)算。
結(jié)合式(1)~式(5),即可夠得到隸屬度矩陣U和聚類中心A以及使目標(biāo)函數(shù)最小化的迭代優(yōu)選過程。
1.2? 基于FCM交通狀態(tài)判別方法
1.2.1? 數(shù)據(jù)預(yù)處理
為增強(qiáng)數(shù)據(jù)處理的可信度,必須檢驗(yàn)原始數(shù)據(jù)的完善與合理程度,并消除和舍棄不合理的原始數(shù)據(jù)記載。本文用三參數(shù)基本圖作為參照,依次繪就占有率—速度、占有率—交通量、速度—占有率的關(guān)系圖,對(duì)部分?jǐn)?shù)據(jù)進(jìn)行校正和剔除[9]。
1.2.2? 迭代聚類
通過式(3)、式(4)計(jì)算U(k),V(k+1),比較V(k+1)與V(k),如果滿足V(k+1)-V(k)≤?的條件,則停止迭代,得到各交通狀態(tài)的聚類中心,否則,以k=k+1繼續(xù)迭代分析。
1.2.3? 狀態(tài)判斷結(jié)果分析
在模擬數(shù)據(jù)分析中,隨機(jī)選擇了這些信息并和新的城市交通狀態(tài)聚類中心比較,以確定最有代表性的信息所對(duì)應(yīng)的新交通狀況。
狀態(tài)判別流程如圖1所示。
2? 基于深度學(xué)習(xí)的快速路交通運(yùn)行狀態(tài)預(yù)測(cè)
2.1? LSTM算法簡(jiǎn)介
長短期記憶網(wǎng)絡(luò)(Long Short-Term Memory, LSTM)是循環(huán)神經(jīng)網(wǎng)絡(luò)RNN的一個(gè)變體[10],是專為處理學(xué)習(xí)長期依賴性現(xiàn)象而設(shè)計(jì)并產(chǎn)生的,對(duì)傳統(tǒng)RNN的缺陷具有針對(duì)性,是當(dāng)前使用較為廣泛的神經(jīng)網(wǎng)絡(luò)模型,在時(shí)間序列預(yù)測(cè)、視頻信息處理、圖像處理及自然語言處理等諸多領(lǐng)域中能達(dá)到較好的應(yīng)用效果。
如圖2所示,RNN是一個(gè)循環(huán)的神經(jīng)網(wǎng)絡(luò),允許了信息的持久性。其中A被視為神經(jīng)網(wǎng)絡(luò)的一個(gè)縮影,接受某時(shí)刻的輸入Xt然后輸出對(duì)應(yīng)的結(jié)果ht,一個(gè)回路可以允許信息從一步傳遞到另一步。一個(gè)循環(huán)神經(jīng)網(wǎng)絡(luò)可以被認(rèn)為把若干個(gè)功能相同的基本單元連接起來,每一個(gè)基本單元都可以將信息傳遞到下一個(gè)基本單元。由于其獨(dú)特的時(shí)間記憶機(jī)制,參數(shù)共享并且圖靈完備,RNN可以記住輸入的有關(guān)重要信息,這使得RNN可以非常精準(zhǔn)的進(jìn)行預(yù)測(cè)。因此,人們?cè)谔幚矸蔷€性的序列數(shù)據(jù)(比如時(shí)間序列數(shù)據(jù)、交通流數(shù)據(jù)、文本、金融數(shù)據(jù)、天氣等)時(shí),常常將RNN作為首選的預(yù)測(cè)算法。
LSTM是RNN的一個(gè)分支,與RNN不同,RNN的隱藏層節(jié)點(diǎn)在LSTM中變成了記憶模塊。由于記憶模塊加入,LSTM具有了記憶能力,可在一定程度解決梯度消失問題及長期依賴問題。
LSTM的核心思想是其細(xì)胞狀態(tài)[11]。傳統(tǒng)的RNN會(huì)以不被控制的方法在每個(gè)時(shí)間步長里重復(fù)之前的記憶,因此信息和殘差在RNN神經(jīng)元中傳遞時(shí)會(huì)隨時(shí)間逐步損耗。因此RNN需要一定的結(jié)構(gòu)來支撐長期記憶能力,LSTM使用“細(xì)胞狀態(tài)”來刻畫神經(jīng)元記憶中不太容易衰減的部分,并圍繞細(xì)胞狀態(tài)構(gòu)造長期記憶。差異對(duì)比如圖3所示。
在圖4中,左圖為RNN的神經(jīng)元結(jié)構(gòu),右圖為LSTM的神經(jīng)元結(jié)構(gòu),LSTM中增加的部位即為細(xì)胞狀態(tài)(Cell State),我們以細(xì)胞狀態(tài)向量的形式,來儲(chǔ)存神經(jīng)元對(duì)之前序列的學(xué)習(xí)和記憶,細(xì)胞狀態(tài)在整個(gè)神經(jīng)網(wǎng)絡(luò)中一直延直線運(yùn)行,將上個(gè)時(shí)間步的細(xì)胞狀態(tài)、當(dāng)前步的數(shù)據(jù)輸入、上一時(shí)步的隱藏狀態(tài)綜合起來,構(gòu)造出每個(gè)神經(jīng)元結(jié)構(gòu)的歷史長期記憶。
LSTM單元結(jié)構(gòu)中的輸入門、遺忘門、輸出門的計(jì)算公式為:
it=g(Wxixt+Whiht-1+hi)? ? ? ? ? ? ? ? ? ? ? ? ?(6)
ft=g(Wx? fxt+Wh? fht-1+bf)? ? ? ? ? ? ? ? ? ? ? ? (7)
Ot=g(Wxoxt+Whoht-1+bo)? ? ? ? ? ? ? ? ? ? ? ? (8)
輸入變化及狀態(tài)更新公式:
i_int=tanh(Wxcxt+Whcht-1+bc_in)? ? ? ? ? ? ? ? ? (9)
ct=ft·ct-1+it·c_int? ? ? ? ? ? ? ? ? ? ? ? (10)
ht=ot·tanh(ct)? ? ? ? ? ? ? ? ? ? ? ? ? ? (11)
2.2? 基于LSTM的快速路交通三要素短時(shí)預(yù)測(cè)流程
基于LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)的交通運(yùn)行三要素預(yù)測(cè)模型的基本步驟如下[12]:
(1)實(shí)驗(yàn)數(shù)據(jù)預(yù)處理(校正、剔除)。
(2)選取訓(xùn)練集與測(cè)試集(對(duì)數(shù)據(jù)集進(jìn)行劃分)。
(3)根據(jù)預(yù)測(cè)因子和所需預(yù)測(cè)的變量確定輸入、輸出變量。
(4)確定網(wǎng)絡(luò)層數(shù)與各層神經(jīng)元數(shù)量。
(5)確定網(wǎng)絡(luò)的初始權(quán)值、隱層閥值、輸出層閥值、激勵(lì)函數(shù)、學(xué)習(xí)速率等。
(6)訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型中,當(dāng)實(shí)驗(yàn)誤差超過規(guī)定范圍以后或訓(xùn)練步數(shù)超過事先規(guī)定的值時(shí)終止訓(xùn)練系統(tǒng),若不滿足,進(jìn)行各網(wǎng)絡(luò)參數(shù)值的修正和調(diào)整。
(7)預(yù)測(cè),輸入測(cè)試集數(shù)據(jù)得到網(wǎng)絡(luò)的實(shí)際輸出值。
(8)分析預(yù)測(cè)結(jié)果,得出最終最佳的預(yù)測(cè)結(jié)果。
本文快速路交通運(yùn)行三要素短時(shí)預(yù)測(cè)流程如圖4所示。
3? 案例分析
3.1? 目標(biāo)道路概況
本文選擇天津市黑牛城道的通達(dá)尚城路段作為研究對(duì)象,該段道路為天津市快速環(huán)路的一部分,主路四車道,輔路兩車道。該道路作為天津市重要的東西向主干道,承擔(dān)著通道性功能,由于交通組織復(fù)雜,交通量大,同時(shí)缺乏必要的管控措施,在高峰時(shí)段常處于過飽和狀態(tài),擁堵問題嚴(yán)重。研究路段區(qū)位信息如圖5所示。道路車道渠化情況如圖6所示。
3.2? 交通調(diào)查與主要參數(shù)
本文主要通過多目標(biāo)跟蹤視覺雷達(dá)對(duì)汽車目標(biāo)路線的信息收集,該技術(shù)能夠?qū)崿F(xiàn)檢測(cè)道路的真實(shí)汽車跟蹤路徑信息,包含了汽車的時(shí)速、方位、車道號(hào)、三維位置,以及超車、變道、停車和逆行等的監(jiān)測(cè)信號(hào),同時(shí)具有汽車流量數(shù)據(jù)、平均速度、市場(chǎng)占有率,以及汽車排隊(duì)時(shí)間等信息。雷達(dá)設(shè)備安置在該段快速路途中一座人行天橋上,正面面對(duì)被測(cè)道路,距離道路豎直距離大概7米。系統(tǒng)采用RS485通信模式設(shè)置,在多目標(biāo)跟蹤、觸發(fā)(單目標(biāo))和觸發(fā)(多目標(biāo))工作模式下同時(shí)發(fā)送RS485數(shù)據(jù)。該系統(tǒng)安裝后屏幕架構(gòu)如圖7所示。該多目標(biāo)雷達(dá)采集系統(tǒng)操作界面及檢測(cè)結(jié)果如圖8所示。
本文選擇的主要研究參數(shù)包括交通量、平均運(yùn)行速度、占有率。同時(shí)以一些組合參數(shù)對(duì)調(diào)查時(shí)段進(jìn)行選取,包括堵塞指數(shù)(CI)、停止時(shí)間比例(PST)等。以120秒為檢測(cè)間隔,選擇早上7:00到8:30作為早高峰時(shí)段,中午11:30到13:00作為午高峰,下午5:30到7:00作為晚高峰時(shí)段,下午2:50到3:50和上午10:00到11:00作為平峰時(shí)段,進(jìn)行了斷面交通調(diào)查。各時(shí)段總體情況如表1所示。
經(jīng)過對(duì)調(diào)查數(shù)據(jù)的分析,并以后驗(yàn)概率為主要衡量指標(biāo)在對(duì)原始聚類分析法中加以優(yōu)化,便可得出關(guān)于快速路交通運(yùn)行狀況的原始聚類分析法中的4×3階矩陣。不同交通運(yùn)行狀態(tài)的初始聚類中心如表2所示。
3.3? 交通運(yùn)行狀態(tài)聚類分析
3.3.1? m值的確定
根據(jù)m值的選定的取值范圍為(1,2.5][13],采用啟發(fā)式的方法,以步長0.3在區(qū)間(1,2.5]中對(duì)進(jìn)行試取值,即m∈{1.3,1.6,1.9,2.2,2.5}。經(jīng)過不同m值的效果對(duì)比,最終選擇m=2.2。
3.3.2? 聚類類數(shù)c值的確定
在應(yīng)用算法進(jìn)行聚類分析時(shí),需要預(yù)先給定聚類類數(shù),本文通過聚類有效性函數(shù)來確定聚類數(shù)目的取值,從而在最大程度上使聚類問題更有效。因而,對(duì)聚類分析而言,有效性問題可以轉(zhuǎn)化為最佳聚類類數(shù)的確定問題。本文采用類有效性函數(shù),確定不同聚類類數(shù)的有效性,類有效性函數(shù)如式(14)所示:
(14)
式中,n表示樣本數(shù)量,c表示類別數(shù),m表示模糊加權(quán)指數(shù),xj表示第j個(gè)樣本的值,uij表示第i個(gè)樣本對(duì)第j類的隸屬度,vi、vj表示第i類和第j類的聚類中心。
就模糊聚類的效果而言,同一類別的樣本間的相似度越大,分布越緊密,而不同類別的樣本間相似度越小,分離程度越大說明聚類效果越好。因此,式(14)中數(shù)值越大表示分類的緊密程度越高,分類分離程度越大,p的值越大就表示聚類效果越好。經(jīng)過計(jì)算,c=2,3,4,5,6,7,8,9,10時(shí),有效性函數(shù)的函數(shù)值如表3所示。