楊 帆,楊曉光,云美萍
(同濟大學 道路與交通工程教育部重點實驗室,上海 201804)
行程時間是表征路段服務(wù)水平的重要特征之一,城市道路間斷流行程時間由于受到信號交叉口延誤等因素的影響,呈現(xiàn)與連續(xù)流行程時間不同的特征.一般而言,連續(xù)流行程時間分布呈現(xiàn)單峰、右偏的分布特征,多以對數(shù)正態(tài)分布或Burr分布作為連續(xù)流的行程時間擬合分布[1-5].單峰分布模型已經(jīng)被驗證能夠很好地描述高速公路及快速路的行程時間特征.在城市內(nèi)部道路網(wǎng)中,定義上游交叉口出口道至下游交叉口出口道為典型路段,則路段的行程時間會受到道路線型設(shè)計,以及交叉口延誤等待而呈現(xiàn)出間斷流的特征,主要體現(xiàn)在:在相似的外界交通環(huán)境條件下,路段行程時間分布方差較大.從宏觀統(tǒng)計學的角度而言,必然有一定概率的出行者由于延誤而以較長時間通過路段,因此,間斷流的行程時間通常呈現(xiàn)出雙波峰特征.Taylor等[6]進一步對澳大利亞阿德萊德市兩條城市主干道的行程時間數(shù)據(jù)進行分析,得出該行程時間表征出正偏、長尾的特征,并存在雙波峰(bimodality)的特性,并在此基礎(chǔ)上用Burr XII型分布來對路段形成時間和路徑行程時間進行了擬合模型研究.同時,通過用兩個單波峰(unimodal)分布的加權(quán)模型來推導出路段行程時間的雙波峰分布,取得了不錯的擬合效果.其研究成果表明,即使在連續(xù)流狀態(tài)下,行程時間分布也是有一定概率呈現(xiàn)出雙峰分布的特征.Jintanakul等[7]利用貝葉斯混合模型對高速公路行程時間分布進行了研究.其假設(shè)行程時間由兩個正態(tài)分布的混合分布組成,用“快速部分”和“慢速部分”來歸類快速行程時間樣本及慢速行程時間樣本.Ji等[8]利用美國CABS(the campus area bus service) 的 公 交 AVL(automatic vehicle location)數(shù)據(jù),在Jintanakul等人的研究基礎(chǔ)上,利用分層貝葉斯混合模型對城市路段行程時間進行估計.結(jié)果表明,該模型可以較好地描述路段行程時間的雙波峰特性.但總體而言,對于城市間斷流行程時間特征分布的研究目前還較少.更重要的是,間斷流的行程時間受到如路段交通狀況、下游交叉口延誤以及高峰平峰等因素的影響,并非一個固定的雙波峰聯(lián)合分布的情況.因此,本文將以南京市RFID(radio frequency identification)數(shù)據(jù)為基礎(chǔ),分析城市間斷流路段行程時間宏觀分布特征,針對具體的交通流特征選擇合理的聯(lián)合分布模型.本文仍以較為公認的正態(tài)分布和對數(shù)正態(tài)分布對行程時間分布進行擬合,用最小二乘法擬合分布參數(shù),最后對路段行程時間特性進行定性定量分析.
本文采用最小二乘法對城市間斷流行程時間分布進行擬合,建立凸規(guī)劃問題,利用Frank-Wolfe算法得到路段雙峰行程時間分布函數(shù)及各參數(shù).在此基礎(chǔ)上,通過對這些參數(shù)的分析研究對路段交通狀態(tài)進行評估.
RFID數(shù)據(jù)是以無線射頻技術(shù)為基礎(chǔ),以射頻標簽與路側(cè)接收器的通訊來獲取車輛的信息數(shù)據(jù).目前在南京主城區(qū)已經(jīng)有超過55個主干道路段布設(shè)有RFID檢測器,全市有超過70萬輛汽車安裝有RFID標簽(南京市汽車保有量為117萬輛),對于每個路段的車輛采樣率均在80%以上.圖1為RFID設(shè)備布設(shè)的示意圖及RFID行程時間樣本分布圖.RFID設(shè)備可以采集通過該斷面的所有裝有RFID標簽的車輛的信息,包括加密后的車牌信息、通過該斷面的時間、車輛信息等.對于本研究而言,車輛連續(xù)通過上下游兩個斷面的時間是主要參數(shù),通過該數(shù)據(jù)可以推出該車輛通過該路段所花費的行程時間.行程時間樣本分布也明顯體現(xiàn)出雙波峰特性,并且呈現(xiàn)出不同的雙峰分布形狀.本文對不同的分布進行參數(shù)擬合,以更好地表述每一個路段的行程時間分布函數(shù).
圖1 南京RFID數(shù)據(jù)行程時間概念圖及概率分布圖Fig.1 Figures of interrupted travel time and possibility distributions based on RFID data in Nanjing
根據(jù)行程時間分布的不同形狀特征,以及雙峰模型的概念,城市間斷流行程時間的概率分布通式如式(1)所示.
式中:f1(x)為第一概率密度函數(shù)(簡稱第一子分布);f2(x)為第二概率密度函數(shù)(簡稱第二子分布);f(x)為雙峰分布的概率分布函數(shù);F1(x)為第一累積分布函數(shù);F2(x)為第二累積分布函數(shù);F(x)混合分布的累積分布函數(shù);λ為權(quán)重系數(shù).
本文將具體地通過6種情形的分析,對行程時間分布參數(shù)進行擬合.6種情形分別為:正態(tài)分布(用N表示)、對數(shù)正態(tài)分布(用LogN表示)、對數(shù)正態(tài)分布+對數(shù)正態(tài)分布(用LogN_LogN表示)、對數(shù)正態(tài)分布+正態(tài)分布(用LogN_N表示)、正態(tài)分布+對數(shù)正態(tài)分布(用N_LogN表示)和正態(tài)分布+正態(tài)分布(用N_N表示).參數(shù)擬合的目標是為了讓擬合后的函數(shù)與實測的樣本之間誤差最小,因此以最小二乘法的概念建立各擬合模型.
用正態(tài)分布或?qū)?shù)正態(tài)分布對行程時間分布進行擬合較為簡單.其模型如式(2)和式(3)所示.
式中:Tmax和Tmin分別表示行程時間樣本中的最大值和最小值;μ和σ2為概率分布的兩個參數(shù),根據(jù)特定分布具有特定的含義;xi為行程時間樣本;p(xi)為xi所在的行程時間區(qū)間值在全樣本中所占的比例.
單一正態(tài)分布和對數(shù)正態(tài)分布模型是在式(1)中令λ=0(或λ=1)而得的特殊情況.區(qū)別在于,在對數(shù)正態(tài)分布模型中,為了滿足概率密度函數(shù)為右偏曲線,σ2為0到1之間的數(shù).另外,對數(shù)正態(tài)分布中的均值μ為行程時間樣本統(tǒng)一取對數(shù)以后得到的正態(tài)分布樣本的均值,因此在約束集中需要在上下界處分別取自然對數(shù)值作為其約束范圍.
LogN_N分布的擬合模型如式(4)所示.
式中:γ為權(quán)重系數(shù);C2為雙峰模型的第二個波峰值.約束4是由正態(tài)分布的特性所得,如圖2所示.如樣本服從正態(tài)分布,則約68.3%數(shù)值分布在距離平均值有1個標準差之內(nèi)的范圍,約95.4%數(shù)值分布在距離平均值有2個標準差之內(nèi)的范圍,以及約99.7%數(shù)值分布在距離平均值有3個標準差之內(nèi)的范圍.稱為“68-95-99.7法則”或“經(jīng)驗法則”.因此,以此約束來界定方差的范圍.
圖2 正態(tài)分布特性及其在行程時間分布中的應(yīng)用Fig.2 Normal distribution features and its application to travel time distribution
類似地,其他3類聯(lián)合分布模型,LogN_LogN,N_LogN以及N_N模型也可以以此方式建模,如式(5)~(7)所示.如圖3所示,C1為雙峰分布的第一個波峰,C2為雙峰分布的第二個波峰,p1,p2分別是雙峰分布兩個模數(shù)處對應(yīng)的概率密度函數(shù)的概率值,M1,M2分別兩個模數(shù)處對應(yīng)的累積分布函數(shù)的概率值.可以看出,此6種情形的模型均為凸規(guī)劃問題.目標函數(shù)為一個凸函數(shù),而約束集為線性約束集(需適當將變量進行調(diào)整,如在式(6)中,需令y1=lnμ1,則可以將約束轉(zhuǎn)化為線性約束).因此,可以用凸規(guī)劃求解算法對其進行求解.
圖3 雙峰分布模型及其參數(shù)Fig.3 Bimodal distribution and its parameters
Frank-Wolfe算法是經(jīng)典的凸規(guī)劃問題求解算法,其基本思路是從一個初始解出發(fā),尋找目標函數(shù)最優(yōu)下降方向,并沿此最優(yōu)方向?qū)ふ易顑?yōu)步長,進行最優(yōu)解的優(yōu)化,直到目標函數(shù)達到最優(yōu).Frank-Wolfe算法多用于交通規(guī)劃中的用戶均衡分配問題,而本問題為普適性的凸規(guī)劃問題,因此求解過程與交通規(guī)劃中的Frank-Wolfe算法略有不同.以LogN_N模型為例,介紹具體的Frank-Wolfe算法的求解過程,其他模型求解與其基本相同.
步驟3(尋找最優(yōu)步長):建立線性模型如式(10)所示,用單純性法求該模型的最優(yōu)解為y(n).該步驟與傳統(tǒng)交通規(guī)劃中的步驟不同.在傳統(tǒng)交通規(guī)劃中,在初始流量加載的基礎(chǔ)上,尋求到的最短路徑即為該線性模型的最優(yōu)解.但更廣泛意義上來說,F(xiàn)rank-Wolfe算法需要對x(n)處進行廣義線性規(guī)劃問題求解,以得到最優(yōu)解的優(yōu)化方向.
用黃金分割法求最優(yōu)步長α.求最優(yōu)步長α使得目標函數(shù)Z(x(n)+αy(n))最大.
步驟4(迭代更新).如果|Z(x(n-1)+αy(n-1))-Z(x(n)+αy(n))|<ε(收斂閾值),則停止迭代,得到最優(yōu)解及最優(yōu)目標函數(shù);否則更新最優(yōu)解,令x(n)=x(n)+αy(n),返回步驟2,重新更新計算.
選取南京市若干個主要路段進行數(shù)據(jù)擬合分析,結(jié)果見表1,表2.表1為路段基本信息,其中B_ID是路段上游RFID點位ID,E_ID為路段下游RFID點位ID.表2為最優(yōu)擬合模型及參數(shù),其中用SECTION_ID來表述某一具體的路段,如“62456243”代表“中山南路南向北(金沙井到府西街)”.圖4是6種組合分布的具體擬合情況.
表1 路段基本信息Tab.1 Section_basic_information
表2 各路段行程時間最優(yōu)擬合模型及參數(shù)Tab.2 The optimized fitting model and its parameters of each section travel timefitting
圖4 6種不同類型的模型擬合曲線及樣本分布圖Fig.4 Fitting curves and sample distribution of six models
圖5 雙正態(tài)分布及對應(yīng)的雙峰分布Fig.5 Two normal distributions and bimodal distributions
本文基于對數(shù)正態(tài)分布和正態(tài)分布,提出了6類不同的行程時間概率分布的單峰模型和雙峰模型.以南京市RFID數(shù)據(jù)為基礎(chǔ),對實際行程時間分布進行了模型和參數(shù)的擬合,并分析了雙峰模型對于城市行程時間描述的內(nèi)涵.從廣義的角度而言,本文提出的是一種理念和方法,并使用了正態(tài)分布和對數(shù)正態(tài)分布作為具體的分布函數(shù)進行擬合,目的是利用這兩種合理并且擬合度較高的分布來印證本文對于間斷流行程時間雙峰分布的假設(shè)和研究,但并不表示所有的路段都可以用這兩種分布來描述.因此,在后續(xù)研究中,可以利用其他分布,如Burr分布等,尋求其他的組合,以提高擬合的精度.
間斷流雙峰分布特性為間斷流行程時間可靠性分析提供了新的思路.傳統(tǒng)的可靠性指標,如BI(buffer index)等,均是基于連續(xù)流行程時間樣本獨立同分布的特性.在間斷流條件下,則需要區(qū)分快速流和慢速流部分的行程時間樣本,并重新定義符合間斷流行程時間可靠性的一些指標,用以評估城市間斷流路段通行質(zhì)量.此外,本研究成果也驗證了在城市道路路徑選擇、流量分配等環(huán)節(jié)中,不能簡單地以傳統(tǒng)最短路徑算法來搜索路徑,而應(yīng)該基于城市間斷流行程時間概率函數(shù)來尋找可行路徑集,這將是本文的后續(xù)研究方向之一.
[1]Wardrop J G.Some theoretical aspects of road traffic research[J].Proceedings of the Institution of Civil Engineers,1952,1(2):325.
[2]Herman R,Lam T.Trip time characteristics of journeys to and from work[C]∥Proceedings of the 6th International Symposium on Transportation and Traffic Theory.Sydney:University of New South Wales,1974:57-86.
[3]Richardson A J,Taylor M A P.Travel time variability on commuter journeys [J].High Speed Ground Transportation Journal,1978,12(1):77.
[4]Polus A.A study of travel time and reliability on arterial routes[J].Transportation,1979,8(2):141.
[5]Al-Deek H,Emam E B.New methodology for estimating reliability in transportation networks with degraded link capacities[J].Journal of Intelligent Transportation Systems,2006,10(3):117.
[6]Taylor M A P,Somenahalli S.Travel time reliability and the bimodal travel time distribution for an arterial road[J].Road &Transport Research,2010,19(4):37.
[7]Jintanakul K,Chu L,Jayakrishnan R.Bayesian mixture model for estimating freeway travel time distributions from small probe samples from multiple days[J].Transportation Research Record,2009,2136:37.
[8]Ji Y,Zhang H M.Travel time distributions on urban streets:their estimation with a hierarchical Bayesian mixture model and application to traffic analysis using high-resolution bus probe data[C/CD]∥ 92th Transportation Research Board.Washington D C:TRB,2013.