閆 飛 李 浦 閻高偉 任密蜂
1.太原理工大學(xué)電氣與動(dòng)力工程學(xué)院 太原 030024
隨著我國(guó)城市交通的快速發(fā)展,交通擁堵已成為各大城市普遍面臨的交通難題,而交通信號(hào)控制作為調(diào)控城市交通流運(yùn)行的最主要措施,其合理的信號(hào)配時(shí)對(duì)更好地利用現(xiàn)有的道路設(shè)施和緩解交通擁堵起著至關(guān)重要的作用.研究表明,自適應(yīng)信號(hào)控制比固定配時(shí)控制能更有效地提高路網(wǎng)的通行效
率[1].如研究者們?cè)缙陂_發(fā)出的綠信比-周期長(zhǎng)-相位差優(yōu)化技術(shù)(Split-cycle-offset optimization technique,SCOOT)和悉尼協(xié)調(diào)自適應(yīng)交通系統(tǒng)(Sydney coordinated adaptive traffic system,SCATS)等自適應(yīng)交通信號(hào)控制系統(tǒng),這些系統(tǒng)都能根據(jù)交通狀況實(shí)時(shí)地對(duì)子區(qū)或路網(wǎng)的信號(hào)配時(shí)進(jìn)行在線優(yōu)化.但隨著控制路網(wǎng)規(guī)模的不斷擴(kuò)大,路網(wǎng)交通狀況愈加復(fù)雜,從而使得整個(gè)路網(wǎng)的協(xié)調(diào)控制變得十分困難[2-3].另一類常用的基于交通流模型進(jìn)行信號(hào)配時(shí)的交通控制方法,因現(xiàn)實(shí)中交通流具有很強(qiáng)的不確定性和隨機(jī)性,很難對(duì)其進(jìn)行精確的數(shù)學(xué)建模,因此也難以達(dá)到理想的控制效果.侯忠生教授提出的基于排隊(duì)長(zhǎng)度均衡的交叉口信號(hào)配時(shí)思想能夠?qū)崟r(shí)動(dòng)態(tài)調(diào)整各相位的綠燈時(shí)間,從而達(dá)到排隊(duì)長(zhǎng)度均衡的控制目標(biāo),并通過采用無(wú)模型的自適應(yīng)控制方法,使得信號(hào)控制具有自學(xué)習(xí)和自適應(yīng)特性,因此不依賴于交通流模型[4].此后,文獻(xiàn)[5-6]基于排隊(duì)長(zhǎng)度均衡的控制思想分別采用不同方法對(duì)單個(gè)交叉口的信號(hào)控制進(jìn)行了研究.
雖然交通流具有復(fù)雜的非線性動(dòng)態(tài)特性,但從宏觀角度看,一個(gè)城市特定區(qū)域的交通流,其每天的運(yùn)行大體是一個(gè)重復(fù)的過程,而交通擁堵通常也發(fā)生在相同的時(shí)間和相同的地點(diǎn)[7].因此,充分利用宏觀交通流運(yùn)行時(shí)固有的周期性特征開展城市交通信號(hào)控制的研究,對(duì)提高城市路網(wǎng)的通行效率具有十分重要的意義.迭代學(xué)習(xí)控制(Iterative learning control,ILC)作為一種新型的學(xué)習(xí)控制策略,是由日本學(xué)者Arimoto 等[8]在1984年首次提出,目的在于解決有限區(qū)間內(nèi)重復(fù)運(yùn)行系統(tǒng)的控制問題.其不依賴于系統(tǒng)的精確數(shù)學(xué)模型,而是一種通過應(yīng)用先前操作信息來獲得控制輸入使其能夠產(chǎn)生期望輸出,并通過控制輸入不斷地調(diào)整最終使實(shí)際的輸出逼近理想輸出的控制方法[9].與傳統(tǒng)的控制方法相比,它具有適應(yīng)性強(qiáng)、易于實(shí)現(xiàn)的特點(diǎn),并且僅需要較少的先驗(yàn)知識(shí)和計(jì)算量.迭代學(xué)習(xí)控制的收斂性是指在迭代軸上具有收斂性,而在時(shí)間軸上能夠?qū)崿F(xiàn)完全跟蹤,而傳統(tǒng)在時(shí)間軸上漸進(jìn)跟蹤的收斂性從理論上講需在時(shí)間足夠大時(shí)才可能滿足.很顯然,具有完全跟蹤收斂的迭代學(xué)習(xí)控制更適合城市交通信號(hào)控制.因此,本文結(jié)合迭代學(xué)習(xí)控制與城市宏觀交通流運(yùn)行特點(diǎn),開展基于迭代學(xué)習(xí)的城市交通信號(hào)控制研究可充分利用迭代學(xué)習(xí)控制的優(yōu)點(diǎn),彌補(bǔ)傳統(tǒng)基于模型的交通控制方法過分依賴交通流模型的不足,從而避開對(duì)交通流進(jìn)行精確建模的難題.
近年來,在交通控制領(lǐng)域已有不少基于迭代學(xué)習(xí)的交通控制方面的研究成果,如文獻(xiàn)[10]首次提出將迭代學(xué)習(xí)控制方法應(yīng)用于高速公路匝道控制中.為進(jìn)一步增強(qiáng)基于迭代學(xué)習(xí)的匝道控制方法的魯棒性,文獻(xiàn)[11-12]在現(xiàn)有反饋控制的基礎(chǔ)上加入迭代學(xué)習(xí)控制,提出了基于迭代學(xué)習(xí)控制和反饋控制相結(jié)合的高速公路交通流控制方法,并討論了輸入受限等問題.考慮現(xiàn)實(shí)中的交通系統(tǒng)并非滿足嚴(yán)格的重復(fù)性,文獻(xiàn)[13]研究了當(dāng)模型參數(shù)和期望軌跡迭代變化時(shí)迭代學(xué)習(xí)控制方法在高速公路交通流控制中的應(yīng)用.文獻(xiàn)[14]結(jié)合模糊控制理論與迭代學(xué)習(xí)控制設(shè)計(jì)了交通信號(hào)自適應(yīng)控制器對(duì)單個(gè)交叉口進(jìn)行控制.文獻(xiàn)[15]將交通分配與交通控制相結(jié)合,采用迭代學(xué)習(xí)控制方法設(shè)計(jì)了交通信號(hào)控制器對(duì)路網(wǎng)進(jìn)行控制.文獻(xiàn)[16-18]將迭代學(xué)習(xí)控制應(yīng)用于多交叉口的交通路網(wǎng)信號(hào)控制,通過對(duì)交叉口信號(hào)的迭代學(xué)習(xí)控制使路網(wǎng)各條道路的車輛數(shù)處于合理水平,以防止交通擁堵的發(fā)生,并分析了交通信號(hào)的迭代學(xué)習(xí)控制策略對(duì)路網(wǎng)宏觀基本圖的影響.文獻(xiàn)[19]考慮城市交通流運(yùn)行初態(tài)的不確定性,通過引入平均迭代算子,提出了一種具有非一致性迭代區(qū)間的迭代學(xué)習(xí)控制算法,并證明了算法的收斂性.
上述關(guān)于城市交通信號(hào)迭代學(xué)習(xí)控制的研究均采用了由Gazis 和Potts[20]早期提出的存儲(chǔ)轉(zhuǎn)發(fā)模型,該模型可將路段內(nèi)的車輛出入動(dòng)態(tài)情況在整個(gè)采樣周期內(nèi)看做是連續(xù)的,避免了更多離散變量的引入,從而在更多的控制方案中得到應(yīng)用.如前所述,城市交通流具有復(fù)雜的非線性動(dòng)態(tài)特性,采用線性的存儲(chǔ)轉(zhuǎn)發(fā)模型無(wú)法準(zhǔn)確地描述交通流的動(dòng)態(tài)特性.鑒于此,本文在存儲(chǔ)轉(zhuǎn)發(fā)模型的基礎(chǔ)上結(jié)合路段內(nèi)交通流的運(yùn)行特點(diǎn),提出了一種描述城市交通流的非線性動(dòng)態(tài)模型.同時(shí),結(jié)合宏觀交通流固有的周期性特征,設(shè)計(jì)了交叉口信號(hào)的迭代學(xué)習(xí)控制策略,并對(duì)其收斂性進(jìn)行了分析.該方法通過對(duì)交叉口信號(hào)的迭代學(xué)習(xí)控制,使交叉口各進(jìn)口道的車輛排隊(duì)長(zhǎng)度逐漸趨于均衡,從而使綠燈時(shí)間得到更充分的利用,有效提高了路網(wǎng)的通行效率.最后通過仿真實(shí)驗(yàn)進(jìn)一步驗(yàn)證了該方法的有效性.
本文的組織結(jié)構(gòu)如下:第1 節(jié)給出了描述交通流動(dòng)態(tài)特性的非線性交通流模型;第2 節(jié)給出了對(duì)所研究問題的描述;第3 節(jié)給出了考慮交通流非線性特性的交叉口信號(hào)迭代學(xué)習(xí)控制策略并對(duì)其收斂性進(jìn)行了分析;第4 節(jié)為仿真研究;第5 節(jié)是本文的結(jié)論.
圖1 交叉口相位示意圖與路段交通流模型Fig.1 The intersection phase and road traffic flow model
根據(jù)路網(wǎng)的宏觀基本圖理論,在路網(wǎng)條件和車輛數(shù)相同的情況下,路網(wǎng)內(nèi)各道路的車輛密度分布越均衡,路網(wǎng)的通行效率就越高[24].而各道路的車輛排隊(duì)長(zhǎng)度在一定程度上反映了各道路的車輛密度.因此,受文獻(xiàn)[4]提出的排隊(duì)長(zhǎng)度均衡控制思想的啟發(fā),本文擬采用該思想對(duì)交叉口信號(hào)進(jìn)行控制,控制目標(biāo)為尋找合適的交叉口相位綠燈時(shí)間,盡可能使路網(wǎng)中同一交叉口各相位所對(duì)應(yīng)的車輛排隊(duì)長(zhǎng)度與該相位的綠燈時(shí)長(zhǎng)相適應(yīng),保證交叉口各相位的綠燈時(shí)間得到充分利用.
以具有4 個(gè)路口的交叉口為例,同一交叉口各路口之間車輛排隊(duì)長(zhǎng)度的差值可任選其中某一路口的車輛排隊(duì)長(zhǎng)度作為參考,例如假設(shè)選取路口1 的車輛排隊(duì)長(zhǎng)度作為參考,則可將其他路口的車輛排隊(duì)長(zhǎng)度與路口1 的車輛排隊(duì)長(zhǎng)度的差值作為向量,假設(shè)該交叉口在第k時(shí)刻的4 個(gè)路口的排隊(duì)長(zhǎng)度分別為y1(k),y2(k),y3(k),y4(k),則該交叉口各路口車輛排隊(duì)長(zhǎng)度的差值情況可描述為
為了驗(yàn)證本文所述的交叉口信號(hào)迭代學(xué)習(xí)控制策略的有效性,本文選取了太原市某區(qū)域的部分道路作為仿真測(cè)試區(qū)域,道路結(jié)構(gòu)簡(jiǎn)圖如圖2所示,并通過VISSIM 和MATLAB 軟件進(jìn)行仿真研究實(shí)驗(yàn).該區(qū)域共由9 個(gè)交叉口和23 條雙向通行車道組成,各路段所包含的車道數(shù)如表1,每條車道寬約為3 m,根據(jù)HCM2000 手冊(cè)可估算出每條單向行駛車道的飽和流量為1 800 veh/h.
圖2 太原市某區(qū)域路網(wǎng)結(jié)構(gòu)簡(jiǎn)圖Fig.2 The road network structure of one region in Taiyuan
表1 各路段車道數(shù)Table 1 The number of lanes in each link
3)迭代學(xué)習(xí)控制.仿真時(shí)迭代學(xué)習(xí)控制的期望為各交叉口的車輛排隊(duì)長(zhǎng)度差值為0.
具體仿真參數(shù)設(shè)置如下:不同路段間的轉(zhuǎn)向率直行:左轉(zhuǎn):右轉(zhuǎn)均設(shè)置為3 :1 :1;所有交叉口均設(shè)置為東西和南北2 個(gè)相位;各交叉口信號(hào)周期時(shí)長(zhǎng)均為120 s;迭代學(xué)習(xí)控制和模型預(yù)測(cè)控制方案綠信比初始設(shè)置為1 :1;每次仿真時(shí)長(zhǎng)為3 600 s,迭代學(xué)習(xí)控制的仿真迭代次數(shù)為20 次;各路段輸入的起始流量如表2所示;路網(wǎng)各交叉口的學(xué)習(xí)增益β取值如表3所示,且均滿足收斂條件‖I -βCD‖<1 .其他仿真參數(shù)采用VISSIM 的默認(rèn)值.
表2 路網(wǎng)的輸入流量(veh/h)Table 2 The inflows of the road network(veh/h)
表3 交叉口的迭代學(xué)習(xí)增益Table 3 The iterative learning gains at different intersections
仿真中分別采用上述的三種控制方案對(duì)各個(gè)交叉口相位的車輛排隊(duì)長(zhǎng)度差值,車輛的實(shí)際排隊(duì)長(zhǎng)度,車輛的平均延遲時(shí)間,車輛平均停車次數(shù)以及所選區(qū)域內(nèi)車輛的平均速度進(jìn)行對(duì)比研究,仿真結(jié)果如圖3~9所示.
通過仿真得到固定配時(shí),模型預(yù)測(cè)控制和迭代學(xué)習(xí)控制三種方案下的交叉口各相位的車輛排隊(duì)長(zhǎng)度的差值,如圖3所示.圖4 和圖5 分別給出了不同控制方案下交叉口4 和交叉口9 各相位的實(shí)際車輛排隊(duì)情況.此處選擇交叉口4 和交叉口9 是由于交叉口4 為該區(qū)域的主要干道交叉口,而交叉口9為不同于其他路口的丁字路口,交通情況復(fù)雜容易造成擁堵.圖6 反映了交叉口車輛的平均排隊(duì)長(zhǎng)度差值隨迭代次數(shù)的變化情況.上述仿真實(shí)驗(yàn)及結(jié)果分析表明當(dāng)信號(hào)控制方式為固定配時(shí)時(shí),各交叉口車輛的平均排隊(duì)長(zhǎng)度差值波動(dòng)相對(duì)較大,而迭代學(xué)習(xí)控制和模型預(yù)測(cè)控制兩種自適應(yīng)控制方案下車輛的平均排隊(duì)長(zhǎng)度差值波動(dòng)相對(duì)較小.從圖3(b)和圖3(c)可以看出,與模型預(yù)測(cè)控制相比,迭代學(xué)習(xí)控制方案下各交叉口車輛的平均排隊(duì)長(zhǎng)度差值波動(dòng)更小,表明車輛在路段中的分布更加均衡.與此同時(shí),通過仿真得到路網(wǎng)中車輛的平均延遲時(shí)間如圖7所示,可以看出,與固定配時(shí)和模型預(yù)測(cè)控制方案相比,經(jīng)過20 次迭代學(xué)習(xí)控制后,路網(wǎng)中車輛的平均延遲時(shí)間明顯減少;圖8 的仿真結(jié)果為車輛的平均停車次數(shù),可以看出迭代學(xué)習(xí)控制方案下車輛的平均停車次數(shù)整體也少于固定配時(shí)和模型預(yù)測(cè)兩種方案下車輛的平均停車次數(shù);關(guān)于3 種控制方案對(duì)路網(wǎng)中車輛平均速度的影響,通過圖9 可以看出,進(jìn)行20 次迭代學(xué)習(xí)控制后路網(wǎng)內(nèi)車輛的平均速度整體也略高于固定配時(shí)和模型預(yù)測(cè)控制配時(shí)下車輛的平均速度.綜合仿真結(jié)果的分析,迭代學(xué)習(xí)控制方案可在不改變道路設(shè)施的基礎(chǔ)上,通過對(duì)交叉口信號(hào)的控制調(diào)節(jié),能有效提高路網(wǎng)的通行效率.
圖3 三種控制方案下各交叉口相位車輛排隊(duì)長(zhǎng)度差值Fig.3 The differences of queue lengths at different phases of each intersection for the three control schemes
圖4 三種控制方案下交叉口4 各相位的車輛排隊(duì)情況Fig.4 The queue lengths at Intersection 4 for the three control schemes
圖5 三種控制方案下交叉口9 各相位的車輛排隊(duì)情況Fig.5 The queue lengths at Intersection 9 for the three control schemes
圖6 平均車輛排隊(duì)長(zhǎng)度差值隨迭代次數(shù)的變化情況Fig.6 The average difference of queue lengths of all intersections after each iteration
圖7 三種控制方案下路網(wǎng)的平均延遲時(shí)間Fig.7 The average delay time of road network for the three control schemes
圖8 三種控制方案下路網(wǎng)的平均停車次數(shù)Fig.8 The average number of stops for the three control schemes
圖9 三種控制方案下路網(wǎng)內(nèi)車輛的平均速度Fig.9 The average speed of vehicles for the three control schemes
針對(duì)城市交通流具有的非線性特性,建立了描述交通流運(yùn)行過程的非線性交通流排隊(duì)模型.并在建模的基礎(chǔ)上利用宏觀交通流所固有的周期性特征,設(shè)計(jì)了交叉口信號(hào)的迭代學(xué)習(xí)控制策略,證明了迭代學(xué)習(xí)律的收斂性.最后以太原市某區(qū)域路網(wǎng)為例,通過經(jīng)典的韋伯斯特法,模型預(yù)測(cè)控制算法和本文方法進(jìn)行了對(duì)比仿真實(shí)驗(yàn).實(shí)驗(yàn)結(jié)果表明,通過對(duì)交叉口信號(hào)的迭代學(xué)習(xí)控制,可以使交叉口進(jìn)口道的車輛排隊(duì)長(zhǎng)度逐漸趨于均衡,提高交叉口信號(hào)有效綠燈時(shí)間的利用率,從而改善路網(wǎng)的通行效率.迭代學(xué)習(xí)控制方法因其計(jì)算量小,從而易于對(duì)路網(wǎng)進(jìn)行集中式控制.但隨著控制路網(wǎng)規(guī)模的增大,不同區(qū)域間交通流特性的差異性會(huì)增強(qiáng).因此,為了適應(yīng)大規(guī)模城市路網(wǎng)的控制,未來開展對(duì)分散式城市道路交通信號(hào)迭代學(xué)習(xí)控制方法的研究將會(huì)有更大的應(yīng)用價(jià)值.