張裊娜,劉美艷
(長春工業(yè)大學(xué) 電氣與電子工程學(xué)院,吉林 長春 130012)
一種基于RTRL的神經(jīng)網(wǎng)絡(luò)駕駛員巡航模型
張裊娜,劉美艷
(長春工業(yè)大學(xué) 電氣與電子工程學(xué)院,吉林 長春130012)
摘要針對大多數(shù)巡航模型未能充分考慮駕駛員的行為特性,文中設(shè)計(jì)了以實(shí)時(shí)遞歸學(xué)習(xí)算法的神經(jīng)網(wǎng)絡(luò)為核心的駕駛員巡航模型。該模型選取前車車速、本車車速、前車加速度和安全車間距共4個參數(shù)作為模型輸入,以駕駛員控制自車所期望的加速度值為輸出,通過真實(shí)環(huán)境下的巡航實(shí)驗(yàn)獲取數(shù)據(jù)樣本對RTRL的神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,并對該模型進(jìn)行仿真驗(yàn)證。仿真實(shí)驗(yàn)結(jié)果表明,本車期望加速度的預(yù)測值與實(shí)際真實(shí)值基本一致,誤差控制在0.05以內(nèi),說明該模型能較準(zhǔn)確的模擬駕駛員的巡航行為。
關(guān)鍵詞RTRL;駕駛員模型;神經(jīng)網(wǎng)絡(luò);巡航
汽車自適應(yīng)巡航控制(ACC)是先進(jìn)駕駛員輔助系統(tǒng)[1],同時(shí)也是汽車智能化技術(shù)的重要代表。巡航過程中駕駛員的行為特性關(guān)系到交通效率、道路安全等方面的諸多問題,因而越來越多的控制理論和方法被應(yīng)用到駕駛員特性分析和建模中[2-4]。目前國內(nèi)外在相關(guān)研究中,大多數(shù)是以運(yùn)動學(xué)方程或是經(jīng)驗(yàn)公式的形式建立數(shù)學(xué)模型,例如線性模型[5]、GHR模型[6],但對一個優(yōu)良性能的汽車ACC系統(tǒng),必須考慮到真實(shí)駕駛員的接受程度,也就是控制特性應(yīng)與熟練的駕駛員操作行為基本一致。因此,從駕駛員操縱行為特性分析的角度出發(fā),建立一種新型駕駛員巡航模型是必要的[7]。
實(shí)時(shí)遞歸學(xué)習(xí)算法(RTRL)在處理復(fù)雜非線性問題上具有一定優(yōu)勢,同時(shí)具備較好的對樣本數(shù)據(jù)不斷學(xué)習(xí)的能力。因此,將實(shí)時(shí)遞歸學(xué)習(xí)算法的神經(jīng)網(wǎng)絡(luò)應(yīng)用到駕駛員巡航模型中,能更為精確地模擬人的駕駛行為特性,提高車輛巡航模型的性能。
1駕駛員巡航模型
駕駛員巡航模型描述了駕駛員對汽車速度的綜合控制行為,模型分為人機(jī)交互界面、信息感知與RTRL神經(jīng)網(wǎng)絡(luò)3個模塊[8-9],如圖1所示。其工作過程如下:首先駕駛員判斷前方一定范圍內(nèi)是否存在行駛車輛,若存在,則在本車接近前方車輛時(shí)開啟ACC系統(tǒng),根據(jù)雷達(dá)、攝像頭和通訊等感知模塊得到前車車速、本車車速、前車加速度、安全車間距4參數(shù),輸入到RTRL神經(jīng)網(wǎng)絡(luò)中,輸出駕駛員控制自車所期望的加速度。然后結(jié)合車輛的動力學(xué)模型,執(zhí)行器根據(jù)控制校正環(huán)節(jié)給出節(jié)氣門開度進(jìn)行恰當(dāng)?shù)膭幼?,最終實(shí)現(xiàn)車輛巡航模型的閉環(huán)控制。
圖1 駕駛員行為特性模型
2基于RTRL的神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)
人工神經(jīng)網(wǎng)絡(luò)是一種應(yīng)用類似于大腦神經(jīng)突觸聯(lián)接的結(jié)構(gòu)進(jìn)行信息處理的數(shù)學(xué)模型,它能根據(jù)不同的外部條件使算法具有適應(yīng)性,是解決非線性系統(tǒng)問題的有效手段,同時(shí)該模型又具備學(xué)習(xí)功能,被廣泛應(yīng)用于自適應(yīng)控制領(lǐng)域[10]。
實(shí)時(shí)遞歸學(xué)習(xí)算法是一種用于訓(xùn)練局部反饋網(wǎng)絡(luò)的學(xué)習(xí)算法[11]。該網(wǎng)絡(luò)共有X個單元,Y個外加輸入,用s(n)表示n時(shí)刻Y維數(shù)輸入向量p(n),l(n+1)為下一刻的X維輸出向量。l(n)與s(n)聯(lián)合起來成為X+Y維的總輸入向量p(n);A表示外加輸入的集合;B表示輸入中有輸出來的集合,如下所示
(1)
網(wǎng)絡(luò)包含一個聯(lián)合的輸入層和一個處理層。以X=2,Y=4的情況為例,網(wǎng)絡(luò)共有XY個前向連接和Y2個反饋連接。其中,Y個是自反饋連接,用ω代表權(quán)矩陣。
n時(shí)刻單元j的凈輸入為
(2)
下一時(shí)刻j的輸出為
lj(n+1)=φ[vj(n)]
(3)
式中,j指B單元中所包含的所有元素的下標(biāo)。下面結(jié)合梯度下降法推導(dǎo)出學(xué)習(xí)算法,用qj(n)表示n時(shí)刻單元j的實(shí)際輸出;C(n)代表有外加實(shí)際輸出的單元集合,計(jì)算單元中其他單元為隱單元,定義N維誤差向量e(n)中第j個元素為ej(n)=qj(n)-lj(n),定義n時(shí)刻的瞬間誤差平方和為
(4)
為使網(wǎng)絡(luò)能實(shí)時(shí)學(xué)習(xí),采用梯度向量法進(jìn)行網(wǎng)絡(luò)權(quán)值的更新,當(dāng)j=k,i=l時(shí),對某一特定權(quán)ωkl(n),其在n時(shí)刻的增量為
(5)
由于只有當(dāng)j=k,j=l,?ωji(n)/?ωkl(n)=1因此?vj(n)/?ωkl(n)改寫為
(6)
(7)
更新權(quán)值為
ωkl(n+1)=ωkl(n)+Δωkl(n)
(8)
本文選取4個變量作為RTRL神經(jīng)網(wǎng)絡(luò)的輸入,分別是前車車速、本車車速、前車加速度和安全車間距,1個變量作為輸出,是駕駛員控制自車所期望的加速度,因此選取RTRL網(wǎng)絡(luò)結(jié)構(gòu)為i=4,j=6,則權(quán)值ω∈R(4+6)×6。
3仿真實(shí)驗(yàn)
訓(xùn)練樣本的選擇很重要,關(guān)系到模型的準(zhǔn)確性,文中通過真實(shí)環(huán)境下的車輛巡航實(shí)驗(yàn)獲得了穩(wěn)定巡航狀態(tài)數(shù)據(jù),經(jīng)過遴選,最后選擇具有代表性的100 組數(shù)據(jù)作為訓(xùn)練樣本。經(jīng)過RTRL神經(jīng)網(wǎng)絡(luò)的調(diào)試并設(shè)置網(wǎng)絡(luò)的最終誤差指標(biāo)為 ,同時(shí)遴選出100組數(shù)據(jù),對網(wǎng)絡(luò)進(jìn)行測試,驗(yàn)證RTRL神經(jīng)網(wǎng)絡(luò)模型的準(zhǔn)確性。后車期望加速度的仿真結(jié)果如圖2所示,可看出模型計(jì)算出的駕駛員控制自車的實(shí)際加速度與所期望加速度基本吻合,預(yù)測結(jié)果接近真值。測試誤差如圖3所示,由圖3可見誤差在實(shí)際值上下0.05范圍內(nèi)浮動,說明該模型有效地模擬了駕駛員的加速度控制特性。
圖2 RTRL網(wǎng)絡(luò)預(yù)測與真實(shí)值
圖3 RTRL測試誤差
4結(jié)束語
仿真實(shí)驗(yàn)驗(yàn)證了該網(wǎng)絡(luò)模型具有模擬駕駛員巡航行為的能力,可準(zhǔn)確快速地學(xué)習(xí)駕駛員的跟隨前車行駛特性,且對前車加速或減速具有良好的適用性,當(dāng)前車變化時(shí)能精準(zhǔn)快速地控制駕駛。由于汽車智能駕駛系統(tǒng)理論研究上的共同性,以上研究結(jié)果也可應(yīng)用在其他汽車智能系統(tǒng)的研究中。
參考文獻(xiàn)
[1]Brackstone M.Car-following:a historical review[J].Transportation Research Part F:Traffic Psychology and Behaviour,1999,2(4):181-196.
[2]李升波,李克強(qiáng),王建強(qiáng),等.非奇異快速的終端滑模控制方法及其跟車控制應(yīng)用[J].控制理論與應(yīng)用,2010,27(5):543-550.
[3]李克強(qiáng),陳濤,羅禹貢,等.智能環(huán)境友好型車輛—概念、體系結(jié)構(gòu)及工程實(shí)現(xiàn)[J].汽車工程,2010,32(9):743-748.
[4]羅禹貢,陳濤,周磊,等.奔騰智能混合動力電動轎車自適應(yīng)巡航控制系統(tǒng)[J].機(jī)械工程學(xué)報(bào),2010,46(6):2-7.
[5]Gipps P G.A behavioral car following model for computer simulation[J].Transportation Research B, 1981,15(2):105 -111.
[6]Gazis D C,Herman R,Rothery R W.Nonlinear follow the leader models of traffic flow[J].Operations Research,1961,9(4):545-567.
[7]張磊,李升波,王建強(qiáng),等.基于神經(jīng)網(wǎng)絡(luò)方法的集成式駕駛員跟車模型[J].清華大學(xué)學(xué)報(bào):自然科學(xué)版,2008,48 (11):1985-1988,1992.
[8]高振海,吳濤,尤洋.基于粒子群算法的汽車自適應(yīng)巡航控制器設(shè)計(jì)[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2013,44(12):12-16.
[9]管欣,王景武,高振海.基于最優(yōu)預(yù)瞄加速度決策的汽車自適應(yīng)巡航控制系統(tǒng)[J].吉林大學(xué)學(xué)報(bào):工學(xué)版,2004,34(2):189-193.
[10]張紅軍.一種新的前饋神經(jīng)網(wǎng)絡(luò)訓(xùn)練算法及其在控制中的應(yīng)用[D].大連:大連理工大學(xué),2002.
[11]閻平凡,張長水.人工神經(jīng)網(wǎng)絡(luò)與模擬進(jìn)化計(jì)算[M].北京:清華大學(xué)出版社,2000.
A Driver Car-Cruising Model Based on RTRL Neural Network
ZHANG Niaona,LIU Meiyan
(Electronic and Electrical Engineering Institute ,Changchun University of Technology, Changchun 130012, China)
AbstractMost car-cruising model could not give full consideration to the driver’s behavior characteristic, this paper designed with real-time recursion learning (RTRL) algorithm of neural network as the core of the driver model of the cruise. This model chooses four parameters as inputs, including the speed and acceleration of preceding vehicle, the following vehicle speed and the safety distance between two vehicles, meanwhile, the desired acceleration which driver controls cruise car is chosen as the output of model. Through cruise experiments under real environment, data samples used for training RTRL neural network are obtained, the model is verified by simulation. Simulation experimental results show that the predictive value of expected acceleration is consistent with the actual true value, error is controlled within 0.05 , it also shows that the model can accurately simulate the behavior of the driver-cruising.
KeywordsRTRL;driver model;neural network;cruise
收稿日期:2015-10-14
基金項(xiàng)目:國家重點(diǎn)基礎(chǔ)研究發(fā)展計(jì)劃基金資助項(xiàng)目(973 計(jì)劃,2011CB711205);國家高技術(shù)研究發(fā)展計(jì)劃基金資助項(xiàng)目(863 計(jì)劃,2011AA11A221);吉林省科技支撐計(jì)劃重大專項(xiàng)基金資助項(xiàng)目(20126008)
作者簡介:張裊娜(1972-),女,教授,碩士生導(dǎo)師。研究方向:復(fù)雜控制系統(tǒng)的建模等。劉美艷(1988-),女,碩士研究生。研究方向:混合動力汽車自適應(yīng)巡航控制。
doi:10.16180/j.cnki.issn1007-7820.2016.06.002
中圖分類號TP183;U27
文獻(xiàn)標(biāo)識碼A
文章編號1007-7820(2016)06-005-03