張 輝,錢大琳*,邵春福,錢振偉,菅美英
(1.北京交通大學(xué)交通運輸學(xué)院,北京100044;2.清華大學(xué)土木系交通研究所北京100084)
駕駛?cè)朔中氖菍?dǎo)致道路交通事故的重要原因之一.據(jù)美國國家道路安全管理局(NHTSA)的統(tǒng)計,2013年有10%的死亡事故、18%的受傷事故是由駕駛?cè)朔中膶?dǎo)致的[1].隨著手機(jī)和導(dǎo)航等車內(nèi)智能終端的日益普及,駕駛?cè)朔中默F(xiàn)象日趨嚴(yán)重.因此,研究駕駛?cè)朔中膶︸{駛安全的影響,構(gòu)建駕駛?cè)朔中臓顟B(tài)判別模型對駕駛?cè)朔中臓顟B(tài)進(jìn)行判別,對于開發(fā)駕駛?cè)朔中念A(yù)警系統(tǒng),減少駕駛?cè)朔中膸淼陌踩[患具有重要的意義.
國外研究表明,駕駛?cè)朔中膶︸{駛?cè)说鸟{駛績效、視覺行為模式和生理指標(biāo)產(chǎn)生一定的影響,從而增大發(fā)生事故風(fēng)險的概率[2].減小和預(yù)防駕駛?cè)朔中牡挠行Т胧┦情_發(fā)駕駛?cè)朔中念A(yù)警系統(tǒng),這種系統(tǒng)通過判別駕駛?cè)藸顟B(tài)給予駕駛?cè)诉m當(dāng)?shù)陌踩A(yù)警提示,以降低事故發(fā)生的風(fēng)險概率.現(xiàn)有的駕駛?cè)朔中呐袆e研究項目包括歐洲的HASTE、AIDE,美國的SAVE-IT等.由NHTSA主導(dǎo)的SAVE-IT(Safety Vehicle Using Adaptive Interface Technology)項目通過傳感器獲取駕駛?cè)藸顟B(tài)判別駕駛?cè)耸欠穹中?,?dāng)檢測到分心,可以通過一系列的手段進(jìn)行預(yù)警,包括碰撞警告系統(tǒng)、重新定向注意力系統(tǒng)等[3].駕駛?cè)朔中鸟{駛狀態(tài)與正常駕駛狀態(tài)在駕駛績效方面存在顯著的特征差異,當(dāng)駕駛?cè)朔中臅r會出現(xiàn)大幅度車速變化、車道偏離、跟車距離增加等現(xiàn)象[2,4-5],駕駛績效特征在駕駛?cè)朔中臓顟B(tài)判別領(lǐng)域方面具有良好的應(yīng)用.Wollmer等[6]提取方向盤轉(zhuǎn)角、油門位置、速度、車頭朝向、橫向偏離和車頭轉(zhuǎn)向等駕駛績效指標(biāo),采用LSTM神經(jīng)網(wǎng)絡(luò)對駕駛?cè)朔中臓顟B(tài)進(jìn)行判別.馬艷麗等[7]采集駕駛績效數(shù)據(jù)(方向盤轉(zhuǎn)角和轉(zhuǎn)速、橫向位移、加速度和速度等),采用SVM分類算法構(gòu)建了基于駕駛績效的IVIS操作分心判定模型.
駕駛?cè)朔中念A(yù)警系統(tǒng)的核心在于建立實時準(zhǔn)確的駕駛?cè)朔中臓顟B(tài)判別模型.在駕駛?cè)朔中臓顟B(tài)判別領(lǐng)域,常用的模式識別算法有神經(jīng)網(wǎng)絡(luò)、混合高斯模型、貝葉斯網(wǎng)絡(luò)、支持向量機(jī)(SVM)、神經(jīng)模糊推理系統(tǒng)(ANFIS)及各種組合算法等[3,6-7].其中SVM以統(tǒng)計學(xué)習(xí)理論為基礎(chǔ),克服了模式識別領(lǐng)域的小樣本難題,在解決多維度、非線性及小樣本的識別問題和實際應(yīng)用中有很多優(yōu)點.已有研究雖然將SVM應(yīng)用到駕駛?cè)朔中臓顟B(tài)判別,但是由于未對模型參數(shù)進(jìn)行優(yōu)化,導(dǎo)致模型分類效果一般[7].因而選取合適的優(yōu)化算法對SVM模型參數(shù)進(jìn)行優(yōu)化,建立最佳參數(shù)的駕駛?cè)朔中臓顟B(tài)SVM判別模型,進(jìn)而判別駕駛?cè)朔中臓顟B(tài),有助于為駕駛?cè)朔中臓顟B(tài)預(yù)警提供支持.
本文在現(xiàn)有研究基礎(chǔ)上,采集駕駛績效數(shù)據(jù),提取駕駛?cè)朔中臓顟B(tài)判別指標(biāo),采用遺傳算法(GA)優(yōu)化支持向量機(jī)(SVM)模型懲罰參數(shù)C和核函數(shù)參數(shù)g,建立以徑向基為核函數(shù)的基于GASVM的駕駛?cè)朔中臓顟B(tài)判別模型,并利用實驗數(shù)據(jù)驗證模型的有效性.本文駕駛績效使用的是車輛運行參數(shù).研究期待為駕駛?cè)朔中念A(yù)警系統(tǒng)、駕駛?cè)税踩芾砼嘤?xùn)和交通安全管理法規(guī)的制定提供理論依據(jù).
駕駛?cè)朔中臅绊戱{駛?cè)说鸟{駛績效,導(dǎo)致車速降低、方向盤控制能力降低、跟車距離增加等[2,4-5],對這些指標(biāo)的研究是駕駛?cè)朔中臓顟B(tài)判別的基礎(chǔ).隨著智能設(shè)備的普及,駕駛過程中使用耳機(jī)或車載設(shè)備免提通話和語音短信聊天的現(xiàn)象日益普遍,對駕駛安全產(chǎn)生較大的威脅.針對這種現(xiàn)象,本研究設(shè)計分心模擬駕駛實驗,采集3種狀態(tài)下(免提通話、正常駕駛和語音短信)的駕駛績效數(shù)據(jù),提取能夠表征分心狀態(tài)特征的駕駛績效指標(biāo)作為駕駛?cè)朔中臓顟B(tài)判別指標(biāo),建立駕駛?cè)朔中臓顟B(tài)判別模型.本文駕駛績效指標(biāo)采用的是車輛運行參數(shù).駕駛?cè)朔中臓顟B(tài)判別可以從模式識別的角度進(jìn)行研究,屬于有監(jiān)督學(xué)習(xí).在訓(xùn)練集中,將駕駛?cè)朔中呐袆e指標(biāo)作為判別模型的輸入,3種狀態(tài)分別標(biāo)記為0、1、2,作為判別模型的輸出,對模型進(jìn)行訓(xùn)練.在測試集中,利用訓(xùn)練好的模型對駕駛?cè)朔中臓顟B(tài)進(jìn)行判別.
本文建立以徑向基為核函數(shù)的駕駛?cè)朔中臓顟B(tài)判別SVM模型,采用GA對模型參數(shù)C和g進(jìn)行優(yōu)化.將駕駛?cè)朔中臓顟B(tài)判別指標(biāo)作為SVM模型的輸入,駕駛?cè)朔中臓顟B(tài)作為SVM模型的輸出.支持向量機(jī)(SVM)是由Vapnik首先提出,被廣泛地應(yīng)用于模式識別和非線性回歸,具有較強(qiáng)的泛化性能,在解決非線性可分的分類問題方面具有顯著的優(yōu)越性.它可以通過構(gòu)建多維度決策曲面,最大化兩類數(shù)據(jù)之間的分割邊緣,從而準(zhǔn)確地實現(xiàn)兩類樣本數(shù)據(jù)分離的目的[8].SVM中核函數(shù)理論有效克服從低維空間線性不可分映射到高維特征空間以實現(xiàn)線性可分過程中的“維數(shù)災(zāi)害”現(xiàn)象,常用的核函數(shù)包括線性核函數(shù)、多項式核函數(shù)、徑向基核函數(shù)(RBF)和Sigmoid核函數(shù)[8].
由于徑向基核函數(shù)能夠?qū)崿F(xiàn)非線性映射,本文選擇徑向基核函數(shù)作為SVM模型的核函數(shù).在建立不同交通狀態(tài)下的駕駛?cè)朔中臓顟B(tài)判別SVM模型時,為得到較為理想的分心狀態(tài)判別效果,需要優(yōu)化模型中的懲罰參數(shù)C和RBF核函數(shù)參數(shù)g,可以利用遺傳算法(GA)等啟發(fā)式算法對SVM模型中的懲罰參數(shù)C和核函數(shù)參數(shù)g進(jìn)行優(yōu)化,以達(dá)到理想的分類準(zhǔn)確率.基于GA-SVM的駕駛?cè)朔中臓顟B(tài)判別方法步驟如下:
Step 1選定訓(xùn)練集和測試集.隨機(jī)選取駕駛?cè)朔中奶卣髦笜?biāo)數(shù)據(jù)的70%作為訓(xùn)練集,30%作為測試集,確保訓(xùn)練集和測試集包含駕駛?cè)?種狀態(tài).
Step 2數(shù)據(jù)標(biāo)準(zhǔn)化.為避免不同駕駛績效指標(biāo)之間單位量綱不同的影響,消除各指標(biāo)間的數(shù)值差異,采用min-max標(biāo)準(zhǔn)化方法的一種特殊形式,所有樣本數(shù)據(jù)按照式(1)進(jìn)行標(biāo)準(zhǔn)化[7],將各特征指標(biāo)無量綱化在[-1,1]區(qū)間.
Step 3最佳參數(shù)的確定.在訓(xùn)練集中利用GA算法對SVM模型的參數(shù)C和g進(jìn)行優(yōu)化.
Step 4利用最佳參數(shù)訓(xùn)練駕駛?cè)朔中臓顟B(tài)判別SVM模型.
Step 5在測試集中利用訓(xùn)練好的模型對駕駛?cè)朔中臓顟B(tài)進(jìn)行判別.
Step 6模型性能評估.
針對上述Step3,基于GA的并行性和全局搜索能力,采用GA進(jìn)一步優(yōu)化SVM模型參數(shù)C和g.GA優(yōu)化SVM的適應(yīng)度函數(shù)為交叉驗證準(zhǔn)確率,如式(2)所示.
式中:CCV Accuracy為交叉驗證準(zhǔn)確率;k為交叉驗證次數(shù);li為每次迭代錯誤分類樣本數(shù);l為總的訓(xùn)練樣本數(shù).
GA對SVM中懲罰因子C和分類函數(shù)中RBF參數(shù)g進(jìn)行優(yōu)化,參數(shù)優(yōu)化流程如圖1所示.
GA優(yōu)化SVM參數(shù)步驟如下:
Step 1 將SVM訓(xùn)練參數(shù)C和g以二進(jìn)制的形式進(jìn)行染色體基因編碼,設(shè)定訓(xùn)練參數(shù).
圖1 基于GA的SVM參數(shù)優(yōu)化Fig.1 SVM parameter optimization based on GA
Step 2隨機(jī)產(chǎn)生1組表示SVM參數(shù)值的染色體.
Step 3利用獲得的SVM參數(shù)訓(xùn)練SVM模型,利用交叉驗證法評估適應(yīng)度,選取交叉驗證準(zhǔn)確率為適應(yīng)度函數(shù).
Step 4通過選擇、交叉、變異等遺傳算子操作,產(chǎn)生1組新的染色體,其中選擇采用輪盤賭法.
Step 5當(dāng)滿足終止條件時,進(jìn)化過程結(jié)束,輸出最優(yōu)SVM參數(shù);否則,轉(zhuǎn)到Step3.
本文實驗利用動感型汽車模擬駕駛器(QJ-4B1型6自由度模擬駕駛器),模擬雙向4車道城市快速路場景中的跟車行為.實驗場景分為自由流和擁擠流2個狀態(tài),車道寬度為3.5 m.在自由流狀態(tài)場景中,模擬主車跟隨引導(dǎo)車做跟車行駛,引導(dǎo)車車速設(shè)定為65 km/h,要求主車緊跟引導(dǎo)車,保持合適的跟車距離,不允許超車.在擁擠流狀態(tài)場景中,設(shè)置緩慢行駛的車流,車流速度限定為35 km/h.主車匯入車流中緩慢行駛,不允許隨意超車和變道.駕駛過程中,駕駛?cè)诵枰?種交通流場景中執(zhí)行指定駕駛次任務(wù),以模擬駕駛分心狀態(tài).指定的駕駛次任務(wù)包括正常駕駛(基準(zhǔn))、免提手機(jī)通話和收發(fā)語音短信,記錄駕駛過程中各項駕駛績效指標(biāo)的變化情況.
實驗共招募53位駕駛?cè)诉M(jìn)行模擬駕駛實驗,所有駕駛?cè)司钟杏行я{照,年齡在26~59歲之間(均值:37.7,標(biāo)準(zhǔn)差:8.51),駕齡為3~39年(均值:12.1,標(biāo)準(zhǔn)差:9.34),累計行駛在0.5萬~400萬km(均值:64.2,標(biāo)準(zhǔn)差:94.63).駕駛?cè)松硇慕】担瑹o視覺和聽覺障礙.具體實驗流程如下:
(1)實驗人員向駕駛?cè)私榻B實驗主要內(nèi)容和基本要求,駕駛?cè)嗽谥橥鈺虾炞郑?/p>
(2)調(diào)查駕駛?cè)四挲g、駕齡、職業(yè)等個人基本信息;
(3)駕駛?cè)诉M(jìn)行大約10 min的適應(yīng)性訓(xùn)練,以適應(yīng)模擬駕駛環(huán)境;
(4)正式實驗,駕駛?cè)送瓿砂杂闪鳡顟B(tài)場景和擁擠流狀態(tài)場景的實驗路段,在該過程中完成指定駕駛次任務(wù);
(5)收集和整理駕駛?cè)塑囕v運行數(shù)據(jù)和視頻錄像.
本實驗中駕駛模擬器的采集頻率為30 HZ,可以采集到17項駕駛績效指標(biāo).參考國內(nèi)外相關(guān)研究[4-7],結(jié)合駕駛次任務(wù)對駕駛績效的影響,確定基于駕駛績效的駕駛?cè)朔中臓顟B(tài)判別變量,包括:車速、方向盤轉(zhuǎn)角、跟車距離、車道側(cè)向偏離、縱向加速度和橫向加速度等6項指標(biāo).按照執(zhí)行駕駛次任務(wù)的順序,將數(shù)據(jù)劃分為6個階段進(jìn)行數(shù)據(jù)提?。鹤杂闪鳌馓嵬ㄔ?、自由流—正常駕駛、自由流—語音短信、擁擠流—免提通話、擁擠流—正常駕駛、擁擠流—語音短信.利用三倍標(biāo)準(zhǔn)差法對實驗數(shù)據(jù)進(jìn)行預(yù)處理,經(jīng)K-S檢驗,可知各指標(biāo)數(shù)據(jù)均服從正態(tài)分布.
在收集駕駛分心實驗數(shù)據(jù)的基礎(chǔ)上,通過檢測不同分心水平對應(yīng)駕駛績效指標(biāo)是否存在顯著差異進(jìn)行特征指標(biāo)提取.在2種交通流狀態(tài)下,分別用單因素方差分析方法檢驗6項駕駛績效指標(biāo)的均值和標(biāo)準(zhǔn)差在不同分心水平之間是否存在顯著性差異.由表1可知,自由流狀態(tài)下的車速均值、方向盤轉(zhuǎn)角標(biāo)準(zhǔn)差、縱向加速度標(biāo)準(zhǔn)差、車道側(cè)向偏離標(biāo)準(zhǔn)差等4項指標(biāo),擁擠流狀態(tài)下的車速標(biāo)準(zhǔn)差、方向盤轉(zhuǎn)角標(biāo)準(zhǔn)差、跟車距離均值、縱向加速度標(biāo)準(zhǔn)差、橫向加速度標(biāo)準(zhǔn)差和側(cè)向偏離標(biāo)準(zhǔn)差等6項指標(biāo)在不同分心水平影響下均存在顯著性影響(P<0.05).因此,可以將表1中自由流狀態(tài)的4項指標(biāo)和擁擠流狀態(tài)的6項指標(biāo)作為駕駛?cè)朔中臓顟B(tài)判別特征指標(biāo).
表1 單因素方差分析結(jié)果Table 1 Statistical comparison results of one-way ANOVA
本文共選取自由流狀態(tài)場景下27 156組樣本數(shù)據(jù),擁擠流狀態(tài)場景下21 209組樣本數(shù)據(jù),將數(shù)據(jù)分為70%訓(xùn)練集和30%測試集.自由流狀態(tài)場景下每個樣本具有4個特征指標(biāo),擁擠流場景下每個樣本具有6個特征指標(biāo),駕駛?cè)朔中臓顟B(tài)(免提通話狀態(tài)、正常駕駛狀態(tài)和語音短信狀態(tài))分別標(biāo)記為0、1、2.
本文采用遺傳算法優(yōu)化SVM模型參數(shù),利用獲得最佳參數(shù)的SVM模型分別對2種交通狀態(tài)下的3種分心狀態(tài)進(jìn)行判別.SVM模型中選擇徑向基(RBF)作為核函數(shù),使用Matlab進(jìn)行GA-SVM模型的建立和訓(xùn)練.自由流狀態(tài)下GA尋優(yōu)算法中設(shè)置:最大遺傳代數(shù)為50,種群數(shù)量為20,參數(shù)C的取值范圍為[0,100],參數(shù)g的取值范圍為[0,100],代溝為0.9,交叉驗證次數(shù)k=5,交叉率為0.7,變異率為0.01.擁擠流狀態(tài)下,GA尋優(yōu)算法中設(shè)置與自由流狀態(tài)相同.利用GA尋優(yōu)算法得到自由流狀態(tài)下SVM最佳懲罰參數(shù)C=99.104 3,最優(yōu)核函數(shù)參數(shù)g=0.101 6,擁擠流狀態(tài)下SVM最佳懲罰參數(shù)C=84.964 4,最優(yōu)核函數(shù)參數(shù)g=0.546 84,GA參數(shù)尋優(yōu)結(jié)果如圖2所示.
圖2 不同交通狀態(tài)下的GA-SVM適應(yīng)度曲線Fig.2 Fitness curves of GA-SVM in different traffic conditions
將2種交通流狀態(tài)下最優(yōu)參數(shù)代入SVM模型中,對訓(xùn)練集進(jìn)行訓(xùn)練,并對測試集進(jìn)行測試,得到模型的分類效果,如表2所示.由表2可知,模型在自由流狀態(tài)和擁擠流狀態(tài)中的分類準(zhǔn)確率較高,分別為94.5%和96.3%,這表明通過GA參數(shù)尋優(yōu)后得到的SVM分類模型可以有效地判別2種交通流狀態(tài)下3種分心狀態(tài).通過特征指標(biāo)的提取和模型分類準(zhǔn)確率可以看出,在擁擠流中駕駛?cè)朔中膶︸{駛績效的影響更為明顯.
為了進(jìn)一步驗證GA-SVM模型的分類性能,將GA-SVM方法與決策樹C4.5、交叉驗證(CV)-SVM進(jìn)行對比.其中CV-SVM方法中參數(shù)尋優(yōu)采用K-CV方法,K取10.本文采用準(zhǔn)確率(Accuracy)、精確率(Precision)、召回率(Recall)和 F1值(F1-Measure)對3種模型性能進(jìn)行評價,模型性能評價結(jié)果如表3所示.
表2 不同交通流狀態(tài)下的分類準(zhǔn)確率Table 2 Classification accuracy under different traffic flow states
表3 2種交通流狀態(tài)下各模型性能評價指標(biāo)Table 3 Performance evaluation indicators of classification methods under two traffic flow conditions
從表3可以看出,無論在自由流還是擁擠流狀態(tài)中,GA-SVM模型各項性能均較其他2種模型為優(yōu),這說明GA-SVM模型分類效果最佳.
(1)本文建立基于GA-SVM的駕駛?cè)朔中呐袆e模型,通過模擬駕駛實驗采集駕駛績效數(shù)據(jù),對模型進(jìn)行驗證.結(jié)果表明,自由流狀態(tài)和擁擠流場景中模型的分類準(zhǔn)確率分別為94.5%和96.3%,可以準(zhǔn)確判別2種交通流中駕駛?cè)朔中臓顟B(tài).
(2)與決策樹C4.5、CV-SVM相比,GA-SVM在準(zhǔn)確率、精準(zhǔn)率、召回率和F1值等模型性能指標(biāo)上能夠體現(xiàn)出更好的性能.
最后,本文實驗是在模擬駕駛環(huán)境中進(jìn)行的,能夠達(dá)到預(yù)期研究目的,但是其在現(xiàn)實環(huán)境中的適用性還待進(jìn)一步研究,因而下一步工作應(yīng)開展自然駕駛條件下駕駛分心判別研究.
[1]Traffic Safety Facts Research Note.Distracted Driving 2013[R].Washington DC:National Highway Traffic Safety Administration,2015.
[2]HORREY W J,LESCH M F,GARABET A,et al.Distraction and task engagement:How interesting and boring information impact driving performance and subjective and physiological responses[J].Applied Ergonomics,2017(58):342-348.
[3]DONG Y,HU Z,UCHIMURA K,et al.Driver inattention monitoring system for intelligent vehicles:A review[J].IEEE Transactions on Intelligent Transportation Systems,2011,12(2):596-614.
[4]LIANG Y,LEE J D.Combining cognitive and visual distraction:less than the sum of its parts[J].Accident Analysis&Prevention,2010,42(3):881-890.
[5]RUMSCHLAG G,PALUMBO T,MARTIN A,et al.The effects of texting on driving performance in a driving simulator:The influence of driver age[J].Accident Analysis and Prevention,2015(74):145.
[6]WOLLMER M,BLASCHKE C,SCHINDL T,et al.Online driver distraction detection using long short-term memory[J].IEEE Transactions on Intelligent Transportation Systems,2011,12(2):574-582.
[7]馬艷麗,顧高峰,高月娥,等.基于駕駛績效的車載信息系統(tǒng)操作分心判定模型[J].中國公路學(xué)報,2016,29(4):123-129.[MA Y L,GU G F,GAO Y E,et al.Driver distraction judging model under in-vehicle information system operation based on driving performance[J].China Journal of Highway and Transport,2016,29(4):123-129.]
[8]VLADIMIR N VAPNIK.統(tǒng)計學(xué)習(xí)理論[M].北京:電子工業(yè)出版社,2015.[VLADIMIR N VAPNIK.Statistical learning theroy[M].Beijing:Publishing House of Electronics Industry,2015.]