田保書 彭月麗 羅婧 劉俊 韋光洋
摘要:隨著時代的發(fā)展,駕車出行是更多人的選擇方式,但是越來越多的交通事故嚴重影響了人們的安全,這些交通事故的背后大多數(shù)都是由于駕駛不規(guī)范而造成的。本項目組研究的基于深度學習的不規(guī)范駕駛行為智能識別系統(tǒng),可以智能的檢測到駕駛員的不規(guī)范行為,極大的提高了駕駛的安全性。
關(guān)鍵詞:深度學習;卷積神經(jīng)網(wǎng)絡(luò);不規(guī)范駕駛行為
1 引言
近幾年,隨著科技和技術(shù)的不斷發(fā)展,公交車和出租車以及私家車都不斷的增多,這不僅給我們的出行帶來了便利,而且還充分的體現(xiàn)出我國的經(jīng)濟發(fā)展的速度,但這也為人們的安全埋下了隱患。根據(jù)交通安全大數(shù)據(jù)所了解,在容易導致事故發(fā)生的十大不規(guī)范駕駛行為中,未按操作規(guī)范安全駕駛、文明駕駛的占49.6%。可以看出不規(guī)范駕駛行為所導致的交通事故接近占總比的一半。
深度學習是機器學習研究中的一個新領(lǐng)域,其目的在于訓練計算機完成自主學習、判斷、決策等人類行為并建立、模擬人腦進行分析學習的神經(jīng)網(wǎng)絡(luò)[1]。當前,深度學習的研究逐漸從監(jiān)督學習轉(zhuǎn)移到強化學習、半監(jiān)督學習以及無監(jiān)督學習鄰域,視頻檢測,因其可以利用海量無標記的自然數(shù)據(jù)去學習視頻的內(nèi)在特征。
對此,基于之前的各種傳統(tǒng)的監(jiān)控系統(tǒng)在不同領(lǐng)域中,所暴露出來的局限性和狹義性。使新一代智能監(jiān)控系統(tǒng)的得以飛速發(fā)展,基于深度學習的不規(guī)范駕駛行為智能識別系統(tǒng)與傳統(tǒng)的行車記錄儀相比他的優(yōu)點在于能夠全面的解決司機的不規(guī)范駕駛行為,以避免造成不必要的交通事故發(fā)生。
2 系統(tǒng)設(shè)計
2.1 系統(tǒng)構(gòu)成
該系統(tǒng)使用普通攝像頭采集視頻信息,然后進行處理,實時傳遞給視頻分析模塊。當檢測到不規(guī)范行為時,通過語音提示器提示駕駛員規(guī)范駕駛。通過這三個模塊的協(xié)同配合,最終實現(xiàn)全套的完整功能。系統(tǒng)功能模塊圖如圖2-1。
2.2 去運動模糊模型
由于車在行駛過程中,司機一直是運動狀態(tài),通過車內(nèi)攝像頭采集司機的圖像會產(chǎn)生運動模糊,所以需要處理模糊。這不禁讓人聯(lián)想起生成對抗網(wǎng)絡(luò)(GAN),因為它能夠保存高紋理細節(jié),創(chuàng)建的圖案接近真實圖像,所以是圖像超分辨率和圖像修復中的主力軍[2]。
2.3 卷積神經(jīng)網(wǎng)絡(luò)模型
卷積神經(jīng)網(wǎng)絡(luò)是多層感知機(MLP)的變種。卷積神經(jīng)網(wǎng)絡(luò)是一種深度的監(jiān)督學習下的機器學習模型,具有極強的適應(yīng)性,善于挖掘數(shù)據(jù)局部特征,提取全局訓練特征和分類,它的權(quán)值共享結(jié)構(gòu)網(wǎng)絡(luò)使之更類似于生物神經(jīng)網(wǎng)絡(luò),在模式識別各個領(lǐng)域都取得了很好的成果[3]。利用卷積神經(jīng)網(wǎng)路模型對采集的司機圖像通過卷積神經(jīng)網(wǎng)絡(luò)進行識別和處理。
3 系統(tǒng)流程
前期準備,通過模擬駕駛場景,針對4種典型的駕駛行為進行識別,分別為:規(guī)范駕駛、疲勞駕駛、打電話、單手駕駛。對這些典型行為進行識別,可為后續(xù)的行為分析提供數(shù)據(jù)支撐。本系統(tǒng)以10名駕駛員為研究對象。每個駕駛員單獨拍攝5-6分鐘視頻,在駕駛位分別做出疲勞駕駛、打電話、單手駕駛的動作,每個動作持續(xù)20秒左右。在每個行為模式下選取多張幀圖,組成6500張圖片,對數(shù)據(jù)進行標注,然后組成訓練集。同理可得到驗證集和測試集。
系統(tǒng)基于TensorFlow深度學習框架完成模型建立,TensorFlow提供很多的函數(shù)模塊,在搭建模型過程中,用戶可以調(diào)用這些函數(shù)。且利用SSD算法獲取圖像中駕駛員的圖像信息,根據(jù)駕駛員圖像信息裁剪駕駛員圖像。然后根據(jù)前向傳播得到預測試,跟真實樣本比較,得到損失值,接著采用反向傳播算法,更新權(quán)值(參數(shù)),來回不斷地迭代,直到損失函數(shù)很小,然后在測試集或者驗證集上對準確率進行評估。
模型訓練完畢,使用真實數(shù)據(jù)進行預測,如表1所示是系統(tǒng)的測試結(jié)果,當司機在開車中有不規(guī)范駕駛動作行為時,對司機進行語音提示。
4 結(jié)語
本系統(tǒng)通過將攝像頭安裝在車內(nèi),并實時采集司機行為特征圖像,控制器與服務(wù)器遠程連接,服務(wù)器通過網(wǎng)絡(luò)通信接收司機圖像,并通過深度學習技術(shù)對采集的司機行為圖像進行識別并處理,再把處理的結(jié)果傳給控制器。有助于提高司機安全意識,減少交通事故的發(fā)生。
參考文獻:
[1]https://blog.csdn.net/weixin_37647148/article/details/105932009
[2]安祺, 姜麗芬, 孫華志,等. 基于生成對抗網(wǎng)絡(luò)去除車輛圖像運動模糊模型[J]. 天津師范大學學報(自然科學版), 2020, v.40(01):79-83.
[3]https://blog.csdn.net/sazass/article/details/87794071
基金項目:西北民族大學中央高?;究蒲袠I(yè)務(wù)費資助本科生科研能力項目訓練項目(項目編號:XBMU21188)
第一作者:田保書(1998—),男,西北民族大學數(shù)學與計算機科學學院本科生,研究方向:軟件工程