王策 陳向曦 王超 蔡朝朝
關(guān)鍵詞: 疲勞駕駛監(jiān)測(cè);表情識(shí)別;SSD;Python;PyTorch
中圖分類(lèi)號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2023)10-0022-03
0引言
在互聯(lián)網(wǎng)時(shí)代,人臉表情識(shí)別已經(jīng)成為計(jì)算機(jī)視覺(jué)任務(wù)中的一個(gè)重要研究方向,不僅是個(gè)人情感的外在表現(xiàn),更是日常生活中人與人之間情感傳播與交流的重要方式。同時(shí),自動(dòng)表情識(shí)別技術(shù)的發(fā)展可以幫助計(jì)算機(jī)擁有對(duì)情緒的理解,在人機(jī)交互問(wèn)題上能提供更有效的解決方法。
駕駛員在疲勞狀態(tài)下駕駛車(chē)輛是造成交通事故的重要原因之一[1]。2008年中國(guó)因疲勞駕駛導(dǎo)致的道路交通事故共2 568起,其中死亡1 353人,受傷3 129 人,造成的直接財(cái)產(chǎn)損失約5 738萬(wàn)元[2]。研究駕駛員疲勞監(jiān)測(cè)方法,監(jiān)測(cè)駕駛員疲勞狀態(tài),在其疲勞時(shí)進(jìn)行提醒或干預(yù),對(duì)于保護(hù)駕駛員及行人的安全有重大意義。
1研究現(xiàn)狀
雷凌俊等人[3]對(duì)三角波、阿爾法波和貝塔波作為腦電信號(hào)進(jìn)行采集,并利用CNN算法對(duì)腦電數(shù)據(jù)進(jìn)行識(shí)別,他們通過(guò)特定腦電圖波形的選擇,腦電圖信號(hào)的預(yù)處理,集中度和靜坐度的判別算法研究從而對(duì)駕駛員進(jìn)行疲勞判定。
徐禮勝等人[4]通過(guò)基于短時(shí)心電信號(hào)的疲勞駕駛檢測(cè)算法提取的特征,并設(shè)計(jì)一種隨機(jī)森林分類(lèi)器并基于這些特征進(jìn)行分類(lèi),在疲勞駕駛監(jiān)測(cè)上具有良好的分類(lèi)效果,平均準(zhǔn)確率達(dá)到91%。
Wang Qingjun等人[5]通過(guò)傳感器采集的方向盤(pán)信號(hào)、轉(zhuǎn)角信號(hào)、呼吸信號(hào)等疲勞監(jiān)測(cè)信號(hào)相融合,提出異質(zhì)信號(hào)融合的疲勞駕駛監(jiān)測(cè)算法,最終使得算法具有良好效果。
呂秀麗等人[6]利用SSD網(wǎng)絡(luò)定位駕駛員的眼睛與嘴巴區(qū)域,并結(jié)合人臉68特征點(diǎn)等方法共同判定駕駛疲勞狀態(tài),在YawDD 數(shù)據(jù)集上的檢測(cè)準(zhǔn)確率達(dá)97.2%。
2模型設(shè)計(jì)
2.1 數(shù)據(jù)集
本文采用從AI Studio下載的公開(kāi)疲勞駕駛分類(lèi)數(shù)據(jù)集,進(jìn)行訓(xùn)練和測(cè)試共2914張圖像,單張大小為640×480的三通道圖像,樣本圖像如圖1所示。下載路徑為:https://aistudio.baidu.com/aistudio/datasetdetail/85880。該數(shù)據(jù)集被標(biāo)注類(lèi)別為四種open_eye、closed_eye、open_mouth、closed_mouth 分別表示眼睛的開(kāi)閉和嘴巴的開(kāi)閉,標(biāo)注圖像如圖2所示。
2.2 SSD網(wǎng)絡(luò)
SSD網(wǎng)絡(luò)[7]是由Wei Liu等人提出的一種卷積神經(jīng)網(wǎng)絡(luò)目標(biāo)檢測(cè)算法,它提供了一種多尺度特征圖預(yù)測(cè)分類(lèi)和回歸的思想,精確度和速度都很高。其采用VGG16作為基礎(chǔ)模型,然后在VGG16的基礎(chǔ)上新增了卷積層來(lái)獲得更多的特征圖以用于檢測(cè),如圖3 所示。
如圖3所示,本文使用SSD網(wǎng)絡(luò),通過(guò)VGG16和多卷積層對(duì)駕駛員圖片中的眼睛與嘴巴進(jìn)行特征提取,并通過(guò)改進(jìn)參數(shù)等方法調(diào)試網(wǎng)絡(luò),實(shí)現(xiàn)對(duì)數(shù)據(jù)集進(jìn)行疲勞駕駛分類(lèi)訓(xùn)練,來(lái)篩選預(yù)測(cè)結(jié)果。
2.4 疲勞駕駛判定方法
2.4.1 PERCLOS值
卡內(nèi)基梅隆研究所經(jīng)過(guò)反復(fù)實(shí)驗(yàn)和論證,提出了度量疲勞/瞌睡的物理量PERCLOS (Percentage? of EyeIid CIosure over the PupiI, over Time, 簡(jiǎn)稱(chēng)PER?CLOS),它被定義為每分鐘眼部閉合程度超過(guò)某一閉值(70%、80%)的時(shí)間比例,其具體實(shí)現(xiàn)公式如下所示。
PERCLOS 值[8]具有三個(gè)最常見(jiàn)標(biāo)準(zhǔn)EM、P70 和P80用于確認(rèn)眼睛的閉合狀態(tài),分別意味著瞳孔被遮擋比例為50%、70%、80%時(shí),眼睛的閉合,本文采用P80標(biāo)準(zhǔn)。
2.4.2 嘴巴閉合狀態(tài)
司機(jī)在駕駛時(shí)的疲勞判定還可以從嘴部特征入手。文章通過(guò)計(jì)算每一幀閉合狀態(tài),確定嘴巴縱橫比。設(shè)定上下嘴唇閉合時(shí),特征值為0,上下嘴唇完全張開(kāi)時(shí),特征值為1。當(dāng)上下嘴唇張開(kāi)時(shí),其間距會(huì)變大,設(shè)定打哈欠時(shí)的特征值為G(G = 0.5)。當(dāng)超過(guò)1 秒時(shí)間的嘴巴縱橫比特征值大于G時(shí),就被認(rèn)定為打哈欠行為。
2.5 模型性能測(cè)試
為測(cè)試模型的可靠性,體現(xiàn)該疲勞駕駛系統(tǒng)的效果,文章使用從AI Studio下載的公開(kāi)疲勞駕駛分類(lèi)數(shù)據(jù)集,對(duì)該模型的準(zhǔn)確率(Accuracy) 進(jìn)行計(jì)算。
TP(True Positive):分類(lèi)器預(yù)測(cè)結(jié)果為正樣本,實(shí)際也為正樣本。
TN(True Negative);分類(lèi)器預(yù)測(cè)結(jié)果為負(fù)樣本,實(shí)際為負(fù)樣本。
最終該模型通過(guò)測(cè)試集測(cè)試后,準(zhǔn)確率達(dá)到了92.15%。驗(yàn)證了該疲勞駕駛系統(tǒng)的有效性與可靠性。
3 系統(tǒng)實(shí)現(xiàn)
3.1 功能設(shè)計(jì)
本文疲勞駕駛監(jiān)測(cè)系統(tǒng)模塊結(jié)構(gòu)如圖4所示,主要有三個(gè)部分組成,即預(yù)處理模塊、檢測(cè)模塊、判斷模塊。預(yù)處理模塊主要是通過(guò)OpenCV工具進(jìn)行數(shù)據(jù)的處理,將輸入數(shù)據(jù)調(diào)整為300×300的大小,并對(duì)輸入數(shù)據(jù)進(jìn)行去均值處理;檢測(cè)模塊主要通過(guò)本文提出的SSD算法對(duì)輸入圖像的眼部、嘴部進(jìn)行檢測(cè);判斷模塊用于判斷駕駛員駕駛狀態(tài),即閉眼時(shí)間比例,張嘴時(shí)長(zhǎng)進(jìn)行判斷,最后得出當(dāng)前駕駛員駕駛狀態(tài)。具體疲勞駕駛監(jiān)測(cè)流程圖如圖5所示。
3.2 軟件設(shè)計(jì)與測(cè)試
該系統(tǒng)軟件開(kāi)發(fā)以Python 語(yǔ)言開(kāi)發(fā),采用Py?Torch作為深度學(xué)習(xí)開(kāi)發(fā)框架。首先,通過(guò)攝像頭讀取數(shù)據(jù),然后進(jìn)行預(yù)處理并送入算法模型中進(jìn)行分類(lèi)檢查,最后計(jì)算PERCLOS值和打哈欠檢測(cè),判斷疲勞駕駛狀態(tài)。使用OpenCV框架部署實(shí)現(xiàn)實(shí)時(shí)監(jiān)測(cè),運(yùn)行測(cè)試如圖6所示。
4總結(jié)
本文介紹了疲勞駕駛國(guó)內(nèi)外研究現(xiàn)狀,并成功搭建SSD網(wǎng)絡(luò)模型對(duì)疲勞駕駛進(jìn)行識(shí)別,使用OpenCV 框架部署實(shí)現(xiàn)實(shí)時(shí)監(jiān)測(cè)。實(shí)現(xiàn)基于表情識(shí)別的疲勞駕駛監(jiān)測(cè)系統(tǒng)的設(shè)計(jì),對(duì)疲勞駕駛監(jiān)測(cè)有不錯(cuò)的效果。在設(shè)計(jì)過(guò)程中,還存在部分問(wèn)題,比如SSD網(wǎng)絡(luò)中主干特征提取網(wǎng)絡(luò)VGG16可以換為更輕量級(jí)的網(wǎng)絡(luò),以及在復(fù)雜環(huán)境下,疲勞駕駛監(jiān)測(cè)的不穩(wěn)定性。希望將來(lái)可以實(shí)現(xiàn)更加穩(wěn)定、高效、輕量的系統(tǒng)。