趙 凱,張 森,李 杰,尤冬海
(1.鐵道警察學(xué)院 圖像與網(wǎng)絡(luò)偵查系,河南 鄭州450053;2.公安部交通管理科學(xué)研究所,江蘇 無(wú)錫214151)
隨著我國(guó)經(jīng)濟(jì)高速發(fā)展,機(jī)動(dòng)車保有量持續(xù)快速增長(zhǎng)。據(jù)公安部統(tǒng)計(jì),截至2017 年年底,全國(guó)機(jī)動(dòng)車保有量達(dá)3.10 億輛,其中汽車達(dá)2.17 億輛,按類型分,載客汽車保有量達(dá)1.85 億輛,載貨汽車保有量達(dá)2341萬(wàn)輛,增速均達(dá)到歷史新高。隨之而來(lái)的道路安全形勢(shì)越來(lái)越嚴(yán)峻,為保證道路安全,杜絕重特大事故發(fā)生,必須對(duì)中型和重型載客、貨汽車嚴(yán)格管理。依據(jù)《中華人民共和國(guó)道路交通安全法實(shí)施條例》第十三條要求,重型、中型載貨汽車及其掛車、拖拉機(jī)及其掛車的車身或者車廂后部應(yīng)當(dāng)噴涂放大的號(hào)牌,字樣應(yīng)當(dāng)端正并保持清晰。如未按照以上要求的,將依法處以警告或者20 元以上200 元以下罰款。但在現(xiàn)場(chǎng)執(zhí)法過(guò)程中,由于放大號(hào)牌在車輛尾部,發(fā)現(xiàn)時(shí)車輛已經(jīng)快速駛離,管理、取證和處罰難度較大。隨著公安系統(tǒng)的天網(wǎng)工程建設(shè)逐步完善,道路監(jiān)控設(shè)備覆蓋越來(lái)越廣,利用電子卡口監(jiān)控設(shè)備,對(duì)車輛尾部噴涂放大號(hào)牌違章進(jìn)行非現(xiàn)場(chǎng)執(zhí)法,可有效實(shí)現(xiàn),并達(dá)到依法取證、有效查處的目的。
本文提出一種基于卷積神經(jīng)網(wǎng)絡(luò)的車輛尾部噴涂放大號(hào)牌檢測(cè)算法,首先采用窗口檢測(cè)器網(wǎng)絡(luò)對(duì)車輛尾部圖像進(jìn)行檢測(cè),得到可能的目標(biāo)窗口,然后采用改進(jìn)的AlexNet 網(wǎng)絡(luò)模型進(jìn)行分類,對(duì)車輛車尾放大號(hào)牌檢測(cè)分類,算法針對(duì)不同車型進(jìn)行了測(cè)試分析。經(jīng)過(guò)實(shí)驗(yàn)測(cè)試,提出的算法模型分類效果和泛化能力較好,檢測(cè)效果滿足實(shí)踐要求。
深度學(xué)習(xí)是通過(guò)建立和模擬人腦的學(xué)習(xí)分析問(wèn)題的神經(jīng)網(wǎng)絡(luò),對(duì)數(shù)據(jù)進(jìn)行解釋,為人們提供精確的識(shí)別和預(yù)測(cè)能力。目前深度學(xué)習(xí)逐漸廣泛應(yīng)用于圖像分類、人臉識(shí)別、語(yǔ)音識(shí)別、自然語(yǔ)言處理等領(lǐng)域。特別在圖像分類領(lǐng)域,從2010 年開始,ImageNet大規(guī)模視覺(jué)識(shí)別挑戰(zhàn)賽(ILSVRC,ImageNet Large Scale Visual Recognition Challenge)每年舉行一次,在2012年,基于深度學(xué)習(xí)的AlexNet[1]網(wǎng)絡(luò)贏得了冠軍,把2010年接近30%的誤差率下降至15.4%,大幅提高了機(jī)器視覺(jué)的識(shí)別率。
對(duì)圖像中物體進(jìn)行分類主要是研究圖像的特征描述。當(dāng)前的車輛特征提取主要有傳統(tǒng)的人工經(jīng)驗(yàn)算法提取和深度學(xué)習(xí)算法提取。傳統(tǒng)的人工經(jīng)驗(yàn)算法的模型簡(jiǎn)單,但是對(duì)圖像的旋轉(zhuǎn)、光線強(qiáng)度和圖像尺寸大小要求嚴(yán)格,并且算法的魯棒性較差。相較于傳統(tǒng)的人工經(jīng)驗(yàn)算法,深度學(xué)習(xí)算法采用層級(jí)連接的方式,對(duì)輸入圖像信號(hào)進(jìn)行非線性建模,從而獲得圖像更本質(zhì)性的表現(xiàn)特征,完全是數(shù)據(jù)驅(qū)動(dòng)的“端到端”的學(xué)習(xí),不依賴于人工設(shè)計(jì)的特征提取模型,能解決車輛在復(fù)雜自然場(chǎng)景下,位置不同、角度不同等所帶來(lái)的分類難題,并具有很好的魯棒性[2]?,F(xiàn)在用于車輛放大號(hào)牌的自動(dòng)分類檢測(cè)的研究較少,在復(fù)雜道路場(chǎng)景下,車尾圖像參數(shù)不統(tǒng)一、車輛的放大號(hào)牌不規(guī)范,采用人工經(jīng)驗(yàn)算法提取的特征進(jìn)行分類檢測(cè)的效果很差。
卷積神經(jīng)網(wǎng)絡(luò)(CNN[3],Convolutional Neural Networks)是一種前饋人工神經(jīng)網(wǎng)絡(luò),與普通的神經(jīng)網(wǎng)絡(luò)相似,是由可學(xué)習(xí)的權(quán)重和偏置常量的神經(jīng)元組成。卷積神經(jīng)網(wǎng)絡(luò)有很多層組成[4],其典型結(jié)構(gòu)由輸入層、隱藏層和輸出層組成,其中隱藏層包含卷積層、池化層和全連接層。
圖1為經(jīng)典的AlexNet網(wǎng)絡(luò)模型,它是Hinton和他的學(xué)生Alex 在參加ImageNet 大規(guī)模視覺(jué)識(shí)別挑戰(zhàn)賽時(shí)提出的卷積神經(jīng)網(wǎng)絡(luò)模型。該模型深度為8層,其中卷積層5 層,全連接層3 層,參數(shù)約60 MB個(gè),具有約650K 個(gè)神經(jīng)元,使用ReLU 函數(shù)作為激活函數(shù),使用了Dropout技術(shù),在最后采用Softmax輸出概率值,按照概率的大小并設(shè)置門限來(lái)進(jìn)行圖像分類。
車輛尾部放大號(hào)牌檢測(cè)網(wǎng)絡(luò)模型是一個(gè)判斷車輛尾部有無(wú)放大號(hào)牌的分類檢測(cè)網(wǎng)絡(luò)模型,實(shí)現(xiàn)該功能的流程如圖2 所示。在通常道路應(yīng)用環(huán)境中,需要首先使用窗口檢測(cè)網(wǎng)絡(luò)對(duì)圖像進(jìn)行車輛檢測(cè)[5],檢測(cè)為車輛尾部圖像后,接著對(duì)車輛類型進(jìn)行分類,放大號(hào)牌只對(duì)中型和重型載客、貨車有要求,對(duì)分類后的車輛尾部圖片進(jìn)行放大號(hào)牌的檢測(cè)。本文主要研究放大號(hào)牌的檢測(cè)網(wǎng)絡(luò)模型。
圖1 經(jīng)典AlexNet網(wǎng)絡(luò)模型框架
圖2 車輛尾部放大號(hào)牌檢測(cè)流程
目前進(jìn)行圖像分類的網(wǎng)絡(luò)算法有AlexNet 的8層,VGGNet[6]的19 層,GoogleNet[7]的22 層,甚至還有ResNet[8]的200 層,理論上層數(shù)越多分類效果越好,但效率也會(huì)降低。本文研究的車輛尾部放大號(hào)牌是二分類問(wèn)題,類別較少,在注重效果的同時(shí),需要更快的速度。因此,受AlexNet 網(wǎng)絡(luò)模型啟發(fā),本文構(gòu)建了如圖3 的網(wǎng)絡(luò)模型。該網(wǎng)絡(luò)模型共有6層,其中4個(gè)卷積層和2個(gè)全連接層,去掉了原網(wǎng)絡(luò)中LRN(Local Response Normalization)層,使 用ReLU 函數(shù)作為激活函數(shù),為防止訓(xùn)練數(shù)據(jù)過(guò)擬合,保留了全連接層的使用Dropout技術(shù),但是去掉了最后一個(gè)全連接層,為了減少模型參數(shù),同時(shí)將原來(lái)較大的卷積核使用較小的核來(lái)實(shí)現(xiàn)。
該算法首先獲取分類后的車輛圖像信息,為了統(tǒng)一數(shù)據(jù)格式,將圖像大小轉(zhuǎn)換為256*256,并使用三通道(RGB)彩色圖片輸入到網(wǎng)絡(luò)中,然后經(jīng)過(guò)4個(gè)卷積層和2個(gè)全連接層。第1、2個(gè)卷積層使用5*5的卷積核,可以減小參數(shù)并加快訓(xùn)練、檢測(cè)速度,第3、4個(gè)卷積層使用3*3的卷積核,所有卷積層均使用ReLU 函數(shù)作為激活函數(shù),在全連接層中,為提高算法的泛化能力保留了Dropout技術(shù),去掉最后一層全連接層,模型最后使用Softmax回歸進(jìn)行概率分類。
為判斷網(wǎng)絡(luò)模型的可行性和通用性,算法模型驗(yàn)證時(shí),分為按車型分類的驗(yàn)證和不按車型分類的驗(yàn)證,然后分析檢測(cè)準(zhǔn)確率,期望得到適合各種車型的網(wǎng)絡(luò)模型。按車型分類驗(yàn)證時(shí),把車型分為重型貨車、大客車和中型客貨車三類,將三類車輛圖像集分別進(jìn)行訓(xùn)練測(cè)試,然后得到模型的檢測(cè)準(zhǔn)確率,從而判斷模型的可行性。不按車型分類驗(yàn)證時(shí),將三類車型樣本集混合打亂,進(jìn)行訓(xùn)練,然后對(duì)三類車型分別測(cè)試,得到模型的檢測(cè)準(zhǔn)確率,從而分析模型的通用性。
實(shí)驗(yàn)數(shù)據(jù)集來(lái)源于某地高速路車輛圖像信息,由于負(fù)樣本較難獲取,故實(shí)驗(yàn)未使用大量的數(shù)據(jù)。實(shí)驗(yàn)數(shù)據(jù)集中,重型貨車圖片1000 張,其中無(wú)噴涂樣本500 張;大客車圖片1000 張,其中無(wú)噴涂樣本500 張;中型客貨車圖片1000 張,其中無(wú)噴涂樣本500 張。實(shí)驗(yàn)測(cè)試集中,三類車型樣本各250 張,其中無(wú)噴涂樣本各125張。
本實(shí)驗(yàn)使用的環(huán)境是Ubuntu 16.04,使用單個(gè)NVIDIA的Tesla系列P4的GPU,是基于Caffe的深度神經(jīng)網(wǎng)絡(luò)平臺(tái)。訓(xùn)練時(shí)初始學(xué)習(xí)率為10-3,動(dòng)量為0.9,權(quán)重衰減量為0.05,塊大小為32,正則化系數(shù)為10-3。
為驗(yàn)證所提出的算法的可行性和有效性,針對(duì)三種不同車型,分別使用經(jīng)典AlexNet 和本文改進(jìn)AlexNet 網(wǎng)絡(luò)模型進(jìn)行了驗(yàn)證對(duì)比。表1~4,在不同的場(chǎng)景下,給出了兩個(gè)算法的檢測(cè)速率、召回率和準(zhǔn)確率。
圖3 放大號(hào)牌檢測(cè)網(wǎng)絡(luò)模型
表1 重型貨車的經(jīng)典AlexNet和改進(jìn)AlexNet算法的比較
表2 大型客車的經(jīng)典AlexNet和改進(jìn)AlexNet算法的比較
表3 中型客貨車的經(jīng)典AlexNet和改進(jìn)AlexNet算法的比較
表4 混合車型的經(jīng)典AlexNet和改進(jìn)AlexNet算法的比較
經(jīng)典AlexNet 和本文改進(jìn)AlexNet 算法,在車輛放大號(hào)牌檢測(cè)中檢測(cè)準(zhǔn)確率均超過(guò)83%,說(shuō)明算法模型可行。分析數(shù)據(jù)發(fā)現(xiàn),重型貨車由于車輛外觀整潔度較差,放大號(hào)牌部分不清晰,導(dǎo)致檢測(cè)準(zhǔn)備率較低;大型客車負(fù)樣本中,小部分車尾部車窗部分粘貼有廣告信息,導(dǎo)致檢測(cè)出錯(cuò);中型客貨車,外觀整潔,車尾無(wú)干擾因素,故檢測(cè)準(zhǔn)確率較高。
在算法效果上,本文從檢測(cè)速率、召回率和準(zhǔn)確率方面進(jìn)行分析。在檢測(cè)速率方面,經(jīng)典AlexNet每秒檢測(cè)4.6張圖片,改進(jìn)的AlexNet可檢測(cè)每秒6.3張。改進(jìn)的AlexNet 網(wǎng)絡(luò)結(jié)構(gòu)比經(jīng)典AlexNet 的少1個(gè)卷積層和一個(gè)全連接層,因此改進(jìn)的AlexNet 檢測(cè)速率較快。在召回率方面,在二分類的應(yīng)用場(chǎng)景下,由于兩者的網(wǎng)絡(luò)結(jié)構(gòu)和采用的技術(shù)類似,兩者的召回率基本一樣,改進(jìn)的AlexNet刪減了LRN層,得到的召回率相對(duì)略高。在準(zhǔn)確率方面,改進(jìn)的AlexNet網(wǎng)絡(luò),車輛的二分類場(chǎng)景中,選用2層5*5的卷積核和2 層3*3 的卷積核更為合適,并且每個(gè)卷積層中具有池化層,算法的特征獲取更好,且算法的泛化能力更強(qiáng),因此改進(jìn)的AlexNet 檢測(cè)準(zhǔn)確率更高。
本文提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)的車輛尾部放大號(hào)牌檢測(cè)方法,設(shè)計(jì)了基于改進(jìn)的AlexNet網(wǎng)絡(luò)模型的放大號(hào)牌的檢測(cè)分類算法,并通過(guò)不同車型場(chǎng)景對(duì)算法的可行性進(jìn)行驗(yàn)證,然后通過(guò)混合車型數(shù)據(jù)集對(duì)算法進(jìn)行通用性和有效性驗(yàn)證。實(shí)驗(yàn)證明,提出的算法模型速率具備較好的泛化能力,算法效率和準(zhǔn)確率能夠滿足實(shí)踐要求。但算法在部分型號(hào)車尾玻璃窗粘貼大幅面廣告場(chǎng)景下,準(zhǔn)確率有一定的下降,這將是算法改進(jìn)的一個(gè)方向。