鄒濤 吳戀 鄧娟 焦登才 莫勝明
摘要:在當(dāng)今人工智能時代下,車標(biāo)屬于車輛主要標(biāo)識,但需要能準(zhǔn)確的識別,難度就較高,如何利用車標(biāo)識別技術(shù),來解決當(dāng)今的智能交通中的諸多問題,是值得思考的?;谏疃葘W(xué)習(xí)的CNN模型的車標(biāo)識別方法能提高對車標(biāo)識別的準(zhǔn)確度,將車標(biāo)當(dāng)做探測對象,從而提高車標(biāo)識別的精確性,這樣解決了有關(guān)車輛辨別問題。 深度學(xué)習(xí)下的車標(biāo)識別方法可以通過多樣化的特征學(xué)習(xí),能直接從訓(xùn)練樣本集中提煉出特征,將獲取到的車標(biāo)圖傳給神經(jīng)網(wǎng)絡(luò)的分類器進(jìn)行分類識別。
關(guān)鍵詞:車標(biāo)識別;深度學(xué)習(xí);CNN模型;智能交通;人工智能
中圖分類號:TP393 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2018)11-0207-03
Intelligent Vehicle Identification Assistant Based on Deep Learning CNN Model
ZOU Tao1,2, WU Lian1,2, DENG Juan1,2, JIAO Deng-cai1,2, MO Sheng-ming1,2
(1. College of mathematics and computer science, Guizhou normal college, Guiyang 550018,China;2. Institute of large data science and intelligent engineering, Guizhou normal college, Guiyang 550018, China)
Abstract: In todays era of artificial intelligence,as an important vehicle logo logo, can accurately identify the high degree of difficulty, can solve the traffic problems existing in intelligent transportation system using logo recognition technology. Vehicle logo recognition method under CNN deep learning model can improve the accuracy of vehicle recognition, the logo as a research object, to improve the accuracy of recognition, so as to solve a series of problems. Vehicle logo recognition method under deep learning through diversified learning, can directly extract the features from the training samples, the logo figure get into the neural network classifier for classification.
Key words: recognition;deep learning;CNN model;intelligent transportation;artificial intelligence
1 引言
隨著社會的發(fā)展,智能交通系統(tǒng)[3]已逐漸成為我國未來交通系統(tǒng)的重要發(fā)展方向,市場對車輛識別技術(shù)要求越來越高,快速獲取車牌信息和車輛信息成為當(dāng)前車輛品牌識別的一種必要研究。早期的車標(biāo)識別技術(shù)多以研究特征提取方法為主,雖然執(zhí)行的效率可觀,但是準(zhǔn)確度不夠而且消耗大量人力資源。
深度學(xué)習(xí)算法[1]中,卷積神經(jīng)網(wǎng)絡(luò)在圖像處理、語音識別、搜索引擎等等領(lǐng)域獲得了巨大成就,結(jié)合深度學(xué)習(xí)的算法,能有效地避免人工選取特征的繁瑣和片面,選用深度學(xué)習(xí)算法將車輛品牌識別和車牌識別相結(jié)合,使網(wǎng)絡(luò)自主選取特征進(jìn)行學(xué)習(xí)和識別,大大提高了在獲取識別時準(zhǔn)確率的提高。
2 卷積神經(jīng)網(wǎng)絡(luò)
深度學(xué)習(xí)是一種高效無監(jiān)督的算法技術(shù),可以類比于人腦,模擬大腦的行為特征,對數(shù)據(jù)進(jìn)行分析和解釋,卷積神經(jīng)網(wǎng)絡(luò) (CNN)作為深度學(xué)習(xí)諸多算法中的一種,通常它由N個特征提取層、下采樣層和N個全連接的分類器組成。 它的模型復(fù)雜度非常低,權(quán)值也非常少,圖像可以不經(jīng)過轉(zhuǎn)換后就輸入,減少了復(fù)雜的特征提煉過程,圖像輸入作為最底層,網(wǎng)絡(luò)可以獲取到該圖像基礎(chǔ)的特征,這樣對目標(biāo)物體或圖像形變,旋轉(zhuǎn)等變化具有好的抵抗性,在計(jì)算機(jī)視覺或圖像識別的任務(wù)中以圖像作為輸入時非常有效。
3 車標(biāo)識別系統(tǒng)的構(gòu)建
3.1總體框架設(shè)計(jì)
為高效、準(zhǔn)確的識別出車輛的信息,避免人工選取特征的繁瑣和片面,深度學(xué)習(xí)的方法將車牌識別和車輛品牌識別有效結(jié)合起來,通過web前端將車標(biāo)圖片上傳至后臺進(jìn)行識別,后臺使用到Java語言調(diào)用Python的腳本從而利用深度模型來識別圖像。
深度學(xué)習(xí)算法具有高效無監(jiān)督的作用,它可以在獲取識別時大大提高數(shù)據(jù)的準(zhǔn)確率,在它的諸多深度學(xué)習(xí)技術(shù)中,卷積神經(jīng)網(wǎng)絡(luò)能夠準(zhǔn)確識別圖片是由于多個特征提煉層和下采樣層及全連接的分類器作用,所以將Python腳本結(jié)合深度學(xué)習(xí)算法CNN車標(biāo)識別模型,會智能進(jìn)行識別并反饋?zhàn)顪?zhǔn)確的車標(biāo)信息給web前端。
3.2車標(biāo)識別系統(tǒng)設(shè)計(jì)
3.2.1 系統(tǒng)的構(gòu)建
本車標(biāo)識別助手系統(tǒng)包括兩大模塊:訓(xùn)練模塊[5]和識別模塊,訓(xùn)練模塊由訓(xùn)練圖片輸入、深度網(wǎng)絡(luò)的訓(xùn)練構(gòu)建和最終分類器模型的形成組成; 識別模塊由調(diào)用循環(huán)模擬、車標(biāo)識別和前端回顯識別結(jié)果的輸出組成。
3.2.2 網(wǎng)絡(luò)的構(gòu)建
常規(guī)的卷積神經(jīng)網(wǎng)絡(luò)[6]CNN共有七層,分別是輸入層、卷積層、子抽樣層、全連接層以及輸出層。它的每一層都散布多個獨(dú)立的神經(jīng)元,在提取特征階段,子抽樣層會完成特征的整合,全連接層會完成分類任務(wù)。
卷積神經(jīng)網(wǎng)絡(luò)的每一個卷積層都有不同卷積核的特征圖,特征圖上又散布多個獨(dú)立的神經(jīng)元,而放在同一特征圖上的神經(jīng)元又共用一個卷積核。每個神經(jīng)元會將接受域里的輸入信息與卷積核做卷積處理,然后獲得處理后的特征圖。 圖即為圖像卷積[7]的一種形式。
卷積操作得到的特征數(shù)量一般都會很大,如果直接將這些海量的數(shù)據(jù)特征送到分類器中,這將帶來巨大的計(jì)算量,甚至出現(xiàn)過擬合現(xiàn)象,所以在卷積層之后需要連上一個子抽樣層,子抽樣層利用池化技術(shù)[8]將小領(lǐng)域內(nèi)的特征整合到新的領(lǐng)域上, 從而減少了計(jì)算的復(fù)雜度。 我們一般采用池化技術(shù)有Mean-pooling、Max-pooling、Stochastic-pooling。
a)Mean-pooling:領(lǐng)域內(nèi)所有特征點(diǎn)的平均值。
b)Max-pooling:領(lǐng)域內(nèi)特征點(diǎn)的最大值。
c)Stochastic-pooling:將一定范圍內(nèi)的像素位點(diǎn)按照數(shù)值的大小計(jì)算出概率,并選出較大的概率值。
如圖5對上層輸出做Max-pooling的舉例:
4 實(shí)驗(yàn)與結(jié)果
4.1模型的訓(xùn)練
本文所述的車標(biāo)樣本來自于網(wǎng)絡(luò),共有30類車標(biāo)圖片,訓(xùn)練集5000張和測試集1000張,每一類300張,總計(jì)6000張圖片。 圖片統(tǒng)一化處理為40*40大小。如圖6的圖片均是經(jīng)過車標(biāo)定位得到的不同車標(biāo)實(shí)例。
依據(jù)順序分別為:本田、奧迪、寶駿、北汽、奔馳、奔騰、道奇、東風(fēng)、東南、法拉利、福特、比亞迪、華普、黃海、吉利、江鈴、金牛星、標(biāo)致、華普、黃海、吉利、江鈴、金牛星、標(biāo)致、榮威、三菱、斯柯達(dá)、五菱、長安、大眾。
4.2系統(tǒng)測試與結(jié)果分析
為測試該系統(tǒng)識別的效果,對一系列車標(biāo)測試集進(jìn)行測試,對于測試的識別效果可知,該系統(tǒng)所用的深度神經(jīng)網(wǎng)絡(luò)對于大多數(shù)車標(biāo)圖的識別來說效果較好,因?yàn)榈挠?xùn)練參數(shù)值小,辨認(rèn)效率高,可直接輸入圖像一系列優(yōu)勢。表1是對測試集的測試結(jié)果,從結(jié)果中不難看出,利用深度學(xué)習(xí)算法對車標(biāo)進(jìn)行識別,其準(zhǔn)確率都比較精準(zhǔn)。
5 總結(jié)
基于深度學(xué)習(xí)的卷積神經(jīng)網(wǎng)絡(luò)(CNN) [10]的車標(biāo)識別方法,與傳統(tǒng)的車標(biāo)識別方法對比,它能夠準(zhǔn)確、快速的定位車標(biāo),在多層的卷積神經(jīng)網(wǎng)絡(luò)能夠從原始圖像上獲取特征,并且能夠自主提取特征進(jìn)行車標(biāo)識別,相信它所在圖像分類上占據(jù)的優(yōu)勢會在未來交通系統(tǒng)中占領(lǐng)主導(dǎo)地位。
參考文獻(xiàn):
[1] Igor M. Coelho,Vitor N. Coelho,Eduardo J. da S. Luz,Luiz S. Ochi,F(xiàn)rederico G. Guimar?es,Eyder Rios. A GPU deep learning metaheuristic based model for time series forecasting[J]. Applied Energy,2017.
[2] Xiaohong Gao,Wei Li,Martin Loomes,Lianyi Wang. A fused deep learning architecture for viewpoint classification of echocardiography[J]. Information Fusion,2017,36.
[3] 陳小娥,楊薇薇.基于深度學(xué)習(xí)的車標(biāo)識別算法的研究與實(shí)現(xiàn)[J].長春工程學(xué)院學(xué)報(自然科學(xué)版),2017,18(2):117-120.
[4] 張素雯. 基于視頻分析的道路車輛信息提取方法研究[D].海南大學(xué),2017.
[5] 劉靈. 基于深度學(xué)習(xí)的車型識別分析與研究[D].山東師范大學(xué),2017.
[6] 吳章輝. 基于樹狀卷積神經(jīng)網(wǎng)絡(luò)的車標(biāo)識別[D].湘潭大學(xué),2017.
[7] 李夢. 基于智能圖像處理的車標(biāo)識別研究[D].北京交通大學(xué),2017.
[8] 張琪. 卷積神經(jīng)網(wǎng)絡(luò)在車標(biāo)識別技術(shù)中的研究及其小樣本下的處理策略[D].安徽大學(xué),2016.
[9] 彭博,臧笛.基于深度學(xué)習(xí)的車標(biāo)識別方法研究[J].計(jì)算機(jī)科學(xué),2015,42(4):268-273.
[10] 張海彬. 基于卡口圖像的車型識別方法研究[D].合肥工業(yè)大學(xué),2015.