程淑紅, 高 許, 周 斌(. 燕山大學 電氣工程學院, 河北 秦皇島 066004;2. 秦皇島中信戴卡股份有限公司 博士后工作站, 河北 秦皇島 066004)
汽車在日常生活及交通運輸中發(fā)揮著重要作用,而交通管理卻面臨著嚴重的挑戰(zhàn)。因此,智能交通系統(tǒng)[1~4]這一集多種先進技術(shù)于一身的全方位、高效率的綜合交通管理系統(tǒng)成為交通管理部門的最佳選擇。而車型識別[5,6]是智能交通系統(tǒng)中一個擁有很好應(yīng)用前景的技術(shù)。Rao Y B[7]設(shè)計了多攝像機視頻監(jiān)控系統(tǒng);王瑞[8]增加了聲頻傳感器用來采集聲頻數(shù)據(jù)。雖然數(shù)據(jù)采集方式的改進能夠優(yōu)化數(shù)據(jù)源,但是單一方面的優(yōu)化并不能有效地提高車型識別率。基于此,研究人員不得不從其他方面入手來提高車型識別率。被檢測車輛的特征提取是整個車型識別過程中的關(guān)鍵步驟,所以又有許多學者通過改進特征提取的方法來提高車型識別率: Wang T T[9]提取了顏色直方圖特征作為特征量參與車型識別;而 Liu S M[10]使用蛇模型提取完整的輪廓曲線特征。改進后的特征提取量不再是長度、面積等基本特征量,而是能夠更加靈活、有效地代表汽車形狀的新型特征量。然而他們僅僅在特征提取方面做了改進,形式單一,并沒有涉及到其它方面的優(yōu)化,這樣雖然能夠使車型識別率提高一些,但并不能取得很好的結(jié)果。Priyadharshini R A[11]使用Gabor和Log-Gabor兩種算法同時對車型識別進行對比試驗,最終驗證Log-Gabor能夠更好地完成車型識別,取得較高的識別率; Zhu G Y則使用了支持向量機(support vector machines,SVM)并對其進行優(yōu)化[12],提出ε臨近分類支持向量機,使得每個類權(quán)重不均勻的問題得到解決。算法和分類器的優(yōu)化大大的提高了車型識別率,但是僅僅對算法或分類器進行優(yōu)化而沒解決特征量單一化的問題是無法很好地完成車型識別的,其識別過程也會存在抗干擾能力差、不穩(wěn)定等問題,無法更加有效地從復(fù)雜的環(huán)境中識別出車輛的類型。
本文提出了一種基于多特征提取和SVM參數(shù)優(yōu)化的車型識別方法:首先提取了多類特征量并進行融合;然后用粒子群算法對SVM參數(shù)進行優(yōu)化;最后,將融合后的檢測結(jié)果與單一特征量的檢測結(jié)果相對比來說明本方法的優(yōu)越性、高效性和可行性。
幾何特征是最先觀察到的特征,本文選取了周長、面積和長寬比作為幾何特征來對車輛進行識別[13]。周長特征是將車輛所在區(qū)域的輪廓像素點總數(shù)量作為特征量;面積特征是將車輛所在區(qū)域的像素點總數(shù)作為特征量;長寬比是指車輛所在區(qū)域的最小矩形的長和寬的比值:
(1)
式中:f(x1)和f(x2)分別是運動區(qū)域最右側(cè)和最左側(cè)像素點與對應(yīng)行第0列像素點之間的距離;f(y1)和f(y2)分別是運動區(qū)域最下面和最上面像素點與對應(yīng)列第0行像素點之間的距離。
紋理特征能夠表現(xiàn)出圖像表面或結(jié)構(gòu)之間的差異,是一種比較穩(wěn)定的特征[14]。本文利用統(tǒng)計灰度直方圖的方式,選擇了均值、標準偏差、熵、平滑度和一致性作為車輛的紋理特征,分別用式(2)~式(6)表示為:
(2)
(3)
(4)
(5)
(6)
式中:L為灰度級總數(shù);zi為第i個灰度級;p(zi)為灰度為zi的概率值;m為均值;μ和σ分別為標準偏差和方差;e為熵;S為平滑度;U為一致性。
局部特征也是描述圖像信息的一種常用方法,常用來表示局部特征的算子主要有:Harris算子、SURF(speed up robust feature)算子和HOG[15]算子等。本文采用HOG算子進行局部特征提取。
HOG是由Dalal等提出的一種表述圖像局部信息的方式,提取圖像HOG的過程為:將一幅圖像分割成很多個小的區(qū)域,計算每個小區(qū)域內(nèi)各個像素點的梯度直方圖(histogram of oriented gradient,HOG),得到每個小區(qū)域的梯度直方圖,再把所有小區(qū)域進行組合,得到一幅完整圖像的HOG特征。提取HOG特征的流程如圖1所示。
圖1 HOG特征提取過程
可以看出,提取HOG特征需要經(jīng)過5個步驟:
1)彩色空間歸一化。在實際應(yīng)用中只對灰度圖像進行歸一化處理即可;
2)梯度計算。 計算灰度圖像中每個像素點的梯度值并得到整個圖像的梯度信息。假設(shè)一幅圖像為f(x,y),對于圖像上的任何一個像素點的梯度可以用式(7)表示為:
(7)
式中:Gx和Gy分別為圖像上任意像素點的水平梯度和垂直梯度。則該點的梯度的大小和方向分別用式(8)和式(9)表示為:
|
(8)
(9)
3)統(tǒng)計梯度直方圖。如圖2所示,將含有車輛的窗口區(qū)域分成多個塊區(qū)域(block),再將每個塊區(qū)域分成4個較小的區(qū)域(cell),把每個cell再被分割成8×8的最小區(qū)域,并計算最小區(qū)域內(nèi)每個像素的梯度。在0°~180°區(qū)間上平均分成9個方向區(qū)間,則得到的每個區(qū)間的大小為20°,然后將cell中的全部像素點的梯度方向累加到相對應(yīng)的區(qū)間上,每個cell均可獲得一個9維的特征向量,將相鄰的4個cell看成一個塊區(qū)域,則任意一個塊區(qū)域可獲得一個36特征向量;
4)歸一化處理。對塊區(qū)域的梯度直方圖進行對比度歸一化處理;
5)HOG特征向量。把經(jīng)過歸一化之后的各塊的全部直方圖連接組成一整幅圖像的HOG特征。
本文主要對視頻圖像中的小轎車、小貨車和面包車進行識別,如圖3所示。樣本采集是在真實的交通場景中完成的,相機用三腳架固定在橋梁上,從道路的正上方進行連續(xù)拍攝;初始樣本視頻每幀圖像大小為720像素×480像素,幀速為25幀/s;測試樣本視頻每幀圖像大小為1 280像素×720像素,幀速為25幀/s;實驗軟件平臺為Matlab 7.0運行平臺。對視頻圖像進行特征參數(shù)提取得到車輛樣本,其中小轎車、小貨車、面包車圖像分別為140幅、60幅、60幅,將這些圖像作為樣本集,測試樣本集和訓練樣本集各占二分之一。
圖3 車輛類型
將采集的3種車型的樣本圖片經(jīng)過灰度化、二值化、中值濾波和雙邊濾波去除圖片噪聲、邊緣提取和形態(tài)學處理等處理過程可得到如圖4所示的處理結(jié)果圖。
圖4 樣本圖像處理結(jié)果
圖4(a)為小轎車、小貨車和面包車的灰度圖像;對分割出來的二值化圖像圖4(b)和邊緣圖像圖4(c)進行幾何特征提取,可以獲得車輛的周長、面積、長寬比、緊密度、矩形度;對圖4(d)前景車輛進行紋理特征和HOG特征提取,從而得到車輛的幾何特征、紋理特征和HOG特征參數(shù),用于后期識別檢測。
對于非線性的樣本,支持向量機[16]可以實現(xiàn)將非線性樣本轉(zhuǎn)換到一個新的特征空間,在此空間可以將非線性樣本轉(zhuǎn)換為線性可分的樣本。一般情況下,通過引入一個非線性變換函數(shù)K(xi,xj)來將非線性問題轉(zhuǎn)換為線性問題進行處理,K(xi,xj)可以是核函數(shù)。
分類判別函數(shù)中只包含輸入樣本和支持向量的內(nèi)積運算,所以,在特征空間進行內(nèi)積運算就可以得到分類結(jié)果,即最優(yōu)分類函數(shù)的輸出。對于非線性的情況,可以選擇合適的內(nèi)積函數(shù)將樣本映射到一個特征空間,再按照線性情況的方法進行求解,常用來表示內(nèi)積函數(shù)的核函數(shù)有線性核函數(shù)、多項式核函數(shù)、徑向基核函數(shù)和Sigmoid核函數(shù),其表達式分別見式(10)~式(13)。有:
K(xi,xj)=xi·xj
(10)
K(xi,xj)=(xi·xj+c)d
(11)
(12)
K(xi,xj)=tanh(a
(13)
式中:xi,xj為2種點集或者兩類訓練樣本;c為常數(shù);d為正整數(shù);σ為控制核函數(shù)高寬; <>代表內(nèi)積運算;a為一個標量;r為位移參數(shù)。式(13)中,當a和r分別取不同值時,Sigmoid核函數(shù)有著不同的性質(zhì)[17]。
支持向量機模型的好壞與懲罰因子、選擇的核函數(shù)以及選擇的核參數(shù)的大小有關(guān),所以選擇一個正確的核函數(shù)是至關(guān)重要的。本文選擇了徑向基核函數(shù),因為與其它3種核函數(shù)相比較而言,線性核函數(shù)只是徑向基核函數(shù)的一種特殊情況,適應(yīng)范圍比較小;多項式和Sigmoid核函數(shù)需要設(shè)置的參數(shù)比較多,使用起來比較繁雜且耗時較長;徑向基核函數(shù)既能很好地服務(wù)于支持向量機,又只需要設(shè)置一個參數(shù),簡單實用且時效性好。
為了獲得較高的分類準確率,除了選擇合適的內(nèi)積函數(shù)之外還需要對其核參數(shù)g和懲罰因子C進行優(yōu)化,本文分別選用網(wǎng)格搜索法、遺傳算法和粒子群算法對支持向量機的核參數(shù)g和懲罰因子C進行優(yōu)化,結(jié)果如表1所示。
表1 SVM最優(yōu)參數(shù)
運用表1中的最優(yōu)參數(shù)優(yōu)化支持向量機,并對樣本進行分類識別,其樣本分類準確率如表2 所示。對比3種方法得到的結(jié)果可知,采用粒子群算法識別準確率最高,而且網(wǎng)格搜索法需要遍歷所有數(shù)據(jù),當數(shù)據(jù)過多時,使用網(wǎng)格搜索法耗時太長,所以,本文選擇粒子群算法對參數(shù)進行優(yōu)化。
表2 樣本分類準確率 (%)
針對采集樣本,分別提取車輛的單一特征及組合特征利用優(yōu)化SVM進行車型識別,其識別準確率如表3所示。從表中的識別準確率對比可知,組合特征識別率高于單一特征的識別率,但是幾何組合與紋理組合的車型識別率也并不理想。為了獲得更高效準確的識別方法,在上述的組合特征中加入了HOG特征構(gòu)建多特征組合矢量矩陣,其中各個特征的權(quán)重都相等,其識別準確率如表4所示。
表3 紋理及幾何特征識別準確率 (%)
表4 多特征組合識別準確率 (%)
由表3和表4可知,利用幾何、紋理和HOG特征組合能夠更全面地描述車輛外在的信息,提高了車型識別準確率。為了進一步驗證本文提出方法的優(yōu)越性、高效性和可行性,使用相同的方法再次采集一組車輛樣本測試數(shù)據(jù)進行實際分類和預(yù)測實驗,其中利用粒子群算法對SVM參數(shù)進行優(yōu)化后可得C=1.196 9,g=5.987 69。測試樣本的實際分類和預(yù)測分類圖如圖5所示。
圖5 測試樣本的實際分類和預(yù)測分類
圖5中給出了小貨車、面包車和小轎車的預(yù)測和實際2種測試集分類圖形。2種圖形重合率越高,說明預(yù)測準確率越高。所以對圖5進行數(shù)據(jù)統(tǒng)計可得到測試樣本整體的識別結(jié)果,如表5所示。由表5和圖5可以看出車型識別的準確率,其中小轎車的識別效果最好,小貨車的識別效果最差。除此之外,3種車型總體的識別準確率為90.769 2%,比初始樣本(表2)的準確率還要高出0.1%。
表5 測試樣本識別結(jié)果
本文主要進行了基于視頻圖像的車輛檢測和車型識別問題的研究,提出了一種基于多特征提取和SVM參數(shù)優(yōu)化的車型識別方法。實驗結(jié)果表明:1)單一種類的組合特征的識別準確率明顯高于單一特征的識別準確率;2)多種類的組合特征的識別準確率高于單一種類的組合特征的識別準確率;3)與其他幾種SVM參數(shù)優(yōu)化算法相比,粒子群優(yōu)化算法能夠取得更好的效果。本文也有需要改進之處。比如:只考慮白天環(huán)境下的車輛檢測而未考慮夜晚的情況;沒有考慮兩輛車相互遮擋時的情況;識別準確率沒能達到100%。這些問題將在進一步的研究中得到解決。
[參考文獻]
[1] 劉昕, 王殿海, 王新穎, 等. 基于IPv6的智能交通信息采集與處理方法[J]. 吉林大學學報(工學版), 2010, 40(5):1226-1229.
[2] Qin Y, Yuan B J, Pi S. Research on framework and key technologies of urban rail intelligent transportation system [C]//Proceedings of the 2015 International Conference on Electrical and Information Technologies for Rail Transportation (2nd). Zhuzhou:Springer Berlin Heidelberg, 2016:729-736.
[3] Ludanek H. Ludanek on ICT and intelligent transportation systems[J].EricssonReview, 2016, 93(1): 30-39.
[4] Moral-Munoz J A, Cobo M J, Chiclana F,etal. Analyzing Highly Cited Papers in Intelligent Transportation Systems[J].IEEETransactionsonIntelligentTransportationSystems, 2016, 17(4):993-1001.
[5] Zhao J, Liu Z J. Research on Vehicle Type Recognition based on Data surveying[J].ScienceandTechnology, 2016, 9(2):319-330.
[6] Wang Y, Zhou J L. Vehicle type recognition in WSN based on ITESP algorithm[C]//10th IEEE International Conference on Ubiquitous Intelligence and Computing (UIC 2013) and 10th IEEE International Conference on Autonomic and Trusted Computing (ATC 2013).Vietrisul Mare, Italy, 2013:668-671.
[7] Rao Y B. Automatic vehicle recognition in multiple cameras for video surveillance[J].VisualComputer,2015, 31(3):271-280.
[8] 王瑞, 王康晏, 馮玉田, 等. 復(fù)雜場景下聲頻傳感器網(wǎng)絡(luò)核稀疏表示車輛識別[J]. 西安電子科技大學學報(自然科學版), 2015, 42(4):115-120.
[9] Wang T T, Xiu C B, Cheng Y. Vehicle Recognition Based on Saliency Detection and Color Histogram[C]//27th Chinese Control and Decision Conference (CCDC 2015), Qingdao, 2015.
[10] Liu S M, Huang Y P, Zhang R J. On-Road Vehicle Recognition Using the Symmetry Property and Snake Models[J].InternationalJournalofAdvancedRoboticSystems,2013,10:1-9.
[11] PriyadharshiniR A, Arivazhagan S, Sangeetha L. Vehicle Recognition based on Gabor and Log-Gabor Transforms[C]//2014 IEEE International Conference on Advanced Communication, Control and Computing Technologies(ICACCCT 2014). Tamil Nadu, India, 2015.
[12] Zhu G Y, Huang D, Zhang P,etal. E-Proximal support vector machine for binary classification and its application in vehicle recognition[J].Neurocomputing, 2015, 161: 260-266.
[13] 王恒奎, 邊耐欣, 王文, 等. 基于Trimmed NURBS 曲面幾何特征的數(shù)字化自適應(yīng)采樣[J]. 計量學報, 2002, 23(4):272-275.
[14] 王崇文, 李見為, 林國清. 一種新的復(fù)合指紋匹配法[J]. 計量學報, 2004, 25(1):77-80.
[15] Li B, Huo G. Face recognition using locality sensitive histograms of oriented gradients[J].Optics,2016, 127(6):3489-3494.
[16] 孟宗,季艷,谷偉明, 等. 基于支持向量機和窗函數(shù)的DEMD端點效應(yīng)抑制方法[J]. 計量學報, 2016, 37(2):180-184.
[17] 劉明. 支持向量機中Sigmoid核函數(shù)的研究[D]. 西安:西安電子科技大學,2009.