潘秋萍 楊萬(wàn)扣 孫長(zhǎng)銀
(東南大學(xué)自動(dòng)化學(xué)院,南京 210096)
車牌識(shí)別系統(tǒng)(license plate recognition,LPR)作為智能交通的重要組成部分,具有重要的實(shí)用價(jià)值和廣泛的應(yīng)用前景.LPR主要包括車牌檢測(cè)、字符分割、字符識(shí)別3個(gè)部分.車牌檢測(cè)是最為關(guān)鍵的環(huán)節(jié),其檢測(cè)精度和速度直接影響整個(gè)車牌識(shí)別系統(tǒng)的性能[1].
目前車牌檢測(cè)的算法有很多,主要分為2大類:一類是基于車牌規(guī)則特征的檢測(cè)方法[2-3],一類是基于統(tǒng)計(jì)學(xué)習(xí)的檢測(cè)方法[4-5].前者復(fù)雜度小,使用廣泛,但是不適合復(fù)雜背景下的檢測(cè).后者適用于復(fù)雜背景下的檢測(cè),它的魯棒性優(yōu)于基于規(guī)則特征的車牌檢測(cè)算法,但是它需要的樣本多,樣本選取較難,特征提取要求高,計(jì)算量大.AdaBoost算法能夠?qū)崟r(shí)地檢測(cè)到車牌,檢測(cè)精度高,且有較高的魯棒性.
傳統(tǒng)的AdaBoot算法使用單一的Haar特征[6]作為分類器,需要大量的特征來(lái)達(dá)到較高的檢測(cè)率和較低的誤檢率,訓(xùn)練耗時(shí).另外AdaBoot算法訓(xùn)練過程中的權(quán)重更新規(guī)則使得學(xué)習(xí)算法專注于比較難分類的樣本,但是當(dāng)訓(xùn)練樣本包含有噪聲、光照、污漬的樣本時(shí),這些樣本的權(quán)重就會(huì)呈指數(shù)增長(zhǎng),最終會(huì)導(dǎo)致權(quán)值分布嚴(yán)重扭曲的現(xiàn)象,降低了算法的檢測(cè)性能[7].為解決傳統(tǒng)的AdaBoost算法訓(xùn)練耗時(shí)和權(quán)值扭曲的現(xiàn)象,左景龍等人提出了一種基于 MB-LBP[8]特征的 AdaBoost算法[9].但是計(jì)算一個(gè)MB-LBP特征的時(shí)間大于Haar特征,選擇出來(lái)的MB-LBP特征的分類能力下降,甚至低于某些Haar特征.
本文提出融合Haar特征和MB-LBP特征的AdaBoost算法并應(yīng)用于車牌檢測(cè):1)以車牌中的數(shù)字單獨(dú)作為訓(xùn)練樣本[10],給出的新算法檢測(cè)的是數(shù)字區(qū)域;2)采用非最大抑制[11]合并窗口,得到候選的車牌區(qū)域;3)通過區(qū)域內(nèi)的灰度跳變次數(shù)[12]來(lái)輔助判斷,最終確定是否為車牌區(qū)域.
Haar特征是一種矩形特征,特征值定義為白色矩形區(qū)域內(nèi)所有的像素灰度值之和減去黑色矩形區(qū)域內(nèi)所有像素灰度值之和.它對(duì)邊緣、線段比較敏感.由于有不同類型的矩形,加上不同的尺寸和位置組合,一幅圖像的Haar特征數(shù)目遠(yuǎn)多于其像素的數(shù)目,因此,選擇適當(dāng)?shù)腍aar特征十分關(guān)鍵.本文選擇了一些合適的Haar特征(見圖1)以兼訓(xùn)練速度和檢測(cè)精度.
MB-LBP(multi-block local binary patterns)算子是LBP算子的一種推廣.LBP對(duì)中心像素與其八鄰域像素的大小關(guān)系進(jìn)行編碼.MB-LBP是對(duì)3×3的大方塊,通過比較中心子塊的平均灰度與其周圍八鄰域子塊的平均灰度計(jì)算特征值(見圖2).MB-LBP改進(jìn)了原始LBP特征只能描述小范圍的圖像信息以及易受噪聲影響的缺點(diǎn),從而捕捉圖像中更多的細(xì)節(jié)變化.
可形式化描述為
圖1 本文使用的幾種Haar特征
圖2 MB-LBP特征值
式中,gc是中心子塊的灰度平均值,gi(i=1,1,…8)是周圍八鄰域的灰度平均值.
MB-LBP特征值是非十進(jìn)制的,為了有效融合Haar與MB-LBP特征,需要對(duì)Haar特征的弱分類器構(gòu)造進(jìn)行修改.
MB-LBP采用多分枝樹形結(jié)構(gòu)來(lái)構(gòu)造弱分類器.這個(gè)樹形結(jié)構(gòu)包括256個(gè)分支,每一個(gè)分支的函數(shù)值與MB-LBP特征值一一對(duì)應(yīng).
式中,xi表示第i個(gè)樣本的MB-LBP特征值,可由式(1)得到.aj表示相應(yīng)的判決系數(shù):
yi∈{+1,-1},+1表示正樣本,-1表示負(fù)樣本.
由式(5)知 aj∈[-1,+1],當(dāng) aj>0 時(shí),表明MB-LBP特征值為j的樣本是正樣本的可能性比是負(fù)樣本的可能性大.
同理,把Haar特征特征值劃分為N個(gè)區(qū)域,計(jì)算每個(gè)區(qū)域的 aj(j=1,2,…,N)的值.
2個(gè)特征的誤差計(jì)算均為
每一個(gè)Haar特征的誤差為
每一個(gè)MB-LBP特征的誤差為
弱分類器旨在找出使得誤差和最小的fHarr(x)或者是fMB-LBP(x).
具體算法描述如下:
1)(x1,y1),(x2,y2),…,(xN,yN)為訓(xùn)練樣本,其中包含了m個(gè)正樣本,l個(gè)負(fù)樣本yi∈{+1,-1},+1表示正樣本,-1表示負(fù)樣本.xi代表第i個(gè)樣本.
3) 對(duì)于 t=1,2,…,T,p=0,q=0(p,q 分別為MB-LBP,Haar構(gòu)成的弱分類器的個(gè)數(shù)).
②搜索最佳的 Haar特征,使得誤差和(式(8))最小,并構(gòu)造弱分類器fHarr(x);搜索最佳的MB-LBP特征,使得誤差和(式(9))最小,并構(gòu)造弱分類器fMB-LBP(x).
③ 如果 eHarr≤eMB-LBP,
式中,F(xiàn)MB-LBP(x)和FHarr(x)分別是由MB-LBP特征和Haar特征構(gòu)成的強(qiáng)分類器.
4)得到強(qiáng)分類器:
其中,THTESH是強(qiáng)分類器的閾值.
本文基于 Haar與MB-LBP特征的AdaBoot算法先檢測(cè)車牌中的數(shù)字,故檢測(cè)后的窗口是一些候選的數(shù)字,并不是最終的車牌區(qū)域.本文采用非最大抑制(non-maximum suppression)合并這些窗口.并通過計(jì)算灰度跳變次數(shù)來(lái)篩選候選區(qū)域,更好地除去干擾.
選取了從車牌上分割出來(lái)的數(shù)字3500張作為正樣本,2391個(gè)負(fù)樣本.訓(xùn)練樣本被歸一化成18×30的像素大小,正樣本是數(shù)字,負(fù)樣本是從背景區(qū)域隨機(jī)選取的不含數(shù)字的子區(qū)域.
測(cè)試環(huán)境為 Intel(R)1.8 GHz CPU,2 G 內(nèi)存,操作系統(tǒng)是Window XP,VC2008.實(shí)驗(yàn)中,我們用了4層級(jí)聯(lián)強(qiáng)分類器,前3層分別是基于圖像的平均灰度、像素值方差、邊緣信息的分類器.后3層分別用了10個(gè)弱分類器,其中MB-LBP特征2個(gè),Haar特征8個(gè).得到一個(gè)弱分類器的時(shí)間大致為48 s;檢測(cè)時(shí)間是將測(cè)試圖片歸一化到352×288大小,采用的是步進(jìn)為1像素的滑動(dòng)窗口檢測(cè).實(shí)驗(yàn)從數(shù)據(jù)庫(kù)中隨機(jī)挑選了154張車牌,檢測(cè)出了146個(gè)車牌,檢測(cè)率為94.8%.同時(shí)誤檢出2個(gè)非車牌區(qū)域.幾種方法的實(shí)驗(yàn)結(jié)果如表1所示.檢測(cè)方法中的一些中間過程見圖3.
本文給出了一種聯(lián)合 Haar與MB-LBP特征的AdaBoot算法用于車牌檢測(cè).這種新的車牌檢測(cè)方法不僅選取少量的特征,并且克服權(quán)值扭曲的現(xiàn)象,具有較快的檢測(cè)速度、較高的檢測(cè)率和較低的誤檢率.
表1 幾種方法的檢測(cè)性能比較
圖3 檢測(cè)方法的中間過程圖
References)
[1]Anagnastopoulos C-N E,Anagnastopoulos I E,Psoroulas I D,et al.License plate recognition from still image and video sequences:a survey[J].IEEE Transactions on Intelligent Transportation Systems,2008,9(3):377-391.
[2]卓均飛,胡煜.基于邊緣檢測(cè)和投影法的車牌定位算法研究[J].科技通報(bào),2010,26(3):438-441.Zhuo Junfei,Hu Yu.Research of license plate locating method based on edge detective and projection [J].Bulletin of Science and Technology,2010,26(3):438-441.(in Chinese)
[3]黃穎,王子新,詹璇,等.一種基于灰度圖像二值化的車牌定位算法[J].電腦知識(shí)與技術(shù),2010,6(2):394-396.Huang Ying,Wang Zixin,Zhan Xuan,et al.An algorithm of license plate localization based on gray images binarization[J].Computer Knowledge and Technology,2010,6(2):394-396.(in Chinese)
[4]Sun Zehang,Bebis G,Miller R.On-road vehicle detection:a review [J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2006,28(5):694-711.
[5]Chang Wenchung,Chou Chiwei.Online boosting for vehicle detection[J].IEEE Transactions on Systems,2010,40(3):892-902.
[6]趙楠.基于AdaBoost算法的人臉檢測(cè)[D].北京:北京大學(xué),2005.
[7]方義秋,盧道兵,葛君偉.車牌檢測(cè)級(jí)聯(lián)分類器快速訓(xùn)練算法[J].重慶郵電大學(xué)學(xué)報(bào):自然科學(xué)版,2010,22(1):104-107.Fang Yiqiu,Lu Daobing,Ge Junwei.Improved license plate detection method based on AdaBoost algorithm[J].Chongqing University of Posts and Telecommunications:Natural Science,2010,22(1):104-107.(in Chinese)
[8]Zhang Lun,Chu Rufeng,Xiang Shiming,et al.Face detection based on multi-block LBP representation[C]//Lecture Notes in Computer Science.Springer,2007,4642:11-18.
[9]左景龍,孫長(zhǎng)銀,楊萬(wàn)扣.一種基于二值模式特征的人臉檢測(cè)算法[J].科技通報(bào),2011,27(5):652-656.Zuo Jinglong,Sun Changyin,Yang Wankou.A face detection algorithm based on MB-LBP features[J].Bulletin of Science and Technology,2011,27(5):652-656.(in Chinese)
[10]Netzer Y,Wang T,Coates A,et al.Reading digits in natural images with unsupervised feature learning[C/OL]//NIPS Workshop on Deep Learning and Unsupervised Feature Learning.(2011)[2012-04-05].http://static.googleusercontent.com/external_content/untrusted_dlcp/research.google.com/zh-CN//pubs/archive/37648.pdf.
[11]Dalal N.Finding people in images and videos[D].Institut National Polytechnique de Grenoble,2006.
[12]Zhang Xiangdong,Shen Peiyi,Bai Jianhua,et al.License plate location based on AdaBoost[C]//International Conference on Information and Automation.Harbin,China,2010:1705-1710.