單 瑾,曾 丹
(成都電子機械高等??茖W校 網(wǎng)管中心,成都 610071)
車牌識別技術(shù)(License Plate Recognition,LPR)是計算機視覺和模式識別技術(shù)在現(xiàn)代智能交通系統(tǒng)中的一項重要研究課題,是實現(xiàn)交通管理智能化的重要環(huán)節(jié)。它是以數(shù)字圖像處理、模式識別、計算機視覺等技術(shù)為基礎(chǔ)的智能識別系統(tǒng)。它利用每一輛汽車都有唯一的車牌號碼,通過攝像機所拍攝的車輛圖像,在不影響汽車狀態(tài)的情況下,計算機自動完成車牌的識別,從而可降低交通管理工作的復雜度。
由于車牌識別涉及到很多復雜因素,現(xiàn)有理論和方法還存在識別速度慢、精度低、抗干擾性能差等問題,因此有必要進一步研究。本文提出了一種基于模板匹配的車牌識別方法[1],能有效地完成不同解析度和不同模糊程度的車牌識別工作,而且識別精度高、速度快,能滿足實時系統(tǒng)的要求。
車牌圖像的分割就是把車牌的整體區(qū)域分割成為單字符的區(qū)域,以便后續(xù)識別。從車輛圖像中準確地定位分割出車牌區(qū)域是車牌識別中最為關(guān)鍵的步驟之一,只有有效地完成分割,才能進一步提取目標特征并識別目標。圖像分割結(jié)合車牌的一些共同特征,例如,車牌呈規(guī)則的矩形,大小一般為44 cm×14 cm;文字與背景之間有明顯灰度對比;第1、2個字符分別是漢字和字母,第3個字符是一個間隔符“·”等等,對圖像中的車牌、背景進行標記、定位,然后將待識別的車牌字符從背景或其他偽目標中分離出來。筆者采用一種投影法粗分割結(jié)合先驗知識后處理的字符分割方法,該方法簡單、容易實現(xiàn),取得了很好的分割效果。算法流程圖如圖1所示。
圖1 分割算法流程圖
圖2 車牌圖片灰度圖
圖3 車牌的灰度直方圖
在完成車牌的精確定位后,進行字符的分割。首先將圖像進行二值化處理,使圖像僅呈現(xiàn)黑色和白色兩種顏色,即在灰度圖上形成僅包含255和0兩種灰度,使圖像在后期識別操作過程中更加容易處理。
車牌中的字和背景使用的是對比比較明顯的顏色,在灰度圖上表現(xiàn)的灰度值相差較大,如圖2所示。在灰度直方圖上面,車牌區(qū)域形成比較明顯的“雙峰型”,如圖3所示。大量統(tǒng)計表明,對于某一類圖像(如目標和背景有較強的對比)直方圖中出現(xiàn)2個峰值,其中一個表示背景灰度,另一個表示目標灰度。在此前提下,在兩峰的中間谷取閾值。
本項目中,灰度值在車牌底色和字的灰度值周圍分布比較密集,因而在雙峰中的波谷位置選擇合適的閾值,能夠很好地將車牌二值化,將字和底色分開。最簡單的分類規(guī)則是依據(jù)區(qū)域相似性和不連續(xù)性,取定一灰度閾值。大于此閾值的像素點置成黑(白),而小于此閾值的像素點置成白(黑)。尋找閾值的算法選擇Ostu算法(最大方差閾值選擇法),Ostu算法同時考慮了圖像的灰度信息和像素間的空間鄰域信息,是一種有效的圖像分割方法。其基本思想是選擇一個閾值,使用該閾值進行分類時,2類之間的類間方差達到最大。
Ostu選擇法的具體步驟是:
將直方圖在某一閾值k處分為二組,C1={0~k},C2={k~255},各自產(chǎn)生的概率:
C1產(chǎn)生的概率為ω(k),
C2產(chǎn)生的概率為1-ω(k);
C1的平均值 μ1=μ(k)/ω(k),
C2的平均值μ2=(μ-μ(k))/(1-ω(k))
其中,μ是整體的灰度平均值;μ(k)是閾值為k時的灰度平均值,所以兩組間的方差可以由式(1)求出:
然后在0~255之間計算式(1)的值,當該值最大時對應的k值作為二值化閾值。這種方法對于在灰度直方圖上呈現(xiàn)出雙波峰的情況效果比較好,而定位之后的車牌區(qū)域恰好符合這個條件。經(jīng)過Ostu閾值二值化處理后的圖片如圖4所示。
由圖4可知,定位后的圖片對于車牌的上下邊緣已經(jīng)定位非常準確。但是由于左右邊緣用于定位的信息不夠充分,同時車牌兩旁的干擾信息具有不可預見性。所以往往左右的邊緣都定位得不是那么準確,通常都要比實際的車牌多出一截。
因此,在進行字符分割時,確定一個可靠的分割起始點就顯得非常重要。通過觀察,發(fā)現(xiàn)在車牌中,第2個字符和第3個字符的間隔是所有相鄰字符中最大的。所以可以尋找間隔最大的區(qū)域,把它認為是第2個和第3個字符所處的位置,以此為依據(jù)進行分割。具體方法如下:
圖4 經(jīng)過Ostu閾值二值化處理后的二值化圖片
1)在二值圖像中對白色像素進行垂直投影。
2)計算橫向間隔最大的位置,認為該位置即是第2、3字符的中間位置。
3)以該位置為基礎(chǔ),按照字符的大致寬度,向左分割出2個字符,向右分割出5個字符。
字符分割計算出的分割線如圖5所示。
該方法充分利用了車牌的布局特征,能夠很好地分割出每個字符。缺點是對于不是橫向排列的車牌不太適應,特別是公交車等車牌呈現(xiàn)上面2個字符,下面5個字符的情況。
圖5 字符分割計算出的分割線
字符分割后要識別每一個字符究竟是什么。筆者采用了一種基于模
板匹配的車牌識別方法,建立大容量的車牌字符特征向量模板庫,用統(tǒng)計學的方法將樣本與模板進行比對。模板匹配的思想是將現(xiàn)有的圖片和模板庫進行比較,如果現(xiàn)有圖片和模板中的一幅圖片的相似度最大,
就認為現(xiàn)有圖片和模板圖片表示的是同一個字符。這里需要解決2個問題,一是圖片進行模式識別前的特征提取采用什么方式,二是采用什么原則進行相似度比較。
特征提取采用網(wǎng)格化的方式,如圖6所示,將一張字符圖片分割成5×5的小方格,這樣一共有25個格子,在每個格子中計算:白色像素個數(shù)/總像素,將得到的值作為特征值,這樣形成一個25維的特征向量??梢詫⑺鼈兌x為X0~X24。
圖6 字符分割計算出的分割線
字符識別的過程是利用現(xiàn)有的特征向量,從待識別的圖像中提取若干圖像的特征量與模板相對應的特征量進行比較,計算模板向量和現(xiàn)有向量之間的相似度,然后將現(xiàn)有特征向量歸入與它相似度最高的模板一類。
本項目中計算圖像和模板特征量之間的距離,用最小距離法判定所屬圖像所屬類別。假設(shè)一個模板向量為M0~M24,特征向量為X0~X24。則特征向量和模板向量的歐氏距離為。分別計算每個模板向量和現(xiàn)有特征向量的歐氏距離d,當d最小時,特征向量X歸入模板向量M所在的類。
采用該方法,當2個模板比較相似的時候,會出現(xiàn)誤判的現(xiàn)象。比如“A”和“4”,如果當時的圖片采集環(huán)境很差或車牌本身有污損的時候,最小距離法有誤判的可能,這個時候可以采用模式識別中的k-近鄰法來實現(xiàn)。k-近鄰法是最近鄰法的擴展,其基本規(guī)則是:在所有N個樣本中找到與測試樣本的k個最近鄰者,取k大者即為識別的字符。
本項目初始建立車牌字符特征向量模板庫時,首先需要采集大量的車牌圖片,提取特征向量加入模版庫,只有建立了較大規(guī)模的字符特征向量模版庫,才能夠保證較高的識別度。
車牌字符可利用的規(guī)律如下:
1)第1個字符總是漢字。
2)第2個字符總是字母。
……
充分利用這些規(guī)律,可以在識別過程中加強判斷條件,以提高識別率。
采用本文中介紹的方法進行實驗,對2 000個樣本進行處理,識別正確1 958個,識別準確率為97.9%,效果理想。[2-4]
[1]單瑾,周娟.一種基于二值圖像灰度變化特征的車牌定位方法[J].成都電子機械高等??茖W校學報,2009(3):30-33.
[2]安勇,張高偉.基于灰度圖像的車牌識別系統(tǒng)[J].計算機工程與科學,2006,28(2):61-62,65.
[3]宋晨光,葉海建.基于數(shù)字形態(tài)學的車牌字符分割算法[J].光電子技術(shù)與信息,2005,18(6):58-62.
[4]蘇厚勝.車牌識別系統(tǒng)的設(shè)計與實現(xiàn)[J].可編程控制器與工廠自動化,2006(3):103-107.
[5]李孟歆,吳成東.基于分級網(wǎng)絡的車牌字符識別算法[J].計算機應用研究,2009,26(5):1703-1705.
[6]崔江,王友仁.車牌自動識別方法中的關(guān)鍵技術(shù)研究[J].計算機測量與控制,2004,33(1):29-33.