李宏偉,羅自航,張賀磊
(1.漯河職業(yè)技術(shù)學(xué)院,河南 漯河 462000;2.鄭州工業(yè)技師學(xué)院,河南 鄭州 450007;3.鄭州航空工業(yè)管理學(xué)院,河南 鄭州 450046)
近些年,隨著國家經(jīng)濟(jì)和科技的飛速發(fā)展,人們的生活也隨之發(fā)生了巨大的變化。據(jù)有關(guān)部門統(tǒng)計(jì),截至2020年6月,國內(nèi)汽車保有量2.7億輛。如此龐大的數(shù)字給交通管理部門的運(yùn)行管理帶來了很大的壓力。智能交通系統(tǒng)(ITS)自被提出以來,利用人工智能領(lǐng)域的數(shù)字圖像處理技術(shù)和圖像處理算法對汽車車牌進(jìn)行自動(dòng)識(shí)別,不斷提升智能交通系統(tǒng)的運(yùn)行效率,具有非常重要的理論價(jià)值和現(xiàn)實(shí)應(yīng)用意義。車牌識(shí)別技術(shù)屬于該領(lǐng)域的問題分支,車牌識(shí)別系統(tǒng)在人們的周圍有著廣泛的應(yīng)用場景,例如:公共設(shè)施停車場管理、小區(qū)門禁系統(tǒng)、公司學(xué)校單位門禁等。
通過對我國車牌圖像進(jìn)行收集分析,車牌上的字符有著如下特點(diǎn):車牌的第一個(gè)字符通常為漢字,一般是該車所在地省份或者直轄市的簡稱;車牌的第二個(gè)字符通常是一個(gè)大寫字母,代表該車所在地所處省份的某一個(gè)地級市;第三個(gè)字符到第七個(gè)字符,一般情況下為字母或者數(shù)字的組合。對于車牌的顏色而言,不同的背景色往往代表著不同的含義,車牌背景為黃色一般代表大車,車牌背景顏色為藍(lán)色一般代表小車,車牌背景為黑色一般代表外資企業(yè)或者大使館使用的專用車輛,軍用車牌一般以白色為背景,字體顏色為紅色。
本文研究討論的車牌針對的對象是民用一般車輛,其背景顏色為藍(lán)色,字符顏色為白色。利用數(shù)字圖像進(jìn)行車牌識(shí)別的流程如圖1所示。
圖1 車牌識(shí)別流程
該模塊的硬件部分主要包含高性能攝像機(jī)、高性能PC機(jī)、圖像采集卡和照明設(shè)備等。很多地方的停車場車牌管理系統(tǒng)主要由車輛傳感探測器、高性能計(jì)算機(jī)、高性能攝像機(jī)和視頻采集卡等組成。硬件設(shè)備的作用在于對車輛靠近、通過、停留及離開進(jìn)行輔助判斷。
圖像采集模塊在采集圖像的過程中不可避免地會(huì)受到實(shí)際拍照環(huán)境的影響,例如光線的強(qiáng)弱、車牌的干凈程度、天氣等因素,都會(huì)對最后形成的圖像質(zhì)感造成一定的影響。通過圖像預(yù)處理,提高圖像的有效性,使圖像中的有用信息更加容易檢測,顯著降低圖像中的噪聲干擾。處理主要包括以下幾個(gè)方面:
(1)圖像的灰度化處理。在計(jì)算機(jī)系統(tǒng)中,比較常用的顏色空間有RGB、YUV、CMY、HSI,不同的色彩空間只是同一種物理量的不同表示。圖像的灰度化主要是將采集的彩色圖像變成灰度圖像,減少數(shù)字圖像處理的數(shù)據(jù)量。攝像頭采集的圖像通常是RGB顏色空間下的圖像,R代表紅色,G代表綠色,B代表藍(lán)色。可以得到下式:
式中:代表最后計(jì)算產(chǎn)生的灰度值;、、代表不同的權(quán)重。
(2)圖像的增強(qiáng)處理。圖像增強(qiáng)的主要作用是有效提升圖像的質(zhì)量與辨識(shí)度,使圖像的后續(xù)處理變得更加容易??沼蛟鰪?qiáng)與頻域增強(qiáng)是經(jīng)常使用的增強(qiáng)技術(shù)。直接對圖像中任意像素的灰度值進(jìn)行計(jì)算處理,這時(shí)圖像中的明暗對比度也會(huì)隨之變化,該方法稱為空域增強(qiáng)技術(shù)??沼蛟鰪?qiáng)技術(shù)經(jīng)常使用的方法包括灰度變換增強(qiáng)、直方圖增強(qiáng)與空域?yàn)V波等。頻域增強(qiáng)技術(shù)先對需要處理的圖像進(jìn)行傅里葉變換,將圖像從空間域變換為頻率域,之后在頻率域中對圖像進(jìn)行計(jì)算處理,處理結(jié)束后再通過傅里葉反變換將圖像從頻域轉(zhuǎn)換到空間域。低通濾波、高通濾波和同態(tài)濾波是頻率域增強(qiáng)技術(shù)中常用的3種方法。
(3)圖像的邊緣檢測處理。邊緣檢測的原理:根據(jù)圖像的差異性進(jìn)行檢測,從而有效檢測出所需圖像中的有效區(qū)域。常見的邊緣檢測算法比較多,檢測效果相對比較好。微分算子、Canny算子與LOG算子是常用的邊緣檢測算法。
車牌定位模塊主要利用高性能計(jì)算機(jī)上的軟件算法實(shí)現(xiàn),該部分主要利用數(shù)字圖像處理技術(shù)進(jìn)行車牌位置的定位識(shí)別。其可直接把圖像分割成目標(biāo)圖像和背景圖像,去除背景中的干擾。通常情況下,把目標(biāo)圖像設(shè)置為1,背景圖像設(shè)置為0,從而得到處理后的圖像。車牌定位識(shí)別的過程涉及形態(tài)學(xué)等學(xué)科。常用的形態(tài)學(xué)處理圖像的方法主要有膨脹處理、腐蝕處理、開運(yùn)算處理與閉運(yùn)算處理。車牌定位模塊流程如圖2所示。
圖2 車牌定位模塊流程
車牌圖像的分割分為兩部分:首先在采集的圖像中檢測獲取僅含有車牌的圖像區(qū)域;其次是對只包含車牌的數(shù)字圖像進(jìn)行處理,得到車牌中的單個(gè)字符;接下來對得到的每個(gè)字符進(jìn)行識(shí)別分析。在字符分割模塊過程中,常采用基于投影信息、邊緣信息和輪廓信息提取字符的分割方法。本文采用垂直投影法進(jìn)行圖像分割,其流程如圖3所示。
圖3 垂直投影法進(jìn)行圖像分割流程
識(shí)別算法的理論基礎(chǔ)是模式識(shí)別,主要有以下幾種方法。
2.5.1 基于特征的字符識(shí)別方法
在對車牌拍照的過程中,往往容易受采集環(huán)境的影響,如車牌圖像的潔凈度、車牌字符是否有破損及變形等都會(huì)對車牌的采集結(jié)果造成影響。通過采集得到一個(gè)原始圖像,然后進(jìn)行統(tǒng)計(jì)、分析、計(jì)算等處理。由此可以看出,統(tǒng)計(jì)識(shí)別過于依賴采集過程中的原始圖像完整性,采用這種方法得到較高的準(zhǔn)確率比較困難,因此車牌識(shí)別很少采用這種方法。
2.5.2 基于神經(jīng)網(wǎng)絡(luò)的字符識(shí)別
在模式識(shí)別過程中,利用神經(jīng)網(wǎng)絡(luò)處理一些實(shí)際分類模型問題有著不俗的表現(xiàn),它具備較強(qiáng)的自適應(yīng)性與較強(qiáng)的學(xué)習(xí)能力,對于復(fù)雜、推理不清晰的問題模型適合采用這種方法。
2.5.3 基于模板匹配的字符識(shí)別
利用模板匹配算法進(jìn)行字符識(shí)別相對比較簡單,計(jì)算量較小,運(yùn)行效率較高。本文采用這種算法進(jìn)行字符識(shí)別,步驟如下:
(1)使需要識(shí)別的測試樣本與訓(xùn)練測試樣本的大小保持一致;
(2)將需要測試對象與訓(xùn)練樣本庫中的對象進(jìn)行對比分析;
(3)獲得相似度最高的字符識(shí)別結(jié)果。
利用MATLAB 2016a運(yùn)行本文算法。采用50張不同場景、不同地區(qū)、不同型號的車牌圖片進(jìn)行驗(yàn)證,發(fā)現(xiàn)能夠正確識(shí)別的圖片有41張,識(shí)別正確率達(dá)82%,證明文中算法可以實(shí)現(xiàn)較為準(zhǔn)確的車牌識(shí)別。車牌識(shí)別過程圖片如圖4~圖9所示。
圖4 原始圖片
圖5 Radon傾斜校正
圖6 二值化處理
圖7 字符分割投影統(tǒng)計(jì)
圖8 字符分割
圖9 識(shí)別結(jié)果
從仿真實(shí)驗(yàn)結(jié)果中可以看出,文中算法的識(shí)別正確率為82%,可以較為準(zhǔn)確地識(shí)別汽車車牌,具有一定的理論學(xué)習(xí)和實(shí)際運(yùn)用參考價(jià)值。但文中的算法在準(zhǔn)確率方面會(huì)受車牌遮擋、光照強(qiáng)度、相機(jī)與車牌距離、車牌傾斜等因素的影響,在今后的學(xué)習(xí)研究中需針對這些影響因素不斷改進(jìn)算法。