張 晨
(廈門(mén)軟件職業(yè)技術(shù)學(xué)院,福建 廈門(mén) 361000)
車(chē)牌識(shí)別系統(tǒng)作為一種重要的交通管理手段,是交通信息化管理的重要組成部分。雖然各個(gè)國(guó)家和地區(qū)的車(chē)牌設(shè)計(jì)有所不同,但車(chē)牌識(shí)別的本質(zhì)和過(guò)程基本相同,即根據(jù)車(chē)牌圖像的紋理特征、邊緣信息、字符結(jié)構(gòu)來(lái)完成車(chē)牌的定位、分割、識(shí)別,主要包括了車(chē)牌圖像采集、圖像預(yù)處理、車(chē)牌定位、字符分割、車(chē)牌識(shí)別等幾個(gè)環(huán)節(jié)。識(shí)別精度是衡量車(chē)牌識(shí)別系統(tǒng)優(yōu)劣的主要指標(biāo),如何在保證識(shí)別精度的前提下提升識(shí)別速度,是車(chē)牌識(shí)別系統(tǒng)的重要研究?jī)?nèi)容之一。但對(duì)于大多數(shù)車(chē)牌識(shí)別系統(tǒng)來(lái)說(shuō),識(shí)別的精度和識(shí)別的速度往往是相互對(duì)立的,比如在實(shí)際應(yīng)用中車(chē)輛在識(shí)別時(shí)需在圖像采集攝像頭前停留較長(zhǎng)一段時(shí)間,以便完成高質(zhì)量的車(chē)牌圖像拍攝。
車(chē)牌圖像質(zhì)量的高低直接影響到車(chē)牌識(shí)別的效率。在實(shí)際應(yīng)用中,車(chē)牌識(shí)別系統(tǒng)大多部署于環(huán)境較為復(fù)雜的戶(hù)外。周?chē)h(huán)境的干擾因素加上車(chē)牌本身可能存在的污損情況,會(huì)導(dǎo)致采集到的原始車(chē)牌圖像或多或少存在失真的問(wèn)題。因此,在車(chē)牌識(shí)別中應(yīng)用圖像處理技術(shù),將濾波去噪、灰度化、二值化技術(shù)融合到車(chē)牌識(shí)別的圖像預(yù)處理環(huán)節(jié),通過(guò)預(yù)處理來(lái)還原車(chē)牌圖像的關(guān)鍵特征并增強(qiáng)特征細(xì)節(jié),為后續(xù)的車(chē)牌定位、字符分割和歸一化、車(chē)牌識(shí)別等打下基礎(chǔ)。
高質(zhì)量的圖像采集是車(chē)牌高效識(shí)別的必要條件和基本前提,輸入系統(tǒng)的車(chē)牌圖像質(zhì)量越高,識(shí)別的精度期望就越高。車(chē)牌原始圖像的采集通過(guò)圖像采集處理單元來(lái)完成:在保持穩(wěn)定光源的前提下由CCD 高清相機(jī)設(shè)備對(duì)目標(biāo)進(jìn)行感應(yīng)和拍攝,再由圖像采集卡完成模擬圖像到數(shù)字圖像的轉(zhuǎn)換,并進(jìn)行初步的圖像去噪和特征加強(qiáng)處理。采集得到的車(chē)牌圖像應(yīng)具備輪廓和紋理清晰的特點(diǎn),且具有良好的空間分辨率、合理的銳度和較高的對(duì)比度[1]。
在車(chē)牌識(shí)別的實(shí)際檢測(cè)場(chǎng)景中,各種來(lái)自?xún)?nèi)部和外部的干擾因素都影響著車(chē)牌圖像的采集質(zhì)量,造成圖像的失真。使用圖像處理技術(shù)不僅可以有效去除圖像噪聲,提高圖像的細(xì)節(jié)和邊緣輪廓、還原圖像特征,還可以去除一些在識(shí)別檢測(cè)過(guò)程中并不關(guān)注的信息,從而降低計(jì)算機(jī)系統(tǒng)的算力消耗。針對(duì)車(chē)牌圖像的特點(diǎn),主要采用高斯濾波、灰度化、二值化來(lái)完成圖像的預(yù)處理。
1.2.1 高斯濾波
濾波操作是信號(hào)和圖像處理中最常見(jiàn)的操作之一,在圖像數(shù)據(jù)的壓縮、紋理分析、邊緣檢測(cè)、圖像增強(qiáng)等方面有重要應(yīng)用。常用的濾波算法主要有均值濾波、中值濾波和高斯濾波。其中,均值濾波通過(guò)計(jì)算圖像的像素平均值來(lái)完成濾波操作,這種方法雖然過(guò)程較為簡(jiǎn)單,但是無(wú)法很好地消除噪聲帶來(lái)的干擾;中值濾波通過(guò)計(jì)算圖像的像素中值來(lái)完成濾波操作,雖然可以很好地過(guò)濾掉椒鹽噪聲,但易導(dǎo)致圖像出現(xiàn)不連續(xù)特性;高斯濾波是一種線性平滑濾波算法,通過(guò)掃描圖像的所有像素點(diǎn)來(lái)確認(rèn)鄰域內(nèi)像素的加權(quán)平均灰度值,對(duì)圖像進(jìn)行平滑濾波的同時(shí),還能更多地保留圖像的紋理特征,適用于車(chē)牌圖像噪聲的降低操作,特別是對(duì)于服從正態(tài)分布的車(chē)牌圖像噪聲有非常好的平滑效果。高斯函數(shù)表達(dá)式為:
其中,z 表示車(chē)牌圖像的灰度值,μ 為灰度值的平均值。σstd為的圖像灰度的標(biāo)準(zhǔn)差,是高斯濾波器重要影響參數(shù)之一。若σstd取值較小,則平滑過(guò)度;若取值較大,則濾波質(zhì)量不佳,所以要根據(jù)實(shí)際場(chǎng)景中的車(chē)牌圖像來(lái)選擇普適性參數(shù)。
1.2.2 灰度化
數(shù)字圖像常呈現(xiàn)為彩色(如RGB 圖像)或黑白(如灰度圖像)的顯示效果。雖然在車(chē)牌識(shí)別中,不同國(guó)家和地區(qū)的車(chē)牌顏色不盡相同,但在實(shí)際的識(shí)別場(chǎng)景中,圖像的顏色并不是我們要關(guān)注的重點(diǎn),且系統(tǒng)處理彩色圖像的數(shù)據(jù)量和運(yùn)算量遠(yuǎn)遠(yuǎn)大于灰度圖像[2]。因此對(duì)車(chē)牌圖像進(jìn)行灰度化處理,可以過(guò)濾掉無(wú)關(guān)信息,增強(qiáng)圖像特征輪廓。目前主要有分量法、最大值法、平均值法、加權(quán)平均法等幾種灰度化方法。其中,分量法是將彩色圖像中的RGB 三分量的亮度作為圖像灰度值的方法;最大值法則將彩色圖像中的RGB 三分量亮度的最大值作為圖像的灰度值;平均值法通過(guò)求彩色圖像中的RGB 三分量亮度的平均值來(lái)得到灰度圖像;加權(quán)平均法主要基于加權(quán)計(jì)算圖像像素中R(紅)、G(綠)、B(藍(lán))三原色的色彩通道中的每個(gè)像素點(diǎn)的顏色深度,將RGB 三分量以不同的權(quán)值進(jìn)行加權(quán)平均得到合理的灰度圖像。幾種方法各有優(yōu)劣,在應(yīng)用中需要根據(jù)實(shí)際情況進(jìn)行選擇。在保證不影響處理效果和識(shí)別速度的前提下,車(chē)牌識(shí)別常采用加權(quán)平均算法將圖像進(jìn)行灰度化處理:
灰度化處理后的灰度值代表圖像色彩的明暗程度。其中,WR、WG、WB分別為R、G、B 的權(quán)值,取值一般分別為WR=0.2987、WG=0.5870、WB=0.1140。
1.2.3 二值化
二值化處理可以降低由于光照、污漬等原因?qū)?chē)牌識(shí)別的影響,使車(chē)牌圖像不易出現(xiàn)字符間斷裂、粘連的情況,二值化處理進(jìn)一步增強(qiáng)了車(chē)牌圖像特征輪廓,不僅可以讓特征細(xì)節(jié)更加容易分辨,還降低了在計(jì)算機(jī)上的處理量,為后續(xù)的邊緣檢測(cè)工作提供良好保障。二值化處理可將灰度圖像轉(zhuǎn)化為二值圖像,此過(guò)程需將圖像的像素點(diǎn)灰度值設(shè)置為0 或255,使圖像僅保留純黑和純白這兩種色彩,即呈現(xiàn)出明顯的黑白效果。目前,最大熵法、直方圖波形分析法、大津法(OTSU)是車(chē)牌識(shí)別中普遍采用的二值化方法。其中,最大熵法是基于不同角度圖像灰度直方圖的熵測(cè)量來(lái)獲得最大熵以及選擇最佳二值化閾值的方法[3];直方圖波形分析法是在灰度直方圖基礎(chǔ)上,根據(jù)圖像直方圖中波峰的數(shù)目來(lái)取得二值化閾值的方法;大津法是通過(guò)灰度取值來(lái)分類(lèi)計(jì)算像素點(diǎn)數(shù)及灰度平均值,最后取所有灰度的類(lèi)間方差中的最大值對(duì)應(yīng)的灰度為閾值。不同的場(chǎng)景適用不同的方法,本文采用大津法根據(jù)最大類(lèi)間方差進(jìn)行判斷完成二值化操作:其中,gotsu為類(lèi)間方差;ω0為前景的像素點(diǎn)數(shù)占整幅圖像的比例,其平均灰度是μ0;ω1為背景的像素點(diǎn)數(shù)占整幅圖像的比例,其平均灰度為μ1;圖像的總平均灰度為μ;分割閾值為d,通過(guò)遍歷d 從0至255 的所有值計(jì)算得出二值化操作的最佳閾值。
實(shí)驗(yàn)采用中國(guó)科學(xué)技術(shù)大學(xué)的CCPD 開(kāi)源車(chē)牌數(shù)據(jù)集,該數(shù)據(jù)集包含了近30 萬(wàn)張?jiān)诓煌瑫r(shí)間、天氣、環(huán)境、角度、距離、光照等條件下采集到的國(guó)內(nèi)車(chē)牌樣本圖像,每張圖像的尺寸為720×1160×3,數(shù)據(jù)集的樣本規(guī)模大且?guī)в性嫉臉?biāo)注信息,利于相關(guān)模型的訓(xùn)練。對(duì)于車(chē)牌圖像的預(yù)處理依次按照高斯濾波、灰度化、二值化的順序進(jìn)行,同時(shí)根據(jù)數(shù)據(jù)集的原始標(biāo)注信息規(guī)則,將圖像信息與類(lèi)別標(biāo)簽關(guān)聯(lián)對(duì)應(yīng)。
實(shí)驗(yàn)搭建的具體操作環(huán)境為Anaconda(Python 3.8)、PyCharm(Community 2021.1.2),調(diào)用OpenCV 庫(kù)封裝的函數(shù)并設(shè)置關(guān)鍵參數(shù)來(lái)進(jìn)行相關(guān)操作:利用GaussianBlur 函數(shù)完成高斯濾波,設(shè)置高斯半徑參數(shù)為2,標(biāo)準(zhǔn)差取0,此時(shí)系統(tǒng)會(huì)根據(jù)高斯矩陣的尺寸計(jì)算得出結(jié)果。圖像的高斯模糊程度隨著高斯矩陣的尺寸和標(biāo)準(zhǔn)差的增加而增大;利用cvtColor 函數(shù)完成圖像的灰度化,參數(shù)設(shè)置為gary 灰度模式,閾值為120,小于閾值時(shí)圖像更偏向于白色,大于閾值則圖像更偏向于黑色;利用threshold 函數(shù)完成圖像的二值化,設(shè)置閾值為220,大于閾值的部分將被設(shè)置為255,小于閾值的部分則將被設(shè)置為0,操作結(jié)束后僅保留圖像的黑和白的視覺(jué)效果。其余為默認(rèn)參數(shù),各參數(shù)將隨著實(shí)驗(yàn)的推進(jìn),結(jié)合相關(guān)模型訓(xùn)練的情況進(jìn)行調(diào)優(yōu)。以國(guó)內(nèi)小型新能源汽車(chē)的車(chē)牌為例,該類(lèi)車(chē)牌的外廓尺寸為480 mm×140 mm,底色以綠色為主,字符數(shù)包括中文地區(qū)簡(jiǎn)稱(chēng)、發(fā)牌機(jī)關(guān)代號(hào)、序號(hào)等在內(nèi)共計(jì)8 位字符,字符為黑色。圖像處理過(guò)程的可視化效果如圖1 所示。
圖1 車(chē)牌圖像處理及邊緣檢測(cè)可視化效果
完成圖像預(yù)處理后將進(jìn)行車(chē)牌的定位,目前主要有基于邊緣檢測(cè)技術(shù)和基于顏色特征的車(chē)牌定位方法[4],其中采用如sobel 算子這樣的基于邊緣檢測(cè)技術(shù)的方法來(lái)獲取數(shù)字圖像的一階梯度以完成邊緣的檢測(cè)和車(chē)牌的定位方法更加普遍。在完成定位后,需進(jìn)一步完成字符分割和歸一化處理,最后完成車(chē)牌的識(shí)別。為了驗(yàn)證圖像處理技術(shù)對(duì)于提升車(chē)牌識(shí)別效率的積極作用,本文將經(jīng)過(guò)圖像處理技術(shù)完成車(chē)牌預(yù)處理的樣本和未經(jīng)處理的樣本進(jìn)行對(duì)比實(shí)驗(yàn),隨機(jī)選取數(shù)據(jù)集中的樣本組合成六個(gè)測(cè)試集進(jìn)行測(cè)試,每個(gè)測(cè)試集的樣本數(shù)量為300。模式分類(lèi)由采用訓(xùn)練過(guò)的SVM 模型分類(lèi)器完成。實(shí)驗(yàn)過(guò)程所用到的樣本數(shù)據(jù)條件相同,且使用了相同的訓(xùn)練標(biāo)準(zhǔn)和模型作為對(duì)照。實(shí)驗(yàn)結(jié)果如表1 所示,其中識(shí)別耗時(shí)為每個(gè)測(cè)試集中單個(gè)車(chē)牌的平均識(shí)別時(shí)長(zhǎng)。分析實(shí)驗(yàn)結(jié)果,將圖像處理技術(shù)應(yīng)用到車(chē)牌識(shí)別中可以有效提升車(chē)牌識(shí)別的效率,未經(jīng)圖像處理的樣本雖然也能夠完成識(shí)別,但識(shí)別效果不盡人意,且往往需要消耗更多的算力資源,造成車(chē)牌識(shí)別速度較慢、識(shí)別效率不佳的結(jié)果。
表1 對(duì)比實(shí)驗(yàn)結(jié)果
圖像處理技術(shù)的應(yīng)用對(duì)于提升車(chē)牌識(shí)別的精度和速度起到了積極的作用,車(chē)牌圖像的預(yù)處理是降低各種內(nèi)外部因素干擾、增強(qiáng)車(chē)牌圖像特征輪廓的有效手段。道路交通的智能化發(fā)展使車(chē)牌識(shí)別系統(tǒng)面臨的挑戰(zhàn)越來(lái)越大,面對(duì)各種復(fù)雜的應(yīng)用環(huán)境,沒(méi)有任何一種車(chē)牌識(shí)別系統(tǒng)是能夠適應(yīng)所有識(shí)別場(chǎng)景的,也沒(méi)有哪種方法能夠在所有情況下保持適用,車(chē)牌識(shí)別的相關(guān)技術(shù)需要不斷進(jìn)行改進(jìn)提升。本文通過(guò)實(shí)驗(yàn)驗(yàn)證了圖像處理技術(shù)對(duì)車(chē)牌識(shí)別帶來(lái)的積極作用,但受限于實(shí)驗(yàn)的計(jì)算機(jī)設(shè)備硬件條件,圖像的處理速度和車(chē)牌的整體識(shí)別效率還有提升空間,后續(xù)將進(jìn)一步對(duì)車(chē)牌識(shí)別的各個(gè)步驟展開(kāi)研究,并對(duì)相關(guān)算法和模型進(jìn)行適配和優(yōu)化。
河北軟件職業(yè)技術(shù)學(xué)院學(xué)報(bào)2022年1期