陳科全,吳耀光,陳一銘,穆協(xié)樂,張鐵異
(廣西大學(xué) 機(jī)械工程學(xué)院,廣西 南寧 530004)
為了便于機(jī)動車的管理,車牌識別系統(tǒng)的完善變得越來越重要。車牌識別系統(tǒng)中主要包含了圖像提取、車牌定位、字符分割和字符識別四大模塊[1]。字符識別作為識別系統(tǒng)中的最后一個環(huán)節(jié),對車牌識別的成功與否起到了決定性的作用,識別方法主要包括模板匹配、特征提取識別、支持向量機(jī)(SVM),以及卷積神經(jīng)網(wǎng)絡(luò)等。模板匹配[2]識別通過模板匹配函數(shù)計算待識別字符與模板字符之間的相似度來實現(xiàn),字符模板的質(zhì)量對字符識別的準(zhǔn)確率影響較大,待識別字符如果有一定角度的傾斜會造成識別錯誤。特征提取識別[3]利用字符特征的相似度進(jìn)行字符識別,根據(jù)提取的字符特征進(jìn)行判別和匹配,字符特征的選擇決定了識別正確率。采用支持向量機(jī)[4]分類時,懲罰系數(shù)C和核參數(shù)g的選取會對字符的分類結(jié)果造成影響。陳政等采用粒子群優(yōu)化算法對SVM的參數(shù)進(jìn)行尋優(yōu),一定程度上提高了SVM的識別準(zhǔn)確率[5]。隨著深度學(xué)習(xí)的發(fā)展,CNN[6]被廣泛應(yīng)用于字符識別中,該方法通過監(jiān)督學(xué)習(xí)自動進(jìn)行圖像提取和識別,具有較強(qiáng)的魯棒性,但需要大量的樣本進(jìn)行網(wǎng)絡(luò)訓(xùn)練,而且對硬件要求高。
基于以上分析,提出一種基于灰狼優(yōu)化車牌字符識別方法,優(yōu)化SVM參數(shù),建立識別模型,提高字符識別準(zhǔn)確率。
文中主要針對車牌識別系統(tǒng)四大模塊中的最后一個模塊—字符識別展開研究,其他模塊此處不再贅述。為保證識別數(shù)據(jù)與訓(xùn)練數(shù)據(jù)集的格式相同,首先對分割后的圖像進(jìn)行歸一化處理,并設(shè)定每種字符圖片的標(biāo)簽信息,然后提取車牌字符的HOG[7]特征,建立SVM字符分類模型,利用改進(jìn)收斂因子的GWO[8]對SVM參數(shù)C和高斯核函數(shù)參數(shù)g進(jìn)行尋優(yōu),建立IGWO-SVM模型,獲取車牌字符識別結(jié)果。
灰狼優(yōu)化算法(GWO)是一種啟發(fā)式優(yōu)化算法,由Mirjalili.S[9]等人提出,該算法所需設(shè)置的參數(shù)較少,原理簡單,速度快,全局搜索能力強(qiáng)?;依欠N群等級分為四類,其中α狼為取得最優(yōu)解的搜索個體,自適應(yīng)度最優(yōu),β狼和δ狼分別為次優(yōu)解和第三優(yōu)解的搜索個體,自適應(yīng)度同理,ω狼的等級最低,為其他候選解的搜索個體。
式中:D代表狼群個體與目標(biāo)獵物之間的距離;C=2r1代表對獵物的擾動,r1為[0,1]之間的隨機(jī)數(shù);t代表迭代次數(shù);XP為目標(biāo)所在位置;X為狼群個體位置。
指導(dǎo)狼群靠近獵物,如圖1所示。尋優(yōu)過程:
Xα,Xβ,Xδ分別代表α狼,β狼和δ狼的當(dāng)前位置。
式中:X1,X2,X3分別代表α狼,β狼和δ狼對ω狼指導(dǎo)后的位置;X(t+1)為子代灰狼的最終位置。
為了防止GWO算法陷入局部最優(yōu),采用改進(jìn)收斂因子a的GWO算法[10],將原始的線性收斂因子改為非線性:
改進(jìn)后的a將從2非線性遞減到0,可降低衰減速度,更利于尋找全局最優(yōu)解。
SVM是一種非常高效的分類算法,通過降低結(jié)構(gòu)化風(fēng)險系數(shù)來提高分類模型的泛化能力,可以在樣本數(shù)量較少時獲得良好的分類效果。
式中:xi∈Rn,i=1, 2, ...,n,表示第i個特征向量,yi={+1, -1},表示特征標(biāo)簽,yi=+1時,xi為正樣本,反之,xi為負(fù)樣本,SVM通過在正負(fù)樣本之間建立一個超平面,將樣本分為兩類。通過最大化正負(fù)樣本的分類間隔,提高模型的泛化能力:
式中,w表示分離超平面的法向量,方向指向正樣本。
除了線性可分問題外,SVM也適用于非線性分類問題,需引入松弛變量ξ≥0和懲罰因子C≥0,保證容錯性:
構(gòu)造拉格朗日函數(shù),并求解對偶問題:
引入核函數(shù)K(xi,xj)將低維數(shù)據(jù)映射到高維空間,并通過核函數(shù)的內(nèi)積運(yùn)算將高維的復(fù)雜運(yùn)算轉(zhuǎn)化為低維的簡單運(yùn)算,簡化線性不可分問題。
式中,αi、αj為拉格朗日系數(shù)。
分離超平面:
式中,b表示截距。
由于高斯核函數(shù)對不同的數(shù)據(jù)類型具有良好的適應(yīng)性,且參數(shù)少,即選用高斯核函數(shù):
SVM常用于處理二分類問題[11],車牌字符分類屬于多分類問題,組合多個二分類SVM可以構(gòu)建一個多分類SVM。本文組合構(gòu)建兩個分類器,分別用于漢字字符、字母和數(shù)字字符分類??紤]到字符的標(biāo)簽多樣性,故采用字符的錯誤率作為自適應(yīng)函數(shù)。
方向梯度直方圖(Histogram of Oriented Gradient, HOG)是圖像處理中常用的圖像特征描述子。提取HOG特征時,先要對圖像進(jìn)行灰度化處理,對顏色空間進(jìn)行歸一化處理,然后將圖像劃分為多個cell單元,其中2×2個cell單元組成一個block塊,由式(16)~式(19)計算每個block中cell單元的梯度信息,最后將所有HOG特征進(jìn)行歸一化處理,得到圖像的HOG特征。
X方向梯度:
Y方向梯度:
像素點(diǎn)梯度的幅度:
像素點(diǎn)梯度方向:
式中,I(x,y)表示圖像中像素點(diǎn)(x,y)處的水平方向和豎直方向的像素值。
GWO優(yōu)化的SVM模型流程如圖2所示。初始化參數(shù)時需對狼群數(shù)量、迭代次數(shù)、尋優(yōu)參數(shù)上下界、優(yōu)化參數(shù)的個數(shù),根據(jù)設(shè)置的參數(shù)生成隨機(jī)的懲罰系數(shù)C和核函數(shù)參數(shù)g的向量,每次循環(huán)取一組數(shù)據(jù)訓(xùn)練SVM,并得到自適應(yīng)函數(shù)值。采用改進(jìn)收斂因子的GWO算法優(yōu)化SVM,以測試集分類錯誤的個數(shù)作為自適應(yīng)函數(shù),最小化錯誤率,求得自適應(yīng)函數(shù)值,根據(jù)自適應(yīng)度值更新α狼、β狼和δ狼的位置,然后在三種狼的指導(dǎo)下根據(jù)式(1)~式(7)更新其他狼群的位置,完成迭代,獲得最優(yōu)參數(shù),訓(xùn)練SVM模型。
本文選取了13 033張車牌字符進(jìn)行模型訓(xùn)練,其中漢字字符2 470張,數(shù)字和字母2 470張;3 439張車牌字符作為測試樣本,其中漢字字符2 601張,數(shù)字和字母838張;拍攝650張車牌用于驗證各算法的準(zhǔn)確率,并進(jìn)行實驗分析。漢字SVM各優(yōu)化算法對比見表1所列,字母和數(shù)字SVM各優(yōu)化算法對比見表2所列。
圖2 基于GWO優(yōu)化的SVM模型流程
PSO-SVM的粒子群數(shù)為50,最大迭代次數(shù)為20,慣性因子ω=0.8,局部學(xué)習(xí)因子c1=2,全局學(xué)習(xí)因子c2=2,參數(shù)值的上界為20,下界為0.01;GA-SVM種群數(shù)為50,最大迭代次數(shù)為20,染色體數(shù)為20,基因長度為20,交叉概率閾值pc=0.6,變異概率閾值pm=0.01;GWO-SVM與IGWOSVM的狼群數(shù)量為20,最大迭代次數(shù)為20,參數(shù)值的上界為20,下界為0.01。
表1 漢字SVM各優(yōu)化算法對比
表2 字母和數(shù)字SVM各優(yōu)化算法對比
從表1和表2的數(shù)據(jù)可以看出,在測試向量集中,四種尋優(yōu)算法對訓(xùn)練集和測試集的識別準(zhǔn)確率差別不大。文中提出的IGWO-SVM在車牌字符識別中綜合效果更好,其中漢字SVM中IGWO-SVM與未優(yōu)化的SVM相比,車牌識別準(zhǔn)確率提高了4%,與GA-SVM識別率相同,高達(dá)92.92%,在尋優(yōu)時間方面,改進(jìn)GWO算法比GA算法縮短了近37%;在字母和數(shù)字SVM中,IGWO-SVM準(zhǔn)確率比未優(yōu)化的SVM提高了0.62%,比PSO-SVM和GA-SVM高出0.57%,尋優(yōu)時間縮短了31%和32%,優(yōu)勢明顯。
針對車牌字符識別的問題,提出了應(yīng)用改進(jìn)收斂因子的灰狼優(yōu)化算法對SVM的懲罰系數(shù)C和高斯核參數(shù)g進(jìn)行尋優(yōu),建立SVM模型,并與其他方法建立的SVM模型對比。文中提出的方法與粒子群和遺傳算法優(yōu)化后的SVM分類準(zhǔn)確率相當(dāng)甚至更佳,但是在模型訓(xùn)練時間上幾乎只用后兩者的二分之一,實際應(yīng)用過程中,在保證準(zhǔn)確率的同時可以極大降低時間成本,綜合表現(xiàn)優(yōu)勢明顯。