摘 要:針對PCA算法在車牌字符識別存在的計算量大,效率低等問題,提出了一種基于2DPCA算法的車牌字符識別方法。實驗結(jié)果表明該方法不僅能有效方便地降低原始特征的維數(shù),減少繁瑣復(fù)雜的計算,識別準(zhǔn)確率也有較大改進(jìn)。
關(guān)鍵詞:2DPCA算法 車牌字符識別 特征矩陣
中圖分類號:TP391.41 文獻(xiàn)標(biāo)識碼:A 文章編號:1672-3791(2013)06(c)-0003-02
車牌字符識別系統(tǒng)是模式識別在智能交通系統(tǒng)中應(yīng)用和推廣的重要研究課題之一[1]。典型的車牌識別系統(tǒng)一般由圖像獲取、車牌定位、車牌提取、車牌分割、車牌識別五個子系統(tǒng)構(gòu)成,而這其中的一個重要的系統(tǒng)就是車牌識別子系統(tǒng)。可以說,快速準(zhǔn)確的字符識別是車牌識別系統(tǒng)中最為核心和重要的部分[2]。
在基于PCA車牌識別技術(shù)研究領(lǐng)域,大量學(xué)者做了深入研究,也取得了很多成果[3]。但是在用PCA方法處理車牌等圖像識別問題時,首先是將圖像矩陣轉(zhuǎn)化為圖像向量,然后以該圖像向量作為原始特征進(jìn)行線性鑒別分析。由于圖像向量的維數(shù)一般較高,因此會給隨后的特征抽取造成困難。為了回避PCA的缺點,同時繼承其優(yōu)點,根據(jù)PCA的計算原理,本文采用了一種2DPCA方法。
1 2DPCA算法原理
設(shè)X表示m維單位化的列向量,2DPCA的思想是將m×n的圖像矩陣A通過線性變換Y=X投影到X上。于是,得到一個n維列向量Y,稱之為圖像A的投影特征向量。
設(shè)有M個m×n訓(xùn)練圖像,訓(xùn)練模式的總體散布矩陣G為:
其中:為訓(xùn)練模式總體的均值矩陣。
定義準(zhǔn)則函數(shù):為使圖像矩陣在X上投影后得到的特征向量的分散程度最大,我們最大化該準(zhǔn)則函數(shù)的單位向量,并稱之為最優(yōu)投影向量,其中圖像總體散布矩陣G的最大特征值所對應(yīng)的單位特征向量對應(yīng)于最優(yōu)投影向量。一般來說,在樣本類別較多的情況下,單一的最優(yōu)投影方向是不夠的,我們需要尋找一組滿足標(biāo)準(zhǔn)正交條件且極大化準(zhǔn)則函數(shù)的最優(yōu)投影向量。
令:P={},P稱為最優(yōu)投影矩陣,對已知的圖像樣本A,經(jīng)過:
變換,得投影特征矢量,稱為圖像樣本A的主成分。利用獲得的主成分可構(gòu)成圖像樣本A的特征矩陣或特征圖:
令第i類訓(xùn)練圖像樣本的均值向量矩陣為,的特征矩陣為,對測試圖像A,采用最近鄰分類器進(jìn)行模式分類。
2 基于2DPCA算法的車牌字符識別
2.1 訓(xùn)練
車牌字符的種類是有限集,因此可以對所有類型的字符進(jìn)行窮舉的訓(xùn)練,用于訓(xùn)練的字符集合就構(gòu)成了訓(xùn)練空間?,F(xiàn)在我們將一幅由N個像素組成的圖像看作一個圖像矩陣。通過訓(xùn)練來建立相應(yīng)的字符訓(xùn)練空間,首先把字符矢量在N維空間投影,在進(jìn)行識別時將相應(yīng)的字符投影到相應(yīng)的字符訓(xùn)練空間中,計算和已知的訓(xùn)練字符之間的距離,同時計算比較,最為接近的字符將作為識別結(jié)果輸出。
設(shè)訓(xùn)練庫中有N副車牌圖像,用矩陣表示,其中i的范圍為(1,N),車牌字符圖像的訓(xùn)練階段步驟如下:
第一步:計算所有訓(xùn)練庫中車牌字符圖像的平均值:;
第二步:將均值圖像和訓(xùn)練庫中的字符圖像作差,做標(biāo)準(zhǔn)化圖像計算即,;
第三步:計算訓(xùn)練模式的總體散布矩陣:;
第四步:計算總體散布矩陣G的特征值和特征向量,得到最優(yōu)投影矩陣P;
第五步:構(gòu)造圖像樣本的特征矩陣B。
按式子(1)~(3)計算訓(xùn)練庫中車牌圖像的特征矩陣B。
2.2 識別
在識別階段,任一測試樣本圖像經(jīng)過2DPCA算法投影處理后可獲得一個投影特征矩陣,計算該矩陣與訓(xùn)練樣本圖像的投影特征矩陣之間的距離,同時,依據(jù)最小距離可判斷該測試樣本圖像所屬的類別。
設(shè)任意兩個特征矩陣分別表示為:和,
兩矩陣之間的距離定義為:
其中:表示兩個主成分向量和的歐氏距離。假設(shè)訓(xùn)練樣本的特征矩陣表示為訓(xùn)練樣本類別集合表示為,k=1,2,…,N;其中,M為訓(xùn)練樣本總數(shù),N為訓(xùn)練樣本類別數(shù)。假定任意一個測試樣本的特征矩陣表示為B,如果,且那么判別結(jié)果為。
2.3 2DPCA算法結(jié)構(gòu)框圖
基于2DPCA算法的車牌字符識別結(jié)構(gòu)框圖如圖1所示。整個算法就是去計算待識別車牌字符圖像特征矩陣和訓(xùn)練車牌字符圖像特征矩陣的最小距離并找到最小距離索引以及檢索與樣本車牌字符圖像最相近的車牌字符字模信息輸出。
3 實驗結(jié)果與分析
實驗將實際采集到的圖片分為兩部分,即訓(xùn)練樣本和測試樣本,訓(xùn)練的車牌字符種類為80,每一類選取4幅圖片用于訓(xùn)練,每一幅樣本圖片是大小為24×48的8位灰度圖像。本實驗中,我們的訓(xùn)練樣本數(shù)據(jù)總共320張車牌字符圖像。經(jīng)上述算法實驗后可知車牌字符的正確識別率為93.30%,當(dāng)樣本數(shù)據(jù)為240時,正確識別率為91%,樣本數(shù)據(jù)為160時,正確識別率為88.75%。
從實驗結(jié)果可知,當(dāng)特征向量個數(shù)一定時,車牌字符識別的可靠性與訓(xùn)練樣本的個數(shù)相關(guān),即訓(xùn)練樣本個數(shù)越多識別的正確率越高。但是在識別一些具有相似字形的車牌字符圖像時,如字符‘D’和‘0’、‘I’和‘1’,2DPCA方法可能會忽略掉字符的某些細(xì)節(jié)特征,因此本設(shè)計在進(jìn)行車牌識別時還是會存在一定的識別誤差,尤其是當(dāng)車牌存在污損或者光線較差的情況下,識別誤差更為明顯。
4 結(jié)論
將2DPCA算法應(yīng)用于車牌識別系統(tǒng),通過實驗比較可以發(fā)現(xiàn)。
采用2DPCA算法能夠避免在圖像特征提取過程中使用的矩陣奇異值分解,減少了繁瑣的計算,2DPCA算法的正確識別率與訓(xùn)練樣本和測試樣本的選擇有關(guān),樣本數(shù)越大,識別率越高。
參考文獻(xiàn)
[1]劉勇,吳勇,周芳.對我國智能交通系統(tǒng)(ITS)發(fā)展的探討[J].交通與安全,2006,49(1):48-50.
[2]范春年.淺談我國智能交通系統(tǒng)的發(fā)展[D].南京氣象學(xué)院,2004.
[3]盧曉東,王亮,程韞琳,等.基于改進(jìn)的PCA方法的車牌字符識別[J].價值工程,2011(34):282-283.