(洛陽師范學(xué)院 河南·洛陽 471000)
字符識別廣泛應(yīng)用于生活的各個方面尤其是在車牌識別和醫(yī)療圖像識別等切實關(guān)系到人類日常生活質(zhì)量的場景中,提高字符的識別率也顯得尤為重要,而字符特征提取作為識別中的重要一步,直接關(guān)系到識別率,因此字符特征提取的研究也極具意義。
字符特征提取是指從經(jīng)過尺寸歸一化處理后的二值圖像中提取出字符的關(guān)鍵特征,同時要滿足特征向量的維數(shù)盡可能少,正確分類的精度盡可能高,系統(tǒng)有較高的穩(wěn)定性和魯棒性的要求。針對在實際生活中常用的數(shù)字和英文字母字符,本文提出一種將輪廓特征提取法和投影特征提取法相結(jié)合的方法,設(shè)置一個特征向量=[行輪廓特征,列輪廓特征,行投影特征,列投影特征]作為字符特征以便更好的進行字符識別。
在日常的得到的數(shù)字和英文字母字符圖像常常存在大小不一致的問題,因此要將得到的字符二值圖像進行尺寸歸一化處理,本算法中采用的是雙三次插值算法并將二值圖像統(tǒng)一尺寸為10*18,其中圖像的寬為18個像素點,長為10個像素點,在MATLAB中使用語句imresize(img,[10,18],'bicubic')編碼實現(xiàn)。
本文采用的是輪廓特征提取法和投影特征法相結(jié)合的方法,將這個方法提取到的特征用一個特征向量表示,將特征向量用于BP神經(jīng)網(wǎng)絡(luò)的自學(xué)習(xí),進而得到訓(xùn)練好的BP神經(jīng)網(wǎng)絡(luò)。
輪廓特征提取法為分別選取二值圖像中每行或每列的第一個白點(二值圖像中值為1的像素點)到該行或該列中最后一個白點的距離作為特征向量值,若某一行或某一列中沒有白點則設(shè)為0,若只有一個白點則為1。設(shè)置特征向量矩陣Fr=[]、Fc=[]分別用來表示行輪廓特征和列輪廓特征。
字符的投影特征在字符圖像處理中廣泛應(yīng)用,其通過統(tǒng)計字符圖像在行上或列上的每個像素點的像素值即白點(二值圖像中值為1的像素點)或者黑點(二值圖像中值為0像素點)的總數(shù)來分析字符特征。在本文中分別統(tǒng)計字符圖像在每行以及每列的白點的數(shù)目作為投影特征,設(shè)置行投影特征向量Pr=[],列投影特征向量Pc=[]。
通過輪廓特征提取法和投影特征提取法分別得到了行輪廓特征Fr、列輪廓特征Fc、行投影特征Pr和列投影特征Pc,進而可設(shè)置總的特征向量Feature=[Fr,Fc,Pr,Pc]。
本文分別提取輪廓特征和投影特征組合成字符的特征向量,用于字符識別,既能避免因單一特征造成識別的局限性,又增加了多個特征點進而提高識別率。