李承昊,蔡晨陽(yáng),李 銳
沈陽(yáng)理工大學(xué),遼寧沈陽(yáng) 110159
基于神經(jīng)網(wǎng)絡(luò)的圖像識(shí)別系統(tǒng)的研究
李承昊,蔡晨陽(yáng),李 銳
沈陽(yáng)理工大學(xué),遼寧沈陽(yáng) 110159
在社會(huì)生活發(fā)展的過(guò)程中,圖像識(shí)別技術(shù)有著十分重要的作用,隨著計(jì)算機(jī)技術(shù)、圖像處理技術(shù)、模式識(shí)別理論的發(fā)展與進(jìn)步,產(chǎn)生了一種新型的圖像識(shí)別技術(shù)——神經(jīng)網(wǎng)絡(luò)圖像識(shí)別技術(shù),通過(guò)此種技術(shù)的應(yīng)用,提升了圖像識(shí)別的準(zhǔn)確性及有效性。在本文中,以神經(jīng)網(wǎng)絡(luò)為基礎(chǔ),研究和設(shè)計(jì)了圖像識(shí)別系統(tǒng)。
神經(jīng)網(wǎng)絡(luò);圖像識(shí)別;系統(tǒng)設(shè)計(jì)
隨著信息技術(shù)的發(fā)展,人們已經(jīng)進(jìn)入信息時(shí)代,作為人類(lèi)感知世界的視覺(jué)基礎(chǔ),圖像中蘊(yùn)含了大量的信息。當(dāng)前,神經(jīng)網(wǎng)絡(luò)已經(jīng)發(fā)展的比較成熟,并在圖像識(shí)別領(lǐng)域中有著比較廣泛的應(yīng)用,在神經(jīng)網(wǎng)絡(luò)的作用下,運(yùn)算量大大的減少,運(yùn)算精度顯著的提升,同時(shí),高容錯(cuò)性的功能允許圖像中某個(gè)局部存在殘缺或背景模糊,有效的提升了圖像識(shí)別的準(zhǔn)確性。
在進(jìn)行本圖像識(shí)別系統(tǒng)設(shè)計(jì)時(shí),以圖像中的數(shù)字為基礎(chǔ),通過(guò)對(duì)圖像一系列的處理之后,將圖像中包含的數(shù)字清晰的顯示出來(lái)。作為一個(gè)圖像識(shí)別系統(tǒng),既可以單獨(dú)使用,同時(shí)還可以在其他的識(shí)別系統(tǒng)中作為核心的軟件應(yīng)用,具有比較高的靈活性及通用性。具體的系統(tǒng)運(yùn)作流程如下:系統(tǒng)啟動(dòng)完成后,將需要識(shí)別的圖像輸入到系統(tǒng)中,接著利用圖像預(yù)處理系統(tǒng)對(duì)圖像進(jìn)行相應(yīng)的處理,之后進(jìn)行字符分割、特征提取,最后進(jìn)行字符識(shí)別,完成之后圖像識(shí)別結(jié)束。
總的來(lái)看,首先進(jìn)行圖像預(yù)處理,再進(jìn)行神經(jīng)網(wǎng)絡(luò)文字識(shí)別是圖像識(shí)別系統(tǒng)的流程,因此,圖像預(yù)處理、特征提取、神經(jīng)網(wǎng)絡(luò)識(shí)別是圖像識(shí)別系統(tǒng)重要的三個(gè)模塊,各個(gè)模塊的具體功能如下:在圖像預(yù)處理模塊中,主要是對(duì)上傳到系統(tǒng)中的圖像進(jìn)行預(yù)處理,并對(duì)圖像中包含的字符進(jìn)行分割;在特征提取模塊中,包含的提取方法比較多,主要功能是對(duì)圖像字符的網(wǎng)格特征、水平和垂直特征、像素百分比特征進(jìn)行提??;在神經(jīng)網(wǎng)絡(luò)識(shí)別模塊中,識(shí)別字符的方法為優(yōu)化之后的BP算法,主要功能包含網(wǎng)絡(luò)訓(xùn)練、數(shù)據(jù)讀取、字符判定、結(jié)果輸出。
2.1 圖像預(yù)處理模塊
第一,讀取圖像數(shù)據(jù)。圖像數(shù)據(jù)是圖像分析和處理的基礎(chǔ),因此,預(yù)處理工作的第一步就是讀取圖像的數(shù)據(jù),包含寬、高以及各個(gè)像素點(diǎn)的顏色值[1]。圖片在進(jìn)行存儲(chǔ)時(shí),格式比較多,比如JPG、GIF等,為了使運(yùn)算的數(shù)據(jù)量減少,本系統(tǒng)在存儲(chǔ)圖片時(shí),選擇256色BMP格式。利用微軟圖像函數(shù)庫(kù)的dibapi.h及dibapi. cpp進(jìn)行圖像數(shù)據(jù)讀取工作。
第二,預(yù)處理圖像。首先進(jìn)行灰度化,2256色位圖調(diào)色板的內(nèi)容非常復(fù)雜,在進(jìn)行圖像處理時(shí),大部分的算法都無(wú)法應(yīng)用,因此要對(duì)圖像進(jìn)行灰度處理,彩色圖像中,像素點(diǎn)中的R、G、B值各不相同,通過(guò)賦予這三點(diǎn)各自一個(gè)加權(quán)系數(shù),使各點(diǎn)分量的值相同,從而實(shí)現(xiàn)灰度化[2]。其次對(duì)灰度圖像進(jìn)行二值化,灰度圖像像素的灰度值位于0~255之間,灰度值越大時(shí),圖像越亮,為了提升圖像處理的便利性,進(jìn)行二值化處理,依據(jù)自適應(yīng)閾值法,將灰度圖像的像素分化為黑或白兩種顏色。
第三,圖像分割。首先,調(diào)整圖像的整體傾斜度,按照由下至上的順序,掃描圖像,記錄下第一個(gè)遇到的黑色的像素點(diǎn),隨后,改變掃描的方向,變?yōu)橛缮隙拢瑯訉⒌谝粋€(gè)遇到的黑色像素點(diǎn)記錄下來(lái),這兩個(gè)點(diǎn)之間的距離就是圖像大致的高度范圍。其次,進(jìn)行圖像分析,從左至右對(duì)圖像進(jìn)行掃描,發(fā)現(xiàn)第一個(gè)黑色像素點(diǎn)之后,將此點(diǎn)作為圖像分割的起始部位,接著進(jìn)行掃描,無(wú)黑色像素點(diǎn)時(shí)停止,同時(shí),圖像分割結(jié)束。
第四,圖像的歸一化處理。掃描完成之后,圖像中的字符可顯示出來(lái),但各個(gè)字符的大小不一,影響識(shí)別的標(biāo)準(zhǔn)性及準(zhǔn)確率,因此,要對(duì)字符的尺寸進(jìn)行調(diào)整,使其尺寸相同。對(duì)比系統(tǒng)要求高度與字符高度,將需變換的系數(shù)計(jì)算出來(lái),依據(jù)此系數(shù)進(jìn)行相應(yīng)的高度變換,寬度也按照此方法進(jìn)行變化[3]。按照插值的方法,將新圖像里的點(diǎn)映射到原圖像中,完成尺寸統(tǒng)一。
第五,圖像的緊縮重排。尺寸相同之后,字符在圖像中的位置不定,影響特征提取的精確性,通過(guò)緊縮重排,形成新的圖像字符。
2.2 特征提取模塊
經(jīng)過(guò)圖像預(yù)處理模塊的處理之后,圖像中的字符變成大小相同、排列整齊,接著,對(duì)能夠代表字符特點(diǎn)的特征向量進(jìn)行提取。將圖像字符帶入BP網(wǎng)絡(luò)中,開(kāi)展網(wǎng)絡(luò)訓(xùn)練工作,從而將樣本中的待識(shí)別的特征向量提取出來(lái),隨后,進(jìn)行字符識(shí)別工作。
2.3 BP神經(jīng)網(wǎng)絡(luò)的圖像識(shí)別模塊
模式識(shí)別是BP神經(jīng)網(wǎng)絡(luò)的重要用途,在進(jìn)行此模塊的設(shè)計(jì)時(shí),重點(diǎn)在于訓(xùn)練出一個(gè)可行、高效的BP網(wǎng)絡(luò),以便于精準(zhǔn)的識(shí)別0~9這十個(gè)數(shù)字。圖像預(yù)處理及特征提取完成之后,就需要利用該模塊進(jìn)行訓(xùn)練和識(shí)別。
利用數(shù)碼相機(jī)拍攝多個(gè)車(chē)牌,并以BMP的格式存儲(chǔ)圖像,隨后,將圖像輸入到本文設(shè)計(jì)的圖像識(shí)別系統(tǒng)中,通過(guò)圖像預(yù)處理之后,形成灰度圖像,并對(duì)車(chē)牌中的數(shù)字進(jìn)行規(guī)范,隨后,利用特征提取模塊對(duì)其特征向量進(jìn)行提取,最后,利用BP神經(jīng)網(wǎng)絡(luò)的圖像識(shí)別對(duì)車(chē)牌中的數(shù)字進(jìn)行識(shí)別。識(shí)別結(jié)果顯示,本圖像識(shí)別系統(tǒng)可準(zhǔn)確的識(shí)別出車(chē)牌中的數(shù)字。
在基于神經(jīng)網(wǎng)絡(luò)的圖像識(shí)別系統(tǒng)設(shè)計(jì)中,圖像預(yù)處理、特征提取、BP神經(jīng)網(wǎng)絡(luò)的圖像識(shí)別是系統(tǒng)中重要的三個(gè)模塊,通過(guò)三個(gè)模塊協(xié)同作用的發(fā)揮,有效而又準(zhǔn)確的進(jìn)行圖像識(shí)別。但本文中設(shè)計(jì)的圖像識(shí)別系統(tǒng)還不完善,選擇的樣品數(shù)量有限,而這也成為日后研究工作的主要方向。
[1]張坤艷,鐘宜亞,苗松池,等.一種基于全局閾值二值化方法的BP神經(jīng)網(wǎng)絡(luò)車(chē)牌字符識(shí)別系統(tǒng)[J].計(jì)算機(jī)工程與科學(xué),2010(02):88-90+134.
[2]楊永,駱霞軍,王莉利.基于神經(jīng)網(wǎng)絡(luò)的汽車(chē)車(chē)型圖像自動(dòng)識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].微計(jì)算機(jī)應(yīng)用,2010(02):56-60.
[3]金健,林宗桂,金龍.一種基于特征的人工神經(jīng)網(wǎng)絡(luò)數(shù)字識(shí)別系統(tǒng)模型[J].南京氣象學(xué)院學(xué)報(bào),2014(06):828-835.
[4]王振,高茂庭.基于卷積神經(jīng)網(wǎng)絡(luò)的圖像識(shí)別算法設(shè)計(jì)與實(shí)現(xiàn)[J].現(xiàn)代計(jì)算機(jī)(專(zhuān)業(yè)版),2015(20):61-66.
TP3
A
1674-6708(2015)150-0070-01
李承昊,本科,電子信息工程專(zhuān)業(yè)在進(jìn)行BP網(wǎng)絡(luò)設(shè)計(jì)時(shí),關(guān)鍵在于確定BP網(wǎng)絡(luò)3層的神經(jīng)元數(shù)目[4]。在此模塊中,第一步的工作就是利用已知訓(xùn)練樣本對(duì)BP網(wǎng)絡(luò)進(jìn)行訓(xùn)練,圖像預(yù)處理之后,特征的維數(shù)就是輸入層的節(jié)點(diǎn)個(gè)數(shù);而在隱層,節(jié)點(diǎn)個(gè)數(shù)并沒(méi)有硬性的規(guī)定,通常,此層所包含的神經(jīng)元數(shù)目越多,BP網(wǎng)絡(luò)的精神程度越高,促使訓(xùn)練時(shí)間延長(zhǎng),不過(guò),神經(jīng)元的數(shù)目不宜過(guò)多,避免出現(xiàn)負(fù)面影響。標(biāo)準(zhǔn)輸出設(shè)定的方式?jīng)Q定了輸入層的節(jié)點(diǎn)數(shù),也就是說(shuō),通過(guò)目標(biāo)期望的編碼方式來(lái)確定輸入層的節(jié)點(diǎn)數(shù)量。神經(jīng)元數(shù)目確定完成之后,需要進(jìn)行字符識(shí)別,通過(guò)BP網(wǎng)絡(luò)訓(xùn)練之后,將權(quán)值保存的形式定為文件形式,訓(xùn)練完成之后,開(kāi)始字符識(shí)別工作,將隱層節(jié)點(diǎn)個(gè)數(shù)、最小均方誤差、相關(guān)系數(shù)以及訓(xùn)練步長(zhǎng)的參數(shù)輸入進(jìn)去,訓(xùn)練之后得到字符識(shí)別結(jié)果。