何 聰 孫 松
(1武漢理工大學(xué)自動(dòng)化學(xué)院,湖北武漢 430070; 2黃石理工學(xué)院電氣與電子信息工程學(xué)院,湖北黃石 435003)
在日常生活中,經(jīng)常會(huì)遇到帶噪音字符的識(shí)別問(wèn)題,如汽車(chē)牌照,由于在使用過(guò)程中,要經(jīng)受自然環(huán)境的風(fēng)吹日曬,容易造成字體模糊不清,難以辨認(rèn)。如何從這些殘缺不全的字符中攫取完整的信息,是字符識(shí)別的關(guān)鍵問(wèn)題。作為字符識(shí)別的組成部分,數(shù)字識(shí)別與字母識(shí)別在郵政、交通及商業(yè)票據(jù)管理方面有著極高的應(yīng)用價(jià)值[1]。
目前有很多種方法用于字符識(shí)別,主要分為神經(jīng)網(wǎng)絡(luò)識(shí)別、概率統(tǒng)計(jì)識(shí)別和模糊識(shí)別等。傳統(tǒng)的字符識(shí)別方法在有干擾的情況下不能很好的對(duì)數(shù)字和字母進(jìn)行識(shí)別,而離散型Hopfield神經(jīng)網(wǎng)絡(luò)具有聯(lián)想記憶的功能,利用這一功能對(duì)數(shù)字和字母進(jìn)行識(shí)別,可以取得令人滿意的效果,并且計(jì)算的收斂速度很快。
Hopfield網(wǎng)絡(luò)作為一種全連接型的神經(jīng)網(wǎng)絡(luò),曾經(jīng)為人工神經(jīng)網(wǎng)絡(luò)的發(fā)展開(kāi)辟了新的研究途徑。它利用與階層型神經(jīng)網(wǎng)絡(luò)不同的結(jié)構(gòu)特征和學(xué)習(xí)方法,模擬生物神經(jīng)網(wǎng)絡(luò)的記憶機(jī)理,獲得令人滿意的結(jié)果。1982年,美國(guó)物理學(xué)家Hop field教授提出了一種可模擬人腦聯(lián)想記憶功能的新的人工神經(jīng)元模型,后來(lái)被稱作Hopfield網(wǎng)絡(luò)。和BP網(wǎng)絡(luò)一樣,Hopfield網(wǎng)絡(luò)是迄今人工神經(jīng)網(wǎng)絡(luò)模型中得到最廣泛應(yīng)用的神經(jīng)網(wǎng)絡(luò)之一,它在聯(lián)想記憶、分類及優(yōu)化計(jì)算等方面得到了成功的應(yīng)用[2]。
離散的Hopfield神經(jīng)網(wǎng)絡(luò)可用加權(quán)無(wú)向圖表示,網(wǎng)絡(luò)節(jié)點(diǎn)的狀態(tài)為:
式(1)中:Wij是附給邊(i,j)的權(quán);θi為節(jié)點(diǎn)i的閾值。
將式(1)離散化,則離散Hopfield模型為[3]:
離散Hopfield神經(jīng)網(wǎng)絡(luò)(簡(jiǎn)稱DHNN)是一種單層的、輸入輸出為二值的神經(jīng)網(wǎng)絡(luò),其網(wǎng)絡(luò)結(jié)構(gòu)如圖 1所示[4]。
圖1 DHNN的結(jié)構(gòu)
根據(jù)Hop field神經(jīng)網(wǎng)絡(luò)相關(guān)知識(shí),設(shè)計(jì)一個(gè)具有聯(lián)想記憶功能的離散型Hopfield神經(jīng)網(wǎng)絡(luò)。要求該網(wǎng)絡(luò)可以正確的識(shí)別 0~9這 10個(gè)數(shù)字和 A~Z這 26個(gè)大寫(xiě)英文字母。當(dāng)字符被一定的噪聲干擾后,仍具有較好的識(shí)別效果。
假設(shè)網(wǎng)絡(luò)用 10×10的矩陣表示。該矩陣直觀的描述阿拉伯?dāng)?shù)字和大寫(xiě)字母,即將字符劃分成 10×10的矩陣,有數(shù)字的部分用 1表示,空白部分用 -1表示。網(wǎng)絡(luò)對(duì)這些穩(wěn)態(tài)即點(diǎn)陣具有聯(lián)想記憶的功能。當(dāng)有帶噪聲的數(shù)字點(diǎn)陣輸入到該網(wǎng)絡(luò)時(shí),網(wǎng)絡(luò)的輸出便可以得到最接近的目標(biāo)向量(即穩(wěn)態(tài))。將輸出的穩(wěn)定向量依次與各個(gè)學(xué)習(xí)模式進(jìn)行比較,將與穩(wěn)定輸出向量最接近的學(xué)習(xí)模式對(duì)應(yīng)的字符作為最終的識(shí)別結(jié)果,從而達(dá)到正確識(shí)別的目的。
Hopfield網(wǎng)絡(luò)設(shè)計(jì)流程如圖2所示。
圖2 Hopfield網(wǎng)絡(luò)設(shè)計(jì)流程圖
字符識(shí)別針對(duì)的是不同的數(shù)字和字母,由于數(shù)字和字母過(guò)多,為減輕網(wǎng)絡(luò)的負(fù)擔(dān),本文只以數(shù)字 1和字母 E為例。如下列矩陣所示,有數(shù)字的部分用 1表示,空白部分用 -1表示,即可得到數(shù)字 1和字母E的點(diǎn)陣:
其他的字符點(diǎn)陣以此類推。
MATLAB神經(jīng)網(wǎng)絡(luò)工具箱為Hopfield網(wǎng)絡(luò)提供了一些工具函數(shù)。數(shù)字點(diǎn)陣和字母點(diǎn)陣,即Hopfield網(wǎng)絡(luò)的目標(biāo)向量確定以后,可以借助這些函數(shù),方便的創(chuàng)建Hop field網(wǎng)絡(luò)。
本文采用的樣本數(shù)量是 1 000個(gè),其中800個(gè)樣本用來(lái)進(jìn)行訓(xùn)練,100個(gè)樣本用來(lái)進(jìn)行驗(yàn)證,剩下的 100個(gè)樣本作為測(cè)試用。由于訓(xùn)練樣本過(guò)大,故不一一在文中介紹、測(cè)試和驗(yàn)證。
帶噪聲的字符點(diǎn)陣,即點(diǎn)陣的某些位置的值發(fā)生了變化。模擬產(chǎn)生帶噪聲的字符矩陣方法有很多種,常見(jiàn)的方法是固定噪聲產(chǎn)生法和隨機(jī)噪聲產(chǎn)生法[5]。由于固定噪聲法是用人工修改的方法改變數(shù)字點(diǎn)陣某些位置的值,如果數(shù)據(jù)量過(guò)大,這種方法是比較麻煩的。隨機(jī)噪聲法是利用產(chǎn)生隨機(jī)數(shù)的方法來(lái)確定需要修改的點(diǎn)陣位置,進(jìn)而對(duì)數(shù)字點(diǎn)陣進(jìn)行修改,這種方法相對(duì)來(lái)說(shuō)比較簡(jiǎn)便。因?yàn)楸疚牟捎玫氖谴笥?xùn)練樣本,所以選擇隨機(jī)噪聲產(chǎn)生法。
將帶噪聲的字符點(diǎn)陣輸入到創(chuàng)建好的Hopfield網(wǎng)絡(luò),網(wǎng)絡(luò)的輸出是與該字符點(diǎn)陣最為接近的目標(biāo)向量,即數(shù)字 1和字母 E,從而實(shí)現(xiàn)聯(lián)想記憶的功能。
對(duì)測(cè)試的結(jié)果進(jìn)行分析、比較、識(shí)別,通過(guò)大量的測(cè)試來(lái)驗(yàn)證Hopfield網(wǎng)絡(luò)用于數(shù)字識(shí)別的可行性與有效性。
隨機(jī)噪聲產(chǎn)生法程序運(yùn)行結(jié)果如圖 3、圖4、圖 5、圖 6所示。
圖3 噪聲強(qiáng)度為0.1時(shí)的識(shí)別結(jié)果
圖4 噪聲強(qiáng)度為0.2時(shí)的識(shí)別結(jié)果
圖5 噪聲強(qiáng)度為0.3時(shí)的識(shí)別結(jié)果
圖6 噪聲強(qiáng)度為0.4時(shí)的識(shí)別結(jié)果
可以看到,通過(guò)聯(lián)想記憶,對(duì)于帶一定噪聲的數(shù)字點(diǎn)陣,Hop field網(wǎng)絡(luò)可以正確的進(jìn)行識(shí)別。另外,通過(guò)對(duì)圖 3、圖 4、圖 5、圖 6的比較,不難發(fā)現(xiàn),隨著噪聲強(qiáng)度的增加,識(shí)別效果也在下降。在噪聲強(qiáng)度達(dá)到 0.4的時(shí)候,字符已經(jīng)很難進(jìn)行識(shí)別了。噪聲強(qiáng)度即是數(shù)字點(diǎn)陣位置值發(fā)生改變的多少。這種改變是隨機(jī)的,每次運(yùn)行都會(huì)得到不同的識(shí)別結(jié)果。
將一些優(yōu)化算法與離散Hop field神經(jīng)網(wǎng)絡(luò)相結(jié)合,可以使其聯(lián)想記憶更強(qiáng),應(yīng)用效果更為突出[6]。例如,由于一般離散Hopfield神經(jīng)網(wǎng)絡(luò)存在很多偽穩(wěn)定點(diǎn),網(wǎng)絡(luò)很難達(dá)到真正的穩(wěn)態(tài)。將遺傳算法應(yīng)用到離散Hopfield神經(jīng)網(wǎng)絡(luò)中,利用遺傳算法的全局搜索能力,對(duì)Hopfield聯(lián)想記憶穩(wěn)態(tài)進(jìn)行優(yōu)化,使待聯(lián)想的模式跳出偽穩(wěn)定點(diǎn),從而使Hopfield網(wǎng)絡(luò)在較高噪信比的情況下保持較高的聯(lián)想成功率。
另外,當(dāng)輸入的訓(xùn)練樣本不滿足相互正交的條件時(shí),可以在網(wǎng)絡(luò)訓(xùn)練時(shí),通過(guò)修改連接權(quán)值,使網(wǎng)絡(luò)達(dá)到穩(wěn)定狀態(tài)。這樣的話,當(dāng)Hopfield網(wǎng)絡(luò)訓(xùn)練樣本不是相互正交時(shí)也可以達(dá)到穩(wěn)定狀態(tài),訓(xùn)練后的網(wǎng)絡(luò)也可以很好的識(shí)別帶噪聲的字符。
[1] 飛思科技產(chǎn)品研發(fā)中心.神經(jīng)網(wǎng)絡(luò)與MATLAB 7實(shí)現(xiàn)[M].北京:電子工業(yè)出版社,2005
[2] 陳祥光,裴旭東.人工神經(jīng)網(wǎng)絡(luò)技術(shù)及應(yīng)用[M].北京:中國(guó)電力出版社,2003
[3] MICHEL A N.Analysis and synthesis techniques for Hopfield type synchronous discrete time neural networkswith application to AM[J].IEEE Trans CAS,1990,37:1356-1366
[4] 宋濤,唐德善,曲煒.基于離散型Hopfield神經(jīng)網(wǎng)絡(luò)的項(xiàng)目風(fēng)險(xiǎn)分析模型[J].統(tǒng)計(jì)與決策, 2005(6):24-26
[5] 張良均,曹晶,蔣世忠.神經(jīng)網(wǎng)絡(luò)實(shí)用教程[M].北京:機(jī)械工業(yè)出版社,2008
[6] 朱大奇,史慧.人工神經(jīng)網(wǎng)絡(luò)原理及應(yīng)用[M].北京:科學(xué)出版社,2006