姜 華,孟丹彤
(東北師范大學(xué)信息科學(xué)與技術(shù)學(xué)院,吉林 長春 130117)
虹膜具有穩(wěn)定性、不可復(fù)制性等特點(diǎn),虹膜識(shí)別中的關(guān)鍵步驟就是虹膜特征提取與識(shí)別.[1]虹膜特征提取是隨著以局部二值模式(Local Binary Patterns,LBP)算子為代表的方法開始而興起.但LBP算子的維數(shù)過高,空間需求過大,因此提出基于中心對(duì)稱局部二值模式(Center Symmetric Local Binary Patterns,CS-LBP)進(jìn)行降維[2],但還是面臨維數(shù)過大的問題.虹膜識(shí)別傳統(tǒng)的方法有Hamming距離法[3],這種算法識(shí)別速度雖然快,但在大批量虹膜識(shí)別中無法保證識(shí)別的準(zhǔn)確率.傳統(tǒng)的連接權(quán)重優(yōu)化方法容易陷入局部最優(yōu)的局面.近年來,使用神經(jīng)網(wǎng)絡(luò)進(jìn)行識(shí)別的算法開始增多,其中典型的就是BP神經(jīng)網(wǎng)絡(luò).BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜,沒有固定算法對(duì)其結(jié)構(gòu)進(jìn)行優(yōu)化,只能具體問題具體分析.
虹膜識(shí)別技術(shù)常用有一對(duì)一(判斷2個(gè)虹膜是否屬于同一種類別)、一對(duì)多(從多類別、多圖像中判別虹膜的所屬類別).本文針對(duì)一對(duì)一的使用情況,提出采用基于分塊中位排序規(guī)則的CS-LBP算法提取虹膜紋理特征,并使用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行判斷.另外,本文提出混沌系統(tǒng)-選擇變異算子-粒子群優(yōu)化算法(C-SM-PSO)使連接權(quán)重可以根據(jù)具體虹膜庫自適應(yīng)優(yōu)化,提高連接權(quán)重優(yōu)化中的全局搜索能力,使神經(jīng)網(wǎng)絡(luò)可以自己跳出局部最優(yōu),進(jìn)而提高算法識(shí)別的準(zhǔn)確率與魯棒性.
在提取虹膜特征之前,需要對(duì)眼睛圖像進(jìn)行預(yù)處理[4].先對(duì)眼睛圖像進(jìn)行質(zhì)量評(píng)價(jià),判斷其是否可以用于虹膜識(shí)別.之后定位虹膜區(qū)域,通過歸一化將環(huán)形虹膜映射到矩形區(qū)域,來增強(qiáng)圖像清晰度,突出虹膜紋理,水平移位虹膜,消除虹膜旋轉(zhuǎn)的影響.最終截取紋理最強(qiáng)區(qū)域,得到252×32維的虹膜圖像用于虹膜特征提取.虹膜識(shí)別各階段圖像如圖1所示.
圖1 虹膜識(shí)別各階段結(jié)果圖像
本文使用CS-LBP對(duì)虹膜紋理提取區(qū)域進(jìn)行處理,采用的是基本的3×3型LBP算子,因此產(chǎn)生8位二進(jìn)制數(shù).處理后的圖像為250×30維.將圖像分成為30個(gè)25×10維的子塊,因?yàn)槊總€(gè)子塊擁有250個(gè)值,將每個(gè)子塊看做一個(gè)聚類,找到每個(gè)聚類的聚類中心,將其作為子塊的代表數(shù),也就是特征值.因?yàn)長BP算法反映的是點(diǎn)與周圍點(diǎn)灰度值變化的規(guī)律,所以中位數(shù)可以反映出這一區(qū)域中的灰度值整體水平.因此對(duì)250個(gè)值進(jìn)行排序,將排序結(jié)果的中位數(shù)作為子塊特征值,最終形成30個(gè)特征數(shù),用于虹膜識(shí)別.
圖2 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
BP神經(jīng)網(wǎng)絡(luò)中的輸入層和輸出層是必不可少的,因此關(guān)于BP神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)設(shè)計(jì)的研究主要以隱層數(shù)和隱層節(jié)點(diǎn)數(shù)的設(shè)計(jì)為主.目前理論上還沒有一種確定隱層數(shù)和隱層節(jié)點(diǎn)數(shù)的方法,通常都是根據(jù)具體問題具體設(shè)計(jì).而關(guān)于隱層節(jié)點(diǎn)數(shù)的設(shè)置,在綜合考慮網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜程度、誤差大小以及本文實(shí)際使用的情況下,用節(jié)點(diǎn)刪除法[5]確定神經(jīng)網(wǎng)絡(luò)的隱層節(jié)點(diǎn)數(shù)為12.
神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)采用三層,節(jié)點(diǎn)數(shù)分別為30,12,1.各層之間均采用sigmoid函數(shù)作為激勵(lì)函數(shù)[6].神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示.
識(shí)別過程如下:
將提取出來的測試虹膜與虹膜庫中的對(duì)比虹膜的30個(gè)特征值相減,將差值Ci作為輸入層輸入神經(jīng)網(wǎng)絡(luò).計(jì)算隱層中各節(jié)點(diǎn)的輸入值公式為
(1)
其中W1-i-t代表輸入層到隱層中連接隱層的第i個(gè)節(jié)點(diǎn)的第t號(hào)連接權(quán)重,隱層的激勵(lì)函數(shù)采用sigmoid函數(shù),因此得到的隱層中各節(jié)點(diǎn)的輸出值為
R1-i=1/(1+e-G1-i).
(2)
計(jì)算輸出層中節(jié)點(diǎn)的輸入值公式為
(3)
其中W2-t代表隱層到輸出層中連接輸出層的第t號(hào)連接權(quán)重,輸出層的激勵(lì)函數(shù)采用sigmoid函數(shù),因此得到的輸出層的輸出值為
P=1/(1+e-S).
(4)
根據(jù)sigmoid函數(shù)的定義,當(dāng)2個(gè)虹膜屬于同一類別的時(shí)候,最后的P越接近于1,當(dāng)二者屬于不同類別的時(shí)候,P就遠(yuǎn)離1.最后,根據(jù)P設(shè)定相應(yīng)的閾值,進(jìn)而判斷虹膜的類別.
針對(duì)BP神經(jīng)網(wǎng)絡(luò)的連接權(quán)重,本文提出了C-SM-PSO算法進(jìn)行優(yōu)化,通過將混沌系統(tǒng)[7]、遺傳算法中的變異算子[8]、粒子群算法[9]的有效結(jié)合.實(shí)現(xiàn)連接權(quán)重的自適應(yīng)優(yōu)化,并且有助于最終的結(jié)果跳出局部最優(yōu),同時(shí)使用選擇算子[10]以達(dá)到減少計(jì)算量的目的.優(yōu)化過程流程如圖3所示.
圖3 神經(jīng)網(wǎng)絡(luò)優(yōu)化過程流程
本文中的粒子群算法采用10個(gè)粒子,每個(gè)粒子中包含BP神經(jīng)網(wǎng)絡(luò)全部的372個(gè)連接權(quán)重,相當(dāng)于設(shè)置10個(gè)神經(jīng)網(wǎng)絡(luò).先使用隨機(jī)數(shù)確定連接權(quán)重以及速度的初始值,初始值設(shè)定時(shí)加入干擾粒子的混沌系統(tǒng),以達(dá)到不改變?cè)辛W尤核惴ㄔ诔跏剂W訒r(shí)的隨機(jī)性條件下利用改進(jìn)后算法混沌性的目的.本文初始化使用的是改進(jìn)式(初始化的范圍為[-n,n]),初始化后進(jìn)行300次的迭代,初始化公式為
(5)
其中tk代表需要初始化的粒子位置(文中為各連接權(quán)重的大小)和速度.初始速度和大小采用隨機(jī)數(shù)的方式設(shè)置.訓(xùn)練時(shí),根據(jù)不同的虹膜庫進(jìn)行自適應(yīng)訓(xùn)練,每個(gè)虹膜庫訓(xùn)練出一組合適的連接權(quán)重.考慮訓(xùn)練時(shí)間復(fù)雜度等因素,本文在連接權(quán)重訓(xùn)練時(shí),采用1個(gè)訓(xùn)練虹膜與20個(gè)對(duì)比訓(xùn)練虹膜組成的訓(xùn)練集(其中5個(gè)虹膜與訓(xùn)練虹膜為同類別,其余15個(gè)虹膜為不同類別)分別用10組神經(jīng)網(wǎng)絡(luò)進(jìn)行虹膜識(shí)別.根據(jù)最后輸出層的輸出值P計(jì)算適應(yīng)度.適應(yīng)度函數(shù)公式為
(6)
其中Pi與Pt分別表示異類別與同類別的輸出層輸出值.正常情況下,同類虹膜輸出值應(yīng)該接近于1,異類虹膜輸出值應(yīng)該遠(yuǎn)離1.因此用異類虹膜與1的差值平方除以同類虹膜與1的差值平方,最后得到的適應(yīng)度F越大越好.
根據(jù)適應(yīng)度的結(jié)果,設(shè)定并更新粒子的歷史最優(yōu)位置pBest以及全局最優(yōu)位置gBest,首次迭代的時(shí)候,將10個(gè)粒子的初始連接權(quán)重設(shè)為各粒子的pBest.之后的299次迭代中,神經(jīng)網(wǎng)絡(luò)通過將F與歷史最優(yōu)的F進(jìn)行比較,如果新的F比歷史最優(yōu)的F大,那么將pBest的值更換為這個(gè)神經(jīng)網(wǎng)絡(luò)的連接權(quán)重,比較10個(gè)神經(jīng)網(wǎng)絡(luò)的F,F(xiàn)最大的神經(jīng)網(wǎng)絡(luò)的粒子中的連接權(quán)重設(shè)為gBest.之后對(duì)粒子的速度與位置進(jìn)行更新.更新公式為:
(7)
(8)
進(jìn)化完速度和位置后,使用選擇算子和變異算子進(jìn)行變異,用隨機(jī)選擇法[12]從372個(gè)連接權(quán)重中選擇100個(gè)(輸入層到隱層之間選擇95個(gè),隱層到輸出層之間選擇5個(gè))進(jìn)行變異操作,變異操作主要根據(jù)變異概率Pm判斷該粒子是否進(jìn)行變異.一旦粒子發(fā)生變異,粒子的值將更換一個(gè)區(qū)間進(jìn)行設(shè)置,這個(gè)區(qū)間與實(shí)現(xiàn)設(shè)置的初始區(qū)間不同,根據(jù)不同區(qū)間設(shè)置粒子大小,進(jìn)而使得粒子群跳出原有布局,增加跳出局部最優(yōu)的能力.變異概率Pm(Pm為實(shí)數(shù))根據(jù)不同的虹膜庫而設(shè)定,本文設(shè)置在(0.05,0.09)之間效果較好.變異操作公式為
(9)
其中T表示需要變異的粒子(位置與速度),粒子一旦變異,新的變異區(qū)間為[m1,m2],具體區(qū)間根據(jù)不同虹膜庫進(jìn)行設(shè)定.經(jīng)過300次迭代后,將最后的全局最優(yōu)值gBest中的連接權(quán)重用做最終識(shí)別.
本文使用的CPU主頻為雙核2.5 GHz,內(nèi)存為4 GB,操作系統(tǒng)為Windows 7、64位.并且識(shí)別實(shí)驗(yàn)所用的虹膜與參數(shù)訓(xùn)練所用的虹膜不同.ROC曲線與正確識(shí)別率(Correct Recognition Rate,CRR)是評(píng)價(jià)算法常用的指標(biāo),ROC曲線表示錯(cuò)誤拒絕率(False Reject Rate,F(xiàn)RR)與錯(cuò)誤接收率(False Accept Rate,F(xiàn)AR)的關(guān)系.FRR與FAR相等的值稱為等錯(cuò)率(Equal Error Rate,EER).ROC曲線越接近坐標(biāo)軸,EER越小,算法的性能越好[13].
實(shí)驗(yàn)中使用中國科學(xué)院CASIA-V1、CASIA-Iris-Twin虹膜庫中質(zhì)量評(píng)價(jià)合格的虹膜組成測試虹膜庫(測試集).將本文算法與其他幾種情況進(jìn)行對(duì)比,根據(jù)CRR、EER以及ROC曲線分布情況進(jìn)行比較:(1)僅使用PSO算法對(duì)BP神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化,測試混沌系統(tǒng)與選擇變異算子對(duì)識(shí)別的影響;(2)不使用其余優(yōu)化算法,依照BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)、人工優(yōu)化連接權(quán)重,觀察不同的自適應(yīng)優(yōu)化方式對(duì)識(shí)別的影響;(3)Li的SCCS-LBP+Hamming法(統(tǒng)計(jì)特征中心對(duì)稱局部二值模式+海明距離)[14].測試集虹膜個(gè)數(shù)以及每個(gè)算法所進(jìn)行的類內(nèi)、類外以及總匹配次數(shù)如表1所示.測試不同LBP類識(shí)別方法的各個(gè)算法的CRR與EER如表2所示.
表1 不同虹膜庫匹配次數(shù)
表2 不同虹膜庫匹配結(jié)果 %
CASIA-V1的ROC曲線如圖4所示.CASIA-Iris-Twin的ROC曲線如圖5所示.
全局圖 局部圖
全局圖 局部圖
根據(jù)表2以及圖4和5可以看出,本文算法根據(jù)虹膜庫的自適應(yīng)優(yōu)化對(duì)虹膜識(shí)別起到了積極影響.因?yàn)楸疚乃惴ú恍枰斯み^多的干預(yù),只需要更換虹膜庫的時(shí)候更改相關(guān)配置即可,優(yōu)化效果更好.另外,混沌系統(tǒng)與選擇變異算子的加入,使得粒子群可以在原有設(shè)定范圍外進(jìn)行設(shè)置,加大了參數(shù)的活動(dòng)范圍,使粒子群更容易跳出局部最優(yōu)化,有助于參數(shù)的全局搜索.另外,與文獻(xiàn)[14]的算法相比,雖然二者的CRR相差不大,但是EER卻要更低,ROC曲線也更貼近于橫、縱坐標(biāo)軸.
實(shí)驗(yàn)使用中國科學(xué)院CASIA-V2、CASIA-Iris-Lamp虹膜庫中質(zhì)量評(píng)價(jià)合格的虹膜組成測試虹膜庫(測試集).將本文算法與Gabor濾波+Hamming算法[15]、Haar小波過定點(diǎn)檢測法[16]、基于改進(jìn)的Log-Gabor小波的虹膜識(shí)別算法[17]進(jìn)行對(duì)比.這3種是虹膜識(shí)別中經(jīng)典算法及改進(jìn)算法.測試與非LBP類的虹膜識(shí)別算法相比較.測試集虹膜個(gè)數(shù)以及每個(gè)算法所進(jìn)行的類內(nèi)、類外以及總匹配次數(shù)如表3所示.各個(gè)算法的CRR與EER如表4所示.
表3 不同虹膜庫匹配次數(shù)
表4 不同虹膜庫匹配結(jié)果 %
CASIA-V2的ROC曲線如圖6所示.CASIA-Iris-Lamp的ROC曲線如圖7所示.
全局圖 局部圖
全局圖 局部圖
從表4、圖6和7可以看出,與傳統(tǒng)的虹膜識(shí)別算法及其改進(jìn)算法相比,本文算法仍然具有一定的優(yōu)勢(shì).因?yàn)镠amming距離是根據(jù)閾值進(jìn)行分類,但由于虹膜拍攝條件的復(fù)雜性,僅憑一個(gè)閾值是很難對(duì)大批量虹膜進(jìn)行判別.因此,本文算法運(yùn)用了神經(jīng)網(wǎng)絡(luò)要相對(duì)占一些優(yōu)勢(shì).而文獻(xiàn)[17]的算法針對(duì)提取特征的Log-Gabor進(jìn)行了改進(jìn),使得準(zhǔn)確率得以提升,但是還是較本文算法有一些差距.同時(shí)也可以看出,使用不同的虹膜庫以后,本文的CRR還能保持較高水平,EER也較低,說明本文算法具有良好的穩(wěn)定性與魯棒性.
本文提出基于CS-LBP與自適應(yīng)神經(jīng)網(wǎng)絡(luò)的虹膜識(shí)別算法,以CS-LBP提取虹膜特征,提出分塊中位排序規(guī)則反映虹膜圖像灰度值變化規(guī)律.并用三層BP神經(jīng)網(wǎng)絡(luò)進(jìn)行虹膜識(shí)別,神經(jīng)網(wǎng)絡(luò)的連接權(quán)重采用C-SM-PSO算法、根據(jù)不同的虹膜庫進(jìn)行自適應(yīng)優(yōu)化,根據(jù)虹膜庫自適應(yīng)優(yōu)化連接權(quán)重,提高連接權(quán)重優(yōu)化中的全局搜索能力,使神經(jīng)網(wǎng)絡(luò)可以自己跳出局部最優(yōu),提高算法通用性以及識(shí)別準(zhǔn)確率.采用CASIA-V1與CASIA-Iris-Twin虹膜庫的正確識(shí)別率達(dá)到99.97%和99.94%,等錯(cuò)率分別達(dá)到0.39%,0.62%.而且ROC曲線更貼近橫、縱坐標(biāo)軸.與傳統(tǒng)虹膜識(shí)別算法相比,本文算法也具有一定的優(yōu)勢(shì).
本文算法僅針對(duì)神經(jīng)網(wǎng)絡(luò)的連接權(quán)重進(jìn)行了優(yōu)化,針對(duì)學(xué)習(xí)策略、網(wǎng)絡(luò)結(jié)構(gòu)沒有涉及.并且針對(duì)圖像的光照與噪音干擾等問題也沒有涉及,這兩點(diǎn)將是下一步研究的重點(diǎn).