何振紅
(甘肅民族師范學(xué)院計算機科學(xué)系,甘肅 合作 747000)
基于廣義高斯分布FDCT_Wrap和FSVM的虹膜識別
何振紅
(甘肅民族師范學(xué)院計算機科學(xué)系,甘肅 合作 747000)
為了提高虹膜識別的準確率,提出了一種改進曲波變換的虹膜識別算法。首先對預(yù)處理后的虹膜圖像進行Wrapping算法的快速離散曲波變換,提取不同尺度和不同方向的曲波子帶系數(shù)矩陣的均值、方差和能量,然后利用廣義高斯分布估算各子帶的權(quán)值,為分類能力較強的特征向量賦予較大權(quán)值,構(gòu)成虹膜圖像的特征向量。最后采用模糊支持向量機和二叉決策樹相結(jié)合的分類器進行匹配識別。采用UBIRIS和CASIA虹膜數(shù)據(jù)庫對算法性能進行測試。實驗結(jié)果表明,該算法能更好地提高虹膜識別準確率和效率,具有可行性。
廣義高斯分布;虹膜識別;曲波變換;模糊支持向量機;二叉決策樹
近年來,隨著小波技術(shù)的發(fā)展,采用小波變換進行虹膜特征提取取得了良好的效果[1-7]。但是小波變換具有各向同性,在表示線奇異的二維圖像時,不滿足空間各向異性的要求,從而影響虹膜識別的準確性。curvelet(曲波)變換能有效彌補小波變換的不足,以邊緣曲線為基本元素,體現(xiàn)出多方向性和各向異性,能更好地表示虹膜圖像的邊緣信息。因此利用curvelet變換提取虹膜特征比小波變換更實際有效。Rahulkar等人[5]提出了一種基于快速離散curvelet變換的虹膜特征提取算法。該算法將歸一化的虹膜圖像劃分為6個子圖像,對每個子圖像進行curvelet變換,提取curvelet系數(shù)的定向能量作為子圖像的特征向量。在UBIRIS V1和CASIA-Iris V2.0數(shù)據(jù)庫中進行實驗,分別獲得97.73%和97.81%的識別準確率,比Gabor小波算法和Haar小波算法的識別效果好。但該方法在眼瞼和睫毛遮擋較嚴重的情況下表現(xiàn)一般。
為了更好地消除采集到的虹膜圖像中不感興趣信息因素對虹膜特征提取的影響,本文提出一種基于廣義高斯分布Wrapping算法的快速離散curvelet變換虹膜識別算法。首先對預(yù)處理后的虹膜圖像進行Wrapping算法的快速離散curvelet變換,提取不同尺度和不同方向的curvelet子帶系數(shù)矩陣的均值、方差和能量,然后利用廣義高斯分布(generalized Gaussian distribution,GGD)估算各子帶的權(quán)值,為分類能力較強的特征向量賦予較大權(quán)值,構(gòu)成虹膜圖像的特征向量。最后采用模糊支持向量機(fuzzy support vector machine,F(xiàn)SVM)和二叉決策樹相結(jié)合的分類器進行分類識別。采用UBIRIS和CASIA虹膜數(shù)據(jù)庫對算法進行性能測試,實驗結(jié)果表明,該方法提取的特征向量維數(shù)較少,相比小波變換具有較高的識別率和良好的頑健性。
一個典型的虹膜識別系統(tǒng)由虹膜圖像采集、虹膜預(yù)處理、虹膜特征提取、匹配識別4個主要部分組成,其中,特征提取是虹膜識別的關(guān)鍵環(huán)節(jié),決定了識別系統(tǒng)的性能。因此,本文重點闡述虹膜識別中的特征提取和匹配識別。
虹膜圖像在采集的過程中,由于受光照、眼瞼、睫毛等因素的影響,采集到的圖像會含有不同程度的噪聲,為了準確地將虹膜紋理區(qū)域從采集到的虹膜圖像中分割,消除不利因素對虹膜特征提取及匹配識別的影響,要先進行虹膜預(yù)處理。虹膜預(yù)處理包括圖像灰度化、虹膜定位、歸一化和圖像增強。整個虹膜的預(yù)處理過程如圖1所示。
2.2.1 Wrapping算法的快速離散curvelet變換
Candès和 Donoho在脊波(ridgelet)變換基礎(chǔ)上提出了曲波變換,之后又提出快速離散曲波變換 (fast discrete curvelet transform,F(xiàn)DCT)。FDCT采用新框架結(jié)構(gòu),減少了參數(shù),實現(xiàn)起來更加快速、簡單。根據(jù)實現(xiàn)方法的不同,可分為基于Wrapping算法的快速離散曲波變換 (FDCT_Wrap)和基于非均勻空間抽樣二維FFT算法的快速離散曲波變換(FDCT_USFFT)。本文采用FDCT_Wrap方法[8],實現(xiàn)過程如下:
· 在給定笛卡爾坐標下對圖像 F[t1,t2]∈L2(R)(0≤t1,t2<ω,ω 為頻域參量)進行二維 Fourier(傅里葉)變換,得到二維頻率函數(shù) F[n1,n2],-n/2≤n1,n2<n/2(n 為矩陣行數(shù));
· 在頻域中對每一對尺度方向(j,l)組合重采樣,得到新的采樣函數(shù) F[n1,n2-n1tan θl],-π/4≤θl≤π/4;
· 計算 fj,l[n1,n2]=F[n1,n2-n1tan θl]×Uj[n1,n2],其中,Uj(n1,n2)為窗函數(shù);
·圍繞原點使用Wrapping算法做局部化處理;
·對每一個fj,l進行二維逆Fourier變換,得到離散curvelet系數(shù) cD(j,l,k),D 代表discrete。
其中,j、l、k分別為尺度參量、方向參量、位移參量。
2.2.2 特征提取
圖1 虹膜圖像預(yù)處理過程
對預(yù)處理的虹膜圖像進行Wrapping算法的快速離散curvelet變換,得到不同尺度和不同方向的curvelet子帶,圖2為curvelet變換各層系數(shù)重構(gòu)結(jié)果。虹膜圖像經(jīng)curvelet變換后,被劃分為5個尺度層。第1層為coarse尺度層,由低頻系數(shù)組成,包含虹膜圖像的基本信息,反映虹膜圖像概貌;第2、3、4層為detail尺度層,每層系數(shù)被分解為4個方向,由中、高頻系數(shù)組成,體現(xiàn)虹膜圖像的細節(jié)信息和邊緣特征;第5層為fine尺度層,由高頻系數(shù)組成,反映虹膜的斑點、收縮褶、細絲等紋理特征的分布情況及邊緣特征。分別計算每層系數(shù)矩陣的均值、方差和能量,計算式分別為式(1)~式(3)。
其中,c(k1+i,k2+j)為對應(yīng)圖像在第i層j方向子帶的系數(shù)矩陣,m×n為子帶系數(shù)矩陣的大小。
curvelet變換各層系數(shù)重構(gòu)結(jié)果如圖2所示。
圖2 curvelet變換各層系數(shù)重構(gòu)結(jié)果
對虹膜圖像進行FDCT_Wrap獲取虹膜圖像局部特征后,針對圖像不同子帶系數(shù)矩陣分類能力的不同,利用廣義高斯分布估算各子帶的權(quán)值,為分類能力較強的特征向量賦予較大權(quán)值,為分類能力較弱的特征向量賦予較小權(quán)值。通過特征加權(quán),將利用FDCT_Wrap提取的不同子帶信息的重要性反映到虹膜圖像最終特征向量中。
GGD概率分布函數(shù)為:為Γ函數(shù),ξ為尺度參數(shù),σ為形狀參數(shù)。
構(gòu)造δ函數(shù):
則:
ξ估計值為:
利用尺度參數(shù)ξ,求得特征加權(quán)數(shù)值為:
經(jīng)特征加權(quán)后的不同尺度和方向的curvelet子帶系數(shù)矩陣的均值、方差和能量分別為。,融合每層特征向量vi為用于匹配識別的特征向量由此獲得每層特征向量(k為通道數(shù)量)。
2.3.1 模糊支持向量機原理
Vapnik等人[9]提出的統(tǒng)計學(xué)習(xí)理論的支持向量機(support vector machine,SVM),通過引入結(jié)構(gòu)風(fēng)險,在尋找最優(yōu)分類超平面作為決策函數(shù)的前提下,將分類問題轉(zhuǎn)化為線性約束的凸二次規(guī)劃。針對小樣本問題,支持向量機已成為當(dāng)前模式識別領(lǐng)域中的優(yōu)選分類器,實現(xiàn)對假設(shè)函數(shù)集的控制,使學(xué)習(xí)機在經(jīng)驗風(fēng)險和過擬合之間取折中,獲得較好的推廣能力。但在虹膜圖像的分類識別過程中,如果訓(xùn)練樣本中含有噪聲點等“異?!毙畔ⅲ琒VM分類過程就容易出現(xiàn)過學(xué)習(xí)或者欠學(xué)習(xí)現(xiàn)象,因而不能獲取真正最優(yōu)分類面。針對此情況,Lin等人[10]提出了模糊支持向量機,引入模糊集理論,依據(jù)不同的訓(xùn)練樣本在分類中對SVM的貢獻不同,賦予不同的模糊隸屬度[10],來削弱噪聲點對分類的不利影響,以區(qū)分噪聲等異常信息與有效樣本。
設(shè)n個獨立同分布訓(xùn)練樣本集X={(xi,yi,)|xi∈Rn,yi=±1,∈[ε,1],i=1,…,n}和核函數(shù) K(xi,xj),根據(jù)統(tǒng)計學(xué)習(xí)理論,求解FSVM最優(yōu)分類面可歸結(jié)為如下二次規(guī)劃:
其中,C為懲罰因子且 C>0,b取類中心點的值,ξi為松弛因子且 ξi≥0。
利用Lagrange(拉格朗日)函數(shù),上述規(guī)劃的Wolfe對偶規(guī)劃為:
這樣模糊支持向量機的決策函數(shù)為:
2.3.2 FSVM與二叉決策樹相結(jié)合的分類算法
當(dāng)訓(xùn)練樣本數(shù)和類別數(shù)較多時,F(xiàn)SVM算法的時間復(fù)雜度較大,因而采用與二叉決策樹相結(jié)合的方法來降低算法時間復(fù)雜度。
設(shè)訓(xùn)練樣本集為X,總類別集為M。
步驟1 定義一個二叉決策樹Bdt={node(i)}。變量node(i)包含4個域:node(i).C存放當(dāng)前節(jié)點所包含的類別號;node(i).P+和node(i).P-分別存放當(dāng)前節(jié)點指向的正子節(jié)點和負子節(jié)點的指針;node(i).S表示訓(xùn)練的順序。令node(i).C={1,2,…,M}(M 為類別數(shù)),node(i).P+=node(i).P-=0,node(i).S=0,終節(jié)點數(shù)Endnode=0。當(dāng)前節(jié)點指針i=1,新生成節(jié)點指針j=1,訓(xùn)練次數(shù)s=1。
步驟2 在節(jié)點i上,判斷node(i).C中的元素個數(shù)是否為1。如果是,節(jié)點i是終節(jié)點,轉(zhuǎn)向步驟4;否則繼續(xù)。
步驟3 用聚類算法將node(i).C中的類別號分成兩組,同時生成兩個子結(jié)點node(j+1)和node(j-1)。令node(i).P+=j+1,node(i).P-=j-1,node(i).S=s,node(j+1).P±=node(j-1).P±=0,node(j+1).S=node(j-1).S=0。
在node(j+1).C中存放正樣本組類別號,在node(j-1).C中存放負樣本組類別號。此時訓(xùn)練樣本集X等于node(i).C所含類別的所有樣本,對應(yīng)的輸出為Y=其中,class(xi)表示樣本xi的所屬類別。用FSVM訓(xùn)練,得到Lagrange乘子和閾值{as,bs}。令 i=i+1,j=j+1,s=s+1,轉(zhuǎn)向步驟 2。
步驟4 令Endnode=Endnode+1,判斷終節(jié)點個數(shù)Endnode是否等于類別數(shù)M。如果是Bdt,保存Bdt,算法結(jié)束;否則i=i+1,轉(zhuǎn)向步驟 2。
為了對本文提出的虹膜識別算法性能進行分析評價,采用UBIRIS V1[11]和CASIA-Iris V2.0[12]虹膜數(shù)據(jù)庫進行仿真實驗。其數(shù)據(jù)庫中的部分虹膜圖像如圖3和圖4所示。
圖3 UBIRIS虹膜數(shù)據(jù)庫中的部分虹膜圖像
圖4 CASIA虹膜數(shù)據(jù)庫中的部分虹膜圖像
為了驗證本文提出的基于廣義高斯分布Wrapping算法的快速離散curvelet變換分解后,低頻均值、方差和高頻能量組成的特征向量是虹膜圖像的最優(yōu)特征表示,利用FDCT_Wrap分別對兩個數(shù)據(jù)庫中的虹膜圖像進行分解,提取出低頻分量和高頻分量,并將低頻分量、高頻分量以及它們的組合分別輸入同一分類器中進行分類識別,通過正確識別率 (correct recognition rate,CRR)和錯誤識別率(error recognition rate,ERR)進行比較,實驗結(jié)果見表1、表2。
由表1和表2可看出,特征加權(quán)能進一步提高虹膜圖像識別率。在UBIRIS虹膜數(shù)據(jù)庫中進行仿真實驗,選用廣義高斯分布FDCT_Wrap提取的低頻子帶系數(shù)矩陣的均值、方差作為特征向量,識別準確率為93.23%;選用高頻子帶能量作為特征向量,識別準確率僅為83.48%;將低頻均值、方差和高頻能量組合作為特征向量,識別準確率達到98.16%。在CASIA虹膜數(shù)據(jù)庫中進行仿真實驗,選用廣義高斯分布FDCT_Wrap提取的低頻子帶系數(shù)矩陣的均值、方差作為特征向量,識別準確率為93.86%;選用高頻子帶能量作為特征向量,識別準確率僅為84.57%;將低頻均值、方差和高頻能量組合作為特征向量,識別準確率達到98.83%。由此可見使用廣義高斯分布FDCT_Wrap分解后的低頻子帶系數(shù)矩陣的均值、方差能較好地表征虹膜紋理的基本特征,將其與高頻子帶能量組成特征向量組進行識別,提高了識別準確率,是用于虹膜識別的較佳特征組合。
表1 UBIRIS庫測試結(jié)果
表2 CASIA庫測試結(jié)果
表3 不同方法的UBIRIS庫性能比較
表4 不同方法的CASIA庫性能比較
為了驗證本文算法的效果和性能,將該算法與基于小波變換的虹膜識別算法進行對比實驗。實驗采用識別準確率較高且變化速度較快的Gabor小波和Haar小波,對虹膜圖像進行分解,提取虹膜紋理特征,分別采用漢明距離(hamming distance,HD)、SVM、二叉決策樹FSVM進行匹配識別。對錯誤接受率 (false acceptance rate,F(xiàn)AR)、 錯誤拒絕率(false rejection rate,F(xiàn)RR)和正確識別率 (correct recognition rate,CRR)3個指標進行比較,實驗結(jié)果見表3、表4。
通過對表3和表4的分析可知,對于不同的特征提取方法和不同的匹配識別方法,本文提出的改進curvelet變換的虹膜識別準確率比其他方法高,識別錯誤率相應(yīng)降低,說明采用廣義高斯分布FDCT_Wrap和二叉決策樹FSVM的虹膜特征提取與識別算法的性能更優(yōu),能有效提高虹膜識別效果,具有較好的穩(wěn)定性和較強的頑健性。
為了更好地評價算法的優(yōu)劣,采用ROC曲線表示。ROC曲線越接近坐標軸,說明匹配識別性能越好。對 UBIRIS和CASIA虹膜數(shù)據(jù)庫,分別采用Farouk[2]算法、Rajbhoj[3]算法、Rahulkar[5]算法以及本文提出算法的ROC曲線對比如圖5、圖6所示。從圖5可知,本文提出的算法在相同F(xiàn)AR下FRR更小,這表示本文提出的算法提取虹膜紋理特征性能更好,識別準確率更高。
圖5 UBIRIS虹膜數(shù)據(jù)庫不同算法的ROC曲線
圖6 CASIA虹膜數(shù)據(jù)庫不同算法的ROC曲線
本文提出的基于廣義高斯分布Wrapping算法的快速離散curvelet變換和二叉決策樹模糊支持向量機的虹膜特征提取與識別算法的識別性能有較明顯的改進。該方法適合應(yīng)用在對安全性要求較高的實時性身份認證系統(tǒng)中。利用廣義高斯分布Wrapping算法的快速離散curvelet變換提取虹膜特征向量,有效地避免了小波變換不具有空間各向異性的缺陷,結(jié)合二叉決策樹FSVM算法,獲得了較理想的識別效果。
[1]孫冬,周俊,魏勇.基于Haar小波的虹膜特征提取算法[J].科學(xué)技術(shù)與工程,2014,1(14):81-85.SUN D,ZHOU J,WEI Y.Iris feature extraction based on Haar wavelet[J].Science Technology and Engineering,2014,1(14):81-85.
[2]FAROUK R M.Iris recognition based on elastic graph matching and Gabor wavelets[J].Computer Vision and Image Understanding,2011,115(8):1239-1244.
[3]RAJBHOJ S M,MANE P B.Haar wavelet approach of iris textureextraction forpersonalrecognition[J].International Journal of Innovative Technology and Exploring Engineering,2013,3(2):22-25.
[4]KARTHIKEYAN V.Novel algorithm for iris biometrics using fast wavelet transforms[J].International Journal of Engineering Sciences and Research Technology,2014,3(3):1481-1484.
[5]RAHULKAR A D,JADHAV D V,HOLAMBE R S.Fast discrete curvelet transform based anisotropic iris coding and recognition using k-out-of-n:a fused post-classifier[J].Machine Vision and Applications,2012,23(6):1115-1127.
[6]DHAGEA S S,HEGDEA S S,MANIKANTANA K,et al.DWT-based feature extraction and radon transform based contrast enhancement for improved iris recognition[J].Procedia Computer Science,2015,1(45):256-265.
[7]ABDULLAH H N,ABDULLAH A A.Iris recognition using wavelet transform and artificial neural networks[J].Engineering&Technology Journal,2015,33(6):877-888.
[8]CANDES E J,DEMANET L,DONOHO D L,et al.Fast discrete curvelet transforms[J].Multiscale Modeling&Simulation,2006,5(3):861-899.
[9]VAPNIKV N.An overview of statistical learning theory[J].IEEE Transactions on Neural Networks,1999,10(5):988-999.
[10]LIN C F,WANG S D.Fuzzy support vector machines[J].IEEE Transactions on Neural Networks,2002,13(2):464-471.
[11]PROENCA H,ALEXANDRE LA.UBIRIS:a noisy iris image database[J].Lecture Notes in Computer Science,2005(3617):970-977.
[12]CASIA-Iris V2[EB/OL].(2007-12-20)[2015-12-14].http://www.cbsr.ia.ac.cn/Iris Database.htm.
Iris recognition based on generalized Gaussian distribution FDCT_Wrap and FSVM
HE Zhenhong
Department of Computer Science,Gansu Normal University for Nationalities,Hezuo 747000,China
In order to improve the accuracy rate of iris recognition,an improved curvelet transform algorithm for iris recognition was proposed.Firstly,the iris image was decomposed with fast discrete curvelet transform by wrapping algorithm.Mean variance and energy of curvelet sub-band coefficients in different scales and different orientations were extracted.The weights of sub-bands were estimated by generalized Gaussian distribution.The feature vectors with stronger classification ability had large weight,which were calculated to constitute feature vectors of iris image.Finally,feature vectors were matched and recognized by classifier combined with fuzzy support vector machine and binary decision tree.The algorithm performances were tested with UBIRIS and CASIA iris database.Simulation results show that the proposed algorithm has higher recognition accuracy rate and efficiency.It is feasibility.
generalized Gaussian distribution,iris recognition,curvelet transform,fuzzy support vector machine,binary decision tree
Scientific Research Project in Gansu Provincial Colleges and Universities(No.2015B-119)
TP391
A
10.11959/j.issn.1000-0801.2016200
2015-12-24;
2016-07-12
甘肅省高等學(xué)校科研項目(No.2015B-119)
何 振 紅 (1979-), 女 , 甘 肅 民 族 師 范 學(xué) 院 講師,主要研究方向為圖像處理、模式識別。