馮瑩瑩,余世干,劉輝
阜陽師范學院信息工程學院,安徽阜陽 236041
◎圖形圖像處理◎
改進典型相關分析的虹膜鑒別算法
馮瑩瑩,余世干,劉輝
阜陽師范學院信息工程學院,安徽阜陽 236041
針對典型相關分析(CCA)無法準確刻畫虹膜圖像的局部遮擋變化缺陷,提出一種改進典型相關分析相融合(ICCA)的虹膜識別方法。以全局和局部特征間的相關性特征作為有效的判別信息,通過劃分子模,并以簡單投票進行結果矯正,提高方法的穩(wěn)定性,以CASIA數(shù)據(jù)集驗證ICCA的有效性。結果表明,ICCA的識別率明顯優(yōu)于參比方法。
典型相關分析;特征融合;虹膜識別;子模型;小樣本問題
虹膜識別是一種模式識別問題,主要包括特征提取和分類設計兩個關鍵步驟,能否提取到有效的特征對虹膜識別的結果具有決定性的影響,因此對于虹膜識別而言,抽取有效的虹膜特征成為計算機視覺領域的一個重要研究課題[1]。
虹膜特征提取包括單模(unimodal)和多模(multimodal recognition)兩類方法[2]。單模虹膜特征提取方法主要有分量分析(Principal Component Analysis,PCA)、線性判別分析(Linear Discriminant Analysis,LDA)、獨立分量分析(Independent Componen Analysis,ICA)及其改進等多種方法[3-5],單模特征提取方法僅能獲得一組目標的一組特征值,僅考慮全局特征,因此存在模型單一、信息利用率低等缺陷,導致虹膜識別率低。多??梢詮囊唤M樣本中提取多組特征,成為當前虹膜特征主要提取方法,典型相關分析(Canonical Correlation Analysis,CCA)作為一種經(jīng)典的多模特征提取方法,通過研究兩組變量之間的相關關系來進行特征提取,在模式識別領域應用廣泛[6-7]。但在虹膜識別問題為代表的高維、小樣本問題的應用過程,CCA存在如下不足:(1)虹膜識別的小樣本特性使CCA兩組特征矢量構成的總體協(xié)方差矩陣奇異,難以直接應用;(2)作為一種全局線性投影(或特征提?。┓椒ǎ蛔阋院芎玫孛枋龇蔷€性的虹膜識別問題;(3)僅考慮了全局特征,缺乏對局部變化的識別魯棒性,在處理虹膜圖像遮擋、光線變化明暗變化時,易丟失了局部圖像變化信息,識別效果不理想。近年來,隨著模式識別中子模式方法興起,為解決CCA在虹膜識別過程面臨的難題提供了新的思想與方法。
為了提高虹膜識別率,綜合子模式和CCA算法優(yōu)點,提出一種改進典型相關分析的虹膜識別方法(Imporved Canonical Correlation Analysis,ICCA)。ICCA將局部與全局特征矢量之間的相關性特征作為有效的判別信息,既達到了融合局部與全局信息的目的,又消除了特征之間的信息冗余;通過子模式的劃分,ICCA避免了小樣本問題,更好地描述了非線性的虹膜識別問題;并通過投票方式融合結果,增強了對局部變化的魯棒性,最后通過采用CASIA Ver1.0和Ver2.0虹膜數(shù)據(jù)集驗證其有效性。
1.1 基于ICCA的虹膜系統(tǒng)工作流程
ICCA的虹膜識別過程為:首先對虹膜圖像進行定位,眼瞼、睫毛檢測和歸一化的預處理,然后將初始模式以矩陣分割法分解成為N個小的子集,提取其子集的圖像局部特征;采用PCA提取整幅圖像全局特征,并采用CCA對局部特征和全局特征進行融合,最后以N個子模型的識別結果進行投票決策,確定測試樣本的最終歸屬。
ICCA通過CCA對全局和局部特征進行融合,不僅考慮了樣本的全局信息,而且考慮了局部變化信息,并消除了多個特征之間的冗余信息;另外將樣本劃分為N個子集,以所有的子集識別結果對樣本的最終歸屬進行校正,有效降低了每個子集對樣本的全局性影響,使得睫毛、眼瞼遮擋、光線明暗等局部變化被控制在個別子集中,每一個樣本子集在最終判別中僅占1/N的權重,可較大幅度提高虹膜識別算法的穩(wěn)定性。基于ICCA的虹膜識別系統(tǒng)工作流見見圖1。
圖1 基于ICCA的虹膜識別系統(tǒng)工作流程圖
1.2 虹膜圖像預處理
1.2.1 虹膜定位
虹膜與瞳孔像素區(qū)別較大,在確定瞳孔中心后,確定其垂直和水平方向的4個方位點,然后以最小二乘法擬合圓,實現(xiàn)瞳孔內邊緣的粗定位,最后以非二次初始化的變分水平集方法進行瞳孔內邊緣的精細定位[8]。虹膜與鞏膜的邊界(虹膜外邊界)并不如內邊界一樣明顯,其定位方法也不一樣。首先以多尺度形態(tài)邊緣檢測確定虹膜的候選外邊界,然后以Hough變換快速確定虹膜外邊緣[9]。
1.2.2 眼瞼、睫毛檢測
對虹膜邊緣進行定位,并截取包含上下眼瞼的虹膜圖像,以水平Sobel算子對眼瞼邊緣進行粗定位,最后以最小二乘法對粗定位邊緣進行拋物線逼近,確定眼瞼最終邊緣[10]。根據(jù)虹膜內邊緣粗定位的結果,獲得含有睫毛的局部圖像,以規(guī)定的閾值對該局部圖像二值化,然后取反得到睫毛區(qū)域。
1.2.3 虹膜圖像歸一化
為便于虹膜圖像對比,本研究將定位后的圓環(huán)狀虹膜圖像以極坐標轉換全部歸一化為64×512的矩形。極坐標轉換如下:
1.3 局部特征的提取
假設以M個人的N張像素為W1×W2的虹膜圖形組成訓練集Train=(x1,x2,…,xN)W1W2。以矩陣分割法將全部圖形不重疊的分割為L張大小相等的子圖形(此時每個子圖形特征維數(shù)k=(W1×W2)/L),為保證以該特征矢量構成的總體協(xié)方差矩陣是非奇異矩陣,k要滿足k≤N-M。圖形被分割后開始構建局部特征子集,用處于原圖形中相同位置各子圖像組成一個獨立的特征子集,共得到L個獨立的特征子集Train1,Train2,…,TrainL,其構建過程見圖2。
圖2 虹膜識別特征子集構建示意圖
在上述圖形分割中,在滿足k≤N-M的約束條件外,k值大小對算法的識別率存在較大影響,k值過小,子集劃分就會多,使得算法過分地注重局部變化,圖形信息被過度零碎化,最終導致算法識別率降低;而k值過大,子集劃分少,使得算法趨向于整體識別方法,忽略了局部變化,算法識別率同樣不佳。針對k值大小的選擇,本研究以訓練集識別率出現(xiàn)拐點為標準,以確定k值的大小。
1.4 全局特征的提取
虹膜識別領域,傳統(tǒng)特征提取方法主要有PCA、圖像轉換、結構紋理等,它們各有特色,在各自的領域中都有廣泛的應用。由于PCA計算復雜度較低,因此選擇PCA進行虹膜全局特征得取,作為CCA融合特征的第二組特征矢量。具體如下:
對于訓練集Train,先以PCA對其進行特征提取,得到投影矩陣WPCA,隨后對Train中所有的樣本基于WPCA進行投影,即可新產生一組低維特征Trainx= (x1,x2,…,xN)k2×N。同樣,為保證該特征矢量構成的總體協(xié)方差矩陣也是非奇異性的,在全局特征提取過程中,其特征維數(shù)k2也應該滿足k2≤N-M的約束條件。
1.5 CCA融合特征
在提取局部特征得到L個Traini特征子集與全局特征Trainx后,每個局部特征子集都可以與全局特征組成一個訓練集對(Traini,Trainx),即可以CCA進行特征融合,具體融合過程如下:
式(3)即為廣義特征問題,式中∧i為該問題前r個最大的非負特征形成的一個對角矩陣,的列向量即為這些特征值對應的特征向量。將所有局部特征子集Traini(i=1,2,…,L)分別與全局特征Trainx構建上述CCA投影矩陣,即得到L個投影矩陣對(i=1,2,…,L),然后以該投影矩陣分別對其對應的特征子集提取特征。
經(jīng)CCA融合特征后可得兩組特征向量,第一組特征向量為各個局部的特征,第二組特征為是全局特征,經(jīng)過CCA投影后,第一組特征的L個向量中的每一個向量變?yōu)橐阅硥K的局部特征為主,融合了整體特征;第二組特征的L個向量中的每一個向量變?yōu)橐匀痔卣鳛橹?,融合了某塊的局部特征。由于在下面的分類過程中,還需要通過投票方式組合L個子塊的結果,如果使用第二組特征則會過于偏重全局特征,從而喪失了部分子模式方法對局部變化的魯棒性,因此本研究僅取第一組特征的投影向量作為判別向量。
1.6 虹膜圖像分類與識別
采用上述相同方式將待識別虹膜圖像劃分為L個子集,然后重構得到L個待測的特征子向量(t1,t1,…,tL)。兩個特征子向量yi,ti之間的相似性定義如下:
首先計算待測樣本第i個子樣本與其對應位置的子模式Traini中各特征子向量之間的相似度,并選擇相似性度最大者的類別作為ti類別,并記為Ci,即未知虹膜第i個子樣本的分類結果,這樣L個獨立的子模式可以得到L個獨立的判別結果。最后以簡單投票對該待測樣本的最終歸屬進行矯正。
待測樣本被識別為第k類的概率可以定義為:
最后對待識別虹膜圖像的識別結果為:
2.1 數(shù)據(jù)來源
為驗證ICCA對于虹膜識別的有效性,采用CASIA Ver1.0和CASIA Ver2兩個標準虹膜數(shù)據(jù)集進行仿真測試。CASIA Ver1.0虹膜圖像庫為8位灰度的280×320虹膜圖像,采集了108只眼睛虹膜圖像,每只眼睛拍攝7幅,共756幅圖像,其采用接觸式設備拍攝,受光照、睫毛遮擋情況較少,每只眼睛隨機選擇幅圖像作為獨立測試樣本,共產生216個測試樣本;CASIA Ver2.0虹膜圖像庫為8位灰度的480×640虹膜圖像,采集了60只眼睛虹膜圖像,每只眼睛拍攝20幅,共1 200幅圖像,其采用非接觸式設備拍攝,受光照不均、睫毛遮擋等影響較大,每只眼睛隨機抽取5幅,共300幅作為獨立測試樣本。兩個數(shù)據(jù)集子集的劃分都以訓練集識別率初次最大為標準,Ver1.0數(shù)據(jù)集了選擇3×6分塊方式,Ver2.0數(shù)據(jù)集上選擇5×10分塊方式。
2.2 結果與分析
為使ICCA的虹膜識別結果具有可比性,構建了3個特征提取算法,分別為:PCA算法(該算法僅以PCA方法直接提取圖像全局特征作為判別特征,不考慮局部特征);ICCA-G算法(該算法以全部特征為主,且融合一部分局部特征向量作為判別特征);ALL算法(該算法直接將全局特征和局部特征進行混合在一起作為判別特征)。在給定子集大小情況下,各算法識別率見表1。
表1 各算法識別率
對表1的實驗結果進行對比分析可知,相對于參比算法,在兩個數(shù)據(jù)集上,ICCA均取得了較高的識別率,且可以得到如下結論:
(1)僅以PCA提取的全局特征作為虹膜識別信息時,因CASIA Ver1.0數(shù)據(jù)采用接觸式設備拍攝虹膜圖像,受光照不均、睫毛遮擋等局部變化影響較少,其識別率達到了92%;而CASIA Ver2.0數(shù)據(jù)庫圖像采用非接觸式設備拍攝,受局部變化影響較大,當僅以全局特征建模時,不能反映局部變化而導致識別率較低。
(2)ICCA-G算法同樣以全局特征構建識別算法,但通過CCA融合了部分局部變化信息,對CASIA Ver1.0數(shù)據(jù)而言,使其較PCA算法識別率有了一定的提高;而CASIA Ver2.0數(shù)據(jù)識別率提高了10個百分點,進一步說明了局部變化特征有利于提高虹膜的識別正確率。
(3)ALL算法同時使用了全局和局部合特征,識別率較ICCA-G算法有了較大幅度的提高,但還是低于ICCA算法識別率,這對比結果表明,并不是特征越多越好,將全局特征和局部直接進行混合,而沒有采用CCA融合技術去消除特征間的冗余信息或者噪音信息,會導致虹膜的識別率不夠理想。
圖3對比顯示了本研究子模式矯正方法與全局特征方法在兩個不同數(shù)據(jù)集上的效果。從圖中可以發(fā)現(xiàn),融合了局部特征的子模式矯正方法在應用于遮擋較嚴重的CASIA Ver2.0數(shù)據(jù)集中時,其識別率相比僅用全局特征識別率提高了15個百分點,而CASIA Ver1.0數(shù)據(jù)集變化并不明顯??梢?,通過子集劃分,將局部變化控制在小范圍內,能更好地處理帶遮擋數(shù)據(jù)集。
為了更一步說明ICCA的優(yōu)越性,采用Garbor濾波器、Harr小波和離散余弦變換等[11]常用虹膜特征提取算法進行對比實驗,對比結果如表2所示。從表2可知,相對于當前常用虹膜識別方法,ICCA的識別率更高,對結果表明表明ICCA是一種識正確率高、結果可靠的虹膜特征提取算法。
圖3 兩個數(shù)據(jù)不同特征的識別率
表2 ICCA與常見虹膜識別方法識別性能對比
特征提取是模式識別的重要組成部分,其有效性關系到分類識別算法的選取與識別正確率,本研究提出了一種基于子模式與CCA的虹膜識別算法。ICCA不僅能夠有效提取圖像的局部與整體特征,使得其對睫毛遮擋、光照不均等局部變化有較高的穩(wěn)定性,而且采用子模式劃分解決了傳統(tǒng)CCA無法處理虹膜識別等小樣本多特征的問題。仿真對比結果表明,相對于其他虹膜識別算法,ICCA不僅有更優(yōu)的虹膜識別性能,而且更具有穩(wěn)定性和魯棒性。
[1]孫即祥,王曉華,鐘山,等.模式識別中的特征提取與計算機視覺不變量[M].北京:國防工業(yè)出版社,2001.
[2]林金龍,石青云.一種基于結構特征的虹膜識別方法[J].計算機工程與應用,2003,39(13):83-84.
[3]田啟川,潘泉,程詠梅,等.基于過零檢測的虹膜特征提取算法[J].電子與信息學報,2006,28(8).
[4]Sanchez-Avila C,Sanchez-Reillo R,Martin-Roche D.Irisbased biometric recognition using dyadic wavelet transform[J].IEEE Aerospace and Electronic System s Magazine,2002,17(10):3-6.
[5]Xie M,Shao S.Iris recogniton based on fearure extration in kernel space[C]//Proceeding of International Conference on Communications,Circuits and Systems,Kokura,2007.
[6]Hotelling H.Relations between two sets of variates[J]. Biometrika,1936,28(3):321-377.
[7]孫權森,曾生根,楊茂龍,等.基于典型相關分析的組合特征抽取及臉像鑒別[J].計算機研究與發(fā)展,2005,42(4):614-621.
[8]王斌,高新波.基于水平集接力的圖像自動分割方法[J].軟件學報,2009,20(5).
[9]羅忠亮,林土勝.用于身份鑒別的虹膜圖像預處理方法[J].華南理工大學學報:自然科學版,2009,37(5):43-48.
[10]Daugman J.How iris recognition works[J].IEEE Trans on Circuits and System for Video Technology,2004,14(1):21-30.
[11]羅忠亮.虹膜生物特征的提取與識別[D].廣州:華南理工大學,2010.
FENG Yingying,YU Shigan,LIU Hui
College of Information Engineering in Fuyang Teachers College,Fuyang,Anhui 236041,China
Canonical Correlation Analysis(CCA)can not better portray the local changes in the iris image,a novel iris recognition method is proposed based on improved CCA algorithm in this paper.Firstly,the correlation between global features and local features are integrated to form the recognition features,the redundant information between the features is eliminated and the global information and local information is integrated effectively at the same time,the performance of ICCA is tested by CASIA datasets.The result show that ICCA’s recognition accuracy is significantly better than the reference model.
Canonical Correlation Analysis(CCA);fusion features;iris recognition;sub-pattern;small samples size
A
TP391
10.3778/j.issn.1002-8331.1208-0473
FENG Yingying,YU Shigan,LIU Hui.Iris recognition algorithm based on improved canonical correlation analysis.Computer Engineering and Applications,2014,50(16):146-149.
安徽省高等學校省級自然科學研究項目(No.KJ2012B138,No.KJ2013B206,No.KJ2013B207);安徽省高等學校省級教學研究項目(No.20101985)。
馮瑩瑩(1982—),女,講師,主要研究領域為無線傳感器網(wǎng)絡安全及計算機圖形學;余世干(1982—),男,講師,主要研究領域為嵌入式系統(tǒng)開發(fā);劉輝(1979—),男,講師,主要研究領域為計算機圖像處理。
2012-08-04
2012-10-29
1002-8331(2014)16-0146-04
CNKI網(wǎng)絡優(yōu)先出版:2012-12-28,http://www.cnki.net/kcms/detail/11.2127.TP.20121228.1007.002.htm l