伍尤富
(韶關(guān)學(xué)院物理與機(jī)電工程學(xué)院,廣東 韶關(guān) 512005)
隨著信息技術(shù)的飛速發(fā)展,信息高度交互,身份識(shí)別的難度和重要性越來越突出?;谏锾卣鞯纳矸葑R(shí)別技術(shù)作為一個(gè)新興的領(lǐng)域,具有非侵入和自然交互等優(yōu)點(diǎn),已經(jīng)吸引了越來越多的研究人員[1]。目前,主要的識(shí)別技術(shù)包括人臉識(shí)別、聲音識(shí)別、指紋識(shí)別和虹膜識(shí)別等技術(shù)。虹膜是人體瞳孔與鞏膜之間的環(huán)狀部分,它具有唯一性、穩(wěn)定性、虹膜圖像獲取的非侵犯性等特點(diǎn),與人臉、聲音識(shí)別相比,虹膜識(shí)別具有更高的準(zhǔn)確性,所以虹膜識(shí)別已成為當(dāng)前生物識(shí)別研究的熱點(diǎn)。
目前,在虹膜識(shí)別研究方面,Daugman首先提出了利用2D-Gabor濾波器對虹膜紋理進(jìn)行局部相位量化和編碼,該算法準(zhǔn)確性高,速度快,是目前虹膜識(shí)別商用系統(tǒng)的基礎(chǔ),但這種算法需要處理紋理的二維信息,增加了特征提取和運(yùn)算時(shí)間;Wildes采用高斯型濾波器在不同分辨率下分解虹膜圖像,并把結(jié)果進(jìn)行存儲(chǔ)比較,計(jì)算量比較大;Boles提出了一種新穎的基于小波變換過零檢測的虹膜識(shí)別算法,只在小樣本集里取得了有限的結(jié)果,這種算法對灰度值比較敏感,因而識(shí)別率比較低[2]。本文提出了一種基于核主成分分析和支持向量機(jī)相結(jié)合虹膜特征提取與識(shí)別方法,該方法首先利用KPCA進(jìn)行非線性特征提取,并根據(jù)SVM和距離度量各自的特點(diǎn),采用了SVM和距離度量相結(jié)合的兩極分類方法,以減少進(jìn)入支持向量機(jī)訓(xùn)練的樣本數(shù)目,實(shí)驗(yàn)表明該方法能有效地提高識(shí)別率,加快了識(shí)別速度,具有較好實(shí)用性。
一般來說,虹膜識(shí)別系統(tǒng)主要包括虹膜圖像的獲取,虹膜圖像的預(yù)處理,虹膜圖像特征提取,模式匹配4部分組成,如圖1所示。
圖1 虹膜識(shí)別系統(tǒng)
虹膜定位就是要找出瞳孔與虹膜之間、虹膜與鞏膜之間的兩個(gè)邊界。根據(jù)虹膜的幾何特性采用粗定位和細(xì)定位相結(jié)合的方法來快速定位其中心及內(nèi)外半徑,這樣可以減少定位搜索的盲目性及計(jì)算時(shí)間[3]。先通過粗定位找到瞳孔的大致位置,然后在這個(gè)位置附近較小的范圍內(nèi)利用Canny邊緣檢測和Hough變換進(jìn)行細(xì)定位。圖 2(b)是虹膜定位的結(jié)果。
圖2 虹膜定位
為了消除平移、縮放和旋轉(zhuǎn)對虹膜模式匹配的影響,為了實(shí)現(xiàn)精確匹配,還須對定位后的虹膜圖像進(jìn)行歸一化,即將每幅原始圖像調(diào)整到相同的尺寸和對應(yīng)位置[1],使用極坐標(biāo)方法進(jìn)行歸一化,以瞳孔中心為起點(diǎn),以虹膜內(nèi)外邊界的交點(diǎn)坐標(biāo)分別為ys( r,θ) ) ,則利用式(1)可將虹膜圖像中的每一個(gè)點(diǎn)一一映射到極坐標(biāo)(r,θ)中。
圖3 虹膜圖像歸一化
目前,已有的虹膜識(shí)別方法大多是利用線性變化(Gabor小波)來提取虹膜紋理的局部特征。然而,線性變換方法在提取特征時(shí)變換基固定且獨(dú)立于處理數(shù)據(jù)。此外,傳統(tǒng)的方法還必須為固定基選擇參數(shù)(如空間、頻率、方向等)。實(shí)際中遇到的問題往往較復(fù)雜,呈現(xiàn)出非線性特性,對于這種非線性問題,可以利用核函數(shù)加以解決,基于核主成分分析(KPCA)特征提取的基本思想是,通過一個(gè)核函數(shù)Φ:Rd→ H ,將原空間 Rd中每個(gè)向量x映射到一個(gè)高維特征空間H中,使之變?yōu)榫€性問題,然后在這高維空間H中進(jìn)行線性主分量分析(PCA)[4]。
特征向量v是由iΦ張成的空間,由此式(3)可等價(jià)于
通過求解方程(7)即可求出特征值λ和特征向量α。結(jié)合式(5)可知,C 的特征向量v可由核矩陣的特征向求出,將α歸一化可得取主元特征,計(jì)算測試樣本在H空間中向量v的投影為
實(shí)驗(yàn)證明[6],KPCA方法在H空間內(nèi)具有與線性 PCA相同的數(shù)學(xué)和統(tǒng)計(jì)特性,而且它比線性 PCA能夠提取更多的樣本信息,在達(dá)到相同分類性能的前提下,KPCA所需的主元個(gè)數(shù)要少于PCA,同時(shí)與其它非線性特征提取方法相比,它不需要解決非線性優(yōu)化問題而只涉及矩陣的特征值分解計(jì)算。
這樣,虹膜特征提取KPCA算法的主要步驟可以歸納如下:
1)選取核函數(shù)并確定其參數(shù);
2)對訓(xùn)練集中的虹膜圖像根據(jù)式(2)求出其在特征空間的協(xié)方差矩陣C;
3)根據(jù)式(7)求出C的特征向量α和特征值λ;
4)選取若干個(gè)較大的特征值,根據(jù)式(8)求出對應(yīng)的特征向量在特征空間的投影作為編碼;
5)將虹膜圖像的特征分為2b個(gè)等級(jí),這樣,每個(gè)特征僅需要b位就可以存儲(chǔ),節(jié)省存儲(chǔ)虹膜特征的空間。
通過KPCA算法得到了虹膜圖像的特征編碼,接下來的工作就是選擇合適的分類算法對編碼進(jìn)行分類。目前在虹膜識(shí)別算法中普遍采用基于海明距離和歐式距離的分類方法。本文采用支持向量機(jī)(SVM)方法完成對虹膜碼的分類識(shí)別。
支持向量機(jī)是一種基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化(SRM)原理的通用的學(xué)習(xí)方法,按照 SRM 的要求,SVM 學(xué)習(xí)的結(jié)果就是尋找一個(gè)最優(yōu)分類超平面,把此平面作為分類決策面,該平面不僅要能夠?qū)深愑?xùn)練樣本正確分開,而且要使分類間距最大。
于是,可從訓(xùn)練集中得到描述最優(yōu)分類超平面的決策函數(shù)即支持向量機(jī)
對于線性不可分問題,我們一般先將樣本映射到高維空間,選擇適當(dāng)?shù)挠成浜瘮?shù)(核函數(shù))K ( xi, x)就可以使樣本映射后線性可分,核函數(shù)K(xi,x)應(yīng)滿足Mercer定理。則決策函數(shù)為采用不同的內(nèi)積核函數(shù)將形成不同的算法。
由以上分析可知,SVM算法是基于小樣本統(tǒng)計(jì)理論和最大分類間隔思想的算法,因此,它具有優(yōu)良的分類性能,但如果輸入的數(shù)據(jù)太大,則會(huì)導(dǎo)致訓(xùn)練時(shí)間過長,根據(jù)SVM和距離度量方法各自的特點(diǎn),本文采用了將支持向量機(jī)和距離度量相結(jié)合的兩級(jí)分類算法,即ISD(Integrated SVM and Distance Classification)分類算法,先利用距離度量進(jìn)行前級(jí)分類,然后根據(jù)虹膜圖像的紋理統(tǒng)計(jì)特征,采用歐式距離來度量虹膜圖像間的相似性,若符合條件,則給出分類結(jié)果,否則就轉(zhuǎn)入后級(jí)分類器——支持向量機(jī)進(jìn)行分類。
為了驗(yàn)證算法的有效性,實(shí)驗(yàn)中,采用了自己采集的虹膜圖像。采用了 100只不同眼睛的虹膜圖像樣本,每只眼睛有 5幅圖像,每類中前3幅圖像參加訓(xùn)練,后2幅圖像用于識(shí)別,虹膜圖像經(jīng)過預(yù)處理后,為了比較主成分分析(PCA)和核主成分分析(KPCA)在虹膜圖像特征提取方面的差別,分別用PCA和KPCA進(jìn)行特征提取。實(shí)驗(yàn)中采用的核函數(shù)為目前廣泛使用的q階的多項(xiàng)式核函數(shù):K (xi,x)=(xi?x+c)q。由于多項(xiàng)式核函數(shù)q的變化對分類識(shí)別率和特征提取時(shí)間有一定影響,在進(jìn)行相關(guān)實(shí)驗(yàn)后最佳核參數(shù)q被確定為2。其比較結(jié)果見表1。
表1 基于PCA和KPCA特征提取的識(shí)別率比較
從表1可以看出,KPCA高于PCA的識(shí)別率,這主要是因?yàn)?PCA僅能提取虹膜圖像的線性成分,而KPCA對圖像中的非線性成分也能提取,因而,KPCA提取的特征更豐富。
實(shí)驗(yàn)中,分別對3種分類器的分類性能進(jìn)行了比較,距離分類器采用度量特征向量間的方差倒數(shù)加權(quán)歐氏距離作為分類依據(jù),其分類結(jié)果如表2所示。
表2 ISD算法與距離分類器、SVM的性能比較
從表2可見,與單純采用距離分類器、支持向量機(jī)分類器相比,ISD算法具有更高的正確識(shí)別率,而且采用距離度量與支持向量機(jī)相結(jié)合的分類方法,能減少進(jìn)入SVM的樣本數(shù),從而減少了訓(xùn)練和測試時(shí)間,其性能優(yōu)于單獨(dú)采用距離度量或SVM的分類方法。
本文中提出了采用核主成分分析(KPCA)提取虹膜特征,距離度量和支持向量機(jī)(SVM)相結(jié)合設(shè)計(jì)分類器進(jìn)行分類識(shí)別。核主成分分析方法對具有非線性高維數(shù)據(jù)特點(diǎn)的虹膜原始特征進(jìn)行提取,不僅實(shí)現(xiàn)了降維,而且取得比傳統(tǒng)主成分分析(PCA)更好的識(shí)別性能,分類識(shí)別時(shí)采用了距離度量和支持向量機(jī)相結(jié)合的兩級(jí)分類方法, 減少進(jìn)入支持向量機(jī)的樣本數(shù)目,大大減少了支持向量機(jī)訓(xùn)練時(shí)間。實(shí)驗(yàn)證明,該方法能有效地提高識(shí)別率,加快了識(shí)別速度,具有較好實(shí)用性。
[1]王蘊(yùn)紅, 朱 勇, 譚鐵牛. 基于虹膜識(shí)別的身份鑒別[J]. 自動(dòng)化學(xué)報(bào), 2002, 28(1): 1-10.
[2]李 峰,劉國彥, 章登勇, 等. 基于ICA和SVM的虹膜識(shí)別方法[J]. 小型微型計(jì)算機(jī)系統(tǒng), 2005,26(12): 2203-2206.
[3]Daugman J. High confidence visual recognition of persons by a test of statistical independence [J]. IEEE Trans. Pattern Analysis and Machine Intelligence,1993, 15(11): 1148-1161.
[4]Seholkopf B, Smola A, Muller K R. Nonlinear component analysis as a kernel eigenvalue problem [J].Neural Computation, 1998, 10(5): 1299-1319.
[5]李弼程, 邵美珍, 等. 模式識(shí)別原理與應(yīng)用[M]. 西安: 西安電子科技大學(xué)出版社, 2008: 82- 92.
[6]Cao L J, Chua K S, chong W K. A Comparision of PCA, KPCA and ICA for dimensionality reduction in support vector machine [J]. Neurocomputing, 2003,55(2): 321-336.