余成波,張 進,張一萌,李洪兵,2
(1.重慶理工大學遠程測試與控制技術(shù)研究所,重慶 400050;2.重慶三峽學院,重慶 404000)
手指靜脈識別技術(shù)相比其他的生物識別技術(shù)(如指紋識別、虹膜識別、掌紋識別等)具有速度快、安全等級高、活體識別、非接觸式等優(yōu)點,所以它在身份驗證、安全系統(tǒng)等方面具有廣泛而重要的用途。因此,近年來關(guān)于手指靜脈識別技術(shù)的研究已成為熱點之一。
目前手指靜脈特征提取的方法主要有兩大類:基于結(jié)構(gòu)信息和基于統(tǒng)計特征的特征提取?;诮Y(jié)構(gòu)信息的特征提取可以分為點特征和線特征兩類:點特征數(shù)量多,計算量大;線特征提取困難,對相近或相似的手指靜脈圖片的鑒別力不夠?;诮y(tǒng)計特征的特征提取方法有:傅里葉變換[1]、Gabor變換[2]、主元分析(principal component analysis,PCA)[3]和 Fisher線性判別(Fisher linear discriminant,F(xiàn)LD)[4]。
Gabor變換和傅里葉變換分析圖像時將圖像從空域變換到頻域,忽略了圖像豐富的細節(jié)信息,受光照條件影響而產(chǎn)生的不穩(wěn)定性也較大,且變換后的圖像特征仍處于高維空間中。PCA,F(xiàn)LD方法具有特征描述性強、計算速度快、易實現(xiàn)和可分性好等特點,廣泛應(yīng)用于人臉識別、文本識別等許多領(lǐng)域。但是PCA提取的特征是最佳描述特征而不是最佳分類特征,不利于分類匹配。而Fisher線性判別[5]的基本思想是找到模式變換以后使得類內(nèi)距離最小和類間距離最大的投影方向,從而提取最佳分類特征。
在提取小樣本的高維手指靜脈圖像特征時,由于光照、溫濕度、水平位移等因素的影響使得采集的靜脈圖像是非線性分布的,因此引入核方法將Fisher算法進一步拓展到非線性的情況,提出了核Fisher算法(kernel Fisher discriminant analysis,KFDA)。核Fisher判別分析使用了類似于支持向量機(support vectormachine,SVM)[6]和核 PCA 方法的“核技巧”,即首先把數(shù)據(jù)非線性地映射到某個特征空間F,然后在這個特征空間中進行Fisher線性判別,這樣就隱含地實現(xiàn)了原輸入空間的非線性判別。核Fisher算法在處理非線性數(shù)據(jù)方面比Fisher算法有了更大的進步。
Fisher線性判別是一種經(jīng)典的分類算法,它是依據(jù)使類間的離散度最大和類內(nèi)的離散度最小的原則,以此來確定原始向量的投影方向,使各類別之間達到最大程度的分離,從而實現(xiàn)正確的分類。Fisher算法的線性判別函數(shù)W(x)的形式[7]為
(1)式中:wi(i=1,2,…,N)為不相同的N個模式類;xi(i=1,2,…,N)表示同一模式類中i個不同的個體。判別系數(shù)就是投影 w=(w1,w2,…,wN)T。
各類樣本的均值向量為mi(i=1,2,…,N),且
(2)式中:Ni為wi類的樣品個數(shù);xij為第i類中的第j個樣本。
類間樣本離散度矩陣Sb和類內(nèi)樣本離散度矩陣Sw分別可定義為
根據(jù)類間離散度最大、類內(nèi)離散度最小原則,可得出 Fisher鑒別函數(shù)定義[11]為
最后投影向量w滿足(Sb-λSw)w=0,求得滿足該式的最大特征值λ0對應(yīng)的特征向量w0,則判決函數(shù)[7]為
(6)式中,x為需要鑒別的未知樣品向量。
Fisher線性判別解決問題的關(guān)鍵就是尋找一個最優(yōu)的映射方向,而對手指靜脈圖像而言,數(shù)據(jù)分布呈非線性,線性判別顯得過于簡單,并不能達到最好的分類效果。因此在手指靜脈識別系統(tǒng)中提出使用基于核函數(shù)的Fisher判別進行分類。
核Fisher判別的核心思想是,通過一個非線性映射Φ將原始特征空間映射到一個新的特征空間H,在新的特征空間H中使用Fisher線性判別進行分類。KFDA是Fisher線性判別的非線性擴展,可以很好地對非線性數(shù)據(jù)進行分類,系統(tǒng)框圖如圖1所示。
圖1 手指靜脈識別系統(tǒng)框圖Fig.1 Block diagram of the Finger vein identification system
手指靜脈識別過程分為2個部分:第1部分是樣本訓練過程;第2部分是樣本的測試過程。核Fisher算法主要應(yīng)用在樣本的訓練階段。
設(shè)數(shù)據(jù)庫中每個人的靜脈圖像w1,w2,…,wp作為p個不同的模式類,第i類樣本數(shù)為Ni,X={X1,X2,…,XNi}表示第i類樣本,總的訓練樣本數(shù)為N。則原輸入空間X到新的特征空間H的非線性映射為Φ:X→H。
此時核Fisher鑒別函數(shù)可定義為
在新的特征空間H中的類間離散度矩陣SΦb和類內(nèi)離散度矩陣SΦw分別為
由于在空間H中得到的矩陣維數(shù)非常高,直接求解是不可能的,因此可以通過核函數(shù)的技巧,這樣就避免進行了非線性運算。
考慮到任何一個目標函數(shù)的解w都可以用特征空間中元素的線性組合 Φ(X1),Φ(X2),…,Φ(XN)表示
(11)式中,αi為各個元素Φ(Xi)的線性系數(shù)。因此結(jié)合(10)式和(11)式,可得
根據(jù)(8)式和(9)式可得
則(7)式可變?yōu)?/p>
特征空間Φ(x)在α上的投影μ為
目前,對于人臉識別已經(jīng)形成了許多標準的數(shù)據(jù)庫,而由于對手指靜脈識別的研究起步較晚,因此國內(nèi)外還沒有建立起通用的手指靜脈數(shù)據(jù)庫。
為了對手指靜脈圖像進行預(yù)處理分析,所在實驗室建立了手指靜脈數(shù)據(jù)庫。該數(shù)據(jù)庫由50個不同人的手指靜脈圖像組成,而且對每個人在不同時間和光照條件下采集了10幅不同的圖像。所有圖像都有一個黑色的背景,手指是豎直向上(能容許一定的位置偏移),這些圖像大小為(328×376)。圖2所示為數(shù)據(jù)庫中不同3人手指靜脈圖像和同一人的不同3幅手指靜脈圖像。
圖2 手指靜脈圖像Fig.2 Finger vein images
如果直接將采集裝置得到的圖片運用本文的算法來進行分類識別,其識別精度會產(chǎn)生較大的誤差,因此需要對圖片進行預(yù)處理。
1)圖像縮放。采集到的圖像尺寸維數(shù)過大,為了后續(xù)處理的方便,并且也為了縮短識別時間,需要按照一定比例對圖像進行統(tǒng)一的縮放,本文是將大小為(328×376)的圖像縮小為(97×65)。
2)灰度歸一化。尺寸縮小后的靜脈圖像灰度分布還是很集中,不利于特征提取與分類。因此采取線性灰度調(diào)整的方法,將灰度能量聚集于[C1,C2]圖像灰度歸一化到[0,255]范圍,得到灰度分布均勻的圖像 f(i,j)[8]
(18)式中:f'(i,j)表示原圖灰度值;f(i,j)表示變換后的灰度值;C1表示原圖最小灰度值;C2表示原圖最大灰度值。
3)均值濾波[9]。由于光照強度、溫濕度對采集裝置的影響而使得圖像存在一定的噪聲,為了提高算法識別準確度,需要對噪聲進行濾波。采取常用的均值濾波方法對圖像進行平滑去噪處理,其基本原理是用均值代替原圖像中的各個像素值,即對待處理的當前像素點(m,n),選擇一個模板,該模板由其近鄰的若干像素組成,求模板中所有像素的均值,再把該均值賦予當前像素點(m,n),作為處理后圖像在該點上的灰度 p(m,n),即 p(m,n)=為該模板中包含當前像素在內(nèi)的像素總個數(shù)。任意h,p兩人的原始圖像與經(jīng)過預(yù)處理后的圖像對比效果如圖3所示。
圖3 原始圖像與預(yù)處理后圖像對比圖Fig.3 Omparison chart between the original image and the pretreatment image
為檢驗本文方法對抽取小樣本手指靜脈圖像分類識別的有效性,通過采集裝置得到的圖像經(jīng)過預(yù)處理后的數(shù)據(jù)庫進行了測試,實驗環(huán)境為Inter 1.60 GHz,內(nèi)存為1 GByte,Matlab 7.1仿真。實驗時,將50個人的500幅圖像隨機分成2組,一組作為訓練樣本,一組作為測試樣本。此時,選每人的前k幅圖片作為訓練樣本,后10-k幅圖片作為測試樣本,兩組之間的樣本沒有重疊,即測試樣本不包含在訓練樣本中。圖4為本文算法分別選用3種不同的核函數(shù)得到的仿真圖,3種核函數(shù)形式主要為
①二次核函數(shù)[10]
②多項式核函[11]
(20)式中:c為常數(shù);d為多項式階數(shù)。
③高斯徑向基(radial basis function,RBF)核函數(shù)[12]
圖4 3種核函數(shù)識別效果對比圖Fig.4 Comparison chart of three kinds of kernel function
從圖4可以看出由于二次核函數(shù)只對于線性數(shù)據(jù)的分類效果較好,而本文的數(shù)據(jù)呈現(xiàn)非線性的特征,因此在仿真時其識別精度比較低,多項式核函數(shù)(c=1,d=3)和RBF核函數(shù)(δ=2)的識別精度都遠遠高于二次核函數(shù)。
本文算法的識別性能如表1所示。結(jié)合圖4以看出,選用RBF核函數(shù)的仿真時間會明顯高于多項式核函數(shù),而兩者的識別精度幾乎大致相同。因此,本文算法就直接選用了多項式核函數(shù)。
本文方法在選取了多項式核函數(shù),訓練樣本數(shù)和測試樣本數(shù)分別為5的情況下,通過計算待識別手指圖像的投影矩陣與各測試樣本的聚類中心之間的歐式距離,得到識別結(jié)果的過程如表2所示。
表1 基于KFDA方法的3種核函數(shù)的識別性能Tab.1 Recognition performance of the three core functionswhich are based on KFDA approach
表2 計算歐式距離測試過程Tab.2 Test of computing euclidean distance
圖5是在不同的訓練樣本數(shù)目下運用PCA,KPCA,F(xiàn)LD,KFDA等4中不同方法的仿真圖對比圖,從識別率比較發(fā)現(xiàn),隨著測試樣本數(shù)的增加,各種方法的識別精度呈上升趨勢,但KFDA方法的識別效果明顯優(yōu)于其他方法,在訓練樣本數(shù)為5的情況下本文方法識別精度達到了98.2%。
圖5 4種算法在不同訓練樣本下的識別精度Fig.5 Recognition accuracy of the four algorithmswhich are under different training samples
本文引入了核方法,將高維空間的不可分問題轉(zhuǎn)化成了低維空間的線性可分問題,并且利用了類間散度陣和類內(nèi)散度陣作為Fisher準則,通過對建立的小樣本手指靜脈數(shù)據(jù)庫進行實驗測試,計算投影矩陣與各測試樣本的聚類中心之間的最小歐式距離進行識別判斷。實驗結(jié)果表明,基于多項式核函數(shù)的KFDA方法具有易實現(xiàn),測試識別時間較短,識別精度較高等優(yōu)勢。
[1]ZHOU Xin,WU Ying.Application of Kernel Fisher Discriminant Analysis to Digital Signal Classification[J].Journal of Beijing University of Posts and Telecommunications,2011,34(1):35-39.
[2] 邊肇棋,張學工.模式識別[M].北京:清華大學出版社,2000.
BIAN Zhao-qi,ZHANG Xue-gong.Pattern Recognition[M].Beijing:Tsing Hua University Press,2000.
[3] MOGHADDAM B,JEBARA T,PENTLAND A,Bayesian face recognition [J].Pattern Recognition,2000,33(11):1771-1782.
[4]楊健,楊靜宇,葉暉.Fisher線性鑒別分析的理論研究及其應(yīng)用[J].自動化學報,2003,29(4):481-493.
YANG Jian,YANG Jing-yu,YE Hui.Theory of Fisher Linear Discriminant Analysis and Its Application[J].Acta Automatica Sinica,2003,29(4):481-493.
[5]鄭宇杰,楊靜宇,徐勇,等.一種基于Fisher鑒別極小準則的特征提取方法[J].計算機研究與發(fā)展,2006,43(7):1201-1206.
ZHENG Yu-jie,YANG Jing-yu,XU Yong,et al.A New Feature Extraction Method Based on Fisher Discriminant Minimal Criterion[J].Journal of Computer Research and Deverlopment,2006,43(7):1201-1206.
[6] 楊勇,羅飛.基于粗糙集理論的表情識別研究[J].重慶郵電大學學報:自然科學版,2009,21(4):549-554.
YANG Yong,LUO Fei.Facialexpression recognitionbased on rough set theory[J].Journal of Chongqing University of Post and Telecommunications:Natural Science Edition,2009,21(4):549-554.
[7] 楊淑瑩.模式識別與智能計算[M].北京:電子工業(yè)出版社,2008.
YANG Shu-ying.Pattern Recognition and Intelligent Computing[M].Beijing:Publishing House of Electronics Industry,2008.
[8] DAVID M J,TAX D M J,KITTLER J.Combining Multiple Classifiers by Averaging or by Multiplying[J].Pattern Recognition,2000,33(9):1475-1485.
[9] 余成波,張睿,秦華鋒.基于CCD的手指靜脈身份識別系統(tǒng)的研制[J].半導體光電,2008,9(3):483-485.
YU Cheng-bo,ZHANG Rui,QING Hua-feng.Development of An IdentityRecognition System Based on CCD Finger Vein Image[J].Semiconductor Optoelectronics,2008,9(3):483-485.
[10] SU C L.Face recognition by Using characteristic matrix and ring rotation invariant transform[J].Mathematics and Computation,2007,189(1):116-125.
[11] SHU Yang,SHUICheng-yan,CHAO Zhang.Bilinear analysis for kernel selection and nonlinear feature extraction[J].IEEE Transactions on Neural Networks,2007,18(5):1442-1452.
[12]MARIAN SB,JAVIER R M,TERRENCE JS L.Face recognition by independent componentanalysis[J].IEEE Transactions on Neural Networks,2002,13(6):1450-1464.