陳虹旭 李曉坤 鄭永亮 袁烺 邵娜 楊磊 劉磊
文章編號: 2095-2163(2018)03-0064-06中圖分類號: 文獻標(biāo)志碼: A
摘要: 關(guān)鍵詞: (Heilongjiang Hengxun Technology Co. Ltd., Harbin 150090, China)
Abstract: Modern science and technology is in a period of rapid development, fingerprint identification technology has been integrated into the various fields of social life. Among many biometric identification techniques, fingerprint recognition technology is widely used as one of the most intuitive technologies. There are some drawbacks in traditional fingerprint recognition technology, such as manually setting fingerprint features and multiple debugging. Design features and classifier selection are relatively difficult to achieve optimization, resulting in poor recognition rate. It is necessary to propose a scheme to improve the accuracy of fingerprint recognition. With the rise of machine learning technology in recent years, deep learning technology has become a hot topic at the moment. The combination of deep learning technology and biometric identification technology also has a bright future. Deep learning technology can learn and analyze in massive data. It can automatically identify, analyze and learn fingerprint characteristic data, thereby reduce manual workload, and improve the accuracy of fingerprint recognition. This paper introduces briefly the research status and existing problems of deep learning and fingerprint recognition technology, through convolution neural network has made the analysis and improvement on the fingerprint recognition technology based on the deep learning. In this paper, it is expected that the analysis and improvement of fingerprint identification technology will help people to understand the concept better and application of fingerprint identification, and promote the rapid development of biometric identification technology.
Key words:
基金項目:
作者簡介:
通訊作者: 收稿日期:
引言
當(dāng)今社會,科學(xué)技術(shù)水平不斷發(fā)展提高,標(biāo)志著高速數(shù)字化信息時代的來臨。大量的數(shù)據(jù)與信息充斥于人們?nèi)粘I畹母鱾€角落,面對數(shù)據(jù)與信息的群集涌入,人們對隨之而來的風(fēng)險與安全問題也日趨關(guān)注與重視。對于身份認(rèn)證,人們試圖設(shè)置多種多樣的密碼以保證數(shù)據(jù)的安全。具體來說,就是通過增加字母、數(shù)字、符號、區(qū)分大小寫來提升密碼的復(fù)雜度??墒沁@一舉措?yún)s使得人們在管理密碼方面陷入了困境:不同數(shù)據(jù)設(shè)置不同密碼,密碼體系已日漸龐大,密碼遺忘或被破譯會給人們帶來數(shù)據(jù)與經(jīng)濟方面的雙重?fù)p失,甚至可能引發(fā)更為嚴(yán)重的后果。
指紋識別是生物特征識別技術(shù)的主要方式之一。指紋是具有唯一性和高度辨識性的人體生物特征。很多人體生物特征還會隨著年齡的變更而發(fā)生改變,但是指紋卻呈現(xiàn)出與年齡無關(guān)的良好穩(wěn)定性。紋理特征的復(fù)雜度使其能夠成為人們身份認(rèn)證的重要攝取方式。相對于其它生物特征,指紋在采集方面更加容易,而且易于保存和處理,采集成本也更低。指紋識別的推廣性堪稱良好,適應(yīng)能力更強;而在采集時對于人體不會造成傷害,安全性極高;對于穩(wěn)定性和可靠性方面也同樣贏得了高度認(rèn)定。人們只需要在電腦或者電子終端上增加一個指紋采集識別設(shè)備?,F(xiàn)如今,指紋識別已經(jīng)深入到了社會生活的多個層面,諸如:在公安領(lǐng)域,警方通過采集指紋信息來判斷公民身份,并對出入境人員進行身份核實;在金融領(lǐng)域,銀行通過指紋及證件對照核驗客戶身份,以實現(xiàn)銀行卡的取現(xiàn)、轉(zhuǎn)賬等業(yè)務(wù)辦理;在生活中,指紋識別技術(shù)已運用于電子設(shè)備管理、考勤管理、門禁管理等各類有關(guān)身份鑒定辨識的場景中。
指紋具有唯一性是在1880年由Fauld醫(yī)生首次以專業(yè)的技術(shù)角度提出的,但卻直到1892年才由Galton開創(chuàng)性地論述了指紋特征點的概念[1]。在1900年以后,司法機關(guān)正式對指紋賦予法律效力。1960年起,計算機替代了人工鑒證指紋時代。1980年,光學(xué)掃描技術(shù)運用到了指紋識別中。進一步地,研究推演到上世紀(jì)九十年代,指紋識別技術(shù)方面出現(xiàn)了相對準(zhǔn)確的算法。學(xué)者Maio提出,可以通過對原始指紋灰度圖像上的脊線進行提取,由此可成功獲取圖像特征[2]。傳統(tǒng)的指紋識別算法是基于整幅指紋圖像的全局增強處理的基礎(chǔ)上研發(fā)得到的,而此后問世的新型識別算法的核心是針對圖像的局部區(qū)域來進行增強處理,這就極大地提高了工作效率,有效減小了圖像處理生成的冗余。在此基礎(chǔ)上, Jiang又拓展提出了改進方法,通過自適應(yīng)步長與細(xì)節(jié)點后續(xù)處理來綜合提高運算速率[3]。
在指紋匹配領(lǐng)域進展中,來自不同國家的相關(guān)科研人員均紛紛貢獻了各自不同的理論研究成果。以Jiang為首的學(xué)者提出了利用全局結(jié)構(gòu)與局部結(jié)構(gòu)的比對,從而進行匹配[4]。Isenor也發(fā)表了一種圍繞圖形形狀等屬性,從而進行匹配的算法[5]。經(jīng)過此后的研究,Hrechak又探討了一種致力于結(jié)構(gòu)匹配的研究算法,從而取代了傳統(tǒng)的圖形識別匹配[6]?,F(xiàn)如今,已獲學(xué)界公認(rèn)且得到廣泛使用的算法是由FBI提出的基于指紋細(xì)節(jié)特征的匹配算法。就識別率而言,無論是基于結(jié)構(gòu)匹配,或是基于圖形匹配,相較于細(xì)節(jié)特征識別均處于劣勢,因其不會隨著圖像的變形而更新結(jié)果,而且還對特征點的數(shù)量要求較高。
1數(shù)據(jù)來源
本文研究采用的數(shù)據(jù)庫為NIST Special Database 4(NIST DB4)[7]的F庫,NIST DB4F庫是國際公開的用于指紋測試的數(shù)據(jù)庫,其中包含了2 000張指紋圖像。具體對應(yīng)有斗、左旋、右旋、弓和帳弓各400張圖像。
2指紋識別
指紋是指手指末端正面皮膚上形成的凹凸紋路,即谷和脊的部分。研究可知,指紋的唯一性是其重要性能,可通過這些紋路的方向與分布來突顯特征,每根手指指紋紋線的相對位置、數(shù)量、方向都是不同的。并且,指紋還兼具穩(wěn)定性,指紋的紋路不會隨著個人年齡、體重的改變而發(fā)生變化。指紋采集圖像的深色部分稱為脊線,淺色部分稱為谷線。指紋識別就是對脊線與谷線所組成的表面特征圖進行比對的過程。
指紋表面蘊含了大量信息,這些反映出來的表面信息則稱為指紋特征。要對指紋進行識別,首先就需要提取出指紋特征。提取出的指紋特征包括了用來識別的2類特征:全局特征與微特征。其中,全局特征是指紋中脊線與谷線形成的全局特定模式,是表面直接呈現(xiàn)的特征,可劃分為如下4個特點,即:紋路圖案、核心點、三角點、模式點。這4個特點能夠在形式上直觀描繪出指紋紋路;微特征主要包含紋線終結(jié)點、轉(zhuǎn)折點、分叉點。不同指紋也許呈現(xiàn)相同的全局特征,但絕不會呈現(xiàn)相同的微特征,局部微特征的相對位置、類型、方向能夠表征指紋的唯一性。
3指紋識別原理
3.1指紋圖
指紋是由皮膚表面凸起的紋線構(gòu)成。指紋由人類遺傳基因與環(huán)境作用而產(chǎn)生,人人皆有指紋卻各不相同。指紋重復(fù)率極低,重復(fù)率大約為150億分之一,因而可將其稱之為人體身份證。這里,即給出了典型人體指紋視像及采集效果可分別如圖1、圖2所示。
3.2點模式匹配算法
點模式匹配算法可分為2個步驟,步驟內(nèi)容可分述如下:
(1)初匹配[8]:通過運算識別圖像與未知圖像之間的匹配基準(zhǔn)點。
(2)二次匹配:優(yōu)先尋找基準(zhǔn)點,對坐標(biāo)給出校正,再對校正后2幅圖的匹配點對數(shù)進行計算。
假設(shè)有一枚未知指紋A和已知指紋B,指紋A中包含M個特征點,指紋B中包含N個特征點。研究可得,數(shù)學(xué)形式表述如下:A=xA1,yA1,sA1,θA1,…,xAm,yAm,sAm,θAm
B=xB1,yB1,sB1,θB1,…,xBm,yBm,sBm,θBm(1)將紋線組成的指紋圖像A與B,轉(zhuǎn)化得出M維和N維的向量組成形式,從而將這2個向量展開逐項比對,得到一個M×N的匹配矩陣ScoreM×N。這一過程的數(shù)學(xué)形式可表示如下:
sAi≠sBj則Scoreij=0(2)
sAi=sBj則Scoreij=n 1≤n≤5(3)
S=100×GAB×GAB∕M×N(4)
綜合上述的初次匹配設(shè)計后,就可以初步判定出匹配指紋。通過初次匹配可以得到最佳參考點,利用最佳參考點則可降低匹配分?jǐn)?shù),刪除差異明顯指紋,提高匹配效率。至此,可得數(shù)學(xué)公式如下:rt
et
st
φt=xt-xc2+yt-yc2
arctanyt-ycxt-xc-θc
st
θt-θc(5)坐標(biāo)轉(zhuǎn)換后,可以在極坐標(biāo)系統(tǒng)中得到2個新的極坐標(biāo)點集A'=(A'1,A'2,…,A'M)與B'=(B '1,B '2,…,B'N), 再利用限界盒將A'與B'實現(xiàn)一一匹配。
3.3限界盒算法[9]
限界盒算法用來解決非線性形變。限界盒算法是通過將特征點上的某一固定范圍限定為一個盒子,落在限定方位內(nèi)的比對點可以判定為匹配。得到中心點5個相鄰特征點的匹配數(shù),即稱作匹配分?jǐn)?shù),進而由極角與極徑組成限界盒子。限界盒的定義可如圖3所示。
4深度學(xué)習(xí)
研究可知,深度學(xué)習(xí)是由人工智能、信號處理、模式識別優(yōu)化、以及神經(jīng)網(wǎng)絡(luò)等多元化學(xué)科交叉后創(chuàng)建的新興研究領(lǐng)域,深度學(xué)習(xí)也可以視作機器學(xué)習(xí)的一種領(lǐng)域拓展。深度網(wǎng)絡(luò)是一種包含多個隱含層的網(wǎng)絡(luò)結(jié)構(gòu),通過這些隱含層可以深入學(xué)習(xí)更加復(fù)雜的函數(shù),還可以實現(xiàn)海量數(shù)據(jù)的挖掘分析。各層之間會將輸入數(shù)據(jù)進行非線性的變換輸出,利用變換輸出這一特點,即可在深度網(wǎng)絡(luò)的海量數(shù)據(jù)中挖掘到包含重要基本特性的部分?jǐn)?shù)據(jù)。深度學(xué)習(xí)屬于多層學(xué)習(xí)算法,通過深度學(xué)習(xí)的表征學(xué)習(xí)方式可以將復(fù)雜的數(shù)據(jù)處理得到簡化表示,一個樣本可以選用強度值矩陣、灰度值矩陣、方向矩陣等多種方式來刻畫像素,通過表征學(xué)習(xí),可以找出一種更優(yōu)方式來對輸入數(shù)據(jù)進行模擬表達。
深度學(xué)習(xí)是借鑒仿生學(xué)原理而推衍架構(gòu)的一種腦神經(jīng)網(wǎng)絡(luò)系統(tǒng)。利用在多層深度網(wǎng)絡(luò)中的特征抽取,將海量數(shù)據(jù)進行簡潔而具有針對性的輸出。數(shù)據(jù)經(jīng)過多層結(jié)構(gòu)特征抽取,可以完成監(jiān)督與非監(jiān)督下的數(shù)據(jù)轉(zhuǎn)換,最終可以取得分類識別的預(yù)期設(shè)計效果。
4.1深度信念網(wǎng)絡(luò)
深度信念網(wǎng)絡(luò)[10](Deep Belief Networks,DBN)是由Hinton等人提出的一種深度學(xué)習(xí)模型。迄至目前,DBN的應(yīng)用相對來說較為廣泛。通過在輸出與標(biāo)簽之間建立了聯(lián)合概率分布,從而生成結(jié)構(gòu)。利用深度信念網(wǎng)絡(luò)綜合研發(fā)的深度學(xué)習(xí)模型已有很多,如卷積深度信念網(wǎng)絡(luò)。多個RBM[11]構(gòu)成了DBN,DBN在靈活性上占據(jù)優(yōu)勢,其擴張能力也更強。而且,DBN通過對無標(biāo)簽樣本進行非監(jiān)督學(xué)習(xí),有效克服了在傳統(tǒng)神經(jīng)網(wǎng)絡(luò)中存在的局部收斂,以及訓(xùn)練困難等問題,使部分無標(biāo)簽數(shù)據(jù)得到了充分、合理的利用,提高了速率。
深度信念網(wǎng)絡(luò)(DBN)包含了多個隱藏層。其中,RBM由相鄰的2層內(nèi)聯(lián)組合產(chǎn)生,下層的可見層由上一層的隱藏層提供支持設(shè)計,通過上一層的隱藏單元學(xué)習(xí)到高度相關(guān)的階段性結(jié)果[12]。相鄰不同層的節(jié)點之間存在關(guān)聯(lián),相同層節(jié)點并無關(guān)聯(lián),最底層深度信念網(wǎng)絡(luò)(DBN)的可見層用來組成DBN的輸入層。分類識別需要將最高層的RBM隱藏層與RBM邏輯回歸層相連,而后再進行分類識別。深度信念網(wǎng)絡(luò)(DBN)在大數(shù)據(jù)訓(xùn)練上的效果要更加突出,且數(shù)據(jù)越多,正確率也越高。
4.2卷積神經(jīng)網(wǎng)絡(luò)
卷積神經(jīng)網(wǎng)絡(luò)(CNN),是一種由多層結(jié)構(gòu)聚合形成的常用深度學(xué)習(xí)網(wǎng)絡(luò)。僅就設(shè)計結(jié)構(gòu)而言,相對來說較為特殊,這是一種通過訓(xùn)練而得到的深層網(wǎng)絡(luò)。訓(xùn)練過程優(yōu)選了與BP神經(jīng)網(wǎng)絡(luò)相同的訓(xùn)練模式,采用前向傳播來運算求出數(shù)值,再通過最小化誤差反向傳播調(diào)整參數(shù)[13]。卷積神經(jīng)網(wǎng)絡(luò)(CNN)共有4層,分別是:輸入層、卷積層、下采樣層和輸出層,每一層都配置了一定的主題功能。卷積神經(jīng)網(wǎng)絡(luò)的設(shè)計結(jié)構(gòu)可如圖4所示。
由圖4可知,輸入層主要就是將輸入圖像在模型中進行統(tǒng)一處理,輸出層的圖像處理可以保證卷積層的運行過程。卷積層[14]則是將輸入圖像與若干權(quán)值各不相同的卷積核進行卷積操作,從而獲取不同的特征。一類特征可以組成一幅特征圖(Feature Map)[15],卷積核個數(shù)與特征圖個數(shù)相同。下采樣層通常稱為池化層,池化層的操作分為平均池化層、最大池化層2種。2種操作過程并不相同,但是結(jié)果卻是相同的。上述兩者的設(shè)計重點都是對特征圖進行降維處理,從而達到降低參數(shù)個數(shù)的目的。輸出層是一種專供連接的分類器。最終將為研究輸出最終的識別結(jié)果。
卷積網(wǎng)絡(luò)是由底層復(fù)雜輸入過渡到高層簡單輸出的非線性映射過程。過程中,通過結(jié)合已知標(biāo)簽類,對數(shù)據(jù)開展學(xué)習(xí)與監(jiān)督性訓(xùn)練,旨在獲得對位置標(biāo)簽類的計算表達式。這是一種有監(jiān)督性的訓(xùn)練模式,目的是使模型具備自我學(xué)習(xí)能力,進而利用模型在未知標(biāo)簽樣本中自主識別并提取樣本。該網(wǎng)絡(luò)的訓(xùn)練階段也可以看作是一種對樣本的學(xué)習(xí)過程,通過研究剖析已知類樣本,對分析樣本判定識別分類并進行儲存。標(biāo)簽表示采取向量形式,可分為一維或多維,通過設(shè)定或運行系統(tǒng)中采集。
4.2.1神經(jīng)元和稀疏連接
神經(jīng)元是CNN設(shè)計中的基礎(chǔ)運算單元。神經(jīng)元之間采用的連接方式為非全連接,通過非全連接可以降低模型復(fù)雜度。利用這種非全連接方式,引入感受域來獲取圖像局部特征。采用傳播算法,便可以得到非線性卷積核以及更大覆蓋的感受域。
4.2.2權(quán)值共享
權(quán)值共享是在卷積操作時,通過規(guī)定卷積層中每一個卷積核步長,使其重復(fù)作用于輸入圖像的神經(jīng)元感受域,與其貢獻相同連接權(quán)重。采用這種共享方式,可以減少權(quán)重數(shù)量,加速CNN模型訓(xùn)練。
4.2.3卷積
卷積運算是一種對圖片進行學(xué)習(xí)分析從而提取圖片特征的運算過程。通過卷積運算,卷積核與特征實現(xiàn)一一對應(yīng)。在滿足一定量的卷積核的大前提下,可以通過計算成功獲取圖片的全部特征。在理論上,卷積層是由濾波過程得到的特征圖組成,圖片的特征信息是通過濾波器對圖片濾波的加工提取結(jié)果。濾波器每次移動一個步長,卷積核在經(jīng)此過程后得到的特征圖也會隨著濾波器的移動而發(fā)生改變。
4.2.4池化
池化分為最大池化與平均池化2種方式。2種操作的過程機理并不相同,但是結(jié)果卻是相同的,都是為了降維并保持旋轉(zhuǎn)、伸縮、平移等不變性。下一層池化層是對上一層池化層得到的特征圖做降維處理,在不重疊的鄰域之間取平均值,也可將獲取的最大值取代此位置原本的像素值。特征圖的個數(shù)并不會受到池化層運算的干擾,卻會使特征圖大小發(fā)生改變。維數(shù)的降低可以使過擬合現(xiàn)象產(chǎn)生的幾率下降。
4.2.5激活函數(shù)
卷積操作與降采樣均要通過線性方式來進行圖像特征處理。待分類樣本并非皆為線性可分的,對于這種樣本需要選用激活函數(shù),同時加入非線性因素,使其建立合適的非線性分類模型。CNN能夠提取強大、有效的特征表達,核心關(guān)鍵即在于:激活函數(shù)保留了神經(jīng)元節(jié)點的有效信息,又去除了冗余。
4.2.6全連接
全連接層發(fā)揮的是分類器的作用。在卷積神經(jīng)網(wǎng)絡(luò)中通過對分布特征表示的映射,來標(biāo)記處理樣本空間。全連接層由卷積操作來設(shè)計實現(xiàn),可將符合標(biāo)準(zhǔn)的全連接層轉(zhuǎn)換為卷積或是卷積核。
5實驗結(jié)果
5.1實驗一
研究中,通過點模式匹配算法在NIST DB4F指紋庫中選取416幅指紋圖像進行試驗。其中,拱型112幅,左環(huán)88幅,右環(huán)120幅,旋渦型96幅,分類結(jié)果可見表1。
5.2實驗二
本文提出的基于深度學(xué)習(xí)的指紋識別方法研究,通過神經(jīng)網(wǎng)絡(luò)出色的容錯性和自我學(xué)習(xí)能力,使識別具有強大的兼容性和優(yōu)越性。
在NIST DB4F指紋庫中,取拱型56幅,左環(huán)116幅,右環(huán)124幅,旋渦型108幅?;贑NN一半進行訓(xùn)練,一半進行測試。實驗結(jié)果可見表2。過程中的平均誤識別率4%。
6結(jié)束語
指紋識別是一種生物特征識別技術(shù),并因其優(yōu)秀的可靠性和實用性而獲得了時下學(xué)界的高度關(guān)注與青睞,研究成果也在不斷的發(fā)展與進步中。本文研究給出的實驗結(jié)果表明傳統(tǒng)的指紋識別方法錯誤率為6.5%。通過傳統(tǒng)的指紋識別方法與深度學(xué)習(xí)相結(jié)合,采用CNN模型用于指紋自動識別則獲得較好的效果,錯誤識別率也提升為4%左右,明顯改善了識別效果。經(jīng)過比較不難發(fā)現(xiàn),傳統(tǒng)的點模式匹配算法的識別率并未達到CNN算法的運行效果。但是卷積神經(jīng)網(wǎng)絡(luò)在訓(xùn)練設(shè)置方面卻頗具現(xiàn)實難度,需要通過大量的實驗數(shù)據(jù)來提供支持。因此可以預(yù)期,CNN算法能夠在指紋識別領(lǐng)域得到更為廣泛的應(yīng)用,但卻需要在實驗方面繼續(xù)改進加強,從而將指紋識別率提升至更高。
參考文獻
[1] HYDE H. Acute alcoholism and the withdrawal state[J]. Medical Trial Technique Quarterly, 1970,17(2):186-193.
[2] MAIO D, MALTONI D. Direct gray-scale minutiae detection in fingerprints[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 1997, 19(1):27-40.
[3] JIANG Xudong, YAU W Y, SER W. Detecting the fingerprint minutiae by adaptive tracing the gray-level ridge[J]. Pattern Recognition, 2001, 34(5):999-1013.
[4] PERALTA D, GALAR M, TRIGUERO I, et al. A survey on fingerprint minutiae-based local matching for verification and identification: Taxonomy and experimental evaluation[J]. Information Sciences, 2015, 315:67-87.
[5] ISENOR D K, ZAKY S G. Fingerprint identification using graph matching[J]. Pattern Recognition, 1986, 19(2):113-122.
[6] HRECHAK A K, MCHUGH J A. Automated fingerprint recognition using structural matching[J]. Pattern Recognition, 1990, 23(8):893-904.
[7] WATSON C I, WILSON C L. NIST special database 4[EB/OL]. [1992-03-17]. http://www.informatik.uni-ulm.de/ni/Lehre/SS03/ENIPRAKT/nist_sd4.pdf.
[8] WANG Li, BHALERAO A, WILSON R. Fingerprint matching method and apparatus: US,US8588484[P]. 2013-11-19.
[9] HOOKER R E, GREER J M. Bounding box prefetcher: EP, US 8880807 B2[P]. 2014-11-04.
[10]LEE H,GROSSE R,RANGANATH R,et al. Convolutional deep belief networks for scalable unsupervised learning of hierarchical representations[C]// Intematioonal Conference on Machine learning. Montreal,Quebec,Canada:ACM,2009:609-616.
[11]KUREMOTO T, KIMURA S,KOBAYASHI K,et al.Time series forecasting using a deep belief network with restricted Boltmann machines[J]. Neurocomputing,2014,137(15):47-56.
[12]楊陽,張文生. 基于深度學(xué)習(xí)的圖像自動標(biāo)注算法[J]. 數(shù)據(jù)釆集與處理,2015,30(1):88-89.
[13]李飛騰. 卷積神經(jīng)網(wǎng)絡(luò)及其應(yīng)用[D]. 大連: 大連理工大學(xué),2014.
[14]NAKASHIKA T, GARCIA C, TAKIGUCHI T. Local-feature-map integration using convolutional neural networks for music genre classification[C]//13th Annual Conference of International Speech Communication Association(INTERSPEECH 2012). Portland, OR, USA: ISCA,2012:1-4.
[15]LAVIN A. maxDNN: An efficient convolution kernel for deep learning with Maxwell GPUs[J]. arXiv preprint arXiv:1501.06633, 2015.