袁 穎
(貴州警察學院刑事技術系 貴州 貴陽 550000)
指紋因其人各不同且終身不變的性質成為了應用最為廣泛的生物特征識別技術之一,目前,指紋自動識別技術已在教育、金融、公安、社保等行業(yè)開始廣泛應用,并在移動支付、考勤、門禁等人身識別領域取得良好的應用效果。在公安領域,通過指紋自動識別系統(tǒng)對入庫指紋與犯罪現(xiàn)場指紋進行比對來鎖定犯罪嫌疑人,縮小偵查范圍是指紋識別的主要應用形式。傳統(tǒng)的指紋自動識別系統(tǒng)使用的特征點為指紋的二級特征即高爾頓細節(jié)特征[1],在指紋自動識別中以終點、分歧點及小點為基礎,該方法經(jīng)歷了幾十年的演變已經(jīng)十分成熟。然而,近年來隨著人工智能和深度學習技術的發(fā)展,已有不少研究者嘗試在該領域使用不基于指紋細節(jié)特征點的算法對指紋進行識別。
指紋自動識別系統(tǒng)最早始于20世紀60年代,隨著人口的增多城市變得越來越擁擠,犯罪率飆升,各國警局積累的指紋檔案越來越多,美國聯(lián)邦調查局FBI、英國內政部、法國巴黎警方及日本警察廳[2]等各國警政部門開始研究指紋的自動識別系統(tǒng)。法國內政部和形態(tài)數(shù)學實驗室在國立巴黎礦業(yè)大學一起開發(fā)的Morpho系統(tǒng),英國Logica公司為新蘇格蘭廠開發(fā)的logica[3]系統(tǒng),該系統(tǒng)可以捕捉細節(jié)特征點、記錄特征點的方位和方向,探測脊線數(shù)量,這是紋線數(shù)量第一次被AFIS的供應商所使用。日本NEC指紋自動識別系統(tǒng)是直接比對單面或者滾動捺印的三面指紋圖像,采用類似于FBI系統(tǒng)細節(jié)點提取的方法來處理指紋圖像。美國的IAFIS、AFIX Tracker、Printrak,其中最著名的是1999年美國FBI使用的IAFIS系統(tǒng)(Integrated Automated Fingerprint Identification System)[4],該系統(tǒng)是基于比對指紋紋線的細節(jié)特征點,如比對紋線的終點、分叉點等信息,如果兩枚指紋拓撲等價,那么這兩枚指紋可以被判斷為認定同一。
我國的指紋自動識別系統(tǒng)的應用起步較晚,從20世紀80年代初開始,目前國內各地公安系統(tǒng)使用的指紋識別系統(tǒng)供應公司,主要為北大高科、北京東方金指、北京刑科所、北京眾城巨元、海鑫科金薩基姆、漢林信通。除此以外還有清華大學的CAFIS系統(tǒng)、北京大學的Delta系統(tǒng)等。傳統(tǒng)的AFIS系統(tǒng)的識別特征點都是基于高爾頓所提出的指紋細節(jié)特征點,雖然不同的系統(tǒng)具體方法各異,但主要步驟都是分為指紋圖像增強、細節(jié)特征提取、細節(jié)特征匹配三步,如圖1所示。所使用指紋特征點(端點、分叉點)的位置和角度等信息對指紋進行識別,是目前各類指紋自動識別系統(tǒng)中最常見的方法。比對的關鍵是找到指紋圖像樣本和輸入的指紋圖像中特征點的最佳的校準點,然而,由于模糊的圖像質量及復雜的輸入條件,在指紋圖像不清晰時指紋細節(jié)特征點難以提取,在面臨需要和與日俱增的指紋數(shù)據(jù)庫中圖像進行比對時,指紋自動識別系統(tǒng)效率低精度下降。并且,基于特征點的識別算法并不能完全利用日益高清的指紋圖像里的豐富特征信息。
圖1 傳統(tǒng)指紋識別步驟
無特征區(qū)域是指在一定范圍內,在手印沒有變形的正常條件下,形成的手印中沒有高爾頓細節(jié)特征點的區(qū)域,即無起點、終點、分歧、結合、眼形線、短線、勾形線、橋形線、點9種細節(jié)特征,這一區(qū)域成為無特征區(qū)域[5],在國外文獻中也稱為“Open Field”開放區(qū)域[6]。指紋的細節(jié)特征都以細節(jié)點的形式出現(xiàn),作為一個沒有出現(xiàn)特征點的空白范圍區(qū)域,本身就是質量較高的細節(jié)特征,具有較高的鑒定價值。
根據(jù)Osterburg等人[7]早在1977年建立的數(shù)學模型對39枚指紋進行了區(qū)域的劃分,對劃分出來的8591個1平方毫米的區(qū)域進行統(tǒng)計,根據(jù)該統(tǒng)計結果顯示,如圖2所示的無特征點的區(qū)域在指紋中占有的比例是76.60%,其中起點終點是指紋特征點中比例最高的特征,比例為8.32%。Lin等人[8]也在同一時期做了相似的研究,對76個指紋14280個特征點進行了統(tǒng)計,根據(jù)統(tǒng)計發(fā)現(xiàn)無特征區(qū)占有的比例是83.90%,這個比例遠遠高于指紋中特征點的比例,起點終點占比為9.60%。除此以外,還有大量的研究在定性定量的分析過指紋特征點位置關系以后得出結論,指紋紋線是連貫的整體,單獨來看指紋特征點可能存在局限性,指紋中無特征點的區(qū)域的面積比有特征點的區(qū)域面積比例要大很多,即使沒有細節(jié)特征點的區(qū)域也具有重要意義。
圖2 無特征點的區(qū)域
對于指紋無特征區(qū)域的分布問題,洛桑大學的Champod[9-10]用統(tǒng)計學理論統(tǒng)計了指紋特征點的分布情況,研究結果顯示細節(jié)特征在指紋的三角區(qū)域和中心區(qū)域分布比其他區(qū)域的密度要大很多,該研究使用了泊松分布公式,泊松分布的參數(shù)λ是單位時間(或單位面積)內隨機事件的平均發(fā)生率,該研究還基于指紋細節(jié)特征點的位置及密度進行了分析,根據(jù)指紋中的主要位置進行了平均密度評估。此外,使用泊松分布統(tǒng)計指紋特征點分布情況,讓我們能夠預測一定范圍內特征點數(shù)量和一定區(qū)域內指紋細節(jié)特征的變化,以及一定區(qū)域內的無特征區(qū)域分布。這項研究強調了無特征區(qū)域的重要性,廣闊的只有連續(xù)紋線而沒有特征點的區(qū)域,也具有指紋鑒定價值。
首先,挖掘指紋圖像的更多可識別的信息是未來指紋識別的趨勢。指紋無特征區(qū)在被科學化的前提下會對指紋篩查起到一定作用[11]?,F(xiàn)有的基于指紋細節(jié)點的AFIS指紋庫中,還有大量的指紋特征信息未被利用,大大限制了我國刑事案件的破案率和辦案效率。特別是犯罪現(xiàn)場的樣本指紋中大部分是特征點少的殘缺指紋,按照傳統(tǒng)的指紋鑒定標準是不足以進行指紋的認定,然而,在國內外關于指紋鑒定數(shù)量標準的討論表明,指紋的同一性不僅僅由細節(jié)點的數(shù)量決定,還與指紋特征的種類、特殊性、圖像局部質量及特征之間的相互關系等密切相關。而且,隨著指紋采集設備采集到的指紋圖像清晰度的不斷提高,捕獲殘缺指紋圖像中的更多信息成為可能,瑞士聯(lián)邦技術研究所研究了汗孔和指紋的細節(jié)點特征在殘缺指紋匹配中的應用價值[12],研究表明在殘缺指紋中指紋的細節(jié)點信息嚴重不足時,指紋三級特征的價值就十分重要,特別是在分辨率足夠高時,在殘缺指紋圖像中的指紋的汗孔、細點線、紋線形態(tài)等信息有很高的識別價值。美國的研究人員構建了利用1000dpi分辨率指紋圖像中多重特征的AFIS 演示系統(tǒng),進行分級識別,在這樣的分辨率下還有很多指紋信息可以作為識別特征。圖3是用我國公安系統(tǒng)常用的AFIS指紋自動識別系統(tǒng)(北京東方金指)發(fā)送的正查匹配分數(shù)為1000分的比對指紋圖,左邊為在犯罪現(xiàn)場找到的粉末刷顯的汗?jié)撝讣y一枚,右邊為指紋庫指紋,指紋庫的容量為千萬級。左圖中指紋中心有一大塊的模糊區(qū)域,該區(qū)域能隱約看到紋線的走向,但卻并不足以能夠提取指紋特征點,盡管如此,在紋線清晰的部位仍然可以找到大片沒有細節(jié)點特征。如圖3中所示,這樣的模糊樣本中存在大量紋線清晰的區(qū)域可以進行肉眼識別,但AFIS無法標注特征點的區(qū)域。此外,一般的指紋圖像中可以提取的細節(jié)特征點大約是60~80個細節(jié)點,而不同的指紋細節(jié)點個數(shù)也不盡相同,對于模糊指紋這個數(shù)量會更少,但紋線的數(shù)量、形態(tài)、流向特征卻清晰可見。
圖3 AFIS指紋比對圖
其次,傳統(tǒng)基于特征點的經(jīng)典指紋自動識別算法,面臨大庫衰減,急需提高效率。歷經(jīng)幾十年的演變,傳統(tǒng)細節(jié)特征點算法對于十指比對的查重任務,算法準確度與效率都非??捎^。但隨著十指庫和案件庫的不斷積累,經(jīng)典算法在面對大庫衰減的問題上缺點逐步顯現(xiàn),面臨比對效率下降的問題。細節(jié)特征點算法的不足日益明顯,單純的提取局部細節(jié)特征點丟失了大量的指紋其他特征的信息,如局部脊線和谷線的走向并沒有被考慮在內。使用非特征點信息對指紋進行匹配是基于指紋圖像的匹配,不用對指紋圖像進行預處理、二值化,可以提高算法的效率和特征利用率。據(jù)相關研究顯示適當增減細節(jié)特征,控制指紋細節(jié)特征點的相對密度,可以達到提高比重率的效果[14]。
最后,使用非特征點的識別算法可以排除人工對指紋識別的影響。傳統(tǒng)的細節(jié)特征識別的算法最后仍然需要人工進行標注,國內外已有學者研究表明,在指紋自動識別系統(tǒng)中指紋檢驗人員對特征點的標注方式受人的經(jīng)驗和知識背景的影響[13],不同的指紋檢驗人員對標注的指紋發(fā)送正查比對分數(shù)有不同程度的影響。使用基于無特征點的識別可以避免人工干擾,避免這樣的影響。
國內現(xiàn)有的指紋自動識別系統(tǒng)應用中,還沒有直接使用指紋非特征點信息進行識別的系統(tǒng)上線,錢榮欣[15]將算法部署在分布式環(huán)境下,在多節(jié)點下并發(fā)處理大量指紋數(shù)據(jù),并提供實時查詢功能和自動特征提取,提取的是指紋圖像的信息,使用計算機視覺領域的深度學習技術、圖像復原、編碼領域和自適應小波框架技術,提出的新的指紋圖像智能比對系統(tǒng),可以實現(xiàn)完全自動化指紋特征提取無需人工干預。
基于非特征點的指紋識別提取的特征信息有兩類,一類是指紋圖像的全局或者局部紋理信息,另一類是指紋的三級特征。
基于紋理識別的研究。Ross等人[16]使用了綜合指紋識別算法,使用特征點和脊線特征地圖來構建一系列八方向的Gabor濾波。并在2007年也提出了一種新的基于特征點紋理方向的地圖綜合指紋識別算法,應用了八向濾波方向來生成衡量方向的特征碼,用于邊緣提取的線性濾波器對指紋圖像進行特征提取。Nanni和Lumini[17-19]提出了一種基于局部二進制模型LBP的綜合指紋識別算法。LBP一種具有灰度不變性和旋轉不變性的高效的紋理描述算法。Yang 等人[20-21]提出了一種不變瞬間IM的指紋識別算法,該算法使用學習向量量化神經(jīng)網(wǎng)絡LVQNN來進行匹配,并提取7個不變的的瞬間作為指紋向量對指紋進行識別。Yang等人還使用棋盤格不變瞬間或是淺區(qū)域IM和特征值加權余弦EWC距離和非線性反向傳播神經(jīng)網(wǎng)絡BPNN來處理指紋識別不同的輸入條件?;谏疃葘W習的研究還包括神經(jīng)網(wǎng)絡(ANN)[22]、反向神經(jīng)網(wǎng)絡(BPNN)[23]、 線性矢量量化(LVQ)[24]、極限學習機(ELM)[25]等。
基于指紋三級特征的識別,主要是基于汗孔識別的研究。Zhao[26]等人提出了一種直接用汗孔進行匹配的方法,利用指紋汗孔周圍的脊線紋理等信息進行特征的粗匹配,然后利用粗匹配的結果建立特定的數(shù)學模型提出粗匹配過程中的錯誤特征點,以此來提高匹配的精度和效率。Roddy和Stosz[27]基于指紋自動比對算法提出了一種可以評估汗孔作為指紋識別效果的模型,并在國家安全局的指紋自動識別系統(tǒng)中使用,該系統(tǒng)是那時唯一利用汗孔作為識別特征的比對系統(tǒng)。他們還研究了汗孔的統(tǒng)計學信息,從統(tǒng)計學的角度證明了兩個不同人的指紋中20個汗孔都重復的概率是5.18 x 10-8,以此來證明了汗孔作為人身識別的意義。Aditya Abhyankar和Stephanie Schuckers[28]在文獻中使用小波變換提升指紋三級特征的識別精度,提出基于校準匹配精度的三角形匹配方法,算法把指紋特征按照一定的規(guī)則相連接起來,連接的特征點構成一個三角,統(tǒng)計出兩副指紋的相似角形個數(shù),就可以進行匹配,該研究對114個像素為686PPI的指紋進行了測試,通過組后的統(tǒng)計圖表顯示,其匹配性能得到了提高。Ray等人[29]嘗試從500PPI的指紋圖像中提取汗孔,來識別汗孔的位置并在指紋比對系統(tǒng)中使用。Arun Ross[30]等人提出的指紋配算法考慮到了指紋的非線性形,要利用板條函數(shù)算出指紋的非線性形,采用校準配的方法。
其中還包括一些經(jīng)典的先進的描述符,Tico等人[31]提出了一種基于變換的識別算法使用離散沃爾什變換DWT來對特征進行變換。沃爾什函數(shù)為基本函數(shù)的一種非正弦正交變換特征,是從指紋圖像細節(jié)在不同規(guī)模和方向上的數(shù)字小波DWT系數(shù)標準的偏差來進行分析的。Amornraksa和Tachaphetpiboon[32]提出了另一種基于數(shù)字余弦變換DCT的識別算法對特征進行分析,該方法顯示了輸入指紋與指紋庫指紋的高比對率。Jin等人[33]提出了一種基于變換的識別算法,基于整合小波及傅立葉-梅林變換WFMT的框架工作來實現(xiàn)特征點的提取。大量的WFMT特征通過FMT的線性特征可以用于形成相關的定值特征,來減少輸入指紋圖像的變化。
總之,現(xiàn)有使用不基于指紋特征點的識別算法主要是將含有指紋特征點特征、中心、三角等紋線特征作為完成的指紋圖像來進行識別,使用指紋圖像本身的紋理信息和神經(jīng)網(wǎng)絡結合進行識別。一方面,指紋的紋理信息是指指紋的紋線方向、紋線數(shù)量、紋線形態(tài)、紋理信息等。紋理是物體表面的自然特性,紋理通過像素及其周圍空間鄰域的灰度分布來表現(xiàn)。它描述圖像像素點與圖像領域之間的灰度空間的分布關系,紋理特性的隨機牲很強,使用指紋的紋理信息進行識別可以提取更多更豐富的指紋信息,并且不進行預處理階段的二值化、骨架化處理。優(yōu)點是精度高、速度快,與其他系統(tǒng)的耦合性高。另一方面,深度學習算法是將特征提取的設計和特征選擇這兩個步驟合二為一。此外,還伴隨一些經(jīng)典和最先進的非細節(jié)的基礎描述符的使用,如Gabor濾波器,DWT,DCT,WFMT,LBP,HOG,IM等。
與傳統(tǒng)基于細節(jié)特征的經(jīng)典算法相比較,基于非細節(jié)特征的算法在實際應用方面還存在一定的技術困難,基于深度學習的識別方式,雖然高效準確,但使用上還是有許多需要注意的地方,例如選擇恰當模型的前期訓練時間較長,以及對于前期的學習訓練材料的質量和數(shù)量要求敏感等問題。但隨著模式識別技術、人工智能技術的應用,高分辨率指紋采集設備的普及,長遠看基于非特征點識別的方式是解決目前傳統(tǒng)基于特征點識別算法面臨的大庫衰減等問題,為解決可識別特征點少的殘缺指紋的識別問題,以及指紋自動識別中人工干預帶來的誤差等問題提供可能,應用前景廣闊。