黃艷國, 楊訓(xùn)根, 周滿國
(江西理工大學(xué)電氣工程與自動化學(xué)院, 贛州 341000)
基于生物特征的身份識別技術(shù)越來越普及,各類產(chǎn)品漸漸融入日常生活。類似指紋[1-2]、人臉[3-5]等識別系統(tǒng)被廣泛用于手機的解鎖與支付軟件當(dāng)中。而身份識別產(chǎn)品的關(guān)鍵技術(shù)是基于人的生物特征,如指紋、人臉、虹膜[6]、掌紋[7]和靜脈等。手指靜脈作為人的生物特征之一,近年來也有許多的研究方法被提出,并取得了良好的識別效果。相對于一些基于深度學(xué)習(xí)的卷積神經(jīng)網(wǎng)絡(luò)[8]方法,傳統(tǒng)特征因其所需數(shù)據(jù)少、對硬件要求低、能夠達(dá)到較高識別率等特點,在實際應(yīng)用上具備一定的優(yōu)勢。
關(guān)鍵點的匹配是手指靜脈識別的有效手段,Meng等[9]結(jié)合感興趣區(qū)域與細(xì)節(jié)匹配,提出了基于區(qū)域的檢測方法,通過計算Hessian矩陣作為細(xì)節(jié)點特征,對于細(xì)節(jié)點的匹配采用鄰域匹配以減少計算量,取得了較好的識別率,但相應(yīng)地增加了匹配時間。Jin等[10]提出的基于二值圖像的算法,對感興趣區(qū)域提取特征點,利用梯度直方圖將特征點矢量化描述,有效縮小了圖像視野,為靜脈采集裝置的小型化提供思路,但算法的識別率仍有較大的提升空間。局部二值模式(local binary patterns, LBP)特征被成功運用于目標(biāo)檢測與跟蹤[11]任務(wù)中,在手指靜脈識別方面也有許多研究。劉超等[12]在LBP算子的基礎(chǔ)上,根據(jù)圖像的分塊包含的信息量,通過逐步迭代的方式得出分塊圖像的權(quán)值,有效提升了算法的識別率,但求取權(quán)值系數(shù)過程計算量大、耗費時間過長,降低了算法的時效性。而胡娜等[13]提出雙向主成分分析(principal component analysis,PCA)降維,對分塊圖像特征進(jìn)行行和列的雙向降維,相對于傳統(tǒng)LBP算法,有效提升了識別率,同樣降低了識別速度。稀疏表示模型也是靜脈識別的一類有效方法,Lei等[14]在稀疏表示模型中引入歐氏距離計算距離熵,有效抑制了圖像的噪聲干擾,相比于原有的模型,有效降低了等錯誤率,但相較于傳統(tǒng)特征算子,識別率還需要進(jìn)一步提升。
基于以上分析,LBP算子在靜脈識別上具備優(yōu)良的性能,在LBP算子的基礎(chǔ)上,現(xiàn)通過局部平均的方式加強LBP算子的紋理表達(dá)能力,然后結(jié)合信息熵[15]作為加權(quán)系數(shù)得出熵值加權(quán)的局部二值模式(entropy weighted local binary patterns,ELBP)特征。而對于原始圖像提取感興趣區(qū)域[16],消除手指周圍區(qū)域的干擾。同時,為提升算法的識別率與識別速度,采用主成分分析(PCA)將特征維數(shù)降低,最后使用歐式距離與曼哈頓距離計算相似性,對比驗證本文方法的有效性。
手指區(qū)域的提取,去除了許多手指未覆蓋的干擾區(qū)域,有利于提升算法的識別率。首先將原圖像轉(zhuǎn)化為灰度圖,對灰度圖做邊緣濾波[17]處理,如圖1(b)所示。從圖1(b)中可以看出,邊緣算子能夠很好地凸顯手指的邊緣部分。然后通過簡單閾值分割凸顯手指邊緣,為方便手指區(qū)域的提取,其中全局閾值設(shè)為100,像素小于100時為0,大于或等于100時為1,得到二值圖像如圖1(c)所示。
由圖1(c)可知,受檢測器的影響,圖像左右兩邊的手指邊緣被包含,為準(zhǔn)確提取手指區(qū)域,將二值圖像分為上下兩部分,如圖1(d)所示。分別求出每部分的最密集邊緣,即為對應(yīng)的邊界,根據(jù)求得的邊界坐標(biāo),可得出原圖的候選區(qū)域,如圖1(e)所示。最后得到的候選區(qū)域如圖1(f)所示,從圖1(f)中可以看出,此方法能夠較完整地保留了待測手指的完整性,有效地去除了冗余區(qū)域。
圖1 ROI提取示意圖Fig.1 ROI extraction process
LBP作為經(jīng)典的紋理特征,在圖像識別與目標(biāo)檢測中得到了廣泛的應(yīng)用。其主要是通過像素與鄰域像素的大小比較,并用0和1表示比較結(jié)果,然后將一系列0與1組合為一個二進(jìn)制數(shù),之后轉(zhuǎn)化為十進(jìn)制數(shù)即為中心像素的LBP值,最后通過直方圖統(tǒng)計,得出圖像的LBP特征。像素LBP值轉(zhuǎn)換公式為
(1)
li=f(c,ni)
(2)
(3)
式中:f(x,y)為比較函數(shù);c為中心像素點;ni為鄰域像素點;li為鄰域像素比較結(jié)果;i為像素對應(yīng)編號;L為求得的LBP值。
為提升LBP算子的識別性能,通過計算鄰域像素的均值,使LBP算子包含鄰域像素之間的大小信息,同時與中心像素比較取更大值作為新的中心像素,計算公式為
(4)
nc=max(c,mean)
(5)
式中:N為鄰域像素個數(shù);mean為均值;nc為新的中心像素。
圖2 LALBP編碼原理Fig.2 LALBP coding principle
將求得nc代入式(2)和式(3)中可得LALBP值,計算過程如圖2所示。將原圖像轉(zhuǎn)化為LALBP圖后,使用梯度直方圖統(tǒng)計可得256維的特征描述子,即圖像的LALBP特征。
信息熵是香農(nóng)在1948年根據(jù)熱力學(xué)中的熱熵[18]提出的,其描述的是信息源的不確定度。當(dāng)信息源的不確定性越高,信息熵越大,其包含的信息量越大。利用信息熵表述圖像的分塊信息量,根據(jù)信息熵的大小分配權(quán)值,可提高重要特征密集區(qū)域的表達(dá),提升識別率,信息熵與權(quán)值的計算公式為
(6)
式(6)中:P為像素級數(shù)大小為k時在圖像中出現(xiàn)的概率;E為信息熵;wi為塊i的權(quán)值系數(shù);Ei為塊i的信息熵值;m為分塊數(shù)。
將原圖劃分為8塊,對于每個分塊分別求LALBP特征并計算信息熵大小,將信息熵作為對應(yīng)塊的LALBP特征的系數(shù),得到ELBP的直方統(tǒng)計圖,最后將各塊的特征歸一化后級聯(lián)得到圖像的ELBP特征,提取流程如圖3所示。
圖3 ELBP特征提取示意圖Fig.3 ELBP feature extraction diagram
靜脈圖像的識別主要包括訓(xùn)練和識別兩部分,訓(xùn)練過程將提取每幅圖像的特征算子儲存到訓(xùn)練庫中,識別過程需要對提取的特征與訓(xùn)練庫進(jìn)行匹配比較,識別出待測圖像屬于訓(xùn)練庫中的哪一類,流程圖如圖4所示。
圖4 識別算法流程圖Fig.4 Flow chart of recognition algorithm
首先提取原圖像的ROI區(qū)域并歸一化至64×128大小,得到相同大小的特征提取圖像;然后根據(jù)歸一化后圖像的尺寸,將圖像分為m大小相同的子塊,分別對子塊圖像提取LALBP特征,之后通過式(4)和式(5)得到對應(yīng)塊的信息熵與加權(quán)系數(shù),將系數(shù)與對應(yīng)塊的特征相乘后級聯(lián),得到熵值加權(quán)的ELBP特征;最后利用向量距離計算方法歐氏距離、曼哈頓距離等作為相似度計算公式,計算待識別圖像與訓(xùn)練庫中所有樣本的相似度,采用最近鄰分類方式得出相似度最大的樣本類,待測圖像的識別結(jié)果即為對應(yīng)的類。
分別采用歐氏距離以及曼哈頓距離作為對比分類器,對于每一個待識別樣本,提取特征后分別與訓(xùn)練庫中的樣本特征求特征向量的距離,距離最小的訓(xùn)練樣本對應(yīng)的類型即分別為匹配類型。歐氏距離與曼哈頓距離計算公式分別為
(7)
(8)
式中:xi為訓(xùn)練庫的特征因子;yi為待識別特征因子;n為特征維數(shù);dE為歐氏距離計算結(jié)果;dM為曼哈頓距離計算結(jié)果。
采用的數(shù)據(jù)集為SDUMLA數(shù)據(jù)庫與天津市智能實驗室采集指靜脈圖像數(shù)據(jù)庫。SDUMLA數(shù)據(jù)庫分別采集了106人,有636種手指類型,圖像大小為320×240。天津數(shù)據(jù)庫則采集了66根不同手指,每類15幅圖像,圖像為尺寸為80×170。
在SDUMLA數(shù)據(jù)庫中分別選取1、2、3、4、5幅圖像為訓(xùn)練樣本數(shù),組建5個不同的訓(xùn)練庫,通過PCA降維,得到在不同訓(xùn)練樣本數(shù)下,ELBP特征維數(shù)與識別率的關(guān)系,結(jié)果如圖5所示。
圖5 特征維數(shù)對比Fig.5 Feature dimension comparison
對比圖5中兩種分類方式可以看出,ELBP的主要特征只有80維,維數(shù)上升到80之后,識別率處于穩(wěn)定狀態(tài),并且特征維數(shù)對識別率的影響在不同分類器上變化趨勢一致。同時,隨著樣本數(shù)量的增加,識別率越穩(wěn)定,所需的特征維數(shù)越低。由圖5可知,當(dāng)訓(xùn)練樣本數(shù)為5時,特征維數(shù)為40時識別率便基本不變?;谄ヅ鋾r間與識別率的綜合考慮,選取80作為維數(shù)降低后特征的長度較為合適,既提升了識別率又兼顧了訓(xùn)練樣本數(shù)量的變化,同時能夠極大程度縮短匹配時間。
歐氏距離與曼哈頓距離同樣作為向量距離的計算方法,但作為識別系統(tǒng)的分類器性能上有很大的差異,一個優(yōu)良的分類器能夠有效地提升識別系統(tǒng)的識別率,LBP、HOG、LBP-PCA與本文方法在不同分類方式下的識別率與識別時間如表1所示。
表1 兩種分類器性能對比
從表1可以看出,在識別率方面,LBP、ELBP和ELBP-PCA特征采用曼哈頓距離計算相似度的識別率更高,相對于歐氏距離分別提升了0.48%、0.16%和0.47%,HOG特征保持不變,而LBP-PCA降低了0.47%;在時間方面,兩種計算方式并無明顯差異,因此本文所選特征算子更適合采用曼哈頓距離作為相似度計算的方法。同時對比幾種特征算子的結(jié)果可以發(fā)現(xiàn),HOG特征雖然識別率達(dá)到了99.21%,但匹配時間過長;LBP-PCA識別時間為8.3 ms,滿足一般識別要求,但識別率僅為94.97%,相對于其他方法偏低;而本文方法識別率最高,達(dá)到了99.53%,同時匹配時間最低為2.5 ms,因此本文方法在識別率與匹配時間上相對其他方法具有一定的優(yōu)勢。
利用維數(shù)選取的5個數(shù)據(jù)庫,對比分析LBP、HOG、LBP-PCA與本文算法識別率、識別時間與樣本個數(shù)的關(guān)系,其中,識別率與訓(xùn)練樣本個數(shù)關(guān)系如圖6所示。
從圖6中可以看出,訓(xùn)練樣本個數(shù)為2時,識別率達(dá)到了低谷,但低谷并不是特征算子導(dǎo)致。因此針對此數(shù)據(jù)集,樣本數(shù)為2時效果最差,同時樣本數(shù)為5時,相較于1、2、3、4,識別率有明顯的提升,所以樣本數(shù)量的增加能夠有效提升識別率。對比圖6(a)和圖6(b),可以看出,不同的分類方式下,識別率會有一定的變化,但本文提出的ELBP-PCA特征,在兩種距離計算方法下,識別率均高于其他特征,在不同訓(xùn)練樣本個數(shù)下均有一定的優(yōu)勢。
由以上實驗分析可知,本文算法在SDUMLA數(shù)據(jù)庫中的識別率最高為99.53%,高于其他對比特征,同時表明了本文算法的高性能。為證明本文算法的通用性,而不是針對某一數(shù)據(jù)集有較好的性能,將本文算法與LBP、HOG和LBP-PCA等特征在天津數(shù)據(jù)庫上進(jìn)一步對比分析。
天津靜脈數(shù)據(jù)庫樣本中,每種類型包含15個樣本,可分別選取1、3、5、7、9個訓(xùn)練樣本數(shù)構(gòu)建5個訓(xùn)練庫,分析各算法在天津數(shù)據(jù)庫上的識別率與訓(xùn)練樣本個數(shù)的關(guān)系。在不同訓(xùn)練樣本個數(shù)的情況下,得出不同特征的識別率,同時也可反映出本文方法在天津靜脈數(shù)據(jù)庫上的性能,得出的各類方法所能取得的最高識別率。同樣采用兩種不同的距離計算方式構(gòu)建分類器,計算不同訓(xùn)練樣本下的識別率,對比結(jié)果如表2所示。
由表2可知,各類特征在此數(shù)據(jù)集上的識別率均在94%以上,表明紋理和梯度特征在靜脈識別中有較好的性能。比較樣本個數(shù)與識別率的關(guān)系可知,天津數(shù)據(jù)庫的最佳樣本數(shù)個數(shù)應(yīng)在3~5,過多的樣本反而會降低識別率。其中利用歐式距離分類,訓(xùn)練樣本個數(shù)為3時,ELBP的識別率達(dá)到最大值99.74%,高于LBP的97.53%,與HOG持平;而使用曼哈頓距離分類時,訓(xùn)練樣本個數(shù)為5時,識別率達(dá)到99.84%,高于LBP、HOG的98.75%、99.74%,表明ELBP特征在不同的數(shù)據(jù)集上仍有很好的識別性能。
圖6 訓(xùn)練樣本數(shù)對比Fig.6 Comparison of the number of training samples
表2 不同訓(xùn)練樣本個數(shù)下的識別率
結(jié)合信息熵與改進(jìn)型LBP算子提出了信息熵加權(quán)的ELBP算子,整體上突出圖像部分信息豐富區(qū)域的表達(dá),對于單個LBP算子通過引入鄰域像素間的關(guān)系加強了LBP算子的識別性能,并通過PCA降維,消除冗余特征,提升了圖像的識別率與匹配速度。實驗結(jié)果表明,本文算法能夠有效提升識別率,在兩個數(shù)據(jù)集上最高識別率分別達(dá)到99.53%、99.84%,相對于單一的LBP、HOG算法,具有更高的識別性能,并且在識別時間上同樣具有一定的優(yōu)勢。同時經(jīng)過實驗驗證,本文算法與曼哈頓距離結(jié)合識別性能更好。