李莧蘭,張 頂,黃 晞
(福建師范大學(xué) 光電與信息工程學(xué)院 福建省光電傳感應(yīng)用工程技術(shù)研究中心,福州 350007)
生物特征識(shí)別技術(shù)作為目前最為方便與安全的識(shí)別技術(shù),近年來(lái)得到了廣泛關(guān)注,比如支付寶公司推出了基于個(gè)人聲紋和人臉識(shí)別的認(rèn)證支付技術(shù).生物識(shí)別技術(shù)主要是指利用個(gè)體的生物特征進(jìn)行身份認(rèn)證的一種技術(shù),目前主要的研究是針對(duì)個(gè)體的虹膜、指紋、掌紋、人臉等生物特征展開(kāi)工作.相比之下,對(duì)于人體靜脈紋的研究相對(duì)較少,而靜脈紋在特征穩(wěn)定性、獨(dú)特性和持久度方面具有一定的優(yōu)勢(shì).
掌靜脈識(shí)別技術(shù)中,掌靜脈圖像質(zhì)量對(duì)后續(xù)特征提取與匹配有著直接的影響,從而影響最終的識(shí)別率.因此,在特征提取之前需要對(duì)靜脈圖像進(jìn)行質(zhì)量評(píng)價(jià),以剔除不適合特征識(shí)別的低質(zhì)量靜脈圖像.
圖像質(zhì)量評(píng)價(jià)可以分為主觀評(píng)價(jià)和客觀評(píng)價(jià),有參考評(píng)價(jià)部分參考以及無(wú)參考評(píng)價(jià),考慮到掌靜脈圖像評(píng)價(jià)為實(shí)時(shí)評(píng)價(jià)且無(wú)標(biāo)準(zhǔn)圖像可供參考,本文選擇的是客觀無(wú)參考的評(píng)價(jià)方法對(duì)圖像進(jìn)行質(zhì)量評(píng)價(jià).近年來(lái),廣大學(xué)者們針對(duì)靜脈無(wú)參考評(píng)價(jià)這一課題做了大量的研究.文獻(xiàn)[1]研究了近紅外成像所生成的灰度圖像的評(píng)價(jià)方法,分析了基于信息容量、能量譜-熵、偽信噪比的評(píng)價(jià)方法,以及每種方法所適用的場(chǎng)合,建立了基于靜脈圖像質(zhì)量的評(píng)價(jià)方法.文獻(xiàn)[2]中在分析人類視覺(jué)系統(tǒng)(HVS)性能的基礎(chǔ)上,將圖像有效區(qū)域、對(duì)比度、位置偏移度、模糊度、信息熵作為評(píng)價(jià)手指靜脈圖像質(zhì)量的參數(shù).并綜合分析這些參數(shù),加權(quán)獲得靜脈圖像總質(zhì)量評(píng)價(jià)函數(shù).文獻(xiàn)[3]提出了一種基于灰度共生矩陣及模糊邏輯的手掌靜脈圖像質(zhì)量評(píng)價(jià)方法.通過(guò)研究對(duì)比度、熵、相關(guān)性的值與靜脈紋理結(jié)構(gòu)信息的關(guān)系,建立模糊推理系統(tǒng)對(duì)圖像質(zhì)量做出了最佳判別,從而驗(yàn)證了采集系統(tǒng)的性能.文獻(xiàn)[4]組合圖像質(zhì)量評(píng)價(jià)法采用清晰度和對(duì)比度、相關(guān)系數(shù)的組合方法來(lái)評(píng)價(jià)生物特征圖像質(zhì)量.文獻(xiàn)[5]結(jié)合手背靜脈圖像結(jié)構(gòu)特點(diǎn),選取了有效區(qū)域尺寸、對(duì)比度、清晰度、位置偏移和旋轉(zhuǎn)角度作為手背靜脈圖像質(zhì)量評(píng)價(jià)的參數(shù).基于各參數(shù)改變對(duì)識(shí)別率影響曲線,提出了根據(jù)其平均斜率確定參數(shù)最優(yōu)權(quán)值的方法,并利用加權(quán)的方法對(duì)各質(zhì)量參數(shù)評(píng)分進(jìn)行融合,最終得到手背圖像總質(zhì)量分?jǐn)?shù).文獻(xiàn)[6]提取了空間域梯度、對(duì)比度、圖像的二維熵、位置偏移度、信噪比等5 個(gè)特征值,然后對(duì)其進(jìn)行加權(quán)融合進(jìn)而建立質(zhì)量評(píng)估模型.文獻(xiàn)[7]提出通過(guò)提取輸入圖像的梯度、對(duì)比度以及信息熵3 個(gè)特征參數(shù),來(lái)對(duì)手指靜脈圖像的質(zhì)量進(jìn)行評(píng)價(jià),然后,通過(guò)支持向量機(jī)對(duì)評(píng)價(jià)的結(jié)果進(jìn)行融合.文獻(xiàn)[8]通過(guò)對(duì)質(zhì)量評(píng)估算法與識(shí)別算法的有效結(jié)合,提出了一種基于質(zhì)量評(píng)估的手指靜脈識(shí)別算法,進(jìn)一步提高了識(shí)別精度.文獻(xiàn)[9]通過(guò)對(duì)采集的靜脈圖像進(jìn)行分析,提出了一種基于Radon 變換的質(zhì)量評(píng)估算法,實(shí)現(xiàn)了對(duì)手指靜脈圖像質(zhì)量的評(píng)估.文獻(xiàn)[10]提出了一種新穎的手指靜脈圖像評(píng)估方法,以減少低質(zhì)量圖像對(duì)識(shí)別性能的影響.首先,提取手指靜脈圖像的梯度,圖像對(duì)比度和信息熵作為圖像質(zhì)量分?jǐn)?shù).其次,提出了基于三角范數(shù)的分?jǐn)?shù)融合方法來(lái)區(qū)分圖像質(zhì)量.
通過(guò)以往學(xué)者的研究發(fā)現(xiàn),對(duì)于靜脈圖像質(zhì)量評(píng)價(jià),主要是通過(guò)提取一些可以反映圖像質(zhì)量的特征,然后對(duì)這些特征進(jìn)行加權(quán)融合得出圖像的質(zhì)量分?jǐn)?shù).加權(quán)系數(shù)的確定存在一定的主觀性,或加權(quán)的算法較為復(fù)雜,算法的可解釋性不強(qiáng),評(píng)價(jià)方法的準(zhǔn)確度有待提升.傳統(tǒng)的方法所建立的模型不能全面、科學(xué)和本質(zhì)的反應(yīng)靜脈數(shù)據(jù)的復(fù)雜特性,造成了信息量的丟失和分類準(zhǔn)確性的不足,嚴(yán)重制約著靜脈識(shí)別系統(tǒng)性能的進(jìn)一步提高.BP-AdaBoost 算法結(jié)構(gòu)簡(jiǎn)單,具有很強(qiáng)的非線性映射能力,自學(xué)習(xí)和自適應(yīng)能力,以及泛化能力和容錯(cuò)能力,能夠通過(guò)對(duì)樣本集的訓(xùn)練學(xué)習(xí),達(dá)到較高的分類準(zhǔn)確率.克服了傳統(tǒng)評(píng)價(jià)方法中,評(píng)價(jià)模型復(fù)雜,評(píng)價(jià)結(jié)果不夠客觀,無(wú)法全面本質(zhì)的反映靜脈數(shù)據(jù)的復(fù)雜特性等的一系列缺點(diǎn).基于此,本文在前人研究的基礎(chǔ)上,使用簡(jiǎn)單的BP 網(wǎng)絡(luò)建立綜合評(píng)價(jià)模型,同時(shí)結(jié)合AdaBoost 算法進(jìn)一步提升評(píng)價(jià)模型的準(zhǔn)確度.實(shí)驗(yàn)結(jié)果證明,該方法能夠?qū)D像進(jìn)行準(zhǔn)確的評(píng)價(jià).
如何實(shí)現(xiàn)對(duì)掌靜脈圖像質(zhì)量的合理評(píng)價(jià),以期符合人類視覺(jué)主觀感受,從而提高整個(gè)識(shí)別系統(tǒng)的性能.評(píng)價(jià)指標(biāo)的確定顯得尤為重要.本文中,分別從圖像的前景與背景的對(duì)比度,圖像靜脈信息豐富度,圖像脈絡(luò)紋理清晰度等幾個(gè)方面考量.確定了以對(duì)比度、信息熵、清晰度、等效視數(shù)為評(píng)價(jià)指標(biāo)的評(píng)價(jià)體系.
就掌靜脈圖像而言,對(duì)比度主要體現(xiàn)在靜脈部分和非靜脈部分的灰度比值.總的來(lái)說(shuō),對(duì)比度大的圖像靜脈紋理更清晰,更容易看出靜脈的紋理結(jié)構(gòu),分布與走勢(shì).而對(duì)比度低的靜脈圖像,其紋理結(jié)構(gòu)特征不明顯.因此,對(duì)比度差的圖像容易在識(shí)別處理過(guò)程中產(chǎn)生錯(cuò)誤,影響識(shí)別系統(tǒng)的準(zhǔn)確率.
圖像的對(duì)比度是指圖像的均方差,圖像的灰度差異,可以表示為式(1):
其中,C為圖像的均方差(對(duì)比度),xi為圖像的像素值,xmean為圖像像素均值,N為一幅圖像總的像素點(diǎn)個(gè)數(shù).
我們選擇3 幅對(duì)比度不同的圖像如圖1 所示,并對(duì)其進(jìn)行了對(duì)比度的測(cè)量統(tǒng)計(jì),如表1 所示.
圖1 不同對(duì)比度掌靜脈圖像的ROI 區(qū)域
表1 圖1 中3 幅圖像對(duì)比度數(shù)值比較
對(duì)照?qǐng)D1 和表1 我們可以得出,圖1(a)的圖像最清晰,圖像質(zhì)量最好,相比較而言圖1(b)次之,而圖1(c)圖像質(zhì)量最差,最模糊,對(duì)應(yīng)于表1 的數(shù)據(jù),圖1(a)的對(duì)比度值最大,圖1(b)次之,圖1(c)最小,因此我們可以說(shuō)對(duì)比度大的圖像質(zhì)量較好.同時(shí),為了說(shuō)明此結(jié)論的一般性,我們選擇170 幅掌靜脈圖像,分別為高質(zhì)量低質(zhì)量各85 幅,利用Matlab 軟件繪制的對(duì)比度與圖像質(zhì)量關(guān)系的統(tǒng)計(jì)散點(diǎn)圖如圖2 所示,可看出高質(zhì)量的圖像較于低質(zhì)量圖像具有更大的對(duì)比度.綜上,可以將對(duì)比度確定為本文掌靜脈圖像質(zhì)量評(píng)價(jià)系統(tǒng)的重要指標(biāo)之一.
一幅數(shù)字圖像是由不同的像素點(diǎn)組成的,不同的像素點(diǎn)分布的不同位置不同概率,形成不同的圖像.對(duì)于灰度靜脈圖像而言,其像素點(diǎn)的分布信息越豐富,靜脈圖像所含的信息量越大,從而表現(xiàn)為更清晰的靜脈紋路.對(duì)于靜脈信息熵的計(jì)算,由式(2)確定:
其中,H為圖像信息熵,i為像素值范圍0~255,pi表示像素值為i的像素在圖像中出現(xiàn)的概率.
我們選擇3 幅信息熵不同的圖像如圖3,并對(duì)其進(jìn)行了對(duì)比度的測(cè)量統(tǒng)計(jì),如表2 所示.
圖2 掌靜脈圖像對(duì)比度統(tǒng)計(jì)散點(diǎn)圖
圖3 不同信息熵掌靜脈圖像的ROI 區(qū)域
表2 圖3 中3 幅圖像信息熵?cái)?shù)值比較
對(duì)照?qǐng)D3 和表2 我們可以得出,圖3(a)的圖像最清晰,圖像質(zhì)量最好,相比較而言圖3(b)次之,而圖3(c)圖像質(zhì)量最差,最模糊,對(duì)應(yīng)于表2 的數(shù)據(jù),圖3(a)的信息熵最大,圖3(b)次之,圖3(c)最小,因此我們可以說(shuō)信息熵大的圖像質(zhì)量較好.類比于對(duì)比度分析,同樣利用Matlab 軟件繪制的信息熵與圖像質(zhì)量關(guān)系的統(tǒng)計(jì)散點(diǎn)圖如圖4 所示,可看出高質(zhì)量的圖像較于低質(zhì)量圖像具有更大的信息熵.綜上,可將信息熵確定為本文掌靜脈圖像質(zhì)量評(píng)價(jià)系統(tǒng)的重要指標(biāo)之一.
清晰度作為衡量圖像質(zhì)量的重要指標(biāo)之一,是一種以人為主觀感覺(jué)為主的一種評(píng)判標(biāo)準(zhǔn).靜脈紋理走向是否清晰取決于圖像的清晰度.本文參考文獻(xiàn)[5]中的方法.首先用Canny 算子提取靜脈圖像的邊緣,得到邊緣圖像,然后統(tǒng)計(jì)所得邊緣圖像的前景像素點(diǎn)個(gè)數(shù),用前景像素點(diǎn)個(gè)數(shù)來(lái)表示圖像靜脈邊緣區(qū)域面積大小S1,最后把邊緣面積S1與圖像大小S的比值作為圖像的清晰度,如式(3)所示:
我們選擇3 幅清晰度不同的圖像如圖5 所示,并對(duì)其進(jìn)行了清晰度的測(cè)量統(tǒng)計(jì),如表3 所示.
圖4 掌靜脈圖像信息熵統(tǒng)計(jì)散點(diǎn)圖
圖5 不同清晰度掌靜脈圖像的ROI 區(qū)域
表3 圖5 中3 幅圖像清晰度數(shù)值比較
對(duì)照?qǐng)D5 和表3 我們可以得出,圖5(a)的圖像最清晰,圖像質(zhì)量最好,相比較而言圖5(b)次之,而圖5(c)圖像質(zhì)量最差,最模糊,對(duì)應(yīng)于表3 的數(shù)據(jù),圖5(a)的清晰度值最大,圖5(b)次之,圖5(c)最小,因此我們可以說(shuō)清晰度好的圖像質(zhì)量較好.類比于前面的分析,同樣利用Matlab 軟件繪制的清晰度與圖像質(zhì)量關(guān)系的統(tǒng)計(jì)散點(diǎn)圖如圖6 所示,可看出高質(zhì)量的圖像較于低質(zhì)量圖像具有更大的清晰度值.綜上,可以將清晰度確定為本文掌靜脈圖像質(zhì)量評(píng)價(jià)系統(tǒng)的重要指標(biāo)之一.
等效視數(shù)作為圖像質(zhì)量評(píng)價(jià)的重要標(biāo)準(zhǔn)之一.研究發(fā)現(xiàn)[11]在掌靜脈圖像質(zhì)量評(píng)價(jià)的過(guò)程中,運(yùn)用等效視數(shù)這一指標(biāo)可以很好的反應(yīng)靜脈圖像紋理的清晰性,體現(xiàn)整幅圖像的灰度對(duì)比度,等效視數(shù)越大,對(duì)比度越小,圖像越模糊,圖像質(zhì)量越差.等效視數(shù)可以由式(4)確定:
其中,μ為圖像灰度均值,σ為圖像灰度標(biāo)準(zhǔn)差.
我們選擇3 幅等效視數(shù)不同的圖像如圖7 所示,并對(duì)其進(jìn)行了等效視數(shù)的測(cè)量統(tǒng)計(jì),如表4 所示.
圖6 掌靜脈圖像清晰度統(tǒng)計(jì)散點(diǎn)圖
圖7 不同等效視數(shù)掌靜脈圖像的ROI 區(qū)域
表4 圖7 中3 幅圖像等效視數(shù)數(shù)值比較
對(duì)照?qǐng)D7 和表4 我們可以得出,圖7(a)的圖像最清晰,圖像質(zhì)量最好,相比較而言圖7(b)次之,而圖7(c)圖像質(zhì)量最差,最模糊,對(duì)應(yīng)于表4 的數(shù)據(jù),圖7(c)的等效視數(shù)最大,圖7(b)次之,圖7(a)最小,因此我們可以說(shuō)等效視數(shù)小的圖像質(zhì)量較好.類比于前面的分析,同樣利用Matlab 軟件繪制的等效視數(shù)與圖像質(zhì)量關(guān)系的統(tǒng)計(jì)散點(diǎn)圖如圖8 所示,可看出高質(zhì)量的圖像較于低質(zhì)量圖像具有更小的等效視數(shù)值.綜上,可以將等效視數(shù)確定為本文掌靜脈圖像質(zhì)量評(píng)價(jià)系統(tǒng)的重要指標(biāo)之一.
圖8 掌靜脈圖像等效視數(shù)統(tǒng)計(jì)散點(diǎn)圖
上述確定了4 個(gè)評(píng)價(jià)指標(biāo),若只根據(jù)某一指標(biāo)來(lái)評(píng)價(jià)圖像質(zhì)量,顯然無(wú)法準(zhǔn)確區(qū)分圖像質(zhì)量的優(yōu)劣.因此考慮綜合使用4 種指標(biāo)對(duì)靜脈圖像進(jìn)行評(píng)價(jià)分類.傳統(tǒng)評(píng)價(jià)方法即將各指標(biāo)進(jìn)行加權(quán)融合,對(duì)圖像進(jìn)行評(píng)價(jià)分類.
使用評(píng)價(jià)指標(biāo)加權(quán)融合的方法對(duì)圖像進(jìn)行評(píng)價(jià)分類的算法步驟如下:
(1)對(duì)數(shù)據(jù)庫(kù)中的圖像進(jìn)行打分及分類
對(duì)靜脈圖像進(jìn)行人工打分(總分為100),同時(shí)設(shè)置得分閾值T,本文閾值設(shè)為80,若低于閾值T則為低質(zhì)圖像,高為閾值T為高質(zhì)圖像.
(2)確定各指標(biāo)權(quán)重系數(shù)
對(duì)每個(gè)評(píng)價(jià)指標(biāo)權(quán)重的計(jì)算,主要根據(jù)人為主觀因素確定一定數(shù)量的高質(zhì)量靜脈圖像和低質(zhì)量的靜脈圖像,分別計(jì)算四個(gè)評(píng)價(jià)指標(biāo)的區(qū)分度,即圖9 所示的重合Sn.對(duì)于每個(gè)質(zhì)量評(píng)價(jià)指標(biāo)來(lái)說(shuō),Sn越小就說(shuō)明該評(píng)價(jià)指標(biāo)越能夠有效區(qū)分靜脈圖像質(zhì)量的高低,從而該質(zhì)量因子的權(quán)重就應(yīng)該越大.因此有:
w1,w2,w3,w4分別為4 項(xiàng)指標(biāo)的權(quán)重,根據(jù)式(5),經(jīng)過(guò)實(shí)驗(yàn)選定本文的w1=0.29,w2=0.25,w3=0.15,w4=0.31.
(3)對(duì)圖像進(jìn)行綜合評(píng)分
圖像最終得分可根據(jù)式(6)計(jì)算:
其中,Q1,Q2,Q3,Q4為 4 項(xiàng)指標(biāo)的評(píng)價(jià)得分,Q為評(píng)價(jià)綜合得分.
(4)按評(píng)分結(jié)果對(duì)圖像進(jìn)行分類
根據(jù)評(píng)分結(jié)果依據(jù)規(guī)定的分類閾值T對(duì)靜脈圖像進(jìn)行分類.
(5)計(jì)算分類準(zhǔn)確率
對(duì)比數(shù)據(jù)樣本統(tǒng)計(jì)分類準(zhǔn)確的個(gè)數(shù),計(jì)算準(zhǔn)確率.
圖9 權(quán)重的確定
BP 神經(jīng)網(wǎng)絡(luò)是一種多層前饋神經(jīng)網(wǎng)絡(luò),其特點(diǎn)是信號(hào)正向傳播,誤差反向傳播.在正向傳遞過(guò)程中,信號(hào)是從輸入層經(jīng)過(guò)隱含層逐層處理,最后到達(dá)輸出層.圖10 為BP 神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu).
圖10 BP 神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)圖
AdaBoost 的算法思想是綜合多個(gè)弱分類器的輸出來(lái)從而得出更有效的分類.其算法步驟主要為:
選擇弱分類器和樣本數(shù)據(jù)集,從數(shù)據(jù)集中選出m組數(shù)據(jù)作為訓(xùn)練集,數(shù)據(jù)集的訓(xùn)練權(quán)重均為1/m.接著用弱分類器迭代訓(xùn)練T次,每次訓(xùn)練后都按照訓(xùn)練輸出結(jié)果更新訓(xùn)練數(shù)據(jù)的權(quán)重,將較大的權(quán)重賦予分類失敗的訓(xùn)練數(shù)據(jù).在下個(gè)弱分類器訓(xùn)練時(shí)給予訓(xùn)練失敗的數(shù)據(jù)更多的關(guān)注.通過(guò)弱分類器的反復(fù)迭代訓(xùn)練得到一個(gè)分類函數(shù)序列f1,f2,f3,…,fT,同時(shí),對(duì)每個(gè)分類函數(shù)賦予一個(gè)對(duì)應(yīng)的權(quán)重,分類結(jié)果越好的函數(shù)對(duì)于的權(quán)重越大.經(jīng)過(guò)T次迭代訓(xùn)練過(guò)后,最終的強(qiáng)分類器由弱分類器加權(quán)得到.在BP-AdaBoost 算法中選擇BP 神經(jīng)網(wǎng)絡(luò)為弱分類器,根據(jù)AdaBoost 算法通過(guò)反復(fù)迭代訓(xùn)練多個(gè)BP 神經(jīng)網(wǎng)絡(luò)弱分類器得到最終的強(qiáng)分類器.BP-AdaBoost 的算法流程圖如圖11 所示.
圖11 BP-AdaBoost 算法過(guò)程
由于采集設(shè)備限制、周圍環(huán)境的影響以及個(gè)體手掌肌肉骨骼組織的差異,往往采集的手掌靜脈圖像質(zhì)量太差,即便進(jìn)行后續(xù)的增強(qiáng)處理也無(wú)法滿足后續(xù)識(shí)別的需求,大大降低了系統(tǒng)的識(shí)別準(zhǔn)確率.降低了系統(tǒng)的性能.因此,對(duì)于前端圖像的質(zhì)量評(píng)價(jià)顯得尤為重要.圖像的質(zhì)量評(píng)價(jià)可以分為質(zhì)量得分評(píng)價(jià)和質(zhì)量分類評(píng)價(jià).鑒于對(duì)掌靜脈圖像的評(píng)價(jià)旨在去除劣質(zhì)圖像,保留優(yōu)質(zhì)圖像的目的,本文采用質(zhì)量分類的評(píng)價(jià)方法.首先,截靜脈圖像的ROI.然后,確定掌靜脈圖像質(zhì)量的評(píng)價(jià)指標(biāo),本文選擇對(duì)比度、信息熵、清晰度以及等效視數(shù)這4 個(gè)參數(shù)為評(píng)價(jià)指標(biāo),對(duì)圖像ROI 區(qū)域進(jìn)行評(píng)價(jià)輸出,以此為樣本數(shù)據(jù)集.接著,構(gòu)建[4 10 1]的單隱含層BP 神經(jīng)網(wǎng)絡(luò)模型,以4 個(gè)參數(shù)值為網(wǎng)絡(luò)4 個(gè)輸入,基于AdaBoost 算法,同時(shí)構(gòu)造10 個(gè)同樣結(jié)構(gòu)的BP 神經(jīng)網(wǎng)絡(luò),作為BP-AdaBoost 神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)弱分類器,通過(guò)網(wǎng)絡(luò)的學(xué)習(xí)訓(xùn)練,得到最終的強(qiáng)分類器.最后,實(shí)現(xiàn)對(duì)靜脈圖像的準(zhǔn)確分類.本文方法對(duì)掌靜脈評(píng)價(jià)分類的流程圖如圖12 所示.
圖12 掌靜脈評(píng)價(jià)分類的流程圖
由圖2,圖4,圖6,圖8 我們可以發(fā)現(xiàn)對(duì)比度、圖像熵、清晰度、等效視數(shù)可以較好的區(qū)分高低質(zhì)的掌靜脈圖像.但是,高、低質(zhì)圖像的每類指標(biāo)分?jǐn)?shù)均存在重疊現(xiàn)象.例如,在圖2 中對(duì)比度值在[8,13]的區(qū)間內(nèi)高、低質(zhì)圖像存在較多的重疊;同理,在圖4,圖6,圖8中我們發(fā)現(xiàn)信息熵、清晰度、等效視數(shù)也存在著部分區(qū)間高低質(zhì)圖像重疊現(xiàn)象,也就是說(shuō),針對(duì)以上4 種評(píng)價(jià)指標(biāo),均無(wú)法完全準(zhǔn)確區(qū)分高、低質(zhì)圖像.鑒于以上分析,我們考慮綜合使用四種評(píng)價(jià)參數(shù)來(lái)評(píng)價(jià)圖像質(zhì)量.針對(duì)上述線性不可分問(wèn)題,考慮使用BP 網(wǎng)絡(luò)的非線性擬合性能,以及優(yōu)良的泛化能力.但其具有容易出現(xiàn)局部極小值,容易產(chǎn)生過(guò)擬合,以及準(zhǔn)確率不高等缺點(diǎn).我們進(jìn)一步引入AdaBoost 算法,結(jié)合多個(gè)BP 弱分類器構(gòu)建一個(gè)BP-AdaBoost 強(qiáng)分類器.
弱分類器的構(gòu)建,即BP 網(wǎng)絡(luò)結(jié)構(gòu)與參數(shù)設(shè)置是構(gòu)建分類器核心內(nèi)容.本文以4 項(xiàng)評(píng)價(jià)指標(biāo)為BP 網(wǎng)絡(luò)輸入,以掌靜脈圖像質(zhì)量高、低為網(wǎng)絡(luò)輸出構(gòu)建分類器.
在使用BP 網(wǎng)絡(luò)構(gòu)建弱分類器時(shí),對(duì)網(wǎng)絡(luò)的設(shè)計(jì)主要體現(xiàn)在網(wǎng)絡(luò)層數(shù)、各層神經(jīng)元個(gè)數(shù)、學(xué)習(xí)率、目標(biāo)誤差、傳遞函數(shù)、訓(xùn)練方法和訓(xùn)練數(shù)據(jù)的處理等方面.
(1)網(wǎng)絡(luò)層數(shù)的確定
神經(jīng)網(wǎng)絡(luò)理論證明,單個(gè)隱含層神經(jīng)網(wǎng)絡(luò)可以逼近任何閉區(qū)間內(nèi)的連續(xù)函數(shù),換言之,即任意m維到n維的非線性映射都可以由三層神經(jīng)網(wǎng)絡(luò)來(lái)完成.在這里,我們采用三層神經(jīng)網(wǎng)絡(luò)對(duì)掌靜脈圖像進(jìn)行分類.
(2)網(wǎng)絡(luò)各層神經(jīng)元個(gè)數(shù)的確定
輸入層神經(jīng)元個(gè)數(shù)取決于輸入訓(xùn)練樣本的維度.本實(shí)驗(yàn)中使用4 個(gè)評(píng)價(jià)指標(biāo)作為輸入.因此,本實(shí)驗(yàn)輸入層設(shè)置為4 個(gè)神經(jīng)元.同理,輸出層的神經(jīng)元個(gè)數(shù)取決于輸出結(jié)果,本實(shí)驗(yàn)設(shè)定BP 為二分類器,用“1”代表高質(zhì)量圖像輸出,“-1” 代表低質(zhì)量圖像輸出,故輸出層神經(jīng)元個(gè)數(shù)為1.關(guān)于與隱含層神經(jīng)元個(gè)數(shù)的確定,在實(shí)踐中,通常采用湊試法來(lái)確定.可根據(jù)如式(7)來(lái)確定神經(jīng)元個(gè)數(shù)的大致范圍.
其中,l代表隱含層神經(jīng)元個(gè)數(shù),m為輸入層神經(jīng)元個(gè)數(shù),n為輸出層神經(jīng)元個(gè)數(shù),a可以取1~10 之間的任意整數(shù).隱含層神經(jīng)元個(gè)數(shù)可以靠上式確定一個(gè)初始值,然后以依次增加或者減少的方法,通過(guò)仿真輸出確定最佳神經(jīng)元個(gè)數(shù).本實(shí)驗(yàn)中確定隱含層神經(jīng)元為10 個(gè).
(3)學(xué)習(xí)率的確定
學(xué)習(xí)率也稱步長(zhǎng),在BP 算法中定為常數(shù).一般情況下,為了獲得較穩(wěn)定的訓(xùn)練結(jié)果,學(xué)習(xí)速率的選擇區(qū)間一般為[0,1].實(shí)驗(yàn)中我們將學(xué)習(xí)率設(shè)置為0.01.
(4)目標(biāo)誤差的確定
當(dāng)網(wǎng)絡(luò)訓(xùn)練誤差達(dá)到期望誤差時(shí),訓(xùn)練則會(huì)停止.若期望誤差設(shè)置過(guò)小,則需將隱含層節(jié)點(diǎn)數(shù)調(diào)整為較大,隨即訓(xùn)練時(shí)間增加.因此,合適的目標(biāo)誤差對(duì)于網(wǎng)絡(luò)性能是十分重要的,經(jīng)過(guò)實(shí)驗(yàn)分析,將誤差設(shè)置為0.01 時(shí)能取得較好的仿真結(jié)果.
(5)傳遞函數(shù)的確定
傳遞函數(shù)的確定應(yīng)該視輸入輸出關(guān)系而定:若要求輸出結(jié)果不含負(fù)數(shù),則應(yīng)采用logsig 函數(shù);反之,采用tansig 函數(shù).本實(shí)驗(yàn)中,隱含層采用的是tansig 函數(shù),輸出層采用的是purelin 函數(shù).分別如式(8),式(9).
(6)訓(xùn)練方法的確定
BP 網(wǎng)絡(luò)中有許多訓(xùn)練方法,選擇哪種訓(xùn)練方法要根據(jù)實(shí)際訓(xùn)練數(shù)據(jù)的類型及分類情況所定.在Matlab環(huán)境中,網(wǎng)絡(luò)訓(xùn)練學(xué)習(xí)函數(shù)為train.train 根據(jù)在newff函數(shù)中確定的訓(xùn)練函數(shù)來(lái)訓(xùn)練,不同的訓(xùn)練函數(shù)對(duì)應(yīng)不同的訓(xùn)練算法.本文采用trainlm 訓(xùn)練算法.
(7)訓(xùn)練數(shù)據(jù)的初始化處理
數(shù)據(jù)歸一化是神經(jīng)網(wǎng)絡(luò)對(duì)數(shù)據(jù)常做一種處理方法.通過(guò)數(shù)據(jù)歸一化的方法把所有數(shù)據(jù)轉(zhuǎn)化為[0,1]之間的數(shù).為了能夠消除各維數(shù)據(jù)間數(shù)量級(jí)的差別,避免因數(shù)據(jù)數(shù)量級(jí)差別較大而造成網(wǎng)絡(luò)誤差較大.本文中選用歸一化方法如式(10):
其中,xmin為數(shù)據(jù)序列中最小數(shù),xmax為數(shù)據(jù)序列中最大數(shù).
BP-AdaBoost 強(qiáng)分類器是由多個(gè)基礎(chǔ)BP 弱分類器反復(fù)訓(xùn)練預(yù)測(cè)樣本輸出,利用AdaBoost 算法將這些弱分類器進(jìn)行線性加權(quán)求和得到最終的強(qiáng)分類器,本文選取10 個(gè)BP 弱分類器進(jìn)行強(qiáng)分類器的構(gòu)建.流程圖如圖13.
圖13 BP-AdaBoost 強(qiáng)分類器構(gòu)建流程圖
BP-AdaBoost 強(qiáng)分類器構(gòu)建過(guò)程:
(1)輸入訓(xùn)練數(shù)據(jù)集
訓(xùn)練數(shù)據(jù)集輸入input_train={(xai,xbi,xci,xdi),…,(xan,xbn,xcn,xdn)},訓(xùn)練數(shù)據(jù)集輸出output_train={y1,y2,…,yn},n∈170,標(biāo)簽yi={1,-1}.
(2)訓(xùn)練數(shù)據(jù)集權(quán)重初始化
(3)對(duì)權(quán)值初始化后的數(shù)據(jù)集進(jìn)行訓(xùn)練,得到BP弱分類器:cm(x)
(4)計(jì)算cm(x)分類誤差
(5)計(jì)算cm(x)分類器的權(quán)值
(6)更新訓(xùn)練數(shù)據(jù)集權(quán)重
(7)最終強(qiáng)分類器
本文的圖像數(shù)據(jù)庫(kù)選擇的是中科大的掌靜脈數(shù)據(jù)庫(kù)(CASIA).首先,通過(guò)人工選擇高質(zhì)量圖像和低質(zhì)量圖像各85 張,并做上標(biāo)記.高質(zhì)量圖像標(biāo)記為“1”,低質(zhì)量圖像標(biāo)記為“-1”.然后,采取的是最大內(nèi)切圓的方法批量截取掌靜脈圖像ROI,截取的圖像ROI 再歸一化大小為182×182.接著,對(duì)這170 張圖像依次進(jìn)行質(zhì)量評(píng)價(jià),使用程序運(yùn)行輸出對(duì)比度,信息熵,清晰度,等效視數(shù)的四項(xiàng)指標(biāo)的數(shù)據(jù)值.以這四維輸出矩陣及標(biāo)簽作為樣本數(shù)據(jù)集.
當(dāng)數(shù)據(jù)集較小時(shí),常將大約2/3~4/5 的樣本數(shù)據(jù)用于訓(xùn)練,剩余樣本用于測(cè)試.故本文中,分別抽取樣本數(shù)據(jù)的50%,60%,70%,80%作為訓(xùn)練集.測(cè)試結(jié)果分別如表5 至表8 所示.分析表中數(shù)據(jù)我們發(fā)現(xiàn),綜合使用4 種評(píng)價(jià)指標(biāo)的分類準(zhǔn)確率比單一使用其中一種指標(biāo)的分類準(zhǔn)確率要高出30%到40%,從圖14 也可以看出.此外,使用BP-AdaBoost 分類器的分類效果比單一使用一個(gè)BP 分類器的分類準(zhǔn)確率要高出10%左右.
表5 樣本的50%作為訓(xùn)練集的準(zhǔn)確率測(cè)試結(jié)果
表6 樣本的60%作為訓(xùn)練集的準(zhǔn)確率測(cè)試結(jié)果
除此之外,由圖15 我們可以發(fā)現(xiàn)相較于BP 分類器,BP-AdaBoost 分類器不僅可以在分類準(zhǔn)確率上具有很大優(yōu)勢(shì),同時(shí),對(duì)于數(shù)據(jù)集劃分方式具有很大的魯棒性.從圖15 中可以看出,隨著訓(xùn)練樣本占總體的比例越來(lái)越大,BP 分類器和BP-AdaBoost 分類器的分類準(zhǔn)確率均不斷提高,但BP-AdaBoost 分類器的分類準(zhǔn)確率基本在98%~100%,BP 分類器的分類準(zhǔn)確率在88%~94%,因此,當(dāng)樣本數(shù)據(jù)集較小時(shí),BP-AdaBoost分類器的分類效果更穩(wěn)定可靠.
表7 樣本的70%作為訓(xùn)練集的準(zhǔn)確率測(cè)試結(jié)果
表8 樣本的80%作為訓(xùn)練集的準(zhǔn)確率測(cè)試結(jié)果
圖14 各評(píng)價(jià)指標(biāo)對(duì)BP 分類器準(zhǔn)確率影響對(duì)比圖
圖15 兩種分類器不同數(shù)據(jù)集劃分的分類準(zhǔn)確率對(duì)比
圖16 是BP-AdaBoost 模型與BP 模型預(yù)測(cè)誤差絕對(duì)值對(duì)比圖.明顯可以看出BP-AdaBoost 分類器的預(yù)測(cè)誤差明顯低于BP 弱分類器的預(yù)測(cè)誤差,說(shuō)明了BPAdaBoost 模型的優(yōu)良性能.
圖16 BP-AdaBoost 模型與BP 模型預(yù)測(cè)誤差絕對(duì)值對(duì)比圖
綜上,BP-AdaBoost 模型在掌靜脈圖像質(zhì)量分類和預(yù)測(cè)上都能達(dá)到優(yōu)良的效果.比BP 模型具有更高的準(zhǔn)確度,更好的魯棒性.
表9 為傳統(tǒng)分類方法與本文BP-AdaBoost 分類方法準(zhǔn)確率的對(duì)比.通過(guò)比較可以看出本文BP-AdaBoost分類方法準(zhǔn)確率遠(yuǎn)高于傳統(tǒng)分類方法,故本文方法具有更優(yōu)的分類特性.
表9 加權(quán)融合的分類法與本文BP-AdaBoost 分類法準(zhǔn)確率
在自動(dòng)掌靜脈身份認(rèn)證系統(tǒng)中,為了更有效的提高識(shí)別系統(tǒng)的準(zhǔn)確度,需要對(duì)采集到的掌靜脈圖像進(jìn)行前端的質(zhì)量評(píng)價(jià).鑒于此,本文提出了一種基于BPAdaBoost 神經(jīng)網(wǎng)絡(luò)的多參數(shù)的掌靜脈圖像質(zhì)量評(píng)價(jià)法.在確定以對(duì)比度、信息熵、清晰度和等效視數(shù)為掌靜脈圖像質(zhì)量評(píng)價(jià)的4 項(xiàng)指標(biāo)后.結(jié)合AdaBoost 算法,構(gòu)造10 個(gè)BP 網(wǎng)絡(luò),以BP 網(wǎng)絡(luò)為弱分類器,形成最終的BP-AdaBoost 強(qiáng)分類器,對(duì)圖像進(jìn)行分類評(píng)價(jià).實(shí)驗(yàn)結(jié)果顯示,本文方法相比較傳統(tǒng)加權(quán)評(píng)價(jià)更具客觀性,分類的準(zhǔn)確率比傳統(tǒng)評(píng)價(jià)指標(biāo)加權(quán)融合的方法高出約14%,具有良好的應(yīng)用價(jià)值.