張 科
(東華大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院, 上海 201620 )
物聯(lián)網(wǎng)設(shè)備的普及為人們的生活帶來了便利,但同時(shí)存在嚴(yán)重的安全風(fēng)險(xiǎn)。因此,安全的身份驗(yàn)證系統(tǒng)對(duì)于物聯(lián)網(wǎng)設(shè)備至關(guān)重要。與指紋和面部識(shí)別相比,虹膜識(shí)別系統(tǒng)更加安全,在認(rèn)證過程中不需要接觸。因此,虹膜識(shí)別是物聯(lián)網(wǎng)設(shè)備的理想安全認(rèn)證方法。傳統(tǒng)的虹膜識(shí)別需要在近紅外照明下并且用戶高度合作的環(huán)境下獲取虹膜圖像。然而,對(duì)于物聯(lián)網(wǎng)設(shè)備的認(rèn)證,虹膜識(shí)別通常需要在不受控制的環(huán)境條件下完成,這給虹膜識(shí)別技術(shù)提出了嚴(yán)峻的挑戰(zhàn)。
虹膜分割是一種從人眼圖像中定位虹膜區(qū)域和非虹膜區(qū)域的方法。該方法將生成一個(gè)相應(yīng)的虹膜分類圖像,為虹膜識(shí)別提供虹膜特征區(qū)域的位置信息。虹膜圖像分割的效果會(huì)影響虹膜特征選擇的正確性,進(jìn)而直接影響最終虹膜識(shí)別的性能。對(duì)于在不可控的環(huán)境中獲取的非理想人眼圖像,虹膜分割會(huì)受到大量環(huán)境噪聲的影響,其中包括:光照條件、運(yùn)動(dòng)模糊、鏡面反射等,導(dǎo)致傳統(tǒng)的虹膜分割算法無法完成準(zhǔn)確的虹膜定位。
近年來,相關(guān)研究者對(duì)非理想虹膜圖像的分割技術(shù)進(jìn)行了深入研究。先前的工作主要使用與圖像處理相關(guān)的技術(shù),基于諸如梯度和幾何關(guān)系等特征來檢索圖像中的虹膜區(qū)域,并使用曲線來擬合虹膜的輪廓。通過這種方式,提出了一種基于改進(jìn)的快速霍夫變換的抗噪虹膜分割方法,并采用多弧多線虹膜邊界策略來定義虹膜邊界[1]。隨后,一種使用橢圓擬合瞳孔和邊緣邊界的分割方法也被用于檢測(cè)非理想虹膜圖像的虹膜區(qū)域[2]。除了使用橢圓擬合邊界之外,其它方法還使用幾何活動(dòng)輪廓來細(xì)化虹膜邊界,并且通過打開操作來抑制睫毛噪聲[3]。這些基于圖像處理的改進(jìn)的分割方法具有一定的抗噪能力,但處理噪聲干擾的效果有限,分割效果不理想。
為了降低虹膜識(shí)別系統(tǒng)的環(huán)境要求并在物聯(lián)網(wǎng)設(shè)備上實(shí)現(xiàn)快速準(zhǔn)確的虹膜識(shí)別,研究提出了一種基于深度學(xué)習(xí)的輕量級(jí)的虹膜分割模型。在訓(xùn)練好虹膜分割模型后,該分割模型可以快速地產(chǎn)生非理想虹膜圖像的分割預(yù)測(cè),適合虹膜識(shí)別在物聯(lián)網(wǎng)設(shè)備上的部署。
早期的虹膜分割方法通常針對(duì)在理想環(huán)境中獲取的理想虹膜圖像。 霍夫變換用于從虹膜圖像中檢測(cè)圓形邊界,然后基于虹膜或瞳孔半徑的約束進(jìn)行邊緣圖投票以確定虹膜圖像邊界[4]。 由于基于霍夫變換的圓形檢測(cè)方法不夠穩(wěn)定,因此使用積分微分算子的新方法也可用于檢測(cè)圖像中的圓形虹膜邊界[5]。 后來,Huang等人[6]提出了一種基于徑向抑制邊緣檢測(cè)的虹膜分割方法,以提高精度。研究中通過使用小波變換來提取虹膜圖像的小波變換模量。 根據(jù)設(shè)計(jì)的徑向非最大抑制方法,保留環(huán)形邊緣,并移除徑向邊緣。 最后,閾值邊緣處理用于去除孤立邊緣并生成二值分割圖像。
后續(xù)的工作注意到虹膜分割上的噪聲引起的干擾,并開始研究非理想條件下的虹膜分割。即有學(xué)者設(shè)計(jì)了一種新穎的噪聲檢測(cè)模型以實(shí)現(xiàn)準(zhǔn)確的虹膜分割。在模型中,通過使用3種條件確定睫毛中的像素,從而解決了反射噪聲的干擾[7]。考慮到由2個(gè)圓形邊緣檢測(cè)引起的誤差,執(zhí)行Adaboost眼檢測(cè)用來做補(bǔ)償。基于顏色的分割方法用于解決重影效果噪聲,并執(zhí)行眼瞼和睫毛檢測(cè)以減少誤差[8]。為了更準(zhǔn)確地?cái)M合虹膜邊界,出現(xiàn)了一些使用靈活輪廓線的方法。活動(dòng)輪廓線可以適應(yīng)各種形狀并同時(shí)分割多對(duì)象,從而進(jìn)一步提高分割的準(zhǔn)確性和效率[9]??紤]到噪聲的影響,Amjed等人[10]提出了一種基于加權(quán)自適應(yīng)霍夫變換的虹膜分割方法。模糊邏輯隸屬度函數(shù)被用于在明暗區(qū)域之間定界并增強(qiáng)對(duì)比度,繼而使用加權(quán)自適應(yīng)霍夫變換完成虹膜分割。
在本節(jié)中,將詳細(xì)描述研究設(shè)計(jì)的對(duì)于非理想虹膜圖像的虹膜分割模型。研究詳情如下。
非理想虹膜圖像中邊界和梯度特征的細(xì)微差異對(duì)虹膜分割方法產(chǎn)生了嚴(yán)峻的考驗(yàn)。僅使用基于梯度和幾何關(guān)系的圖像處理技術(shù)很難應(yīng)對(duì)復(fù)雜的噪聲干擾。但是,卷積神經(jīng)網(wǎng)絡(luò)具有強(qiáng)大的特征提取能力,可以學(xué)習(xí)從大量數(shù)據(jù)中識(shí)別虹膜區(qū)域。本次研究使用卷積神經(jīng)網(wǎng)絡(luò)作為非理想虹膜圖像的分割模型。在虹膜圖像分割任務(wù)中,研究會(huì)利用預(yù)測(cè)虹膜像素和真實(shí)虹膜像素之間的差異構(gòu)造損失函數(shù)。具體地,使用U-Net[11]的結(jié)構(gòu)作為虹膜分割的骨干網(wǎng)絡(luò)。 U-Net在上采樣過程中使用級(jí)聯(lián)結(jié)構(gòu)將淺層特征與深層特征相結(jié)合。其中,網(wǎng)絡(luò)使用較深的特征用于定位虹膜區(qū)域,而較淺的特征用于精確分割,從而在非理想虹膜圖形分割過程中產(chǎn)生更精確分割結(jié)果。
在分割損失時(shí),研究會(huì)使用二進(jìn)制交叉熵?fù)p失項(xiàng)來表示虹膜分割的損失項(xiàng)L,對(duì)虹膜分割損失的數(shù)學(xué)定義可表示為:
L=-Ex,y[ylogS(x)+(1-y)log(1-S(x))].
(1)
其中,S(x)表示在給定大小為H×W×3的輸入虹膜圖像x的情況下,分割模型生成的2個(gè)大小為H×W×2的類的類概率圖。 這里會(huì)使用分割損失來鼓勵(lì)分割模型正確預(yù)測(cè)虹膜區(qū)域的像素位置,并對(duì)模型進(jìn)行訓(xùn)練以最小化損失函數(shù)。
本次研究的虹膜分割模型基于U-Net的網(wǎng)絡(luò)結(jié)構(gòu),采用了具有skip connection的全卷積自編碼器的形式。 其中,編碼器由大小為3×3卷積組成(每層僅使用一個(gè)卷積),每個(gè)卷積層后將續(xù)接一個(gè)整流線性單元(ReLU)和步幅為2且大小為2×2 的最大池化操作。解碼器是先對(duì)特征圖進(jìn)行上采樣,再進(jìn)行2×2卷積,從收縮路徑與相應(yīng)裁剪的特征圖進(jìn)行拼接,再經(jīng)過3×3卷積,并通過ReLU激活函數(shù)。
本節(jié)重點(diǎn)討論了實(shí)驗(yàn)的實(shí)驗(yàn)細(xì)節(jié)和實(shí)驗(yàn)結(jié)果。 對(duì)此擬展開研究論述如下。
(1)CASIA v4 Interval。 該數(shù)據(jù)庫是NLPR Lab提供的CASIA Iris圖像數(shù)據(jù)庫的子集。 其中包含來自249個(gè)主題的2 639個(gè)虹膜圖像,圖像分辨率為320 * 280。 該數(shù)據(jù)集是通過配備圓形近紅外光 LED陣列并具有適當(dāng)通光量的相機(jī)獲得的。 由于此數(shù)據(jù)集中缺少相應(yīng)的真實(shí)分割標(biāo)簽,研究時(shí)使用由WaveLab生成的EP數(shù)據(jù)集,其中包含了CASIA v4虹膜數(shù)據(jù)集的真實(shí)分割標(biāo)簽。
(2)Perturbed CASIA v4 Interval。 為了獲得非理想的虹膜數(shù)據(jù)集,文中使用了Shabab研究中提出的增強(qiáng)方法[12]。 這種增強(qiáng)方法通過降低眼窩分辨率,降低圖像對(duì)比度、陰影圖像和圖像模糊,來模擬在現(xiàn)實(shí)環(huán)境中獲取的非理想虹膜圖像。研究時(shí)會(huì)在擾動(dòng)的數(shù)據(jù)集上進(jìn)行訓(xùn)練和測(cè)試,以驗(yàn)證該方法在非理想虹膜圖像中的性能。
文中選擇了多種評(píng)估指標(biāo)來分析所提出的非理想虹膜圖像分割方法的性能。 對(duì)于評(píng)估指標(biāo)的研究,本文給出闡釋分述如下。
(1)錯(cuò)誤率: 參考NICE I競(jìng)賽的評(píng)估標(biāo)準(zhǔn)來衡量本文提出的分割方法的性能。錯(cuò)誤率的定義表示如下:
(2)
其中,TP、TN、FP、FN分別代表真陽例、真反例、假正例、假反例。
(2)交并比:通常用于評(píng)估目標(biāo)檢測(cè)任務(wù)中預(yù)測(cè)的準(zhǔn)確性。 在這里,使用交并比來衡量分割預(yù)測(cè)和真實(shí)分割標(biāo)簽之間的差異。 交并比的定義表示如下:
(3)
(3)F1分?jǐn)?shù):這是統(tǒng)計(jì)學(xué)中用于衡量分類模型準(zhǔn)確性的指標(biāo)。 該指標(biāo)同時(shí)考慮了分類模型的準(zhǔn)確性和召回率。F1分?jǐn)?shù)的定義表示如下:
(4)
文中的網(wǎng)絡(luò)模型在TensorFlow中實(shí)現(xiàn),通過使用Adam優(yōu)化算法進(jìn)行了訓(xùn)練,其動(dòng)量值為0.99。繼而使用隨機(jī)正態(tài)分布初始化來初始化網(wǎng)絡(luò)的權(quán)重。 在實(shí)驗(yàn)中,批處理大小設(shè)置為10。前10個(gè)學(xué)習(xí)周期的學(xué)習(xí)率為0.0001,在接下來的10個(gè)學(xué)習(xí)周期中,學(xué)習(xí)率線性降低為0。 GTX1080Ti GPU服務(wù)器用于訓(xùn)練網(wǎng)絡(luò)。對(duì)于所有數(shù)據(jù)集,會(huì)將數(shù)據(jù)的20%用作測(cè)試,60%用作訓(xùn)練,剩余的20%作為驗(yàn)證部分。為了彌補(bǔ)數(shù)據(jù)的不足,研究通過水平翻轉(zhuǎn)數(shù)據(jù)集來進(jìn)行數(shù)據(jù)擴(kuò)充。 此外,還會(huì)將輸入圖像縮放成128 * 96的大小并送入分割網(wǎng)絡(luò)中,以使不同虹膜數(shù)據(jù)集的圖像大小保持一致。
為了將文中方法的分割結(jié)果與其他方法進(jìn)行比較,研究選擇了2種最新的虹膜分割方法,包括虹膜識(shí)別系統(tǒng)OSIRIS v4.1[13]和虹膜分割框架IrisSeg[14]。 OSIRIS是集成了多種圖像處理方法的開源虹膜識(shí)別框架。 在實(shí)驗(yàn)中,僅使用其虹膜分割模塊,并將其應(yīng)用于具有非理想虹膜圖像的數(shù)據(jù)集。 為了確保OSIRIS的性能不受無關(guān)因素的影響,在實(shí)驗(yàn)前則將虹膜半徑的最大和最小參數(shù)設(shè)置為適當(dāng)?shù)闹怠?IrisSeg是用于非理想虹膜圖像的分割框架。 在實(shí)驗(yàn)中,將直接使用該框架對(duì)2個(gè)不同的數(shù)據(jù)集進(jìn)行測(cè)試。
在對(duì)比實(shí)驗(yàn)中,該方法分別在2個(gè)數(shù)據(jù)集中進(jìn)行了訓(xùn)練和測(cè)試。在此基礎(chǔ)上,將測(cè)試集上的分割結(jié)果與其它兩種方法進(jìn)行定量比較,并通過將結(jié)果與3個(gè)評(píng)估指標(biāo)進(jìn)行比較來證明該方法的分割性能。2個(gè)數(shù)據(jù)集的實(shí)驗(yàn)比較結(jié)果見表1、表2。由表1、表2中可以看出,本文提出的方法對(duì)擾動(dòng)的CASIA數(shù)據(jù)集實(shí)現(xiàn)了最佳分割效果,并且該方法的3個(gè)指標(biāo)的結(jié)果明顯高于其他兩種方法。盡管在CASIA數(shù)據(jù)集上的分割結(jié)果比IrisSeg差,但分析后可以發(fā)現(xiàn)兩者之間的差異僅為1%。因此,結(jié)果表明本文的方法在分割非理想虹膜圖像方面具有顯著的優(yōu)勢(shì),并且在理想虹膜圖像的分割中表現(xiàn)出良好的性能。此外,還計(jì)算了每個(gè)指標(biāo)上的分割結(jié)果的標(biāo)準(zhǔn)差。從結(jié)果的分析對(duì)比中可以看出,本文的方法的標(biāo)準(zhǔn)偏差在所有2個(gè)數(shù)據(jù)集中都是最低的,這表明本文方法的性能是最穩(wěn)定的。與其它兩種方法不同,本文的方法沒有產(chǎn)生很多差的分割結(jié)果。
表1 CASIA虹膜數(shù)據(jù)集的定量對(duì)比結(jié)果
表2 Perturbed CASIA虹膜數(shù)據(jù)集的定量對(duì)比結(jié)果
Tab. 2 The quantitative comparision results on Perturbed CASIA dataset
%
此外,研究還繪制了實(shí)驗(yàn)結(jié)果的CDF圖如圖1、圖2所示。與先前的結(jié)論類似,本文的方法在CASIA數(shù)據(jù)集上比IrisSeg稍差,但在非理想虹膜數(shù)據(jù)集上卻獲得了最佳結(jié)果。 這也展示了本次研究在處理非理想虹膜圖像方面的優(yōu)勢(shì)。
(a) (b) (c)
(a) (b) (c)
在本文中,研究提出了一種基于深度學(xué)習(xí)的虹膜分割模型,該模型有助于在物聯(lián)網(wǎng)設(shè)備上部署虹膜識(shí)別驗(yàn)證系統(tǒng)。 本文所設(shè)計(jì)的虹膜分割網(wǎng)絡(luò)可以實(shí)現(xiàn)對(duì)非理想虹膜圖像準(zhǔn)確、快速的分割,能夠有效地應(yīng)對(duì)虹膜分割過程中環(huán)境噪聲的干擾。 通過在2個(gè)虹膜數(shù)據(jù)集上進(jìn)行的大量實(shí)驗(yàn)結(jié)果表明,本文的虹膜分割模型可實(shí)現(xiàn)頂尖的分割性能,并且提高了虹膜識(shí)別系統(tǒng)的可用性,促進(jìn)了虹膜識(shí)別系統(tǒng)在物聯(lián)網(wǎng)設(shè)備上的部署。