楊亞男, 朱曉冬, 劉元寧, 朱 琳, 董 霖
(吉林大學(xué) 符號(hào)計(jì)算與知識(shí)工程教育部重點(diǎn)實(shí)驗(yàn)室, 長(zhǎng)春 130012;吉林大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院, 長(zhǎng)春 130012)
與指紋、 面部等生物特征相比, 虹膜具有高度唯一性、 穩(wěn)定性和非侵犯性[1], 因而虹膜識(shí)別技術(shù)應(yīng)用廣泛. 虹膜識(shí)別系統(tǒng)包括虹膜圖像采集、 虹膜圖像質(zhì)量評(píng)價(jià)、 虹膜內(nèi)外圓定位、 歸一化以及特征提取和匹配[2]. 虹膜定位是虹膜識(shí)別中的重要環(huán)節(jié), 定位的不準(zhǔn)確將引入光斑、 睫毛等干擾信息或?qū)е潞缒ぜy理信息丟失, 直接影響特征識(shí)別效果以及特征匹配正確率[3].
經(jīng)典的虹膜定位算法有Daugman[4]法和Wildes[5]法. Daugman通過(guò)積分微分算子確定虹膜的內(nèi)外圓, 但易受圖像邊緣干擾; Wildes利用Hough變換和投票機(jī)制搜索內(nèi)外圓, 但該算法對(duì)噪聲敏感. 為準(zhǔn)確定位虹膜, Yu等[6]提出了基于小范圍搜索確定瞳孔的大致位置, 利用Daugman圓模板和Hough變換精定位內(nèi)外圓; 劉帥等[7]通過(guò)Hough變換和卷積操作對(duì)虹膜進(jìn)行粗定位, 再利用分塊搜索進(jìn)行精定位; 孫正等[8]先利用投影法和灰度直方圖定位瞳孔, 再利用扇環(huán)灰度定位虹膜外邊界. 這些傳統(tǒng)定位算法均只適用于干擾較少的虹膜圖像, 不能處理光斑、 睫毛眼瞼等導(dǎo)致的灰度梯度值變化過(guò)程中的局部最值情況.
卷積神經(jīng)網(wǎng)絡(luò)在目標(biāo)檢測(cè)領(lǐng)域取得了較好的成果, 主要有One-stage和Two-stage兩種思路. Two-stage基于目標(biāo)候選框的思想, 先生成一系列樣本候選框, 再通過(guò)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行樣本分類, 如滕童等[9]提出了一種基于級(jí)聯(lián)神經(jīng)網(wǎng)絡(luò)的多任務(wù)虹膜快速定位方法, 但該方法多次運(yùn)行檢測(cè)和分類流程使得檢測(cè)速度較慢; 張海珊等[10]提出了一種兩級(jí)質(zhì)量評(píng)價(jià)與虹膜定位的級(jí)聯(lián)型方法, 先利用HOG-SVM分類模型和BP神經(jīng)網(wǎng)絡(luò)對(duì)虹膜進(jìn)行粗定位, 再利用圓擬合法對(duì)虹膜進(jìn)行精定位, HOG(histogram of oriented gradient)特征會(huì)丟棄大部分的判別信息, 同時(shí), 評(píng)價(jià)指標(biāo)過(guò)多會(huì)誤刪除部分可進(jìn)行虹膜識(shí)別的圖像, 導(dǎo)致浪費(fèi)虹膜數(shù)據(jù). One-stage基于回歸的思想, 通過(guò)主干網(wǎng)絡(luò)提取圖像特征信息直接回歸物體的邊界框, 速度較快, 如Yolo系列. YoloV4[11]在網(wǎng)絡(luò)結(jié)構(gòu)和訓(xùn)練技巧上較YoloV3[12]都有所改進(jìn), 檢測(cè)速度更快, 準(zhǔn)確率也更高. YoloV4通過(guò)一系列的卷積操作進(jìn)行特征提取, 導(dǎo)致模型參數(shù)量較大. 輕量級(jí)網(wǎng)絡(luò)MobileNetV3[13]將標(biāo)準(zhǔn)卷積操作分解為深度卷積和點(diǎn)卷積, 在精度不減的情況下極大減少了參數(shù)量和計(jì)算量.
針對(duì)上述算法的局限性以及神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)視覺(jué)中的優(yōu)勢(shì), 本文提出一種基于MobileNetV3和YoloV4相結(jié)合并進(jìn)行一系列細(xì)化步驟的虹膜定位算法, 包括K-means++聚類算法[14]生成先驗(yàn)框, 增強(qiáng)數(shù)據(jù)集適應(yīng)性; 改進(jìn)網(wǎng)絡(luò)結(jié)構(gòu), 使其更適用于虹膜定位任務(wù); 改進(jìn)非極大值抑制, 使用快速soft-DIoU-NMS算法, 提高模型檢測(cè)率; 修改損失函數(shù), 使用Focal Loss[15]作為類別損失函數(shù); 使用灰度差值對(duì)不合格虹膜圖像進(jìn)行精定位. 實(shí)驗(yàn)結(jié)果表明, 該算法提高了虹膜定位準(zhǔn)確率和定位速度, 能準(zhǔn)確定位受光斑、 睫毛眼瞼等干擾的虹膜圖像, 增強(qiáng)了虹膜定位的魯棒性, 識(shí)別效果穩(wěn)定. 算法流程原理如圖1所示.
圖1 基于改進(jìn)YoloV4網(wǎng)絡(luò)的虹膜定位算法流程Fig.1 Flow chart of iris location algorithm based on improved YoloV4 network
為更好地降低睫毛眼瞼、 光斑等背景干擾, 更快速、 有效地提取瞳孔和虹膜的關(guān)鍵信息, 本文采用改進(jìn)YoloV4網(wǎng)絡(luò)對(duì)虹膜內(nèi)外圓進(jìn)行粗定位, 用MobileNetV3結(jié)構(gòu)提取主干特征, 用YoloV4檢測(cè)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行網(wǎng)絡(luò)結(jié)構(gòu)的預(yù)測(cè), 在兩個(gè)不同維度上完成虹膜內(nèi)外圓定位. 本文方法的整體網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示. 用K-means++聚類算法生成與數(shù)據(jù)集虹膜和瞳孔尺寸相匹配的先驗(yàn)框, 用Focal Loss作為類別損失函數(shù), 用快速soft-DIoU-NMS算法進(jìn)行預(yù)測(cè)框的篩選.
圖2 Mobile_YoloV4整體網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 Overall network structure of Mobile_YoloV4
為適應(yīng)數(shù)據(jù)集中虹膜和瞳孔的尺寸, 去除原始YoloV4網(wǎng)絡(luò)中小目標(biāo)預(yù)測(cè)尺度, 保留適合較大的虹膜和尺寸中等的瞳孔檢測(cè)兩個(gè)尺度. MobileNetV3通過(guò)使用SE(squeeze-and-excitation)注意力機(jī)制、 激活函數(shù)H-swish使其具有優(yōu)秀的特征提取效果, 將標(biāo)準(zhǔn)卷積分解成深度卷積和點(diǎn)卷積的核心思想是大幅度減少參數(shù)量和計(jì)算量[16]. MobileNetV3由若干個(gè)Bneck結(jié)構(gòu)連接而成, Bneck結(jié)構(gòu)如圖3所示, 由1×1卷積升維、 深度可分離卷積、 逆殘差結(jié)構(gòu)、 SE塊、 1×1卷積降維幾部分組成. 其中NL表示非線性激活函數(shù), Dwise表示深度卷積, 1×1卷積表示點(diǎn)卷積. H-swish激活函數(shù)可簡(jiǎn)化swish函數(shù)的計(jì)算成本, 并最大程度完成swish函數(shù)的功能, 表達(dá)式為
(1)
其中x表示當(dāng)前層的輸入, ReLU6為ReLU6激活函數(shù).
圖3 Bneck結(jié)構(gòu)Fig.3 Bneck structure
考慮到網(wǎng)絡(luò)輸入尺寸對(duì)模型檢測(cè)速度和精度的影響, 將數(shù)據(jù)集中的圖片尺寸統(tǒng)一為480×480. 特征提取網(wǎng)絡(luò)結(jié)構(gòu)列于表1, 由1個(gè)卷積層和13個(gè)Bneck結(jié)構(gòu)組成, 分別在卷積層和第2,4,7,11個(gè)Bneck處下采樣為240×240,120×120,60×60,30×30,15×15. 其中Conv表示標(biāo)準(zhǔn)卷積, Bneck表示Bneck結(jié)構(gòu),n×n表示卷積核大小, 升維通道數(shù)表示每個(gè)Bneck結(jié)構(gòu)中第一層1×1卷積升維通道數(shù), SE表示當(dāng)前Bneck結(jié)構(gòu)是否使用SE注意力機(jī)制, HS表示H-swish函數(shù), RE表示ReLU函數(shù). 將第10個(gè)Bneck輸出特征圖30×30和第13個(gè)Bneck輸出特征圖15×15作為兩個(gè)分支輸入到檢測(cè)網(wǎng)絡(luò)中.
表1 主干特征提取網(wǎng)絡(luò)結(jié)構(gòu)
由于對(duì)輸入網(wǎng)絡(luò)的圖片進(jìn)行了統(tǒng)一尺寸預(yù)處理, 因此本文檢測(cè)網(wǎng)絡(luò)部分去除Yolov4中的空間金字塔池化(spatial pyramid pooling, SPP)結(jié)構(gòu), 檢測(cè)網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示. 經(jīng)過(guò)主干特征提取網(wǎng)絡(luò)進(jìn)行初步特征提取, 得到兩個(gè)有效特征圖30×30和15×15, 分別對(duì)這兩個(gè)特征圖進(jìn)行1×1卷積操作調(diào)整通道數(shù). 先將15×15特征圖進(jìn)行步長(zhǎng)為2的上采樣, 再與尺寸相同的特征圖30×30進(jìn)行相接得到低層次特征圖. 對(duì)相接后的特征圖進(jìn)行1×1-3×3-1×1結(jié)構(gòu)的卷積操作后, 一部分進(jìn)行下采樣與15×15特征圖相接后再次經(jīng)過(guò)1×1-3×3-1×1結(jié)構(gòu)的卷積操作. 其中1×1卷積核用于調(diào)整通道數(shù), 3×3卷積核用于提取特征, 多個(gè)卷積核交錯(cuò)達(dá)到目的. 下采樣直接使用池化操作, 3×3卷積均使用深度可分離卷積, 以進(jìn)一步減少計(jì)算量和參數(shù)量. 此時(shí), 這兩個(gè)特征圖已經(jīng)包含了豐富的上下文信息, 分別在這兩個(gè)維度上預(yù)測(cè)邊界框.
YoloV4先驗(yàn)框是在VOC數(shù)據(jù)集的標(biāo)注上進(jìn)行聚類得到的. 在虹膜數(shù)據(jù)集中, 虹膜和瞳孔大小差異變化較小, 不適合直接使用原始模型的先驗(yàn)框. 故本文基于虹膜數(shù)據(jù)集進(jìn)行K-means++聚類[14,17]生成6組先驗(yàn)框, 算法步驟如下:
1) 提取數(shù)據(jù)集中所有的GT-Box(ground-truth box)坐標(biāo), 獲得n組GT-Box的寬高數(shù)據(jù)作為樣本;
2) 從n組寬高數(shù)據(jù)集中隨機(jī)選擇一個(gè)樣本作為初始聚類中心Anchor-Box;
3) 計(jì)算每個(gè)GT-Box到最近Anchor-Box的IoU值;
4) 選取一個(gè)樣本作為新的聚類中心, IoU值較大的點(diǎn)被選擇為聚類中心的概率較大;
5) 重復(fù)步驟3)和步驟4), 直到得到預(yù)設(shè)的6組先驗(yàn)框.
整個(gè)網(wǎng)絡(luò)訓(xùn)練過(guò)程中的損失由位置損失、 置信度損失和類別損失三部分組成[18-19]. 由于虹膜數(shù)據(jù)集中存在正負(fù)樣本數(shù)據(jù)不均衡, 負(fù)樣本比例過(guò)高的問(wèn)題, 因此本文使用Focal Loss[15]作為類別損失函數(shù), 可降低大量簡(jiǎn)單負(fù)樣本在訓(xùn)練中所占權(quán)重. Focal Loss公式如下:
FL(pt)=-α(1-pt)γlog(pt),
(2)
其中α為用于調(diào)解正負(fù)樣本比例的權(quán)值,γ是用于降低簡(jiǎn)單樣本損失值的權(quán)值,pt表示模型的預(yù)測(cè)得分.本文取α=0.25,γ=2.
在虹膜定位過(guò)程中, 由于瞳孔在虹膜內(nèi)部, 因此同時(shí)預(yù)測(cè)虹膜和瞳孔時(shí), 使用傳統(tǒng)非極大值抑制(non maximum supression, NMS)算法存在一個(gè)最高分?jǐn)?shù)的預(yù)測(cè)框?qū)⑵渌眯哦壬缘偷硎玖硪晃矬w的預(yù)測(cè)框刪除的情形, 導(dǎo)致漏檢. DIoU-NMS算法[11]將DIoU(distance-IoU)作為非極大值抑制的準(zhǔn)則, 不僅考慮兩個(gè)預(yù)測(cè)框之間的重疊區(qū)域, 還考慮中心點(diǎn)距離. soft-NMS算法[20]對(duì)非最大預(yù)測(cè)框的預(yù)測(cè)得分進(jìn)行高斯指數(shù)衰減而非徹底篩除. 考慮到數(shù)據(jù)集中的每張圖片僅存在一個(gè)瞳孔類別和虹膜類別, 因此本文在結(jié)合soft-NMS和DIoU-NMS算法的基礎(chǔ)上, 先去除部分冗余框, 將剩余預(yù)測(cè)框在獲得新的得分后按預(yù)測(cè)類別排列, 分別選出兩個(gè)類別中的最大得分預(yù)測(cè)框, 即為網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果. 算法步驟如下:
1) 設(shè)置置信度閾值Conf_thres, 取出當(dāng)前圖片中得分高于該閾值的預(yù)測(cè)框, 并根據(jù)置信度降序排列;
2) 選取置信度最高的預(yù)測(cè)框Max_detection添加到輸出列表, 并將其從預(yù)測(cè)框列表中刪除;
3) 計(jì)算Max_detection與預(yù)測(cè)框列表中所有框的DIoU值, 將獲得的DIoU值取高斯指數(shù)后與原始得分相乘得到新的得分并重新排列, 得到新的預(yù)測(cè)框列表;
4) 根據(jù)預(yù)測(cè)框中的類別信息將預(yù)測(cè)框按類別排列, 得到瞳孔預(yù)測(cè)框列表和虹膜預(yù)測(cè)框列表;
5) 分別選出瞳孔預(yù)測(cè)框列表和虹膜預(yù)測(cè)框列表中得分最高的預(yù)測(cè)框, 即為網(wǎng)絡(luò)預(yù)測(cè)結(jié)果.
由虹膜的結(jié)構(gòu)可知, 虹膜中心與瞳孔中心不是同一點(diǎn), 但這兩個(gè)中心存在一定的耦合關(guān)系[21], 可以以虹膜內(nèi)圓定位信息為基礎(chǔ)對(duì)虹膜外圓精定位. 因此, 先精定位虹膜內(nèi)圓, 再精定位虹膜外圓. 為減少無(wú)意義的計(jì)算量, 只對(duì)網(wǎng)絡(luò)輸出預(yù)測(cè)框與其真實(shí)框交并比小于IoU閾值的圖像進(jìn)行精定位. 首先判斷網(wǎng)絡(luò)輸出預(yù)測(cè)框和對(duì)應(yīng)真實(shí)框的交并比與IoU閾值的關(guān)系, 若小于閾值, 則進(jìn)行精定位; 否則, 為定位的最終結(jié)果. 虹膜內(nèi)圓精定位和虹膜外圓精定位的流程分別如圖4和圖5所示. 以JLU4.0數(shù)據(jù)集中的圖像為例, 內(nèi)圓和外圓的IoU閾值均設(shè)置為0.90.
圖4 虹膜內(nèi)圓精定位流程Fig.4 Flow chart of precise positioning of iris inner circle
圖5 虹膜外圓精定位流程Fig.5 Flow chart of fine positioning of iris outer circle
(3)
(4)
(5)
其中
(6)
(7)
圖7為網(wǎng)絡(luò)預(yù)測(cè)結(jié)果.由圖7可見, 圖像的瞳孔圓心為(304.00,141.50), 半徑為38.75; 左、 右、 下3個(gè)檢測(cè)區(qū)域的灰度均值依次為152.82,255.00,132.75.左側(cè)和下側(cè)檢測(cè)區(qū)域無(wú)需移動(dòng), 右側(cè)檢測(cè)區(qū)域需向左移動(dòng).檢測(cè)區(qū)域移動(dòng)后如圖8所示.此時(shí), 3個(gè)檢測(cè)區(qū)域灰度均值依次為152.82,140.52,132.75; 3個(gè)檢測(cè)區(qū)域中心坐標(biāo)依次為(265.25,141.50),(336.75,141.50),(304.00,180.25).根據(jù)上述公式, 調(diào)整后的圓心為(301.00,144.50), 半徑為35.88.調(diào)整后的虹膜內(nèi)圓如圖9所示.
圖6 二值化圖像上的檢測(cè)區(qū)域Fig.6 Detection region on binarization image
圖7 網(wǎng)絡(luò)預(yù)測(cè)結(jié)果Fig.7 Network prediction result
圖8 二值化圖像移動(dòng)后的檢測(cè)區(qū)域Fig.8 Detection region of binarization image after movement
圖9 虹膜內(nèi)圓精定位Fig.9 Fine positioning of iris inner circle
圖10 調(diào)整圓心前后的虹膜外圓Fig.10 Outer circle of iris before and after center adjustment
圖11 模板區(qū)域和檢測(cè)區(qū)域Fig.11 Template region and detection regions
圖11中圖像的虹膜圓心為(301.00,144.50), 半徑為115.00; 左、 右兩個(gè)檢測(cè)區(qū)域灰度均值與模板區(qū)域灰度均值的比值依次為1.67和1.64, 左側(cè)檢測(cè)區(qū)域需向右移動(dòng), 右側(cè)檢測(cè)區(qū)域需向左移動(dòng).檢測(cè)區(qū)域移動(dòng)后如圖12所示.此時(shí), 兩個(gè)檢測(cè)區(qū)域灰度均值與模板區(qū)域灰度均值的比值依次為1.35和1.44; 兩個(gè)檢測(cè)區(qū)域中心坐標(biāo)依次為(196.00,144.50)和(411.00,144.50).調(diào)整后的圓心為(303.50,144.50), 半徑為107.50.調(diào)整后的虹膜外圓如圖13所示.
圖12 移動(dòng)后的檢測(cè)區(qū)域Fig.12 Detection regions after movement
圖13 虹膜外圓精定位Fig.13 Fine positioning of outer circle of iris
本文數(shù)據(jù)集由吉林大學(xué)自主采集的虹膜庫(kù)JLU4.0,JLU6.0和中科院虹膜庫(kù)CASIA-IrisV4-Interval組成, 其中選取JLU4.0數(shù)據(jù)庫(kù)中40個(gè)類別, 每類別選取100張圖像, 共4 000張圖像; 選取JLU6.0數(shù)據(jù)庫(kù)中20個(gè)類別, 每類別選取80張圖像, 共1 600張圖像; 選取CASIA-IrisV4-Interval數(shù)據(jù)庫(kù)中60個(gè)類別, 每類別選取10張圖像, 共600張圖像. 其中包括睫毛較重、 貼近邊緣等類型圖像. 對(duì)每個(gè)樣本進(jìn)行人工標(biāo)記虹膜內(nèi)外圓, 并對(duì)每個(gè)數(shù)據(jù)集按照4∶1的比例劃分訓(xùn)練集和測(cè)試集.
JLU4.0和JLU6.0數(shù)據(jù)庫(kù)中數(shù)據(jù)尺寸為640×480, CASIA-IrisV4-Interval數(shù)據(jù)庫(kù)中數(shù)據(jù)尺寸為320×280, 本文網(wǎng)絡(luò)輸入尺寸為480×480, 因此在輸入網(wǎng)絡(luò)前需對(duì)3個(gè)數(shù)據(jù)集分別進(jìn)行預(yù)處理. JLU4.0和JLU6.0數(shù)據(jù)庫(kù)中數(shù)據(jù)以長(zhǎng)邊為基礎(chǔ)裁剪得到480×480的圖像, CASIA-IrisV4-Interval數(shù)據(jù)庫(kù)中數(shù)據(jù)對(duì)長(zhǎng)邊和短邊做填充操作得到480×480的圖像.
Bneck結(jié)構(gòu)中一個(gè)主要的參數(shù)是擴(kuò)張系數(shù)t, 本文設(shè)置兩次下采樣之間使用同一個(gè)擴(kuò)張系數(shù), 為確定一組最優(yōu)的t, 選擇幾組不同的擴(kuò)張系數(shù)進(jìn)行實(shí)驗(yàn), 實(shí)驗(yàn)結(jié)果列于表2.
表2 Bneck結(jié)構(gòu)中擴(kuò)張系數(shù)t的設(shè)置
圖14 虹膜區(qū)域歸一增強(qiáng)過(guò)程Fig.14 Normalized enhancement process of iris region
選擇F1值[22]為評(píng)價(jià)指標(biāo), 對(duì)精確率和召回率進(jìn)行調(diào)和平均, 該值越大表示模型的輸出越好. 平均精度均值(mean average precision, mAP)[22]是衡量多類別目標(biāo)檢測(cè)的指標(biāo).F1值(iris)表示虹膜外圓F1值,F1值(pupil)表示虹膜內(nèi)圓F1值. 由表2可見, 參數(shù)設(shè)置為t={1,3,3,6,6}時(shí),F1值(iris)最高, 參數(shù)設(shè)置為t={1,2,2,2,6}時(shí),F1值(pupil)最高, 且平均精度均值最高. 綜合考慮, 將t={1,2,2,2,6}應(yīng)用于本文模型中.
實(shí)驗(yàn)使用Intel Core i7-8550處理器, 內(nèi)存為12 GB, NVIDIA GeForce MX150顯卡, Window10操作系統(tǒng)的PC機(jī), 模型框架為pytorch1.2.0, 編程語(yǔ)言為python 3.6. 訓(xùn)練模型的超參數(shù)設(shè)置如下: 訓(xùn)練批次大小Batch_size=2, 模型訓(xùn)練次數(shù)Epoch=100, 初始學(xué)習(xí)率為0.001, 優(yōu)化算法選用Adam算法. 本文將Daugman[4]的微積分圓模板法、 Wildes[5]的Hough圓定位法、 文獻(xiàn)[7]的分塊搜索法、 文獻(xiàn)[8]的單位扇環(huán)灰度法、 文獻(xiàn)[9]的級(jí)聯(lián)神經(jīng)網(wǎng)絡(luò)多任務(wù)虹膜快速定位方法、 YoloV3[12]、 YoloV4[11]、 不改變YoloV4的主干結(jié)構(gòu)模型作為對(duì)比方法.
本文選擇目標(biāo)檢測(cè)常用的mAP和虹膜識(shí)別系統(tǒng)中常用的正確識(shí)別率(correct recognition rate, CRR)、 等錯(cuò)率(equal error rate, EER)和ROC曲線[23]作為評(píng)價(jià)指標(biāo). ROC曲線是表示錯(cuò)誤拒絕率(false reject rate, FRR)和錯(cuò)誤接收率(false accept rate, FAR)關(guān)系的曲線. 在同一閾值下, 二值呈反比關(guān)系, ROC曲線越接近坐標(biāo)軸, 系統(tǒng)性能越好. FAR和FRR相等時(shí)的值為EER.
在進(jìn)行虹膜圖像歸一化時(shí), 本文的對(duì)比實(shí)驗(yàn)均使用Daugman[4]提出的橡皮圈模型將環(huán)形虹膜展開成512×64矩形, 并進(jìn)行圖像增強(qiáng), 截取左上角紋理最強(qiáng)的部分256×32區(qū)域作為虹膜識(shí)別區(qū)域; 使用水平移位, 消除虹膜旋轉(zhuǎn)[24]. 該過(guò)程如圖14所示. 使用二維Gabor濾波[25]提取虹膜的紋理特征, 通過(guò)對(duì)比樣本間的歐氏距離[26]判斷虹膜類別.
根據(jù)不同IoU閾值下平均定位準(zhǔn)確率、 內(nèi)外圓平均定位時(shí)間以及CRR,EER和ROC曲線對(duì)不同算法進(jìn)行比較. 在吉林大學(xué)JLU4.0,JLU6.0數(shù)據(jù)庫(kù)和中科院CASIA-IrisV4-Interval數(shù)據(jù)庫(kù)中的實(shí)驗(yàn)結(jié)果分別列于表3~表8, ROC曲線分別如圖15~圖17所示.
表3 JLU4.0數(shù)據(jù)庫(kù)中不同IoU閾值下不同算法的平均定位準(zhǔn)確率和平均定位時(shí)間
表4 JLU6.0數(shù)據(jù)庫(kù)中不同IoU閾值下不同算法的平均定位準(zhǔn)確率和平均定位時(shí)間
表5 CASIA-IrisV4-Internal數(shù)據(jù)庫(kù)中不同IoU閾值下不同算法的平均定位準(zhǔn)確率和平均定位時(shí)間
表6 JLU4.0數(shù)據(jù)庫(kù)實(shí)驗(yàn)結(jié)果
表7 JLU6.0數(shù)據(jù)庫(kù)實(shí)驗(yàn)結(jié)果
表8 CASIA-IrisV4-Interval數(shù)據(jù)庫(kù)實(shí)驗(yàn)結(jié)果
圖15 JLU4.0數(shù)據(jù)庫(kù)實(shí)驗(yàn)結(jié)果ROC曲線Fig.15 ROC curves of experimental results of JLU4.0 database
表3~表5對(duì)原始YoloV4網(wǎng)絡(luò)、 不改變YoloV4主干部分和本文算法進(jìn)行了比較, 其中不改變YoloV4主干部分是指除主干部分外其余部分均與本文算法相同. 由表3~表5可見, 當(dāng)IoU閾值較小時(shí), 本文方法平均定位準(zhǔn)確率存在略小于YoloV4模型和不改變YoloV4主干部分的網(wǎng)絡(luò)模型的情形, 這是由于原始YoloV4主干特征提取網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜且網(wǎng)絡(luò)參數(shù)較多, 能更好地適應(yīng)復(fù)雜環(huán)境下的目標(biāo)檢測(cè). 隨著IoU閾值的增大, 由于在網(wǎng)絡(luò)預(yù)測(cè)基礎(chǔ)上增加精定位, 不改進(jìn)YoloV4主干部分的網(wǎng)絡(luò)模型和本文算法的平均定位準(zhǔn)確率高于YoloV4模型. 本文將主干部分網(wǎng)絡(luò)替換為改進(jìn)后的MobileNetV3模型, 平均定位準(zhǔn)確率較替換前的網(wǎng)絡(luò)模型有所提升, 內(nèi)外圓平均定位時(shí)間較替換前大幅度減少. 說(shuō)明本文使用的改進(jìn)Mobile_YoloV4模型和灰度差值精定位不合格虹膜圖像的思想對(duì)定位速度和定位準(zhǔn)確率的提升具有關(guān)鍵作用.
圖16 JLU6.0數(shù)據(jù)庫(kù)實(shí)驗(yàn)結(jié)果ROC曲線Fig.16 ROC curves of experimental results of JLU6.0 database
圖17 CASIA-IrisV4-Interval數(shù)據(jù)庫(kù)實(shí)驗(yàn)結(jié)果ROC曲線Fig.17 ROC curves of experimental results of CASIA-IrisV4-Interval database
表6~表8和圖15~圖17對(duì)Daugman[4]算法、 Wildes[5]算法、 文獻(xiàn)[7]、 文獻(xiàn)[8]、 文獻(xiàn)[9]、 YoloV3算法和本文算法進(jìn)行了比較. Daugman[4]利用圓檢測(cè)算子檢測(cè)內(nèi)外圓, Wildes[5]利用Hough變換和投票機(jī)制搜索內(nèi)外圓, 這兩種方法都是在全局范圍內(nèi)定位內(nèi)外圓. 文獻(xiàn)[7]的分塊搜索法雖然在局部范圍內(nèi)進(jìn)行邊緣定位, 但在粗定位時(shí)采用先內(nèi)圓后外圓的方法, 過(guò)程非常耗時(shí). 文獻(xiàn)[8]采用投影法、 灰度直方圖和扇環(huán)灰度值分別定位內(nèi)圓和外圓, 同樣導(dǎo)致定位時(shí)間較長(zhǎng). 同時(shí), 上述算法在遇到光斑、 睫毛眼瞼等干擾或圖像邊緣噪聲等問(wèn)題時(shí), 定位效果并不理想, 從而導(dǎo)致識(shí)別效果不穩(wěn)定. 文獻(xiàn)[9]采用先生成候選框再進(jìn)行細(xì)粒度物體檢測(cè)的思想分兩階段同時(shí)定位內(nèi)外圓, 有效解決了正負(fù)樣本不均衡的問(wèn)題, 準(zhǔn)確率較高, 識(shí)別效果較穩(wěn)定, 但兩階段的檢測(cè)任務(wù)使得檢測(cè)速度較慢, 不能滿足虹膜系統(tǒng)實(shí)時(shí)性的要求. YoloV3[12]直接在網(wǎng)絡(luò)中提取特征預(yù)測(cè)物體分類和位置, 雖然定位時(shí)間約為0.2 s, 但相比兩階段的算法, 隨著識(shí)別標(biāo)準(zhǔn)的升高準(zhǔn)確率會(huì)逐步下降, 同樣導(dǎo)致識(shí)別效果不穩(wěn)定. 本文首先將Focal Loss作為損失函數(shù), 解決了正負(fù)樣本不均衡的問(wèn)題, 同時(shí)引入改進(jìn)的MobileNetV3作為主干特征提取網(wǎng)絡(luò), 使用快速soft-DIoU-NMS算法去除冗余框, 后續(xù)對(duì)不合格的圖像再次進(jìn)行精定位, 使定位時(shí)間大幅度下降, 并提升了定位準(zhǔn)確率, 能準(zhǔn)確定位受睫毛、 光斑等干擾的圖像, 增強(qiáng)了虹膜定位的魯棒性, ROC曲線較其他算法更接近于坐標(biāo)軸, 識(shí)別效果更穩(wěn)定.
綜上所述, 本文提出了一種基于改進(jìn)YoloV4網(wǎng)絡(luò)的虹膜定位算法. 首先, 利用改進(jìn)Mobile_YoloV4網(wǎng)絡(luò)模型在兩個(gè)維度對(duì)虹膜內(nèi)外圓進(jìn)行粗定位, 同時(shí), 使用K-means++聚類算法生成先驗(yàn)框, 引入Focal Loss函數(shù)作為類別損失函數(shù)解決正負(fù)樣本不平衡問(wèn)題, 改進(jìn)非極大值抑制為快速soft-DIoU-NMS算法去除預(yù)測(cè)過(guò)程中的冗余框, 提高算法檢測(cè)率; 其次, 挑選出小于內(nèi)外圓IoU閾值的虹膜圖像; 最后, 利用二值化圖像對(duì)小于IoU閾值的內(nèi)圓進(jìn)行精定位, 利用虹膜和鞏膜的灰度差值對(duì)小于IoU閾值的外圓進(jìn)行精定位. 實(shí)驗(yàn)結(jié)果表明, 相比于傳統(tǒng)算法, 本文方法通過(guò)利用神經(jīng)網(wǎng)絡(luò)可以同時(shí)定位內(nèi)外圓且能準(zhǔn)確定位出受干擾的圖像; 相比于Two-stage算法和Yolo系列算法, 本文方法通過(guò)改進(jìn)損失函數(shù)和非極大值抑制、 引入MobileNetV3、 改進(jìn)網(wǎng)絡(luò)結(jié)構(gòu)以及篩選不合格虹膜進(jìn)行精定位, 提高了虹膜定位準(zhǔn)確率, 縮短了定位時(shí)間, 提高了定位速度, 識(shí)別效果穩(wěn)定.