■文/公安部檢測中心 吳彤 陳燦燦 張翔
關(guān)鍵字:人臉檢測 人臉識別 評測方法 性能指標
隨著移動互聯(lián)網(wǎng)和人工智能技術(shù)的飛速發(fā)展,人體生物特征識別應用成為當前安防領(lǐng)域技術(shù)發(fā)展的趨勢。人臉識別應用相對于其他人體生物特征識別應用有著采集方式便捷、采集設備門檻低、特征辨識性強等顯著優(yōu)勢,在交通、金融、旅游、社保等實際場景中得到越來越多的應用。本文將分四部分內(nèi)容對人臉識別應用中算法級別的測試方法進行簡要闡述。
人臉識別應用功能流程包括人臉檢測、人臉活體檢測、抓取人臉質(zhì)量評估、人臉特征數(shù)據(jù)提取、人臉特征數(shù)據(jù)比對和比對結(jié)果。
圖1 人臉識別應用功能流程圖
人臉檢測是人臉識別應用中的首要步驟,是指對于一幅照片或視頻中的某一幀圖像,確定其是否含有人臉,并能夠給出人臉的位置信息和大小區(qū)域。人臉檢測的性能在實際測試中,主要會受到膚色、人臉姿態(tài)、表情、外飾物遮擋和采集光線等信息的干擾。
人臉假體檢測中的人臉活體檢測是人臉檢測中的可選步驟,是指確認輸入人臉的是一個合法的生物活體,也就是說人臉識別系統(tǒng)需要能夠防范惡意攻擊者使用各種假體進行攻擊,判斷獲取到的生物特征是否屬于一個有生命、在現(xiàn)場、真實的人。目前,人臉活體檢測技術(shù)主要包括交互式活體檢測、利用紅外等設備活體檢測和基于大數(shù)據(jù)分析方法的活體檢測等。
市場上的人臉識別應用類安防產(chǎn)品對于經(jīng)過人臉檢測獲取的人臉圖片會進行人臉質(zhì)量評估,判斷提取到的人臉是否能進行人臉比對并得到很好的結(jié)果,比如對是否遮擋過大、人臉姿態(tài)是否端正、人臉區(qū)域是否完整、人臉圖像亮度和對比度是否合適等因素的判斷。這一步驟的參數(shù)和指標的設定與廠家的比對算法是緊密相連的,也對比對結(jié)果有很重要的影響。
將人臉圖片的特征點進行提取形成特征數(shù)據(jù),特征點的數(shù)據(jù)描述方式由安防廠家根據(jù)算法規(guī)定,每個廠家都不同。影響提取的主要因素是照片的格式、存儲大小和分辨率,這一步驟與人臉識別類安防產(chǎn)品中的人臉注冊相對應。
人臉識別應用中比較核心的功能就是人臉特征數(shù)據(jù)的比對,再根據(jù)預設的相似度閾值給出比對結(jié)果,即是否為目標人,識別算法的主要指標也是針對這一步驟。
根據(jù)安防領(lǐng)域的實際情況可將應用場景分為人證核驗、人庫核驗和庫庫碰撞。
人證核驗是人臉識別應用中最基本的一種應用場景,它對應的是識別算法中的1:1人臉確認算法。當前的旅店業(yè)、火車站出入口、汽車臨檢、移動警務臨檢,甚至公司考勤、小區(qū)出入等一般場景的身份鑒別都會用到人臉和證件照片的比對識別。
人庫核驗是指將現(xiàn)場采集到的人臉圖片或視頻與目標人底庫進行比對的場景,它對應的是1:N人臉辨認算法,一般在警務布控、重大組織活動安保等場景中應用。
庫庫碰撞是指現(xiàn)場采集的多張人臉圖片或視頻與目標人底庫進行比對的場景,它對應的是M:N關(guān)注名單人臉識別,一般在目標人視頻追蹤、警務布控和重大組織活動安保等場景中應用。
第三方算法測試庫本著公平、客觀的原則進行創(chuàng)建,根據(jù)測試指標的要求分為以下五類測試庫。
主要用于人臉注冊性能的算法測試。注冊庫由約束條件下采集狀況良好的圖片庫或視頻庫組成,采集樣本組成因素(性別、年齡、地域等)根據(jù)對應的行業(yè)標準進行實時更新,樣本數(shù)量根據(jù)性能指標進行確認。
這個建議,后來令曹操驚出一身冷汗!可惜,袁紹猜忌許攸與曹操舊誼,腦袋差點搬家。許攸只好“重新選擇”曹操!結(jié)果,許攸與曹操合作,烏巢糧道一把火,直接改寫了袁紹與曹操的命運。毛澤東在《中國革命戰(zhàn)爭的戰(zhàn)略問題》一文中,盛贊曹操“雙方強弱不同,弱者先讓一步,后發(fā)制人,因而戰(zhàn)勝”的軍事才能和高超的選擇藝術(shù)。
主要對人證核驗、人庫核驗應用場景進行算法測試。測試庫包括兩類圖片集或視頻集:一類是約束條件下的人臉注冊用,采集狀況較好;另一類是半約束狀態(tài)下的對應的現(xiàn)場采集,配合度和采集狀況均不確定。
主要是對庫庫碰撞應用場景進行算法測試。測試庫包括三類圖片集或視頻集:一類是約束條件下的人臉注冊用,采集狀況較好;一類是半約束狀態(tài)下的對應的現(xiàn)場采集;第三類是半約束狀態(tài)下的非對應得現(xiàn)場采集。二、三類的配合度和采集狀況均不確定。
專項應用庫主要用于對特殊指標的測試,比如戴眼鏡判定、性別判定、表情判定、活體檢測判定等,這類測試庫正負樣本比例1:1,當多狀態(tài)判定時狀態(tài)樣本比例應按照實際場景的狀態(tài)比例進行配比。
算法性能進行評測的具體指標項包括兩類:一類為算法基礎指標,主要為注冊成功率(特征提取成功率)、活體通過率和假體通過率、認假率(FAR)和拒真率(FRR)、特征提取時間、特征比對時間;一類為屬性指標,主要為檢出率、檢索準確率、重復抓拍率、誤聚率。由于后一類與業(yè)務屬性關(guān)系較大,公式定義較復雜,本文僅對第一類基礎指標做出說明。
圖2 人臉追蹤檢測軟件界面
(1)注冊成功率(特征提取成功率)
注冊成功率=特征提取成功的樣本數(shù)量/樣本總數(shù)量(百分數(shù)表示結(jié)果)
(2)活體通過率
活體通過率=人臉活體樣本測試正確通過的通行測試次數(shù)/人臉活體樣本通行測試總次數(shù)(百分數(shù)表示結(jié)果)
(3)假體通過率
假體通過率=人臉假體樣本測試通過的通行測試次數(shù)/人臉假體樣本通行測試總次數(shù)(百分數(shù)表示結(jié)果)
(4)認假率(FAR)
認假率=非目標人樣本測試結(jié)果確認為目標人的次數(shù)/非目標人樣本測試總次數(shù)(百分數(shù)表示結(jié)果)
(5)拒真率(FRR)
拒真率=目標人樣本測試結(jié)果未確認為目標人的次數(shù)/目標人樣本測試總次數(shù)(百分數(shù)表示結(jié)果)
(6)特征提取時間
單次特征提取的平均時間(單位為毫秒),不計數(shù)據(jù)傳輸、保存時間。
(7)特征比對時間
單次特征數(shù)據(jù)比對的平均時間(單位為毫秒)。
本文對人臉識別應用算法的測試庫類別和測試指標項做了簡要介紹。近年來,人臉識別應用領(lǐng)域是非常活躍的技術(shù)領(lǐng)域,期待未來能出現(xiàn)更有意義的應用和發(fā)展。