国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

人臉識別系統(tǒng)的活體檢測綜述

2021-07-22 17:02:20馬玉琨徐姚文王澤瑞
計算機與生活 2021年7期
關鍵詞:活體假體人臉

馬玉琨,徐姚文,趙 欣,徐 濤,王澤瑞

1.河南科技學院 人工智能學院,河南 新鄉(xiāng) 453003

2.北京工業(yè)大學 信息學部,北京 100124

3.河南科技學院 信息工程學院,河南 新鄉(xiāng) 453003

近年來,人臉由于其唯一性和穩(wěn)定性,被廣泛用于在線身份認證,而人臉識別技術的發(fā)展[1-2]也促使了人臉身份認證系統(tǒng)在越來越多場合下的應用[3-4]。然而在線的人臉身份認證系統(tǒng)極易受到各種蓄意的攻擊[5],即外部攻擊和內部攻擊[6]。外部攻擊也稱作呈現(xiàn)攻擊[7],指的是對采集傳感器的假體人臉攻擊[8-10],將合法用戶的人臉生物特征偽造物呈現(xiàn)給傳感器[11-13],如圖1 所示,其目的是干擾生物識別系統(tǒng)的獲取操作[7]。內部攻擊指的是攻擊者侵入人臉識別系統(tǒng)內部,替換或篡改系統(tǒng)中各種關鍵模塊或數(shù)據(jù)。

Fig.1 Several types of face presentation attack圖1 常見的幾種人臉假體攻擊類型

相對于內部攻擊,外部攻擊即假體攻擊更加容易實施,是因為一是很容易生成合法用戶人臉偽造物并呈現(xiàn)給傳感器。實際上,這種呈現(xiàn)攻擊的生物特征樣本極其容易被獲取,并且對人臉識別系統(tǒng)產(chǎn)生了極大的威脅。隨著社交網(wǎng)絡的發(fā)展,人臉已經(jīng)不再是私密特征,人們都樂意將自己的人臉圖像或者視頻放在社交網(wǎng)絡中,比如微信朋友圈、微博、臉書等。攻擊者可以零努力地、低成本地獲取并復制這些人臉樣本,并且攻擊者也很容易將這種生物特征呈現(xiàn)給系統(tǒng)傳感器。二是不需要了解人臉識別系統(tǒng)中算法的任何細節(jié),僅僅需要使用更真實的呈現(xiàn)媒介來呈現(xiàn)人臉樣本。因此,人臉識別系統(tǒng)的主要威脅來源于呈現(xiàn)攻擊。

針對假體攻擊為人臉識別系統(tǒng)帶來的安全問題,人臉活體檢測技術應運而生[9]。人臉活體檢測技術旨在判斷系統(tǒng)采集的人臉數(shù)據(jù)是否為真實的人臉,以防止偽造的假體人臉攻擊[14],如圖2 所示。完善的人臉活體檢測技術是人臉身份認證系統(tǒng)進一步普及應用的前提條件,可廣泛應用于大型集會、特殊組織和場合,包括刷臉支付、人臉解鎖、公共安防以及各種在線人臉識別系統(tǒng)等,具有重大的社會意義。

Fig.2 Face presentation attack detection圖2 人臉活體檢測示意圖

近年來,假體人臉的攻擊逐漸成為人臉認證系統(tǒng)得以應用的瓶頸,也是研究者們關注的重點和熱點,國際上也舉辦了多次關于人臉活體檢測的競賽[15-16]。在過去的幾十年中,國內外大批頂尖的研究機構和學者對此開展了研究,該領域的科研成果也頻繁出現(xiàn)在國際權威的學術期刊與會議上,有大量文獻對人臉識別系統(tǒng)中數(shù)據(jù)捕獲子系統(tǒng)和活體檢測方法進行了深入分析和研究。文獻[17]對可見光譜下的人臉活體檢測方法進行了綜述;文獻[18]全面綜述了2014 年前關于人臉識別中反欺騙的先進性方法以及數(shù)據(jù)庫,同時還介紹了生物識別反欺騙通用性方法。文獻[6]對人臉呈現(xiàn)攻擊類型與活體檢測的國際標準給出詳細解釋,并且對2017 年前的人臉活體檢測方法、數(shù)據(jù)庫以及競賽進行了綜述。

2017 年以來,多個新的人臉呈現(xiàn)攻擊數(shù)據(jù)庫被公布,且涌現(xiàn)了許多新穎的檢測方法,因此有必要對最新的發(fā)展進行總結與分析。本文在概述人臉活體檢測早期的研究工作基礎上,系統(tǒng)地介紹了最近幾年的研究進展,并對數(shù)據(jù)庫的發(fā)展進行了總結,補充了對評價方法的綜述,對活體檢測的未來發(fā)展趨勢進行了展望。

1 人臉活體檢測方法

主流人臉活體檢測方法根據(jù)是否利用輔助信息可以分為利用輔助信息的方法和不利用輔助信息的方法。

輔助信息指除可見光下的人臉圖像信息外的其他可以用來檢測呈現(xiàn)攻擊的信息,其中包括基于用戶配合的方法和利用其他模態(tài)信息的方法。利用用戶配合信息的方法需要用戶做出隨機給出的指令,如頭部轉動[19],或讓用戶讀出指定數(shù)字[20],眨眼等?;谟脩襞浜系姆椒ㄆ溆脩趔w驗較差,且等待時間較長,效率低下。另一方面,隨著虛擬視頻生成技術的發(fā)展與深入,很容易由一張靜態(tài)圖片生成虛擬的動作視頻[21-22],攻破基于用戶配合的活體檢測算法。利用其他模態(tài)輔助信息的方法采用光場相機[23-24]、雙目相機[25]、近紅外相機[26-27]、結構光等[28]設備采集可見光人臉信息不具備的有用信息,比如深度信息[29]。該類方法準確度較高,但另一方面提高了產(chǎn)品的成本,限制了其應用場景和推廣進度。

考慮到基于輔助信息方法的局限性,本文重點分析無需輔助信息的方法。該類方法僅僅根據(jù)可見光下人臉圖像進行活體檢測,該類方法的研究進展分為兩個階段,深度學習發(fā)展之前大多采用傳統(tǒng)手工定義的特征進行檢測,深度學習普及之后涌現(xiàn)了很多基于深度特征的檢測方法。本文分別對這兩類方法進行分析討論。

1.1 基于手工特征的人臉活體檢測算法

基于手工特征的人臉活體檢測算法又可進一步分為基于靜態(tài)特征的方法和基于動態(tài)特征的方法。

基于靜態(tài)特征的活體檢測方法探索真假人臉的顏色、紋理等差別。區(qū)別于真實人臉,照片或者視頻攻擊需要二次成像及額外的展示過程,會丟失圖像的細節(jié)紋理信息,可使用紋理特征與局部形狀特征進行檢測[30-31]。該區(qū)別反映到頻域上為高頻信息的損失,同時會引入額外的噪聲[32],如圖3 所示。該方法具有一定的局限性,隨著成像和打印技術的逐漸成熟,照片人臉和真實人臉在細節(jié)部分的差異越來越小,因此頻域差異也越來越小。

Fig.3 Difference between genuine face and photo face in frequency domain圖3 真實人臉和照片人臉在頻域的區(qū)別

此外,2015 年Garcia 和Patel 等人分別提出利用二次成像的摩爾紋(Moire patterns)信息檢測基于電子屏幕的照片或視頻假體人臉攻擊[33-34]。由于電子屏幕基于固定重復模式的紋理元素合成各種顏色,因此二次成像含有摩爾紋特征,如圖4 所示?;诖颂攸c,利用摩爾紋可以檢測惡意的屏幕展示攻擊。然而設備開發(fā)者也在盡力避免摩爾紋的產(chǎn)生,例如適馬的X3 和腐蝕的X-Trans 傳感器等。因此基于摩爾紋的方法也有一定的局限性。

Fig.4 Several examples of Moire圖4 摩爾紋的幾個例子

基于動態(tài)特征的方法主要利用人臉的運動信息進行活體檢測,可利用的運動信息包括人類固有的動作和生理行為。如Pan 等人對眨眼行為進行建模,判斷是否為活體人臉[35];Kollreider等人利用光流法[36]模擬人臉表情微動作信息[37],以此檢測照片攻擊;Li等人[11]通過檢測液晶顯示屏的抖動進行重放攻擊檢測?;趧討B(tài)特征的方法只檢測某個特定的動作,或者相鄰兩幀的差別,但對于具有真實人臉動作信息的視頻攻擊較難檢測。

1.2 基于深度學習的人臉活體檢測

隨著深度學習技術的發(fā)展,許多研究者嘗試將深度學習技術用于人臉活體檢測問題,并取得了較好的性能,如直接應用AlexNet做活體檢測二分類[38],將遷移學習應用于活體檢測分類網(wǎng)絡解決數(shù)據(jù)量不足的問題[39],對人臉圖像進行預處理改進網(wǎng)絡輸入的方法[40-41]。

基于深度學習的方法利用數(shù)據(jù)驅動的訓練方式,能夠較好學習大量訓練數(shù)據(jù)中包含的模式信息,在性能上相比于傳統(tǒng)方法有了顯著提升,但深度特征的含義難以解釋,提取過程難以控制,不易關注到真?zhèn)文槻町惖谋举|,阻礙了基于深度特征的方法性能進一步提升,也容易過擬合到數(shù)據(jù)集中與活體信息無關的設備、光照信息等。在實驗驗證中表現(xiàn)為較好的庫內測試準確率,但跨庫測試準確率非常低,即算法泛化性較差。如利用MSU-MFSD 和Idiap Replay Attack 數(shù)據(jù)集進行訓練,在第三個數(shù)據(jù)集CASIA 上測試的半錯誤率為41.02%[42],這對于二分類任務幾乎不可用,說明在真實場景中的泛化性仍然是較大的挑戰(zhàn)[43-44]。近期針對活體檢測的研究進展集中在算法的泛化性上,本文將這些方法分為如圖5 所示五類。

1.2.1 基于輔助監(jiān)督信號的方法

基于輔助監(jiān)督信號的方法認為已有方法把活體檢測看作二分類問題,直接讓分類模型學習的方法學習到的特征泛化性和區(qū)分度不夠,因此引入如人臉深度圖、遠程光電體積描記術(remote photoplethysmography,rPPG)信息、假體介質輪廓等輔助監(jiān)督信號指導特征的提取,提高特征的可解釋性。

Fig.5 Deep learning-based face presentation attack detection analysis圖5 基于深度學習的活體檢測分析

Atoum 等人認為視頻攻擊和照片攻擊的立體分布和真實人臉具有較大差異,因此將人臉深度圖作為活體與非活體的差異特征[45],設計基于分塊人臉和人臉深度圖的活體檢測框架。

rPPG[46-47]在2016年被首次用于活體檢測。為了使該微弱變化具有更明顯的可視性,Lakshminarayana等人提出利用時空映射的方法[48],將時域內的膚色周期性變化映射到單張圖像,如圖6 所示,增強了該變化的可視性。rPPG 對于面具攻擊和紙張攻擊效果很好,但是對于視頻翻拍攻擊效果一般,因錄制的視頻人臉上也帶有被弱化的rPPG 信息,故不好區(qū)分。

Fig.6 Spatio-temporal mapping results in different situations圖6 不同情況下的時空映射結果

在以上對rPPG 研究的基礎上,2018 年,Liu 等人[49]首次將活體檢測看作特征監(jiān)督問題,設計深度框架預測出脈跳和深度圖信息,進而進行活體檢測分類。該方法的性能首次超越傳統(tǒng)手工提取特征的方法。Liu 等人利用rPPG 信號對3D 面具攻擊進行了檢測[50]。

除深度圖和rPPG 等信息外,每種攻擊類型的假體都有其特有的輪廓,如面具攻擊的假體輪廓為人臉輪廓,而重放攻擊的輪廓為電子屏的矩形輪廓,該假體介質輪廓加以利用作為輔助監(jiān)督信號,因此Zhu等人將活體檢測的分類任務轉化為假體介質輪廓(spoofing medium contours,SMCs)的檢測問題[51]。該方法要求拍攝范圍能夠覆蓋所有假體,當拍攝距離較小時具有一定局限性。

基于輔助信號監(jiān)督的方法雖然通過約束所提特征的含義范圍來增強其可解釋性,但這一約束也導致網(wǎng)絡忽略了其他可能的鑒別線索。如何在保留其他線索的前提下加入輔助信號可作為該類方法的進一步研究方向。

1.2.2 基于域適應、域泛化的方法

偽臉不僅存在由攻擊類型不同導致的類間差異,還存在同種攻擊類型內的類內差異,如采集設備差異、呈現(xiàn)設備差異、打印媒介的材質差異、背景光照差異等。針對偽臉類間、類內差異較大的問題,采用域適應、域泛化技術,提高人臉活體檢測算法在跨域情景下的性能。

該類方法使用域的概念表示活體檢測問題中的不同攻擊類型、場景、數(shù)據(jù)庫等。針對活體檢測方法在不同攻擊類型之間的泛化性問題,Shao 等人提出了多對抗性域泛化機制[52],用統(tǒng)一的提取器提取各域圖片的特征,針對每個域均訓練一個單獨的鑒別器,通過生成對抗的訓練形式,學習多個庫之間共存的具有區(qū)分度的廣義特征空間特征,增強算法在未知數(shù)據(jù)庫上的泛化性。傳統(tǒng)的三重挖掘約束只在各自域內進行,但域泛化方法依賴多個域間的交互,因此提出雙向的三重挖掘約束,不僅關注單個域內的正負樣本,也在域間進行約束,即不同域間的樣本對距離也要小于域間的樣本對距離?;谟蜻m應的方法通過使鑒別器無法判斷生成器所提特征的域來源,迫使生成器提取的特征去域化。域泛化的方法無需目標域的樣本,但通常需要多個源域,實際上是豐富了樣本的多樣性。

而域適應的方法通過少量目標域的樣本調整源域訓練的特征提取器,使特征更接近目標域的特征分布[53-55]。Jia 等人認為活體檢測的最終目的是選出真實人臉,因此只需提取真實樣本的去域化特征即可,不必要也不易于將多個域的偽臉樣本特征約束至緊湊空間[53],提出利用非對稱三重挖掘的概念不僅要求真實人臉與偽臉分離,同時要求所有域的真實人臉彼此聚集,不同域的偽臉彼此分離。Wang 等人用源域、目標域的編碼器分別提取各自域圖片的特征,通過生成對抗的訓練形式,使鑒別器無法判斷所提特征的域來源,迫使兩個編碼器提取的特征分布更接近。再使用共享參數(shù)的解碼器進一步拉近兩者的分布并嵌入到真?zhèn)伪鎰e空間,從而將在源域學習的分布信息遷移至目標域[56]。域適應的方法本質上屬于遷移式學習,訓練時需要目標域的少量樣本,泛化性也因此受限。

1.2.3 基于特征解耦的方法

基于特征解耦的方法將真?zhèn)闻袆e信息與用戶身份、背景環(huán)境等真?zhèn)螣o關信息相分離,解耦出更有辨別力的活體檢測特征[42,56]。Wang 等人認為已有方法對未見場景不泛化是因為特征過擬合了人的身份信息,擁有相似外貌的用戶樣本會更傾向于聚在一起,從而增加了以真?zhèn)螢闃藴实木垲愲y度,影響活體檢測性能。當測試樣本與訓練樣本來自不同域的時候該問題更為嚴重。因此,為避免因身份信息過擬合而導致的模型泛化能力下降,提出將特征中的身份信息和活體信息解耦[42],使用解耦后的活體信息單獨進行活體檢測,其具體方法為在兩個域內分別預訓練真?zhèn)畏诸愄卣魈崛∑骱蜕矸萏卣魈崛∑鳎粨Q兩個域的真?zhèn)畏诸愄卣魈崛∑?,利用重構圖片驗證身份信息,利用分類器驗證真?zhèn)畏诸愋畔ⅲㄟ^交換分類特征提取器后重構驗證的方式,迫使提取器提取的特征更具有泛化性。

Zhang等人認為,除了身份信息以外,特征還包含了如環(huán)境、設備等內容,因此將人臉提取的特征空間劃分為活體空間和內容空間,從高維特征空間獲取活體信息[57],通過交換真?zhèn)畏诸愄卣骱笾貥嬺炞C的方式,迫使真?zhèn)畏诸愄卣髋c身份、背景等特征更無關。值得一提的是,該工作用LBP(local binary pattern)、深度圖作為輔助信息約束真?zhèn)畏诸愄卣鳎蛊涓哂姓鎮(zhèn)伪鎰e力。該類方法解耦后的幾部分應具有獨立、完備且互補的特性,而目前已有解耦方法較難在理論上證明滿足該特性。且對活體特征造成干擾的因素多種多樣,如身份信息、光照、設備、運動等。如何設計合理的解耦方法使得所提活體特征從各種干擾中分離,是該方向的難點。

1.2.4 基于噪聲建模的方法

偽臉是攻擊者使用合法用戶的真實人臉圖像,基于一定的偽造媒介(打印設備、視頻播放設備、3D面具等)制作的偽造物,因此偽造過程不可避免地會引入一些與媒介強相關的噪聲?;谠肼暯5姆椒ㄊ軉l(fā)于去噪和去抖動的思想,認為成像噪聲包括顏色失真、顯示降質、呈現(xiàn)環(huán)境噪聲、采集設備噪聲等,將活體人臉圖看作原圖x′,而非活體人臉圖看作活體人臉圖加了噪聲的結果,用x表示,即x=x′+N(x′)。自編碼器提取輸入圖片的噪聲圖N(真實人臉圖片的噪聲圖為0),通過x′=x-N得到合成的真實人臉圖片,利用VQ(visual quality)網(wǎng)絡判斷輸入圖片是否為虛擬合成,DQ(discriminative quality)網(wǎng)絡判斷輸入圖片是否為真實人臉。噪聲建模的概念將活體檢測任務轉化為估計噪聲的任務,然后利用噪聲模式特征進行分類決策,通過對噪聲建模研究偽造媒介的影響[58-59],進而對人臉進行去攻擊操作。噪聲模式隱藏在網(wǎng)絡中,無法直觀體現(xiàn)各攻擊類型與真實人臉間差異的本質,尤其是在成像過程中引入的噪聲和假體人臉攻擊伴隨的噪聲難以徹底區(qū)分。

1.2.5 基于異常檢測的方法

基于異常檢測的方法將活體檢測問題看作真實人臉的異常檢測,利用手工特征將真實人臉建模為標準生成模型,測試過程中將模型之外的分布看作假體攻擊。Nikisins 和Pérez-Cabo 等人提出在訓練階段只學習真實人臉的特征[60-61],測試階段判斷所見人臉是否符合該特性,一方面避免了數(shù)據(jù)收集階段的繁瑣,另一方面對未見攻擊類型具有一定泛化性。2019 年,Liu 等人提出,人臉假體欺騙的類型多種多樣,且將來會層出不窮,因此針對未知攻擊類型的檢測即零次學習(zero-shot learning)應作為未來研究趨勢[62]。Baweja 等人針對以往異常檢測的方法需要分階段學習的問題,提出在CNN(convolutional neural network)訓練過程中引入偽負類,考慮到假體攻擊人臉和真實人臉的相似性,在真實人臉的特征分布上生成偽負類特征,輔助訓練特征的提取和分類,實現(xiàn)異常檢測的端到端學習[63]。偽負類特征輔助的方法需要在理論上解決兩個問題,一是偽負類特征如何避免與正類特征重疊,二是如何證明偽負類特征具有負類信息。針對這兩個問題,目前尚未有解決方法。

Table 1 Comparison of different face presentation attack detection methods表1 不同人臉活體檢測方法比較

以上介紹了不同的活體檢測方法。表1 分析了各類方法的優(yōu)點、缺點、應用場景等。實際應用中經(jīng)常將多種方法相結合用于提高算法準確性。

2 活體檢測的評價

2.1 數(shù)據(jù)庫

隨著活體檢測技術的進步,以及對評價方法要求的不斷提高,目前已有多個數(shù)據(jù)集公開并用于方法測評,由于數(shù)量較多無法在本文中一一列出。而2017 年之前已有對活體檢測方法的綜述文章,其中包括對數(shù)據(jù)集的介紹,因此本文重點介紹2017 年之后最新發(fā)布的數(shù)據(jù)集,包括SiW-M、CASIA-SURF、ROSE-YOUTU 等。這些數(shù)據(jù)集在數(shù)量和多樣性上都有了較大的提升,并在最新的文章中被廣泛應用[6]。

SiW-M 數(shù)據(jù)集收集了493 個人的真實和假體視頻,共660 個真實視頻,968 個假體視頻,且包含13 種攻擊方式[60],如照片攻擊、視頻攻擊、3D 面具攻擊、化妝攻擊、部分遮擋攻擊等。相比已有數(shù)據(jù)集,SiW-M增加了攻擊類型的多樣性。

CASIA-SURF 數(shù)據(jù)集[29]于2019 年完成,包含21 000 個視頻中的1 000 名中國人,覆蓋不同的性別、年齡、是否戴眼鏡/無眼鏡等特性,以及6 個不同攻擊方式。照片裁剪方式裁剪下照片中人臉的不同區(qū)域。該數(shù)據(jù)庫使用Intel Real Sense SR300 相機同時捕捉RGB、深度和紅外(IR)視頻,使用A4 紙打印彩色圖片。在照片拍攝過程中,測試者需要做一些動作,例如向左或向右轉,向上或向下移動,走進或遠離相機。此外,測試者的面部角度要求小于30°,測試者站在距離相機0.3~1.0 m 的范圍內。Real Sense SR300 攝像機記錄多模態(tài)視頻流,最后進行融合得到除去背景以外的面部區(qū)域。而該數(shù)據(jù)集的升級版CASIA-SURF CeFA 已于2020 年發(fā)布[64],增加了跨種族的志愿者身份,以測試算法在種族間的泛化性。

ROSE-YOUTU 數(shù)據(jù)集由YouTu 收集[65]。它涉及20 個參與者,每個參與者有25 個真實的和150~200個假臉視頻。收集的數(shù)據(jù)多種多樣,覆蓋了5 種不同的光照條件。并使用5 臺移動設備(神州手機、華為手機、中興手機、iPad、iPhone 5s)采集數(shù)據(jù)。此外,在ROSE-YOUTU 數(shù)據(jù)庫中,除了打印的照片(靜止、顫抖)和視頻(聯(lián)想LCD 屏和Mac 屏顯示)之外,還包括各種紙面面具攻擊示例。這種攻擊可能包含3D 信息,這在已有的數(shù)據(jù)集是未出現(xiàn)過的。

隨著越來越多,越來越龐大的數(shù)據(jù)集被發(fā)布,其發(fā)展趨勢體現(xiàn)在攻擊手段、展示設備、攝錄設備越來越多樣,而假體數(shù)據(jù)采集的代價越來越高,且假體的數(shù)據(jù)量遠遠無法與真實數(shù)據(jù)達到平衡,因此2019 年Yang 等人提出利用虛擬合成的方法獲得負樣本數(shù)據(jù)[66],彌補負樣本不完備或難以獲取的問題,在一定程度上緩解了對數(shù)據(jù)收集的強烈需求。

2.2 評價指標

人臉活體檢測算法的性能評價指標同時考慮活體人臉與假體人臉的識別率。常用的性能評價指標主要有兩套:

一是錯誤接受率(false acceptance rate,F(xiàn)AR)、錯誤拒絕率(false rejection rate,F(xiàn)RR)、等錯誤率(equal error rate,EER)以及半錯誤率(half total error rate,HTER)。錯誤接受率(FAR)指算法把假體人臉判斷成活體人臉的比率,F(xiàn)AR=假體人臉判斷為活體人臉的次數(shù)/假體人臉攻擊總次數(shù)。錯誤拒絕率(FRR)指算法把活體人臉判斷成假體人臉的比率,F(xiàn)RR=活體人臉判斷為假體人臉的次數(shù)/活體人臉請求總次數(shù)。FRR 與FAR 的均值即為半錯誤率HTER。當FRR=FAR 時,即為等錯誤率EER。

第二套評價指標是攻擊分類錯誤率(attack presentation classification error rate,APCER)、善意提示錯誤率(bona fide presentation classification error rate,BPCER)以及平均錯誤率(average classification error rate,ACER)指標[7]。攻擊分類錯誤率(APCER)指針對某一具體攻擊類型的假體人臉分類錯誤率,善意提示錯誤率(BPCER)指活體人臉分類錯誤率。APCER 與BPCER 同第一套評價指標中的FAR 與FRR 類似,但是FAR 和FRR 把所有類別的假體人臉混合在一起計算性能,APCER 是為每一種類別的假體人臉分別計算,比如照片類假體、視頻類假體、3D面具類假體,最后活體檢測算法總的APCER 是所有類別假體中識別率最差的結果。

2.3 測試方法

目前對人臉活體檢測方法的測試分為三類,分別是庫內測試、跨庫測試和實際應用場景測試。

庫內測試指算法的訓練和測試來自同一個數(shù)據(jù)集中的不同數(shù)據(jù)。庫內測試在一定程度上反映了算法的有效性。但由于單數(shù)據(jù)集中的攻擊方式、設備以及場景較為單一,因此無法反映算法在多樣化真實場景下的性能。在無人為干預下,數(shù)據(jù)驅動的算法很容易學到數(shù)據(jù)集所獨有的特性,如人臉尺寸、相機特性等,而非真假人臉的差異。因此一旦這些條件發(fā)生變化,算法有效性將大大降低。

為解決庫內測試的局限性,近期的活體檢測方法在原有庫內測試的基礎上,加入了跨庫測試性能的比較。訓練階段使用已有的一個或幾個數(shù)據(jù)集訓練,測試時針對另外的數(shù)據(jù)集進行測試。跨庫測試是目前研究最為廣泛的測試方法。

除庫內和跨庫測試外,一部分研究者認為在數(shù)據(jù)集上的表現(xiàn)無法體現(xiàn)實際場景中的性能,因此將算法的評測放在實際人臉應用系統(tǒng)中,這也最大程度上符合人臉活體檢測的應用目標。

3 難點與挑戰(zhàn)

隨著研究的不斷深入,人臉活體檢測算法的性能不斷突破新高,但仍面臨著很多難點與挑戰(zhàn)。

(1)不斷出現(xiàn)的新的攻擊方式?!暗栏咭怀吣Ц咭徽伞?,相對于主動的假體攻擊研究,活體檢測為針對具體假體攻擊形式的被動研究。而新的攻擊方式不斷涌現(xiàn),對活體檢測提出新的挑戰(zhàn),如為了躲避眨眼檢測和動態(tài)信息檢測,出現(xiàn)了彎曲照片攻擊和裁剪照片攻擊等形式,虛擬動作合成的視頻攻擊也應運而生[67],如圖7 所示,對基于用戶配合的檢測方法提出了挑戰(zhàn)。

Fig.7 New presentation attacks圖7 新的假體攻擊方式

(2)類間距離小,類內距離大。不同于普通的分類問題,人臉活體檢測的真假兩類具有較大的相似性,相當一部分視頻即使人眼也很難分辨真?zhèn)?。而對于較小的類間距離,由不同身份的人臉差異帶來的類內距離較大。如何應對小類間距離和大類內距離,是人臉活體檢測的難點之一。

(3)受成像以及展示設備的影響較大。實際應用中真實人臉和假體攻擊的成像結果區(qū)別受成像及展示設備影響較大,當設備更換時,特征也會有較大差異,學術研究中該問題體現(xiàn)在跨庫測試性能較低。

針對以上難點與挑戰(zhàn),未來工作可以在以下幾個方面開展:大型人臉活體檢測數(shù)據(jù)集的創(chuàng)建進一步推動相關研究;提高人臉活體檢測算法的實時性,提高檢測效率;在實際應用中結合一些額外的設備,針對性地提出解決方法,以提高其實用性。

4 結束語

隨著互聯(lián)網(wǎng)應用的飛速發(fā)展,基于人臉特征的認證技術具有廣闊的應用前景,如臉部識別技術引爆刷臉時代。如何找到一種模式,既可以利用人臉信息進行身份認證,又能保證用戶和系統(tǒng)的安全性,將是近期亟待解決的問題。本文對近年來人臉活體檢測的主要算法進行了綜述,并對人臉活體檢測研究存在的問題進行了分析,也對進一步研究方向進行了展望??梢钥闯觯延械娜四樆铙w檢測方案離實際應用還有一定距離,需要進一步深入細致的研究。

猜你喜歡
活體假體人臉
友愛的“手”
Not afraid of incompleteness,living wonderfully
當歸六黃湯治療假體周圍骨折術后低熱疑似感染1例
有特點的人臉
張帆:肝穿刺活體組織學檢查
肝博士(2021年1期)2021-03-29 02:32:08
讓活體肝移植研究走上世界前沿
華人時刊(2020年21期)2021-01-14 01:33:36
活體器官移植,你怎么看?
三國漫——人臉解鎖
動漫星空(2018年9期)2018-10-26 01:17:14
保留假體的清創(chuàng)術治療急性人工關節(jié)感染
“汪星人”要打“飛的”——話說活體空運
廊坊市| 天镇县| 平远县| 阜新市| 收藏| 彝良县| 商水县| 滁州市| 张掖市| 隆林| 肥东县| 红桥区| 镇巴县| 阳西县| 二连浩特市| 错那县| 海城市| 灵璧县| 绍兴市| 修武县| 横峰县| 常山县| 化德县| 西城区| 府谷县| 格尔木市| 华坪县| 东源县| 绥芬河市| 巴林左旗| 甘肃省| 大英县| 金坛市| 民勤县| 永新县| 永登县| 漠河县| 陕西省| 深水埗区| 扶余县| 呼伦贝尔市|