熊興發(fā)
(摩佰爾(天津)大數(shù)據(jù)科技有限公司 天津300456)
近年來(lái)生物識(shí)別技術(shù)在安全認(rèn)證領(lǐng)域正發(fā)揮越來(lái)越重要的作用,特別是隨著深度學(xué)習(xí)的興起,使人臉識(shí)別技術(shù)漸趨成熟,基于深度學(xué)習(xí)的人臉?biāo)阉?、人臉比?duì)、人臉認(rèn)證登錄等已成為當(dāng)下研究熱點(diǎn)。然而,僅依賴深度學(xué)習(xí)的人臉識(shí)別技術(shù)在安全性方面還存在一定欠缺。單純的深度學(xué)習(xí)人臉識(shí)別無(wú)法判斷圖像是活體真人還是照片或者視頻,往往很容易被視頻或圖像欺騙。目前主流的人臉識(shí)別反欺詐系統(tǒng)主要有兩大類。
①配合式的人臉識(shí)別反欺詐。這種方式需要使用者在攝像頭前配合語(yǔ)音或文字提示做出相關(guān)動(dòng)作,比如眨眼、張嘴、轉(zhuǎn)頭等操作,這種反欺詐方式用戶體驗(yàn)差,認(rèn)證時(shí)間長(zhǎng),單純的眨眼或者點(diǎn)頭很容易被視頻欺詐。為提高安全性需要隨機(jī)生成相關(guān)指令,這就增加了認(rèn)證時(shí)間,降低了用戶體驗(yàn)。
②非配合式的人臉識(shí)別反欺詐。這類認(rèn)證系統(tǒng)往往需要特定的攝像頭等輔助硬件設(shè)備,如:利用紅外攝像頭的人臉識(shí)別反欺詐;配合泛光感應(yīng)原件和點(diǎn)陣投射器等形成 3D結(jié)構(gòu)光,從三維角度實(shí)現(xiàn)活體認(rèn)證等。這類反欺詐方式往往對(duì)硬件設(shè)備要求高,成本相對(duì)較高,僅適用于安全認(rèn)證級(jí)別較高的支付場(chǎng)景。對(duì)于一般安全級(jí)別要求,采用此類設(shè)備往往投入和收益不成比例。
為了在一定程度上解決單純采用深度學(xué)習(xí)系統(tǒng)進(jìn)行人臉識(shí)別的安全問(wèn)題,在不增加硬件成本的條件下提升人臉識(shí)別的安全性,同時(shí)去除繁瑣的配合式安全認(rèn)證步驟,提升用戶體驗(yàn),使算法易于集成,提出一種基于人臉圖像頻域紋理的 2D人臉?lè)雌墼p輔助算法。該算法能夠判斷攝像頭采集的圖像是否經(jīng)過(guò)二次翻拍,從而得出圖像是否為真人,進(jìn)而達(dá)到提升人臉識(shí)別安全性的目的。
本方案提出的算法屬于單幀檢測(cè)算法,所以只需要普通攝像頭采集單幀2D原始圖像。
該算法本質(zhì)上是利用翻拍圖像所具有的特殊的紋理結(jié)構(gòu)在頻域當(dāng)中進(jìn)行判斷,一般來(lái)說(shuō),翻拍圖像具有較低的頻率,高頻部分較少,例如翻拍圖像所具有的摩爾紋、相機(jī)反射光等。針對(duì)摩爾紋,目前尚沒(méi)有有效的辦法在時(shí)域當(dāng)中進(jìn)行判斷,較好的方式是將采集的原始圖像進(jìn)行離散傅里葉變換轉(zhuǎn)換至頻域,然后再做進(jìn)一步處理。但是,如果直接對(duì)所采集的圖像進(jìn)行離散傅里葉變換,很容易因頻譜泄露,導(dǎo)致對(duì)后續(xù)判斷產(chǎn)生嚴(yán)重影響。因此,在做離散傅里葉變換之前需要對(duì)二維圖像進(jìn)行窗函數(shù)處理,具體為:設(shè) M、N分別表示圖像的高寬,首先利用公式(1),依據(jù)圖像的高和寬生成對(duì)應(yīng)一維漢寧窗向量。
由于圖像為二維矩陣,需要根據(jù)一維漢寧窗向量生成二維矩陣,然后跟原始圖像做點(diǎn)積運(yùn)算,即漢寧窗處理后的圖像如公式(2),其中 Hm和 Hn分別為m×1以及n×1的一維漢寧窗向量。
一般來(lái)說(shuō),沒(méi)有很好的方式在時(shí)域當(dāng)中根據(jù)圖像的細(xì)微紋理特征判斷圖像是否是二次翻拍,特別是針對(duì)翻拍質(zhì)量比較好的圖像,摩爾紋紋理在時(shí)域當(dāng)中只有非常細(xì)微的差別,如圖1所示。
圖1 正常采集圖像和翻拍圖像的細(xì)節(jié)區(qū)別(左真右假)Fig.1 Details of normal image acquisition and remake images(left is true, and right is false)
所以有必要利用離散將圖像轉(zhuǎn)換至頻域。離散傅里葉變換DFT公式如下:
圖2 不同sigma下的高斯差分濾波器Fig.2 Gaussian difference filter under different Sigma
對(duì)漢寧窗圖像進(jìn)行離散傅里葉變換后得到的圖像需要進(jìn)一步做高斯差分濾波,因?yàn)椴煌h(huán)境下拍攝到的圖像特征并不完全相同(如圖2所示同sigma下的高斯差分濾波器),很難采用一種直接的基礎(chǔ)帶通過(guò)濾篩選適宜的頻率部分,因此需要采用不同的sigma參數(shù)值以及 k值來(lái)確定合適的帶通參數(shù)(其中sigma為高斯核函數(shù)方差,k稱為帶通的帶寬),試驗(yàn)過(guò)程中方差sigma從0增加到150,k保持為2不變,其中二維高斯核確定像素點(diǎn)的值為:
利用不同的高斯差分濾波器對(duì)圖像進(jìn)行帶通濾波,其中G是具有0均值和對(duì)應(yīng)方差的高斯核函數(shù):
對(duì)不同的高斯差分濾波器濾波得到的離散傅里葉圖像構(gòu)建峰值檢測(cè)器進(jìn)行峰值檢測(cè)。具體地,又主要分為以下5個(gè)細(xì)分步驟:
① 給定閾值,對(duì)帶通后的傅里葉圖像進(jìn)行二值化處理。圖像閾值的二值化處理較為簡(jiǎn)單,即超高閾值的圖像像素部分取值為 1,低于閾值的圖像像素部分取值為0。數(shù)學(xué)表示如下:
上述公式的t值即為設(shè)定的閾值,實(shí)際上,閾值t的選擇是該算法的核心,直接關(guān)系到算法的成敗。閾值t是使下述相關(guān)系數(shù)最大時(shí)的t值。
② 計(jì)算圖像相關(guān)系數(shù)。具體地,給定圖像 A和二值化圖像 B(這里的二值化單指 0,1的二值化,不規(guī)范到0~255),相關(guān)系數(shù)按下式計(jì)算:
其中:
公式(8)—(12)當(dāng)中,g是帶通后的傅里葉頻域圖像各個(gè)像素點(diǎn)的灰度值,p(g)表示該灰度水平的概率(頻率),p(g)根據(jù)帶通后傅里葉圖像的直方圖獲得。t即二值化圖像時(shí)所采用的閾值,最終t值實(shí)際上需要根據(jù)搜索算法獲得能夠使得上述相關(guān)系數(shù)最大的 t。而μ0和μ1表示閾值上下限的均值或期望值,μ0和μ1可以按照公式13、14計(jì)算:
③ 依據(jù)上述公式(8)—(14),對(duì)于每一個(gè)不同的閾值 t,顯然都能得到不同的相關(guān)系數(shù)ρ,但在實(shí)際上需要尋找能夠使得相關(guān)系數(shù)最大的閾值tmax。即:
獲取 tmax的方法比較多,這里采用一階搜索的方式獲取,實(shí)際上如果為了便于顯示把帶通后的傅里葉頻域圖轉(zhuǎn)換為 0~255之間,也可以采用循環(huán)的方式暴力搜索,但是這樣將會(huì)影響算法的計(jì)算效率。
④ 找到最優(yōu)閾值 t之后,即可根據(jù)步驟①給出的二值化公式獲取最優(yōu)閾值下的二值化的離散傅里葉帶通頻域圖像。如圖3的第3以及第4列圖像。實(shí)際上,不同帶通下都有最優(yōu)閾值t以及對(duì)應(yīng)的二值圖像。圖3的第3列是σ為40時(shí)的二值化傅里葉頻域圖像。
圖3 中間過(guò)程與最終結(jié)果Fig.3 Intermediate process and final result
根據(jù)上述步驟得到的最優(yōu)二值化的圖,依據(jù)下述公式計(jì)算對(duì)應(yīng)的P值:
其中 M、N為圖像的尺寸,分別表示高和寬,T表示二值化后的圖像。
跟據(jù)上述計(jì)算得到的 P值,與預(yù)先設(shè)定的 Pmin作比較,判斷P值是否小于Pmin,如果小于Pmin則證明該圖像是攝像頭采集的經(jīng)過(guò)二次翻拍的圖像。如果 P≥Pmin,則繼續(xù)步驟。經(jīng)過(guò)多次試驗(yàn)測(cè)試,Pmin取值在1×10-3左右效果較好。
判斷當(dāng)前帶通參數(shù)σ是否小于與設(shè)定的最大σmax,如果σ>σmax,則證明圖像是實(shí)際的真實(shí)采集的圖像,如果σ<σmax,則轉(zhuǎn)下一步。
最終結(jié)果如圖3所示,圖3第1行為二次翻拍的spoof圖像,第 2行為攝像頭采集的真實(shí)圖像。第二列為漢寧窗處理后的離散傅里葉變換的頻域圖像,第 3列為σ=40時(shí)取得的最優(yōu) t值后的二值化圖像。第 4列為所有帶通下找到的最優(yōu)二值化圖像,可以看出,對(duì)于 spoof的二次翻拍圖像,最終的 P值要遠(yuǎn)小于之前設(shè)定的 Pmin,而對(duì)于實(shí)際的真實(shí)采集的圖像,最小的P值仍然大于預(yù)設(shè)定的Pmin。算法在一定條件下能夠有效判斷收集圖像的真實(shí)性。
經(jīng)過(guò)以上綜合分析,二次翻拍的圖像一般有其自身特點(diǎn),例如摩爾紋現(xiàn)象,攝像頭采集手機(jī)、平板等二次翻拍圖像時(shí)產(chǎn)生的反光區(qū)域等。一般來(lái)說(shuō),二次翻拍的圖像較正常圖像具有更少的高頻部分。因此本方案的本質(zhì)是利用不同的帶通濾波來(lái)搜索頻域圖像當(dāng)中的特定頻域,也就是在頻域當(dāng)中獨(dú)立或隔離特定的高頻部分。所以說(shuō),對(duì)于二次翻拍的圖像,方案假設(shè)其將會(huì)有更少的高頻部分。本方案類似于在頻域當(dāng)中搜索特定的紋理特征,所以說(shuō)本質(zhì)上也是根據(jù)圖像的紋理細(xì)節(jié)來(lái)判斷圖像是否為二次翻拍的欺詐圖像。
實(shí)際上,本方案在使用當(dāng)中存在拍攝距離限制。也就是說(shuō),為了更好地檢測(cè)圖像當(dāng)中特定的頻域中的紋理特征,需要攝像頭采集二次翻拍圖像時(shí),手機(jī)和平板設(shè)備距離攝像頭的距離要小于某個(gè)最大值,這一點(diǎn)實(shí)際上也很容易達(dá)到,只要設(shè)定攝像頭最終采集到的檢測(cè)后的人臉圖像不小于某個(gè)最小像素值即可。本方案當(dāng)中的初始設(shè)定值為:裁剪后的最小人臉像素不低于 160,這也是為了方便后續(xù)深度學(xué)習(xí)進(jìn)行人臉識(shí)別。這種情況下,二次翻拍設(shè)備一般會(huì)距離攝像頭10~20cm。該范圍實(shí)際上也更容易使得設(shè)備產(chǎn)生較為明顯的摩爾紋等紋理特征,更有助于算法判斷。實(shí)際上,一般情況下采用二次翻拍進(jìn)行圖像欺詐的絕大多數(shù)也在本方案的設(shè)計(jì)范圍之內(nèi),所以說(shuō),算法在一定程度上能夠輔助深度學(xué)習(xí)系統(tǒng)在一般安全要求下進(jìn)行活體檢測(cè)。
與現(xiàn)有方案相比,本方法的優(yōu)點(diǎn)主要在于:通過(guò)頻域當(dāng)中的紋理判斷圖像是否為二次翻拍,屬于單幀檢測(cè)的方式,算法相比利用深度神經(jīng)網(wǎng)絡(luò)的形式計(jì)算速度快,容易集成;算法不需要用戶配合驗(yàn)證,用戶體驗(yàn)好,驗(yàn)證速度快。雖然精度低于 3D結(jié)構(gòu)光的方式,但是算法對(duì)硬件設(shè)備要求低、成本低、易于集成和部署,適用于一般安全級(jí)別的輔助認(rèn)證。