王恒宇, 王才標(biāo)
(大連市公安局, 遼寧大連 116000)
按照《互聯(lián)網(wǎng)上網(wǎng)服務(wù)營業(yè)場所管理條例》規(guī)定,網(wǎng)吧經(jīng)營者應(yīng)對上網(wǎng)人員進行有效身份登記。然而,一直以來,由于網(wǎng)吧作為公共場所的特殊性,也使它存在著事故易發(fā)、多發(fā)等問題:想方設(shè)法規(guī)避實名制的情況,盜用、冒用、借用身份證的現(xiàn)象伴隨而來的違法行為也屢屢發(fā)生。上述種種問題隱藏著諸多安全風(fēng)險,導(dǎo)致網(wǎng)吧上網(wǎng)實名制實際上是“形同虛設(shè)”。
通過人臉識別技術(shù)解決網(wǎng)吧實名制管理問題,是當(dāng)下對互聯(lián)網(wǎng)安全領(lǐng)域的一項嘗試,也是實現(xiàn)“科技強警”的創(chuàng)新舉措[1]。人臉識別技術(shù)以其易于采集、方便處理、實時性強、無法偽造等諸多特點而著稱。在網(wǎng)吧實名登記管理模式遭遇瓶頸的當(dāng)下,人臉識別技術(shù)無疑為破解網(wǎng)吧實名制管理難題打開了一扇新的“天窗”。
根據(jù)網(wǎng)吧管理中人臉識別專項,開發(fā)一種使用人臉識別技術(shù)的網(wǎng)吧“實名制”管理系統(tǒng)。該系統(tǒng)通過建立人證核驗中心和人證查驗中心,對網(wǎng)吧上網(wǎng)人員的人臉信息進行采集,通過后臺深度學(xué)習(xí)算法進行實時比對并確認人員身份,從而實現(xiàn)“人證合一”的實名制管理。該方案為解決當(dāng)下網(wǎng)吧實名制難題提供了一條可供借鑒的實踐之道。
近年來,隨著互聯(lián)網(wǎng)的蓬勃發(fā)展、政策的利好和技術(shù)的進步共同推動了人工智能的高速發(fā)展,深度學(xué)習(xí)作為人臉識別的核心技術(shù)在這個過程中起到了關(guān)鍵的作用,其具有識別率高、泛化能力強等特點而越來越受到業(yè)界的關(guān)注[2]。針對網(wǎng)吧上網(wǎng)時受控條件下的人臉識別場景,構(gòu)建了一套基于網(wǎng)吧圖像采集的身份認證系統(tǒng),該系統(tǒng)實現(xiàn)了人臉圖片實時采集、檢索和認證服務(wù)。其涉及的主要技術(shù)如下:
(1)網(wǎng)吧管理技術(shù)。當(dāng)前,網(wǎng)吧管理常用的主要模式是采用從Client/Server架構(gòu),通過服務(wù)端身份證刷卡上網(wǎng),控制客戶機開機,并輔以計費、會員等功能。
(2)人臉識別技術(shù)。人臉識別方法分為3種,基于幾何特征的人臉識別方法、基于模板匹配的人臉識別方法和基于模型的人臉識別方法。由于近年來深度學(xué)習(xí)在圖像識別效果上的異軍突起,基于“深度學(xué)習(xí)模型的人臉識別方法”如今已經(jīng)成為主流的研究領(lǐng)域[3]。
(3)深度學(xué)習(xí)技術(shù)。深度學(xué)習(xí)分為卷積神經(jīng)網(wǎng)絡(luò)(CNN, Convolutional Neural Network)和循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN, Recurrent Neural Network)。在圖像識別算法中,通常使用卷積核來提取圖像的局部特征,經(jīng)過多層迭代后,提取圖片間的非線性特征進行相似度計算。RNN在時間序列的處理和預(yù)測上具有優(yōu)勢。
本例中,人臉相似度的方法存在一個問題,當(dāng)樣本庫的數(shù)據(jù)量越來越龐大,需要將待比較圖片與樣本庫中每張圖進行相似度計算,從而導(dǎo)致開銷過大、反饋時間過長等問題。同時,對于隨著時序的增加,同一個人的樣貌特征發(fā)生變化是自然而然的事,這樣的人臉識別問題利用循環(huán)神經(jīng)網(wǎng)絡(luò)就能夠得到很好的解決[4]。
系統(tǒng)通過上述各項技術(shù)的支撐,在實際使用過程中,能夠以不同模式來適應(yīng)遇到的不同識別場景。
通過系統(tǒng)實現(xiàn)身份認證,首先要判別識別場景。由于各種人臉識別算法在不同場景中表現(xiàn)互有優(yōu)劣,同時,遭遇“冷啟動”的問題是很多系統(tǒng)在部署初期遇到的常見現(xiàn)象,其原因是數(shù)據(jù)庫缺少能夠使用的樣本,無法滿足相關(guān)模型的訓(xùn)練要求而無法使用。所以,根據(jù)應(yīng)用場景的不同,系統(tǒng)分為3種不同的應(yīng)用模式(如圖1)。
圖1 系統(tǒng)工作流程
在未發(fā)現(xiàn)采樣歷史時,通過1∶1比對模式進行身份識別,使用多特征融合的人臉識別技術(shù),將采樣圖像與身份證照片進行比對[5]。該方法使用了多種圖像特征,如SIFT特征、HOG特征、GIST特征等,多種特征能夠得到多個圖像對比識別的置信度,將多個置信度轉(zhuǎn)化成線性方程尋找最優(yōu)解,對采樣圖片進行識別[6]。實驗結(jié)果表明,在稀疏樣本條件下,這種方法提升準(zhǔn)確率比較顯著,要顯優(yōu)于常規(guī)的特征檢索方法[7]。
系統(tǒng)采用1∶All的比對模式,即將采樣圖片與全庫樣本進行比對。在該模式下,對于采樣圖片與全庫圖片之間的圖片相似度,可使用2-channel CNN來計算[8-9]。
在模型訓(xùn)練時,樣本將由采集的照片兩兩之間組成,對于身份證號相同的兩張圖片,其相似度標(biāo)記為1,對于身份證號不同的兩張圖片相似度標(biāo)記為0。然后,以雙通道的形式將訓(xùn)練樣本輸入到CNN中,再通過構(gòu)造損失函數(shù)來對網(wǎng)絡(luò)參數(shù)進行更新[10-11]。模型的最后兩層是全連接層,輸出的神經(jīng)元個數(shù)為1,表示兩張圖片的相似度。模型由圖片RGB色彩組成的feature map進行輸入,經(jīng)過第一個卷積層后將圖片特征加權(quán)組合,并由激活函數(shù)relu(Rectified Linear Unit)傳輸給下一層[12](如圖2)。通過驗證后,從第一層就可以將兩張圖片關(guān)聯(lián)在一起,在隨機梯度下降算法下,卷積過程中產(chǎn)生的不同非線性效果對兩者的影響可以得到有效解決[13]。采樣圖片與某身份證號下所有樣本的平均相似度高于預(yù)測閾值,則確認該人員身份成功。
圖2 系統(tǒng)所使用卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
系統(tǒng)使用1∶N模式,即將采樣圖片與該身份證號下的所有圖片進行比對。模式下,使用了基于循環(huán)神經(jīng)網(wǎng)絡(luò)模型的人臉檢索方法,用于解決隨著時間的積累,人臉采樣產(chǎn)生部分特征變化的問題[14]。同時,隨著系統(tǒng)部署時間的推移,全庫數(shù)據(jù)的不斷增加,進行1∶All預(yù)測的時間將會隨樣本庫增加而增加。使用循環(huán)神經(jīng)網(wǎng)絡(luò)能夠?qū)⑼蝗藛T的所有圖片逐步輸入,通過一次預(yù)測即可確認人員身份,從而可以極大地減少系統(tǒng)的計算開銷。
在模型訓(xùn)練時,可按照身份證號進行樣本分類,同一身份證號下的圖片,按照時間域排序后,輸入到模型中進行訓(xùn)練,最終將模型狀態(tài)(狀態(tài)n)經(jīng)過全連接和歸一化層進行判別后輸出結(jié)果,使用隨機梯度下降算法對損失函數(shù)結(jié)果進行優(yōu)化,更新模型參數(shù)[15](如圖3)。
圖3 系統(tǒng)所使用循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
實驗表明,在樣本稠密條件下,使用該方法有著更為優(yōu)秀的檢索比對性能,并且隨著樣本庫的不斷擴充,模型會獲得更好的擬合性能,尤其在對樣貌特征存在較大變化的識別場景中,系統(tǒng)能夠得到比人工篩查更為良好的身份認證結(jié)果。
上述技術(shù)通過與網(wǎng)吧計費軟件的整合,目前已完成300余家的部署,基本實現(xiàn)了“人證合一”的管理理念。在系統(tǒng)使用實際數(shù)據(jù)進行測試中,為了模擬實際使用情況,準(zhǔn)備測試數(shù)據(jù)如下。
測試集1:測試集由3 000張現(xiàn)場采集照片(240×320 pi)和3 000張證件照片(102×126 pi)組成。
測試集2:測試集由5 000張后續(xù)現(xiàn)場采集照片(240×320 pi)和原有3 000張現(xiàn)場采集照片(240×320 pi)組成。
系統(tǒng)沒有任何數(shù)據(jù)的情況下,使用1∶1比對模式。將測試集1中3 000張現(xiàn)場采集照片與3 000張證件照片進行比對。使用多特征融合的人臉特征抽取算法進行測試,比對成功率為100%。但鑒于該實驗使用現(xiàn)場照片與證件照片拍攝時間間隔不長,相關(guān)人員面貌變化不明顯,在實際使用中會導(dǎo)致識別誤差。
在1∶All比對模式下,使用測試集2,將測試集中每張圖片與樣本庫中圖片計算相似度。隨機抽取18名用戶的人臉識別相似度數(shù)據(jù)結(jié)果如表1所示。
表1 相似度計算結(jié)果
說明:在表格中,只展示屬于測試人員身份圖片的相似度。
通過正確人員驗證的成功率達99.77%,說明在數(shù)據(jù)樣本較少時,使用2-channel CNN算法能夠非常有效地解決人臉識別問題。
使用測試集1和測試集2的現(xiàn)場采集照片,首先,將3 000張現(xiàn)場采集照片分別與照片庫中各時期的本人樣本進行比對,將本人照片按時間排序輸入訓(xùn)練好的循環(huán)神經(jīng)網(wǎng)絡(luò)中,計算拒識率(FRR,false rejection rate);再將這3 000張現(xiàn)場采集照片分別與庫中非本人的樣本進行比對,計算誤識率(FAR,false acceptance rate);
(1)
(2)
式中,NGRA是類內(nèi)測試的總次數(shù),NIRA是類間測試的總次數(shù)。NFR是錯誤拒絕的次數(shù),NFA是錯誤接受的次數(shù)。
計算拒識率:使樣本的FAR=0.1%和FAR=0.5%時,計算測試集的FRR(如表2)。
表2 拒識率計算結(jié)果
計算誤識率:樣本的FRR=2%和FRR=5%時,計算測試集的FAR(如表3)。
表3 誤識率計算結(jié)果
實驗結(jié)果證明,在擁有大量人員庫的情況下,RNN算法能夠有效識別不同時期人員特征,解決人員臉部特征出現(xiàn)變化的問題。
通過上述各項實驗,證明了人臉識別技術(shù)引入到網(wǎng)吧管理到警務(wù)工作中的可行性。系統(tǒng)根據(jù)使用條件,實現(xiàn)了1∶1模式、1∶All模式和1∶N模式的人員身份識別,解決了冷啟動、計算開銷過大和實際人員的臉型變化問題。從實際使用結(jié)果來看,基本可完成上網(wǎng)人員的身份驗證功能。
對于網(wǎng)吧管理工作而言,防止身份作假、使用虛假身份證是亟待解決的問題。當(dāng)下,使用深度學(xué)習(xí)的人臉識別算法能夠有效解決在此過程中傳統(tǒng)方法不能解決的人員身份精確匹配問題,對互聯(lián)網(wǎng)上網(wǎng)服務(wù)場所的管理具有重要意義。
然而,由于圖片采集效果受光線、角度、分辨率等多種因素的影響,使模型存在一些誤識現(xiàn)象。在后續(xù)的工作中需要提高在采集條件不理想時,模型的泛化能力,包括克服光照的影響、解決化妝和雙胞胎的識別問題、通過局部特征進行識別和減少人員配合提高效率等問題??傊?,人臉識別技術(shù)還有很多方面需要去深入研究,相信不久的將來,人臉識別技術(shù)將在速度、可靠性、穩(wěn)定性、成本上有更好的突破。