林星翰 張帥
摘 要:本文概述了人臉識別技術的概念與研究發(fā)展歷程,介紹了人臉識別的主要技術和識別方法及其優(yōu)缺點,對人臉識別技術的應用情況進行總結,并今后的發(fā)展方向進行了展望。
關鍵詞:人臉識別;人臉檢測;人臉識別方法;應用趨勢
中圖分類號:TP391.41 文獻標識碼:A 文章編號:1671-2064(2019)23-0043-02
隨著社會信息化、智能化、網(wǎng)絡化的迅猛發(fā)展,個人信息泄露問題愈發(fā)嚴重,越來越多人開始關注個人身份信息的安全保障。作為生物識別技術之一的人臉識別技術在身份識別、公安刑偵、電子商務、金融服務、家庭生活等各領域中被廣泛運用并發(fā)揮了重要作用,為個人身份信息安全提供了重要保障,對提高生活服務效率、防止社會犯罪具有重要意義。
1 人臉識別的概念
人臉識別是指利用計算機技術強大的分析、比較功能對人的臉部特征進行識別,以進行人物區(qū)分的一項技術。即用相機或攝像機釆集含有人臉的圖像或視頻流,并自動在圖像或視頻中檢測和跟蹤人臉,進而對人臉進行識別,通常也稱為人像識別、面部識別。人臉識別技術具有易實施、易識別、非接觸和快捷友好等優(yōu)勢,近年來成為人工智能領域研究和應用的熱點。
2 人臉識別技術的發(fā)展歷程
自上世紀六十年代,人臉識別技術的研究開始,經過近20年的時間,其在計算機及光學成像技術發(fā)展的推動下,取得了進一步發(fā)展,九十年代后期進入初級應用階段。人臉識別技術發(fā)展大致可以分為三個階段[1]:
(1)第一階段(1964年-1990年早期階段)。該階段主要針對人臉面部幾何結構特征開展研究,即采用正面人臉圖像或側臉圖像中可計算的比較精確的幾何結構特征來識別人臉,并將研究重點在提取和分析面部剪影曲線的結構特征方面。階段性研究成果不明顯,也缺乏實際的應用。
(2)第二階段(1990年-1998年)。這個階段人臉識別研究十分火熱,僅1990年到1998年之間EI可檢索的相關文獻就多達數(shù)千篇[2],研究的重點是基于采用多維特征矢量表示的人臉面部特征,但在判斷時需要用到先驗知識。隨著高速度高性能計算機的出現(xiàn),人臉識別方法有了重大突破,國外有很多大學在此時取得了很大進展,研究涉及的領域很廣,其中,美國麻省理工學院的Turk和 Pentland提出了這一時期內非常有名的算法“特征臉”(Eigen-face)[3]。
(3)第三階段(1998年-現(xiàn)在)。該階段是人臉識別技術邁向商業(yè)化并廣泛運用的階段,研究的重點是面向真實條件的人臉識別問題,研究的熱點及難點主要聚焦在不理想光照強度、人臉姿勢不到位對人臉識別的影響及改進方面。此外,重點向基于3D模型的人臉建模與識別方法研究方面發(fā)展。
從提出到實踐應用,人臉識別技術走過了漫長的60多年,并吸引了越來越多的學者及互聯(lián)網(wǎng)企業(yè)對其進行研究。隨著算法、技術的日驅成熟以及新產品的不斷研發(fā),如百度公司開發(fā)的人臉識別開放平臺和曠視公司開發(fā)的Face++人臉識別開放平臺,其在人臉的識別和匹配方面的成功率越來越高。
3 人臉識別的主要技術
人臉識別技術主要包含三個方面:人臉檢測、人臉跟蹤和人臉比對,上述三個方面均有多種成熟的技術對其進行處理。
(1)人臉檢測:人臉檢測主要是利用特征子臉法、樣品學習法、人臉規(guī)則法等[4]方法檢測圖像或視頻中是否存在人臉區(qū)域,以將其分離出來,檢測過程中上述方法可綜合運用。
(2)人臉跟蹤:人臉跟蹤主要是利用膚色模型跟蹤或基于運動與模型相結合的方法對檢測到的人臉區(qū)域進行動態(tài)目標跟蹤。
(3)人臉比對:人臉比對是指對利用特征向量法或面紋模板法在現(xiàn)有的數(shù)據(jù)庫中對被檢測到的人臉區(qū)域進行目標搜索和比對,以找到最優(yōu)匹配對象,比對的效率和性能由人臉特征的描述方式所決定,綜合運用特征和模板將有助于比對效率的提升。
4 人臉識別的主要方法
用于人臉識別的方法多種多樣,主要有基于特征臉(PCA)、幾何特征、神經網(wǎng)絡、彈性圖匹配、模板匹配的人臉識別方法,現(xiàn)也涵蓋深度學習算法。
4.1 基于特征臉的人臉識別方法
在20世紀90年代初,Turk首次提出基于特征臉的人臉識別方法[3]。首先按照從上到下、從左到右的順序,將一幅人臉圖像所有像素的灰度值組成一個高維向量,然后通過主成分分析法,將人臉圖像降維,之后采用線性判別分析,進而識別人臉。該方法具有計算簡單、使用方便、效果良好的優(yōu)點。但是它對于拍照角度、拍照環(huán)境、光照強度等外界因素要求很高,進而導致識別準確率較低。
4.2 基于幾何特征的人臉識別方法
基于幾何特征的人臉識別方法是Bledsoe最先提出的。該方法主要是對面部特征點進行幾何運算,計算得出描述每個面部關鍵位置的持征矢量。目標人臉由這些特征矢量表示出來,再與數(shù)據(jù)庫中的人臉進行比對,找出最為匹配的人臉。該方法優(yōu)點:操作簡便,淺顯易懂,占據(jù)存儲空間小,識別速度快,光照影響小。但當表情或者姿態(tài)發(fā)生變化時,面部器官位置也隨之變化,使提取的特征不夠穩(wěn)定,加之整個圖像的很多細節(jié)信息被忽略,導致識別率較低。
4.3 基于神經網(wǎng)絡的人臉識別方法
基于人工神經網(wǎng)絡的人臉識別研究方法主要采用BP神經網(wǎng)絡學習算法。1997年Lin.等研究了一種基于神經網(wǎng)絡的全自動人臉檢測系統(tǒng),在當時引起了很大反響。人工神經網(wǎng)絡優(yōu)秀的學習能力、分類能力使得對人臉進行持征提取與識別更加容易。神經網(wǎng)絡方法通過學習過程,避免了復雜的特征提取工作,使獲得人臉識別規(guī)律的隱性表達更加容易。
4.4 基于彈性圖匹配的人臉識別方法
彈性圖匹配方法是基于動態(tài)鏈接結構的一種算法。Lades等人在1997年首次將該方法用于人臉識別并取得了較好效果[5]。使用該方法時,通過與目標圖像相近模型圖的尋找,和對圖中的每個節(jié)點位置進行相似度匹配,然后生成一個各節(jié)點與模型圖中對應點位置相近的拓展圖。該方法受光照、表情等因素影響較小,優(yōu)于特征臉方法。但計算速度慢,占據(jù)存儲空間大。
4.5 基于模板匹配的人臉識別方法
基于模板匹配的方法預先給定包含了人臉特征的標準模板,但這些模板的長寬比例不同。然后在全局范圍內,通過不斷迭代來更改模板大小,根據(jù)這些模板與待測對象的相似性大小進行比對和識別,尋求量佳匹配。早在1993年,Poggio和Brunelli就對上述兩種方法進行過比較,并得出模板匹配方法比幾何特征方法識別率高的結論[6]。
4.6 基于深度學習的人臉識別方法
深度學習能夠模擬人類視覺感知神經系統(tǒng)的認知學習,從而獲得更具表征力的高層特征。2012年,Lee H等率先將深度學習用于LFw數(shù)據(jù)庫的人臉識別。他們采用無監(jiān)督的持征學習方法,取得了87%的識別率。目前,深度學習算法的識別率已經達了99.47%,基至超過了人眼的識別率。該方法通過學習得到更有意義的數(shù)據(jù),并且能建立更精的模型。然而,訓練摸型需要很長時間,并且要不斷地迭代來進行模型優(yōu)化,但不能保證得到全局最優(yōu)解。
5 人臉識別技術的應用與展望
目前人臉識別已在安保系統(tǒng)、交通運輸、電子商務、金融行業(yè)、刑偵查案、社會保障、軍隊等領域廣泛應用,“刷臉”已滲透到大眾生活的方方面面,人臉識別系統(tǒng)的應用已經為我們帶來了良好的生活體驗。
各大銀行、科技館、企事業(yè)單位等為了更好地進行身份認證,紛紛廣泛運用人臉識別技術,以當前最為火熱的“刷臉”考勤來說,運用人臉考勤系統(tǒng)的正確率已相當高[7]。同時,人臉識別技術在安全防護方面的應用也相當廣,在諸如政府機關、機場、檔案單位這種安全級別較高的區(qū)域,均采用了基于人臉識別的門禁系統(tǒng)來進行身份驗證以加強安全防護。利用人臉識別技術相當于把人臉作為通行證,其關鍵技術是運用掃描設備對人臉圖像進行掃描,以輸入預先錄入的人臉庫進行比對,若比對結果一致,則能順利通過門禁系統(tǒng),否則門禁系統(tǒng)關閉。蘋果公司在2017年發(fā)布iphone X時就用人臉識別替代了以往的指紋識別,用戶通過刷臉解鎖手機,進一步保障了個人信息安全。此外,人臉識別技術在筆記本電腦等私人物品、各種以Apply pay為代表的在線支付,以及各種需要驗證的APP中都運用極廣。
與此同時,人臉識別技術在公安破案領域的應用也進入到實踐階段,美國在2104年投入10億美金建設電子識別系統(tǒng)以鎖定嫌疑人;日本于2015年在入境審查方面引入了智能化人臉識別系統(tǒng)。
在醫(yī)療領域,張勐、劉哲等人創(chuàng)新性地將人臉識別應用到醫(yī)院各領域,一方面,對防止醫(yī)生亂開藥、開錯藥起到了很好的效果。另一方面,在疾病的輔助診斷方面,人臉識別技術也開始發(fā)揮作用。以內分泌疾病的診斷為例,運用人臉識別技術提取并分析比對患者的臉部特征數(shù)據(jù),可以幫助醫(yī)生更好地判斷患者的疾病類型。
今后,隨著智能化手段的不斷發(fā)展和AI技術的不斷深入研究,人臉識別技術將會應用到更多的生活領域,我們預計,人臉識別技術將呈現(xiàn)出以下發(fā)展趨勢:
(1)不斷加強的網(wǎng)絡化趨勢,人臉識別技術可以解決日常生活中的身份識別問題,未來這項技術將會越來越多地跟各行各業(yè)的應用結合起來,并通過無處不在的網(wǎng)絡實現(xiàn)信息共享,發(fā)展出“人臉識別+物聯(lián)網(wǎng)”的新應用模式。
(2)多種生物識別模式融合趨勢,目前人臉識別技術尚無法達到預期體驗,對于安全性要求很高的特殊行業(yè)應用,如金融行業(yè),尚存在安全漏洞,容易被不法分子利用,因此需要融合多種生物特征識別技術(如活體檢測、虹膜識別等)來確保安全性。
(3)3D人臉識別技術將不斷發(fā)展,基于3D的人臉識別算法能夠彌補2D投影造成有效識別信息丟失的問題,可以很好地解決人臉旋轉、遮擋、極度相似的傳統(tǒng)難點問題,隨著3D人臉庫的完善以及設備成本的降低,3D技術未來將有很大發(fā)展空間。
參考文獻
[1] 左騰.人臉識別技術綜述[J].軟件導刊,2017,16(02):182-185.
[2] 何歡,肖強,王春莉,等.人臉識別技術發(fā)展現(xiàn)狀及趨勢分析[J].情報探索,2016(11):41-47.
[3] Turk M,Pentland A. Eigenfaces for recognition.[J].Journal of cognitive neuroscience,1991,3(1):71-86.
[4] 尚麗,陳杰,張愉.人臉自動識別技術綜述[J].蘇州市職業(yè)大學學報,2010,21(01):1-12.
[5] Zhang J, Yan Y, Lades M. Face recognition: eigenface, elastic matching, and neural nets[J].Proc IEEE,1997,85(9):1423-1435.
[6] Brunelli R, Poggio T. Face Recognition: Features Versus Templates[J].IEEE Trans.pattern Anal. & Mach.intell,1993,15(10):1042-1052.
[7] 盧文峰.人臉識別研究技術發(fā)展綜述[J].電子世界,2017(17):97.