人臉識(shí)別的發(fā)展綜述
文/彭酉乾,河北科技大學(xué)信息科學(xué)與工程學(xué)院
人臉識(shí)別技術(shù)是現(xiàn)在非?;鸬囊环N生物識(shí)別技術(shù)。本文主要介紹了人臉識(shí)別發(fā)展過程,同時(shí)介紹了一下人臉識(shí)別技術(shù)常用的幾種算法。
人臉識(shí)別;幾何特征;特征臉;神經(jīng)網(wǎng)絡(luò)
人臉識(shí)別技術(shù)是一種生物識(shí)別技術(shù),該技術(shù)通過電腦來提取圖像中的人臉信息,根據(jù)這些人臉信息來對(duì)人的身份進(jìn)行驗(yàn)證[1]。人臉識(shí)別技術(shù)相對(duì)于其它生物識(shí)別技術(shù),如指紋,虹膜等,具有非接觸,快速簡(jiǎn)便,直觀可靠,自主學(xué)習(xí)等優(yōu)點(diǎn),從而被人們廣泛的應(yīng)用。人臉識(shí)別技術(shù)的主要應(yīng)用范圍有:人員管理系統(tǒng),如通過人臉考勤機(jī)來進(jìn)行打卡;刑事案件的偵破;關(guān)鍵地點(diǎn)的安全監(jiān)控;人機(jī)交互;金融支付等。
早在1965年,Chan和Bledsoe就發(fā)表了一篇關(guān)于人臉識(shí)別的文章,在那個(gè)時(shí)候就已經(jīng)開始有人對(duì)人臉識(shí)別技術(shù)進(jìn)行研究。從那開始越來越多的人開始研究人臉識(shí)別技術(shù),人臉識(shí)別技術(shù)已經(jīng)有了半個(gè)多世紀(jì)的研究歷史。隨著,人臉識(shí)別技術(shù)的不斷發(fā)展,人臉的識(shí)別率和匹配率得到了大大提升。
人臉識(shí)別技術(shù)主要經(jīng)歷了以下3個(gè)階段。
(1)從1964年到1990年,這個(gè)階段是人臉識(shí)別的初期階段,主要研究的是人臉的面部幾何結(jié)構(gòu),主要工作就是提取人臉的幾何特征并對(duì)其進(jìn)行分析。該階段沒有太多的成果問世,因此人臉識(shí)別的實(shí)際應(yīng)用也沒有誕生。這個(gè)階段主要人物有Harmon,Kanade,Bled soe等。
(2)從1991年到1997年,越來越多的科學(xué)家投入到人臉識(shí)別的研究中。在這一階段,一個(gè)非常重要的算法被提出,即“特征臉”(Eigenface),該算法是由麻省理工的Turk和Pentland提出的。這一時(shí)期的主要貢獻(xiàn)人物有Turk,Prentland、Bruneli等。
(3)從1998年到現(xiàn)在,人們開始考慮在各種各樣的情況下對(duì)圖像進(jìn)行人臉識(shí)別,如人臉的角度,光照的強(qiáng)弱等這些問題慢慢變成研究的熱點(diǎn)問題。同時(shí),越來越多的人臉識(shí)別的技術(shù)被應(yīng)用到了實(shí)際生活中,如人臉考勤機(jī),人臉支付等。在這之后,三維人臉建模的方法被人提了出來,并逐漸成為一種新的發(fā)展方向。
這是人臉識(shí)別的早期算法,通過計(jì)算人臉面部特征點(diǎn)之間的相對(duì)距離,如眼睛之間的距離眼睛到鼻子的垂直距離等,從而得到人臉的特征向量。我們可以比較這些特征向量,來找到最佳的人臉匹配對(duì)象。該算法的優(yōu)點(diǎn)有:原理容易理解;只存儲(chǔ)特征向量,占用資源少;對(duì)光照的不敏感,強(qiáng)光或弱光下都能實(shí)現(xiàn)。但是這種算法也有一些缺點(diǎn):很難得到穩(wěn)點(diǎn)的特征向量;沒有考慮圖像中的細(xì)節(jié)信息;識(shí)別率比較低。
特征臉主要依據(jù)的是主要成分分析法而提出的一種人臉識(shí)別技術(shù)。主要成分分析法主要依賴于KL正交變換(Karhunen-Loevetr ansform)的一種方法,通過這種技術(shù)來對(duì)提取人臉圖像的統(tǒng)計(jì)特征,從而在其子空間模型下進(jìn)行人臉識(shí)別。該方法具有簡(jiǎn)單,快速,實(shí)用的優(yōu)點(diǎn)。缺點(diǎn)是:局限性大,對(duì)訓(xùn)練圖像和測(cè)試圖像的相關(guān)性要求很高;人臉的角度,光照的強(qiáng)度,人臉的表情都會(huì)影響識(shí)別率,使得識(shí)別率變低。
神經(jīng)網(wǎng)絡(luò)是現(xiàn)在比較火的人臉識(shí)別的研究算法,主要依賴的是BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)[2]。人工神經(jīng)網(wǎng)絡(luò)是由大量處理單元互聯(lián)組成的非線性、自適應(yīng)信息處理系統(tǒng)。它信息處理的方式模擬的是人腦神經(jīng)網(wǎng)絡(luò)的信息處理方式。它由處理單元和單元之間的連接構(gòu)成。主要過程是,建立一個(gè)神經(jīng)網(wǎng)絡(luò)模型,將得測(cè)圖像中的像素和神經(jīng)網(wǎng)絡(luò)的神經(jīng)元建立對(duì)應(yīng)關(guān)系。該算法的優(yōu)點(diǎn)是特征提取比較簡(jiǎn)單,適應(yīng)性強(qiáng);處理的過程速度非???。缺點(diǎn)是當(dāng)神經(jīng)元較多時(shí),訓(xùn)練時(shí)間會(huì)加長(zhǎng)。
目前,人臉識(shí)別技術(shù)依舊處于發(fā)展階段,還有許多的問題需要解決,如人年齡的變化,大規(guī)模的人臉識(shí)別,人臉遮擋和表情變化,人臉的角度等諸多問題。需要更多的研究者不斷的投入精力和時(shí)間,探索問題的解決辦法和人臉識(shí)別的發(fā)展方向。隨之人臉識(shí)別技術(shù)的不斷發(fā)展,未來將會(huì)有更多的方面用到人臉識(shí)別,從而使我們的生活變得的更加方便便捷,安全可靠。
[1]梁文莉.基于獨(dú)立成分分析的人臉識(shí)別算法研究[D].西安:西安科技大學(xué),2012.
[2]雷明.基于小波變換與奇異值分解的人臉識(shí)別技術(shù)研究[D].沈陽:沈陽工業(yè)大學(xué),2007.