紀(jì)國惠
摘 ? 要:隨著社會的發(fā)展,如何通過人像快速、準(zhǔn)確、高效地識別人員身份是當(dāng)前的熱門研究課題。本文以人臉識別技術(shù)為主題,從人臉檢測、特征提取、底庫構(gòu)建、特征對比等方面著手,淺析人臉識別技術(shù)及其應(yīng)用。
關(guān)鍵詞:人臉識別;人臉檢測;特征提取;底庫構(gòu)建;特征比對
1 引言
隨著社會的發(fā)展和科技的進(jìn)步,人們對信息安全性和隱蔽性日益重視,身份識別和認(rèn)證技術(shù)快速發(fā)展。在各種身份識別方法中,人臉識別因其獨特性、唯一性,具有直接友好的特點脫穎而出。目前人臉識別技術(shù)已經(jīng)成為人工智能領(lǐng)域的一個重要發(fā)展方向。近年來隨著人臉識別技術(shù)在手機(jī)等日常場景中的廣泛應(yīng)用,對其安全性提出了更高要求,它必須在保證用戶信息不被泄露的基礎(chǔ)上才能更好的發(fā)揮作用。本文正是在這樣的背景下,針對人臉識別技術(shù)進(jìn)行詳細(xì)介紹。
人臉識別技術(shù)是基于人的面部特征信息進(jìn)行身份識別的生物識別技術(shù),如圖1所示,其流程包括人臉圖像采集、人臉檢測、人臉特征提取、人臉特征比對和識別等[1][2]。人臉識別的過程可以簡要概括為:對采集的圖像進(jìn)行掃描檢測,確定是否存在人臉,若存在則獲取人臉的位置、大小以及面部器官等信息,基于此類信息提取相關(guān)功能特征,與人臉數(shù)據(jù)庫中的信息進(jìn)行比對,最終達(dá)到分類識別的目的。雖然人臉識別技術(shù)會因為圖像采集過程中受光照、姿勢、表情、遮擋的影響以及人臉隨時間的變化而變化等增加識別的技術(shù)難點,但是隨著對其不斷研究,人臉識別技術(shù)已經(jīng)日臻成熟,其本身具有的自然性、非強(qiáng)制性、非接觸性和并發(fā)性優(yōu)點越來越突出,在使用方式和辨別方便性上具有明顯的優(yōu)勢[3]。隨著手機(jī)的使用越來越普遍,將人臉識別技術(shù)應(yīng)用在移動端中,具有信息獲取方便、隱蔽以及識別正確率、識別效率高的優(yōu)點。
2 人臉檢測
人臉檢測是人臉識別中非常重要的一環(huán),它直接影響后續(xù)的特征提取和識別工作的成功與否[6],首先是對圖像信息進(jìn)行掃描檢測,確定圖像中人臉的位置和質(zhì)量等相關(guān)信息,從而實現(xiàn)在大范圍的圖像中,準(zhǔn)確找到人臉區(qū)域,降低背景信息對識別性能的影響。當(dāng)前人臉檢測的方法主要有兩大類,分別是基于“特征”的人臉檢測方法和基于圖像的人臉檢測方法。
目前有很多種人臉識別算法,應(yīng)用較多的有AdaBoost算法、特征抽取算法和支持向量機(jī)方法等。其中AdaBoost算法是目前最為有效的一種人臉檢測算法,該算法是具有自適應(yīng)性的Boosting迭代算法,通過將若干弱分類器級聯(lián)形成強(qiáng)分類器,并對弱分類器進(jìn)行不斷訓(xùn)練學(xué)習(xí),能夠達(dá)到很低的誤檢率和誤接受率。
3 特征提取
經(jīng)過人臉檢測之后,需要對檢測到的人像進(jìn)行特征提取。特征提取是指將圖像中的人臉面部特征,如眼睛、鼻子、眉毛、嘴巴和面部輪廓等具體位置、大小、形狀及其相關(guān)位置的不同等特征信息進(jìn)行提取,從而獲得能夠表征人臉圖像的數(shù)據(jù)量。
目前人臉特征提取的方法包括特征臉方法、神經(jīng)網(wǎng)絡(luò)方法、歐式距離判別法、陰馬爾科夫方法等。其中特征臉方法是利用PCA算法計算特征向量(即特征臉),將需要提取的人臉圖像信息映射到各個向量中,并使用對應(yīng)的向量系數(shù)表征人臉特征,達(dá)到人臉特征提取的目的。PCA算法是在最小均方差下尋找一組基向量,用其組成的矩陣構(gòu)造一個投影子空間,使高維空間的樣子投影到該子空間中,這樣既保留數(shù)據(jù)的主要特征成分,又達(dá)到降維的效果。因此我們可以實現(xiàn)用低維子空間來描述人臉圖像,求得圖像壓縮中的最優(yōu)化正交變換,把所需要的識別信息保存下來。PCA算法的基礎(chǔ)是K-L變換:
Y=A(X-mX)
其中:X=(X1,X2,…,XN)為N維隨機(jī)矢量,mX=E(X)為其平均值向量,A為變換矩陣,其行為CX的特征值,CX=E{(X-mX)(X-mX)T}為X的協(xié)方差矩陣。
4 底庫構(gòu)建
因為人臉識別需要將特征提取的信息與特征信息底庫進(jìn)行比對匹配,因此需要構(gòu)建特征信息底庫。
在這個過程中,首先需要將分散存儲的原始數(shù)據(jù)匯集到云平臺,并分類存儲,使數(shù)據(jù)在邏輯上存儲在同一位置,包括結(jié)構(gòu)化數(shù)據(jù)抽取、非結(jié)構(gòu)化數(shù)據(jù)抽取、數(shù)據(jù)格式轉(zhuǎn)換;其次進(jìn)行數(shù)據(jù)清洗,去除原始數(shù)據(jù)中的重復(fù)數(shù)據(jù)和無效數(shù)據(jù),保證數(shù)據(jù)的準(zhǔn)確性和可用性;然后對數(shù)據(jù)整合,對現(xiàn)有的非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行特征提取、關(guān)聯(lián)匹配、數(shù)據(jù)融合,從而得到所需要的信息資源。如圖2是數(shù)據(jù)處理的結(jié)構(gòu)框圖。
在整合完數(shù)據(jù)資源之后,基于PCA算法搭建特征信息底庫,將人臉圖像視為高維向量,經(jīng)過K-L變換之后降為低維向量,該低維向量可以組成特征臉子空間,將訓(xùn)練樣本集中的人像投影到該低維空間,得到代表該人像在低維空間的坐標(biāo)系數(shù),以此坐標(biāo)系數(shù)作為該人像的“特征標(biāo)簽”。在每次進(jìn)行人臉識別的過程中,特征庫將會保存所識別的人像信息,從而達(dá)到更新特征庫的目的。圖3是特征信息底庫構(gòu)建流程示意圖。
5 特征比對
人臉特征比對是將所提取的人臉特征信息與特征信息底庫中的信息進(jìn)行比較,從而判斷相似度的鑒別過程。
在進(jìn)行人臉識別時,基于PCA的特征臉?biāo)惴?,只需要將測試樣本的人像投影到低維空間后得到的坐標(biāo)系數(shù)、訓(xùn)練系數(shù)與訓(xùn)練樣本中所有人臉的坐標(biāo)系數(shù)進(jìn)行匹配比較,從而實現(xiàn)分類識別。
6 結(jié)束語
綜上所述,雖然人臉識別技術(shù)在處理尺度變化范圍大,光照、姿態(tài)變化劇烈以及遮擋的人臉圖像時存在不足,但是其已經(jīng)成為一個成熟完整的識別技術(shù)。在手機(jī)解鎖、刑偵破案、證件驗證、視頻監(jiān)控、入口控制等方面人臉識別技術(shù)的優(yōu)勢突出,隨著軟硬件的更新發(fā)展,其必將給人類社會帶來更大的便利。
參考文獻(xiàn)
[1]肖軍.人臉識別技術(shù)在公安領(lǐng)域內(nèi)的應(yīng)用研究[J].計算機(jī)科學(xué),2016,43(11A):127-132.
[2]陳惠紅,劉世明,胡耀民.人臉識別技術(shù)分析與系統(tǒng)架構(gòu)[J].新型工業(yè)化,2017,7(2):26-32,36.
[3]何歡,肖強(qiáng),王春莉,趙錕,禚鈔.人臉識別技術(shù)發(fā)展現(xiàn)狀及趨勢分析[J].情報探索,2016(229):41-47.
[4]王楠,韓鵬霄.公安大數(shù)據(jù)應(yīng)用研究[J],警察技術(shù),2016(5):4-7.
[5]宛根訓(xùn),田強(qiáng),李建勇,仝星,高育新,王云,侯建軍.公安大數(shù)據(jù)背景下的人臉識別技術(shù)進(jìn)展[J].警察技術(shù),2014(5):16-18.
[6]張道華.人臉識別技術(shù)研究.甘肅民族出版社,2008.6.
責(zé)編/李曼