王成記
摘 ? 要:人臉識別技術(shù)主要有單一圖像識別與多圖像識別?;趫D像集人臉識別算法采用了多圖像識別,主要是在LBP的基礎(chǔ)上進行有效的計算,與傳統(tǒng)算法相比具有較大的優(yōu)勢。文章首先對人臉識別數(shù)據(jù)庫進行分類闡述,而后對人臉檢測技術(shù)進行深入的分析,最后著重分析以LBP為基礎(chǔ)的圖像集人臉識別算法,提出幾點建議,僅供參考。
關(guān)鍵詞:局部二值模式;圖像集人臉識別;算法
以局部二值模式(Local Binary Patterns,LBP)為基礎(chǔ)的圖像集人臉識別算法主要是在多圖像的基礎(chǔ)上進行模型的構(gòu)建,能夠?qū)€體實施有效表達,并且也不受光照環(huán)境的影響,這在較大程度上提升了識別率。但是以LBP為基礎(chǔ)的圖像集人臉識別算法也存在一些問題,比如模型的建立會受提取不明顯以及仿射包過大等因素的影響,為此需要采取有效的方法對以LBP為基礎(chǔ)的圖像集人臉識別算法實施研究,以此尋求有效的解決方法。
1 ? ?人臉識別數(shù)據(jù)庫
在進行人臉識別實驗的過程中,需要進行數(shù)據(jù)庫的建立,并且應(yīng)在數(shù)據(jù)庫中完成實驗的整個過程,其中,人臉識別數(shù)據(jù)庫與識別率有較大的關(guān)系,彼此之間互相影響。因不同數(shù)據(jù)庫之間差異性較大,因此在進行數(shù)據(jù)庫人臉系別系統(tǒng)開發(fā)的過程中難度較大,一般情況下有以下幾種數(shù)據(jù)庫:(1)Yale人臉數(shù)據(jù)庫,主要是確保圖片在一定光照下,表情自然,并且無遮攔。其中,該數(shù)據(jù)庫包含了10人的5 700多幅灰度圖像,姿勢與光照條件分別有較大的種類。由此可以看出,該數(shù)據(jù)庫主要適用于對姿勢與光照要求較高的人臉識別算法。(2)光學回波損耗(Optical Return Loss,ORL)人臉數(shù)據(jù)庫,庫中有上萬張圖片與上千個志愿者,包含了不同人臉的表情與姿勢的變化,具有較高的識別率。因此,該數(shù)據(jù)庫使用價值相對較大。(3)麻省理工學院(Massachusetts Institute of Technology,MIT)人臉數(shù)據(jù)庫,主要是由國外大學創(chuàng)建,分為3種,包含尺寸旋轉(zhuǎn)以及光照,其中,光照包括了正面以及人臉轉(zhuǎn)動的不同角度[1]。
2 ? ?人臉檢測
在進行人臉識別的過程中,需要進行人臉檢測,在檢測期間圖像質(zhì)量會對后續(xù)的識別產(chǎn)生較大影響,其過程是畫面捕捉到的人臉位置,并在此基礎(chǔ)上對人臉圖像進行有效截取。此外,AdaBoost算法作為一種人臉檢測算法,能夠使用在不同的檢測方法中,并且具有較高的使用頻率,同時,在檢測過程中精確度與其他軟件相比也相對較高。AdaBoost算法計算速度相對較快,能夠在多種背景與環(huán)境下對人臉進行快速、準確的檢測。
該人臉檢測算法原理主要表現(xiàn)在以下幾個方面:(1)圖像在表達的過程中主要通過積分圖來完成,能夠在較大程度上對掃描特征實施計算,在此之前,對圖像特征的表達應(yīng)采用Haar-like特殊方式來完成。(2)使用效率較高的分類器,可在較多特征中提取出具有較大代表性的特征。(3)使用有效的方法使分類器聯(lián)合,能夠保證圖像背景區(qū)域的快速去除[2]。
3 ? ?以LBP為基礎(chǔ)的圖像集人臉識別算法分析
3.1 ?紋理特征及LBP算法
LBP算法主要是通過臉部紋理進行特征的有效提取,在所有分析方法中,該算法使用紋理概念較為頻繁,其中,紋理一般情況下是物體表面的不同信息,與其他圖像信息表征方法具有一定的差異性,能夠?qū)D像灰度空間特征進行真實的描述,不但能夠?qū)D像像素點進行有效的描述,而且還可對其與周圍環(huán)境的聯(lián)系實施全面反映。由此可以看出,紋理特征既能對提取微觀信息實施描述,還可對圖像整體信息進行描述。
LBP算法在應(yīng)用的過程中,具有計算量小、過程簡單以及能夠克服光照等優(yōu)勢,并且在此基礎(chǔ)上具有較強的分類能力。其主要思路是:首先,將灰度圖像中的單點看作中心像素點,并將灰度值看作是一個閥值。其次,該值與像素點進行全面的對比,以此獲得兩個值的序列。再次,對此實施有效的處理,以此將該數(shù)據(jù)作為該像素點數(shù)值,對該特征進行編制。最后,將其有效的組合,從而表示全局特征。
3.2 ?圖像集的建模
經(jīng)典圖像集算法 包括以下幾種。
(1)流形算法。主要建立在微積分幾何的基礎(chǔ)之上,其中,流形主要表達了多維曲線、幾何空間以及曲面。流形實質(zhì)上是一個非線性空間,在人臉識別圖像集模型構(gòu)建的過程中,把人臉圖像當作一個非線性曲面,在此曲面中有不同線性小塊,將其叫作最大線性塊。此外,在對流形距離進行計算的過程中,只需要對小塊之間的距離進行計算,其公式如下[4-5]:
d(ci, cj)=(1﹣α)dE(ci, cj)+adv(ci, cj)
其中,de與dv公式如下:
(2)離散矩陣算法。主要是把主成分分析(Principal Component Analysis,PCA)算法在圖像集中進行有效的擴展,其主要思路表現(xiàn)在:首先,把圖像集中的圖像轉(zhuǎn)化為矩陣,并在此基礎(chǔ)上對其實施有效分解,得出特征值所對應(yīng)的特征向量,以此作為矩陣列。其次,求出圖像矩陣后,將其組合成圖像集矩陣,以此實施人臉識別匹配。比如,假設(shè)一個圖像集是G(I1, I2, …, In),其中,n表示圖像集中有n和圖像,Ii主要是圖像集中的每個圖像,圖形對應(yīng)的矩陣為G(A1, A2, …, An)。再次,將奇異值實施有效的分解,并在此基礎(chǔ)上進行Ai矩對應(yīng)的特征值。最后,求出m最大特征值對應(yīng)的特征向量,并將此作為一列;對不同圖像矩陣特征向量進行計算,其恩正矩陣是W(W1, W2, …, Wn);對不同向量之間的距離實施準確計算,并在此基礎(chǔ)上將其進行有效轉(zhuǎn)換,形成不同的矩陣,其公式如下:
3.3 ?仿射包的圖像集建模
對圖像集實施模型的有效構(gòu)建,主要是把圖像集中不同圖像之間的關(guān)系實施有效表達,能夠較好地把一人圖像集中的圖像進行全面的聯(lián)系。將不同圖像當作線性特征向量或者仿射特征空間,再把個人圖像集使用凸模式進行表示,其中,凸模式主要是圖像特征向量的凸包。凸包主要是對最鄰近分類進行有效增強,均是在樣本之間的一些部位使用填補的方式對樣本變化過程中的敏感性進行有效降低。此外,圖像在分類過程中,需要采用有效的方法對凸模式間距進行全面計算,一般情況下使用幾何距離進行計算,具有較大的合理性,主要是因為雖然不同環(huán)境中的圖像均是同一個人,但是依然會有一定的重合,在一定程度上允許不同圖像集中使用特征向量組合進行新圖像的合成,據(jù)此圖像集間距,可得到最近間距。
首先,需要對XK進行有效的定義:XK=[xk,1,xk,2…xk,nk],以此對圖像集進行表示,其中,Xk,i主要是指第K個樣品集中第i個圖像;K表示樣本數(shù)量;i表示某個樣本集第i幅圖像。其次,詞用仿射包進行圖像集模型的構(gòu)建,并在此基礎(chǔ)上通過兩者的間距進行有效標記,在圖庫中若樣本與測試樣本有最近間距,表示是一人圖像。使用A與表示不同凸包,那么不同凸包間距便是兩者最近距離,公式如下[6]:
其中,D表示不同凸包間距計算的距離函數(shù);x與y分別是A與中的任何點。為了對上述公式進行有效計算,應(yīng)對A與中的點引入?yún)?shù)形式,再通過數(shù)字規(guī)劃方式小化兩點間距。
4 ? ?結(jié)語
隨著我國經(jīng)濟的發(fā)展、科學技術(shù)的進步,人臉識別技術(shù)在各個領(lǐng)域應(yīng)用越來越廣泛,不但能夠?qū)σ恍╊I(lǐng)域管理質(zhì)量有較好的提升,而且也大大提高了信息的安全性。以LBP為基礎(chǔ)的圖像集人臉識別算法,主要是由不同組圖像構(gòu)成圖像集進行人臉識別,在此過程中包含了較多的信息,由此可以看出,以LBP為基礎(chǔ)的圖像集人臉識別算法與傳統(tǒng)相比具有較大優(yōu)勢,但是也存在一些缺點,最為明顯的缺點就是時效下降,為此應(yīng)對該算法進行深入的研究,采取有效的方法對問題進行有效的解決。
[參考文獻]
[1]楊艷,郭振鐸,徐慶偉.基于PCA和LBP的自適應(yīng)加權(quán)融合人臉識別算法[J].中原工學院學報,2018(6):79-84.
[2]丁園園,鄭巖,崔倩倩,等.基于子圖像方法和稀疏表示的人臉識別算法[J].科技視界,2018(2):40-41.
[3]付余偉,胡方媛,晉杰,等.基于對數(shù)能量熵與LBP特征提取的人臉識別[J].信息技術(shù),2017(7):1-4.
[4]張輝,劉新.基于改進LBP的單樣本人臉識別算法[J].計算機應(yīng)用與軟件,2017(12):220-223.
[5]彭澤昆.基于哈希算法圖象人臉匹配識別模型[J].電腦迷,2019(1):54.
[6]胡勇,朱瑩瑩.特征臉算法人臉識別系統(tǒng)[J].金陵科技學院學報,2018(2):7-10.