李揚(yáng) 周冬梅
摘要:人臉識(shí)別是借助于攝像手段采集與跟蹤人臉的圖像或視頻流,將人臉的形狀、屬性等特征反映給計(jì)算機(jī)的技術(shù)。該文在人臉特征識(shí)別PCA算法基礎(chǔ)上進(jìn)一步完善的2DPCA算法,通過(guò)二者模擬實(shí)驗(yàn)的對(duì)照,發(fā)現(xiàn)后者不僅是對(duì)前者的升華補(bǔ)充,而且可以大幅度降低識(shí)別時(shí)間,提高識(shí)別速率。
關(guān)鍵詞:人臉識(shí)別;PCA;2DPCA
中圖分類號(hào):TP18 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2015)09-0193-02
計(jì)算機(jī)視覺(jué)技術(shù)的全面發(fā)展,使得人們愈來(lái)愈將目光投入到便捷獨(dú)特的智能處理中,其中包含智能監(jiān)控、安全交易、交互設(shè)計(jì)等,而人臉識(shí)別技術(shù)是其中很重要的一個(gè)方面。它不但可以驗(yàn)證和靜態(tài)使用面部特征匹配的身份,被動(dòng)識(shí)別,而且易于被用戶接受,友好和方便,所以成為現(xiàn)在人工智能領(lǐng)域的一個(gè)研究熱點(diǎn)。
1 人臉識(shí)別概述
人臉識(shí)別是模式識(shí)別的一個(gè)重要組成部分,它是通過(guò)計(jì)算機(jī)為平臺(tái),處理以及規(guī)劃人臉圖像的分類分析,并獲得有效的識(shí)別信息來(lái)描述面部特征和實(shí)現(xiàn)有效的識(shí)別,是一種應(yīng)用于身份識(shí)別的新興計(jì)算機(jī)技術(shù)。它主要囊括了如下幾個(gè)部分:人臉圖片的采集、檢測(cè)、預(yù)處理、特征提取、匹配與識(shí)別[1]。
1.1 圖像的采集
不同的人臉圖像,如靜態(tài)圖像和動(dòng)態(tài)圖像,不同位置和不同的表情,通過(guò)相機(jī)拍攝的結(jié)果往往也不同。當(dāng)用戶在采集設(shè)備的拍攝范圍內(nèi)時(shí),采集設(shè)備會(huì)自動(dòng)搜索并拍攝用戶的人臉圖像。通過(guò)數(shù)學(xué)矩陣轉(zhuǎn)換成計(jì)算機(jī)能自動(dòng)辨別的信息,交給計(jì)算機(jī)有效的數(shù)學(xué)處理后,最終達(dá)到對(duì)人臉圖像進(jìn)行識(shí)別的效果。
1.2 圖像的檢測(cè)
人臉圖像中有非常豐富的模式化特性,比如結(jié)構(gòu)特性和Haar特性等。檢測(cè)的目的就是尋找出其中有用的信息,主流的檢測(cè)方式叫做Adaboost算法,該算法將篩選出的面部矩形特征按照加權(quán)的方式逐層升級(jí),起著“提升樹”的作用,即把一系列的弱檢測(cè)算法提升成為強(qiáng)檢測(cè)算法,進(jìn)而增強(qiáng)檢測(cè)的準(zhǔn)確度。
1.3 圖像的預(yù)處理
對(duì)于人臉的圖像預(yù)處理是基于人臉檢測(cè)結(jié)果,對(duì)圖像進(jìn)行處理并最終服務(wù)于特征提取的過(guò)程。拍攝的原始圖片一般不可以直接模式轉(zhuǎn)換,需要灰度校正、噪聲過(guò)濾等預(yù)處理后才能清晰直觀的使用。預(yù)處理的方法有很多,例如光線補(bǔ)償、直方圖的均衡化、歸一化等。
1.4 圖像的特征提取
視覺(jué)特征、像素統(tǒng)計(jì)特征等是很常見(jiàn)的特征提取方法。人臉特征提取就是針對(duì)人臉的某些特征進(jìn)行的。人臉特征提取,也稱為人臉表示,它是一種人臉特征建模過(guò)程。主要有兩種特征提取方法:一是基于知識(shí)的表征方法;二是基于統(tǒng)計(jì)特性的代數(shù)方法。
1.5 圖像的匹配與識(shí)別
經(jīng)過(guò)預(yù)處理的特征圖片發(fā)送至計(jì)算機(jī),與計(jì)算機(jī)硬盤中的數(shù)據(jù)庫(kù)進(jìn)行搜索匹配,然后軟件設(shè)定一個(gè)閾值,當(dāng)采集的圖片與原始圖片的相似度接近于閥值時(shí),將識(shí)別結(jié)果輸出。圖像識(shí)別是根據(jù)人臉特征模板的相似度比較來(lái)確定驗(yàn)證和識(shí)別人臉身份信息的過(guò)程。
2 PCA概述
在一般情況下,人臉圖像的數(shù)據(jù)量非常大,龐大的計(jì)算相當(dāng)繁瑣,所以必需對(duì)初次采集得到的數(shù)據(jù)作適當(dāng)?shù)奶幚?,降低?jì)算難度,得到反映分類本質(zhì)等特征。
基于以上的考慮,采用Eigenface方法(即特征臉)來(lái)進(jìn)行測(cè)試,該算法可以有效地減少數(shù)據(jù)量,降低計(jì)算的難度,進(jìn)而提高效率和速度。特征臉?lè)椒ㄊ侨四樧R(shí)別算法的經(jīng)典算法,即主成分分析的核心(主成分分析的降維算法,PCA)。
PCA基本原理是數(shù)據(jù)降維,借助于特征向量矩陣,把獲取的圖像從高維的向量空間投影到低維,即是用維數(shù)較低的空間去重構(gòu)對(duì)應(yīng)的維數(shù)高的向量空間,并且還不會(huì)丟失任何圖像信息。這種方法既能達(dá)到模式樣本的維數(shù)壓縮的效果,也能達(dá)到消除模式樣本之間的相關(guān)性的作用。
3 2DPCA概述
在一般情況下,人臉圖像的維數(shù)較大,而對(duì)人臉圖像處理維度的PCA算法的使用局限造成計(jì)算復(fù)雜度的增加,費(fèi)時(shí)又費(fèi)力,故而便引進(jìn)了處理圖片的2DPCA二維主成分分析方法)。2DPCA方法是直接計(jì)算人臉圖像,不同于PCA需要首先先將原始圖像的矩陣轉(zhuǎn)化為一維列向量那樣,2DPCA保留了更多的結(jié)構(gòu)信息,計(jì)算協(xié)方差矩陣更為準(zhǔn)確,在圖像特征提取上更加簡(jiǎn)單和直觀。以下是2PDCA圖像重構(gòu)的原理:
設(shè)X表示n維單位列向量。可以設(shè)該圖像A(m行n列)是通過(guò)線性變換的隨機(jī)矩陣[2]:
[Y=AX] (1)
因此,得到圖像[A]的投影特征向量Y。再令
[Yk=AXk,k=1,2,…,d] (2)
設(shè)[X1,X2,…,Xd]為最圖片優(yōu)投影向量,可以計(jì)算出一系列特征向量組[Y1,Y2,…,Yd],叫做圖片A的主成分向量。則[B=[Y1,Y2,…,Yd]]構(gòu)成A的特征圖像。
假設(shè)[X1,X2,...,Xd]在協(xié)方差矩陣最大特征值(前d個(gè))的圖像產(chǎn)生的特征向量經(jīng)由投影后得到相應(yīng)的主成分向量為[Yk=AXk,k=1,2,...,d]。令[V=Y1,Y2,...,Yd],[U=X1,X2,...,Xd],如果[V=AU],那么A重構(gòu)后得到:
[A=VUT=k=1dYkXTk] (3)
令 [Ak=YkXTk(k=1,2,...,d)],這是一個(gè)和A相同大小的圖片。所以,圖片A的重建取決于前d個(gè)子圖像,當(dāng)主分量向量的個(gè)數(shù)d等于矩陣特征向量的總數(shù)時(shí),[A=A],樣本圖片重構(gòu)無(wú)損;如果[d4 PCA與2DPCA的實(shí)驗(yàn)對(duì)比
調(diào)用ORL人臉庫(kù)中[3]的頭像作為原始數(shù)據(jù),該人臉庫(kù)共有[112×92]大小的照片400幅,分別來(lái)自40個(gè)人,這些照片具有不同的表情。然后使用每個(gè)人的前五張圖片作為實(shí)驗(yàn),篩選10個(gè)擁有最大特征值的特征向量作為投影軸投影軸上的圖像,可以獲得10個(gè)主成分向量,確定一個(gè)向量重構(gòu)圖。為清晰起見(jiàn),其中的一些子圖像在圖2中進(jìn)行了反射。此外,在圖2中對(duì)特征值的遞減進(jìn)行了大小繪制。
在圖1中觀察到,第一張子圖包含了大部分的原始圖像的能量。k值的增加,包含的信息(能量)逐漸減小。圖2顯示了特征值的快速收斂至零,與圖1有相同的結(jié)果。因此,用向量表示這些能量的分布來(lái)實(shí)現(xiàn)圖片識(shí)別是合理的。所以,通過(guò)增加特征值獲得的人臉圖像的圖像重建,作為子圖像的數(shù)目愈增加,重建圖像愈清晰。
另外,PCA和2DPCA在特征向量維度相同的情形下,識(shí)別精度方面,2DPCA性能優(yōu)于PCA。二者的計(jì)算速度與效率方面,表1可以看出,采用2DPCA特征提取所消耗的時(shí)間比PCA要少很多。綜上所述,2DPCA比PCA有兩個(gè)明顯的優(yōu)勢(shì):第一,它更容易準(zhǔn)確地評(píng)估協(xié)方差矩陣;第二,在確立特征向量時(shí),2DPCA有顯著的優(yōu)越性。
5 結(jié)束語(yǔ)
基于2DPCA的人臉特征提取方法是在研究了經(jīng)典的PCA算法的基礎(chǔ)上提出并加以改進(jìn)的,通過(guò)二者的對(duì)比,2DPCA在效率和計(jì)算量方面都優(yōu)于PCA,同時(shí),人臉識(shí)別作為一種復(fù)雜的生物技術(shù),為了達(dá)到更好的識(shí)別效果,需要在理論成熟的同時(shí)也要綜合各方面科技的優(yōu)勢(shì),相信在國(guó)內(nèi)外學(xué)者的不懈努力下,人臉識(shí)別技術(shù)必將得到更加長(zhǎng)足的發(fā)展!
參考文獻(xiàn):
[1] 肖冰,王映輝.人臉識(shí)別研究綜述[J].計(jì)算機(jī)應(yīng)用研究,2005(8):1-5.
[2] LIU Ke,CHENG Yongqing,YANG Jingyu,et al.Algebraic feature extraction for image recognition based on an optimal discriminant criterion[J]. Pattern Recognition, 1993,26(6):903-911.
[3] AT&T Laboratories Cambridge.The ORL Database of Faces.