国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于主成分分析法的人臉識(shí)別的探討與研究

2011-07-13 06:02:40葉玉堂邢同舉吳建平周孟特王智芳
電子設(shè)計(jì)工程 2011年20期
關(guān)鍵詞:特征向量人臉識(shí)別特征值

孫 強(qiáng),葉玉堂,邢同舉,吳建平,周孟特,王智芳

(電子科技大學(xué) 光電信息學(xué)院,四川 成都 610054)

人臉識(shí)別近些年已經(jīng)成為計(jì)算機(jī)視覺(jué)和模式識(shí)別等人工智能領(lǐng)域中的最熱門課題之一[1-4],它有廣泛的應(yīng)用前景,比如在安全控制和人機(jī)交互等領(lǐng)域。

經(jīng)過(guò)多年的研究,現(xiàn)在形成了人臉識(shí)別的幾個(gè)主流研究方向[5]:基于主成分分析的特征臉(Eigenface)方法、基于Fisher線性判別條件的Fisher臉(Fisherface)方法、彈性圖匹配法(Elastic Graph Matching)以及局部特征臉(Local Feature Analysis)。特征臉?lè)椒ㄗ鳛橐环N比較成功的人臉技術(shù)掀起了人臉識(shí)別研究的第二次高潮。

基于特征臉的人臉識(shí)別算法[1]屬于構(gòu)造子空間的人臉識(shí)別方法,其理論依據(jù)是統(tǒng)計(jì)主成分分析(Principal Component Analysis,PCA),或者說(shuō) K-L 變換(Karhunan-Loeve Transform)。主成分分析通過(guò)求解訓(xùn)練樣本的散布矩陣的特征值問(wèn)題,給出一組遠(yuǎn)遠(yuǎn)小于樣本空間維數(shù)的正交基來(lái)表示訓(xùn)練樣本張成的子空間。從線性重建角度而言,這組基的優(yōu)點(diǎn)在于可以最充分地表征樣本。

PCA算法就是一種主成分分析的方法。這種方法將包含人臉圖像的區(qū)域看做一種隨機(jī)向量,因此可以采用K-L變換得到正交變換基,對(duì)應(yīng)其中較大的特征臉的基底具有與人臉相似的形狀。PCA算法利用這些基底的線性組合可以描述、表達(dá)人臉和逼近人臉,因此可以進(jìn)行人臉的識(shí)別和重建。識(shí)別過(guò)程就是把待識(shí)別人臉映射到由特征臉張成的子空間中,與庫(kù)中人臉的子空間位置進(jìn)行比較。人臉的重建就是根據(jù)識(shí)別人臉在子空間的位置,還原到人臉空間中。

1 K-L變換的原理

PCA方法是由Turk和Pentland提出來(lái)的,它的基礎(chǔ)就是Kauhunen-Loeve變換(簡(jiǎn)稱K-L變換),是一種常用的正交變換。下面對(duì)K-L變換做簡(jiǎn)要的介紹[6]。

假設(shè)X為n維的隨機(jī)變量,X可以用n個(gè)基向量的加權(quán)和來(lái)表示。

如果設(shè) Φ=(φ1,φ2,…,φn),α=(α1,α2,…,αn)T,則式(1)可用矩陣表示為:

文中取基向量為正交向量,即:

將式(2)兩邊左乘ΦT,并考慮Φ的正交性ΦTΦ=I,得

設(shè)隨機(jī)向量X的總體自相關(guān)矩陣為:R=E[XXT](6)

將(2)帶入(6)得:R=E[XXT]=E[ΦααTΦT]=ΦE[ααT]ΦT(7)

要求向量α的各個(gè)分量互不相關(guān),即滿足下列條件:

將(10)式兩邊右乘Φ,并考慮Φ的正交性,得

可以看出,凡是λi的自相關(guān)矩陣R的本征值,φi是對(duì)應(yīng)的本征向量。因?yàn)镽為實(shí)對(duì)稱矩陣,所以其不同的本征值對(duì)應(yīng)的本征向量應(yīng)正交。

綜上所述,K-L展開式的系數(shù)可以用下列步驟求出:

Step 1:求隨機(jī)向量X的自相關(guān)矩陣 R=E?XXT」,可以把數(shù)據(jù)的協(xié)方差矩陣Σ=E?(x-μ)(x-μ)T」作為 K-L 坐標(biāo)系的產(chǎn)生矩陣,這里μ為總體均值向量。

Step 2:求出協(xié)方差矩陣Σ的特征值λi和特征向量φi,其中 i=1,2,…,n。 同時(shí)本征向量組成的矩陣為 Φ=(φ1,φ2,…,φn)。

Step 3:展開式系數(shù)向量即為:α=ΦTX

K-L變換的實(shí)質(zhì)是建立了一個(gè)新的坐標(biāo)系,將一個(gè)物體主軸沿特征矢量對(duì)齊的旋轉(zhuǎn)變換,這個(gè)變換解除了原有數(shù)據(jù)向量的各個(gè)分量之間的相關(guān)性,從而有可能去掉那些帶有較少信息的坐標(biāo)系以達(dá)到降低特征空間維數(shù)的目的。

2 基于PCA的人臉識(shí)別原理

基于PCA算法的人臉識(shí)別系統(tǒng)的基本過(guò)程包括:導(dǎo)入訓(xùn)練樣本集合測(cè)試樣本集,計(jì)算樣本特征值及特征向量的計(jì)算,計(jì)算特征臉向量,計(jì)算測(cè)試樣本投影到特征臉空間的坐標(biāo)系數(shù),最后進(jìn)行分類識(shí)別。即:

Step 1:讀入人臉庫(kù)圖像,構(gòu)成圖像訓(xùn)練集矩陣;

Step 2:對(duì)圖像訓(xùn)練集矩陣進(jìn)行K-L變換得到特征臉空間,存儲(chǔ)在模板中,以便系統(tǒng)利用其進(jìn)行識(shí)別;

Step 3:把訓(xùn)練圖像和待測(cè)圖像投影到特征空間,得到它們?cè)谔卣骺臻g對(duì)應(yīng)的坐標(biāo)系數(shù);

苗木質(zhì)量(QI)指數(shù)采用苗木質(zhì)量指數(shù)公式[17]計(jì)算: 苗木質(zhì)量式中:苗高單位cm,地徑單位mm,總干重、莖干重、根干重單位均為g。

Step 4:利用距離分類器判別輸入的此待測(cè)的人臉圖像所屬的類別。

下面具體介紹利用此算法進(jìn)行人臉識(shí)別計(jì)算過(guò)程。

1)載入人臉庫(kù)

在載入人臉庫(kù)圖像前,必須對(duì)所有的圖像進(jìn)行幾何歸一化,即將所有的圖像的維數(shù)統(tǒng)一為相同維數(shù),不妨設(shè)為m×n。每幅圖像 i(i=1,2,…M)按行優(yōu)先并按列向量存貯為 N=m×n行的列向量 xi∈RN×1(i=1,2,…M)。 可視為 N 空間中的一個(gè)點(diǎn)。這樣可以得到存貯所有人臉庫(kù)的訓(xùn)練樣本的矩陣X=(x1,x2,…,xM)∈RN×M。

2)利用K-L變換得到人臉特征空間[7]

首先定義平均人臉為:

則所有訓(xùn)練樣本的協(xié)方差矩陣為:

每個(gè)人臉xi與平均人臉μx的差值向量為:wi=xi-μx(18)

文中差值圖像為 W∈RM(N>>M),則 WWT∈RM的特征值可以由WTW∈RM得到。對(duì)WTW進(jìn)行SVD分解得到其非零特征值(λ1,λ2,…,λr)(從大到小排序,1≤r<M)及對(duì)應(yīng)的特征向量 V=(v1,v2,…,vr),則 WWT正交歸一化特征向量為

則 C 的非零特征值為(λ1/M,λ2/M,…,λr/M)及其對(duì)應(yīng)的單位正交特征向量(u1,u2,…ur)后,可以得到人臉特征子空間U=(u1,u2,…ur)∈RN×r。

3)把訓(xùn)練圖像和待測(cè)圖像投影到特征子空間

每一副人臉圖像向特征臉子空間投影,得到一組坐標(biāo)系數(shù),就對(duì)應(yīng)于子空間中的一個(gè)點(diǎn)。同樣,子空間中的任一點(diǎn)對(duì)應(yīng)于一副圖像。這組系數(shù)便可作為人臉識(shí)別的依據(jù),也就是這張人臉圖像的特征臉特征。也就是說(shuō)任何一副人臉圖像都可以表示為這組特征臉的線性組合,各個(gè)加權(quán)系數(shù)就是K-L變換的展開系數(shù),可以作為圖像識(shí)別特征。

即上一步得到了特征空間U后,可以將所有訓(xùn)練樣本圖像X投影到此空間上,可以得到每幅圖像在特征子空間中的坐標(biāo)系數(shù):

同樣可以將待測(cè)圖像xtest投影到特征子空間中,得到其對(duì)應(yīng)的坐標(biāo)系數(shù)為:

4)利用距離分類器進(jìn)行識(shí)別

本文采用歐幾里得距離,即向量的2-范數(shù)對(duì)ytest所屬的類別進(jìn)行識(shí)別。即目標(biāo)函數(shù)為:

從而可以求得滿足最小距離的圖像,達(dá)到識(shí)別的目的。

3 算法實(shí)驗(yàn)及驗(yàn)證

1)載入人臉庫(kù),構(gòu)成人臉庫(kù)圖像矩陣X

文中選用University of Essex的網(wǎng)站[9]上的faces94這個(gè)人臉庫(kù)。此人臉庫(kù)中包含153個(gè)不同人的人臉圖像,20個(gè)female,113個(gè)male,20個(gè)malestaff,并且每個(gè)人又有 20個(gè)不同表情和姿態(tài)的人臉。其中圖像的分辨率為200 pixel×180 pixel(將 RGB 圖相同轉(zhuǎn)化為灰度圖像),即 m=200,n=180,則N=m×n=36 000。文中從這個(gè)人臉庫(kù)中的malestaff中以及從female中分別選取5個(gè)人,并且每個(gè)人分別從20張中選取3張不同的人臉,組成訓(xùn)練集X∈RN×M,其中M=30。每個(gè)人選取的編號(hào)均為1,8,15。同時(shí)將每個(gè)人對(duì)應(yīng)的編號(hào)為20的人臉作為測(cè)試集,如圖1所示。

圖1 人臉測(cè)試集Fig.1 Face test set

2)計(jì)算人臉特征子空間

在得到了人臉庫(kù)圖像X后,繼而可以得到差值圖像W,并且 rank(X)=30,rank(W)=rank(WWT)=rank(WTW)=29

計(jì)算 WTW得到特征值 di(i=1,2,…29)和對(duì)應(yīng)的特征向量 vi(i=1,2,…,29),則協(xié)方差矩陣 C=WWT/M 的特征值為 di/M(i=1,2,…,29)以及對(duì)應(yīng)的正交歸一化向量為:

將得到的特征值 di(i=1,2,…29)從大到小排列,得到的分布圖如圖2所示,可以看出特征值的成指數(shù)分布。可以選用前幾個(gè)特征值對(duì)用的特征向量構(gòu)建特征子空間,進(jìn)一步可以達(dá)到降維的目的。但文中選用的樣本集本身不是很大,選用所有的特征值對(duì)應(yīng)的特征向量構(gòu)建特征子空間。

圖2 人臉庫(kù)圖像特征值分布Fig.2 The distribution of face image database’s eigenvalues

協(xié)方差矩陣 C 的特征向量空間 U=(u1,u2, …,u29)∈R36000×29中的每一個(gè)向量構(gòu)成的圖像如圖3所示,文中只展示第 1,3,6,8,11,14,22,29 個(gè)特征值對(duì)應(yīng)的特征向量對(duì)應(yīng)的圖像。可以看出它們都很像人臉,所以稱為特征臉。由這些特征臉張成的空間稱為特征子空間。對(duì)于正交基選擇的不同,對(duì)應(yīng)較大特征值的特征向量(正交基)也稱主分量,用于表示人臉的大體形狀,如人臉框架,光照等,而對(duì)應(yīng)于較小特征值的特征向量則用于描述人臉的具體細(xì)節(jié),或者從頻域來(lái)看,主分量表示了人臉的低頻部分,較小的分量則描述了人臉的高頻部分。

圖3 部分特征臉Fig.3 Part of the eigenface

3)將所有訓(xùn)練集樣本圖像以及待測(cè)圖像投影到特征子空間進(jìn)行分類識(shí)別

將所有的訓(xùn)練樣本圖像和待測(cè)圖像對(duì)特征子空間進(jìn)行投影,得到對(duì)應(yīng)的坐標(biāo)系數(shù):Y=UTW,ytest=UT(xtest-μx),進(jìn)而利用最小距離分類器進(jìn)行識(shí)別。匹配識(shí)別的結(jié)果如圖4所示,可以看出所有待測(cè)圖像都得到正確地匹配識(shí)別。

4)圖像重建

對(duì)于一副圖像xr(已轉(zhuǎn)化為向量形式),其投影到特征子空間中的坐標(biāo)系數(shù)為:yr=UT(xr-μx)。

圖4 待測(cè)圖像(編號(hào)為20)和識(shí)別結(jié)果圖像Fig.4 Pending test images(index is 20) and the result of recognition images

圖5 前5個(gè)待測(cè)圖像(橫向編號(hào)均為為20)和30個(gè)樣本圖像投影坐標(biāo)向量的二范數(shù)(×104)Fig.5 The first five pending test images(all the indexes are 20) and the norm of 30 sample images’ projection vector (×104)

圖6 后5個(gè)待測(cè)圖像(橫向編號(hào)均為為20)和30個(gè)樣本圖像投影坐標(biāo)向量的二范數(shù)(×104)Fig.6 The end five pending test images(all the indexes are 20)and the norm of 30 sample images’ projection vector(×104)

利用投影系數(shù)yr和投影矩陣U可以對(duì)圖像進(jìn)行重建:

其中1:t表明選用前t個(gè)特征向量去重建圖像。

文中選用4張圖像進(jìn)行圖像重建實(shí)驗(yàn),包括訓(xùn)練樣本集中的2張圖像(fordj.8和elduns.8),樣本集外的malestaff中的圖像anonym.1以及非人臉圖像drill(PCB微型鉆頭顯微圖像)。分別取 t=2,6,10,14,18 得到的重建結(jié)果如圖7 所示。從圖7可以看到,來(lái)自樣本集的2張圖像可以得到很好地重建;而來(lái)自樣本集外的人臉圖像重建結(jié)果很模糊,得不到待重建的圖像,雖然結(jié)果有人臉的輪廓;第四個(gè)非人臉圖像重建的結(jié)果同樣很模糊。

圖7 圖像重建結(jié)果Fig.7 The result of image reconstruction

4 結(jié)論及改進(jìn)

從上面的實(shí)驗(yàn)結(jié)果可以看到,利用PCA算法進(jìn)行人臉識(shí)別是有效的,屬于訓(xùn)練樣本集中人物的測(cè)試圖像都能正確識(shí)別歸類。同時(shí)可以推論到,不屬于樣本集中的人臉圖像和非人臉圖像也能得到一個(gè)匹配結(jié)果,這是現(xiàn)實(shí)中我們不希望發(fā)生的。所以以后的改進(jìn)應(yīng)加入衡量參數(shù),將測(cè)試結(jié)果分為3類,輸出結(jié)果包含3種情況:(a)輸入的是人臉圖像,但不是測(cè)試樣本中的圖像;(b)輸入的測(cè)試樣本中的第k張圖像對(duì)應(yīng)的人物;(c)輸入的圖像不是人臉圖像。

如果取pλ=90%,計(jì)算30個(gè)樣本集對(duì)應(yīng)的合適的特征值個(gè)數(shù)為t0=10。即前10個(gè)特征臉足夠用于人臉識(shí)別。

5 結(jié)束語(yǔ)

人臉識(shí)別是一個(gè)跨學(xué)科的富有挑戰(zhàn)性的前沿課題,目前的人臉識(shí)別主要適用特定環(huán)境下、限定類別數(shù)量下的應(yīng)用。光照、背景、人臉模式的多樣性等條件都會(huì)影響識(shí)別效果,還有許多需要改進(jìn)的地方?;谔卣髂樀娜四樧R(shí)別方法的重要貢獻(xiàn)不僅為基于圖像的目標(biāo)識(shí)別提供了一種普遍的方法,還在于它的基本變換進(jìn)行降維和特征提取的思想為目標(biāo)識(shí)別提供了一種方法論[5]。

[1]Kumar N M.An efficient multimodal biometric facerecognition using speech signal[J].ICSIP,2010:201-206.

[2]Shekar B H.Face recognition using kernel entropy component analysis[J].Neurocomputing,2011,74(6):1053-1057.

[3]鄧偉宏.高精度人臉識(shí)別算法研究[D].北京:北京郵電大學(xué),2009.

[4]葛微.自動(dòng)人臉識(shí)別關(guān)鍵技術(shù)研究[D].長(zhǎng)春:中國(guó)科學(xué)院研究生院(長(zhǎng)春光學(xué)精密機(jī)械與物理研究所),2010.

[5]田捷,楊鑫.生物特征識(shí)別理論與應(yīng)用[M].北京:清華大學(xué)出版社,2009:241-242,251-253.

[6]謝立權(quán).基于PCA的人臉識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].南京:東南大學(xué),2007.

[7]Kyungnam K.Face recongnition using principle component analysis[J].IEEE Signal Processing Society,2002,9(2):40-42.

[8]黃廷祝,鐘守銘,李正良.矩陣?yán)碚揫M].北京:高等教育出版社,2003.

[9]Spacek L D.Computer Vision Science Research Projects[EB/OL].http://dces.essex.ac.uk/mv/allfaces/faces94.html (2011-08-20)[2011-09-20].

猜你喜歡
特征向量人臉識(shí)別特征值
二年制職教本科線性代數(shù)課程的幾何化教學(xué)設(shè)計(jì)——以特征值和特征向量為例
人臉識(shí)別 等
克羅內(nèi)克積的特征向量
一類帶強(qiáng)制位勢(shì)的p-Laplace特征值問(wèn)題
單圈圖關(guān)聯(lián)矩陣的特征值
揭開人臉識(shí)別的神秘面紗
一類特殊矩陣特征向量的求法
EXCEL表格計(jì)算判斷矩陣近似特征向量在AHP法檢驗(yàn)上的應(yīng)用
基于商奇異值分解的一類二次特征值反問(wèn)題
基于類獨(dú)立核稀疏表示的魯棒人臉識(shí)別
郴州市| 闽侯县| 双柏县| 大竹县| 上饶县| 香港 | 广南县| 炎陵县| 武山县| 项城市| 蓬溪县| 古浪县| 于田县| 嵊州市| 上饶县| 长春市| 洪湖市| 兰溪市| 虹口区| 东辽县| 道孚县| 双辽市| 承德县| 西畴县| 社旗县| 营口市| 陇南市| 仙桃市| 景东| 霞浦县| 雷山县| 盖州市| 金溪县| 吴桥县| 高碑店市| 江油市| 香河县| 黄骅市| 东乌珠穆沁旗| 泰州市| 巍山|