全星慧++牟海維++呂秀麗++張華
文章編號(hào): 10055630(2014)02012204
收稿日期: 20131119
基金項(xiàng)目: 黑龍江省科技廳自然科學(xué)基金項(xiàng)目(F201108)
摘要: 研究了主元分析與貝葉斯決策相結(jié)合的人臉識(shí)別方法。利用主元分析提取人臉圖像訓(xùn)練集的特征子空間,將訓(xùn)練圖像和測(cè)試圖像投影到該子空間,提取特征向量及計(jì)算統(tǒng)計(jì)特性,利用最小錯(cuò)誤率貝葉斯決策規(guī)則對(duì)測(cè)試圖像進(jìn)行分類,從而實(shí)現(xiàn)人臉識(shí)別。大量實(shí)驗(yàn)表明:主元分析能將人臉圖像的特征信息有效地映射在特征子空間,同時(shí)采用貝葉斯決策規(guī)則能夠快速準(zhǔn)確地對(duì)人臉圖像進(jìn)行分類。
關(guān)鍵詞: 主元分析; 貝葉斯決策; 人臉識(shí)別
中圖分類號(hào): TP 391.4文獻(xiàn)標(biāo)志碼: Adoi: 10.3969/j.issn.10055630.2014.02.007
Research on face recognition methods based on
principal component analysis and Bayesian decision
QUAN Xinghui, MU Haiwei, L Xiuli, ZHANG Hua
(College of Electronic Science, Northeast Petroleum University, Daqing 163318, China)
Abstract: A method for face recognition based on principal component analysis(PCA)and Bayesian decision is described. Extracting feature subspace of face image training sets using PCA, the training images and test images are projected in the subspace, the eigenvectors are extracted and the statistical properties are calculated,adopt Bayesian decision based on minimum error rate to realize face recognition. Experimental results show that PCA is well in the subspace of face images to extract feature information, by Bayesian decision can quickly and accurately classify the face images.
Key words: principle component analysis; Bayesian decision; face recognition
引言人臉識(shí)別技術(shù)是模式識(shí)別和人工智能領(lǐng)域的一個(gè)熱門課題,它覆蓋了圖像處理、模式識(shí)別、人工神經(jīng)網(wǎng)絡(luò)、生理學(xué)及心理學(xué)等許多學(xué)科的內(nèi)容,具有非常廣泛的應(yīng)用前景[12]。通常人臉識(shí)別系統(tǒng)包括人臉檢測(cè)、人臉預(yù)處理、人臉特征提取和人臉識(shí)別等主要步驟。本文提出了一種主元分析結(jié)合最小錯(cuò)誤率貝葉斯決策實(shí)現(xiàn)人臉?lè)诸愖R(shí)別的算法。1主元分析原理及人臉特征子空間提取基于主元分析(principle component analysis,PCA)的人臉特征提取方法是建立在KL變換基礎(chǔ)上的。因?yàn)槿四樈Y(jié)構(gòu)的存在,當(dāng)把這樣的人臉圖像歸一化之后,這些圖像在這個(gè)高維空間中不是隨機(jī)、散亂地分布而是存在特定的規(guī)律。因此,通過(guò)KL變換用一個(gè)低維子空間描述人臉圖像,同時(shí)又可以提取所需要的識(shí)別信息。
1.1主元分析原理對(duì)于一幅人臉圖像,用f(x,y)來(lái)表示,這里x和y指空間中的坐標(biāo)。實(shí)際在計(jì)算機(jī)的應(yīng)用中,人臉圖像f(x,y)在空間坐標(biāo)和灰度上都己經(jīng)被離散化了,因此可以用一個(gè)矩陣來(lái)表示一幅人臉圖像,矩陣中的每一個(gè)元素對(duì)應(yīng)圖像中的一個(gè)像素點(diǎn),而矩陣中的相應(yīng)元素的值對(duì)應(yīng)該點(diǎn)的灰度等級(jí)。選擇人臉庫(kù)中每個(gè)人一定數(shù)量的圖像構(gòu)成訓(xùn)練集,其余形成測(cè)試集,用于測(cè)試系統(tǒng)性能。一幅N×N的圖像按列相連可構(gòu)成一個(gè)N2維列向量,通過(guò)主元分析方法用一個(gè)低維子空間來(lái)表示原始圖像[3]。設(shè)訓(xùn)練集中有M幅大小為N×N的人臉圖像,將每幅圖像看作是長(zhǎng)度為N2的列向量,記作[x1 x2…xM ]。用μ表示M幅人臉圖像的平均向量:μ=1M∑Mi=1xi(1)求出每一幅圖像與平均向量的差異,把差異運(yùn)用KL變換,用訓(xùn)練集的協(xié)方差矩陣作為產(chǎn)生矩陣,即S=1M∑Mi=1xi-μxi-μT=1MQQT(2)光學(xué)儀器第36卷
第2期全星慧,等:基于PCA與貝葉斯決策的人臉識(shí)別算法
其中:Q=[x1-μ,x2-μ,…,xM-μ](3)1.2基于KL變換的人臉特征子空間提取KL展開是圖像壓縮的一種最優(yōu)正交變換。人們將其應(yīng)用于特征提取,形成了利用子空間投影進(jìn)行模式識(shí)別的基礎(chǔ)。為了求N2×N2維矩陣的特征值和正交歸一的特征矢量,直接計(jì)算幾乎是不可能的,為此引出奇異值分解定理(SVD)[4]:設(shè)秩為r、大小為n×r的矩陣X,存在兩個(gè)正交矩陣:U=[u0,u1,…,ur-1]∈pn×rUTU=1(4)
V=[v0,v1,…,vr-1]∈pr×rVTV=1(5)以及對(duì)角陣:Λ=diag[λ0,λ1,…,λr-1]∈pr×r且λ0≥λ1≥…λr-1(6)滿足X=UΛ1/2VT(7)其中,pn×r、pr×r分別表示矩陣的大小為n×r,r×r,λi(i=0,1,…,r-1)為矩陣XXT和XTX的非零特征值,ui和vi分別為XXT和XTX對(duì)應(yīng)于λi的特征矢量。推論U=XVΛ1/2(8)故由式(2)構(gòu)造矩陣R=QTQ∈pM×M(9)容易求出其特征值λi及相應(yīng)的正交歸一特征矢量vi(i=0,1,…,M-1)。因而S的正交歸一特征矢量由推論可得ui=1λiQvii=0,1,…,M-1(10)經(jīng)KL變換可以得到一組由大到小特征值λi對(duì)應(yīng)的特征向量ui,稱之為“特征臉”。有了這樣一個(gè)由“特征臉”組成的降維子空間,任何一幅人臉圖像都可以向其做投影并獲得一組坐標(biāo)系數(shù),這組系數(shù)表明了該圖像在子空間中的位置,從而可以作為人臉識(shí)別的依據(jù)。2貝葉斯決策理論及人臉?lè)诸愖R(shí)別
2.1貝葉斯決策理論及規(guī)則貝葉斯決策理論是統(tǒng)計(jì)模式識(shí)別中的一個(gè)基本方法[5]。已知總共有c類物體,討論在下列條件下對(duì)某一樣本按其特征向量x分類的問(wèn)題[6]:(1)各類別ωi=1,2,…,c的先驗(yàn)概率P(ωi)及類條件概率密度函數(shù)p(xωi)已知。(2)類別數(shù)一定。貝葉斯公式為P(ωix)=p(xωi)P(ωi)p(x)=p(xωi)P(ωi)∑ci=1p(xωi)P(ωi)(11)最有代表性的決策規(guī)則分別為基于最小錯(cuò)誤率的判決準(zhǔn)則和基于最小風(fēng)險(xiǎn)的判決準(zhǔn)則。本文采用基于最小錯(cuò)誤率的判決準(zhǔn)則,即若P(ωix)=maxj=1,2,…,cP(ωjx),則x∈ωi(12)2.2訓(xùn)練樣本特征統(tǒng)計(jì)利用貝葉斯決策進(jìn)行分類,首先需要求取各類樣本的統(tǒng)計(jì)特性,即通過(guò)對(duì)各類訓(xùn)練樣本在特征空間上的投影,得到每一個(gè)樣本的特征向量,并對(duì)各類訓(xùn)練樣本的特征向量分別求均值和協(xié)方差矩陣。
2.3測(cè)試樣本特征提取及分類識(shí)別對(duì)測(cè)試圖像在特征空間進(jìn)行投影,得到特征向量。利用測(cè)試樣本的特征向量及各類訓(xùn)練樣本的特征向量均值和協(xié)方差矩陣,分別計(jì)算各類的類條件概率密度及先驗(yàn)概率,從而可以計(jì)算得到測(cè)試樣本的各類后驗(yàn)概率,根據(jù)最小錯(cuò)誤率的貝葉斯決策規(guī)則,后驗(yàn)概率較大者,即為測(cè)試樣本歸屬類別,從而給出分類識(shí)別結(jié)果。3實(shí)驗(yàn)分析本文采用ORL人臉數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)包含40位人臉圖像數(shù)據(jù),每人10幅,共400幅圖像組成[7]。每幅圖像的分辨率為112×92,灰度級(jí)256。這些圖像面部表情、面部遮掩物、時(shí)間、光照等各不相同。本文任選庫(kù)中4人,各任意選取5張圖像作訓(xùn)練樣本,這4人的訓(xùn)練圖像如圖1所示。將訓(xùn)練樣本進(jìn)行主元分析,提取特征子空間,同時(shí)將各類訓(xùn)練樣本投影到子空間得到相應(yīng)的特征向量,對(duì)各類訓(xùn)練樣本的特征向量求均值和協(xié)方差矩陣,并計(jì)算各類的先驗(yàn)概率及類條件概率密度。
圖1讀取的人臉訓(xùn)練樣本
Fig.1The face training samples
圖2測(cè)試樣本
Fig.2The test sample
表1測(cè)試樣本所對(duì)應(yīng)的后驗(yàn)概率
Tab.1Posterior probability of the test samples
第一類第二類第三類第四類4.809 4×10-222.625 9×10-246.909×10-224.098 4×10-20
在第四類人臉圖像中,任選測(cè)試樣本以外的一張圖像作為測(cè)試樣本,其測(cè)試樣本如圖2所示。將測(cè)試樣本投影到特征子空間得到相應(yīng)的特征向量,利用式(11)計(jì)算測(cè)試樣本的后驗(yàn)概率分布如表1所示。最后根據(jù)基于最小錯(cuò)誤率的貝葉斯決策規(guī)則得出測(cè)試樣本屬于第四類。實(shí)驗(yàn)比較了不同數(shù)目的訓(xùn)練樣本下,該人臉識(shí)別算法的識(shí)別率。從ORL人臉庫(kù)中隨機(jī)選取4,5,6,7,8幅圖像作訓(xùn)練樣本,剩余圖像用作測(cè)試樣本,對(duì)不同數(shù)目的訓(xùn)練樣本各重復(fù)實(shí)驗(yàn)10次,識(shí)別率都在97%以上。4結(jié)論本方法結(jié)合主元分析提取人臉特征及貝葉斯決策實(shí)現(xiàn)分類識(shí)別。主元分析能有效地提取原始人臉圖像特征,而不依賴于面部表情,光照等因素,不僅降低了運(yùn)算量而且保證了特性的穩(wěn)定性,而使用基于最小錯(cuò)誤率的貝葉斯決策規(guī)則進(jìn)行分類,算法不僅簡(jiǎn)單實(shí)用而且大大提高了識(shí)別的速度。通過(guò)實(shí)驗(yàn)表明,本文提出的算法識(shí)別的準(zhǔn)確率比較高。參考文獻(xiàn):
[1]劉艷麗,趙躍龍.人臉識(shí)別技術(shù)研究進(jìn)展[J].計(jì)算機(jī)工程,2005,31(3):1011.
[2]朱樹先,張仁杰,鄭剛.基于RBF神經(jīng)網(wǎng)絡(luò)的人臉識(shí)別[J].光學(xué)儀器,2008,30(2):3133.
[3]全星慧,于麗,計(jì)春悅.基于主元分析的人臉識(shí)別方法研究[J].科學(xué)技術(shù)與工程,2010,10(24):60636065.
[4]陳元春.基于矩陣主成分分析的人臉識(shí)別方法研究[D].武漢:武漢理工大學(xué),2012:2642.
[5]邊肇祺,張學(xué)工.模式識(shí)別[M].北京:清華大學(xué)出版社,2000:721.
[6]LI Z F,TANG X O.Using support vector machines to enhance the performance of Bayesian face recognition[J].IEEE Transactions on Information Forensics and Security,2007,2(2):174180.
[7]曾岳,馮大政,付達(dá)杰.最小風(fēng)險(xiǎn)貝葉斯決策的二值化人臉識(shí)別算法[J].計(jì)算機(jī)工程與設(shè)計(jì),2011,32(10):3511
2.3測(cè)試樣本特征提取及分類識(shí)別對(duì)測(cè)試圖像在特征空間進(jìn)行投影,得到特征向量。利用測(cè)試樣本的特征向量及各類訓(xùn)練樣本的特征向量均值和協(xié)方差矩陣,分別計(jì)算各類的類條件概率密度及先驗(yàn)概率,從而可以計(jì)算得到測(cè)試樣本的各類后驗(yàn)概率,根據(jù)最小錯(cuò)誤率的貝葉斯決策規(guī)則,后驗(yàn)概率較大者,即為測(cè)試樣本歸屬類別,從而給出分類識(shí)別結(jié)果。3實(shí)驗(yàn)分析本文采用ORL人臉數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)包含40位人臉圖像數(shù)據(jù),每人10幅,共400幅圖像組成[7]。每幅圖像的分辨率為112×92,灰度級(jí)256。這些圖像面部表情、面部遮掩物、時(shí)間、光照等各不相同。本文任選庫(kù)中4人,各任意選取5張圖像作訓(xùn)練樣本,這4人的訓(xùn)練圖像如圖1所示。將訓(xùn)練樣本進(jìn)行主元分析,提取特征子空間,同時(shí)將各類訓(xùn)練樣本投影到子空間得到相應(yīng)的特征向量,對(duì)各類訓(xùn)練樣本的特征向量求均值和協(xié)方差矩陣,并計(jì)算各類的先驗(yàn)概率及類條件概率密度。
圖1讀取的人臉訓(xùn)練樣本
Fig.1The face training samples
圖2測(cè)試樣本
Fig.2The test sample
表1測(cè)試樣本所對(duì)應(yīng)的后驗(yàn)概率
Tab.1Posterior probability of the test samples
第一類第二類第三類第四類4.809 4×10-222.625 9×10-246.909×10-224.098 4×10-20
在第四類人臉圖像中,任選測(cè)試樣本以外的一張圖像作為測(cè)試樣本,其測(cè)試樣本如圖2所示。將測(cè)試樣本投影到特征子空間得到相應(yīng)的特征向量,利用式(11)計(jì)算測(cè)試樣本的后驗(yàn)概率分布如表1所示。最后根據(jù)基于最小錯(cuò)誤率的貝葉斯決策規(guī)則得出測(cè)試樣本屬于第四類。實(shí)驗(yàn)比較了不同數(shù)目的訓(xùn)練樣本下,該人臉識(shí)別算法的識(shí)別率。從ORL人臉庫(kù)中隨機(jī)選取4,5,6,7,8幅圖像作訓(xùn)練樣本,剩余圖像用作測(cè)試樣本,對(duì)不同數(shù)目的訓(xùn)練樣本各重復(fù)實(shí)驗(yàn)10次,識(shí)別率都在97%以上。4結(jié)論本方法結(jié)合主元分析提取人臉特征及貝葉斯決策實(shí)現(xiàn)分類識(shí)別。主元分析能有效地提取原始人臉圖像特征,而不依賴于面部表情,光照等因素,不僅降低了運(yùn)算量而且保證了特性的穩(wěn)定性,而使用基于最小錯(cuò)誤率的貝葉斯決策規(guī)則進(jìn)行分類,算法不僅簡(jiǎn)單實(shí)用而且大大提高了識(shí)別的速度。通過(guò)實(shí)驗(yàn)表明,本文提出的算法識(shí)別的準(zhǔn)確率比較高。參考文獻(xiàn):
[1]劉艷麗,趙躍龍.人臉識(shí)別技術(shù)研究進(jìn)展[J].計(jì)算機(jī)工程,2005,31(3):1011.
[2]朱樹先,張仁杰,鄭剛.基于RBF神經(jīng)網(wǎng)絡(luò)的人臉識(shí)別[J].光學(xué)儀器,2008,30(2):3133.
[3]全星慧,于麗,計(jì)春悅.基于主元分析的人臉識(shí)別方法研究[J].科學(xué)技術(shù)與工程,2010,10(24):60636065.
[4]陳元春.基于矩陣主成分分析的人臉識(shí)別方法研究[D].武漢:武漢理工大學(xué),2012:2642.
[5]邊肇祺,張學(xué)工.模式識(shí)別[M].北京:清華大學(xué)出版社,2000:721.
[6]LI Z F,TANG X O.Using support vector machines to enhance the performance of Bayesian face recognition[J].IEEE Transactions on Information Forensics and Security,2007,2(2):174180.
[7]曾岳,馮大政,付達(dá)杰.最小風(fēng)險(xiǎn)貝葉斯決策的二值化人臉識(shí)別算法[J].計(jì)算機(jī)工程與設(shè)計(jì),2011,32(10):3511
2.3測(cè)試樣本特征提取及分類識(shí)別對(duì)測(cè)試圖像在特征空間進(jìn)行投影,得到特征向量。利用測(cè)試樣本的特征向量及各類訓(xùn)練樣本的特征向量均值和協(xié)方差矩陣,分別計(jì)算各類的類條件概率密度及先驗(yàn)概率,從而可以計(jì)算得到測(cè)試樣本的各類后驗(yàn)概率,根據(jù)最小錯(cuò)誤率的貝葉斯決策規(guī)則,后驗(yàn)概率較大者,即為測(cè)試樣本歸屬類別,從而給出分類識(shí)別結(jié)果。3實(shí)驗(yàn)分析本文采用ORL人臉數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)包含40位人臉圖像數(shù)據(jù),每人10幅,共400幅圖像組成[7]。每幅圖像的分辨率為112×92,灰度級(jí)256。這些圖像面部表情、面部遮掩物、時(shí)間、光照等各不相同。本文任選庫(kù)中4人,各任意選取5張圖像作訓(xùn)練樣本,這4人的訓(xùn)練圖像如圖1所示。將訓(xùn)練樣本進(jìn)行主元分析,提取特征子空間,同時(shí)將各類訓(xùn)練樣本投影到子空間得到相應(yīng)的特征向量,對(duì)各類訓(xùn)練樣本的特征向量求均值和協(xié)方差矩陣,并計(jì)算各類的先驗(yàn)概率及類條件概率密度。
圖1讀取的人臉訓(xùn)練樣本
Fig.1The face training samples
圖2測(cè)試樣本
Fig.2The test sample
表1測(cè)試樣本所對(duì)應(yīng)的后驗(yàn)概率
Tab.1Posterior probability of the test samples
第一類第二類第三類第四類4.809 4×10-222.625 9×10-246.909×10-224.098 4×10-20
在第四類人臉圖像中,任選測(cè)試樣本以外的一張圖像作為測(cè)試樣本,其測(cè)試樣本如圖2所示。將測(cè)試樣本投影到特征子空間得到相應(yīng)的特征向量,利用式(11)計(jì)算測(cè)試樣本的后驗(yàn)概率分布如表1所示。最后根據(jù)基于最小錯(cuò)誤率的貝葉斯決策規(guī)則得出測(cè)試樣本屬于第四類。實(shí)驗(yàn)比較了不同數(shù)目的訓(xùn)練樣本下,該人臉識(shí)別算法的識(shí)別率。從ORL人臉庫(kù)中隨機(jī)選取4,5,6,7,8幅圖像作訓(xùn)練樣本,剩余圖像用作測(cè)試樣本,對(duì)不同數(shù)目的訓(xùn)練樣本各重復(fù)實(shí)驗(yàn)10次,識(shí)別率都在97%以上。4結(jié)論本方法結(jié)合主元分析提取人臉特征及貝葉斯決策實(shí)現(xiàn)分類識(shí)別。主元分析能有效地提取原始人臉圖像特征,而不依賴于面部表情,光照等因素,不僅降低了運(yùn)算量而且保證了特性的穩(wěn)定性,而使用基于最小錯(cuò)誤率的貝葉斯決策規(guī)則進(jìn)行分類,算法不僅簡(jiǎn)單實(shí)用而且大大提高了識(shí)別的速度。通過(guò)實(shí)驗(yàn)表明,本文提出的算法識(shí)別的準(zhǔn)確率比較高。參考文獻(xiàn):
[1]劉艷麗,趙躍龍.人臉識(shí)別技術(shù)研究進(jìn)展[J].計(jì)算機(jī)工程,2005,31(3):1011.
[2]朱樹先,張仁杰,鄭剛.基于RBF神經(jīng)網(wǎng)絡(luò)的人臉識(shí)別[J].光學(xué)儀器,2008,30(2):3133.
[3]全星慧,于麗,計(jì)春悅.基于主元分析的人臉識(shí)別方法研究[J].科學(xué)技術(shù)與工程,2010,10(24):60636065.
[4]陳元春.基于矩陣主成分分析的人臉識(shí)別方法研究[D].武漢:武漢理工大學(xué),2012:2642.
[5]邊肇祺,張學(xué)工.模式識(shí)別[M].北京:清華大學(xué)出版社,2000:721.
[6]LI Z F,TANG X O.Using support vector machines to enhance the performance of Bayesian face recognition[J].IEEE Transactions on Information Forensics and Security,2007,2(2):174180.
[7]曾岳,馮大政,付達(dá)杰.最小風(fēng)險(xiǎn)貝葉斯決策的二值化人臉識(shí)別算法[J].計(jì)算機(jī)工程與設(shè)計(jì),2011,32(10):3511