陳棟同濟(jì)大學(xué)
二維隨機(jī)映射算法與模塊化方法在人臉識(shí)別中的應(yīng)用
陳棟
同濟(jì)大學(xué)
本文提出了一種基于二維隨機(jī)映射和模塊化方法的人臉識(shí)別算法。該算法將面部圖像劃分為子圖像,并將二維隨機(jī)映射應(yīng)用于每個(gè)子圖像。在應(yīng)對(duì)姿勢(shì),照明方向和面部表情的變化的同時(shí),利用二維隨機(jī)映射的優(yōu)點(diǎn),顯著降低了計(jì)算復(fù)雜度的同時(shí)能夠以較少的存儲(chǔ)器和較短的計(jì)算時(shí)間來保留最多的特征信息。實(shí)驗(yàn)表明,該方法比傳統(tǒng)方法表現(xiàn)更好。
人臉識(shí)別;模塊化方法;隨機(jī)映射;特征提取
人臉識(shí)別是計(jì)算機(jī)視覺的熱門研究領(lǐng)域[1],是一個(gè)具有挑戰(zhàn)性的課題。這是由樣本變化(表情,年齡,角度,照明)引起的。隨著攝影技術(shù)發(fā)展和實(shí)際需要,高維度人臉識(shí)別需要更快的識(shí)別速度。在人臉識(shí)別領(lǐng)域已經(jīng)提出了各種算法,可以根據(jù)對(duì)原始圖像的處理方法分為兩類:整體匹配方法和局部匹配方法。主成分分析[2],線性判別分析[3]及其相關(guān)算法都是典型的全局結(jié)構(gòu)方法。基于稀疏表示的面部分類算法嘗試將樣本的稀疏表示結(jié)構(gòu)保留在低維嵌入子空間中。該類算法在處理圖像損壞,面部偽裝[4]實(shí)現(xiàn)了很好的識(shí)別效果。局部匹配方法在處理角度、場(chǎng)景變化時(shí)魯棒性更好。
模塊化方法將圖像劃分成較小的區(qū)域,對(duì)每一個(gè)區(qū)域計(jì)算權(quán)重向量代表臉部的局部信息。但直接劃分會(huì)丟失相鄰子圖像的邊界信息,本文提出的改進(jìn)方法是采取重疊取樣方法,以固定像素的步長(zhǎng)提取固定大小像素的重疊子圖像。另外,隨機(jī)映射在以隨機(jī)的方式獲得可靠的數(shù)據(jù)信息方面有很好的表現(xiàn)。JL引理表明原始數(shù)據(jù)的幾何結(jié)構(gòu)能夠在隨機(jī)投影下得到保留。二維隨機(jī)映射(2D-RP)將整個(gè)圖像用來做隨機(jī)映射,在不破壞二維圖像的整體結(jié)構(gòu)的情況下能夠以更少的內(nèi)存占用提取出主要信息。
基于模塊化方法的魯棒性和2D-RP高效率的優(yōu)點(diǎn),提出了以下模塊化隨機(jī)映射算法。假設(shè)訓(xùn)練集中有大小為X×Y的T個(gè)個(gè)體,每個(gè)人都有Γ個(gè)訓(xùn)練樣本。首先以步長(zhǎng)為s像素提取大小為x×y像素的重疊子圖像。得到每個(gè)個(gè)體平均子圖像為:,采取二維隨機(jī)映射算法得到其主信息。通過兩個(gè)隨機(jī)映射矩陣將子圖像映射為:Ktn=Φ1JtnΦ2T,得到每一個(gè)人臉子圖像映射后的矩陣,對(duì)待測(cè)試人臉圖像使用相同的映射矩陣來獲得主要信息。最后用最近鄰(NN)方法來確定識(shí)別結(jié)果。最小距離計(jì)算方法為:,如果min(Dt)<θi,θi為設(shè)定的閾值,則待測(cè)試人臉圖像屬于數(shù)據(jù)庫(kù)中的t類,否則不屬于該數(shù)據(jù)庫(kù)。
在Yale人臉數(shù)據(jù)庫(kù)上進(jìn)行實(shí)驗(yàn)。該數(shù)據(jù)庫(kù)有15名拍攝者的11張不同表情,光照,100×80像素的圖片。使用三個(gè)圖像來進(jìn)行識(shí)別,其余圖像進(jìn)行訓(xùn)練。首先比較兩種算法識(shí)別率,子圖像的數(shù)量從4到256不等,以觀察其效果。實(shí)驗(yàn)結(jié)果如圖1(左)所示,在分割數(shù)量較小時(shí),本方法優(yōu)于傳統(tǒng)方法。當(dāng)子圖像數(shù)量較大時(shí),兩種識(shí)別率都會(huì)降低。由于計(jì)算成本是人臉識(shí)別的關(guān)鍵部分,隨機(jī)映射在內(nèi)存和運(yùn)行時(shí)間上的有較低開銷。與模塊化PCA人臉識(shí)別時(shí)間比較,從圖1(右)可以看出,本文方法在計(jì)算成本方面表現(xiàn)良好。
本文提出一種基于二維隨機(jī)投影和重疊分塊的新型人臉識(shí)別算法。重疊分塊在表情,照明和姿勢(shì)變化的條件下表現(xiàn)良好。2D-RP比傳統(tǒng)的隨機(jī)投影效率更高。首先將訓(xùn)練圖像劃分成小塊,然后在圖像的每個(gè)部分應(yīng)用2D-RP。將待測(cè)試人臉圖像經(jīng)過相同辦法處理后與已有數(shù)據(jù)進(jìn)行比較,從而得到人臉類別。實(shí)驗(yàn)表明,與模塊化PCA方法相比,提出的模塊化隨機(jī)映射算法內(nèi)存占用低、運(yùn)行時(shí)間少??傮w來說優(yōu)于傳統(tǒng)的模塊化PCA、隨機(jī)映射算法。
[1]P.J.Phillips,H.Moon,S.A.Rizvi,and P.J.Rauss,“The FE?RET Evaluation Methodology for Face-Recognition Algorithms,”IEEE Transactions on Pattern Analysis&Machine Intelligence,vol. 22,no.10,pp.1090-1104,2000.
[2]Jolliffe,and Ian,“Principal Component Analysis,”Springer Berlin,vol.87,no.100,pp.41-64,1986.
[3]J.C.Davis,“Introduction to statistical pattern recognition∶2nd edition,by K.Fukunaga,Academic Press,San Diego,1990,”Computers&Geosciences,vol.22,no.7,pp.833-834,1996.
[4]J.Wright,A.Y.Yang,A.Ganesh,S.S.Sastry,and Y.Ma,“Robust Face Recognition via Sparse Representation,”IEEE Transac?tions on Pattern Analysis&Machine Intelligence,vol.31,no.2,pp. 210-227,2009.
陳棟(1990-),男,江蘇人,研究生,研究方向:人臉識(shí)別,數(shù)據(jù)降維。