山東華宇工學(xué)院 孫德剛
人臉識(shí)別作為熱門研究技術(shù),有關(guān)其生物特征識(shí)別算法陸續(xù)被提出。PCA作為經(jīng)典算法,在人臉識(shí)別領(lǐng)域運(yùn)用可以取得顯著效果?;诖?,在對(duì)PCA算法理論展開分析的基礎(chǔ)上,結(jié)合人臉識(shí)別基本思路和流程提出了該算法在人臉識(shí)別上的應(yīng)用原理,并對(duì)算法實(shí)現(xiàn)方法進(jìn)行了探討。從仿真結(jié)果來(lái)看,采用PCA算法能夠提高人臉識(shí)別率。
伴隨著科學(xué)技術(shù)的發(fā)展,人工智能被運(yùn)用到各行各業(yè),為各項(xiàng)工作的高效開展提供支持。而人臉識(shí)別屬于生物特征識(shí)別技術(shù),早在19世紀(jì)得以被提出,目前在智能交通、智慧安防等多個(gè)領(lǐng)域得到了運(yùn)用。采用PCA算法實(shí)現(xiàn)人臉特征提取,能夠使因光照、角度等原因造成的人臉識(shí)別率低的問題得到解決,因此還要加強(qiáng)基于該算法的人臉識(shí)別技術(shù)研究,以便使技術(shù)得到更好地推廣應(yīng)用。
PCA為主成分分析法的英文簡(jiǎn)稱,通常理應(yīng)原始變量線性組合對(duì)原本指標(biāo)數(shù)據(jù)進(jìn)行替代,從而實(shí)現(xiàn)主成分解釋。采用該算法能夠使原本數(shù)據(jù)結(jié)構(gòu)分布得到最大限度的保留,并在最小均方條件下進(jìn)行最能代表原始數(shù)據(jù)的投影查找,從而在特征空間中實(shí)現(xiàn)數(shù)據(jù)降維。作為常用人臉識(shí)別算法,能夠?qū)崿F(xiàn)方差最大化,同時(shí)實(shí)現(xiàn)冗余最小化,在數(shù)據(jù)降維、數(shù)據(jù)相關(guān)性分析等多個(gè)領(lǐng)域擁有顯著優(yōu)勢(shì)。采用該算法能夠?qū)υ紨?shù)據(jù)進(jìn)行線性變換,將數(shù)據(jù)變換到新坐標(biāo)系中,在數(shù)據(jù)方差最大的方向樹立第一個(gè)坐標(biāo)軸,即第一主成分。與坐標(biāo)軸正交平面為第二個(gè)坐標(biāo)軸,則為第二個(gè)主成分。對(duì)低階主成分進(jìn)行保留,使高階主成分得到忽略,能夠使數(shù)據(jù)集方差貢獻(xiàn)最大的特征得到保持。利用不同維度線性無(wú)關(guān)數(shù)據(jù)進(jìn)行表示,可以得到一組不相關(guān)的綜合指標(biāo)。通過(guò)對(duì)數(shù)據(jù)主要特征分量進(jìn)行提取,將高維空間數(shù)據(jù)向低維空間投影,能夠完成數(shù)據(jù)降維處理。
采用人臉識(shí)別技術(shù),需要通過(guò)構(gòu)建人臉分類器獲得人臉識(shí)別模型,通過(guò)運(yùn)用高效識(shí)別算法保證人臉特征得到準(zhǔn)確提取。在算法運(yùn)用上,還要完成大量樣本訓(xùn)練,以便得到科學(xué)分類模型。現(xiàn)階段,主要采用的人臉識(shí)別技術(shù)可以劃分為三類。一類為實(shí)現(xiàn)彈性圖匹配的技術(shù),能夠利用發(fā)生一定變形的樣本實(shí)現(xiàn)人臉識(shí)別。如在拍攝圖片存在角度旋轉(zhuǎn)或人臉存在表情變化的情況下,還要對(duì)各圖像進(jìn)行分別計(jì)算,完成相應(yīng)模型圖的存儲(chǔ),要求選用具有較強(qiáng)適應(yīng)性的算法。第二類為利用幾何特征實(shí)現(xiàn)人臉識(shí)別的技術(shù),需要對(duì)人臉的眼睛、鼻子等器官幾何特征進(jìn)行提取。由于這些生物特征相對(duì)穩(wěn)定,因此可以適應(yīng)光照、姿態(tài)等因素引起的變化。第三類為基于子空間的識(shí)別技術(shù),通過(guò)將圖像從高維向低維投影,能夠?qū)崿F(xiàn)人臉特征判別,容易受光照等外界因素干擾。實(shí)際采用PCA算法進(jìn)行人臉識(shí)別,還要解決因光照等因素造成人臉識(shí)別率低的問題。具體來(lái)講,就是要在利用PCA算法進(jìn)行生物特征提取時(shí),利用直方圖均衡化方法完成圖像預(yù)處理,使原始圖形大部分信息得到保留基礎(chǔ)上完成主要元素提取,繼而使技術(shù)穩(wěn)定性得到增強(qiáng)。
從人臉識(shí)別流程來(lái)看,需要先獲取人臉圖像信息。采用多種采集設(shè)備,能夠完成大量圖像采集,然后轉(zhuǎn)化為計(jì)算機(jī)能夠處理的數(shù)據(jù)信息。考慮到圖像質(zhì)量受光照、拍攝角度等復(fù)雜因素的影響,還要通過(guò)預(yù)處理增強(qiáng)圖像識(shí)別性,避免特征提取受到過(guò)大影響。為此,還要從明暗度、姿態(tài)、尺寸等多個(gè)角度進(jìn)行數(shù)據(jù)預(yù)處理,使各種影響得到消除。在特征提取環(huán)節(jié),應(yīng)認(rèn)識(shí)到每幅圖像擁有各自的特征。不同于人眼依靠物理和結(jié)構(gòu)特征進(jìn)行人臉記憶和識(shí)別,計(jì)算機(jī)在視覺處理上需要對(duì)數(shù)學(xué)特征進(jìn)行提取,通過(guò)協(xié)方差矩陣計(jì)算、樣本平均值統(tǒng)計(jì)等操作獲得特征數(shù)據(jù)。機(jī)器學(xué)習(xí)需要大量訓(xùn)練樣本,數(shù)據(jù)維度過(guò)高將造成算法消耗資源過(guò)大。采用PCA算法實(shí)現(xiàn)主要信息提取,然后對(duì)原始高維向量進(jìn)行重構(gòu),能夠?yàn)槿四樧R(shí)別提供支持。在特征匹配階段,需要將提取的特征與數(shù)據(jù)庫(kù)中的人臉特征樣本進(jìn)行比對(duì),按照分類規(guī)則實(shí)現(xiàn)匹配分析,最終使人臉得到有效識(shí)別。
在樣本分類過(guò)程中,還要假設(shè)樣本存在n個(gè)特征,通過(guò)對(duì)樣本平均值、離散度矩陣Sw進(jìn)行計(jì)算,能夠?qū)ν队胺较蜻M(jìn)行選擇,將樣本投影至一維空間Y。對(duì)空間邊界點(diǎn)進(jìn)行查找,能夠根據(jù)投影點(diǎn)與分界點(diǎn)關(guān)聯(lián)完成分類。如在各樣本均值向量為mi時(shí),樣本類間的離散度矩陣滿足:
想要使投影后的一維空間保持較大距離,需要使樣本均值差(m1-m2)較大,實(shí)現(xiàn)類間距離最大化。與此同時(shí),使類間距離實(shí)現(xiàn)最小化,能夠使各樣本保持緊密。對(duì)向量W *進(jìn)行求取,需要完成分類準(zhǔn)則函數(shù)的構(gòu)建,得到:
對(duì)投影空間分割閾值y0進(jìn)行計(jì)算,能夠得到一維空間內(nèi)各樣本均值和離散度矩陣。針對(duì)給定原始變量X,通過(guò)在W*投影得到y(tǒng),可以根據(jù)y與y0大小比值完成分類。對(duì)樣本數(shù)據(jù)協(xié)方差進(jìn)行計(jì)算時(shí),對(duì)得到的矩陣Σ=(Sij)p×p(i,j=1,2,...,p),還要完成特征值λi和對(duì)應(yīng)正交化單位特征向量ai進(jìn)行分析。根據(jù)主成分貢獻(xiàn)率,能夠完成重要主成分篩選。主成分Fi特征值平均更與原始變量Xj系數(shù)乘積為主成分荷載,能夠?qū)ζ渑c原始指標(biāo)間的關(guān)聯(lián)程度進(jìn)行反映,得到:
對(duì)不同主成分得分進(jìn)行分析,能夠完成樣本特征評(píng)判,得到:
在算法實(shí)現(xiàn)上,在二維人臉圖像長(zhǎng)和寬分別為M和N的條件下,可以看成是MN列向量,轉(zhuǎn)換為一維列向量,需要先對(duì)圖像M*N值進(jìn)行計(jì)算。按照行實(shí)現(xiàn)轉(zhuǎn)置運(yùn)算,能夠按列實(shí)現(xiàn)圖像灰度值提取,得到一維向量矩陣T。通過(guò)對(duì)圖形進(jìn)行預(yù)處理,可以得到一維列向量平均值。采用列陣對(duì)每列平均值進(jìn)行削減,能夠得到矩陣A。利用A實(shí)現(xiàn)樣本訓(xùn)練,維度能夠達(dá)到M×N×P,與轉(zhuǎn)置相乘可以得到協(xié)方差矩陣C,維度為(MN)2。由于維度較高,還要采用PCA算法進(jìn)行降維處理,能夠利用C=AAT實(shí)現(xiàn)矩陣L構(gòu)造,得到L=AAT∈Rm×m。通過(guò)對(duì)特征值及向量進(jìn)行計(jì)算,能夠從中篩選出數(shù)值超100的值作為C的特征值,然后重新進(jìn)行特征向量計(jì)算,生成特征臉圖像。在人臉識(shí)別階段,通過(guò)樣本訓(xùn)練從數(shù)據(jù)庫(kù)中提取圖像,得到特征數(shù)據(jù)庫(kù)后,可以進(jìn)行樣本測(cè)試。針對(duì)需要識(shí)別的人臉,對(duì)提取得到的特征和數(shù)據(jù)庫(kù)中樣本距離進(jìn)行比較,將距離最小的圖像當(dāng)成是結(jié)果,從而完成人臉識(shí)別。為確定算法實(shí)現(xiàn)效果,還要采用matlab軟件進(jìn)行編程實(shí)現(xiàn),從face 94 Essex face database中獲得400張人臉圖像。在樣本圖像占比超出65%的情況下,通過(guò)樣本訓(xùn)練后采用剩余35%圖像數(shù)據(jù)進(jìn)行人臉識(shí)別測(cè)試,可以發(fā)現(xiàn)人臉識(shí)別率能夠達(dá)到92%以上,能夠滿足人臉識(shí)別技術(shù)應(yīng)用要求。
結(jié)論:在人臉識(shí)別技術(shù)實(shí)現(xiàn)過(guò)程中,采用PCA算法還要確定算法在人臉生物特征提取方面的缺陷,通過(guò)科學(xué)進(jìn)行圖像預(yù)處理降低數(shù)據(jù)處理難度,確保原始圖形主要元素得到最大限度提取,為后續(xù)特征匹配和分析提供有力支撐。通過(guò)大量樣本訓(xùn)練建立人臉特征庫(kù),并采用歐式距離法實(shí)現(xiàn)圖像判別,能夠使人臉識(shí)別算法得到有效實(shí)現(xiàn),最終取得理想技術(shù)效果。