趙旭陽
摘要 提出了一種人臉識別的方法,首先采用gabor濾波器對圖像進(jìn)行5個方向8個尺度的濾波處理,然后采用主成分算法對提取的系數(shù)特征進(jìn)行壓縮降維處理,最后采用極限學(xué)習(xí)機進(jìn)行分類識別,實驗結(jié)果說明本文的算法識別率高、計算速度快、有很大的優(yōu)越性。
【關(guān)鍵詞】人臉識別 Gabor 變換 主成分分析極限學(xué)習(xí)機
1 引言
在現(xiàn)代社會人們的交往過程中,人臉?biāo)囊曈X信息占據(jù)了主導(dǎo)地位,它是區(qū)別人與人之間差別的最重要的特征,因而人臉識別技術(shù)成為當(dāng)今研究的一個熱點。
人臉識別主要包括特征提取和模式識別兩個部分,特征提取常用的算法有主成分分析、獨立成分分析、LBP算子等。模式識別常用的有BP神經(jīng)網(wǎng)絡(luò)、RBF神經(jīng)網(wǎng)絡(luò)、支持向量機,然而這些傳統(tǒng)的算法都存在著訓(xùn)練速度慢、訓(xùn)練精度不夠高的問題。Huang提出了一種極限學(xué)習(xí)機算法,改算法訓(xùn)練速度快且精度較高,本文將其應(yīng)用到了人臉識別中進(jìn)行分析。
2 人臉特征提取
近年來學(xué)者們通過研究發(fā)現(xiàn),可以用一組二維gabor小波來模擬大部分視覺皮層簡單細(xì)胞的濾波響應(yīng)。由于人臉圖片的特征非常容易受到表情變換、光照因素、遮擋、以及姿態(tài)的影響,如果我們直接采用灰度圖像進(jìn)行特征提取來做人臉識別的話往往不容易獲得期望的精度。而如果使用了2D蓋博小波變換,我們能夠較好的獲得一張圖片中相對于空間坐標(biāo)、空間頻率以及方向選擇選擇性的局部結(jié)構(gòu)信息,這些信息很適合用來描述一個人臉圖片的特征。一個2D蓋博濾波器g(x,y)可以寫成下式:
本文選用5個中心頻率和8個方向組成的40個蓋博濾波器的濾波器組來對圖像進(jìn)行處理。
Gabor濾波器處理后的圖像特征維度比較大,含有大量的冗余特征,所以我們需要采用主成分分析算法對其進(jìn)行特征壓縮降維度處理。
3 基于極限神經(jīng)網(wǎng)絡(luò)的人臉識別
極限學(xué)習(xí)機仍然采用三層前饋神經(jīng)網(wǎng)絡(luò)的機構(gòu)。極限學(xué)習(xí)機的初始權(quán)值是可以隨機設(shè)置,在訓(xùn)練之前就一次性給定好,然后在訓(xùn)練過程中不需要再重新調(diào)整,只需要求解出輸出權(quán)值最小化即可,而這個求解輸出權(quán)值最小化可以通過求解廣義逆矩陣來一次性完成。
極限學(xué)習(xí)機每個結(jié)點的隱含層輸出為
4 實驗分析
實驗數(shù)據(jù)的選擇:本文的實驗在ORL人臉庫上進(jìn)行,ORL人臉庫由劍橋大學(xué)提供,里有40個人,每個人都有10張表情,姿態(tài),光照各異的人臉圖片。
不同維度的特征對識別的效果有所影響,在圖1中給出了不同的特征維度下人臉識別效果的變化曲線,為了便于對比識別算法統(tǒng)一采用ELM分類器,所有曲線都現(xiàn)實了l到200維的識別效果,從圖1可以看出特征壓縮到40維時取得較好的效果。
在表1中給出了文本算法和一些常見的其它算法的分類精度對比。
在表中可以看出本文的算法有最佳的精度,且訓(xùn)練所消耗的時間最短具有極大的優(yōu)勢。
5 結(jié)論
本文主要研究基于gabor特征、主成分分析和極限學(xué)習(xí)機算法的人臉識別,并且和神經(jīng)網(wǎng)絡(luò)的人臉識別進(jìn)行性能分析對比,實驗結(jié)果表明本文的算法有一定的優(yōu)越性。
參考文獻(xiàn)
[1]王盾,袁杰,復(fù)雜環(huán)境下的人臉識別研究[J].自動化應(yīng)用,2017 (11):75-78.
[2]蔡競,王萬良,鄭建煒,李吉明,增量式鑒別非負(fù)矩陣分解算法及其在人臉識別中的應(yīng)用[J],圖學(xué)學(xué)報,2017,38 (05): 715- 721.
[3]Huang G B,Zhu Q Y,Siew C K.Extreme learning machine:a newlearning scheme of feedforwardneural networks[J].Neurocomputing, 2004,2 (02): 985-990.
[4]章毓晉等編著,基于子空間的人臉識別[M].北京:清華大學(xué)出版社,2009.