路 翀 , 劉曉東 , 劉萬泉
(1.大連理工大學 電信學部,遼寧 大連 116024;2.澳大利亞科庭大學 西澳 佩斯市 6102;3.伊犁師范學院 新疆 伊寧 835000)
人臉識別技術在國內外許多領域得到了廣泛應用[1],研究者們?yōu)樘岣咦R別率提出了許多人臉識別方法。文獻[2-3]綜述了近幾年人臉識別的主要方法和進展。人臉識別中的一個關鍵問題是特征選擇,其基本任務是從許多特征中找出最有效的特征。人臉圖像數據量一般十分龐大,直接用于識別效率不高,因此必須對原始圖像進行有效降維。2DDCT是常用的圖像壓縮方法,其本質是通過2DDCT對圖像進行變換,用較少的數據表示較多的信息,實現(xiàn)圖像壓縮,以達到減少數據存儲量提高傳輸速率的目的。2DDCT既能有效地降低特征維數,又可以保留對光照、表情以及姿態(tài)不敏感的類別信息,許多研究人員嘗試著將2DDCT應用到圖像特征降維。文獻[4]詳細闡述了基于DCT的人臉表征,文獻[5]提出了一種M2DPCA和NFA相結合的人臉識別方法。
在模式識別中,壓縮感知(Compressive Sensing,or Compressed Sampling,簡稱 CS)[6],是近幾年流行起來的一個介于數學和信息科學的新方向,由Candes、Terres Tao等人提出,挑戰(zhàn)傳統(tǒng)的采樣編碼技術,即Nyquist采樣定理,CS理論是基于信號“信息”的一種采樣技術,是對信號更為本質的描述。目前,該理論是一個快速發(fā)展的領域,在許多基礎的信號和圖像處理中取得了很好的效果[7],在信號處理、圖像識別等領域也有廣泛的研究[8-9]。由于在圖像識別過程中,運用CS理論需要預先將人臉圖像矩陣展開成一維的向量,轉換后的一維向量的維數一般較高,因此,對很多分辨率較高人臉圖像都要預先做裁剪。而2DDCT能夠有效地濾掉圖像中不敏感的中頻和高頻部分,保留信息的本質內容。
鑒于此,提出將二維離散余弦變換與壓縮感知相結合用于人臉識別。首先對原始人臉圖像實施2DDCT變換,接著進行壓縮,濾掉圖像中不敏感的中頻和高頻部分后,在頻域中用壓縮感知算法提取人臉特征,將提取的人臉識別特征用最近鄰分類器完成識別,在ORL、Yale、YaleB及Feret人臉數據庫上得到了較好的識別效果,且能減少整體識別時間。
人臉圖像數據包含較大的冗余信息,需要進行降維處理;首先將人臉圖像實施2DDCT,經過2DDCT后能量主要集中在低頻系數上,適當地提取2DDCT系數也就達到了降維的目的。然后在頻域中應用CS進行特征提取,將提取的人臉識別特征利用最近鄰分類器完成識別。
人臉圖像數據是高度相關的,存在很大的冗余性。圖像經過2DDCT變換后,其低頻分量集中在左上角,高頻分量分布在右下角。低頻分量包含了圖像的主要信息,與之相比高頻分量就顯得不那么重要了,所以可以忽略高頻分量,從而達到壓縮的目的。圖像經過2DDCT變換后,只需用少量的數據點即可表示圖像。2DDCT系數很容易被量化,因此能獲得較好的塊壓縮,同時具有快速算法,因此在人臉識別中容易實現(xiàn)。
離散余弦變換是一種常用的圖像數據壓縮方法,它的壓縮質量接近于信息壓縮的最優(yōu)變換(變K-L換)。 對于一幅M×N 的數字圖像 f(x,y),離散余弦變換的特點是:頻域變化因子 u,v較大時,DCT 系數 C(u,v)的值很??; 而數值較大的C(u,v)主要分布在u,v較小的左上角區(qū)域,這也是有用信息的集中區(qū)域?;?DDCT系數重建圖像時,保留少數離散余弦變換的低頻分量,而舍去大部分高頻分量,利用反變換仍可獲得與原始圖像相近的恢復圖像。
壓縮感知的數學描述是:
對給定的 T, 稀疏信號 x∈Rn在數據字典 Ψ=[Ψ1,Ψ2,…Ψk]∈Rn×k,(n<k)上可以表示為 x=Ψα,α∈Rk且‖α‖0<T< 設 Ω=ΦΨ∈Rp×k,(p< 由于p< 求得α^后,重構信號可以用x^=Ψα^表示。 在稀疏分解算法的設計方面,已經有許多好的算法[8],如基于貪婪迭代思想的MP(Matching Pursuit),正交最小二乘OLS(Orthogonal Least Squares)等算法以及與之相關的改進算法,本文采用的是正交最小二乘算法OLS。 在壓縮感知人臉識別中,用所有的訓練樣本構造字典矩陣 Ψ=[A1,A2,…AC]∈Rn×N,這里訓練樣本是一個 n 維向量,N是訓練樣本總數;A1是包含第i類所有訓練樣本的矩陣。將一個人臉 x表示為 x=Ψα,(‖α‖0<T)投映矩陣 Φ 有滿足高斯獨立分布的隨機矩陣產生并按列標準化,測量矩陣Y在訓練階段產生,Y=ΦΨ∈Rp×N。給定一個測試樣本x,計算投映樣本y=Φx,然后,用 OLS 算法尋找稀疏向量α^,使其滿足 Yα=y;最后,用基于α^計算在每個類上的重構誤差來確定測試樣本x屬于哪個類。 文章提出的算法是基于2DDCT特征提取和降維特性,由于在頻域中經過2DDCT變換的圖像能夠比原本在時域中更有效降低光照和側轉等因素影響,所以,先用2DDCT將人臉矩陣投映到頻域后,取右上角w×w塊作為頻域中的“人臉”,然后運用CS做人臉識別,亦即是為了去除噪音先用2DDCT進行過濾,然后在頻域中取左上角較小塊做“人臉”,運用CS做人臉識別,這樣能夠有效降低計算復雜度,提高識別效率。 算法步驟如下: 1)輸入c類N個訓練樣本,用2DDCT將其投映到頻域空間,在頻域中取右上角w×w作為頻域中的訓練樣本,構成字典矩陣 Ψ=[A1,A2,…AC]∈Rn×N。 2)產生按列標準化的隨機投映矩陣Φ∈Rp×n。 3)給定一個測試圖像,將其用2DDCT投映到頻域空間,得到頻域中的測試圖像x。 4)在頻域空間計算 Yi=ΦAi,(i=1,…C)并計算測量矩陣Y=[Y1,Y2,…YC]=ΦΨ∈Rp×N 將文章提出的方法先在ORL人臉庫上進行測試。該人臉庫包含40個人,每個人有10幅圖像。圖像為單一深色背景的正面圖像,包含了一定的光照、表情、面部細節(jié)變化以及一定范圍內的深度旋轉。圖像大小均為112×92像素。實驗中對每個人,隨機選取 4、5、6幅圖像作為訓練樣本,其余的 6、5、4幅圖像分別用來做測試。首先運用CS方法,取特征向量維數feature=150進行識別,記作CS方法;然后將所有人臉圖像用2DDCT變換投映到頻域,在頻域中取能量集中的低頻部分64×64,分別運用 2DDCT 和 CS 方法識別(取 feature=82),分別記作2DDCT和2DDCT_CS方法,實驗結果為5次平均值,識別率比較見表1;每類用5個作為訓練樣本,5次識別運行平均時間(CPU:2 duo cpu 2.13 GHz, RAM:2.0 GB)比較見表 2。 從表1中可以看出,文章提出的2DDCT_CS方法比CS方法的識別率略高,比 2DDCT方法有明顯提高,在訓練樣本n=6時,2DDCT方法和2DDCT_CS方法識別率幾乎相同,訓練樣本到一定數量識別率不在有大的區(qū)別。 表1 3種方法在ORL上的識別率(%)比較Tab.1 Recognition accuracy(%)in ORL database 表2 3種方法在ORL上識別的運行時間(秒)比較Tab.2 Computation Cost in ORL database (s) 從表 2中可以看出,DCT耗費時間最多,CS次之,2DDCT_CS方法最小,CS與2DDCT_CS方法相近,由于CS,2DDCT_CS方法在識別前都進行了較大的降維處理,而2DDCT_CS方法進行了兩次降維,所以,用時最少,當訓練樣本較少時含有較多的信息量,識別率較高。 另外兩組在Yale和Feret人臉庫上做實驗,Yale數據庫包含了15個人的不同條件下的圖像,數據庫中每個人各有11種不同光照、表情、姿態(tài),是否戴眼鏡等條件下的成像圖像,圖像總量為165張。這些圖像大小均為231×195像素,為做CS實驗方便,將原圖像按中心對稱裁剪為100×80像素。在Feret人臉庫中包含不同表情,不同距離,不同時間,面部變化、旋轉等人臉圖像,將個體不少于10幅圖像共49人選出(超過10幅取前10幅),按給定的人眼和鼻子位置將原來640×480的圖像裁剪到112×92實驗。與在ORL數據庫類似,比較各自最高識別率及其所取的特征向量維數,見表3和表4。 表3 3種方法在Yale上的識別率(%)比較Tab.3 Comparison the recognition rates(%)of tree approaches under the Yale database 表4 3種方法在Feret上的識別率(%)比較Tab.4 Comparison the recognition rates(%)of tree approaches under the Feret database 從表3和表4中可以看出,文章提出的2DDCT_CS方法比CS、2DDCT的識別率都有一定的提高。 對于以上實驗,在像素較大的圖像運用CS方法時都必須先進行裁剪,得到像素較小的圖像后才能方便使用CS方法,而筆者提出的2DDCT_CS方法可以不進行裁剪處理。因此,最后一個實驗直接應用2DDCT_CS方法在典型人臉數據庫YaleB作為實驗,YaleB數據庫包含了10個人的不同條件下、不同表情、不同背景和不同姿態(tài)下的圖像。數據庫中每個人各有64種不同光照、姿態(tài)等條件下的成像圖像,圖像總量為640張。這些圖像大小均為640×480像素。實驗中對每個人,5次隨機選取5、10、15幅圖像作為訓練樣本,其余每人的59、54、49幅圖像分別用來做測試識別方法的性能。首先將所有人臉圖像用2DDCT變換投映到頻域,在頻域中分別取能量集中的低頻部分 80×80,然后分別運用 2DDCT和2DDCT_CS方法識別,實驗結果為5次平均值 (小括號中為2DDCT_CS在頻域中所取的特征值)。實驗結果見表5: 表5 兩種方法在YaleB上的識別率(%)Tab.5 Comparison the recognition rates(%)of two approaches on ORL database 從表5中可以看出,文章提出的2DDCT_CS方法比2DDCT方法的識別率有顯著提高,當訓練樣本n達到15時,識別率可達100%,且不需要對圖像進行裁剪,這說明該算法的有效性和魯棒性。 2DDCT既能有效地降低特征維數,又可以保留對光照、表情以及姿態(tài)不敏感的類別信息。 文章結合2DDCT和CS的優(yōu)點提出了一種2DDCT_CS人臉識別方法,無論是對高維問題還是大樣本集問題都可進行有效地特征抽取,提高正確識別率,特別是在YaleB人臉數據庫運用該方法得到了很好的實驗結果。此外,在對CS方法以及在2DDCT變換頻域塊的取值和經過2DDCT變換后,對不同的人臉數據庫中的特征值應如何設置才能更好地提高識別效率,仍需進一步研究。 [1]Kwak K C,Pedrycz W.Face recognition using an enhanced independent component analysis approach [J].IEEE Trans.Neural Networks (S1045-9227), 2007, 18(2):530-541. [2]Fmatos F,Batista L V,Poel J D.Face recognition using DCT coefficients election [C]//Proceedings of the 2008 ACM Symposium on Applied Computing.Fortaleza:Brazl,2008:1753-1757. [3]Bengherabi M,Mezai L,Harizi F.2DPCA based techniques in DCT domain for face recognition[J].Int.J.Intelligent Systems Technologies and Applications,2009,7(3):243-264. [4]梁淑芬,甘俊英.基于局部小波變換與DCT的人臉識別算法[J].微計算機信息,2006,22(2):206.LIANG Shu-fen,GAN Jun-ying.Face recognition based on local wavelet transform and discrete cosine transform[J].Microcomputer Information,2006,22(2):206. [5]陳勝.一種M2DPCA和NFA相結合的人臉識別方法[J].電子設計工程,2011,19(13):163-165.CHEN Sheng.A facerecognition algorithm based on combination of modular 2DPCA and NFA[J].Electronic Design Engineering,2011,19(13):163-165. [6]Candes E J,Tao T. “Near-optimal signal recovery from random projections: Universal encoding strategies?”[J]. IEEE Transactions on Information Theory,2006,52 (12):5406-5425. [7]Michael Elad.Optimized projections for compressed sensing[J].IEEE Transactions on Signal Processing,2007,55 (12):5695-5702. [8]張宗念 ,黃仁泰 ,閆敬文.壓縮感知信號盲稀疏度重構算法[J].電子學報,2011,39(1):18-22.ZHANG Zong-nian,HUANG Ren-tai,YAN Jing-wen.A blind sparsity reconstruction algorithm for compressed sensing signal[J].Acta Electronica Sinica,2011,39(1):18-22. [9]Nhat Vo,Duc Vo,Subhash Challa,et al.Compressed Sensing for Face Recognition [C]//Computational Intelligence for Image Processing,2009:104-109.1.3 基于壓縮感知的人臉識別(CSFR)
1.4 基于2DDCT的壓縮感知算法
2 試驗結果與分析
3 結束語