聶祥飛,楊志軍,何 雪
(重慶三峽學院 電子與信息工程學院,重慶 404000)
?
利用離散余弦變換與梯度臉的人臉光照處理*
聶祥飛,楊志軍,何 雪
(重慶三峽學院 電子與信息工程學院,重慶 404000)
針對光照變化對人臉識別效果帶來的嚴重影響,提出了一種基于離散余弦變換和梯度臉的人臉光照處理方法。該方法首先將人臉圖像變換到對數(shù)域,在對數(shù)域中計算離散余弦變換,舍棄部分低頻系數(shù),再計算其離散余弦反變換。然后用梯度臉(Gradientfaces)算法對人臉圖像的高頻細節(jié)成分進行增強。在人臉識別階段,采用主成分分析法提取人臉特征,運用基于余弦距離的最近鄰分類器進行分類判別。在Yale B正面人臉庫和CUM PIE人臉庫上進行實驗,實驗結果表明該方法可以削弱人臉光照的影響,適用于光照魯棒的人臉識別,合理地選擇相關參數(shù),人臉識別率分別能夠達到100%和96.25%。
離散余弦變換;梯度臉;人臉光照處理;人臉識別
在人臉識別中,因為相同人臉在不同光照條件下的差異大于不同人臉在相同光照條件下的差異,所以光照問題一直是人臉識別中面臨的主要挑戰(zhàn)之一[1]。一般情況下,解決人臉識別中光照問題的方法主要分為三類:提取光照不變特征、光照變化的建模、光照條件標準化等[2]。
(1)提取光照不變特征。其基本思想是提取人臉圖像中不隨光照變化或至少對光照變化不敏感的特征。如商圖像、去噪模型、自商圖像法[3]等。ELDP[4]等提出一種對光照具有不變性的算法,該算法使8方向的圖像邊緣信號生成光照不敏感特征,取得了很好的識別效果。Zhang[5]等提出梯度臉算法,該算法考慮相鄰像素間的潛在聯(lián)系,在梯度域中提取了光照不變特征,但該方法沒有進行降維處理,因此計算量大,計算復雜。
(2)光照變化的建模。其主要思想是在一個合適的子空間或流形中表示光照引起的變化,然后對人臉的特征估計模型參數(shù)。如主成分分析(PCA)[6]、線性判別分析(LDA)[7]、子空間投影法[8]、光照錐法[9]和基于球面諧波基圖像的方法[10]等。這類方法需要大量不同光照條件下的人臉圖像作為訓練樣本,因此在實際應用中受到一定的限制。
(3)光照條件標準化。該方法是對人臉圖像作預處理操作,規(guī)范化為標準形式,獲取魯棒的光照人臉圖像,如經典的直方圖均衡法[11]、伽瑪矯正、同態(tài)濾波、對數(shù)變換等。Chen[12]等提出的離散余弦變換算法,在對數(shù)域中對人臉圖像進行離散余弦變換,舍棄部分低頻系數(shù),對重建后的人臉圖像進行識別,但該算法沒有考慮圖像的高頻成分。光照條件標準化的方法對光照引起的人臉變換具有一定的補償作用,但是識別效果增強不明顯。
在本文中,人臉光照處理的框圖如圖1所示。首先,將人臉圖像變換到對數(shù)域,在對數(shù)域中,對輸入人臉圖像作離散余弦變換[13],舍棄部分低頻系數(shù),然后作離散余弦反變換。當完成人臉圖像歸一化后,利用梯度臉[5]對人臉圖像的高頻細節(jié)部分進行增強并提取光照不變的人臉特征。本文方法綜合考慮了人臉圖像的高頻成分和低頻部分,不僅舍棄了部分的光照分量,同時也對反射分量進行了一定的增強。由于光照處理的目的是為了提高人臉識別率,因此其處理的有效性通過人臉識別率來表征。
圖1 人臉光照處理框圖
1.1 人臉圖像的對數(shù)變換
根據(jù)光照模型,任意灰度人臉圖像I(x,y)可以看成是反射分量和光照分量的乘積[14]:
I(x,y)=R(x,y)L(x,y)
(1)
其中,R(x,y)即低頻,對應圖像的快變化部分,L(x,y)即高頻,對應圖像的慢變化部分。對式(1)兩邊取對數(shù),得:
lnI(x,y)=lnR(x,y)+lnL(x,y)
(2)
從式(1)和式(2)可以看出,在空間域中原圖像的反射分量和光照分量是相乘的關系,而在對數(shù)域中卻變成了相加的關系。因此人臉圖像在對數(shù)域中進行光照處理就是削弱光照分量對應的低頻部分,其處理效果等同于高通濾波。
1.2 梯度臉算法
梯度臉[5]算法的主要思想如下:
對于灰度圖像I(x,y),像素點(x,y)在x方向的鄰域點為(x+Δx,y),則有:
I(x+Δx,y)=R(x+Δx,y)L(x+Δx,y)
(3)
式(3)-式(1)得:
I(x+Δx,y)-I(x,y)=R(x+Δx,y)L(x+Δx,y)-
R(x,y)L(x,y)
(4)
由于L近似光滑且變化緩慢,則有:
I(x+Δx,y)-I(x,y)≈(R(x+Δx,y)-R(x,y))L(x,y)
(5)
當Δx趨于0時,式(5)取極限有:
(6)
同理在圖像的y方向有:
(7)
式(7)除以式(6)得:
(8)
其中Iy為人臉圖像在y方向上的梯度?I(x,y)/?y,Ix為人臉圖像在x方向上的梯度?I(x,y)/?x,Ry為人臉圖像反射分量在y方向上的梯度,Rx為人臉圖像反射分量在x方向上的梯度。根據(jù)假設理論,R是光照不變分量,因此Iy與Ix的比值也是光照不變的。
圖像的梯度臉定義如下:
G=arctan(Iy/Ix)
(9)
其中G∈[π,-π]。實際應用中,為了計算梯度臉,首先需要計算人臉圖像在x方向、y方向的梯度值,為了能夠成功地計算梯度值,首先需要用高斯核函數(shù)光滑人臉圖像,即人臉圖像與高斯核函數(shù)卷積后再分別計算x方向和y方向的梯度。高斯核函數(shù)的表達式為:
(10)
其中σ為高斯核函數(shù)的標準差。
2.1 人臉圖像的對數(shù)變換
本文采用Yale B人臉庫和CUM PIE人臉庫進行實驗。Yale B人臉數(shù)據(jù)庫共包含10個人的9種不同姿態(tài),每種姿態(tài)又包含64種不同的光照。因為本文只研究光照處理問題,所以只選擇使用正面姿態(tài)下不同光照的人臉圖像作為實驗樣本。實驗時,人臉圖像的尺寸是128×128,且將所有圖像按照入射光的不同角度分為5個子集。子集1共包含70個樣本,其角度小于12°。子集2共包含120個樣本,其角度位于13~25°之間。子集3共包含120個樣本,其角度位于26~50°之間。子集4共包含140個樣本,其角度位于51~77°之間。子集5共包含190個樣本,其角度大于77°。CUM PIE人臉數(shù)據(jù)庫共包含68個人的41 368個人臉圖像,本文算法主要解決的是光照問題,因此選擇正面人臉光照組(C27)作為訓練圖庫。該光照組共有1 428個人臉庫,所有圖片均裁剪為64×64大小。
2.2 參數(shù)的選擇
實驗時,對式(10)中高斯核函數(shù)σ參數(shù)和離散余弦變換后舍棄的低頻系數(shù)個數(shù)的不同取值進行了實驗。在Yale B人臉庫中實驗時,通過挑選,最終確定高斯核函數(shù)σ參數(shù)為0.57和DCT舍棄的低頻系數(shù)個數(shù)為19時獲得最好的人臉識別率。在CUM PIE人臉庫中實驗,通過挑選,單獨使用DCT變換時,DCT舍棄系數(shù)個數(shù)為19時獲得最好的識別效果,單獨使用梯度臉算法時,高斯核函數(shù)σ參數(shù)為 0.55時獲得最好的識別效果。
人臉圖像經過光照處理后,規(guī)范化其均值和方差分別為0和1,運用主成分分析法提取人臉特征時,其特征向量數(shù)為50。
2.3 實驗結果
在Yale B正面人臉庫中的實驗結果如圖2所示。圖2中顯示的是人臉圖像光照處理后的效果對比圖,其中第一行是原圖,第二行是經離散余弦變換處理后的人臉圖像,第三行是經本文方法處理后的人臉圖像。從圖2可以看出,經本文所提方法光照處理后的人臉圖像,可以削弱不同角度的光照對人臉圖像的影響,對光照具有一定的魯棒性。
圖2 Yale B人臉光照處理結果
在Yale B人臉庫上的實驗結果如表1所示,表1中列出了現(xiàn)有部分人臉光照處理算法處理后的人臉錯誤識別率,其中以Yale B正面人臉庫的子集1作為訓練集,其他子集作為測試集,且表中DCT算法與梯度臉算法的實驗條件與本文方法的實驗條件一致。從表1可以看出,DCT算法的最小平均錯誤識別率為1.58%,梯度臉算法的最小平均錯誤識別率為0.70%,QI的平均錯誤識別率為45.35%,WBCT的平均錯誤識別率為2.26%,LBP的平均錯誤識別率為23.2%,本文算法的平均錯誤識別率為0。
表1 不同光照處理算法的結果對比
在Yale B人臉庫中的第二個實驗是分別采用不同的子集作為訓練集,其余子集作為測試集。當訓練集為子集1時,測試子集2、子集3、子集4、子集5的識別率均為100%。子集2作為訓練集時,子集1、子集3、子集4、子集5的識別率均為100%。子集3作為訓練集時,子集1、子集2、子集4、子集5的識別率均為100%。子集4作為訓練集時,子集1、子集2、子集3、子集5的識別率均為100%。子集5作為訓練樣本時,子集1、子集2、子集3、子集4的識別率均為100%。即以任一子集作為訓練集,其余子集樣本都能夠識別。
為了進一步驗證本算法的有效性,在CUM PIE數(shù)據(jù)庫上進行了實驗。實驗時,從每個樣本的21種光照中選取一個人臉圖像作為訓練集,其余人臉作為測試集。圖3中列出了部分人臉圖像以及與其相對應的本文方法處理后的人臉圖像。從圖中可以看出,經本文方法處理后的人臉圖像保留了重要的人臉特征,這些特征對人臉識別起著重要的作用。
圖3 部分CUM PIE 人臉圖像及相關本文方法處理后的人臉圖像
表2 不同算法的實驗對比結果
表2列出了參考文獻[5]的部分重要實驗結果和本文算法的實驗結果。其中DCT算法和梯度臉算法與本文實驗條件一致。
本文提出了一種基于離散余弦變換和梯度臉的人臉光照處理算法。該算法先將人臉圖像在對數(shù)域中做離散余弦變換,舍棄部分低頻系數(shù),然后用梯度臉算法增強人臉的高頻細節(jié)信息。提取人臉特征用的是主成分分析法,使用基于余弦距離的最近鄰分類器進行分類判別。實驗結果表明,本文所提方法光照處理后的人臉識別正確率,在Yale B人臉庫中可達到100%,在PIE人臉庫上為96.25%,可以有效削弱光照的影響。今后的主要工作是在更大型的人臉庫上對本算法進行測試。
[1] Tao Song, Ke Xiang, Wang Xuanyin. Face recognition under varying illumination based on gradientface and local features[J]. IEEJ Transactions on Electrical and Electronic Engineering, 2015, 10(2): 222-228.
[2] FARAJI M R, QI X. Face recognition under varying illumination based on adaptive homomorphic eight local directional patterns [J]. Iet Computer Vision, 2014, 9(3):390-399.
[3] WANG H T, LI S Z,WANG Y S, Face recognition under varying lighting conditions using self quotient image[C].Proc of IEEE International Conference on Automatic Face and Gesture Recognition, 2004:819-824.
[4] FARAJI M R, QI X. Face recognition under illumination variations based on eight local directional patterns[J]. Biometrics Iet, 2015, 4(1):10-17.
[5] ZHANG T P, TANG Y Y,FANG B , et al. Face recognition under varying illumination using gradientfaces[J]. IEEE Transactions on image processing, 2009, 18(11): 2599-2606.
[6] 周先春,孫文榮.基于自適應對數(shù)變換和PCA算法的人臉識別研究[J]. 電子技術應用,2014, 40(6):126-129.
[7] BELHUMEUR P N, HESPANHA J P, KRIEGMAN D J. Eigenfaces vs. fisherfaces: recognition using class specific linear projection [J]. IEEE Trans on Pattern Analysis and Machine Intelligence, 1997, 19(7):711-720.
[8] MANOLOVA A, TONCHEV K, BOUMBAROV O, et al. Recognition of facial images with subspace projection and dissimilarity representation [C]. IDAACS 2011: 6th International Conference on Intelligent Data Acquisition and Advanced Computing, IEEE,2011: 444-449.
[9] CHEN J, XIA C, YING H, et al. Using facial symmetry in the illumination cone based 3D face reconstruction [C]. IEEE International Conference on Image Processing, 2013: 3700-3704.
[10] ZHAO W Y, CHEN S L, ZHENG Y, et al. Lighting estimation of a convex lambertian object using redundant spherical harmonic frames[J]. Journal of Computer Science & Technology, 2013, 28(3):454-467.
[11] SHAN S, GAO W, CAO B, et al. Illumination normalization for robust face recognition against varying lighting conditions[C]. IEEE International Workshop on Analysis and Modeling of Faces and Gestures, 2003: 157-157.
[12] CHEN W, MENG JOO ER, WU S. Illumination compensation and normalization for robust face ercognition using discrete cosine transform in logarithm domain[J]. In IEEE Transactions on System,Man, and Cybernetics. Part B (Cybernetics) ,2006,36(2):458-466.
[13] VISHWAKARMA V P, PANDEY S, GUPTA M N. An illumination invariant accurate face recognition with down scaling of DCT coefficients[J]. Journal of Computing & Information Technology, 2010, 18(1): 53-67.
[14] SHAHAMAT H, POUYAN A A. Face recognition under large illumination variations using homomorphic filtering in spatial domain [J]. Journal of Visual Communication & Image Representation, 2014, 25(5):970-977.
[15] SHASHUA A, RILLIN-RAVIV T. The quotient image: class-based re-rendering and recognition with varying illuminations [J]. Pattern Analysis & Machine Intelligence IEEE Transactions on, 2001, 23(2):129-139.
[16] LONG B T, LE T H. Using wavelet-based contourlet transform illumination normalization for face recognition [J]. International Journal of Modern Education & Computer Science, 2015, 7(1):16-22.
[17] AHONEN T, HADID A, PIETKAINEN M. Face description with local binary patterns: application to face recognition[J]. IEEE Trans on Pattern Analysis & Machine Intelligence, 2006, 28(12):2037-2041.
Face illumination processing using discrete cosine transform and gradientfaces
Nie Xiangfei, Yang Zhijun, He Xue
(School of Electronics and Information Engineering, Chongqing Three Gorges University, Chongqing 404000, China)
Focus on the issue that the change of lighting has a serious impact on face recognition, a novel approach based on Discrete Cosine Transform (DCT) and gradientfaces for face illumination processing is proposed. Firstly, face images are transformed into logarithm domain in which DCT is calculated and some low-frequency coefficients are discarded. After that, inverse DCT is calculated. Then, the details of high frequency apart of face image are enhanced by gradientfaces arithmetic. In the process of face recognition, Principal Component Analysis (PCA) is used to extract face features, and the nearest neighbor classifier based on cosine distance is used to classify. Experiments have been carried out on Yale B face database and CUM PIE face database, the experimental results show that this method can weaken the effect of illumination and be suitable for illumination robust of face recognition. The recognition rate can reach to 100% and 96.25% respectively for choosing reasonable parameters.
Discrete Cosine Transform (DCT); gradientfaces; face illumination processing; face recognition
國家自然科學基金資助項目(61602072);重慶市教委科技項目(KJ121114);重慶高校創(chuàng)新團隊建設計劃資助項目(CXTDX201601034)
TN911.73
A
10.19358/j.issn.1674- 7720.2017.11.015
聶祥飛,楊志軍,何雪.利用離散余弦變換與梯度臉的人臉光照處理[J].微型機與應用,2017,36(11):50-53.
2017-01-15)
聶祥飛(1973-),男,博士,教授,碩士生導師,主要研究方向:智能信息處理,模式識別。
楊志軍(1991-),男,碩士研究生,主要研究方向:智能信息處理,模式識別。
何雪(1989-),女,碩士研究生,主要研究方向:智能信息處理,模式識別。