林智鵬 簡(jiǎn)彩仁 周書偉
摘 要:人臉識(shí)別技術(shù)得到了廣泛研究與開發(fā)應(yīng)用,人臉識(shí)別問(wèn)題已成為模式識(shí)別和圖像處理中最熱門的研究主題之一。文中提出正則跡范數(shù)人臉識(shí)別法:利用正則跡范數(shù)改進(jìn)基于表示理論的分類法。該方法通過(guò)正則跡范數(shù)平衡L1范數(shù)的稀疏性質(zhì)和L2范數(shù)的聚集性。在4個(gè)公開人臉識(shí)別數(shù)據(jù)集上的實(shí)驗(yàn)表明,該方法可以較好地提高人臉識(shí)別準(zhǔn)確率。
關(guān)鍵詞:人臉識(shí)別;跡范數(shù);分類;稀疏;聚集;圖像處理
中圖分類號(hào):TP311;TP371文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):2095-1302(2019)07-00-03
0 引 言
由于人臉的自然特性,人臉識(shí)別(Face Recognition)已經(jīng)成為身份認(rèn)證的重要生物特征技術(shù),在軍事、國(guó)防、公安和日常生活等領(lǐng)域得到了廣泛應(yīng)用。隨著大數(shù)據(jù)及計(jì)算機(jī)技術(shù)的迅速發(fā)展,人臉自動(dòng)識(shí)別技術(shù)得到了廣泛研究與開發(fā),人臉識(shí)別成為近30年模式識(shí)別和圖像處理中最熱門的研究主題之一。人臉識(shí)別的目的是從人臉圖像中抽取人的個(gè)性化特征,并以此來(lái)識(shí)別人的身份,在20世紀(jì)90年代初,人臉識(shí)別的研究隨著特征臉?lè)椒ǖ囊攵餍衅饋?lái)[1],人臉識(shí)別研究已經(jīng)引起了科研人員的濃厚興趣,提出了諸多識(shí)別方法,并取得了較大成功[2-4],但由于人臉采樣環(huán)境的復(fù)雜性,如圖像質(zhì)量不清晰、人臉表情、面部遮擋等,使得研究具有魯棒性能的人臉識(shí)別方法仍然具有重要的意義。
許多基于經(jīng)典的分類方法在研究人臉識(shí)別問(wèn)題上存在局限性,比如k最近鄰分類法基于歐式距離的大小分類難以克服人臉圖像數(shù)據(jù)集高維數(shù)和非線性等困難;支持向量機(jī)是一種經(jīng)典的分類方法,但由于需要訓(xùn)練分類器,容易造成過(guò)擬合問(wèn)題。伴隨著模式識(shí)別技術(shù)的不斷發(fā)展,許多基于流形學(xué)習(xí)和稀疏表示的分類方法被提出,并且被廣泛應(yīng)用于人臉識(shí)別研究中。以稀疏表示分類法為代表的基于表示理論的分類方法[5-7],利用訓(xùn)練樣本表示測(cè)試樣本,充分考慮了所有樣本對(duì)分類的影響,可以在一定程度上克服人臉圖像數(shù)據(jù)的高維數(shù)和非線性等困難,不僅如此,基于表示理論的分類方法無(wú)需訓(xùn)練分類器,可以避免傳統(tǒng)分類方法的過(guò)擬合問(wèn)題,因此基于表示理論的分類方法在人臉識(shí)別、腫瘤識(shí)別等方面的研究中得到了廣泛應(yīng)用。稀疏表示分類法(SRC)[5]、最小二乘回歸分類法(LSRC)[6]以及非負(fù)最小二乘回歸分類法(NNLS)[7]等都是基于表示理論的分類法,它們的區(qū)別在于正則懲罰項(xiàng)或約束條件的不同:稀疏表示分類法(SRC)利用L1范數(shù)的稀疏性質(zhì)構(gòu)建分類器,最小二乘回歸分類法(LSRC)利用L2范數(shù)的聚集性構(gòu)建分類器,非負(fù)最小二乘回歸分類法(NNLS)利用表示系數(shù)的非負(fù)限制構(gòu)建分類器。
本文研究了基于表示理論的人臉識(shí)別方法,借鑒文獻(xiàn)[8-9],跡范數(shù)可以同時(shí)保持L1范數(shù)的稀疏性質(zhì)和L2范數(shù)的聚集性優(yōu)點(diǎn)?;谯E范數(shù)的人臉識(shí)別方法通過(guò)正則跡范數(shù)保持表示系數(shù)的稀疏性和聚集性。
1 相關(guān)研究
基于稀疏表示、最小二乘回歸和最近鄰子空間準(zhǔn)則提出了基于正則跡范數(shù)的分類法。
1.1 最小二乘回歸
假設(shè)y是未知類別標(biāo)簽的人臉圖像樣本,X是已知類別標(biāo)簽的人臉圖像樣本訓(xùn)練集,有n個(gè)訓(xùn)練樣本,m個(gè)圖像屬性,其中mn,用已知類別標(biāo)簽的訓(xùn)練集表示未知類別標(biāo)簽的樣本。
式中xi為第i個(gè)訓(xùn)練樣本,由于mn,是一個(gè)超定方程,因此求解該公式的精確解無(wú)意義,考慮如下最小二乘回歸
模型:
得到該模型的解析解:
1.2 稀疏表示
稀疏表示通常表示為如下求解稀疏系數(shù)w的問(wèn)題:
式中||w||0是向量w的L0范數(shù),表示向量w非零元素的數(shù)量。求解該問(wèn)題較難,因此可將問(wèn)題轉(zhuǎn)化為求解L1的問(wèn)題:
式中||w||1是向量w的L1范數(shù),即向量w非零元素絕對(duì)值的和,可以擴(kuò)展為允許有噪聲的模型:
式中λ>0,是正則參數(shù),Kim等人給出了一種快速計(jì)算稀疏表示模型的方法[10]。
1.3 最近鄰子空間準(zhǔn)則
最近鄰子空間準(zhǔn)則[1]通過(guò)分類重構(gòu)測(cè)試樣本的方法對(duì)測(cè)試樣本進(jìn)行分類。假設(shè)人臉圖像數(shù)據(jù)集有K個(gè)類別{l1,l2,…,lK},對(duì)一個(gè)人臉圖像數(shù)據(jù)樣本y求解系數(shù)向量w,對(duì)每一個(gè)類計(jì)算如下的度量余量:
式中δk(w):Rn→Rn,計(jì)算得到類lk的系數(shù),其第j個(gè)元素定義為:
樣本y所屬的類:
2 基于正則跡范數(shù)的識(shí)別方法
稀疏表示分類法利用L1范數(shù)保持表示系數(shù)的稀疏性,最小二乘回歸分類法利用L2范數(shù)保持表示系數(shù)的聚集性,本文利用跡范數(shù)保持表示系數(shù)的稀疏性和聚集性。
2.1 正則跡范數(shù)模型
為了平衡L1范數(shù)和L2范數(shù),文獻(xiàn)[8]提出了跡范數(shù)Ω(w)=||XDiag(w)||*,不同于其他范數(shù),跡范數(shù)包含數(shù)據(jù)集X,可以自適應(yīng)保持?jǐn)?shù)據(jù)集的相關(guān)性,從而更好地保持?jǐn)?shù)據(jù)的相關(guān)信息。XDiag(w)可以分解為:
文獻(xiàn)[8]指出,||w||2≤||XDiag(w)||*≤||w||1,因此,跡范數(shù)能同時(shí)保持表示系數(shù)的稀疏性和聚集性,將Ω(w)=||XDiag(w)||*作為正則項(xiàng),建立基于跡范數(shù)的識(shí)別方法:
2.2 模型求解
求解模型正則跡范數(shù)模型有許多方法[8-9],本文利用交替乘子方向法(Alternating Direction Method of Multipliers,ADMM)[11]求解正則跡范數(shù)問(wèn)題。
2.3 正則跡范數(shù)分類法
利用訓(xùn)練集X對(duì)每個(gè)測(cè)試樣本y求解表示系數(shù)w,然后用最近鄰子空間準(zhǔn)則對(duì)測(cè)試樣本y進(jìn)行分類,將這一過(guò)程歸納為基于正則跡范數(shù)的分類法(Trace Norm Regulation Classification Method,TNRC)。
算法二:正則跡范數(shù)分類法
輸入:訓(xùn)練集X,測(cè)試樣本y,訓(xùn)練樣本類別ltrain,正則參數(shù)λ,γ
輸出:測(cè)試樣本類別ltest
第一步:利用迭代方法求解表示系數(shù)w;
第二步:利用最近鄰子空間準(zhǔn)則測(cè)試樣本y分類,得到測(cè)試樣本類別ltest。
3 實(shí)驗(yàn)分析
本節(jié)通過(guò)實(shí)驗(yàn)驗(yàn)證了正則跡范數(shù)分類法(TNRC)可以提高人臉識(shí)別的準(zhǔn)確率,選用的對(duì)比方法包括經(jīng)典的稀疏表示分類法(SRC)和最小二乘回歸分類法(LSRC)、非負(fù)最小二乘回歸分類法(NNLSC)以及最近鄰分類法(KNN),主要對(duì)比方法的參數(shù)設(shè)置:稀疏表示分類法的正則參數(shù)和正則跡范數(shù)分類法的正則參數(shù)λ都設(shè)置為0.000 1。
實(shí)驗(yàn)數(shù)據(jù)集為四個(gè)常用的人臉圖像數(shù)據(jù)集,分別為FERET,ORL,PIE和Yale,它們的主要信息見(jiàn)表1所列。
3.1 主要實(shí)驗(yàn)結(jié)果對(duì)比
本節(jié)對(duì)比不同分類方法在不同交叉驗(yàn)證折數(shù)下的識(shí)別準(zhǔn)確率。表2所列為不同方法在不同交叉驗(yàn)證折數(shù)下的平均準(zhǔn)確率,并且通過(guò)圖1直觀給出了所有方法在不同交叉折數(shù)下的對(duì)比結(jié)果。
從表2的平均識(shí)別準(zhǔn)確率可以發(fā)現(xiàn),正則跡范數(shù)分類法的平均準(zhǔn)確率最高,因此本文提出的方法適合人臉圖像的識(shí)別。不僅如此,從圖1的實(shí)驗(yàn)結(jié)果不難發(fā)現(xiàn),正則跡范數(shù)分類法(TNRC)取得了較好的聚類準(zhǔn)確率,說(shuō)明Ω(w)=||XDiag(w)||*很好地保持了稀疏表示分類法的稀疏性和最小二乘回歸分類法的聚集性。不難發(fā)現(xiàn),最近鄰分類法(KNN)的識(shí)別準(zhǔn)確率明顯低于其他方法,反映了傳統(tǒng)分類方法不適合人臉圖像數(shù)據(jù)高維數(shù)非線性的特點(diǎn)。
3.2 參數(shù)討論
本節(jié)研究正則跡范數(shù)分類法(TNRC)的正則參數(shù)λ對(duì)人臉識(shí)別準(zhǔn)確率的影響。
從圖2的實(shí)驗(yàn)結(jié)果不難發(fā)現(xiàn),較小的正則參數(shù)可以得到更準(zhǔn)確的識(shí)別準(zhǔn)確率。當(dāng)λ=1時(shí),識(shí)別準(zhǔn)確率明顯下降,因此,在用正則跡范數(shù)分類法進(jìn)行人臉識(shí)別時(shí),可以設(shè)置較小的正則參數(shù),以提高識(shí)別準(zhǔn)確率與正則跡范數(shù)分類法的實(shí)用性。
4 結(jié) 語(yǔ)
本文利用跡范數(shù)理論提出了正則跡范數(shù)分類法,并用該方法研究了人臉識(shí)別問(wèn)題。正則跡范數(shù)分類法通過(guò)正則跡范數(shù)達(dá)到保持表示系數(shù)的稀疏性和聚集性,提高表示系數(shù)的表示能力,從而提高識(shí)別準(zhǔn)確率。在四個(gè)人臉圖像數(shù)據(jù)集上的實(shí)驗(yàn)表明了該方法的有效性,但由于該方法利用交替乘子方向法(ADMM)求解,需要較大的時(shí)間開銷,因此研究正則跡范數(shù)模型的快速求解將是一個(gè)不錯(cuò)的課題。
參 考 文 獻(xiàn)
[1] TURK M,PENTLAND A. Eigenfaces for recognition [J]. Journal of cognitive neuroscience,1991,3(1):71-86.
[2] TOLBA A S,ELBAZ A H,ELHARBY A.Face recognition:a literature review [J]. International journal of signal processing,2008,2(1):88-103.
[3]潘周嫻,陳適,潘慧,等.人臉識(shí)別技術(shù)的醫(yī)學(xué)診斷應(yīng)用的發(fā)展與現(xiàn)狀[J].基礎(chǔ)醫(yī)學(xué)與臨床,2016,36(12):1747-1750.
[4] GAO Y,MA J,YUILLE A L. Semi-supervised sparse representation based classification for face recognition with insufficient labeled samples [J]. IEEE transactions on image processing,2017,26(5):2545-2560.
[5] WRIGHT J,YANG A Y,GANESH A,et al. Robust face recognition via sparse representation [J]. Pattern analysis and machine intelligence,2009,31(2): 210-227.
[6] CHEN X,JIAN C. A tumor classification model using least square regression[C]// International Conference on Natural Computation. IEEE,2014:753-758.
[7] LI Y,NGOM A. Classification approach based on non-negative least squares[J]. Neurocomputing,2013,118(11):41-57.
[8] OBOZINSKI G,BACH F. Trace Lasso: A Trace Norm Regularization for Correlated Designs [C]// International Conference on Neural Information Processing Systems. Curran Associates Inc. 2011:2187-2195.
[9] LU C,F(xiàn)ENG J,LIN Z,et al. Correlation adaptive subspace segmentation by trace lasso[C]// IEEE International Conference on Computer Vision. IEEE,2014:1345-1352.
[10] KIM S J,KOH K,LUSTIG M,et al. An interior-point method for large-scale l1-regularized least squares[J].IEEE journal of? selected topics in signal processing,2007,8(8): 1515-1559.
[11] BOYD S,PARIKH N,CHU E,et al. Distributed optimization and statistical learning via the alternating direction method of multipliers[J].Foundations & trends in machine learning,2011,3(1):1-122.