(西華大學(xué)電氣與電子信息學(xué)院,四川 成都 610039)
·計(jì)算機(jī)軟件理論、技術(shù)與應(yīng)用·
基于壓縮感知和圖像分塊的遮擋人臉識(shí)別
張 近,夏 凌*,李光瑞
(西華大學(xué)電氣與電子信息學(xué)院,四川 成都 610039)
針對(duì)基于壓縮感知的SRC算法對(duì)遮擋人臉識(shí)別效果不夠理想的問題,提出一種先將圖像分塊再進(jìn)行識(shí)別的方法。將遮擋分散在盡可能少的分塊中以降低遮擋對(duì)人臉識(shí)別的不利影響,從而提高識(shí)別率。在AR人臉數(shù)據(jù)庫上的實(shí)驗(yàn)結(jié)果表明,使用該方法的遮擋人臉識(shí)別率可超過80%,顯著高于基本SRC算法40%~50%的識(shí)別率。
遮擋人臉識(shí)別; 壓縮感知; 圖像分塊; SRC算法
人臉識(shí)別技術(shù)是將靜態(tài)圖像或視頻中檢測(cè)出的人臉圖像與數(shù)據(jù)庫中的人臉圖像進(jìn)行對(duì)比,并從中找出與之匹配的人臉的技術(shù),其目的是進(jìn)行身份的識(shí)別與鑒定。人臉識(shí)別技術(shù)以其方便、友好、非侵犯性等優(yōu)點(diǎn),被廣泛應(yīng)用于各種場(chǎng)合;但是,人臉識(shí)別技術(shù)依然存在光照、姿勢(shì)、遮擋等問題需要解決,其識(shí)別精度還遠(yuǎn)不及指紋等其他生物特征識(shí)別技術(shù)[1-4]。
壓縮感知(compressed sensing,CS)理論,是近幾年被提出的革命性理論[5]。其基本思想是如果信號(hào)在某個(gè)變換域是稀疏的,就可以用一個(gè)與變換矩陣不相關(guān)的測(cè)量矩陣將變換域的高維信號(hào)投射到低維空間中,得到壓縮后的信號(hào),然后再對(duì)這個(gè)壓縮信號(hào)求最優(yōu)解,就能夠基本無失真地重建出原始信號(hào)。壓縮感知理論已被應(yīng)用于信號(hào)處理和圖像處理等領(lǐng)域,并取得了豐富的應(yīng)用成果。壓縮感知同樣也被應(yīng)用于人臉識(shí)別,最典型的應(yīng)用是基于稀疏表示的分類算法[6](sparse representation-based classification,SRC)。
SRC算法在人臉識(shí)別上具有很多優(yōu)勢(shì),尤其是對(duì)噪聲有著很好的魯棒性,但對(duì)遮擋人臉的識(shí)別卻不夠理想。為改善這種情況,本文提出一種基于圖像分塊的SRC算法,并通過隨機(jī)遮擋人臉識(shí)別與固定遮擋人臉識(shí)別這2組實(shí)驗(yàn),驗(yàn)證其在不同情況下的有效性。
壓縮感知理論是Candes等在2004 年提出的[7-8]。他們證明了只要信號(hào)在某一個(gè)正交空間具有稀疏性,就能在低于奈奎斯特采樣頻率的條件下對(duì)信號(hào)進(jìn)行采樣,并且之后能以高概率重構(gòu)該信號(hào)[9-10]。
壓縮感知是一種在采樣的同時(shí)實(shí)現(xiàn)壓縮目的的理論[11],其流程圖如圖1所示。
圖1 壓縮感知流程圖
一般情況下,RN中長度為N的信號(hào)X,表示為
(1)
式中:Ψ為N×N的標(biāo)準(zhǔn)正交基;Θ是信號(hào)X在該正交基上展開的系數(shù)向量;ψi為正交基Ψ中的列向量;θi為N×1維系數(shù)向量Θ中的元素。如果系數(shù)向量Θ中僅有K個(gè)元素不為零,且K?N,則稱信號(hào)X在正交基Ψ下是K-稀疏(K-Sparse)的。
通過變換得到信號(hào)的稀疏系數(shù)向量Θ=ΨTX后,再通過一個(gè)觀測(cè)矩陣Φ(M×N),得到M(M Y=ΦΘ=ΦΨTX=ACSX。 (2) 式中:Y即為觀測(cè)向量;ACS稱為壓縮感知矩陣。若Y和Φ已知,要求Θ,由于M argmin‖Θ‖0s.t.Y=ΦΘ。 (3) 這個(gè)l0范數(shù)問題是一個(gè)NP完全問題,無法求解,不過壓縮感知理論證明,可以通過求解l1范數(shù)問題來求得相同的解,即 argmin‖Θ‖1s.t.Y=ΦΘ。 (4) 對(duì)于式(4),目前的求解算法有梯度投影法(GP)、基追蹤法(BP)、匹配追蹤法(MP)、正交匹配追蹤法(OMP)等[12]。 2.1 SRC算法 SRC算法是壓縮感知理論在人臉識(shí)別領(lǐng)域的一個(gè)典型應(yīng)用。該算法假設(shè)任何一張人臉圖像都可以用樣本圖像庫中同一個(gè)人的所有圖像的線性組合來表示,通過尋找測(cè)試圖像相對(duì)于整個(gè)樣本圖像庫的稀疏表示系數(shù)來判斷測(cè)試圖像的身份。與現(xiàn)有的很多分類算法不同,SRC算法直接利用高維數(shù)據(jù)分布的稀疏性進(jìn)行統(tǒng)計(jì)分析,可以有效地解決維數(shù)災(zāi)難(curse of dimensionality)問題[13-14]。 假設(shè)一個(gè)樣本集合含有m個(gè)人,每個(gè)人有n張人臉圖像,則樣本中一共有m×n張圖像。設(shè)這個(gè)樣本集合為X,X={x1,x2,…,xm},其中xi(i=1,2,…,m)表示第i個(gè)人的圖像集合,又xi={xi1,xi2,…,xin},xij是第i個(gè)人的第j張圖像,j=1,2,…,n。SRC算法的核心思想是對(duì)于一張屬于第i個(gè)人的測(cè)試圖像y,應(yīng)該能由樣本集合中所有屬于第i個(gè)人的圖像線性表示出來,而其他人的圖像則與y無關(guān),即 y=xi1ai1+xi2ai2+…+xinain。 (5) 其中ai1,ai2,…,ain是對(duì)應(yīng)于xi1,xi2,…,xin的系數(shù)。設(shè)系數(shù)矩陣為A={a1,a2,…,am},其中ai={ai1,ai2,…,ain},i=1,2,…,m,那么式(5)可以改寫為 y=XA。 (6) A={0,0,…,0,ai1,ai2,…,ain,0,0,…,0}。也就是說,A是一個(gè)稀疏向量。在y和X已知的情況下,如果能夠求出A,然后確定A中的稀疏元素對(duì)應(yīng)的人,就完成了對(duì)人臉的識(shí)別。 假設(shè)每張圖像的像素個(gè)數(shù)為p,則矩陣X共有p行,m×n列。一般情況下,有p?(m×n)。如果通過一定的降維方法,將每張圖像的維數(shù)降低,使p<(m×n),那么式(6)便成為與式(2)一樣的形式。此時(shí),就可以應(yīng)用壓縮感知的重構(gòu)算法來求系數(shù)向量A。 (7) 重建殘差最小的i即為識(shí)別結(jié)果。 2.2圖像分塊方法 SRC算法對(duì)遮擋人臉識(shí)別的魯棒性并不是很理想。圖像中遮擋的部分對(duì)識(shí)別影響很大,將遮擋部分與其他部分混在一起參與識(shí)別必然會(huì)對(duì)識(shí)別率產(chǎn)生不利的影響;但如何識(shí)別出哪些部分是遮擋,哪些部分不是遮擋也是一個(gè)很復(fù)雜的問題,因此,可以考慮將圖像分塊處理。這樣,遮擋部分較多的塊的識(shí)別率會(huì)差些,但是更多的沒有被遮擋的塊的識(shí)別率則不受影響。把所有塊的識(shí)別情況合在一起,就能以很大概率得到正確的識(shí)別結(jié)果。 根據(jù)這種想法,本文提出一種基于圖像分塊的SRC算法,其流程圖如圖2所示。 圖2 基于圖像分塊的SRC算法流程圖 本文將通過2組對(duì)比實(shí)驗(yàn)對(duì)改進(jìn)方法進(jìn)行討論。一組實(shí)驗(yàn)中,遮擋人臉的位置和形狀是未知且隨機(jī)的;另一組實(shí)驗(yàn)中,遮擋人臉的位置和形狀是已知且固定的。 實(shí)驗(yàn)選擇帶有遮擋人臉圖像的AR人臉數(shù)據(jù)庫作為樣本圖像集和測(cè)試圖像。AR數(shù)據(jù)庫中,共有100人(50男50女),每人26張?jiān)?個(gè)不同時(shí)期的不同表情、光照、遮擋的人臉圖像,共2 600張圖像,其尺寸均為120×165。實(shí)驗(yàn)平臺(tái)為PC機(jī),配置i5-2500的CPU與8G的1600內(nèi)存,實(shí)驗(yàn)所用軟件為MATLAB R2008a。SRC算法中,降維方法采用圖像下采樣,欠定方程組的解法采用OMP算法。 3.1隨機(jī)遮擋 選擇AR數(shù)據(jù)庫中每人的第1~7張非遮擋圖像作為樣本圖像,共700張。選擇每個(gè)人的第14~16張非遮擋圖像作為測(cè)試圖像,共300張。這300張測(cè)試圖像在進(jìn)行測(cè)試之前,程序會(huì)在每張圖像上繪制一個(gè)黑塊作為遮擋,黑塊的位置和面積都是隨機(jī)的,面積的隨機(jī)范圍為圖像面積的10%~25%。添加隨機(jī)遮擋的人臉圖像示例如圖3所示。 圖3 隨機(jī)遮擋人臉示例 由于遮擋的位置和面積均不可知,因此采用對(duì)圖像進(jìn)行平均分塊的方法。本次實(shí)驗(yàn)中,將對(duì)已經(jīng)添加黑塊的測(cè)試圖像做不分塊、分成2×2塊、分成3×3塊、分成4×4塊這4種操作,如圖4所示。 (a)不分塊 (b)2×2 (c)3×3 (d)4×4 圖4 隨機(jī)遮擋人臉的4種分塊方式示意圖 4種分塊方式的識(shí)別率對(duì)比結(jié)果如圖5所示,運(yùn)算時(shí)間對(duì)比結(jié)果如圖6所示。橫坐標(biāo)特征個(gè)數(shù)表示每個(gè)圖像分塊在經(jīng)過降維之后的像素個(gè)數(shù)。 圖5 不同分塊方式下隨機(jī)遮擋人臉的識(shí)別率對(duì)比圖 圖6 不同分塊方式下隨機(jī)遮擋人臉識(shí)別的運(yùn)算時(shí)間對(duì)比圖 由圖5可知:在相同的特征個(gè)數(shù)下,隨著分塊數(shù)的增大,識(shí)別率也逐漸提高;分成4×4塊相比于分成3×3塊,在識(shí)別率上的優(yōu)勢(shì)并不是特別明顯。事實(shí)上,隨著分塊數(shù)的增加,識(shí)別率的增長會(huì)越來越小,最后甚至?xí)?dǎo)致識(shí)別率的下降。這是因?yàn)?,?dāng)分塊數(shù)超過某一合理值之后,分塊所含有的信息量過小以至于無法進(jìn)行正確識(shí)別,進(jìn)而對(duì)總識(shí)別率產(chǎn)生不利的影響[15]。 由圖6可知,在相同的特征個(gè)數(shù)下,隨著分塊數(shù)的增大,運(yùn)算時(shí)間也在逐漸變長。這是因?yàn)椋緦?shí)驗(yàn)所用算法的時(shí)間復(fù)雜度為O(nKMN),其中n為分塊數(shù),K為OMP算法中設(shè)置的先驗(yàn)稀疏度,是一個(gè)固定值,M×N為特征個(gè)數(shù),當(dāng)K和M×N均相同時(shí),不同分塊方式所對(duì)應(yīng)的運(yùn)算時(shí)間只與分塊數(shù)有關(guān),分塊數(shù)越多則運(yùn)算時(shí)間越長,且基本成正比關(guān)系。 本實(shí)驗(yàn)表明:對(duì)于隨機(jī)遮擋的人臉識(shí)別,相比于不分塊時(shí)的40%左右識(shí)別率,平均分塊法能夠有效地提高識(shí)別率至80%以上,但是需要犧牲運(yùn)算時(shí)間作為代價(jià);分塊數(shù)也不能過大,否則只會(huì)無謂地浪費(fèi)運(yùn)算時(shí)間,對(duì)提高識(shí)別率不會(huì)有任何幫助。 3.2固定遮擋 本實(shí)驗(yàn)中,樣本圖像與3.1節(jié)中實(shí)驗(yàn)保持一致,選擇AR數(shù)據(jù)庫中每個(gè)人的第8~10張戴墨鏡的圖像作為測(cè)試圖像,共300張。在這300張圖像中,每個(gè)人都戴著同一個(gè)墨鏡,墨鏡的位置和形狀基本一樣,也即符合固定遮擋的要求。 對(duì)于這種形式的遮擋,可以設(shè)計(jì)一種分塊方式,使遮擋部分盡可能地被分在同一個(gè)分塊中,而未遮擋部分則在其他分塊中??紤]到墨鏡遮擋的特殊性,可以將測(cè)試圖像從上到下等間隔分成4塊,即分成4×1塊,這樣整個(gè)墨鏡就基本上位于第2個(gè)分塊中。本次實(shí)驗(yàn)中,也將對(duì)測(cè)試圖像做分成2×2塊、分成3×3塊、分成4×4塊這3種分塊操作。4種分塊方式的示意圖如圖7所示。 (a)4×1 (b)2×2 (c)3×3 (d)4×4 圖7 墨鏡人臉的4種分塊方式示意圖 4種分塊方式與不分塊的識(shí)別率對(duì)比結(jié)果如圖8所示,運(yùn)算時(shí)間對(duì)比結(jié)果如圖9所示。 由圖8可知,分成4×1塊的識(shí)別率已非常接近分成4×4塊的識(shí)別率,最大值均超過80%,相比于不分塊的50%左右的識(shí)別率,均有大幅提升。由圖9可知,分成4×1塊的運(yùn)算時(shí)間與分成2×2塊的運(yùn)算時(shí)間基本相同,遠(yuǎn)小于分成4×4塊的運(yùn)算時(shí)間。 圖8 不同分塊方式下墨鏡人臉的識(shí)別率對(duì)比圖 圖9 不同分塊方式下墨鏡人臉識(shí)別的運(yùn)算時(shí)間對(duì)比圖 本實(shí)驗(yàn)表明:對(duì)于固定遮擋的人臉識(shí)別,可以得到與之前實(shí)驗(yàn)相同的結(jié)論,即在一定范圍內(nèi),平均分塊方式的分塊數(shù)越多,識(shí)別率越高,運(yùn)算時(shí)間越長;但不同的是,可以通過設(shè)計(jì)一種合理的分塊方式,來達(dá)到用最短的時(shí)間得到最好的識(shí)別率的目的。分塊方式的設(shè)計(jì)有2個(gè)原則:含有遮擋部分的分塊要盡可能少地含有未遮擋部分,以提高整體的識(shí)別率;分塊數(shù)要盡可能的少,以減少運(yùn)算時(shí)間。 SRC算法是壓縮感知理論在人臉識(shí)別技術(shù)中的重要應(yīng)用,但是其對(duì)遮擋人臉的識(shí)別率卻不是十分理想。為改善這種情況,本文提出一種基于圖像分塊的SRC算法。實(shí)驗(yàn)結(jié)果顯示,這種方法能夠顯著地提高對(duì)遮擋人臉的識(shí)別率。相比于基本SRC算法的40%~50%的識(shí)別率,使用這種方法的識(shí)別率能夠達(dá)到80%以上;但是這種方法需要消耗更多的時(shí)間,且分塊數(shù)不能過大,否則會(huì)降低識(shí)別率。 此外,當(dāng)遮擋的形狀和位置是已知且固定時(shí),通過設(shè)計(jì)一種有針對(duì)性的分塊方式,可以在盡可能短的時(shí)間里得到盡可能好的識(shí)別結(jié)果。 [1]王映輝. 人臉識(shí)別原理、方法與技術(shù)[M]. 北京:科學(xué)出版社,2010:56-88. [2]楊軍,劉研麗.基于圖像的單樣本人臉識(shí)別研究進(jìn)展[J].西華大學(xué)學(xué)報(bào):自然科學(xué)版,2014,33(4):1-5. [3]楊軍,劉研麗.零空間邊界Fisher分析法及其在人臉識(shí)別中的應(yīng)用[J].西華大學(xué)學(xué)報(bào):自然科學(xué)版,2014,33(1):60-64. [4]趙成芳,李兆延.基于縮放因子的人臉直方圖特征距離度量方法[J].西華大學(xué)學(xué)報(bào):自然科學(xué)版,2013,32(5):8-10. [5]李樹濤,魏丹. 壓縮傳感綜述[J]. 自動(dòng)化學(xué)報(bào),2009,35(11):1369-1377. [6]李莉,楊吉斌,趙斐. 壓縮感知新技術(shù)專題講座(四):第7講:壓縮感知在圖像信號(hào)處理中的應(yīng)用[J]. 軍事通信技術(shù),2012,33(3):93-99. [7]Candes E J, Romberg J, Terence Tao. Robust Uncertainty Principles: Exact Signal Reconstruction from highly Incomplete Frequency Information [J]. IEEE Trans on Information Theory, 2006, 52(2):489-509. [8]Candes E J, Tao T. Near Optimal Signal Recovery from Random Projections: Universal Encoding Strategies [J]. IEEE Trans Info Theory,2006, 52(12): 5406-5425. [9]Yaakov Tsaig, David L. Extensions of Compressed Sensing [J].Signal Processing,2005, 86(3):549-571. [10]Peyr G. Best Basis Compressed Sensing [J]. Signal Processing, IEEE Trans on, 2010,5(5):2613-2622. [11]石光明,劉丹華,高大化,等. 壓縮感知理論及其研究進(jìn)展[J]. 電子學(xué)報(bào),2009,37(5):1070-1081. [12]李卓凡,閆敬文. 壓縮感知及應(yīng)用[J]. 微計(jì)算機(jī)應(yīng)用,2010,31(3):12-16. [13]楊榮根,任明武,楊靜宇. 基于稀疏表示的人臉識(shí)別方法[J]. 計(jì)算機(jī)科學(xué),2010,37(9):267-269. [14]鄧楠,徐正光,王珺. 基于稀疏表征多分類器融合的遮擋人臉識(shí)別[J]. 計(jì)算機(jī)應(yīng)用研究,2013,30(6):1914-1920. [15]平強(qiáng),莊連生,俞能海. 姿態(tài)魯棒的分塊稀疏表示人臉識(shí)別算法[J]. 中國科學(xué)技術(shù)大學(xué)學(xué)報(bào),2011,41(11):975-981. (編校:饒莉) OccludedFaceRecognitionBasedonCompressedSensingandImageBlocking ZHANG Jin, XIA Ling*, LI Guang-rui (SchoolofElectricalEngineeringandElectronicInformation,XihuaUniversity,Chengdu610039China) A method is proposed based on image blocking for the poor results of occluded face recognition using SRC algorithm based on compressed sensing. It performs recognition after blocking image. It disperses the occlusion in the less blocks as possible in order to reduce the adverse effect of occlusion on face recognition. Results of the experiments based on AR face database show that, occluded face recognition rate with this method can reach more than 80%, which is significantly higher than the rate of 40%~50% with basic SRC algorithm . occluded face recognition; compressed sensing; image blocking; SRC algorithm 2014-08-18 西華大學(xué)研究生創(chuàng)新基金(ycjj201367)。 :夏凌(1962—),女,副教授,博士,主要研究方向?yàn)槟J阶R(shí)別與醫(yī)學(xué)圖像處理。E-mail:xialing.cd@gmail.com TP391.41 :A :1673-159X(2015)03-0013-04 10.3969/j.issn.1673-159X.2015.03.003 *2 SRC算法及改進(jìn)
3 實(shí)驗(yàn)結(jié)果及分析
4 結(jié)論