摘要:稀疏性是信號(hào)表示非零系數(shù)個(gè)數(shù)的度量,一個(gè)信號(hào)越稀疏,它的非零系數(shù)個(gè)數(shù)越多。稀疏表示一種信號(hào)的基礎(chǔ)研究,它在人臉識(shí)別、圖像復(fù)原、圖像去噪等領(lǐng)域有著極為重要的意義。文章基于信號(hào)的稀疏特性在人臉識(shí)別、圖像去噪等方面的應(yīng)用,對(duì)信號(hào)在過(guò)完備字典下的表示進(jìn)行了研究。
關(guān)鍵詞:稀疏表示;人臉識(shí)別方法;圖像復(fù)原;圖像去噪;字典優(yōu)化 文獻(xiàn)標(biāo)識(shí)碼:A
中圖分類號(hào):TP393 文章編號(hào):1009-2374(2015)36-0001-03 DOI:10.13535/j.cnki.11-4406/n.2015.36.001
稀疏性是指信號(hào)進(jìn)行某種變換后,用來(lái)表示該信號(hào)的非零系數(shù)遠(yuǎn)小于信號(hào)本身的長(zhǎng)度。這種特性使得與信號(hào)相關(guān)的信息提取變得快速有效,減少信號(hào)在處理過(guò)程中所需要的成本。稀疏表示使得圖像的能量只集中于部分少量的原子,這些非零系數(shù)對(duì)應(yīng)的原子揭示了圖像主要的特征及內(nèi)在的結(jié)構(gòu)。近百年來(lái),信號(hào)處理經(jīng)歷了小波變換、正交基變換、多尺度變換,直到20世紀(jì)末則使用過(guò)完備字典的稀疏表示,過(guò)完備字典的表示是指構(gòu)成字典的基原子的個(gè)數(shù)遠(yuǎn)大于基元素的維數(shù),這樣便構(gòu)成了一個(gè)扁矩陣,進(jìn)而將問(wèn)題轉(zhuǎn)換成為求解欠定方程的問(wèn)題。
1 基于稀疏表示的人臉識(shí)別
人臉識(shí)別(Face Recognition,F(xiàn)R)技術(shù)是基于人臉部特征進(jìn)行身份識(shí)別的一種生物識(shí)別技術(shù),因?yàn)槿四樀奈ㄒ恍院筒蝗菀讖?fù)制性,為人物的身份進(jìn)行正確的判定提供了重要線索,人臉識(shí)別技術(shù)也已成為模式識(shí)別、計(jì)算機(jī)視覺(jué)、圖像處理等領(lǐng)域的研究熱點(diǎn)。2009年,J.Wright等人在前人的人臉識(shí)別算法基礎(chǔ)上,提出了基于稀疏表示的穩(wěn)健人臉識(shí)別方法(Sparse Representation-based Classification,SRC),與其他的算法相比,即使在圖片具有高污染或陰影的情況下,仍然可以保持較高的識(shí)別率。
人臉識(shí)別問(wèn)題也就是監(jiān)督學(xué)習(xí)分類問(wèn)題,即已知一些數(shù)據(jù)的正確結(jié)果,然后對(duì)未知的數(shù)據(jù)做出預(yù)測(cè)。在已有監(jiān)督學(xué)習(xí)分類識(shí)別中,它的基本問(wèn)題描述如下:給定個(gè)不同種類的人臉數(shù)據(jù),共個(gè)樣本集,假設(shè)給定的第類樣本中有個(gè)樣本人臉圖片,且滿足:
利用這些已知類別的個(gè)訓(xùn)練樣本集,來(lái)判斷新的測(cè)試樣本屬于哪一類別。在人臉識(shí)別中,一張像素為的黑白人臉圖片,就是一個(gè)的矩陣圖片信息,矩陣的每一個(gè)元素就對(duì)應(yīng)人臉圖片的一個(gè)灰度值。通過(guò)把這張人臉圖片構(gòu)成的矩陣堆積成一個(gè)維度為的列向量,在第類中,把這個(gè)樣本人臉圖片合并成一個(gè)維的矩陣,其中作為矩陣的列向量,即,則就表示第個(gè)人的人臉訓(xùn)練集。
在實(shí)際的人臉識(shí)別問(wèn)題中,通常一張普通的人臉圖片的分辨率為像素,則一張圖片的維度為個(gè)數(shù)量級(jí),所以圖片維度大大超過(guò)訓(xùn)練樣本的個(gè)數(shù),即,這樣求解是一個(gè)過(guò)定方程,得到的解是一個(gè)唯一的解,作為之后的分類判別效果很不好,并且圖片的維數(shù)過(guò)高,但計(jì)算量太大,超出普通計(jì)算機(jī)可以承受的范圍,所以需要對(duì)進(jìn)行降維處理。
如圖2所示,由于噪聲的存在,導(dǎo)致求得的系數(shù)在不相關(guān)的類別上,并不是嚴(yán)格的零。如何針對(duì)求得的系數(shù)進(jìn)行正確的分類是算法的核心問(wèn)題。
基于全局的稀疏表示,可以設(shè)計(jì)出多種不同的分類器,SRC算法采用了使用系數(shù)向量與所有樣本直接的相關(guān)程度來(lái)分類的方式,即用余差法的方式,具體過(guò)程如下:
對(duì)于每一個(gè)類別,讓作為第個(gè)類別的對(duì)應(yīng)系數(shù)的特征函數(shù),對(duì)于,是一個(gè)新的系數(shù)向量,它當(dāng)中的元素除了與它對(duì)應(yīng)的第類的系數(shù),其他元素都為零,即。使用這個(gè)只與第類對(duì)應(yīng)的系數(shù)相關(guān)的向量,可以把測(cè)試樣本重新表示為。接下來(lái),將通過(guò)最小化和的范數(shù)來(lái)對(duì)進(jìn)行分類:
(6)
在計(jì)算過(guò)程中,如果第類恢復(fù)得到誤差最小,那么就判斷測(cè)試樣本屬于第類。至此,可以總結(jié)得出SRC算法的基本過(guò)程:(1)輸入:類訓(xùn)練樣本的共張圖片,構(gòu)造出訓(xùn)練樣本矩陣以及一個(gè)測(cè)試樣本;(2)將樣本矩陣的列向量歸一化。identity(y)=argminiri(y);(3)求解最小化范數(shù)問(wèn)題,得到稀疏系數(shù): subject to ;(4)計(jì)算出測(cè)試樣本對(duì)應(yīng)的每一類的余差值: ;(5)輸出:判斷圖片的類別:。
2 字典優(yōu)化
為了應(yīng)對(duì)現(xiàn)實(shí)模型分析,產(chǎn)生了基于學(xué)習(xí)的冗余字典。在基于稀疏表示的人臉識(shí)別建模中,就是使用基于訓(xùn)練樣本學(xué)習(xí)的方法來(lái)構(gòu)造過(guò)完備冗余字典。特征空間的提取對(duì)于稀疏表示模型的一個(gè)好處是:減少數(shù)據(jù)的維數(shù),降低計(jì)算的成本。在SRC算法中,訓(xùn)練樣本矩陣被替代為,d ,基本模型由前式(1)至式(5)可得。 為驗(yàn)證不同降維方法對(duì)SRC算法性能的影響,選取了兩種降維方式:一是傳統(tǒng)的通過(guò)主元分析(PCA)得到的特征臉Eigenfaces;二是一種隨機(jī)臉(Randomfaces)的降維方法。 由參考文獻(xiàn)[2]和參考文獻(xiàn)[3]可得,通過(guò)PCA降維的主要思想是:尋找一個(gè)維子空間來(lái)表示數(shù)據(jù),并盡量保持原始數(shù)據(jù)的方差不變。在運(yùn)行PCA算法之前,首先需要對(duì)訓(xùn)練樣本進(jìn)行預(yù)處理,以保證不同刻量單位的數(shù)據(jù)具有零均值和單位的方差,下面是PCA算法通常的預(yù)處理步驟:(1)計(jì)算樣本均值:;(2)替換每一個(gè)為;(3)計(jì)算所有類的第個(gè)數(shù)據(jù)的方差:;(4)替換每一個(gè)為。 由于圖片灰度值都是0到255統(tǒng)一的刻度標(biāo)準(zhǔn),所以步驟3、4在算法中可以省略。假設(shè)一個(gè)單位向量和一個(gè)空間的數(shù)據(jù)點(diǎn),那么點(diǎn)到向量的投影的長(zhǎng)度可以表示為,那么如果是數(shù)據(jù)集中的一個(gè)點(diǎn),那么它到向量的投影就是到原點(diǎn)的距離。因此,為了最大化投影的方差,可以選擇一個(gè)單位長(zhǎng)度的向量進(jìn)行最大化: (7) 其中是數(shù)據(jù)的協(xié)方差矩陣,在的條件下,由拉格朗日乘子可得,最大化,需要是數(shù)據(jù)的主元特征向量。當(dāng)投影到一維子空間的時(shí)候,需要選擇是的主元特征向量。更一般地,如果我們想把數(shù)據(jù)投影到一個(gè)維子空間(),需要選擇是的前個(gè)特征值對(duì)應(yīng)的特征向量,所有的都是正交的。因此,要表示投影后的數(shù)據(jù),只需要計(jì)算對(duì)應(yīng)的向量:
(8)
因?yàn)椋虼讼蛄烤徒o出了低維空間的表示。向量叫做數(shù)據(jù)的前個(gè)主元成分。在稀疏表示人臉識(shí)別中,可以根據(jù)具體情況選擇最合適的維投影空間,再由以上介紹的PCA過(guò)程計(jì)算出訓(xùn)練樣本數(shù)據(jù)的前個(gè)特征向量作為投影矩陣來(lái)對(duì)數(shù)據(jù)進(jìn)行降維。
通過(guò)隨機(jī)臉降維的主要思想是:使用隨機(jī)采樣法,用一個(gè)高斯隨機(jī)矩陣作為投影矩陣對(duì)人臉數(shù)據(jù)進(jìn)行線性地投影。研究表明,在范數(shù)的求解過(guò)程中,如果系數(shù)解是足夠的稀疏,有個(gè)非零元素,且t (9) 那么隨機(jī)線性測(cè)量對(duì)于范數(shù)優(yōu)化問(wèn)題求解已經(jīng)足夠了,由此可以得出隨機(jī)臉的定義:考慮一個(gè)投影矩陣,它的元素是零均值的正態(tài)分布且線性獨(dú)立(高斯隨機(jī)陣即可滿足),那么歸一化它的行向量后,這個(gè)矩陣的行向量就可以看作是維空間的隨機(jī)臉。 3 實(shí)驗(yàn)結(jié)果及分析 在本文的人臉識(shí)別仿真中,使用了兩種常用的人臉數(shù)據(jù)庫(kù),下面首先對(duì)這兩個(gè)常用的人臉數(shù)據(jù)庫(kù)進(jìn)行介紹,分別是Yale Database人臉數(shù)據(jù)庫(kù)和AR Database人臉數(shù)據(jù)庫(kù)。 Yale Database:由耶魯大學(xué)計(jì)算視覺(jué)和控制中心產(chǎn)生,一共有15位志愿者的165張圖片,每人11張,包括表情、光照、姿態(tài)的變化,如圖3所示是其中第一個(gè)志愿者的部分人臉圖片。 AR Database:由100個(gè)人組成,其中50個(gè)男性,50個(gè)女性,每人26張圖片,分兩次拍攝完成,每次每人拍攝13張,如圖4所示。其中14張圖片只有光照和表情的變化,另外12張圖片是戴著圍巾或墨鏡,是有遮擋的情況,比較符合現(xiàn)實(shí)中實(shí)際的人臉圖片。 下面給出基于以上介紹的SRC稀疏人臉識(shí)別算法的Matlab仿真實(shí)驗(yàn)結(jié)果。這個(gè)實(shí)驗(yàn)是基于AR人臉數(shù)據(jù)庫(kù)進(jìn)行的仿真,選用100個(gè)人臉中每人7張圖片共700張圖片作為訓(xùn)練樣本構(gòu)造冗余字典。如圖5所示,由于噪聲的存在,求解得到的稀疏系數(shù)在其他人臉空間并不是嚴(yán)格的零,但系數(shù)分布仍然十分稀疏,較大的幅值主要集中于測(cè)試樣本所屬的人臉空間。從圖中較大的系數(shù)可以看到,最大幅值所對(duì)應(yīng)x的位置是8,由于每個(gè)人是7張訓(xùn)練圖片,第8張圖片恰好對(duì)應(yīng)第二個(gè)人的訓(xùn)練圖片的第一張。雖然算法并不是直接使用最大幅值來(lái)作為分類標(biāo)準(zhǔn),是使用余差值的方法,但仍然可以由圖中系數(shù)分布情況得到與算法一致的分類效果。 在本實(shí)驗(yàn)中,選取Yale Database人臉數(shù)據(jù)庫(kù)中每個(gè)人10張圖片作為訓(xùn)練樣本集,剩余1張圖片作為測(cè)試樣本。在AR Database人臉數(shù)據(jù)庫(kù)中,選取僅有光照和表情變化的14張圖片進(jìn)行實(shí)驗(yàn),其中7張作為訓(xùn)練樣本集,7張作為測(cè)試樣本集。在選取過(guò)程中,以隨機(jī)選取為原則,隨機(jī)性地選擇圖片,保證了實(shí)驗(yàn)結(jié)果不依賴于某些特別的圖片,從而保證實(shí)驗(yàn)的準(zhǔn)確性。在這兩個(gè)人臉庫(kù)中,使用以上介紹的PCA和Randomfaces兩種降維方法進(jìn)行了正確識(shí)別率的測(cè)試,測(cè)試結(jié)果如下: 由圖6和圖7分析可得,無(wú)論使用哪種降維方法,算法的正確識(shí)別率都是隨著特征空間維度的增加而增大,并且SRC對(duì)于特征空間的選取方式并不敏感,即使是隨機(jī)臉,它的人臉識(shí)別率仍與Eigenface差不多,這與傳統(tǒng)的人臉識(shí)別方法有很大的不同,傳統(tǒng)的人臉識(shí)別分類依靠特征臉的選取,同一分類方法,使用不同的特征空間提取方法,分類效果差異很大,往往需要試驗(yàn)得出哪種分類效果更好。 既然SRC算法對(duì)于特征空間的選取不敏感,那么在對(duì)數(shù)據(jù)進(jìn)行降維時(shí),可以選取隨機(jī)臉作為投影矩陣。隨機(jī)臉易于產(chǎn)生,且與訓(xùn)練數(shù)據(jù)獨(dú)立,不受訓(xùn)練數(shù)據(jù)集的影響,這些優(yōu)點(diǎn)大大降低了降維過(guò)程中計(jì)算的成本。 4 結(jié)語(yǔ) 本文是基于稀疏表示的人臉識(shí)別。通過(guò)信號(hào)的稀疏表示,在Extend Yale B Database和AR Database人臉數(shù)據(jù)庫(kù)仿真模擬下分析了SRC算法在不同的人臉特征空間的性能。 參考文獻(xiàn) [1] J.Wright,Allen Y.Yang and A.Ganesh.Robust Face Recognition via Sparse Representation[J].IEEE Tans.Pattern Analysis and Machine Intelligence,2009,31(2). [2] P.Belhumeur,J.Hespanda,and D.Kriegman.Eigenfaces versus Fisherfaces:Recognition Using Class Specific Linear Projection[J].IEEE Trans.Pattern Analysis and Machine Intelligence,1997,19(7). [3] R.Basri and D.Jacobs.Lambertian Reflection and Linear Subspaces[J].IEEE Trans.Pattern Analysis and Machine Intelligence,2003,25(3). [4] D.Donoho.High-Dimensional Data Analysis:The Curses and Blessings of Dimensionality[M].AMS Math Challenges Lecture,2000. 作者簡(jiǎn)介:劉敏(1986-),女,四川瀘州人,西南科技大學(xué)信息工程學(xué)院碩士,研究方向:圖像處理。 (責(zé)任編輯:周 瓊)
中國(guó)高新技術(shù)企業(yè)2015年36期