楊穎嫻
(廣東司法警官職業(yè)學(xué)院 信息管理系,廣東 廣州 510520)
在人臉識別中,為了提高人臉識別率,尋找一個好的特征提取方法和分類器非常關(guān)鍵。目前常用的人臉特征提取方法有特征臉法、奇異值分解、傅里葉變換及小波分解等,常用的人臉識別分類器有人工神經(jīng)網(wǎng)絡(luò)分類器、最近鄰分類器、Fisher線性分類器和基于統(tǒng)計學(xué)習(xí)的分類器等[1-2]。
支持向量機(jī) SVM (Support Vector Machine)最初由Vapnik等人于20世紀(jì)90年代提出,它建立在統(tǒng)計學(xué)習(xí)理論基礎(chǔ)上,克服了小樣本和高維數(shù)問題,是一種新型的機(jī)器學(xué)習(xí)方法[3-5]。然而在實際問題中,不同的樣本對分類的作用不一定是相同的,因此,對所有的訓(xùn)練樣本采用相同的錯分懲罰是不合理的。基于以上考慮,Lin Chunfu等人[6]將隸屬度函數(shù)引入支持向量機(jī)中,提出了一種模糊支持向量機(jī),在支持向量機(jī)的基礎(chǔ)上給每個樣本分別賦—個隸屬度值,對不同的樣本采用不同的懲罰權(quán)重系數(shù),在構(gòu)造目標(biāo)函數(shù)時,使不同的樣本有不同的貢獻(xiàn),對噪聲或孤立點賦予很小的權(quán)值,從而達(dá)到消除噪聲或孤立點的目的。張釗等[7]提出在二叉樹支持向量機(jī)的基礎(chǔ)上結(jié)合模糊支持向量機(jī)理論提出的多分類方法,克服了上述缺點,取得了較好的分類效果。宦若虹等把支持向量機(jī)應(yīng)用于人臉識別[8]提出采用ICA和SVM進(jìn)行圖像的目標(biāo)提取和識別,取得了一定的效果。
本文在參考文獻(xiàn)[7]和參考文獻(xiàn)[8]等工作的基礎(chǔ)上,結(jié)合獨立元分析和模糊支持向量機(jī)分類器,提出了一種新人臉識別方法。首先利用獨立分量分析對人臉圖像進(jìn)行人臉特征臉空間的特征提取,所得到的特征值組成向量,再利用模糊支持向量機(jī)分類器對各類人臉圖像進(jìn)行分類。基于ORL人臉圖像庫的實驗結(jié)果表明,本文的識別方法非常有效,且算法簡單,易于實現(xiàn)。
[6]將模糊技術(shù)應(yīng)用于支持向量機(jī)中,提出了一種模糊支持向量機(jī),針對支持向量機(jī)對訓(xùn)練樣本內(nèi)的噪聲和孤立點的敏感性,引入模糊參數(shù),對不同的樣本采用不同的懲罰系數(shù),使得對決策函數(shù)的學(xué)習(xí)有不同的貢獻(xiàn),從而減弱噪聲及孤立點對分類的影響。
設(shè)給定模糊訓(xùn)練樣本集S ={(x1,y1,μ1),(x2,y2,μ2),…,(xl,yl,μl)}和核函數(shù)K(xi,xj),其中xi∈Rn,yi∈{-1,1},μi∈(0,1]。K對應(yīng)某特征空間Z中的內(nèi)積,即K(xi,xj)=φ(xi)·φ(xj),變換φ:X→Z將樣本從輸入空間映射到特征空間,μi是訓(xùn)練點(xi,yj,μi)的輸出yj=1(正類)或-1(負(fù)類)的模糊隸屬度(i=1,2,…,l)。則模糊最優(yōu)分類函數(shù)為:
在SVM中,仍將n類問題轉(zhuǎn)化為n個兩類問題來處理。 設(shè)類 i和類 j的決策函數(shù)為 Dij(x)=w(x)+bij,并有Dij(x)-Dji(x)。對于輸入向量 x,計算:
在模糊支持向量機(jī)算法中,通過對不同樣本賦予不同的隸屬度 ui=f(Dij(x)),如果 ui是 Dij(x)的線性函數(shù),則:
這里隸屬度均為正值。
在樣本數(shù)量和類別數(shù)目較多的情況下,F(xiàn)SVM算法的時間復(fù)雜度很大,因此考慮結(jié)合二叉決策樹來降低算法的時間復(fù)雜度。如果存在一個類可分的問題,那么任意兩類之間都是兩兩可分的?;谶@點,本文將FSVM兩類分類器與二叉決策樹的拓?fù)浣Y(jié)構(gòu)結(jié)合起來,構(gòu)成樹形結(jié)構(gòu)的多類分類器。在FSVM分類器的設(shè)計中,核函數(shù)的選擇也是關(guān)鍵,常用的核函數(shù)有多項式核函數(shù)、徑向基核函數(shù) (RBF)和sigmoid函數(shù)作為內(nèi)積核函數(shù)等。本文利用RBF函數(shù)作為核函數(shù)。下面給出基于徑向基核函數(shù)(RBF)的二叉樹 FSVM多類分類方法(K類,K>2),具體步驟如下:
(1)排序。對K類樣本根據(jù)各類樣本的數(shù)量進(jìn)行由多到少的排序,形成分類序列集合。
(2)訓(xùn)練傳統(tǒng)的 SVM分類器,得到初始支持向量,并用其來構(gòu)成決策分類面。
(3)根據(jù) 1.1節(jié)中介紹的方法,由傳統(tǒng) SVM中得到的分類面及超平面,求出隸屬度函數(shù) ui,確定模糊訓(xùn)練集(x1,y1,μ1),(x2,y2,μ2),…,(xl,yl,μl)。
(4)訓(xùn)練模糊訓(xùn)練點,構(gòu)造最優(yōu)分類函數(shù)。對于k類訓(xùn)練樣本,訓(xùn)練k-1個FSVM分類器。
(5)對樣本進(jìn)行分類。
(6)依次下去,直到算法結(jié)束。
ICA作為一種盲源信號分離技術(shù)[8],是基于信號的高階統(tǒng)計特性的分析方法。由原始樣本數(shù)據(jù)求一個特征空間,然后把新的數(shù)據(jù)映射到這個特征空間,獲得一組特征向量,用來分類識別。在人臉圖像的實際處理中,ICA基本原理是通過對人臉訓(xùn)練樣本進(jìn)行某種線性分解,把其分解成統(tǒng)計上獨立的成分,根據(jù)這些獨立成分對待檢測圖像進(jìn)行判別。在利用ICA之前先要對原始數(shù)據(jù)進(jìn)行預(yù)處理,預(yù)處理的內(nèi)容主要包括去均值、矢量歸一以及PCA降維,降維既能去除噪聲,又能減少運(yùn)算量。
記xi為一幅人臉數(shù)據(jù),可以構(gòu)造一個訓(xùn)練人臉集合{x1,x2,…,xM}(xi表示一幅 m×n 大小的人臉圖像按列展開成的M×N維向量),其中每個人臉數(shù)據(jù)看作是N個獨立元素 s1,s2,…,sN的線性組合,這些獨立元素概率獨立并具有零均值。 將觀察變量xi記作向量 X,X=(x1,x2, …,xM)T,將元素 si記作向量 S,S=(s1,s2,…,sN)T,則人臉的樣本集X可以表示為:
ICA算法的目的就是求分離矩陣W,使得:
利用ICA提取人臉特征的具體過程如下:
(1)計算所有樣本的均值向量并中心化所有樣本;
(2)求樣本X的協(xié)方差矩陣并求白化矩陣;
(3)求輸出矩陣 Z,它是X在 UM1所張成的子空間上的投影;
(4)應(yīng)用固定點ICA 算法對 Z作獨立分量分析,得到輸出Y;
(5)將人臉圖像T向獨立成分S構(gòu)成的子空間投影,得到投影系數(shù)。
為了檢驗本文算法的有效性,選擇ORL標(biāo)準(zhǔn)人臉庫作為分類識別對象。在人臉識別過程中,為構(gòu)造特征臉空間,首先根據(jù)本文第2節(jié)的算法對人臉圖像進(jìn)行降維,將 400幅 112×92的人臉圖像轉(zhuǎn)化為 40×40,求得 M個相互正交的特征向量和相對應(yīng)的M個特征值;然后將人臉圖像在高維空間中的向量映射到特征臉空間,構(gòu)成人臉圖像在特征臉空間的特征參數(shù),以這些特征參數(shù)為輸入構(gòu)造FSVM的樣本空間。利用1.2節(jié)的FSVM的二叉樹分類算法判斷人臉圖像所屬類別。
為了驗證本文所提出方法的有效性,分別采用4種不同方法對ORL人臉數(shù)據(jù)庫進(jìn)行實驗,實驗結(jié)果如表1所示。
表1 4種方法實驗結(jié)果
從結(jié)果可以看出,在相同的實驗條件下,本文提出的方法的識別率明顯高于其他3種分類算法,誤識標(biāo)準(zhǔn)差也更小,說明系統(tǒng)更加穩(wěn)定。
本文結(jié)合獨立元分析和模糊支持向量機(jī)分類器,提出一種新的人臉識別方法。首先利用獨立分量分析對人臉圖像進(jìn)行人臉特征臉空間的特征提取,將所得到的特征值組成向量,再利用模糊支持向量機(jī)分類器對各類人臉圖像進(jìn)行分類。實驗結(jié)果證明,與采用單獨的PCA+SVM、ICA+SVM等方法相比,該方法具有更好的魯棒性且識別精度較高。
參考文獻(xiàn)
[1]ZHAO W Y, CHELLAPPA R, ROSENFELD A, et al.Face recognition: a literature survey [J].ACM Computing Surveys, 2003,35(4):399-458.
[2]楊潔,馮力剛,蔣加伏.基于小波包和支持向量機(jī)的人臉識別[J].計算機(jī)仿真,2004,21(9):131-133.
[3]CRISTIANINI N,TAYLOR J S.An introduction to support vector machines and other kernel-based learning methods[M].Cambridge: Cambridge University Press, 2000.
[4]鄧乃揚(yáng),田英杰.數(shù)據(jù)挖掘中的新方法——支持向量機(jī)[M].北京:科學(xué)出版社,2004.
[5]祁亨年.支持向量機(jī)及其應(yīng)用研究綜述[J].計算機(jī)工程,2004,30(10):6-9.
[6]Lin Chunfu,Wang Shengde.Fuzzy support vectormachines[J].IEEE Transactions on Neural Networks,2002, 13(2): 464-471.
[7]張釗,費(fèi)一楠,宋麟,等.基于模糊支持向量機(jī)的多分類算法研究[J].計算機(jī)應(yīng)用,2008,28(7):1681-1683.
[8]宦若虹,楊汝良.基于ICA和SVM的SAR圖像特征提取與目標(biāo)識別[J].計算機(jī)工程,2008,34(13):24-28.
[9]BELLA J.An information maximization approach to blind separation and blinddeconvolution[J].Neural Computation,1995,7(6):1129-1159.