原豪杰, 孫桂玲, 鄭博文, 李志晟(南開大學(xué) 電子信息與光學(xué)工程學(xué)院, 天津 300350)
基于余類零空間與最近距離的人臉識別算法①
原豪杰, 孫桂玲, 鄭博文, 李志晟
(南開大學(xué) 電子信息與光學(xué)工程學(xué)院, 天津 300350)
提出了一種新的人臉識別算法, 即基于余類零空間與最近距離的人臉識別算法. 通過構(gòu)建不同類別的人臉圖像的余類零空間與子空間, 可以將不同類別的人臉最大化地區(qū)別出來. 本算法的主要思想在于: 測試圖像與所屬類別圖像的子空間之間的距離最小, 而與所屬類別的圖像的余類零空間距離最大. 本算法基于ORL數(shù)據(jù)集與AR數(shù)據(jù)集進(jìn)行了測試. 從這些人臉數(shù)據(jù)集上的測試結(jié)果可以看出, 本文提出的算法在PCA降維方法的基礎(chǔ)上,比一些常見的算法所使用的判別方式更有效, 如最近鄰分類器(NN)所使用的最近距離判別方式、最近空間分類器(NS)所使用的最近空間距離判別方式、最近最遠(yuǎn)子空間分類器(NFS)所使用的最近最遠(yuǎn)空間距離判別方式等.
余類零空間; 人臉識別; 最近空間; 分類器; 子空間
人臉識別是一項(xiàng)重要的技術(shù). 我們可以借助計(jì)算機(jī)技術(shù), 通過從人臉圖像中提取出來的信息快速識別出不同的人. 人臉識別技術(shù)被廣泛用于國家安全、軍事安全以及公共安全中. 同時(shí), 人臉識別的研究也將在認(rèn)知科學(xué)、生理學(xué)、心理學(xué)以及其它相關(guān)學(xué)科中起到非常重要的作用.
目前已經(jīng)有很多譬如計(jì)算機(jī)科學(xué)、數(shù)學(xué)科學(xué)、神經(jīng)科學(xué)等眾多科學(xué)的研究者加入到了人臉識別的研究中. 目前一些比較優(yōu)秀的、成型的人臉識別算法包括:基于PCA人臉識別算法、相關(guān)匹配算法 (correlation matching algorithm)、基于神經(jīng)網(wǎng)絡(luò)的算法、基于小波變換的算法以及基于離散余弦變換的算法等.
基于PCA的人臉識別算法在人臉識別中有非常重要的地位[1,2], 其算法步驟主要分為三個(gè)階段, 即特征提取階段、訓(xùn)練階段、識別階段. 許多基于PCA的算法側(cè)重前兩個(gè)階段的研究, 如2DPCA[3]與BDPCA[4]以及另外一些改進(jìn)的PCA算法[5-7]. 針對第三階段的研究, J.Mi提出了最遠(yuǎn)子空間分類器算法以及最近最遠(yuǎn)子空間分類器算法(NFS)[8], 此外還有一些另外的分類器算法[9,10]. 本文提出了側(cè)重于第三個(gè)階段的一種新型分類器算法.
本文提出的算法主要分為三個(gè)步驟:
第一步利用PCA算法以及PCA的改進(jìn)算法提取人臉圖像的特征向量或特征矩陣, 構(gòu)建屬于不同類別的人臉子空間, 并計(jì)算測試圖像與所有子空間的距離;
第二步基于不同類別人臉之間的關(guān)系構(gòu)建不同類別的人臉余類零空間并計(jì)算測試圖像與所有余類零空間的距離;
第三步根據(jù)第一步計(jì)算出的距離與第二步計(jì)算出的距離判別出測試圖像的類別.
我們在兩個(gè)人臉數(shù)據(jù)集上對算法進(jìn)行了測試, 實(shí)驗(yàn)結(jié)果表明本文算法在各種測試環(huán)境下由于其它同類別算法. 余類零空間算法首先被用在MIMO(多入多出技術(shù))系統(tǒng)的預(yù)編碼中[11,12]. 在MIMO系統(tǒng)中, 多用戶的MIMO廣播信道被分解成多個(gè)獨(dú)立的單用戶的廣播通道, 系統(tǒng)可以在高速數(shù)據(jù)流中將多樣性最大化. 結(jié)合MIMO預(yù)編碼技術(shù)與人臉識別技術(shù), 我們會發(fā)現(xiàn)二者之間很多的共同點(diǎn). 在MIMO系統(tǒng)中, 我們將多用戶通道分解成多個(gè)獨(dú)立的單用戶通道, 而在人臉識別中, 我們將不同類別的人臉數(shù)據(jù)分解到多個(gè)獨(dú)立的子空間與余類零空間中. MIMO系統(tǒng)中單用戶中的多樣性也與人臉識別中某一類別的人臉的多樣性不謀而合.
本文第一部分首先介紹PCA及分類器的基本原理, 第二部分詳細(xì)介紹本文提出的算法, 第三部分對算法進(jìn)行試驗(yàn)并給出結(jié)果討論.
1.1 PCA算法基本原理
PCA算法在圖像壓縮中是一種理想的正交變換. PCA算法首先在原始圖像中使用K-L變換得到一系列正交基底, 通過保留部分重要的正交基底, 可以得到圖像的特征矩陣. PCA算法極大地降低了圖像的維度,但其卻幾乎不影響人臉識別的性能.
假設(shè)在一個(gè)訓(xùn)練集中有N幅人臉圖像, 其中每張圖像可以用一個(gè)二維的m× n 矩陣表示. 對于一幅圖像Xi, 我們將矩陣的每一列附加到前一列中即可將一幅圖像轉(zhuǎn)換為一個(gè)維度為D的列向量(其中D=m×n).
將一個(gè)訓(xùn)練集中的N幅圖像表示成矩陣X=(X1, X2,...,XN), 其中每一個(gè)列向量表示一個(gè)圖像. 矩陣X的互相關(guān)矩陣可以表示為:
計(jì)算互相關(guān)矩陣的特征值與特征向量, 在計(jì)算得到的所有特征向量中, 取前r個(gè)最大特征值對應(yīng)的特征向量, 可得到特征臉空間Q=(, Q,...,Q)這里取到的每一個(gè)特征向2r量被稱為一個(gè)特征臉. 將訓(xùn)練集X中的每一個(gè)圖像向量映射到特征臉空間中, 即得到基于特征臉的特征圖像,可以表示為:
這里的Zi是Xi的零均值化圖像.
1.2 BDPCA與2DPCA算法基本原理
傳統(tǒng)PCA算法中,圖像首先被轉(zhuǎn)換為一個(gè)向量.而在2DPCA中則直接從原始圖像矩陣中提取特征矩陣, 這大大減少了特征提取與訓(xùn)練的時(shí)間, 并且2DPCA的識別性能比PCA更好. N個(gè)訓(xùn)練圖像可以表示為其中每個(gè)圖像矩陣X的i維度為m×n. 總散度矩陣表示為:
1.3 BDPCA算法基本原理
BDPCA通過公式(4)直接從訓(xùn)練圖像矩陣Xi中獲取特征矩陣Yi:
其中Wcol與Wrow分別為左映射矩陣與右映射矩陣.
給定訓(xùn)練圖像集{X1, X2,...,XN}, 其中N為訓(xùn)練集樣本的個(gè)數(shù), 每幅圖像矩陣的維度為m×n. 首先定義行總散度矩陣, 可表示為:
事實(shí)上, BDPCA是2DPCA的一般化的方法, 而2DPCA可被看做BDPCA的一種特殊情況, 將BDPCA中的以單位矩陣來代替即為2DPCA.
文章從這里開始, 文中提到的測試圖像向量均指測試圖像經(jīng)PCA或其改進(jìn)算法得到的特征向量. 測試圖像矩陣均指測試圖像經(jīng)PCA改進(jìn)算法得到的特征矩陣.
1.4 分類器
目前有許多基于PCA特征的分類器. 一種常見的分類器為基于Frobenius距離的最近鄰分類器(NN). 在NN分類器的基礎(chǔ)上, 有許多改進(jìn)的分類器.
根據(jù)測試圖像矩陣與所有訓(xùn)練圖像矩陣的距離,即可判斷出圖像的類別. 常見的距離定義有Frobenius距離, Yang距離, Assembled Matrix 距離(AMD).
Li和Lu提出了NN分類器的一種改進(jìn)分類器為最近線(NL)分類器[13].
作為NN與NL分類器的擴(kuò)展, Chien和Wu[14]提出了最近平面(NP)與最近空間(NS)分類器. 下面這簡單介紹NS分類器[15]的原理.
假設(shè)訓(xùn)練集有K種類別的人臉, 每種類別包含p個(gè)圖像向量. 將這p個(gè)圖像向量組合成一個(gè)矩陣代表第i個(gè)類別的子空間, 可表示為:
最后, 我們在得到的K個(gè)距離中找到最小的距離d, d對應(yīng)的類別即判定為測試圖像向量對應(yīng)的類別.
J.Mi提出了最近最遠(yuǎn)子空間分類器(NFS)[8], 第一步, 對于第i種類別, 除第i種類別的N-1種訓(xùn)練集構(gòu)建“l(fā)eave-one-class-out”子空間:
回顧NS算法, 算法將測試圖像判別為最小距離di對應(yīng)的類別. 我們能否找到另外一個(gè)與di、li無關(guān)的, 判別效果更好的距離Vali, 我們將測試圖像判別為最大的Vali對應(yīng)的類別? 進(jìn)一步, 結(jié)合距離di與Vali, 我們可以將測試圖像判別為最大的Vali/di. 這里的距離di可以通過NS距離來計(jì)算.
通過距離Vali來對測試圖像進(jìn)行判別的算法與使用距離di來判別的NS算法是兩種完全不同的算法.兩個(gè)距離所表示的含義以及采取的判別策略有本質(zhì)差別.
2.1 多次余類零空間距離分類器
在得到訓(xùn)練圖像的特征矩陣Yi后, 將矩陣中的每一列附加到前一列中, 可將矩陣轉(zhuǎn)換為一個(gè)列向量.所有的特征列向量可以表示為HT. D為每個(gè)特征列向量的維度, N為訓(xùn)練圖像的個(gè)數(shù). HT中的每一列均表示一個(gè)特征列向量. HT共包含K種類別,每種類別包括S張人臉圖. 將HT轉(zhuǎn)置后得到H, H可表示為每一個(gè)子矩陣Hi表示第i種類別的特征矩陣, 并且H. 矩陣H i的右逆矩陣可表示為:
測試圖像向量與“l(fā)eave-one-class-out”子空間的距
下面,我們將會證明Hj(j≠i)×Pi,right=0成立.由右逆矩陣的特性可知H×H?right=I, 進(jìn)一步可以得到×Hi,right=I, Hj(j≠i)×Hi,right=0. 這里的矩陣Hi,right是H?right的子矩陣. 定義矩陣T為Hj(j≠i)×Qi,right=T, 我們可以得T× Ri,right=0, 其中T∈?S×D, 并且∈?D×S的對角線元素不為0.T× Ri,right=0可以擴(kuò)展為如下形式:
其中R(1,1),R(2,2),...,R(S,S)均不等于0. 矩陣T的左邊部分可以表示為Hj(j≠i)×Pi,right.
將矩陣T的第一行依次乘以右矩陣Ri,right的每一列, 將會依次得到T(1,1)=T(1,2)=...=T(1,S)=0. 同理可得T(2,1)=T(2,2)=...=T(2,S)=0. 最終, 我們將會得到T的左邊部分為0, 即:
我們將Pi,right稱作第i類人臉圖像的余類零空間(此零空間與除第i類外余下類別人臉圖像乘積為0).計(jì)算得到所有K類人臉圖像的余類零空間后, 可得到余類零空間矩陣P=[P1,right,P2,right...PK,right], P的大小為P∈?D×N.
簡明地概括余類零空間的性質(zhì)為: 第i類人臉的余類零空間與所有不屬于第i類人臉的圖像矩陣相乘的結(jié)果為零, 而與第i類人臉的圖像矩陣相乘的結(jié)果不為零.
進(jìn)一步可推導(dǎo)出來, 由第i類人臉的圖像矩陣線性組合成的圖像矩陣與所有不屬于第i類人臉的余類零空間相乘的結(jié)果為零, 而與第i類人臉的余類零空間相乘的結(jié)果不為零.
事實(shí)上, 來自同一個(gè)類別的人臉圖像以很高的概率屬于同一個(gè)子空間, 即同一個(gè)類別中的人臉圖像以很高的概率為這一類別中人臉圖像的線性組合. 如果一個(gè)向量h是Hj(j≠i)中向量的線性組合, 根據(jù)公式(19)可得到||h×Pi,right||2=0. 這里的||·||2為求矩陣的二范數(shù). 所以, 如果一個(gè)測試圖像向量h屬于第j種類型,那么||h×Pi,right||2的值將遠(yuǎn)遠(yuǎn)小于||h×Pj,right||2.
在得到余類零空間矩陣P后, 計(jì)算測試圖像向量h與所有余類零空間的零空間距離, 可得到:
不同的i表示不同的余類零空間. Vali表示第i個(gè)零空間距離. 在所有的Vali中找到最大的Val, Val對應(yīng)的類型即判定為測試圖像向量所屬的類型.
余類零空間距離算法的流程如圖1所示.
圖1 余類零空間距離算法流程圖
當(dāng)人臉數(shù)據(jù)集的數(shù)據(jù)量比較小時(shí), 例如總共有20種類型的人臉圖像, 每種類型的人臉包含14張人臉向量, 每張人臉向量的維度為300. 前文提出的一次余類零空間距離分類器(null-space distance classifier簡稱NSD)識別效果很好. 當(dāng)人臉數(shù)據(jù)集的數(shù)據(jù)量較大時(shí),例如, AR人臉數(shù)據(jù)集總共包含100種人臉圖像, 當(dāng)在這樣大的數(shù)據(jù)集上運(yùn)用NSD算法時(shí), 算法結(jié)果較差.
人臉圖像的維度較大時(shí), 意味著矩陣H的行數(shù)較大, 計(jì)算右逆矩陣時(shí)HT(H×HT)-1的復(fù)雜度將很大.同時(shí), 在計(jì)算過程中, 很容易出現(xiàn)奇異矩陣, 奇異矩陣的出現(xiàn)將導(dǎo)致計(jì)算得到的結(jié)果有很大的偏差. 在這種情況下, 我們將不能使用上述提到的算法.
本文在上面提出的NSD算法的基礎(chǔ)上提出了多次余類零空間距離分類器算法(multi-time null-space disance classifier簡稱MNSD). MNSD算法不僅解決了NSD算法不適合大數(shù)據(jù)集的問題, 而且相較與NSD,降低了算法的復(fù)雜度. MNSD算法將不同類型的人臉數(shù)據(jù)集分成P組, 每組包括Q種類型的人臉數(shù)據(jù). H可表示為:
Ht(1<=t<=P)表示其中的一組. 對包括100類人臉圖像的AR數(shù)據(jù)集, 我們可以將其分為10組, 每組包含10類人臉圖像, 即Q和P的值分別為10和10. 在將原有數(shù)據(jù)集進(jìn)行分組后, 在每一組中使用NSD算法, 選擇出每一組中與測試圖像向量最匹配的類別. 調(diào)用P次NSD算法后, 將得到P類與測試圖像向量最匹配的類別. 下一步, 將這P類人臉特征向量組合成一個(gè)新的組, 新的組可以表示為:
Hnew的大小為Hnew∈?(S×P)×D, 其中H∈?S×D(1<=t<=P)為組H=中與t,maxit測試圖像向量最匹配的類別.在這個(gè)新的組上使用NSD算法, 即可判斷出測試圖像的類別. 如果這個(gè)新的組的維度仍然較大, 我們可以對這個(gè)新的組繼續(xù)分割, 然后重復(fù)上面的過程即可. MNSD算法的流程如表1所示.
表1 MNSD 算法
步驟 操作Hnew=[H1,maxi,H2,maxi,...,HP,maxi].如果Hnew中的類別數(shù)大于Q, 返回步驟1繼續(xù)迭4代過程, 如果Hnew中的類別數(shù)小于Q, 使用NSD算法在Hnew中判別出h所屬的類別即可.
2.2 余類零空間與最近空間距離分類器
在MNSD算法基礎(chǔ)上, 進(jìn)一步, 我們可以利用Vali與dj結(jié)合起來進(jìn)行分類. 新的距離被定義為Vali/di. 所有Vali/di中, 最大的對應(yīng)的類別即判定為測試圖像向量所屬的類別. 我們將此算法稱為余類零空間與最近空間距離算法(null-space combined with nearest distance method簡稱NSND). 如果使用NS算法計(jì)算dj, 我們稱算法為NSND(結(jié)合NS). NSND(結(jié)合NS)算法流程如表2所示.
表2 NSND (結(jié)合NS)
本文提出的MNSD算法的思想在于用不同類別的余類零空間最大化不同類別人臉圖像的差異性. 將最近空間方法結(jié)合到余類零空間的方法后, 本文提出的NSND算法不僅利用了同一類別中不同圖片之間的相似性, 而且最大化利用了不同類別之間的差異性.
2.3 算法時(shí)間復(fù)雜度分析
MNSD算法的計(jì)算量主要包括求解矩陣的右逆矩,求解多個(gè)矩陣的QR分解.
對矩陣H=[HTHT...HT]T∈?N×D, 計(jì)算其右逆矩
12K
陣的時(shí)間復(fù)雜度為O( DN2). 對需要進(jìn)行QR分解的矩陣H∈?D×S, 計(jì)算K個(gè)這樣的矩陣的QR分解的
i,right時(shí)間復(fù)雜度為O(2KDS2), 整個(gè)算法的復(fù)雜度為O( DN2+2KDS2).
然而, 上述的計(jì)算過程都只需要進(jìn)行一次計(jì)算即可. 即我們將余類零空間全部計(jì)算出來后即可應(yīng)用于所有測試樣本.
對每一個(gè)樣本向量, 算法需要計(jì)算其與所有余類零空間乘積的二范數(shù), 即對計(jì)算得到的所有零空間P=[P,P...P], 其中P∈?D×S, 則一個(gè)1,right2,rightK,righti, right樣本向量與其相乘求二范數(shù)的算法復(fù)雜度為O( KDS).
本文算法的運(yùn)行時(shí)間與NS算法相當(dāng), 但比NFS算法快許多. 因?yàn)镹FS算法需要做多次大維度矩陣的最小二乘法, 而本文算法只需要對一個(gè)大維度矩陣做一次右逆矩陣計(jì)算.
2.4 本文算法與同類算法的關(guān)系
為了更好地將本文算法與其它算法進(jìn)行比較, 有必要說明本文算法與其它算法的一些關(guān)系. 與本文比較的其它算法有NN算法、NS算法、NFS算法等. 本文算法與其它算法的關(guān)系圖如圖2所示.
圖2 本文算法與其它算法的關(guān)系圖
從圖2可以看到, 在PCA、2DPCA與BDPCA三種降維的方式基礎(chǔ)上, 將七種算法進(jìn)行了比較.
NFS算法在NS算法的基礎(chǔ)上增加了最遠(yuǎn)距離的判別手段,本文的NSND算法在MNMD算法的基礎(chǔ)上結(jié)合了NS算法的判別手段.
特別的, 當(dāng)采用PCA降維方法時(shí), 降維后的圖像為向量形式, 不能采用NN(Yang) 與 NN(AMD)算法,因此, 在使用PCA降維方法時(shí), 共對比了五種算法.
我們用ORL人臉數(shù)據(jù)集與AR人臉數(shù)據(jù)集對本文提出的算法進(jìn)行了驗(yàn)證. 我們用多種基于PCA的算法進(jìn)行圖像特征提取. 在PCA、2DPCA與BDPCA三種不同的特征提取方法的基礎(chǔ)上, 本文算法與NN算法、NS算法、NFS算法等進(jìn)行了比較.
3.1 ORL數(shù)據(jù)集實(shí)驗(yàn)結(jié)果
ORL人臉數(shù)據(jù)集共包含400張人臉圖像, 每種類別包含10張圖像. 圖像之間年齡、燈光、表情、面部細(xì)節(jié)等不盡相同, 每張圖像的大小為112*93. 圖3展示了ORL數(shù)據(jù)集中的部分圖像.
圖3 ORL數(shù)據(jù)集中部分圖像
對于每種類別, 實(shí)驗(yàn)隨機(jī)選取S張圖片作為訓(xùn)練集, 用多次實(shí)驗(yàn)的平均準(zhǔn)確率作為評價(jià)標(biāo)準(zhǔn)(運(yùn)行20次的平均結(jié)果). 我們對不同的S進(jìn)行了測試. 使用特征提取算法為BDPCA時(shí), 選取的參數(shù)為krow=12, krol=12. 使用特征提取算法為2DPCA時(shí), 選取的參數(shù)為krow=12. 對本文提出的算法, 我們將特征圖像分為8組, 每組包含5類人臉數(shù)據(jù).
我們將本文的MNSD, NSND(結(jié)合NS)與如下算法進(jìn)行了比較: NS, NFS, NN(AMD), NN(Frobenius距離), NN(Yang距離). 實(shí)驗(yàn)結(jié)果見表3, 表4與表5. 在這些表中, 我們可以看到不同的算法與不同的訓(xùn)練圖像個(gè)數(shù)對實(shí)驗(yàn)結(jié)果的影響. 表3展示了使用PCA作為特征提取方法的實(shí)驗(yàn)結(jié)果, 表4展示了使用2DPCA作為特征提取算法的實(shí)驗(yàn)結(jié)果, 表5展示了使用BDPCA作為特征提取算法的實(shí)驗(yàn)結(jié)果.
表3 在ORL數(shù)據(jù)集上基于PCA特征的比較結(jié)果
8 0.9700 0.9725 0.9350 0.9781 0.9762 9 0.9700 0.9800 0.9850 0.9875 0.9800
表4 在ORL數(shù)據(jù)集上基于2DPCA特征的比較結(jié)果
表5 在ORL數(shù)據(jù)集上基于BDPCA特征的比較結(jié)果
從表3中, 我們可以看到, 當(dāng)作為訓(xùn)練的圖像的個(gè)數(shù)為2到9時(shí), 本文的算法的識別率最高.
從表4可以看到, 除了5、7、9, 本文算法在別的訓(xùn)練個(gè)數(shù)時(shí), 取得的結(jié)果最好.
從表5可以看到, 除了9, 在別的的訓(xùn)練個(gè)數(shù)情況下, 本文算法的結(jié)果最好.
盡管本文算法在某些訓(xùn)練個(gè)數(shù)的情況下不是最好的, 但這些不是最好的結(jié)果與最好的結(jié)果很接近. 3.2 AR數(shù)據(jù)集實(shí)驗(yàn)結(jié)果
我們在AR數(shù)據(jù)集中選取了包含50個(gè)男性與50個(gè)女性的共100類人臉圖片. 每一類人臉圖片包含14張圖片. 每張圖片的尺寸為60*43. 圖4展示了AR數(shù)據(jù)集中的部分人臉圖片.
圖 4 AR數(shù)據(jù)集中的部分圖像
對于每種類別, 實(shí)驗(yàn)隨機(jī)選取了S張圖片作為訓(xùn)練數(shù)據(jù)集, 用多次實(shí)驗(yàn)的平均準(zhǔn)確率作為評價(jià)標(biāo)準(zhǔn)(運(yùn)行20次的平均結(jié)果). 我們對不同的S進(jìn)行了測試. 使用特征提取算法為BDPCA時(shí), 選取的參數(shù)為krow=20, krol=20. 使用特征提取算法為2DPCA時(shí), 選取的參數(shù)為krow=10. 對本文提出的算法, 我們將特征圖像分為10組, 每組包含10類人臉數(shù)據(jù). 我們將本文的MNSD, NSND(結(jié)合NS)與如下算法進(jìn)行了比較: NS, NFS, NN(AMD), NN(Frobenius距離), NN(Yang距離).
圖5展示了使用PCA作為特征提取方法的結(jié)果.
圖5 在AR數(shù)據(jù)集上基于PCA特征的算法識別率比較
從圖5的結(jié)果可以看出, 本文的MNSD與NSND(結(jié)合NS)的識別率最高.
圖6展示了使用2DPCA作為特征提取方法的結(jié)果.圖7展示了使用BDPCA作為特征提取方法的結(jié)果.
圖6 AR數(shù)據(jù)集上基于2DPCA特征的算法識別率比較
圖7 AR數(shù)據(jù)集上基于BDPCA特征的算法識別率比較
從圖6與圖7可以看出, 在平均識別率的指標(biāo)下,本文的MNSD與NSND(結(jié)合NS)的表現(xiàn)最好.
結(jié)合以上的ORL數(shù)據(jù)集與AR數(shù)據(jù)集的比較結(jié)果可以看出, 本文的算法在AR數(shù)據(jù)集上比在ORL數(shù)據(jù)集上更有效. 原因如下:
① AR數(shù)據(jù)集的維度比ORL數(shù)據(jù)集的維度大, 而本文提出的算法在數(shù)據(jù)集的維度較大時(shí)更有效.
② AR數(shù)據(jù)集中圖像的變化性比ORL中圖像的變化性大, 例如燈光、面部表情等. 本文提出的算法在圖像變化性較大時(shí)更有效.
從上述的實(shí)驗(yàn)結(jié)果可以看出, 本文提出的算法比傳統(tǒng)的算法更有效. 在得到訓(xùn)練圖像的特征矩陣后,我們計(jì)算不同類別特征矩陣的余類零空間. 相比較于圖像的特征矩陣, 這些獨(dú)立的余類零空間可以將不同類別的人臉最大化地分離開來. 傳統(tǒng)的分類器主要利用了圖像之間的相似性而沒有充分利用不同類別圖像之間的差異性. 本文提出的算法不僅利用了同一類別圖像之間的相似性, 而且充分利用了不同類別圖像之間的差異性.
本文提出了一種新型的使用余類零空間與最近空間距離的分類器. 我們在ORL數(shù)據(jù)集與AR數(shù)據(jù)集上進(jìn)行了測試. 測試結(jié)果表明本文算法性能優(yōu)異, 即使當(dāng)訓(xùn)練數(shù)據(jù)較小時(shí)也可取得較高的識別率. 此外, 本文的降維算法使用的是PCA及其改進(jìn)算法, 當(dāng)使用別的降維算法, 如獨(dú)立成分分析算法(ICA)、線性判別式分析算法(LDA)、局部保留投影算法(LPP)時(shí)算法的性能將是繼續(xù)研究的地方. 另外在算法結(jié)果中可以看出, NSND(結(jié)合NS)算法并非在所有情況下都好于本文的另一種MNSD算法, 如何調(diào)整余類零空間距離與最近空間距離的權(quán)重以便得到更好的識別效果也是算法有待改進(jìn)的地方.
1 Sirovich L, Kirby M. Low-dimensional procedure for characterization of human faces. Journal of the Optical Society of American, 1987, 33(4): 591–596.
2 Li C, Liu J, Wang A, et al. Matrix reduction based on generalized PCA method in face recognition. International Conference on Digital Home. IEEE. 2014. 35–38.
3 Yang J, Zhang D, Frangi AF, et al. Two-dimensional PCA: A new approach to appearance-based face representation and recognition. IEEE Trans. on Pattern Analysis and Machine Intelligence, 2004, 26(1): 131–137.
4 Zuo W, Zhang D, Wang K. Bidirectional PCA with assembled matrix distance metric for image recognition. IEEE Trans. on Systems Man and Cybernetics Society, 2006, 36(4): 863–872.
5 Zhou C, Wang L, Zhang Q, et al. Face recognition based on PCA and logistic regression analysis. Optik-International Journal for Light and Electron Optics, 2014, 125(20): 5916–5919.
6 Tian X, Tian M. Face recognition using a hybrid algorithm based on improved PCA. Proc. of the 2013 InternationalConference on Information Technology and Computer Application Engineering. ITCAE. 2014. 289–292.
7 Luan X, Fang B, Liu L, et al. Extracting sparse error of robust PCA for face recognition in the presence of varying illumination and occlusion. Pattern Recognition, 2014, 47(2): 495–508.
8 Mi JX, Huang DS, Wang B, et al. The nearest-farthest subspace classification for face recognition. Neurocomputing, 2013, 113(7): 241–250.
9 He R, Yang N, Wang XK, et al. Direct sparse nearest feature classifier for face recognition. Life System Modeling and Intelligent Computing-International Conference on Life System Modeling and Simulation. 2010. 386–394.
10 Naseem I, Togneri R, Bennamoun M. Linear Regression for Face Recognition. IEEE Trans. on Pattern Analysis and Machine Intelligence, 2010, 32(11): 2106–2112.
11 Choi LU, Murch RD. A transmit preprocessing technique for multiuser MIMO systems using a decomposition approach. IEEE Trans. on Wireless Communications, 2004, 3(1): 20–24.
12 Zu K, de Lamare RC, Haardt M. Generalized design of low-complexity block diagonalization type precoding algorithms for multiuser MIMO systems. IEEE Trans. on Communications, 2013, 61(10): 4232–4242.
13 Li SZ, Lu J. Face recognition using the nearest feature line method. IEEE Trans. on Neural Networks, 1999, 10(2): 439–443.
14 Chien JT, Wu CC. Discriminant waveletfaces and nearest feature feature classifiers for face face recognition. IEEE Trans. on Pattern Analysis and Machine Intelligence, 2002, 24(12): 1644–1649.
15 Shi Q, Eriksson A, Hengel AVD et al. Is face recognition really a compressive sensing problem? IEEE Conference on Computer Vision and Pattern Recognition. 2011. 553–560.
Face Recognition Using Null-Space Combined with Nearest Space Distance Classifier
YUAN Hao-Jie, SUN Gui-Ling, ZHENG Bo-Wen, LI Zhi-Sheng
(College of Electronic Information and Optical Engineering, Nankai University, Tianjin 300350, China)
This paper presents a new scheme for face recognition, namely face recognition using null-space combined with nearest space distance classifier. By constructing the null-spaces and the subspaces of different types of human face images, different types of human face images are distinguished at the maximum degree. This idea considers that a test image has the shortest distance from its own class-specific subspace and has the farthest distance from its own class-specific null-space. The proposed classifier is evaluated on ORL database and AR database. Experiments on these databases demonstrate that the proposed scheme is more effective than some discriminants used by common classifiers, such as nearest distance used by nearest neighbor classifier, nearest space distance used by nearest space classifier and nearest-farthest subspace distance used by nearest-farthest subspace classifier.
null-space; face recognition; nearest space; classifier; subspace
高等學(xué)校博士學(xué)科點(diǎn)專項(xiàng)科研基金(20130031110032)
2016-07-16;收到修改稿時(shí)間:2016-08-25
10.15888/j.cnki.csa.005694