高 燕,明曙軍,劉永俊
(常熟理工學(xué)院 計(jì)算機(jī)科學(xué)與工程學(xué)院,江蘇 常熟 215500)
近年來,人臉識(shí)別作為一門既有理論價(jià)值又有應(yīng)用價(jià)值的研究課題,越來越受到研究者的關(guān)注,各種各樣的人臉識(shí)別方法層出不窮[1-13].對線性子空間方法中經(jīng)典的主成分分析方法(PCA[2])、Fisher線性鑒別分析方法(FLDA[13])和最大散度差鑒別分析方法(MSLDA[3])進(jìn)行研究發(fā)現(xiàn),這三種方法都需要平均樣本來進(jìn)行人臉識(shí)別.由于在訓(xùn)練樣本中存在的干擾樣本會(huì)影響人臉的識(shí)別率,所以需要去除干擾樣本,本文通過中間樣本的提取來避免提取平均樣本時(shí)干擾樣本的干擾.
對人臉識(shí)別的研究中,一般都是基于灰度圖像的,但是在真實(shí)生活中人臉是彩色的,隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展,彩色圖像[5]處理也成為了熱門的課題.已有研究發(fā)現(xiàn),利用彩色信息相對于灰度圖像[2]能提高人臉圖像的識(shí)別率,因此,越來越多的研究者開始利用人臉圖像的彩色信息來提高人臉識(shí)別算法的性能.而彩色的人臉識(shí)別[8-10]基本思路是將彩色圖像通過某種變換轉(zhuǎn)化為灰度圖像,然后基于灰度圖像進(jìn)行彩色人臉的識(shí)別,加上本文提出的中間樣本的人臉識(shí)別,能夠更加有效地提高人臉識(shí)別的識(shí)別率.
人臉圖像訓(xùn)練樣本集{x1,x2,···,xN},xi為n維向量.訓(xùn)練樣本分為 K 類,記為C1,C2,···,CK,且Ci類包含Ni個(gè)訓(xùn)練樣本.則所有樣本的均值向量為
可見,St是所有樣本的協(xié)方差矩陣.
FLDA算法的目標(biāo)就是找到最佳投影方向Wopt,就是使樣本的類間散布矩陣和樣本的類內(nèi)散布矩陣的行列式比值最大的正交特征向量,即Fisher準(zhǔn)則函數(shù):
Wopt是滿足下列等式的解
但是,應(yīng)用FLDA時(shí)常常會(huì)遇到這樣一個(gè)問題,就是樣本的類內(nèi)散布矩陣為奇異矩陣,導(dǎo)致無法直接求解的特征值,這是因?yàn)橛?xùn)練樣本的數(shù)量常常小于樣本的像素?cái)?shù).這就是所謂的小樣本問題.
對于小樣本的問題,由宋楓溪、劉永俊等人提出了一種新的最大散度差鑒別分析方法[13],此方法是以樣本的類間離散度與類內(nèi)離散度之差作為鑒別準(zhǔn)則,從根本上解決了當(dāng)類內(nèi)散布矩陣為奇異矩陣時(shí)不能直接求解的問題.
散度差準(zhǔn)則函數(shù)定義為
15年來,浙江省氣象部門在生態(tài)環(huán)境氣象研究領(lǐng)域,取得了歷史性成績。一系列驕人的研究成果相繼涌現(xiàn),一篇篇優(yōu)秀的成果論文在《浙江氣象》期刊上相繼呈現(xiàn)。例如,代表作有:(1)“氣候生態(tài)環(huán)境監(jiān)測預(yù)警系統(tǒng)建設(shè)探討”(苗長明、王守榮著,2004年第4期);(2)“浙江省大氣水平能見度氣候特征分析”(胡云麗、陳斌著,2016年第1期);(3)“杭州AQI的分布特征及其與氣象條件相關(guān)性分析”(張霏燕、黃哲、查賁、沈杭峰著,2016年第3期),等等。
針對樣本集中遠(yuǎn)離了所有樣本的干擾樣本,本文提出了一種新的思路,就是去除干擾樣本尋求中間樣本,以保證所獲得樣本不會(huì)因?yàn)閭€(gè)別的樣本而造成影響.假設(shè)有樣本集{x1,x2,...xN},xi為高維樣本向量,訓(xùn)練樣本分為k類,記為C1,C2,...,Ck,且每一類都包含M 個(gè)訓(xùn)練樣本.圖1所示為所有樣本的矩陣表示,矩陣的一列表示一個(gè)樣本.首先將樣本集{x1,x2,...xN}中的所有樣本按其像素值的大小排序,即將圖中方框內(nèi)的像素值按其大小進(jìn)行排序,形成一個(gè)新的樣本集{x1',x2',...xN'},然后取其中間樣本代替第1節(jié)中的均值向量.該方法的復(fù)雜程度與第1節(jié)中相比,特征抽取過程中增加了對樣本分量排序的時(shí)間,但是減少了求平均值的算法,因此總體算法復(fù)雜程度與原算法相當(dāng).
圖1 所有樣本的矩陣表示
樣本的新類間散布矩陣為
樣本的新類內(nèi)散布矩陣為
樣本的新總體散布矩陣為
將求得的散布矩陣代入Fisher鑒別準(zhǔn)則(2.4)和最大散度差鑒別準(zhǔn)則(2.5)
求解新的投影方向進(jìn)行人臉鑒別特征抽取,然后進(jìn)行相似性度量和分類.把得到的新方法應(yīng)用到彩色人臉識(shí)別上去.
對于彩色人臉鑒別[10-13]特征抽取及自動(dòng)識(shí)別,是在RGB三個(gè)顏色空間中,尋找三個(gè)顏色空間的“特征空間”UR,UG,UB,接下來對彩色圖像進(jìn)行投影,任何一幅中心化后的人臉圖像都可以通過下面的式子投影到特征臉子空間并獲得一組坐標(biāo)系數(shù)
對應(yīng)于彩色圖像的三個(gè)顏色空間的投影,可表示如下:
任何一幅人臉圖像都可以表示為這組特征,也可以稱為該圖像的彩色代數(shù)特征.
處理后的特征向量
最后,對上述選擇后的鑒別特征輸入到分類器進(jìn)行分類識(shí)別,目前最經(jīng)典的是使用最近鄰分類器或最小距離分類器.
為驗(yàn)證本文算法的有效性,本實(shí)驗(yàn)在一個(gè)規(guī)模較大的AR人臉圖像數(shù)據(jù)庫上進(jìn)行.它由120人,每人26張?jiān)诓煌瑫r(shí)期、光照、姿態(tài)、表情、遮擋等條件下拍攝的人臉圖像組成.這26張圖像拍攝于兩個(gè)時(shí)期,前13張圖像為一個(gè)時(shí)期,后13張圖像為另一個(gè)時(shí)期,前后相差14天.本實(shí)驗(yàn)僅考察無遮擋的情況,采用前60人的圖像組成樣本集.采用分辨率為50×40的規(guī)范化人臉圖像.圖2為其中某人經(jīng)過規(guī)范化的14幅彩色圖像.
本實(shí)驗(yàn)運(yùn)用線性鑒別分析的方法,建立類內(nèi)散布矩陣和類間散布矩陣,其維數(shù)就會(huì)很高,顯然這么高的維數(shù)在計(jì)算機(jī)上運(yùn)行是不現(xiàn)實(shí)的.因此,本實(shí)驗(yàn)先對樣本的RGB三個(gè)顏色分量分別用主成分分析方法降維,然后再用Fisher準(zhǔn)則和最大散度差準(zhǔn)則進(jìn)行線性鑒別分析.如表1和表2所示,選取的是50到59個(gè)投影軸進(jìn)行的特征提取,分別為用最近中心分類器(MD)和最近鄰分類器(1NN)進(jìn)行識(shí)別的識(shí)別率和用時(shí)長短對比表.
圖2 AR人臉圖像數(shù)據(jù)庫中的14幅圖像
由表1、表2可見,經(jīng)過改進(jìn)后的Fisher鑒別分析方法和最大散度差鑒別分析方法,由于在一定程度上去除了個(gè)別干擾樣本的影響,其識(shí)別性能有了較好的提升.從表3可以看出,由于增加了對中間樣本的求解,特征抽取的時(shí)間略有增加,但識(shí)別的時(shí)間并沒有明顯變化,證明本文方法是可行的.
表1 改進(jìn)前、后Fisher鑒別分析方法用兩種分類器的識(shí)別率對比表
表2 改進(jìn)前、后的最大散度差鑒別分析方法用兩種分類器的識(shí)別率對比表
表3 采用兩種方法改進(jìn)后用最近鄰分類器的最優(yōu)識(shí)別率下的用時(shí)對比表
本文提出了基于中間樣本的人臉彩色鑒別特征抽取及識(shí)別方法,舍棄了樣本平均值的求解方法,采用中間樣本代替,進(jìn)一步排除了干擾樣本對實(shí)驗(yàn)的影響,使得人臉識(shí)別率比以前有所提高.本文將改良的方法應(yīng)用到彩色人臉識(shí)別上,為充分利用顏色信息,采用先對各顏色分量進(jìn)行特征抽取,然后再融合的策略.最后在國際通用的AR標(biāo)準(zhǔn)彩色人臉庫上對本文提出的新方法進(jìn)行了綜合實(shí)驗(yàn),驗(yàn)證了該方法的可行性.
[1]Robert W,Frischholz,Ulrich Diecklmann.BioID:A Multimodal Biometric Identification System[J].IEEE Computer,2000,33(2):64-68.
[2]袁殿國.基于PCA的人臉識(shí)別研究[D].大連:大連理工大學(xué),2007.
[3]Turk Matthew,Pentland Alex.Face recognition using Eigenfaces[C].Proc.IEEE Conf.On Computer Vision and Pattern Recognition,1991:586-591.
[4]Pentland Alex. Looking at people:sensing for ubiquitous and wearable computing[J].IEEE Trans Pattern Anal Machine Intell,2000,22(1):107-119.
[5]Maxim A,Grudin.On internal representations in face recognition systems[J].Pattern Recognition,2000,33(7):1161-1177.
[6]Shih P,Liu C.Comparative assessment of content based face image retrieval in different color spaces[J].Intl Jnl of Pattern Recognition,2005,19(7):873-893.
[7]Creed J,Abbott A.Color face recognition by hyper complex gabor analysis[C].Proceedings of the 7th International Conference on Automatic Face,2002.
[8]王成章,白曉明.基于Fisher塊對角LNMF的彩色人臉識(shí)別[J].計(jì)算機(jī)工程與應(yīng)用,2010,36(16):24-26.
[9]劉永芹,劉永俊,常晉義.彩色人臉鑒別特征抽取及識(shí)別[J],常熟理工學(xué)院學(xué)報(bào),2010,24(8):85-89.
[10]Jian Yang,Chengjun Liu,Lei Zhang.“Color space normalization:Enhancing the discriminating power of color spaces for face recognition”[J].Pattern Recognition,2010(43):215-218.
[11]Liu C.“Learning the uncorrelated,independent,and discriminating color spaces for face recognition”[J].IEEE Trans Information Forensics and Security,2008,3(2):213-222.
[12]Xiaoyuan Jing,Qian Liu,Chao Lan,et al.Holistic orthogonal analysis of discriminant transforms for color face recognition[C].Proceedings of 2010 IEEE 17th International Conference on Image Processing,2010:26-29.
[13]劉永俊,陳才扣.基于差空間的最大散度差鑒別分析及人臉識(shí)別[J].計(jì)算機(jī)應(yīng)用,2006,26(10):2460-2462.