裴珍,許忠仁
(遼寧石油化工大學(xué)信息與控制工程學(xué)院,遼寧撫順113001)
人臉檢測(cè)(Face Detection)是指在對(duì)于任意一幅給定圖像中,采用一定的策略對(duì)其進(jìn)行搜索以確定其中是否含有人臉,如果有則返回人臉的位置、大小、姿態(tài)[1]。隨著人臉檢測(cè)在電視會(huì)議、圖像搜索、數(shù)字視頻處理、視頻檢測(cè)、視頻壓縮編碼等領(lǐng)域的廣泛應(yīng)用,人臉檢測(cè)的研究也日益成熟。然而人臉檢測(cè)存在以下幾個(gè)問(wèn)題:1)人臉存在膚色、外貌、表情等差異,具有模式可變性;2)人臉上有時(shí)會(huì)有眼鏡、胡須和頭部飾物以及其他的東西等附屬物;3)光源和成像角度會(huì)對(duì)人臉產(chǎn)生反射和陰影等影響。
目前已有很多學(xué)者相繼提出了使用AdaBoost與其他特征相融合來(lái)檢測(cè)人臉圖像[2-3]。文獻(xiàn)[4]提出的膚色檢測(cè)方法適用于背景環(huán)境簡(jiǎn)單的人臉檢測(cè),然而復(fù)雜的背景下僅僅依靠膚色檢測(cè)會(huì)有會(huì)很大的誤差,產(chǎn)生比較高的誤檢率。文獻(xiàn)[5]提出的改進(jìn)的AdaBoost和膚色特征相結(jié)合的算法采用了改進(jìn)的權(quán)重,有效避免增益現(xiàn)象。文獻(xiàn)[6]提出的膚色模型和小波變換結(jié)合的算法實(shí)現(xiàn)了復(fù)雜背景中單人臉快速、準(zhǔn)確定位,與傳統(tǒng)的YCbCr空間的膚色檢測(cè)相比,提高了檢測(cè)精度。
本文為了復(fù)雜背景下多人臉檢測(cè)率以及人臉檢測(cè)速度,提出了一種基于改進(jìn)AdaBoost、膚色檢測(cè)和2DPCA的人臉檢測(cè)方法,該方法首先通過(guò)金字塔結(jié)構(gòu)的檢索方法將圖像分成不同尺寸的子圖像,然后通過(guò)分類器對(duì)這些子圖像進(jìn)行判斷,進(jìn)而判斷是否為人臉,接著對(duì)歸類出的人臉使用膚色分割算法快速提取圖像中膚色區(qū)域,最后根據(jù)人臉幾何位置的特征,對(duì)膚色區(qū)域內(nèi)定位到的人眼部位進(jìn)行2DPCA檢測(cè),繼而解決了復(fù)雜背景下多人臉檢測(cè)和計(jì)算量大的問(wèn)題,使檢測(cè)結(jié)果更加精確。
改進(jìn)的人臉檢測(cè)方法由改進(jìn)的AdaBoost算法、膚色檢測(cè)和2DPCA的眼睛檢測(cè)等部分組成,流程圖如圖1所示。
AdaBoost算法的主要原理是:由大量的弱分類器形成一個(gè)強(qiáng)分類器,通常這種算法對(duì)于難以分類樣本予以分配很高的權(quán)值,最終造成增益現(xiàn)象[7]。而改進(jìn)的AdaBoost算法是在提出了一種金字塔結(jié)構(gòu)的搜索方法,將原始圖像分成若干不同大小不同尺寸的子圖像,然后利用了基于類人臉特征訓(xùn)練的分類器逐一對(duì)這些子圖像進(jìn)行判斷是否為人臉。
圖1 人臉檢測(cè)流程圖Fig.1 Flow diagram of the face detection
1.1.1 人臉子圖像的數(shù)量
設(shè)人臉圖像大小為X×Y,人臉子圖像的初始大小為x0×y0及縮放因子為r,搜索歩長(zhǎng)是x及y方向的Sx和Sy。則第一輪搜索按初始子圖像大小x0×y0搜索,得到子圖像的數(shù)量如式(1):
同理,第二輪搜索按初始圖像r倍即r·x0×r·y0,則子圖像的數(shù)量如式(2):
以此類推,第n+1輪按初始圖像的rn倍即rn·x0×r·y0,則子圖像的數(shù)量如式(3):
于是,每一輪搜索得到的子圖像的數(shù)量形成具有規(guī)律的數(shù)列,如式(4):
設(shè)金字塔搜索的最高級(jí)數(shù)為n+1,由于最大搜索子圖像尺寸rn·x0和rn·y0不大于待檢測(cè)圖像X和Y,故得到式(5):
由(4)式,該n+1項(xiàng)表達(dá)式構(gòu)成了等比數(shù)列。因此有:
式(6)為金字塔結(jié)構(gòu)的最終子圖像總數(shù)量。其中,x0和y0的大小大約為20個(gè)像素,搜索步長(zhǎng)sx和Sy在1~5之間,縮放因子r則在1.1~1.4之間。
1.1.2 分類器訓(xùn)練
該方法根據(jù)人臉的灰度分布特征訓(xùn)練分類器,基于先驗(yàn)知識(shí)了解人臉特征采用的矩形特征,此特征反映的是局部人臉灰度分布模型,即眼睛和臉頰灰度值較高,如圖2所示。
圖2 人臉檢測(cè)的矩形特征Fig.2 Rectangular feature of face detection
假設(shè)n個(gè)訓(xùn)練樣本(x1,y1),(x2,y2),…(xn,yn),其中i=1,2,n,yi=0代表非人臉樣本,yi=1代表人臉樣本。訓(xùn)練樣本中包含m個(gè)非人臉樣本,l個(gè)人臉樣本。
弱分類器ht,j如下
pj:表示不等式方向的偏置(有±1兩種情況)。
fj:表示樣本k維特征,即fj(·)(1≤j≤k),則i個(gè)樣本xi,特征為f1(xi),f2(xi),…,fj(xi),…,fk(xi),且每一個(gè)特征fj有一個(gè)簡(jiǎn)單二值分類器。
θj:表示閾值。
算法步驟:
①初始化權(quán)重:設(shè)第t次循環(huán)中第i個(gè)樣本的誤差權(quán)重為wt,i,初始化權(quán)重:當(dāng)yi=0時(shí),w1,i=1/(2m);當(dāng)yi=1時(shí),w1,i=1/(2l)。
③選取最小εt的弱分類器:首先對(duì)于每個(gè)特征j,訓(xùn)練出其弱分類器。即確定閾值θj和偏置pj,使權(quán)重誤差εt=minf,p,θ|最小。最后最小錯(cuò)誤εt選取弱分類器ht。
④調(diào)整權(quán)重:wt+1=wt,i
最后,將
作為人臉檢測(cè)函數(shù)來(lái)判斷圖像中是否包含人臉。
1.2.1 膚色空間轉(zhuǎn)換
在YCbCr色彩空間中膚色有較好的色度聚類特性,可以從復(fù)雜的背景中分割出膚色區(qū)域。本文采用YCbCr空間作為膚色檢測(cè)的映射空間,Y為亮度信息,Cb和Cr為藍(lán)色和紅色的色度。將圖像從RGB轉(zhuǎn)換到顏色分量互不相關(guān)的空間,轉(zhuǎn)換公式如式(7):
1.2.2 膚色建模
選定色彩空間之后,下面開(kāi)始建立與YCbCr色彩空間相對(duì)應(yīng)的膚色模型。膚色模型是在一定的顏色空間中描述膚色分布規(guī)律的數(shù)學(xué)模型,它可以采用代數(shù)或查表等形式來(lái)表示哪些像素屬于膚色,也可以表示像素點(diǎn)的色彩與膚色的相似程度。盡管同一人種的膚色存在差異,但是這種差別對(duì)于亮度信息是微不足道的,因此膚色二維的高斯(Gaussion)模型G(m,v2)如式(8)。
2DPCA的主要原理是[9]矩陣通過(guò)線性變換直接投影到一個(gè)新的低維空間,從而得到低維的投影特征。2DPCA先利用二維圖像矩陣直接構(gòu)建一個(gè)協(xié)方差矩陣,求出該協(xié)方差矩陣的特征值和特征向量,然后根據(jù)信息閾值的設(shè)定,得到對(duì)應(yīng)于最大幾個(gè)特征值的特征向量來(lái)構(gòu)建坐標(biāo)系,最后將每個(gè)圖像矩陣投影到這個(gè)坐標(biāo)系上,從而提取出圖像的分類特征。2DPCA方法應(yīng)用到眼睛識(shí)別,包括眼睛定位、眼睛圖像的特征提取以及眼睛分類方法。
首先研究眼睛特征提取,設(shè)眼睛圖像訓(xùn)練樣本A1、A2,……,AN,N為訓(xùn)練樣本個(gè)數(shù),每個(gè)樣本都是m×n的矩陣,計(jì)算訓(xùn)練樣本的平均值和協(xié)方差矩陣,并對(duì)協(xié)方差舉證進(jìn)行特征值分解,選取d個(gè)最大特征值所對(duì)應(yīng)的標(biāo)準(zhǔn)正交特征向量所構(gòu)成的投影向量組P=[U1,U2,…,Ud],即是投影矩陣。再利用投影矩陣進(jìn)行特征提取。假設(shè)Y(i)1、Y(i)2,……,Y(i)d是訓(xùn)練樣本Ai的前d個(gè)二維主成分,Y(i)1、Y(i)2,……,Y(i)d是其對(duì)應(yīng)的特征向量,將待檢測(cè)樣本圖像如上述向P作投影,得到檢測(cè)眼睛圖像的特征矩陣。
最后研究眼睛圖像的分類,本文采用最近鄰分類器來(lái)進(jìn)行分類,任意兩個(gè)特征矩陣Bi=[Y(i)1、Y(i)2,…,Y(i)d]和Bj=[Y(i)1、Y(j)2,…,Y(j)d],計(jì)算距離:
本文的訓(xùn)練樣本主要采用CMU人臉數(shù)據(jù)庫(kù)和網(wǎng)上下載的人臉圖像,其中有170張來(lái)自CMU人臉數(shù)據(jù)庫(kù),照片主要選擇不同光照、多姿態(tài)、不同背景和不同表情的人臉;此外,95張網(wǎng)絡(luò)下載的人臉圖像,共包含265個(gè)人臉。測(cè)試環(huán)境為Pentium(R)Dual-Core CPU 2.99GHz,1.99 GB的內(nèi)存,操作系統(tǒng)為Windows XP,在VC++6.0平臺(tái)上編程實(shí)現(xiàn),檢測(cè)結(jié)果如表1所示,人臉檢測(cè)方法實(shí)現(xiàn)流程圖如圖3所示,部分檢測(cè)結(jié)果如圖4所示。
圖3 基于改進(jìn)的AdaBoost、膚色和2DPCA的人臉檢測(cè)方法的流程圖Fig.3 Flow chart of face detection method based on the improved AdaBoost,skin color and 2DPCA
從上述仿真結(jié)果[10]圖可以看出,本文提出來(lái)的算法能夠在復(fù)雜背景下多姿態(tài)、不同光照等情況下的人臉檢測(cè),可以準(zhǔn)確的檢測(cè)出我們期望的結(jié)果。
圖4 多人臉檢測(cè)結(jié)果Fig.4 Many face detection result
表1 傳統(tǒng)算法與本文算法比較Tab.1 Traditional algorithm and the algorithmin this paper
本文提出一種基于改進(jìn)的AdaBoost、膚色和2DPCA結(jié)合的人臉檢測(cè)方法。該方法利用AdaBoost算法快速搜索待檢測(cè)圖像,排除非人臉區(qū)域,然后通過(guò)膚色檢測(cè)方法對(duì)于候選區(qū)域進(jìn)行膚色像素分析,分割出復(fù)雜背景下的人臉區(qū)域,最后采用2DPCA對(duì)人臉幾何特征定位的人眼進(jìn)行分類。該算法降低了不同光照、不同表情和不同姿態(tài)等情況下人臉檢測(cè)率不高的問(wèn)題,避免了AdaBoost算法因計(jì)算量大而導(dǎo)致的低速。因此該算法具有很好的實(shí)用價(jià)值。
[1] Yang MH,Kriegman D,Ahuja N.Detecting faces in images:a survey[J].IEEE Trans.Pattern Analysis and Machine Intelligence,2002,24(1):34-58.
[2] ZHANG Cha,ZHANG Zheng-you.A survey of recent advances in face detection[J].Microsoft Technical Report,2010,26(2):1-17.
[3] SrisukS,Kurutach W.A New Robust Face Detection in Color Images[C]//Int Conf on Aut Face and Ges Rec.Washington:IEEE,2002:291-296.
[4] 王小華,徐蕙素,吳海虹.基于YCbCr顏色空間的不良圖像膚色檢測(cè)[J].計(jì)算機(jī)應(yīng)用與軟件,2011,28(4):150-153.WANG Xiao-hua,XU Hui-su,WU Hai-hong.Objectionable image skin colour detection based on YCbCr colour space[J].Computer Applications and Software,2011,28(4):150-153.
[5] Yang J,Zhang D,F(xiàn)rangi A F,et a1.Two-dimensional PCA:a new approach to appearance-based face repre-sentation and recognition[J].IEEE Transactions 0n PAMI,2004,26(1):131-137.
[6] John W,Arvind G,Zhou Z H,et a1.Robust face recognaition via sparse representation[J].IEEE International Conference on Automatic Face and Gesture Recog-nation,2008,31(2):210-227.
[7] XIONG Sheng-wu,ZONG Xin-lu,ZHU Guo-feng.Improved face detection method based on AdaBoost algorithm[J].Application Research of Computers,2007,24(11):298-300.
[8] 趙明華.人臉檢測(cè)和識(shí)別技術(shù)的研究[D].成都:四川大學(xué),2006.
[9] 李玉鑑,王利娟.基于PCA的眉毛識(shí)別方法研究[J].計(jì)算機(jī)工程與科學(xué),2008,30(11):28-30.LI Yu-jian,WANG Li-juan.Eyebrow recognition based on principal component analysis[J].Computer Engineering&Science,2008,30(11):28-30.
[10] 張國(guó)飛,崔志勝,徐廣鑫,等.基于瞬時(shí)無(wú)功功率理論的APF諧波補(bǔ)償能力的仿真研究[J].陜西電力,2012(11):77-81.ZHANG Guo-fei,CUI Zhi-sheng,XU Guang-xin,et al.Instantaneous reactive power theory-based simulation of harmonics compensation performance of active power filter[J].Shaanxi Electric Power,2012(11):77-81.